Исходный размер 1140x1600

Обучение генеративной сети для вдохновения

Проект принимает участие в конкурсе

CONCEPT

Проект направлен на изучение возможностей нейросети воспроизводить объекты вдохновения дизайнеров одежды.

В качестве исходного материала для генераций я выбрала уличные снимки прохожих, созданные дизайнерами брэнда Kiko Kostadinov. Снимки отличаются небрежностью, зачастую они выполнены исподтишка. Значимой чертой фотографий является человек с уникальным и аутентичным стилем, на нем есть нечто, что привлекло дизайнеров одежды. Впоследствии такие снимки попадают в мудборды при создании новой коллекции.

Ключевой вопрос может ли нейросеть на основе уникального стиля прохожих сгенерировать еще более интересные сочетания цветов, слоев и фактур.

ORIGINAL IMAGES

Важно обратить внимание, что в самих референсах главный объект снимка не лицо и не человек, а именно сочетание одежды и стиль прохожих.

Исходный размер 743x743
Исходный размер 591x591

GENERATIONS

Изображения получились детализированные, лица в целом довольно размазанные, однако если посмотреть на референсы, становится понятно, что это тут было и неважно.

Исходный размер 512x512

Модель хорошо передала различные фактуры ткани и интересные цветовые сочетания. Интересно, что более удачные генерации оказались со спины. Генеративная модель почти не добавляла лишнего.

0

Генеративная модель довольно хорошо справилась с позингом, комбинированием цветовых решений, а также в целом со стилем. Она смогла передать общие черты, создав новые объекты для мудборда. Еще раз стоит дополнительно подчеркнуть, что в изображениях на которых училась модель почти не было лиц, так что их расплывчатость не столь важна, нежели цветовое комбинирование одежды и фактур.

Обучение модели

Процесс обучения модели происходил поэтапно: — загрузка папки, подготовка датасета — использование BLIP для автоматических подписей к фото — обучение модели с применением LoRA -генерация изображений в похожей стилистике.

Исходный размер 952x513

Описание применения генеративной модели

Для улучшения финальных промтов использовался DeepSeek.

Исходный размер 802x287
Обучение генеративной сети для вдохновения
Проект создан 24.03.2026