Исходный размер 595x842

FUNNY

Проект принимает участие в конкурсе

Описание проекта

В данном проекте я обучила нейросеть генерировать изображения на основе фотографий моей собаки Фанни. В качестве исходных фото я взяла свой домашний фотоархив с собакой, поэтому никакие авторские права не нарушаются.

Исходный размер 3104x2451

Обучение модели

Исходный размер 907x737

Первым делом я импортирую все нужные библиотеки и загружаю фотографии в архив.

Затем генерирую промпты к будущим изображениям и вывожу описание загруженных фотографий и промпта на их основе.

Исходный размер 902x674

Загружаю датасеты и сохраняю получившуюся модель на HuggingFace.

Исходный размер 650x316

Настраиваю StableDiffusion и начинаю генерировать изображения.

Серия созданных изображений

Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 3152x1024
Исходный размер 1024x1024
Исходный размер 1024x1024

Промпты:

«photo in FUNNY style, dog sleep» «photo in FUNNY style, dog portrait» «photo in FUNNY style, dog take the bath» «photo in FUNNY style, dog face» «photo in FUNNY style, dog playing» «photo in FUNNY style, dog smile» «photo in FUNNY style, dog eat cake» «photo in FUNNY style, dog in glasses, read book» «photo in FUNNY style, dog read book» «photo in FUNNY style, dog playing» «photo in FUNNY style, dog, landscape background» «photo in FUNNY style, dog watching TV»

Исходя из полученных результатов можно сделать вывод, что модель считала породу Фанни, её особенности и некоторые настройки камеры. Тем не менее, нейросеть часто генерировала лишние лапы, странные пропорции и прочее.

Тем не менее, генерации я считаю успешными, ведь им вполне удалось передать узнаваемые черты моей собаки.