Исходный размер 1140x1600

Рождение фиолетового динозаврика

Проект принимает участие в конкурсе

Идея проекта

post

Целью данного проекта стало создание и обучение нейросети рисовать авторского персонажа — фиолетового динозаврика с крыльями. Идея родилась из желания соединить традиционное рисование с современными технологиями: я нарисовала 15 изображений своего персонажа в разных позах, а затем обучила Stable Diffusion воспроизводить его в новых, ранее не существовавших ситуациях.

Почему динозаврик? Этот образ обладает рядом узнаваемых характеристик: фиолетовый цвет, наличие двух крыльев, милый мультяшный стиль, круглые глаза, простота форм. Такая комбинация признаков позволяет проверить, насколько хорошо нейросеть способна уловить и воспроизвести сложные сочетания визуальных элементов.

post

Для обучения были подготовлены мои собственные рисунки дино. Изображения имели:

  1. Квадратный формат

  2. Однотонный фон

  3. Единый художественный стиль (цифровой рисунок, чёткие линии)

  4. Разнообразие поз и ракурсов

Список использованных в проекте инструментов:

— Stable Diffusion — обучение генеративной нейросети под свой стиль; — Google Colab — выполнение кода и генераций; — LoRA — метод дообучения; — HuggingFace — обучение нейросети;

Исходные изображения персонажей

нападающий и грустный дино

спящий и боковой ракурс дино

Описание процесса обучения

Сначала потребовалось загрузить все необходимые для работы библиотеки. Я установила diffusers, transformers, accelerate, peft, torch и xformers.

Далее нужно было загрузить изображения с компьютера в Google Colab. Я использовала встроенную функцию files.upload ().

Далее было создание датасета и подготовка данных. Присвоение каждому изображению текстового описания — промпта с триггерным словом zadino.

Исходный размер 1375x708
Исходный размер 1976x410

первые генерации

Следующим шагом была загрузка модели Stable Diffusion. Для дообучения я использовала метод LoRA.

Исходный размер 1280x804
Исходный размер 1012x241
Исходный размер 1975x796

начало получаться лучше

Самый важный этап — обучение модели. Я установила 100 эпох (полных проходов по всем изображениям).

Обученная модель позволяла генерировать новые изображения по текстовым описаниям. Для улучшения качества я использовала детальные промпты, в которых явно указывала цвет (#6C6994), наличие двух крыльев, форму глаз.

Исходный размер 1280x954
Исходный размер 984x1041

Всего было сгенерировано более 60 изображений в различных сценах. Я сохранила их и собрала в один ZIP-архив вместе с исходными рисунками для удобства.

Качество результата

Консистентность стиля: единый мультяшный стиль во всех 60+ изображениях.

Передача особенностей: фиолетовый цвет, крылья, глаза — ключевые признаки переданы успешно.

Вариативность: разнообразие сцен от бытовых до фантастических.

Исходный размер 1975x796

Подводя итог этого проекта, важно осмыслить главное: нейросеть — это мощный, но всё же инструмент в руках художника, а не самостоятельный творец. За время работы над проектом я поняла одну важную вещь: нейросеть — это не конкурент художнику, а его соавтор. Она берёт на себя рутинную, техническую часть — быструю генерацию, перебор вариантов, масштабирование идеи. Но именно художник остаётся тем, кто задаёт направление, определяет качество, несёт ответственность за конечный результат.

Рождение фиолетового динозаврика
Проект создан 24.03.2026