Исходный размер 1140x1600

«Я так больше не могу» | Обучение нейросети

Проект принимает участие в конкурсе

КОНЦЕПЦИЯ

Корпоративный иллюстративный стиль — это современный визуальный язык, используемый компаниями для создания нейтральных, «дружелюбных» изображений. Он отличается упрощёнными формами, мягкой пастельной палитрой и отсутствием ярко выраженной индивидуальности или сложных эмоций.

Корпоративные иллюстрации с сайта «Freepik»

В рамках проекта было решено взять такой обезличенный, спокойный стиль и с помощью генеративной нейросети Stable Diffusion попытаться изобразить в нём состояния усталости, отчуждённости и внутреннего напряжения. Цель проекта — передать подавленное эмоциональное состояние, создавая контраст между подобной визуальной формой и человеческим переживанием.

Исходный размер 1024x1024

Корпоративная иллюстрация с сайта «Freepik»

ГЕНЕРАЦИИ

Промпты:

  1. «corporate office worker sitting at desk, head in hands, stress, emotional breakdown, pastel colors, minimalism»
  2. «corporate office worker standing in office, empty office, isolation, emotional fatigue, pastel colors, minimalism»

Промпт: «corporate office worker holding face, sad expression, emotional exhaustion, pastel colors, minimalism»

Исходный размер 1024x1024

Промты:

  1. «corporate office worker crying at desk, emotional breakdown, pastel colors, minimalism»
  2. «corporate office worker crying, emotional breakdown, pastel colors, minimalism»

Промпт: «corporate office worker sitting alone in hallway, isolation, loneliness, emotional fatigue, pastel colors, minimalism»

Исходный размер 1024x1024

Промпты:

  1. «corporate office worker holding head, stress, overwhelmed, emotional fatigue, pastel colors, minimalism»
  2. «corporate office worker sitting on floor, surrounded by papers, emotional breakdown, exhaustion, pastel colors, minimalism»

Сгенерированные изображения в целом смогли передать ключевые черты корпоративного иллюстративного стиля: упрощённые формы, пастельную палитру и визуальную нейтральность. Однако сильные эмоции выражаются не так ярко, как хотелось бы. Они всё же остаются сдержанными и приглушёнными, что неудивительно, учитывая особенности исходной выборки. Но, в целом, цель достигнута — контраст между спокойной формой и эмоциональным содержанием усиливает ощущение отчуждённости.

ПРИНЦИП РАБОТЫ КОДА

Для генерации изображений использовался Stable Diffusion. Для обучения модели была собрана выборка изображений в корпоративном иллюстративном стиле, приведённая к единому формату и загруженная в Google Colab. После этого можно было переходить к подготовке обучающего набора.

Исходный размер 1784x452

Фрагмент кода: загрузка зависимостей

Исходный размер 1782x717

Фрагмент кода: превью выборки изображений

Так как для обучения требуются пары «изображение — текст», подписи были сгенерированы автоматически с помощью модели BLIP, после чего к каждому описанию добавлялся общий префикс, задающий стиль: «corporate illustration style, pastel colors, minimalism».

Исходный размер 1730x417

Фрагмент кода: LoRA

Далее я получила токен на Hugging Face для сохранения модели и запустила обучение с использованием LoRA. После завершения обучения модель была готова к использованию и генерации изображений.

Исходный размер 818x236

Фрагмент кода: загрузка модели SDXL, подготовка к работе на GPU

ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ

Для помощи с кодом и генерации промптов был использован CHAT GPT.

«Я так больше не могу» | Обучение нейросети
Проект создан 24.03.2026