Обучение генеративной сети стилю картин Эдварда Мунка на Deziiign

Стиль Эдварда Мунка — это уникальное сочетание экспрессии, тревожной атмосферы и узнаваемых цветовых решений.

Цель проекта — обучить нейросеть Stable Diffusion XL (SDXL) с помощью DreamBooth + LoRA так, чтобы она могла создавать новые изображения в духе Мунка

Для обучения использовалась коллекция из 200 изображений картин Мунка, собранных с Kaggle: https://www.kaggle.com/datasets/isaienkov/edvard-munch-paintings (Распространяются под лицензией CC0: Public Domain)

Примеры исходных работ:

Исходный размер 1536x256

Часть изображений из датасета

Изображения различаются по сюжету, но объединены общей экспрессивной манерой.

Модель успешно переняла ключевые особенности стиля:

Промт: painting in MUNCHSTYLE style, lonely figure by the sea at sunset

Промт: painting in MUNCHSTYLE style, city street in anxiety mood

Промт: painting in MUNCHSTYLE style, self portrait with expressive brushstrokes

Промт: painting in MUNCHSTYLE style, two people under dramatic sky

Промт: painting in MUNCHSTYLE style, night bridge and flowing lines

Промт: painting in MUNCHSTYLE style, symbolic landscape with red sky

Промт: painting in MUNCHSTYLE style, faceless crowd in motion

Промт: painting in MUNCHSTYLE style, portrait with distorted perspective

Результаты показывают, что модель научилась не просто копировать отдельные картины, а именно стилизовать новые сцены под Мунка. Это видно по тому, как на новых сюжетах сохраняются ключевые элементы стиля.

Цветовая палитра: доминируют приглушённые, тревожные оттенки, характерные для Мунка.

Композиция: искажённые перспективы, вытянутые фигуры, эмоциональные позы.

Атмосфера: ощущается тревожность, одиночество, экспрессия.

Техника: заметны мазки, напоминающие оригинальную манеру письма художника.

Технические детали:

Для генерации промптов использовалась BLIP-captioning, чтобы максимально точно описать исходные изображения.

Обучение велось в режиме LoRA с сохранением промежуточных чекпоинтов.

Для генерации итоговой серии использовались разные текстовые описания, чтобы проверить универсальность переноса стиля.

Работа с кодом:

Исходный размер 998x445

Устанавливаем необходимые скрипты и зависимости

Исходный размер 996x1185