rural photo archive style generations на Deziiign

Фотография позволяет сохранить момент, но никогда не может сохранить его полностью. Каждое изображение становится лишь фрагментом воспоминания — следом света, времени и места.

В этом проекте нейросеть обучается на серии моих фотографий загородной природы, снятых на цифровую камеру. Анализируя реальные пейзажи, она создаёт новые изображения, которые никогда не существовали, но сохраняют знакомое ощущение тишины, пространства и присутствия человека в природной среде.

Результат представляет собой своеобразное продолжение личного архива: нейросеть не копирует исходные фотографии, а переосмысляет их, создавая новые вариации между документальной фиксацией и воображением.

Исходный размер 3072x2304

Концепция

В этом проекте я работаю с собственным архивом фотографий загородной природы, снятых на цифровую камеру. Меня заинтересовала возможность использовать нейросеть не просто как инструмент генерации изображений, а как способ переосмыслить уже существующие визуальные воспоминания.

Природный пейзаж постоянно меняется: свет, погода, время года и состояние самого наблюдателя никогда не повторяются полностью. Обучаясь на фотографиях, нейросеть создаёт новые изображения, которые не являются копиями реальных мест, но сохраняют их атмосферу и визуальный характер.

Получившаяся серия находится между документальной фотографией и воображением. Эти изображения напоминают знакомые пейзажи, однако существуют только внутри модели, превращая личный фотоархив в пространство новых, никогда не происходивших воспоминаний.

Исходный размер 3072x2304

Архив

Датасет сформирован на основе моих собственных фотографий загородной природы, снятых на цифровую камеру. Для обучения были отобраны изображения пейзажей, растений, лесных и открытых пространств, объединённые общей визуальной атмосферой и тематикой.

Обучении генеративной модели

Обучение модели проводилось в среде Google Colab с использованием графического процессора (GPU). Для работы была использована модель Stable Diffusion XL и метод дообучения LoRA, позволяющий адаптировать нейросеть под особенности выбранного набора изображений без полного переобучения модели.

На начальном этапе были установлены необходимые библиотеки и подготовлена рабочая среда для обучения. После этого был загружен датасет, состоящий из моих собственных фотографий загородной природы, снятых на цифровую камеру. Изображения были приведены к единому формату и использованы для обучения модели.

В процессе обучения нейросеть анализировала визуальные особенности фотографий: композицию, цветовую палитру, освещение и характер природных объектов. В результате была создана LoRA-модель, способная генерировать новые изображения, сохраняющие атмосферу и визуальный стиль исходного фотоархива.

Блокнот

Датасет был сформирован из моих собственных фотографий загородной природы, снятых на цифровую камеру. Изображения были загружены в рабочую среду, приведены к единому квадратному формату и собраны в отдельную директорию для дальнейшего обучения. Подготовленная выборка включала природные пейзажи, растения и различные природные объекты, объединённые общей визуальной атмосферой.

На следующем этапе для каждого изображения были автоматически созданы текстовые описания, которые использовались в качестве подписей при обучении модели. Полученные описания были дополнены общим ключевым токеном, связанным с тематикой проекта, что позволило модели лучше выделить характерные особенности датасета. Такой подход помог связать визуальные характеристики фотографий с текстовыми запросами и подготовить данные для последующего обучения LoRA-модели.

Исходный размер 2554x958

В качестве базовой модели использовалась Stable Diffusion XL, которая была дообучена на подготовленном датасете с помощью метода LoRA. Такой подход позволяет эффективно адаптировать модель под конкретный визуальный материал, сохраняя при этом возможности исходной нейросети.

В ходе обучения были заданы основные параметры генерации и оптимизации, включая разрешение изображений, размер обучающих батчей и количество шагов обучения. Модель обучалась на парах «изображение — текстовое описание», постепенно перенимая характерные особенности фотографий: природные формы, композиционные решения, освещение и общую атмосферу загородных пейзажей.

В результате обучения была получена специализированная LoRA-модель, способная генерировать новые изображения природы, сохраняющие визуальный характер и настроение исходного фотоархива, но при этом создающие уникальные, ранее не существовавшие сцены.

Исходный размер 2554x1016

После завершения обучения полученные веса LoRA были сохранены и использованы для генерации итоговой серии изображений. На этапе генерации обученная модель подключалась к базовой версии Stable Diffusion XL, после чего по текстовым запросам создавались новые варианты природных пейзажей.

При генерации использовались различные описания природной среды, времени суток и погодных условий, что позволило получить разнообразные визуальные результаты при сохранении общего характера датасета. Несмотря на то что созданные изображения не повторяют конкретные фотографии из архива, они сохраняют особенности композиции, освещения и атмосферы, усвоенные моделью в процессе обучения.

Полученная серия демонстрирует, как нейросеть может не только воспроизводить отдельные визуальные характеристики исходных изображений, но и создавать новые интерпретации природных ландшафтов, основанные на изученном визуальном материале.

Исходный размер 2550x1136

Итоговые генерации

Исходный размер 1344x768

Переданные элементы стиля:

Текстурная идентичность — Сохраняется визуальная фактура исходных фотографий: зернистость цифровой камеры, мягкие переходы света, естественные поверхности земли, травы и деревьев. Даже в генерации ощущается связь с реальными исходными кадрами.

Композиционная стабильность — В большинстве изображений сохраняется спокойная, наблюдательная композиция с акцентом на горизонтальные линии, открытое пространство и глубину сцены. Это поддерживает ощущение документальности и фотоархива.

Постепенность трансформации — Генеративная модель демонстрирует мягкие изменения реальности: от точного воспроизведения природных сцен до слегка смещённых, почти воспоминательных интерпретаций пространства.

Цветовая преемственность — Поддерживается приглушённая природная палитра: зелёные, коричневые и серо-голубые оттенки остаются основой визуального языка, даже при изменении формы и освещения сцены.

rural memory archive style, open field at dusk, tall grass moving in wind, soft overexposed sky, quiet atmosphere, no people

rural memory archive style, countryside after rain, wet ground reflecting sky, blurred horizon, soft and unstable exposure

rural memory archive style, rural road disappearing into fog, minimal composition, soft grain, dreamlike realism

rural memory archive style, meadow with wild plants in foreground, shallow depth of field, imperfect exposure, archival feeling

rural memory archive style, fenced pasture ending at river edge, water reflecting pale light, minimal composition, dreamlike rural realism

rural memory archive style, weathered fence posts disappearing into fog near river, soft focus, washed-out greens and greys, archival texture

rural memory archive style, narrow dirt path parallel to river and fence line, slight motion blur, overexposed highlights, quiet solitude

rural memory archive style, riverbank with uneven wooden fence segments, water shimmering softly, muted tones, analog film instability

Исходный размер 1344x768

Процесс обучения

Архитектура и параметры: — Базовая модель: Stable Diffusion 1.5 — Метод адаптации: DreamBooth с LoRA — Размер датасета: 13 изображений — Количество эпох: 30 — Разрешение: 512×512 пикселей Описание процесса

Обучение модели проводилось на датасете из 10 изображений, выполненных в едином визуальном стиле rural memory archive. Все изображения представляли собой сельские пейзажи с акцентом на атмосферу памяти, мягкую нестабильную экспозицию и кинематографическую зернистость. Для улучшения качества генерации использовались techniques gradient checkpointing, 8-bit Adam optimizer и mixed precision (fp16), что позволило эффективно обучать модель в ограниченных вычислительных ресурсах GPU T4. Уникальный токен «rma rural archive» был введён для закрепления стилистической связки между объектами и характерной визуальной эстетикой, обеспечивая стабильную генерацию сцен с архивным, размытым и эмоционально нейтральным настроением.

В результате генерации были получены визуально цельные и атмосферные изображения загородной природы, в которых хорошо сохраняется общее настроение исходного фотоархива. Модель уверенно воспроизводит характер пейзажей: открытые пространства, мягкое освещение, природные текстуры и ощущение спокойной наблюдательности.

При этом отдельные сцены не стремятся к точной фиксации реальности. Формы природных объектов могут слегка смещаться, терять чёткость или становиться более обобщёнными. Из-за этого изображения иногда уходят в сторону визуальной неопределённости, где конкретный пейзаж превращается в состояние или ощущение места.

Такая «неточность» генерации в данном случае становится важной частью результата: она усиливает эффект памяти, в которой детали не воспроизводятся буквально, а реконструируются и дополняются воображением модели.

Исходный размер 1280x1024

Использование генеративной модели

Stable Diffusion XL (SDXL) — базовая генеративная модель, использованная для синтеза изображений по текстовым запросам. Она позволяет создавать фотореалистичные и стилизованные изображения на основе описаний, задаваемых пользователем.

LoRA (Low-Rank Adaptation) — метод дообучения, применённый для адаптации модели под собственный датасет. Данный подход позволяет эффективно настраивать поведение модели, обучая только небольшую часть параметров, что делает процесс более быстрым и доступным при ограниченных вычислительных ресурсах.

DreamBooth — методика дообучения, используемая для привязки модели к конкретному визуальному стилю или набору изображений, позволяющая воспроизводить характерные особенности исходного датасета в генерации.

GigaChat — инструмент, использованный в процессе работы для помощи в формулировке и оптимизации текстовых промптов, а также для поддержки в задачах, связанных с программированием и структурированием описания проекта.

Stable Diffusion XL (SDXL): https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0 LoRA: https://huggingface.co/docs/diffusers/training/lora DreamBooth: https://huggingface.co/docs/diffusers/training/dreambooth GigaChat: https://giga.chat/