Исходный размер 1024x1536

Код кино

PROTECT STATUS: not protected

Введение

Для своего исследование я выбрал датасет с данными о кинофильмах. Кино всегда меня привлекало, как зрителя, поэтому, рассуждая о теме исследования я выбрал именно это направление.

Киноиндустрия — одна из тех сфер, где творчество и коммерция переплетаются настолько тесно, что порой трудно понять, где заканчивается одно и начинается другое. Одни фильмы оказываются в центре внимания и превращаются в события, тогда как другие проходят почти незамеченными, или проваливаются в прокате, хотя на первый взгляд располагают теми же бюджетами, жанрами и рекламными возможностями.

Особенно интересно выявить влияние творческих команд на финансовый успех, несоответствие между оценками и коммерческим успехом фильма, проследить саму эволюцию кино, как медиума — по длительности, жанровой структуре. Таким образом, подобный анализ позволит посмотреть одновременно на кино, как на продукт труда конкретных людей, и как на часть культурного контекста, и как на экономическую единицу со своими рисками и закономерностями.

Для поиска датасета с подробной информацией о кинофильмах, я использовал источник Kaggle.com.

Обработал и объединил данные для анализа с помощью кода

Методы исследования и типы диаграмм

Для визуализации результатов представлены следующие типы диаграмм:

Line plot — для временных рядов (динамика производства, длительность по жанрам).

Scatterplot — для анализа вкладов творческих команд и синергии.

Pie chart — для пропорций категорий «рейтинг × окупаемость».

Horizontal bar chart — для ранжирования жанров по частоте.

Grouped bar chart — для сравнения жанровых распределений по десятилетиям.

В исследовании применялись следующие статистические методы:

Анализ временных рядов — при анализе динамики количества фильмов, длительности и жанровых изменений во времени.

Частотный анализ — при подсчёте количества фильмов по жанрам и при сравнении жанровых распределений между периодами.

Пропорциональный анализ — при формировании категорий по сочетаниям «рейтинг × ROI» и расчёте их долей.

Нормализация признаков (z-score) — для стандартизации вкладов режиссёров и актёров.

Многофакторный анализ — совместное рассмотрение двух нормализованных вкладов с дополнительной переменной (синергией), визуализированной через цвет.

Сравнение групп — при сопоставлении жанров между десятилетиями и при анализе временных изменений в длительности.

Цветовая палитра

Для проекта выбрана цветовая палитра, которая максимально отсылает наблюдателя к эстетике кино.

Исходный размер 1098x1094
Исходный размер 1500x600

График № 1

Линейный график — это самый наглядный способ показать, как менялась индустрия в долгосрочной перспективе. Когда мы говорим о десятилетиях развития, важно движение: ускоряется ли рост, появляются ли переломные моменты, меняется ли структура производства.

Исходный размер 1330x568

График 2

Горизонтальный барчат позволяет легко сравнивать категории, не перегружая зрителя длинными названиями. Визуально становится ясно, какие жанры формируют центр индустрии, а какие остаются на её периферии

Исходный размер 2266x1136

График 3

Столбчатая диаграмма оптимальна, потому что она позволяет одновременно сравнивать несколько категорий (жанров) в разные временные периоды. Такой формат обеспечивает чёткую визуальную дифференциацию между десятилетиями и позволяет непосредственно оценивать изменение объёмов производства внутри одного жанра по мере перехода от одной эпохи к другой.

Исходный размер 2266x1212
Исходный размер 2098x1384

График 4

Линейный график выбран потому, что он позволяет одновременно отображать динамику нескольких жанров в рамках одного временного ряда. Такой формат наглядно показывает, как менялась средняя длительность фильмов внутри каждого жанра и как эти изменения соотносятся между собой

Исходный размер 2274x1134
Исходный размер 1756x1360
Исходный размер 1892x514

График 5

Круговая диаграмма позволяет показать соотношение разных типов несоответствий между оценками и доходностью — буквально показать, какую долю каждая категория занимает в общей картине.

Исходный размер 2276x1286
Исходный размер 1448x1308

График 6

Суть анализа творческих команд заключается в том, что на результат влияет не один фактор, а взаимодействие нескольких людей. Scatterplot подходит для этой задачи лучше любого другого типа визуализации, потому что он позволяет разместить вклад режиссёра и актёра на двух осях, а цветом одновременно показать синергию — то есть то, насколько хорошо команда работает вместе. Такой тип визуализации делает сложное взаимодействие человеческих факторов видимым.

Исходный размер 1314x980
Исходный размер 1620x1352
Исходный размер 2014x658

Выводы

Проведённый анализ позволил рассмотреть сферу кино одновременно в нескольких измерениях: как результат работы конкретных творческих команд, как культурный продукт своего времени и как экономическую систему со специфическими закономерностями.

Анализ показывает, что кинопроизводство за последние десятилетия заметно выросло, а жанровая структура стала более разнообразной: драма остаётся ведущей, документальное кино и экшен усилили позиции. Жанры по-разному реагируют на культурные изменения, что особенно видно по динамике длительности: в большинстве направлений фильмы постепенно становятся короче, тогда как экшен в 2000-е, напротив, увеличивается в хронометраже вслед за ростом блокбастерной модели. Сопоставление рейтингов и финансовых результатов подтверждает, что художественные оценки и коммерческий успех нередко расходятся. При этом анализ творческих команд показывает, что финансовые показатели во многом определяются не отдельными участниками, а качеством их взаимодействия

«Описание применения генеративной модели»

В проекте была задействована нейросеть Chart GPT 5.1, чтобы править код, генерировать обложку.

Промт для создания обложки: Generate a high-resolution digital artwork with the exact resolution 1140×1600 pixels. The image must depict a large, realistic golden Oscar statuette in the foreground, viewed from a slightly low angle to create a monumental, cinematic presence. The lighting should produce warm golden reflections on the statue, emphasizing its metallic surface. The background must use a deep navy-blue gradient (

0A1B3D range), subtle and textured, not flat. On this background, display uneven, human-typed Python code in soft yellow tones (

FFD659), arranged in perspective, as if projected onto a distant wall. Indentation and line spacing should vary to mimic natural coding, not a repeated block. At the top of the background, include thin vertical golden light streaks and small glowing particles, creating depth and a subtle bokeh-like atmospheric effect. Maintain the correct physical perspective so that code and light streaks appear to recede into space behind the statue. The final composition must retain a premium, cinematic aesthetic, combining the themes of film industry prestige, digital technology, and data analysis

Код кино
Проект создан 16.01.2026