Введение
Для своего исследование я выбрал датасет с данными о кинофильмах. Кино всегда меня привлекало, как зрителя, поэтому, рассуждая о теме исследования я выбрал именно это направление.
Киноиндустрия — одна из тех сфер, где творчество и коммерция переплетаются настолько тесно, что порой трудно понять, где заканчивается одно и начинается другое. Одни фильмы оказываются в центре внимания и превращаются в события, тогда как другие проходят почти незамеченными, или проваливаются в прокате, хотя на первый взгляд располагают теми же бюджетами, жанрами и рекламными возможностями.
Особенно интересно выявить влияние творческих команд на финансовый успех, несоответствие между оценками и коммерческим успехом фильма, проследить саму эволюцию кино, как медиума — по длительности, жанровой структуре. Таким образом, подобный анализ позволит посмотреть одновременно на кино, как на продукт труда конкретных людей, и как на часть культурного контекста, и как на экономическую единицу со своими рисками и закономерностями.
Для поиска датасета с подробной информацией о кинофильмах, я использовал источник Kaggle.com.
Обработал и объединил данные для анализа с помощью кода




Методы исследования и типы диаграмм
Для визуализации результатов представлены следующие типы диаграмм:
Line plot — для временных рядов (динамика производства, длительность по жанрам).
Scatterplot — для анализа вкладов творческих команд и синергии.
Pie chart — для пропорций категорий «рейтинг × окупаемость».
Horizontal bar chart — для ранжирования жанров по частоте.
Grouped bar chart — для сравнения жанровых распределений по десятилетиям.
В исследовании применялись следующие статистические методы:
Анализ временных рядов — при анализе динамики количества фильмов, длительности и жанровых изменений во времени.
Частотный анализ — при подсчёте количества фильмов по жанрам и при сравнении жанровых распределений между периодами.
Пропорциональный анализ — при формировании категорий по сочетаниям «рейтинг × ROI» и расчёте их долей.
Нормализация признаков (z-score) — для стандартизации вкладов режиссёров и актёров.
Многофакторный анализ — совместное рассмотрение двух нормализованных вкладов с дополнительной переменной (синергией), визуализированной через цвет.
Сравнение групп — при сопоставлении жанров между десятилетиями и при анализе временных изменений в длительности.
Цветовая палитра
Для проекта выбрана цветовая палитра, которая максимально отсылает наблюдателя к эстетике кино.
График № 1
Линейный график — это самый наглядный способ показать, как менялась индустрия в долгосрочной перспективе. Когда мы говорим о десятилетиях развития, важно движение: ускоряется ли рост, появляются ли переломные моменты, меняется ли структура производства.


График 2
Горизонтальный барчат позволяет легко сравнивать категории, не перегружая зрителя длинными названиями. Визуально становится ясно, какие жанры формируют центр индустрии, а какие остаются на её периферии


График 3
Столбчатая диаграмма оптимальна, потому что она позволяет одновременно сравнивать несколько категорий (жанров) в разные временные периоды. Такой формат обеспечивает чёткую визуальную дифференциацию между десятилетиями и позволяет непосредственно оценивать изменение объёмов производства внутри одного жанра по мере перехода от одной эпохи к другой.


График 4
Линейный график выбран потому, что он позволяет одновременно отображать динамику нескольких жанров в рамках одного временного ряда. Такой формат наглядно показывает, как менялась средняя длительность фильмов внутри каждого жанра и как эти изменения соотносятся между собой




График 5
Круговая диаграмма позволяет показать соотношение разных типов несоответствий между оценками и доходностью — буквально показать, какую долю каждая категория занимает в общей картине.


График 6
Суть анализа творческих команд заключается в том, что на результат влияет не один фактор, а взаимодействие нескольких людей. Scatterplot подходит для этой задачи лучше любого другого типа визуализации, потому что он позволяет разместить вклад режиссёра и актёра на двух осях, а цветом одновременно показать синергию — то есть то, насколько хорошо команда работает вместе. Такой тип визуализации делает сложное взаимодействие человеческих факторов видимым.






Выводы
Проведённый анализ позволил рассмотреть сферу кино одновременно в нескольких измерениях: как результат работы конкретных творческих команд, как культурный продукт своего времени и как экономическую систему со специфическими закономерностями.
Анализ показывает, что кинопроизводство за последние десятилетия заметно выросло, а жанровая структура стала более разнообразной: драма остаётся ведущей, документальное кино и экшен усилили позиции. Жанры по-разному реагируют на культурные изменения, что особенно видно по динамике длительности: в большинстве направлений фильмы постепенно становятся короче, тогда как экшен в 2000-е, напротив, увеличивается в хронометраже вслед за ростом блокбастерной модели. Сопоставление рейтингов и финансовых результатов подтверждает, что художественные оценки и коммерческий успех нередко расходятся. При этом анализ творческих команд показывает, что финансовые показатели во многом определяются не отдельными участниками, а качеством их взаимодействия
«Описание применения генеративной модели»
В проекте была задействована нейросеть Chart GPT 5.1, чтобы править код, генерировать обложку.
Промт для создания обложки: Generate a high-resolution digital artwork with the exact resolution 1140×1600 pixels. The image must depict a large, realistic golden Oscar statuette in the foreground, viewed from a slightly low angle to create a monumental, cinematic presence. The lighting should produce warm golden reflections on the statue, emphasizing its metallic surface. The background must use a deep navy-blue gradient (



