Учась основам кино, мне необходимо учитывать реакции людей, психологию воздействия. Изучая субъективные данные от зрительской аудитории, я получаю возможность самосовершенствоваться. Восприятие публики формирует основы для культурного, духовного, эстетического развития.
В исследовании использованы датасет (https://www.kaggle.com/datasets/sahilislam007/letterbox-movie-classification-dataset) с сайта Kaggle.
Набор данных Letterbox Movie Classification Dataset представляет собой обширную и подробную коллекцию метаданных о 10 001 фильмах и исчерпывающий срез их характеристик.
Для анализа применены такие данные, как жанры фильмов, рейтинги и количество просмотров, страны производства, данные о студиях, длительность фильма, оценки зрителей.
цветовое решение
Цвета взяты с интернет страницы Letterboxd, дабы подчеркнуть палитру и эстетику найденного датасета.
использование библиотек
В кодах использованы библиотеки: > gdown для скачивания файла из Google Drive > pandas для работы с csv-файлом > matplotlib.pyplot для осн. визуализации данных > seaborn для стилизации графика > matplotlib.colors для работы с заливкой
import gdown
file_id = '1Go5gyaugXVBdiAQ0el6mDrlxRjFLcwat' output_name = 'your_dataset.csv'
gdown.download (f'https://drive.google.com/uc?id={file_id}', output_name, quiet=False)
import pandas as pd
df = pd.read_csv (output_name)
df.head ()
обработка данных / диаграммы!
[1.] Популярные комбинации жанровых специфик дают понимание текущих зрительских ожиданий и предпочтений позволяет выбирать тематику будущего проекта, минимизируя риски «провала» и развивая потенциал привлечения аудитории.
самые популярные жанры по среднему рейтингу
Для начала рассмотрим эту линейную диаграмму. Выясним первые самые популярные 10 комбинаций по среднему рейтингу. Из диаграммы видно, что первое место занимает ['Thriller', 'Drama', 'Mystery', 'TV Movie'] с очень маленьким отрывом от ['Animation', 'Mystery', 'Family', 'Comedy']
самые популярные жанры по просмотрам
Теперь рассмотрим столбчатую диаграмму. Выясним первые топ-10 комбинаций по просмотрам. Из диаграммы видно, что самую высокую нишу занимает ['Animation', 'Family', 'Comedy', 'Fantasy'], а комбинации, которая была самой популярной по рейтингу (['Thriller', 'Drama', 'Mystery', 'TV Movie']) и вовсе нет в топе.
Для успешного планирования целесообразно учитывать обе метрики — рейтинг и просмотры — и искать баланс между созданием высокорейтинговых, но возможно менее популярных среди массовой аудитории проектов и более массовых, популярных среди зрителей, даже если они имеют чуть ниже оценки.
[2.] Знание кинорынка и конкурентоспособности студий показывает зоны влияния и возможные точки роста узнаваемости. Можно искать возможности сотрудничества с международными партнёрами.
топ-5 списков студий через призму среднего рейтинга
Благодаря круговой диаграмме видим, что страна-лидер по производству кинокартин — США, так как большинство студий из приведенного топа 5 связаны именно с ней. Есть представительства из Великобритании (BBC), Германии (ZDF), Франции (France Télévisions) и Китая (Tencent).
топ-5 списков студий через призму просмотров
Вторая круговая диаграмма показывает топ-5 студий, основываясь на просмотрах. По ней понятно, что страны-лидеры по количеству и влиянию — Соединенные Штаты Америки и Великобритания. Они доминируют в мировой киноиндустрии, особенно в производстве фильмов с большим бюджетом. Также присутствуют студии из Австралии, Германии, Южной Кореи и Канады.
[3.] Продолжительное или короткое повествование требует особых подходов к монтажу, динамике сцены и удерживанию внимания зрителя. Понять оптимальное соотношение продолжительности и качества истории полезно для управления процессом съёмок и постпродакшена.
В сравнении с базой лайков и рейтингом Highest★★★★★ разберемся, какая продолжительность фильма наиболее оптимальна и приятна для пользователей. Это тем более актуально в современный период, когда многие пользователи стали носить ярлык «клиповое мышление», что подразумевает, что долго что-либо смотреть им все труднее и труднее.
Общий топ по лайкам показывает самые популярные фильмы в целом — это может быть как очень длинные, так и короткие. Однако, диаграмма с их продолжительностью указывает на то, что все они длятся более 90 минут (1 час 30 мин), так что если фильм какими-то другими факторами (сюжетом, динамикой, ритм, визуальным миром и тп) завладевает вниманием зрителей, то тогда они способны «выдержать» длинный фильм.
Есть общие фильмы в обоих топах: Parasite, Interstellar, Spider-Man: Into the Spider-Verse. > Фильмы, входящие только в топ по лайкам: Fight Club, Barbie. > Фильмы, входящие только в топ по пятизвездочному рейтингу: The Dark Knight, Everything Everywhere All at Once.
В топ по лайкам попали более короткие фильмы (Fight Club — 139 минут, Barbie — 114 минут), что логично, так как короткие фильмы чаще могут набрать много лайков за короткий период.
В топ по рейтингу звезд — фильмы с чуть большей продолжительностью (The Dark Knight — 152 минута, Everything Everywhere All at Once — 140 минут), возможно потому, что они считаются более динамичными/«эпичными».
> Средняя длина фильмов в топе по лайкам: 131.67 минут > Средняя длина фильмов в топе по пятизвездочному рейтингу: 142.20 минут
Фильмы, попавшие в оба топа, такие как Parasite, Interstellar, Spider-Man: Into the Spider-Verse, — имеют длительность более 90 минут, что свидетельствует о престижности и высокой оценке зрителей независимо от критериев (лайки или рейтинг). Наличие более коротких фильмов в топе по лайкам говорит о необходимости «быстрого» вовлечения зрителя, тогда как в топе по рейтингам выделяются фильмы с более длинным и насыщенным сюжетом, что требует сильного погружения.
Анализируя данные о продолжительности фильмов в топах по лайкам и рейтингу Highest★★★★★, можно сделать вывод, что наиболее оптимальная длительность для современного зрителя составляет примерно 130-140 минут. Создание фильмов в данной временной рамке может повысить их популярность и удовлетворенность зрителей, учитывая тенденции к сокращению внимания и предпочтение динамичного контента.
инструменты / генеративные модели:
- Gpt + Giga chat — исправление ошибок в кодах
- Google Collab — работа с датасетом, создание графиков
(ссылки на нейросети: https://trychatgpt.ru/ + https://giga.chat/)



