Концепция
Свой проект я бы хотела посвятить анализу зрительских предпочтений на примере 50 лучших фильмов разных жанров. В наше время через человека проходит огромный поток информации и успеть её обработать и зафиксировать становится крайне сложно, даже если речь заходит о простом выборе фильма на вечер. Целью моего проекта является формирование кратких выводов, которые облегчат зрителю поиск и выбор фильма. Используя разные базы данных, я выявила наиболее популярного режиссёра, 10 самых просматриваемых фильмов, самый популярный жанр и самые длинные фильмы. Данные представила в виде круговой диаграммы, гистограммы, точечной диаграммы и облака слов.
Обложка
Обложка для проекта была сгенерирована с помощью ИИ в нейросети Midjourney, выполнена в стиле кинообложек 2000-х.
#660099 Основной цвет
Поиск и обработка данных
Для сбора данных я воспользовалась kaggle и библиотекой numpy, скачала cvs-файл. Код был написан в google colab, а для устранения образовавшихся ошибок пользовалась Chat-GPT.
Визуализация полученных данных
Гистограмма демонстрирует нам, что наиболее востребованным жанром является Action/Боевик, он встречается в каждом из 50 фильмов, за ним идут жанры Drama/Драма и Adventure/Приключение.
Гистограмма. Распределение фильмов по жанрам
На круговой диаграмме мы наглядно видим, что самым популярным режиссером является Christopher Nolan/Кристофер Нолан. Он снял наибольшее количество фильмов из списка (4).
Круговая диаграмма. Распределение фильмов по режиссерам
Облако слов показывает нам названия 10 самых просматриваемых фильмов из списка 50 лучших фильмов.
- The Dark Knight — 2564876 голосов
- Inception — 2276070 голосов
- The Matrix — 1863163 голосов
- The Lord of the Rings: The Fellowship of the Ring — 1803162 голосов
- The Lord of the Rings: The Return of the King — 1781988 голосов
- The Dark Knight Rises — 1656953 голосов
- The Lord of the Rings: The Two Towers — 1609410 голосов
- Gladiator — 1457691 голосов
- Batman Begins — 1430635 голосов
- Star Wars — 1326295 голосов
Облако слов. 10 наиболее просматриваемых фильмов из списка
Точечная диаграмма фиксирует самы длинные по продолжительности фильмы из списка.
- Gangs of Wasseypur — 321 min
- Seven Samurai — 207 min
- The Lord of the Rings: The Return of the King — 201 min
- RRR — 187 min
- Avengers: Endgame — 181 min
- The Lord of the Rings: The Two Towers — 179 min
- The Lord of the Rings: The Fellowship of the Ring — 178 min
- Heat — 170 min
- K.G.F: Chapter 2 — 168 min
- Baahubali 2: The Conclusion — 167 min
Точечная диаграмма. Самые длинные фильмы
Заключение
Анализ датасета помог определить некоторые пункты, на которые человек сможет удобно ориентироваться при выборе фильма. Например, по выбору режиссера, длительности фильма, наиболее популярного жанра или краткой выжимки лучших фильмов.
Описание применения генеративных моделей
Для своего проекта я пользовалась ИИ в качестве помощника для генерации изображения (обложки) Midjourney. Для написания кода был использован Google Colab. Для устранения неточностей в коде я пользовалась Chat-GPT. Текст для проекта был сформулирован лично мной, без помощи ИИ.



