Описание
В процессе поиска интересного датасета на сайте kaggle.com я обратила внимание на данные, посвящённые премии «Оскар». Этот датасет показался мне особенно любопытным, так как «Оскар» на протяжении почти ста лет отражает не только развитие киноиндустрии, но и изменение её приоритетов, жанров и подходов к оценке фильмов и персоналий.
Не раздумывая слишком долго, я решила выбрать именно его и попробовать разобраться, как со временем менялись победы, категории и структура номинаций премии.
Типы диаграмм
(01) линейный график (02) горизонтальная столбчатая диаграмма (03) точечная диаграмма (04) тепловая карта (05) горизонтальная столбчатая диаграмма
Выбор пал на диаграммы, которые позволяют наглядно показать динамику данных во времени, выявить доминирующие категории и проследить связь между количеством номинаций и побед. Такой набор визуализаций помогает быстро считать основные закономерности и сделать выводы без углубления в сырые таблицы.
(00) Этапы работы
При создании визуального стиля проекта я ориентировалась на атмосферу кинотеатра и саму эстетику премии «Оскар». В качестве основы был выбран тёмный фон, ассоциирующийся с кинозалом, вечерним показом и торжественной церемонией награждения.
Цветовая палитра строится вокруг золотого оттенка, символизирующего саму награду и статус премии, с добавлением глубокого красного цвета как отсылки к ковровым дорожкам и классической киноэстетике.

Цветовая палитра
В качестве шрифтового решения была выбрана гарнитура Non Bureau.
Почему?
Это современный, строгий и в то же время выразительный шрифт, который хорошо сочетается с аналитическим характером проекта и поддерживает «редакционную» и фестивальную эстетику, не отвлекая внимание от данных.Шрифт
(01) Количество побед «Оскар»
Для построения линейного графика используется библиотека Matplotlib. В коде задаются размеры холста, цвет линии, толщина линии, а также оформление осей, сетки и заголовка диаграммы в соответствии с выбранным визуальным стилем проекта.
(02) Номинации и победы
Для отображения связи между количеством номинаций и побед используется точечная диаграмма. Цвет точек кодирует год, а цветовая шкала помогает визуально проследить изменение распределения данных во времени.
(03) Категории с наибольшим числом побед
Горизонтальная столбчатая диаграмма используется для отображения персон с наибольшим числом номинаций. В коде дополнительно выполняется фильтрация данных и настройка подписей, чтобы диаграмма оставалась компактной и наглядной.
(04) Доминирующие категории
Тепловая карта строится на основе агрегированных данных по десятилетиям. В коде используется цветовое кодирование интенсивности значений, что позволяет быстро определить доминирующие категории в разные периоды времени.
Подытожим
В ходе анализа данных о премии «Оскар» я построила серию визуализаций, которые позволили проследить, как со временем менялись победы, категории и структура номинаций. Использование различных типов диаграмм помогло взглянуть на премию не как на отдельные события, а как на долгую и меняющуюся систему.
Если попробовать собрать условный «портрет» успешного участника премии на основе данных, то можно выделить несколько наблюдений: 1/ определённые категории стабильно доминируют на протяжении десятилетий 2/ количество номинаций и побед со временем растёт и распределяется неравномерно 3/ одни и те же имена и категории регулярно появляются в данных, формируя устойчивые паттерны
Выходит, получить «Оскар» — это не только вопрос одного удачного фильма, но и результат долгосрочных тенденций киноиндустрии.



