Моя жизнь неразрывно связана с музыкой. Начиная с младенчества, когда мама включала мне Вивальди, и до сегодняшнего дня, когда за плечами уже 7 лет музыкальной школы, а наушники почти приросли к телу. Мне невозможно представить себя без столь важной части жизни. И исследовать я решила информацию связанную именно с музыкой. Она отражает культурные и эмоциональные сдвиги в обществе. Анализируя характеристики треков, можно увидеть, как меняется вкус слушателей со временем.
Информацию я взяла из датасета Spotify Tracks Dataset (Kaggle), содержащего характеристики музыкальных треков и показатели их популярности.
Для начала я загрузила данные и отфильтровала по годам, чтобы убрать редкие старые записи и шум.


Стиль графиков
Для проекта я разработала единый визуальный стиль Spotify After Dark
Стиль вдохновлён интерфейсом Spotify и эстетикой ночного прослушивания музыки: тёмный фон снижает визуальный шум, а зелёные акценты работают как «звуковые маркеры», аналогичные пикам в эквалайзере.
Реализация:
- тёмный фон для всех графиков;
- единый акцентный цвет (зелёный);
- минимальная сетка и отсутствие декоративных элементов;
- единый кодовый шаблон для построения графиков.
Используемые статистические методы
- Описательная статистика среднее (mean) медиана (median)
df.describe ()
- Агрегация и группировка (основа большинства графиков) groupby («year») для трендов groupby («genres») для сравнений категорий
df.groupby («year»)[«duration_ms»].mean () df.groupby («year»)[«popularity»].median ()
- Логика «ограничений» Я отдельно учитывал, что:
- track_popularity это платформенная метрика (зависит от алгоритмов Spotify)
- средние значения чувствительны к выбросам
Популярность по годам Этот график показывает «одну линию популярности»
Популярность устроена так, что она часто неравномерно распределена: небольшое число треков собирает огромную долю внимания.
Даже если медианная популярность растёт, распределение может становиться более неравномерным: в музыкальной экосистеме усиливается эффект «победитель забирает всё», когда несколько треков получают непропорционально много внимания.
Ограничения Метрика popularity в Spotify является платформенным индексом. Она может изменяться со временем, зависеть от внутренней нормировки и от того, как именно формируется выборка.
Средняя длительность треков по годам График отражает, как меняется типичная длительность трека во времени. Для каждого года релиза я агрегировал данные и посчитал среднее значение duration_ms (переведённое в минуты). То есть это не про один конкретный трек, а про «среднюю композицию» внутри каждого года.
Как читать
- Если кривая понижаются, это означает тенденцию к сокращению длительности треков.
- Если на графике есть резкие скачки вверх/вниз, их важно воспринимать осторожно: они часто возникают из-за особенностей выборки (в каком-то году в датасете могло оказаться больше длинных треков определённого жанра или эпохи).
Наблюдается снижение длительности, это можно объяснить через изменения в способе потребления музыки. Экономика внимания: короткие треки легче дослушать до конца, а удержание внимания сегодня критично. Стриминговая логика: платформы стимулируют контент, который чаще переслушивают и который «быстрее цепляет». Короткие форматы контента: рост популярности TikTok/Reels/Shorts.
Современная музыкальная среда постепенно смещается к более коротким формам: композиция становится компактнее, с более быстрым входом в «главную идею» трека.
Ограничения Среднее чувствительно к выбросам (например, если в год попадёт много очень длинных треков).
Энергия и настроение (Energy vs Valence) График показывает эмоциональную карту музыки: от спокойных и грустных до энергичных и радостных.
Как читать Его удобно читать через «зоны»:
- низкая энергия + низкий valence: спокойные/меланхоличные треки
- высокая энергия + высокий valence: бодрые/позитивные треки
- высокая энергия + низкий valence: «злой драйв», напряжённая музыка
- низкая энергия + высокий valence: «лёгкое настроение», мягкая позитивность
Музыка в данных формирует эмоциональные кластеры: аудитория и индустрия тяготеют к нескольким устойчивым сочетаниям энергии и настроения, а экстремальные состояния встречаются реже.
Надо учитывать, что Energy и valence это инженерные признаки, рассчитанные алгоритмами Spotify, а не прямые психофизиологические измерения.
Энергия и популярность (Energy vs Popularity) График отвечает на вопрос: является ли более энергичная музыка более популярной.
Как читать
- Если точки образуют явный наклон вверх, есть положительная связь.
- Если облако «размазано» без чёткой линии, значит корреляция слабая: энергия влияет, но не является главным фактором.
Энергия может повышать вероятность популярности, но не гарантирует её. В данных видно множество треков с высокой энергией и низкой популярностью, а также умеренно энергичные треки с высокой популярностью.
Ограничения Популярность это не чисто музыкальная характеристика, а показатель, который зависит от внешних факторов (алгоритмы, продвижение). Поэтому корректно:
График показывает связь между аудио-признаком и платформенной метрикой, а не «причину популярности».
В динамике по годам видно, что музыкальная форма меняется (длительность треков). Распределения популярности показывают, что внимание аудитории неравномерно и концентрируется на части треков. На уровне аудио-признаков визуальная карта Energy–Valence описывает эмоциональные «зоны» музыки, а график Energy–Popularity демонстрирует, что популярность не сводится к одному параметру: энергетика помогает, но не объясняет успех полностью.



