Описание
Музыка — это неотъемлемая часть нашей культуры. Она сопровождает нас в разные моменты жизни, способствуя созданию воспоминаний и эмоций. Мы все любим музыку: она вдохновляет, развлекает и успокаивает. Музыка объединяет людей, позволяет выражать чувства и делиться опытом. В современном мире музыка стала доступна каждому благодаря платформам, таким как Spotify, где можно найти треки на любой вкус и настроение.
Анализ основан на данных из Spotify Tracks Dataset, который был взят с платформы Kaggle. Этот датасет содержит информацию о 114 000 музыкальных треках, доступных на Spotify, и включает в себя множество параметров, которые позволяют глубоко изучить особенности популярной музыки. Данные охватывают различные аспекты треков, такие как их популярность, жанры, аудио-характеристики и длительность.
Анализ данных о музыкальных треках интересен, потому что музыка является важной частью нашей культуры, объединяющей людей по всему миру. Исследуя музыкальные тренды и предпочтения, мы можем понять, как меняются вкусы слушателей и какие жанры становятся популярными. Это полезно для музыкантов и продюсеров, позволяя им адаптировать своё творчество к современным требованиям. Кроме того, анализ данных открывает возможности для изучения психологического восприятия музыки и её влияния на эмоции. В быстроразвивающейся музыкальной индустрии это помогает компаниям разрабатывать более эффективные стратегии продвижения и лучше понимать свою аудиторию. В целом, тема анализа музыкальных данных предлагает увлекательные и полезные инсайты о современных культурных и коммерческих трендах.
Каждая диаграмма была выбрана с учетом того, какой тип визуализации лучше всего подходит для ответа на конкретный вопрос или анализа определенного аспекта данных. В работе были использованы: 1.Столбчатая диаграмма — Этот график позволяет быстро идентифицировать самые популярные треки на платформе Spotify. 2.Горизонтальная столбчатая диаграмма — Этот график помогает понять, какие жанры наиболее представлены на платформе. 3.Точечный график — Этот график позволяет изучить, как длительность трека влияет на его популярность. 4.Круговая диаграмма — Этот график показывает, какие жанры наиболее популярны среди слушателей.
Цветовая гамма
Основной цвет Spotify — зеленый, но синий часто используется в их интерфейсе и визуализациях как дополнительный цвет. Он также ассоциируется с креативностью и вдохновением, что хорошо подходит для музыкальной тематики.
Начало работы
Я начала с загрузки данных в Google Colab. Для этого я использовала модуль files из библиотеки google.colab, чтобы загрузить CSV-файл с данными о музыкальных треках. После загрузки файла я убедилась, что данные успешно загружены, и сохранила их в переменную df с помощью библиотеки pandas.
Я провела первичный анализ данных, чтобы понять их структуру и содержание. Для этого я использовала методы info () и isnull ().sum (). Это помогло мне узнать, что данные содержат 114 000 строк и 21 столбец, а также обнаружить, что в некоторых столбцах есть пропущенные значения. Также чтобы избавиться от пропущенных значений, я удалила строки, где они присутствовали. После этого я убедилась, что данные готовы для дальнейшего анализа.
Визуализация данных
График 1
Этот график позволяет быстро и эффективно идентифицировать самые популярные треки на платформе Spotify. С его помощью можно наглядно сравнить количество прослушиваний или лайков различных треков, что помогает выявить лидеров по популярности. Это полезно для музыкантов и продюсеров, которые хотят понять, какие композиции вызывают наибольший интерес у слушателей.
Я решила найти топ-10 самых популярных треков. Для этого я отсортировала данные по столбцу popularity и выбрала первые 10 строк. Затем я визуализировала результат с помощью горизонтального barplot.
Вывод: Треки Blinding Lights, Shape of You и Dance Monkey лидируют по популярности. Это говорит о том, что слушатели предпочитают треки с запоминающимися мелодиями, высоким уровнем энергии и танцевальности. Эти композиции стали настоящими культурными феноменами, что подтверждает их глобальную популярность.
График 2
Данный график помогает проанализировать представительство различных жанров на платформе. С его помощью можно быстро увидеть, какие жанры доминируют в прослушиваниях, и сравнить их популярность. Это позволяет понять, какие музыкальные стили становятся актуальными, что может быть полезно как для артистов, так и для маркетологов при разработке новых музыкальных произведений или стратегий продвижения.
Я решила исследовать жанры треков. Сначала я посчитала количество треков для каждого жанра и выбрала топ-10. Затем я визуализировала это с помощью вертикального barplot.
Вывод: Жанры Pop, Rock и Hip-Hop являются наиболее популярными. Это отражает текущие тренды в музыкальной индустрии, где эти жанры доминируют благодаря своей универсальности и широкой аудитории. Увеличение оси X на 10% сделало график более читаемым, что особенно важно при работе с большим количеством данных.
График 3
Этот график предоставляет возможность изучить связь между длительностью трека и его популярностью. Он позволяет визуализировать, как время звучания композиций влияет на количество прослушиваний или рейтинги. Анализ таких данных может выявить оптимальную длину трека для достижения максимальной популярности, что является ценным инсайтом для исполнителей и продюсеров.
Я добавила новый столбец duration_min, чтобы перевести длительность треков из миллисекунд в минуты. Также я решила исследовать, есть ли связь между популярностью треков и их длительностью. Для этого я отфильтровала треки длительностью до 10 минут.
Вывод: Популярные треки обычно имеют среднюю длительность — от 3 до 5 минут. Это связано с предпочтениями слушателей, которые ценят компактные и динамичные композиции. Более длинные треки (свыше 5 минут) реже становятся популярными, что может быть связано с ограниченным вниманием аудитории.
График 4
Этот график показывает распределение популярных жанров среди слушателей. С помощью круговой диаграммы можно быстро оценить, какие жанры занимают наибольшую долю в общем объеме слушаемой музыки, что помогает понять предпочтения аудитории и адаптировать контент под их вкусы. Это, в свою очередь, может помочь в создании более целевого музыкального контента и формировании стратегий по его продвижению.
Перед визуализацией я решила проверить, какие жанры попали в топ-10. Для этого я вывела результат. Это помогло мне убедиться, что данные корректны и готовы для визуализации.
Заключение
Анализ позволил сделать данные выводы: 1). Топ-10 самых популярных треков — Треки Blinding Lights, Shape of You и Dance Monkey лидируют по популярности. Это говорит о том, что слушатели предпочитают треки с запоминающимися мелодиями, высоким уровнем энергии и танцевальности. Эти композиции стали настоящими культурными феноменами, что подтверждает их глобальную популярность. 2). Распределение треков по жанрам — Жанры Pop, Rock и Hip-Hop являются наиболее популярными. Это отражает текущие тренды в музыкальной индустрии, где эти жанры доминируют благодаря своей универсальности и широкой аудитории. Увеличение оси X на 10% сделало график более читаемым, что особенно важно при работе с большим количеством данных. 3). Зависимость популярности от длительности трека — Популярные треки обычно имеют среднюю длительность — от 3 до 5 минут. Это связано с предпочтениями слушателей, которые ценят компактные и динамичные композиции. Более длинные треки (свыше 5 минут) реже становятся популярными, что может быть связано с ограниченным вниманием аудитории.
4). Распределение популярности по жанрам — Жанры Pop и Dance имеют самые высокие показатели популярности. Это подтверждает, что данные жанры наиболее соответствуют предпочтениям широкой аудитории. Их успех может быть связан с высокой танцевальностью, энергичностью и доступностью для слушателей разных возрастов.
Применение генеративной модели
В работе я использовала нейросеть DeepSeek-R1 для корректировки моих кодов для создания инфографики. Ссылка на модель: https://www.deepseek.com/ Для генерации изображений я обращалась к Ideogram. Ссылка на модель: https://ideogram.ai/t/explore



