Вводная часть.
Музыкальные стриминговые платформы, такие как Spotify, формируют предпочтения миллионов слушателей по всему миру. В период пандемии COVID-19 потребление музыкального контента значительно возросло.
Мне было интересно самому проанализировать, кто был на вершине чартов во время, когда я не интересовался музыкой от слова совсем.
Для анализа были выбраны данные из Spotify Top 200 Charts за 2020–2021 годы.
Как источник данных я использовал Kaggle (Spotify Charts Dataset).
Формат: CSV-файл, содержащий информацию о позициях треков в чартах, именах артистов и названиях песен.
Объём данных: Более 300 000 строк, охватывающих чарты в разных странах за 2 года.
Виды графиков и выбор визуализации
Гистограмма.
— Этот тип графика удобен для сравнения частоты упоминаний артистов.
Круговая диаграмма (Pie Chart).
— Помогает оценить долю лидеров чартов в общем массиве данных.
Этапы работы.
Я использовал Google Colab для работы с данными. Анализировал их, используя Pandas.
Данные включают такие параметры, как название песни, исполнитель, альбом, рейтинг, длительность и другие метрики.
Сначала я импортировал Pandas в мой Notebook.
Далее я пытался вручную загрузить файл, но столкнулся с тем, что его надо было обновить. Использовав функцию Google Colab, помогающую исправить код, обновил файл и смог его загрузить.
Посмотрел на всякий случай первые строки, всё было хорошо.
Посмотрел все столбцы в файле.
Я импортировал две библиотеки: matplotlib.pyplot, чтобы создать графики, и seaborn, чтобы настроить визуальные стили. Я сначала установил стиль графиков с помощью sns.set (style="whitegrid»), чтобы добавить сетку на фон. Затем я построил гистограмму «Топ-10 артистов», используя метод plot (), чтобы создать столбчатую диаграмму с цветом skyblue для столбцов и чёрной обводкой. В цикле я добавил технику «пятнистости», накладывая штрихи на столбцы, что придавало графику стиль, похожий на работы Роя Лихтенштейна. Заголовки и метки для осей я установил с помощью plt.title (), plt.xlabel () и plt.ylabel (). В конце я вывел график с помощью plt.show ().
Я импортировал необходимые библиотеки: matplotlib.pyplot, seaborn и numpy, чтобы настроить визуализацию и стилизацию графиков. Затем создал палитру цветов с помощью sns.color_palette для пирогового графика. Для стилизации графика в технике Бен-Дау написал функцию ben_day_dots, которая добавляет штрихи в виде точек на каждом сегменте пирога, изменяет цвет заливки, обводки и толщину линий. Я построил сам график, использовав метод plot для создания пирога с процентными данными, и применил функцию для добавления точек. В конце настроил заголовок.
Взял загруженные данные и выделил десять самых популярных жанров, подсчитав количество песен в каждом из них. Затем я построил линейчатую диаграмму, где по оси Y расположил жанры, а по оси X — количество песен. Для стилизации графика я использовал кислотно-розовый цвет заливки, добавил черные контуры и применил паттерн из кружков, чтобы придать визуальной выразительности. В завершение я перевернул ось Y, чтобы самые популярные жанры оказались сверху.
Вдохновение стилизации графиков.
Для стилизации графиков я вдохновлялся искусством поп-арта и графической техникой Бен-Деи, используемой, например, Роем Лихтенштейном.
Паттерновое заполнение графиков поверх основного цвета, мне кажется, привлекает внимание к самим графикам и позволяет четче видеть различие между анализируемой информацией.
Итоговые графики.
Блокнот с кодом и датасет.
Обложка проекта.
Обложка проекта была сгенерирована в нейросети Шедеврум.
Промт: «A white woman sitting at home, relaxing and listening to music on a green Spotify player. Outside the window, coronavirus particles float in the air. The image is in pop-art style with vibrant colors, graphic details, and Ben-Day dot patterns applied to both the woman and the background.»



