Введение
Для анализа был выбран датасет «Steam Store Games (Clean dataset)», взятый с сайта Kaggle и содержащий информацию о более чем 27,000 играх, опубликованных в магазине Steam. Чтобы соответствовать тематике, выбран стиль «Steam Dark UI»: тёмный фон и акцентные цвета (голубой, зеленый лайм), моноширинные шрифты. Это сделает инфографику аутентичной.
Почему это интересно?
Игровая индустрия одна из самых быстрорастущих в мире. Анализ Steam позволяет понять:
- Как менялось количество выпускаемых игр по годам? (Взрывной рост инди-сегмента).
- Влияет ли стоимость игры на удовлетворенность пользователей? .
- Какие жанры самые массовые, а в какие люди реально играют дольше всего?.
- Какова доля игр, поддерживающих Linux и Mac, по сравнению с Windows, и растет ли она?
- Кто топ 5 по количеству игр в популярных жанрах?
- Как менялась средняя цена на игры по году выпуска?
Импорт, первичная обработка и подготовка данных, визуал
Графики и анализ
Взрывной рост индустрии: кол-во релизов по годам.
Этот график четко демонстрирует стабильный, а затем взрывной рост числа игровых релизов в Steam с начала 2000-х годов, с особенно резким увеличением примерно в 2014–2018 годах. Это указывает на массовое расширение игровой индустрии и самой платформы Steam в этот период.
Благодаря линейному графику четко виден рост числа игровых релизов
Гексагональный график, визуализирующий взаимосвязь между ценой игры (до 60$) и долей положительных отзывов, предполагает слабую положительную корреляцию. Хотя наблюдается более высокая плотность игр в низких ценовых диапазонах, распределение рейтингов по разным ценам не показывает сильной, четкой закономерности, при которой более высокие цены неизменно приводят к значительно более высоким (или низким) рейтингам. Статистическая корреляция, предоставленная ранее, также подтверждает слабую положительную связь, что означает, что чуть более дорогие игры оцениваются немного лучше, но зависимость не является строгой.
В связи с большим объемом данных (27k+ записей) классический точечный график стал бы нечитаемым из-за наложения точек друг на друга. Я использовал гексагональный, который агрегирует данные в шестиугольные соты. Это позволило визуализировать плотность распределения и четко определить наиболее востребованные ценовые сегменты, сохранив при этом информацию о редких аномальных значениях
Круговая диаграмма иллюстрирует распределение игр по доступности платформ. Значительное большинство игр (около 69%) доступны исключительно на Windows. Существенная часть (около 31%) являются кроссплатформенными, то есть они доступны на Windows, а также на Linux или Mac, или на обеих платформах. Это подчеркивает доминирование Windows как игровой платформы, но также показывает заметное присутствие игр, поддерживающих другие операционные системы.
Круговая диаграмма выбрана, потому что она мгновенно показывает «кусок пирога» — сразу видно, что Windows занимает почти всё пространство, а остальные лишь малую часть.
Графики явно показывают, что в каждом из пяти популярных жанров (Инди, Экшн, Приключения, Казуальные, Симуляторы) есть свои доминирующие издатели. Например, Ubisoft и Square Enix активно представлены в жанре Экшн, а Artifex Mundi в Приключениях. Наблюдается как специализация некоторых издателей (например, Artifex Mundi в Приключениях), так и наличие крупных издателей (например, Ubisoft), которые попадают в топ-5 по нескольким жанрам, что указывает на широкий и разнообразный портфель игр. Эти графики демонстрируют определенную концентрацию рынка: несколько крупных издателей выпускают значительную долю игр в ключевых жанрах, что может влиять на конкуренцию и инновации в индустрии.
Столбчатые графики были выбраны, поскольку их наглядность позволяет сразу увидеть разницу между любыми издателями
График демонстрирует динамику средней цены игр. Видно, что до 2005–2006 годов средняя цена оставалась относительно низкой, а затем начала постепенно расти, достигая пика примерно в 2012–2013 годах, после чего наблюдается небольшое снижение или стабилизация. Это может быть связано с изменением бизнес-моделей, инфляцией или увеличением количества инди-игр по более низким ценам.
Итог
Исследование показало, что Steam это зрелая, но продолжающая трансформироваться экосистема. Успех продукта на платформе в большей степени зависит от попадания в жанровую нишу и качества исполнения, нежели от высокой цены, а рынок остается открытым для новых имен, несмотря на присутствие крупных издательских корпораций.
Описание применения генеративной модели
В ходе выполнения работы были использованы Gemini 3 и ChatGPT. Цель применения: Помощь с кодом на Python (библиотеки Pandas, Matplotlib, Seaborn). Обложка (ChatGPT), промпт: A professional digital cover, centered bold text «STEAM ИЗНУТРИ», Steam platform color palette (deep navy blue, slate grey, and electric blue accents), sleek industrial tech aesthetic, high quality, clean typography, 8k resolution --ar 57:80 RES 1140×1600
Датасет и IPYNB



