Вместо того чтобы смотреть на верхушки рейтингов, давайте опустимся на самое дно!
Мой анализ данных фокусируется на самых непопулярных играх по оценкам, тэгам и владельцам среди первых 1000 игр, опубликованных на момент 2026. Стилистика визуализации несерьёзная, нёрдовая, игровая, но в меру минималистичная и презентабельная — посколько аудитория, соответственно, геймеры и нёрды.
Анализ преследует две цели: во-первых, происследовать незанятые рыночные ниши, доступные более маленьким инди разработчикам; во-вторых, помочь игрокам, заинтересованным в нишевых и редких жанрах — найти менее известные игры.
Получившиеся картинки визуализации как мне кажется могут хорошо смотреться как постер на стене или рекламный разворот журнала.


Сначала я нашла на Kaggle нужный датасет и открыла его в Google таблицах чтобы полистать и оценить данные. Увидела, что в датасете есть ДЛС, паки, скины — и их просто удалила руками, чтобы они не портили общую статистику.
В Visual Studio Code я сделала Jupyter Notebook и с помощью кодов pandas посчитала и разделила тэги… Опять-таки некоторые тайтлы приходится удалять и не учитывать — потому что жанры очень похожи (например, тэги «comedy» и «funny») или в данных есть всего один тэг, что создаст неинформативную выборку.
Дальше, я немного играюсь с самим визуалом графика — чтобы данные становились более нагрядно понятными и выделялись.
Для поиска «неогранённых алмазов» я сделала корреляцию между высокими оценками отзывов и низким количеством владельцев. Такие корреляции уже вне моих компетенций pandas и matplotlib, поэтому ChatGPT вайбкодит вместе со мной.
Я математику не знаю совсем, поэтому могу только полагаться на интеллект машины и верить в лучшее.
Результат выглядит достаточно убедительно, я даже вижу тайтлы, в который играла сама и могу ручаться за них. «The Liar Princess and the Blind Prince», например, это действительно классная игра, и я действительно не знаю ни одного другого человека, который бы в неё играл.
Последний график также полагается на корреляцию и, соответственно, помощь ИИшки. Я разделяю данные на ячейки, разбитые на группы по четыре года, чтобы увидеть, как год релиза влияет на оценки игроков. Моё изначальное предположение состоит в том, что игроки чаще ставят высокие оценки старым играм, т. к. имеют для них более низкие стандарты и ожидания, а также подвержены фактора ностальгии.
Моя гипотеза подтверждается — вплоть до последней ячейки лет, когда оценки снова вырастают. Я предполагаю, что новые релизы обычно интересны и расхайпаны для игроков первое время. Также на статистику скорее всего оказывают влияние купленные отзывы критиков, нужные чтобы поднять первоначальные продажи игры.
Источники: kaggle dataset Top 1000 Steam Games (2024–2026) by Waddah Ali
Мокапы: Alexandre Lallemand, DVLOOP CREATIVES, Graphic Time
Софт: ChatGPT, Google sheets, Visual Studio Code, Clip Studio Paint EX, Adobe Photoshop







