Введение
В этом проекте используются данные шахматных партий Lichess из kaggle.com Мне было интересно анализировать шахматные партии, поскольку сам играю время от времени в шахматы и хотел бы сделать новые выводы касательно информации об играх. Конкретно в этих данных можно узнать итоги партий обычных игроков разнообразного спектра. Будь то новички, любители или опытные шахматисты.
Для анализа данных я решил использовать круговую диаграмму, линейный график, диаграмму рассеяния и столбчатую диаграмму. Я выбрал их по следующим причинам:
- Круговая диаграмма хорошо показывает доли и их соотношения, что довольно просто и ясно укажет как часто и с каким итогом заканчиваются игры.
- Линейный график можно использовать для распределения по оси X, что в данном случае означает в какой момент заканчиваются игры с течением времени.
- Диаграмма рассеяния позволяет искать нормальное распределение, аномалии или корреляции от соотношения осей X и Y, что можно использовать для рассмотрения как встречаются рейтинги белых и черных игроков.
- Столбчатая диаграмма позволяет сравнить параметры у элементов, в нашем случае частоту игр форматов времени
Для начала импорт необходимых инструментов и загрузка файла самих данных
Итоги партий
Из данных выводится категория victory_status, из которых выводится параметры итога и количества их случаев. Названия итогов партий потом переименовываются в соответствующие на русском языке, чтобы было проще читать.
Из круговой диаграммы видно что большинство игр заканчиваются сдачей. На втором месте победа одной стороны матом короля, на третьем окончанием времени. Реже всего встречаются паты и ничьи.
Партии по длительности
Из данных выводится категория ходов, а потом разделяются на два разных значения, чтобы позже установить на оси X и Y в линейном графике.
Данный анализ показывает резкий выступ окончания игр в начале. Тем самым показывая, что окончание игр сдачей из прошлого графика, частично, но не полностью, объясняется тем, что одна сторона совершила критическую ошибку в начале партии, не став продолжать.
Также видно, что в среднем длина партии стремится к пику в 50 ходов, а после чего эндшпиль ожидается закончится к этому пику или с небольшим распределением вероятности позже.
Соотношения рейтинга в партиях
Из данных выводится две категории, рейтинг белых и черных. Они становятся осями расположения точек. Также к ним добавляется пунктирная линия для более удобного чтения положения.
Здесь наблюдается и корреляция, что игроки с соответствующим рейтингом играют друг с другом, а также и особенность. Много партий было совершено с рейтингом 1500 против многих других рейтингов. Это исходит от того что 1500 является начальным рейтингом при регистрации на Lichess, многие из которых могли играть в нерейтинговые игры с друзьями, оставаясь на рейтинге 1500 против широкого выбора игроков.
Также видна похожая линия на более высоких рейтингах. Поскольку профессиональные шахматисты могут зарегистрироваться с более высоким начальным рейтингом.
Формат времени в партиях
Категория increment_code, обозначающая формат времени, делится по названию на подкатегории, где все получают своё значение количества. 15 самых популярных выходят в столбчатую диаграмму по подкатегориям.
На этом графике быстро становится ясно, что с большим отрывом самым популярным форматом времени в игре 10 минут без добавления времени за ход. Также известный как рапид, а точнее его нижний порог.
Можно сделать вывод, что подавляющее большинство игроков хочет более коротких шахматных партий, но не понижая до уровня блица, где скорость становится более преимущественным качеством игры.
Далее следуют варианты рапидов по 15 минут, блицы. И только на 9 и 10 столбце возникают форматы значительно длиннее чем рапид на 10 минут. Что может указывать на либо непопулярность, либо на физическое ограничение сыграть много партий с длительным временным ограничением.
Стилевые решения
Основной упор в выборе палитры был в том, чтобы сделать насыщенные, но в то же время, умеренные тона. Попытаться избежать привычного винтажного вида, придав немного неформального ощущения, но при этом не выходя за край.
Исходя из этого графики строились на светлом желтом фоне, словно на старой бумаге, однако не стеснялись использовать краски.
Идея такой стилизации в том, чтобы объединить понятие старого и понятие нового. Поскольку шахматы это не то что было и прошло, а также не то, что возникло недавно. Так что эту сущность можно воплотить таким решением.



