Описание
Я выбрала винный датасет, с сайта kaggle, потому что он идеально балансирует между научной строгостью и эстетической привлекательностью. Химический анализ вин превращает искусство виноделия в точную науку. Мне было важно показать, как работа с реальными данными позволяет находить скрытые закономерности там, где кажется, что правит только субъективное восприятие, даже во вкусе вина можно обнаружить математическую точность.
Реализация кода была в среде colab.google с использованием Pandas
Загрузка файла формата csv.
Подключение библиотек.
Стилизация
Палитра подбиралась по винным оттенкам.
{1} Круговая диаграмма и барплот
Всего образцов: 178 Количество классов: 3
{2} Боксплот
Класс 1 показывает стабильно высокое содержание алкоголя (13-14.5%), Класс 3 — самое низкое (12-13%), а Класс 2 занимает промежуточное положение. Это чёткое ранжирование позволяет использовать алкоголь как первичный маркер для классификации вин.
{3} Корреляция характеристик
Флавоноиды, общие фенолы и антоцианы образуют тесный корреляционный кластер (0.6-0.9), что указывает на их совместное присутствие и взаимное влияние — изменение одного компонента систематически отражается на других.
{4} Scatter plot
Все три класса образуют визуально различимые кластеры с минимальным перекрытием, демонстрируя, что всего две главные компоненты (PC1 и PC2) сохраняют достаточно информации для уверенного различения вин — 66,1% общей дисперсии.
{5} Сравнение средних значений
Градиентные столбцы визуализируют последовательное снижение всех ключевых показателей от Класса 1 к Классу 3: алкоголь (14.2 — 13.0), флавоноиды (3.0 — 1.7), интенсивность цвета (5.5 — 3.3). Это доказывает системность различий, а не случайные отклонения по отдельным параметрам.
Выводы
СТАТИСТИКА ПО КЛАССАМ:
Класс 1: • Образцов: 59 (33.1%) • Алкоголь: 13,74% • Флавоноиды: 2.98
Класс 2: • Образцов: 71 (39.9%) • Алкоголь: 12,28% • Флавоноиды: 2.08
Класс 3: • Образцов: 48 (27.0%) • Алкоголь: 13,15% • Флавоноиды: 0.78
КЛЮЧЕВЫЕ РАЗЛИЧИЯ:
- Класс 1: Высокий алкоголь и флавоноиды
- Класс 2: Средние значения, самая многочисленная группа
- Класс 3: Наименьший алкоголь, более светлый цвет
Использование генеративной модели
DeepSeek — помощь с кодом Sora — генерация обложки



