Данный проект представляет собой комплексный статистический анализ факторов, влияющих на уровень счастья населения в различных странах мира. В основе исследования лежат реальные данные из World Happiness Report 2019 — официального отчёта ООН, измеряющего субъективное благополучие граждан 156 стран.
Данный проект идеально перекликается с моим глубоким интересом к осознанности и внутреннему благополучию. Как человек, увлеченный практиками mindfulness, я часто размышляю о том, что делает жизнь по-настоящему полной, и мне искренне нравится разговаривать с людьми о счастье — делиться историями, понимать их эмоции и находить общие инсайты. Этот проект позволяет мне систематизировать эти разговоры на глобальном уровне
Выбор данных
Источник: World Happiness Report 2019 Где нашёл: Kaggle (https://www.kaggle.com/datasets/unsdsn/world-happiness) Объём: 156 стран, 10 параметров
Почему эти данные?
- Авторитетность — официальный отчёт ООН, публикуется с 2012 года
- Актуальность — данные о благополучии людей всегда интересны
- Комплексность — сочетание экономических и социальных факторов
- Практическая ценность — можно выявить, что действительно делает людей счастливыми
Выбор типов графиков
Горизонтальная гистограмма — Топ- 20 стран — легко сравнивать Box plot — Распределение по регионам — показывает разброс Тепловая карта — Корреляции — все связи видны сразу Scatter plot — Регрессия — связь между переменными Комплексный dashboard — Общая картина — все в одном месте
Статистические методы
- Описательная статистика • Среднее (mean) — центральная тенденция • Медиана (median) — устойчива к выбросам • Стандартное отклонение (std) — разброс данных • Квартили (Q1, Q3) — распределение
- Корреляционный анализ • Коэффициент Пирсона — измеряет линейную связь • Значения от -1 до +1 — сила и направление связи • p-value — статистическая значимость
- Регрессионный анализ • Множественная линейная регрессия — предсказание на основе нескольких переменных • R2 (коэффициент детерминации) — 0.779 означает, что модель объясняет 77,9% вариации • RMSE — средняя ошибка предсказания
- Визуальный анализ • Box plots — распределение и выбросы • Scatter plots — взаимосвязи между переменными • Heatmaps — множественные корреляции



