Исходный размер 1296x1824

Статистический анализ и визуализация алмазного фонда по системе GIA

PROTECT STATUS: not protected
Проект принимает участие в конкурсе

Введение

В центре проекта стоит задача разобрать на понятные составляющие ценообразование мирового ювелирного рынка и составить объективный цифровой портрет драгоценных камней. Отправной точкой стал мой давний личный интерес к геммологии: я очень люблю разбираться в камнях, изучать их свойства, читать профессиональную литературу об их происхождении и внутренней структуре. При этом в массовой культуре бриллианты чаще всего окружены мифами, штампами и демонстративным потреблением, однако за их реальной стоимостью стоит строгая математическая модель. Мне стало любопытно, можно ли увидеть скрытые экономические закономерности и логику ценообразования через цифры и алгоритмы с помощью массива данных.


Я постараласьсобрать более широкий визуальный образ структуры мирового рынка драгоценных камней. Практическая ценность инфографики состоит в том, что она делает массив данных наглядным, помогая увидеть реальное распределение алмазного фонда.

Выбранный мной датасет с платформы Kaggle дает возможность детально рассмотреть физические свойства каждого минерала. Он содержит детальный аудит более 53 тысяч ювелирных алмазов по состоянию на 2022 год. Набор данных охватывает ключевые физические и коммерческие параметры каждого камня: вес в каратах, качество огранки, цвет, цену, геометрические размеры, а также степень чистоты.

Процесс создания

Итоговый проект был полностью реализован с помощью программирования на языке Python в среде разработки Google Colab. Способ визуализации выбирался в соответствии с объемом и типом информации, необходимой для исследования.

Исходный размер 817x443

часть кода для визуализации графиков

Для начала я подготовила данные для удобства дальнейшей работы. На этапе обработки и анализа ключевым шагом стало внедрение международной системы геммологической классификации бриллиантов GIA (Геммологического института Америки). Без этой верификации первичные данные выглядели как хаотичный набор буквенных шифров. В рамках пайплайна была проведена расшифровка и логическое упорядочивание категорий.

Для параметра чистоты камня (clarity), определяющего наличие внутренних природных дефектов, была выстроена иерархия от худшего к лучшему:

  • I1 (Included) — дефекты видны невооруженным глазом;
  • SI2, SI1 (Slightly Included) — мелкие включения, заметные под лупой;
  • VS2, VS1 (Very Slightly Included) — незначительные микродефекты;
  • VVS2, VVS1 (Very Very Slightly Included) — мельчайшие, едва различимые включения;
  • IF (Internally Flawless): абсолютно чистые, идеальные камни.
Аналогичный порядок от удовлетворительного до идеального был задан для огранки: Fair (Удовлетворительно) → Good (Хорошо) → Very Good (Очень хорошо) → Premium (Премиально) → Ideal (Идеально).

макет с модульной сеткой и итоговый плакат

Все полученные визуализации автоматически сохранялись в векторном формате SVG, который позволял изменять изображения без потери качества. Финальная верстка постера производились в графическом редакторе Figma. Для идеальной композиции я выстроила модульную сетку 20×12 и полями 70: сначала спроектировала макет с помощью серых полупрозрачных прямоугольников, а затем вписала в эти ячейки векторные элементы. Генеративный ИИ Gemini привлекался для создания логических текстовых связок и поиска дизайн-решения, а также для создания обложки.

Визуализации и их описание

Диаграмма рассеяния / Scatter Plot наглядно показывает зависимость стоимости от веса бриллианта. На графике присутствует репрезентативная выборка из 5000 камней образует экспоненциальную кривую. Так, при переходе к крупным фракциям цена резко взмывает вверх, что доказывает главный принцип геммологии: крупные алмазы встречаются в природе реже, из-за чего их ценность возрастает в геометрической прогрессии.

гистограмма и диаграмма рассеивания

Чтобы оценить степень влияния работы ювелира на итоговую цену, я использовала Гистограмму / Bar Plot. График отражает среднюю стоимость бриллиантов, сгруппированных по пяти официальным категориям качества огранки GIA: по мере роста мастерства обработки от удовлетворительной (Fair) до безупречной (Ideal) средняя цена демонстрирует стабильный прирост. Так, диаграмма визуализирует добавленную стоимость, которую создает мастер: геометрически правильная огранка заставляет свет идеально преломляться, превращая невзрачный природный камень в дорогостоящий бриллиант премиум-класса.

Исходный размер 2361x1548

круговая диаграмма

Круговая диаграмма / Pie Chart 
помогает определить процентное соотношение идеальных и дефектных камней в общем обороте. Она демонстрирует долевое распределение всей совокупности датасета по шкале чистоты GIA: сегмент абсолютно безупречных бриллиантов без внутренних дефектов (IF) занимает ничтожно малую долю (около 3-4% рынка). В то же время ювелирная индустрия и массовый оборот удерживаются за счет «середняков» — категорий SI1 и VS2. Визуализация наглядно подтверждает редкость идеальных природных минералов и объясняет, почему основная экономика ювелирных брендов строится на компромиссе между чистотой камня и его доступностью для потребителя.

Постер в среде

Исходный размер 2778x1550
Исходный размер 2268x1624
Исходный размер 4500x3000

Заключение

В результате визуального исследования были математически обоснованы ключевые законы ювелирного рынка: диаграмма рассеяния подтвердила экспоненциальный характер роста цены бриллианта в зависимости от его веса, гистограмма средних стоимостей наглядно продемонстрировала прямую зависимость ценности камня от мастерства огранки ювелира, а круговая диаграмма вскрыла анатомию дефицита. Итоговый проект наглядно доказывает, как инструменты науки о данных очищают индустрию роскоши от маркетинговых мифов, обнажая за внешней эстетикой драгоценных камней строгие законы экономики и природы.

Источники

Датасет
 — Цены на бриллианты

Блокнот
— Драгоценные камни

Статистический анализ и визуализация алмазного фонда по системе GIA
Проект создан 18.06.2026