Исходный размер 1140x1600

Анализ арий из мюзикла Джекилл и Хайд

PROTECT STATUS: not protected

It’s such a fine line Between a good man and a bad

«Джекилл и Хайд» — крайне успешный готический мюзикл, написанный композитором Фрэнком Уайлдхорном вместе с либретистом Лесли Брикассом. Сюжет мюзикла основан на классической английской новелле, и повествует о Докторе Генри Джекилле, что решается переступить через границу добра и зла.

Мой выбор пал именно на этот мюзикл, поскольку я с давних пор являюсь его поклонницей. В качестве данных для анализа были взяты тексты арий, которые можно найти в открытом доступе на просторах интернета, и лично мной собраны в файл формата CSV. Мне хотелось собрать такой список арий, что полностью бы раскрывал сюжет мюзикла, поэтому тесты были взяты из двух версий.

Поскольку аналитическая работа проводилась с текстом, у меня сразу возникла мысль, что можно подсчитать количество слов. Для такого рода данных хорошо подходит линейные или столбчатые диаграммы, поэтому в дальнейшем их будет довольно много. Также мне хотелось сделать диаграмму в стиле «облако слов», и круговую для более наглядной демонстрации.

Этапы работы

В качестве вдохновения для визуального решения проекта была выбрана формула HJ7, которую Доктор Джекилл и решает испробовать на себе. Чаще всего она описывается как жидкость зеленого цвета, поэтому проект оформлен в несколько вариантов зеленого. В качестве дополнительных цветов выступают черный и белый, что репрезентируют собой бесконечную борьбу добра со злом.

Исходный размер 970x546

Роберт Куччиоли в роли Доктора Джекилла

Исходный размер 2480x465

Для оформления текста был выбран шрифт Metrika. Этот шрифт приглянулся мне своей элегантностью, но при этом достаточно большой функциональностью: шрифт поддерживает как латиницу, так и кириллицу. Диаграммы и фрагменты кода будут оформлены с использованием этого шрифта.

После того как я определилась с оформлением, настало время обработки данных. Первым делом я решила подсчитать частоту использования слов. Также, чтобы сделать подсчет слов более информативным, я решила разбить реплики по персонажам, чтобы в дальнейшем посчитать частотность употребления слов для каждого персонажа.

Как только данные были приведены в удобовари́мый вид, я прописала ряд стоп-слов, чтобы очистить вывод самых популярных слов от союзов, предлогов и артиклей. С этими первыми подсчетами я начала делать первые визуализации.

График № 1: Частота использования слов по всем ариям

Исходный размер 1389x1189
Исходный размер 2480x1350

Через самые употребляемые слова можно взглянуть на противоречивую душу мюзикла. С одной стороны это мрачная история, где проливается немало крови, что отражает наиболее часто используемое слово murder (убийство). С другой стороны это история о мечтателе-идеалисте, что ставил своей целью искоренение зла из души человеческой, что отражается в словах see (видеть), know (знать) и way (путь).

Исходный размер 2024x989

Облако часто повторяющихся слов во всем мюзикле

Исходный размер 2480x1582

Чтобы наглядно продемонстрировать разностороннюю направленность мюзикла, было создано «облако слов», что показывает 50 самых популярных слов. Также слова окрашиваются в рандомный оттенок зеленого, поскольку трех оттенков было мало для такого облака.

График № 2: Частота использования слов по персонажам

После создания диаграммы с самыми популярными словами мне стало интересно, каковы различия между персонажами. Первыми персонажами, кому были созданы персональные списки популярных слов, были Джекилл и Хайд.

Исходный размер 1590x788
Исходный размер 2480x1350

Различия видны невооруженным взглядом. Джекилл стремиться к знанию, он жаждет разгадать загадку добра и зла, много размышляет и погружен в себя (know, see, find, inside). Также можно сказать, что он достаточно религиозен, что удивительно для ученого, который готов ставить эксперименты на себе.

Хайд же, хоть и является воплощением зла, воплощает энергию к жизни, показывает насколько пленительным может быть зло (feeling, alive, live). И похоже Эдвард Хайд, очень любит говорить о себе в третьем лице, его имя и фамилия одни из самых упоминаемых слов.

Исходный размер 1590x1180
Исходный размер 2480x1350

Во второй диаграмме я собрала важных второстепенных персонажей.

Ансамбль здесь вынесен не просто так. Дело в том, что в мюзикле город играет важную роль в повествовании. Горожане реагируют на события, ужасаются деяниям Хайда (murder), и рассуждают о двуличии, бесконечной социальной игре (façade).

К моему удивлению, друг Джекилла Джон Аттерсон мало участвует в ариях, список слов у него довольно скромный. Он поддерживает Джекилла и стремиться открыть ему глаза (see, way).

Эмма — мечтательная романтичная девушка. Она много говорит о любви и мечтах (love, dream).

Люси же стремится к новой жизни, и хоть она и говорит о любви, у нее она занимает далеко не первое место.

График № 3: «Экранное время» персонажей

Исходный размер 1389x989
Исходный размер 2480x1766

Роль Джекилла и Хайда считается невероятно сложной для исполняющего актера. И это подтверждается при помощи графика с подсчетом слов на персонажа. Джекилл лидирует по количеству слов, а если добавить к этому еще и слова Хайда, то это число будет практически в два раза больше, чем у ансамбля.

Удивляет, что ансамбль играет столь большую роль в постановке, по количеству слов он занимает второе место.

Также удивительно, что Хайд говорит не многим больше чем Эмма, хотя его присутствие ощущается куда больше.

Исходный размер 2480x1800
Исходный размер 2480x1885

Чтобы наглядно продемонстрировать процентное соотношение между персонажами была использована круговая диаграмма. Чтобы не засорять изображение лишними словами, персонажи с малым количеством реплик были объединены в группу «Другие».

Заключение

«Джекилл и Хайд» — великолепный мюзикл, который сочетает в себе сильную музыку и изобретательный текст, который способен многое донести до слушателя.

Через текст мюзикл демонстрирует свою многогранность, способность затрагивать множество важных для слушателя тем, при этом оставаясь собой.

Крайне сложный в постановке и исполнении, но очень дорогой сердцу мне, и множеству других фанатов, которые с нетерпением ждут новых постановок по всему миру.

Описание применения генеративной модели

В процессе работы над проектом, в помощь для написания и оптимизации кода был использован GPT Chatbot, что позволило значительно повысить эффективность работы.

Ссылка на блокнот и датасет

Анализ арий из мюзикла Джекилл и Хайд
Проект создан 05.02.2026