Команда ученых из США и Австралии проанализировала изменение эмоциональной окраски в текстах популярных литературных произведений и нашла в них несколько общих типов сюжетов. Среди них шесть оказались наиболее популярными: «из грязи в князи», «трагедия», «падение и взлет», «Икар», «Золушка» и «Эдип». Исследование в виде препринта выложено на сайте arXiv.org.
Для анализа эмоционального окраса ученые использовали алгоритм «Гедонометр» (Hedonometer), основанный на словаре, в котором каждому слову соответствует численное значение, отражающее его эмоцию. Более «радостному» слову соответствует большее положительное число и наоборот. Авторы изучали 1737 художественных произведений не длиннее 200000 слов, скачанных из открытой библиотеки проекта Гутенберг. Через каждый текст пропускали рамку считывания, которая вычисляла средний эмоциональный окрас в отрывке длиной 10000 слов.
Для всех текстов ученые получали характерную кривую, которая показывает, как изменяется эмоциональный окрас на протяжении текста. Используя
по набору простых кривых (синусов с разным периодом), авторы смогли описать большую часть данных шестью основными сюжетами. Их названия ученые взяли из предыдущих работ в этой области, или просто в соответствии с наиболее ярким примером произведения.
Все шесть сюжетов разбивались на три пары, в которых из одной и той же кривой, взятой с разным знаком, получались два разных типа. Самые простые сюжеты — «из грязи в князи» и «трагедия» — описывались кривой без максимумов и минимумов. Более сложные типы — «падение и взлет» и «Икар» — имели по одному экстремума, оставшиеся два типа — «Золушка» и «Эдип» — имели по два экстремума.
Авторы отмечают, что описанные в работе закономерности характеризуют только глобальный масштаб произведения, хотя на самом деле эмоциональный накал меняется гораздо чаще от сцены к сцене, просто эти колебания значительно меньше на фоне основных максимумов и минимумов. Например, в романе «Гарри Поттер и дары смерти» Джоан Роулинг наблюдается как минимум 16 выраженных экстремумов.
По словам авторов, полученные результаты хорошо согласуются с более ранними эмпирическими выводами о типах литературных сюжетов (к примеру, описанных
писателя Курта Воннегута). Ученые также предполагают, что их подход может использоваться не только для анализа, но и для автоматического написания художественных текстов, используя одну из основных эмоциональных кривых в качестве отправной точки.