Энтропия оказалась ключевым ингредиентом юмора

Коллектив ученых из Канады и Германии выяснил, как можно математически предсказать, является ли смешным какое-либо выдуманное слово. Оказалось, что мера «необычности» — то есть информационная энтропия — во многом определяет, покажется ли новое слово смешным, или нет. Исследование опубликовано в Journal of Memory and Language.
Авторы начали с экспериментальной проверки, являются ли вообще выдуманные слова хоть сколько-то смешными. Для этого ученые при помощи случайного генератора и словаря создали базу из нескольких тысяч выдуманных слов, а добровольцев попросили оценить эти слова по шкале от 1 (вообще ни капельки не смешно) до 7 (очень смешно, обхохочешься).
В результате некоторые слова показали очень высокие средние показатели. Так, рекордсменом оказалось «whong» с 5,92 баллами из 7. Авторы заподозрили, что юмор в этом слове проистекает из созвучия со словом «wang» (сленговое название мужского полового члена), поэтому проверили и другие выдуманные слова, набравшие подозрительно много баллов. Среди них, действительно, нашлись «dongl» (dong, перевод тот же), «shart» (вероятно, созвучный с fart), «focky» (меняем o на u) и «clunt» (убираем l).

После того, как исследователи удалили все слова, содержавшие нецензурные и сленговые корни, в подборке осталась только безобидно звучащая чепуха, однако какие-то слова добровольцы все же находили более, а какие-то — менее смешными. В качестве критерия «веселости» авторы воспользовались теорией, которую еще 200 лет назад сформулировал философ Артур Шопенгауэр. Согласно ей, юмор ассоциируется с тем, насколько далеко отстоит воспринимаемое от ожидаемого.

В качестве меры воспринимаемого и ожидаемого ученые предложили энтропию Шеннона: сумму -p

log

2

(p

i

), где p

i

 — вероятность появления данного элемента (одной или нескольких букв) в данном слове. В основном эксперименте авторы предлагали добровольцам из двух выдуманных слов (уже без нецензурных корней) выбрать более смешное. Оказалось, что по разности энтропии для двух слов можно было предсказать, какое из них воспримется смешнее. Однако точность предсказания была невысокой: лишь в 40 процентах случаев участники отвечали так, как предсказывала теоретическая модель.

https://www.youtube.com/embed/fMfpw5us_7Y

Авторы пишут, что их работа стала первой экспериментальной проверкой теории Шопенгауэра, созданной 200 лет назад. Несмотря на то, что предсказательная способность оказалась слабой, ученые отмечают важность самого эффекта, что юмор можно связать с какой-то информационной метрикой. Авторы также предположили, что в качестве значений можно использовать частоты появления букв в английском языке, хотя с этим также может быть связан ряд проблем.

Чаще всего энтропия Шеннона используется в криптографии, например, в качестве оценки «силы» пароля. Так, для представления данного слова нужно n бит энтропии, то само значение энтропии составит S=2

n

, а для взлома потребуется в среднем 2

n-1

 попыток. Что касается выдуманных слов, здесь стоит вспомнить легендарного Доктора Сьюза — англоязычного автора детских книг, прославившегося своим талантом в области веселого словотворчества.


Тарас Молотилин

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Молекулярных роботов научили собирать молекулы с заданной стереоизомерией