Математики нашли распределение Бенфорда в классической музыке

Математики обнаружили, что суммарная длительность нот в классических музыкальных произведениях описывается статистическим законом Бенфорда. Оказалось, что этот закон, описывающий вероятность появления определенной цифры в начале числа из реальной жизни — длины рек, высоты зданий или размера генома — подходит и для музыки, пишут ученые в препринте, опубликованном на arXiv.org

Закон Бенфорда задает вероятность, с которой та или иная цифра окажется первой в случайной числовой последовательности из реальной жизни. Этот закон имеет логарифмический вид с основанием, соответствующем числу возможных знаков. Например, в случае десятичной системы счисления вероятность того, что первой цифрой в последовательности будет d, описывается следующим уравнением:

Согласно этому закону распределения, «1» на первом месте оказывается примерно в 30,1 процента случаев, «2» — в 17,6 процента случаев, а «9» — лишь в 4,5 процента случаев. Впервые эта закономерность была обнаружена еще в конце XIX века, а в 1938 году американский физик Фрэнк Бенфорд проверил ее на выборке из более чем 20 тысяч различных последовательностей.

Аналогичные выражения существуют и для вероятности обнаружить ту или иную цифру на второй или третьей позиции в последовательности. Законом Бенфорда описывается очень большое число различных распределений: длина рек, население городов, распределение высот зданий по всему миру в любых единицах измерения или размер генома. Другие примеры распределений, подчиняющихся этому закону, можно найти здесь.

Американские математики Азар Хосравани (Azar Khosravani) из Колумбийского колледжа Чикаго и Константин Росинариу (Constantin Rasinariu) из Чикагского университета Лойолы обнаружили, что закону Бенфорда подчиняются и суммарные длительности нот в классических музыкальных произведениях. В своем исследовании ученые проанализировали записи произведений Баха, Моцарта, Бетховена, Шуберта и Чайковского, среди которых были только инструментальные произведения, в частности балеты, сонаты и концерты. Точное количество произведений авторы не указывают, но отмечают, что всего был проанализирован 521 аудио-файл (при этом количество файлов, соответствующих одному произведению, может варьироваться: например, запись балета «Лебединое озеро» состояла из 43 файлов). С помощью программы ученые определили длительность каждой ноты, после чего для каждой отдельной ноты посчитали суммарную длительность ее звучания в произведения в секундах. При этом авторы исследования отмечают, что громкие и тихие ноты анализировались одинаковым образом.

Полученный массив суммарных длительностей звучания всех нот во всех произведениях авторы работы исследовали с помощью статистического анализа и обнаружили, что эти значения подчиняются закону Бенфорда. Сначала ученые проверили эту закономерность на 32 сонатах Бетховена, для которых описали логарифмическим распределением вероятность встретить ту или иную цифру в качестве первой знака в суммарной длительности звучания ноты. Кроме того, ученые проанализировали и вероятность обнаружить в начале записи последовательность из двух знаков, которые также, как оказалось, подчиняется закону Бенфорда.

Проверив применимость закона Бенфорда к сонатам Бетховена, ученые перешли к «Лебединому озеру» Чайковского, после чего проанализировали также произведения Моцарта, Баха и Шуберта. Оказалось, что все без исключения произведения подчиняются закону Бенфорда, так же как и суммарная выборка. Никаких выводов из своих результатов ученые не делают, однако эти данные однозначно подтверждают, что последовательности, полученные из музыкальных произведений, встали в один ряд с распределениями высот зданий, длин генома или степенью сжатия файлов jpeg, которые описываются одним из наиболее контринтуитивных законов распределения.

Поскольку очень много разнообразных последовательностей описываются логарифмическим распределением Бенфорда, ученые предлагают использовать эту закономерность и в полезных целях. Например, не так давно математик Дженнифер Голбек показала, что с помощью проверки на «логарифмичность» распределения можно определять «подозрительную активность». Оказалось, что первая цифра числа друзей друзей одного аккаунта должна подчиняться закону Бенфорда. В том случае, если закон нарушается, то скорее всего учетная запись — бот.

Александр Дубов


Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.