Представители 21 разного культурного сообщества по всему миру акустически одинаково общаются с младенцами и поют им колыбельные. Это выяснили американские ученые, которые собрали и проанализировали аудиокорпус из 1615 записей пения и разговоров, адресованных маленьким детям и взрослым. Оказалось, что у коммуникации с младенцами есть свои культурно универсальные характерные акустические черты (самая заметная — изменение высоты голоса и, например, смягчение голоса при пении): это подтвердил как статистический анализ, так и опрос более 50 тысяч человек. Статья опубликована в журнале Nature Human Behaviour.
Коммуникация социальных животных часто зависит от контекста: в зависимости от того, нужно ли особи привлечь потенциального партнера, защититься от неприятеля или сообщить что-то детенышу, могут использоваться самые разные сигналы. Люди, разумеется, не исключение — и формы, которые принимает человеческое общение, также сильно зависят от самых разных факторов. Помимо общего контекста беседы это могут быть, например, эмоции (речь раздраженного человека чаще всего довольно легко отличить от речи воодушевленного или радостного человека) или даже что-то, что выделяет собеседника (скажем, статус или возраст).
Один из самых важных контекстов для человеческой речи — это общение родителя и ребенка, и у такого общения также есть свои особенности. Во-первых, если ребенок еще не научился говорить, чтобы обратить на себя внимание родителя ему или ей нужно будет заплакать (в целом, это основной способ коммуникации для младенца). Чтобы ответить на младенческий запрос, взрослые, в свою очередь, используют особую форму родительской коммуникации (в англоязычной литературе для нее используется термин baby talk), которая характеризуется целым рядом параметров и часто изучается исследователями психологии развития, лингвистики и антропологии.
Так, при общении с маленькими детьми (по сравнению с общением со взрослыми) родители растягивают гласные, изменяют высоту звука, говорят медленнее (считается, что это помогает раннему языковому развитию), а также поют колыбельные. Любое общение (будь то с детьми или же со взрослыми), однако, сильно зависит, с одной стороны, от культурных особенностей общества, а с другой — от особенностей языка (в частности, фонетических), на котором это общение происходит.
Конечно, утверждать, что все народы мира и носители всех языков общаются со своими младенцами одинаково, скорее нельзя — в подобных выводах всегда нужно учитывать культурные особенности. С другой стороны, разговор с младенцем — коммуникация довольно простая (она едва ли попадает под формат диалога, а главная цель ее почти всегда — успокоить), и простота эта как раз может говорить в пользу универсальности.
Чтобы оценить универсальность общения с младенцами, Сэмюэл Мер (Samuel Mehr) из Гарвардского университета вместе с коллегами собрал большой аудиокорпус с записями разговоров взрослых друг с другом и с маленькими детьми, а также пения — адресованного взрослым или же младенцам. В корпус попали записи голосов 410 людей из 21 сообществ со всего мира: например, в корпусе можно найти записи жителей Кракова и польской сельской местности, индейцев боливийского племени цимане, суданских топоса и носителей английского из США, Новой Зеландии и племени араваков, которые используют креольский вариант. Всего ученым удалось собрать 1615 записей, а записанные отрывки обрабатывали (в основном, убирали лишний шум) автоматически, чтобы избежать какого-либо влияния на материал аннотаторов-людей.
На полученных данных исследователи обучили статистическую модель — логистический классификатор — который определял адресата (взрослый или ребенок) разговора или пения на записи по 15 акустическим параметрам, включая высоту звука, используемый темп и тембр голоса говорящего. В модели каждый раз использовались записи только 20 сообществ из 21: по ним обучали классификатор, который затем относил записи 21-го сообщества к одной из двух категорий. Анализ провели 21 раз, каждый раз классифицируя новое сообщество из выборки.
Во всех сообществах модель правильно определяла, кому адресовано произнесенное или спетое: в случае и с песнями, и с разговорами классификатор верно определял адресата выше уровня случайного попадания (площадь под кривой, которая определяет качество работы бинарного классификатора, равнялась 91 и 82 процентам соответственно). Также модель позволила выделить и главные факторы, отличающие детскую коммуникацию от взрослой: так, при разговоре с младенцами голос людей становится выше, а гласные выделяются и растягиваются; песни, спетые детям, тоже отличаются растянутыми гласными, а также — меньшей интенсивностью по сравнению со «взрослыми».
Результат работы классификатора ученые также успешно воспроизвели не на материале различных сообществ, а на материале языковых семей — всего их было 15. Кроме того, результат повторился и при использовании другого статистического метода — метода главных компонент.
Далее ученые провели эксперимент с помощью онлайн-теста: участникам включали отрывки, взятые из собранного аудиокорпуса, и просили определить, кому адресовано сказанное или спетое — младенцу или взрослому. Всего в исследовании поучаствовали чуть больше 51 тысячи человек из 187 стран, говорящих на 199 различных языках.
Оказалось, что на слух люди также могут верно отличить песни, спетые младенцам, от песен, спетых взрослым (p = 0,032), — и то же самое и с речью (p = 0,017). Эффект сохранялся даже с поправкой на разные значимые факторы: во-первых, участники опроса в целом чаще отмечали всю речь как обращенную ко взрослому, а все песни — как спетые младенцу. Во-вторых, все участники свободно владели английским языком и могли понять, к кому обращается человек на записи, по словам — поэтому их из анализа удалили; также удалили те записи, где на фоне слышен, например, детский плач.
Кроме того, участники также правильно определяли адресата с поправкой на язык (в родном или хорошо известном языке, в языке из той же языковой семьи и в совершенно незнакомом языке). Также на разброс ответов участников не влияли важные факторы — пол и возраст, родной язык и место рождения.
Чтобы проверить, зависели ли оценки участников опроса от акустических характеристик записей, ученые вновь воспользовались логистическим классификатором, обучив его предсказывать ответы участников по акустическим параметрам звуков, а затем сравнили их с реальными ответами, обнаружив сильную положительную корреляцию (r = 0,72 для разговоров и r = 0,36 для песен). Для песен корреляция была слабее (но, тем не менее, была) — это авторы объяснили тем, что при прослушивании речи участники больше ориентировались на акустические особенности.
Ученые заключили, что, несмотря на культурные различия, разные родные языки и особенности воспитания детей, когда взрослые разговаривают с младенцами, они используют одинаковые акустические особенности для регуляции речи. Другими словами, разговоры с младенцами и пение им можно назвать культурно универсальным (впрочем, авторы отмечают, что это еще нужно подтвердить на других выборках с участием представителей других народов).
Корпус со всеми записанными отрывками (как песнями, так и речью) авторы работы выложили в открытый доступ, а на сайте их лаборатории можно сыграть в игру на его основе — ее использовали в исследовании.
Мер и его коллеги в своих работах часто обращаются к теме культурной универсальности. Например, в 2019 году они выяснили, что распространенные виды песен (среди которых, кстати, были и колыбельные) у 86 различных сообществ схожи по трем основным параметрам: формальности, религиозности и тому, какие эмоции они вызывают у слушателя.
Елизавета Ивтушок