Разговорная речь заставила выбрать между умными словами и сложными предложениями

Edward Gibson et al. / Proceedings of the National Academy of Sciences, 2022

Говорящим приходится выбирать между синтаксисом и семантикой: если речь богата лексически, то грамматически она будет проще, а если человек использует сложные конструкции — в них будет меньше редких и сложных слов. К такому выводу пришли американские ученые, которые разработали метод оценки синтаксической сложности и лексической наполненности высказываний разговорной речи и проанализировали с помощью него речь здоровых людей и пациентов с разными формами афазии. В рассказах всех участников исследования лексическая сложность обратно коррелировала с грамматической, пишут лингвисты в журнале Proceedings of the National Academy of Sciences.

В самом простом смысле производство речи можно разделить на две составляющие: семантическую и синтаксическую. Первая отвечает за подбор нужных для выражения мысли слов, а вторая — за то, чтобы подобранные слова соединились в правильные грамматические конструкции.

Несмотря на то, что в речи два этих процесса работают совместно, их все же принято разделять — причем не только на уровне изучения лингвистических дисциплин, но и в том, как речь строится вообще. В пользу этого говорят, например, многочисленные данные, полученные при изучении людей с афазией — приобретенным нарушением речи. Разные типы афазий характеризуются сложностями как с составлением грамматически правильных предложений, так и с подбором нужных слов. Эти нарушения зависят от того, какая мозговая структура повреждена (вследствие инсульта или по каким-либо другим причинам).

Тем не менее, структурное и патологическое разделение лексики и грамматики не отвечает до конца на вопрос о том, как они взаимодействуют в самом процессе речи. Изучить этот вопрос подробнее решили лингвисты из Чикагского университета под руководством Эдварда Гибсона (Edward Gibson). Они предположили, что в речи говорящий всегда отдает предпочтение либо семантике, либо синтаксису: в грамматически сложной фразе, согласно их гипотезе, будет меньше сложных слов, а лексическое разнообразие, наоборот, приведет к упрощению конструкций. К примеру, если человек не сможет вспомнить слово сапборд, он может сказать надувная доска, на которой можно идти по воде, стоя с веслом; напротив, если слово сапборд ему известно, необходимость в сложной описательной конструкции самого сапборда пропадает.

Чтобы проверить свою гипотезу, ученые разработали методику, с помощью которой по частоте использования тех или иных конструкций в высказываниях оценивали их синтаксическую сложность, а по частоте используемых слов — семантическую наполненность. Для оценки синтаксиса ученые взяли небольшой корпус англоязычной устной речи и автоматически выделили для фраз связи частей речи в предложении друг с другом. 

Из получившихся связей ученые выделили 20 самых распространенных синтаксических конструкций: например, связку «предлог — существительное», «артикль — прилагательное — существительное» и «существительное — вспомогательный глагол — глагол». Сложность синтаксиса, таким образом, оценивали по частоте их употребления: чем меньше говорящий использует самые распространенные конструкции, тем синтаксически сложнее его речь. Лексическую наполненность, в свою очередь, оценивали по частотности самостоятельных слов (существительных, глаголов, наречий и прилагательных) в речи: чем в речи больше популярных слов, тем она семантически беднее.

Полученную методику ученые использовали в двух экспериментах с участием 231 человека: 152 здоровых носителей английского и 79 — пациентов с первичной прогрессирующей афазией трех типов. В группе пациентов у 26 человек была диагностирована логопедическая афазия, а у 24 — семантическая: оба этих типа афазий связаны с нарушениями лексикосемантических связей. Еще у 29 пациентов была диагностирована небеглая форма афазии, которая характеризуется упрощением синтаксической структуры высказываний.

От редактора

Классификация афазий — предмет довольно сложный: в разной литературе нарушениям с одной и той же симптоматикой дают разные названия, а в некоторых случаях в одной классификации может не найтись полного аналога афазии, принятого в другой классификации.

В этой статье ученые сосредоточились на отдельной группе афазий — первичных прогрессирующих — которые впервые выделили в 2001 году. Первичные прогрессирующие афазии отличаются постепенным ухудшением речевых функций вследствие нейродегенеративных заболеваний, а не последствий инсульта (одной из основных причин появления афазий вообще).

Среди первичных прогрессирующих афазий выделяют всего три типа: логопедическая, семантическая и небеглая. Для простоты повествования в этом тексте мы, вслед за авторами статьи, будем использовать именно эту классификацию и эти названия.

В первом эксперименте приняли участие 53 здоровых носителя и все 79 пациентов с афазией. Участников эксперимента попросили посмотреть на изображение семьи на пикнике и максимально подробно, с использованием полных предложений, описать, что на изображении происходит. Речь участников записывали, а затем автоматически анализировали: подсчитывали распространенные синтаксические конструкции и частотность используемых слов.

Как и предполагалось, пациенты с семантической и логопедической афазией использовали больше (p < 0,001) самых частотных слов в своем рассказе, чем здоровые участники и пациенты с небеглой афазией — те чаще отдавали предпочтение более редким словам. Пациенты с небеглой афазией чаще других участников (p < 0,001) использовали более простые конструкции в своей речи (даже с поправкой на длину законченной фразы).

После этого ученые оценили корреляцию между синтаксической и лексической сложностью в речи участников. Как и ожидалось, они оказались отрицательно скоррелированы (p < 0,001): чем сложнее грамматика, тем проще слова, — и наоборот. Отрицательная корреляция наблюдалась у всех участников: как у здоровых носителей, так и у пациентов с афазией — независимо от типа.

Во втором эксперименте ученые решили воспроизвести результаты первого — но только на здоровых участниках (всего 99 человек). Участники эксперимента либо также описывали изображение пикника, либо рассказывали о своей работе. Как и в первом эксперименте, синтаксическая и лексическая сложность оказались отрицательно скоррелированы (p < 0,001): в грамматически простых предложениях было больше редких слов, а семантически бедные высказывания отличались наслоением сложного синтаксиса.

Результаты двух экспериментов говорят о том, что в процессе речи говорящим (как здоровым, так и пациентам с афазией) действительно приходится выбирать между сложной грамматикой и богатой лексикой. Этому, по мнению ученых, есть два возможных объяснения. С одной стороны, причиной такого выбора может быть то, что говорящим, в первую очередь, необходимо быть понятыми. Если человек, к примеру, использует то же слово сапборд, этого будет достаточно: при условии, если собеседник знает о значении этого слова, необходимость в долгих, грамматически сложных описаниях отпадает. Напротив, если слово сапборд неизвестно, более простое надувная доска всего смысла не передаст — и говорящему необходимо использовать более сложную конструкцию, чтобы собеседник понял, о чем идет речь.

С другой стороны, подобный выбор может объясняться доступностью различных средств говорящему: авторы работы предположили, что и на синтаксис, и на лексику в процессе речи тратится единое ограниченное количество когнитивных ресурсов. Таким образом, если говорящему необходимо вспомнить сложное редкое слово, ресурса на то, чтобы обрамить его сложной синтаксической конструкцией, у него не останется, — и наоборот. Впрочем, авторы работы отмечают, что полученных ими данных недостаточно, чтобы сделать вывод о причинах подобного выбора, — это нужно будет подробнее изучить в следующих исследованиях.

И еще раз от редактора

В исследовании участвовали только носители английского языка и изучалась, соответственно, только разговорная речь на английском языке. Может показаться, что на материале одного языка делать такие выводы довольно сомнительно, но на самом деле язык тут ни при чем — все дело в речи, в том, как говорящий структурирует и выражает свои мысли. Язык в данном случае играет больше вторичную роль — роль оболочки. Впрочем, воспроизвести результаты исследования на материале других языков было бы очень интересно — возможно, мы заблуждаемся, и у носителей других языков дела обстоят иначе.

На беглость речь влияет не только выбор между лексико-семантическим и синтаксическим наполнением, но и отдельные слова: например, несколько лет назад ученые на примере носителей девяти разных языков выяснили, что перед существительными люди чаще делают паузы и замедляют артикуляцию. 

Елизавета Ивтушок, Александр Дубов

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.