Читать новые научные статьи стало объективно сложнее

Фрагмент из до сих пор не расшифрованной рукописи Войнича

Шведские ученые убедились, что за последние сто лет научные статьи стали значительно более сложными для восприятия. Ученые исследовали несколько сотен тысяч биомедицинских аннотаций и связали этот эффект с распространением научного жаргона, включающего не только специальные термины, но и множество более понятных, но редко использующихся в простой речи слов. Предварительную публикацию работы можно увидеть на сайте bioRxiv.

Исследователи из Каролинского института проанализировали более семисот тысяч аннотаций научных статей, опубликованных между 1881 и 2015 годами в 122 известных биомедицинских журналах (включая Nature, Science и другие), и утверждают, что язык этих текстов со временем становится все менее читабельным. Использование малопонятного внешнему наблюдателю научного жаргона, напротив, постоянно возрастает.

В разные времена существует мода на тексты разной степени сложности. Сейчас, например, все более простым языком пишут президентские речи, новости и художественные произведения. В научных статьях за последние сорок лет стиль изложения тоже поменялся — стало принято использовать больше слов с положительной коннотацией, таких, как «инновационный» или «полезный».

Чтобы понять, насколько тексты усложнились, ученые воспользовались двумя алгоритмами — Flesch Reading Ease (FRE) и New Dale-Chall Readability Formula (NDC). FRE анализирует число букв в словах и число слов в предложениях. NDC также учитывает число слов в предложениях, а еще определяет, какие из этих слов относятся к «сложным», пользуясь словарем распространенных, то есть «обычных» слов. В самом сложном предложении уровень FRE будет очень низкий, а NDC — очень высокий. Считается, что уровень FRE 100 соответствует уровню чтения десятилетнего ребенка, а тексты уровня меньше 30 способны прочитать только люди с высшим образованием.

Выяснилось, что с каждым годом тексты аннотаций усложнялись. Средние показатели NDC возрастали, а FRE снижались. Увеличивалась длина слов и количество «сложных» слов в предложении. С 1960 года также постоянно увеличивалась средняя длина предложений. Тексты с отрицательными значениями FRE (то есть, фактически нечитабельные) в 1960 году составляли около шестнадцати процентов от общего числа, а к 2015 году это значение превысило двадцать шесть процентов. Результаты FRE и NDC демонстрировали соответствие друг другу.

Чтобы оценить, насколько сложность аннотаций коррелирует со сложностью самой статьи, исследователи проанализировали также скачанные тексты статей из шести дополнительных журналов. Известно, что аннотации в среднем пишутся более сложным языком по сравнению с самой статьей, однако результаты показали значимую корреляцию между читабельностью одного и другого.

Такое положение дел можно было бы объяснить увеличением среднего числа соавторов в статьях. «У семи нянек дитя без глазу», предположили ученые. Протестировав эту гипотезу, они убедились, что число авторов статьи, пусть оно, действительно, и коррелирует с читабельностью аннотаций, все же не является определяющим фактором усложнения текста.

Вторая гипотеза состоит в том, что научный жаргон, возможно, настолько прочно вошел в обиход научных сотрудников, что они практически создали из него отдельный язык для написания статей. Он включает не только технические термины, но и ряд вроде бы не очень специальных слов, которые в статьях, однако, используются в сотни раз чаще, чем в обычной речи. Это касается таких слов, как «robust», «significant», «furthermore» и «underlying». Чтобы узнать, верно ли это предположение, ученые создали второй словарь, содержащий 2949 слов, часто встречающихся в двенадцати тысячах случайно выбранных аннотаций, но не входящих при этом в список «обычных» слов из первого словаря. Из него убрали такие слова, как «gene», которые появились сравнительно недавно, и узкоспециальные слова, такие как «tumor», имеющие отношение лишь к небольшому кругу тем.

Выяснилось, что оставшиеся 2140 научно-жаргонных слов в большинстве своем все чаще встречаются в аннотациях (исключение составляет, например, слово «appears», которое сейчас появляется реже, чем раньше), и таким образом гипотеза упрочнения положения научного жаргона подтвердилась.

Ученые полагают, что усложнение текстов научных статей, кроме всего прочего, — неизбежное зло, поскольку объем знаний человечества постоянно возрастает, соответственно, возрастает и количество описываемых явлений и процессов, зачастую очень сложных и не поддающихся упрощению.

Из-за сложности статей становится, однако, все труднее разобраться в сути научных исследований, не говоря уже о воспроизведении их результатов. Далекие от предмета люди не берутся читать очень сложные статьи, а иногда с этим плохо справляются и специалисты. Помимо очевидных минусов с точки зрения науки, из-за этого возникают и бытовые проблемы. Пытаясь разобраться в каком-то научном вопросе, люди начинают все охотнее верить простым и доступным текстам рекламного или просто заведомо ложного характера, пропагандирующие, например, какое-нибудь неработающее лекарство.

Анна Казнадзей




Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.