Читать новые научные статьи стало объективно сложнее

Шведские ученые убедились, что за последние сто лет научные статьи стали значительно более сложными для восприятия. Ученые исследовали несколько сотен тысяч биомедицинских аннотаций и связали этот эффект с распространением научного жаргона, включающего не только специальные термины, но и множество более понятных, но редко использующихся в простой речи слов. Предварительную публикацию работы можно увидеть на сайте bioRxiv.

Исследователи из Каролинского института проанализировали более семисот тысяч аннотаций научных статей, опубликованных между 1881 и 2015 годами в 122 известных биомедицинских журналах (включая Nature, Science и другие), и утверждают, что язык этих текстов со временем становится все менее читабельным. Использование малопонятного внешнему наблюдателю научного жаргона, напротив, постоянно возрастает.

В разные времена существует мода на тексты разной степени сложности. Сейчас, например, все более простым языком пишут президентские речи, новости и художественные произведения. В научных статьях за последние сорок лет стиль изложения тоже поменялся — стало принято использовать больше слов с положительной коннотацией, таких, как «инновационный» или «полезный».

Чтобы понять, насколько тексты усложнились, ученые воспользовались двумя алгоритмами — Flesch Reading Ease (FRE) и New Dale-Chall Readability Formula (NDC). FRE анализирует число букв в словах и число слов в предложениях. NDC также учитывает число слов в предложениях, а еще определяет, какие из этих слов относятся к «сложным», пользуясь словарем распространенных, то есть «обычных» слов. В самом сложном предложении уровень FRE будет очень низкий, а NDC — очень высокий. Считается, что уровень FRE 100 соответствует уровню чтения десятилетнего ребенка, а тексты уровня меньше 30 способны прочитать только люди с высшим образованием.

Выяснилось, что с каждым годом тексты аннотаций усложнялись. Средние показатели NDC возрастали, а FRE снижались. Увеличивалась длина слов и количество «сложных» слов в предложении. С 1960 года также постоянно увеличивалась средняя длина предложений. Тексты с отрицательными значениями FRE (то есть, фактически нечитабельные) в 1960 году составляли около шестнадцати процентов от общего числа, а к 2015 году это значение превысило двадцать шесть процентов. Результаты FRE и NDC демонстрировали соответствие друг другу.

Чтобы оценить, насколько сложность аннотаций коррелирует со сложностью самой статьи, исследователи проанализировали также скачанные тексты статей из шести дополнительных журналов. Известно, что аннотации в среднем пишутся более сложным языком по сравнению с самой статьей, однако результаты показали значимую корреляцию между читабельностью одного и другого.

Такое положение дел можно было бы объяснить увеличением среднего числа соавторов в статьях. «У семи нянек дитя без глазу», предположили ученые. Протестировав эту гипотезу, они убедились, что число авторов статьи, пусть оно, действительно, и коррелирует с читабельностью аннотаций, все же не является определяющим фактором усложнения текста.

Вторая гипотеза состоит в том, что научный жаргон, возможно, настолько прочно вошел в обиход научных сотрудников, что они практически создали из него отдельный язык для написания статей. Он включает не только технические термины, но и ряд вроде бы не очень специальных слов, которые в статьях, однако, используются в сотни раз чаще, чем в обычной речи. Это касается таких слов, как «robust», «significant», «furthermore» и «underlying». Чтобы узнать, верно ли это предположение, ученые создали второй словарь, содержащий 2949 слов, часто встречающихся в двенадцати тысячах случайно выбранных аннотаций, но не входящих при этом в список «обычных» слов из первого словаря. Из него убрали такие слова, как «gene», которые появились сравнительно недавно, и узкоспециальные слова, такие как «tumor», имеющие отношение лишь к небольшому кругу тем.

Выяснилось, что оставшиеся 2140 научно-жаргонных слов в большинстве своем все чаще встречаются в аннотациях (исключение составляет, например, слово «appears», которое сейчас появляется реже, чем раньше), и таким образом гипотеза упрочнения положения научного жаргона подтвердилась.

Ученые полагают, что усложнение текстов научных статей, кроме всего прочего, — неизбежное зло, поскольку объем знаний человечества постоянно возрастает, соответственно, возрастает и количество описываемых явлений и процессов, зачастую очень сложных и не поддающихся упрощению.

Из-за сложности статей становится, однако, все труднее разобраться в сути научных исследований, не говоря уже о воспроизведении их результатов. Далекие от предмета люди не берутся читать очень сложные статьи, а иногда с этим плохо справляются и специалисты. Помимо очевидных минусов с точки зрения науки, из-за этого возникают и бытовые проблемы. Пытаясь разобраться в каком-то научном вопросе, люди начинают все охотнее верить простым и доступным текстам рекламного или просто заведомо ложного характера, пропагандирующие, например, какое-нибудь неработающее лекарство.

Анна Казнадзей



Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Российский школьник стал абсолютным победителем Международной географической олимпиады