Ученые нашли в твитах признаки надвигающейся эпидемии

Giphy.com

По изменениям количества твитов, в которых население поддерживает вакцинацию, или выступает против, можно предсказать наступление переломной точки, в которой количество людей, отказавшихся привиться становится так велико, что это приводит к вспышке эпидемии. Такие выводы сделали ученые из университетов Канады, США и Швейцарии в своей работе, опубликованной в журнале Proceedings of the National Academy of Sciences.

Эпидемии болезней можно сдержать при помощи массовой вакцинации, а некоторые болезни, которые могут достичь эпидемических масштабов, можно полностью ликвидировать. Всемирная организация здравоохранения разрабатывает планы ликвидации полиомиелита, кори, и других болезней. Отказ от вакцинации замедляет процесс искоренения болезни и может привести к новым эпидемическим вспышкам. Так, например, вспышке кори в период с 2014 по 2015 год в Диснейленде предшествовало снижение охвата вакцинацией против кори, краснухи и свинки (MMR vaccine) в штате Калифорния в период с 2010 по 2014 год. 

Ученые разрабатывают сложные математические модели для подобных динамических систем, чтобы предсказывать коллапсы. Также ученые разрабатывают индикаторы, которые позволяют как можно раньше судить о приближении к критической точке. Крис Баух (Chris Bauch) из департамента прикладной математики Университета Ватерлоо вместе с коллегами из Канады, США и Швейцарии решили испытать существующие модели и ранние предупреждающие индикаторы на примере эпидемии кори в Диснейленде, а в качестве индикатора настроений вокруг вакцинации использовать данные социальных сетей и запросов в Google. 

Они выбрали модель динамики болезней и поведения людей, в которую входят показатели динамики болезни (индексы рождаемости и смертности, число больных и восприимчивых к болезни), социальных норм (является ли вакцинация нормой, и насколько социальные нормы вообще сильны в данном обществе) и воспринимаемых рисков (как от болезни, так и риски от принятия вакцины). Также они использовали теорию критического замедления (critical slowing down), согласно которой в случаях, когда система близка к критической точке опрокидывания, скорость ее восстановления должна уменьшаться. О критическом замедлении авторы судили по изменениям индикаторов дисперсии, автокорреляции и коэффициента вариации: все три должны продемонстрировать значительный рост перед эпидемией, и спад после. Автокорреляционную функцию используют для идентификации циклов в поведении динамических систем, и она удобна для выявления критического замедления. Индикатором настроений населения стали запросы в Google и посты в Twitter с геотегами США и, в частности, Калифорнии. Все твиты c 2011 по 2016 год разделили на три категории по их содержанию: «за вакцинацию», «против вакцинации», и «другие», в которых настроения автора не поддавались классификации «за» или «против». Данные разбили на недельные промежутки, для позитивных и негативных твитов рассчитали значения индикаторов, которые затем сравнили с предсказаниями модели. Данные Google Trends не раскрывают настроений населения, но, поскольку спорные темы провоцируют увеличение поисковых запросов, эти данные могут отражать несогласие в обществе по поводу вакцинации. 

Поскольку на решение прививаться влияет разница между представлениями о том, что рискованнее, болезнь или прививка, ученые предположили, что готовность населения прививаться становится критической вблизи порога устранения болезни, когда социальные нормы ослабевают.

Среди всех американских твитов 660 477 оказались против вакцинации, 883 570 — за, и еще 483 636 твитов попало в категорию «другие». Среди калифорнийских твитов против вакцинации оказалось 101 683, за — 112 741, 59 030 попало в категорию «другие». Ученые обнаружили, что вариация, коэффициент вариации и функция автокорреляции для негативных твитов значительно выросли до эпидемии, причем рост начался за несколько лет до ее возникновения, а после вспышки кори все три показателя резко пошли на спад. Похожие изменения произошли и в позитивных твитах: росли вариация и коэффициент вариации, но автокорреляция не менялась на протяжении этих лет, а после эпидемии ее значение резко падало, но быстро возвращалось на прежний уровень. Самые надежные тенденции демонстрировал показатель вариации, самыми ненадежными оказались тенденции показателя автокорреляции. Объем поисковых запросов в Google о вакцине от кори увеличился за несколько лет до вспышки эпидемии, как и общее число твитов на тему вакцинации.

Авторы считают, что полученные результаты подтверждают их гипотезу о важности динамики общественного мнения вблизи порога устранения болезни, и обращают внимание на то, как быстро индикаторы возвращаются к норме, когда число заболевших достигает высокой отметки. Нестабильность показателя автокорреляции они связывают с тем, что продолжительность жизни новостей в социальных сетях обычно меньше 24 часов. Также, по их мнению, данные результаты подтверждают целесообразность использования данных социальных сетей для получения предсказаний, однако авторы признают, что данные социальных сетей является косвенным показателем настроений всего населения, и нуждаются в разработке более точных для этого моделей.

Другая компьютерная модель показала, что заболеваемость корью увеличивается в три раза, когда охват детей вакцинацией падает на пять процентов, а вот связи этой прививки с аутизмом ученые не нашли. Ранее мы провели обзор малоизвестных прививок, и рассказали о проблеме распространения ложной информации в онлайн среде.

Анна Зинина

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.