Экстремистов в твиттере вычислят до публикации постов

Кристина Уласович

Ученые создали алгоритм, который умеет определять экстремистов в социальных сетях еще до публикации постов, сообщается в журнале Operations Research. Для этого они проанализировали пять тысяч аккаунтов в Twitter.

Экстремисты, связанные с «Исламским государством» (деятельность организации запрещена на территории России), а также другими террористическими организациями, обычно используют социальные сети для пропаганды, запугивания населения и вербовки новых членов. Такие компании как Facebook и Twitter уже блокируют подозрительных пользователей с помощью специальных алгоритмов, однако это происходит после публикации постов. Теперь же исследователи создали алгоритм, который в перспективе позволит деактивировать экстремистские аккаунты сразу же после их создания.

Джитт Клаузен (Jytte Klausen) из Университета Брандейса в Массачусетсе вместе с коллегами из Массачусетского технологического института собрали данные пяти тысяч аккаунтов в твиттере, которые вели либо члены ИГИЛ, либо связанные с ними люди. Их имена были получены с помощью СМИ, блогов, правоохранительных органов и аналитических центров. Исследователи собрали всю информацию о пользователях, которая была указана в профиле, а также получили аналогичные данные для их друзей и подписчиков. Из-за этого количество профилей в базе данных возросло до 1,3 миллиона. Также ученые проанализировали 4,8 миллиона твитов, связанных с экстремистскими аккаунтами: часть из них принадлежала самим пользователями, а часть просто упоминала их или содержала соответствующие хэштеги.

Используя статистическое моделирование экстремистского поведения, результаты анализа постов и данные о пользователях, группа Клаузен создала предсказательную модель, которая может определять аккаунты как экстремистские, даже если они не сделали ни одной записи в микроблоге. Это связано с тем, что алгоритм опирается не на описание постов, а на то, как в целом выглядит типичный профиль экстремиста. Так, ученые выяснили, что 70 процентов аккаунтов из нового набора данных принадлежат экстремистам, а погрешность составила всего 2 процента.

«Пользователи, которые занимаются в какой-либо форме онлайн-экстремизмом, будут иметь очень похожие поведенческие характеристики в социальных сетях. Они будут связаны с определенным набором пользователей, которые формируют экстремистскую группировку. Они будут создавать новые похожие аккаунты после блокировки старых, а затем возвращаться в соцсеть и с высокой долей вероятности восстанавливать связи с теми же лицами», — поясняет Клаузен.

Иногда ученые применяют нестандартный подход к поиску экстремистских аккаунтов и групп в интернете. Например, недавно построили модель, которая опирается на теорию гелеобразования и описывает рост экстремистских групп, и показали с ее помощью, что экстремистские группы обычно объединяют людей со схожими интересами, а избавиться от сетевого экстремизма, уничтожив нескольких «подстрекателей», нельзя.

Кристина Уласович