Машинное обучение вычислило торговцев опиоидами в Twitter

С помощью машинного обучения команда исследователей из Калифорнийского университета в Сан-Диего вычислила пользователей Twitter, занимающихся незаконной продажей опиоидных анальгетиков. Описывающая метод статья вышла в журнале American Journal of Public Health.

Алгоритмы машинного обучения позволяют исследователям работать с большим массивом данных, выявляя порой неочевидные на первый взгляд связи. Очень часто объектом анализа выступают посты пользователей в социальных сетях. Системы искусственного интеллекта позволяют не только выявить определенные закономерности в поведении людей в интернете, но и вычислить тех, кто нарушает закон или правила конкретного сообщества, например Facebook.

В 2008 году, спустя несколько лет после смерти 18-летнего Райана Хейта (Ryan Haight) от передозировки викодином, конгресс США выпустил акт, запрещающий распространять в интернете не подлежащие свободному обращению вещества. Авторы новой работы использовали машинное обучение, чтобы найти твиты с сообщениями об онлайн-продаже опиоидных анальгетиков. С помощью специального сервиса они в течение полугода отбирали посты в твиттере, содержащие названия опиодных : «перкоцет», «фентанил», «викодин», «оксиконтин», «оксикодон» и «гидрокодон». В выборку попало почти 620 тысяч записей. 

На следующем этапе ученые использовали алгоритм BTM, умеющий определять темы коротких текстов, чтобы отобрать твиты, связанные с продажей лекарств. Благодаря этому число постов в выборке сократилось до 1778, причем 90 процентов из них содержали ссылку на онлайн-магазин. Проверка показала, что примерно 46 процентов ссылок были рабочими и позволяли совершить нелегальную покупку в сети. Исследователи смогли выделить семь отдельных URL-адресов, принадлежавших нескольким аптекам, которые использовали блоги и соцсети для продажи, а также рекламным сайтам. Часть магазинов находилась в Пакистане.

Прошлые исследования Твиттера показали, что социальная сеть может являться источником эмоционального заражения. Кроме того выяснилось, что количество фолловеров в социальных сетях напрямую зависит от того, к какой демографической группе принадлежит пользователь.

Кристина Уласович

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Экономия трафика и устойчивый сигнал

Как устроен стандарт NB-IoT для автономных IoT-устройств