Массовые беспорядки предскажут по сотовым данным

Ученые из США и Ирландии создали алгоритм обнаружения подозрительных скоплений людей на основании открытой статистики сотовых операторов. По данным о ежедневных звонках и смс-сообщениях программа рассчитывает «нормальное» поведение человека и его маршруты среди дня. Если достаточно большая группа людей начинает двигаться «ненормально», это может оказаться акцией, митингом или другой формой протеста. Текст работы выложен  на сайте arxiv.org.

В качестве исходных данных авторы использовали базу учетных записей о звонках (Call Detail Record) Кот-д’Ивуара в период с декабря 2011 по апрель 2012 года. В это время в стране наблюдался политический кризис и прошла Вторая гражданская война, поэтому данных о массовом скоплении людей было в достатке.

Отслеживание перемещений людей только на основании сотовых данных представляет собой достаточно трудную задачу по двум причинам. Во-первых, большинство звонков в течении дня совершается нерегулярно, поэтому нет возможности следить за движением человека в реальном времени, есть только несколько контрольных точек на протяжении дня. Во-вторых, геометка привязывается не к точке, где находится абонент, а к ближайшей вышке, поэтому все данные разбиваются дискретно не только во времени, но и в пространстве.

Тем не менее, авторам удалось создать эффективный метод, который отслеживает образование «кластеров» из абонентов и их движение от вышке к вышке.

Обучая программу по каждому абоненту, ученые создают базу «нормальных» перемещений людей в течение дня. В случае, когда несколько абонентов объединяются в «кластеры», которые движутся не по «нормальному» ежедневному маршруту, авторы говорят о формировании «необычной толпы», что может говорить о проведении массовой акции.

Исследователи обучали свою программу на двух третях имеющейся выборки, а на последней трети тестировали работу алгоритма. Кроме того, полученные результаты сравнивали с результатами нескольких других алгоритмов, которые используют GPS-данные.

Оказалось, что метод, основанный на сотовых данных, корректно определил 23 из 25 «тестовых» акций, тогда как альтернативная система нашла 19 из 25. При этом авторы не учитывали, что количество доступных треков GPS на несколько порядков меньше, чем число учетных записей о звонках, совершаемых ежедневно.

На основании новой работы предполагается создать систему мониторинга скопления людей в реальном времени. Она может послужить как вопросам безопасности (для предотвращение массовых акций и беспорядков), так и улучшению городской инфраструктуры, например — планированию улучшенных транспортных сетей.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Российский школьник стал абсолютным победителем Международной географической олимпиады