Глобальный анализ твиттера показал, что график интенсивности общения в твиттере в течение дня сильно напоминает кардиограмму. Более того, пики активности оказались синхронизированными между континентами. Описание работы опубликовано в журнале Journal of the Royal Society Interface.
Каждый отдельно взятый человек имеет свой собственный режим и привычки в течение дня, которые включают, в частности, общение в социальных сетях. Тем не менее, индивидуальные режимы подчиняются общим закономерностям, которые можно выявить не только опросами, но и при помощи современных технологий, изучая глобальное потребление электричества, активность использования мобильной связи или интернета.
В новой работе ученые изучили более 500 миллионов твитов с отметками геолокации, опубликованных с августа 2013 года по апрель 2014 года, для выявления общих трендов в социальном поведении пользователей твиттера. Данные собрали при помощи стримингового интерфейса Twitter streaming API, который обеспечивает сбор информации в режиме реального времени. Отметка геолокации дает точное географическое позиционирование твита. Помеченные геолокацией твиты составили около трех процентов от общего потока. Аудитория твиттера — в основном обеспеченная городская молодежь, таким образом, результаты исследования дают репрезентативную картину динамики молодого населения в крупных городах.
Выяснилось, что в крупных городах график интенсивности твитов в течение дня напоминает кардиограмму: четкий пик активности наблюдается в деловых центрах города перед началом рабочих часов, за ним следует еще один пик социальной активности после рабочего дня, который завершается периодом слабой активности и рассеиванием географии твитов между спальными районами города, когда люди разъезжаются по домам и ложатся спать — такой рисунок активности в самом деле напоминает сердечный цикл, который состоит из сокращения предсердий, сокращения желудочков и фазы расслабления. Наблюдения в течение нескольких месяцев показали, что интенсивность твитов больше привязана к рабочему расписанию, нежели чем к природным циклам, не сильно меняясь при изменении длительности дня и ночи при смене сезонов.
Используя данные твиттера, исследователи получили графики интенсивности твитов для 52 метрополий по всему миру. Характерный рисунок сердцебиения обнаружился в каждом городе, хотя величина и время пиков отличались от города к городу; при этом города, которые находятся в близких временных зонах, имели схожие шаблоны твиттер-активности. Так, города Азии и Океании отличаются одним большим пиком интенсивности в течение дня, города Южной и Северной Америки имеют характерный рисунок с двумя небольшими пиками утром и большим пиком вечером, а города Европы, Среднего и Ближнего Востока и Африки показали два пика примерно равного размера, которые приходятся на утро и время после работы.
Неожиданной находкой стала синхронизация активности твиттера между разными временными зонами: так, утренний пик в Европе совпал с пиком вечерней активности в азиатских городах, при этом совпали не только пики, но и собственно темы обсуждения: их отследили по тэгам и упоминаниям конкретных персон и событий.
Ниже на видео показана усредненная корреляция твиттер-активности в течение дня: линии отражают наблюдаемую в течение 12 часов корреляцию величиной более 0.9, цвета отражают основные кластеры со схожим графиком интенсивности твитов.
Ученые отмечают, что выявленные закономерности демонстрируют новый уровень обмена идеями и информацией современного мира в глобальном масштабе, а новые возможности получения и обработки информации позволяют прогнозировать особенности распространения данных между социальными сообществами.
Надежда Бессонова