Европейские физики использовали большой массив данных с сабреддита r/wallstreetbets, а также динамику стоимости ценных бумаг, чтобы понять механизмы самоорганизации большого количества людей на примере скандала вокруг неожиданного взлета акций GameStop. Разработанная ими математическая модель избирателя, находящегося под действием глобального самосогласованного поля, показала качественное согласие с собранными и проанализированными данными. Исследование опубликовано в Scientific Reports.
Вопросы самоорганизации в достаточно больших системах относятся к самым сложным разделам соответствующих наук, например, физики, химии, биологии и так далее. Чем сложнее организована материя, тем труднее ее изучать и воспроизводить результаты. Венцом этой цепи можно назвать самоорганизацию большого числа людей в условиях информационного общества. Такие процессы могут иметь глобальные последствия для целых регионов.
Ярчайшим их примером можно назвать серию протестов под общим названием «Арабская весна», существенно изменивших политический ландшафт большей части арабского мира. И хотя ни у кого не вызывает сомнений важность роли, которую сыграли социальные сети в этом процессе, связь между массовыми уличными протестами и активностью в интернете, которую пытались отыскать исследователи, оказалась довольно нетривиальной. По этой причине любое достаточно громкое событие, связанное с самоорганизацией большого числа людей, находится под пристальным вниманием ученых.
Очередным подобным объектом исследования стала резонансная история вокруг акций американской розничной сети по продаже видеоигр и аксессуаров GameStop, чья стоимость в январе 2021 года резко взлетела вопреки прогнозам аналитиков из-за самоорганизации пользователей реддита. Флешмоб вылился в миллиардные убытки, которые понесли инвестиционные хэдж-фонды, для которых стратегия заключалась в «игре на понижение» на падении акций GameStop. Ситуация накалилась до такой степени, что на нее отреагировали Илон Маск и пресс-секретарь Белого дома, а само противостояние любителей и профессиональных трейдеров нарекли «борьбой Давида с Голиафом».
Академическое сообщество также проявило к истории интерес. Большинство исследователей интересовало финансовая сторона процесса. В частности, с помощью методов линейной регрессии или машинного обучения ученые пытались построить предсказательную модель для оценки дохода GameStop. Фундаментальные же вопросы человеческой самоорганизации интересовали лишь считанное число авторов.
Подробнее остановиться на этом аспекте решила группа итальянских физиков в соавторстве с Риккардо Ди Клементе (Riccardo Di Clemente) из Университета Эксетера. Они модернизировали простую модель, описывающую возникновение консенсуса в сети избирателей, с помощью дополнительного глобального поля, создаваемому самими узлами, и применили ее к данным о постах и комментариях в сабреддите r/wallstreetbets (WSB) за период, охватывающий зарождение и кульминацию флешмоба. И хотя модель качественно воспроизвела основные статистические особенности случившегося, ее количественное применение было ограничено недостатком данных.
Платформа Reddit представляет собой крупнейший англоязычный форум для общения между пользователями. Он разбит на сабреддиты, посвященные самой различной тематике и обладающие значительной автономией в плане модерации контента. Конкретно в WSB обсуждаются вопросы любительской торговли на рынке ценных бумаг. Общение в сабреддитах происходит с помощью публикации постов, комментариев к ним и ответов на комментарии. В результате каждый тред представляет собой дерево сообщений, а активность в сабреддитах можно представить в виде массива таких деревьев (леса), эволюционирующих со временем.
Физики проанализировали леса дискуссий в WSB с 1 сентября 2019 года по 1 февраля 2021 года. За этот период произошли основные события в жизни сети GameStop. Главными причинами ее упадка стало развитие цифровых платформ дистрибуции видеоигр, а также пандемия коронавируса, в результате чего к 3 апреля 2020 года цена одной акции достигла рекордно низких 2,57 доллара.
Бедственное положение GameStop встретило сочувствие со стороны трейдеров-любителей с WSB. Весь 2020 год эта тема в сабреддите поднималась каждый раз, когда в компании происходили какие-либо перемены либо она публиковала квартальные отчеты. Ученые отслеживали этот факт с помощью поиска в сообщениях различных тикеров — коротких идентификаторов тех или иных ценных бумаг (акциям GameStop соответствует тикер GME). Анализ показал, что всплески интереса форумчан явно коррелируют с объемом торговли акциями GME, а их амплитуда растет со временем по мере прироста пользователей сабреддита и их вовлеченности. В конечном итоге именно эта активность и привела к взрывному росту акций до 483 долларов в январе 2021 года. Не последнюю роль в этом сыграл воинственный настрой сабреддиторов по отношению к хедж-фонду Citron Research, который в одном из твитов уничижительно высказался о трейдерах-любителях.
Модель, разработанная физиками, представляла собой модификацию уже известной модели избирателя. В ее рамках сеть избирателей моделируется с помощью узлов-битов, чье значение может быть равно ±1. Оно может меняться случайным образом влиянием соседей. Параметром порядка (его еще называют намагниченностью по аналогии с очень похожей спиновой моделью) выступает арифметическое среднее мнений. Его нулевое или единичное по модулю значение соответствует отсутствию или наличию в обществе некоторого консенсуса. Авторы добавили в модель некое глобальное самосогласованное поле, действующее одновременно на всех избирателей. Оно по определенной формуле зависит от консенсуса и определяется двумя параметрами: долей, с которой поле влияет на изменение мнения отдельного человека на фоне мнений соседей, и контрольным параметром, определяющим то, насколько большой должен быть консенсус, чтобы влияние поля было существенным. Последний параметр исследователи связали с вовлеченностью пользователя в идеи, которые витают в сабреддите.
Чтобы адаптировать новую модель, физики создавали сети пользователей на основании того, как часто они отвечают друг другу в постах WSB. Некоторые выводы о вовлеченности они делали, анализируя настроения пользователей, обсуждающих GME. Последнее было сделано с помощью инструмента VADER (Valence Aware Dictionary and sEntiment Reasoner), сопоставляющего текстовому отрывку дробное число в диапазоне от −1 до +1, характеризующее его негативный или позитивный настрой. Им пришлось адаптировать VADER к специфичной лексике пользователей WSB, использующих большое количество жаргонизмов, сарказма и токсичных выражений. Анализ показал, что последние два месяца перед кульминацией настроение в таких сообщениях демонстрирует почти ровный линейный рост с минимальным статистическим разбросом.
Авторы сконцентрировались на последних четырех месяцах выборки и посмотрели, как консенсус пользователей коррелирует с их вовлеченностью. Поведение полученных зависимостей оказалось в качественном согласии с симуляциями Эрдёша — Реньи в рамках модели самосогласованного поля. Физики признают, что дальнейшее развитие модели ограничено тем, что они не могут однозначно сопоставить измеренные настроения сообщений параметру вовлеченности написавших их пользователей, ограничиваясь лишь качественными соображениями. Кроме того, под анализ не попало общение участников флешмоба в дискорде, которое также повлияло на его исход. Наконец, наиболее продуктивным было бы связать результаты моделирования с тем, как покупают и продают акции отдельные пользователи. Последнее, однако, представляет собой коммерческую тайну и не может быть предоставлено исследователям.
Математикам подвластны не только текстовые сообщения с реддита, но и изображения, в особенности мемы. Ранее мы рассказывали, как ученые благодаря такому анализу назвали Дональда Трампа самым популярным героем мемов и доказали усложнение мемов с годами.
Марат Хамадеев