Соцсети оказались врагом энтропии

Работа Криса Йохансона, коллекция музея современного искусства Сан-Франциско

Фотография: Jason Tester Guerrilla Futures / flickr.com

Ученые из Индианского университета доказали эффект «социального пузыря», заключающийся в том, что люди, получающие информацию из социальных медиа, потребляют менее разнообразный контент нежели те, кто читает новости «большого интернета». Исследование, основанное на анализе более чем 100 миллионов кликов и 1,3 миллиарда постов, опубликовано в PeerJ Computer Science.

Для оценки того, насколько информация, получаемая при помощи поисковых инструментов, разнообразнее информации, получаемой из социальных сетей, ученые ввели особый индекс, рассчитываемый исходя из распределения количества кликов. Индекс был введен на основе определения информационной энтропии (меры неопределенности или непредсказуемости информации). Например, один клик на «Коммерсант» и девять кликов на «Ведомости» дают меньший индекс, чем пять кликов на каждый сайт. Чем меньше значение индекса, тем более «концентрирован» трафик. Чем индекс выше – тем более разнообразны сайты, которые посещает пользователь.

Исследователи проанализировали анонимную базу данных CNetS (Center for Complex Networks and Systems Research), в которой содержатся сведения о 100 000 поисковых запросах, совершенных между октябрем 2006 и маем 2010. Вначале ученые очистили сырые данные от трафика поисковых ботов, а затем посмотрели, куда в конечном счете приводит та или иная ссылка, пометив источник каждой из них тремя метками: search, social media, email. Оказалось, что характер трафика в трех разных категориях существенно разнится: информационная энтропия у трафика из поисковых систем выше, что означает его большее разнообразие. 

Также команда изучила массив данных, содержащих 18 миллионов кликов полумиллиона пользователей AOL в 2006 году и 1,3 миллиарда твитов со ссылками, опубликованных между апрелем 2013 и апрелем 2014 года. Это было сделано для более точного анализа соответствия между коллективным и индивидуальным трафиком. Опять же оказалось, что разнообразие сайтов, на которые пользователи переходили из социальных сетей, ниже, чем разнообразие сайтов, на которые пользователи попадали из поиска. При этом информационная энтропия в случае коллективного трафика коррелировала с информационной энтропией индивидуальных пользователей – то есть существует не только «общественный социальный пузырь», но также «индивидуальный социальный пузырь». 

Согласно руководителю исследования Димитару Николову (Dimitar Nikolov), эффект «социального пузыря» приводит к тому, что новости распространяются среди людей с похожими взглядами – а это в конечном счете означает снижение количества источников информации. Проще говоря, чем больше времени вы проводите в социальных сетях, тем менее разнообразны ваши новости.

Помимо теории «социального пузыря» существует также теория «пузыря фильтров». Согласно ей, алгоритмы поисковых сайтов решают, какую информацию показывать пользователю, на основе сделанных им запросов. Это в свою очередь приводит к тому, что пользователь видит только ту информацию, которая согласуется с его прошлыми точками зрения.

Александра Стуккей

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.