Математики описали процесс возникновения инновационных концепций с помощью модели случайного блуждания с усилением. С помощью предложенной схемы удалось описать появление новых научных идей в астрономии, экономике и математике, пишут ученые в Physical Review Letters.
Возникновение новых идей у человечества в целом и у научного сообщества в частности — процесс, который лежит в основе современного технического прогресса, экономического и социального развития. Чтобы точно описывать и предсказывать вероятность появления инновационных концепций в той или иной сфере, ученые обычно используют эмпирические законы, которые определяют количество новых элементов, появляющихся в той или иной последовательности с течением времени (как, например, закон Хипса в лингвистике, который связывает число уникальных слов в тексте с его длиной) или относительно простые статистические модели (такие как урновая схема Пойа).
Группа математиков под руководством Вито Латора (Vito Latora) из Лондонского университета королевы Марии предложила использовать для описания процесса появления инновационных идей модель случайного блуждания с усилением. Каждый узел модельной сетки, по которой происходит блуждание, обозначает ту или иную идею, а соединение двух узлов — существование между идеями прямой взаимосвязи. Когнитивный процесс в рамках модели представляет собой переход по ребру сетки из одного узла в другой. Появление инновационной идеи определяется как переход на узел, который до этого ни разу не был занят.
Единственным параметром, который в рамках модели можно было варьировать — коэффициент усиления, который повышает вероятность возвращения в узел, который уже был занят до этого, по сравнению с вероятностью перехода в новый узел. При каждом новом переходе по тому или иному ребру сети, «вес» этого ребра увеличивается на определенную величину и повышает таким образом силу связи и вероятность ее использования в дальнейшем.
Построенную модель авторы работы сначала проверили на небольших искусственных сетках, состоящих из нескольких сотен узлов и образующих графы типа «Мир тесен», в которых две случайные вершины оказываются смежными с очень большой вероятностью. Оказалось, что случайное блуждание по таким сетям в течение нескольких тысяч шагов воспроизводит закон Хипса и описывается экспоненциальным ростом с показателем степени от 0,1 до 0,6 в зависимости от размера системы.
Чтобы показать, что предложенная модель также описывает развитие научного знания, авторы работы попробовали описать с помощью нее появление новых концепций в различных научных областях. Для этого математики проанализировали научные статьи по математике, астрономии, экономике и экологии, опубликованные с 1991 по 2010 год. Новизна предложенных в статьях идей оценивалась исходя из текстового анализа аннотаций по наличию в них тех или иных словосочетаний.
Для всех полученных сетей авторы оценили количество узлов, среднюю степень узла (то есть количество ребер, которой приходит в один узел), степень кластеризации и среднюю характерную длину, необходимую, чтобы из одного узла сети перейти в другой. Оказалось, что для всех научных областей характерна высокая степень кластеризации и маленькие средние длины связи двух узлов (от 2 до 4). При этом степени узлов в этих сетях довольно большие и сильно варьируются в зависимости от области: если статьи по астрономии в среднем имеют непосредственную связь со 172 другими статьями, то для математических статей таких связей только 19.
Оказалось, что если описать блуждание по такой сети с течением времени (рассматривая время по дате публикации статьи) с помощью предложенной авторами модели, то можно с достаточно хорошей точностью описать динамику появления новых научных идей. Например самый быстрый рост количества новых концепций из четырех выбранных областей за исследованный промежуток времени оказался характерен для экономики, а самый медленный — для астрономии.
Авторы работы утверждают, что предложенная ими схема может применяться не только для описания научных инноваций, но также для эволюционных процессов в биологии, развития технологий и появления новых направлений в искусстве. Также, по словам ученых, модель может быть расширена при рассмотрении нескольких одновременных блужданий по одной и той же сети.
Отметим, что год назад для описания появления инновационных идей была представлена другая статистическая модель, которая была основана на использовании урновой схемы Пойа и также успешно воспроизводила эмпирические законы Хипса и Ципфа.
Александр Дубов
Обладатели среднего уровня физической активности стали главными двигателями ЗОЖ в массы
В исследовании, опубликованном в журнале PLoS One, американские психологи и математики показывают, как зависит заразительность массового спорта от изменения активности средне- и высокоактивных людей. Применение модели Кермака-Маккендрика показало, что самое важное звено распространения моды на ЗОЖ — люди со средним уровнем физической активности. Если не давать им прекращать заниматься спортом и повысить их социальную связь с неактивными людьми, то можно улучшить физическое здоровье общества в целом. В последние полвека было много исследований, показывающих, сколько и как надо человеку двигаться, чтобы защитить себя от болезней обмена веществ, сердца, сосудов и головного мозга. В целом, согласно этим исследованиям, перед большинством людей стоит более чем реальная цель в несколько десятков минут занятий в день. Тем не менее, лишь от четверти до половины взрослых людей в развитых странах в состоянии регулярно эту цель выполнять. Правительства и неправительственные организации пытаются стимулировать физическую активность людей, и эту социальную политику можно организовать по разному. Наряду с влиянием социальной рекламы и программ, важен пример, который показывают родственники, близкие знакомые и коллеги друг другу. Формирование и распространение новые социальных паттернов иногда подчиняется тем же законам, что и распространение инфекционных заболеваний в условиях эпидемии. Для прогнозирования эпидемий существует система дифференциальных уравнений Кермака-Маккендрика. В базовом варианте этой модели вся популяция состоит из трех частей: восприимчивые к инфекции (не болевшие), инфицированные и выздоровевшие (об этой SIR-модели мы рассказывали в материале «Зараза, гостья наша»). Математики и психологи из нескольких университетов США под руководством Дайаны Томас (Diana M.Thomas) из Военной академии США в Вест-Пойнте приложили законы развития эпидемий к повышению физической тренированности и попытались смоделировать заразительность здорового образа жизни. В случае эпидемий можно вычислить базовое репродуктивное число и сказать, сколько человек в среднем заразит один носитель. Заразительность идей и привычек (в том числе привычки к здоровому образу жизни) зависит от авторитета «апологета» идеи в глазах «внушаемого», но авторитет крайне сложно измерить. Чтобы обойти проблему, авторы исследования воспользовались данными замкнутого коллектива с выстроенной иерархией — армии. Они проанализировали результаты 372 курсантов Военной академии США в беге в условиях массового старта. Анализ результатов показал, что худшие результаты по подразделениям были довольно кучными — наихудшие бегуны добегали дистанцию вместе и не были мотивированы на улучшение своего результата. Таким образом, заключили доктор Томас с коллегами, есть социальное влияние, ухудшающее результаты испытуемых со средним уровнем активности. Авторы разработали модель на базе SIR, описывающую влияние физической активности людей в обществе друг на друга. Как и в исходной эпидемиологической модели, из людей сформировали три группы: малоактивные, среднеактивные и высокоактивные. В сценарии, когда нет социального влияния одних групп на другие, а все переходы между группами случайны, базовое репродуктивное число равно нулю. Следовательно, по логике авторов, сценарий, когда на физическую активность влияют только факторы объективной необходимости (например, поменялись условия работы, врач предписал физические упражнения или человек получил травму и не смог двигаться) не позволят поднять уровень физической активности населения. Во втором сценарии, когда мало- и высокоактивные люди не влияют социально друг на друга, а люди из средней группы не могут переходить в малоактивную группу, возможно два исхода. В зависимости от коэффициентов, количество людей, не занимающихся физическими упражнениями, может как расти, так и падать. Потом авторы изменили условия и «запретили» людям из высокоактивной группы становиться неактивными, но разрешили переходить туда людям из среднеактивной группы. (Авторы руководствовались логикой, что адепт ЗОЖ при получении травмы не прекратит заниматься спортом, а скорее поменяет активность, лишь немного ее снизив, а человек, не имеющий такого энтузиазма, после получения травмы может бросить занятия.) В результате заразительность идеи стала зависеть от числа неактивных людей в группе. Изменение коэффициентов, описывающих усиление социального взаимодействия между группами, дало снижение группы неактивных людей примерно на 20 процентов, а потеря активности людьми из средней группы — увеличивают ее почти на треть. В целом, наиболее сильно повлияли факторы социальных связей и предотвращение перехода среднеактивных к неактивному образу жизни. Его аналог исследователи увидели в группе военных, прибегавших последними в тесте: у них было недостаточно мотивации, чтобы следовать за более быстрыми курсантами, и они переходили в группу малоактивных. На основе составленных уравнений авторы разработали приложение, которое позволит оценить результаты социальных программ, меняя отдельные параметры, на которые нацелена та или иная программа. Моделирование социальных процессов позволяет предсказать динамику стоимости акций на бирже и выявлять закономерности в развитии коррупции в системе государственного управления.