Следование выигрышной стратегии оказалось необязательным при принятии решений

Люди правильно определяют стратегию принятия успешного решения даже в случае, когда задание этого не предполагает, а исход является исключительно вероятностным, но не всегда ей пользуются. Это выяснили американские ученые: они провели эксперимент, в котором участникам необходимо было выбрать выигрышную опцию, опираясь на определенный паттерн, либо на неизвестную им вероятность исхода. И в том, и в другом случае участники могли выучить успешную комбинацию, основывая свою стратегию на изменениях среды, но при вероятностном событии все равно ей не пользовались, так как это не обеспечивало больший выигрыш и было, по сути, бесполезно, пишут ученые в Nature Communications

Любые решения, которые человек принимает в определенной среде, обусловлены двумя факторами. Первый тип факторов называется нисходящими (top-down) — в них входит вся известная заранее информация, а второй — восходящими (bottom-up), и он определяется дополнительными данными, которые могут повлиять на принятие решения в моменте. По сути, принятие решений подразумевает противостояние этих факторов: можно ориентироваться на уже известную информацию, которая обеспечит исход с определенной вероятностью, а можно эту вероятность предсказать с учетом новых данных.

Не всегда понятно, какой из вариантов лучше. С одной стороны, игнорировать новую информацию в среде в действительности может быть неэффективно, но с другой — уже известный и много раз пройденный путь к решению может оказаться единственно верным. Изучить принятие решение в такой ситуации подробнее решили Аркадий Коновалов (Arkady Konovalov) и Ян Крайбих (Ian Krajbich) из Университета штата Огайо. Для этого они использовали экспериментальную парадигму, в которой показателем решения участника и его уверенности в нем служит передвижение и положение компьютерной мыши.

Участникам (всего их было 57) на экране показывали изображение двух фракталов, из которых надо было выбрать один. После этого с разной вероятностью появлялось другое изображение, но не сразу: для этого необходимо было переместить курсор в нижнюю часть экрана, а затем — нажать мышкой на появившееся изображение. После этого появлялась сумма выигрыша (она определяла финальное денежное вознаграждение, которое получат участники). Вероятность появления того или иного фрактала была определена заранее, но для участников была неизвестной и случайной, поэтому никакого паттерна, который можно было бы выучить для того, чтобы получить максимальное вознаграждение, не было. 

Чтобы убедиться, что в таком задании участники не руководствуются тем, как меняется вероятность появления того или иного события, а принимают решение, опираясь исключительно на нисходящую информацию, ученые смоделировали поведение агента в схожей среде. Симуляция показала, что в случае, когда какая-либо адаптивная модель поведения отсутствует, агент склонен выбирать тот же вариант, что и в предыдущий раз, если сумма выигрыша растет — независимо от того, с какой вероятностью этот вариант появляется. 

С другой стороны, если адаптивная модель поведения есть (то есть паттерн удалось выучить), агент выбирает тот же вариант только тогда, когда вероятность появления того или другого варианта высокая. Ответы участников в среднем соответствовали первой модели — и ученые сделали вывод, что при выполнении поставленной задачи они не используют никаких восходящих сигналов и не адаптируют процесс принятия решений под изменения среды.

После этого ученые изменили задание. В новом условии выигрышный фрактал в нижней части экрана определялся тем, какой верхний фрактал участники выбирали в трех предыдущих условиях: например, если в три предыдущих раза участник менял свой выбор, то в следующий раз выигрышной стратегией было его уже не менять. Другими словами, вероятность появления того или иного варианта была неслучайной, и участники могли выучить паттерн, а затем успешно им пользоваться. 

Чтобы сравнить стратегии участников в двух заданиях, ученые воспользовались стандартной моделью, которая показывает влияние выученной в процессе принятия решения стратегии на исход события. Показатель этой модели выражается в весе w — коэффициенте от 0 до 1: чем ближе w к нулю, тем более случайный и не зависящий от какой-либо стратегии выбор делают участники.

Коэффициент w в первом условии в среднем равнялся 0,24, а во втором задании — 0,41. Разница была статистически значимой (p < 0,001), что указывает на то, что во втором условии участники в действительности смогли выучить паттерн успешного принятия решения и следовали ему. При этом коэффициент w также коррелировал с тем, какое вознаграждение получали участники, но только во втором условии (p < 0,001): это означает, что ориентирование на стратегию в первом условии не приводило к большему успеху.

Далее ученые проанализировали положение курсора участников. Для этого экран разделили посередине горизонтальной и вертикальной полосами и отслеживали, как перемещался курсор из квадрата сверху к квадрату снизу. К примеру, если участники выбирали фрактал в правом верхнем углу, а затем перемещали курсор вниз ближе к левому нижнему углу, то они ожидали увидеть его именно там, чтобы быстрее нажать. Такие перемещения отражали то, выучили ли участники стратегию даже в том случае, если в итоге они ей не следовали.

И в том, и в другом условии положение мыши участников в действительности значимо (p < 0,001) коррелировало с тем, в каком месте появится выигрышный фрактал снизу — это означает, что и при заранее неизвестной вероятности, и при наличии паттерна, который можно было выучить, участники понимали, какой выбор для них будет выигрышным. 

При этом в первом условии, вероятностном, участники, как показало сравнение с моделированием, все равно предпочитали не пользоваться какой-либо стратегией: принятие решений в таком случае было чаще свободным, ориентированном на нисходящие факторы. Это, по мнению ученых, объясняется оценкой издержек: так как анализ показывает, что адаптированная стратегия при вероятностном исходе события не приводит к большему выигрышу, следовать ей оказывается невыгодным. 

Авторы заключили, что при принятии вероятностных решений люди в действительности могут выделить для себя наиболее эффективный паттерн — они понимают, что исход события определяется какой-то заранее установленной вероятностью и даже, по-видимому, могут ее примерно подсчитать. При этом следование такой вероятностной стратегии не всегда нужно — например, если издержки подсчета и следования вероятности превышают выигрыш — поэтому и не всегда используется.

Принятие вероятностых решений — довольно популярная тема в психологических исследованиях, в частности — в работах, посвященных участию в этом процессе головного мозга. Недавно, например, ученые выяснили, что принятие решений регулирует в том числе и таламус — посредник между органами чувств и корой больших полушарий. 

Елизавета Ивтушок

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
В волосах жителей Менорки бронзового века нашли психостимуляторы и галлюциногены

Почти 3000 лет назад на западе Средиземноморья употребляли эфедру и мандрагору