Американские ученые выяснили, что примерно 70 процентов эмоциональных реакций на определенные ситуации можно назвать универсальными для всех жителей планеты. Для этого они с помощью алгоритмов компьютерного зрения проанализировали шесть миллионов видео, снятых людьми по всему миру, и соотнесли 16 возможных реакций (от базовых эмоций до более сложных, вроде разочарования) с 653 определенными контекстами. Статья опубликована в журнале Nature.
В самом базовом представлении эмоция — это нейрофизиологическая реакция организма на определенный стимул, которая определяется тремя основными компонентами: субъективным ощущением эмоции, ее физиологическими проявлениями и тем, как она выражается внешне. Все три определяющих эмоции компонента связаны между собой и подвержены сильному влиянию других, внешних или внутренних факторов. Так, на то, какие эмоции испытывает человек, как он их ощущает на уровне тела и как он их проявляет, в разной степени может влиять воспитание и другой личный опыт, общее психическое и физическое состояние, а также культурные особенности.
Последний фактор — культурный — особенно важен в контексте изучения универсальности эмоций. С одной стороны, понятно, что базовые эмоции (в особенности, негативные — страх, отвращение и злость) хорошо знакомы каждому человеку, так как формировались в процессе эволюции и помогали выжить в мире вокруг в целом и в обществе в частности. С другой стороны, эмоции возникают в определенных ситуациях, требующих определенного поведения, которое для представителей разных культур может быть разным: это, в свою очередь, приведет к тому, что внешние проявления универсальных нейрофизиологических реакций все же окажутся культурно обусловленными.
Большинство исследований выражения эмоций у представителей разных культур, однако, проводятся в форме опросов по картинкам, которые редко учитывают контекста проявления эмоций — то есть тех самых ситуаций, из которых и могут следовать культурные различия. Чтобы провести более систематический анализ выражений лиц людей, Алан Коуэн (Alan Cowen) из Калифорнийского университета в Беркли и его коллеги решили использовать автоматическое распознавание изображений — и собрали для анализа шесть миллионов видео из 144 стран.
Для распознавания лиц использовали нейросеть, обученную присваивать изменениям выражения лица одну из 16 категорий, включая как базовые эмоции (радость или грусть), так и более специфичные реакции (разочарование или сомнение). Сами видео разбили на две части: первые три миллиона видео классифицировали по контекстам на основе анализа кадров и и метаданных (названий и описаний), а для классификации второй части использовали только метаданные. Всего для первой части датасета удалось получить 653 контекста, а для второй части — 1953 контекста, то есть информации о том, что происходит на видео (например, свадьба или парад), или о том, кто на видео изображен (например, родители или собаки).
Затем исследователи разбили использованные для анализа страны на 12 регионов и подсчитали корреляцию между ними на основании того, какие именно распознанные нейросетью эмоции можно заметить на видео в зависимости от контекста. По результатам первого эксперимента оказалось, что примерно 70 процентов выражений лиц культурно универсальны в определенных контекстах, что означает, что в одних и тех же ситуациях люди из разных стран реагируют схожим образом в 70 процентах случаев. Результаты второго эксперимента это подтвердили, но похожих реакций оказалось меньше на 40 процентов, что ученые объясняют использованием для описания контекста только метаданных (описание видео могло не соответствовать тому, что на самом деле происходит на видео).
По словам ученых, полученные данные — это еще одно подтверждение культурной универсальности проявления эмоций. Авторы, однако, уточнили, что у исследования есть и свои ограничения, обусловленные выборкой использованных видео: во-первых, видео в интернете не всегда отражают повседневную жизнь людей и привычные для них ежедневные ситуации, а во-вторых, на реакциях людей, запечатленные на видео в интернете, во многом могли сказаться стандарты западной культуры.
Еще один аргумент в пользу универсальности эмоций — особенности цветового восприятия: недавно ученые выяснили, что представители минимум 30 национальностей связывают базовые эмоции с одинаковыми цветами.
Елизавета Ивтушок
Microsoft подтвердила, что уже некоторое время использует алгоритм в Bing
Компания OpenAI представила генеративную языковую модель GPT-4. Новая версия модели получила более высокие результаты в бенчмарках, причем не только на английском языке. Также алгоритм научился принимать не только текст, но и изображения (но генерирует он по-прежнему лишь текстовые ответы). Наконец, GPT-4 лучше определяет опасные и дискриминирующие запросы, например, просьбу написать инструкцию по сборке бомбы. OpenAI открыла ограниченный доступ к GPT-4 подписчикам ChatGPT Plus, а также открыла прием заявок на доступ к API, но в обоих случаях речь идет о версии модели без поддержки изображений. Описание GPT-4 опубликовано на сайте OpenAI, а также доступно в виде научной статьи.