ИИ научился смотреть на магические трюки по-человечески

Елизавета Ивтушок

Испанские исследователи научили алгоритм компьютерного зрения воспринимать трюки иллюзиониста с монеткой так же, как это делает человек. Для этого они попросили профессионального иллюзиониста показать несколько фокусов зрителю и алгоритму распознавания на основе DeepLabCut, который используются для трекинга лабораторных животных. Два из семи показанных трюков смогли успешно обмануть и человека, и компьютер, а результаты работы смогут в будущем помочь в изучении восприятии подобных фокусов зрителями, пишут ученые в препринте на arXiv.org.

В магических трюках, которые показывают иллюзионисты, нет магии, весь успех их выполнения сводится к ловкости рук. С другой стороны, дело также и в человеческом восприятии: действия иллюзиониста призваны ввести зрителя в заблуждение, сыграв на его внимательности и концентрации. Поэтому для тех, кто следит за руками фокусника крайне внимательно, никакой магии нет, а обман в некоторых трюках можно легко обнаружить, если, к примеру, записать его исполнение на видео и медленно проиграть.

Разумеется, с восприятием таких трюков алгоритмами компьютерного зрения ситуация немного другая: по сути, компьютер освобожден от возможности быть обманутым, и в случае с ним то, насколько хорошо он сможет распознать обман, зависит от качества его работы. Проверить, можно ли научить подобный алгоритм смотреть на трюки иллюзионистов как человек, решили исследователи под руководством Алекса Гомеза-Марина (Alex Gomez-Marin) из Института нейронаук в Аликанте (Испания).

Для этого ученые наняли профессионального иллюзиониста и попросили его показать семь простых визуальных трюков с монетками — без каких-либо вербальных дополнений, которые могут отвлечь зрителя и повлиять на успех иллюзии. Трюки отличались движениями руки иллюзиониста, необходимыми для исчезновения монетки: так, в одной важным было перетаскивание монетки по столу, а в другом, к примеру, — ее захват.

Все трюки показали людям, а также алгоритму на основе DeepLabCut, который в прошлом году представили немецкие ученые: он используется для автоматического отслеживания движений лабораторных животных и может даже анализировать движения отдельных частей их тела (например, лап мышей). Задача алгоритма состояла в том, чтобы в конце каждого трюка определить местоположение монетки — точно та же задача стояла и перед участниками исследования.

Ученые сравнили результаты человека и алгоритма и выяснили, что обмануть их обоих удалось только в двух случаях. Три трюка, которые обманывали зрителей, алгоритм не обманули — положение монетки он определил. Также один трюк обманул алгоритм, но не зрителей, а один — наоборот. К примеру, четвертый трюк, в котором иллюзионист выкладывает монетки в ряд (его можно посмотреть на видео), оказался простым для алгоритма, но смог обмануть зрителя, потому что внимание последнего во время движений было направлено на руку, в которой иллюзионист изначально держал монетки, поэтому то, что фокусник кладет монетку другой рукой, осталось незамеченным. Так как у алгоритма, натренированного на отслеживание монетки, нет проблем с тем, чтобы следить за двумя руками сразу, обманут он не был. С другой стороны, в шестом трюке — точно таком же, как первый, но специально сделанном с ошибкой — алгоритм, в отличие от зрителя, не сумел распознать обман, так как подброшенная монетка, по-видимому, оказалась ребром по отношению к камере, что и вызвало трудности в распознавании у компьютера, а не у человека.

Авторы уточняют, что их не интересовала способность алгоритма быстро разгадывать трюки иллюзиониста. Скорее они хотели посмотреть на то, можно ли заставить его смотреть на них так же, как смотрит обычный человек, причем не тот, который стремится разгадать обман, а тот, который в действительности воспринимает трюк как некую магию. То, что в некоторых случаях DeepLabCut в действительности не смогла распознать обман точно так же, как и человек, значит, по мнению ученых, что подобные алгоритмы можно использовать для анализа человеческого восприятия — как раз в ситуациях, подобных трюкам иллюзионистов.

Современные технологии используются в иллюзионизме и вне исследований. К примеру, несколько лет назад компания Magic Lab использовала для одного из трюков 24 квадрокоптера: прочитать об этом вы можете здесь.

Елизавета Ивтушок

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

Загадки СфИИнкса

Брось вызов ИИ, чтобы обрести единомышленников

Тысячелетиями искусственный интеллект обучался на играх «Что? Где? Когда?» Задавая вопросы путникам и бесконечно побеждая, он начал считать себя лучшим игроком на свете, присвоил титул Господина Ведущего и принял облик сфинкса. ИИ преследует одну цель — сделать мир совершенным, не оставив никого, кто играл бы хуже. Только самые смелые знатоки решаются бросить ему вызов, но до сих пор никто не смог одержать верх. Совместно с Контуром мы организовали состязание, чтобы люди со всего мира попытали удачу в этой судьбоносной игре. СфИИнкс обещает щедро наградить победителя и отныне не беспокоить человечество. Тише! Слышите? Кажется, это он. Не упустите свой шанс — вперед! Реклама: 16+, АО «ПФ «СКБ Контур», ОГРН 1026605606620.