Кожа многих человекоподобных роботов во время мимических движений смещается не так, как у людей, что может объяснять их нереалистичность, выяснили ученые из Японии. Они использовали высокоточную инфракрасную систему слежения и показали, что кожа роботов двигается линейно, а не по кривой траектории, а по высоте изгибается и вовсе противоположным образом. Статья опубликована в журнале Frontiers in Robotics and AI.
Начиная с первого употребления слова «робот» в 1920 году писатели и инженеры чаще всего подразумевали под ним человекоподобную машину. Изначально инженеры рассматривали человекоподобность роботов как безусловное благо, помогающее людям относиться к ним с доверием или хотя бы без страха. Однако по мере развития технологий и прототипов инженеры обнаружили эффект зловещей долины, который заключается в том, что повышение реалистичности робота делает его привлекательнее для человека лишь до определенного уровня. Выяснилось, что очень реалистичные, но все же неидеальные роботы вызывают у человека отвращение и страх из-за небольших отличий от привычного облика и поведения людей.
Ученые и инженеры трудятся над решением проблемы зловещей долины, работая в разных направлениях: совершенствуют технологии, особенно искусственные части лица и алгоритмы управления ими или же наоборот ищут способы снизить реалистичность роботов, чтобы увеличить привлекательность в глазах людей. Но в основном усилия разработчиков реалистичных человекоподобных роботов в последние годы были сконцентрированы на улучшении их внешнего вида, то есть качества искусственной кожи, глаз и других органов, а не на том, как они двигаются во время речи и других занятий. Хисаси Исихара (Hisashi Ishihara) и его коллеги из Осакского университета решили внимательнее изучить разницу между движениями частей лица реалистичных роботов и людей, чтобы понять, как именно нужно улучшить мимику будущих роботов.
Они исследовали лицевые движения взрослых людей (трех добровольцев мужского пола) и двух роботов: женщины, у которой за движения лица отвечают 9 актуаторов, и ребенка, оснащенного 16 актуаторами. Исследователи воспользовались системой кодирования лицевых движений (FACS), описывающей 46 движений (называемых двигательными единицами) частей человеческого лица и позволяющей описать с их помощью любое выражение лица. У использованных в работе роботов количество возможных движений из FACS равняется количеству актуаторов: 9 и 16.
Исследователи закрепили на правой половине лица добровольцев и роботов от 103 до 125 инфракрасных маркеров, в зависимости от испытуемого. Инфракрасный маркер — это полусфера диаметром три миллиметра с поверхностью, которая хорошо отражает инфракрасное излучение. В комнате для экспериментов была установлена система камер, позволяющая отслеживать движение каждого маркера в пространстве с точностью менее 0,5 миллиметра. Во время эксперимента роботы и люди сначала показывали нейтральное выражение лица, а затем выполняли все доступные им двигательные единицы.
После съемки испытуемых ученые сначала привели размеры их лиц к одному, а затем интерполировали вектора смещения инфракрасных маркеров в каждый момент времени так, чтобы создать вместо них решетку из точек с периодом в миллиметр и соответствующих векторов смещения. Таким образом, они получили для каждой двигательной единицы карты, на которых видно смещение точек лица во время движения как в плоскости, так и по высоте.
Получив карты смещений, ученые сравнили их для трех основных типов двигательных единиц, описывающих движения в области глаз, лба и рта. На картах видно, что даже при таких локальных движениях на самом деле смещение происходит по всему лицу. Кроме того, при этом происходят не только смещения вдоль поверхности лица, но и изменения высоты кожи в разных областях.
Проанализировав данные, ученые выделили две группы различий в мимических движениях роботов и людей. Во-первых, движения частей лица роботов, особенно в области глаз и лба, в основном линейны и вертикальны, тогда как для людей они имеют более сложные кривые траектории. Кроме того, у людей оказался выше коэффициент структурной сложности движения, учитывающий направления движений вокруг точек с пиковым движением.
Во-вторых, у людей и роботов по-разному меняется высота кожи во время мимических движений: у роботов кожа поднимается по направлению движения, а у людей наоборот опускается. Ученые объясняют это принципами работы мышц и актуаторов роботов подъем кожи со стороны направления движения обусловлен простым переносом объема материала, а у людей кожа наоборот опускается из-за того, что мышцы прикреплены к коже и кости по диагонали, сокращаются в длину и увеличиваются в ширину:
Авторы исследования отмечают, что у него есть важные ограничения: эксперименты проводились над двумя роботами одного разработчика с похожим принципом работы актуаторов, а в качестве людей выступали три мужчины-японца. При использовании более разнообразного состава испытуемых результаты могут отличаться. Тем не менее они считают, что разработчики могут использовать эту методику измерения разницы в движениях их роботов и людей, чтобы делать роботов реалистичнее.
Исследования показывают, что даже не очень реалистичные роботы все равно вызывают у людей психофизиологические реакции, похожие на те, которые происходят при взаимодействии с людьми. В прошлом году финские ученые выяснили, что взгляд робота и человека вызывает у людей одни и те же реакции, в том числе эмоциональное возбуждение и сосредоточение внимания.
Григорий Копиев
Он показал лучшее время на трассе, обойдя соперников на полсекунды
Инженеры разработали автопилот для гоночного дрона, управляющий беспилотником на уровне лучших людей-пилотов. Алгоритм под названием Swift, полученный с помощью метода обучения с подкреплением, способен управлять гоночным квадрокоптером, полагаясь только на данные бортовых сенсоров. В реальных полетах на тестовой трассе для дрон-рейсинга Swift смог превзойти трех профессиональных пилотов-чемпионов, выиграв у них 15 гонок из 25 и пройдя трассу с минимальным временем, которое на полсекунды меньше лучшего результата пилота-человека. Статья опубликована в журнале Nature. При поддержке Angie — первого российского веб-сервера Дрон-рейсинг — вид спорта, в котором мультикоптеры на высокой скорости проходят трассу, состоящую из последовательности ворот, через которые нужно пролететь за минимально возможное время. При этом управление происходит от первого лица, с помощью камеры и видеоочков. Современные дроны обладают очень высокой маневренностью и подвижностью: они могут резко менять направление движения, ускоряться, замедляться и совершать перевороты, а во время гонки они разгоняются до скоростей свыше 100 километров в час и подвержены перегрузкам, превышающим их собственный вес в пять раз. Это делает их пилотирование непростой задачей и требует хорошей подготовки и высокой скорости реакции оператора. Инженеры давно работают над созданием автопилота, который мог бы управлять дроном на уровне профессиональных пилотов. Помимо участия в дрон-рейсинге такая способность может пригодиться и в обычной жизни — мультикоптеры обладают невысокой энергоэффективностью, поэтому способность быстро летать и успешно маневрировать в окружении большого числа препятствий напрямую связана с успешностью выполнения задач. Инженеры под руководством Давида Скарамузза (Davide Scaramuzza) из Цюрихского университета уже имеют опыт разработки эффективных алгоритмов управления для дронов. К примеру, ранее они создали автопилот, способный управлять квадрокоптером на скорости от 3 до 7 метров в секунду в лесу между деревьев, полагаясь только на данные с бортовых сенсоров. В своей новой работе инженеры представили алгоритм под названием Swift. Он способен эффективно управлять гоночным квадрокоптером на уровне профессионального пилота дрон-рейсинга. Swift состоит из двух основных модулей: системы восприятия, которая переводит изображение от бортовой камеры дрона и данные от инерционного измерительного блока IMU в низкоразмерное представление, а также системы управления, которая принимает на вход низкоразмерное представление, созданное системой восприятия, и генерирует управляющие команды для электромоторов дрона. В модуль системы восприятия также входит алгоритм, вычисляющий текущее положение дрона в пространстве на основе данных камеры и инерционно-измерительного блока. Эта информация через фильтр Калмана объединяется с данными об относительном положении гоночных ворот, обнаруженных предварительно обученным нейросетевым детектором объектов в видеопотоке, после чего передается на вход системы управления, которая состоит из двух скрытых слоев, по 128 нейронов в каждом. Система управления тренировалась в симуляции с использованием модельно-свободного глубокого обучения с подкреплением. Этот метод обучения использует метод проб и ошибок, чтобы максимизировать величину параметра вознаграждения. В данном случае вознаграждение было максимальным в случае, если дрон следовал в сторону центра ближайших ворот таким образом, чтобы следующие ворота оставались в поле зрения камеры. Чтобы учесть различия между симуляцией и реальной динамикой полета, в процессе обучения информацию симулятора дополнили данными из реального мира, записанными с помощью системы захвата движений. Оценку автопилота провели на трассе для дрон-рейсинга, состоящей из семи ворот, установленных на квадратной площадке с длиной стороны 30 метров. Длина маршрута через все ворота составляла 75 метров. Алгоритм соревновался с тремя профессиональными пилотами Алексом Вановером (Alex Vanover), Томасом Битматтой (Thomas Bitmatta) и Марвином Шэппером (Marvin Schaepper). Все участники использовали гоночные дроны с одинаковыми характеристиками. Перед испытательными соревнованиями у пилотов была неделя для знакомства с трассой. В соревнованиях каждый из пилотов стартовал одновременно с дроном под управлением автопилота. Победителем становился тот, кто быстрее пролетит через все ворота на трассе в правильном порядке три раза. По результатам Swift смог выиграть у своих соперников в совокупности 15 гонок из 25, а также установил рекорд трассы, пролетев ее быстрее на полсекунды, чем остальные участники. https://www.youtube.com/watch?v=fBiataDpGIo&t=1s Инженеры разрабатывают гоночные автопилоты и для автомобилей. Например, инженеры из подразделения искусственного интеллекта компании Sony создали алгоритм автопилота GT Sophy, который с помощью обучения с подкреплением научился проходить за минимальное время трассы в гоночном автосимуляторе Gran Turismo Sport. В настоящих киберспортивных соревнованиях GT Sophy не только показала лучшее время в одиночных заездах, но и смогла победить команду лучших игроков в совместных гонках, набрав больше всего очков.