Психологи и специалисты по робототехнике из Вашингтонского университета разработали метод обучения роботов взаимодействию с окружающим миром через демонстрируемый пример. При этом робот не слепо повторяет увиденное физическое действие, а пытается достичь того же результата, что и человек, но с помощью более удобных для себя движений. По словам исследователей, подобным образом учатся взаимодействовать с окружающим миром дети. Статья опубликована в PLOS ONE, кратко суть работы описана на сайте университета.
Исследователи разработали алгоритм, при помощи которого робот пытается предугадать результат, которого добивается человек, показывающий какие-либо манипуляции с предметами. После этого при помощи методов машинного обучения робот пытается понять, как наилучшим образом добиться того же результата, однако не путем повторения всех движений, а с поправкой на свои физические возможности.
Для проверки системы авторы провели несколько экспериментов как с компьютерным симулятором, так и с реальным роботом. В эксперименте с симулятором, например, система смотрела на человека и училась «вращать» модель головы таким образом, чтобы смотреть туда же, куда и человек.
Для того, чтобы проверить умение проецировать свой опыт на окружающих, модели робота «показали», что при повязке на глазах ничего не видно — один из исследователей, профессор Эндрю Мельтзоф, ранее проводил подобный эксперимент на младенцах. Оказалось, что модель робота, которая «понимала», что в повязке ничего не видно, переставала пытаться смотреть в том же направлении, что и человек. Исследователи отмечают, что подобное умение проецировать опыт на окружающих ранее наблюдалось и у младенцев.
В эксперименте с реальным роботом ему сначала продемонстрировали человека, перемещающего различные предметы по столу, а затем предложили выполнить аналогичные операции самостоятельно. Выяснилось, что в некоторых случаях робот не повторял человеческие движения для того, чтобы сдвинуть предмет по столу, не поднимая его, а пользовался манипулятором, чтобы поднять объект, перенести в другую область и там положить.
Авторы отмечают, что возможность обучать роботов на собственном примере важна для будущего взаимодействия с роботами людей, которые не обладают навыками программирования. Также ученые отмечают, что, по сравнению с методом наглядного обучения (когда человек непосредственно управляет манипулятором, а робот записывает показания сервомоторов), их технология позволяет роботу найти, возможно, более эффективный путь решения задачи с учетом собственных возможностей.
Ранее исследователи из университета Карнеги — Меллона при помощи нейронных сетей организовали промышленному роботу Baxter самостоятельное обучение по захватыванию манипулятором различных объектов. За 700 часов непрерывных попыток захватить и поднять предметы различной формы робот научился предсказывать удачное для захвата место даже на незнакомых предметах с точностью до 80 процентов.