Исследователи Google при помощи глубинного машинного обучения научили роботов координировать свои движения при захвате предметов. Об этом сообщается в блоге компании, препринт статьи доступен на сайте ArXiv.org.
Специалисты Google обучили роботов зрительно-моторной координации движений при захвате предметов. Для этого они научили сверточную нейронную сеть предсказывать вероятность успешного захвата, основываясь на изображениях камеры независимо от ее калибровки и исходного положения робота.
Для того, чтобы обучить сверточную нейронную сеть, исследователи совершили более 800 тысяч попыток захвата с помощью 14 роботов, что примерно эквивалентно 3 тысячам часов обучения. При этом роботы могли обучаться параллельно, что существенно ускорило процесс.
Сама система состоит из двух компонентов: первый — это «предсказывающая» сверточная нейронная сеть, которая обрабатывает визуальную вводную информацию и команды движений и вычисляет вероятность успешного захвата предметов. Вторая часть представлена функцией управления, которая постоянно контролирует робота и направляет в удобную позицию. Таким образом, робот наблюдает за собственным захватывающим механизмом и корректирует его поведение в соответствии с предсказаниями нейронной сети.
Исследователи оценили успешность такого подхода, сравнив результаты обучаемых роботов с результатами роботов, которые не использовали «обратную связь» для захвата. Они провели два испытания: в обоих экспериментах был установлен лимит в 100 попыток захвата, однако в первом роботы могли возвращать предметы обратно в корзину, что позволяло повторно подбирать более удобные вещи, а во втором — нет.
В итоге, роботы, оснащенные сверточной нейронной сетью, справились с заданием почти в два раза лучше. В первом эксперименте количество неудачных попыток составило 17,5 процентов, в то время у роботов, которые использовали лишь одно изображение, чтобы взять предмет, количество неудач достигло 33,7 процентов. В случае, когда предметы нельзя было вернуть обратно в корзину, разница между количеством неудач составила 23 процента.
Специалисты также заметили интересное поведение захватывающего механизма: например, в некоторых случаях робот сначала отбрасывал мешающие предметы. На видео также видно, как он прицеливается для того, чтобы взять предмет — это, по мнению специалистов, придает движениям робота некоторую «человечность».
Сверточная нейронная сеть — это специальная архитектура искусственных нейронных сетей, нацеленная на эффективное распознавание изображений. Структура этой сети однонаправленная, то есть без обратных связей, и принципиально многослойная.