Инженеры из Массачусетского технологического института разработали робота, которым можно управлять с помощью голосовых команд, заданных на «повседневном» языке. Помимо этого, робот понимает и запоминает контекст команд и окружающих его объектов. Например, такому роботу можно сказать, что в коробке, которую человек держит в руках, находится еда. После этого его можно будет просто попросить дать еду, а не указывать на конкретную коробку. Разработка была представлена на конференции по искусственному интеллекту IJCAI, ее текстовая версия доступна на сайте конференции, также о ней рассказывает издание MIT News.
Компьютеры и роботы уже умеют выполнять множество сложных задач, и многие из них они делают эффективнее людей. Но, поскольку в повседневной жизни люди чаще всего общаются с помощью абстрактных выражений, компьютерным системам бывает сложно правильно интерпретировать довольно банальные, с точки зрения человека, команды. Например, даже простое выражение «Пойдем в соседнюю комнату» подразумевает, что робот должен понять, где находится комната и он сам, затем пройти в ее сторону, поворачивая и огибая препятствия на своем пути.
Исследователи из MIT создали алгоритм под названием ComText (сокращение от «commands in context»), который может запоминать различные свойства объектов и их связей с людьми или другими объектами. Как отмечают исследователи, в отличие от многих других роботов, он может формировать не только семантическую, но и эпизодическую память.
Инженеры занимались разработкой алгоритма, а в качестве аппаратного обеспечения выбрали популярного среди разработчиков робота Baxter с двумя роборуками и камерами. Они продемонстрировали несколько примеров задач, которые способен выполнять робот. Например, исследователи говорили ему, что коробка и консервная банка, которые лежат на столе — это их перекус. Робот заносил эту информацию в свою базу данных, и в дальнейшем ему уже не обязательно указывать на конкретные объекты — коробку и банку, достаточно сказать ему «Возьми мой перекус».
В дальнейшем исследователи планируют обучить алгоритм пониманию более абстрактных фактов и понятий. К примеру, если на столе лежат печенья и сахар, а команда звучит как «Дай мне еду», алгоритм должен понимать, что сахар не является непосредственно едой, а скорее ее компонентом или добавкой.
Недавно исследователи из Университета Брауна разработали похожую систему. Они создали алгоритм, который может понимать уровень абстракции команд и правильно интерпретировать как подробное поэтапное описание действий, так и высокоабстрактные команды, такие как «Отнеси стул в другую комнату».
Григорий Копиев