Нейросеть DeepMind научилась следовать «человеческому» описанию маршрута

Кристина Уласович

Лаборатория DeepMind научила систему искусственного интеллекта следовать текстовым навигационным инструкциям, сообщает The Next Web. Программисты проверили работу алгоритма, отправив его в путешествие по Нью-Йорку в виртуальной среде, созданной на основе Google Street View.

Современные беспилотные автомобили опираются на систему GPS-навигации, которая встроена в бортовой компьютер. Если же пассажир предложит автомобилю доехать до определенного места с помощью списка инструкций (например, «двигайся прямо два километра и на первом перекрестке поверни направо»), машина не справится с задачей, несмотря на ее простоту. Дело в том, что в отличие от человека, система ИИ не имеет накопленного опыта и не знает, как следовать навигационным инструкциям.

Чтобы решить эту проблему, подразделение Google DeepMind в прошлом году преобразовало карты Google Street View в обучающую среду. С ее помощью исследователи обучили компьютер следовать из точки А в точку B без использования маршрута или других подсказок. Однако стратегия алгоритма была неудобной: он просто долго путешествовал по карте — до тех пор, пока не находил место, которое внешне было идентично пункту назначения. В реальной жизни такой подход будет бесполезен.

В новой работе, опубликованной на arXiv.org, исследователи научили нейросеть следовать текстовым навигационным инструкциям. Программисты дополнили ранее созданную ими обучающую среду, добавив в нее навигационные указания из Google Maps для случайно выбранных начальных и конечных пунктов. Исследователи поместили в StreetNav — так была названа новая среда — агента и дали ему набор команд (например, «поверни направо на перекрестке») и снимков, который должен был помочь ему добраться до нужного места. Если компьютер достигал цели или делал верные шаги, он получал награду — такой метод тренировки называется обучением с подкреплением.

Во время обучения и контрольного тестирования агент путешествовал по разным частям Манхэттена. Проверка показала, что алгоритм неплохо справляется с навигацией по инструкциям: его лучший результат составил 72,7 процента. Однако когда программисты проверили способности искусственного интеллекта, отправив его в путешествие по незнакомой среде, он смог достичь успеха лишь в 46,6 процента случаев.

Сами исследователи отмечают, что созданная ими программа требует серьезной доработки. Тем не менее, созданная DeepMind модель может лечь в основу других, более продвинутых навигационных алгоритмов и позволить сделать беспилотные автомобили более адаптированными к реальной жизни.

В прошлом лаборатория Google DeepMind разработала новый подход к обучению алгоритмов искусственного интеллекта, который позволяет сделать процесс в десять раз эффективнее. Кроме того, DeepMind также выпустила набор новых игровых уровней для виртуальной среды DeepMind Lab.

Кристина Уласович