Алгоритм OpenAI научился собирать кубик Рубика одной рукой

Григорий Копиев

Исследователи из OpenAI создали алгоритм для роборуки, позволяющий ей собирать кубик Рубика, переворачивая и скручивая его пальцами. Сначала алгоритм обучался методом проб и ошибок в виртуальной среде, а затем его перенесли на реальное устройство. Из максимально сложных конфигураций, требующих 26 поворотов, роборука собирает кубик в 20 процентах случаев, а для конфигураций, требующих 15 поворотов, успешность составляет 60 процентов, рассказывают исследователи в блоге OpenAI.

В области роботизированных рукоподобных манипуляторов основное внимание разработчиков сконцентрировано на протезах или телеуправляемых человекоподобных роботах. Сами по себе эти конструкции зачастую уже достаточно ловки и позволяют проводить сложные манипуляции, но алгоритмы управления роборуками пока отстают от электромеханической составляющей. Для улучшения уровня алгоритмов некоторые компании концентрируют внимание на своих прикладных задачах, а исследователи зачастую решают трудноприменимые на практике «детские» задачи. Однако в процессе их решения зачастую рождаются технологии, которые впоследствии можно применить во многих областях.

Программисты из некоммерческой организации OpenAI в 2017 году поставили перед собой в качестве такой задачи сборку кубика Рубика одной роборукой. В 2018 году они показали промежуточный результат своей работы, научив роборуку переворачивать кубик нужной стороной до 50 раз подряд. Теперь исследователи показали, что достигли конечной цели, используя похожие алгоритмы и принципы их обучения.

Поскольку авторы ставили перед собой задачу создать алгоритм для ловких манипуляций с объектами, для расчета ходов в процессе решения они использовали доступную реализацию двухфазного алгоритма Коцембы. Кроме того, они использовали коммерчески доступную роборуку Shadow Dexterous Hand.

Основные алгоритмы можно разбить на две основные части. Первая основана на архитектуре сверточной нейросети и отвечает за визуальное восприятие кубика. Она получает три изображения руки с кубиком с разных ракурсов и рассчитывает на их основе положение кубика, а также углы между его плоскостями. Во втором алгоритме используется архитектура рекуррентной нейросети с долгой краткосрочной памятью (LSTM). Она получает данные от первой и на их основе, а также последовательности сборки, рассчитанной алгоритмом Коцембы, создает последовательность движений для пальцев.

Как и в прошлой работе, исследователи использовали для обучения не множество реальных роборук, а виртуальную среду с их копиями. Это позволило, во-первых, распараллелить процесс обучения и тем самым ускорить его, а, во-вторых, повысить качество алгоритмов, меняя параметры среды. В процессе обучения алгоритмы обучались путем проб и ошибок, и постепенно достигали порогового уровня успешности, после которого среда автоматически меняла параметры, к примеру, размеры и массу кубика. Из-за этого алгоритм был вынужден снова адаптироваться к условиям. Именно это позволило подготовить алгоритмы к переносу на реальную роборуку, без необходимости абсолютно точно симулировать все аспекты взаимодействия кубика и руки.

Недавно OpenAI показала другую примечательную работу в области машинного обучения. Исследователи создали нейросетевых агентов, которые самостоятельно научились играть в прятки. В процессе обучения две стороны несколько раз обнаруживали новые выигрышные стратегии поведения, причем одна из таких стратегий использует особенность виртуальной среды, которую авторы упустили при разработке.

Григорий Копиев

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

11:48 30.06.23 2.7 Роботы и дроны

Квадрокоптер-трансформер c ротор-колесами научился стоять на двух ногах

А также летать, ездить и самостоятельно прокладывать маршрут

Андрей Фокин

Инженеры разработали робота-трансформера под названием Morphobot M4, который может ездить как четырехколесный ровер, летать как квадрокоптер, ходить как четвероногий робот и стоять вертикально, балансируя на двух ногах-колесах. Кроме того он способен комбинировать эти режимы, чтобы преодолевать встречающиеся на пути препятствия. Робот оснащен автономной системой навигации и может самостоятельно прокладывать маршрут, выбирая подходящий режим передвижения. Благодаря таким возможностям Morphobot сможет применяться для широкого спектра задач, оптимально расходуя энергию. Статья опубликована в журнале Nature Communications. Большинство из существующих сегодня типов роботов не универсальны и не могут передвигаться в любых условиях одинаково эффективно. К примеру, мультикоптеры тратят много энергии в полете и поэтому могут находиться в воздухе непродолжительное время, а колесные и ходячие роботы обладают более высокой энергоэффективностью, но ограничены передвижением по относительно ровной поверхности. Инженеры пытаются обойти эти ограничения через создание гибридных конструкций. Например, американские инженеры совместили квадрокоптер с ходячим двуногим роботом, а разработчики из Кореи собрали гибрид коптера с колесным ровером. Большинство подобных проектов объединяет один недостаток: часть конструкции робота, предназначенная для передвижения в одной среде, никак не используется при движении в другой, выступая лишь в качестве пассивного груза. Инженеры под руководством Мортезы Гариба (Morteza Gharib) из Калифорнийского технологического института решили создать гибридного робота, все части конструкции которого принимают участие в разных типах движения. В результате у них получился робот-трансформер Morphobot M4, который представляет собой гибрид квадрокоптера и четырехколесного робота. Его масса около шести килограмм, а многие детали выполнены из углеволокна и с помощью 3D-печати. В режиме колесного ровера длина робота составляет 0,7 метра, а ширина и высота 0,35 метра. Четыре колеса робота диаметром 0,25 метра расположены на концах балок, которые играют роль подвижных конечностей. Они могут отклоняться сервомоторами в двух направлениях продольно и перпендикулярно в сторону от корпуса. Колеса приводятся в движение отдельными электромоторами. При трансформации в квадрокоптер обода выступают в роли защитных бамперов для воздушных винтов, расположенных внутри колес с электромоторами в осях, а четыре конечности робота разворачиваются, направляя плоскости пропеллеров параллельно поверхности земли. Корпус робота в этом режиме поддерживается расположенными снизу посадочными опорами. Суммарная тяга всех четырех винтов составляет около девяти килограмм. Morphobot может комбинировать два основных режима, например, для того чтобы преодолевать препятствия, которые он не может переехать. Для этого роторы в одной части робота разворачиваются в полетный режим, а вторая пара конечностей продолжает опираться на колеса. Таким образом робот может забираться на крутые склоны с наклоном больше 45 градусов, затрачивая меньше энергии, чем при полноценном полете в режиме квадрокоптера. Также используя пару винтов только с одной стороны М4 может принять вертикальное положение, балансируя на двух колесах, напоминая при этом двуногий ходячий робот. В режиме ровера М4 может регулировать высоту корпуса относительно поверхности, выдвигая конечности с колесами вперед и назад. Это может пригодиться для преодоления препятствий с ограничением по высоте. Робот также может ходить как четвероногий, перебирая конечностями с колесами как ногами, это может пригодится для преодоления неровностей на пути. Помимо этого, М4 способен использовать конечности с колесами в роли манипуляторов, ухватывая и удерживая предметы с помощью колесных ободов. В качестве примера разработчики продемонстрировали, как робот удерживает таким образом небольшой шар, балансируя при этом на двух колесах в вертикальном положении. Morphobot может передвигаться автономно, трансформируясь в наиболее подходящий в текущей ситуации режим. Для низкоуровневого управления используются два отдельных микроконтроллера, которые отвечают за движения колес и конечностей в режиме ровера и за полет в режиме коптера. Навигация и планирование маршрута происходят с помощью компьютера Jetson Nano, который использует данные об окружении, поступающие со стереокамеры Intel RealSense. На борту также есть инерционный измерительный модуль, средства беспроводной коммуникации для удаленного управления и батарея емкостью 4000 миллиампер-час. https://www.youtube.com/watch?v=S4eQXXxUnNE По словам разработчиков, такие способности позволят использовать подобных роботов-трансформеров для широкого спектра задач, например, для поиска и спасения людей во время стихийных бедствий, или в качестве робота для исследования космоса. Ранее мы рассказывали о другом дроне-трансформере с необычной конструкцией под названием DRAGON, которого построили японские инженеры. Он состоит из нескольких сегментов, может менять форму прямо в полете, захватывать предметы, огибая их с двух сторон и поворачивать вентили.