Искусственный интеллект научился играть в покер лучше людей
В американском городе Питтсбурге завершился турнир по покеру между живыми игроками и компьютерной программой Libratus, разработанной в Университете Карнеги — Меллона. Турнир длился 20 дней, и в результате искусственный интеллект победил: Libratus выиграл 1,7 миллиона условных долларов, далеко опередив остальных игроков (в действительности, игра шла на условные фишки, а призовой фонд турнира, 200 тысяч настоящих долларов США, живые игроки поделят между собой). Издание The Conversation опубликовало статью профессора Тоби Уэлша, специалиста в области искусственного интеллекта, под названием: «Научись вовремя сбрасывать: ИИ обыграл в покер ведущих игроков мира». В ней автор рассказывает о победах компьютеров над людьми не только в играх, но и в других сферах, и рассуждает, к чему все это может привести. Предлагаем вам полный перевод этой статьи на русский язык.
Если вы планировали сыграть партию-другую в интернет-покер, то теперь, возможно, передумаете. Человечество только что потерпело поражение в еще одной игре, на этот раз в покере — речь идет про техасский холдем с нелимитированными ставками один на один. Это ключевой момент в истории развития искусственного интеллекта (ИИ).
Первой игрой, в которой люди уступили машине, были нарды. В 1979 году мирового чемпиона по игре в нарды победила компьютерная программа BKG 9.8, разработанная Хансом Берлинером.
В 1997 году Гари Каспаров, на то время действующий чемпион мира по шахматам, проиграл программе Deep Blue компании IBM. По словам Каспарова, он «почуял», что по ту сторону стола от него находится новая форма интеллекта.
С тех пор перед ИИ пали и другие игры: шашки, «Отелло», «Эрудит», американское интеллектуальное игровое шоу Jeopardy!, даже классическая игра-аркада Pong.
Совсем недавно жертвой машин стала древняя китайская игра го. В марте прошлого года один из лучших игроков в го на планете, Ли Седоль, был повержен со счетом 4:1 программой AlphaGo, созданной программистами Google.
И, чтобы совсем доконать нас, сразу после Рождества AlphaGo анонимно, по интернету, сыграла с десятками ведущих игроков в го по всему миру и утвердила свое превосходство.
Го называли Эверестом настольных игр. Выиграть в эту игру куда сложнее, чем в шахматы или во что-то еще. И тем не менее, для ИИ это менее сложная задача, чем победа в покер.
Подобно миру вокруг нас, покер — это царство неопределенности. Игроки не знают, какие карты на руках у их противников, а какие им еще сдадут из колоды. Для сравнения, в играх типа шахмат или го оба игрока одинаково хорошо видят доску, у обоих есть полная информация. С точки зрения компьютерной программы, шахматы и го гораздо легче покера.
Покер также требует понимания психологии других игроков. Вдруг они блефуют? Должны ли вы сбросить карты? Или надо блефовать в ответ?
Наконец, покер связан со ставками. Когда надо делать ставку? Сколько ставить? Эти вопросы ставит перед программистом, пишущим компьютерную программу, которая должна играть в покер так же, как люди, или лучше людей, дополнительные сложности.
На протяжении последних трех недель четверо высокорейтинговых игроков в покер провели изматывающий матч, состоявший из 120 тысяч раздач, в помещении казино Rivers в Питтсбурге, США.
Им противостояла программа Libratus, созданная в Университете Карнеги — Меллон. Ее написали мой коллега профессор Туомас Сандхолм и его защитившийся аспирант Ноам Браун.
Победа Libratus предрешена и будет достигнута уже сегодня (статья была написана 30 января, в своем прогнозе Тоби Уэлш не ошибся), программа опережает игроков-людей больше чем на миллион условных долларов. Проигравшие смогут утешиться, разделив между собой настоящие 200 тысяч долларов — призовой фонд турнира.
Чтобы снизить влияние случая на результат, на турнире была организована двойная сдача. Это значит, что сразу две идентично перетасованные колоды карт использовались одновременно за двумя игровыми столами. За одним столом карты сдавал человек, назовем его игроком А, а ИИ был игроком Б. За другим столом, расположенным в другой комнате, в то же самое время игроком А выступал ИИ, а игроком Б был человек.
В результате если бы один из игроков получил необычайно удачную комбинацию карт, то и другой игрок в параллельной игре получил бы такую же комбинацию.
И этим же объясняется, почему потребовалось сыграть так много раздач. По итогам матча мы можем со статистической уверенностью сказать, что Libratus играет в покер лучше людей.
Детали рецепта победы ИИ пока держатся в секрете. Но можно сделать ряд обоснованных предположений на основании предыдущих работ команды программистов из Университета Карнеги — Меллон.
Пожалуй, любопытнее всего тут то, что победа в наибольшей степени зависела от старого доброго традиционного ИИ, чем от модных сегодня нейронных сетей с глубоким обучением.
Подобно Deep Blue, чемпиону по шахматам от IBM, Libratus использовал множество вычислений прямым перебором, чтобы понять, какой ход окажется лучшим. Нам известно, что в конце каждой раздачи он обращался в Питтсбургский суперкомпьютерный центр.
И каждую ночь Libratus использовал этот же суперкомпьютер, чтобы улучшить свою стратегию. Если вы полагаете, что это было нечестно по отношению к людям, то имейте в виду, что противники тоже собирались на ежевечерние совещания, чтобы проанализировать свои результаты и составить план на следующий день.
Libratus также активно использовал теорию игр — отрасль математики, ставшую знаменитой благодаря фильму «Игры разума» о Джоне Нэше. Libratus искал возможность делать стратегические ходы, так чтобы оппоненты, что бы они ни делали, не смогли сделать ходы лучше.
Покер пока еще не сдался перед ИИ. Libratus пока умеет играть лишь в техасский холдем с нелимитированными ставками один на один. При добавлении в игру других игроков ее сложность значительно возрастет. Значит, у нас есть еще несколько лет до того, как компьютер научится побеждать в компании четырех или большего числа игроков.
Но это еще один пример того, как в разных узконаправленных областях ИИ начинает показывать лучшие, по сравнению с людьми, результаты: анализ маммографии, распознавание речи на китайском языке, учебные схватки в ближнем воздушном бою с пилотами-людьми... список пополняется едва ли не каждую неделю.
Не удивительно, что многих людей интересует: чем все это закончится? Отберут ли компьютеры у нас в конце концов все рабочие места?
Широко известное исследование ученых из Оксфордского университета еще в 2013 году установило, что в течение двух последующих десятилетий 47 процентов рабочих мест в США окажутся под угрозой со стороны автоматизированных систем и ИИ.
У этого исследования было несколько недостатков. Особая ирония заключалась в том, что его авторы автоматизировали задачу по предсказанию, какие профессии окажутся в зоне риска. В исследовании использовалось машинное обучение на небольшой выборке из 70 отобранных вручную вакансий, чтобы предсказать, какая доля из 700 различных профессий окажется под угрозой.
Именно здесь вы тоже можете помочь. Я призываю к мудрости масс и хочу выяснить, сможем ли мы сделать более точное предсказание. Найдите, пожалуйста, несколько минут, чтобы пройти наш опрос. Чтобы вознаградить вас за потраченные время и усилия, я готов по вашему указанию перечислить на выбранные вами благотворительные цели небольшое пожертвование.
Но пусть мы пока и не получили результатов нашего опроса, уже сейчас ясно, что такие профессии, как водитель такси, водитель грузового транспорта, рентгенолог и профессиональный игрок в покер, оказались под угрозой. Несомненно, технологии вскоре создадут новые рабочие места. Но будет ли их достаточно по сравнению с теми, которые закроются, — вот в чем вопрос.
Чтобы окончательно не проиграть роботам, людям придется сделать ставку на свои врожденные преимущества, такие как креативность и эмоциональный интеллект. Нам также надо думать о том, как расширять возможности человека, а не заменять его машиной. В совместном сотрудничестве люди и машины могут достичь большего, чем люди и машины по отдельности. Лучший игрок в шахматы сегодня — это человек, вооруженный компьютером.
Вместе мы способны стать сверхлюдьми.
Перевел с английского Дмитрий Иванов
Гексакоптер оснащен двумя взлетно-посадочными платформами для квадрокоптеров
Инженеры из Сколтеха разработали гибридный гексакоптер MorphoLander, который выступает в роли передвижного аэродрома для дронов меньшего размера. MorphoLander не только летает, но и может ходить по неровной поверхности при помощи четырех ног. В верхней части корпуса расположены две взлетно-посадочные платформы для микродонов. Дрон может пригодиться для инспекции объектов и поиска пострадавших во время стихийных бедствий, говорится в препринте на arXiv.org. При поддержке Angie — первого российского веб-сервера Дроны отлично подходят для выполнения задач поиска, инспекции и мониторинга, но потребляют много энергии и не могут долго находиться в полете. Одним из способов преодолеть это ограничение стала разработка дронов гибридной конструкции, которые могут не только летать, но и передвигаться по земле, например, с помощью колес или ног. Несмотря на то, что такой подход позволяет продлить время работы за счет менее энергозатратного способа передвижения по поверхности, продолжительность полета гибрида и его эффективность часто снижается из-за дополнительного веса. Инженеры под руководством Дмитрия Тетерюкова (Dzmitry Tsetserukou) из Сколтеха предложили использовать громоздкий дрон в качестве носителя для дронов поменьше. Тогда большой дрон выступает в роли передвижного «улья», который в нужный момент выпускает рой маленьких дронов, способных более эффективно выполнить задачу на большой территории за счет совместной работы. Разработанный прототип под названием MorphoLander представляет собой гексакоптер с четырьмя ногами, каждая из которых имеет три степени свободы. С их помощью дрон может передвигаться по неровной поверхности. Масса гибрида немного больше 10 килограмм. Встроенного аккумулятора хватает на 12 минут полета. Сверху на корпусе закреплены две посадочные платформы диаметром 20 сантиметров, на которые могут садиться микродроны. Чтобы микродронам (инженеры использовали Crazyflie 2.1 массой 27 грамм) было проще садиться на MorphoLander, материнский дрон с помощью алгоритма стабилизации старается удерживать горизонтальное положение платформ, подстраивая высоту ног под неровности поверхности. Посадка микродронов происходит под управлением алгоритма машинного обучения, его обучение с подкреплением проходило в симуляторе на платформе игрового движка Unity, который позволяет имитировать физику, с использованием пакета машинного обучения Unity ML Agents. Обученный алгоритм посадки затем испытали в трех сценариях с участием реальных дронов. В первом два микродрона должны были взлетать с расстояния полутора метров от MorphoLander и затем садиться на его платформы. Среднее значение отклонения от центра платформы в этом сценарии составило всего около 5,5 миллиметра. Во втором сценарии микродроны должны были садиться на материнский дрон, стоящий на неровной поверхности. В этом случае ошибка возросла и составила 25 миллиметров. Третий сценарий имитировал реальное применение: микродроны взлетали с платформ, в то время как MorphoLander отходил от места взлета на некоторое расстояние, после чего микродроны должны были сесть обратно. Среднее значение отклонения от центра 20-сантиметровой платформы составило 35 миллиметров. В будущем инженеры планируют увеличить точность и устойчивость алгоритма управления микродронами за счет контроля тяги отдельных винтов. https://www.youtube.com/watch?v=fV8_Ejy81s8&t=1s Совместная работа помогает роботам справляться с более трудными задачами. К примеру японские инженеры разработали систему из работающих в паре дрона и наземного робота. Они соединены друг с другом тросом, что позволяет наземного дрону взбираться на более крутые подъемы. Для этого дрон закрепляет трос на вершине, после чего наземный робот натягивает его с помощью лебедки и поднимается наверх.