Искусственный интеллект научился играть в покер лучше людей
В американском городе Питтсбурге завершился турнир по покеру между живыми игроками и компьютерной программой Libratus, разработанной в Университете Карнеги — Меллона. Турнир длился 20 дней, и в результате искусственный интеллект победил: Libratus выиграл 1,7 миллиона условных долларов, далеко опередив остальных игроков (в действительности, игра шла на условные фишки, а призовой фонд турнира, 200 тысяч настоящих долларов США, живые игроки поделят между собой). Издание The Conversation опубликовало статью профессора Тоби Уэлша, специалиста в области искусственного интеллекта, под названием: «Научись вовремя сбрасывать: ИИ обыграл в покер ведущих игроков мира». В ней автор рассказывает о победах компьютеров над людьми не только в играх, но и в других сферах, и рассуждает, к чему все это может привести. Предлагаем вам полный перевод этой статьи на русский язык.
Если вы планировали сыграть партию-другую в интернет-покер, то теперь, возможно, передумаете. Человечество только что потерпело поражение в еще одной игре, на этот раз в покере — речь идет про техасский холдем с нелимитированными ставками один на один. Это ключевой момент в истории развития искусственного интеллекта (ИИ).
Первой игрой, в которой люди уступили машине, были нарды. В 1979 году мирового чемпиона по игре в нарды победила компьютерная программа BKG 9.8, разработанная Хансом Берлинером.
В 1997 году Гари Каспаров, на то время действующий чемпион мира по шахматам, проиграл программе Deep Blue компании IBM. По словам Каспарова, он «почуял», что по ту сторону стола от него находится новая форма интеллекта.
С тех пор перед ИИ пали и другие игры: шашки, «Отелло», «Эрудит», американское интеллектуальное игровое шоу Jeopardy!, даже классическая игра-аркада Pong.
Совсем недавно жертвой машин стала древняя китайская игра го. В марте прошлого года один из лучших игроков в го на планете, Ли Седоль, был повержен со счетом 4:1 программой AlphaGo, созданной программистами Google.
И, чтобы совсем доконать нас, сразу после Рождества AlphaGo анонимно, по интернету, сыграла с десятками ведущих игроков в го по всему миру и утвердила свое превосходство.
Го называли Эверестом настольных игр. Выиграть в эту игру куда сложнее, чем в шахматы или во что-то еще. И тем не менее, для ИИ это менее сложная задача, чем победа в покер.
Подобно миру вокруг нас, покер — это царство неопределенности. Игроки не знают, какие карты на руках у их противников, а какие им еще сдадут из колоды. Для сравнения, в играх типа шахмат или го оба игрока одинаково хорошо видят доску, у обоих есть полная информация. С точки зрения компьютерной программы, шахматы и го гораздо легче покера.
Покер также требует понимания психологии других игроков. Вдруг они блефуют? Должны ли вы сбросить карты? Или надо блефовать в ответ?
Наконец, покер связан со ставками. Когда надо делать ставку? Сколько ставить? Эти вопросы ставит перед программистом, пишущим компьютерную программу, которая должна играть в покер так же, как люди, или лучше людей, дополнительные сложности.
На протяжении последних трех недель четверо высокорейтинговых игроков в покер провели изматывающий матч, состоявший из 120 тысяч раздач, в помещении казино Rivers в Питтсбурге, США.
Им противостояла программа Libratus, созданная в Университете Карнеги — Меллон. Ее написали мой коллега профессор Туомас Сандхолм и его защитившийся аспирант Ноам Браун.
Победа Libratus предрешена и будет достигнута уже сегодня (статья была написана 30 января, в своем прогнозе Тоби Уэлш не ошибся), программа опережает игроков-людей больше чем на миллион условных долларов. Проигравшие смогут утешиться, разделив между собой настоящие 200 тысяч долларов — призовой фонд турнира.
Чтобы снизить влияние случая на результат, на турнире была организована двойная сдача. Это значит, что сразу две идентично перетасованные колоды карт использовались одновременно за двумя игровыми столами. За одним столом карты сдавал человек, назовем его игроком А, а ИИ был игроком Б. За другим столом, расположенным в другой комнате, в то же самое время игроком А выступал ИИ, а игроком Б был человек.
В результате если бы один из игроков получил необычайно удачную комбинацию карт, то и другой игрок в параллельной игре получил бы такую же комбинацию.
И этим же объясняется, почему потребовалось сыграть так много раздач. По итогам матча мы можем со статистической уверенностью сказать, что Libratus играет в покер лучше людей.
Детали рецепта победы ИИ пока держатся в секрете. Но можно сделать ряд обоснованных предположений на основании предыдущих работ команды программистов из Университета Карнеги — Меллон.
Пожалуй, любопытнее всего тут то, что победа в наибольшей степени зависела от старого доброго традиционного ИИ, чем от модных сегодня нейронных сетей с глубоким обучением.
Подобно Deep Blue, чемпиону по шахматам от IBM, Libratus использовал множество вычислений прямым перебором, чтобы понять, какой ход окажется лучшим. Нам известно, что в конце каждой раздачи он обращался в Питтсбургский суперкомпьютерный центр.
И каждую ночь Libratus использовал этот же суперкомпьютер, чтобы улучшить свою стратегию. Если вы полагаете, что это было нечестно по отношению к людям, то имейте в виду, что противники тоже собирались на ежевечерние совещания, чтобы проанализировать свои результаты и составить план на следующий день.
Libratus также активно использовал теорию игр — отрасль математики, ставшую знаменитой благодаря фильму «Игры разума» о Джоне Нэше. Libratus искал возможность делать стратегические ходы, так чтобы оппоненты, что бы они ни делали, не смогли сделать ходы лучше.
Покер пока еще не сдался перед ИИ. Libratus пока умеет играть лишь в техасский холдем с нелимитированными ставками один на один. При добавлении в игру других игроков ее сложность значительно возрастет. Значит, у нас есть еще несколько лет до того, как компьютер научится побеждать в компании четырех или большего числа игроков.
Но это еще один пример того, как в разных узконаправленных областях ИИ начинает показывать лучшие, по сравнению с людьми, результаты: анализ маммографии, распознавание речи на китайском языке, учебные схватки в ближнем воздушном бою с пилотами-людьми... список пополняется едва ли не каждую неделю.
Не удивительно, что многих людей интересует: чем все это закончится? Отберут ли компьютеры у нас в конце концов все рабочие места?
Широко известное исследование ученых из Оксфордского университета еще в 2013 году установило, что в течение двух последующих десятилетий 47 процентов рабочих мест в США окажутся под угрозой со стороны автоматизированных систем и ИИ.
У этого исследования было несколько недостатков. Особая ирония заключалась в том, что его авторы автоматизировали задачу по предсказанию, какие профессии окажутся в зоне риска. В исследовании использовалось машинное обучение на небольшой выборке из 70 отобранных вручную вакансий, чтобы предсказать, какая доля из 700 различных профессий окажется под угрозой.
Именно здесь вы тоже можете помочь. Я призываю к мудрости масс и хочу выяснить, сможем ли мы сделать более точное предсказание. Найдите, пожалуйста, несколько минут, чтобы пройти наш опрос. Чтобы вознаградить вас за потраченные время и усилия, я готов по вашему указанию перечислить на выбранные вами благотворительные цели небольшое пожертвование.
Но пусть мы пока и не получили результатов нашего опроса, уже сейчас ясно, что такие профессии, как водитель такси, водитель грузового транспорта, рентгенолог и профессиональный игрок в покер, оказались под угрозой. Несомненно, технологии вскоре создадут новые рабочие места. Но будет ли их достаточно по сравнению с теми, которые закроются, — вот в чем вопрос.
Чтобы окончательно не проиграть роботам, людям придется сделать ставку на свои врожденные преимущества, такие как креативность и эмоциональный интеллект. Нам также надо думать о том, как расширять возможности человека, а не заменять его машиной. В совместном сотрудничестве люди и машины могут достичь большего, чем люди и машины по отдельности. Лучший игрок в шахматы сегодня — это человек, вооруженный компьютером.
Вместе мы способны стать сверхлюдьми.
Перевел с английского Дмитрий Иванов