апр. 14, 2017
Китайский ИИ выиграл 290 тысяч долларов у шести профи в покер
By RTR Dennis
Многое было сказано о том, чтобы программы искусственного интеллекта (ИИ) побеждали игроков в покер. И мы можем добавить еще одну историю к этой тенденции, потому что китайский ИИ обыграл шесть профи в покере из 290 000 долларов (230 000 фунтов стерлингов).
Названный Ленгпудаши, ИИ противостоял покерным профессионалам в течение пяти дней. Людей возглавлял Юэ Ду, который в прошлом году выиграл $ 800 586 в турнире WSOP Texas Hold'em с бай-ином $ 5 000. «Team Dragon» Ду состояла из игроков и инженеров, которые использовали свои знания в области покера и искусственного интеллекта, чтобы противостоять Ленгпудаши.
Техасский холдем часто считался сложной игрой для ИИ, потому что, в отличие от шахмат и го, он содержит несовершенную информацию. Однако ИИ значительно продвинулись до такой степени, что могут использовать сложные стратегии ставок и противодействовать блефам оппонентов. И Ленгпудаши продемонстрировал это в полной мере, победив Ду и его команду профи в покере с выигрышем в 290 тысяч долларов.
Третий раз, когда ИИ победили людей
Победа Ленгпудаши, безусловно, примечательна, но даже близко не к самой известной победе ИИ над профи в покере. Ранее в этом году Libratus победил четырех элитных профи в покере - Донга Кима, Даниэля Маколея, Джимми Чоу и Джейсона Леса - на сумму 1 766 250 долларов.
Разработка Libratus, разработанная Университетом Карнеги-Мелон, стала важной вехой в сообществе искусственного интеллекта. В 2015 году искусственный интеллект Карнеги Мелона, Клаудико, потерпел сокрушительное поражение с почти $ 800 000 против Леса, Кима, Бьорна Ли и Дуга Полка. Мало кто ожидал, что последняя версия Libratus вернется и так легко выиграет.
Libratus был разработан группой исследователей из Carnegie Melon во главе с профессором компьютеров Туомасом Сандхольмом и аспирантом Ноамом Брауном.
«Люди думают, что блеф - это очень человечно, - сказал Браун. - Оказывается, это неправда. Компьютер может узнать на собственном опыте, что если у него слабая рука и он блефует, он может заработать больше денег».
Еще одно менее громкое соревнование состоялось между AI Университета Альберты, DeepStack, и группой из 11 покерных профессионалов. Каждого игрока просили сыграть против DeepStack 3000 или более рук в течение четырех недель. В результате DeepStack одержал победу над людьми после 44 000 раздач.
Компьютерный ученый Майкл Боулинг, возглавлявший исследователей Университета Альберты в этом проекте, сказал, что покер уже давно стал проблемой для его профессии. Однако похоже, что сообщество ИИ сделало большой шаг к преодолению этого препятствия.
«Это типичная игра несовершенной информации в том смысле, что игроки не имеют одинаковой информации или разделяют одну точку зрения во время игры», - сказал Боулинг.
Еще одна веха в области искусственного интеллекта
Победы Ленгпудаши, DeepStack и Libratus подтверждают, что ИИ обогнали людей в игре несовершенной информации. И это лишь последняя веха в продолжающемся процессе с 1980-х годов.
Все началось в начале 1980-х, когда разработчики начали попытки победить шахматы. Чтобы победить шахматиста-человека, потребовалось совсем немного времени, но пройдет много времени, прежде чем сообщество ИИ решит шахматы.
Это произошло 11 мая 1997 года, когда компьютер IBM Deep Blue победил чемпиона мира по шахматам Гарри Каспарова в шести партиях. Deep Blue выиграл две партии, Каспаров выиграл 1, и у них было три ничьи.
Позже на веб-сайте IBM было отмечено, что конкуренция «была важной информатикой, которая подтолкнула компьютеры к обработке сложных вычислений, необходимых для открытия новых медицинских препаратов; выполнить широкое финансовое моделирование, необходимое для выявления тенденций и анализа рисков; обрабатывать поиск по большим базам данных; и выполнять масштабные вычисления, необходимые во многих областях науки ».
В конце 2000-х основное внимание было уделено тому, как ИИ могут побеждать в лимитном холдеме. Эта задача была выполнена быстро, потому что в лимитном холдеме фиксированные лимиты ставок, в отличие от безлимитной версии. Теперь, спустя более трех десятилетий после того, как начался путь решения игровых задач, исследователи обыграли еще одну игру в безлимитном холдеме.
Чем ИИ лучше игроков в покер?
По словам Боулинга, бот Университета Альберты использует технику, называемую постоянным повторным решением, чтобы улучшить свою игру в покер и побеждать людей.
«Каждая ситуация сама по себе представляет собой мини-покер», - пояснил он. «Вместо того, чтобы решать одну большую игру в покер, она решает миллионы этих маленьких игр в покер, каждая из которых помогает системе уточнить ее интуитивное представление о том, как работает игра в покер. И эта интуиция лежит в основе того, как DeepStack играет в полную игру ».
Каким бы трудным ни было решение, DeepStack может отреагировать в среднем в течение трех секунд. Это сильно контрастирует с лучшими профессиональными игроками, которые иногда принимают решения в живых играх за несколько минут. Возможность разыграть миллионы «покерных мини-игр» за секунды дает ИИ большое преимущество перед своими собратьями-людьми.
Также помогает то, что усталость никогда не является фактором. Фактически, ИИ может продолжать решать проблемы и совершенствоваться вне конкуренции, тогда как игроку-человеку в конечном итоге нужно отдыхать, или он начинает работать на уровне ниже оптимального.