• United Kingdom
  • Sweden
  • Ireland
  • Germany
  • Austria
  • China
  • Finland
  • Norway
  • Canada
  • Russia
  • Ukraine
  • Bulgaria
  • Romania
  • Slovenia
  • Hungary
  • Brazil

用Google翻译翻译。您的首选项将被保存,并可随时更改。

4月 14, 2017

Chinese AI赢得$ 290k对抗六名职业扑克玩家

By RTR Dennis

665x200 apr17 lengpudashi1

关于打败扑克玩家的人工智能程序(AI)的很多内容。我们可以为这一趋势再加上一个故事,因为中国的AI在290,000美元(230,000英镑)中击败了六名扑克职业玩家。

AI被称为Lengpudashi,在5天的时间内与扑克职业选手对峙。人类由Yue Du带领,他在去年的$ 5,000 WSOP德州扑克赛事中赢得了$ 800,586。 Du的“ Team Dragon”由玩家和工程师组成,他们利用他们的扑克/人工智能知识来对抗Lengpudashi。

人们通常认为,德州扑克是AI难以击败的游戏,因为与国际象棋和围棋相反,它具有不完美的信息。但是,认可机构已经取得了相当大的进步,可以使用复杂的下注策略并抵消对手的虚张声势。而Lengpudashi则以29万美元的价格击败了Du和他的扑克职业选手团队,充分展示了这一点。

人工智能第三次击败人类

尽管当然值得注意,但Lengpudashi的胜利与最著名的AI击败扑克职业玩家的胜利还差得很远。今年早些时候,Libratus击败了四位精英扑克职业玩家– Dong Kim,Daniel MacAulay,Jimmy Chou和Jason Les –奖金为$ 1,766,250。

由卡内基·梅隆大学开发,Libratus的胜利被视为AI社区的里程碑。 2015年,卡内基·梅隆(Carnegie Melon)的AI(Claudico)在与Les,Kim,Bjorn Li和Doug Polk的比赛中被击败了近80万美元。很少有人期望最新版本的Libratus能够如此轻松地获胜。

Libratus由卡内基·梅隆大学的一组研究人员开发,由计算机教授Tuomas Sandholm和博士生Noam Brown领导。

布朗说:“人们认为虚张声势是非常人性化的。事实并非如此。计算机可以从经验中学到,如果计算机的手弱并且虚张声势,则可以赚到更多的钱。”
在艾伯塔大学的AI DeepStack和一组11名扑克职业玩家之间进行了另一场较少引起关注的竞赛。要求每个玩家在四个星期内与DeepStack玩3,000手或更多手牌。结果包括DeepStack在44,000手牌之后击败了人类。

领导艾伯塔大学研究人员的计算机科学家迈克尔·鲍林(Michael Bowling)表示,长期以来,扑克一直是他的职业挑战。但是,看来AI社区朝着克服这一障碍迈出了一大步。

保龄球说:“从意义上讲,这是典型的不完美信息游戏,因为玩家在玩游戏时没有相同的信息或没有相同的观点。”

人工智能的另一个里程碑

Lengpudashi,DeepStack和Libratus的胜利证实了AI在信息不完善的游戏中已经超越了人类。这只是自1980年代以来一直在进行的过程中的最新里程碑。

这一切始于1980年代初,当时开发人员开始尝试击败国际象棋。击败人类棋手并不需要很长时间,但是AI社区解决象棋还需要很长时间。

这是在1997年5月11日,当时IBM电脑Deep Blue在六场比赛中击败了世界象棋冠军Garry Kasparov。深蓝赢得了两场比赛,卡斯帕罗夫赢得了1场,他们有3次平局。

随后,IBM网站指出,该竞赛是重要的计算机科学,推动了计算机处理帮助发现新药所需的各种复杂计算的能力。进行识别趋势和进行风险分析所需的广泛财务建模;处理大型数据库搜索;并执行许多科学领域所需的大量计算。”

在2000年代后期,重点变成了AI如何在极限德州扑克中获胜。此任务很快完成,因为与无限制版本不同,限注德州扑克具有固定的下注限额。现在,在解决游戏难题的旅程开始三十多年之后,研究人员在无限注德州扑克中击败了另一款游戏。

人工智能如何比人类扑克玩家更好?

根据鲍林(Bowling)的说法,阿尔伯塔大学的机器人使用了一种称为“持续重新解决”的技术来改善其扑克游戏并击败人类。

他解释说:“每种情况本身就是一个迷你扑克游戏。” “它解决了数百万种小型扑克游戏,而不是解决一种大型扑克游戏,每一种都有助于系统改善其对扑克游戏运作方式的直觉。这种直觉是DeepStack如何玩完整游戏的背后推动力。”

无论决策有多困难,DeepStack都能平均响应三秒钟。这与顶级职业玩家形成鲜明对比,后者有时需要花费几分钟来在实时游戏中做出决策。能够在几秒钟内解决数百万个“扑克迷你游戏”,这给AI带来了优于人类同行的巨大优势。

这也有助于疲劳永远不会成为一个因素。实际上,人工智能可以继续解决问题并在竞争中脱颖而出,而人类玩家最终需要休息,或者他们开始以低于最佳水平的水平运行。