据外媒报道,一款名为Pluribus的人工智能扑克机器玩家在德州扑克中击败了人类顶级职业扑克手,这是AI机器人首次在超过两名玩家的游戏中击败人类精英玩家,成为超级赌神。
这款扑克机器玩家的开发者,包括美国卡耐基梅隆大学团队以及社交网络公司Facebook旗下的人工智能研究团队。
几十年来,德州扑克一直是人工智能领域最难以攻克的重大问题之一。因为扑克对局涉及“隐藏信息”,你不知道对手的牌是什么,要想在牌局中获胜,需要成功运用多种策略,而这些策略并不适用于国际象棋、围棋等对局。这使得德州扑克成为AI难以攻克的堡垒之一。近年来随着技术进步,AI在“一对一”德州扑克对局中,已经能击败顶级人类玩家,但“一对多”仍是攻克目标。美国纽约大学研究游戏和人工智能的学者朱利安·滕力思说:“虽然从两名玩家增加到六名似乎是渐进的,但这实际上是一件大事。多人游戏是目前正在研究的其他人工智能游戏中一个空白的领域。”而此次Pluribus在六人无限制德州扑克这项复杂游戏中,碾压了人类职业选手,可谓是里程碑式的成功。
据悉,扑克机器玩家Pluribus的开发团队过去已经开发了一款名为Libratus的人工智能软件,它在双人扑克比赛中击败了专业人士。随后,团队通过升级Libratus构建了Pluribus,并创建了一个只需要更少计算能力就能玩比赛的人工智能机器玩家。如今,越来越多的人工智能软件已经涉足了人类游戏中,在两个玩家的零和游戏中,这些人工智能玩家被证明是难以战胜的。
通过解决多人扑克游戏,Pluribus为未来人工智能解决这类复杂问题奠定了基础。
Pluribus的成功很大程度上归功于它的运行效率。当进行扑克游戏时,它只运行在两个中央处理器。当与自己对弈时,Pluribus在大约20秒内就能打出一只手——大约是专业玩家速度的两倍!
事实证明,游戏是衡量人工智能进步的一种很好的方式,因为机器人可以在与顶尖人类的比赛中得分,而且如果它们获胜,还能被客观上誉为超人。
那么,此次与AI对抗的人类职业选手都是谁呢?2000年世界扑克大赛主赛事冠军Chris " Jesus " Ferguson、 2012年世界扑克大赛主赛事冠军Greg Merson以及四次世界扑克巡回赛冠军Darren Elias。完整的全明星阵容包括:Jimmy Chou、Seth Davies、Michael Gagliano、Anthony Gregg、Dong Kim、Jason Les、Linus Loeliger、Daniel McAulay、Nick Petrangelo、Sean Ruan、Trevor Savage和Jake Toole。上述每一位职业选手在职业扑克比赛中都赢得了超过100万美元的奖金,其中许多人赢得了超过1000万美元的奖金。
一般而言,要打败一个人工智能,人类玩家需要熟悉它并找出它的漏洞。但是这些职业牌手也表示和AI对垒压力巨大。职业玩家Michael Gagliano说:“能与机器人对战,并看到它选择的一些策略真的令人难以置信。”WSOP冠军Cris Ferguson说:“Pluribus是一个非常努力的对手,任何手牌你都很难压倒它。AI非常善于在河牌轮下小注。非常擅长在手握好牌时尽量多赢。”职业玩家Jimmy Chou说:“每当和机器人玩牌时,我会选择一些新的策略。作为人类,我认为我们倾向于为自己过度简化对局,让对局策略更易于使用和记忆,更倾向于走捷径。机器人就不会走这种捷径,它的每个决定背后都有一个极其复杂而平衡的策略树。”
四次世界扑克巡回赛冠军Darren Elias说:“它的主要优势是能够使用混合策略,这也是人类试图做的事情。对人类来说,这是一个执行的问题——以一种完全随机的方式,并始终如一地这样做。大多数人就是做不到。”
尽管Pluribus是为玩扑克而开发的,但其技术可以延伸其他领域。在扑克游戏中,玩家交流和串通的机会是有限的。在构建非常简单的协调博弈时,现有的自我游戏算法可能无法找到一个好的策略。然而,许多真实世界的交互——包括涉及欺诈预防、网络安全以及对有害内容采取行动的交互——可能被建模为涉及隐藏信息和/或多个智能体的场景,这些智能体之间的通信是有限的。因此,使Pluribus能够在牌桌上击败多个对手的技术,可能有助于AI社区在这些和其他领域开发有效的策略。
编辑:李伶
责任编辑:施薇