在德州扑克人机大战中,四位职业牌手与 CMU 开发的人工智能系统 Libratus 进行了激烈对抗。
Libratus是卡耐基梅隆大学的托马斯·桑德霍尔姆和诺姆·布朗(Noam Brown)开发的。他们以前开发的机器人 Claudico 在 2015 年的德州扑克比赛中没能击败职业牌手。
“一对一无限注德州扑克”就是两个人玩的赌博游戏,因为事先会给每位玩家分发 2 张底牌,所以对方“底牌信息”你是不知道的,对于计算机来说,就是在处理一种“非完整信息博弈”。我们知道 AlphaGo 玩围棋,对弈双方的信息是完整的、对称的,并没有隐藏的信息。所以在德州扑克上AI取得了进步,是具有重要意义的。
比赛期间,前三轮比赛失利后,四位职业牌手在第四天和第六天的比赛中获得胜利。Libratus 原本领先193000 美元,在第六轮比赛后 Libratus 仅领先 51000美 元。
在人类选手反击迅猛之时,牌手之一詹森·莱斯便在一封电子邮件中写道:
我们花了一段时间学习,以理解正在发生的事情。
然而,随后 Libratus 的表现让所有非常人吃惊:再次获得关键性胜利。第 10 天结束时,Libratus 已经领先 677000 美元,而且局势也似乎不可逆转。
跟 AlphaGo 相似,Libratus 也可通过增强学习进行自我博弈和学习。
Libratus 的开发者之一托马斯·桑德霍尔姆也说道:
我们不能详细谈论 Libratus 的技术,直到比赛结束为止。但是,我可以告诉大家,Libratus 的算法一直在超级计算机上运行,所以超级计算机每天都在输出改进的策略。
今年 1 月底,Libratus 可能会在下一场比赛中再次击败人类。到目前为止,机器人还没有在无限制德州扑克团体赛中击败过人类,但这一天也许不会太远了。
人工智能扑克机器人的研发具有重大意义。首先,它是一种教导人工智能系统处理不完整信息的方式。诺姆·布朗指出“在现实世界中,所有的相关信息通常不像棋盘上的棋子那样明显。有些重要的信息会丢失或隐藏,人工智能需要能够处理这样的信息。”