美國(guó)卡內(nèi)基-梅隆大學(xué)2019年7月11日宣布,該校和臉書(shū)公司合作開(kāi)發(fā)的人工智能Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手,成為機(jī)器在多人游戲中戰(zhàn)勝人類的一個(gè)里程碑。
美國(guó)《科學(xué)》雜志7月11日在線發(fā)表的相關(guān)論文顯示,Pluribus與13名德州撲克高手進(jìn)行了1萬(wàn)手不限注對(duì)局的六人桌比賽,每次比賽中由機(jī)器對(duì)5名人類選手,結(jié)果機(jī)器取得勝利。
在另外一種形式的六人桌比賽中,由5個(gè)Pluribus與1名人類選手對(duì)局,結(jié)果機(jī)器分別在5 000手對(duì)局中先后擊敗了德州撲克世界冠軍達(dá)倫?伊萊亞斯和克里斯?弗格森。
在比賽中,Pluribus會(huì)讓自己變得難以預(yù)測(cè)。例如:常規(guī)打法是在牌最好的時(shí)候押注,但這很快會(huì)被對(duì)手識(shí)破,因此它會(huì)“耍點(diǎn)心眼”,不按常理出牌。分析顯示,它會(huì)做出一些多數(shù)人類玩家都認(rèn)為不好的決策,這在客觀上也迷惑了對(duì)手。
研究人員指出,與讓機(jī)器下國(guó)際象棋和圍棋相比,德州撲克的挑戰(zhàn)更大。德州撲克比賽中每方都不知道對(duì)手的牌,對(duì)手還可能在押注時(shí)虛張聲勢(shì),因此決策只能基于不完全信息,這與真實(shí)世界中的問(wèn)題更接近。
卡內(nèi)基-梅隆大學(xué)教授圖奧馬斯?桑德霍爾姆說(shuō),此前人工智能在“戰(zhàn)略性推理”方面取得的成就僅限于二人游戲,此次在復(fù)雜游戲中戰(zhàn)勝5名人類選手,將為人工智能解決真實(shí)世界問(wèn)題提供新的可能性。