張力平
棋牌游戲?qū)θ藖?lái)說(shuō)是益智游戲,對(duì)人工智能來(lái)說(shuō)是其“智力開(kāi)發(fā)”的重要手段。棋牌游戲一直被用作人工智能的開(kāi)發(fā)、測(cè)試工具。
過(guò)去20年,許多棋牌游戲在人工智能面前紛紛“淪陷”。如中國(guó)象棋軟件把頂尖棋手玩得團(tuán)團(tuán)轉(zhuǎn),“深藍(lán)”攻陷國(guó)際象棋,“阿爾法狗”在與圍棋高手的“番棋賽”及連續(xù)對(duì)戰(zhàn)中獲勝,最近又有人工智能系統(tǒng)擊敗德州撲克高手。至此,頂級(jí)人工智能系統(tǒng)都創(chuàng)造了戰(zhàn)勝頂級(jí)人類(lèi)大師的記錄。
人工智能能夠戰(zhàn)勝?lài)迤迨挚芍^登頂成功,人工智能在德州撲克上勝出如征服一座奇峰,也具有重要意義。中國(guó)象棋、國(guó)際象棋和圍棋都是“完美信息”游戲,玩家在游戲中能獲得公開(kāi)和對(duì)稱(chēng)的確定性信息,人類(lèi)玩家的每一步落棋都能被算出所有可能性,人類(lèi)玩家每個(gè)決策點(diǎn)都能被人工智能獨(dú)立得出最優(yōu)解。然而,德州撲克是包含很多隱藏信息的“不完美信息”游戲,玩家只能掌握不對(duì)稱(chēng)的信息。由于人工智能系統(tǒng)不具備欺騙對(duì)手和體察到對(duì)手在欺騙自己等人類(lèi)獨(dú)具的心理能力,雖然一局德州撲克中的決策點(diǎn)數(shù)量少于圍棋,但在每個(gè)決策點(diǎn)都需要全盤(pán)復(fù)雜推理,計(jì)算量難以想象,這對(duì)人工智能更具挑戰(zhàn)。
機(jī)器學(xué)習(xí)技術(shù)是人工智能進(jìn)步神速的關(guān)鍵。在運(yùn)用深度學(xué)習(xí)反復(fù)自我博弈后,人工智能系統(tǒng)學(xué)會(huì)了在每一個(gè)具體情境出現(xiàn)時(shí)進(jìn)行推理。這非常接近人類(lèi)玩家的“牌感”。開(kāi)發(fā)者還會(huì)將其與超級(jí)計(jì)算機(jī)聯(lián)網(wǎng)改進(jìn)算法,使之總能在人類(lèi)對(duì)手制衡自己前搶先一步。
無(wú)論是在圍棋上的“明爭(zhēng)”,還是在德州撲克上的“暗斗”,人工智能在“戰(zhàn)勝人類(lèi)”的道路上銜枚疾行。掌握博弈論的人工智能應(yīng)用,絕不只是簡(jiǎn)單地下棋打牌。人類(lèi)生活中有許多“不完美信息”的場(chǎng)景。所以,人工智能攻克德州撲克后,其未來(lái)還能應(yīng)用在金融、證券、拍賣(mài)、政治和商業(yè)談判、軍事、網(wǎng)絡(luò)安全等那些需要人工智能在“不完美信息”的情景中做出決策的領(lǐng)域。人工智能發(fā)展速度,正史無(wú)前例地不斷刷新行業(yè)的預(yù)期和人類(lèi)的認(rèn)知,催生新的以互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等信息通信技術(shù)為核心的行業(yè),幫助人們創(chuàng)新未來(lái)。