人工智能“阿爾法圍棋”新版本“從零開(kāi)始”學(xué)習(xí)圍棋,僅用3天就擊敗前輩版本,40天成為新的王者。
之前的版本在剛開(kāi)始學(xué)習(xí)圍棋時(shí),都要依靠人類知識(shí),即先教它們一些人類摸索出的基本下法,然后再開(kāi)始自己學(xué)習(xí)。而這個(gè)阿爾法元程序(AlphaGo Zero)擺脫了這個(gè)限制,研究人員沒(méi)有給它除棋盤(pán)和棋子外的任何輸入,它完全是“從零開(kāi)始”,自己與自己對(duì)弈,通過(guò)更為優(yōu)秀的算法,取得飛速進(jìn)步。
開(kāi)始學(xué)習(xí)圍棋3天后,它就以100比0的成績(jī)戰(zhàn)勝“阿爾法圍棋-李”;40天后,它又戰(zhàn)勝了在所有人類高手看來(lái)已不可企及的“阿爾法圍棋-大師”(AlphaGo Master)。