陳經(jīng)
前不久,Deep?mind在《自然》上發(fā)表論文,介紹了“阿爾法狗”(Al?phaGo)取得的重大進(jìn)展。與之前的版本不同,AlphaGoZero完全不需要人類(lèi)棋譜,從零開(kāi)始自學(xué)習(xí),只用3天就以100∶0的壓倒性成績(jī),擊敗曾贏下韓國(guó)棋手李世石的那版AlphaGo。
人工智能(AI)與人類(lèi)的關(guān)系,在2016年的AI爆發(fā)后備受關(guān)注。對(duì)于給定規(guī)則的博弈問(wèn)題,AI是需要人類(lèi)的知識(shí)提供“第一推動(dòng)”,還是可以自己從“元規(guī)則”開(kāi)始反復(fù)實(shí)踐總結(jié),發(fā)展出知識(shí)體系,是個(gè)有趣的問(wèn)題。對(duì)于像“打磚塊”這樣的簡(jiǎn)單游戲,AI從零知識(shí)開(kāi)始反復(fù)試玩,達(dá)到超過(guò)人類(lèi)玩家的分?jǐn)?shù),2015年就實(shí)現(xiàn)了。但是圍棋這樣復(fù)雜的游戲,人們還有疑問(wèn),也許人類(lèi)提供一些知識(shí)對(duì)高水平AI是必需的,從零知識(shí)開(kāi)始也許AI會(huì)陷入局部陷阱中出不來(lái)。
現(xiàn)在AlphaGoZero給出了答案:對(duì)于AI來(lái)說(shuō),人類(lèi)對(duì)圍棋的知識(shí)積累不是必須的!而且從零知識(shí)開(kāi)始訓(xùn)練,可以達(dá)到更高水平。人類(lèi)棋譜中有一些“成見(jiàn)”,如一些自以為正確的本能定式下法,其實(shí)反而阻止了學(xué)習(xí)者達(dá)到更高水平。Al?phaGoZero從零開(kāi)始自學(xué)習(xí),完全不受人類(lèi)棋譜的“污染”,就可以突破“成見(jiàn)”,真正進(jìn)入自由的天地,達(dá)到更高的水平。
AlphaGo能不依賴(lài)人類(lèi)的知識(shí)就學(xué)習(xí)成功,其關(guān)鍵之處在于:圍棋是有確定規(guī)則的,是一個(gè)“客觀”的游戲。不需要人主觀評(píng)判,機(jī)器按行棋規(guī)則下,終局就有確定的勝負(fù)結(jié)果出來(lái)。這樣,AlphaGo的學(xué)習(xí)就不需要人類(lèi)的干預(yù),完全可以自動(dòng)進(jìn)行海量的實(shí)踐。AlphaGoZe?ro的成功,是自學(xué)習(xí)方法的突破,也是“實(shí)踐檢驗(yàn)”哲學(xué)原理的成功。
人類(lèi)的社會(huì)活動(dòng)或者AI的博弈,需要通過(guò)實(shí)踐不斷提升效率與表現(xiàn)。實(shí)踐總是需要在一定的規(guī)則之內(nèi)進(jìn)行,這是基礎(chǔ),就如穩(wěn)定的社會(huì)、現(xiàn)代銀行體系、圍棋的行棋與終局規(guī)則。實(shí)踐時(shí),人類(lèi)本能地會(huì)借鑒前輩的一些“經(jīng)驗(yàn)”作為思考的出發(fā)點(diǎn)。學(xué)校、政府、公司都有教育體系,正如圍棋AI會(huì)學(xué)習(xí)人類(lèi)高手的棋譜生成“策略網(wǎng)絡(luò)”作為優(yōu)先選擇。然而這些“經(jīng)驗(yàn)”,到底能起什么樣的作用,值得仔細(xì)觀察。
在實(shí)踐不足的情況下,參考前人經(jīng)驗(yàn)與人類(lèi)棋譜,顯然是有益的,能夠快速“上手”。但是,在發(fā)展遇到瓶頸的時(shí)候,可能就會(huì)顯出前人經(jīng)驗(yàn)的不足,照本宣科會(huì)限制思維,無(wú)法突破。想取得突破,就需要從本原出發(fā),敢于懷疑,拋棄成見(jiàn)大膽實(shí)踐學(xué)習(xí),下出“新手”,作出改革。這說(shuō)明,人類(lèi)的實(shí)踐活動(dòng)可以借鑒前人的經(jīng)驗(yàn),但是如果有了好的實(shí)踐反饋學(xué)習(xí)框架,完全可以進(jìn)行揚(yáng)棄,取得理論突破。中國(guó)改革開(kāi)放的歷程也說(shuō)明,全社會(huì)持續(xù)不斷地學(xué)習(xí)與主動(dòng)變革實(shí)踐,正是社會(huì)奮發(fā)向上不斷取得突破的哲學(xué)基礎(chǔ)。
AlphaGo雖然再次震驚世人,但無(wú)須對(duì)AI的快速發(fā)展和驚人實(shí)力感到神傷。目前,AI仍只是人類(lèi)的工具,還沒(méi)有自己的思維?!?/p>
(作者是科技與戰(zhàn)略風(fēng)云學(xué)會(huì)研究員)