最近被各種社交媒體狂刷屏的事件大概要數(shù)李世石大戰(zhàn)“阿爾法圍棋”(AlphaGo)了。“阿爾法圍棋”是谷歌公司研發(fā)的圍棋程序。Go是“圍棋”的意思,而Alpha則來(lái)自谷歌的母公司Alphabet(字母表)的名稱。由此看來(lái),谷歌在下一盤很大的棋,在“阿爾法圍棋”之后還會(huì)推出一系列人工智能程序挑戰(zhàn)人類智慧。
據(jù)“阿爾法圍棋”研發(fā)者介紹,這款圍棋程序包含兩個(gè)“大腦”:一個(gè)是對(duì)每一步棋進(jìn)行概率分析的“策略網(wǎng)絡(luò)”,即“策略大腦”;另一個(gè)是進(jìn)行全局判斷的“價(jià)值網(wǎng)絡(luò)”,即“價(jià)值大腦”。
其實(shí),按照現(xiàn)有的科技發(fā)展規(guī)律,擁有“策略大腦”的計(jì)算機(jī)贏棋并不是很難。因?yàn)槿魏纹孱愑螒虻穆渥游恢檬怯邢薜模灰?jì)算機(jī)的計(jì)算能力足夠強(qiáng)大,用窮舉法把每一步棋的位置變化都算出來(lái),做到每下一步棋的贏棋概率接近甚至達(dá)到100%,這個(gè)擁有“策略大腦”的“阿爾法圍棋”就可以成為當(dāng)之無(wú)愧的世界第一棋王。和常人對(duì)決不同的是,人機(jī)對(duì)決的關(guān)鍵是前期的幾手棋,人類棋手一旦前期出現(xiàn)失誤,后期再怎么精于算計(jì)也贏不了機(jī)器。而且每名棋手前期的習(xí)慣走棋方式也是可以根據(jù)歷史數(shù)據(jù)獲取的,這些都大大降低了計(jì)算的難度。
“阿爾法圍棋”的設(shè)計(jì)師透露,在挑戰(zhàn)李世石之前,他們的內(nèi)部測(cè)試概率就是5∶0完勝。這真的不見(jiàn)得是吹牛。1965年,英特爾公司創(chuàng)始人摩爾提出了“摩爾定律”,也就是當(dāng)價(jià)格不變時(shí),集成電路上的元器件數(shù)目每隔18?24個(gè)月便會(huì)增加一倍,性能也會(huì)提升一倍。如今,多核中央處理器的出現(xiàn)和云計(jì)算技術(shù)使計(jì)算機(jī)的整體運(yùn)算速度仍然保持突飛猛進(jìn)的發(fā)展。2015年10月,“阿爾法圍棋”就以5∶0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。
而這次人機(jī)大戰(zhàn)最有意思的亮點(diǎn)其實(shí)是“阿爾法圍棋”的“價(jià)值大腦”。1997年5月,當(dāng)時(shí)IBM的超級(jí)電腦“深藍(lán)”在經(jīng)過(guò)六盤對(duì)決后,戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫?!吧钏{(lán)”當(dāng)時(shí)只有一個(gè)“策略大腦”。而如今“阿爾法圍棋”所擁有的“價(jià)值大腦”則會(huì)根據(jù)對(duì)局的需要做出“價(jià)值判斷”。如果一步棋即便會(huì)對(duì)局部造成損失,但是對(duì)全局有價(jià)值,計(jì)算機(jī)也會(huì)加以判斷后果斷出招。例如“阿爾法圍棋”對(duì)陣?yán)钍朗诙种械牡?7手黑棋,這步棋當(dāng)時(shí)被看作是不顧自己左下角損失的“爛”棋,但卻成為后來(lái)連聶衛(wèi)平都要“脫帽致敬”的關(guān)鍵一步,體現(xiàn)出“阿爾法圍棋”所具有的“價(jià)值判斷”的威力。
不過(guò),贏幾盤棋顯然并不是“阿爾法圍棋”的終極目標(biāo)。谷歌推出圍棋程序的目的還是為了測(cè)試人工智能的程度。3月13日,李世石終于扳回一盤,表示“這一勝太有價(jià)值,我不會(huì)用任何東西來(lái)?yè)Q”。在李世石看來(lái),這盤贏棋的價(jià)值在于終于挽回了自己和人類的面子。而擁有“價(jià)值大腦”的“阿爾法圍棋”憑借這盤輸棋名正言順地獲得國(guó)際圍棋排名的正式積分,成為世界排名第四的正式棋手,因?yàn)槿绻麤](méi)有輸棋記錄將不會(huì)被記分。不管什么棋,本質(zhì)上還是游戲。對(duì)于人類來(lái)說(shuō),真正的游戲不僅僅在于輸贏,更在于給每一名參與者和旁觀者帶來(lái)快樂(lè)。從這點(diǎn)來(lái)看,能否熟練進(jìn)行價(jià)值判斷才是實(shí)現(xiàn)人工智能的關(guān)鍵。
早在古希臘,亞里士多德就提出“人是理性的動(dòng)物”,也正是在得與失的價(jià)值判斷中,人才產(chǎn)生了自我意識(shí),并以此為出發(fā)點(diǎn)開(kāi)始進(jìn)行改造外部世界的科學(xué)實(shí)踐。與之相應(yīng)的則是感性,它是根據(jù)人的情感好惡對(duì)理性價(jià)值觀的修訂。理性與感性的共同作用構(gòu)成了人類獨(dú)有的智慧和價(jià)值體系。從這點(diǎn)來(lái)看,“阿爾法圍棋”要想模擬人類的智慧,其實(shí)是非常困難的。機(jī)器人可以精確計(jì)算出自己的利益得失,甚至能掌握人類所具有的知識(shí),卻無(wú)法理解人類為崇高的信念而做出自我犧牲、為了尊嚴(yán)寧可放棄優(yōu)厚待遇的做法。人工智能的最大難點(diǎn)是如何從“機(jī)器性”過(guò)渡到“人性”。因此,我們不懼怕贏棋的“阿爾法圍棋”,但可能會(huì)懼怕經(jīng)過(guò)深思熟慮后主動(dòng)輸棋以討絕大多數(shù)人喜歡的“阿爾法圍棋”。因?yàn)楹笳呖赡芤呀?jīng)進(jìn)化出人的感情和價(jià)值觀,成為真正能與人類匹敵的對(duì)手了。
對(duì)于這一點(diǎn),很多影視作品都進(jìn)行過(guò)探討。當(dāng)施瓦辛格扮演的T-800機(jī)器人在電影《終結(jié)者5》中說(shuō)出充滿感情色彩的臺(tái)詞“我老了,但是還沒(méi)有過(guò)時(shí)”,你還會(huì)認(rèn)為他是臺(tái)只知道打打殺殺的機(jī)器嗎?