5月23日,浙江,烏鎮(zhèn)。
來自中國浙江麗水的天才圍棋少年柯潔穩(wěn)穩(wěn)地坐在棋盤前,等待著一盤三番棋挑戰(zhàn)賽的開始。這個(gè)不滿20歲的棋手在他短短的職業(yè)生涯里已經(jīng)爆發(fā)出震驚世界的能量,從兩年前第一次贏得世界冠軍起,他就以令人炫目的棋風(fēng)打造了一個(gè)傳奇般的神話,成為中國圍棋歷史上成名最早、得到世界冠軍最快的年輕棋手。此刻,少年的對(duì)面坐著一位名字叫黃士杰的中年業(yè)余棋手,如果以自身棋力相搏,恐怕他自己都不愿意坐在柯潔面前。但此時(shí)此刻,另外一個(gè)身份卻讓他顯得氣定神閑,因?yàn)樗€是Google旗下的人工智能博士,在這次與人類最高水平的圍棋選手對(duì)決中,黃博士扮演的是一個(gè)機(jī)械手,負(fù)責(zé)根據(jù)另外一個(gè) “大腦”的指令冷靜、準(zhǔn)確地?cái)[下棋子,而這個(gè)大腦就是來自DeepMind的人工智能系統(tǒng)AlphaGo。
世界冠軍時(shí)越九段:“這是我前所未見的,就像是我想象中來自遙遠(yuǎn)未來的棋局一樣。”?
一年前,意氣風(fēng)發(fā)的柯潔本來穩(wěn)穩(wěn)地蟬聯(lián)著世界排名第一的寶座。我們無法了解當(dāng)時(shí)的柯潔如何看待各路圍棋高手對(duì)自己的圍攻與挑戰(zhàn),但可以肯定的是,他無論如何都不會(huì)想到,自己世界第一的排名會(huì)被一臺(tái)計(jì)算機(jī)超越。2016年3月,在全球媒體關(guān)注下,AlphaGo和韓國棋手李世石擺開了棋盤,這個(gè)具備了“深度學(xué)習(xí)”功能的電腦想去挑戰(zhàn)一下人類最復(fù)雜的棋類運(yùn)動(dòng),而選擇的挑戰(zhàn)對(duì)象是一位世界冠軍,一等一的高手。直到比賽之前,人們還普遍認(rèn)為AlphaGo有點(diǎn)不自量力,但在人類自以為是的傲慢視角下,AlphaGo以令人瞠目的4:1大比分取勝,其飄逸古怪有如神助的棋風(fēng),不僅讓圍棋界為之嘩然,也為全世界上了一場別開生面的AI科普課。
當(dāng)AlphaGo戰(zhàn)勝李世石的時(shí)候,柯潔剛過18歲,年輕氣盛的他對(duì)這個(gè)電腦圍棋高手并不以為然,直言“就算阿法狗贏了李世石,但是贏不了我?!边@個(gè)判斷在一年前也許有道理,但柯潔顯然沒有預(yù)料到,AI的學(xué)習(xí)能力達(dá)到了日新月異的程度,此刻棋盤前的AlphaGo早已脫胎換骨,在一年的時(shí)間里完成了幾個(gè)代際的跨越。
當(dāng)然,柯潔也不是沒有思想準(zhǔn)備。2017年元旦期間,他就在圍棋對(duì)弈網(wǎng)站上和一個(gè)網(wǎng)名為Master的高手下過一盤棋,對(duì)方的棋力強(qiáng)大到不可思議,短短幾天里在弈城和野狐網(wǎng)上將包括柯潔在內(nèi)的數(shù)10名世界一流棋手虐了個(gè)遍。事后Google宣布,Master其實(shí)就是AlphaGo,一時(shí)間讓我們想起了互聯(lián)網(wǎng)時(shí)代的名言:“在網(wǎng)上,沒有人知道你是一條狗”——不過這次,是AlphaGo。
此次烏鎮(zhèn)大戰(zhàn)吸引著中國圍棋老少三代職業(yè)高手傾巢而出,印象中過去任何國際圍棋大賽的決賽也沒有如此豪華的觀光團(tuán)陣容。為了充分展示AlphaGo的實(shí)力,組織者在賽制方面做出了一些調(diào)整,設(shè)定了三番慢棋比賽,復(fù)古的賽制給人腦多留下了一些思考的時(shí)間,能夠稍微彌補(bǔ)一下人機(jī)對(duì)戰(zhàn)時(shí)的不公平。即便如此,賽前的預(yù)測也已經(jīng)一邊倒,幾乎沒人相信柯潔會(huì)贏,而對(duì)戰(zhàn)雙方更是心知肚明:勝負(fù)已不再重要,柯潔肩負(fù)的不僅僅是與AI的棋力較量,也是對(duì)AlphaGo新的計(jì)算平臺(tái)的一次全新檢驗(yàn),對(duì)局過程將對(duì)人工智能的未來產(chǎn)生積極的貢獻(xiàn)。
戰(zhàn)局如期開始,第一場柯潔執(zhí)黑子,以相對(duì)保守的方式進(jìn)行了試探,雖然精心布局謹(jǐn)慎搏殺,但整盤柯潔并沒有出現(xiàn)勝機(jī),最終以四分之一子的微弱劣勢(shì)落敗。兩天之后的第二場柯潔執(zhí)白,為了將局面打散,柯潔一度挑起了一場十面埋伏般的兇悍對(duì)殺戰(zhàn),成功地將局面引入變化萬千的多路拼殺,但終究自己也難以駕馭如此復(fù)雜的局面,倒是AlphaGo越來越熟悉了盤中的對(duì)戰(zhàn),反而精準(zhǔn)地控制了局面,最后柯潔只能中盤投子認(rèn)負(fù)。5月27日下午,人機(jī)大戰(zhàn)進(jìn)入最后一局依然沒有奇跡,柯潔九段中盤告負(fù),總比分鎖定在了 0:3 ,世界排名第一的人類最高水平棋手?jǐn)∮贏lphaGo。不僅如此,比賽中,柯潔在局面不利時(shí)還曾長時(shí)間離開,回來后又淚灑現(xiàn)場。賽后柯潔一度哽咽稱:它太完美,我很痛苦,看不到任何勝利的希望。
柯潔的郁悶可以理解,畢竟面對(duì)面對(duì)戰(zhàn)中才能真正感受到對(duì)手的強(qiáng)大。一年前大戰(zhàn)李世石時(shí),AlphaGo使用了1 202個(gè)CPU和176個(gè)GPU,同時(shí)可以有40個(gè)搜索線程。而今年新的阿法狗除了算法上的改進(jìn)之外,Google云和TPU等計(jì)算資源上的改進(jìn)對(duì)性能提升的作用巨大。不僅如此,Google使用的TPU是一款具有學(xué)習(xí)能力的可定制處理器,憑借全新的算法和強(qiáng)大的計(jì)算力,在與李世石的比賽之后,AlphaGo 成為了自己的老師,完成了百萬次高水準(zhǔn)的自我訓(xùn)練,不斷提高著自己的水平。難怪賽后職業(yè)棋手們紛紛評(píng)價(jià),今年的AlphaGo與去年已經(jīng)不在一個(gè)檔次,甚至很多棋手已經(jīng)開始學(xué)習(xí)他的精彩棋路來提高自己的水平。
因?yàn)楸荣愔械膬?yōu)異表現(xiàn),中國棋院給AlphaGo頒發(fā)了圍棋九段證書,至此,AlphaGo成為了第43位中國圍棋九段的獲得者。DeepMind團(tuán)隊(duì)首席科學(xué)家大衛(wèi)·席爾瓦作為代表接受了中國棋院院長王汝南頒發(fā)的寫著如下內(nèi)容的證書:AlphaGo是人工智能創(chuàng)新史上的里程碑,是中國古老的圍棋藝術(shù)與現(xiàn)代高科技結(jié)合創(chuàng)造出的舉世矚目之奇妙成果。神游局內(nèi)、經(jīng)緯天地、妙不可言,置身其中,棋藝世界已入化境。對(duì)圍棋之道的深度探索給棋屆留下了寶貴財(cái)富,并將圍棋文化的影響傳播世界。圍棋未來必定更加精彩。
就在比賽結(jié)束、AlphaGo因精彩的棋藝被人們稱頌之時(shí),DeepMind的創(chuàng)始人、被稱為AlphaGo之父的Demis Hassabis卻宣布了它將從圍棋領(lǐng)域退役——“AlphaGo作為一個(gè)競賽系統(tǒng)已經(jīng)戰(zhàn)勝了最高級(jí)別的人類選手,本次中國烏鎮(zhèn)圍棋峰會(huì)是AlphaGo參加的最后對(duì)弈比賽?!睂?shí)際上,在比賽期間Demis Hassabis就發(fā)表了一篇長博客,宣稱“探索圍棋這一古老游戲的深遠(yuǎn)奧秘”顯然不是AlphaGo的目的。通過 AlphaGo的啟發(fā),棋手們能夠在這項(xiàng)具有3000年歷史的游戲中,嘗試全新的思路與策略,但圍棋卻并不是AlphaGo的終點(diǎn),接下來科學(xué)家會(huì)根據(jù)AlphaGo建立通用算法,應(yīng)用到更多領(lǐng)域,去解決更復(fù)雜的問題,比如新的疾病治療方法、顯著降低能源消耗、發(fā)明革命性的新材料等。
人機(jī)大戰(zhàn)的終局,也成為人機(jī)協(xié)作的起點(diǎn)。