江鑄久
2017年5月30日,我去香港鳳凰衛(wèi)視,參加錄制鏘鏘三人行的節(jié)目,談AlphaGo對(duì)柯潔的人機(jī)大戰(zhàn)第二季。想起去年3月,李世石和AlphaGo的第五局時(shí),我也是一路奔到香港,邊和文濤聊著圍棋與人工智能,邊掛念著戰(zhàn)況。
一年多過(guò)去,AlphaGo從一開(kāi)始的職業(yè)棋手都覺(jué)得下不過(guò)李世石,到現(xiàn)在成為很多人心中的圍棋上帝,這世界變化得太快了。
還記得對(duì)李世石的第一局,AlphaGo贏了之后,整個(gè)圍棋界都震動(dòng)了。芮乃偉那時(shí)候就非常難過(guò)。我倒還好,因?yàn)橘惽拔乙杨A(yù)測(cè)AlphaGo會(huì)贏,電腦戰(zhàn)勝人類(lèi)的時(shí)刻就要到來(lái)。之所以這么認(rèn)為,是因?yàn)槎嗄昵?,我在美?guó)時(shí)就接觸過(guò)一些立志開(kāi)發(fā)圍棋人工智能的IT人士,還給他們當(dāng)過(guò)參謀。之后,我也一直關(guān)注著這方面的發(fā)展。圍棋人工智能的發(fā)展十分緩慢,早在1990年代,IBM的深藍(lán)就打敗了國(guó)際象棋特級(jí)大師,但是電腦解決不了圍棋海量的計(jì)算,解決不了圍棋里“虛”的東西。當(dāng)所有的智力游戲都被攻克時(shí),圍棋依然一花獨(dú)放。不過(guò),看了2016年初Google發(fā)表的AlphaGo 5∶0戰(zhàn)勝歐洲冠軍樊麾的棋譜,我覺(jué)得我們將要見(jiàn)證歷史了。
但是我的預(yù)想圖是AlphaGo會(huì)贏一至兩盤(pán),沒(méi)想到他第一局就贏了,而且贏得非常漂亮,也沒(méi)想到最后4∶1的結(jié)果,居然是李世石只贏了一盤(pán)。當(dāng)然那是一盤(pán)偉大的勝局,李世石在形勢(shì)不利的情況下弈出神的一手,引出了AlphaGo的bug。
從那次人機(jī)大戰(zhàn)的整體看,AlphaGo下得漂亮。比如第二局黑37手的尖沖,令人蕩氣回腸,感覺(jué)是吳清源老師回來(lái)了。吳老師曾說(shuō)他200歲在宇宙中還要下棋。那么,這是AlphaGo將吳老師的思想傳遞回來(lái)了吧?我非常感動(dòng)。
2017新年AlphaGo再度出山,以Master的網(wǎng)名在各大圍棋對(duì)弈網(wǎng)站下了60盤(pán)棋,全勝。我認(rèn)真研究了這60盤(pán)棋并寫(xiě)下打譜心得給我的學(xué)生們學(xué)習(xí)。知道孩子們要理解這些還有點(diǎn)早,但我愿意埋一顆種子,期待在他們的心中慢慢發(fā)芽。
5月末,人機(jī)大戰(zhàn)第二季在烏鎮(zhèn)開(kāi)戰(zhàn)。
此次人機(jī)大戰(zhàn)的勝負(fù)基本是沒(méi)有懸念的,當(dāng)然我們希望柯潔贏,但是60局所顯現(xiàn)的AlphaGo太強(qiáng)大了。因此,奔向?yàn)蹑?zhèn)時(shí),我期待看到AlphaGo下出更加神奇的,甚至是我們職業(yè)棋士也看不懂的招法,期待看到人機(jī)之間更加精彩的對(duì)抗。
三番棋分別在5月23、25、27日進(jìn)行。大會(huì)場(chǎng)里,屏幕上除了對(duì)局的進(jìn)程外,還可以看到柯潔對(duì)局中的表情和動(dòng)作,現(xiàn)場(chǎng)感很強(qiáng)。
第一局,AlphaGo執(zhí)白勝1/4子,在中國(guó)規(guī)則里是最小的差距,但棋盤(pán)上的內(nèi)容是一面倒的。柯潔似乎有點(diǎn)拘謹(jǐn),AlphaGo一直掌控著局勢(shì)。
第二局,感覺(jué)柯潔放開(kāi)了,下得非常出色,成功地把AlphaGo拖入混戰(zhàn)中,有一度很有機(jī)會(huì),可以說(shuō)是逼AlphaGo使出了渾身解數(shù)。據(jù)賽后公布的數(shù)據(jù),AlphaGo認(rèn)為前100手是雙方最善。雖然后半盤(pán)柯潔弈出問(wèn)題手,棋局戛然而止。但是那一局棋,令許許多多的觀眾熱血沸騰。
27日第三局,澎湃新聞開(kāi)通在線直播,我們和IT專(zhuān)家、紐約大學(xué)教授張崢老師一起講解。柯潔前半盤(pán)弈出問(wèn)題手,之后奮力拼搏,一度使形勢(shì)非常接近,但還是未能翻盤(pán)。
3∶0,這個(gè)結(jié)果并不意外。那么,看一場(chǎng)意料之中的賽事,看人類(lèi)敗于機(jī)器,有意思嗎?有。
有柯潔近乎悲壯的對(duì)AlphaGo的死磕,有AlphaGo在棋盤(pán)上展現(xiàn)出來(lái)的奇思妙想,也有人機(jī)聯(lián)手等好玩的賽事,更有DeepMind團(tuán)隊(duì)的講座和互動(dòng),這次的烏鎮(zhèn)圍棋峰會(huì)內(nèi)容豐富精彩,我們站在了歷史的節(jié)點(diǎn)上。
24日那天是論壇。DeepMind CEO哈薩比斯(Damis Hassabis)先生和AlphaGo技術(shù)負(fù)責(zé)人席爾瓦(David Silver)先生的講座非常精彩,令觀眾了解了AlphaGo是如何依靠他們的策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)進(jìn)行剪枝和判斷的。但是最令人震撼的是席爾瓦先生在講話中說(shuō),AlphaGo Master經(jīng)過(guò)這一段的深度學(xué)習(xí),已經(jīng)比同李世石下棋時(shí)的版本進(jìn)步了Three Stones。聽(tīng)到這個(gè)說(shuō)法,柯潔立刻在微博上發(fā)表了“天哪”的感嘆。
三子啊,真是令人難以置信。午餐時(shí)我們特地去找哈薩比斯先生求證。哈薩比斯先生首先肯定了這Three Stones就是三個(gè)子,而不是三目(Three points),然后解釋說(shuō)這是系統(tǒng)自己測(cè)定的,按照“AlphaGo李”同“AlphaGo柯”自己對(duì)下的勝率估算出的實(shí)力差距,并不說(shuō)明和人類(lèi)下也能讓三子。不過(guò),他又補(bǔ)充了一句:“也許是讓兩子……”
嗯,這也已經(jīng)足夠令人震驚了。想起今年3月份我到日本的時(shí)候,碰到了武宮正樹(shù)老師、趙治勛老師和小林光一老師,他們都不約而同地認(rèn)為如果是60連勝,按照棋份來(lái)說(shuō),那是兩個(gè)子的棋份了。
哈薩比斯先生還說(shuō),他們已經(jīng)修復(fù)了對(duì)李世石時(shí)的bug,即使形勢(shì)不利(基本不太可能),AlphaGo也不會(huì)亂來(lái)了。趁此機(jī)會(huì),我提出,希望能多給我們看一些AlphaGo左右互搏的棋譜。哈薩比斯先生答應(yīng)考慮一下。
下午,一不小心去了Jeff Dean的記者會(huì)(后來(lái)才知道他有多牛,據(jù)說(shuō)谷歌員工認(rèn)為谷歌搜索驚人的速度都?xì)w功于他)。會(huì)后,主辦方好意安排我和他聊幾句。我問(wèn)他,AlphaGo的開(kāi)發(fā)會(huì)一直繼續(xù)下去嗎?有沒(méi)有目標(biāo)?他嚴(yán)肅地回答這個(gè)要去問(wèn)DeepMind團(tuán)隊(duì)……好吧,那我再問(wèn),你覺(jué)得人工智能,比如AlphaGo,在對(duì)孩子的教育方面有些什么幫助?Jeff很認(rèn)真地說(shuō),人工智能會(huì)很好地啟發(fā)孩子們的創(chuàng)造力……
26日上午,大舞臺(tái)上是配對(duì)賽,古力和AlphaGo對(duì)陣連笑和AlphaGo。雖然是表演賽,但大家相當(dāng)期待,都想看人和電腦會(huì)配合成什么樣子。而且,如果是人機(jī)對(duì)戰(zhàn),機(jī)器優(yōu)勢(shì)了,就會(huì)挑穩(wěn)妥的路走,不求最好,只選擇勝率最高的一手。所以我們預(yù)想,到了后半盤(pán),是不是可以由人類(lèi)高手領(lǐng)著AlphaGo下出最善的著手呢?
很有意思的一盤(pán)棋。布局,執(zhí)白的連笑弈出問(wèn)題手,黑棋優(yōu)勢(shì)。但是緊接著黑方的AlphaGo下了一步無(wú)比堅(jiān)實(shí)的自補(bǔ),我相信任何一個(gè)職業(yè)棋手都是不會(huì)往那里想棋的。是不是阿老師覺(jué)得優(yōu)勢(shì)了呢?我們笑說(shuō),這一步似乎把古力的調(diào)子打亂了。
據(jù)說(shuō)后臺(tái)數(shù)據(jù)黑棋勝率曾到達(dá)75,古力下了某一手后掉到60多一點(diǎn),再后來(lái)又掉到45……好玩的是有位女棋手在朋友圈轉(zhuǎn)了這條消息,然后寫(xiě)道:“我想說(shuō),是時(shí)候讓你們體會(huì)體會(huì)女棋手在混雙賽中的壓力了。”確實(shí),一到混雙賽,女棋手常常是戰(zhàn)戰(zhàn)兢兢的,怕下錯(cuò)了。局后古力聽(tīng)了大笑,說(shuō)幸虧阿老師不會(huì)說(shuō)話,不然我肯定要受責(zé)備了。這個(gè)角色轉(zhuǎn)換令人莞爾。
后半盤(pán),黑棋處于劣勢(shì)了,黑方AlphaGo要認(rèn)輸,古力不同意。局后古力說(shuō),他和連笑商量好了,不管哪一方的電腦要求認(rèn)輸,都要拒絕。結(jié)果,阿老師似乎是發(fā)脾氣了,連續(xù)損目,古力只好也拿起牌子來(lái),示意認(rèn)輸,他的同伴爽快接受。這么看來(lái),劣勢(shì)情況下,要率領(lǐng)AlphaGo繼續(xù)兢兢業(yè)業(yè)地收官,不是一件容易的事情。
連笑局后的感想是,和阿老師配合心里很有底。問(wèn)為什么,答中盤(pán)時(shí)覺(jué)得形勢(shì)不好,但是同伴仍然不緊不慢地很穩(wěn)健,所以心就定了,想是不是也沒(méi)有那么糟。一等一的高手形勢(shì)判斷要依仗阿老師了,這又是配對(duì)賽有意思的地方。真希望這樣的對(duì)局多來(lái)幾盤(pán),可以好好欣賞一下人機(jī)配合的各種有趣。
下午是陳耀燁、周睿羊、時(shí)越、羋昱廷、唐韋星五位世界冠軍對(duì)陣AlphaGo。一個(gè)長(zhǎng)條桌上擺著棋盤(pán),四個(gè)人坐在后面,周睿羊在另一面和大家一起討論,他轉(zhuǎn)過(guò)身就是比賽用的正式棋盤(pán),商量定了就由他在盤(pán)上落子。AlphaGo橫空出世后,周睿羊最先采用阿老師的很多下法,贏了不少棋,因此得了一個(gè)“阿爾法羊”的美稱(chēng)。
賽前,大家都不看好這場(chǎng)所謂的群毆,因?yàn)殡p方各兩個(gè)半小時(shí)的用時(shí),對(duì)人類(lèi)一方實(shí)在是太少了,一個(gè)人下都有點(diǎn)緊巴巴的,五個(gè)人稍一討論,十來(lái)分鐘就沒(méi)有了,何況對(duì)面是一秒鐘能算百萬(wàn)步的阿老師,更加覺(jué)得有壓力了。果然,大盤(pán)講解的古力、王磊等一直在為他們擔(dān)心:還不下?。繒r(shí)間又過(guò)去十分鐘啦。想想看,五個(gè)棋風(fēng)不同的高手一起討論,哪能那么快就達(dá)成一致呢?所以,我們?cè)谄聊簧希偸强吹桨柗ㄑ蛟谛?,等著大家統(tǒng)一意見(jiàn)的樣子。
中盤(pán)時(shí),AlphaGo有一個(gè)靠然后小尖的連環(huán)手筋,是屬于讓人大吃一驚的思路。但是據(jù)說(shuō)研究室里柯潔先于AlphaGo擺出了這兩步棋,不禁感慨,柯潔真是最適合大戰(zhàn)AlphaGo的人??!
最后小官子階段,是AlphaGo小勝的局面,讀秒后替換周睿羊坐到棋盤(pán)前的唐韋星在白棋空里二二點(diǎn)了一手。這是一步騙招,完全沒(méi)有棋的地方,但是阿老師很穩(wěn)健地補(bǔ)了一手,損目了,當(dāng)然這和勝負(fù)無(wú)關(guān)。五個(gè)年輕的世界冠軍笑得不可開(kāi)交,有一張他們捂著臉撐著頭笑著的照片瞬間刷爆了朋友圈。這步棋是一種測(cè)試,AlphaGo應(yīng)錯(cuò)了。不過(guò)這不算什么。我們非常想知道,如果補(bǔ)一手會(huì)輸,阿老師還會(huì)像實(shí)戰(zhàn)那樣走嗎?當(dāng)然,答案其實(shí)是很明顯的。
27日第三局結(jié)束后的新聞發(fā)布會(huì)上,哈薩比斯先生宣布AlphaGo將退出圍棋賽事!DeepMind團(tuán)隊(duì)同時(shí)宣布,將陸續(xù)公布AlphaGo左右互搏的50局棋譜,今天先公布10局。我看了幾個(gè)片段,那真的是有著許多可以顛覆圍棋觀的內(nèi)涵,谷歌的武功秘籍公開(kāi)了。
非常感傷,一段傳奇就要這樣離開(kāi)嗎?
回味這場(chǎng)“絕唱”,在傳承方面,AlphaGo吸收了很多前輩高手的精華并予以再創(chuàng)造。在棋局中,我看到它的很多招法有當(dāng)年吳清源老師的影子,心里非常感動(dòng)。也許,上天是通過(guò)AlphaGo映照出了很多職業(yè)棋手在歷史上那些讓人難忘的場(chǎng)景,那些可歌可泣的精神。
三歲的AlphaGo打敗了人類(lèi)幾千年的進(jìn)化。人類(lèi)棋手要戰(zhàn)勝電腦已經(jīng)不可能了。但是,通過(guò)學(xué)習(xí),我們可以在自身的基礎(chǔ)上獲得提高。我想,生活在現(xiàn)代的職業(yè)棋士是幸運(yùn)的,阿老師幫助我們突破自身的局限,使我們能夠以更加自由的心靈和開(kāi)闊的視野去面對(duì)棋盤(pán),也更加能夠體會(huì)圍棋的美好。