王杰夫
4月17日,和人工智能系統(tǒng)AlphaGo的賽程敲定后的一周內(nèi),柯潔將自己的微博昵稱從“柯潔大棋渣”改為“棋士柯潔”。他清楚,自己將不僅僅以柯潔的身份,而是作為所有棋手的代表,帶著人類的尊嚴(yán)去迎戰(zhàn)一個超人般的存在。
一個月之后的5月23日,DeepMind研發(fā)的圍棋人工智能AlphaGo與排名世界第一的柯潔(九段)在浙江烏鎮(zhèn)對戰(zhàn)三局。和“人機大戰(zhàn)”第一季有所不同的是,這一次無論輸贏都會下滿三盤,雙方各有三小時。
在場的每個人似乎都已判定,這是一場必輸?shù)谋荣?。判斷柯潔必敗的理由很簡單,今年農(nóng)歷新年前夕, AlphaGo曾化名Master現(xiàn)身中國線上圍棋對戰(zhàn)平臺,一周內(nèi)60戰(zhàn)60捷,無一敗績,柯潔參與了其中三盤,三戰(zhàn)皆敗。
2016年12月30日,柯潔與Master兩戰(zhàn)兩敗?!跋袷潜淮蛄艘挥浝錁?,這是哪個世外高人啊,”柯潔回憶道,“與李世石對戰(zhàn)的V18(AlphaGo)還是人類的下法,但Master下棋很仙?!边@也是他一開始不相信Master是AlphaGo的原因—它的進(jìn)步實在太快了。
在接下來的半年時間里,為了鉆研Master的棋譜,柯潔幾乎廢寢忘食,把Master下的60盤棋譜找來研究,試圖理解對方的下法。后者基于策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò)算法背后的人工智能系統(tǒng),對圍棋的布局、開局都超越了人類的想象。2017年1月3日再次敗北后,柯潔的身體再也支撐不住,急性腸胃炎將他送進(jìn)了醫(yī)院,這也是他人生中第一次住院。
在烏鎮(zhèn)比賽之前,沒有人比柯潔自己更清楚,幾乎沒有人相信他能贏。
但沒有多少人能體會到,柯潔承受著一名職業(yè)棋手可能承受的最沉重的壓力。在對戰(zhàn)的前一天夜里,他在新浪微博上發(fā)表《最后的對決》,表示與AlphaGo的三番棋會是他與人工智能最后的三盤棋?!拔沂且幻迨?,作為棋手,從來只有輸和贏,輸棋的痛苦,外人無法想象。只有勝利是唯一真諦,所以不惜我的一切,真的去拼了?!?/p>
第一天的比賽結(jié)束后,柯潔解釋了這個決定背后的原因:“與人工智能的差距不是靠自身努力可以彌補的?!彪S著將來人工智能的繼續(xù)發(fā)展,獲勝的可能也越來越渺茫。
5月23日的第一場,下午2點51分,這場持續(xù)4小時17分鐘,共計289手的對弈結(jié)束了??聺嵤胀炅俗詈笠粋€單官(單官即占不到棋盤上空交叉點的一手棋),一只手在自己的棋盒里打著轉(zhuǎn),另一只手托著腮,眼睛直勾勾地盯著棋盤,似乎想從裁判的手中再摳出哪怕半子。但結(jié)果如同他已經(jīng)心算過幾十遍的數(shù)字—落后1/4子。
在一個多月的備戰(zhàn)中,柯潔曾反復(fù)思考擊敗AlphaGo的策略。在當(dāng)天的比賽中,他在第三手就用了AlphaGo擅長的點三三下法,希望能夠借此取得優(yōu)勢。然而出乎柯潔的意料,AlphaGo不但處理得很好,反而還占了上風(fēng)。
“我印象中它是非常貪戀實地的,今天這盤棋(我)也在貫徹先撈后洗的策略,沒想到被它打破了意圖,棋完全進(jìn)入了它的調(diào)子中,”柯潔說,“如果用棋手比喻,這個AlphaGo和去年完全是兩個人,那一次他的棋很接近人類,但現(xiàn)在更接近我理解中的圍棋上帝。”
在很多人眼里,柯潔以1/4子這個圍棋中影響勝負(fù)的最小目數(shù)落敗,至少說明雙方的差距不是很大。然而對于只在乎如何實現(xiàn)勝率最大化的AlphaGo來說,它要確定風(fēng)險最小的獲勝機會,或許與柯潔這樣的高手對弈時,每擴大一點目數(shù)的優(yōu)勢就意味著風(fēng)險的提高。
柯潔很清楚,盤面上看他只輸了1/4子,但這是AlphaGo給的安樂死?!埃∕aster的)60盤棋每個人都是安樂死的,”這是柯潔最不想看到的輸法,“死得太安逸了?!?/p>
5月25日第二場,柯潔中盤告負(fù),但這卻是他離戰(zhàn)勝AlphaGo最近的一場。
這一場,柯潔的戰(zhàn)術(shù)表現(xiàn)堪稱完美。他主動出擊,全場引戰(zhàn),試圖將局面復(fù)雜化,以干擾AlphaGo對于局面的判斷。整場戰(zhàn)斗,需要巨量的計算力作為支撐,圍棋盤上職業(yè)棋手以下出“四龍”或“六龍對殺”(即六塊棋互相絞殺)局面為榮,當(dāng)?shù)降?14手棋時,棋局被柯潔拉升到十龍對殺。
“在前50手,柯潔的每一手都是AlphaGo計算中的最佳解,”AlphaGo之父、DeepMind創(chuàng)始人Demis Hassabis向所有人透露了后臺的數(shù)據(jù):“而在前100手也從來沒有哪位棋手能夠像柯潔這樣與AlphaGo Master版本在勝率上咬得如此之緊?!?/p>
柯潔賽后稱,自己曾經(jīng)一度有“可能戰(zhàn)勝AlphaGo”的預(yù)感,這也是當(dāng)時在比賽現(xiàn)場他反復(fù)用手按住胸口的原因,“我的心在跳,我想讓他跳得慢一點?!钡珮O度的興奮卻影響了他的判斷,在關(guān)鍵手上出現(xiàn)失誤。
不過,這一場證明了柯潔的想法,與其安樂死,不如玉石俱焚。他請求最后一場繼續(xù)執(zhí)白,這樣更方便引導(dǎo)AlphaGo進(jìn)入火拼狀態(tài)。
遺憾的是,奇跡并沒有出現(xiàn)。在5月27日的最后一場,柯潔在布局階段就走出惡手,在之后的棋局中,AlphaGo沒有出現(xiàn)任何失誤,他毫無機會地輸?shù)袅吮?賽。
比賽中,在局面不利時,柯潔一度離開棋場。他躲在比賽的宣傳板后,一個人失聲痛哭,比賽停滯了20分鐘,直到裁判長找到他。
當(dāng)比賽宣告結(jié)束時,柯潔的戰(zhàn)斗似乎還沒有停止。他左手手肘支著臉頰,右手執(zhí)著的在棋盤的左上方碼著棋子,把幾個子摳掉,又把幾個子填回來,像是希望在這里使用什么時間倒流的魔法。
“今天我有點失態(tài),和AlphaGo下棋非常痛苦?!笨聺嵲谫惡竺襟w發(fā)布會上說道,聲音有些哽咽,“每一步我擔(dān)心的棋它都會下,而我想不到的棋它都能下得更好,它太過完美了。”
應(yīng)戰(zhàn)一場勝算幾乎為零的比賽,柯潔沒有選擇退縮的原因或許很簡單。這名90后的世界冠軍少年,曾在新浪微博上多次吐槽沒人看圍棋比賽,即使有直播也沒人看,在他看來,和贏同樣重要的是希望有更多人喜歡圍棋—這項可以向人類智慧致以最高敬意的游戲。
身為棋士的驕傲讓柯潔難以接受自己輸?shù)萌绱穗y堪,但身為人類的觀眾更在意的是他在與人工智能對決中,展現(xiàn)出來的獨屬于人類的品質(zhì)—榮譽、智慧與英勇。在當(dāng)天的發(fā)布會現(xiàn)場,每當(dāng)柯潔說完一句話,現(xiàn)場都會響起鼓勵的掌聲。
柯潔輸?shù)袅吮荣?,但這三場人類頂尖棋手與人工智能的對決,將成為圍棋世界的寶貴財富。AlphaGo的開發(fā)公司DeepMind在賽后表示,他們將與柯潔合作,深入研究三盤對局,共同分析比賽,并將分析做成視頻與全球的圍棋愛好者共同分享。
毫無疑問,AlphaGo的出現(xiàn)對于每一位職業(yè)圍棋手都意義重大。周睿羊(九段)現(xiàn)在尊稱AlphaGo為“阿老師”,即便面對的是冷冰冰的機器。“AlphaGo的對局讓我們感受到圍棋的自由性,沒有任何一招棋是絕對不可能的。如今,每一名棋手都在嘗試新的風(fēng)格,這在過去是不可想象的?!敝茴Q虮硎?。
圍棋一直被認(rèn)為是最復(fù)雜的策略性游戲,也是人工智能難以攻破的終極智力活動。即使1997年,IBM的電腦“深藍(lán)”(Deep Blue)戰(zhàn)勝了當(dāng)時的國際象棋世界冠軍卡斯帕羅夫,大多數(shù)人仍然這么認(rèn)為。
但現(xiàn)在,超越深藍(lán)的人工智能出現(xiàn)了。
對于站在歷史變革節(jié)點的柯潔來說,某種程度上,他也是幸運的。雖然在賽前,他曾調(diào)侃AlphaGo始終是冷冰冰的機器,感覺不到它對圍棋的熱情和熱愛。但不可否認(rèn)的是,AlphaGo的棋風(fēng)正在激發(fā)人類棋手挑戰(zhàn)創(chuàng)新的邊界,并賦予一些傳統(tǒng)套路以新的生命。
在和AlphaGo比賽結(jié)束的兩天后,柯潔輕松晉級LG杯世界圍棋棋王戰(zhàn)32強。在序盤階段,他用了對付AlphaGo的點三三下法,中盤期間,帶有“阿老師”風(fēng)格的招法也隨處可見。
取得大勝后的柯潔恢復(fù)了心情,賽后他在新浪微博上寫道:現(xiàn)在才發(fā)覺,原來和人類下棋,是可以這么的輕松、自在、快樂。下圍棋真好。