亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        對于人類棋手,AlphaGo是怎樣的存在

        2016-03-18 15:21:52李翊
        三聯(lián)生活周刊 2016年12期
        關鍵詞:勝率李世石定式

        李翊

        如果圍棋世界是有層級的,以窮盡圍棋的所有可能得到最優(yōu)解為天,以懂得圍棋基本規(guī)則為地,AlphaGo在四盤棋里表現(xiàn)出的棋力和弱點,讓人類第一次有了伙伴和參照物,知道在天地之間,自己對圍棋的理解處于怎樣的位置。

        劫爭

        和AlphaGo的第一局開局,李世石劍走偏鋒:在他的職業(yè)比賽中從未使用過這一開局,甚至整個圍棋界,沒有人見過這一開局。避開流行布局,甚至避開曾經(jīng)流行過的已經(jīng)被淘汰的布局,李世石在考驗AlphaGo在布局階段的應變能力。然而,在新浪講棋的俞斌認為李世石的下法勉強。“他在試探AlphaGo,但實際上效果并不好?!倍F(xiàn)在回顧比賽,李世石對第一局的看法是:“即使重頭來下,我也覺得沒法贏。我從一開始錯誤估計了它的實力?!?/p>

        李世石對AlphaGo實力的了解,或許更多來自之前樊麾和AlphaGo下的五盤棋。如果僅從這五盤棋所表現(xiàn)出的內(nèi)容看,“AlphaGo大概在職業(yè)初段的水平”。這是俞斌、古力等職業(yè)棋手比較一致的評價。俞斌說,雖然知道5個月的時間里,圍棋AI(人工智能)的水平經(jīng)過深度學習一直在提高,但是能提高到現(xiàn)在這樣的水平,誰都沒有預料到。

        第一局下完,中國圍棋界議論紛紛,圍棋人各種挑錯,各種不服氣,俞斌覺得李世石一開始太冒進,不好。兩局戰(zhàn)罷,俞斌所有的感受只有兩個字形容:“服氣!”

        中國棋手李喆六段

        “原來覺得,開放型復雜局面的對殺,電腦的計算力可能沒那么準確,結果第一局AlphaGo居然扛住了。第二局從后半盤看,AlphaGo或許不能做到百分百的計算正確,但在殘局的計算能力上已經(jīng)遠超人類,這不是單個人類可以抵擋的。就這兩點可以確認,如果AlphaGo還會打劫,那么人類就沒辦法贏它了?!?/p>

        在李世石以比較大的差距輸?shù)舻诙P比賽后,職業(yè)棋手九段羅洗河對李世石回避劫爭的行為提出了質(zhì)疑:“李世石是否和谷歌簽了保密協(xié)議有不準打劫這一條?”這成為幾乎所有人猜測的話題。李世石的棋風被人稱為“僵尸流”,棋入中盤,他常常因出招過分而導致死大龍,在職業(yè)高手看來,這樣一邊倒的局面已可終局,尤其是對于老派的只研究前半盤的中日職業(yè)棋手而言。然而,絕境之中的李世石常常能爆發(fā)出驚人的力量,他一次次地如同僵尸復活一樣滿血歸來,并且總能在最后一刻撞線。“這一局,有兩次機會打劫,而且是在李世石輸定的情況下,不打劫必輸;打劫,按照人腦的計算,如果是人跟人下,有可能贏,因為人會犯錯。但是跟機器下,它如果會處理,人還是可能輸。第二局在形勢明顯落后的情況下,以李世石的性格和棋風,他應該反擊。然而,兩次打劫的機會李世石都放棄了,這可能是大家懷疑他的原因之一?!庇岜笳f,“棋手特別瞧不起那些輸多了還麻木不仁的棋手。我們比較崇敬的,是那些在輸定的情況下還孤注一擲的,這叫勝負心。我們崇敬有勝負心的人。所以,李世石在失敗的情況下沒有選擇相對危險但是有勝機的打劫,我們奇怪。但是看視頻,我覺得他當時并沒有判斷清楚局勢,他應該是對勝負有疑惑,選擇了一條相對穩(wěn)妥的路?!?/p>

        “第二局AlphaGo有一個打劫的機會,但是很長時間都沒提回來。當然不提沒關系,提一下,絕對的先手。但AlphaGo一直不走這一步,這也是懷疑的原因之一?!庇岜筮M一步解釋說,“但這并不能成為AlphaGo害怕打劫的根據(jù)。因為這個劫很輕,也就是價值很小,跟別的棋子都沒關系,所以它沒必要去提。”

        圍棋界有句俗語,臭棋怕打劫。劫爭會是AlphaGo的阿喀琉斯之踵嗎?從俞斌過往和計算機打交道的經(jīng)驗來看,完全有可能。

        打劫,也叫“劫爭”,是指黑白雙方都把對方的棋子圍住,這種局面下,如果輪白下,可以吃掉一個黑子;如果輪黑下,同樣可以吃掉一個白子。因為如此往復就形成循環(huán)無解,所以圍棋禁止“同形重復”。根據(jù)規(guī)則“提”一子后,對方在可以回提的情況下不能馬上回提,要先在別處下一著,待對方應一手之后再回“提”。顧名思義“劫材”就是“打劫”的材料。但是并非所有的劫材都會導致對方應一手,在價值判斷取舍的情況下,對方也可能不應劫而解消劫爭,“劫勝”也叫“消劫”。因為這里涉及找劫材及消劫的價值判斷,是比較復雜的技術。

        大概6年前,李喆曾經(jīng)找了一些職業(yè)棋手做過研究,認為人能做到七路棋盤的最優(yōu)解,計算機如果速度快,也能窮盡七路盤的計算。但是升級到九路盤的時候,電腦靠蠻力窮盡不了,就會出現(xiàn)一些問題,比如明知沒棋的地方也要補一手?!拔腋娔X下九路棋的時候,電腦在領先很多的情況下,自填一眼的事情也干過。”俞斌說,當時最好的對弈軟件,Bug(漏洞)就是劫?!拔覀儑尻牭钠迨指@個電腦下的時候,即使我方形勢不好,只要出現(xiàn)這個Bug,我們就知道贏了。”

        AI面對復雜劫爭時的糟糕表現(xiàn),是蒙特卡洛算法固有的頑疾。去年在北京奪冠的來自韓國的圍棋AI“石子旋風”,在對陣世界冠軍連笑時甚至不能理解循環(huán)劫,不停地找劫來回提,使局面一塌糊涂?!斑@是因為,基于概率,循環(huán)劫也總有打贏的可能。如果基于邏輯,會明白這是不可能的事情?!崩顔凑f,“AlphaGo的算法缺乏邏輯能力,這一點實際在去年10月對陣樊麾時已經(jīng)有所體現(xiàn)。蒙特卡洛算法使它并不是根據(jù)‘邏輯上A優(yōu)于B來做選擇,而是根據(jù)AB各自的勝率來做出決策。但在準確性上,概率不如邏輯?!?/p>

        AlphaGo顯然不是一般的圍棋AI。在和李世石對陣的第三局,它表現(xiàn)出了打劫的能力,雖然這個劫相對封閉,應對并不復雜?!癆lphaGo基本上就打會影響勝率的劫。當不打比打的勝率更低時,就會打劫。但它對打劫的勝率評估會偏低,因為可能性更多,所以它顯得會回避劫。”連著的三局棋,李喆一直站在AlphaGo的角度在觀察它,其間會和Facebook人工智能研究院智能圍棋項目負責人田淵棟博士聯(lián)系。田博士負責開發(fā)的圍棋AI“Dark Forest”和AlphaGo一樣使用了深度學習和蒙特卡洛搜索算法,但仍然無法避免打劫這一Bug。

        “AlphaGo不害怕簡單的劫,但在復雜階段,如連環(huán)劫、循環(huán)劫,很多處劫爭變化,它還會不會做出正確的選擇,目前沒有看到?!庇岜笳f,像連環(huán)劫這樣復雜的劫爭并不是刻意能為之,一百盤里能出現(xiàn)一盤就不錯了。

        失誤還是創(chuàng)新

        在知道谷歌要在《Nature》發(fā)表關于AlphaGo論文的晚上,李喆和田淵棟有過簡單交流,雖然李喆知道“黑暗森林”與傳統(tǒng)的圍棋AI水平持平甚至更好,但是對于谷歌能做到什么程度,誰都不清楚。

        “樊麾的棋譜出來后,我們做了個評估。如果說之前的AI,是職業(yè)棋手讓5子的水平,即普通人通過學習訓練能達到,那么AlphaGo展現(xiàn)出的是讓2子,這是普通人需要經(jīng)過專業(yè)訓練才能達到的。相對于以前的AI,這是個飛躍?!崩顔凑f,當時棋界一片哀嚎,因為能看到的棋譜只有5盤,出于某種自尊,也出于對棋譜的解讀,棋界大致認為樊麾發(fā)揮太差,AlphaGo不足以威脅到職業(yè)棋手?!捌婀值氖牵F(xiàn)在也在質(zhì)疑李世石的水平?!?/p>

        圍棋里有個詞語,手談。圍棋是人與人的競技比賽,是人就會有情緒,多數(shù)時候,會在肢體語言上表現(xiàn)出來。日本古代有個著名的公案,“耳赤之一手”,說的是“本因坊”秀策比賽時下了一子,大家認為他形勢不好。而在一旁觀戰(zhàn)的一個不懂圍棋的醫(yī)生卻認為這是步好棋,因為他看到對手的耳朵紅了。“下棋的時候需要對對方的應對有預估,然后做出判斷和選擇。這種預估一方面基于經(jīng)驗,一方面基于對對方的了解。然而,機器是沒有情緒的,你甚至看不見它。用樊麾的話說,它就是一個虛無,但是它又無處不在?!崩顔凑f,“我曾試著設身處地體會李世石的感受,坐在棋盤邊上,有人在你的對面擺棋,水平不高。你不知道對手,它沒表情,沒動作,緊隨你的落子是唯一的反饋。我們低估了人在面對機器時的感受。換一個人,未必能比李世石做得更好?!?/p>

        大部分人認為,以人類的思維去下就好了,李世石不同,他有大量試探,試圖理解AlphaGo行棋的棋理。

        AlphaGo經(jīng)常會下出一些讓人無法理解的棋,有人認為這是電腦失誤。然而,人類定義的失誤在AI的思維里卻未必是失誤。“在AlphaGo與人類下棋之前,我們認為人能贏的一個原因是覺得電腦不像人會創(chuàng)新。事實上,它表現(xiàn)得比人類更不依賴定式,更會創(chuàng)新。”

        第一盤棋,李世石用了個不在棋譜庫里的開局,結果AlphaGo給出了“不存在”的一手?!八辉谌魏味ㄊ街?,然而,我認為這是好手。好處在于使右中下角的黑子變成效率低下的一手,雖然在右上局部白棋稍稍虧損,但加上右中下黑子的低效,白棋一點也不吃虧?!?/p>

        傳統(tǒng)的圍棋AI,會根據(jù)已有棋譜來走定式,定式是經(jīng)過長期檢驗的局部可以接受的定型。然而定式的弊端就在于,不同的周圍環(huán)境,定式的適用性有所不同。實戰(zhàn)白棋選擇了一個定式里沒有的、局部稍虧的,卻使得另一個遙遠黑子的效率變低的下法,非常清楚地證明了兩點:電腦不依靠背譜來下棋;電腦的考慮基于全局而非局部。

        “人類對失誤的認識有幾種,一種是開放性布局的情況下,一地虧損,從大局看,經(jīng)驗告訴我們擺了十手還是虧,那么人類不會下。第一局AlphaGo在左下角的那一子,人類基于經(jīng)驗判斷會虧損,不能保證是絕對正確的一招;第二種是不能給出明確虧與不虧,也看不出最后是否有問題的下法。但是AlphaGo這么下,從結果導向——贏棋來看沒問題。這種情況下,除非它被人類擊敗,才能證明這是失誤。第三種,從邏輯上能嚴格證明的失誤。在第一盤AlphaGo出現(xiàn)過兩次,右上和右下,在封閉情況下,分別虧了一目棋,可通過計算判斷有失誤。之所以AlphaGo還會這么下,我認為它已經(jīng)判斷贏定了,即使有兩個失誤對勝率也不會有影響,甚至可能其他選擇未必像這個選擇能產(chǎn)生目前的結果。”

        AlphaGo最石破天驚的一招是第二局的黑37尖沖。這一子落下,棋手們紛紛驚嘆:“它想干嗎?”有人說是臭棋,但這個下法卻讓人想起金庸在《天龍八部》里詳述的“珍瓏”棋局:這個“珍瓏”的秘奧,正是要白棋先擠死了自己一大塊,以后的妙招方能源源而生。任何人所想的,總是如何脫困求生,從來沒人故意往死路上去想。若不是虛竹閉上眼睛、隨手瞎擺而下出這著大笨棋來,只怕再過一千年,這個“珍瓏”也沒人能解得開。

        “這雖然不是決定勝負關鍵的一子,但是用人類語言來說,卻是基于對全局虛實的掌握,在子力的相互關系中找到的最為均衡的選點。”李喆說,在人類看來,300多個點里,根據(jù)已有經(jīng)驗知識看來這個點是會虧損而立即排除的一點。然而,從結果上看,這個棋沒虧?!霸谶@個局面下,我也會下這里,但我想不到?!?/p>

        李喆嘗試從AlphaGo的角度去理解?!巴瑯右徊狡澹祟惖乃季S是用道理的形式,辯證(勢、地、厚薄、動靜)來理解棋。而機器是以數(shù)據(jù)的方式求得勝率最高解而非最優(yōu)解。類似這樣的招法,AlphaGo其實是基于全局特定的情況的選擇,而人會有常識性的下法,其實是局部性的判斷?!?/p>

        AlphaGo還有更讓人目瞪口呆的出手。第二局李世石執(zhí)白選擇了最普通的布局應對,下到第12手,李世石心里或許還有一點興奮:這個布局我是見得多了,白棋總是不虧的。然后,看到對方在右下角落下黑13。右下先虎之后脫先中國流,這又是職業(yè)棋譜中從未出現(xiàn)過的布局。通俗的解釋就是:人類棋手認為交換一步棋后一定要拆一個,定式才完。如果你不拆反而在別的地方下了,這就脫先了?!耙郧皩W棋的時候,定式不走完就相當于故事沒講完,老師會罵的?!笨吹竭@一步,李世石站起來,出去抽了根煙。

        抽完煙回來的李世石沒有在黑棋脫先的地方下,而是當右下黑棋沒交換那一下跟著下了?!叭绻钍朗歉讼?,以他的性格和棋風,你敢脫先,我氣勢上一定追究你,會在脫先的地方下,這叫針鋒相對,這叫氣勢??墒菍I來說,氣勢是什么?血性是什么?勝負感是什么?AI只看勝率是什么?!崩顔凑f,所以李世石沒有反擊,跟著下了?!敖?jīng)過昨天的試探,AI不會背譜,人類整體的經(jīng)驗可能是最有力的,李世石要盡可能將局面導回到熟悉的套路中去。即使輸了棋,他也值得所有人尊重,他一直在有針對性地調(diào)整策略,盡力讓人們了解AlphaGo?!?

        吳清源曾經(jīng)說過:不要記定式。但是,對于初學者而言,這是學棋必經(jīng)的一個過程。張三豐說:“記了招式,再忘掉。”AlphaGo以其超出人類經(jīng)驗的下法表示,它做到了。

        弱點

        就AlphaGo秀完莫測高深的棋力讓人類悲觀地以為李世石將被其以5∶0的比分零封時,戲劇性的一幕出現(xiàn)了。AlphaGo竟然在第四局局面占優(yōu)的情況下突然崩潰了。

        比賽開局階段,李世石始終落后于AlphaGo,一直在被吊打。然而,第78手的時候,局勢峰回路轉(zhuǎn),李世石下出了關鍵的一步,一招極其冷門的妙手。對于這一步棋,視頻觀戰(zhàn)的職業(yè)棋手古力評價為“神之一手”。

        隨后,AlphaGo一連串的差手讓棋面局勢利好于李世石。在第97手,AlphaGo再次出現(xiàn)低級失誤,棋盤左下角落白子被李世石果斷吃掉。最終經(jīng)過長達4個多小時的鏖戰(zhàn)之后,AlphaGo中盤認輸。李世石終于在這場人機大戰(zhàn)中贏回“尊嚴”之戰(zhàn)。

        俞斌說,李世石這一步棋,是妙手,給敵人造成很大麻煩,但并非無解?!癆lphaGo至少有兩個變化可以抵擋,然后它依然還能保持優(yōu)勢??墒撬尤粵]有抓住?!?/p>

        AlphaGo在迅速做出應對后,開始出現(xiàn)一連串業(yè)余棋手也不會犯的低級錯誤,導致棋面局勢利好于李世石??吹竭@里,李喆不解地說:“AlphaGo瘋了!”他想不明白為什么?!霸谖铱磥?,不是電腦沒算到這步棋,有可能是因為這步棋產(chǎn)生更多分支變化,接下來可能涉及劫爭,又或者AlphaGo漏算了某一步關鍵的棋?”

        反而是俞斌見怪不怪?!霸瓉砦液陀嬎銠C下的時候,計算機在形勢特別不好的時候也會走一步特別可笑的棋。如果下在別的地方勝率接近0,而其他地方有1%,那么計算機會應在有1%的地方,1%的勝率總強過0。這說明AlphaGo在面對復雜對殺需要精確計算時可能出現(xiàn)問題?!?/p>

        AlphaGo原論文作者之一德米斯·哈薩比斯(Demis Hassabis)在賽后的總結說:“李世石下出白78后,AlphaGo自我感覺良好,在程序的‘價值網(wǎng)絡(用于評估電腦勝率)中,誤以為勝率達到70%,直到第87步才反應過來。短短幾個子的時間,勝率陡降至40%以下。發(fā)現(xiàn)時為時已晚。”

        “出門問問”的CTO、原谷歌研究院領導開發(fā)谷歌基于深度神經(jīng)網(wǎng)絡的離線語音識別系統(tǒng)的人工智能專家雷欣稱,這其中的原因很可能是由于AlphaGo在復雜情況下的判斷還是不夠客觀,碰到?jīng)]見過的下法(如李世石的白78挖)會犯錯誤,而且在犯錯誤的時候不能夠及時發(fā)現(xiàn),會接連出低級錯誤?!皩θ祟悂碚f,如果犯了大錯,應該很快就會發(fā)現(xiàn)并且糾正,但是機器的反應都是連續(xù)的,不能及時做出調(diào)整,這也許是AlphaGo的一個致命弱點?!?/p>

        從專業(yè)技術的角度看,“出門問問”NLP工程師李理認為,如果一定要猜測,可能是開局主要靠“價值網(wǎng)絡”,因為搜索空間太大,有可能在某些特殊的局面下出現(xiàn)非常差的結果。就像之前神經(jīng)網(wǎng)絡識別圖片時也出現(xiàn)過很詭異的錯誤,還有人研究怎么構造讓它識別出錯的例子。

        這和李世石賽后的實戰(zhàn)分析頗為吻合。賽后李世石談到AlphaGo的弱點時說:“AlphaGo覺得當它用黑棋時更難贏而不是白棋。當它遇到出其不意的招數(shù)時,有可能會導致失誤。我發(fā)現(xiàn)AlphaGo執(zhí)黑棋時似乎掙扎比較多。”李喆分析:“執(zhí)黑先行要主動選擇搜索路徑,黑棋下第一步的勝率低。此外,按照中國規(guī)則,黑棋要貼7目半,即三又四分之三子?!?/p>

        “從谷歌的角度來說,這盤棋幫助他們找到了AlphaGo的一個弱點,以后可以更有針對性地去解決這個問題。如果不是李世石這種頂尖棋手,也許很久也發(fā)現(xiàn)不了這個弱點,因為水平差距太大根本沒有機會逼得AlphaGo犯錯。從李世石的角度來看,這也是一個巨大的勝利,證明至少目前人類選手對戰(zhàn)人工智能還是有機會的。人工智能雖然計算能力強大,但還是會犯錯誤,并且是很低級的錯誤。這樣,人類棋手不會把人工智能神話,以后對戰(zhàn)的心態(tài)會更好?!崩仔勒f。

        猜你喜歡
        勝率李世石定式
        一種生成殘局數(shù)據(jù)庫的倒推算法
        基于預期收益策略與UCT的德州撲克算法
        養(yǎng)生方法定式多 因人而異是關鍵
        隨機線性互補問題的無約束優(yōu)化再定式
        突破思維定式,強化解題方法
        堅韌自信的李世石
        人機大戰(zhàn)
        2014—2015年中國女子籃球職業(yè)聯(lián)賽單節(jié)得失分與比賽結果相關性分析
        李世石不代表人類
        汽車觀察(2016年3期)2016-02-28 13:16:18
        CBA球隊主客場勝率及得失分與比賽結果排名的相關性研究
        香港台湾经典三级a视频| 日韩av在线不卡观看| 美女人妻中文字幕av| 亚洲精品一区三区三区在线| 欧美成人午夜免费影院手机在线看| 亚洲狠狠婷婷综合久久久久图片| 國产一二三内射在线看片| 无码AⅤ最新av无码专区| 白色白色视频在线观看| 国产精品视频自拍在线| 性色av免费网站| 玩两个丰满老熟女| 日韩人妻无码精品二专区| 免费观看在线视频播放| 日日碰日日摸日日澡视频播放 | 亚洲深深色噜噜狠狠网站| 国产精品网站在线观看免费传媒 | 国产免费一区二区三区最新不卡| 国产不卡一区在线视频| 中文字幕女同人妖熟女| 国产麻豆剧果冻传媒一区| 真实国产老熟女粗口对白| 午夜影院91| 日本在线无乱码中文字幕| 亚洲综合精品中文字幕| 最近中文字幕大全在线电影视频| 久久久亚洲av波多野结衣| 国产农村妇女毛片精品久久| 98在线视频噜噜噜国产| 99久久亚洲精品加勒比| 天堂av网手机线上天堂| 人人摸人人搞人人透| 乱码一二三入区口| 网红极品女神精品视频在线| 国产一区二区av免费观看| 24小时日本在线视频资源| 人妻被黑人粗大的猛烈进出| 久久久精品人妻一区二区三区日本| 蜜桃高清视频在线看免费1| 久久久久亚洲av片无码| ā片在线观看|