丁陽
在“阿法狗”的締造者哈薩比斯身上,我們能看到很多歐美工程師身上看得到的一些氣質(zhì),而中國人在這方面是非常缺乏的,這不僅僅是體制問題,更多的是文化觀念方面的問題,有些東西是非常值得我們學(xué)習(xí)的。
經(jīng)歷了一盤偉大的勝利后,李世石與“阿法狗”(AlphaGo)的圍棋人機(jī)大戰(zhàn)正持續(xù)引發(fā)著關(guān)注。
對于創(chuàng)造出“阿法狗”的DeepMind公司來說,輸?shù)粢槐P棋并不是什么壞事,反而很高興。終于有人類發(fā)現(xiàn)了“阿法狗”的弱點(diǎn),以幫助它進(jìn)行改進(jìn)。而“阿法狗”的強(qiáng)大,已經(jīng)在前三盤展現(xiàn)得淋漓盡致,這真是一個(gè)偉大的成就。
如此了不起的人工智能程序,到底是怎樣的人把它創(chuàng)造出來的呢?考察一下杰米斯·哈薩比斯,這位DeepMind公司創(chuàng)始人的經(jīng)歷,你會(huì)發(fā)現(xiàn),這并不是偶然。
一個(gè)英國天才
1月下旬,谷歌旗下的DeepMind公司公布其創(chuàng)造的“阿法狗”圍棋程序擊敗了人類職業(yè)選手、歐洲冠軍樊麾,這一消息震撼了主要聚集在東亞的整個(gè)圍棋圈。在Deepmind公司公布的一段視頻中,有人就留意到,在“阿法狗”與樊麾對弈時(shí),“阿法狗”的介紹標(biāo)簽上貼著一個(gè)英國國旗。而這一次“阿法狗”挑戰(zhàn)韓國的世界冠軍李世石,現(xiàn)場的選手信息介紹中,也同樣給“阿法狗”貼上了一個(gè)英國國旗。
在“阿法狗”3:0戰(zhàn)勝李世石后,這一做法顯然可以做一些解讀——來自英國的程序,在圍棋這一古老的東亞智慧游戲上,戰(zhàn)勝了來自東亞的人類。
首要的,還是要去了解Deepmind這家偉大的公司以及“阿法狗”的團(tuán)隊(duì),其關(guān)鍵人物毫無疑問就是英國人杰米斯·哈薩比斯。
1976年的倫敦北部,哈薩比斯誕生在一個(gè)有希臘-塞浦路斯混血的父親和新加坡-中國混血的母親的家庭中,是3個(gè)孩子中的老大。4歲時(shí),他就對國際象棋表現(xiàn)出濃厚的興趣;8歲編寫自己的計(jì)算機(jī)游戲;13歲國際象棋達(dá)到大師水平,在一次歐洲比賽上僅輸給了一代名將小波爾加;17歲就作為主力程序員,開發(fā)了最早包含AI的游戲之一“主題公園”;20歲從劍橋大學(xué)獲得計(jì)算機(jī)科學(xué)雙重一級(jí)榮譽(yù)學(xué)位;不久之后創(chuàng)辦自己的開創(chuàng)性視頻游戲公司Elixir;從游戲界退出后,回到科研領(lǐng)域,在海馬體和情節(jié)記憶方面進(jìn)行了開拓性的學(xué)術(shù)研究;隨后又創(chuàng)辦了DeepMind公司,迄今為止在人工智能領(lǐng)域創(chuàng)造了一個(gè)又一個(gè)的奇跡。
以上還只是哈薩比斯驚人履歷的一部分,像保持著蟬聯(lián)5屆腦力奧林匹克運(yùn)動(dòng)會(huì)全能腦力王稱號(hào)紀(jì)錄這樣的成就,還塞不進(jìn)他的簡歷之中。毫無疑問,哈薩比斯是一個(gè)非凡的英國智力天才。
哈薩比斯暢游在游戲的海洋中,但人工智能一直是他的終極目標(biāo)
很容易就留意到,哈薩比斯的履歷與游戲有很大的關(guān)系,但并不純粹是因?yàn)樗麗弁?。從一開始,他選擇開發(fā)的游戲就與“人工智能”有密切的關(guān)系。17歲他在牛蛙公司主導(dǎo)“主題公園”的開發(fā)——這是一款二十年前風(fēng)靡一時(shí)并極受好評(píng)的游戲,游戲有很強(qiáng)的自由度和樂趣,非常強(qiáng)調(diào)智慧。通過開發(fā)《主題公園》,他意識(shí)到如果繼續(xù)發(fā)展人工智能,那么人工智能將發(fā)揮巨大的力量。隨后他還參與開發(fā)了著名的“善與惡”,也是以人工智能為主題的,這款游戲采用了強(qiáng)化學(xué)習(xí)技術(shù),迄今他還認(rèn)為這是到目前為止游戲中最復(fù)雜的人工智能應(yīng)用案例。
在哈薩比斯看來,當(dāng)時(shí)他所做的事情就是在開發(fā)技術(shù)極其領(lǐng)先的人工智能。因?yàn)楫?dāng)時(shí)所有新技術(shù)都尚未普及,也沒有得到大規(guī)模應(yīng)用,包括神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等如今時(shí)髦的概念。在他看來,最優(yōu)秀的人工智能技術(shù)一直存在于游戲之中。他自己創(chuàng)辦的Elixir公司,開發(fā)的也是與人工智能技術(shù)非常相關(guān)的游戲。
但在2004至2005年的時(shí)候,當(dāng)哈薩比斯意識(shí)到,很明顯游戲行業(yè)走上了與90年代不同的發(fā)展方向——“90年代的游戲很有趣,具有創(chuàng)新性。當(dāng)你想到一個(gè)點(diǎn)子時(shí),就可以將其開發(fā)出來。而到00年代,游戲更強(qiáng)調(diào)圖像、內(nèi)容IP,類似FIFA的游戲大行其道。因此,游戲行業(yè)不再有趣?!薄@時(shí),哈薩比斯選擇了退出。他選擇了攻讀神經(jīng)科學(xué)的博士學(xué)位,希望從大腦解決問題的方式中獲得人工智能技術(shù)的靈感。
哈薩比斯退出游戲界,毫無疑問是游戲界的重大損失。但對于人工智能領(lǐng)域而言,則是迎來了技術(shù)上的革命者。
DeepMind公司不是為了更好地打游戲而研究AI,目的是解決人類重大問題
創(chuàng)辦DeepMind公司后,哈薩比斯實(shí)際上以另一種方式回歸了游戲業(yè)。即用神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的方式來訓(xùn)練AI玩游戲。在哈薩比斯看來,這是攻關(guān)人工智能技術(shù)的捷徑。不管是前年公布的用AI來玩雅達(dá)利小游戲,還是開發(fā)“阿法狗”來挑戰(zhàn)古老的東方智慧游戲圍棋,都是DeepMind公司研究項(xiàng)目主線范圍內(nèi)的事情,其目的就是使用通用用途的機(jī)器學(xué)習(xí)技術(shù),讓機(jī)器自己學(xué)會(huì)并精通這個(gè)游戲?!鞍⒎ü贰钡南乱徊绞?,拋棄所有的已知圍棋知識(shí),從零開始自己跟自己下,看看能發(fā)展到多高等級(jí)、能玩得多好。
但玩游戲或下圍棋并不是DeepMind公司本身的目的,他們希望將這些技術(shù)應(yīng)用于重要的現(xiàn)實(shí)世界的問題上,比如氣候建?;蚴菑?fù)雜病癥分析上。他們已經(jīng)跟英國衛(wèi)生部門進(jìn)行了合作。
哈薩比斯代表了一類歐美科學(xué)家、工程師身上的氣質(zhì)
哈薩比斯對圍棋的興趣,來自于大學(xué)時(shí)期。他曾在劍橋的一個(gè)高水平圍棋社團(tuán)里學(xué)習(xí)圍棋,并很快沉迷其中。但是因?yàn)槊τ陔娔X方面的工作,他沒有足夠時(shí)間去練習(xí),圍棋技藝僅停留在業(yè)余一段水平。不過,這并不妨礙他喜歡圍棋。
這是圍棋在歐美傳播的一個(gè)典型案例。歐美大約有幾十萬人喜歡圍棋,集中在大學(xué)和科技界,他們的圍棋水平遠(yuǎn)遠(yuǎn)不如把圍棋當(dāng)作競賽或者消遣的東方人,但對圍棋中反映的博弈、數(shù)學(xué)等問題有極大的興趣。這正是歐美科學(xué)家、工程師身上特有的“極客”特質(zhì)(Geek,美國俚語中意指智力超群,善于鉆研但不愛社交的學(xué)者或知識(shí)分子)。正是這樣的特質(zhì)讓他們往往能夠使人類在很多重大問題上取得突破。
這些“極客”特質(zhì)不會(huì)給人類似于中國“書呆子”的印象。哈薩比斯其他方面的愛好也非常廣泛,看村上春樹的《1Q84》,聽萊昂納德·科恩帶有詩意的歌曲,看《星際穿越》電影,是利物浦足球隊(duì)的死忠,并且玩各類桌游和德州撲克。在他看來,生活與工作是一致的,興趣上的口味和投入能反哺到工作之中。
在企業(yè)發(fā)展發(fā)面,哈薩比斯同樣有強(qiáng)大的能量,他估計(jì)自己花費(fèi)了“至少和思考算法一樣多的時(shí)間來思考DeepMind的運(yùn)轉(zhuǎn)效率”,并將這家公司描述為“調(diào)和了最好的學(xué)術(shù)圈與最激動(dòng)人心的初創(chuàng)企業(yè),擁有令人難以置信的能量來為創(chuàng)造力和成就助力?!?/p>
或許,以上就是哈薩比斯和DeepMind公司能取得如此成就的部分原因吧。