借助人工智能,或許能揭開(kāi)有關(guān)生命運(yùn)作方式的部分奧秘?!?戴密斯·哈薩比斯(Demis Hassabis)是人工智能公司DeepMind的聯(lián)合創(chuàng)始人。他領(lǐng)銜的團(tuán)隊(duì)近期解決了生物學(xué)的一大艱深問(wèn)題。
比賽前的媒體造勢(shì)階段,李世石很是自信。他即將和一位特殊的選手對(duì)弈——人工智能圍棋程序AlphaGo。不過(guò),身為人類頂尖棋手之一的李世石認(rèn)為自己會(huì)輕松獲勝。“我覺(jué)得,AlphaGo的基本機(jī)制是概率計(jì)算,只不過(guò)是一臺(tái)機(jī)器而已。”李世石當(dāng)時(shí)這么說(shuō)。即便是在輸?shù)舻谝粓?chǎng)比賽之后,他也認(rèn)為這只是因?yàn)锳lphaGo不會(huì)犯錯(cuò)。接著,在第二場(chǎng)對(duì)局之中,這個(gè)人工智能程序下出了如今已是聲名在外的第37手。AlphaGo就像改寫(xiě)了圍棋規(guī)則一樣,下出了根本不會(huì)有人類想到的一手棋。最終以1:4的總比分輸?shù)舯荣惖睦钍朗@呆了:“這手棋實(shí)在是太有想象力、太巧妙了?!?/p>
李世石和AlphaGo的這個(gè)五番棋比賽是人工智能發(fā)展歷程中的重要時(shí)刻,而德米斯·哈薩比斯正是推動(dòng)人工智能發(fā)展的主要人物之一。2010年,他與合作者共同創(chuàng)建了DeepMind公司,并且開(kāi)始研發(fā)比人類圍棋水平更高的人工智能。那個(gè)時(shí)候,人們普遍認(rèn)為,人工智能很難精通圍棋,畢竟這項(xiàng)棋類運(yùn)動(dòng)中可能出現(xiàn)的變化要比宇宙中的原子總數(shù)還多。然而,AlphaGo在2016年戰(zhàn)勝了李世石,這也讓DeepMind——以及哈薩比斯——迅速成為全世界的焦點(diǎn)。1997年,IBM公司的“深藍(lán)”擊敗了國(guó)際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov)。AlphaGo在2016年的這場(chǎng)勝利是繼深藍(lán)之后,人工智能的又一大重要時(shí)刻。
2016年之后,DeepMind——現(xiàn)在,哈薩比斯的這家公司已經(jīng)隸屬于谷歌的母公司Alphabet了——一直在完善算法,并且把目光投向了棋類項(xiàng)目以外。2020年11月,DeepMind開(kāi)發(fā)的新人工智能程序AlphaFold破解了預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)這一極為艱深的生物學(xué)問(wèn)題。哈薩比斯認(rèn)為,這還只是人工智能在科學(xué)領(lǐng)域發(fā)揮作用的開(kāi)端。就此,《新科學(xué)家》(New Scientist)雜志編輯蒂莫西·雷維爾(Timothy Revell)采訪了哈薩比斯。
目前的目標(biāo)是什么?
我們的愿景是解決人工智能問(wèn)題。具體來(lái)說(shuō),就是從根本上認(rèn)識(shí)智能,并且通過(guò)人工手段再現(xiàn)智能,然后再利用人工智能幫助我們認(rèn)識(shí)世界,從而產(chǎn)生積極影響。加快科學(xué)發(fā)現(xiàn)的腳步就是我們希望看到的積極影響之一。
具體哪些類型的智能應(yīng)該編碼在人工智能程序中,你們是怎么確定的?
神經(jīng)科學(xué)給了我們很多啟示。我本人既有神經(jīng)科學(xué)背景,又有計(jì)算科學(xué)背景:我本科階段學(xué)習(xí)計(jì)算機(jī)科學(xué),博士階段則從事神經(jīng)科學(xué)研究。人類大腦的能力及運(yùn)作方式給了我們靈感,也讓我們確定了將神經(jīng)科學(xué)同計(jì)算機(jī)科學(xué)聯(lián)系在一起的目標(biāo)。
你們現(xiàn)在所做的項(xiàng)目中,最令人激動(dòng)的是哪些?
DeepMind目前研究的項(xiàng)目有很多。首先,我們要認(rèn)證那些令我們感興趣同時(shí)具有學(xué)科交叉屬性的科學(xué)問(wèn)題。要想有所建樹(shù),明確的目標(biāo)和一定量的訓(xùn)練數(shù)據(jù)都是必需的。另一個(gè)我們重點(diǎn)考慮的因素是影響力:如果我們解決了這個(gè)問(wèn)題,是否就能開(kāi)啟某個(gè)全新的科學(xué)分支?蛋白質(zhì)折疊問(wèn)題就符合我剛才所說(shuō)的全部要求。除此之外,我們還關(guān)注量子化學(xué)、數(shù)學(xué)、物理學(xué)和材料科學(xué)等領(lǐng)域的前沿問(wèn)題。
在蛋白質(zhì)方面已經(jīng)取得了重大成就。當(dāng)初,為什么你們會(huì)選擇這個(gè)項(xiàng)目?
在我看來(lái),蛋白質(zhì)是一種非常精致的結(jié)構(gòu)。它們就像一臺(tái)臺(tái)微型生化機(jī)器,在我們身體的各個(gè)部位轉(zhuǎn)運(yùn)養(yǎng)分。它們是開(kāi)關(guān)、是馬達(dá)、是一座座小工廠。從數(shù)學(xué)角度和計(jì)算機(jī)科學(xué)的角度來(lái)看,那種層面上的生物學(xué)開(kāi)始變得有點(diǎn)數(shù)字化,并且?guī)缀蹙拖裼?jì)算機(jī)編碼一樣,確實(shí)很有意思。
目前,我們只知道大約10萬(wàn)種蛋白質(zhì)的結(jié)構(gòu),可是,自然界中總共有大約2億種蛋白質(zhì),這個(gè)比例實(shí)在是很小了。
如果能解決蛋白質(zhì)折疊的問(wèn)題,就很可能能夠加速藥物的研發(fā)過(guò)程。借助人工智能,我們或許能以比傳統(tǒng)實(shí)驗(yàn)(這種方法速度慢、難度大,還牽扯很多人力、物力)快得多的速度揭開(kāi)部分有關(guān)生命運(yùn)作方式的奧秘,從而更深入地認(rèn)識(shí)疾病。我認(rèn)為,未來(lái)10~20年中,科學(xué)領(lǐng)域的一項(xiàng)重大轉(zhuǎn)變會(huì)是:通過(guò)這種計(jì)算機(jī)科學(xué)的方式認(rèn)識(shí)越來(lái)越多的生物學(xué)內(nèi)容。
蛋白質(zhì)結(jié)構(gòu)非常復(fù)雜,通常需要數(shù)年的實(shí)驗(yàn)才能確定
人工智能可以幫助我們?nèi)〉媚男﹤鹘y(tǒng)方法無(wú)法企及的生物學(xué)成就?
20世紀(jì)初,人類已經(jīng)取得了許多相對(duì)容易的科學(xué)成就——雖說(shuō)是相對(duì)容易一些,但也需要像愛(ài)因斯坦這樣的天才才能完成。如今,我們面對(duì)的是更為復(fù)雜的系統(tǒng),它們本身并不是某幾條簡(jiǎn)單的定律就能描述的。就目前的情況來(lái)說(shuō),人們普遍認(rèn)為,生物學(xué)實(shí)在太過(guò)復(fù)雜,太缺少規(guī)律性,因而無(wú)法應(yīng)用傳統(tǒng)物理學(xué)方法加以研究。不過(guò),計(jì)算機(jī)科學(xué)和人工智能或許可以幫助我們跨過(guò)這道鴻溝。在我看來(lái),這正是人工智能的最佳應(yīng)用領(lǐng)域。
你可以把它看作一位隨時(shí)能為你服務(wù)的世界最佳科研助手。人工智能能夠找到合適的模式,它們可以從各種各樣的論文中找出看似不相干的信息,并發(fā)現(xiàn)其中的聯(lián)系。至于目標(biāo)以及目標(biāo)重要性的確定,則仍是人類科學(xué)家的責(zé)任。博士生現(xiàn)在做的很多工作都比較枯燥且缺乏創(chuàng)造性,如果能引入人工智能這樣的自動(dòng)化系統(tǒng),省掉一些這樣的苦差事,就能解放學(xué)生,讓他們有精力思考更有創(chuàng)新性的解決方案。
有一種批評(píng)觀點(diǎn)認(rèn)為,像AlphaFold這樣的系統(tǒng),它們可以很擅長(zhǎng)某項(xiàng)任務(wù),但做不了其他任何事情。我們是否需要從根本上重新審視人工智能,讓它們從設(shè)計(jì)上就變得更通用一些?
不,我認(rèn)為不需要。不過(guò),這個(gè)批評(píng)還是有道理的。我們之前開(kāi)發(fā)過(guò)一款叫作AlphaZero的程序,它會(huì)所有一對(duì)一的棋類項(xiàng)目,并且可以在不做任何修改的前提下與對(duì)手對(duì)弈,但它有個(gè)缺點(diǎn),就是每從事一項(xiàng)新項(xiàng)目都得從頭學(xué)習(xí),沒(méi)有觸類旁通的能力。AlphaZero學(xué)到的東西沒(méi)法遷移。有些人會(huì)說(shuō),這也沒(méi)什么,你們有通用的算法就行了。還有些人則不會(huì)滿足于這點(diǎn)。
我個(gè)人認(rèn)為,如果某個(gè)人工智能程序主要學(xué)習(xí)的是國(guó)際象棋,那么它對(duì)圍棋的認(rèn)識(shí)至少也不能是零,肯定要有一些能夠遷移的東西。人類在這方面就做得特別好,畢竟我們顯然負(fù)擔(dān)不起每執(zhí)行一個(gè)新任務(wù)就從頭學(xué)起的代價(jià)。這就叫遷移學(xué)習(xí),并且也是人工智能目前沒(méi)有攻破的難關(guān)。遷移學(xué)習(xí)是一個(gè)非?;钴S的研究領(lǐng)域,我個(gè)人目前也在做這方面的研究。當(dāng)然,我們或許還需要更多的模塊,比如情境記憶和注意力機(jī)制。
這些新增模塊會(huì)在哪些方面起作用呢?
人類大腦似乎至少擁有兩個(gè)計(jì)算模塊。其一是大腦皮層,這個(gè)模塊學(xué)習(xí)速度比較慢,而且需要大量案例學(xué)習(xí),但勝在穩(wěn)定。另一個(gè)模塊就是海馬體,這也是我博士生階段研究的課題。海馬體是人類大腦的關(guān)鍵部件,并且擁有極快的學(xué)習(xí)能力。你是怎么記住昨天午餐吃了什么的?全靠海馬體。
于是,你或許會(huì)有這種疑問(wèn),為什么人類大腦沒(méi)有進(jìn)化出一個(gè)超大的海馬體?學(xué)習(xí)速度肯定是越快越好嘛。實(shí)際上,老鼠的大腦基本上就是一個(gè)巨大的海馬體,并且,從體型大小來(lái)評(píng)判,這種動(dòng)物算得上很聰明了。然而,問(wèn)題在于——當(dāng)然,這只是我個(gè)人的猜測(cè)——如果你只是學(xué)習(xí)速度快,那么學(xué)到新東西之后,未必能穩(wěn)定把這些知識(shí)保留下來(lái)。你在學(xué)騎自行車的時(shí)候,可能要把彈鋼琴的專長(zhǎng)給忘掉。因?yàn)槟銓W(xué)得實(shí)在是太快了,沒(méi)法控制具體哪些知識(shí)會(huì)被覆蓋。
如果你現(xiàn)在正努力在已有知識(shí)結(jié)構(gòu)的頂層構(gòu)筑新知識(shí)體系,那么肯定不希望大腦那么不穩(wěn)定。不過(guò),另一方面,你肯定不想黃昏時(shí)分在水坑里遇到獅子兩次以上才發(fā)現(xiàn)這種情況真的很危險(xiǎn)。因此,大腦皮層和海馬體這兩種系統(tǒng)你都需要,而且很可能還需要這兩個(gè)系統(tǒng)之間的某種遷移學(xué)習(xí)功能。這正是我們睡覺(jué)時(shí)大腦做的無(wú)數(shù)工作之一。
這是不是說(shuō),人工智能也需要某種形式的睡眠?
可能是這樣。我們也確實(shí)在做這方面的研究。在公司成立初期,我們?cè)?xùn)練人工智能玩雅達(dá)利生產(chǎn)的那種電子游戲,記憶回放是人工智能能做到這點(diǎn)的一大關(guān)鍵原因。它不僅僅是在玩游戲,更是在把剛才完成的關(guān)鍵動(dòng)作回放給自己看。不過(guò),很明顯,你不能把這個(gè)叫作睡眠,實(shí)際上,它也不是真正的睡眠。對(duì)人工智能來(lái)說(shuō),這是一種離線模式。
假設(shè)有一個(gè)人工智能發(fā)展進(jìn)度條,進(jìn)度條的一端是掃地機(jī)器人,另一端是擁有人類智能的人工智能。那么,我們目前處在進(jìn)度條的哪里?
大概是中間點(diǎn)附近的某個(gè)地方吧。不過(guò),對(duì)于這個(gè)問(wèn)題,有很多種見(jiàn)解。有些人認(rèn)為,我們這些研究深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的人走錯(cuò)了路,所以未來(lái)肯定會(huì)碰壁;還有一些支持我們的人就會(huì)說(shuō),瞧,我們現(xiàn)在什么都有了,接下去不過(guò)是一些繼續(xù)升級(jí)換代、擴(kuò)大技術(shù)規(guī)模的問(wèn)題:運(yùn)用更多的計(jì)算機(jī),處理更多的數(shù)據(jù),然后,終于有一天,我們就得到了擁有人類這個(gè)級(jí)別智能的通用人工智能。
我覺(jué)得,這兩派意見(jiàn)都有失偏頗。在我看來(lái),我們目前已經(jīng)開(kāi)發(fā)出的人工智能,肯定是沒(méi)走錯(cuò)路,并且還超級(jí)有用。不過(guò),我不覺(jué)得我們已經(jīng)擁有了一切。要想達(dá)到那個(gè)終極目標(biāo),還需要依賴其他的技術(shù)飛躍。
DeepMind公司有做過(guò)新冠病毒方面的研究嗎?
現(xiàn)在就指望人工智能可以為這樣的突發(fā)疫情帶來(lái)許多實(shí)質(zhì)性的幫助,未免有些太早了。我希望未來(lái)再也不會(huì)出現(xiàn)新冠病毒這樣的疫情了,但如果不幸出現(xiàn)了,我希望人工智能到時(shí)能夠在應(yīng)對(duì)疫情方面發(fā)揮更大的作用。
中國(guó)的研究人員很早就測(cè)繪了新冠病毒中蛋白質(zhì)的基因序列。就當(dāng)時(shí)的情況來(lái)說(shuō),我們也已經(jīng)通過(guò)實(shí)驗(yàn)知曉了其中某些蛋白質(zhì)的結(jié)構(gòu),但仍然還有大概十幾種相關(guān)蛋白質(zhì)的結(jié)構(gòu)沒(méi)有掌握。當(dāng)時(shí),我們已經(jīng)認(rèn)為AlphaFold系統(tǒng)足夠精確,但由于它沒(méi)有經(jīng)過(guò)實(shí)踐檢驗(yàn),我們也就沒(méi)有大肆宣揚(yáng)AlphaFold找到的那些蛋白質(zhì)結(jié)構(gòu)。不過(guò),我們同時(shí)也認(rèn)為,這個(gè)人工智能程序絕對(duì)可以為科學(xué)界帶來(lái)幫助,所以立刻發(fā)表了AlphaFold研究的那些蛋白質(zhì)的最佳模型。
說(shuō)起人類生存威脅這個(gè)話題,我想問(wèn)問(wèn),人工智能可以為氣候變化做點(diǎn)什么嗎?
我們?yōu)楣雀杷龅淖畛雒ぷ髦?,就是控制?shù)據(jù)中心的冷卻系統(tǒng)。每個(gè)人都會(huì)用到這些數(shù)據(jù)中心,比如你看YouTube視頻的時(shí)候。我們通過(guò)更高效地開(kāi)關(guān)風(fēng)扇、水泵以及數(shù)據(jù)中心內(nèi)其他一切神奇設(shè)備,使得數(shù)據(jù)中心的能耗下降了30%。這對(duì)節(jié)約成本來(lái)說(shuō),顯然是一項(xiàng)巨大的進(jìn)步,同時(shí)也實(shí)現(xiàn)了環(huán)境保護(hù)。
我們應(yīng)該可以把同類型的優(yōu)化升級(jí)措施應(yīng)用到其他機(jī)構(gòu),甚至是電網(wǎng)上,那肯定會(huì)節(jié)約大量能源。未來(lái),人工智能還會(huì)在材料設(shè)計(jì)、蛋白質(zhì)設(shè)計(jì)這樣的領(lǐng)域大顯身手,幫助我們得到可以分解廢物塑料或是生產(chǎn)可再生生物燃料的蛋白質(zhì)。
未來(lái)10年,人工智能能產(chǎn)生最大影響的領(lǐng)域是哪個(gè)?
我希望能在重大科學(xué)問(wèn)題上看到數(shù)十項(xiàng)突破,以及由此產(chǎn)生的各種產(chǎn)品、服務(wù)與進(jìn)步。如果我們沒(méi)能在10年內(nèi)完成這個(gè)目標(biāo),那我應(yīng)該會(huì)非常驚訝。我們希望在各種科學(xué)分支中扮演重要角色,比如可再生能源(尤其是核聚變技術(shù))、量子化學(xué)、材料設(shè)計(jì)以及疾病療法。
DeepMind有這么多項(xiàng)目同時(shí)進(jìn)行,你每天都是怎么安排的?
我的工作安排比較奇怪,因?yàn)槲业墓ぷ骱蜕钇鋵?shí)是相互交織在一起的。我每天有兩個(gè)工作時(shí)段。白天,我處理公司管理方面的事務(wù),當(dāng)然也少不了開(kāi)會(huì)。到了晚上,我又開(kāi)始工作。我是個(gè)夜貓子,晚上特別清醒,大概22點(diǎn)左右又會(huì)坐下來(lái)干活,一直干到天亮前的幾小時(shí)。這段時(shí)間,我主要用來(lái)撰寫(xiě)自己的研究論文,閱讀并考察各個(gè)領(lǐng)域的最新思想、方法,并深入研究。晚上工作很安靜,沒(méi)人打擾,因此,我很喜歡在這段時(shí)間工作,一周七天,每晚如此。
聽(tīng)起來(lái),你睡覺(jué)時(shí)間并不多啊。要知道,無(wú)論對(duì)人,還是對(duì)人工智能來(lái)說(shuō),睡眠都很重要。
沒(méi)錯(cuò),我也知道,睡得少確實(shí)不是一件好事。我不知道自己還能維持這種工作方式幾年,所以,我盡量保證每天睡至少6小時(shí),但有時(shí)就是做不到。周末的時(shí)候,我會(huì)睡睡懶覺(jué),補(bǔ)一點(diǎn)睡眠。當(dāng)然,規(guī)律作息肯定更好。
資料來(lái)源 New Scientist