編譯 蔡立英
2019年,事件視界望遠鏡團隊首次讓世界一睹黑洞的真容。不過,研究人員公布的這張發(fā)光環(huán)形物體的圖像并不是傳統(tǒng)的照片,而是經(jīng)過計算獲得的圖片。利用位于美國、墨西哥、智利、西班牙和南極的射電望遠鏡捕獲的數(shù)據(jù),研究人員進行了數(shù)據(jù)轉(zhuǎn)換,最終合成了這張標志性的圖片。研究團隊在撰文記錄這一發(fā)現(xiàn)的同時,還發(fā)布了實現(xiàn)這一壯舉所用的編程代碼,供科學界了解來龍去脈并在此基礎上進行深入研究。
這種模式正變得越來越普遍。從天文學到動物學,現(xiàn)代每一項重大科學發(fā)現(xiàn)的背后都有計算機的貢獻。美國斯坦福大學的計算生物學家邁克爾·萊維特(Michael Levitt)因“為復雜化學系統(tǒng)創(chuàng)立了多尺度模型”與另兩位研究者分享了2013年諾貝爾化學獎。他指出,當今的筆記本電腦的內(nèi)存和時鐘速度大約是1967年實驗室制造的計算機的1萬倍,他獲諾獎的研究工作就是從那時開始的。他說:“我們今天確實擁有相當可觀的計算能力,但我們?nèi)匀恍枰伎肌!?/p>
如果沒有能夠解決研究問題的軟件,以及知道如何編寫和使用軟件的研究人員,那么,功能再強大的計算機也毫無用處。總部位于英國愛丁堡、致力于改善科學軟件開發(fā)利用的軟件可持續(xù)研究所所長尼爾·洪(Neil Chue Hong)指出:“現(xiàn)在的科學研究與軟件緊密相關(guān),軟件已經(jīng)滲透到科研的方方面面?!?/p>
科學發(fā)現(xiàn)理應獲得媒體的關(guān)注,不過近期的《自然》雜志轉(zhuǎn)而將目光投向了幕后,盤點了過去幾十年來改變科學研究的十大關(guān)鍵計算機代碼。
盡管這樣的榜單難有定論,不過《自然》雜志花了一年時間,對數(shù)十名研究人員進行了調(diào)查,以多元化的視角評選出對科學界產(chǎn)生重大影響的十種軟件工具。
最初的現(xiàn)代計算機對用戶并不友好,當時的編程實際上是手工將電線連接成一排排電路來實現(xiàn)的。后來出現(xiàn)了機器語言和匯編語言,允許用戶使用代碼進行計算機編程,但是這兩種語言都需要對計算機的架構(gòu)有深入的了解,使得許多科學家難以掌握。
1963年,科羅拉多州博爾德美國國家大氣研究中心獲得這臺CDC 3600型計算機,研究者在Fortran編譯器的幫助下對其進行了編程
20世紀50年代,隨著符號語言的發(fā)展,特別是約翰·巴克斯(John Backus)及其團隊在加州圣何塞的IBM開發(fā)了“公式翻譯”語言Fortran(Formula Translation)之后,這種情況發(fā)生了變化。利用Fortran,用戶可以使用人類可讀的指令來編程,例如x = 3 + 5,然后由編譯器將這些指令轉(zhuǎn)換為快速高效的機器代碼。
不過,這個過程仍然不容易。早期,程序員使用打孔卡來輸入代碼,而復雜的模擬可能需要數(shù)萬張打孔卡。盡管如此,新澤西州普林斯頓大學的氣候?qū)W家真鍋淑郎(Syukuro Manabe)還是指出,F(xiàn)ortran使得非計算機科學家也能編程,“這是我們第一次能夠自己對計算機進行編程”。他和同事利用這種語言開發(fā)的氣候模型是最早取得成功的模型之一。
Fortran至今仍廣泛應用于氣候建模、流體動力學、計算化學等學科,這些學科都涉及復雜線性代數(shù)且需要強大的計算機來快速處理數(shù)字。Fortran生成代碼很快,并且仍然有很多程序員知道如何編寫。古老的Fortran代碼庫仍然活躍在世界各地的實驗室和超級計算機上。加州蒙特雷美國海軍研究生院的應用數(shù)學家和氣候模型師弗蘭克·吉拉爾多(Frank Giraldo)說:“老資格的程序員知道他們在做什么,他們非常注重內(nèi)存,因為早期計算機的內(nèi)存非常少?!?/p>
當射電天文學家掃描天空時,他們捕捉到的是隨時間變化的復雜信號雜音。為了理解這些無線電波的性質(zhì),他們需要看到這些信號作為頻率的函數(shù)時的樣子。研究人員可以通過一種叫作“傅立葉變換”的數(shù)學過程來做到這一點,但問題是效率低下,大小為N的數(shù)據(jù)集需要進行計算N2的次數(shù)。
1965年,美國數(shù)學家詹姆斯·庫利(James Cooley)和約翰·杜基(John Tukey)想出了一種加速該過程的方法——快速傅立葉變換(FFT),通過遞歸(一種“分而治之”的編程方法,同一種算法重復應用其自身)將計算傅立葉變換的問題簡化為N log2(N)步。隨著N的增加,變換速度也會提高。對于1 000個點,速度提升大約是100倍;對于100萬個點,則是5萬倍。
澳大利亞西部的射電望遠鏡陣列—默奇森寬視場陣列的部分夜景,該望遠鏡使用快速傅立葉變換來收集數(shù)據(jù)
英國牛津大學數(shù)學家尼克·特雷菲森(Nick Trefethen)指出,這個“發(fā)現(xiàn)”實際上是一次再發(fā)現(xiàn),因為德國數(shù)學家高斯(Carl Friedrich Gauss)早在1805年就研究出來了,但他從未發(fā)表過研究結(jié)果。而詹姆斯·庫利和約翰·杜基做到了,他們開啟了FFT在數(shù)字信號處理、圖像分析、結(jié)構(gòu)生物學等領(lǐng)域的應用。特雷菲森認為:“FFT的發(fā)現(xiàn)確實是應用數(shù)學和工程領(lǐng)域的重大事件之一”。FFT已經(jīng)多次應用于代碼中,一個流行的選擇是FFTW,即“西方最快的傅立葉變換”( Fastest Fourier Transform in the West,F(xiàn)FTW)。
保羅·亞當斯(Paul Adams)是加州勞倫斯伯克利國家實驗室分子生物物理學和綜合生物成像部門的主任,他回憶說,當他在1995年改進細菌蛋白質(zhì)凝膠的結(jié)構(gòu)時,即使使用FFT和超級計算機,也需要“很多小時甚至數(shù)天”時間。他說:“如果在沒有FFT的情況下嘗試做這些,我不知道應該如何做到,可能永遠做不到?!?/p>
數(shù)據(jù)庫是當今科學研究中不可或缺的組成部分,以至于人們很容易忘記它們也是由軟件驅(qū)動的。在過去幾十年中,數(shù)據(jù)庫資源的規(guī)模激增,并影響了許多領(lǐng)域,但或許沒有哪個領(lǐng)域的變化會超過生物學。
當今龐大的基因組和蛋白質(zhì)數(shù)據(jù)庫源于美國國家生物醫(yī)學研究基金會的瑪格麗特·戴霍夫(Margaret Dayhoff)的工作,她是生物信息學的先驅(qū)。20世紀60年代初,當生物學家致力于梳理蛋白質(zhì)的氨基酸序列時,戴霍夫開始整理這些信息,以尋找不同物種之間進化關(guān)系的線索。1965年,她與三位合著者發(fā)表了《蛋白質(zhì)序列和結(jié)構(gòu)圖冊》(Atlas of Protein Sequence and Structure),描述了當時已知的65種蛋白質(zhì)的序列、結(jié)構(gòu)和相似性。歷史學家布魯諾·斯特拉瑟(Bruno Strasser)在2010年寫道,這是第一個“與特定研究問題無關(guān)”的數(shù)據(jù)集,它將數(shù)據(jù)編碼在打孔卡中,從而有可能擴展數(shù)據(jù)庫并進行搜索。
蛋白質(zhì)數(shù)據(jù)庫擁有超過17萬個分子結(jié)構(gòu)的檔案,包括這種細菌的“表達體”,其功能是聯(lián)接RNA和蛋白質(zhì)合成的過程
其他“計算機化”的生物數(shù)據(jù)庫緊隨其后。1971年,蛋白質(zhì)數(shù)據(jù)庫投入使用,至今已詳細記錄了超過17萬個大分子結(jié)構(gòu)。加州大學圣迭戈分校的進化生物學家拉塞爾·杜利特爾(Russell Doolittle)在1981年創(chuàng)建了另一個名為Newat的蛋白質(zhì)數(shù)據(jù)庫。1982年,美國國立衛(wèi)生研究院(NIH)與多個機構(gòu)合作,成立了GenBank數(shù)據(jù)庫,這是一個開放獲取的DNA序列數(shù)據(jù)庫。
1983年7月,這些數(shù)據(jù)庫資源證明了其存在價值。當時,由倫敦帝國癌癥研究基金會的蛋白質(zhì)生物化學家邁克爾·沃特菲爾德(Michael Water field)領(lǐng)導的團隊,與杜利特爾的團隊各自獨立報道了一個特殊的人類生長因子序列與一種導致猴子出現(xiàn)癌癥的病毒蛋白質(zhì)之間的相似性。觀察結(jié)果顯示了一種病毒誘發(fā)腫瘤機制——通過模仿一種生長因子,病毒會誘導細胞不受控制地生長。美國國家生物技術(shù)信息中心(NCBI)前主任詹姆斯·奧斯特爾(James Ostell)說:“這一結(jié)果點燃了對計算機和統(tǒng)計學不感興趣的生物學家的頭腦——我們可以通過比較序列來了解有關(guān)癌癥的一些情況?!?/p>
奧斯特爾還表示,這一發(fā)現(xiàn)標志著“客觀生物學的到來”。除了設計實驗來驗證特定的假設,研究人員還可以挖掘公共數(shù)據(jù)集,尋找那些實際收集數(shù)據(jù)的人可能從未想到的聯(lián)系。當不同的數(shù)據(jù)集連接在一起時,這種力量就會急劇增長。例如,NCBI的程序員在1991年通過Entrez(Entrez是一個可以讓研究人員在DNA、蛋白質(zhì)和文獻之間自由檢索和比對的工具)實現(xiàn)了這一點。
NCBI現(xiàn)任的代理主任史蒂芬·謝利(Stephen Sherry)認為Entrez相當于一位研究生。他回憶說:“我記得當時以為Entrez是魔術(shù)?!?/p>
第二次世界大戰(zhàn)結(jié)束時,計算機先驅(qū)馮·諾伊曼(John von Neumann)開始將幾年前一直用于計算彈道軌跡和武器設計的計算機轉(zhuǎn)向天氣預報。真鍋淑郎解釋說,在那之前,“天氣預報只是經(jīng)驗性的”,即利用經(jīng)驗和直覺來預測接下來會發(fā)生什么。相比之下,馮·諾依曼的團隊“試圖根據(jù)物理定律進行數(shù)值天氣預報”。
新澤西州普林斯頓的美國國家海洋和大氣管理局(NOAA)地球物理流體動力學實驗室的建模系統(tǒng)部門負責人文卡塔拉瑪尼·巴拉吉(Venkatramani Balaji)表示,幾十年來,人們已經(jīng)熟知這些方程式;但早期的氣象學家無法實際解決這些問題。要做到這一點,需要輸入當前的條件,計算它們在短時間內(nèi)會如何變化,并不斷重復。這個過程非常耗時,以至于在天氣狀況實際出現(xiàn)之前還無法完成數(shù)學運算。1922年,數(shù)學家劉易斯·理查森(Lewis Fry Richardson)花了幾個月時間計算,以實現(xiàn)德國慕尼黑6小時的預報。根據(jù)一段歷史記載,他的結(jié)果“極不準確”,包括預測“在任何已知的陸地條件下都不可能發(fā)生”。計算機使這個問題變得很容易解決。
20世紀40年代末,馮·諾伊曼在普林斯頓高等研究院建立了天氣預報團隊。1955年,第二個團隊——地球物理流體動力學實驗室——開始進行所謂的“無限預測”,也就是氣候建模。
真鍋淑郎于1958年加入氣候建模團隊,開始研究大氣模型;他的同事柯克·布萊恩(Kirk Bryan)將這一模型應用在海洋研究中。1969年,他們成功將二者結(jié)合起來,創(chuàng)造了《自然》雜志在2006年所說的科學計算“里程碑”。
今天的模型可以將地球表面劃分為一個個25千米×25千米的正方形,并將大氣層劃分為數(shù)十層。相比之下,真鍋淑郎和布萊恩的海洋-大氣聯(lián)合模型劃分的面積為500平方千米,將大氣分為9個層次,只覆蓋了地球的1/6。盡管如此,文卡塔拉瑪尼·巴拉吉表示,“這個模型做得很好”,使研究團隊第一次能夠通過計算機預測二氧化碳含量上升的影響。
評審方式:改變評審方式。吸收各行業(yè)專家,采取各行業(yè)聯(lián)合評審,根據(jù)專家自身專業(yè)優(yōu)勢,分章節(jié)進行主審和整體內(nèi)容評審相結(jié)合的方式,這樣能充分發(fā)揮各專家的專長,也能更好地整合各個專家的觀點。
科學計算通常涉及使用向量和矩陣進行相對簡單的數(shù)學運算,但這樣的向量和矩陣實在太多了。在20世紀70年代,還沒有一套普遍認可的計算工具來執(zhí)行這些運算。因此,從事科學工作的程序員會將時間花在設計高效的代碼來進行基本的數(shù)學運算,而不是專注于科學問題。
編程世界需要一個標準。1979年,這樣的標準出現(xiàn)了:基本線性代數(shù)子程序庫(BLAS)。這是一個應用程序接口(API)標準,用以規(guī)范發(fā)布基礎線性代數(shù)操作的數(shù)值庫,如矢量或矩陣乘法。該標準一直發(fā)展到1990年,為向量數(shù)學和后來的矩陣數(shù)學定義了數(shù)十個基本例程。
美國田納西大學計算機科學家、BLAS開發(fā)團隊成員杰克·唐加拉(Jack Dongarra)表示,事實上,BLAS把矩陣和向量數(shù)學簡化成了與加法和減法一樣基本的計算單元。
美國得克薩斯大學奧斯汀分校的計算機科學家羅伯特·蓋杰(Robert van de Geijn)指出,BLAS“可能是為科學計算定義的最重要接口”。除了為常用函數(shù)提供標準化的名稱之外,研究人員還可以確?;贐LAS的代碼在任何計算機上以相同方式工作。該標準還使計算機制造商能夠優(yōu)化BLAS的安裝啟用,以實現(xiàn)在硬件上的快速操作。
40多年來,BLAS代表了科學計算堆棧的核心,也就是使科學軟件運轉(zhuǎn)的代碼。美國喬治·華盛頓大學的機械和航空航天工程師洛雷娜·巴爾巴(Lorena Barba)稱其為“五層代碼中的機械”。而杰克·唐加拉則說:“BLAS為我們的計算提供了基礎結(jié)構(gòu)。”
加州勞倫斯利弗莫爾國家實驗室的Cray-1超級計算機。在BLAS編程工具于1979年問世之前,并沒有線性代數(shù)標準可供研究人員在Cray-1超級計算機等機器上工作
20世紀80年代初,程序員韋恩·拉斯班德(Wayne Rasband)在美國國立衛(wèi)生研究院的腦成像實驗室工作。該實驗室擁有一臺掃描儀,可以對X光片進行數(shù)字化處理,但無法在電腦上顯示或分析。為此,拉斯班德寫了一個程序。
這個程序是專門為一臺價值15萬美元的PDP-11小型計算機設計的,這是一臺安裝在架子上的計算機,顯然不適合個人使用。然后,在1987年,蘋果公司發(fā)布了Macintosh II,這是一個更友好、更實惠的選擇。拉斯班德說:“在我看來,這顯然是一種更好的實驗室圖像分析系統(tǒng)?!彼麑④浖D(zhuǎn)移到新的平臺上,并重新命名,建立了一個圖像分析生態(tài)系統(tǒng)。
NIH Image及其后續(xù)版本使研究人員能在任何計算機上查看和量化幾乎任何圖像。該軟件系列包括ImageJ(拉斯班德為Windows和Linux用戶編寫的基于Java的版本)、Fiji(這是ImageJ的分發(fā)版,由德國德累斯頓的馬克斯·普朗克分子細胞生物學和遺傳學研究所的帕維爾·托曼恰克團隊開發(fā))。“ImageJ無疑是我們所擁有的最基礎的工具,”美國博德研究所成像平臺的計算生物學家貝絲·奇米尼(Beth Cimini)說,“我從來沒有和只使用顯微鏡但沒有使用ImageJ或Fiji的生物學家說過話。”
在插件的幫助下,ImageJ工具可以自動識別顯微鏡圖像中的細胞核
凱文·埃里克伊里說:“這個程序的目的不是做到一切或終結(jié)一切,而是服務于用戶的需求。不像Photoshop和其他程序,ImageJ可以成為你想要的任何東西?!?/p>
可能沒有什么能比把軟件名稱變成動詞更能說明文化的相關(guān)性了。提到搜索,你會想到谷歌;而提到遺傳學,研究者會立刻想到BLAST。
通過諸如替代、刪除、缺失和重排等方式,生物將進化中的改變刻蝕在分子序列中。尋找序列之間的相似性——特別是蛋白質(zhì)之間的相似性——可以讓研究人員發(fā)現(xiàn)進化關(guān)系,并深入了解基因功能。在迅速膨脹的分子信息數(shù)據(jù)庫中,想要快速而準確地做到這一點并不容易。
瑪格麗特·戴霍夫在1978年提供了關(guān)鍵的進展。她設計了一種“點接受突變”(Point Accepted Mutation)矩陣,使研究人員不僅可以根據(jù)兩種蛋白質(zhì)序列的相似程度,還可以根據(jù)進化距離來評估它們的親緣關(guān)系。
1985年,弗吉尼亞大學的威廉·皮爾森(William Pearson)和NCBI的大衛(wèi)·李普曼(David Lipman)引入了FASTP,這是一種結(jié)合了戴霍夫矩陣和快速搜索能力的算法。
數(shù)年后,李普曼與NCBI的沃倫·吉什(Warren Gish)和史蒂芬·阿特舒爾(Stephen Altschul),賓夕法尼亞州立大學的韋布·米勒(Webb Miller),以及亞利桑那大學的吉恩·邁爾斯(Gene Myers)一起開發(fā)了一種更強大的改進技術(shù):BLAST(Basic Local Alignment Search Tool)。BLAST發(fā)布于1990年,將處理快速增長的數(shù)據(jù)庫所需的搜索速度,與提取進化上更為遙遠的匹配結(jié)果的能力結(jié)合起來。與此同時,該工具還可以計算出這些匹配發(fā)生的概率。
阿特舒爾表示,計算結(jié)果會非???,“你可以輸入搜索內(nèi)容,喝一口咖啡,搜索就完成了”。但更重要的是,BLAST很容易使用。在通過郵寄更新數(shù)據(jù)庫的時代,沃倫·吉什建立了一個電子郵件系統(tǒng),后來又建立了一個基于網(wǎng)絡的架構(gòu),允許用戶在NCBI計算機上遠程運行搜索,從而確保搜索結(jié)果始終是最新的。
哈佛大學的計算生物學家肖恩·艾迪(Sean Eddy)表示,BLAST系統(tǒng)為當時處于萌芽階段的基因組生物學領(lǐng)域提供了變革性的工具,即根據(jù)相關(guān)基因找出未知基因可能功能的方法。對于各地的測序?qū)嶒炇?,它還提供了巧妙的動詞。艾迪說:“它是眾多由名詞變成動詞的例子之一,你會說,你正準備BLAST一下你的序列?!?/p>
20世紀80年代末,高能物理學家經(jīng)常將他們已投稿的論文手稿副本郵寄給同行,征求他們的意見——但只發(fā)給少數(shù)人。物理學家保羅·金斯帕格(Paul Ginsparg)在2011年寫道:“處于食物鏈較低位置的人依賴于一線研究者的成果,而非精英機構(gòu)中有抱負的研究人員則往往身處特權(quán)圈以外?!?/p>
1991年,當時在新墨西哥州洛斯阿拉莫斯國家實驗室工作的金斯帕格編寫了一個電子郵件自動應答程序,希望建立一個公平的競爭環(huán)境。訂閱者每天都會收到預印本列表,每一篇都與文章標識符相關(guān)聯(lián)。只需通過一封電子郵件,世界各地的用戶就可以從實驗室的計算機系統(tǒng)中提交或檢索論文,并獲得新論文的列表,按作者或標題進行搜索。
金斯帕格的計劃是將論文保留三個月,并將內(nèi)容限制在高能物理學界。但一位同事說服他無限期保留這些文章。他說:“就在那一刻,它從布告欄變成了檔案館?!庇谑?,論文開始從各個領(lǐng)域如潮水般涌來。1993年,金斯帕格將這個系統(tǒng)遷移到互聯(lián)網(wǎng)上,并在1998年將其命名為arXiv.org,沿用至今。
arXiv成立已近30年,擁有約180萬份預印本,全部免費提供,而且每月有超過1.5萬份論文提交,下載量達3 000萬次。十年前,《自然-光子學》(Nature Photonics)的編輯在評論arXiv創(chuàng)立20周年時寫道:“不難看出為什么arXiv的服務會如此受歡迎,這個系統(tǒng)讓研究人員用快速和方便的方式插上旗幟,顯示他們所做的工作,同時避免傳統(tǒng)期刊上同行評議的麻煩和時間?!?/p>
arXiv網(wǎng)站的成功也促進了生物學、醫(yī)學、社會學和其他學科同類預印本網(wǎng)站的繁榮。在如今已出版的數(shù)萬份關(guān)于新冠病毒的預印本中就可以看到這種影響。
金斯帕格說:“很高興看到30年前在粒子物理學界之外被認為是異端的方法,現(xiàn)在被普遍接受,從這個意義上說,它就像一個成功的研究項目?!?/p>
2001年,費爾南多·佩雷斯(Fernando Pérez)還是 “尋找拖延癥”的研究生,當時他決定采用Python的一個核心組件。
Python是一種解釋型語言,這意味著程序是逐行執(zhí)行的。程序員可以使用一種稱為“讀取-評估-打印循環(huán)”(REPL)的計算調(diào)用和響應工具,在其中輸入代碼,然后由解釋器執(zhí)行代碼。REPL允許快速探索和迭代,但佩雷斯指出,Python的REPL并不是為科學目的而構(gòu)建的。例如,它不允許用戶方便地預加載代碼模塊,也不允許打開數(shù)據(jù)可視化。因此,佩雷斯自己編寫了另一個版本。
結(jié)果就是IPython的誕生,這是一個“交互式”Python解釋器,由佩雷斯在2001年12月推出,共有259行代碼。10年后,佩雷斯與物理學家布萊恩·格蘭杰(Brian Granger)和數(shù)學家埃文·帕特森(Evan Patterson)合作,將該工具遷移到web瀏覽器上,推出了IPython Notebook,開啟了一場數(shù)據(jù)科學革命。
與其他計算型Notebook一樣,IPython Notebook將代碼、結(jié)果、圖形和文本合并在一個文檔中。但與其他類似項目不同的是,IPython Notebook是開源的,邀請了大量開發(fā)者社區(qū)的貢獻。而且它支持Python,一種很受科學家歡迎的語言。2014年,IPython演變?yōu)镴upyter,支持大約100種語言,允許用戶在遠程超級計算機上瀏覽數(shù)據(jù),就像在自己的筆記本電腦上一樣輕松。
《自然》雜志在2018年寫道:“對于數(shù)據(jù)科學家,Jupyter實際上已經(jīng)成為一個標準?!碑敃r,在GitHub代碼共享平臺上有250萬個Jupyter Notebook。如今,這一數(shù)字已經(jīng)發(fā)展到1 000萬個,在2016年的引力波發(fā)現(xiàn),以及2019年的黑洞成像工作中,它們都發(fā)揮了重要的作用。佩雷斯說:“在這些項目中,我們做的貢獻很小,但非常有價值?!?/p>
人工智能有兩種類型:一種是使用編碼規(guī)則,另一種則通過模擬大腦的神經(jīng)結(jié)構(gòu)來讓計算機“學習”。加拿大多倫多大學的計算機科學家杰弗里·辛頓(Geoffrey Hinton)表示,幾十年來,人工智能研究人員一直認為后者是“一派胡言”。但在2012年,他的研究生亞力克斯·克里澤夫斯基(Alex Krizhevsky)和伊爾亞·蘇茨克維(Ilya Sutskever)證明了事實并非如此。
在一年一度的ImageNet比賽中,要求研究人員在一個包含100萬張日常物體圖像的數(shù)據(jù)庫中訓練人工智能,然后在一個單獨圖像集上測試生成的算法。辛頓表示,當時最好的算法錯誤分類了大約1/4的圖像??死餄煞蛩够吞K茨克維的AlexNet是一種基于神經(jīng)網(wǎng)絡的“深度學習”算法,它將錯誤率降低到了16%。辛頓說:“我們把錯誤率幾乎減半?!?/p>
辛頓還指出,該團隊在2012年的成功反映了足夠大的訓練數(shù)據(jù)集與出色的編程,以及新出現(xiàn)的圖形處理單元的強大能力的結(jié)合。圖形處理單元是最初設計用來加速計算機視頻性能的處理器。他說:“突然之間,我們可以將算法運行速度提高30倍,或?qū)W習多達30倍的數(shù)據(jù)?!?/p>
真正的算法突破實際上發(fā)生在三年前,當時辛頓的實驗室創(chuàng)建了一個神經(jīng)網(wǎng)絡,可以比經(jīng)過幾十年改進的傳統(tǒng)人工智能更準確地識別語音。辛頓說:“只是稍微好一點,但這已經(jīng)預示了某些東西?!?/p>
這些成功預示著深度學習在實驗室研究、臨床醫(yī)學和其他領(lǐng)域的崛起。通過人工智能的深度學習,手機能夠理解語音查詢,圖像分析工具能夠很容易在顯微照片中識別出細胞。這就是為什么AlexNet會成為眾多從根本上改變科學和改變世界的工具之一。
資料來源 Nature