2024年諾貝爾科學獎項頒給了微小RNA的發(fā)現(xiàn)者、人工智能模型的先驅以及那些將人工智能用于蛋白質結構預測的人。顯然,人工智能在2024年諾貝爾獎中大獲全勝。
諾貝爾科學獎一直在用自己的方式表彰人類智慧。2024年,人工智能(AI)的變革潛力首次得到諾貝爾獎的認可。10月8日,瑞典皇家科學院將物理學獎授予普林斯頓大學的約翰 · 霍普菲爾德(John Hopfield)和多倫多大學的杰弗里 · 辛頓(Geoffrey Hinton),以表彰倆人在計算機科學領域取得的突破。他們的成果對當今許多最強大AI模型的開發(fā)至關重要。
10月9日,一款神奇AI模型的開發(fā)者也接到斯德哥爾摩的來電。他們就是谷歌人工智能公司DeepMind的核心人物,德米斯 · 哈薩比斯(Demis Hassabis)和約翰 · 江珀(John Jumper),因創(chuàng)造能精準預測蛋白質三維結構的AlphaFold而獲得化學獎。
長期以來,蛋白質結構預測是生物化學領域的重大挑戰(zhàn)。當然,這兩位只分得一半榮譽,另一半授予華盛頓大學的生物化學家大衛(wèi) · 貝克(David Baker),以表彰他利用計算機輔助設計新蛋白質的工作。
人工智能并不是這次結果揭曉的唯一共同點。在一些嚴謹?shù)娜耸靠磥恚?024年諾獎委員會對物理獎和化學獎的頒發(fā)是“越界”的,因為人工智能研究屬于計算機科學,而蛋白質研究則應歸屬于生物學。
破界
這種靈活“跨界”并非史無前例。例如,1973年,3位常與蜜蜂、鵝和棘魚打交道的動物行為學先鋒被“強行”授予諾貝爾生理學或醫(yī)學獎。不過辛頓和霍普菲爾德所做出的諾獎成就有更深遠的影響。
2024年諾貝爾科學獎獲得者:杰弗里·辛頓(左一)、約翰·霍普菲爾德(左二)、德米斯·哈薩比斯(左三)、大衛(wèi)·貝克(左四)、約翰·江珀(右三)、加里·魯夫昆(右二)、維克多·安布羅斯(右一)
兩位大師都在1980年代初完成了他們的關鍵工作,但當時計算機硬件無法充分利用它?;羝辗茽柕略O計了一種后來被稱為霍普菲爾德神經(jīng)網(wǎng)絡的人工神經(jīng)網(wǎng)絡,其構建模式類似物理學中的自旋玻璃模型——這讓瑞典皇家科學院有理由稱這屬于“物理學”。辛頓的貢獻是使用所謂的反向傳播算法來訓練神經(jīng)網(wǎng)絡。
人工神經(jīng)網(wǎng)絡是計算機程序,大致基于人們認為的真實生物神經(jīng)細胞或神經(jīng)元網(wǎng)絡的工作方式。具體而言,此類網(wǎng)絡中“節(jié)點”(相當于神經(jīng)元)之間連接的強度(稱為權重)具有可塑性。這種可塑性賦予網(wǎng)絡根據(jù)過往表現(xiàn)以不同方式處理信息的能力,換言之,就是學習能力?;羝辗茽柕戮W(wǎng)絡中每個節(jié)點都連接到除自身之外的所有節(jié)點,這種網(wǎng)絡特別擅長“從稀疏或嘈雜的數(shù)據(jù)中提取模式”。
辛頓通過他設計的算法,讓神經(jīng)網(wǎng)絡在三維空間中工作,增強神經(jīng)網(wǎng)絡的學習能力?;羝辗茽柕戮W(wǎng)絡及其同類網(wǎng)絡本質上是二維的。盡管它們實際上僅作為軟件中的模擬而存在,但它們可以被視為節(jié)點的物理層。但是,將這些層堆疊在一起,信號在層之間來回移動(即反向傳播和前向傳播)時通過調整權重來訓練它們,您將擁有一個更加復雜的學習系統(tǒng)。
此外,辛頓博士還利用物理學的一個分支,即統(tǒng)計力學,對霍普菲爾德的網(wǎng)絡做出改進,創(chuàng)建了玻爾茲曼機。玻爾茲曼機可用于創(chuàng)建以無人監(jiān)督的方式學習的系統(tǒng),無須明確教授即可發(fā)現(xiàn)數(shù)據(jù)中的模式。[統(tǒng)計力學是熱力學第二定律的基礎,由與阿爾弗雷德 · 諾貝爾(Alfred Nobel)同時代的路德維希 · 玻爾茲曼(Ludwig Boltzmann)創(chuàng)立。]
因此,這兩位研究人員的工作讓機器學習真正發(fā)揮了作用。人工智能模型現(xiàn)在不僅能學習,還可以創(chuàng)造(或者,用懷疑論者的話說,以最復雜方式重組和照搬)。這些工具已經(jīng)從執(zhí)行高度特化的任務,例如識別組織樣本中的癌細胞或精簡大量粒子物理數(shù)據(jù),轉變至能應付從為本科生寫論文到運行機器人的各種事務。
接受媒體采訪時,辛頓博士似乎流露出對自己的成果既擔心又自豪的態(tài)度。他和領域內(nèi)許多人一樣,擔心超越人類的機器智能會怎樣對待創(chuàng)造它自己的人。另一方面,他也沉思:通過協(xié)助腦力勞動,AI能否帶來如工業(yè)革命之于體力勞動那樣巨大的影響?
這樣的沉思來得正是時候。不到24小時后頒發(fā)的諾貝爾化學獎似乎是對上述問題的回復。瑞典皇家科學院表彰了利用AI模型預測蛋白質結構的3位先鋒。
折疊
蛋白質是生命的主要化學組成部分。它們的基本組成單位是氨基酸,這些小分子排列成長鏈,以相當復雜和特定的方式折疊。最終的折疊形態(tài),也就是蛋白質三維結構,決定其生物功能。換言之,我們要了解蛋白質——進而理解生物學——就必須了解蛋白質結構。
貝克博士通過實踐獲得了這種理解。他在2003年的一篇具有里程碑意義的論文中介紹了自己設計的全新蛋白質。據(jù)稱,借助計算機程序Rosetta,他發(fā)現(xiàn)了一種能以此前從未見于自然界的方式折疊的氨基酸序列。貝克在實驗室重新創(chuàng)建該序列并制得蛋白質,接著用X射線晶體學技術確定其最終結構——與他設想的折疊形態(tài)非常接近。Rosetta(現(xiàn)在叫作Rosetta Common)很快成為全球蛋白質化學家使用的軟件包。蛋白質計算設計已在各個方面發(fā)揮作用,例如疫苗開發(fā)和有毒化學物質檢測。
另一方面,若要根據(jù)蛋白質的氨基酸序列預測其三維結構,那就是更艱巨的任務了。鑒于蛋白質可以折疊出近乎無限種形態(tài)——據(jù)估計,一個復雜蛋白質有10300種可能的空間結構——因此即使用計算機也只能獲得有限結果。DeepMind的AlphaFold 1和2(均為人工神經(jīng)網(wǎng)絡)分別于2018年和2020年發(fā)布,是第一種接近無限可能的神經(jīng)網(wǎng)絡。AlphaFold 2目前擁有一個包含超過2億種蛋白質結構預測的數(shù)據(jù)庫,預測準確率高達約90%。
在此次諾貝爾獎結果揭曉前,2024年德米斯和江珀出現(xiàn)于各大科技獎項的候選人名單中,當然,許多人質疑,現(xiàn)在就向AlphaFold致敬是否為時過早??蔁o論如何,AlphaFold正改變科學。
DeepMind表示,大約200萬科學家已經(jīng)在研究中使用此工具。2024年5月發(fā)布的AlphaFold 3不再局限于蛋白質研究,還能預測大量其他生物分子的結構,諸如DNA,以及可能作為藥物發(fā)揮作用的小分子;它也可以預測不同結構的不同分子怎樣組合到一起,例如病毒的刺突蛋白如何與宿主體內(nèi)的抗體和糖相互作用。
“見微知著”
2024年的諾貝爾生理學或醫(yī)學獎與AI毫無關聯(lián),也沒有受到所謂跨學科的爭議。評審團隊繼續(xù)關注分子和細胞層面的“最微小”成果(而非生理學或器官方面的研究)的趨勢,因為最令人興奮的科學前沿正是在這些微觀尺度上。
馬薩諸塞大學醫(yī)學院的維克多 · 安布羅斯(Victor Ambros)和麻省總醫(yī)院的加里 · 魯夫昆(Gary Ruvkun)因發(fā)現(xiàn)微小RNA(miRNA)及其在“轉錄后基因調控”中的作用而共同獲獎。微小RNA是一類僅由20~24個核苷酸組成的小分子非編碼RNA,在細胞的運作中發(fā)揮關鍵作用。
每個人體細胞的細胞核內(nèi)都有一套完整指令用于創(chuàng)建人體,那就是基因組。生物學的一個重要問題是,同一套基因和指令怎樣導致身體產(chǎn)生從肌肉細胞到肝細胞各種不同類型的細胞。答案是,并非細胞核內(nèi)所有基因都會轉化為蛋白質。不同類型的細胞遵循自己的發(fā)育途徑,只選用與自己生長發(fā)育相關的遺傳指令。而能在一定程度上控制它們的選擇的,正是由安布羅斯和魯夫昆發(fā)現(xiàn)的微小RNA分子。
微小RNA主要通過與細胞內(nèi)另一種分子的靶標部分結合來發(fā)揮作用,它就是信使RNA(mRNA)——負責將信息從基因組的DNA傳遞到細胞內(nèi)的蛋白質制造工廠 。通過干擾mRNA,miRNA可以改變或阻止蛋白質的產(chǎn)生。值得一提的是,2023年諾貝爾生理學或醫(yī)學獎授予了mRNA疫苗領域的兩位先驅。
微小RNA首次發(fā)現(xiàn)于1993年,現(xiàn)已知人類基因組中有超過1000種這樣的小分子。它們的生物學影響不可謂不深遠:微小RNA分子的調節(jié)異常可能導致癌癥和癲癇;編碼miRNA分子的基因突變會引發(fā)先天性聽力喪失等疾病,并被認為與許多眼部疾病的病理有關,例如白內(nèi)障、青光眼和黃斑變性;此外,miRNA分子似乎也是許多骨骼疾病的一大成因,如骨質疏松癥、骨肉瘤和骨轉移等。
1980年代末,安布羅斯和魯夫昆在麻省理工學院的同一實驗室工作,并利用生物學研究中的關鍵工具秀麗隱桿線蟲(Caenorhabditis elegans)發(fā)現(xiàn)了miRNA分子。他們當時正研究秀麗隱桿線蟲的兩種突變株,這些株系的基因存在缺陷,而線蟲的發(fā)育和工作方式又由基因決定。二人觀察到,一種名為lin-4的基因會產(chǎn)生一種異常短小的RNA分子,該分子不編碼任何蛋白質,而且似乎能抑制另一個基因的活性。
瑞典卡羅林斯卡醫(yī)學院的諾貝爾委員會在揭曉獲獎名單時指出,當科學家發(fā)表他們的研究成果時,他們遭遇了“來自科學界的幾乎震耳欲聾的沉默”。人們起初認為秀麗隱桿線蟲體內(nèi)這種不尋常的基因調控機制是該生物所特有的一種特性,與人類或其他更復雜的生物無關。但這種觀點后來發(fā)生了轉變,因為大家發(fā)現(xiàn),編碼miRNA的基因遍布整個動物界。
丹麥制藥巨頭諾和諾德是嘗試利用miRNA制造藥物的公司之一。2024年,他們收購了德國生物制藥企業(yè)Cardior,后者研發(fā)的miR-132反義抑制劑CDR132L能阻斷特定miRNA,有望幫助患慢性心力衰竭和心臟肥大(心壁增厚和變硬)的病人。
追諾路萬條
對于世界各地越來越多依靠人工智能進行研究的科學家來說,2024年諾貝爾獎傳遞了有趣的信號——或許他們有一天也能獲得科學界最高獎項。江珀表示:“我希望我們未來將會迎來許多乘勢AI的不可思議的科學突破?!?/p>
資料來源 The Economist