當(dāng)?shù)貢r間10月9日,瑞典皇家科學(xué)院宣布,2024年諾貝爾化學(xué)獎將頒發(fā)給大衛(wèi)·貝克(David Baker),另一半授予杰米斯·哈薩比斯(Demis Hassabis)和約翰·詹珀(John M.Jumper),以表彰他們對蛋白質(zhì)科學(xué)的開創(chuàng)性貢獻(xiàn)。
今年被科學(xué)界認(rèn)可的發(fā)現(xiàn)之一是涉及壯觀的蛋白質(zhì)的構(gòu)建,另一個是關(guān)于實(shí)現(xiàn)一個50年前的夢想:從氨基酸序列中預(yù)測蛋白質(zhì)結(jié)構(gòu)。諾貝爾化學(xué)委員會主席Heiner Linke說:“這兩種發(fā)現(xiàn)都開辟了巨大的可能性?!?/p>
此次獲獎的大衛(wèi)·貝克完成了設(shè)計(jì)全新蛋白質(zhì)的非凡壯舉,而杰米斯·哈薩比斯和約翰·詹珀開發(fā)了一個人工智能(AI)模型,以解決那個50年前的挑戰(zhàn):預(yù)測蛋白質(zhì)的復(fù)雜三維結(jié)構(gòu)。
他們的研究讓我們可以期待每天都有更多的生物之謎被揭示。
“沒有蛋白質(zhì),生命就無法存在”,如果說蛋白質(zhì)結(jié)構(gòu)預(yù)測是為了理解自然,那么蛋白質(zhì)設(shè)計(jì)就是創(chuàng)造自然。
瑞典皇家科學(xué)院在一份聲明中表示,“我們現(xiàn)在可以預(yù)測蛋白質(zhì)結(jié)構(gòu)并設(shè)計(jì)自己的蛋白質(zhì),這給人類帶來了巨大的好處。”
正是大衛(wèi)·貝克,在2003年成功“從頭設(shè)計(jì)”(De novo design)了一種新的蛋白質(zhì)。
這一奇思妙想來自對生物的深刻思考,蛋白質(zhì)僅靠20種氨基酸的排列組合,支撐起了整個生物界。既然算法可以從蛋白的序列預(yù)測出結(jié)構(gòu)了,那反過來是不是可以通過功能來設(shè)計(jì)對應(yīng)的結(jié)構(gòu),再用逆向算法把結(jié)構(gòu)推導(dǎo)回序列呢?
這種方式被科學(xué)家稱為蛋白質(zhì)的“從頭設(shè)計(jì)”,也就是在沒有模板參照的情況下設(shè)計(jì)出自然界中不存在的蛋白,并完成特定功能。
大衛(wèi)·貝克團(tuán)隊(duì)設(shè)計(jì)了一個含有93個氨基酸殘基的α/β蛋白,具有全新的拓?fù)浣Y(jié)構(gòu),能夠自動折疊成球狀并非常穩(wěn)定。這個蛋白被命名為Top7,這是人類第一次獲得了非自然界來源的全新蛋白質(zhì),代表著人類在從頭設(shè)計(jì)蛋白領(lǐng)域邁出了一大步。貝克也因此被一些媒體稱為具有“上帝之手”。
此后,貝克團(tuán)隊(duì)創(chuàng)造了一系列創(chuàng)新蛋白質(zhì),這些蛋白質(zhì)在藥品、疫苗、納米材料和傳感器中都有應(yīng)用。在人工智能預(yù)測蛋白結(jié)構(gòu)方面,大衛(wèi)·貝克也是其中的重要推手,他開發(fā)了著名的Rosetta軟件,極大地推動了蛋白質(zhì)結(jié)構(gòu)預(yù)測的進(jìn)展。
繼大衛(wèi)·貝克之后,杰米斯·哈薩比斯和約翰·詹珀帶領(lǐng)團(tuán)隊(duì)開發(fā)出的AlphaFold,不僅帶來了基于人工智能的突破,他們的模型還可以預(yù)測研究人員確定的近兩億種蛋白質(zhì)的結(jié)構(gòu)。
2020年11月30日,AlphaFold2在國際蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽(CASP)中一舉奪魁,其預(yù)測的蛋白質(zhì)結(jié)構(gòu)已達(dá)到原子精度,可與實(shí)驗(yàn)測得的結(jié)構(gòu)相媲美。要知道,多年來,科學(xué)家只能通過核磁共振、X射線和冷凍電鏡技術(shù)來確定蛋白質(zhì)的結(jié)構(gòu)。他們需要為了一個蛋白質(zhì)結(jié)構(gòu)反復(fù)試驗(yàn),其間要花費(fèi)數(shù)年時間和巨額費(fèi)用。2005年,《科學(xué)》雜志在創(chuàng)刊125周年之際將預(yù)測蛋白質(zhì)結(jié)構(gòu)列為125個最具挑戰(zhàn)性的科學(xué)問題之一。因此,AlphaFold的這次勝利被視為解決了50年來生物學(xué)領(lǐng)域的一個重大挑戰(zhàn)。
AlphaFold數(shù)據(jù)庫就是蛋白質(zhì)結(jié)構(gòu)的“谷歌搜索”,要認(rèn)識某個蛋白質(zhì)結(jié)構(gòu)只需在數(shù)據(jù)庫搜索可立即獲得結(jié)果,這可以讓科學(xué)家能夠集中精力加快實(shí)驗(yàn)研究?,F(xiàn)在,AlphaFold2已被全球數(shù)百萬科學(xué)家使用,以解決抗生素耐藥性和塑料降解等問題。
成立僅一年的AI制藥公司Xaira Therapeutics,在2023年吸引到10億美元的單輪融資,這家公司的聯(lián)合創(chuàng)始人正是大衛(wèi)·貝克。他也是美國生化學(xué)家、華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)研究所所長。
中國科研人員王順智在接受《中國科學(xué)報(bào)》采訪時回憶稱,“我博士后期間熬的夜比讀博時候還多!”這是因?yàn)樗幸晃化偪竦膶?dǎo)師——大衛(wèi)·貝克。導(dǎo)師每一次重現(xiàn)那種對科研“沖勁兒”時,都令他十分佩服。在他眼里,大衛(wèi)·貝克是一位“純粹科學(xué)家”,全身心撲在科研上,一得空就泡在實(shí)驗(yàn)室,談起研究就像打了“雞血”。
“強(qiáng)將手下無弱兵”,2023年,王順智以共同第一作者身份在《科學(xué)》(Science)發(fā)表論文,采用一種人工智能強(qiáng)化學(xué)習(xí)算法,開發(fā)了一款強(qiáng)大的新型蛋白質(zhì)設(shè)計(jì)軟件。該成果是利用人工智能開展蛋白質(zhì)科學(xué)研究的一個里程碑。
在大衛(wèi)·貝克的公司融資時,“天才”杰米斯·哈薩比斯創(chuàng)建的公司——DeepMind已聞名遐邇。在少年就以國際象棋成名的哈薩比斯,在劍橋大學(xué)主修計(jì)算機(jī)時,已顯示出了其與眾不同的觀點(diǎn),他不認(rèn)同劍橋大學(xué)當(dāng)時研究人工智能的方法。“他們的研究方式完全關(guān)于邏輯的。在我看來,這顯然行不通。你永遠(yuǎn)不可能為它編寫足夠多的知識?!彼鴮γ襟w說。
2010年,哈薩比斯與朋友共同創(chuàng)辦了DeepMind。彼時34歲的他要向世界證明AI的最好方式是游戲。DeepMind在一場預(yù)測蛋白質(zhì)如何折疊的競賽中一騎絕塵。
四年后,DeepMind被谷歌以4億英鎊的價(jià)格收購。這家企業(yè)也被視為英國最接近馬斯克式野心的一個企業(yè)。
“我一直是工作到凌晨4點(diǎn)左右。”哈薩比斯曾在接受媒體采訪時說,“有時是4點(diǎn)半,視情況而定。”
他一天有兩個工作日,如果“第一個工作日”的工作是經(jīng)營公司,指導(dǎo)700名員工(其中400名博士),努力保持DeepMind作為世界領(lǐng)先的AI公司的地位,“第二個工作日”就是提醒自己為什么要經(jīng)營這家公司。這涉及計(jì)算機(jī)科學(xué)、數(shù)學(xué),并且要緊跟這些領(lǐng)域的最新前沿。他說:“那是我做研究的時候。”
正是在DeepMind,哈薩比斯的戰(zhàn)友約翰·詹珀,帶領(lǐng)團(tuán)隊(duì)創(chuàng)建了AlphaFold,這是一種人工智能模型,可以根據(jù)氨基酸序列高精度預(yù)測蛋白質(zhì)結(jié)構(gòu)。
詹珀出生于美國阿肯色州的一個農(nóng)場,本科就讀于離家不遠(yuǎn)的私立名校學(xué)習(xí)理論物理,在芝加哥大學(xué)獲得博士學(xué)位,主要研究方向是使用ML來模擬蛋白質(zhì)折疊和動力學(xué)。
詹珀的一位師弟曾專門寫了一篇文章分析詹珀的工作能力:一、深厚的數(shù)學(xué)、物理學(xué)功底;二、足夠的蛋白質(zhì)領(lǐng)域知識;三、高超的編程技能;四、深刻的對深度學(xué)習(xí)的理解。
這位擁有深厚專業(yè)背景和工作經(jīng)驗(yàn),善于教學(xué)、言談幽默、工作高效、注重實(shí)際效果的人,很自然成為AlphaFold團(tuán)隊(duì)中的核心和領(lǐng)導(dǎo)者。
詹珀的同事常調(diào)侃,無論何時給詹珀發(fā)郵件,總能得到他迅捷的回復(fù),而有時候,詹珀回復(fù)郵件的時間顯示為凌晨四五點(diǎn)。
在DeepMind,不止一位同事曾問過詹珀,為何在畢業(yè)后不繼續(xù)學(xué)術(shù)生涯。他的回答很直接,我存的錢快花完了,我還要養(yǎng)孩子啊。
作為一年一度的“全球科學(xué)盛宴”,從1901年首次頒發(fā)至今,諾貝爾獎已經(jīng)走過了120多個年頭,1985年出生的詹珀是第一位獲得這一獎項(xiàng)的80后。