1987年,當(dāng)研究人員第一次用基因組學(xué)這個(gè)詞來(lái)描述新近發(fā)展的DNA圖譜學(xué)科時(shí),埃里克?格林(Eric Green)剛剛從醫(yī)學(xué)院畢業(yè)。幾年后,他參與了當(dāng)時(shí)尚為年輕的這一領(lǐng)域的標(biāo)志性登月項(xiàng)目——人類基因組計(jì)劃(HGP)的前沿工作。為了引導(dǎo)國(guó)家參與全球協(xié)作,1989年,國(guó)會(huì)批準(zhǔn)建立國(guó)家人類基因組學(xué)研究所(NHGRI)。
1990年,整個(gè)人類基因組的測(cè)序工作開始進(jìn)行,歷時(shí)13年完成。2009年,格林成為該研究所的負(fù)責(zé)人。那時(shí),NHGRI的任務(wù)已經(jīng)包括將基因組學(xué)擴(kuò)展到醫(yī)學(xué)。這意味著會(huì)資助和協(xié)調(diào)旨在精確定位導(dǎo)致遺傳疾病的基因突變的項(xiàng)目,開發(fā)遺傳疾病的檢測(cè)手段以及療法。從更廣義上來(lái)講,這意味著會(huì)產(chǎn)生證據(jù),證明DNA數(shù)據(jù)可以有效改善結(jié)果,甚至對(duì)并未真正罹患罕見(jiàn)疾病的人來(lái)說(shuō)也是如此。
為了幫助描述這一過(guò)程,格林的任務(wù)之一就是定期整合該領(lǐng)域的戰(zhàn)略遠(yuǎn)景。為了慶祝進(jìn)展,確定技術(shù)差距,并激勵(lì)科學(xué)家去追求最具影響力的研究領(lǐng)域,他的團(tuán)隊(duì)在2020年10月發(fā)表了最新預(yù)測(cè)。格林和他的同事首次為2030年人類基因組學(xué)可能實(shí)現(xiàn)的成果列出了10個(gè)大膽預(yù)測(cè)。其中包括:高中生將在科學(xué)展的活動(dòng)中展示基因分析;在診室里進(jìn)行基因測(cè)試將成為與血液檢測(cè)一樣的常規(guī)工作。
測(cè)序競(jìng)賽開始后的30年,我們可能已經(jīng)到達(dá)早期基因組學(xué)時(shí)代的終點(diǎn)。這是技術(shù)爆炸增長(zhǎng)的時(shí)期,實(shí)現(xiàn)若干突破,如第一條狗、雞和癌細(xì)胞的測(cè)序,廉價(jià)的家庭DNA測(cè)試。這個(gè)領(lǐng)域已經(jīng)如此成熟:基因組學(xué)幾乎存在于所有生物學(xué)領(lǐng)域——從對(duì)抗入侵的大黃蜂到釀造口感更好的啤酒?;蚪M醫(yī)學(xué)也不再是純理論,但它尚未廣泛普及。雖然科學(xué)家已經(jīng)繪制了人類基因組圖譜,但他們還沒(méi)有完全弄懂。在接受《連線》雜志采訪時(shí),格林談到了基因組學(xué)的下一個(gè)10年。
2020年10月進(jìn)行了人類基因組計(jì)劃30周年慶典。當(dāng)您環(huán)顧如今的現(xiàn)狀時(shí),該項(xiàng)目對(duì)醫(yī)學(xué)產(chǎn)生的影響是否達(dá)到了您曾經(jīng)的期望?
我從一開始就參與了人類基因組計(jì)劃,我必須強(qiáng)調(diào),當(dāng)時(shí)我們并不知道自己在做什么。我們有一個(gè)大膽而冒險(xiǎn)的目標(biāo),就是讀出人類“基因說(shuō)明書”中的30億個(gè)字母,但我們當(dāng)時(shí)并沒(méi)有相應(yīng)的技術(shù)。我們沒(méi)有方法,我們那時(shí)甚至沒(méi)有高效的互聯(lián)網(wǎng),沒(méi)有參考樣本。因此,作為參與了此項(xiàng)目的一名年輕醫(yī)生,我可以想象有一天基因組學(xué)可能會(huì)成為臨床護(hù)理的一部分;但我真的沒(méi)有想到這會(huì)在我的有生之年發(fā)生。
如果我們回到10年前,根本沒(méi)有人在醫(yī)療健康方面真正使用基因組學(xué)。我們?cè)?jīng)幻想:病人站在我們面前,我們不知道問(wèn)題在哪,我們對(duì)其基因組進(jìn)行測(cè)序并找出問(wèn)題所在。這在2011年還只是假設(shè),而現(xiàn)在已成為常規(guī)手段,起碼對(duì)懷疑患有罕見(jiàn)基因疾病的人來(lái)說(shuō)是這樣。
這太令人吃驚了。但這與人類基因組計(jì)劃設(shè)想要完成的目標(biāo)還有相當(dāng)大的差距。2000年,弗朗西斯?柯林斯(Francis Collins)在白宮發(fā)表講話時(shí)說(shuō),可能需要15到20年的時(shí)間實(shí)現(xiàn)“治療醫(yī)學(xué)的徹底轉(zhuǎn)化”,為從癌癥到精神疾病的所有疾病提供個(gè)性化治療。顯然,這并沒(méi)有實(shí)現(xiàn),為什么?
部分原因是基因組信息的復(fù)雜性。如果醫(yī)生準(zhǔn)備使用這些信息,而病人準(zhǔn)備采取行動(dòng),那么投資1 000美元來(lái)測(cè)序基因組,在我們終身醫(yī)療的宏偉計(jì)劃中都是微不足道的。所以,我認(rèn)為這不是癥結(jié)所在。問(wèn)題的癥結(jié)是:對(duì)于一個(gè)普通的健康人來(lái)說(shuō),我們不知道這些信息該如何處理。這也是我自己沒(méi)有進(jìn)行基因組測(cè)序的原因。
你還沒(méi)有嗎?
還沒(méi)有。因?yàn)?,雖然我們有能力進(jìn)行測(cè)序,并且測(cè)序的質(zhì)量會(huì)很好;但是,有這些數(shù)據(jù)和弄清這些數(shù)據(jù)的意義存在鴻溝。這就是為什么我們的大膽預(yù)測(cè)之一是:知道每一個(gè)人類基因的生物學(xué)功能。我們正在取得進(jìn)展,但這一進(jìn)展可能需要幾十年而不是幾年。
您能否指出任何正在加速縮小這一差距的新興技術(shù)?
我只需要說(shuō)說(shuō)2020年的諾貝爾化學(xué)獎(jiǎng):CRISPR技術(shù)。很多時(shí)候人們聽(tīng)到CRISPR就會(huì)想到應(yīng)用于人的治療方法。但到目前為止,CRISPR更大的用途還是在實(shí)驗(yàn)室。有了CRISPR,我們可以對(duì)DNA的片段進(jìn)行編輯,這些小片段不會(huì)進(jìn)入人體內(nèi)——它們會(huì)進(jìn)入細(xì)胞系或細(xì)菌中,然后我們對(duì)這些細(xì)胞系或細(xì)菌進(jìn)行測(cè)試,來(lái)檢測(cè)這些編輯是否會(huì)造成功能性的影響?;蚪M編輯和基因組合成方法的結(jié)合越來(lái)越好,再加上越來(lái)越好的計(jì)算工具,將真正改變生物學(xué)發(fā)現(xiàn)的步伐?,F(xiàn)在,我們總是依賴于發(fā)表的一篇論文,這篇論文只能提供我們關(guān)于基因變體的丁點(diǎn)信息。
這根本不成規(guī)模。所以,我們必須要達(dá)到這樣一個(gè)程度,我們要做出數(shù)以百萬(wàn)記的改變,產(chǎn)生大量的數(shù)據(jù),然后我們就有希望使用人工智能來(lái)訓(xùn)練計(jì)算機(jī)尋找模式。到那時(shí),我們甚至不需要做實(shí)驗(yàn),因?yàn)槲覀兛梢愿鶕?jù)過(guò)去的1 000次實(shí)驗(yàn)來(lái)預(yù)測(cè)某一突變意味著什么。展望未來(lái),這些才是可能會(huì)帶來(lái)改變的工具。
就數(shù)字化和所有生物數(shù)據(jù)分析而言,這似乎是巨大的進(jìn)步。
在我們面對(duì)的巨大挑戰(zhàn)中,至少有一半與計(jì)算相關(guān)。這是個(gè)好問(wèn)題。從某些方面來(lái)講,我們是自身成功的受害者:我們通過(guò)測(cè)序消除了眾多技術(shù)障礙,而現(xiàn)在最大的障礙就是如何處理這些數(shù)據(jù)??茖W(xué)發(fā)展的速度比我們計(jì)劃這些事情的速度要快得多,即使是在美國(guó)國(guó)立衛(wèi)生研究院(NIH)這樣的地方也是如此。如果今天我能重新組織NIH,我會(huì)設(shè)立引領(lǐng)數(shù)據(jù)科學(xué)的單獨(dú)機(jī)構(gòu)??墒乾F(xiàn)在,我們還沒(méi)有這樣的機(jī)構(gòu)。
未來(lái)10年,還有哪些障礙會(huì)成為我們面臨的挑戰(zhàn)?
我們現(xiàn)在面臨的一個(gè)問(wèn)題就是:并不是所有的保險(xiǎn)公司都愿意為基因組序列買單,這對(duì)患有未確診的罕見(jiàn)疾病的人來(lái)說(shuō)是個(gè)問(wèn)題。我們?cè)诎┌Y領(lǐng)域已經(jīng)取得很大成功,基因檢測(cè)已經(jīng)成為主流,在產(chǎn)前檢測(cè)方面也是如此。大約有六七百萬(wàn)的孕婦在2020年接受血液測(cè)試來(lái)篩查胎兒的遺傳缺陷。
面臨的另一個(gè)問(wèn)題是:這項(xiàng)技術(shù)的應(yīng)用不均衡。在斯坦福、哈佛和貝勒等大學(xué),罕見(jiàn)遺傳疾病患者的測(cè)序和診斷都非常好。但在蒙大拿州的農(nóng)村地區(qū),這類工作進(jìn)展卻十分不理想。因此,那里的障礙就是找到這樣的醫(yī)生:他們不在主要的學(xué)術(shù)醫(yī)療中心工作,在農(nóng)村地區(qū)執(zhí)業(yè)、受過(guò)良好教育、對(duì)基因組醫(yī)學(xué)沒(méi)有偏見(jiàn)。我們面臨的風(fēng)險(xiǎn)是現(xiàn)有的健康差距的進(jìn)一步擴(kuò)大。如果只有最富有和最杰出的人能夠獲得基因組學(xué)方面的醫(yī)療益處,那將是一個(gè)悲劇。這些曾經(jīng)假設(shè)的挑戰(zhàn)現(xiàn)在正變得非?,F(xiàn)實(shí)。
NHGRI將如何應(yīng)對(duì)這些挑戰(zhàn)?
當(dāng)然,這很復(fù)雜。這些問(wèn)題涉及社會(huì)的許多方面。但在2021年,我們要做的一件事是公布一項(xiàng)行動(dòng)議程,創(chuàng)建更加多樣化的基因組工作團(tuán)隊(duì)——包括研究和臨床方面。如果工作團(tuán)隊(duì)能更加多樣化,那么基因組學(xué)在醫(yī)學(xué)領(lǐng)域的應(yīng)用就會(huì)更加統(tǒng)一。這就是即將要做的事。
我們支持的另一個(gè)項(xiàng)目是努力獲得參考基因組,用以捕捉人類各種維度的多樣性。我們現(xiàn)有的東西無(wú)法做到這一點(diǎn)。如果我們從亞洲中部找一些人,對(duì)他們的基因組進(jìn)行測(cè)序,我們想要將他們的變異與適當(dāng)匹配的對(duì)照組進(jìn)行比較,這樣我們就可以評(píng)估:健康問(wèn)題背后或?qū)е陆】碉L(fēng)險(xiǎn)的的任何罕見(jiàn)變異。如果我們所能進(jìn)行比較的只有一種標(biāo)準(zhǔn)參照——就像我們現(xiàn)在所擁有的那樣——碰巧是基于歐洲人的DNA,那么它就會(huì)具有誤導(dǎo)性。因此,這項(xiàng)泛基因組研究的目標(biāo)就是找到一組適當(dāng)?shù)?、血緣匹配的?shù)據(jù)集,并用于醫(yī)學(xué)解釋。實(shí)現(xiàn)這一目標(biāo)也是我們的大膽預(yù)測(cè)之一。
你提到有些方面基因組學(xué)已經(jīng)成為主流醫(yī)療健康的一部分,你認(rèn)為基因組學(xué)醫(yī)療健康在哪些方面最難達(dá)到?
最難的方面是預(yù)防常見(jiàn)疾病——高血壓、糖尿病、心血管疾病、哮喘、自閉癥、阿爾茨海默氏癥等。我們正在開始為這些開發(fā)多基因風(fēng)險(xiǎn)評(píng)分,但是我們?nèi)匀徊恢榔漕A(yù)測(cè)的真實(shí)性如何。
所以,這是一種將成千上萬(wàn)的微小基因變異的所有微小影響疊加的方法,你可以用它來(lái)估計(jì)某人罹患這些常見(jiàn)疾病的風(fēng)險(xiǎn)。
你說(shuō)得對(duì)。我們投資一些重大項(xiàng)目,旨在研究多基因風(fēng)險(xiǎn)評(píng)分,看看多基因風(fēng)險(xiǎn)評(píng)分的預(yù)測(cè)能力如何,以及專業(yè)醫(yī)護(hù)人員和患者對(duì)這類信息有何反應(yīng)。另一個(gè)重大問(wèn)題就是他們是否將采取行動(dòng)——如果你的基因得分顯示你患高血壓的風(fēng)險(xiǎn)更高,或者有早期心臟病發(fā)作的征兆,那么,這會(huì)讓你注意飲食和鍛煉、少攝入鹽嗎?
你的醫(yī)生可能會(huì)在獲得這些信息后,囑咐你從35歲開始每年做一次心電圖,可是你會(huì)預(yù)約并去做嗎?這才是真正的考驗(yàn)——基因組學(xué)是否真的能改變?nèi)藗兊男袨椤?/p>
那么關(guān)于基因組學(xué)和傳染病呢?我記述過(guò)國(guó)內(nèi)外為挖掘基因數(shù)據(jù)而付出的巨大努力,以便更好理解為什么冠狀病毒會(huì)在不同人群身上引發(fā)如此廣泛的癥狀。你如何看待這一領(lǐng)域?qū)椭覀償[脫這種流行病的貢獻(xiàn)?
這些重要研究說(shuō)明了為什么現(xiàn)如今基因組學(xué)會(huì)涉及生物醫(yī)學(xué)的幾乎所有領(lǐng)域?;蚪M學(xué)在幫助我們解讀人們的基因遺傳在多大程度上影響了他們對(duì)COVID的反應(yīng)方面至關(guān)重要。
但我認(rèn)為,人類基因組計(jì)劃最重要的遺產(chǎn)之一就是它永久改變了科學(xué)家共享基因數(shù)據(jù)的方式。如果您留意了本次疫情的時(shí)間線,那么就知道對(duì)該病毒的首次報(bào)告是在2019年12月下旬。在那之后的兩周內(nèi),病毒的序列即被公之于眾。
我記得的,那實(shí)際上是我寫的第一篇關(guān)于冠狀病毒的文章——關(guān)于它如何成為公共衛(wèi)生的一次真正的勝利。
沒(méi)錯(cuò)兒!這個(gè)序列立刻被用來(lái)對(duì)病毒進(jìn)行測(cè)試。這正是疫苗開發(fā)的第一步,現(xiàn)在已經(jīng)被證實(shí)是有效的。如果你回到人類基因組計(jì)劃啟動(dòng)之前,這簡(jiǎn)直就是聞所未聞。研究人員會(huì)對(duì)病毒進(jìn)行測(cè)序,寫一篇論文,提交并發(fā)表,幾個(gè)月后,當(dāng)論文見(jiàn)刊后,他們才會(huì)公布該序列。
這就是我們?cè)?jīng)的做法,直到我們提出:讓人們盡早接觸不完美數(shù)據(jù)比之后接觸完美數(shù)據(jù)要更好。許多科學(xué)家擔(dān)心這會(huì)有損他們獲得資金的信譽(yù)。因此,我們還必須召集期刊編輯和資助者,讓他們創(chuàng)造并執(zhí)行一種新的規(guī)范。這對(duì)我們來(lái)說(shuō)非常重要,因?yàn)槿祟惢蚪M計(jì)劃并不是傳統(tǒng)的科學(xué)項(xiàng)目。我們創(chuàng)造了一種社區(qū)資源,所以我認(rèn)為,基因組學(xué)在改變一些其他領(lǐng)域(比如傳染?。┑奈幕?guī)范方面功不可沒(méi)。它影響力最持久的遺產(chǎn)之一是它真正改變了科研規(guī)則。
資料來(lái)源 Wired