曹玲
“在生命經(jīng)濟(jì)時(shí)代,擁有更多的基因資源,對(duì)這些基因資源進(jìn)行認(rèn)知和利用,在這樣一個(gè)新時(shí)代中就擁有了自己的優(yōu)勢(shì)。”
在深圳華大基因總部的會(huì)議室里,投影儀在白板上映出一張海底世界的照片,一簇簇不同顏色、不同形態(tài)的珊瑚在海水中搖晃,其間并沒(méi)有魚兒以及其他動(dòng)物。華大基因生物多樣性基因組研究專家張國(guó)捷問(wèn)大家:“你們猜猜圖里大概有多少個(gè)物種?是千是萬(wàn)還是百萬(wàn)級(jí)別?”
不同背景、不同學(xué)科的人給出了不同的答案。張國(guó)捷說(shuō):“如果我們把這一塊區(qū)域所有生物加起來(lái)的話,有上百萬(wàn)的物種在這里生存。”
“生物不是一個(gè)單獨(dú)存在的個(gè)體,任何個(gè)體都要和其他個(gè)體以及物種結(jié)合在一起,共同組成大的生物系統(tǒng),這個(gè)系統(tǒng)經(jīng)常會(huì)受到氣候、環(huán)境的影響,改變整個(gè)地球物種分布的格局。生物多樣性要理解自然界中生物是什么樣的組成,它是一個(gè)很古老的學(xué)科。”張國(guó)捷說(shuō)。他是華大基因生物多樣性基因組學(xué)研究帶頭人,也是丹麥哥本哈根大學(xué)副教授。定義上來(lái)說(shuō),生物多樣性是指在一定時(shí)間和一定地區(qū)所有生物(動(dòng)物、植物、微生物)物種及其遺傳變異和生態(tài)系統(tǒng)的復(fù)雜性總稱。它主要包括遺傳多樣性、物種多樣性、生態(tài)系統(tǒng)多樣性三個(gè)層次。
如果把歷史追溯到文藝復(fù)興時(shí)期,研究生物多樣性的人當(dāng)時(shí)被稱作博物學(xué)家、自然歷史學(xué)家或者自然科學(xué)家,他們的工作是采集、收集各種有趣、珍奇的標(biāo)本。最初這樣做更多出于獵奇,之后逐漸形成了系統(tǒng)的調(diào)查,出現(xiàn)了很多耳熟能詳?shù)拿?,比如林奈、洪堡、梭羅、拉馬克、達(dá)爾文等等。
地球上的生命讓人眼花繚亂。放眼炙熱沙漠,冰凍雪山以及馬里亞納海溝,生命無(wú)處不在。細(xì)菌、蚊子、鯨、蘑菇、暴龍的共同之處在于它們都由DNA組成,DNA掌握著造就地球上每一個(gè)生命的密碼。在人類基因組計(jì)劃完成之時(shí),人類終于讀到生命之書,開始學(xué)習(xí)上帝創(chuàng)造生命所使用的語(yǔ)言。繼而,人類著手揭開其他物種的基因密碼。在過(guò)去若干年里,華大基因測(cè)序的對(duì)象包括:大熊貓、水稻、桑蠶、大豆、牦牛、藏羚羊、蘭花、黃瓜、家雞、人類腸道微生物、高智商人群,還有在格陵蘭發(fā)現(xiàn)的一個(gè)4000年以前的古人等成千上萬(wàn)個(gè)不同的物種。
華大基因的目標(biāo)似乎是窮盡世間萬(wàn)物,掌握所有生物的基因。在深圳東南部大鵬新區(qū)下沙片區(qū)禾塘仔的一座白色階梯狀建筑里,華大基因正準(zhǔn)備朝這一目標(biāo)奮進(jìn)。這里將會(huì)儲(chǔ)存各種生物樣本,進(jìn)而進(jìn)行測(cè)序,建立一個(gè)數(shù)字化的生物王國(guó),這是深圳國(guó)家基因庫(kù)之所在。國(guó)家基因庫(kù)于2011年由國(guó)家發(fā)改委等部委批復(fù),依托華大基因組建、運(yùn)營(yíng),存儲(chǔ)管理我國(guó)特有遺傳資源、生物信息和基因數(shù)據(jù),于今年9月22日正式開庫(kù)。
“基因庫(kù)是真正的國(guó)庫(kù),比銀行的金庫(kù)還要寶貴。在農(nóng)業(yè)經(jīng)濟(jì)時(shí)代擁有更多的耕地,就意味著你擁有了優(yōu)勢(shì);在工業(yè)經(jīng)濟(jì)時(shí)代擁有更多的能源,你也具有了相應(yīng)的優(yōu)勢(shì);在生命經(jīng)濟(jì)時(shí)代,擁有更多的基因資源,對(duì)這些基因資源進(jìn)行認(rèn)知和利用,你在這樣一個(gè)新時(shí)代中就擁有了自己的優(yōu)勢(shì)?!眹?guó)家基因庫(kù)主任、華大農(nóng)業(yè)集團(tuán)董事長(zhǎng)兼總裁梅永紅說(shuō)。
大鵬新區(qū)位于深圳東南部,東西臨海,南北環(huán)山,遙望香港新界,是深圳的“黃金海岸”。這里山地多平地少,森林覆蓋率超過(guò)76%,整個(gè)大鵬半島被稱為深圳最后的“桃花源”。
國(guó)家基因庫(kù)從外形上看成臺(tái)階形,這樣的造型是有來(lái)歷的。2002年4月5日,《科學(xué)》雜志以14頁(yè)的篇幅發(fā)表了華大基因《水稻(秈稻)基因組的工作框架序列圖》,封面是秀美的云南紅河哈尼梯田,國(guó)家基因庫(kù)建筑的外形基本就是參照龐大的哈尼梯田設(shè)計(jì)的。據(jù)華大基因研究院院長(zhǎng)、國(guó)家基因庫(kù)執(zhí)行主任徐訊介紹,基因庫(kù)倚靠山體的自然坡度進(jìn)行建設(shè),每一層都相當(dāng)于是第一層,有山體結(jié)構(gòu)的支撐,穩(wěn)固性非常好,可以擺放一些較重的設(shè)備。
從國(guó)家基因庫(kù)6樓的露臺(tái)望去,對(duì)面是茂密的青山,遠(yuǎn)處能看見海?;驇?kù)選址大鵬還有一個(gè)考慮,因?yàn)樯胶竺媸荓NG(液化天然氣)碼頭,液化天然氣運(yùn)輸?shù)酱说臅r(shí)候是液態(tài),要變成氣態(tài)輸送至千家萬(wàn)戶,這個(gè)過(guò)程需要汽化,汽化會(huì)產(chǎn)生大量的冷能。如果冷能直接釋放到海里將導(dǎo)致海洋溫度改變,引起生態(tài)系統(tǒng)的變化?!叭绻牙淠苤苯虞斔偷絿?guó)家基因庫(kù)用于冷卻樣品,每年能節(jié)約三分之二的電費(fèi)。”徐迅說(shuō)。
此外,深圳正在全力推進(jìn)“東進(jìn)戰(zhàn)略”,將在深圳東部沿海大鵬半島規(guī)劃建設(shè)國(guó)際生物谷,并將其打造成為國(guó)際領(lǐng)先的生物科技創(chuàng)新中心,國(guó)家基因庫(kù)是大鵬新區(qū)的重要產(chǎn)業(yè)基礎(chǔ)設(shè)施。
據(jù)徐迅介紹,國(guó)家基因庫(kù)一期的目標(biāo)存儲(chǔ)規(guī)模是3000萬(wàn)份樣本,二期目標(biāo)準(zhǔn)備動(dòng)工,打算在對(duì)面山里打一個(gè)隧道用于儲(chǔ)存樣本,把儲(chǔ)存能力提高到3億?!吧絽^(qū)地形推平蓋樓成本太高,而且山洞保藏樣品的能量耗散低?!彼麄兦捌谧隽撕芏嗾{(diào)研,認(rèn)為這種方式是最有價(jià)值的。比如挪威的末日種子庫(kù)建設(shè)在挪威永凍土的山洞里,基本不需要外來(lái)的能量就能保持低溫0~4攝氏度,利于保存種子。
在國(guó)家基因庫(kù)里,你看不到琳瑯滿目的動(dòng)植物標(biāo)本,基因庫(kù)里保存的樣本是組織、血液、尿液等。動(dòng)植物標(biāo)本、石蠟切片等在常溫下保存;唾液、脫落細(xì)胞需保持于4攝氏度環(huán)境中;干血片、種子、DNA(中短期保存)需在-20攝氏度環(huán)境保存;微生物、血漿/清、蛋白、DNA、RNA等保存溫度要達(dá)到-80攝氏度。保存溫度最苛刻的是細(xì)胞和組織,需要-200攝氏度的液氮或氣相液氮環(huán)境。
在這里,能看到的絕大部分是專業(yè)儀器和密封倉(cāng)庫(kù),比如基因庫(kù)3樓擺放著華大基因自主研發(fā)的150臺(tái)BGISEQ-500基因測(cè)序儀,以及一臺(tái)造價(jià)2000萬(wàn)美元的Revolocity超級(jí)測(cè)序儀。這些價(jià)值數(shù)億元的設(shè)備,未來(lái)將每天產(chǎn)生大量的數(shù)據(jù),通過(guò)4樓的數(shù)據(jù)中心以及與基因庫(kù)合作的云平臺(tái),面向全球的科研機(jī)構(gòu)、企業(yè)。這一切都將以一種肉眼看不到的方式,靜悄悄地進(jìn)行。
一個(gè)巨大的數(shù)據(jù)庫(kù)將會(huì)生成。深圳國(guó)家基因庫(kù)是繼美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)、歐洲生物信息研究所(EBI)、日本DNA數(shù)據(jù)庫(kù)(DDBJ)之后世界上第四個(gè)國(guó)家級(jí)基因庫(kù),其他三個(gè)數(shù)據(jù)庫(kù)的主要功能是保存數(shù)據(jù),而深圳國(guó)家數(shù)據(jù)庫(kù)不僅會(huì)源源不斷地產(chǎn)生數(shù)據(jù),而且更加注重對(duì)于數(shù)據(jù)的研發(fā)和利用。“我們希望打造中國(guó)乃至世界最大的生物信息數(shù)據(jù)中心,像是生命健康數(shù)據(jù)領(lǐng)域的谷歌。”徐迅說(shuō)。
國(guó)家基因庫(kù)已實(shí)現(xiàn)對(duì)基因信息數(shù)據(jù)總量達(dá)60PB的訪問(wèn)支持,在9月22日正式營(yíng)業(yè)當(dāng)天,將有5PB的數(shù)據(jù)正式對(duì)外發(fā)布,提供數(shù)據(jù)檢索和查詢功能。數(shù)字化中心一年會(huì)有2PB左右的產(chǎn)量,這意味著一人一天看一部電影大概要看1萬(wàn)年?!拔覀兊哪繕?biāo)要做成10PB的年產(chǎn)量,以最高通量來(lái)算,一年要產(chǎn)生100萬(wàn)人的數(shù)據(jù)。”
第一批入庫(kù)樣本基本以疾病和物種多樣性為主。徐迅介紹了三個(gè)和疾病相關(guān)的重要數(shù)據(jù)庫(kù)。第一是罕見病數(shù)據(jù)庫(kù),華大基因已經(jīng)測(cè)了將近3000個(gè)罕見病家庭,新發(fā)現(xiàn)了400種罕見病基因?!昂芏嗨幬镒钤缍际轻槍?duì)罕見病基因開始的,而基因和基因之間通過(guò)網(wǎng)絡(luò)和通路相互作用,后來(lái)發(fā)現(xiàn)針對(duì)罕見病基因的藥物能治療的疾病越來(lái)越多。”他相信,基因庫(kù)的數(shù)據(jù)庫(kù)公開之后,訪問(wèn)最多的會(huì)是研究藥物和疾病的研究機(jī)構(gòu)。
第二個(gè)是癌癥數(shù)據(jù)庫(kù)。癌癥是基因病,細(xì)胞的基因突變促使癌癥產(chǎn)生?!拔覀円恢币詠?lái)都是國(guó)際癌癥組織聯(lián)盟的成員,現(xiàn)在國(guó)際癌癥組織所有的數(shù)據(jù)信息也存在于即將開業(yè)的基因庫(kù)里,開業(yè)之后我們會(huì)提供全球的癌癥數(shù)據(jù),癌癥數(shù)據(jù)庫(kù)里存儲(chǔ)了近上萬(wàn)份的不同類型和系統(tǒng)的癌癥數(shù)據(jù),這對(duì)未來(lái)疾病的診斷和治療也有很大的意義?!彼A(yù)計(jì),癌癥數(shù)據(jù)庫(kù)會(huì)是未來(lái)訪問(wèn)最頻繁的一個(gè)數(shù)據(jù)庫(kù)。
第三是大規(guī)模人群隊(duì)列的數(shù)據(jù)庫(kù)?!耙?yàn)椴煌褡?、不同區(qū)域的人群基因背景不一樣,這意味著疾病發(fā)病的情況也不相同,用藥情況會(huì)有差別,所以這種區(qū)域性的隊(duì)列數(shù)據(jù)不管是對(duì)技術(shù)科研還是應(yīng)用來(lái)講都有很大意義?!?/p>
科學(xué)家通過(guò)測(cè)序可以了解到疾病與特定基因的關(guān)系,最為人熟知的例子是美國(guó)影星安吉麗娜·朱莉。她有癌癥家族遺傳史,她的母親、外婆和姨媽都因癌癥去世。朱莉通過(guò)基因檢測(cè)知道自己有87%的可能性患上乳腺癌,50%的可能性患卵巢癌,從而選擇提前預(yù)防,切除了自己的乳腺和卵巢。
梅永紅說(shuō):“目前我們國(guó)家提倡精準(zhǔn)醫(yī)學(xué),精準(zhǔn)醫(yī)學(xué)恰恰建立在對(duì)人和與人相關(guān)的外源性生物物種認(rèn)知的基礎(chǔ)上,我們要通過(guò)基因測(cè)序來(lái)了解遺傳規(guī)律、醫(yī)學(xué)范式,這時(shí)能否擁有更多的基因資源、能否掌握更多的遺傳規(guī)律就非常關(guān)鍵,未來(lái)精準(zhǔn)醫(yī)學(xué)的發(fā)展和競(jìng)爭(zhēng)在某種程度上取決于我們具有的基因資源,以及認(rèn)知基因資源的能力?!?/p>
國(guó)家基因庫(kù)的主要功能是“三庫(kù)兩平臺(tái)”,三庫(kù)即生物信息數(shù)據(jù)庫(kù)、生物樣本資源庫(kù)、生物活體庫(kù),兩平臺(tái)即數(shù)字化平臺(tái)、合成與基因編輯平臺(tái),這是國(guó)家基因庫(kù)作為一個(gè)國(guó)際級(jí)平臺(tái)應(yīng)當(dāng)具備的功能。梅永紅說(shuō):“我國(guó)國(guó)家基因庫(kù)的建設(shè)雖晚于發(fā)達(dá)國(guó)家,但它相當(dāng)于國(guó)外多個(gè)樣本庫(kù)和基因庫(kù)的集合,既有保存動(dòng)植物、微生物和人類組織細(xì)胞等樣本的‘濕庫(kù),也有匯集人類各種生物信息的‘干庫(kù),還引入了‘活庫(kù),即活體生物庫(kù),是全球最大的綜合性基因庫(kù)?!?/p>
至于為什么把這樣一個(gè)規(guī)模龐大的國(guó)家基因庫(kù)交給華大基因進(jìn)行建設(shè),梅永紅說(shuō)他曾經(jīng)思考過(guò)這個(gè)問(wèn)題。“我們國(guó)家有那么多的科研機(jī)構(gòu),那么多大學(xué),那么多做得好的國(guó)有企業(yè),為什么要把這樣一個(gè)國(guó)家級(jí)的平臺(tái)建設(shè)交給華大?”在他看來(lái)有幾個(gè)原因:第一,華大是全球最大的基因測(cè)序公司,建國(guó)家基因庫(kù)并不僅僅是收集和保存基因資源,更要得到應(yīng)用,需要有數(shù)字化的過(guò)程,華大在解讀基因遺傳密碼方面是全球領(lǐng)先的。第二,華大從1999年創(chuàng)立以來(lái),通過(guò)參與人類基因組計(jì)劃到今天,已經(jīng)成為全球擁有基因數(shù)據(jù)量最大的機(jī)構(gòu),產(chǎn)出的人類基因組數(shù)據(jù)一度占到全球的47%,而且產(chǎn)出超過(guò)70%的全球農(nóng)業(yè)基因組數(shù)據(jù),華大所擁有的這些數(shù)據(jù)對(duì)國(guó)家基因庫(kù)特別是數(shù)據(jù)庫(kù)來(lái)說(shuō),是非常重要的資源。第三,華大基因作為一個(gè)民辦官助的新型研究機(jī)構(gòu),在利用這個(gè)資源方面可能比我們體制內(nèi)的機(jī)構(gòu)具有更好的條件。
對(duì)于研究生物多樣性的張國(guó)捷來(lái)說(shuō),深圳國(guó)家基因庫(kù)還有自己的特殊之處。“全世界的基因組研究機(jī)構(gòu)中,只有華大提出將生物多樣性研究作為重要方向,所以可以說(shuō)這是世界上唯一一個(gè)以生物多樣性研究為最主要研究目的的大型基因組研究中心?!蓖ㄟ^(guò)方向性的戰(zhàn)略規(guī)劃,他們已經(jīng)和全世界200多個(gè)博物館、動(dòng)物園、動(dòng)物保護(hù)區(qū)建立了長(zhǎng)期穩(wěn)定的合作關(guān)系。
“我們要研究生物,研究基因組學(xué),其中一個(gè)最核心的問(wèn)題就是生命之樹什么樣。這不光能解釋人類從哪里來(lái),還要回答生命從哪里來(lái),究竟是如何產(chǎn)生這個(gè)多姿多彩的世界。過(guò)去科學(xué)家用肉眼去觀察化石、標(biāo)本,如今我們用一種更新的技術(shù)——基因組學(xué)去揭示物種之間更深刻的聯(lián)系,了解物種如何適應(yīng)環(huán)境,解答基礎(chǔ)的生物學(xué)問(wèn)題?!睆垏?guó)捷說(shuō)。他穿著一件黑色的短袖T恤,前面的圖案是達(dá)爾文的進(jìn)化樹,后面印著《物種起源》最后一句話的英文原文。
“我們沒(méi)辦法一下子把全世界的物種都數(shù)字化,但我們可以根據(jù)我們的目的,針對(duì)所要回答的科學(xué)問(wèn)題,側(cè)重性地選取一些物種進(jìn)行研究?!彼f(shuō)。
2014年,他和國(guó)際鳥類基因組聯(lián)盟的研究人員通過(guò)基因組研究揭示了鳥類的秘密。當(dāng)年12月,美國(guó)《科學(xué)》及其他雜志以??男问?,公布了迄今為止最可靠、最全面的鳥類“生命之樹”。張國(guó)捷等人從分子生物學(xué)角度揭示了“鳥是如何成為鳥的”。為回答這些問(wèn)題,他領(lǐng)導(dǎo)的國(guó)際鳥類基因組聯(lián)盟對(duì)48個(gè)鳥類物種進(jìn)行基因組測(cè)序、組裝和全基因組比較分析,這些鳥類物種包括烏鴉、鴨、隼、鸚鵡、企鵝、朱鹮、啄木鳥和鷹等,囊括了現(xiàn)代鳥類的主要分支。
結(jié)果表明,鳥類是6500萬(wàn)年前白堊紀(jì)物種大滅絕事件中的幸存者,那次事件滅絕了地球上的恐龍,只有部分鳥類的祖先存活了下來(lái)。而基于基因組數(shù)據(jù)的新研究表明,恐龍滅絕后1000萬(wàn)年至1500萬(wàn)年間,鳥類經(jīng)歷了一次“超級(jí)物種大爆發(fā)”,后來(lái)逐漸演化出了1萬(wàn)多種被稱為新鳥綱的鳥類,95%的現(xiàn)存鳥類來(lái)自這一新鳥綱鳥類。
研究還發(fā)現(xiàn),與其他脊椎動(dòng)物相比,鳥類的基因組要小很多,大約只有哺乳類平均大小的30%~40%,而且相比哺乳動(dòng)物,鳥類基因組也更加穩(wěn)定,基因組重排現(xiàn)象要少得多。同時(shí)研究人員還發(fā)現(xiàn),鳥類的祖先從爬行動(dòng)物中分化出來(lái)后丟失了成百上千的基因,比如牙齒相關(guān)基因的丟失解釋了為何現(xiàn)存所有鳥類都沒(méi)有牙齒,卵巢發(fā)育相關(guān)基因的丟失解釋了為何鳥類只有單一功能的卵巢?!斑@是非常有趣的發(fā)現(xiàn)。人們通常認(rèn)為,生物演化出新特征依靠的是產(chǎn)生新的遺傳物質(zhì),而不是基因的丟失?!睆垏?guó)捷說(shuō)。
目前,他們和世界眾多博物館合作,計(jì)劃把全世界所有的鳥類,以及過(guò)去400年內(nèi)滅絕的鳥類進(jìn)行數(shù)字化。這個(gè)項(xiàng)目推行得比較順利,保存在美國(guó)自然歷史博物館和各種博物館的鳥類已經(jīng)達(dá)到8000多種,如果進(jìn)一步降低測(cè)序成本很快可以實(shí)現(xiàn)他們的目標(biāo)。
測(cè)序可以回答很多問(wèn)題?!氨热纾煌B類之間有什么關(guān)系?為什么很多鳥在不停地遷徙?為什么有些鳥可以飛,有些不能?為什么有些鳥類一感染禽流感馬上就死亡,有些鳥類卻可以抵御禽流感?鳥類祖先進(jìn)化到現(xiàn)在有1.5億多年的歷史,如此長(zhǎng)的歷史過(guò)程中,地球發(fā)生的歷史事件如何影響到鳥類的分布和分化?氣候變化對(duì)鳥類的分布格局有什么影響?”
正如同人類剛剛擁有幾臺(tái)計(jì)算機(jī)時(shí),無(wú)法想象數(shù)字技術(shù)能夠引發(fā)怎樣的社會(huì)、經(jīng)濟(jì)和科學(xué)領(lǐng)域的變革一樣,當(dāng)人們確定最初幾個(gè)基因組時(shí),也沒(méi)有想象到未來(lái)會(huì)發(fā)生什么樣的變化,要如何期待、如何迎接這樣的變化。如今,隨著測(cè)序技術(shù)的發(fā)展,這個(gè)前景越來(lái)越清晰,基因測(cè)序?qū)⒑兔恳粋€(gè)人發(fā)生關(guān)系,基因庫(kù)將成為真正意義上的“國(guó)庫(kù)”。