亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基因算命靠譜嗎?

        2017-07-12 20:24:59袁越
        三聯(lián)生活周刊 2017年28期
        關(guān)鍵詞:基因組測(cè)序基因

        袁越

        隨著DNA測(cè)序技術(shù)的飛速發(fā)展,基因檢測(cè)越來越火了。這是生物學(xué)研究領(lǐng)域的一次重大革新,它改變了科學(xué)研究的范式,標(biāo)志著生命科學(xué)邁向了一個(gè)嶄新的未知領(lǐng)域。

        差異決定命運(yùn)

        2009年8月14日,朵拉(左)和弗雷德·貢克爾參加“23和我”公司進(jìn)行的個(gè)體基因組測(cè)試

        如果你想知道自己未來會(huì)不會(huì)謝頂或者發(fā)胖,有多大可能得糖尿病或者癌癥,甚至想知道自己究竟能活多久,能否生出一個(gè)健康的孩子,你可以:A.請(qǐng)一位算命先生測(cè)測(cè)自己的生辰八字;B.找一個(gè)星座大師查查自己的星盤;C.把自己的唾液寄給一家基因檢測(cè)公司。

        選A和B的我們稱為封建迷信,選C的則被視為科學(xué),因?yàn)橐粋€(gè)人的生辰八字和星座星盤沒有理由決定他的命運(yùn),兩者之間的邏輯鏈條是不清晰的,而基因則是所有生命現(xiàn)象的遺傳基礎(chǔ),科學(xué)家們已經(jīng)搞清了遺傳的本質(zhì),明確了從基因到蛋白質(zhì)之間的因果關(guān)系,用基因來算命應(yīng)該是靠譜的吧?

        沒錯(cuò),自從1953年沃森和克里克發(fā)現(xiàn)了DNA分子的雙螺旋結(jié)構(gòu)之后,我們終于知道生命信息是由DNA分子負(fù)責(zé)儲(chǔ)存的,而基因則是由DNA分子當(dāng)中的G、A、T、C這四種核苷酸依次排列而成,不同的排列方式?jīng)Q定了蛋白質(zhì)的結(jié)構(gòu)和功能。蛋白質(zhì)不但是所有生命體的結(jié)構(gòu)基礎(chǔ),也是所有生化反應(yīng)的催化劑(酶),基因正是通過控制蛋白質(zhì)來控制生命的,這條邏輯鏈不但相當(dāng)完整,而且經(jīng)受了時(shí)間的考驗(yàn)。

        2003年,人類基因組計(jì)劃宣告成功,來自全世界的科學(xué)家們通力合作,測(cè)出了所有30億個(gè)核苷酸的全部DNA序列,其中包含大約2萬個(gè)基因。值得一提的是,這2萬個(gè)基因的長度加起來只占人類染色體總長度的1.5%左右,人類基因組中的絕大部分DNA序列都不編碼任何蛋白質(zhì)。但是,這并不等于說這些DNA序列都是沒用的,它們很可能參與了基因性能的調(diào)控,并以這種方式控制了蛋白質(zhì)合成的時(shí)間和數(shù)量,進(jìn)而控制了生命的進(jìn)程。

        隨著基因組測(cè)序量的增加,我們知道地球上所有人的基因組相互之間的相似度高達(dá)99.5%以上,剩下的這不到0.5%的差異之中,大部分是單個(gè)核苷酸的差別,比如某個(gè)位點(diǎn)大多數(shù)人是A,但少數(shù)人是G,這樣的差異我們稱為“單核苷酸多態(tài)性”(Single Nucleotide Polymorphism,以下簡稱SNP)。除此之外,還包括多個(gè)核苷酸的插入、缺失和重復(fù)等其他類型的差異,但它們所占的比例很低,本文暫不考慮。

        2013年9月7日,在美國北卡羅來納州達(dá)勒姆的斯塔格維爾種植園,烹飪史學(xué)家邁克爾·特維蒂獲知了遺傳測(cè)試結(jié)果,確定他的祖先在北非

        如果讓一個(gè)外星人來研究人類基因組,他肯定會(huì)把研究重點(diǎn)放在那99.5%的相同部分,因?yàn)橥庑侨烁信d趣的是人類和其他生物的差異,那99.5%才是決定人之所以為人的主要原因。但是,人類科學(xué)家肯定會(huì)更加關(guān)心剩下的0.5%,因?yàn)槿伺c人之間的差異,以及很多種疾病的病因都是由這0.5%造成的。

        同樣,算命先生肯定也只關(guān)心這0.5%的基因差異,因?yàn)槿祟惞餐拿\(yùn)是不需要算的。算命愛好者關(guān)心的是自己和其他同類的不同之處,幾乎所有這些不同之處都源于人類基因組內(nèi)的SNP,市面上那些基因檢測(cè)公司測(cè)的就是它們。

        基因檢測(cè)的芯片法

        測(cè)SNP最準(zhǔn)確的辦法當(dāng)然是直接測(cè)DNA序列,最先知道的人類SNP正是在基因測(cè)序的過程中被發(fā)現(xiàn)的。2008年開始實(shí)施的“千人基因組計(jì)劃”(1000 Genomes Project)測(cè)量了來自26個(gè)不同族群的1000多個(gè)個(gè)體的全基因組序列,發(fā)現(xiàn)平均每個(gè)人的基因組內(nèi)都有100萬~300萬個(gè)SNP,具體數(shù)量和這個(gè)人所屬的族群有很大關(guān)系。

        這個(gè)數(shù)字看似很大,但考慮到人類基因組一共有30億個(gè)核苷酸,算下來一個(gè)人平均每1000多個(gè)核苷酸才會(huì)有一個(gè)和別人不一樣,這說明SNP的出現(xiàn)概率其實(shí)是非常低的。

        SNP是DNA復(fù)制差錯(cuò)導(dǎo)致的。隨著人口總數(shù)的增加和基因組測(cè)序量的增大,科學(xué)家們發(fā)現(xiàn)了越來越多的SNP。截至2017年,國際單核苷酸多態(tài)性數(shù)據(jù)庫(dbSNP)里已經(jīng)收錄了3.24億個(gè)SNP,其中出現(xiàn)頻率超過1%的SNP約為8500萬個(gè)。這些SNP統(tǒng)一用以rs為開頭的一串?dāng)?shù)字來命名,比如rs72921001就是一個(gè)位于第11號(hào)染色體上的SNP,假如你在這個(gè)SNP位點(diǎn)上的核苷酸是A,那么你很可能會(huì)喜歡吃香菜,如果是C的話,那么你很可能會(huì)覺得香菜有股讓人惡心的肥皂味兒。

        如果你想知道自己到底喜不喜歡吃香菜,當(dāng)然可以把自己的第11號(hào)染色體上的那段相應(yīng)的DNA序列測(cè)出來,但這么做成本太高了。既然我們已經(jīng)知道了這段DNA序列,那就可以不用測(cè)序,而是通過更加廉價(jià)的“探針法”將其檢測(cè)出來。事實(shí)上,為了區(qū)分不同的SNP,國際SNP數(shù)據(jù)庫通常會(huì)列出該SNP兩邊各幾十個(gè)核苷酸的序列,這就為科學(xué)家們合成出相應(yīng)的探針提供了便利。

        顧名思義,所謂“探針”(Probe),就是事先制作好的一個(gè)和目標(biāo)基因互補(bǔ)的DNA短片段,用它可以從龐大的基因組中釣取出特定的SNP序列。比如前文提到的這個(gè)rs72921001,如果我們想要知道自己在這個(gè)SNP上到底是怎樣的話,只要根據(jù)數(shù)據(jù)庫里提供的信息,事先合成出一個(gè)帶有熒光標(biāo)記的DNA探針,覆蓋了這個(gè)SNP兩邊的幾十個(gè)核苷酸序列,然后把這個(gè)探針和自己的基因進(jìn)行雜交,SNP位點(diǎn)的不同會(huì)導(dǎo)致雜交強(qiáng)度出現(xiàn)差異,從而引起熒光強(qiáng)度的變化。我們只要設(shè)法測(cè)出熒光的強(qiáng)度,就可以推斷出自己在這個(gè)SNP位點(diǎn)上到底是A還是C了。

        安吉麗娜·朱莉在得知自己攜帶乳腺癌基因后,參考了多方面因素,最終決定預(yù)防性切除乳腺和卵巢

        探針法最大的好處就是可以把探針做得非常小,然后將很多探針集成到一塊芯片上,通過機(jī)器來自動(dòng)讀取熒光信息,這就大大提高了基因檢測(cè)的通量,降低了成本。最早采用這個(gè)辦法的就是大名鼎鼎的美國基因檢測(cè)公司“23和我”(23andMe),這家公司早在2007年就推出了全世界第一個(gè)基于芯片法的個(gè)人基因測(cè)試盒,后來的所有這類面向普通消費(fèi)者的基因檢測(cè)公司大都沿用了他們發(fā)明的這項(xiàng)技術(shù),其中就包括國內(nèi)的諾禾致源、博奧頤和、碳云智能和23魔方等等不下幾十家公司。

        總部位于深圳的“微基因”(WeGene)也是其中之一,這家公司采用了96孔和24孔兩種規(guī)格的芯片板,其中24孔板就是在一塊尺寸大約為12厘米×6厘米的塑料板上安置24塊芯片,每塊芯片上事先放置了60萬個(gè)熒光探針。顧客把自己的唾液吐進(jìn)專門從國外定制的收集管里寄回公司,這批管子被集中送至同樣位于深圳的“華大基因”(BGI)公司的實(shí)驗(yàn)室,由專門的實(shí)驗(yàn)人員從唾液中提取出顧客的DNA,在恒溫箱中和芯片進(jìn)行雜交。之后這塊芯片板被送入專門的儀器中讀取熒光信號(hào),再用相應(yīng)的軟件進(jìn)行分析,就可以獲得這位顧客基因組內(nèi)的60萬個(gè)SNP位點(diǎn)的遺傳信息了。

        “單個(gè)熒光信號(hào)并不能直接告訴我們?cè)撐稽c(diǎn)的遺傳信息,必須把來自多個(gè)芯片的信號(hào)數(shù)據(jù)整合起來分析,才能判斷出某個(gè)SNP位點(diǎn)到底是哪個(gè)核苷酸?!薄拔⒒颉钡氖紫夹g(shù)官陳鋼對(duì)我介紹說,“我們通過大量試驗(yàn),對(duì)芯片讀取技術(shù)進(jìn)行了多次優(yōu)化,終于把數(shù)據(jù)的重復(fù)率提高到了99.6%。也就是說,同樣一塊芯片,分析兩次得出的結(jié)果有99.6%都是一樣的。”

        判斷一家基因測(cè)序公司的好壞,數(shù)據(jù)的可重復(fù)性是很重要的指標(biāo)。另一個(gè)重要指標(biāo)當(dāng)然是探針的設(shè)計(jì)和SNP數(shù)據(jù)的分析方法,這里面的學(xué)問就更多了,值得我們好好討論一番。

        祖源分析的科學(xué)基礎(chǔ)

        祖源分析一直是全球絕大部分基因檢測(cè)公司的主要業(yè)務(wù)項(xiàng)目,我們可以先通過這個(gè)項(xiàng)目了解一下基因檢測(cè)到底是如何進(jìn)行的。

        從某種意義上說,祖源分析就是基因親子鑒定的擴(kuò)增版,兩者的理論基礎(chǔ)是類似的,都是基于這樣一個(gè)事實(shí),那就是基因突變的發(fā)生頻率非常低,絕大部分基因突變(包括SNP)都只發(fā)生過一次。所有這些突變都會(huì)遵循基本的遺傳法則在人群中擴(kuò)散,只要掌握了這套遺傳法則,就可以根據(jù)相應(yīng)的遺傳特征判斷出兩個(gè)人是否有親緣關(guān)系,以及一個(gè)人的祖先究竟來自哪里,大約是在什么時(shí)候和其他人群分家的。

        這套分析方法的原理并不復(fù)雜,但實(shí)施起來卻并不容易,需要事先對(duì)不同的族群進(jìn)行全基因組測(cè)序,從中找出最具代表性的SNP。比如,如果我們能找到一群一直生活在某一非洲地區(qū)的原住民,分析他們的DNA,再和世界其他地方的人做對(duì)比,找出哪幾個(gè)SNP是這群非洲人獨(dú)有的。之后,如果我們?cè)诨驕y(cè)試的過程中再次發(fā)現(xiàn)了這幾個(gè)SNP,就可以推斷出這個(gè)測(cè)試者是那群非洲原住民的后代,甚至可以根據(jù)一套復(fù)雜的算法大致估算出這位測(cè)試者到底是從什么時(shí)候開始從那個(gè)非洲部落里走出來的。

        這套分析方法要求SNP的遺傳規(guī)律相對(duì)簡單,人類基因組當(dāng)中只有線粒體和Y染色體符合這個(gè)要求,因?yàn)樗鼈冊(cè)趶?fù)制的過程中不會(huì)發(fā)生基因重組,最適合用于祖源分析。

        雖然線粒體和Y染色體不會(huì)發(fā)生基因重組,但依靠它們進(jìn)行祖源分析還是很難的。線粒體雖然很小,但也有1.67萬個(gè)核苷酸,Y染色體雖然是所有染色體當(dāng)中最短的,也含有大約6000萬個(gè)核苷酸,科學(xué)家們需要積累很多的DNA數(shù)據(jù)才能得出可靠的結(jié)論。

        最早開始研究線粒體和Y染色體的是歐美國家,他們采樣的范圍肯定偏向歐美人群,所以歐美等國在這方面的數(shù)據(jù)積累得特別多,得出的結(jié)論也就更加精確。再加上歐美等國的居民成分本來就相對(duì)要復(fù)雜一些,那里的消費(fèi)者對(duì)于自己祖先來源的興趣也更大,所以祖源分析在歐美消費(fèi)者當(dāng)中很有市場,很多歐美人之所以去測(cè)基因,主要目的就是為了測(cè)祖源。

        相比之下,中國在這方面的優(yōu)勢(shì)就沒那么明顯了。比如我在“微基因”測(cè)過自己的祖源,發(fā)現(xiàn)我是99.66%的北方漢族。這個(gè)結(jié)果對(duì)我來說幾乎一點(diǎn)意義都沒有,不過我有幾個(gè)少數(shù)民族的朋友還是測(cè)出了一些不同的成分,不能一概而論。

        這個(gè)分析結(jié)果的理論基礎(chǔ)來自十多年前由復(fù)旦大學(xué)金力教授牽頭實(shí)施的“東亞男性Y染色體大調(diào)查”,研究人員深入到許多偏遠(yuǎn)地區(qū),收集到了1.2127萬個(gè)Y染色體樣本,分別來自163個(gè)不同的東亞人群。這些人群的分布情況和遷徙路線大都是已知的,這就給研究人員提供了很多優(yōu)質(zhì)的參考數(shù)據(jù),準(zhǔn)確地把基因和族群特征聯(lián)系了起來?!拔⒒颉敝灰獪y(cè)出我的基因組內(nèi)與此相關(guān)的若干個(gè)SNP的情況,就可以知道我的祖先來自哪里。

        女性沒有Y染色體,只能通過線粒體來進(jìn)行祖源分析。但是線粒體本來就短,東亞人群的線粒體研究也做得不如Y染色體好,所以依靠線粒體進(jìn)行祖源分析不如Y染色體那么可靠。不過,“微基因”收集了很多位于常染色體上的祖源特征,也可以借助常染色體的SNP信息來測(cè)祖源。

        如果你信不過中國的基因檢測(cè)公司,去國外做檢測(cè),效果會(huì)不會(huì)好一點(diǎn)呢?答案是否定的,因?yàn)闅W美人祖先的遷徙路線和中國人很不相同,歐美公司自然會(huì)偏向他們,專挑那些和歐美人的祖源有關(guān)聯(lián)的SNP去測(cè)。前文說過,算命的基礎(chǔ)是差異性。如果你測(cè)的SNP在中國人當(dāng)中只有萬分之一的出現(xiàn)率,那就說明你需要測(cè)一萬個(gè)中國人才會(huì)出現(xiàn)一次不同的結(jié)果,這樣的SNP對(duì)于中國用戶來說是沒有意義的。

        因此,對(duì)于中國用戶來說,如果你想更精確地知道自己的祖先來自哪里,只能希望中國科學(xué)家們多多努力了。中國人的祖源成分雖然有可能不如歐美人那么富有戲劇性,但在中國這塊土地上發(fā)生的族群遷徙和融合事件一點(diǎn)也不會(huì)輸給歐美,長達(dá)3000多年的有文字記載的中國歷史就是明證,僅僅用“北方漢族”這四個(gè)字來概括是遠(yuǎn)遠(yuǎn)不夠的,應(yīng)該可以分得更細(xì)才對(duì)。

        華大基因的技術(shù)員在操作“微基因”公司的基因芯片

        問題在于,人類基因組測(cè)序是很費(fèi)錢的,相關(guān)數(shù)據(jù)的收集整理需要耗費(fèi)大量的時(shí)間和精力,一般人缺乏動(dòng)力,除非能一邊收集數(shù)據(jù)一邊掙到錢才會(huì)去干。不過,這不就是“微基因”這樣的公司正在做的事情嗎?事實(shí)上,全世界幾乎所有的基因測(cè)序公司都是在一邊提供服務(wù)一邊收集數(shù)據(jù),希望能從消費(fèi)者提供的數(shù)據(jù)中發(fā)現(xiàn)新的東西,“微基因”自然也不例外。

        “不過,我們畢竟是一家面向普通消費(fèi)者的商業(yè)公司,不可能一上來就要求使用者填一大堆表?!标愪搶?duì)我說,“我們會(huì)使用一些技巧,比如填一次表可以拿到一張優(yōu)惠券之類的,鼓勵(lì)用戶把他們的一些個(gè)人信息告訴我們。當(dāng)然了,我們會(huì)事先向用戶說明這些信息的用途?!?/p>

        對(duì)于祖源分析來說,“微基因”需要的無非就是用戶的出生地、籍貫和民族等普通個(gè)人信息,收集起來難度不大。用戶在提供這些信息的同時(shí),也就幫助了“微基因”積累更多的數(shù)據(jù),提高祖源分析的準(zhǔn)確性。要知道,對(duì)于“微基因”來說,光有一大堆SNP數(shù)據(jù)是沒有用的,必須把每個(gè)人的遺傳信息和他的民族籍貫等真實(shí)信息結(jié)合起來才有價(jià)值。

        陳鋼還告訴我,他們最近開始嘗試一種新的玩法,鼓勵(lì)使用者上傳自己的正面免冠照片,然后他們?cè)诤笈_(tái)把和使用者基因型相似的所有人的照片整合起來,用軟件加以平均,生成一張“祖源平均臉”。“微基因”希望通過這個(gè)方式,發(fā)現(xiàn)面部特征的遺傳基礎(chǔ)。如果這個(gè)目標(biāo)真的能實(shí)現(xiàn)的話,將來便可以通過一個(gè)人的基因型推斷出他的長相。美國聯(lián)邦調(diào)查局(FBI)也在研究類似的技術(shù),他們已經(jīng)利用該技術(shù)破獲了一起刑事案件。

        這項(xiàng)看似天方夜譚的技術(shù)真的靠譜嗎?答案是:有待確定。一個(gè)人的膚色、眼珠顏色、鼻梁高低和毛發(fā)是否卷曲等特征確實(shí)和種族有關(guān),推測(cè)起來應(yīng)該不難,但決定一個(gè)人長相的并不僅僅是以上這些,還包含了面部骨骼的很多細(xì)微變化,這些變化是由遺傳和環(huán)境這兩個(gè)因素雙重控制的,沒人知道兩者各占多大的比例。即使遺傳所占的比例很高,能夠影響臉型的基因也很可能有很多個(gè),怎么可能預(yù)測(cè)準(zhǔn)確呢?

        事實(shí)上,基因檢測(cè)的核心問題就出在這里。

        從基因型到表型

        依靠基因檢測(cè)來進(jìn)行祖源分析之所以還算靠譜,原因在于基因型和祖源是直接相關(guān)的,中間沒有多余的環(huán)節(jié)。但是,如果你想通過基因檢測(cè)來預(yù)判自己未來能長多高、會(huì)不會(huì)發(fā)胖、喜不喜歡吃香菜,或者預(yù)測(cè)自己生某種病的概率,可靠性就沒那么高了,這是因?yàn)閺幕蛐偷奖硇椭g還有很多步驟,每一步都存在諸多變數(shù),太復(fù)雜了。

        基因可以看成是制造蛋白質(zhì)的工程圖紙,從基因型到蛋白質(zhì)之間還要經(jīng)過轉(zhuǎn)錄、翻譯和翻譯后修飾等若干環(huán)節(jié),兩者之間并不是簡單的一一對(duì)應(yīng)關(guān)系。同樣,從蛋白質(zhì)到表型(Phenotype,也就是身高體重、頭發(fā)顏色、是否會(huì)生病等等后天表現(xiàn)出來的整體性狀)之間同樣也要經(jīng)歷很多步驟,這些步驟相互之間可以有互補(bǔ)和互惠等不同的關(guān)系,也不能簡單地畫等號(hào)。

        就拿遺傳病來說,有一類遺傳病只需要一個(gè)基因發(fā)生變異就可以表現(xiàn)出來,科學(xué)術(shù)語稱為“單基因遺傳病”。國際遺傳病數(shù)據(jù)庫中收錄的單基因遺傳病種類大概有8000種,其中4000多種病的致病機(jī)理是比較明確的,基本上可以建立一對(duì)一的關(guān)系。這類疾病理論上是可以通過基因檢測(cè)測(cè)出來的,比如“微基因”就列出了30項(xiàng)中國人當(dāng)中比較常見的單基因遺傳病,包括苯丙酮尿癥、肥厚型心肌病和葡萄糖-6-磷酸脫氫酶缺乏癥等。其中肥厚型心肌病不做檢查的話很難看出來,患者如果不注意的話有可能在做劇烈運(yùn)動(dòng)時(shí)發(fā)生猝死。葡萄糖-6-磷酸脫氫酶缺乏癥又名“蠶豆病”,患者進(jìn)食新鮮蠶豆后會(huì)誘發(fā)溶血性貧血,嚴(yán)重的有生命危險(xiǎn)。

        如果基因檢測(cè)查出一個(gè)人攜帶有某種致病基因,并不等于他一定會(huì)得病,因?yàn)閱位蜻z傳病大都是隱性遺傳的,即只有兩條染色體上攜帶的都是致病基因時(shí)才會(huì)發(fā)病。即使在這種情況下,基因檢測(cè)仍然是有用處的,因?yàn)槿绻蚱揠p方都是攜帶者,那么他們生出的孩子將有四分之一的可能性患病,因此如果某人在基因檢測(cè)時(shí)被查出是某個(gè)遺傳病的基因攜帶者,那么配偶就應(yīng)該也去做檢查,防止生出患病的下一代。

        不過,絕大部分單基因遺傳病的發(fā)病率都很低,一般人中招的可能性很小。但像糖尿病、心臟病和癌癥這類高發(fā)性疾病則大都是由多種遺傳因素疊加而成的,很難通過消費(fèi)者級(jí)別的基因檢測(cè)做出可靠的判斷。另外,像智商這樣的表型背后的相關(guān)基因就更多了,一般的基因檢測(cè)是根本查不出來的。

        還有,絕大部分疾病不但和遺傳有關(guān),還和環(huán)境有很大關(guān)系。比如乳腺癌的發(fā)病率不但和致癌基因有關(guān),還和患者的初潮年齡、生育年齡和家族史等等很多因素密切相關(guān),即使是攜帶有BRCA1或者BRCA2這兩個(gè)著名的乳腺癌基因也并不意味著一定會(huì)得癌癥。安吉麗娜·朱莉之所以決定預(yù)防性摘除乳腺和卵巢,絕不僅僅是因?yàn)榛驒z測(cè),還和她的好幾位直系親屬都已得了癌癥有很大關(guān)系,這個(gè)決定是在參考了多方面因素后才做出來的。

        一種表型到底和遺傳有多大的關(guān)系?這是個(gè)非常難以回答的問題,因?yàn)榧膊〉倪z傳性不但難以界定,而且是會(huì)隨著環(huán)境的變化而發(fā)生改變的。舉例來說,身高的遺傳性在最近這100年里有了顯著的增加,但這不是因?yàn)槲覀兊幕虬l(fā)生了變化,而是因?yàn)槿祟惖臓I養(yǎng)水平普遍提高了,營養(yǎng)不良對(duì)于身高的影響力大大下降。再比如,肺癌一直被認(rèn)為是一種和后天生活環(huán)境(比如吸煙和空氣污染)關(guān)系密切的疾病,但如果一個(gè)村莊坐落在一家管理不善的火電站旁邊,或者該村的村民人人吸煙的話,那么肺癌對(duì)于這個(gè)村的村民來說就變成一種具有高度遺傳性的疾病了。

        正因?yàn)槿绱?,像“微基因”這種面向普通消費(fèi)者的基因測(cè)試結(jié)果是不能用于醫(yī)療診斷的,該公司也取消了“健康建議”欄目,因?yàn)樗麄儾幌嘈畔M(fèi)者有能力區(qū)分遺傳因素和環(huán)境影響之間的差別。但他們?nèi)匀槐A袅艘恍┖徒】涤嘘P(guān)的項(xiàng)目,比如運(yùn)動(dòng)基因、營養(yǎng)代謝、健康風(fēng)險(xiǎn)和藥物指南等等。不過,雖然這些項(xiàng)目的理論基礎(chǔ)大都來自可靠的科學(xué)論文,但使用者在解讀時(shí)仍需謹(jǐn)慎。

        比如,運(yùn)動(dòng)基因欄目中的“膝蓋前交叉韌帶保護(hù)能力”是和膠原蛋白的合成能力掛鉤的,理由是韌帶的主要成分是膠原蛋白,但真實(shí)生活中一個(gè)人的韌帶保護(hù)能力還和他的腿部肌肉力量有關(guān),所以這個(gè)指標(biāo)只能作為運(yùn)動(dòng)時(shí)的參考。再比如,營養(yǎng)代謝欄目中的“乳糖代謝能力”衡量的是成年人體內(nèi)的乳糖酶的活性,但其實(shí)乳糖酶基因誰都有,只是有些人成年后不再表達(dá)了而已,這個(gè)基因的表達(dá)通路經(jīng)過適當(dāng)?shù)挠?xùn)練是可以重新恢復(fù)的,因此這項(xiàng)檢測(cè)肯定會(huì)有很多人覺得不準(zhǔn)。

        以上這些測(cè)試結(jié)果之所以不完全可靠,最根本的原因在于相應(yīng)的科學(xué)論文都屬于純粹的相關(guān)性研究,并沒有對(duì)雙方的因果關(guān)系做出合理的解釋。

        相關(guān)與因果

        鐮刀型細(xì)胞貧血癥是幾乎所有遺傳學(xué)教科書上都會(huì)拿出來詳細(xì)解釋的一種遺傳病,因?yàn)檫@是人類第一個(gè)完全搞清楚致病機(jī)理的單基因遺傳病,從致病基因到貧血癥之間的因果關(guān)系是非常明確清晰的。

        當(dāng)初科學(xué)家們先是從鐮刀型紅細(xì)胞入手,發(fā)現(xiàn)患者血紅蛋白β-肽鏈的第6位置上的谷氨酸被纈氨酸所代替。隨即進(jìn)行的生化實(shí)驗(yàn)表明,僅此一項(xiàng)變異就能降低病人血紅蛋白的攜氧能力,并導(dǎo)致紅細(xì)胞從圓盤形變成鐮刀形。之后,科學(xué)家們找到了編碼鐮刀型血紅蛋白的基因,發(fā)現(xiàn)DNA序列中的一個(gè)核苷酸T變成了A,正是這個(gè)變化導(dǎo)致了它所編碼的氨基酸發(fā)生了改變。

        這個(gè)例子象征著傳統(tǒng)研究范式的勝利。這套研究方法的核心訴求就是尋找因果關(guān)系,研究思路則圍繞著“假說”(Hypothesis)做文章。研究者首先必須提出一個(gè)可被證偽的假說,然后設(shè)計(jì)出精巧的科學(xué)實(shí)驗(yàn),通過改變預(yù)設(shè)條件并觀察相應(yīng)的實(shí)驗(yàn)結(jié)果來驗(yàn)證(或者證偽)該假說。然后,研究者會(huì)把這一過程重復(fù)很多次,這才能找到自然現(xiàn)象與科學(xué)理論之間的因果關(guān)系。

        這套研究范式統(tǒng)治了科學(xué)研究幾百年,取得了一大批豐碩的成果,極大地提高了人類的生活質(zhì)量。但是,自從人類基因組計(jì)劃完成后,情況悄悄地發(fā)生了變化。

        就拿前文提到過的香菜基因來說,這個(gè)基因的發(fā)現(xiàn)過程和科學(xué)界常見的研究范式背道而馳。首先,“23和我”公司的研究人員并不知道去哪里尋找香菜基因,也沒有提出過任何假說,而是在自己的用戶群中發(fā)放了一份調(diào)查問卷,其中有一條就是詢問他們是否喜歡吃香菜。問卷收集上來之后,研究人員按照用戶對(duì)香菜的態(tài)度把所有人分成兩組,然后從他們的SNP數(shù)據(jù)中尋找規(guī)律,rs72921001就是這么被發(fā)現(xiàn)的。直到今天,科學(xué)家們也只能說這個(gè)SNP很可能與嗅覺功能有關(guān),但它和香菜之間真正的因果關(guān)系尚不清楚。

        不知道因果關(guān)系并不妨礙基因檢測(cè)公司利用這一信息為用戶提供服務(wù)。事實(shí)上,各家基因公司在更多的人群中收集到的數(shù)據(jù)表明,用這個(gè)SNP來預(yù)判用戶對(duì)香菜的態(tài)度還是很靠譜的,只在中國遇到了一點(diǎn)小麻煩。因?yàn)橹袊腼兇罅渴褂孟悴?,很多中國人即使覺得香菜味道像肥皂,也漸漸地接受了這個(gè)味道,起碼不那么討厭它了。

        這個(gè)香菜SNP的發(fā)現(xiàn)和“23和我”公司的芯片設(shè)計(jì)很有關(guān)系。人群中喜歡香菜和討厭香菜的人都很多,因此這個(gè)香菜基因的多樣性肯定是非常高的。這家公司的科學(xué)家在芯片上放置了一大批專門針對(duì)高頻SNP的DNA探針,雖然這些SNP的功能還是未知的。等到公司收集了很多用戶,積累了大量數(shù)據(jù)之后,就可以利用這些高頻SNP來尋找有意思的基因了,香菜基因只是其中一個(gè)比較好玩的例子而已。

        事實(shí)上,這就是大部分這類普通消費(fèi)者級(jí)別的基因檢測(cè)公司的生財(cái)之道?!?3和我”公司2007年底剛開業(yè)的時(shí)候,一個(gè)基因測(cè)試盒的售價(jià)高達(dá)1000美元,但第二年就降到了399美元,后來更是降到了99美元的最低價(jià),其目的就是為了收集更多用戶的基因數(shù)據(jù),最終以此來盈利。其實(shí)這也是谷歌這類互聯(lián)網(wǎng)公司的生財(cái)之道,“23和我”正是從谷歌那里學(xué)會(huì)了這一招。

        就這樣,在堅(jiān)持了很多年,積累了80萬用戶之后,“23和我”終于在2015年初掙到了第一桶金。著名的生物技術(shù)公司基因泰克(Genentech)宣布付給“23和我”1000萬美元現(xiàn)金,用于購買該公司收集到的和帕金森氏癥有關(guān)的SNP數(shù)據(jù),希望能從中尋找到和這個(gè)病有關(guān)的基因,從而開發(fā)出針對(duì)這一絕癥的新藥。如果成功的話,基因泰克公司還將支付5000萬美元,使得這項(xiàng)合作的總價(jià)值有可能高達(dá)6000萬美元。

        “微基因”顯然也想復(fù)制“23和我”的成功模式。陳鋼告訴我,他們?cè)O(shè)計(jì)的芯片上有10萬個(gè)探針檢測(cè)的是已知功能的SNP位點(diǎn),另外50萬個(gè)探針檢測(cè)的是未知功能的SNP位點(diǎn),后者是專門為中國人量身打造的,包括了一大批在中國人群中出現(xiàn)率很高的SNP位點(diǎn),他們希望能把中國人群的遺傳多樣性都包括進(jìn)來。

        但是,這里面存在兩個(gè)問題。第一,這些位點(diǎn)的選擇必須考慮到探針的靈敏度問題,有些SNP位點(diǎn)出現(xiàn)率很高,但因?yàn)樽陨眄樞虻脑驅(qū)е绿结樅茈y設(shè)計(jì),從生產(chǎn)工藝的角度講麻煩太多,只能被舍棄。第二,光有基因數(shù)據(jù)一點(diǎn)用處也沒有,必須同時(shí)收集到用戶的個(gè)人健康信息才有用,這就涉及個(gè)人隱私的保護(hù)問題。其實(shí)這類研究的目的是造福全人類,用戶在購買服務(wù)的同時(shí)還能為科學(xué)研究做點(diǎn)貢獻(xiàn),本身應(yīng)該是件好事,可惜很多中國人對(duì)于疾病的認(rèn)識(shí)還處在原始階段,覺得生病是一件丟人的事情,不愿意讓別人知道。

        有家公司自認(rèn)為能夠一舉解決這兩個(gè)問題,這就是同樣位于深圳的華大基因。

        大數(shù)據(jù)的魅力

        “我們一直沒有在針對(duì)普通消費(fèi)者的基因檢測(cè)方面做太多事情,因?yàn)槲覀冇X得現(xiàn)有的數(shù)據(jù)量還不夠大,相關(guān)性不夠可靠?!比A大基因的創(chuàng)始人兼現(xiàn)任董事長汪建在接受我專訪時(shí)開門見山地說,“所以我們決定先從自己的員工做起,而且是從全基因組測(cè)序再到生化指標(biāo)檢測(cè)再到影像系統(tǒng)數(shù)據(jù)收集等等一起做。我們有6000多名職工,加上家屬有3萬到4萬人,足以構(gòu)建一個(gè)非常龐大的優(yōu)質(zhì)數(shù)據(jù)庫了?!?/p>

        采訪是在位于深圳郊區(qū)的國家基因庫進(jìn)行的,這是在發(fā)改委等國家部委的支持下,由華大基因研究院負(fù)責(zé)組建并運(yùn)營的國家級(jí)研究機(jī)構(gòu),其基因測(cè)序和數(shù)據(jù)儲(chǔ)存能力在全世界都是數(shù)一數(shù)二的。華大基因本來就是靠DNA測(cè)序起家的,當(dāng)年曾經(jīng)代表中國參與了人類基因組計(jì)劃,負(fù)責(zé)并完成了其中1%的測(cè)序工作。

        基因測(cè)序可以很好地彌補(bǔ)探針設(shè)計(jì)上的缺陷,在基因檢測(cè)領(lǐng)域有著不可替代的作用,但汪建顯然早就不滿足于只測(cè)DNA了?!叭绻蚴茿,健康是Z,從A到Z之間還有很多步驟呢,包括小分子代謝、維生素和氨基酸調(diào)控等等等等,所有這些步驟都有很多數(shù)據(jù)需要研究,只有掌握了這些數(shù)據(jù),才能搞清楚兩者之間的因果關(guān)系?!蓖艚ㄒ贿叴蛑謩?shì)一邊說,“我有一次講課時(shí)給每位學(xué)員發(fā)了一串糖葫蘆,第一個(gè)葫蘆是DNA,第二個(gè)是RNA,然后是氨基酸、蛋白質(zhì)、組織、器官……如果生命是一串糖葫蘆,那么我們必須把所有的葫蘆都串起來,把所有的關(guān)節(jié)都打通,否則是不行的?!?/p>

        在汪建的構(gòu)想中,華大基因最終將會(huì)變成一家醫(yī)療健康服務(wù)機(jī)構(gòu)。為了實(shí)現(xiàn)這個(gè)目標(biāo),他決定先從公司員工做起。他不但自己以身作則,還在公司內(nèi)部強(qiáng)力營造了一個(gè)健康生活的氛圍。比如國家基因庫里面居然沒有電梯,上下樓只能爬樓梯。他還在每個(gè)樓梯口放了一臺(tái)體重秤,時(shí)刻提醒大家注意控制體重。我還注意到,國家基因庫的辦公室桌上散落著好多握力器,他隨手抓起一個(gè)對(duì)我說:“我們公司開會(huì)發(fā)言的時(shí)候每個(gè)人都拿一個(gè)握力器,握多久就講多久,我一次能握100下!”

        不過,除了“少食多動(dòng)”這些常見的口號(hào)之外,華大基因極力發(fā)展的大數(shù)據(jù)分析并沒有為員工們提供太多有針對(duì)性的健康建議。不過這也很容易理解,因?yàn)檫@項(xiàng)工作才剛剛開始,數(shù)據(jù)量積累得還不夠多,不可能從中總結(jié)出什么驚世駭俗的健康理論。

        “我給你講個(gè)故事吧,這個(gè)故事給我留下很深刻的印象。”汪建一邊捏握力器一邊對(duì)我說,“新中國剛成立的時(shí)候流行過一陣子克山病,這是一種心肌病變,沒人知道病因。80年代初期,聯(lián)合國發(fā)展署為了幫助中國攻克克山病,送給中國政府一大堆儀器設(shè)備,能夠?qū)Νh(huán)境中的微量元素進(jìn)行分析,分析結(jié)果發(fā)現(xiàn),克山病高發(fā)區(qū)的土壤中硒的含量很低,于是中國政府開始有針對(duì)性地為老百姓補(bǔ)硒。到了1986年,這個(gè)病終于消失了。當(dāng)年我還是個(gè)醫(yī)生,被派去大理和楚雄做調(diào)研,發(fā)現(xiàn)那里的土壤和水系中的硒含量非常高,但當(dāng)年那兩個(gè)地區(qū)照樣有克山病,我百思不得其解。后來我才意識(shí)到,當(dāng)年云南很窮,得病的人都是因?yàn)槌圆伙柖亲樱髞斫?jīng)濟(jì)發(fā)展了,老百姓有飯吃了,克山病自然也就消失了?!?/p>

        這真是個(gè)很有意思的故事,從中可以總結(jié)出很多道理。

        首先,這個(gè)故事說明相關(guān)性研究有很多陷阱,一不小心很容易找錯(cuò)目標(biāo)。這方面還有一個(gè)著名的案例,有人曾經(jīng)發(fā)現(xiàn)尼古丁受體和肺癌有很強(qiáng)的相關(guān)性,但如果你想研究尼古丁受體分子到底是如何致癌的,結(jié)果恐怕會(huì)令你失望,因?yàn)閮烧咧g并沒有生物學(xué)上的關(guān)系,兩者的相關(guān)性純粹是因?yàn)槟峁哦∈荏w和吸煙有關(guān),而煙草才是導(dǎo)致肺癌的真正殺手。

        總之,我們不能輕信相關(guān)性研究的結(jié)論,而目前大多數(shù)消費(fèi)者級(jí)別的基因檢測(cè)的結(jié)果大都是基于相關(guān)性的研究,只能作為參考,不能成為醫(yī)生治病的依據(jù)?!?3和我”公司曾經(jīng)受到美國FDA的懲罰,原因就在于該公司夸大了基因檢測(cè)的可靠性,導(dǎo)致很多用戶把檢測(cè)結(jié)果當(dāng)成制定醫(yī)療方案的根據(jù)了。

        其次,這個(gè)故事說明新發(fā)現(xiàn)往往來自于新技術(shù)的應(yīng)用。在克山病的故事里,聯(lián)合國提供的環(huán)境微量元素測(cè)量設(shè)備是關(guān)鍵,沒有它就沒有硒理論的出臺(tái)。同理,基因研究領(lǐng)域近年來的飛速發(fā)展同樣得益于DNA測(cè)序技術(shù)的進(jìn)步。要知道,2003年測(cè)出的第一個(gè)人類基因組序列耗時(shí)13年,總花費(fèi)約為30億美元。14年后的今天,這兩個(gè)數(shù)字分別降到了數(shù)天和數(shù)百美元,甚至有可能在未來的幾年里降到一天和100美元的水平。相比之下,RNA和蛋白質(zhì)測(cè)序的技術(shù)仍然停留在10年前的水平,小分子代謝領(lǐng)域的研究方法也沒有太多改進(jìn),這就使得DNA成為生物學(xué)研究領(lǐng)域的一匹黑馬,而且早就一騎絕塵,把其他研究手段遠(yuǎn)遠(yuǎn)地甩在了后面。如今生物學(xué)之所以會(huì)出現(xiàn)那么多關(guān)于基因型和表型之間的相關(guān)性研究,根本原因就在這里。

        第三,雖然相關(guān)性研究不太可靠,但如果采樣范圍足夠廣、數(shù)據(jù)量足夠大的話,相關(guān)性總有一天會(huì)轉(zhuǎn)變?yōu)橐蚬P(guān)系,隱藏在大數(shù)據(jù)中的事實(shí)真相早晚有一天會(huì)浮出水面。

        就拿基因研究來說,如果我們能把全世界所有人的基因組順序都測(cè)出來,相關(guān)性肯定就變成了非??煽康囊蚬P(guān)系了。即使做不到每個(gè)人都測(cè),只要能測(cè)出一定比例的基因組,比如把三分之一的人口都測(cè)一遍,那么隱藏在基因組中的很多秘密一定會(huì)迎刃而解的。問題在于,基因組研究的數(shù)據(jù)量非常龐大,“微基因”把原始數(shù)據(jù)發(fā)給了每一位用戶,我那份數(shù)據(jù)的大小是14.5MB,大致相當(dāng)于一首高質(zhì)量的MP3歌曲。我每次用記事本打開它時(shí)都要等很久,因?yàn)槠胀ㄎ谋疚募苌儆羞@么大的。

        這還只是60萬個(gè)SNP位點(diǎn)的簡要信息,如果是全基因組測(cè)序的話,光是記錄測(cè)序結(jié)果的文件就有1GB左右,大致相當(dāng)于一部高清電影的大小。標(biāo)準(zhǔn)的全基因組測(cè)序結(jié)果還會(huì)加上質(zhì)量評(píng)分和測(cè)序深度等附加信息,通常是90GB左右,如果換成音樂的話恐怕一輩子都聽不完。如果再算上轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué)等等中間步驟的數(shù)據(jù)的話,任何一個(gè)人的健康數(shù)據(jù)都將是TB級(jí)別的。對(duì)于這個(gè)級(jí)別的大數(shù)據(jù),無論是存儲(chǔ)還是分析都將耗費(fèi)大量的電腦資源,任何一家公司要想開展這方面的研究,都必須首先把大筆投資放在計(jì)算機(jī)系統(tǒng)上。好在IT領(lǐng)域近年來發(fā)展神速,計(jì)算機(jī)的速度越來越快,硬盤的儲(chǔ)存量越來越大,價(jià)格卻越來越低了,無論是華大基因還是國內(nèi)另一家以測(cè)序?yàn)橹鳂I(yè)的旗艦型基因公司諾禾致源(Novogene)都已經(jīng)有了幾十PB級(jí)別的數(shù)據(jù)儲(chǔ)存能力,足以應(yīng)付目前的研究任務(wù)。

        同樣是最近這幾十年才發(fā)展起來的新興行業(yè),生命科學(xué)和計(jì)算機(jī)科學(xué)的差距為什么越拉越大呢?原因就在于研究范式的不同。

        研究范式的改變

        前文提到,最近這半個(gè)多世紀(jì)的生物學(xué)研究是以研究因果關(guān)系為主的,研究人員首先必須明確自己的研究目標(biāo),要么是一個(gè)基因或者一個(gè)蛋白質(zhì),要么是一種化學(xué)藥物或者一個(gè)治療方法,然后研究人員必須在實(shí)驗(yàn)室里建立一個(gè)細(xì)胞模型,把實(shí)驗(yàn)條件變來變?nèi)ィ疾烀恳淮胃淖兯鶎?dǎo)致的結(jié)果,并在這個(gè)過程中搞清其作用機(jī)理。這一步完成之后,還要再轉(zhuǎn)移到昆蟲或者小鼠中,利用動(dòng)物模型來做實(shí)驗(yàn),直到動(dòng)物模型也做得差不多了,這才敢轉(zhuǎn)移到人身上。無論從何種角度來看,科學(xué)家直接在人身上做實(shí)驗(yàn)都是不現(xiàn)實(shí)的,因此只能繞這么一個(gè)大彎子。

        這套模式導(dǎo)致的結(jié)果就是一名科學(xué)家往往只關(guān)心某一條生化路徑,找到的新藥也只能解決某一條路徑出現(xiàn)的問題。在汪建看來,這是現(xiàn)代生物醫(yī)藥領(lǐng)域最大的瓶頸所在。

        “分子生物學(xué)在最近這50年里所犯的最大錯(cuò)誤就是高估了單一基因的作用,因?yàn)槿祟惖膹?fù)雜程度是超出我們想象的?!蓖艚▽?duì)我解釋說,“一個(gè)人年輕的時(shí)候有很多代償性機(jī)制可以用來彌補(bǔ)單一基因缺陷所帶來的隱患,但他年紀(jì)大了之后這些代償機(jī)制很可能就逐漸失靈了,所以人老了才更容易生病?,F(xiàn)在的絕大多數(shù)化學(xué)藥都只是堵住了某一條代謝路徑,這個(gè)思路是行不通的?!?/p>

        在汪建看來,現(xiàn)代醫(yī)學(xué)確實(shí)提高了人類的壽命,但主要的功勞來自抗生素和疫苗的使用。這兩樣發(fā)明都是針對(duì)病菌的,可以較為容易地在培養(yǎng)皿里做實(shí)驗(yàn)。但像癌癥和老年癡呆癥這樣的疾病就沒辦法做實(shí)驗(yàn)了,所以進(jìn)展緩慢,逐漸變成了現(xiàn)代人最厲害的殺手。大數(shù)據(jù)研究方式則可以繞過這個(gè)障礙,不用拿人來做實(shí)驗(yàn),僅僅通過分析各種數(shù)據(jù),從中找出規(guī)律就行了。

        “在我看來,目前的基因大數(shù)據(jù)領(lǐng)域有兩種玩法,分別代表了兩個(gè)哲學(xué)層面的概念。一個(gè)是Why Not(為什么不),一個(gè)是For What(為了什么)?!蓖艚▽?duì)我說,“像‘23和我這樣的公司玩的是前者,反正就是鬧著玩的,靠不靠譜無所謂,只要消費(fèi)者玩得起就行。我雖然也在玩前者,但我最想玩的其實(shí)是后者,這就必須要有確切的科學(xué)證據(jù)才敢去做,于是在很多人眼里我就顯得有些保守了。”

        汪建的這段話很可能是有感而發(fā)的,因?yàn)樗?jīng)的部下,擔(dān)任過華大基因CEO的王俊不久前剛剛離開華大,創(chuàng)立了碳云智能公司,準(zhǔn)備立即把他那套“糖葫蘆”理論付諸實(shí)踐。

        “不過呢,新生兒遺傳缺陷、癌癥和傳染病這三個(gè)領(lǐng)域有些不同,因?yàn)檫@相當(dāng)于和死神賽跑,病人等不了了,所以我決定先從這三個(gè)領(lǐng)域入手,做點(diǎn)實(shí)際的事情?!蓖艚ㄑa(bǔ)充道。

        他所說的新生兒遺傳缺陷,指的就是華大基因開發(fā)的一套無創(chuàng)產(chǎn)前診斷方法,用的是華大最擅長的高通量測(cè)序法。以前孕婦要想做產(chǎn)前診斷的話只能抽羊水,存在一定的流產(chǎn)風(fēng)險(xiǎn)。華大的這套方法只需抽取孕婦5毫升靜脈血就可以判斷出胎兒的第13、18和21號(hào)染色體有沒有出現(xiàn)異常情況,其中21號(hào)染色體三體就是唐氏綜合征的病因。

        癌癥指的是癌細(xì)胞的基因檢測(cè),這是目前流行的癌癥靶向藥物在使用前必須經(jīng)過的一步。傳染病指的是用基因測(cè)序的方法判斷感染源,同樣可以幫助醫(yī)生迅速判斷出到底應(yīng)該用什么抗生素。

        稍微想想即可知道,這三個(gè)領(lǐng)域用的都是純粹的高通量基因測(cè)序技術(shù),和前文所說的那些研究不太一樣,肯定不是汪建和華大基因最終想要實(shí)現(xiàn)的目標(biāo)。但那個(gè)目標(biāo)太過遙遠(yuǎn),要想實(shí)現(xiàn)它,華大基因首先必須生存下去,于是這家公司正在將工作重心從純粹的基因測(cè)序服務(wù)轉(zhuǎn)移到醫(yī)療領(lǐng)域的實(shí)際應(yīng)用上來,其醫(yī)學(xué)部分馬上就要上市了。

        可惜的是,中國目前沒有任何一種基于基因檢測(cè)的診斷方法被列入醫(yī)保,中國患者只能自費(fèi)。

        至于華大基因未來的那個(gè)目標(biāo)到底是什么,其實(shí)誰也說不清,因?yàn)檠芯糠妒揭呀?jīng)發(fā)生了改變?!拔覀兪且患褼ata-driven(數(shù)據(jù)驅(qū)動(dòng))的公司,不再是Hypothesis-driven(假說驅(qū)動(dòng))了?!蓖艚ㄕf,“這個(gè)意思就是說,我們先生產(chǎn)出數(shù)據(jù),然后再從里面找假說?!?/p>

        至于說能否找得到,那就要看數(shù)據(jù)的總量和質(zhì)量了。每一個(gè)自費(fèi)花錢做基因測(cè)序的人,其實(shí)都是在為這個(gè)目標(biāo)做出自己的一份貢獻(xiàn)。

        結(jié)語

        汪建是一個(gè)直性子的人,采訪結(jié)束后的閑談過程中,他提到自己最近正打算駕船沿著達(dá)爾文當(dāng)年的足跡來一次環(huán)球旅行,把達(dá)爾文當(dāng)年研究過的動(dòng)植物的基因組統(tǒng)統(tǒng)測(cè)一遍?!斑@事就是純粹的Why Not,雖然尚未得到政府的支持,但我現(xiàn)在自己也玩得起了,于是我就想痛痛快快地玩一把?!?/p>

        達(dá)爾文的那次環(huán)球旅行在人類歷史上留下了濃重的一筆,因?yàn)樗褪窃谀谴温眯型局虚_始思考進(jìn)化論的。事實(shí)上,在達(dá)爾文的時(shí)代,生物學(xué)并沒有多少理論可以提供指導(dǎo),也沒有多少假說可供研究,還處在發(fā)現(xiàn)相關(guān)性的時(shí)代。那個(gè)時(shí)代的博物學(xué)家們滿世界尋找新穎的動(dòng)植物標(biāo)本,有點(diǎn)類似于現(xiàn)在的基因?qū)W家到處給人測(cè)序。最終,達(dá)爾文在浩如煙海的動(dòng)植物標(biāo)本中發(fā)現(xiàn)了規(guī)律,寫出了《物種起源》這本現(xiàn)代生物學(xué)的奠基之作。在他之后的生物學(xué)便一直沿著他定下的道路前行,取得了一大批豐碩的成果。

        如今生物學(xué)再一次遇到了瓶頸,醫(yī)學(xué)研究領(lǐng)域的發(fā)展速度明顯慢了下來。也許這就是一個(gè)信號(hào),告訴我們生物學(xué)又到了需要發(fā)現(xiàn)相關(guān)性的時(shí)代了,生物大數(shù)據(jù)研究就是在這個(gè)大背景下火起來的。此時(shí)汪建重走達(dá)爾文之路,好似生物學(xué)迎來了一個(gè)新的輪回,只不過這個(gè)輪回發(fā)生在更深的層次上,其結(jié)果也很可能像當(dāng)年的進(jìn)化論一樣,讓所有人大吃一驚。

        讓我們拭目以待吧。

        猜你喜歡
        基因組測(cè)序基因
        杰 Sir 帶你認(rèn)識(shí)宏基因二代測(cè)序(mNGS)
        新民周刊(2022年27期)2022-08-01 07:04:49
        Frog whisperer
        牛參考基因組中發(fā)現(xiàn)被忽視基因
        二代測(cè)序協(xié)助診斷AIDS合并馬爾尼菲籃狀菌腦膜炎1例
        傳染病信息(2021年6期)2021-02-12 01:52:58
        修改基因吉兇未卜
        奧秘(2019年8期)2019-08-28 01:47:05
        創(chuàng)新基因讓招行贏在未來
        商周刊(2017年7期)2017-08-22 03:36:21
        基因
        基因捕獲測(cè)序診斷血癌
        單細(xì)胞測(cè)序技術(shù)研究進(jìn)展
        基因組DNA甲基化及組蛋白甲基化
        遺傳(2014年3期)2014-02-28 20:58:49
        少妇高潮惨叫正在播放对白| 杨幂一区二区系列在线| 国产丝袜美腿精品91在线看| 国产婷婷色综合av蜜臀av| 亚洲国产一区二区三区网| 少妇被日到高潮的视频| 97成人精品视频在线| 丰满爆乳在线播放| 亚洲综合AV在线在线播放| 日本高清中文字幕二区在线| 国产变态av一区二区三区调教| 草草浮力影院| 国产自精品| 人妻色中文字幕免费视频| 一区二区三区视频在线观看免费| 熟女性饥渴一区二区三区| 在线观看视频一区| 国产高清不卡在线视频| 狠狠色狠狠色综合网| 国产精品jizz在线观看老狼| 日韩激情网| 一本色道久久亚洲av红楼| 国产精品99精品无码视亚 | 国产精品户露av在线户外直播 | 精品国产一区二区三区2021| 人妻少妇精品视频一区二区三区 | 在线精品首页中文字幕亚洲| 久久久老熟女一区二区三区| 亚洲男人精品| 国产美女冒白浆视频免费| 亚洲乱码国产乱码精华 | 国产又色又爽的视频在线观看91 | 国产成人高清视频在线观看免费 | 看av免费毛片手机播放| 人妻精品丝袜一区二区无码AV| 少妇人妻av一区二区三区| 在办公室被c到呻吟的动态图| 国产精品亚洲一区二区无码| 日本一区二区高清视频在线播放| 色偷偷激情日本亚洲一区二区| 亚洲精华国产精华液的福利|