郭禮和
“垃圾DNA”這個名字出自上世紀70年代。在這之前已經(jīng)發(fā)現(xiàn)真核細胞(有細胞核結(jié)構(gòu)的細胞)染色體上的基因之間是不連續(xù)的,也就是說,基因之間存在著很大的間隔,就像上海到北京的鐵路有許多火車站,但這些火車站只占據(jù)鐵路總長的1.5%(也就是基因只占DNA總長的1.5%)。故而,1972年美國加州理工學院大野乾把不編碼蛋白的染色體片斷稱為“垃圾基因”。70年代后期,由于DNA測序技術(shù)的誕生和使用,證明不僅基因之間有很長的不編碼DNA,就是基因內(nèi)部也存在有許多不編碼的間隔,說明一個完整的基因?qū)嶋H上是由許多不連續(xù)的DNA編碼片斷拼接起來的。因此,科學家把這些不編碼蛋白信息的DNA統(tǒng)稱為“垃圾DNA”。但是,對原核生物(沒有細胞核的單細胞生物)DNA測序,發(fā)現(xiàn)它們的基因內(nèi)部卻是連續(xù)編碼,基因之間的間隔也很短,說明它們的垃圾DNA很少。真核細胞與原核細胞的基因組和基因結(jié)構(gòu)為什么有這樣大的差異,這使人們產(chǎn)生很多聯(lián)想和推測。
真核細胞產(chǎn)生這么多的“垃圾DNA”究竟干什么?到了上世紀80年代后期,DNA測序技術(shù)已經(jīng)完全實現(xiàn)了自動化,故而人們提出將人類的基因組(人的細胞染色體全部DNA)序列進行分析,這就是所謂“人類基因組計劃”。此計劃從1990年啟動到2003年完成,但是,這項人類歷史上最大的科學工程實際上只是完成了一個草圖。因為,研究人員只是將人類基因組的序列測出一部分,還有很多空隙未測出,主要是涉及到一些重復序列,它們的序列用現(xiàn)有技術(shù)很難測出。根據(jù)已測出的序列和結(jié)構(gòu)分析,基因只有2.6萬個左右,占基因組總長度約1.5%,而98.5%的DNA為非編碼區(qū),也就是人們通常所說的“垃圾DNA”。這98.5%的“垃圾DNA”究竟有什么用處?于是,科學家們在完成“人類基因組計劃”的草圖之后,啟動了ENCODE研究計劃,進一步對那些基因組空白處進行測序,并探索這些大量的“垃圾DNA”的功能,編纂DNA元件百科全書。上述兩個研究計劃可以分別稱為“結(jié)構(gòu)基因組計劃”和“功能基因組計劃”。
“結(jié)構(gòu)基因組計劃”的完成證明:人類和小鼠的基因組大小、基因種類和數(shù)量甚至基因的結(jié)構(gòu)都很相似,但在個體形態(tài)和智慧方面的差異卻有天壤之別。他們的基因組最大的差異就是“垃圾DNA”,由此可見“垃圾DNA”并不“垃圾”,它可能與物種進化、胚胎發(fā)育、個體生長、疾病發(fā)生、機體衰老和死亡等生命現(xiàn)象都有著密切關(guān)系,也就是與控制基因的變異、突變、表達、調(diào)控等密切相關(guān)。
可以把生命活動簡單地理解為一臺電腦在進行一項工程設(shè)計,例如用電腦設(shè)計飛機。要完成這項任務(wù)需要兩樣東西,一個是“數(shù)據(jù)庫”,另一個是“軟件包”。有了這兩項工具就可以設(shè)計出各種類型的飛機。生命活動中的基因庫可以把它理解為“數(shù)據(jù)庫”,因為小鼠、猴子與人類的基因庫大同小異,而且可以相互替代。“垃圾DNA”可以把它理解為“軟件包”,利用不同物種的“軟件包”(也就是不同物種的“垃圾DNA”)可以設(shè)計出小鼠、猴子或人的有機體。
可以把生命活動理解為拍一部電影,基因組就是電影的劇本,基因編碼的蛋白質(zhì)可以理解為演員,“垃圾DNA”就是導演。不同演員的出場和退場或再次出場都是導演根據(jù)劇本的情節(jié)來安排,這樣就可以展現(xiàn)出一部有血有肉有情感的動人場面。導演不僅要指導演員的表演,而且要安排舞臺燈光變幻和道具的變化來烘托舞臺場景和故事情節(jié)?!袄鳧NA”在生命活動中的演繹也是像電影導演那樣如此忙碌,故而需要大量的“垃圾DNA”,但它們不出場,也就是不編碼蛋白在細胞的生命活動舞臺上出現(xiàn),可是不同蛋白何時出場何時退場或再出場卻是由“垃圾DNA”來決定的。
從某種意義上來說,物種相近的基因組主要差異不在基因(當然基因也可有差異),而是“垃圾DNA”。例如,人和猴子,尤其人與人之間的遺傳差異主要是“垃圾DNA”。這就造成人與人對疾病的發(fā)生和藥物敏感性有差異,也就是為什么需要個體化醫(yī)療的原因。
閱讀上面的文字,按要求回答問題。
1.作者認為“垃圾DNA”有哪些方面的作用?
答:
2.這篇科普文的語言形象生動,請指出其手法,并舉兩例簡要說明。
答:
3.請談?wù)勀銓Ρ疚臉祟}的理解。
答: