張國捷
本期專稿選編了芝加哥大學龍漫遠教授和他的學生艾米麗·莫爾托拉發(fā)表在《美國科學家》(American Scientists)雜志上的一篇關(guān)于基因起源研究的科普文章。作者以親身經(jīng)歷生動地描繪了科學史上關(guān)于基因起源假說橫跨半個多世紀的爭論。從這篇文章中讀者可以管窺在科學研究過程中,隨著技術(shù)進步,科學家對于客觀規(guī)律的認知如何不斷地自我矯正和發(fā)展。
基因是一段可以按三聯(lián)密碼編碼成蛋白的DNA片段,是維持生命構(gòu)造和功能的基本單元。然而,并非基因組上的所有DNA片段都能編碼成蛋白。以人類基因組為例,我們的基因組大約有30億個堿基對,平均一個蛋白長度大約300個氨基酸,也即900個堿基。假如我們的基因組上所有堿基都能編碼成蛋白,那么理論上人類應該有幾百萬個基因。然而隨著我們對自身基因組的了解,人類基因組上能夠編碼成蛋白的基因數(shù)目已經(jīng)下調(diào)到目前比較公認的21 000個左右,這意味著我們的基因組近98%的DNA序列不會編碼成蛋白的序列,而這些序列往往被認為是無用的垃圾序列。
此外,不同的物種含有不同數(shù)量的基因。比如鳥類大約含有17 000個基因,而水稻大概有4萬多個基因。物種間基因數(shù)量的差異提示物種分化的過程中不斷有新的基因產(chǎn)生。這些新產(chǎn)生的基因為自然選擇提供了新的遺傳物種,并在物種分化和適應環(huán)境過程中發(fā)揮著重要作用。而這些年輕基因也恰好為我們揭示基因起源的基本途徑以及起源后的演化過程提供了重要的研究材料。在人類基因組數(shù)據(jù)公布之前,主流觀點基本認同法國遺傳學家、1965年諾貝爾生理學或醫(yī)學獎得主弗朗索瓦·雅各布和日裔美籍演化生物學家大野乾等提出的,新基因主要由原先已經(jīng)存在的基因直接或者復制后變異形成,其功能既不太新也不太重要,基本排除了年輕基因從無到有(de novo)演化形成的可能。
而相比于其他新基因產(chǎn)生機制,從無到有的演化機制無疑是最吸引人,同時也是最難形成基因的一種方式。因為從一串完全隨機無序的非編碼序列演變成可以符合三聯(lián)密碼結(jié)構(gòu)的蛋白讀碼框,同時還可以被轉(zhuǎn)錄和翻譯,這需要有非常多的巧合事件才可能形成。這些巧合事件的存在需要兩個重要前提:一是物種在演化的某個時間段存在極高的突變速率,為促使這些巧合事件的發(fā)生提供可能;二是該物種承受著巨大的自然選擇壓力,為新蛋白形成之后能夠快速在群體里擴散這一新的基因型提供條件。
所幸,正如美國古生物學家喬治·蓋洛德·辛普森所提出的,生命的演化速率并非一成不變,某些物種類群在某些特殊的演化節(jié)點會有快速分化和變異的過程。如同人類社會的歷史長河里,我們既可以看到屹立千年亙古不變的歐洲城市,也可以看到像海南三亞這樣在短短30年內(nèi)由小漁村發(fā)展成高樓林立的國際都市。為提高發(fā)現(xiàn)從無到有這一新基因起源機制的可能性,需要盡量尋找到某個經(jīng)歷過快速變異的物種類群作為研究對象。
為此,龍漫遠團隊創(chuàng)造性地利用經(jīng)歷過人工馴化的、人們通常只關(guān)注其食用價值的栽培稻作為研究對象來攻克這一難題。一方面,從野生稻被馴化為栽培稻只有短短數(shù)千年的歷史,但是性狀發(fā)生了巨大的變化;另一方面,人類對水稻經(jīng)濟性狀的選擇偏好在水稻基因組上形成了巨大的選擇壓力。最終果然在水稻馴化過程中,龍漫遠團隊成功地發(fā)現(xiàn)了大量由非編碼的序列演變而成的新蛋白編碼基因,論證了從無到有這一機制對產(chǎn)生新基因具有不可忽略的重要貢獻。
龍漫遠團隊這一發(fā)現(xiàn)的成功不僅得益于對研究材料的敏銳覺察,更離不開多學科的協(xié)作和新技術(shù)的發(fā)展。假使沒有基因組學和蛋白質(zhì)組學新技術(shù)的出現(xiàn),我們將難以捕捉到水稻基因組在幾千年這一演化歷史上極其短瞬時間內(nèi)的變化過程。諾貝爾生理學或醫(yī)學獎得主悉尼·布倫納睿智地提出,科學的進步有賴于新技術(shù)以推動新的發(fā)現(xiàn),進而推動新思維的產(chǎn)生。這一點,在這篇文章里可見一斑。