張煥萍,尹佟明
1.南京林業(yè)大學(xué)機(jī)電學(xué)院,南京 210037;
2.南京林業(yè)大學(xué)南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,南京 210037
譜系特有基因研究進(jìn)展
張煥萍1,2,尹佟明2
1.南京林業(yè)大學(xué)機(jī)電學(xué)院,南京 210037;
2.南京林業(yè)大學(xué)南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,南京 210037
譜系特有基因(Lineage-specific genes,LSGs)是指在一個(gè)譜系中特有并與其他物種譜系所有基因沒有明顯序列相似性的基因,約為物種基因組全部基因數(shù)量的10%~20%,于1996年首次在完成全基因組測(cè)序的酵母基因組中大量發(fā)現(xiàn)。大規(guī)模測(cè)序技術(shù)的發(fā)展使譜系特有基因研究成為比較基因組學(xué)的研究熱點(diǎn),已在微生物、海洋低等生物、植物(如擬南芥、水稻、楊樹)、昆蟲及高等靈長(zhǎng)類動(dòng)物等多個(gè)物種或類群中展開,其生物功能對(duì)于闡明物種進(jìn)化歷程和生物適應(yīng)性具有重要意義。文章介紹了譜系特有基因的研究背景和現(xiàn)狀,從譜系特有基因獲取、基因結(jié)構(gòu)分析、進(jìn)化起源、生物功能、表達(dá)特性分析等方面闡述譜系特有基因的研究進(jìn)展,分析了存在的問題和后續(xù)研究方向,以期為相關(guān)研究提供參考。
譜系特有基因;孤兒基因;基因起源進(jìn)化;基因生物功能
譜系特有基因(Lineage-specific genes,LSGs)又稱為分類受限基因(Taxonomically-restricted genes, TRGs),是指在一個(gè)譜系中特有、與其他物種譜系所有基因沒有明顯序列相似性的基因[1],在相關(guān)文獻(xiàn)中也稱為非嚴(yán)格意義上的孤兒基因(Orphan genes)或ORFans(ORFans多用于微生物)[2]。1996年,最初在完成全基因組測(cè)序的酵母(Saccharomyces cerevisiae)基因組發(fā)現(xiàn)大量與數(shù)據(jù)庫序列無相似性的孤兒基因,約為酵母基因組數(shù)量的26%[3]。隨著測(cè)序技術(shù)的發(fā)展,越來越多的物種完成了全基因組測(cè)序,通過序列比對(duì),研究人員在多個(gè)物種中發(fā)現(xiàn)了約為基因組數(shù)量10%~20%的譜系特有基因[4]。已完成測(cè)序的物種數(shù)量對(duì)譜系特有基因的比例和數(shù)量有很大影響(圖1),用樹狀圖表示測(cè)序物種數(shù)量對(duì)孤兒基因的影響,測(cè)序物種數(shù)量的增加使原來的孤兒基因變成譜系特有基因,在相關(guān)文獻(xiàn)及本文中,對(duì)孤兒基因和譜系特有基因并不進(jìn)行嚴(yán)格意義上的區(qū)分。
譜系特有基因與新基因這兩個(gè)概念有一定的相關(guān)性,但并不等同。Long等[5]認(rèn)為廣義新基因(New gene)是指物種某一位點(diǎn)在進(jìn)化過程中特定時(shí)間范疇內(nèi)產(chǎn)生的此前不存在的基因。復(fù)制產(chǎn)生的新基因通常是多基因家族的成員,不能用序列相似性方法鑒定出來,因此多數(shù)新基因不是譜系特有基因,例如人類基因組在近期進(jìn)化過程中產(chǎn)生了大量的新基因,只有一部分基因是人類特有的基因[6]。年輕基因(Young gene)由于產(chǎn)生時(shí)間短,保留了進(jìn)化過程中大量有用的信息,這些信息對(duì)于新基因研究有重要作用,進(jìn)化時(shí)間在幾百萬年的年輕新基因通常是譜系特有基因,目前大多數(shù)新基因研究都以年輕新基因?yàn)橹鱗5]。Tautz等[7]研究結(jié)果表明,小鼠(Mus musculus)基因組中的孤兒基因主要是從頭(de novo)起源新基因,即相當(dāng)多數(shù)的譜系特有基因或孤兒基因可能都是新基因;譜系特有基因也可以是老的復(fù)制基因因?yàn)榭焖龠M(jìn)化失去了與其同源基因的相似性而產(chǎn)生[8]。
圖1 測(cè)序物種數(shù)量對(duì)譜系特有基因鑒定的影響[4]a:9個(gè)物種分別代表3個(gè)屬,3個(gè)屬各有1個(gè)物種完成基因組測(cè)序,得到3個(gè)孤兒基因A、B、D,n.s.表示未測(cè)序的基因組;b:9個(gè)物種全部測(cè)序完成,基因B和基因E是嚴(yán)格意義上的孤兒基因,基因A是同屬物種特有基因,基因D1、D2、D3旁系同源,基因C是同屬物種特有基因。
譜系特有基因通常有相似的基因結(jié)構(gòu)如肽鏈長(zhǎng)度短、內(nèi)含子數(shù)量少等,但起源機(jī)制、生物功能、表達(dá)水平及表達(dá)偏好性有各自的特性,在不同基因組中的比例也有差異,研究者通過對(duì)比多個(gè)物種,發(fā)現(xiàn)植物譜系特有基因平均比例高于動(dòng)物中的平均比例[9]。譜系特有基因獲取受到測(cè)序技術(shù)的影響,微生物中已有大量物種完成測(cè)序,因此譜系特有基因研究也相對(duì)深入。Yin等[10,11]對(duì)上千種微生物基因組進(jìn)行比對(duì),發(fā)現(xiàn)病毒基因組中約30%的開放閱讀框 (Open reading frame,ORF)是ORFans,細(xì)菌基因組ORFans比例約為9.1%,表明ORFans在病毒中起源速率較高。高等生物由于完成測(cè)序的基因組數(shù)量少,譜系特有基因研究還不夠深入,大多數(shù)譜系特有基因的生物功能是未知的,其起源進(jìn)化也尚未完全研究清楚,但譜系特有基因的生物功能往往與物種特有的生物特征和環(huán)境適應(yīng)性有關(guān),這對(duì)于闡明物種進(jìn)化歷程有重要意義。目前譜系特有基因研究已成為比較基因組學(xué)的新興研究領(lǐng)域,并在多個(gè)物種或類群中展開,如微生物[10~12]、高等靈長(zhǎng)類動(dòng)物[13~16]、昆蟲[17~20]及擬南芥(Arabidopsis thaliana)[21,22]、水稻(Oryza sativa)[23]、楊樹(Populus)[24]等多個(gè)模式植物[25],與自然界龐大的物種數(shù)量相比,譜系特有基因研究仍在起步階段,還有大量工作要做。本文詳細(xì)介紹了譜系特有基因的研究背景和現(xiàn)狀,從譜系特有基因獲取、基因結(jié)構(gòu)分析、基因進(jìn)化起源、生物功能預(yù)測(cè)、基因表達(dá)分析等方面闡述譜系特有基因的研究進(jìn)展及取得的成果,分析了存在的問題和后續(xù)研究方向。
譜系特有基因的獲取一般是通過序列比對(duì),將所研究物種的測(cè)序序列(基因組序列、轉(zhuǎn)錄組序列等)與其他物種進(jìn)行比對(duì),比對(duì)物種序列主要從NCBI等多個(gè)數(shù)據(jù)庫中獲得,根據(jù)比對(duì)相似程度獲得譜系特有基因,所得基因數(shù)量多少取決于譜系的定義范圍,并受到比對(duì)序列和比對(duì)算法的影響。常用的比對(duì)軟件以BLAST為主,包括 BLASTP、TBLASTN、PSIBLAST等,其他比對(duì)軟件有l(wèi)iftOver、InterProScan[26]等。比對(duì)結(jié)果受數(shù)據(jù)庫選取、比對(duì)算法、參數(shù)設(shè)置等因素的影響,不同研究小組獲取的同一物種譜系特有基因數(shù)量也有差異,如靈長(zhǎng)類動(dòng)物和擬南芥。Tay等[13]用基于BLASTZ的軟件liftOver將從cDNA和EST實(shí)驗(yàn)數(shù)據(jù)獲得38037轉(zhuǎn)錄單元與9個(gè)非靈長(zhǎng)類物種基因組進(jìn)行比對(duì),得到131個(gè)靈長(zhǎng)類譜系特有轉(zhuǎn)錄單元,其結(jié)果與Toll-Riera等[14]對(duì)靈長(zhǎng)類動(dòng)物研究結(jié)果有差異。Lin等[21]比較了擬南芥與178種植物的基因序列,獲得兩組譜系特有基因,一組是914個(gè)僅與十字花科植物有序列相似的十字花科譜系特有基因,另一組是1324個(gè)與其他物種都沒有序列相似的擬南芥譜系特有基因,這些基因大部分被轉(zhuǎn)錄,但沒有基因功能注釋;Donoghue等[22]用BLAST軟件和InterProScan對(duì)數(shù)據(jù)庫中的大量物種序列與擬南芥基因組序列進(jìn)行比對(duì)篩選(包括線粒體基因和葉綠體基因),得到1789個(gè)(28個(gè)線粒體)十字花科譜系特有基因,其中958個(gè)(18個(gè)線粒體)擬南芥譜系特有基因,葉綠體中無十字花科譜系特有基因,與Lin等的研究結(jié)果有差異。這種差異表明用生物計(jì)算的方法獲取譜系特有基因會(huì)受到計(jì)算參數(shù)的影響,具有較高的假陽性率。如何建立一種快速、有效的譜系特有基因鑒定方法,對(duì)后續(xù)研究有很大影響,同時(shí)各物種所獲得的譜系特有基因也會(huì)隨著基因組數(shù)據(jù)的增加、基因注釋的改善而變化。目前譜系特有基因絕對(duì)數(shù)量在增長(zhǎng)中,隨著更多基因組測(cè)序的完成,會(huì)使原有的譜系特有基因在其他物種中找到同源基因,譜系特有基因數(shù)量會(huì)逐漸下降或趨于飽和。Wilson等[12]研究了最早發(fā)表的122種微生物中的孤兒基因,發(fā)現(xiàn)孤兒基因的比例隨著測(cè)序基因組數(shù)量的增加而下降,但絕對(duì)數(shù)量還在小幅增長(zhǎng)。
基因結(jié)構(gòu)分析主要包括基因長(zhǎng)度、內(nèi)含子數(shù)量及長(zhǎng)度、外顯子數(shù)量及長(zhǎng)度、GC含量、染色體分布偏好性等。多數(shù)物種的譜系特有基因具有相似的結(jié)構(gòu)特征,如肽鏈長(zhǎng)度短、外顯子和內(nèi)含子數(shù)量少、GC含量低等特性,靈長(zhǎng)類動(dòng)物、擬南芥、果蠅(Drosophila)、蜜蜂(Apis mellifera)、斑馬魚(Danio rerio)等譜系特有基因結(jié)構(gòu)都有這種特性[14,17,22],如斑馬魚基因組中[9],約28%的孤兒基因只有一個(gè)外顯子,而保守基因中只有一個(gè)外顯子的基因比例是6%。玉米(Zea mays)基因組中約36.87%的基因是無內(nèi)含子基因,其中約有1/6的無內(nèi)含子基因與其他物種無同源性,這些基因?qū)τ谘芯坑衩椎倪M(jìn)化起源和特有的生物功能有重要意義[27]。多數(shù)物種譜系特有基因GC含量低于保守基因,這一特性并不具有普遍性,例如斑馬魚中孤兒基因GC含量高于保守基因,這一特性與水稻譜系特有基因相似[9]。譜系特有基因在染色體上的分布特性也不相同,斑馬魚的譜系特有基因在染色體上分布不均勻,部分染色體上譜系特有基因比例較高,而有些染色體上沒有譜系特有基因,這種分布特性可能與染色體長(zhǎng)度有關(guān)[9];擬南芥譜
系特有基因在5條染色體的比例分別是5.84%、7.86%、6.87%、6.07%和6.36%,表明擬南芥譜系特有基因的分布沒有染色體偏好性[22]。螞蟻基因組中的孤兒基因沒有集聚性,均勻分布在整個(gè)基因組非孤兒基因之間[28]。
Tautz等[7]認(rèn)為譜系特有基因和孤兒基因的結(jié)構(gòu)特征還與起源方式及進(jìn)化時(shí)間有關(guān),從頭起源的年輕基因,由于進(jìn)化時(shí)間不長(zhǎng),通?;蜷L(zhǎng)度較短,而通過復(fù)制-分化產(chǎn)生的基因,基因長(zhǎng)度與起源時(shí)間沒有相關(guān)性,因?yàn)殚L(zhǎng)基因與短基因的復(fù)制機(jī)率是相同的。從頭起源的基因初始階段沒有結(jié)構(gòu)域,與其他基因共享結(jié)構(gòu)域,且外顯子數(shù)量少,并在進(jìn)化過程中獲得結(jié)構(gòu)域和新的外顯子[29]。起源后的新基因如何獲得調(diào)控轉(zhuǎn)錄因子,目前還知之甚少,可能是基因組中還有許多未發(fā)現(xiàn)的轉(zhuǎn)錄起始位點(diǎn)[30],也可能新基因會(huì)利用已有的調(diào)控因子[7]。目前譜系特有基因結(jié)構(gòu)分析僅限于少數(shù)物種,還不能得出譜系特有基因結(jié)構(gòu)特性的普遍規(guī)律,具有相似結(jié)構(gòu)特性的基因可能會(huì)有相同的起源和進(jìn)化模式,基因結(jié)構(gòu)分析有助于闡明譜系特有基因的進(jìn)化起源機(jī)制。
與具有上億年的多物種分布的古老保守基因相比,通常在近緣物種分布的譜系特有基因進(jìn)化時(shí)間還很短。譜系特有基因的起源進(jìn)化機(jī)制已成為研究熱點(diǎn),多數(shù)研究結(jié)果表明,與古老保守基因或分布廣泛的基因相比,譜系特有基因的進(jìn)化速度較快,且這種進(jìn)化模式存在于多個(gè)物種[31~33],Albà等[34]發(fā)現(xiàn)哺乳動(dòng)物基因的年齡與進(jìn)化速率成反比關(guān)系,這種快速進(jìn)化模式產(chǎn)生的內(nèi)在機(jī)制并不明確,已有多種學(xué)說來解釋這種進(jìn)化機(jī)制[35,36]。
Long等[37]系統(tǒng)介紹了新基因起源的分子機(jī)制,起源機(jī)制主要有如下幾種:基因復(fù)制(G e n e du pl i c a t i o n,GD)、轉(zhuǎn)位因子(Tr a n s p o s o n exaptation,TE)、橫向基因轉(zhuǎn)移(Horizontal gene transfer,HGT)、從頭進(jìn)化機(jī)制(De novo)等,祖先基因在不同物種中的選擇性保留也是譜系特有基因起源的一個(gè)重要機(jī)制[38]?;驈?fù)制被認(rèn)為是最主要的新基因產(chǎn)生機(jī)制,并根據(jù)重復(fù)區(qū)域大小,可將基因復(fù)制分為單個(gè)基因復(fù)制、部分基因組復(fù)制和整個(gè)基因組復(fù)制即多倍體化,基因復(fù)制觀點(diǎn)認(rèn)為譜系特有基因是由基因復(fù)制后序列變異形成的,由于進(jìn)化速度加快,該基因失去了與其他物種基因的序列相似性,從而出現(xiàn)了譜系特有基因[39,40],即Tautz等[1]認(rèn)為的復(fù)制-分化(Duplication-divergence)模型,擬南芥、水稻、果蠅及靈長(zhǎng)類動(dòng)物等物種譜系特有基因的產(chǎn)生多數(shù)是基于基因復(fù)制[14,22,41]。橫向基因轉(zhuǎn)移指不同于常規(guī)的由親代到子代的垂直基因傳遞(Vertical gene transfer,VGT),而是在不同生物個(gè)體之間,或細(xì)胞內(nèi)部細(xì)胞器之間所進(jìn)行的遺傳物質(zhì)的交流。橫向基因轉(zhuǎn)移是原核生物基因組取得新基因的主要途徑,受體生物通過獲取外源基因迅速得到有利的表現(xiàn)型,例如細(xì)菌不僅能快速產(chǎn)生耐藥性,而且能在菌落間相互傳播耐藥性[42];相對(duì)于原核生物,橫向基因轉(zhuǎn)移在真核生物尤其是多細(xì)胞真核生物中發(fā)生頻率可能較低,但橫向基因轉(zhuǎn)移對(duì)于真核生物的早期進(jìn)化、提高環(huán)境適應(yīng)性、新基因的產(chǎn)生發(fā)揮了重要作用[43~47]。從頭起源是新基因起源的重要機(jī)制之一,新基因可以起源于基因間的非編碼區(qū)[48],也可以起源于內(nèi)含子[49],已在多個(gè)物種中發(fā)現(xiàn)了從頭起源的基因[1,7,50~52]。C a r v u n i s等[53]在釀酒酵母(Saccharomyces cerevisiae)非基因序列中發(fā)現(xiàn)數(shù)百個(gè)物種特異的短ORF翻譯活動(dòng),從中確定了多個(gè)原基因(proto-genes),這些原基因進(jìn)而可能成為新基因;從頭起源對(duì)于果蠅新基因的出現(xiàn)發(fā)揮了重要作用[54],約有11.9%的果蠅新基因是從頭起源;Toll-Riera等[14]發(fā)現(xiàn)62個(gè)靈長(zhǎng)類動(dòng)物譜系特有基因是基于從頭起源;螞蟻?zhàn)V系特有基因產(chǎn)生的主要機(jī)制是從頭起源[28]?;蛑丿B(Gene overprinting)是從頭起源的特例,這種起源機(jī)制是在注釋基因中產(chǎn)生新的重疊閱讀框并轉(zhuǎn)錄、翻譯,原基因生物功能同時(shí)保留[55],兩個(gè)重疊基因通常其中一個(gè)是譜系特有基因,另一個(gè)分布廣泛[56],基因重疊起源機(jī)制存在于多個(gè)物種并在微生物中大量出現(xiàn)[57~60]。轉(zhuǎn)位因子也是譜系特有基因起源的重要機(jī)制,轉(zhuǎn)位因子是基因組中具有轉(zhuǎn)位特性的獨(dú)立的DNA片段,它們可以直接從基因組內(nèi)的一個(gè)位點(diǎn)移到另一個(gè)位點(diǎn),擬南芥約有10%的基因起源于轉(zhuǎn)位因子[61];B?hne等[62]研究了多種脊椎動(dòng)物,發(fā)現(xiàn)轉(zhuǎn)位因子是脊椎動(dòng)物進(jìn)化和保持生物多樣性的重要機(jī)制。同一物種譜系特有基因有不同的起源機(jī)制,靈長(zhǎng)類動(dòng)物譜系特有基因主要有3種起源機(jī)制,分別是基因復(fù)制、轉(zhuǎn)位因子機(jī)制、非編碼區(qū)從頭進(jìn)化機(jī)制[14];約2/3的十字花科植物譜系特有基因已鑒定起源機(jī)制,主要有基因復(fù)制、轉(zhuǎn)位因子機(jī)制和基因重疊等[22]。
新基因通常由多種起源機(jī)制共同作用產(chǎn)生,由基因復(fù)制產(chǎn)生的新基因可能經(jīng)歷固定階段(Fixation phase)、命運(yùn)決定階段(Fate-determination phase)和保存階段(Preservation phase)[63],并以很低的概率在群體中固定,多數(shù)新基因在進(jìn)化過程中丟失,固定下來的基因可能成為假基因,也可能保留原功能或成為具有新功能的基因,并在不斷進(jìn)化中適應(yīng)外界環(huán)境成為譜系特有的關(guān)鍵基因。已有多種基因進(jìn)化的模型和假說,包括新功能化(Neofunctionalization)模型[64]、 復(fù) 制 -退 化 -互 補(bǔ)(Duplication-degeneration-complementation,DDC)模型[65]、自適應(yīng)輻射(Adaptive radiation,AR)模型[66]、創(chuàng) 新 - 擴(kuò) 增 - 分 化 (Innovationamplification-divergence,IAD)模型[67]、解除適應(yīng)性沖突(Escape from adaptive conflict,EAC)模型[68]、統(tǒng)計(jì)檢驗(yàn)方法等等[37,63,69],這些模型主要針對(duì)以基因復(fù)制起源的新基因。生物體由簡(jiǎn)單到復(fù)雜的進(jìn)化過程正是伴隨著新基因不斷產(chǎn)生和老基因丟失的過程,目前人們對(duì)這個(gè)過程的研究仍在初始階段,有許多問題還知之甚少,如新基因如何在群體中固定,基于多種起源機(jī)制的新基因如何進(jìn)化,譜系特有新基因的進(jìn)化模型和基因結(jié)構(gòu)產(chǎn)生的分子機(jī)制,不同譜系的新基因起源進(jìn)化模式是否相同等等,這些問題已成為基因起源進(jìn)化的重要研究?jī)?nèi)容。
物種進(jìn)化過程中出現(xiàn)的新基因曾被認(rèn)為是不重要的,其功能的缺失并不會(huì)對(duì)生物體有致命的影響,只有保守基因?qū)τ谏难永m(xù)才有不可替代的重要作用[70,71]。新基因在快速進(jìn)化過程中受到外界環(huán)境壓力會(huì)獲得新的生物功能,新功能使物種更能適應(yīng)外界環(huán)境而保留下來,并使新基因在進(jìn)化過程中成為重要基因,這種模型稱為新基因進(jìn)化的“等待模型”[72,73],等待過程可能無需太長(zhǎng)時(shí)間,新基因可以很快獲得重要功能。最近,芝加哥大學(xué)的研究結(jié)果表明新基因在物種生長(zhǎng)發(fā)育過程中與古老保守基因同樣重要,該課題組利用RNA干擾技術(shù)研究了黑腹果蠅195個(gè)起源于一百萬到三百五十萬年前的新基因,阻止每個(gè)目標(biāo)基因轉(zhuǎn)錄為功能產(chǎn)物,發(fā)現(xiàn)59個(gè)基因可在果蠅中后期發(fā)育階段導(dǎo)致死亡,而古老保守基因在發(fā)育早期具有重要作用[74];該研究還發(fā)現(xiàn)一些具有重要生物功能的新基因只存在于某些物種,并在特定組織中表達(dá),例如新基因nsr(novel spermatogenesis regulator)和Zeus只存在于少數(shù)果蠅物種,已成為果蠅生殖系統(tǒng)發(fā)育的重要基因[75,76]。這些譜系特有的新基因如何在較短的進(jìn)化時(shí)間內(nèi)成為物種發(fā)育的重要基因以及這些基因的生物功能,還有待進(jìn)一步研究[77]。
用生物實(shí)驗(yàn)方法對(duì)新基因生物功能進(jìn)行分析之前,通常先預(yù)測(cè)新基因的生物功能,常用方法有ORF長(zhǎng)度分析、基因轉(zhuǎn)錄分析、Ka/Ks比率[78]、多態(tài)性分析等[37]。由于與其他物種無同源性,譜系特有基因無法通過同源比對(duì)方法推測(cè)其生物功能,這也增加了譜系特有基因生物功能預(yù)測(cè)的難度,因此大多數(shù)譜系特有基因生物功能是未知的,例如靈長(zhǎng)類動(dòng)物譜系特有基因,除少數(shù)幾個(gè)基因外,大多數(shù)基因的生物功能并不明確,但這些譜系特有基因的表達(dá)通常具有組織特異性[14]。研究者認(rèn)為譜系特有基因的生物功能與物種獨(dú)特的生物特征及環(huán)境適應(yīng)性有關(guān),許多細(xì)菌物種對(duì)人類腸道就有特殊的環(huán)境適應(yīng)性,人類腸道中發(fā)現(xiàn)的微生物蛋白質(zhì)家族在其他環(huán)境中并不存在[79]。水蚤(Daphnia pulex)基因組是首次獲得的甲殼動(dòng)物的完整基因組序列,這個(gè)看似簡(jiǎn)單的小生物包含了約31 000個(gè)基因,超過1/3的基因?yàn)樗樽V系特有,且這些水蚤譜系特有基因(包括多個(gè)生物功能未注釋基因)均對(duì)生態(tài)環(huán)境的改變非常敏感[80]。刺胞動(dòng)物都具有用以捕食的刺細(xì)胞,但不同刺胞動(dòng)物如水螅(Hydra)、珊瑚(Acropora)的刺細(xì)胞形狀和大小也不相同,以適應(yīng)不同的生存環(huán)境和食物,提高防御能力,譜系特有基因?qū)τ诖贪麆?dòng)物形態(tài)多樣性的形成發(fā)揮了重要作用[81~83]。果蠅譜系特有的flightin基因能增強(qiáng)雙翅的飛行力量,提高果蠅的生存適應(yīng)性[84]。模式植物擬南芥譜系特有基因的生物功能也與環(huán)境適應(yīng)能力有很大關(guān)系,在外界環(huán)境刺激(生物刺激或非生物刺激)下,這些基因往往有相似的表達(dá)特性[22,85]。
一些新基因起源后很快參與到生物網(wǎng)絡(luò)和生物通路中并發(fā)揮重要作用,果蠅具有重要生物功能的新基因多數(shù)參與了蛋白質(zhì)相互作用網(wǎng)絡(luò),一些新基因與原有基因有多個(gè)相互作用,并成為生物網(wǎng)絡(luò)中的重要節(jié)點(diǎn)。Zeus基因在約4~6百萬年前起源于DNA結(jié)合蛋白Caf40,保留了Caf40約30%的DNA結(jié)合位點(diǎn),獲得了193個(gè)新的結(jié)合位點(diǎn),調(diào)控下游多個(gè)參與生殖系統(tǒng)的基因,表明新基因可以在很短的進(jìn)化時(shí)間內(nèi)改變?cè)械纳锞W(wǎng)絡(luò)[76]。酵母新基因能以獨(dú)特的方式獲得生物功能并參與和改變?cè)械纳锞W(wǎng)絡(luò)[86]。這些譜系特有的新基因如何能在很短的進(jìn)化時(shí)間內(nèi)參與到復(fù)雜的生物網(wǎng)絡(luò)并發(fā)揮重要作用,以及新基因在生物網(wǎng)絡(luò)中的具體功能,還有待深入研究。
譜系特有基因的表達(dá)特性在各物種并不相同,在生物體發(fā)育的不同階段和不同組織中也有差異,相對(duì)于非譜系特有基因,譜系特有基因表達(dá)水平較低,在水稻、果蠅及靈長(zhǎng)類動(dòng)物中都具有這樣的特性[14,41,87]。擬南芥譜系特有基因的表達(dá)與非譜系特有基因相比,具有表達(dá)水平低、組織特異性、易受外界壓力影響等特點(diǎn),在外界環(huán)境刺激下(如冷、熱、干旱、鹽堿、病菌處理等),譜系特有基因的表達(dá)水平有不同的變化[22]。表達(dá)特性分析有助于闡明譜系特有基因的生物功能,常用的基因表達(dá)分析方法有EST[88]、Microarray[89]、RNA-seq[90]等技術(shù)。
譜系特有基因在生物體發(fā)育的不同階段具有不同的表達(dá)模式,種系特征性發(fā)育階段(Phylotypic stage)是動(dòng)物胚胎發(fā)育比較相似的階段,分化通常發(fā)生在該階段之前或之后[91,92]。Domazet-Lo?o等[93,94]研究了斑馬魚和黑腹果蠅的基因在不同發(fā)育階段的轉(zhuǎn)錄表達(dá),發(fā)現(xiàn)這兩種生物在種系特征性發(fā)育階段有最保守的轉(zhuǎn)錄組,古老基因高表達(dá)和年輕基因低表達(dá),而在之前的卵期和之后的成年期,則有較新的轉(zhuǎn)錄組,古老基因表達(dá)下降和年輕基因表達(dá)上升,表明斑馬魚和黑腹果蠅譜系特有的適應(yīng)性特征在種系特征性發(fā)育階段形成的可能性較小,這些適應(yīng)性特征更可能是在之前的卵期和之后的成年期形成,這種發(fā)育模式稱為“沙漏模式(Hourglass model)”,種系特征性發(fā)育階段是發(fā)育調(diào)節(jié)和發(fā)育制約的關(guān)鍵點(diǎn)。多種動(dòng)物胚胎發(fā)育過程中存在種系特征性發(fā)育階段,大量保守基因在該階段表達(dá)[95~97]。Quint等[98]研究發(fā)現(xiàn),“沙漏模式”不僅存在于動(dòng)物界,模式植物擬南芥中也存在相同的發(fā)育模式。
譜系特有基因的表達(dá)還具有組織差異性,多數(shù)譜系特有基因尤其是動(dòng)物譜系特有基因通常在生殖系統(tǒng)和腦部這兩類組織中特異表達(dá)。斑馬魚[9]、靈長(zhǎng)類動(dòng)物[13]、果蠅[87]的譜系特有基因在生殖系統(tǒng)都有較高表達(dá),果蠅多個(gè)譜系特有新基因在生殖系統(tǒng)發(fā)育中發(fā)揮重要作用,如nsr和Zeus基因[75~76,99];黑腹果蠅(D.melanogaster)的譜系特有基因 Sdic1 (Sperm-specific dynein intermediate chain 1)在生殖器官中特異表達(dá)[100]。研究者應(yīng)用染色體工程將果蠅(D.melanogaster)中Sdic基因家族所有拷貝去除,結(jié)果導(dǎo)致果蠅精子活力大大下降,表明Sdic基因家族與果蠅生殖能力相關(guān)[101,102];果蠅逆轉(zhuǎn)座基因Drcd-1r控制生殖器官基因表達(dá)和雄性果蠅的繁殖[103]。由于動(dòng)物生殖器官睪丸中有大量特異表達(dá)的新基因,Kaessmann等[72]提出了“out of testis”假說,該假說認(rèn)為睪丸是促進(jìn)動(dòng)物基因組新基因起源和進(jìn)化的重要器官。植物中新基因起源研究比較少,張亞平院士課題組利用基因芯片表達(dá)數(shù)據(jù)發(fā)現(xiàn)擬南芥中新基因在成熟花粉中顯著偏好表達(dá),提出了植物基因組新基因產(chǎn)生的“Out of pollen”假說[104]。多數(shù)物種譜系特有基因在腦部組織特異表達(dá),果蠅多個(gè)譜系特有新基因如sphinx在腦部特異表達(dá)并控制果蠅行為[105,106];Fortna等[107]利用cDNA技術(shù)研究人類譜系特有基因,發(fā)現(xiàn)這些基因生物功能與腦部神經(jīng)發(fā)育有關(guān)。Zhang等[108]研究發(fā)現(xiàn),多個(gè)人類特有的年輕基因在腦部前額皮層高表達(dá),其生物功能與認(rèn)知活動(dòng)相關(guān),并在胎兒大腦中更為常見。人類特有的年輕基因SRGAP2在大腦神經(jīng)發(fā)育中起關(guān)鍵作用,該基因缺失會(huì)造成神經(jīng)連接發(fā)育出現(xiàn)問題,導(dǎo)致常見的神經(jīng)發(fā)育疾病比如自閉癥,癲癇和精神分裂癥等[109,110]。Wu等[111]鑒定出60個(gè)從頭起源的人類譜系特有新基因,RNA-seq數(shù)據(jù)顯示這些基因在大腦皮層和睪丸組織中表達(dá)最高,表明這些基因的生物功能與人類認(rèn)知能力有關(guān)。譜系特有基因在不同階段和不同組織的表達(dá)特性,對(duì)于研究這些基因的生物功能和參與的生物過程具有重要意義。
自然界的物種在不斷進(jìn)化中以適應(yīng)變化的生存環(huán)境,譜系特有基因的產(chǎn)生為物種的生物適應(yīng)性和遺傳多樣性提供了物質(zhì)基礎(chǔ)。雖然譜系特有基因研究取得了一些成果,但研究范圍還局限于少數(shù)物種,整體研究仍在起步階段,對(duì)于譜系特有基因的進(jìn)化起源、生物功能等方面還知之甚少,仍有許多問題沒有解決,例如:(1)利用基因組比對(duì)的方法鑒別譜系特有基因受到計(jì)算方法的很大影響,建立一套高效的譜系特有基因鑒定方法是待解決的問題之一;(2)譜系特有基因的基因結(jié)構(gòu)與起源機(jī)制、起源動(dòng)力的關(guān)系,以及基因結(jié)構(gòu)對(duì)生物功能和表型的影響;(3)譜系特有基因如何參與到生物體復(fù)雜的生物網(wǎng)絡(luò)并行使生物功能,如何參與生物體重要組織的生命活動(dòng);(4)不同物種譜系特有基因的橫向?qū)Ρ妊芯浚偨Y(jié)譜系特有基因起源進(jìn)化規(guī)律和生物功能。大規(guī)模測(cè)序技術(shù)的發(fā)展使許多物種完成了基因組測(cè)序,不斷有新的基因組序列被公布,越來越多的近緣物種測(cè)序產(chǎn)生了大量數(shù)據(jù),從中將能找到關(guān)于譜系特有基因起源與進(jìn)化的有用信息,為譜系特有基因的全面深入研究提供了有利條件,這對(duì)于闡明物種進(jìn)化歷程和生物適應(yīng)性具有重要意義。
[1]Tautz D,Domazet-Lo?o T.The evolutionary origin of orphan genes.Nat Rev Genet,2011,12(10):692–702.
[2]Fischer D.Eisenberg D.Finding families for genomic ORFans.Bioinformatics,1999,15(9):759–762.
[3]Dujon B.The yeast genome project:what did we learn? Trends Genet,1996,12(7):263–270.
[4]Khalturin K,Hemmrich G,Fraune S,Augustin R,Bosch TCG.More than just orphans:are taxonomically-restricted genes important in evolution?Trends Genet,2009,25(9): 404–413.
[5]Chen SD,Krinsky BH,Long MY.New genes as drivers of phenotypic evolution.Nat Rev Genet,2013,14(9):645–660.
[6]Zhang YE,Landback P,Vibranovski MD,Long MY. Accelerated recruitment of new brain development genes into the human genome.PLoS Biol,2011,9(10): e1001179.
[7]Neme R,Tautz D.Phylogenetic patterns of emergence of new genes support a model of frequent de novo evolution. BMC Genomics,2013,14:117.
[8]Magadum S,BanerjeeU,MuruganP,GangapurD, Ravikesavan R.Gene duplication as a major force in evolution.J Genet,2013,92(1):155–161.
[9]YangLD,ZouM,FuBD,HeSP.Genome-wide identification,characterization,and expression analysis of lineage-specific genes within zebrafish.BMC Genomics, 2013,14:65.
[10]Yin YB,Fischer D.Identification and investigation of ORFans in the viral world.BMC Genomics,2008,9:24.
[11]Yin YB,Fischer D.On the origin of microbial ORFans: Quantifying the strength of the evidence for viral lateral transfer.BMC Evol Biol,2006,6:63.
[12]Wilson GA,Bertrand N,Patel Y,Hughes JB,Feil EJ,Field D.Orphans as taxonomically restricted and ecologically important genes.Microbiology,2005,151(8):2499–2501.
[13]Tay SK,Blythe J,Lipovich L.Global discovery of primate-specific genes in the human genome.Proc Natl Acad Sci USA,2009,106(29):12019–12024.
[14]Toll-Riera M,Bosch N,Bellora N,Castelo R,Armengol L, Estivill X,Albà MM.Origin of primate orphan genes: a comparative genomics approach.Mol Biol Evol,2009, 26(3):603–612.
[15]Lindskog C,Kuhlwilm M,Davierwala A,Fu N,Hegde G, UhlénM,NavaniS,P??bo S,Pontén F.Analysis of candidate genes for lineage-specific expression changes in humansand primates.J Proteome Res,2014,13(8): 3596–3606.
[16]Zhang Q. Using pseudogene database to identify lineage-specific genes and pseudogenes in humans and chimpanzees.J Hered,2014,105(3):436–443.
[17]Johnson BR,Tsutsui ND.Taxonomically restricted genes are associated with the evolution of sociality in the honey bee.BMC Genomics,2011,12:164.
[18]Zhang GJ,Wang HS,Shi JJ,Wang XL,Zheng HK,Wong GKS,Clark T,Wang W,Wang J,Kang L.Identification and characterization of insect-specific proteins by genome data analysis.BMC Genomics,2007,8:93.
[19]Palmieri N,Kosiol C,Schl?tterer C.The life cycle of Drosophila orphan genes.Elife,2014,3:e01311.
[20]Rogers RL,Shao L,Sanjak JS,Andolfatto P,Thornton KR. Revised annotations, sex-biased expression, and lineage-specific genes in the Drosophila melanogaster group.G3(Bethesda),2014,4(12):2345-2351.
[21]Lin HN,Moghe G,Ouyang S,Iezzoni A,Shiu SH,Gu X, Buell CR.Comparative analyses reveal distinct sets of lineage-specific genes within Arabidopsis thaliana.BMC Evol Biol,2010,10:41.
[22]Donoghue MT,Keshavaiah C,Swamidatta SH,Spillane C. Evolutionary origins of Brassicaceae specific genes in Arabidopsis thaliana.BMC Evol Biol,2011,11:47.
[23]Campbell MA,Zhu W,Jiang N,Lin HN,Ouyang S,Childs KL,Haas BJ,Hamilton JP,Buell CR.Identification and characterization of lineage-specific genes within the poaceae.Plant Physiol,2007,145(4):1311–1322.
[24]Lin WL, Cai B, Cheng ZM. Identification and characterization of lineage-specific genes in Populus trichocarpa.Plant Cell Tiss Org,2014,116(2):217–225.
[25]Yang XH,Jawdy S,TschaplinskiTJ,Tuskan GA. Genome-wide identification of lineage-specific genes in Arabidopsis,Oryza and Populus.Genomics,2009,93(5): 473–480.
[26]Hunter S,Apweiler R,Attwood TK,Bairoch A,Bateman A,Binns D,Bork P,Das U,Daugherty L,Duquenne L, Finn RD,Gough J,Haft D,Hulo N,Kahn D,Kelly E, Laugraud A,Letunic I,Lonsdale D,Lopez R,Madera M, Maslen J,McAnulla C,McDowall J,Mistry J,Mitchell A, Mulder N,Natale D,Orengo C,Quinn AF,Selengut JD, Sigrist CJA,Thimma M,Thomas PD,Valentin F,Wilson D,Wu CH,Yeats C.InterPro:the integrative protein signature database.Nucleic Acids Res,2009,37(suppl.1): D211–D215.
[27]Yan HW,Zhang W,Lin YX,Dong Q,Peng XJ,Jiang HY, Zhu SW,Cheng BJ.Different evolutionary patterns among intronless genes in maize genome.Biochem Biophys Res Commun,2014,449(1):146–150.
[28]WisslerL,Gadau J,Simola DF,HelmkampfM, Bornberg-Bauer E.Mechanisms and dynamics of orphan gene emergence in insect genomes.Genome Biol Evol, 2013,5(2):439–455.
[29]Chothia C,Gough J.Genomic and structural aspects of protein evolution.Biochem J,2009,419(1):15–28.
[30]Carninci P.RNA dust:where are the genes?DNA Res, 2010,17(2):51–59.
[31]Cai JJ,Woo PCY,Lau SKP,Smith DK,Yuen KY. Accelerated evolutionary rate may be responsible for the emergence of lineage-specific genes in ascomycota.J Mol Evol,2006,63(1):1–11.
[32]Wolf YI,Novichkov PS,Karev GP,Koonin EV,Lipman DJ.The universal distribution of evolutionary rates of genes and distinct characteristics of eukaryotic genes of different apparent ages.Proc Natl Acad Sci USA,2009, 106(18):7273–7280.
[33]Kasuga T,Mannhaupt G,Glass NL.Relationship between phylogenetic distribution and genomic features in Neurospora crassa.PLoS One,2009,4(4):e5286.
[34]Albà MM,Castresana J.Inverse relationship between evolutionary rate and age of mammalian genes.Mol Biol Evol,2005,22(3):598–606.
[35]Cai JJ,Petrov DA.Relaxed purifying selection and possibly high rate of adaptation in primate lineage-specific genes.Genome Biol Evol,2010,2:393–409.
[36]Gayà-Vidal M,Albà MM.Uncovering adaptive evolution in the human lineage.BMC Genomics,2014,15:599.
[37]Long MY,Van Kuren NW,Chen SD,Vibranovski MD. New gene evolution:little did we know.Annu Rev Genet, 2013,47:307–333.
[38]Guo LH,Chen YN,Ye N,Dai XG,Yang WX,Yin TM. Differential retention and expansion of the ancestral genes associated with the paleopolyploidies in modern rosid plants,as revealed by analysis of the extensins super-gene family.BMC Genomics,2014,15:612.
[39]Hoffmann FG,OpazoJC,StorzJF.Rapid ratesof lineage-specific gene duplication and deletion in the alpha-globin gene family. Mol Biol Evol, 2008, 25(3):591-602.
[40]Kondrashov FA.Gene duplication as a mechanism of genomic adaptation to a changing environment.Proc Biol Sci,2012,279(1749):5048–5057.
[41]Guo WJ, Li P, Ling J, Ye SP. Significant comparative characteristics between orphan and nonorphan genes in the rice(Oryza sativa L.)genome. Comp Funct Genomics,2007:21676.
[42]Davies J,Davies D.Origins and evolution of antibiotic resistance.Microbiol Mol Biol Rev,2010,74(3):417–433.
[43]Dunning Hotopp JC. Horizontal gene transfer between bacteria and animals.Trends Genet,2011, 27(4):157–163.
[44]Gao CH,Ren XD,Mason AS,Liu HL,Xiao ML,Li JN,Fu DH.Horizontal gene transfer in plants.Funct Integr Genomics,2014,14(1):23–29.
[45]Huang JL.Horizontal gene transfer in eukaryotes:The weak-link model.BioEssays,2013,35(10):868–875.
[46]王洽,樂霽培,張?bào)w操,黃錦嶺,孫航.水平基因轉(zhuǎn)移在生物進(jìn)化中的作用.科學(xué)通報(bào),2014,59(21):2055–2064.
[47]Cooper ED. Horizontal gene transfer: accidental inheritance drives adaptation.Curr Biol,2014,24(12): R562–R564.
[48]Cai J,Zhao RP,Jiang HF,Wang W.De novo origination of a new protein-coding gene in Saccharomyces cerevisiae. Genetics,2008,179(1):487–496.
[49]Sorek R.The birth of new exons:mechanisms and evolutionary consequences. RNA, 2007, 13(10): 1603–1608.
[50]Light S,Basile W,Elofsson A.Orphans and new gene origination,a structural and evolutionary perspective. Curr Opin Struct Biol,2014,26:73–83.
[51]Wu DD,Zhang YP.Evolution and function of de novo originated genes. Mol Phylogenet Evol, 2013, 67(2):541–545.
[52]Li CY,Zhang Y,Wang ZB,Zhang Y,Cao CM,Zhang PW, Lu SJ,Li XM,Yu Q,Zheng XF,Du Q,Uhl GR,Liu QR, Wei LP.A human-specific De novo protein-coding gene associated with human brain functions.PLoS Comput Biol, 2010,6(3):e1000734.
[53]Carvunis AR,Rolland T,Wapinski I,Calderwood MA, Yildirim MA,Simonis N,Charloteaux B,Hidalgo CA, Barbette J,Santhanam B,Brar GA,Weissman JS,Regev A, Thierry-Mieg N,Cusick ME,Vidal M.Proto-genes and de novo gene birth.Nature,2012,487(7407):370–374.
[54]Zhou Q,Zhang GJ,Zhang Y,Xu SY,Zhao RP,Zhan ZB, Li X,Ding Y,Yang S,Wang W.On the origin of new genes in Drosophila.Genome Res,2008,18(9):1446–1455.
[55]Ohno S.Birth of a unique enzyme from an alternative reading frame of the preexisted,internally repetitious coding sequence.Proc Natl Acad Sci USA.1984,81(8):2421–2425.
[56]KeesePK,Gibbs A.Originsofgenes:"big bang" or continuous creation?Proc Natl Acad Sci USA,1992, 89(20):9489–9493.
[57]Ekman D,Elofsson A.Identifying and quantifying orphan protein sequences in fungi.J Mol Biol,2010,396(2): 396–405.
[58]ChungWY,WadhawanS,SzklarczykR,PondSK, Nekrutenko A.A first look at ARFome:Dual-coding genes in mammalian genomes.PLoS Comput Biol,2007,3(5): e91.
[59]Knowles DG,McLysaght A.Recent de novo origin of human protein-coding genes.Genome Res,2009,19(10): 1752–1759.
[60]Sabath N,Wagner A,Karlin D.Evolution of viral proteins originated de novo by overprinting.Mol Biol Evol,2012, 29(12):3767–3780.
[61]Lockton S,Gaut BS.The contribution of transposable elements to expressed coding sequence in Arabidopsis thaliana.J Mol Evol,2009,68(1):80–89.
[62]B?hne A,Brunet F,Galiana-Arnoux D,Schultheis C,Volff JN. Transposable elements as drivers of genomic and biological diversity in vertebrates.Chromosome Res, 2008,16(1):203–215.
[63]Innan H,Kondrashov F.The evolution of gene duplications: classifying and distinguishing between models.Nat Rev Genet,2010,11(2):97–108.
[64]Gibson TA,Goldberg DS.Questioning the ubiquity of neofunctionalization.PLoS ComputBiol,2009,5(1): e1000252.
[65]Van Hoof A.Conserved functions of yeast genes support the duplication,degeneration and complementation model for gene duplication.Genetics,2005,171(4):1455–1461.
[66]Gillespie RG.Adaptive radiation: convergence and non-equilibrium.Curr Biol,2013,23(2):R71–R74.
[67]N?svall J,Sun L,Roth JR,Andersson DI.Real-time evolution of new genes by innovation,amplification,and divergence.Science,2012,338(6105):384–387.
[68]Deng C,Cheng CHC,Ye H,He XM,Chen LB.Evolution of an antifreeze protein by neofunctionalization under escape from adaptive conflict.Proc Natl Acad Sci USA, 2010,107(50):21593–21598.
[69]孫紅正,葛頌.重復(fù)基因的進(jìn)化——回顧與進(jìn)展.植物學(xué)報(bào),2010,45(1):13–22.
[70]Krylov DM,Wolf YI,Rogozin IB,Koonin EV.Gene loss, protein sequence divergence, gene dispensability, expression level,and interactivity are correlated in eukaryotic evolution. Genome Res, 2003, 13(10): 2229–2235.
[71]Gabor Miklos GL,Rubin GM.The role of the genome project in determining gene function:insights from model organisms.Cell,1996,86(4):521–529.
[72]Kaessmann H.Origins,evolution,and phenotypic impact of new genes.Genome Res,2010,20(10):1313–1326.
[73]Long MY,Betrán E,Thornton K,Wang W.The origin of new genes:glimpses from the young and old.Nat Rev Genet,2003,4(11):865–875.
[74]Chen SD,Zhang YE,Long MY.New genes in Drosophila quickly become essential.Science,2010,330(6011): 1682–1685.
[75]Ding Y,Zhao L,Yang S,Jiang Y,Chen Y,Zhao RP,Zhang Y,Zhang GJ,Dong Y,Yu HJ,Zhou Q,Wang W.A young Drosophila duplicate gene plays essential roles in spermatogenesisby regulating severaly-linked male fertility genes.PLoS Genet,2010,6(12):e1001255.
[76]Chen SD,Ni XC,Krinsky BH,Zhang YE,Vibranovski MD,White KP,Long MY.Reshaping of global gene expression networks and sex-biased gene expression by integration of a young gene.EMBO J,2012,31(12): 2798–809.
[77]Cardoso-Moreira M,Long MY.The origin and evolution of new genes.Methods Mol Biol,2012,856:161–186.
[78]Nei M,Gojobori T.Simple methods for estimating the numbers of synonymous and nonsynonymous nucleotide substitutions.Mol Biol Evol,1986,3(5):418–426.
[79]Ellrott K,Jaroszewski L,Li WZ,Wooley JC,Godzik A. Expansion of the protein repertoire in newly explored environments:human gut microbiome specific protein families.PLoS Comput Biol,2010,6(6):e1000798.
[80]Colbourne JK,Pfrender ME,Gilbert D,Thomas WK, Tucker A,Oakley TH,Tokishita S,Aerts A,Arnold GJ, Basu MK,Bauer DJ,Cáceres CE,Carmel L,Casola C, Choi JH,Detter JC,Dong QF,Dusheyko S,Eads BD, Fr?hlich T,Geiler-Samerotte KA,Gerlach D,Hatcher P, Jogdeo S,Krijgsveld J,Kriventseva EV,Kültz D,Laforsch C,Lindquist E,Lopez J,Manak JR,Muller J,Pangilinan J, Patwardhan RP,Pitluck S,Pritham EJ,Rechtsteiner A, Rho M,Rogozin IB,Sakarya O,Salamov A,Schaack S, Shapiro H,Shiga Y,Skalitzky C,Smith Z,Souvorov A, Sung W,Tang ZJ,Tsuchiya D,Tu H,Vos H,Wang M, Wolf YI,Yamagata H,Yamada T,Ye YZ,Shaw JR, Andrews J,Crease TJ,Tang HX,Lucas SM,Robertson HM,Bork P,Koonin EV,Zdobnov EM,Grigoriev IV, Lynch M,BooreJL.Theecoresponsivegenomeof Daphnia pulex.Science,2011,331(6017):555–561.
[81]Milde S.Hemmrich G,Anton-Erxleben F,Khalturin K, Wittlieb J,Bosch TCG.Characterization of taxonomically restricted genes in a phylum-restricted cell type.Genome Biol,2009,10(1):R8.
[82]Steele RE,David CN,Technau U.A genomic view of 500 million years of cnidarian evolution.Trends Genet,2011, 27(1):7–13.
[83]Khalturin K,Anton-Erxleben F,Sassmann S,Wittlieb J, Hemmrich G,Bosch TCG.A novel gene family controls species-specific morphological traits in Hydra.PLoS Biol, 2008,6(11):e278.
[84]Domazet-Loso T,Tautz D.An evolutionary analysis of orphan genes in Drosophila.Genome Res,2003,13(10): 2213–2219.
[85]Silverstein KAT,Moskal WA Jr,Wu HC,Underwood BA, Graham MA, Town CD, VandenBosch KA. Smallcysteine-rich peptidesresembling antimicrobial peptides have been under-predicted in plants.Plant J, 2007,51(2):262–280.
[86]Capra JA,Pollard KS,Singh M.Novel genes exhibit distinct patterns of function acquisition and network integration.Genome Biol,2010,11(12):R127.
[87]Begun DJ,Lindfors HA,Kern AD,Jones CD.Evidence for de novo evolution of testis-expressed genes in the Drosophila yakuba/Drosophila erecta clade.Genetics, 2007,176(2):1131–1137.
[88]Parkinson J,Blaxter M.Expressed sequence tags:an overview.Methods Mol Biol,2009,533:1–12.
[89]Kogenaru S,Qing Y,Guo YP,Wang NA.RNA-seq and microarray complementeach otherin transcriptome profiling.BMC Genomics,2012,13:629.
[90]祁云霞,劉永斌,榮威恒.轉(zhuǎn)錄組研究新技術(shù): RNA-Seq及其應(yīng)用.遺傳,2011,33(11):1191–1202.
[91]Richardson MK.A phylotypic stage for all animals?Dev Cell,2012,22(5):903–904.
[92] ?vorcová J.The phylotypic stage as a boundary of modular memory:non mechanistic perspective.Theory Biosci,2012,131(1):31–42.
[93]Domazet-Lo?o T,Tautz D.A phylogenetically based transcriptome age index mirrors ontogenetic divergence patterns.Nature,2010,468(7325):815–818.
[94]Kalinka AT,Varga KM,Gerrard DT,Preibisch S,Corcoran DL,Jarrells J,Ohler U,Bergman CM,Tomancak P.Gene expression divergence recapitulates the developmental hourglass model.Nature,2010,468(7325):811–814.
[95]Hazkani-Covo E,Wool D,Graur D.In search of the vertebrate phylotypic stage:a molecular examination of the developmental hourglass model and von Baer's third law.J Exp Zool B Mol Dev Evol,2005,304(2):150–158.
[96]Irie N,Kuratani S.Comparative transcriptome analysis reveals vertebrate phylotypic period during organogenesis. Nat Commun,2011,2:248.
[97]Comte A,RouxJ,Robinson-RechaviM.Molecular signaling in zebrafish development and the vertebrate phylotypic period.Evol Dev,2010,12(2):144–156.
[98]Quint M,Drost HG,Gabel A,Ullrich KK,B?nn M, Grosse I. A transcriptomic hourglass in plant embryogenesis.Nature,2012,490(7418):98–101.
[99]Levine MT,Jones CD,Kern AD,Lindfors HA,Begun DJ. Novel genes derived from noncoding DNA in Drosophila melanogaster are frequently X-linked and exhibit testis-biased expression.Proc Natl Acad Sci USA,2006, 103(26):9935–9939.
[100]Nurminsky DI,Nurminskaya MV,De Aguiar D,Hartl DL. Selective sweep of a newly evolved sperm-specific gene in Drosophila.Nature,1998,396(6711):572–575.
[101]Yeh SD,Do T,Abbassi M,Ranz JM.Functional relevance of the newly evolved sperm dynein intermediate chain multigenefamily in Drosophila melanogastermales. Commun Integr Biol,2012,5(5):462–465.
[102]Yeh SD,Do T,Chan C,Cordova A,Carranza F,Yamamoto EA,Abbassi M,Gandasetiawan KA,Librado P,Damia E, DimitriP,RozasJ,HartlDL,RooteJ,RanzJM. Functional evidence that a recently evolved Drosophila sperm-specific gene boosts sperm competition.Proc Natl Acad Sci USA,2012,109(6):2043–2048.
[103]Quezada-Díaz JE,Muliyil T,Río J,Betrán E.Drcd-1 related:a positively selected spermatogenesis retrogene in Drosophila.Genetica,2010,138(9–10):925–937.
[104]Wu DD,Wang X,Li Y,Zeng L,Irwin DM,Zhang YP. "Out of pollen"hypothesis for origin of new genes in flowering plants:study from Arabidopsis thaliana. Genome Biol Evol,2014,6(10):2822–2829.
[105]Chen SD,Spletter M,Ni XC,White KP,Luo LQ,Long MY.Frequent recent origination of brain genes shaped the evolution of foraging behavior in Drosophila.Cell Rep, 2012,1(2):118–132.
[106]Chen Y,Dai HZ,Chen SD,Zhang LY,Long MY.Highly tissue specific expression of Sphinx supports its male courtship related role in Drosophila melanogaster. PLoS One,2011,6(4):e18853.
[107]Fortna A,Kim Y,MacLaren E,Marshall K,Hahn G, Meltesen L, Brenton M, Hink R, Burgers S, Hernandez-Boussard T,Karimpour-Fard A,Glueck D, McGavran L, Berry R, Pollack J, Sikela JM. Lineage-specific gene duplication and loss in human and great ape evolution.PLoS Biol,2004,2(7):E207.
[108]Zhang YE,Landback P,Vibranovski M,Long MY.New genes expressed in human brains:implications for annotating evolving genomes.Bioessays,2012,34(11): 982–991.
[109]Charrier C,Joshi K,Coutinho-Budd J,Kim JE,Lambert N, de Marchena J,Jin WL,Vanderhaeghen P,Ghosh A,Sassa T,Polleux F.Inhibition of SRGAP2 function by its human-specific paralogs induces neoteny during spine maturation.Cell,2012,149(4):923–935.
[110]Dennis MY,Nuttle X,Sudmant PH,Antonacci F,Graves TA,Nefedov M,Rosenfeld JA,Sajjadian S,Malig M, Kotkiewicz H,Curry CJ,Shafer S,Shaffer LG,de Jong PJ, Wilson RK,Eichler EE.Evolution of human-specific neural SRGAP2 genes by incomplete segmental duplication.Cell,2012,149(4):912–922.
[111]Wu DD,Irwin DM,Zhang YP.De novo origin of human protein-coding genes.PLoS Genet,2011,7(11):e1002379.
(責(zé)任編委:吳為人)
Advances in lineage-specific genes
Huanping Zhang1,2,Tongming Yin2
1.College of Mechanical and Electrical Engineering,Nanjing Forestry University,Nanjing 210037,China;
2.Co-Innovation Center for Sustainable Forestry in Southern China,Nanjing Forestry University,Nanjing 210037,China
Lineage-specific genes(LSGs)are defined as genes found in one particular taxonomic group but have no significant sequence similarity with genes from other lineages,which compose about 10%?20%of the total genes in the genome of a focal organism.LSGs were first uncovered in the yeast genome in 1996.The development of the whole genome sequencing leads to the emergence of studies on LSGs as a hot topic in comparative genomics.LSGs have been extensively studied on microbial species,lower marine organisms,plant(such as Arabidopsis thaliana, Oryza sativa,Populus),insects,primate,etc;the biological functions of LSGs are important to clarify the evolution and adaptability of a species.In this review,we summarize the progress of LSGs studies,including LSGs identification,gene characterization,origin and evolution of LSGs,biological function,and expression analysis of LSGs.In addition,we discuss the existing problems and future directions for studies in this area.Our purpose is to provide some unique insights into the researches of LSGs.
lineage-specific genes;orphan genes;origin and evolution of LSGs;biological function of LSGs
URL:http://www.cnki.net/kcms/detail/11.1913.R.20150316.1049.002.html
2014-11-13;
2015-02-20
行業(yè)公益重大項(xiàng)目(編號(hào):201304102),國(guó)家自然科學(xué)基金項(xiàng)目(編號(hào):31125008)和中國(guó)博士后基金項(xiàng)目(編號(hào):2014M551604)資助
張煥萍,博士,講師,研究方向:基因組學(xué)。E-mail:nuaazhp@njfu.edu.cn
尹佟明,博士,教授,博士生導(dǎo)師,研究方向:基因組學(xué)。E-mail:tmyin@njfu.edu.cn
10.16288/j.yczz.14-392
時(shí)間:2015-3-16 10:49:32