馬博涵,姚 丹,焦蘇淇,魯中爽,李澤遠(yuǎn),張愛晶,何浩博,張家野
(吉林農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,吉林 長(zhǎng)春 130118)
早在20世紀(jì),人們就開始研究非編碼RNA(non-coding RNAs,ncRNAs),但是直到基因組時(shí)代的到來,ncRNAs才逐漸受到重視。隨著近年來轉(zhuǎn)錄組測(cè)序技術(shù)的發(fā)展,越來越多新的ncRNAs逐漸浮出水面,這些新ncRNAs的調(diào)控機(jī)制已經(jīng)成為當(dāng)前生命科學(xué)研究的熱點(diǎn)之一。
ncRNAs是一類不編碼蛋白且具有催化活性的RNA分子,廣泛存在于各種生物體中。由于結(jié)構(gòu)不同,ncRNAs可分為線性ncRNAs(linear ncRNAs)和環(huán)形 ncRNAs(circRNAs),其中l(wèi)inear ncRNAs包括小ncRNAs如(microRNAs miRNAs)和長(zhǎng)鏈 ncRNAs(lncRNAs)。植 物miRNAs在近些年研究較多,其能夠降解或者抑制靶標(biāo)mRNA的翻譯、抑制目的基因的表達(dá),進(jìn)而影響生物過程;lncRNAs在動(dòng)物醫(yī)學(xué)方面研究比較深入,而通過這兩年在植物中的研究發(fā)現(xiàn),lncRNAs具有順式或者反式調(diào)節(jié)因子、調(diào)控基因的功能;circRNAs是一種新型的ncRNAs,它與miRNAs之間的海綿機(jī)制一直是人們研究的熱點(diǎn),XING等[1]系統(tǒng)分析了我國(guó)非編碼RNA研究的主要現(xiàn)狀。2000年以前,國(guó)內(nèi)還未見非編碼RNA相關(guān)的文章,但到了2015年,非編碼RNA的文章高達(dá)600余篇,占世界此類研究文總數(shù)的1/2,表明我國(guó)非編碼RNA研究的速度驚人。WANG等[2]研究表明,這些ncRNAs對(duì)植物生長(zhǎng)發(fā)育尤其是在應(yīng)激反應(yīng)過程中起著重要的調(diào)控作用;YE等[3]對(duì)環(huán)形非編碼RNA進(jìn)行研究,發(fā)現(xiàn)其在植物生長(zhǎng)發(fā)育過程中起著重要的調(diào)控作用。本研究簡(jiǎn)述了ncRNAs的分類及相關(guān)功能,總結(jié)了近年來植物中幾種主要ncRNAs(miRNAs、lncRNAs、circRNAs)的研究進(jìn)展,包括這些ncRNAs的特征、鑒定、功能以及相關(guān)數(shù)據(jù)庫(kù)等,重點(diǎn)總結(jié)了在植物應(yīng)激反應(yīng)機(jī)制的研究現(xiàn)狀,并展望了未來植物ncRNAs的研究方向,為進(jìn)一步深入研究這些植物ncRNAs的作用機(jī)理提供理論依據(jù)。
miRNAs是由內(nèi)源基因編碼的一類非編碼單鏈小RNA分子,其長(zhǎng)度約為22個(gè)核苷酸,大多數(shù)miRNAs具有高度的保守性和組織特異性[4]。早在1993年,LEE等[5]首次在秀麗隱桿線蟲中發(fā)現(xiàn)了第1個(gè)miRNA基因lin-4;在隨后的2000年,REINHART等[6]在果蠅體內(nèi)發(fā)現(xiàn)了第2個(gè)miRNA基因let-7。與動(dòng)物相比,雖然植物miRNAs的研究相對(duì)較晚,但后期發(fā)展迅速。REINHART等[7]在模式植物擬南芥中發(fā)現(xiàn)miRNAs基因并鑒定出20種miRNAs;WANG等[8]從水稻中鑒定出20種miRNAs;隨著對(duì)植物miRNAs研究的深入,截至2011年,已在植物中發(fā)現(xiàn)72種miRNAs。至今,已經(jīng)在擬南芥(Arabidopsis thaliana L.)、 大 豆(Glycine max L.)、水稻(Orza sativa L.)、煙草(Nicotiana tabacum L.)、玉米(Zea mays L.)、小麥(Triticum aestivum L.)等多種植物中發(fā)現(xiàn)許多不同類型的miRNAs[9-13],為今后研究植物中的 miRNAs提供參考。
2012年,KHRAIWESH等[14]報(bào)道了miRNAs的生物合成途徑(圖1),在RNA聚合酶Ⅱ(RNA Pol Ⅱ)的作用下,首先由miRNAs轉(zhuǎn)錄產(chǎn)生初級(jí)轉(zhuǎn)錄物pri-miRNAs,接著Dicer-like1酶(DCL1)將植物初級(jí)轉(zhuǎn)錄物pri-miRNAs剪切加工形成雙鏈 的 pre-miRNAs(precursor miRNAs),premiRNAs為成熟miRNA的前體;然后DCL1酶進(jìn)行第2次切割形成由pre-miRNAs與成熟miRNAs的互補(bǔ)片段所組成的雙鏈miRNAs,并借助于HST(轉(zhuǎn)運(yùn)蛋白Exportin-5在植物中的同源類似物)將miRNAs轉(zhuǎn)運(yùn)出細(xì)胞核,最終經(jīng)酶切后在細(xì)胞質(zhì)中形成成熟的miRNAs。成熟的miRNAs進(jìn)入核糖核蛋白復(fù)合體(RNA-induced silencing complex,RISC)并在其中發(fā)揮作用。
圖1 植物miRNAs的主要生物合成途徑(改自文獻(xiàn)[15])Fig.1 Major biogenesis pathways of plant miRNAs (Change from reference[15])
通過近10年的研究,一些植物miRNAs的功能已經(jīng)被鑒定,這些小分子miRNAs在真核基因表達(dá)調(diào)控中有著廣泛的作用,它們通過抑制靶基因的表達(dá)進(jìn)而調(diào)控植物生長(zhǎng)發(fā)育、株型變化以及器官分化等過程(表1)。
表1 植物miRNAs在信號(hào)通路中的作用Table 1 Role of plant miRNAs in signaling pathways
植物miRNAs通過抑制靶mRNA間接地調(diào)控目的基因的表達(dá),從而影響植物的生長(zhǎng)發(fā)育,因此,如何鑒定植物miRNAs的靶基因,成為生物學(xué)研究的難點(diǎn)。迄今為止,常用一些生物信息學(xué)工具對(duì)植物miRNA作用的靶基因進(jìn)行預(yù)測(cè),目前有許多miRNAs數(shù)據(jù)庫(kù),如miRBase[39]從已經(jīng)鑒定的不同生物實(shí)驗(yàn)計(jì)算收集miRNAs;PmiRKB[40]植物miRNAs信息庫(kù)是眾所周知的植物特異性miRNAs的注釋數(shù)據(jù)庫(kù);miRTarBase[41]是常見的miRNAs與靶標(biāo)相互作用數(shù)據(jù)庫(kù);miRPlant[42]、miRanalyzer[43]、miRA[44]、miRDeep-P[45]可用于預(yù)測(cè)新的miRNAs,miRU[46]、psRNATarget[47]和 TAPIR[48]都可以用來預(yù)測(cè)植物miRNAs的靶標(biāo)。但是,通過生物信息學(xué)預(yù)測(cè)靶基因以后,還需要采用如q-PCR、測(cè)序等生物學(xué)實(shí)驗(yàn)進(jìn)一步驗(yàn)證植物miRNA靶基因的準(zhǔn)確性,為后續(xù)實(shí)驗(yàn)做準(zhǔn)備。
lncRNAs是一類長(zhǎng)度大于200 nt的ncRNAs,具有啟動(dòng)子結(jié)構(gòu)和polyA尾巴,存在組織特異性與時(shí)空特異性,在不同植物組織之間的lncRNAs表達(dá)量不同[49]。ncRNAs最初被認(rèn)為是轉(zhuǎn)錄“噪音”,因?yàn)樗鼈兙哂休^低的表達(dá)水平和序列保守性,但隨著近些年的研究發(fā)現(xiàn),lncRNAs是細(xì)胞過程中的關(guān)鍵調(diào)節(jié)因子,可作為基因表達(dá)的順式或反式調(diào)節(jié)因子在轉(zhuǎn)錄水平發(fā)揮作用,具有調(diào)控植物生長(zhǎng)發(fā)育的功能。
近年來,植物lncRNAs的研究突飛猛進(jìn),目前在擬南芥[50]、小麥[51]、水稻[52]、獼猴桃[53]、玉米[54]、桃樹[55]、黃瓜[56]等鑒定出了大量lncRNAs,而對(duì)lncRNAs功能的研究是目前生物學(xué)研究的熱點(diǎn)和難點(diǎn)之一,探究植物lncRNAs的作用機(jī)制有助于更加深入地理解其特征及相關(guān)生物學(xué)功能。雖然lncRNAs不能編碼蛋白,與已知編碼蛋白的基因類似,一些植物lncRNAs可以充當(dāng)ceRNAs,通過靶標(biāo)靶向調(diào)控miRNAs,從而阻斷miRNA與其靶標(biāo)之間的相互作用,影響植物的生長(zhǎng)發(fā)育,如BARDOU等[57]報(bào)道了擬南芥中低磷誘導(dǎo)的lncRNAs IPS1采取模擬靶基因的方法,解除了miR399對(duì)靶基因PHO2的抑制,因此調(diào)控磷反應(yīng)過程進(jìn)而達(dá)到穩(wěn)定狀態(tài);WANG等[58]報(bào)道了幾種lncRNAs被鑒定為響應(yīng)番茄黃葉卷曲病毒(TYLCV)感染的番茄miRNA的靶標(biāo)模擬物;最近一項(xiàng)研究報(bào)道,有13種lncRNAs被預(yù)測(cè)為96種miRNAs的前體,這些miRNAs參與了對(duì)甘藍(lán)型油菜菌核病菌的感染過程[52];針對(duì)小麥的一項(xiàng)研究報(bào)道了3種lncRNAs作為miR-2004和miR-2066的前體,16種lncRNAs作為97種siRNAs響應(yīng)白粉病感染的前體[59]。雖然已經(jīng)有l(wèi)ncRNAs作用機(jī)制及功能的相關(guān)報(bào)道,但其在植物上的研究還不夠深入,因此還有待于進(jìn)一步研究植物中不同類型lncRNAs的特征,這對(duì)作用機(jī)制的研究具有很大幫助。
為了鑒定lncRNAs及其生物學(xué)特征,已經(jīng)開發(fā)了幾個(gè)數(shù)據(jù)庫(kù)用于進(jìn)一步的lncRNAs研究。例如,NONCODE是16種ncRNAs的完整收集和注釋數(shù)據(jù)庫(kù),涵蓋動(dòng)物中各種類型的ncRNAs,并使用CNCI軟件評(píng)估lncRNAs編碼潛力[60],然而在植物中,NONCODE中僅包括擬南芥lncRNAs;lncRNAdb[61]提供了287個(gè)真核生物lncRNAs的綜合注釋,以及它們實(shí)驗(yàn)驗(yàn)證的生物學(xué)功能,lncRNAdb中同樣只有很少的植物lncRNAs,包括7個(gè)擬南芥lncRNAs和2個(gè)水稻lncRNAs;QUEK等[62]開發(fā)了PlncDB,它提供了與lncRNAs相關(guān)的全面信息,但也僅適用于擬南芥;PNRD[63]是最大的植物lncRNAs數(shù)據(jù)庫(kù),PNRD包括主要有4種植物物種的lncRNAs序列,包括擬南芥、水稻、楊樹和玉米,因此,如果鑒定植物中的lncRNAs,PNRD是首選數(shù)據(jù)庫(kù)。相比較鑒定動(dòng)物lncRNAs而言,鑒定植物lncRNAs較少且受物種的局限,還有待于進(jìn)一步研究并建立植物lncRNAs相關(guān)數(shù)據(jù)庫(kù)。
circRNAs是一類內(nèi)源性非編碼環(huán)狀RNA,具有3’和5’末端共價(jià)結(jié)合形成的閉合環(huán)狀結(jié)構(gòu),具有組織特異性。與傳統(tǒng)的線性RNA相比,circRNAs沒有5’末端帽子結(jié)構(gòu)和3’末端poly(A)尾巴,不易被核酸外切酶RNaseR降解,因此circRNAs結(jié)構(gòu)穩(wěn)定;一些circRNAs含有miRNAs應(yīng)答元件,能夠miRNAs靶向結(jié)合,在細(xì)胞中與miRNAs存在海綿機(jī)制作用,消除miRNAs對(duì)靶基因的抑制,進(jìn)而調(diào)控靶基因的表達(dá)。
目前發(fā)現(xiàn)的circRNAs主要來源于基因外顯子(exon),這些circRNAs廣泛存在于多種真核生物中,circRNAs的生物合成有幾個(gè)途徑(圖2)。首先外顯子環(huán)化的效率依賴于外顯子附近出現(xiàn)的剪切位點(diǎn),正常情況下反向剪切效率一般都低于相同位置的線性轉(zhuǎn)錄本,這是由于剪切子在反向剪切位點(diǎn)位置上的組裝不利于5'端和3'端的連接;大多數(shù)的circRNAs包含幾個(gè)外顯子,其外顯子序列用于反向剪切,然后同一個(gè)基因通過可變剪切能夠產(chǎn)生多個(gè)circRNAs,在此過程中,環(huán)化的外顯子側(cè)翼內(nèi)含子中可能會(huì)頻繁出現(xiàn)順式調(diào)控元件,如形成RNA雙鏈結(jié)構(gòu)將明顯增強(qiáng)反向剪切,另外內(nèi)含子序列中短的順式作用元件能夠識(shí)別RNA結(jié)合蛋白(PBRs)進(jìn)而促進(jìn)外顯子環(huán)化;circRNAs結(jié)合蛋白介導(dǎo)的調(diào)控合成途徑除了順式作用元件過表達(dá)RBPs,也可以在側(cè)翼內(nèi)含子序列中添加RNA蛋白結(jié)合位點(diǎn),同樣能促進(jìn)circRNAs的表達(dá)。
SANGER等[64]于20世紀(jì)70年代在植物病毒體中發(fā)現(xiàn)了第1個(gè)circRNAs。2014年在擬南芥根部首次發(fā)現(xiàn)circRNAs,隨后2016年YE等[65]補(bǔ)充報(bào)道了水稻中有12 307個(gè)circRNAs,模式植物擬南芥中有6 012個(gè)circRNAs(表2)。2015年,LU等[66]通過高通量測(cè)序和RNA-seq數(shù)據(jù)的生物信息學(xué)計(jì)算后,在水稻中鑒定了2 354個(gè)circRNAs,其中1 356是外顯子來源的circRNAs,一些差異表達(dá)的circRNAs表現(xiàn)出組織特異性。LIU等[67]對(duì)不同生長(zhǎng)階段的擬南芥葉片進(jìn)行轉(zhuǎn)錄組測(cè)序,通過對(duì)擬南芥葉片生長(zhǎng)與衰老過程的表達(dá)譜進(jìn)行分析,鑒定了168個(gè)circRNAs,其中包括40種新型circRNAs,在擬南芥葉片中有158個(gè)是基因外顯子來源的circRNAs。通過GO分析和KEGG分析,一些circRNAs被注釋,從中發(fā)現(xiàn)circRNAs具有調(diào)控?cái)M南芥葉片衰老的功能。
圖2 circRNAs的生物合成Fig.2 Biosynthesis pathways of plant circRNAs
表2 植物circRNAs鑒定Table 2 Identification of plant circular RNAs
ZHANG等[68]在玉米和擬南芥中分別鑒定了2 174和1 354個(gè)circRNAs,并且大多數(shù)差異表達(dá)的circRNAs參與干旱反應(yīng)途徑。截止至目前,在玉米、大豆、水稻、小麥、大麥、擬南芥、獼猴桃(Pseudomonas syringaeL.)、番茄(Solanum lycopersicumL.)等植物中鑒定到了circRNAs (表2)。由于存在植物本身的特異性和取樣組織部位的特異性,不同樣品之間的測(cè)序深度不同,導(dǎo)致當(dāng)前報(bào)道的circRNAs數(shù)量有明顯差異。
近年來,ZHAO等[69]通過轉(zhuǎn)錄組測(cè)序和生物信息學(xué)分析在鑒定了大豆中circRNAs,對(duì)3 904個(gè)circRNAs進(jìn)行了GO分析和KEGG分析,在分子功能方面,GO分析的注釋包括核苷酸結(jié)合、ATP結(jié)合、蛋白質(zhì)結(jié)合和mRNA加工等功能。在生物過程方面,circRNAs主要參與一些代謝過程;KEGG途徑分析顯示,circRNAs在檸檬酸循環(huán)途徑、氨酰基-tRNA生物合成、糖酵解/糖異生、甘油磷脂代謝、丙酮酸代謝和氧化磷酸化等相關(guān)途徑中顯著富集。ZHAO等[74]運(yùn)用轉(zhuǎn)錄組測(cè)序技術(shù)對(duì)大豆抗蟲基因進(jìn)行分析,從中鑒定出5 367個(gè)circRNAs,并預(yù)測(cè)在大豆中有5 356個(gè)circRNAs能與miRNAs靶標(biāo)結(jié)合,這些miRNAs來自69個(gè)家族,包括miRNA1520、miRNA172、miRNA159、miRNA156和 miR395家 族 等,其中miRNA1514家族與circRNAs結(jié)合位點(diǎn)的數(shù)目最多。
目前在植物中鑒定到的circRNAs數(shù)量較少,鑒定到的miRNAs不夠全面,如在miRNAs一些新的數(shù)據(jù)庫(kù)中,鑒定到的玉米miRNAs有325個(gè),但在動(dòng)物中(包括人類)已達(dá)到2 000多個(gè),這讓circRNAs和miRNAs之間的靶向關(guān)系變得模糊,因此有待于進(jìn)一步研究驗(yàn)證。
植 物 ncRNAs除 了 miRNAs、lncRNAs、circRNAs外,還有幾種較重要的RNA。例如,snRNAs核內(nèi)小分子RNA(small nuclear RNA),它參與mRNA前體的加工,是真核生物轉(zhuǎn)錄后加工過程中RNA剪接體的主要成分;snoRNAs核仁小分子RNA(small nucleolar RNAs),它在核糖體RNA 的生物合成中發(fā)揮重要作用,還能指導(dǎo)snRNA、tRNA 和mRNA 的轉(zhuǎn)錄后修飾;siRNAs是siRISC的主要成員,激發(fā)與之互補(bǔ)的靶標(biāo)mRNA的沉默;piRNAs(Piwi-interacting RNA)目前研究較少,它是一類長(zhǎng)度為24~32 nt的單鏈小RNA,具有專一性,piRNAs主要與PIWI亞家族成員Piwi蛋白或AGO3蛋白質(zhì)結(jié)合而發(fā)揮作用。隨著ncRNAs研究的深入,會(huì)出現(xiàn)越來越多新的ncRNAs。
植物ncRNAs的作用機(jī)理是當(dāng)今分子生物學(xué)研究的前沿與熱點(diǎn)之一,鑒定ncRNAs的種類及功能,闡明ncRNAs的生物合成途徑是該領(lǐng)域的基本科學(xué)問題。近年來開發(fā)的單細(xì)胞測(cè)序和單分子測(cè)序可能會(huì)為鑒定植物中新的ncRNAs提供機(jī)會(huì),因此,有必要開發(fā)新的生物信息學(xué)方法來鑒定更多的 ncRNAs[62]。雖然 miRNAs、circRNAs和lncRNAs在植物應(yīng)激反應(yīng)中取得了顯著進(jìn)展,但它們之間的互相作用還有待進(jìn)一步研究。研究miRNAs、circRNAs、lncRNAs之間的表達(dá)模式并構(gòu)建網(wǎng)絡(luò)將會(huì)很有趣,這使我們對(duì)應(yīng)激反應(yīng)中基因調(diào)控網(wǎng)絡(luò)有更深的了解。即使編碼蛋白質(zhì)的基因在植物中相對(duì)變化較少,隨著ncRNAs的增加,植物的結(jié)構(gòu)域是動(dòng)態(tài)的,每年都在不斷地發(fā)現(xiàn)新成員。
除在水稻和大豆等作物中有一些研究外,當(dāng)前對(duì)植物ncRNAs的生物學(xué)功能和作用機(jī)制的研究還主要集中在擬南芥等模式植物方面。植物中circRNAs和lncRNAs的研究還處于起步階段,尤其是與植物circRNAs相關(guān)的問題有待深入研究,包括植物circRNAs的作用機(jī)制和生物學(xué)功能;還有受生物和非生物等環(huán)境因素所調(diào)控的比較重要的分子機(jī)制等,包括現(xiàn)在基因編輯CRISPR/Cas9技術(shù)的通用性可能對(duì)ncRNAs功能表征有一定作用,預(yù)計(jì)這些新的技術(shù)將在ncRNAs研究中得到廣泛應(yīng)用。期望不久的將來會(huì)發(fā)現(xiàn)更多新的ncRNAs、成熟的研究技術(shù)以及利用ncRNAs的作用機(jī)制促進(jìn)分子的植物育種。