高慧娟,呂昕培,王潤娟,任偉,程濟南,汪永平,邵坤仲,張金林
(蘭州大學農(nóng)業(yè)農(nóng)村部草牧業(yè)創(chuàng)新重點實驗室,蘭州大學草地農(nóng)業(yè)生態(tài)系統(tǒng)國家重點實驗室,蘭州大學草地農(nóng)業(yè)科技學院,甘肅 蘭州 730020,甘肅 蘭州730020)
功能基因組學中的轉錄組學是從整體mRNA水平上研究特定組織或細胞在不同發(fā)育階段,不同狀態(tài)下功能基因的表達情況和調(diào)控機理,以闡明生物表型與功能[1-2]。自1977年Sanger法測序技術誕生,以末端終止法為核心的傳統(tǒng)的第一代測序技術主導了DNA測序近30年,但是Sanger法測序通量低,準確度不高,價格昂貴,在應用過程中有很多缺陷[3-4]。隨著科學技術的發(fā)展,DNA微陣列(DNA microarray)、DNA宏陣列(DNA macroarray)、基因表達系列分析(serial analysis of gene expression, SAGE)、大規(guī)模平行測序技術(massively parallel signature sequencing, MPSS)以及使用最廣泛的第二代測序技術(next-generation sequencing technologies, NGS)即高通量測序技術(RNA-seq)相繼產(chǎn)生[5-6]。二代測序技術自2005年被引入市場,逐漸替代了Sanger法并對基因組學的研究產(chǎn)生了深刻的影響[7]。相比于傳統(tǒng)的測序方法,以Illumina/Solexa測序、Roche/454測序及ABI/SOLiD測序為主的RNA測序技術(RNA-seq)測序時間短、成本低、準確性高、高通量等,還可以獲得低豐度的表達基因,亦可用于未知基因組序列的物種研究,因此被大規(guī)模的用于醫(yī)學、生物學、農(nóng)業(yè)等各個領域[8-11](表1)。該技術可以高通量的直接對mRNA反轉錄生成的cDNA進行測序,揭示特定細胞或組織中表達的全部轉錄本;通過不同處理間基因表達差異的比較,還可獲得轉錄本表達量,確定轉錄發(fā)生位點,繪制轉錄圖譜,預測一些基因模型和組蛋白修飾,進行遺傳轉化分析等[12-14]?;蚪M已知物種,轉錄組測序結果通過與其基因組比對,可以獲得基因結構優(yōu)化和基因可變剪切,發(fā)現(xiàn)新轉錄本,檢測基因融合;無參考基因組的物種,通過測序組裝(Denovoassembly)可獲得單一基因序列,并通過功能比對獲得基因信息,包括基因表達量及差異表達基因研究,還可檢測轉錄水平的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)和簡單重復序列遺傳標記(simple sequence repeat,SSR)等[13-14]。近年來,RNA-seq在動植物發(fā)育調(diào)控, 免疫互作, 表觀調(diào)控以及逆境響應上的應用也越來越廣[15]。在植物抗逆方面,RNA-seq技術的應用能全面動態(tài)地檢測逆境下植物體基因在各個時空下的表達變化,并挖掘功能基因,分析脅迫響應調(diào)控機制,為植物抗逆機理研究,培育抗逆品種提供分子遺傳基礎[16-17]。本研究詳細總結了近年來國內(nèi)外有關RNA-seq技術在林草植物抗逆方面的應用。
表1 DNA測序技術的發(fā)展
Barakat等[18]用454測序技術比較了栗疫病感染下美國板栗(Castaneamollissima)和抗病型中國板栗的基因表達情況。通過測序組裝各自產(chǎn)生了28890和40039個Unigenes,GO注釋表明大多基因都富集在生物與非生物刺激響應、細胞組織、生物進程、轉移酶和水解酶代謝方面。栗疫病感染下一些與抗逆相關的轉錄因子和生物脅迫響應基因在中國板栗中發(fā)生了差異表達,其中有一些已被報道參與植物病原體防御反應,包括過敏性反應相關的細胞死亡以及阻止病原體進入細胞的物理屏障的構建,這些可能是導致兩種板栗抗病性差異的主要原因。Wu等[19]利用Solexa技術對霜霉病感染下的葡萄(Vitisvinifera)葉片進行轉錄組表達分析,正常條件下獲得了203514個Unigenes,霜霉病感染下獲得了233653個Unigenes;通過基因表達分析發(fā)現(xiàn),感病葉片中0.9%的Unigenes表達上調(diào)了5倍以上,0.6%的Unigenes表達下調(diào)5倍以上,且上調(diào)基因主要富集在核糖體結構、氨基酸和糖代謝通路中,這些差異基因以及代謝、信號通路可能與葡萄的抗病性密切相關。Wang等[20]利用Solexa測序技術研究了尖孢鐮刀菌感染(0、2、4和6 d)下香蕉(Musanana)根部基因表達情況,組裝獲得了平均長度為1439 bp的25158個Unigenes,通過序列相似性比較,21622(85.94%)個Unigenes得到注釋,真菌感染下與苯丙氨酸代謝、苯丙烷合成以及亞麻酸代謝途徑相關的基因發(fā)生了差異表達,這些可能與香蕉抗病性密切相關。同年,Li等[21]利用RNA-seq技術比較了尖孢鐮刀菌侵染下兩種不同抗性香蕉(變異卡文迪香蕉和野生型香蕉)間的基因表達變化,共獲得了平均長度為554 bp的88161個Unigenes,其中5008個基因與植物病害防御和信號轉導相關;基因表達譜(gene expression profile,DGE)分析發(fā)現(xiàn)轉錄因子、細胞壁修飾基因以及與免疫激活、激素合成、病害防御相關的基因的表達在二者間有很大差異,導致了香蕉的抗病性的不同。稻瘟菌感染下水稻(Oryzasativa)轉錄組測序結果發(fā)現(xiàn),參與信號轉導和次生代謝反應的基因表達急劇上調(diào),尤其是WRKY轉錄因子。已知OsWRKY的過表達可以增強水稻的抗病性,更加說明WRKY在水稻抗稻瘟菌反應中發(fā)揮重要作用[22]。輪狀鐮刀菌會引起玉米(Zeamays)穗腐病,降低籽粒產(chǎn)量。Wang等[23]對鐮刀菌有較高抗性的玉米柱系進行了RNA測序分析,發(fā)現(xiàn)熱激蛋白類、次級代謝物(苯丙酸、木質素、香豆酸、類黃酮)以及脫落酸、茉莉酸、水楊酸信號通路在玉米抵抗真菌感染過程中發(fā)揮重要作用。Sun等[24]對水稻條銹病感染下的擬南芥(Arabidopsisthaliana)進行了RNA測序分析,總共檢測到624個差異表達基因,在感染14 d后,有255個基因上調(diào),38個下調(diào),感染21 d后,146個基因上調(diào),237個下調(diào),其中只有52個基因在整個感染期間均差異表達。即在感染早期(14 d),與宿主防御反應相關的基因被誘導表達,而到后期(21 d)表達被抑制。功能注釋發(fā)現(xiàn)這些基因與植物防御反應、次生代謝及蛋白質磷酸化相關。研究發(fā)現(xiàn)大白菜(Brassicapekinensis)R635-10不易感染十字花科根腫病菌,而S177-47極易感染根腫病菌,Jia等[25]對這兩個品種進行了RNA-seq分析,發(fā)現(xiàn)R635-10感染病菌后,有2089個基因差異表達,其中與鈣離子內(nèi)流、葡糖異硫氰酸鹽合成、細胞壁增厚、水楊酸穩(wěn)態(tài)及幾丁質代謝相關的基因都上調(diào)表達。S177-47感染病菌后有10038個基因差異表達,其中與三羧酸循環(huán)、DNA復制、氧化磷酸化、細胞壁擴張、根瘤素、吲哚乙酸和細胞分裂素相關的基因上調(diào)表達,這些基因主要參與了細胞周期控制、細胞分裂及能量合成和轉換過程;而細胞分裂和擴張基因在R635-10中被抑制表達,說明在S177-47中根細胞分裂失去調(diào)控導致了根的腫脹。
Martinelli等[26]通過RNA-seq研究黃龍病感染下柑橘(Citrusreticulata)的轉錄組變化情況。黃龍病感染下,幾個WRKY轉錄因子、與光合作用光反應、ATP合成、乙烯通路、蛋白降解和錯誤折疊相關的基因表達上調(diào);而與細胞分裂素和赤霉素合成以及信號轉導相關的基因表達受到抑制。通路分析發(fā)現(xiàn),與源庫運輸相關的蔗糖和淀粉代謝,以及激素合成和信號通路發(fā)生了改變。這些結果說明了黃龍病感染下柑橘的基因響應情況,為以后減緩發(fā)病提供了廣泛的數(shù)據(jù)基礎。龍葵(Solanumnigrum)對青枯雷爾氏菌引起的青枯病有較強的抗性,Zuluaga等[27]對青枯病感染下的龍葵F118(抗病)和F97(易感病)進行了RNA測序分析,在F118和 F97中分別有221和644個基因發(fā)生差異表達,其中上調(diào)表達基因中有1/2已被報道參與植物病原反應。乙烯和水楊酸相關基因只在F118中被誘導表達,茉莉酸相關基因在F118和 F97中均表達下調(diào),這為以后龍葵抗青枯病研究提供了重要的分子基礎。根際有益菌能提高植物對病原菌的抵抗力,Van de Mortel等[28]對熒光假單孢菌SS101 (Pf. SS101)在擬南芥抵抗細菌性斑點病反應中的功能進行了分析。發(fā)現(xiàn)熒光假單孢菌能夠增強植株對細菌性斑點病的抗性,通過轉錄組測序發(fā)現(xiàn),其他根際細菌一般通過乙烯信號來提高植物防御能力,而Pf. SS101是依靠水楊酸信號來提高植物抗病能力,尤其葡糖異硫氰酸鹽和植保素是Pf. SS101誘導植物抗細菌性斑點病必不可缺的次級代謝物。
大豆包囊線蟲(soybean cyst nematode, SCN)寄生于豆類植物根部,對豆類生長和種子產(chǎn)量造成嚴重危害。變異山羊草(Triticumtriunciale)對包囊線蟲具有一定的抗性,由于基因組信息的缺乏,相關抗蟲功能基因研究受到限制。Xu等[29]運用RNA-seq對包囊線蟲感染下的山羊草根部組織進行測序,獲得了平均長度為500 bp的118064個Unigenes。功能分類發(fā)現(xiàn)7408個Unigenes與植物防御和抗性有關,包括“植物病原互作”“磷脂酰肌醇信號系統(tǒng)”和“ABC 轉運體”,這為抗蟲基因篩選以及山羊草抗包囊線蟲分子機制研究提供了一定的基礎。Jain等[30]對SCN感染下的兩種黑白斑豆(Glycinemax), PI533561(抗SCN)和GTS-900(易感染SCN)進行了RNA測序分析,發(fā)現(xiàn)PI533561感染SCN后有353個基因發(fā)生差異表達,其中154個上調(diào)表達,GTS-900感染SCN后有990個基因發(fā)生差異表達,406個上調(diào)表達。其中,WRKY、病程相關蛋白和熱激蛋白基因均發(fā)生差異表達,光合反應均被抑制。黑豆(Glycinemax)對SCN具有較強的抗性,Li等[31]通過RNA測序分析了灰皮支黑豆對SCN的抗病機制。發(fā)現(xiàn)在SCN侵染5、10和15 d后灰皮支黑豆根部分別有740、1413和4925個基因發(fā)生了差異表達,其中有225(3個下調(diào))個基因在整個時間段均差異表達。且大多數(shù)基因與植物防御以及激素信號相關,為了驗證激素信號在灰皮支黑豆抵抗SCN中的作用,對灰皮支黑豆進行了生長素、赤霉素、水楊酸、茉莉酸以及乙烯處理,結果發(fā)現(xiàn)激素處理能夠顯著提高灰皮支黑豆對SCN的抗性。芽孢桿菌Sneb545能提高大豆(Glycinemax)對SCN的抗性,Kang等[32]通過轉錄組測序對經(jīng)過Sneb545處理的大豆響應SCN的防御機制進行了分析,發(fā)現(xiàn)與未處理的大豆相比,Sneb545處理的大豆中有大量的殺線蟲代謝物,包括4-乙烯基苯酚、蛋氨酸、胡椒堿和棕櫚酸,這些代謝物增強了大豆的抗病性。
Rubio等[33]利用Solexa技術分析李痘病毒感染下桃樹(Amygdaluspersica)葉片的基因表達變化。沒有癥狀發(fā)生的葉片,初期伴隨有腺苷甲硫氨酸的產(chǎn)生,且與茉莉酸、幾丁質酶以及細胞分裂素等相關的基因發(fā)生差異表達。有痘病癥狀的樣品中,有一部分基因比對到病毒參考基因組。GO注釋表明與生物刺激響應,脂類和碳水化合物代謝有關的基因發(fā)生了差異表達。此次結果闡明了轉錄水平下桃樹感病和抗病的分子機制的不同。馬鈴薯(Solanumtuberosum)病毒病對馬鈴薯產(chǎn)量造成嚴重影響,不同馬鈴薯品種對病毒病的響應有很大差異。Goyer等[34]通過RNA測序比較了兩個馬鈴薯品種Premier Russet和Russet Burbank在病毒病(PVY)感染下的基因表達變化。Premier Russet栽培種對PVYO有抗性,但易感染PVYNTN,Russet Burbank易感染PVYNTN和PVYO。結果發(fā)現(xiàn)感染4 d后,大多數(shù)基因下調(diào)表達,感染10 d后,大多數(shù)基因上調(diào)表達。Premier Russet感染PVYO反應中,差異表達基因大多與光合作用中的光捕獲相關,Premier Russet感染PVYNTN和Russet Burbank感染PVYO反應中,差異表達基因大多與核小體組裝有關。這些基因中,ABC轉運蛋白、MYC2 、脂質轉運蛋白及木葡聚糖內(nèi)轉糖苷酶/水解酶基因只有在Premier Russet感染PVYO反應中下調(diào)表達,說明這些基因的表達決定了馬鈴薯對PVY的抗病能力的強弱。Rodamilans等[35]對李痘病毒感染下的歐洲李(Prunusdomestica)進行了RNA測序分析,總共有3020個基因發(fā)生差異表達,其中與植物防御相關的基因大多都上調(diào),而光合相關基因都下調(diào)表達。上調(diào)基因中有10個是核苷酸結合位點-富含亮氨酸重復基因(NBS-LRR),NBS-LRR在文獻中多有報道參與植物抗病反應[18,21,26]。
總的來說,通過RNA測序,我們可以分析病蟲侵害下植物基因表達變化,從而篩選出一些病蟲害響應基因;也可以通過比較兩個不同抗性品種在生物脅迫前后的基因表達差異,直接鑒定出病蟲害防御基因,探究抗病機理。植物對真菌、細菌、蟲害以及病毒的響應機理大多是相通的,尤其一些苯丙氨酸、蛋氨酸、甲硫氨酸、轉錄因子(WRKY)、激素(脫落酸、茉莉酸、水楊酸、乙烯)、熱激蛋白、次級代謝物(苯丙酸、香豆酸、類黃酮、胡椒堿、棕櫚酸、葡糖異硫氰酸鹽和植保素)、NBS-LRR、細胞壁修飾基因(幾丁質和木質素)以及植物防御相關基因在植物應對生物脅迫過程中發(fā)揮重要功能。
胡楊(Populuseuphratica)是一種耐鹽模式植物,Qiu等[36]利用Solexa技術對鹽處理前后(100 mmol·L-1NaCl)胡楊進行轉錄組測序分析,組裝獲得了86777個Unigenes,27%的Unigenes發(fā)生差異表達,且它們主要參與物質轉運、轉錄調(diào)控、細胞信號轉導、脫落酸(abscisic acid,ABA)調(diào)節(jié)以及生物合成等反應,這為以后胡楊鹽脅迫響應的分子機制研究奠定了基礎。Chen等[37]利用Solexa技術分析高耐鹽紅樹植物杯萼海桑(Sonneratiaalba)在鹽處理下(250 mmol·L-1NaCl)的轉錄組表達情況, 組裝獲得了平均長度為581 bp的30628個Unigenes,鑒定了2358個SSR標記,基因功能注釋發(fā)現(xiàn)與線粒體、碳代謝和次生代謝相關的基因參與了海桑的鹽適應過程。另外,通過與已知的273個其他物種中的鹽響應基因比對,在海桑中篩選出了1266個的耐鹽候選基因。將杯萼海桑轉錄組序列與其他同種海桑的表達系列標簽(expressed sequence tags, EST)比較,鑒定了4個具有較強自然選擇標記的基因,這為海桑耐鹽機理及遺傳多樣性研究提供了豐富的理論依據(jù)。Chen等[38]利用Solexa和DGE技術分析鹽處理下小葉楊(Populussimonii)的轉錄組表達變化,在3、6和9 d的鹽處理下分別檢測到了5453、2372和1770個差異表達基因,GO功能分析表明大多數(shù)差異表達基因與物質運輸和逆境響應相關。Huang等[39]利用Solexa測序技術研究鹽處理下半紅樹植物水黃皮(Pongamiapinnata)的轉錄組基因表達情況,獲得了平均長度為606 bp的108598個Unigenes,54596(50.3%)個Unigenes獲得注釋,鹽處理下檢測到了23815個顯著差異表達基因,這些基因的功能富集分析顯示出組織特異性,根中的差異表達基因數(shù)多于葉中。2013年,Ma等[40]又利用RNA-seq技術進行了鹽處理下(200 mmol·L-1NaCl)胡楊根、葉和毛白楊(Populustomentosa)愈傷組織的基因表達分析,分別檢測到 6727、3954和3733個差異表達基因,許多與陽離子運轉以及氧化還原酶相關的基因在胡楊中特異表達,這可能導致了二者之間的耐鹽性差異。兩個甜瓜(Cucumismelo)品種玉露和冰雪脆在300 mmol·L-1NaCl下的生理參數(shù)存在差異,陳嘉貝等[41]利用Solexa測序技術檢測它們在NaCl處理下的基因表達情況,發(fā)現(xiàn)玉露共有56個轉錄因子基因發(fā)生差異表達(22個上調(diào)表達,34個下調(diào)表達),冰雪脆有47個轉錄因子發(fā)生差異表達(17個上調(diào)表達,30個下調(diào)表達)。轉錄因子表現(xiàn)出一定的品種特異性,兩品種間也有部分重疊。趙航等[42]利用RNA-seq技術分析鹽處理下(600 mmol·L-1NaCl)鹽穗木(Halostachyscaspica)基因表達情況,并分析其相應的響應方式。研究獲得了大量的差異表達基因,通過分類匯總,得到23組與耐鹽相關的基因類群,包括檸檬酸合成酶、蛋白激酶、WRKY成員等,這與鹽穗木的耐鹽性密切相關。Joann等[43]利用RNA-seq技術研究鹽脅迫下堿蓬(Suaedaglauca)的轉錄組表達變化,組裝獲得了平均長度為763 bp的54526個Unigenes。基因差異表達分析檢測到475個Unigenes表達下調(diào),44個上調(diào)。功能分析發(fā)現(xiàn)許多基因與離子轉運、信號調(diào)節(jié)、細胞代謝以及干旱和耐鹽響應相關,此次結果鑒定了許多參與堿蓬耐鹽反應的候選基因,也為其他多肉植物研究提供了豐富的參考基因序列。高彩婷等[44]利用Solexa和DGE技術檢測300 mmol·L-1NaCl處理下VAO-9燕麥(Avenasativa)葉片在0.5、3、8和24 h下的基因表達情況,并測定了相對電導率、丙二醛和脯氨酸含量變化。結果獲得了平均長度為645 bp的65810個Unigenes?;虿町惐磉_分析檢測出0.5 h有306個基因表達上調(diào),64個下調(diào);3 h下639個上調(diào),290個下調(diào);8 h下1488個上調(diào),882個下調(diào)。通路分析發(fā)現(xiàn)差異基因大多富集在激素信號轉導途徑、磷酸肌醇途徑以及滲透調(diào)節(jié)等途徑。而且脅迫下生理指標的變化與相對應的Unigenes的表達變化一致。Ma等[45]利用RNA-Seq技術分析了旱生植物霸王(Zygophyllumxanthoxylon)在鹽和滲透脅迫下的轉錄組表達情況,組裝獲得了平均長度為680 bp的106423個Unigenes。脅迫下檢測到與Na+、K+、Ca2+、Mg2+、氮、磷酸鹽以及微量元素轉運,離子區(qū)劃及活性氧清除相關的基因顯著上調(diào)。且相較于滲透脅迫,鹽脅迫下與活性氧清除、光合電子傳遞及碳固定相關的基因明顯上調(diào),而葉綠素分解相關基因表達減少。這些結果為以后牧草類以及農(nóng)作物抗逆機制研究提供了豐富的基因資源。An等[46]利用RNA-seq技術分析鹽堿脅迫下紫花苜蓿(Medicagosativa)的轉錄組表達變化,共獲得了53853個Unigenes,處理第1天2286個基因發(fā)生差異表達,第7天2233個基因差異表達。大多數(shù)基因與過氧化物酶、光反應、類黃酮代謝、脂質代謝以及轉錄因子相關。另外,轉錄因子NAC和谷胱甘肽轉移酶基因在鹽脅迫表達下調(diào),而在鹽堿脅迫下表達上調(diào),這為苜蓿耐鹽堿機制研究提供了新的思路。250 mmol·L-1NaCl處理下,對紅麻(Hibiscuscannabinus)進行RNA測序獲得了2384個差異表達基因(1702個上調(diào)),GO富集發(fā)現(xiàn)抗氧化酶類基因均上調(diào)表達,大多數(shù)基因與氨基酸代謝以及碳水化合物代謝通路相關[47](表2)。綜上所述,通過轉錄組測序能夠發(fā)現(xiàn)轉錄因子WRKY、抗氧化酶類、蛋白激酶以及與離子轉運、類黃酮代謝、ABA信號以及碳固定相關基因在植物應對鹽脅迫過程中發(fā)揮重要功能。
表2 部分植物耐鹽分子機制的轉錄組學研究
Zhou等[48]利用454測序技術分析沙冬青(Ammopiptanthusmongolicus)根在PEG處理下的基因表達差異,組裝獲得了15173個contigs 和13883個singlets,檢測到1827個SSR分子標記,功能分析發(fā)現(xiàn)了數(shù)百個干旱脅迫相關基因,為以后沙冬青耐旱機制研究奠定基礎。Yu等[49]利用Solexa測序技術研究干旱脅迫下(0、1、2和3 d)大白菜(Brassicapekinensis)基因表達情況,通過測序比對分別有13036、12472、12774和12227個特異性標簽比對到數(shù)據(jù)庫,基因表達分析發(fā)現(xiàn)脅迫下總共有1092個基因發(fā)生顯著差異表達,包括37個轉錄因子基因、61個滲透響應基因和28個信號轉導相關基因。Chen等[50]利用RNA-seq技術研究干旱處理下2個棉花(Gossypiumhirsutum)品種(耐旱型和干旱敏感型)的基因表達情況,發(fā)現(xiàn)有13.38%~18.75%的Unigenes發(fā)生差異表達,且隨著處理時間的延長,差異表達基因數(shù)目增多?;虮磉_分析發(fā)現(xiàn)干旱處理下耐旱型棉花的一些包括光合作用在內(nèi)的細胞代謝過程被抑制。兩種棉花品種中與ABA信號、乙烯信號以及茉莉酸信號通路相關的基因表達水平存在顯著差異,說明這些信號通路可能參與棉花抗旱反應。Shi等[51]利用Solexa技術分析干旱脅迫下C3旱生灌木紅砂(Reaumuriasongarica)的轉錄組表達變化并鑒定其相應的耐旱基因,組裝獲得了平均長度為677 bp的77647個Unigenes,其中43054個能比對到已知蛋白,差異基因分析檢測到123個抗旱相關的候選基因,C4植物光合作用相關基因在紅砂中也有所表達,這為旱生植物基因功能分類以及荒漠植物適應干旱環(huán)境的遺傳基礎研究提供了豐富的基因資源。Long等[52]利用Solexa技術分析干旱處理下梭梭(Haloxylonammodendron)轉錄組基因表達情況,組裝獲得了平均長度為728 bp的79918個Unigenes,25619個在Nr數(shù)據(jù)庫獲得注釋?;虮磉_分析發(fā)現(xiàn)干旱處理下356個基因上調(diào)表達,704個下調(diào)表達。通路分析發(fā)現(xiàn)部分差異表達基因與脂肪酸、淀粉和氮代謝相關,這些代謝途徑可能參與梭梭干旱響應過程;并檢測到了35個干旱誘導的轉錄因子,包括WRKY、MYB和bZIP家族成員,這為逆境下荒漠植物基因和基因組研究提供了豐富的基因基礎。Steven等[53]利用RNA-seq技術研究干旱下兩種紅三葉草(Trifoliumpratense)的干旱響應機制,組裝獲得了45181個contigs,鑒定了3127個SSR位點,在7178個contigs中檢測到27922個稀有等位基因SNP。而且正常條件下許多衰老相關基因都在敏感型紅三葉草中高豐度表達,干旱處理下干旱敏感型紅三葉草中差異表達基因數(shù)目大約是耐旱型紅三葉草的2倍,這為紅三葉草的耐旱機制研究奠定了豐富的基因基礎。Xiao等[54]分析了不同脫水情況下牛耳草(Boeahygrometrica)的基因表達情況,發(fā)現(xiàn)1239 個基因特異性響應中度脫水,4135個基因特異性的響應重度脫水;且與植物-病原互作和激素相關的基因在不同脫水情況下均差異表達,而與mRNA檢測通路,尤其是光合作用和氮代謝相關基因只在重度脫水下差異表達,其中ABA代謝和信號、磷脂信號、胚胎發(fā)育晚期蛋白、過氧化物酶以及早期光誘導蛋白基因大多數(shù)都上調(diào)表達,這為牛耳草耐旱機制研究提供了豐富的理論依據(jù)。Zhu等[55]對PEG處理下的一年生禾本科牧草蘇丹草(Sorghumsudanense)進行了基因表達分析,在短期的PEG處理下(3 d),獲得了2329個差異表達基因,大多與碳固定和激素信號通路相關。在長期的PEG處理下(6 d),獲得了5101個差異表達基因,大多與激素信號通路相關,還檢測到17548個SSR。本課題組利用RNA-seq對-0.75 MPa 滲透脅迫處理下的梭梭干旱響應機制進行了分析,在梭梭地上部和地下部分別產(chǎn)生了平均長度為556 和535 bp的82736 和99624個 Unigenes;種類分布發(fā)現(xiàn),梭梭與葡萄同源性最高,同時鑒定到了13486個 SSRs;GO功能分類發(fā)現(xiàn)大多數(shù)基因與細胞代謝及催化活性相關;COG分類發(fā)現(xiàn)多數(shù)基因與轉錄、翻譯以及核糖體結構相關;KEGG分類發(fā)現(xiàn)多數(shù)基因與翻譯及碳水化合物相關。DGE分析發(fā)現(xiàn),與對照相比,滲透脅迫下地上部分總共有3353個差異表達基因,其中627個基因在6和24 h下均差異表達;地下部分總共有4564個差異表達基因,其中821基因在6和24 h下均差異表達。地上部與光合、寡糖、有機酸、胺、異戊二烯以及質子轉運相關的基因下調(diào)表達,而與脅迫、水分匱缺以及茉莉酸刺激響應、水楊酸代謝以及類黃酮和乙烯合成相關基因上調(diào)表達;地下部分與分生組織生長、色素積累調(diào)節(jié)以及根系發(fā)育相關基因下調(diào)表達,與水楊酸信號通路、植物螯合肽代謝、激素刺激、氧化和高滲透脅迫響應相關基因上調(diào)表達。本研究又進行了干旱響應基因篩選,發(fā)現(xiàn)與離子轉運、活性氧清除、細胞壁和細胞膜結構維持、木質素、有機滲透調(diào)節(jié)物以及激素合成相關的大多數(shù)基因均上調(diào)表達,還有一些常見的水通道蛋白、胚胎發(fā)育晚期蛋白(包括脫水素和脫落酸脅迫成熟誘導蛋白)以及熱激蛋白基因都上調(diào)表達,這為梭梭耐旱機制研究提供了豐富的分子基礎,也為植物抗旱分子機制研究以及優(yōu)良牧草和作物培育提供了大量的候選基因[56](表3)。綜上所述,通過轉錄組測序發(fā)現(xiàn)轉錄因子(WRKY、MYB和bZIP)、水通道蛋白、胚胎發(fā)育晚期蛋白、熱激蛋白、激素信號(ABA、乙烯以及茉莉酸信號)以及活性氧清除相關基因在植物應對干旱脅迫過程中發(fā)揮重要功能。
Zhao等[57]利用Solexa測序技術對生長于阿爾卑斯山具有極強耐冷性的高山離子芥(Chorisporabungeana)進行了低溫處理下的轉錄組表達分析,并與擬南芥進行比較。結果獲得了平均長度為888 bp的54870個Unigenes,基因表達分析檢測到3484個基因表達上調(diào),4571個表達下調(diào)。還發(fā)現(xiàn)了一個與離子芥和擬南芥耐寒相關的生長調(diào)節(jié)因子Karrikins。功能富集分析發(fā)現(xiàn)與低溫適應相關的基因在擬南芥中上調(diào)表達,包括轉錄因子CBF2和CBF3,而在高山離子芥中沒有CBF同源基因的差異表達,說明低溫適應不是離子芥主要的耐冷方式;但是與蛋白磷酸化和自動泛素化作用相關的基因在高山離子芥中高豐度表達,使它能夠快速,靈活的適應寒冷環(huán)境,這也導致了擬南芥和離子芥耐寒機制的不同,這些結果為植物耐低溫關鍵基因挖掘提供了重要的理論依據(jù)。Tian等[58]利用Solexa測序技術研究低溫誘導下火鶴花(Anthuriumscherzerianum)轉錄組差異基因表達情況,組裝獲得了平均長度為560 bp的44382個Unigenes,其中27396個能比對到已知蛋白??偣矙z測到了4363個差異表達基因,1、5和 24 h下分別有292、805和708個基因上調(diào)表達。KEGG通路分析發(fā)現(xiàn)1 h下差異表達基因主要富集在光合、代謝以及氧化磷酸化途徑;5 h下主要富集在氧化磷酸化途徑;24 h下主要富集在mRNA檢測、RNA轉運以及植物病原互作途徑。還發(fā)現(xiàn)了39個低溫誘導相關的轉錄因子包括AP2/ERF、Zinc finger protein、NAC、MYB和bZIP 家族成員,這些為火鶴花基因和基因組研究提供了豐富的基因資源。Xin等[59]利用RNA-seq技術研究耐寒型長白山葡萄(Vitisvinifera)的抗寒響應機制,并與歐洲葡萄進行比較。發(fā)現(xiàn)在低溫處理下,長白山葡萄差異表達基因數(shù)(1314)少于歐洲葡萄(2307),有408個基因在二者中均差異表達,在葡萄抗寒反應中起基礎防御作用。功能分類表明長白山葡萄含有較多的與代謝、信號轉導和轉錄相關的上調(diào)基因,這些基因可能在葡萄抗寒反應中發(fā)揮重要作用。Wang等[60]利用Solexa測序和DGE技術研究低溫下茶樹(Camelliasinensis)的基因表達變化,并分析其響應方式。結果獲得了平均長度為356 bp的216831個Unigenes,1770個基因發(fā)生了差異表達(1168個上調(diào)),大多與信號轉導、低溫響應、質膜穩(wěn)定性以及滲透響應等相關。通路分析表明碳水化合物代謝和鈣信號通路可能在茶樹低溫響應過程中發(fā)揮重要作用。Sperotto等[61]對處于營養(yǎng)生長期的兩種基因型水稻進行了低溫(10 ℃)誘導下的轉錄組分析,在耐低溫和低溫敏感型水稻中分別獲得了831和357個差異表達基因,并發(fā)現(xiàn)與細胞壁組成相關的基因在耐低溫植株中大量表達,使低溫下植株中有較高的纖維素積累;與脂類代謝相關的基因也在耐低溫植株中大量表達,使其積累了較多的亞油酸。且相比于敏感型,耐低溫植株具有較高的光合效率和抗氧化能力,以及更有效的乙烯、Ca2+信號通路。Chen等[62]對高溫處理下的二穗短柄草(Brachypodiumdistachyon)幼苗葉片,以及抽穗期的葉片和花序進行了RNA-seq分析,656個基因在3組樣品中均發(fā)生了差異表達,差異基因大多與光合天線蛋白、內(nèi)質網(wǎng)及剪接體相關;還發(fā)現(xiàn)1973個可變剪接。綜上所述,通過轉錄組測序能夠發(fā)現(xiàn)生長調(diào)節(jié)因子Karrikins、轉錄因子(CBF2、AP2/ERF、NAC、MYB、bZIP和CBF3)、亞油酸、纖維素、Ca2+和乙烯信號通路以及細胞壁組成相關基因在植物應對低溫脅迫過程中發(fā)揮重要功能。
表3 部分植物耐旱分子機制的轉錄組學研究
排根的形成對于植物適應磷饑餓具有重要作用,羽扇豆(Lupinusmicranthus)因為有發(fā)育良好的排根,能夠在低磷條件下正常生長。O’Rourke等[63]利用RNA-seq技術分析缺磷狀態(tài)下羽扇豆葉片、根以及排根的基因表達及其適應機理。通過測序組裝獲得了平均長度為1155 bp的125821個Unigenes,其中50734個基因具有轉錄活性。基因表達分析總共檢測到2128個差異表達基因,葉片中有1342個(987個在磷充足葉片上調(diào)),根中有904個(396個在磷充足根中上調(diào)),包括110個磷酸鹽轉運蛋白和155個轉錄因子,有12個基因在擬南芥和馬鈴薯中也存在差異表達。之后,Secco等[64]利用Solexa測序技術研究磷饑餓下羽扇豆排根的發(fā)育和調(diào)控機理,通過測序組裝,產(chǎn)生了46383個contigs,再并入到已公布的羽扇豆轉錄組數(shù)據(jù)集,最后形成高質量的65097個contigs。通過功能注釋,磷饑餓下在排根發(fā)育的不同階段發(fā)現(xiàn)許多差異表達基因,成熟的排根中有許多與膜轉運蛋白和代謝適應相關的基因表達,根尖中只有直接參與磷吸收與平衡的基因有表達,而與分生組織活性和發(fā)育進程相關的轉錄因子以及細胞分裂素和生長素基因在排根尖中有較高表達,說明轉錄因子和激素在排根發(fā)育過程中發(fā)揮重要作用,而且不同生長階段的排根在耐磷饑餓過程中功能不盡相同。邵彩虹等[65]利用RNA-seq技術對水稻根系響應氮素脅迫的分子機制進行了分析,發(fā)現(xiàn)脅迫下,根系有2270個基因發(fā)生了差異表達,其中木質素合成關鍵酶肉桂酰輔酶A還原酶基因、參與細胞伸長發(fā)育的EGase基因以及與生長素和新RNA合成相關的基因上調(diào)表達,以促進根系伸長生長來應對養(yǎng)分脅迫刺激。
通過RNA測序,可以分析植物在高鹽、干旱、低溫、高溫及營養(yǎng)匱缺等非生物脅迫下的基因表達及信號通路變化,從而篩選出一些脅迫響應基因;也可以通過比較兩個不同抗性品種在非生物脅迫前后的基因表達差異,直接鑒定出抗逆關鍵基因,探究植物適應機理,對關鍵基因分子功能進行更深一步的研究,并應用于牧草及作物的抗逆遺傳改良。
RNA-seq與DNA測序相結合可以檢測SNP、RNA編輯以及表達數(shù)量性狀位點,尤其在分析中將基因型數(shù)據(jù)和基因表達變化進行相關分析可以獲得復雜性狀的遺傳機理,例如植株高度,且表達數(shù)量性狀位點研究發(fā)現(xiàn)遺傳變異能夠影響許多基因的表達[66-67]。RNA-seq與重測序結合可以在融合基因分析中去除假陽性,還能分析拷貝數(shù)的改變[68-69]。通過將RNA-seq與DNA甲基化進行整合,對差異表達基因和甲基化模式進行關聯(lián)分析,能夠識別具有差異表達和差異甲基化的一個或多個基因[70]。RNA-seq與轉錄因子染色質免疫共沉淀測序(chromatin immunoprecipitation, ChIP)結合分析可以去除ChIP-seq中的假陽性,并能檢測出轉錄因子對其目標基因的激活或抑制效應。RNA-seq與miRNA-seq整合分析能夠闡明miRNAs對轉錄穩(wěn)態(tài)水平的調(diào)節(jié)效應。RNA-seq與蛋白質組學分析相關性不高,但二者整合分析能夠鑒定新的亞型,RNA-seq結果中沒有檢測到某個基因的表達,但在質譜分析中發(fā)現(xiàn)它的多肽,說明發(fā)生了翻譯后修飾。RNA-seq與代謝組學相結合能夠鑒定出在基因表達和代謝水平均發(fā)生了變化的信號通路。另外,還能通過一些軟件或在線網(wǎng)站將多個基因組數(shù)據(jù)進行整合分析。SNMNMF和PIMiM能夠將mRNA和 miRNA表達數(shù)據(jù)與蛋白-蛋白、DNA-蛋白、miRNA-mRNA互作網(wǎng)絡結合起來鑒定miRNA-基因調(diào)控模式[71-72]。MONA能夠將不同水平的功能基因組學數(shù)據(jù)結合起來,包括mRNA、miRNA、DNA甲基化和蛋白質組學,以檢測樣品生物學功能的改變[73]。Paintomics可以整合任何類型的基因組學數(shù)據(jù)進行通路分析[74]。3Omics可以對轉錄組、代謝組和蛋白質組進行關聯(lián)分析,研究其調(diào)控網(wǎng)絡[75]。目前需要做的就是要把轉錄組數(shù)據(jù)與其他組學相結合,從多方面更系統(tǒng)、更深入地對數(shù)據(jù)進行分析,獲得更充分、更精確的研究結果。
新一代高通量測序技術已經(jīng)廣泛應用于林草植物抗逆性研究中,并且取得了較好的成果。但是RNA-seq數(shù)據(jù)結果容易受參數(shù)設置影響,尤其是低豐度表達基因。相信隨著測序技術的不斷發(fā)展,即測序時間和成本的不斷壓縮,以及測序通量和準確度的不斷提高,用少量的mRNA就能構建cDNA文庫用于測序,并獲得較長的reads,得到優(yōu)質的且精確度較高的轉錄本;在接下來的幾年中,RNA-seq分析會越來越完善,也必定會帶來更加驚人的發(fā)現(xiàn)。此外,以單分子測序儀,單分子實時測序(single molecule real time,SMRT)以及即時DNA測序技術為主的第三代測序技術,即單分子測序逐漸呈現(xiàn),它不需要進行PCR擴增,可直接對DNA分子全長進行單獨測序。但是三代測序技術剛起步,還不夠完善、成熟,每次對單個細胞只能進行一種功能基因組的檢測,不能在檢測轉錄組的同時進行其他組學分析,且堿基錯誤率較高,費用昂貴,未能得到大面積使用。今后的發(fā)展趨勢是要不斷改進并創(chuàng)造性的綜合利用各種測序技術,將RNA-seq與三代測序技術相結合來進行糾錯,降低錯誤率,獲得豐富且精確的轉錄本。還要將轉錄組學與蛋白組學以及代謝組學等其他組學相關聯(lián),進行整合分析,更好地應用于植物抗逆關鍵基因的鑒定及抗逆分子機理研究。