王瑩 李玉娟 李敏 馬祥建 談峰 郭聰 張健
摘要:對(duì)紫葉紫薇新品系的葉片進(jìn)行RNA-Seq測序和分析,共獲取145 338條Contig,得到組裝的Unigene有53 654條,平均長度1 186.25 bp。32 667條Unigene可以匹配到蛋白質(zhì)數(shù)據(jù)庫獲得注釋信息,KEGG和GO注釋與富集分析顯示,差異DEG主要調(diào)節(jié)激素信號(hào)轉(zhuǎn)導(dǎo)、碳水化合物代謝、核糖體代謝等生物學(xué)功能。58個(gè)表達(dá)差異基因分別對(duì)比到毛果楊和擬南芥2個(gè)模式植物的數(shù)據(jù)庫,篩出與葉綠素代謝相關(guān)候選基因9個(gè),其中2個(gè)候選基因共同參與了葉綠素兼類黃酮代謝的調(diào)控,2個(gè)候選基因可能參與類黃酮代謝過程,它們分別屬于DUF547、Polyketide_cyc2、Pkinase、Calreticulin、NAD_Gly3P_dh_N、Glyco_hydro_9等13個(gè)基因家族,主要經(jīng)氧化還原反應(yīng)、物質(zhì)能量代謝、植物激素信號(hào)轉(zhuǎn)導(dǎo)等機(jī)制介入紫薇葉色調(diào)控。本研究結(jié)果為探究紫葉紫薇葉色變異的分子機(jī)制提供參考。
關(guān)鍵詞:紫葉紫薇:葉色變化:轉(zhuǎn)錄組
中圖分類號(hào):S687.9
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào): 1000-4440(2018) 05-1128-10
紫薇(Lagerstroemia indica)以其觀賞性佳、抗逆性好,受到廣泛關(guān)注。雖然紫薇屬資源在中國分布非常廣泛,但該屬植物的育種研究起步較晚,主要集中在花色,如李文芳等和劉龍昌等分別對(duì)紫薇花色素的化學(xué)性質(zhì)及結(jié)構(gòu)進(jìn)行了初步研究:花香,如徐婉等對(duì)紫薇雜交后代花香氣成分做了定性與定量分析;抗逆性,如謝憲等對(duì)紫薇抗寒性的研究。紫薇屬稀缺彩葉品種,近年來育種專家們通過引種與選育,逐步獲得了一批集觀花、觀葉性于一體的彩葉紫薇。然而,對(duì)彩葉紫薇的研究目前僅集中于傳統(tǒng)的引種與栽培技術(shù)研究,基礎(chǔ)研究方面過于薄弱,尤其關(guān)于葉片呈色機(jī)理的研究。目前僅能查閱到宋倩等和王淑安等關(guān)于彩葉紫薇的葉色變異機(jī)制的研究報(bào)道,分別闡明了彩葉紫薇葉色變化與葉片中色素含量的關(guān)系,得到了大量與類胡蘿卜素和葉綠素合成相關(guān)的候選基因。
作為非模式植物中的一員,紫薇全基因組測序尚未完成,生物信息學(xué)信息十分匱乏。隨著測序技術(shù)日益成熟,高通量測序技術(shù)可以在不涉及基因組信息的情況下,檢測到所有物種的轉(zhuǎn)錄本,為彩葉紫薇葉片呈色機(jī)制的研究提供可能。
RNA-Seq測序技術(shù)可獲得大量的遺傳信息,能詮釋植物生化水平的多樣性及植物次生代謝分支調(diào)控機(jī)理,為研究彩葉植物葉色轉(zhuǎn)化帶來新的機(jī)遇。曹樺等對(duì)鐵皮石斛葉色突變體進(jìn)行轉(zhuǎn)錄組測序分析,認(rèn)為do GLK1表達(dá)水平低和do Ftsz不表達(dá)導(dǎo)致了突變體葉綠體合成和分裂受阻。任杰對(duì)紅花槭品種艷紅葉色轉(zhuǎn)化期轉(zhuǎn)錄組解析結(jié)果表明,花青素苷代謝途徑基因差異表達(dá)對(duì)葉色變化起重要調(diào)控作用。紅掌突變體葉色呈色機(jī)制的研究結(jié)果表明,AaGLK和AaARC5分別是調(diào)控葉綠體發(fā)育和分裂的關(guān)鍵基因,AaDFR在花青素合成過程中起著關(guān)鍵作用。轉(zhuǎn)錄組測序技術(shù)已經(jīng)被廣泛應(yīng)用在非模式彩葉植物的葉片呈色機(jī)理研究中。
本項(xiàng)目組2011年開始進(jìn)行紫薇實(shí)生選種工作.2012年開始進(jìn)行雜交育種工作,通過2種方法已選育出一批觀賞性狀優(yōu)良的彩葉紫薇新品系。其中在黑鉆石系列Best Red后代實(shí)生苗中發(fā)現(xiàn)l株植株葉片在春季呈現(xiàn)更加明艷的紫紅色,初夏開始返青,上位葉紫紅色,中位葉呈紫色與綠色相交的花葉色,下位葉綠色,色葉期比親本長15~20d,通過繁育觀察,其特異性、一致性、穩(wěn)定性均達(dá)到新品種的申報(bào)要求,擬定名為紫晶l號(hào),已申報(bào)國家林業(yè)局植物新品種權(quán)。本研究利用Illumina HiSeq高通量測序平臺(tái)對(duì)紫晶1號(hào)不同葉位葉片進(jìn)行轉(zhuǎn)錄組測序分析,比較不同葉片中基因表達(dá)的差異,以期通過RNA-Seq技術(shù)獲得與葉色性狀相關(guān)的基因序列,為揭示紫葉紫薇葉色變異的分子機(jī)制和培育彩葉紫薇新品種提供參考。
1 材料與方法
1.1 試驗(yàn)材料
以江蘇沿江地區(qū)農(nóng)業(yè)科學(xué)研究所紫薇種質(zhì)圃內(nèi)新選育的紫葉紫薇紫晶l號(hào)為試驗(yàn)材料。選取轉(zhuǎn)色期葉色性狀穩(wěn)定、生長健壯、長勢一致的植株,采集上位葉(紫葉)、中位葉(花葉)和下位葉(綠葉),用錫紙包裹,在液氮中迅速冷凍。本項(xiàng)目中試驗(yàn)材料總RNA的提取與質(zhì)量檢測以及無參考基因組序列的轉(zhuǎn)錄組高通量測序分析均由北京百邁客生物科技有限公司進(jìn)行。
1.2 試驗(yàn)方法
1.2.1 總RNA的提取與質(zhì)量檢測 用總RNA提取試劑盒(QIAGEN)對(duì)不同葉位葉片進(jìn)行RNA提取,樣本的純度、濃度和完整度分別選用Nanodrop、Qu-bit 2.0、Aglient 2100分析。后續(xù)進(jìn)行合格RNA的cDNA文庫構(gòu)建和RNA-Seq測序。
1.2.2 cDNA文庫構(gòu)建和轉(zhuǎn)錄組測序檢測后合格的樣品,以mRNA為模板,構(gòu)建cDNA雙鏈,利用AMPure XP beads試劑盒依次進(jìn)行純化、末端修復(fù)和片段大小選擇,通過PCR富集得到紫薇cDNA文庫。cDNA文庫的質(zhì)量用Agilent 2100檢測,再通過Illumina Hi-Seq平臺(tái)完成RNA-Seq測序分析。
1.2.3 De novo組裝及質(zhì)量控制 獲得的原始數(shù)據(jù)(Raw reads)經(jīng)過濾得到Clean reads,將其用Trinity拼接,得到Contigs,利用De Bruijn圖的方法和測序Read信息,在片段集合中讀取轉(zhuǎn)錄本序列,最長Contig即為最終轉(zhuǎn)錄本的Unigene。
1.2.4 Unigene功能注釋使用BLAST軟件將DEGs序列與NR、Swiss-Prot、GO、COG、KOG、eggNOG4.5、KEGG數(shù)據(jù)庫分別比對(duì),獲得相關(guān)注釋信息。
2 結(jié)果與分析
2.1 轉(zhuǎn)錄組測序與de novo組裝
利用Illumina Hi-Seq對(duì)3個(gè)不同葉位葉片(每個(gè)葉位3個(gè)重復(fù))共計(jì)9個(gè)樣品進(jìn)行轉(zhuǎn)錄組測序(表1),共獲得68.56Gb(過濾后序列),各樣品過濾后的序列量均達(dá)到6.87Gb以上;Q30堿基百分比在91%以上,G、C含量在49%以上,可以用于下一步的De novo組裝。利用Trinity軟件將所有的短序列拼接,獲得145 338條Contig,進(jìn)一步組裝得到53 654條Unigene,總長度63646992 bp,平均長度為l 186.25bp,其中長度在200—300 bp的Unigene所占的比例最高,Unigene的N50為2229 bp,組裝完整性較高(圖1),獲得的Mapped Read可用于后續(xù)分析。
2.2 差異基因表達(dá)量分析
將FDR小于0.01,差異倍數(shù)FC≥4作為篩選標(biāo)準(zhǔn),對(duì)紫晶l號(hào)3個(gè)不同葉位葉片中差異表達(dá)基因進(jìn)行比對(duì),共篩選得到58條差異表達(dá)基因(圖2、表2):以綠葉為對(duì)照,上位葉檢測出的差異表達(dá)基因數(shù)目最多,有4792個(gè)轉(zhuǎn)錄因子的轉(zhuǎn)錄水平發(fā)生了改變,其中上調(diào)表達(dá)的轉(zhuǎn)錄因子基因高達(dá)4017個(gè),上調(diào)倍數(shù)在4.00~1573.76,最大上調(diào)基因ID為c49503.graph_c0;在下調(diào)基因中,下位葉與中位葉對(duì)比,差異DEG最少,其次為上位葉與下位葉對(duì)比得到的差異DEG數(shù),其中最大下調(diào)表達(dá)基因ID為c41691.graph_c0,下調(diào)倍數(shù)達(dá)1 418.35。
2.3 差異表達(dá)基因功能注釋
通過選擇BLAST參數(shù)(E-value≤le-5)和HM-MER參數(shù)(E-value≤le-10),將全部Unigene序列與COG、GO等8個(gè)數(shù)據(jù)庫比對(duì)(表3、表4),最后得到32667個(gè)有注釋信息的基因,其中長度在1000 bp以上的基因注釋效率為53.05%,而未得到注釋的Unigene為20 987條(39.12%)。
2.4 差異表達(dá)基因GO分類和功能富集
紫晶l號(hào)差異表達(dá)基因在GO數(shù)據(jù)庫進(jìn)行比對(duì),有18 718條Unigene在GO數(shù)據(jù)庫中得到相關(guān)注釋,其中每2個(gè)樣品相比得到的差異基因在GO數(shù)據(jù)庫中注釋率最多達(dá)56.88%(圖3),注釋的基因參與生物學(xué)過程、細(xì)胞組分和分子功能調(diào)控(表5),功能組涉及到53個(gè)。生物學(xué)過程的注釋顯示,Uni-gene表達(dá)差異顯著順序依次為代謝過程,細(xì)胞過程和單組織過程;在細(xì)胞成分分類信息中,細(xì)胞部分和細(xì)胞顯著富集:在分子功能分類中,富集程度最高的是催化活性,說明紫晶l號(hào)轉(zhuǎn)色時(shí)期葉片中催化活性受影響較大。
2.5 差異表達(dá)基因KEGG注釋和富集分析
有7544個(gè)(23.10%) Unigene在KEGG數(shù)據(jù)庫得到注釋,涉及了119個(gè)KEGG代謝通路,其中綠葉與紫葉對(duì)比獲得注釋的919個(gè)差異表達(dá)基因( DEG)可以被分配到118個(gè)KEGG通路(表6),綠葉對(duì)比花葉獲得注釋的187條DEG可以被分配到88個(gè)KEGG通路,紫葉對(duì)比花葉獲得注釋的599條DEG可以被分配到113個(gè)KEGG通路,排名前10顯著性富集差異基因主要涉及到細(xì)胞途徑、遺傳信號(hào)響應(yīng)、環(huán)境信號(hào)響應(yīng)和新陳代謝4個(gè)方面,其中最大的分類是新陳代謝,包括碳水化合物、氨基酸、多糖生物合成以及能量、次生物質(zhì)等;環(huán)境信號(hào)響應(yīng)類最小。同時(shí),KEGG的注釋結(jié)果也顯示,差異基因主要參與了次生物質(zhì)代謝、植物激素信號(hào)轉(zhuǎn)導(dǎo)、核糖體代謝和碳水化合物代謝等通路。紫晶l號(hào)在轉(zhuǎn)色期葉片類黃酮生物合成途徑的KEGG通路注釋結(jié)果顯示,花青素合成途徑中有9個(gè)基因表達(dá)上調(diào),3個(gè)基因下調(diào),肉桂酰輔酶a是花色苷合成關(guān)鍵酶,相應(yīng)的基因ID為c37587.graph_c0、c50617.graph_c0和c54586.graph_c0(K05278+K08695+K00660).
2.6 差異基因注釋結(jié)果分析
葉色轉(zhuǎn)化期間,log2FC達(dá)8倍以上差異表達(dá)的基因如表7所示,高水平差異表達(dá)的注釋基因中,以綠葉為對(duì)照,紫葉對(duì)比花葉的短鏈脫氫酶還原酶c27313.graph_c0基因表達(dá)下調(diào)水平顯著;以紫葉為對(duì)照,c52058.graph_c0(表皮原因子基因)也顯示出相似的下調(diào)趨勢。在差異表達(dá)DEG中,除c47073.graph_c0、c27117.graph_c0為假定的脂質(zhì)轉(zhuǎn)移蛋白基因,其他的基因功能主要涉及到基礎(chǔ)代謝、逆境響應(yīng)因子、性別決定等幾個(gè)方面。
2.7 葉色相關(guān)轉(zhuǎn)錄因子分析
在轉(zhuǎn)色期間,3種不同葉位篩選到差異基因58個(gè)。與模式植物毛果楊和擬南芥的GO和KEGG蛋白數(shù)據(jù)庫作比對(duì)(表8),篩出與葉綠素代謝相關(guān)候選基因9個(gè),其中2個(gè)候選基因共同參與了葉綠素兼類黃酮代謝的調(diào)控,2個(gè)候選基因可能參與類黃酮代謝過程,分別屬于DUF547、Polyketide_cyc2、Pki-nase、Calreticulin、NAD Gly3P dh_N、Glyco hydro 9等13個(gè)基因家族,主要經(jīng)氧化還原反應(yīng)、物質(zhì)能量代謝、植物激素信號(hào)轉(zhuǎn)導(dǎo)等機(jī)制介入紫薇葉色調(diào)控。在與葉色相關(guān)差異表達(dá)候選基因中,有11條Uni-gene與卟啉環(huán)代謝和葉綠素合成相關(guān)基因表現(xiàn)出同源性:而c56217.graph_c0基因在葉綠素降解通路中發(fā)揮了一定作用;在花青素苷代謝途徑中,尿苷二磷酸葡萄糖基轉(zhuǎn)移酶、富含亮氨酸重復(fù)序列受體蛋白激酶、松脂醇還原酶I、聚半乳糖醛酸酶Ⅱ等均參與了對(duì)花青苷代謝途徑的調(diào)控。
3 討論
3.1 基于RNA-Seq技術(shù)的植物葉色基因的發(fā)掘
新一代高通量測序技術(shù)是基于邊合成邊測序和可逆終止子的原理,雙端測序的使用,不僅可以提高測序的深度,還能提高從頭拼接的效率和準(zhǔn)確性。一大批彩葉植物包括紫背天葵(Gynura bi-color)、銀杏(Ginkgo biloba)、花葉矢竹(Pseudosasa japonica f.Akebonosuji)等的轉(zhuǎn)錄組已經(jīng)被測序,為研究彩葉植物色素合成途徑及葉色轉(zhuǎn)化帶來新的機(jī)遇。本項(xiàng)目組對(duì)紫晶l號(hào)3種葉色葉片作了轉(zhuǎn)錄組測序分析和功能基因預(yù)測,獲得145338條Contig,進(jìn)一步組裝得到53654條Uni-gene,Q30均大于91%,被標(biāo)記的序列數(shù)比例(被標(biāo)記的序列數(shù)/過濾后的序列數(shù))均在72%以上,Uni-gene的N50為2229 bp,測序數(shù)據(jù)的輸出和裝配質(zhì)量能夠滿足轉(zhuǎn)錄分析的基本要求,為詮釋紫晶l號(hào)葉片色素代謝分支調(diào)控機(jī)制,為色素合成關(guān)鍵基因的挖掘提供重要參考。
3.2 差異基因表達(dá)與功能注釋分析
楊海蕓等的研究結(jié)果表明,同一轉(zhuǎn)錄組Uni-genes的序列越長,其匹配率越高,本研究中長度在1000 bp以上的基因注釋率為53.05%,而在300—1000 bp的Unigenes的注釋率只有29.50%,結(jié)果與前者相似。在生物學(xué)過程分類中,表達(dá)差異最大的是代謝過程,這與吳全金、郭小鷗的研究結(jié)果相似,表明紫晶l號(hào)葉片中代謝相關(guān)基因的表達(dá)存在顯著差異,代謝產(chǎn)物的差異可能導(dǎo)致生物學(xué)功能與形態(tài)的差異。羅成科等在相關(guān)研究中指出,DUF是一大組未表明功能的蛋白家族,一些植物特有的DUF蛋白家族在調(diào)控植物生長發(fā)育、防御病蟲害和非生物脅迫應(yīng)答反應(yīng)等方面起著重要作用。Kodama等的研究結(jié)果顯示,擬南芥葉綠體運(yùn)動(dòng)響應(yīng)是DUF家族中WEB1和PMI22個(gè)基因互相作用調(diào)控的,推測c42391.graph_c0可能與其作用過程相似。韓曉斌等的研究結(jié)果表明,阻遏或敲除Pkinase家族中的Os EDR1基因,突變體植株均會(huì)出現(xiàn)斑葉,推測與Os EDR1同源的紫薇c45897.graph_c0轉(zhuǎn)錄因子影響了葉綠素的表達(dá),進(jìn)而使葉色發(fā)生變化。在毛果楊、擬南芥、水稻等研究結(jié)果中表明,HMA基因家族是植物吸收、轉(zhuǎn)運(yùn)Zn、Cu、Cd等重金屬的重要組分,擬南芥HMA1功能缺失會(huì)導(dǎo)致葉綠體中Cu含量下降和Zn含量上升,進(jìn)而影響葉綠素的合成。以綠葉為對(duì)照,紫葉中屬于HMA家族的c51707.graph—c0表達(dá)量顯著上調(diào),進(jìn)一步推測c51707.graph_c0是控制紫薇葉色表達(dá)的候選基因?;ㄉ兆鳛轭慄S酮物質(zhì)的一類,是植物呈現(xiàn)紅、橙、粉、紫、藍(lán)等顏色的主要色素,而葡萄糖醛酸轉(zhuǎn)移酶家族(UDPGT)在花色苷合成途徑起到重要作用。Kotepong等研究馬六甲蒲桃果皮發(fā)現(xiàn),UFGT表達(dá)強(qiáng)度隨著紅巴梨果實(shí)的成熟而降低,招雪晴等研究指出,UFGT家族的PgUFGT基因在紅寶石和水晶甜石榴品種的發(fā)育期內(nèi)具有不同的表達(dá)模式,這與本研究的結(jié)果相似,推測c47870.graph_c0可能參與了紫薇葉片中類黃酮物質(zhì)的3-0位置的糖基化,與之相似的同源基因MDP0000543445、At UGT78D2等已在紅肉蘋果、黃果草莓等研究中被找到,并已證實(shí)其與花青素的代謝活動(dòng)密切相關(guān)。孫海燕等在三色堇花色形成機(jī)制的研究中,克隆出屬于SDR(短鏈脫氫/還原酶)超基因蛋白家族的Vw DFR基因,推測該基因可能是花青素合成結(jié)構(gòu)基因。本研究中c29868.graph_c0屬于SDR基因家族,在類黃酮的生物合成過程中起到了正向調(diào)控作用,在紫葉中表達(dá)水平最高,說明c29868.graph_c0是紫晶1號(hào)葉片色素合成的關(guān)鍵候選基因。
本研究利用高通量測序技術(shù)對(duì)紫葉紫薇新品系紫晶l號(hào)轉(zhuǎn)色期葉片進(jìn)行了轉(zhuǎn)錄組測序,共獲得145338條Contig,進(jìn)一步組裝得到53 654條Uni-gene。KEGG和GO注釋與富集分析顯示,差異DEG主要調(diào)節(jié)激素信號(hào)轉(zhuǎn)導(dǎo)、碳水化合物代謝、核糖體代謝等生物學(xué)功能。將最終獲得的58條差異表達(dá)Unigene對(duì)比到毛果楊和擬南芥2個(gè)模式植物的數(shù)據(jù)庫,篩出與葉綠素代謝相關(guān)候選基因9條,有2條候選基因共同參與了葉綠素兼類黃酮代謝的調(diào)控,2條候選基因可能參與類黃酮代謝過程,它們分別屬于DUF547、Polyketide_cyc2、Pkinase等13個(gè)基因家族,主要經(jīng)氧化還原反應(yīng)、物質(zhì)能量代謝、植物激素信號(hào)轉(zhuǎn)導(dǎo)等機(jī)制介入紫薇葉色調(diào)控。