陶彥彤, 馬 娟, 張穎娟,3
(1.內(nèi)蒙古師范大學(xué) 生命科學(xué)與技術(shù)學(xué)院,內(nèi)蒙古 呼和浩特 010022;2.哈爾濱市香坊中學(xué),黑龍江 哈爾濱 150036; 3.內(nèi)蒙古師范大學(xué) 學(xué)報編輯部,內(nèi)蒙古 呼和浩特 010022)
西鄂爾多斯是荒漠化草原到草原化荒漠的過渡地區(qū),年降水量稀少,蒸發(fā)量遠大于降水量。該地區(qū)是亞洲中部荒漠區(qū)古老特有植物分布最集中、最豐富的區(qū)域,分布著多種國家級重點保護珍稀瀕危植物,有第三紀孑遺植物“避難所”之稱[1-3]。綿刺(Potaniniamongolica)為荒漠強旱生小灌木,是薔薇科(Rosaceae)綿刺屬(Potaninia)的古地中海孑遺植物,分布于西鄂爾多斯和阿拉善荒漠[4]。綿刺對干旱氣候有特殊適應(yīng)性,若生長季降水稀少,則葉、花、果實全部脫落,并以假死方式進入休眠; 若秋季有降水補給,綿刺則迅速吸水,進行二次生長繁殖[4]。目前對于綿刺的研究多集中于分類、形態(tài)、生理生態(tài)[5-8]等方面,對其分子生物學(xué)方面的研究較少。研究人員利用AFLP分子標(biāo)記法對8個綿刺種群遺傳結(jié)構(gòu)進行分析,發(fā)現(xiàn)隨機遺傳漂變不是影響綿刺種群遺傳多樣性的主要過程[9-10]; 采用兼并PCR(polymerase chain reaction)和RACE(rapid amplification of cDNA ends)技術(shù)分離了綿刺肌動蛋白(actin)基因cDNA序列,驗證了PmActin基因可作為分子內(nèi)標(biāo)的可靠性[11]。
隨著高通量測序技術(shù)的快速發(fā)展,轉(zhuǎn)錄組測序因能夠快速有效的從整體水平探究基因功能與基因結(jié)構(gòu),在生物學(xué)各個領(lǐng)域得到廣泛應(yīng)用,已成為研究基因差異表達的重要手段[12]。2017年Khan等[13]利用轉(zhuǎn)錄組測序技術(shù)對自然條件下及干旱脅迫下的耐旱型蠶豆Hosa wi-2進行了轉(zhuǎn)錄組分析,獲得了Hosa wi-2相關(guān)抗旱基因。段娜[14]通過對干旱脅迫下的唐古特白刺葉片進行轉(zhuǎn)錄組學(xué)分析,發(fā)現(xiàn)干旱脅迫下白刺差異表達基因的主要相關(guān)酶。
本研究利用轉(zhuǎn)錄組Illumina HiSeq X-ten測序平臺,對不同時期綿刺進行轉(zhuǎn)錄組測序,篩選出生長期與休眠期耐旱相關(guān)的差異表達的功能基因和調(diào)控基因,并對基因的相關(guān)信息進行了分析,旨在為西鄂爾多斯地區(qū)珍稀瀕危植物的耐旱研究提供依據(jù)。
綿刺樣品取自西鄂爾多斯自然保護區(qū)內(nèi)(106°45′24″E,39°56′15″N),本區(qū)地處亞非荒漠東部邊緣,生態(tài)環(huán)境脆弱。年均溫8 ℃,極端最高溫度40.2 ℃,地面極端最高氣溫可達68.5 ℃,≥10 ℃的活動積溫3 200 ℃左右; 年降水量為190~250 mm,年蒸發(fā)量約3 000 mm,濕潤系數(shù)小于0.13。氣候干旱少雨,風(fēng)大沙多,春遲秋旱,為中溫帶大陸性氣候。
對自然生境下具有休眠復(fù)蘇特性的珍稀植物綿刺,隨機選取長勢一致的成年植株90株,設(shè)計3個階段植物的處理,每10株作為一個處理,每個處理重復(fù)3次。90株分為三個階段并標(biāo)記, (1) 生長期(Z): 綿刺正常生長的時期; (2) 休眠期(X): 綿刺植株下部葉片發(fā)黃達到50%; (3) 復(fù)蘇期(F): 綿刺第二次生長。將每個階段處理的植株選取頂端嫩莖上的葉片,用鋁箔包好,迅速放入布袋中用液氮冷凍保存帶回實驗室,隨后送到北京百邁克公司進行RNA提取以及轉(zhuǎn)錄組測序。
1.2.1 綿刺總RNA提取、文庫構(gòu)建及轉(zhuǎn)錄組測序 提取樣品總RNA并檢測合格后用帶有Oligo(dT)的磁珠富集真核生物mRNA,加入Fragmentation Buffer將mRNA進行隨機打斷; 以被打斷的mRNA為模板,用六堿基隨機引物(random hexamers)合成第一條cDNA鏈,然后加入緩沖液、dNTPs、RNase H和DNA polymerase I合成第二條cDNA鏈,利用AMPure XP beads純化cDNA; 純化得到的雙鏈cDNA再進行末端修復(fù)、加A尾并連接測序接頭,使用AMPure XP beads進行片段大小選擇,最后通過PCR富集得到cDNA文庫。北京百邁克公司使用Illumina HiSeq X-ten高通量測序平臺完成測序。
1.2.2 Unigene功能注釋與差異表達基因分析 使用BLAST軟件將Unigene序列與NR、GO、Swiss-Prot、COG、KOG、eggNOG4.5、KEGG的數(shù)據(jù)庫進行比對,使用KOBAS2.0技術(shù)鑒定Unigene在KEGG中的KEGG Orthology結(jié)果,使用HMMER軟件與Pfam數(shù)據(jù)庫比對,獲得Unigene的注釋信息。采用Benjamini-Hochberg法篩選差異表達基因,并進行差異基因的GO和KEGG富集分析。
綿刺生長期(Z)、休眠期(X)和復(fù)蘇期(F)轉(zhuǎn)錄組測序共得到75.63 Gb Clean Data,每個樣品Clean Data質(zhì)量值≥30的堿基百分比均不小于92.84%。利用Trinity軟件經(jīng)對過de novo組裝后,Clean reads被組裝得到435 276條Transcript(轉(zhuǎn)錄本)和141 608條Unigene,Transcript和Unigene平均長度分別是1 974.70 bp和702.73 bp; Transcript與Unigene的N50分別為3 269和1 103,由表1可以看出Unigene分布變化隨著長度區(qū)間的增加而減少,組裝完整性較高。
表1 組裝結(jié)果統(tǒng)計Tab.1 Assemble result table
選擇BLAST參數(shù)E-value≤10-5和HMMER參數(shù)E-value≤10-10,最終獲得87 707個有注釋信息的Unigene(表2)。比對到eggNOG和NR數(shù)據(jù)庫里的Unigene數(shù)較多,分別占All Unigene的90.92%和89.54%,其他依次為Pfam、KOG、Swissprot、GO、KEGG、COG數(shù)據(jù)庫,分別占All Unigene的59.95%、59.21%、55.63%、41.16%、37.97%、29.36%,其中每個Unigene可能被比對到多個數(shù)據(jù)庫中。
表2 Unigene注釋結(jié)果Tab.2 Results of Unigene annotations
綿刺三個時期兩兩之間的差異表達基因篩選結(jié)果見表3。生長期與休眠期差異表達基因數(shù)共999條,其中上調(diào)基因數(shù)635條,下調(diào)基因數(shù)364條; 生長期與復(fù)蘇期差異表達基因數(shù)共2 596條,其中上調(diào)基因數(shù)1 631條,下調(diào)基因數(shù)965條; 休眠期與復(fù)蘇期的差異表達基因數(shù)共476條,上調(diào)基因數(shù)204條,下調(diào)基因數(shù)272條。生長期與復(fù)蘇期差異基因表達的數(shù)最多,說明采用的試驗樣品時間的間段增加,參與基因調(diào)控的數(shù)目增多。
表3 差異表達基因數(shù)目統(tǒng)計結(jié)果Tab.3 The number of DEGs statistical result
基于基因在不同樣品中的表達量,對識別到的差異表達基因進行功能注釋,各差異表達基因注釋的統(tǒng)計結(jié)果見表4。注釋到各功能數(shù)據(jù)庫數(shù)量最多的是生長期與復(fù)蘇期,為2 475條; 其次是生長期與休眠期的938條; 最少的是休眠期與復(fù)蘇期的451條。不同差異表達基因的各功能數(shù)據(jù)庫注釋到的基因數(shù)目,與總數(shù)變化呈一致性。
表4 注釋的差異表達基因數(shù)量Tab.4 The number of DEGs annotation
綿刺GO功能富集在生長期與休眠期有340條樣本基因注釋到“生物學(xué)過程”,主要聚集在代謝過程(metabolic process)、細胞過程(cellular process)和單生物過程(single-organism process)等(圖略)。注釋到“分子功能”中有356條差異表達基因被富集,主要富集條數(shù)最多的為催化活性(catalytic activity)和物質(zhì)結(jié)合(binding)等。注釋到“細胞組分”中共246條,注釋到的差異表達基因數(shù)最多的條目為細胞(cell)、細胞成分(cell part)和細胞器(organelle)等,這些富集差異表達基因數(shù)最多的條目主要與細胞、細胞成分有關(guān),表現(xiàn)在干旱脅迫下,細胞及細胞成分的性狀發(fā)生變化。在綿刺生長期與復(fù)蘇期得到注釋的共有1 224條。其中綿刺基因注釋到“生物學(xué)過程”中共有989條,數(shù)量多于生長期和休眠期間的注釋,主要富集差異基因較多的仍是代謝過程、細胞過程和單生物過程等。在“分子功能”中同樣富集條數(shù)最多的為催化活性和物質(zhì)結(jié)合等,這與植物的耐旱功能緊密相關(guān)?!凹毎M分”中共677條差異基因被富集,細胞、細胞成分和細胞器等得到大量聚集。休眠期與復(fù)蘇期有200條注釋到GO數(shù)據(jù)庫。其中綿刺基因富集到“生物學(xué)過程”中共有154條,富集較多的過程同生長期與休眠期相同,但數(shù)量較小?!胺肿庸δ堋敝杏?67條差異表達基因被富集,富集條數(shù)最多的同生長期與休眠期一致?!凹毎M分”中共105條差異表達基因被富集,注釋到基因數(shù)較多的同生長期與休眠期相符。這些功能表達說明在綿刺耐旱性中起重要作用。
綿刺生長期與休眠期有316條和KEGG富集通路相關(guān)的差異表達基因,被注釋到通路中的有88個,其中富集顯著性可靠且參考價值較大包括真核生物核糖體起源(ribosome biogenesis ineukaryotes)、葡萄糖醛酸轉(zhuǎn)換(pentose andglucuronate interconversions)、光合作用(photosynthesis)等。生長期與復(fù)蘇期有1 162條和此通路相關(guān)的差異表達基因,被注釋到通路中的有114個,其中富集顯著性可靠且參考價值較大為光合作用、光合作用-天線蛋(photosynthesis-antenna proteins)等。休眠期與復(fù)蘇期有225條和此通路相關(guān)的差異表達基因有78個,其中光合作用-天線蛋白、精氨酸與脯氨酸代謝(arginine and proline metabolism)等富集顯著性可靠且參考價值較大,其他通路的富集顯著可靠性較低。
隨著干旱脅迫的逐漸增加,綿刺在生長期與休眠期的差異表達基因中,耐旱相關(guān)的基因有36條Unigenes預(yù)測為功能基因(表5),主要有滲透調(diào)節(jié)物質(zhì)、內(nèi)源激素類物質(zhì)、活性氧清除類物質(zhì)、果膠酶和保護生物大分子物質(zhì)等相關(guān)的基因。綿刺在水分脅迫下,植物體內(nèi)相關(guān)的基因均會發(fā)揮重要的調(diào)節(jié)作用,篩選出6條差異表達基因與植物激素相關(guān),其中生長素(auxin)5條占比最多,4條上調(diào)表達基因,1條為下調(diào)表達。
表5 干旱誘導(dǎo)與功能相關(guān)的差異表達基因的表達情況Tab.5 Expression of differentially expressed genes related to drought and function
續(xù)表5 干旱誘導(dǎo)與功能相關(guān)的差異表達基因的表達情況Continude Tab.5 Expression of differentially expressed genes related to drought and function
果膠酶分為果膠酯酶(pectinesterase,PME)和多聚半乳糖醛酸酶(polygalacturonase,PG)兩種,注釋到的差異表達基因中篩選到10個基因與果膠酶相關(guān),干旱脅迫下植物體內(nèi)的果膠酯酶有6條均上調(diào)表達。滲透調(diào)節(jié)類有兩類相關(guān)的差異基因,脯氨酸(proline)和海藻糖(trehalose)類均有1個上調(diào)表達的差異基因,有11個差異表達基因與活性氧清除類物質(zhì)相關(guān),其中與過氧化物酶(peroxidase,POD)相關(guān)的基因有5條,均呈上調(diào)表達。與谷胱甘肽(glutathione)相關(guān)的基因有3條,2條為上調(diào)表達1條下調(diào)表達。與抗壞血酸氧化酶(ascorbic acid oxidase,AO)相關(guān)的3條基因均呈上調(diào)表達。經(jīng)篩選共有6條保護生物大分子物質(zhì),其中與LEA蛋白相關(guān)的基因有3條,2條上調(diào)表達,1條下調(diào)表達。與水通道蛋白(aquaporin)相關(guān)的基因有3條,均呈上調(diào)表達。
干旱脅迫的環(huán)境條件會在植物體內(nèi)誘導(dǎo)一系列轉(zhuǎn)錄因子基因,干旱脅迫信號轉(zhuǎn)導(dǎo)過程中,轉(zhuǎn)錄因子通過啟動多條途徑從多個層面調(diào)節(jié)、降低脅迫對植物的傷害[15],對植物在逆境下的生長發(fā)育起到重要作用。綿刺生長期與休眠期得到注釋的差異表達基因中,耐旱相關(guān)的轉(zhuǎn)錄因子共8條,主要來自AP2/EREBP、NAC、bHLH、MYB/MYC四個轉(zhuǎn)錄因子家族的轉(zhuǎn)錄因子。篩選的每個轉(zhuǎn)錄因子注釋的信息和調(diào)控表達見表6。屬于NAC的基因共2條,基因c66600.graph_c2和c58089.graph_c0均為下調(diào)表達。屬于AP2/EREBP的基因共有4條,c57840.graph_c0、c40137.graph_c0和c69583.graph_c0基因上調(diào)表達,AP2/EREBP家族中ERF類轉(zhuǎn)錄因子c65442.graph_c0表現(xiàn)出下調(diào)表達,同是下調(diào)表達基因的有bHLH的基因c68718.graph_c0。只有一條屬于MYB/MYC的基因c41021.graph_c0為上調(diào)表達。
表6 干旱誘導(dǎo)與調(diào)控相關(guān)的差異表達基因的表達情況Tab.6 Expression of differentially expressed genes related to drought induction and regulation
轉(zhuǎn)錄組測序適用于缺乏基因信息的研究對象,該技術(shù)可以對在單核苷酸水平上檢測指定材料的整體轉(zhuǎn)錄活動,且不需要參考基因組來獲得有用的轉(zhuǎn)錄信息[16]。本研究通過高通量測序?qū)ψ匀簧诚碌木d刺在轉(zhuǎn)錄組水平分析其耐旱響應(yīng)。在對綿刺不同時期的差異表達基因(DEG)的研究中,三組的差異表達基因的數(shù)目共有4 071條,而成功被注釋到的差異表達基因數(shù)量為3 864條這一結(jié)果與其他植物轉(zhuǎn)錄組測序結(jié)果一致[17]。由于物種基因信息不足,不是所有Unigenne都能得到注釋。但基于被檢測出來的DEG,可篩選出多條富集通路和過程,從而為研究綿刺對干旱脅迫的響應(yīng)機制提供理論基礎(chǔ)。在DEG的KEGG富集分析中,核糖體生物合成“ribosome biogenesis in eukaryotes”在生長期與休眠期的比較中富集顯著性最高,生長期與復(fù)蘇期中“光合作用”的富集顯著性最高,而休眠期與復(fù)蘇期的“光合作用-天線蛋白”富集顯著最高。說明隨著環(huán)境的變化,激發(fā)了各通路的相關(guān)基因的表達,而富集顯著性較高的基因,就可能在綿刺適應(yīng)脅迫過程中起重要的作用。
由于2017年綿刺復(fù)蘇期返青較晚(10月上旬),平均氣溫接近10 ℃,返青前有降雪,影響綿刺葉片的生長,差異表達基因篩選只比較了生長期與休眠期,共有37條Unigenes預(yù)測為抗旱相關(guān)功能基因?;钚匝跚宄愇镔|(zhì)在植物中廣泛存在,綿刺在逆境脅迫加劇的環(huán)境下,呈差異表達基因只發(fā)現(xiàn)POD、GSH和AO,并且三種酶的基因表達量變化大部分呈現(xiàn)上調(diào)表達。與過氧化物酶(POD)相關(guān)的基因含有5條,均是上調(diào)表達。這與段麗[14]對白刺干旱脅迫下POD相關(guān)差異基因表達呈上調(diào)的研究結(jié)果相一致; 研究發(fā)現(xiàn)與GSH相關(guān)的基因有3條,其中1條下調(diào)表達2條上調(diào)表達,而與AO基因相關(guān)的有3條,均是上調(diào)表達,說明在休眠期干旱脅迫加劇AO相關(guān)基因表達量的增加使綿刺耐旱性增強。
滲透調(diào)節(jié)物質(zhì)中與脯氨酸和海藻糖相關(guān)的差異基因各有一條,均呈上調(diào)表達。研究表明,脯氨酸的過表達可增強植物的耐旱能力。杜俊瑞[18]對白沙蒿相關(guān)抗旱基因研究發(fā)現(xiàn),控制白沙蒿脯氨酸合成的基因表現(xiàn)為上調(diào)表達,與本文研究結(jié)果一致,說明脯氨酸相關(guān)基因的上調(diào)表達有助于綿刺的耐旱性。在綿刺中參與海藻糖相關(guān)的差異表達基因僅有一條上調(diào)表達與多數(shù)研究相一致。黃曉鈺[19]對干旱脅迫下的檸條錦雞兒進行轉(zhuǎn)錄組分析結(jié)果表明,海藻糖合成途徑相關(guān)酶基因的表達量出現(xiàn)不同程度地上調(diào),表明海藻糖合成途徑在檸條錦雞兒應(yīng)對干旱脅迫時發(fā)揮重要作用。
姜揚[20]對長春在逆脅迫下的變化研究發(fā)現(xiàn),干旱脅迫使PME基因表達上調(diào),有助于保持細胞水分,增強抗逆能力; 在逆脅迫處理下番茄的PG基因表達顯著增加[21]。本研究結(jié)果也表明,隨干旱脅迫加劇,綿刺體內(nèi)的果膠酯酶有6條均上調(diào)表達,PG相關(guān)的差異表達基因有4條均是上調(diào)表達。綿刺休眠期葉片脫落,PG可能起到了一定的作用,PME和PG可能增強綿刺耐旱能力。
LEA蛋白是一類種子胚胎發(fā)育后期富集的脫水保護蛋白。Veeranagamallaiah等[22]通過SDS-PAGE研究發(fā)現(xiàn),隨LEA蛋白的表達增加來減弱水分脅迫導(dǎo)致的蛋白質(zhì)凝聚現(xiàn)象,表明LEA蛋白可間接增強植物抗逆性。Zhang等[23]將沙漠牧草隱子草(Cleistgenessongorica)中的脫水蛋白CsLEA轉(zhuǎn)化到紫花苜蓿(MedicagosativaL.),發(fā)現(xiàn)CsLEA在紫花苜蓿中的過表達顯著提高了轉(zhuǎn)基因植株的抗旱性和耐鹽性。本研究也發(fā)現(xiàn),綿刺在干旱脅迫加劇的休眠期,2個LEA蛋白基因呈上調(diào)表達,僅有一個是下調(diào)表達,上調(diào)的LEA蛋白基因,可能對綿刺適應(yīng)干旱脅迫起較重要的調(diào)控作用。
AQP是一種跨膜輸水蛋白,能增加生物膜對水分的透性,調(diào)節(jié)細胞滲透平衡,脅迫條件下調(diào)節(jié)水分在植物內(nèi)長距離或短距離運輸[24]。其在逆脅迫下的響應(yīng)表達不同,且每個AQP也有單獨的意義。韋興炎[25]對箭舌豌豆的水通道蛋白相關(guān)基因進行研究發(fā)現(xiàn),在根、莖、葉組織中有8個VsAQP基因在干旱處理過程中呈現(xiàn)出不同的表達模式,反映了它們在箭筈豌豆響應(yīng)干旱脅迫中可能具備不同的功能。本研究結(jié)果發(fā)現(xiàn),綿刺在休眠期綿刺有3條與AQP有關(guān)的基因呈上調(diào)表達,具體如何參加綿刺耐旱調(diào)控需要進一步研究。
干旱脅迫信號轉(zhuǎn)導(dǎo)過程中,轉(zhuǎn)錄因子在水分脅迫中起到不同作用,表達量的變化也不同。張翠梅[26]在紫花苜蓿響應(yīng)干旱脅迫的研究中發(fā)現(xiàn),NAC轉(zhuǎn)錄因子苜蓿抵抗干旱脅迫過程中起負調(diào)控因子。王一航對舟山新木姜子(Neolitseasericea)幼苗葉片的耐旱性進行研究,發(fā)現(xiàn)bHLH家族的轉(zhuǎn)錄因子AtbHLH112可能參與調(diào)控干旱脅迫的ABA信號轉(zhuǎn)導(dǎo)[27]。MYB44的過表達通過抑制蛋白PHOSPHA Tase 2C(PP2C)基因賦予擬南芥植物抗旱性[28]。TaPIMP1表達上調(diào),轉(zhuǎn)基因煙草在干旱脅迫期間表現(xiàn)出增強的耐性[29]。與本文篩選綿刺的AP2/EREBP、NAC、bHLH、MYB/MYC四類轉(zhuǎn)錄因子的DEG變化不完全一致,轉(zhuǎn)錄因子在干旱脅迫加劇的休眠期,呈現(xiàn)不同的調(diào)控表達,表明轉(zhuǎn)錄因子對綿刺的作用相對復(fù)雜多變,具體轉(zhuǎn)錄因子如何提高綿刺耐旱能力,需要更進一步的研究驗證。
本研究對自然生境下不同時期的綿刺進行轉(zhuǎn)錄組測序,共得到75.63 Gb Clean Data。共有87 707條Unigenes被注釋到NR、GO、COG、KEGG、Swissprot、eggNOG和Pfam數(shù)據(jù)庫。綿刺不同時期GO功能富集發(fā)現(xiàn)注釋到GO數(shù)據(jù)庫中的DEG有440條,在三大類別中富集DEG較多,分別為代謝過程、催化活性細胞、細胞成分等。不同時期KEGG功能富集分析,主要集中于核糖體生物合成,光合作用,光合作用-天線蛋白等代謝通路等。發(fā)現(xiàn)有37條Unigene與綿刺抗旱相關(guān)的功能基因主要有滲透調(diào)節(jié)物質(zhì)、內(nèi)源激素、果膠酶等相關(guān)基因。在生長期與休眠期的注釋到的差異表達基因中,統(tǒng)計與耐旱相關(guān)的轉(zhuǎn)錄因子共8條,主要來自AP2/EREBP、NAC、bHLH。