王 培, 王鳳濤, 常洪雷, 馮 晶, 郭青云, 藺瑞明*
1.青海大學(xué)農(nóng)林科學(xué)院, 青海省農(nóng)林科學(xué)院, 農(nóng)業(yè)農(nóng)村部西寧作物有害生物科學(xué)觀測(cè)實(shí)驗(yàn)站; 青海省農(nóng)業(yè)有害生物綜合治理重點(diǎn)實(shí)驗(yàn)室; 省部共建三江源生態(tài)與高原農(nóng)牧業(yè)國(guó)家重點(diǎn)實(shí)驗(yàn)室, 西寧 810016;2.中國(guó)農(nóng)業(yè)科學(xué)院植物保護(hù)研究所, 植物病蟲害生物學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室; 農(nóng)業(yè)農(nóng)村部作物有害生物綜合治理重點(diǎn)實(shí)驗(yàn)室, 北京 100193;3.北京迪??萍加邢薰? 北京 101116
轉(zhuǎn)錄因子(transcription factor,TF)又稱反式作用因子,是一類能與真核基因啟動(dòng)子區(qū)域中的一段DNA序列(即順式作用元件)發(fā)生特異性結(jié)合從而調(diào)控基因轉(zhuǎn)錄起始頻率的DNA結(jié)合蛋白。近年來(lái),已經(jīng)從植物中相繼分離出一系列的轉(zhuǎn)錄因子,其中,植物特有的NAC轉(zhuǎn)錄因子是一個(gè)具有多種生物學(xué)功能的轉(zhuǎn)錄因子家族。第1個(gè)NAC類轉(zhuǎn)錄因子NAM克隆自矮牽牛[1],隨后在擬南芥中發(fā)現(xiàn)了NAM、ATAF1/2和CUC2 3個(gè)具有相同結(jié)構(gòu)域的基因,取這3個(gè)基因的首字母將該結(jié)構(gòu)域命名為NAC結(jié)構(gòu)域,并將包含NAC結(jié)構(gòu)域的蛋白質(zhì)稱為NAC轉(zhuǎn)錄因子[2]。NAC結(jié)構(gòu)域包含5個(gè)亞結(jié)構(gòu)域(A~E),其中A、C、D 3個(gè)亞結(jié)構(gòu)域高度保守,而B和E亞結(jié)構(gòu)域變異性較強(qiáng)[3]。擬南芥基因組和水稻基因組中分別有117個(gè)[4]和151個(gè)[5]NAC轉(zhuǎn)錄因子。Ooka等[4]根據(jù)NAC結(jié)構(gòu)域的氨基酸序列的相似度將其發(fā)現(xiàn)的水稻和擬南芥的NAC轉(zhuǎn)錄因子分為2組:Ⅰ組和Ⅱ組;并將Ⅰ組進(jìn)一步分為14個(gè)亞組,Ⅱ組分為4個(gè)亞組。諸多研究表明,NAC轉(zhuǎn)錄因子在植物生長(zhǎng)、發(fā)育和抗逆、抗病過程中起著重要作用[6~9]。
大多數(shù)NAC轉(zhuǎn)錄因子定位在細(xì)胞核,但是有一些NAC轉(zhuǎn)錄因子具有含α螺旋的跨膜基序(transmembrane motif,TM),可編碼蛋白定位在植物細(xì)胞的膜系統(tǒng),因此命名為NTL(NAC with transmembrane motif 1-like,NTM1-like)。目前,擬南芥中已鑒定出18個(gè)NTLs,水稻中有5個(gè)NTLs,大豆中有15個(gè)NTLs。正常條件下NTLs主要錨定在質(zhì)膜或內(nèi)質(zhì)網(wǎng)膜上,但當(dāng)植物遭受環(huán)境或其他因子刺激后,NTLs蛋白將從質(zhì)膜或內(nèi)質(zhì)網(wǎng)膜上切除下來(lái)進(jìn)入細(xì)胞核調(diào)控相關(guān)基因的表達(dá)。已有研究表明,NTLs基因參與生長(zhǎng)發(fā)育[10]、非生物脅迫[3,11~13]以及生物脅迫[14,15]。
小麥(Triticumaestivum)是我國(guó)重要的糧食作物,隨著人們對(duì)農(nóng)業(yè)環(huán)境的日益重視,開展作物抗逆抗病機(jī)理研究以培育抗逆抗病新品種對(duì)于保證小麥產(chǎn)量的穩(wěn)定愈發(fā)迫切。目前關(guān)于小麥NTLs基因的研究較少,僅報(bào)道了2個(gè)TaNTL轉(zhuǎn)錄因子[3,15],且具體的生物學(xué)功能尚不完善。本研究基于基因組數(shù)據(jù)擬采用生物信息學(xué)的手段,通過全基因組鑒定、理化性質(zhì)預(yù)測(cè)、系統(tǒng)發(fā)育分析、保守結(jié)構(gòu)域預(yù)測(cè)、亞細(xì)胞定位預(yù)測(cè)等對(duì)小麥中的NTL轉(zhuǎn)錄因子進(jìn)行綜合研究,并分析其在小麥與條銹菌互作過程中的表達(dá)變化,以期為下一步挖掘小麥中NTL轉(zhuǎn)錄因子的抗病功能提供參考。
從Ensembl的植物數(shù)據(jù)庫(kù)下載截至2019年1月4日更新的小麥基因組數(shù)據(jù)(ftp://ftp.ensemblgenomes.org/pub/plants/release-42/fasta/triticum_aestivum/)的全基因組序列、蛋白質(zhì)序列、染色體信息文件。
下載Pfam數(shù)據(jù)庫(kù)構(gòu)建NAC家族的隱馬爾可夫模型(hidden Markov model,HMM)文件,并利用HMMER 3.0軟件包中的Hmmerseach程序?qū)π←湹娜蚪M進(jìn)行比對(duì),以獲取小麥基因組中包含NAC保守結(jié)構(gòu)域的所有基因。隨后利用初篩的小麥NAC轉(zhuǎn)錄因子序列重新構(gòu)建新的隱馬爾可夫模型,再以新的隱馬爾可夫模型在小麥全基因組序列中利用Perl語(yǔ)言搜索NAC轉(zhuǎn)錄因子的序列(E<10-5被認(rèn)為是候選序列)。進(jìn)一步利用Pfam數(shù)據(jù)庫(kù)去除不含NAC結(jié)構(gòu)域的候選序列,獲得全基因組水平內(nèi)所有的NAC家族轉(zhuǎn)錄因子。再利用跨膜結(jié)構(gòu)域預(yù)測(cè)工具TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測(cè)獲得的小麥NAC轉(zhuǎn)錄因子是否具有跨膜結(jié)構(gòu)域。
利用ExPASY-ProtParam在線工具(https://www.expasy.org/)分析小麥中NAC蛋白的基本理化性質(zhì),主要包括氨基酸數(shù)目(number of amino acids)、分子量(molecular weight)、等電點(diǎn)(PI)、平均親水系數(shù)(grand average of hydropathicity)、不穩(wěn)定指數(shù)(instability index)。
利用MEGA7.0[16]對(duì)候選小麥TaNTL轉(zhuǎn)錄因子保守區(qū)域氨基酸序列進(jìn)行多序列比對(duì),用最大似然法構(gòu)建小麥、擬南芥、水稻、玉米的NTL轉(zhuǎn)錄因子保守區(qū)域的系統(tǒng)進(jìn)化樹,將Bootstrap值設(shè)為1 000以獲得更為可靠的分支聚類。
利用蛋白質(zhì)保守基序在線搜索程序MEME(http://meme-suite.org/)分析TaNTL轉(zhuǎn)錄因子家族的保守基序。每個(gè)序列可包含任何數(shù)量的基序,且不發(fā)生重疊,不同基序的數(shù)目為20個(gè),基序長(zhǎng)度為6~100 aa。
將已鑒定的TaNTLs基因的CDS序列與其對(duì)應(yīng)的基因組序列進(jìn)行比對(duì),利用基因結(jié)構(gòu)顯示系統(tǒng)(Genne structure display server 2.0,http://gsds.cbi.pku.edu.cn/)分析其外顯子-內(nèi)含子(exon-intron)結(jié)構(gòu)及相位。
為了獲得小麥TaNTL轉(zhuǎn)錄因子家族的染色體分布情況,利用Perl程序解析釋放出每個(gè)候選成員基因組位置信息。進(jìn)而利用在線繪圖工具(Map Gene 2 Chrom web V2,http://mg2c.iask.in/mg2c_v2.0/)繪制小麥NTL轉(zhuǎn)錄因子家族在染色體上的位置分布圖。
為了明確小麥NTLs編碼蛋白具體定位的細(xì)胞器,本研究通過PSORT在線工具(https://wolfpsort.hgc.jp/)對(duì)TaNTL膜結(jié)合轉(zhuǎn)錄因子蛋白的亞細(xì)胞定位進(jìn)行了預(yù)測(cè)分析。WoLF PSORT是用于蛋白質(zhì)亞細(xì)胞位置預(yù)測(cè)的POORT程序的擴(kuò)展。將蛋白質(zhì)序列轉(zhuǎn)換為數(shù)值,然后使用分類器進(jìn)行定位預(yù)測(cè)。結(jié)果的呈現(xiàn)方式有2種,一種是與查詢最相似的定位特征的已知定位的蛋白質(zhì)列表,另一種是具有關(guān)于個(gè)體定位特征的詳細(xì)信息的列表。
為了進(jìn)一步解析小麥NTL基因家族的表達(dá)模式,利用在線分析工具(http://www.wheat-expression.com/)分析17個(gè)TaNTLs在小麥與條銹菌互作及小麥經(jīng)病原物模擬處理后基因表達(dá)量的變化。
在小麥基因組中共鑒定出448個(gè)NAC轉(zhuǎn)錄因子,其中具有跨膜結(jié)構(gòu)的轉(zhuǎn)錄因子有17個(gè)。這17個(gè)TaNTLs中最長(zhǎng)的序列有730個(gè)氨基酸殘基,最短的有454個(gè)氨基酸殘基,等電點(diǎn)的范圍在4.50~6.12之間。
亞細(xì)胞定位與蛋白質(zhì)的功能存在著非常重要的聯(lián)系。WoLF PSORT能提供準(zhǔn)確的亞細(xì)胞定位預(yù)測(cè)。結(jié)果顯示,TaNTLs既有細(xì)胞核定位信號(hào)又有內(nèi)質(zhì)網(wǎng)和細(xì)胞膜定位信號(hào)。其中,TraesCS3B01G208300.1、TraesCS3D01G183900.2在細(xì)胞核及質(zhì)膜上均無(wú)定位信息,但在內(nèi)質(zhì)網(wǎng)膜上存在定位信息,具體見表1。
表1 17個(gè)TaNTLs轉(zhuǎn)錄因子編號(hào)、編碼的蛋白質(zhì)性質(zhì)分析及定位預(yù)測(cè)Table 1 Gene number, coding protein characterization and predicted location of 17 TaNTLs.
為了比較小麥中TaNTLs與擬南芥、水稻NTLs基因序列間的關(guān)系,利用最大似然法構(gòu)建了18個(gè)擬南芥NTLs(AtNTLs)、5個(gè)水稻NTLs(OsNTLs)和上述17個(gè)TaNTLs編碼蛋白序列的聚類樹(圖1)。由圖1可見,17個(gè)TaNTLs可以分為6個(gè)同源基因組。根據(jù)水稻和擬南芥的NTLs的名稱對(duì)17個(gè)小麥NTLs命名,即命名時(shí),參考與待命名小麥NTL距離最近的擬南芥或水稻NTL的名稱。TaNTL2包括7A、7B和7D 3個(gè)同源基因;TaNTL3包括3A、3B和3D 3個(gè)同源基因,其中TaNTL3-3B為已報(bào)道的TaNAC8[15];TaNTL4包括5A和5D 2個(gè)同源基因;TaNTL5包括7B、7D和染色體信息未知的3個(gè)同源基因,其中染色體信息未知的基因?yàn)橐褕?bào)道的TaNTL5[3],很可能是位于7A染色體;TaNTL6包括6A、6B和6D 3個(gè)同源基因;TaNTL9包括7A、7D 2個(gè)同源基因;TaNTL9-4A僅有1個(gè)基因,來(lái)源于4A染色體,但該基因編碼蛋白與TaNTL9-7A、TaNTL9-7D的序列高度相似,推測(cè)可能發(fā)生了非同源染色體的基因復(fù)制事件。
圖1 小麥與擬南芥、水稻NTLs轉(zhuǎn)錄因子編碼蛋白質(zhì)的聚類分析Fig.1 The phylogenetic tree of NTLs from wheat, Arabidopsis and rice.
從NTLs在同源染色體組的分布來(lái)看(圖1),A、B、D的同源染色體組分別有7個(gè)、4個(gè)、6個(gè),表明B染色體組可能在進(jìn)化過程中發(fā)生了NTLs的丟失事件。而對(duì)1~7號(hào)染色體組來(lái)說(shuō),來(lái)源于小麥7號(hào)染色體的NTLs有TaNTL2、TaNTL5、TaNTL9,同源基因共8個(gè);3號(hào)染色體及6號(hào)染色體各有3個(gè);4號(hào)染色體有1個(gè);5號(hào)染色體有2個(gè)。相對(duì)于3、6、5號(hào)染色體,7號(hào)染色體上NTLs的基因活躍度更高。
根據(jù)擬南芥及水稻的NTLs研究[17]及聚類樹的關(guān)系,將40個(gè)NTLs分為4個(gè)亞組:NAC2、ANAC001、TIP和OsNAC8。NAC2亞組包括20個(gè)NTLs,已進(jìn)行生物學(xué)功能研究的有8個(gè):OsNTL5抑制水稻開花[10],TaNTL5-U/TaNTL5的表達(dá)在干旱、鹽脅迫下表達(dá)受到抑制[3],NTL4參與葉片衰老并通過JA信號(hào)通路調(diào)控花藥的開裂[11,18],NTL11參與類黃酮合成[19],ANAC050和ANAC052抑制開花時(shí)間[20],NTL1(ANAC013)[21,22]和NTL7[12,13]參與線粒體脅迫和氧化脅迫調(diào)控;ANAC001亞組有6個(gè),均源自擬南芥,其中NTL8參與毛狀體形成及鹽脅迫[12,13],NTL14參與細(xì)胞死亡[23];TIP亞組有10個(gè),NTL9參與逆境脅迫及抗病免疫[14,24],NTL6參與內(nèi)質(zhì)網(wǎng)脅迫[25,26];OsNAC8亞組有4個(gè),全部為小麥和水稻的NTLs,TaNAC3-3B/TaNAC8可響應(yīng)條銹菌侵染和非生物脅迫[15]。
保守基序(conserved motif)是具有特定功能的蛋白結(jié)構(gòu),每個(gè)基序都有其特征性的氨基酸序列以發(fā)揮其功能。小麥NTLs編碼蛋白質(zhì)序列的保守基序分析結(jié)果顯示,小麥NTLs均含有保守基序Motif 1、Motif 2、Motif 3。Motif 18和Motif 19為較為保守的結(jié)構(gòu)域,其中Motif 18只存在于TracesCS5A01G271500.2(TaNTL4-5A),推測(cè)其功能不同于其他轉(zhuǎn)錄因子。結(jié)合17個(gè)TaNTLs的聚類樹,可以發(fā)現(xiàn)親緣關(guān)系較近的NTLs具有相似的保守基序,具體見圖2。
基因組序列由內(nèi)含子(intron)和外顯子(exon)構(gòu)成,外顯子為基因的可編碼序列。為了進(jìn)一步研究基因結(jié)構(gòu),分析了小麥中NTL的exon-intron分布(圖2)。結(jié)果表明,小麥NTL基因一般有4~7個(gè)外顯子,蛋白序列親緣關(guān)系較近的NTLs具有相似的exon-intron結(jié)構(gòu)。A、B、D同源基因的exon-intron的模式相似,但是內(nèi)含子長(zhǎng)度存在差異。
圖2 小麥NTL轉(zhuǎn)錄因子家族的保守基序及基因結(jié)構(gòu)Fig.2 Conserved motifs and gene structure of NTLs in wheat.
為了分析TaNTLs在小麥響應(yīng)病原菌侵染過程中的表達(dá)模式,本研究基于已知的小麥-條銹菌親和互作、小麥-病原物模擬接種的轉(zhuǎn)錄組數(shù)據(jù)庫(kù),進(jìn)行表達(dá)譜分析。研究結(jié)果表明(圖3),在小麥-條銹菌親和互作過程中,9個(gè)TaNTLs的表達(dá)水平發(fā)生顯著變化,根據(jù)響應(yīng)條銹菌侵染的早期(2 d及以內(nèi))和晚期可將其分為2類,其中,5個(gè)TaNTLs在親和條銹菌侵染小麥的早期表達(dá)水平升高:TaNTL3-3A(TraesCS3A02G176500.1)、TaNTL3-3B(TraesCS3B02G208300.2)、TaNTL3-3D(TraesCS3D02G183900.2)、TaNTL5-7D(TraesCS7-D02G283800.1)、TaNTL6-6D(TraesCS6D02-G390200.1),8個(gè)TaNTLs在條銹菌侵染11 d時(shí)(條銹菌夏孢子堆已經(jīng)完全擴(kuò)展到小麥葉片內(nèi)部)表達(dá)水平顯著升高:TaNTL3-3A(TraesCS3A02G176500.1)、TaNTL3-3B(TraesCS-3B02G208300.2)、TaNTL3-3D(TraesCS3D02-G183900.2)、TaNTL5-U(TraesCSU02G135000.1)、TaNTL5-7D(TraesCS7D02G283800.1)、TaNTL6-6A(TraesCS6A02G406700.1)、TaNTL6-6B(TraesCS-6B02G451300.1)、TaNTL9-7D(TraesCS7D02G0-00200.1)。尤其是TaNTL6-6A(TraesCS6A02-G406700.1),其本底水平不高,但在11 d時(shí)達(dá)到最高表達(dá)水平。此外,同源群內(nèi)的基因?qū)τH和條銹菌侵染的響應(yīng)存在差異,如接種親和條銹菌后,TaNTL5-U與TaNTL5-7D的表達(dá)水平顯著升高,而TaNTL5-7B的表達(dá)變化不大;TaNTL9-7D的表達(dá)顯著升高,TaNTL9-7A、TaNTL9-7B的表達(dá)變化不大。由此推測(cè),來(lái)源于A、B、D不同染色體組的NTLs在進(jìn)化過程中可能由于啟動(dòng)子、上游調(diào)控序列或DNA甲基化水平存在差異導(dǎo)致親和條銹菌侵染后的表達(dá)水平存在差異。
基于小麥-病原物模擬接種的轉(zhuǎn)錄組數(shù)據(jù)庫(kù)分析表達(dá)譜變化(圖3),結(jié)果表明,小麥接種幾丁聚糖和鞭毛多肽后,TaNTL3-3A、TaNTL3-3B、TaNTL3-3D、TaNTL4-5A、TaNTL4-5D、TaNTL6-6A和TaNTL6-6D的表達(dá)水平升高。
圖3 TaNTLs在小麥與條銹菌互作及病原物模擬處理后的表達(dá)譜分析Fig.3 The expression pattern of TaNTLs responsing wheat-sripe rust infection and pathogen-associated molecular treatment.
本研究搜集了小麥基因組數(shù)據(jù),獲得了17個(gè)TaNTLs。其中TaNTL5-U為之前報(bào)道的TaNTL5[3],TaNTL3-3B為TaNAC8[15]。相比水稻中的5個(gè)NLTs基因,小麥多了1個(gè)同源群基因(TaNTL9)。17個(gè)TaNTLs均具有跨膜結(jié)構(gòu)域,除TaNTL3-3B、3D和TaNTL5-7B、7D預(yù)測(cè)無(wú)核定位信號(hào)外,其余均含有核定位信號(hào)。通過小麥-條銹菌轉(zhuǎn)錄組及小麥-原體接種處理2個(gè)數(shù)據(jù)庫(kù)的表達(dá)譜分析,TaNTL5-7D、TaNTL6-6A和TaNTL6-6D在2種處理中均表達(dá)升高,推測(cè)這3個(gè)基因可能參與了抗病調(diào)控過程。
NTL類轉(zhuǎn)錄因子屬于NAC家族的轉(zhuǎn)錄因子,其特點(diǎn)是具有跨膜結(jié)構(gòu)域,因此與一般轉(zhuǎn)錄因子蛋白產(chǎn)物定位在細(xì)胞核不同,該類轉(zhuǎn)錄因子蛋白產(chǎn)物一般為膜定位,如質(zhì)膜、內(nèi)質(zhì)網(wǎng)膜。已有研究表明,膜結(jié)合轉(zhuǎn)錄因子的跨膜結(jié)構(gòu)域的切割有2種蛋白水解機(jī)制[27],第1種為通過膜內(nèi)蛋白水解(regulated intramembrane proteolysis,RIP)機(jī)制,第2種為依賴泛素/蛋白體加工(regualated ubiquitin/proteasome-dependent processing,RUP)的調(diào)節(jié)機(jī)制。
在細(xì)胞內(nèi)NTLs實(shí)現(xiàn)其功能的先決條件是膜釋放,其通過蛋白水解從膜上釋放,并被轉(zhuǎn)運(yùn)到細(xì)胞核中調(diào)節(jié)應(yīng)激反應(yīng)基因的表達(dá)。對(duì)于擬南芥中NTLs功能的研究較為深入,此外玉米、大豆、水稻等的NTLs均有報(bào)道。已經(jīng)明確NTLs在植物生長(zhǎng)發(fā)育、調(diào)控逆境脅迫中發(fā)揮調(diào)節(jié)作用[27~30]。蛋白質(zhì)的結(jié)構(gòu)相似,其功能也可能相似,參照擬南芥和水稻的NTLs功能,小麥NTLs可能也具有不同的生物功能。根據(jù)蛋白質(zhì)序列的聚類樹,推測(cè)TaNTL5和TaNTL6的3個(gè)同源基因可能在植物的發(fā)育過程中起重要作用,同時(shí)可負(fù)調(diào)控逆境脅迫;TaNTL4的2個(gè)同源基因與擬南芥的NTL1、NTL4同屬于一個(gè)亞組,可能位于線粒體膜上,可能調(diào)控線粒體、內(nèi)質(zhì)網(wǎng)內(nèi)脅迫;TaNTL3中TaNTL3-3B為已報(bào)道的TaNAC8,響應(yīng)條銹菌侵染和非生物脅迫;TaTNL2的3個(gè)同源基因的功能尚無(wú)參考基因推測(cè),而TaTNL9的3個(gè)同源基因與擬南芥的NTL9序列相似,可能響應(yīng)逆境脅迫和內(nèi)質(zhì)網(wǎng)脅迫。
根據(jù)表達(dá)譜分析TaNTL5-7D、TaNTL6-6A和TaNTL6-6D在小麥-病原菌互作過程中均表達(dá)升高,推測(cè)這3個(gè)基因可能參與抗病調(diào)控過程,同時(shí)結(jié)合聚類分析,推測(cè)其負(fù)調(diào)控逆境脅迫的同時(shí)在植物的發(fā)育過程中起重要作用。然而,其在小麥-病原菌互作過程中的功能尚需準(zhǔn)確、系統(tǒng)的蛋白水平的檢測(cè)及生物學(xué)功能驗(yàn)證。