薛佳麗,任曉慶,郄倩茹,段 明,申慧芳,高建華
(1.山西農(nóng)業(yè)大學(xué)基礎(chǔ)部,山西太谷030801;2.山西農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,山西太谷030801;3.山西農(nóng)業(yè)大學(xué)實(shí)驗(yàn)教學(xué)中心,山西太谷030801)
漆酶(LAC)是一種含銅離子的酚類氧化酶,屬于銅藍(lán)氧化酶蛋白家族,其最初是從漆樹(Rhus ver-nicifera)的漆液中發(fā)現(xiàn),之后在一些真菌、細(xì)菌中也發(fā)現(xiàn)了漆酶的表達(dá)[1]。在植物中,漆酶主要參與木質(zhì)素的合成,而在真菌中,其則與木質(zhì)素降解有關(guān)[2]。木質(zhì)素作為植物生長發(fā)育中的一種次生代謝物,在植物生長發(fā)育和抗性方面具有重要的生物學(xué)功能。在對植物木質(zhì)化過程的研究中,植物漆酶備受關(guān)注[3]。
近年來,隨著植物基因組序列的發(fā)布和生物信息學(xué)技術(shù)對相應(yīng)數(shù)據(jù)的挖掘,極大加速了植物基因家族的篩選和鑒定[4]。目前,已報(bào)道多種植物的漆酶家族,其中,擬南芥(Arabidopsis thaliana)中含有17 個(gè)AtLAC基因[5];水稻(Oryza sativa)基因組含有30 個(gè)OsLAC基因,且大部分在根中高表達(dá)[6];亞麻(Linum usitatissimum)中鑒定出45 個(gè)LuLAC基因[7];甜高粱(Sorghum bicolor)中鑒定出27 個(gè)SbLAC基因[8];二穗短柄草(Brachypodium distachyon)中鑒定出29 個(gè)BdLAC基因[9];甘蔗(Saccharumspp.)中鑒定出12 個(gè)SpLAC基因[10]等。由此可見,不同植物中漆酶基因家族成員存在較大差異。研究發(fā)現(xiàn),植物漆酶主要參與根、莖細(xì)胞壁的木質(zhì)化過程[11]。在擬南芥中,lac4或lac17缺失突變導(dǎo)致莖稈中木質(zhì)素含量降低約20%,而lac4和lac17雙突變體的木質(zhì)素含量降低40%,且木質(zhì)部表型不規(guī)則,lac17恢復(fù)表達(dá)能夠使木質(zhì)部剖面結(jié)構(gòu)恢復(fù)正常[12]。研究二穗短柄草中LAC5[9]和毛竹中克隆的2 個(gè)LAC基因[13]在莖的木質(zhì)化中也發(fā)揮著重要作用。楊樹LAC3基因表達(dá)對其木質(zhì)部纖維的正常細(xì)胞壁結(jié)構(gòu)和完整性至關(guān)重要[14]。此外,漆酶的活性與酚酸類物質(zhì)的抗性呈正相關(guān),LAC基因的表達(dá)增強(qiáng)了植物抗性[15]。
谷子(Setaria italica)屬禾本科,由野生近親狗尾草(Setaria viridis)馴化而來,在我國北方地區(qū)已有超過8 700 a 的歷史[16]。其具有抗干旱、耐貧瘠、適應(yīng)性廣等特性。另外,谷子為二倍體,基因組小,如最早發(fā)布的豫谷1 號基因組約500 Mb[17],張雜谷基因組約420 Mb[18],晉谷21 超早熟突變體xiaomi的基因組約430 Mb[19]。近緣物種狗尾草的漆酶基因已通過生物信息學(xué)方法進(jìn)行篩選[20],而谷子漆酶的研究相對較少。
本研究利用生物信息學(xué)方法篩選鑒定谷子LAC(SiLAC)基因家族,并對其染色體的分布、基因結(jié)構(gòu)、啟動(dòng)子順式作用元件及在不同組織的表達(dá)譜進(jìn)行分析,旨在為谷子木質(zhì)素合成途徑的研究和種質(zhì)資源創(chuàng)新及利用奠定基礎(chǔ)。
為了鑒定谷子LAC基因家族成員,本研究通過文獻(xiàn)獲取狗尾草的LAC(SvLAC)基因家族成員[20],并利用Pfam(http://pfam.xfam.org/)數(shù)據(jù)庫的Sequence Search 功能下載符合LAC基因家族的隱馬爾可夫模型(Hidden Markov Model,HMM)[21]。
從Phytozome V12 數(shù)據(jù)庫(https://phytozome.jgi.doe.gov/pz/portal.html)[22]中分別獲取水稻(Osativa_323_v7.0.protein.fa)、谷子(Sitalica_312_v2.2.protein.fa)、擬南芥(Athaliana_447_Araport11.protein.fa)和狗尾草(Sviridis_500_v2.1.protein.fa)的蛋白質(zhì)數(shù)據(jù),通過HMMER 軟件中的hmmsearch 命令對4 個(gè)物種全基因組蛋白質(zhì)數(shù)據(jù)進(jìn)行檢索,篩選閾值E <1e-20的結(jié)果為候選基因。利用MEGA X 軟件對谷子、狗尾草、水稻和擬南芥的LAC家族蛋白進(jìn)行多序列比對(Clustal W 法),采用鄰接法(Neighbour Joining Tree,NJ)繪制系統(tǒng)發(fā)育樹,Bootstrap 設(shè)置為1 000,其他參數(shù)默認(rèn)[23]。為了防止遺漏,利用獲得的谷子LAC基因家族氨基酸序列,重構(gòu)HMM模型,并使用該模型重新檢索谷子蛋白質(zhì)數(shù)據(jù)庫,最終確定谷子LAC基因家族成員。
利用Phytozome 數(shù)據(jù)庫中下載的谷子基因組注釋gff3 文件,用TBtools[24]對篩選到的基因進(jìn)行位置信息的提取。利用在線工具M(jìn)apGene2Chromosome V2(http://mg2c.iask.in/mg2c_v2.0/)[25]對基因定位的結(jié)果進(jìn)行分析,繪制染色體定位圖,并命名。
利用ProtParam 工具(https://web.expasy.org/protparam/)預(yù)測SiLAC基因家族成員編碼蛋白質(zhì)的氨基酸數(shù)目、分子質(zhì)量、理論等電點(diǎn)和親疏水性等理化性質(zhì)。利用在線軟件PSORT(http://psort1.hgc.jp/form.html)對SiLAC基因編碼的蛋白質(zhì)進(jìn)行亞細(xì)胞定位預(yù)測。
利用TBtools 中Gtf/gff3 Sequences Extractor 選項(xiàng)獲取SiLAC上游2 000 bp 的基因組序列,將所獲取的序列提交至PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)進(jìn)行啟動(dòng)子順式作用元件分析,最后通過TBtools 對常見功能元件進(jìn)行可視化展示。
通過MEME 預(yù)測SiLAC基因家族的保守基序,保守位點(diǎn)寬度設(shè)置為≥10 和≤100,最大保守序列鑒定數(shù)目設(shè)置為10。利用TBtools 繪制SiLAC基因家族基因結(jié)構(gòu)和保守基序圖。
為了進(jìn)一步分析SiLAC基因家族成員在谷子不同組織中的表達(dá)情況,在Phytozome 數(shù)據(jù)庫下載公布的豫谷1 號轉(zhuǎn)錄組雙端測序數(shù)據(jù),篩選SiLAC基因在光下生長10 d 的根、7 d的莖、14 d的旗葉、第一階段穗的表達(dá)量[17]?;诟骰蛟谥参锝M織各器官的表達(dá)差異構(gòu)建表達(dá)熱圖,并利用可視化軟件TBtools 展示。
親緣關(guān)系分析結(jié)果顯示(圖1),52 個(gè)SiLAC 蛋白可分為5 組(Ⅰ~Ⅴ),其中,Ⅴ亞家族包含33 個(gè)SiLAC 蛋白,Ⅳ亞家族包含6 個(gè)SiLAC 蛋白,Ⅰ和Ⅱ亞家族均包含5 個(gè)SiLAC 蛋白,Ⅲ亞家族數(shù)量最少,包含3 個(gè)SiLAC 蛋白,這與SvLAC 的分類相符[20]。與擬南芥相比,谷子與水稻的LAC 同源性較高,這可能是因?yàn)閿M南芥為雙子葉植物,而谷子和水稻同屬禾本科單子葉植物。
對豫谷1 號中共鑒定的52 個(gè)SiLAC家族成員,按照其在染色體上的位置(圖2),命名為SiLAC1~SiLAC52,其中,SiLAC1~SiLAC51分布在谷子1、3、4、5、7、8、9 號染色體上,5 號和8 號染色體上該基因拷貝數(shù)較多,形成基因簇,5 號染色體有8 個(gè)緊密串聯(lián)(SiLAC13~SiLAC20),8 號染色體有25 個(gè)緊密串聯(lián)(SiLAC25~SiLAC49);SiLAC52基因序列尚未定位,不在谷子的9 條染色體上。
對SiLAC 蛋白進(jìn)行理化性質(zhì)和亞細(xì)胞定位預(yù)測結(jié)果顯示(表1),除SiLAC38基因僅編碼271 個(gè)氨基酸外,其余SiLAC基因編碼氨基酸序列長度在472~651;等電點(diǎn)范圍在5.33~9.49,其中,等電點(diǎn)大于9 的基因有4 個(gè),分別為SiLAC4、SiLAC8、SiLAC24、SiLAC29,小于6 的基因有19 個(gè);52 個(gè)漆酶中酸性氨基酸有40 個(gè),堿性氨基酸有12 個(gè),表明不同漆酶工作環(huán)境pH 差異較大。SiLAC家族44 個(gè)成員的總平均親水性(GRAVY)為負(fù)值,為疏水性蛋白,且所有的成員脂肪系數(shù)均小于100,故均為脂溶性蛋白;52 個(gè)SiLAC 蛋白定位于細(xì)胞外,均屬于分泌型蛋白。
表1 SiLAC 基因家族成員及理化性質(zhì)
續(xù)表1
為了探究SiLAC基因家族啟動(dòng)子在轉(zhuǎn)錄水平的調(diào)控功能,對其基因上游2 000 bp 的序列進(jìn)行順式作用元件預(yù)測,結(jié)果共鑒定了11 類順式作用元件(圖3),包括參與茉莉酸甲酯、脫落酸、水楊酸、赤霉素響應(yīng)、低溫響應(yīng)、分生組織表達(dá)調(diào)控、胚乳表達(dá)調(diào)控、參與干旱脅迫、防御應(yīng)激反應(yīng)的順式作用元件以及光響應(yīng)和黃酮類化合物合成調(diào)控的3 個(gè)MYB 結(jié)合位點(diǎn)。其中,SiLAC50包含的響應(yīng)元件種類最多(8 種),而SiLAC47包含的順式響應(yīng)元件最少(1 種)。從組成類型特異性來看,除了SiLAC6、SiLAC8、SiLAC20、SiLAC40、SiLAC41、SiLAC47以外,其余都含有茉莉酸甲酯響應(yīng)元件;除SiLAC7、SiLA20、SiLAC31、SiLAC47以外,其余均包含脫落酸響應(yīng)元件;SiLAC47包含的啟動(dòng)子區(qū)順式元件最少,僅參與低溫響應(yīng);約1/2 基因的啟動(dòng)子序列中包含干旱脅迫下MYB 轉(zhuǎn)錄因子結(jié)合位點(diǎn),還有部分參與光響應(yīng)脅迫下MYB 轉(zhuǎn)錄因子結(jié)合位點(diǎn),可見,SiLAC家族可能受MYB 轉(zhuǎn)錄因子調(diào)控,通過改變細(xì)胞壁木質(zhì)化程度,提高抵抗逆境脅迫的能力。這些結(jié)果表明,SiLAC基因不僅在植物生長發(fā)育過程中起作用,而且在干旱、低溫等逆境響應(yīng)中也發(fā)揮著重要作用。
SiLAC基因家族成員的基因結(jié)構(gòu)分析結(jié)果顯示(圖4),52 個(gè)SiLAC基因均為斷裂基因,包含2~6 個(gè)外顯子,以6 個(gè)外顯子為主,但是不同基因的基因結(jié)構(gòu)存在一定的差異。其中,SiLAC2、SiLAC3、SiLAC4、SiLAC5、SiLAC10、SiLAC20、SiLAC21、SiLAC31、SiLAC52不含非翻譯區(qū)(UTR),其余都具有5′端和3′端非翻譯區(qū)。保守結(jié)構(gòu)域分析顯示(圖4),GroupⅤ亞區(qū)中,SiLAC5不包含motif 1、motif 3 和motif 9;SiLAC38不包含motif 4、motif 5、motif 8 和motif 10;其余該區(qū)基因均包含motif 1~motif 10,且排列順序基本一致。Group I~I(xiàn)V 中,Group Ⅰ的SiLAC10、SiLAC22、SiLAC23和SiLAC50包含motif 10;Group Ⅱ的SiLAC2不包含motif 3,其余Ⅰ~Ⅳ區(qū)中SiLAC基因均含有motif 1~motif 9,且排位基本一致。說明LAC 蛋白家族成員基本結(jié)構(gòu)相對比較保守。
為了進(jìn)一步分析SiLAC基因在谷子不同組織中的表達(dá)情況,對豫谷1 號不同組織轉(zhuǎn)錄組數(shù)據(jù)的FPKM值進(jìn)行了分析,結(jié)果表明(圖5),SiLAC13、SiLAC25、SiLAC28在生長10 d 的根中表達(dá)量極高(FPKM>30),具有組織表達(dá)特異性;SiLAC51在第一階段穗子中表達(dá)量最高,達(dá)到27.149;在莖中,SiLAC37、SiLAC18表達(dá)量高于其他基因,F(xiàn)PKM 值分別為20.803 和16.408。此外,SiLAC基因家族在生長14 d 的旗葉中不表達(dá)或低表達(dá)(FPKM<5),可能是因?yàn)槿~的木質(zhì)化程度較低。
本研究通過對豫谷1 號中的52 個(gè)LAC基因進(jìn)行生物信息學(xué)分析發(fā)現(xiàn),SiLAC基因家族可分為5 個(gè)亞家族,其中,Ⅴ亞家族包含33 個(gè)基因成員,占63.46%。家族成員多分布于5 號和8 號染色體上,這與狗尾草中鑒定的52 個(gè)LAC基因家族的聚類和分布情況相似[20]。Ⅴ亞家族成員的高占比主要是由第V 分支內(nèi)的多個(gè)基因串聯(lián)重復(fù)引起的。與擬南芥相比,谷子SiLAC與水稻OsLAC親緣關(guān)系更近,可能與同屬禾本科單子葉植物有關(guān)。木質(zhì)素是細(xì)胞壁的主要組成成分,在擬南芥生長發(fā)育過程中,AtLAC17、AtLAC4和AtLAC11等漆酶基因都被證明參與木質(zhì)素合成[5,12,26]。亞細(xì)胞定位預(yù)測表明,SiLAC蛋白均為分泌型蛋白,符合谷子漆酶參與木質(zhì)素的合成預(yù)期。趙晶等[27]在陸地棉(Gossypium hirsutum)漆酶的分析中也發(fā)現(xiàn),其83 個(gè)GhirLAC 蛋白都屬于分泌蛋白。
本研究表明,豫谷1 號SiLAC基因家族在葉中幾乎不表達(dá),而少量基因在根、莖等木質(zhì)化程度較高的部位中表達(dá)活躍。在多種植物中也觀察到類似的現(xiàn)象,比如擬南芥[28]、亞麻[9]等。本研究進(jìn)一步分析發(fā)現(xiàn),SiLAC25、SiLAC13和SiLAC28基因的表達(dá)主要集中在根部,而SiLAC37和SiLAC18基因主要在莖部表達(dá),這些基因可能是參與谷子木質(zhì)化的關(guān)鍵基因。在水稻中,OsLAC主要在胚乳、根、莖和花中表達(dá),多數(shù)基因在根中(包括營養(yǎng)和生殖生長階段)表達(dá)量較高[29]。在擬南芥中,AtLAC1、AtLAC3、AtLAC7、AtLAC8和AtLAC15在根和生殖器官中表達(dá)[5]。有研究表明,microRNA857 可以通過靶向AtLAC7來調(diào)節(jié)擬南芥莖中次生木質(zhì)部的形態(tài)發(fā)生和木質(zhì)素積累,而不會影響木質(zhì)素生物合成基因的表達(dá)[28]。這些結(jié)果表明,AtLAC7在擬南芥莖木質(zhì)部細(xì)胞木質(zhì)素聚合中起關(guān)鍵作用。
本研究進(jìn)一步分析根中的3 個(gè)高表達(dá)基因可發(fā)現(xiàn),SiLAC13在5 號染色體的基因簇中,SiLAC25和SiLAC28在8 號染色體的基因簇中,基因串聯(lián)重復(fù)可使在同一染色體上的基因具有相似的功能。對SiLAC啟動(dòng)子順式作用元件預(yù)測分析,發(fā)現(xiàn)谷子SiLAC啟動(dòng)子區(qū)含有茉莉酸甲酯、脫落酸、水楊酸、赤霉素反應(yīng)等激素應(yīng)激響應(yīng)元件,而這3 個(gè)高表達(dá)基因啟動(dòng)子中均含有茉莉酸甲酯、脫落酸反應(yīng)等激素響應(yīng)元件,推測SiLAC的表達(dá)可能受激素影響。這與劉彥英等[30]在香蕉(Musa paradisiaca)漆酶基因(MaLAC)中的發(fā)現(xiàn)相似,在香蕉MaLAC啟動(dòng)子區(qū)也含有茉莉酸甲酯、脫落酸、赤霉素、水楊酸等激素應(yīng)激響應(yīng)元件。其次,谷子是耐旱作物[31],結(jié)果表明,SiLAC28、SiLAC25、SiLAC13分別包含了4、2、2 個(gè)參與干旱誘導(dǎo)的MYB 轉(zhuǎn)錄因子結(jié)合位點(diǎn)相關(guān)的作用元件,因此,認(rèn)為這3 個(gè)基因可能參與谷子抗旱調(diào)控,通過MYB 轉(zhuǎn)錄因子調(diào)控,改變細(xì)胞壁木質(zhì)化程度,從而提高抵抗逆境脅迫的能力。再者,有60%左右的基因還包含1~2 個(gè)與MYB轉(zhuǎn)錄因子結(jié)合位點(diǎn)相關(guān)的作用元件,這些MYB結(jié)合位點(diǎn)參與光反應(yīng)、干旱誘導(dǎo)、黃酮合成基因調(diào)控,因此,這些基因可能參與了谷子生長發(fā)育過程中種子成熟和色素合成,這與龍眼(Dimocarpus longanLour.)中漆酶基因的部分啟動(dòng)子元件功能一致,預(yù)測谷子漆酶可能高度參與了谷子生長發(fā)育調(diào)控或相關(guān)防御應(yīng)激反應(yīng)[32]。
本研究基于谷子基因組和轉(zhuǎn)錄組數(shù)據(jù),鑒定了52 個(gè)SiLAC基因。通過染色體定位分析發(fā)現(xiàn),5 號和8 號染色體出現(xiàn)SiLAC基因串聯(lián)重復(fù),其中,位于5 號染色體的SiLAC13、位于8 號染色體的SiLAC25和SiLAC28在根部組織中特異表達(dá),這3 個(gè)基因均含有與激素響應(yīng)相關(guān)的啟動(dòng)子順式作用元件,預(yù)測SiLAC的表達(dá)可能會受激素影響。此外,SiLAC啟動(dòng)子序列還包含與植物生長發(fā)育調(diào)控、逆境響應(yīng)相關(guān)的順式作用元件,表明在谷子生長發(fā)育過程中漆酶基因家族發(fā)揮重要作用。本研究結(jié)果可為進(jìn)一步分析谷子LAC基因家族的功能、解析其在谷子生長過程中表達(dá)調(diào)控機(jī)制提供參考。