張愷愷,楊立瑩,豐美靜,,張林鳳,陳段芬,邱德有,楊艷芳*
(1.中國林業(yè)科學研究院林業(yè)研究所,林木遺傳育種國家重點實驗室,國家林業(yè)和草原局林木培育重點實驗室,北京 100091;2.河北農(nóng)業(yè)大學園藝學院,河北保定 071001;3.中國花卉協(xié)會,北京 100020)
紅豆杉(Taxusspp.)是舉世公認的珍貴林木,在全世界一共有11 種,我國存在4 種和1 變種,即東北紅豆杉(T.cuspidataSieb.et Zucc.)、西藏紅豆杉(T.wallichianaZucc.)、云南紅豆杉(T.yunnanensisCheng et L.K.Fu)、中國紅豆杉(T.chinensis(Pilger) Rehd.)以及南方紅豆杉(T.chinensisvar.mairei(Lemeee et Levl)Cheng et L.K.Fu)[1]。曼地亞紅豆杉(Taxus×mediaRehder)為一種天然雜交種,于上世紀90 年代由美國或加拿大引種于我國。
NAC (NAM/ATAF/CUC)是植物中最常見的轉(zhuǎn)錄因子家族之一,在植物生長發(fā)育過程中起到重要的調(diào)控作用,如響應(yīng)非生物脅迫、調(diào)控器官生長發(fā)育以及參與激素信號轉(zhuǎn)導等[2-4]。研究發(fā)現(xiàn),水稻OsNAC2 蛋白能夠通過影響植物生長素和細胞分裂素(cytokinin)反應(yīng)基因來調(diào)控根的發(fā)育[5],而擬南芥ANAC092 可以與生長素應(yīng)答因子ARF8和PIN4 的啟動子相結(jié)合,通過控制生長素信號途徑來影響擬南芥根系的發(fā)育[6-8]。此外,在擬南芥中異源表達BnNAC14、GmNAC109、CiNAC3和CiNAC4等其他物種的NAC基因,也可以對側(cè)根的形成起到促進作用[8-11]。這些研究結(jié)果表明,NAC 轉(zhuǎn)錄因子在植物根系的形成過程中扮演重要角色。
近年來,人們?yōu)榱司徑饧t豆杉開發(fā)與利用的矛盾,在紅豆杉人工種植研究上取得了巨大進展,但仍存在紅豆杉扦插繁殖生根較慢(大約需要45~60 d)的技術(shù)瓶頸。并且,目前關(guān)于紅豆杉生根的分子機制研究也較為少見。本研究從曼地亞紅豆杉三代全長轉(zhuǎn)錄組數(shù)據(jù)中鑒定出了44 個NAC轉(zhuǎn)錄因子基因,并對該基因家族進行了系統(tǒng)生物信息學及組織表達分析,為探索NAC 轉(zhuǎn)錄因子調(diào)控紅豆杉根系的形成奠定理論基礎(chǔ),有助于今后利用分子手段調(diào)控其根系生長、縮短扦插育苗時間。
通過隱馬可夫模型HMM(PF02365) (TBtools v1.064[12])從課題組曼地亞紅豆杉三代全長轉(zhuǎn)錄組數(shù)據(jù)(未發(fā)表)中獲取NAC 蛋白序列。利用在線工具CD-HIT Suite 進行去冗余[13],利用NCBI CD Search 工具進行結(jié)構(gòu)域預(yù)測,并篩選結(jié)構(gòu)域完整的序列進行后續(xù)分析。
利用ExPASy 在線工具ProtParam(https://web.expasy.org/protparam/)分析TmNAC 蛋白理化特性。根據(jù)進化樹結(jié)果,每個亞家族選取一個TmNAC 蛋白作為代表,利用phyre2 在線網(wǎng)站(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)進行三級結(jié)構(gòu)建模。
擬南芥NAC 蛋白序列下載于Plant TFDB (http://planttfdb.cbi.pku.edu.cn/)數(shù)據(jù)庫。從138 個擬南芥NAC 蛋白質(zhì)序列中隨機選取6 個序列,用ClustalX2 軟件將其與44 個TmNAC 序列進行多序列比對,比對結(jié)果利用EsPript 3.0 (http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)進行美化。利用MEGA 7 軟件中的NJ(Neighbor-Joining)法構(gòu)建進化樹,重復1 000 次,其他參數(shù)為默認值。iTOL(https://itol.embl.de/)在線網(wǎng)站美化進化樹。
利用 MEME 在線網(wǎng)站對TmNAC 蛋白進行保守基序(Motif)分析[14],最大motif 檢索數(shù)為10,其余為默認參數(shù),將結(jié)果通過TBtoolsv1.064軟件進行可視化處理[12]。
利用云南紅豆杉植株根、莖和葉的RNA-seq數(shù)據(jù)(SRP127697)和TBtools v1.064 軟件繪制TmNACs 基因在根、莖和葉組織中的表達熱圖,對NAC 成員基因表達量FPKM 值使用log2 (FPKM +1)對數(shù)轉(zhuǎn)化處理[12]。
本研究共獲得44 條NAC 蛋白序列,命名為TmNAC1~TmNAC44。對獲得的44 個TmNAC蛋白序列進行理化性質(zhì)分析,發(fā)現(xiàn)TmNAC38 序列最長,含有1 010 個氨基酸殘基,而TmNAC9序列最短,含有154 個氨基酸殘基;這些TmNAC蛋白等電點為 4.70~9.60,相對分子質(zhì)量為18.13~113.57 kDa,GRAVY 值均為負值,表明TmNAC蛋白均為親水蛋白。
系統(tǒng)進化樹結(jié)果顯示,44 個TmNAC 蛋白被分為NAM 等7 個亞家族,其他NAC1、ONAC22和SEUN5 等擬南芥9 個NAC 亞家族中無TmNACs蛋白分布(圖1)。
從圖1 中可以看出,各TmNAC 成員的三級結(jié)構(gòu)十分相似,但也存在些許差異,如TmNAC1 蛋白比其他蛋白多了一個β-折疊,TmNAC16 和TmNAC21 蛋白比其他蛋白多一個α 螺旋(圖2)。
圖1 曼地亞紅豆杉與擬南芥NAC 家族進化樹分析Fig.1 Phylogenetic relationship among NAC superfamily genes of of Taxus × media and Arabidopsis thaliana
圖2 TmNAC 蛋白的三級結(jié)構(gòu)分析Fig.2 3D structures of TmNAC proteins
多序列比對結(jié)果發(fā)現(xiàn),所有的NAC 蛋白在N 端均具有保守的NAC 結(jié)構(gòu)域(圖3),其結(jié)果與擬南芥和水稻NAC 轉(zhuǎn)錄因子家族分析結(jié)果相似[15]。此外,TmNAC7 和TmNAC42 蛋白具有不完整的亞結(jié)構(gòu)域D 與E (圖3),其余蛋白均具有5 個保守的亞結(jié)構(gòu)域(A~E)。
圖3 曼地亞紅豆杉和擬南芥NAC 蛋白保守結(jié)構(gòu)域分析Fig.3 Analysis of conserved domains of the NAC proteins of Taxus × media and Arabidopsis thaliana
基序分析結(jié)果發(fā)現(xiàn)motif 2、4、5 幾乎存在于所有的NAC 蛋白成員中。另外,有的亞家族具有或缺失某些蛋白基序,如motif 8、10 僅存在于ANAC011 亞家族中,motif 7 僅存在于NAM 與ATAF 亞家族中;而ANAC011 亞家族中的TmNAC36 和TmNAC15 則分別缺少motif 2 和motif 5 (圖4)。
圖4 曼地亞紅豆杉TmNAC 蛋白motif 分析Fig.4 Motif analysis of TmNAC proteins of Taxus × media
組織表達分析結(jié)果顯示,TmNAC15、16、18、21、22、29、39、40、41和44在根中均有較高的表達量,而在葉和莖中的表達量都相對較低。另外,TmNAC2、3、8、17、25和42在根與葉中表達量相近,而TmNAC27和TmNAC43在莖中表達量最高,在葉和根中的表達量均較低(圖5)。
圖5 TmNAC 基因在根、莖和葉中表達模式Fig.5 The expression patterns of TmNAC genes in roots, leaves and stems
NAC基因家族具有保守的結(jié)構(gòu)域和功能域,對植物的生長發(fā)育具有重要的作用[15-17]。本研究從曼地亞紅豆杉轉(zhuǎn)錄組數(shù)據(jù)中鑒定出 44 個NAC 轉(zhuǎn)錄因子,數(shù)目明顯少于擬南芥和水稻基因組中的138 個和140 個[18-19]。究其原因,很有可能是由于本研究的NAC 來源于三代全長轉(zhuǎn)錄組測序數(shù)據(jù),也有可能是因為物種不同造成。目前,已經(jīng)有西藏紅豆杉和南方紅豆杉基因組發(fā)表[20-21],未來可以利用這些基因組信息對NAC 基因家族進一步進行分析,紅豆杉NAC 家族的完整性可以得到進一步完善和確定。
研究表明NAC 蛋白具有典型結(jié)構(gòu)特征,均含有NAC 功能域,且NAC 區(qū)域包含 A~E 共5 個NAC 亞結(jié)構(gòu)域。本研究蛋白多序列比對結(jié)果顯示,44 個TmNAC 蛋白在N 端均含有 NAC 結(jié)構(gòu)域,但TmNAC7 和TmNAC42 蛋白具有不完整的D 和E 亞結(jié)構(gòu)域。這5 個亞結(jié)構(gòu)域的保守性順序為A>C>D>B>E,亞結(jié)構(gòu)域A 與C 對蛋白質(zhì)的穩(wěn)定發(fā)揮著重要作用。此外,亞結(jié)構(gòu)域 E 是NAC 蛋白中一個重要的 DNA 結(jié)合區(qū)域,可能參與了發(fā)育時期調(diào)控,并且前人也推測存在由亞結(jié)構(gòu)域D 和E 組成的DNA 結(jié)合區(qū)[22]。蛋白的功能與其結(jié)構(gòu)密切相關(guān),由此可以推測,TmNAC 家族有很大可能與其他植物的NAC 蛋白功能相似,而TmNAC7和TmNAC42 蛋白功能則極其可能與其他TmNAC蛋白功能有所不同。
進化樹分析顯示紅豆杉TmNAC 成員與大多數(shù)擬南芥NAC 家族各亞家族成員具有較高同源性,表明NAC 家族在物種間進化保守。因此,可以通過其他物種NAC 蛋白功能來預(yù)測紅豆杉NAC 同源蛋白的功能。此外,擬南芥中NAC1、ONAC22和SEUN5 等9 個亞家族并不包含紅豆杉NAC 同源蛋白,這些情況可能是由于曼地亞紅豆杉的NAC家族序列是從轉(zhuǎn)錄組數(shù)據(jù)中獲得,并未全部獲取到基因組中其他亞家族NAC 蛋白序列所造成。
多序列比對、motif 及蛋白質(zhì)三級結(jié)構(gòu)分析均發(fā)現(xiàn),44 個曼地亞紅豆杉NAC 蛋白具有較高的相似性和保守性,該結(jié)果與桃樹、蓖麻、茶樹、番茄中的報道相類似,說明其在進化上非常保守[23-26]。值得注意的是,TmNAC1、TmNAC16 和TmNAC21三者所在的亞家族與其他亞家族成員結(jié)構(gòu)上存在顯著差異,且不同亞家族或同一亞家族不同成員之間motif 類型和數(shù)目也存在差異,這些結(jié)構(gòu)差異是否導致它們功能發(fā)生變異尚不清楚,值得研究人員進一步深入研究。
研究表明,不同的物種間同源基因在進化過程中會保留相同或相似的功能,而基因的組織表達模式往往與其功能密切相關(guān)[27]。擬南芥和水稻的一些NAC 轉(zhuǎn)錄因子的功能已經(jīng)得到驗證,這為預(yù)測紅豆杉TmNAC 轉(zhuǎn)錄因子的功能提供了線索。TmNAC 家族TmNAC15、16、18、21、22、29、39、40、41和44基因在紅豆杉根中表達量較高,同時TmNAC21、30、39、40 和44 蛋白與擬南芥AtNAC2/AT3G15510 蛋白在系統(tǒng)發(fā)育樹中聚為一支,而AtNAC2恰恰參與側(cè)根的形成與發(fā)育[28];TmNAC5、11、14、22、24、34 和37 蛋白與擬南芥AtNAC1/AT3G15170 蛋白在系統(tǒng)發(fā)育樹中聚為一支,AtNAC1介導生長素信號以促進側(cè)根的形成[29]。綜合上述,推測紅豆杉TmNAC21、39、40、44(NAP/ANAC3 亞家族)和TmNAC22(NAM 亞家族)可能在紅豆杉根系生長發(fā)育中起到重要調(diào)控作用。
本研究從紅豆杉轉(zhuǎn)錄組中鑒定出44 個NAC成員,發(fā)現(xiàn)紅豆杉NAC基因編碼的44 個蛋白在N 端均具有保守的NAC 結(jié)構(gòu)域,TmNAC 家族有很大可能與其他植物的NAC 蛋白功能相似。蛋白功能結(jié)構(gòu)域分析結(jié)果預(yù)示著紅豆杉NAC 家族成員可能在亞家族間以及亞家族內(nèi)部具有功能的特異性。表達量比較分析顯示,TmNAC基因在紅豆杉不同組織中的表達量各不相同,TmNAC21、22、39、40和44可能與紅豆杉根的生長發(fā)育有關(guān),為進一步探索紅豆杉NAC 轉(zhuǎn)錄因子調(diào)控紅豆杉根系生長提供理論基礎(chǔ)。