劉營,江姚蘭,尹澤,劉佳,張大為,吳金鋒,鄒子湘,周定港*,嚴明理*
(1.湖南科技大學生命科學學院,湖南 湘潭,411201;2.經(jīng)濟作物遺傳改良與綜合利用湖南省重點實驗室,湖南 湘潭,411201;3.中國農(nóng)業(yè)科學院油料作物研究所,湖北 武漢,430062)
甘藍型油菜作為我國重要的油料作物,常年種植面積在700 萬公頃(約1 億畝)以上,具有適應性強,生長速度快,生物量大等優(yōu)點[1]。隨著農(nóng)業(yè)機械化的要求越來越高,抗裂角資源的匱乏嚴重限制了機械化收割。因此,挖掘調(diào)控抗裂角性狀相關基因,對油菜的抗裂改良意義重大。
FUL(FRUITFULL)基因?qū)儆贛ADS-box 轉(zhuǎn)錄因子家族的一員,廣泛存在于真核生物中,在植物的生長發(fā)育中,特別是在被子植物的花器官分化、開花時間的調(diào)節(jié)以及果實的發(fā)育和成熟等方面起重要作用[2,3]。MADS-box 家族依據(jù)進化關系分為兩種類型:type I 型和type II 型[4]。FUL基因?qū)儆趖ype II型(又名MIKC型),通常在N端(M)具有高度保守的DNA 結合域(MADS-box),一般56~60 個氨基酸[5],“K”為第二保守結構域,具有螺旋結構,有助于蛋白之間形成二聚體,“I”和“C”結構域則保守性較低[6]。
FUL基因在模式植物擬南芥中研究較為深入,在擬南芥中僅有1 個FUL基因,且為第一個鑒定出的與擬南芥角果開裂有關的基因[7]。FUL基因在擬南芥的早期發(fā)育過程中不表達,在成熟期高表達;且突變體植株角果內(nèi)皮層細胞增多,成熟的種子自動從角果中脫落[8];而過表達AtFUL基因的擬南芥植株中,角果皮不能形成離區(qū),成熟時角果皮不開裂[9]。此外,F(xiàn)UL基因還參與調(diào)控擬南芥的葉片發(fā)育[10]、花序分化[11]、開花時間[12]和角果伸長[8]等。對油菜FUL基因的研究中,異位表達AtFUL基因能顯著增強芥菜型油菜角果的抗裂性[13];在甘藍型油菜中過表達與擬南芥FUL同源的白芥MADSB基因也提高了角果的抗裂性[14]。過表達GmFULa增加了大豆產(chǎn)量,而未改變開花時間和成熟度[15];番茄TDR4/FUL1和MBP7/FUL2這兩個基因在無乙烯的條件下,參與細胞壁修飾并影響果實成熟[16];黃瓜中,F(xiàn)UL的旁系同源基因Csa004592和Cs004120通過控制細胞分裂與細胞大小,從而調(diào)節(jié)黃瓜果實的長度[17]。
基于甘藍型油菜的基因組序列,本研究在全基因組水平上系統(tǒng)鑒定甘藍型油菜BnFUL 基因家族成員,并對其基本理化性質(zhì)、蛋白結構、基因結構、系統(tǒng)進化關系及共線性關系等進行分析。同時,基于轉(zhuǎn)錄組表達數(shù)據(jù)對該家族基因在不同品種、不同發(fā)育時期和不同部位的表達特性進行分析,以期為甘藍型油菜抗裂基因的功能闡釋和抗裂角種質(zhì)資源的培育奠定基礎。
基因組數(shù)據(jù)庫來自擬南芥基因組[18](https://www. arabidopsis. org/)和甘藍型油菜基因組[19](http://cbi. hzau. edu. cn/bnapus/index. php)。表達譜數(shù)據(jù)源自甘藍型油菜轉(zhuǎn)錄組數(shù)據(jù)庫[20](http://yanglab.hzau.edu.cn/BnTIR)。
以擬南芥AtFUL(AT5G60910.1)基因為種子序列進行本地blastp(參數(shù)為:1e-5),以初篩選序列繪制進化樹,結合Pfam(http://pfam. xfam. org/)和SMART(http://smart. emblheidelberg. de/)分析結構域,最終將與AtFUL聚為一支且均含有K-box 結構域和MADS_MEF2_like結構域的成員確定為甘藍型油菜BnFUL基因。鑒定所得成員,根據(jù)其在染色體的位置命名。
利用GSDS[21](http://gsds. gao-lab. org/)對甘藍型油菜FUL 基因家族進行結構分析。利用MEME[22](https://meme-suite. org/meme/tools/meme)進行蛋白保守基序預測。利用NCBI-CDD[23](https://www.ncbi. nlm. nih. gov/Structure/bwrpsb/bwrpsb. cgi)工具進行BnFUL 蛋白家族保守結構域分析。利用在線網(wǎng)站ExPASY(https://www. expasy. org/)和SOMPA(https://prabi.ibcp.fr/htm/site/web/home)對鑒定所得成員的蛋白序列進行一級結構和二級結構分析。利 用 PLANTCARE[24](http://bioinformatics. psb.ugent. be/webtools/plantcare/html/)進行啟動子區(qū)域順式作用元件分析。利用在線網(wǎng)站W(wǎng)oLF PSOORT(https://wolfpsort. hgc. jp/)和TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)進行亞細胞定位預測和跨膜結構域預測,并用TBtools(v1.0971)[25]進行可視化。
首先在Ensembl Plants 數(shù)據(jù)庫下載白菜和甘藍基因組信息,按照1.2 的標準分別鑒定白菜和甘藍物種中的FUL 家族基因成員;其次利用NCBI 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/)的BLAST 比對功能,獲取與甘藍型油菜BnFUL 家族基因相似性較高的其它十字花科植物序列信息;后利用MEGA X 軟件進行多序列比對,并采用鄰接法(Neighbor-Joining)構建系統(tǒng)進化樹,Bootstrap 值為1000[24]。利用TBtools 進行甘藍型油菜自身共線性及擬南芥與甘藍型油菜、擬南芥與甘藍、擬南芥與白菜物種間的共線分析,參數(shù)為1e-5。
將擬南芥AtFUL、白菜和甘藍的FUL基因(各3個)、甘藍型油菜的BnFUL基因(5個)及共線分析定位在ChrA09 上的基因位點(BnaA09T0074000ZS)進行多序列比對,并提交Pfam分析序列結構域特性。
甘藍型油菜BnFUL 基因家族在各個部位的基因表達量,由甘藍型油菜轉(zhuǎn)錄組數(shù)據(jù)庫(http://yanglab. hzau. edu. cn/BnTIR)獲得;不同品種甘藍型油菜BnFUL 基因家族各個時期的基因表達量,由甘藍型油菜泛基因組數(shù)據(jù)庫獲得(http://cbi. hzau. edu.cn/bnapus/index.php)。
通過BLAST 方法,并結合結構域篩選,在甘藍型油菜中共鑒定到5 個FUL基因,分別命名為Bn-FUL1(BnaA02G0391500ZS)、BnFUL2(BnaA03G040 4700ZS)、BnFUL3(BnaC02G0523700ZS)、BnFUL4(BnaC07G0377400ZS)和BnFUL5(BnaC09G0064500 ZS)。5 個BnFUL基因編碼的氨基酸數(shù)目為240~242,分子量為27 365.17~27 718.66 Da,理論等電點9.34~9.46,5個BnFUL基因所編碼蛋白之間理化性質(zhì)差異極小,說明該家族在其擴張過程中十分保守,極其穩(wěn)定。進一步分析發(fā)現(xiàn),BnFUL 蛋白不穩(wěn)定系數(shù)為45.89~53.87,脂溶性指數(shù)為83.29~88.63,親水性平均系數(shù)在-0.620~-0.718(表1);亞細胞定位預測結果顯示成員均定位在細胞核上。二級結構預測結果顯示:BnFUL蛋白二級結構中α-螺旋比例最高,達到51.87%~58.09%;且蛋白家族的二級結構組成較為一致,均為α-螺旋>無規(guī)則卷曲>延伸鏈>β-轉(zhuǎn)角(表2)。
表1 BnFUL蛋白理化特性Table 1 Protein physical and chemical properties of BnFUL proteins
表2 BnFUL蛋白二級結構組成Table 2 Secondary structure composition of BnFUL proteins
使用MEME 對甘藍型油菜BnFUL 蛋白進行保守Motif 預測,每個蛋白均含有7 個Motif,且排列方式與位置一致。利用Pfam 和NCBI 數(shù)據(jù)庫對甘藍型油菜5 條FUL 蛋白進行結構域分析,所有成員均含有一個K-box 結構域和一個MADS_MEF2_like 結構域,排列順序和相對位置無明顯差異。對其基因結構分析發(fā)現(xiàn),5 個成員中均沒有UTR(未翻譯區(qū)),且均含有8 個外顯子,僅呈現(xiàn)出外顯子位置的差異(圖1)。
圖1 甘藍型油菜BnFUL基因保守基序、結構域及基因結構Fig.1 Analysis of domain,motif and gene structure of BnFUL genes in Brassica napus
提取甘藍型油菜BnFUL 蛋白家族的上游3 kb啟動子序列進行順式作用元件分析(圖2),結果顯示甘藍型油菜BnFUL 蛋白啟動子區(qū)域存在眾多順式作用元件,主要分為3大類:一是與光響應相關的元件,例如:BOX 4、G-box、MRE、I-box、ACE、GATA-motif和LAMP-element等;二是與生物脅迫或非生物脅迫相關元件,例如:ARE、LTR、MBS 和TCrich repeats 等;三是與激素響應相關的元件,例:Pbox、TGA-box、TGACG-motif、CGTCA-motif、ABRE和AuxRR-core等。
圖2 甘藍型油菜BnFUL基因啟動子區(qū)域順式作用元件預測Fig.2 Prediction of cis-acting element of BnFUL genes in B.napus
為更深入地了解甘藍型油菜BnFUL基因家族的進化關系,利用TBtools 對甘藍型油菜自身以及擬南芥與甘藍、擬南芥與白菜、擬南芥與甘藍型油菜基因組之間進行共線性分析(圖3、4)。5 個BnFUL基因依次定位在染色體ChrA02、ChrA03、ChrC02、ChrC07 和ChrC09 上。共線結果顯示白菜和甘藍兩物種均有3 個FUL基因,可能與白菜和甘藍經(jīng)歷了全基因組三倍化事件有關。擬南芥與甘藍型油菜的共線分析及自身共線分析顯示,甘藍型油菜有6個BnFUL基因位點,與前文僅鑒定到5 個BnFUL 基因家族成員的結論不符,提示其可能在白菜和甘藍雜交及多倍化進程中A 基因組上的1 個拷貝丟失(BnaA09T0074000ZS)。
圖3 甘藍型油菜ZS11種內(nèi)共線性分析Fig.3 Analysis of collinearity in B.napus cv ZS11
圖4 擬南芥與白菜、甘藍及甘藍型油菜ZS11之間FUL基因家族共線性分析Fig.4 Collinearity analysis of FUL gene family in Arabidopsis thaliana with B.rapa,B.oleracea and B.napus(ZS11)
為明確甘藍型油菜ZS11 僅鑒定到FUL 基因家族的5個拷貝,而在A基因組上存在1個拷貝丟失的原因,我們對擬南芥、白菜、甘藍及甘藍型油菜ZS11的FUL 基因家族與BnaA09T0074000ZS 進行多序列比對(圖5)。結果顯示,潛在缺失基因(BnaA09T0074000ZS)編碼蛋白序列長度(403 aa)明顯大于白菜、甘藍和甘藍型油菜的FUL 蛋白序列(240~243 aa);進一步經(jīng)過Pfam鑒定發(fā)現(xiàn),該基因序列僅包含K-box 結構域,丟失了MADS_MEF2_like結構域,且有COBRA 結構域等其它序列的插入與融合,不符合FUL基因的鑒定標準,因此,該基因未被判定為BnFUL基因。
圖5 擬南芥、白菜、甘藍及甘藍型油菜ZS11的FUL基因家族與BnaA09T0074000ZS的多序列比對Fig.5 Multiple sequence alignment of FUL gene family in A.thaliana,B.rapa,B.oleracea,B.napus(ZS11)with BnaA09T0074000ZS
為進一步分析甘藍型油菜中FUL 家族基因蛋白的進化關系,在NCBI 數(shù)據(jù)庫中搜索并下載與At-FUL基因同源的其它十字花科植物氨基酸序列,并結合白菜和甘藍全基因組鑒定到的FUL基因,利用MEGA X 軟件,將5 個BnFUL與AtFUL及其它11 個FUL基因,分別為野生甘藍(B. oleraceavar.oleracea,XP_013618458.1)、花椰菜(Brassica oleraceavar.botrytis,CAD47849.1)、甘藍(B. oleracea)3 個、白菜(B. rapa)3 個、亞麻芥(Camelina sativa,XP_010456827.1) 、蘿 卜(Raphanus sativus,XP_018454622.1)和埃塞俄比亞芥(B. carinata,KAG2316775.1)的氨基酸序列進行多序列比對及系統(tǒng)進化樹分析(圖6)。結果表明:FUL基因在進化過程中十分保守,除白菜BraA09g36363Z在甘藍型油菜ChrA09 上無對應直系同源基因,其余2 個白菜FUL基因(BraA02g09072Z和BraA03g13786Z)及甘藍3 個FUL基因(BolC2g12170H、BolC7g44992H和BolC9g53713H)在甘藍型油菜中均有對應直系同源基因;這與甘藍型油菜是由白菜和甘藍雜交及染色體加倍而來的遺傳背景一致。另外野生甘藍(XP_013618458.1)和花椰菜(CAD47849.1)較甘藍(BolC2g12170H)與甘藍型油菜BnFUL3有更近的親緣關系。與擬南芥AtFUL親緣關系最近的是亞麻芥(XP_010456827.1)。
圖6 十字花科植物FUL基因系統(tǒng)發(fā)育樹Fig.6 Phylogenetic analysis of FUL gene in Brassicaceae
對8 種甘藍型油菜(ZS11、Quinta、Tapidor、Shengli、Zheyou、Gangan、Westar 和No2127)發(fā)育的T0(播種后24 d,溫度>10℃)、T1(播種后54 d,溫度<10℃)、T2(播種后82 d,溫度<10℃)、T3(播種后115 d,溫度<10℃)和T4(播種后147 d,溫度<10℃)五個不同時期的葉片進行了表達量分析(圖7)。結果發(fā)現(xiàn),在8 種甘藍型油菜的5 個發(fā)育時期中,T0 時期表達量最低,大部分未見表達;T2、T3 和T4 時期FUL基因表達量顯著上升,這與其在果實發(fā)育,角果形成中有重要作用相一致;其中BnFUL3表達量最高,且表達時間跨度最大;而BnFUL4在整個發(fā)育時期表達量偏低,尤其在T0 和T1 時期,眾多油菜品種該基因均未表達。另外,不同類型甘藍型油菜在同一發(fā)育時期中的表達量有所差別,不同類型甘藍型油菜的FUL基因家族表達模式不同。
圖7 BnFUL基因家族在8個甘藍型油菜品種5個不同發(fā)育時期表達量Fig.7 Expression of BnFUL gene family in 5 different developmental stages of 8 B.napus species
為了解BnFUL 基因家族在甘藍型油菜不同組織中的表達特征,以甘藍型油菜品種ZS11 為例,分析了BnFUL 家族基因在甘藍型油菜葉、莖、根以及角果等組織器官中的表達量,繪制表達模式熱圖(圖8),結果表明BnFUL基因在根、花粉和種子生殖生長時期中表達量低或不表達,在葉片、角果、角果殼和莖中均高表達。
圖8 甘藍型油菜FUL基因家族各個發(fā)育時期表達量Fig.8 Expression of FUL gene family in B.napus at different developmental stages
油菜BnFUL 基因家族在不同品種、不同時期及不同部位的表達情況分析表明,BnFUL基因表達存在明顯的組織特異性,且在油菜的生長發(fā)育與果實成熟過程中發(fā)揮重要作用。
本研究利用生物信息學的方法在甘藍型油菜中共鑒定到5 個BnFUL基因,都屬于MADS-box 轉(zhuǎn)錄因子家族,MADS-box 轉(zhuǎn)錄因子家族一般存在兩個結構域:K-box 主要參與蛋白的二聚體或多聚體的特異結合,MADS-box 能與DNA 結合并調(diào)控下游基因表達[15]。對其基因結構、所編碼蛋白的基序和結構域等方面進行分析,發(fā)現(xiàn)該家族成員在進化過程中比較保守,成員之間理化特性、蛋白結構域等均無明顯差異,僅有外顯子的排列位置差異較大。對其啟動子區(qū)域順式作用元件的分析顯示,BnFUL基因上游啟動子區(qū)域存在大量與光響應有關的元件,與其具有調(diào)控花發(fā)育的功能相一致,另有與生物脅迫、非生物脅迫和激素響應相關的元件,推測BnFUL基因可能在油菜的生長發(fā)育過程中起重要作用[2,3]。
蕓薹屬的白菜和甘藍在7500 年前經(jīng)全基因組三倍化后,進而雜交形成甘藍型油菜。白菜基因組和甘藍基因組中均鑒定到3 個FUL基因位點,理論上甘藍型油菜FUL基因應為6 個拷貝,且共線性分析顯示存在6 個共線性位點,與本文僅鑒定到5 個FUL基因結論不一致,提示其在A 基因組(ChrA09)上有該基因拷貝數(shù)的缺失。進一步分析該基因位點的缺失原因,我們將不一致的基因位點(BnaA09T0074000ZS)序列進行分析,發(fā)現(xiàn)該基因僅有K-box 結構域,但無MADS_MEF2_like 結構域,所編碼的氨基酸長度明顯大于其它成員,有COBRA 結構域等其它序列的插入與融合,表明在甘藍型油菜ChrA09 染色體上的部分基因片段可能在染色體加倍過程中發(fā)生了基因的斷裂和融合,導致部分基因的缺失。這與Sheng 等認為植物在基因組發(fā)生復制之后,往往出現(xiàn)大面積的基因丟失和染色體重排,用來維持代謝平衡或其它生長發(fā)育需要的觀點一致[26]。
植物中FUL基因不同的表達模式與其功能有明顯的相關性。例如,禾本科植物小麥(Triticum aestivum)的3 個FUL基因,WFUL1在葉片中表達,WFUL2調(diào)控外稃和外稃發(fā)育,而WFUL3則參與調(diào)控果實發(fā)育[27]。豆科植物苜蓿(Medicago truncatula)中的3 個MtFUL基因:MtFULa和MtFULb在各階段均有表達,開花前表達量最高,主要促進開花;而MtFULc主要在開花后表達,促進花的發(fā)育;同時在擬南芥中異源過表達MtFUL造成擬南芥開花提前[28]。本次結合公開數(shù)據(jù)對BnFUL基因表達譜進行分析,8個甘藍型油菜品種在5個不同時期的分析顯示:T3 時期(播種后115 d)各個基因的表達量均高于其它時期,BnFUL3更為明顯,且在不同品種間均高表達;相比之下,BnFUL4表達量較其它時期沒有顯著變化。進一步結合油菜品種ZS11 在各個生長階段的表達量分析:BnFUL在葉、莖、花、長角果發(fā)育初期和角果殼中持續(xù)高表達,而在果實、花粉和根中基本不表達。BnFUL 蛋白保守基序基本相似,只有在“C”末端氨基酸區(qū)域相似度不高,結合表達譜表達模式的不同,推測BnFUL4可能與其它Bn-FUL基因間在功能上存在差異。
彭鵬飛等在擬南芥中過表達BnFUL能提高擬南芥角果的抗裂性,同時促進早開花,甚至表現(xiàn)出一個果柄多角果的現(xiàn)象[29]。因此,F(xiàn)UL基因可作為篩選和開發(fā)抗裂種質(zhì)資源的重要候選基因,后期可利用CRISPR-Cas9 技術和基因工程等方法促進Bn-FUL在甘藍型油菜自身中表達,來獲得優(yōu)質(zhì)油菜新種。本文基于甘藍型油菜基因組序列,從全基因組角度系統(tǒng)鑒定并對甘藍型油菜的BnFUL 基因家族成員進行基本理化特性、進化發(fā)育關系和表達模式分析,利于闡釋甘藍型油菜BnFUL 基因家族的功能,為油菜的分子育種尤其是甘藍型油菜抗裂基因的挖掘和抗裂角油菜新品種的培育提供依據(jù)。