谷 佳, 王童欣, 饒 英, 潘慶龍, 李霆格, 趙 瑩, 周 揚(yáng), 彭 婷, 王 健
(1.熱帶特色林木花卉遺傳與種質(zhì)創(chuàng)新教育部重點(diǎn)實(shí)驗室/海南省熱帶特色花木資源生物學(xué)重點(diǎn)實(shí)驗室/海南大學(xué)林學(xué)院,海南???570228;2.貴州大學(xué)農(nóng)學(xué)院,貴州貴陽 550025)
植物在生長發(fā)育過程中受到多種轉(zhuǎn)錄因子調(diào)控,如WRKY、MYB、AP2/ERF轉(zhuǎn)錄因子等[1],其中MYB家族具有特定的保守結(jié)構(gòu)域,根據(jù)其結(jié)構(gòu)域重復(fù)的次數(shù)可分為4R-MYB、3R-MYB、1R-MYB、R2R3-MYB 等4類,其中R2R3-MYB 轉(zhuǎn)錄因子是MYB家族中最重要的、目前研究最廣泛的一類轉(zhuǎn)錄因子,在植物體內(nèi)廣泛存在[2]。MYB轉(zhuǎn)錄因子對植物具有重要影響,可以參與植物根、莖、葉和花的生長[3],也可調(diào)控植物代謝,如調(diào)節(jié)類黃酮、花青素等物質(zhì)合成[4]。目前,通過基因組以及轉(zhuǎn)錄組數(shù)據(jù)對物種進(jìn)行MYB基因家族進(jìn)行鑒定,從而對物種生長發(fā)育進(jìn)一步進(jìn)行研究探索,已經(jīng)在擬南芥(Arabidopsisthaliana)、彩葉楊(Populusdeltoids)、甘蔗(Saccharumsp.)等物種進(jìn)行MYB基因家族研究,如擬南芥中發(fā)現(xiàn)含有126個R2R3-MYB、64個1R-MYB、5個3R-MYB、1個4R-MYB[2],在彩葉楊中已被鑒定出183 個R2R3-MYB、 5個3R-MYB、1個4R-MYB和 113個1R-MYB[5],在甘蔗中鑒定出57個R2R3-MYB、13個1R-MYB[6],進(jìn)行基因家族的鑒定已經(jīng)成為MYB功能挖掘的重要研究手段。
三色堇(Viola×wittrikiananGams.)為堇菜科堇菜屬植物,是常見的花卉植物,因其花斑形狀多樣,顏色多彩而具有較高的觀賞價值和經(jīng)濟(jì)價值,國內(nèi)外應(yīng)用十分廣泛。目前,對三色堇MYB基因家族分析未見報道,其在三色堇中基因功能尚不清楚。本研究通過對三色堇3代全長轉(zhuǎn)錄組測序,在三色堇3代全長轉(zhuǎn)錄組數(shù)據(jù)的基礎(chǔ)上鑒定出三色堇MYB轉(zhuǎn)錄因子并對其序列特征、蛋白質(zhì)保守基序、進(jìn)化關(guān)系等進(jìn)行分析,對挖掘三色堇中具有特殊功能的MYB基因具有重要的意義。
材料使用花瓣為黃底紫斑的三色堇(Viola×wittrockianaGams.)夢蝶,2020年1月種植于海南大學(xué)林學(xué)院基地,播種3個月后采摘三色堇植株的根、莖、葉、花并均勻混合,置于液氮中速凍,送廣州基迪奧生物科技有限公司利用單分子實(shí)時測序技術(shù)(SMRT)進(jìn)行三色堇3代全長轉(zhuǎn)錄組測序。蛋白序列源于本測序上傳的所有轉(zhuǎn)錄組數(shù)據(jù)庫,擬南芥MYB家族氨基酸序列下載于Plant TFDB 3.0。
從Pfam 31.0數(shù)據(jù)庫下載MYB結(jié)構(gòu)域種子文件(PF00249),之后利用HMMER 3.2.1 軟件創(chuàng)立Profile HMM(數(shù)值表格型隱馬可夫模型)[7],檢索三色堇轉(zhuǎn)錄數(shù)據(jù),對檢索結(jié)果去冗余,得到候選VwMYB蛋白序列。候選蛋白序列用SMART軟件預(yù)測[8],再通過NCBI的Blastp分析,去除重復(fù)序列,得到三色堇MYB序列蛋白。利用在線工具 ExPAS軟件對三色堇 MYB轉(zhuǎn)錄因子家族成員的蛋白分子量(pW)、蛋白長度以及等電點(diǎn)(pI)等基本屬性進(jìn)行分析[9];利用CELLO v.2.5軟件進(jìn)行亞細(xì)胞定位預(yù)測[10]。
使用軟件MEGA-X中的ClustalW 對三色堇R2R3-MYB進(jìn)行多序列比對,再利用 WebLogo軟件獲取序列標(biāo)識。利用在線網(wǎng)站MEME和TBtools軟件分析三色堇MYB轉(zhuǎn)錄因子蛋白保守基序序列[11]。
使用 MEGA-X軟件,利用鄰域連接(NJ)法,設(shè)置bootstrap(n=1 000)進(jìn)行系統(tǒng)發(fā)育分析[12]。
以MYB結(jié)構(gòu)域序列作為靶序列,利用三色堇全長轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行篩選,得到141個MYB 轉(zhuǎn)錄因子,后通過SMART與Blastp 2次篩選最終得到121個MYB,分別編號VwMYB1~VwMYB121,其中共包含61個1R-MYB、57個R2R3-MYB以及3個 3R-MYB 類轉(zhuǎn)錄因子。
對三色堇MYB轉(zhuǎn)錄因子家族成員的氨基酸序列、分子量、等電點(diǎn)進(jìn)行分析,結(jié)果表明,三色堇MYB基因家族中,序列最長的為VwMYB61(Isoform0000184),有1 996個氨基酸殘基,最短的為VwMYB91(Isoform0026081),有119個氨基酸殘基;等電點(diǎn)從10.16 (VwMYB43,Isoform0045501)到4.44 (VwMYB75,Isoform0008562);分子量從13.9 ku(VwMYB91,Isoform0026081)到216.3 ku (VwMYB61,Isoform0000184)。蛋白亞細(xì)胞定位預(yù)測顯示,多數(shù)MYB定位到細(xì)胞核,還有部分定位到細(xì)胞質(zhì)、線粒體等(表1)。
表1 三色堇MYB轉(zhuǎn)錄因子基本信息
表1(續(xù))
表1(續(xù))
表1(續(xù))
對121個三色堇MYB轉(zhuǎn)錄因子進(jìn)行保守基序分析,獲得 20種保守motif元件(圖1),其中分布頻次最高的是motif2(15.2%),其次是motif4 (12.6%),最低的是motif20 (0.3%)(圖2)。不同MYB蛋白的motif數(shù)量與分布存在差異,多數(shù)motif 元件分布在 N 端,少數(shù)(如 motif9)分布在MYB的C端,同一個亞組的基因具有相似基序,根據(jù)親緣性說明其具有相似功能,同時序列所含motif數(shù)量、類型與分布存在不同,表明不同基因功能之間具有差異,也存在一些高頻率基序,如motif 2幾乎存在于每一個亞組中,反映這個基序?qū)wMYB蛋白功能具有重要性。
R2和R3的保守結(jié)構(gòu)域是識別MYB序列所必需的,通過WebLogo對三色堇的57個R2R3MYB序列位點(diǎn)信息進(jìn)行分析,從圖3中可看出,三色堇R2R3-MYB類轉(zhuǎn)錄因子結(jié)構(gòu)域存在R2R3MYB特有的W型保守氨基酸,R2 MYB與R3 MYB的結(jié)構(gòu)域均含有52個氨基酸殘基,R2 MYB包含3個高度保守的色氨酸殘基(W)(圖3-A),R3 MYB第1個色氨酸(第925位)被亮氨酸(L)所取代(圖3-B),只有2個色氨酸殘基(W)。三色堇保守結(jié)構(gòu)域特點(diǎn)與已報道擬南芥、辣椒、梨等物種一致[13]。
將三色堇R2R3-MYB和擬南芥MYB蛋白家族進(jìn)行系統(tǒng)發(fā)育分析,根據(jù)樊錦濤等對擬南芥R2R3-MYB族群的劃分依據(jù),對三色堇R2R3-MYB類轉(zhuǎn)錄因子劃分亞群,結(jié)果見圖4[14]。三色堇R2R3-MYB類轉(zhuǎn)錄因子可劃分為30個亞群(A1~A30),有8個亞群不能與擬南芥聚類,其他22個亞群可以聚類到擬南芥S1、S4、S6、S7、S9、S16、S18、S22、S23亞群中。聚類在同一個亞群的基因具有較高的同源性與序列相似性,并可能具有類似的功能[15]。
三色堇沒有參考基因組,這限制了對三色堇的深入研究,但利用3代測序技術(shù)可以快速得到全長轉(zhuǎn)錄組,獲得植物大部分有效的基因表達(dá)信息,是對非模式植物研究的新方法。本研究利用3代測序得到三色堇全長轉(zhuǎn)錄本,分析得到121個MYB轉(zhuǎn)錄因子,接近已報道玉米基因組分析發(fā)現(xiàn)的132個ZmMYB基因[16],明顯高于亞洲百合基于2代轉(zhuǎn)錄組測序結(jié)果發(fā)現(xiàn)的69個LaMYB基因[17],表明3代測序獲得高質(zhì)量的cDNA全長序列與基因信息,為三色堇MYB轉(zhuǎn)錄因子研究提供有效參考。
MYB轉(zhuǎn)錄因子N端包含保守DNA 結(jié)合域,該結(jié)合域由1~4個不完全重復(fù)序列(R)構(gòu)成,每個重復(fù)序列約52個氨基酸,構(gòu)成3個α-螺旋[18],其中第2和第3螺旋(R2和R3)形成 HLH(Helix-Loop-Helix)結(jié)構(gòu)與目標(biāo)基因結(jié)合[19]。本研究獲得的三色堇MYB轉(zhuǎn)錄因子全部包含上述的R序列,共有61個1R-MYB、57個R2R3-MYB、3個3R-MYB類轉(zhuǎn)錄因子,符合MYB轉(zhuǎn)錄因子基因家族的基本結(jié)構(gòu)特征。在大部分MYB轉(zhuǎn)錄因子中,N端保守性更高,C端序列具有可變性,負(fù)責(zé)蛋白質(zhì)活性調(diào)節(jié),MYB轉(zhuǎn)錄因子具有通過其保守的N端結(jié)構(gòu)域轉(zhuǎn)錄調(diào)節(jié)C端結(jié)構(gòu)域參與復(fù)雜的生理過程[20],這與本研究中三色堇MYB轉(zhuǎn)錄因子的大部分motif 元件集中、規(guī)律地分布在N端,少數(shù)無規(guī)律地分布在 MYB 的C端的保守基序結(jié)構(gòu)特點(diǎn)一致,表明MYB基因家族可以通過其特殊的保守結(jié)構(gòu)域進(jìn)行識別以及對基因功能產(chǎn)生影響。
R2R3-MYB是目前研究最廣的轉(zhuǎn)錄因子,參與植株生長發(fā)育、代謝調(diào)節(jié)、表皮細(xì)胞形態(tài)分化等功能調(diào)控[21]。本研究中將三色堇57個R2R3-MYB與擬南芥共同進(jìn)行系統(tǒng)發(fā)育進(jìn)化分析,其中一些三色堇轉(zhuǎn)錄因子與擬南芥處于同一分支, 表明這2個物種的MYB基因家族具有部分相同的進(jìn)化過程。一般來說,聚集在同一個分支的基因親緣關(guān)系相近,其在功能上也具有相似性,如居利香等利用該方法認(rèn)證多個與辣椒相關(guān)的轉(zhuǎn)錄因子,其中CaMYB141、CaMYB71與擬南芥亞組20中的AtMYB2聚為一類,認(rèn)為CaMYB141、CaMYB71與AtMYB2功能相似,均可在干旱條件下增加辣椒素含量[22]。本研究中,三色堇中的VwMYB48、VwMYB53、VwMYB47、VwMYB52與擬南芥亞組4中的AtMYB3、AtMYB4、AtMYB7、AtMYB32聚為一類,表明三色堇中VwMYB48、VwMYB53、VwMYB47、VwMYB52可能參與植物生長過程中的生物協(xié)迫與非生物脅迫調(diào)節(jié)過程[23]。VwMYB40、VwMYB35與擬南芥亞組1中的AtMYB30、AtMYB96關(guān)系最近,AtMYB30、AtMYB96與激素調(diào)節(jié)有關(guān),且主要關(guān)于脫落酸與水楊酸,而脫落酸影響花青素的合成[24],推測三色堇中VwMYB40、VwMYB35通過調(diào)節(jié)激素的合成從而影響花青素的合成。同理,三色堇中VwMYB39、VwMYB36、VwMYB43、VwMYB41與擬南芥第七亞組中的AtMYB11、AtMYB12和AtMYB111聚為一類,已有研究表明AtMYB11、AtMYB12、AtMYB111與黃酮醇生物合成相關(guān)[25],因此VwMYB39、VwMYB36、VwMYB43、VwMYB41也可能參與三色堇中黃酮醇生物合成,調(diào)節(jié)植物代謝活動。VwMYB51、VwMYB54與擬南芥亞組6中的AtMYB75、AtMYB90、AtMYB113、AtMYB114最相近,而AtMYB75、AtMYB90、AtMYB113、AtMYB114是控制植物花青素合成的基因[26],表明三色堇的花色形成可能受到VwMYB51、VwMYB54調(diào)節(jié),這2個轉(zhuǎn)錄因子可能參與三色堇花青素合成[27]。但是,有一部分三色堇MYB與擬南芥分支不同,如A1分支不含有任何AtMYB,這種轉(zhuǎn)錄因子的特異性可能是物種后期進(jìn)化分離導(dǎo)致[28]。當(dāng)然,上述論述只是基于基因結(jié)構(gòu)相似性的推測,是否具有相應(yīng)的功能及其作用機(jī)制,還需要進(jìn)一步研究闡明。