方亦圓,嚴(yán) 維,吳建新,殷冬梅,唐曉艷,3*
(1.華南師范大學(xué) 生命科學(xué)學(xué)院,廣東省植物發(fā)育生物工程重點實驗室,廣州 510631;2.河南農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,鄭州 450002;3.深圳市作物分子設(shè)計育種研究院,廣東 深圳 518107)
MYB轉(zhuǎn)錄因子是植物中最大的轉(zhuǎn)錄因子家族之一,廣泛參與植物生理生化過程,包括植物表皮組織細(xì)胞分化、外界環(huán)境因素響應(yīng)、激素應(yīng)答等[1-2]。MYB家族成員都具有非常保守的MYB結(jié)構(gòu)域。MYB結(jié)構(gòu)域在三維空間中構(gòu)成3個α-螺旋,第二個和第三個螺旋以三個色氨酸殘基為疏水核心構(gòu)成“螺旋-轉(zhuǎn)角-螺旋”結(jié)構(gòu),MYB轉(zhuǎn)錄因子通過該結(jié)構(gòu)與DNA結(jié)合[3]。MYB結(jié)構(gòu)域可分為3種,分別為R1、R2和R3,它們在堿基數(shù)目和色氨酸保守性上有所不同。根據(jù)MYB結(jié)構(gòu)域數(shù)量,MYB基因可分為1R-MYB、2R-MYB、3R-MYB和4R-MYB四個基因亞家族,其中1R-MYB的MYB結(jié)構(gòu)域主要為R1或R3,2R-MYB主要為R2R3,3R-MYB主要為R1R2R3,4R-MYB主要為R1和R2[4-5]。
自PAZ-ARES等[6]第一次在玉米中發(fā)現(xiàn)植物MYB轉(zhuǎn)錄因子后,研究人員已先后對擬南芥和水稻[7]、西瓜[8]、棉花[9]、大豆[10]、中國棗[11]、苜蓿[12]等植物中MYB轉(zhuǎn)錄因子的功能進(jìn)行了相關(guān)研究。研究表明,MYB轉(zhuǎn)錄因子的功能多種多樣,對植物的生長發(fā)育至關(guān)重要。例如,MYB轉(zhuǎn)錄因子可通過控制各個細(xì)胞分裂時期來實現(xiàn)對細(xì)胞周期的調(diào)控[13-15],也可通過調(diào)節(jié)植物次生代謝相關(guān)基因的表達(dá)來調(diào)節(jié)花青素、類黃酮等次生代謝產(chǎn)物的合成[16-19],在非生物脅迫和生物脅迫響應(yīng)中也扮演了重要的角色[20-27]。此外,MYB轉(zhuǎn)錄因子還能調(diào)控植株對植物激素的響應(yīng)[28-29]。
栽培花生是世界上最重要的油料和糧食作物之一[30],研究花生功能基因?qū)μ嵘a(chǎn)量及品質(zhì)具有重要意義。目前,對栽培花生MYB轉(zhuǎn)錄因子家族基因的整體研究較少,僅Chen等[31]鑒定了30個MYB轉(zhuǎn)錄因子,鑒定數(shù)量少,鑒定方法也有改良空間,因此,有必要進(jìn)行更全面的鑒定和分析工作。鑒定及分析花生MYB基因家族的功能有助于為該類基因?qū)ㄉ纳L發(fā)育調(diào)控功能研究提供參考。2019年,Bertioli等[32]和Zhuang等[30]分別完成了栽培花生基因組的全基因組測序及組工作,為栽培花生全基因組范圍MYB轉(zhuǎn)錄因子基因家族的系統(tǒng)鑒定、功能分析提供了條件。本研究基于花生的基因組序列信息,篩選并鑒定栽培花生MYB轉(zhuǎn)錄因子家族成員,分析其蛋白保守結(jié)構(gòu)域、系統(tǒng)發(fā)育和共線性等信息,同時利用花生的轉(zhuǎn)錄組數(shù)據(jù),研究MYB轉(zhuǎn)錄因子成員在栽培花生不同組織和不同發(fā)育時期的表達(dá)模式以及部分同源基因?qū)Φ谋磉_(dá)偏向,為后續(xù)的功能研究奠定基礎(chǔ)。
RNA-Seq數(shù)據(jù)來源于NCBI項目 PRJNA419393,參考基因組來源于花生數(shù)據(jù)網(wǎng)站PeanutBase(https://peanutbase.org)。
通過以下途徑獲得候選AhMYB基因:1)在PeanutBase數(shù)據(jù)庫中以“MYB”為關(guān)鍵字搜索栽培花生的基因注釋信息;2)使用blastp比對花生蛋白序列和擬南芥已知MYB蛋白(e-value<1x10-3)。獲得全部候選基因后,去除重復(fù)基因,提取最長蛋白序列,采用hmmsearch鑒定候選基因MYB結(jié)構(gòu)域(e-value<1x10-5),同時提交至SMART、Pfam數(shù)據(jù)庫,對MYB結(jié)構(gòu)域可信度進(jìn)行重復(fù)確認(rèn)(SMART:e-value<1x10-5或PFam:e-value<1x10-8),最終確定可靠的AhMYB基因。
提取所有候選花生MYB蛋白序列,對于有多個轉(zhuǎn)錄本的基因選取最長蛋白序列,使用ClustalW進(jìn)行序列比對;利用MEGA 7.0根據(jù)鄰接法(Neighbour-joining,NJ)構(gòu)建MYB基因系統(tǒng)發(fā)育樹,依據(jù)具有的MYB保守結(jié)構(gòu)域數(shù)目和特征,將栽培花生的MYB轉(zhuǎn)錄因子歸類到1R-MYB、2R-MYB、3R-MYB、4R-MYB4個亞家族中;根據(jù)栽培花生各MYB轉(zhuǎn)錄因子基因在染色體上的位置順序信息對各基因進(jìn)行命名。所有AhMYB的位置分布情況使用TBtools中的Gene distribution功能進(jìn)行可視化。
通過blastn比對MYB基因序列(e-value <1x10-10),初步獲得MYB基因之間的相似性,利用MCScanX進(jìn)一步分析MYB轉(zhuǎn)錄因子基因之間的同線性關(guān)系(e-value <1x10-5),使用Circos對結(jié)果進(jìn)行可視化。根據(jù)Bertioli等[32]發(fā)現(xiàn)的部分同源基因?qū)虯hMYB基因同線性分析結(jié)果,確認(rèn)AhMYB部分同源基因?qū)Α?/p>
為了分析花生MYB轉(zhuǎn)錄因子的時空表達(dá)模式,從NCBI下載了19個花生不同組織樣品的RNA-seq數(shù)據(jù)(PRJNA419393),利用Salmon v1.0.0分析MYB基因在每個樣品中的表達(dá)量,計算MYB轉(zhuǎn)錄因子在不同時空條件中的表達(dá)水平(Transcripts Per Million mapped reads,TPM值),使用R package:pheatmap展示MYB基因在各組織中的表達(dá)情況。
使用R包DESeq2對同一組織中的同源基因?qū)Ρ磉_(dá)量進(jìn)行分析,鑒定同源表達(dá)偏向的MYB基因?qū)Α@肂enjamini 和Hochberg方法對P值進(jìn)行調(diào)整以控制錯誤率。部分同源偏向表達(dá)基因?qū)Y選條件為:1)調(diào)整后P值(FDR)<0.05;2)|差異倍數(shù)log2(fold change)| ≥1。使用R包pheatmap繪制相關(guān)熱圖。
根據(jù)AhMYB是否具有同源性以及所在基因?qū)κ欠窬哂衅蛐裕瑢hMYB分為四類,分別為A偏向性、B偏向性、無偏向性以及不成對基因,使用AgriGOv2[33](http://systemsbiology.cau.edu.cn/agriGOv2/)逐一進(jìn)行功能富集分析。
根據(jù)PeanutBase參考蛋白序列,選取每個基因最長的蛋白序列作為該基因的代表序列,通過hmmsearch、blast初步獲得MYB轉(zhuǎn)錄因子成員,隨后用SMART和Pfam確認(rèn)MYB結(jié)構(gòu)域(SANT結(jié)構(gòu)域)是否存在,最終確定443個MYB基因(見表1)。按照每個MYB轉(zhuǎn)錄因子具有的MYB保守結(jié)構(gòu)域數(shù)量,將鑒定到的MYB轉(zhuǎn)錄因子分別歸類到1R-MYB、2R-MYB、3R-MYB和4R-MYB類型,最終確定1R-MYB轉(zhuǎn)錄因子219個,2R-MYB(R2R3-MYB)轉(zhuǎn)錄因子209個,3R-MYB(R1R2R3-MYB)轉(zhuǎn)錄因子12個,4R-MYB轉(zhuǎn)錄因子3個。
表 1 花生MYB轉(zhuǎn)錄因子不同亞家族在花生染色體組上的分布情況Table 1 Different subfamilies of AhMYB transcription factors distributed on cultivated peanut chromosomes
依據(jù)基因注釋信息,獲得443個MYB基因在染色體上的分布情況(見表1),并依據(jù)分布位置信息和基因組來源命名為AhMYB1A到AhMYB443B。其中,AhMYB1A至AhMYB217A分布于A亞基因組上,AhMYB218B至AhMYB443B分布在B亞基因組上,說明B基因組有更多的MYB基因。AhMYB基因在染色體上的分布和密度并不均勻。AhMYB基因數(shù)目最多的同源染色體對為8號(A08-B08)與3號(A03-B03),均有64個AhMYB基因。成員最少的染色體對是10號染色體對(AhA10-AhB10),僅有25個AhMYB基因。此外,大多數(shù)AhMYB基因成簇分布于染色體兩端,其中有15對基因形成串聯(lián)重復(fù)基因(見圖1),如A3染色體上的AhMYB51A/AhMYB52A、B5的AhMYB313B/AhMYB314B、B8染色體的AhMYB386B/AhMYB387B等,這可能與染色體兩端多處于常染色質(zhì)狀態(tài),在減數(shù)分裂過程中更易發(fā)生基因重組交換和基因重復(fù)有關(guān)。
圖1 443個AhMYB基因在栽培花生基因組上的分布情況Fig.1 Distribution of 443 AhMYB genes on cultivated peanut chromosomes注:紅顏色字體標(biāo)注的基因代表串聯(lián)重復(fù)基因。Notes:Genes highlighted in red are tandem repeat.
植物MYB轉(zhuǎn)錄因子的MYB結(jié)構(gòu)域共有三種類型,分別為R1,R2以及R3,其中R1主要分布于1R-MYB轉(zhuǎn)錄因子中,R2和R3主要分布于2R-MYB轉(zhuǎn)錄因子中。在MYB結(jié)構(gòu)域中,色氨酸殘基是DNA結(jié)合域的疏水核心殘基,對結(jié)合域空間結(jié)構(gòu)的維持非常重要,也是關(guān)鍵的MYB結(jié)構(gòu)域識別堿基[34]。為分析花生MYB轉(zhuǎn)錄因子的MYB保守結(jié)構(gòu)域,對鑒定到的209個2R-MYB轉(zhuǎn)錄因子及219個1R-MYB轉(zhuǎn)錄因子的MYB結(jié)構(gòu)域進(jìn)行提取和分析。結(jié)果表明(見圖2),花生MYB結(jié)構(gòu)域約含51個氨基酸殘基。分析結(jié)果顯示,在三種MYB結(jié)構(gòu)域中,R2的3個色氨酸保守度最高,R3第一個保守色氨酸殘基(W)會被苯丙氨酸(F)、異亮氨酸(I)或亮氨酸(L)替代;R1結(jié)構(gòu)域第三個保守色氨酸殘基會被亮氨酸(L)或丙氨酸(A)替代,第二個保守色氨酸殘基也存在被脯氨酸(P)替代的情況。整體而言,三種MYB結(jié)構(gòu)域的色氨酸殘基均存在被其它疏水氨基酸替代的情況,但相較于其它氨基酸殘基,色氨酸殘基的保守程度依然是極高的。除了色氨酸殘基,MYB結(jié)構(gòu)域中還有其它保守性較高的氨基酸殘基,如首個保守疏水殘基近旁的谷氨酸(E)和天冬氨酸(D)。此外,R2和R3均具有特異的保守氨基酸,如R2結(jié)構(gòu)域中靠近第三個色氨酸殘基的精氨酸(R)和半胱氨酸(C),R3結(jié)構(gòu)域中靠近第二個色氨酸殘基的甘氨酸(G)和天冬酰胺(N)等。這些保守性較高的氨基酸殘基很可能與保守的色氨酸殘基共同維持花生MYB轉(zhuǎn)錄因子的DNA結(jié)合域結(jié)構(gòu),保證轉(zhuǎn)錄因子的功能??傮w而言,在MYB結(jié)構(gòu)域識別位點的保守性上,R1結(jié)構(gòu)域的保守性最低,R3結(jié)構(gòu)域保守性較高,R2結(jié)構(gòu)域保守性最高。
圖2 花生MYB轉(zhuǎn)錄因子DNA結(jié)構(gòu)域Fig.2 DNA binding domain of MYB transcription factors in pea nut
根據(jù)花生MYB轉(zhuǎn)錄因子蛋白序列以鄰接法(Neighbor Joining)構(gòu)建系統(tǒng)發(fā)育樹,同時展示花生MYB轉(zhuǎn)錄因子上MYB結(jié)構(gòu)域的分布情況(見圖3)。發(fā)育樹顯示,各亞家族總體上擁有各自的進(jìn)化分枝,說明花生MYB轉(zhuǎn)錄因子在進(jìn)化上有不同程度的分化。然而部分2R-MYB轉(zhuǎn)錄因子雖然擁有兩個MYB結(jié)構(gòu)域,但結(jié)構(gòu)域的分布并不典型,如AhMYB62A、AhMYB259B、AhMYB205A、AhMYB424B等,蛋白序列中兩個MYB結(jié)構(gòu)域之間的距離較遠(yuǎn),在進(jìn)化上也更接近1R-MYB轉(zhuǎn)錄因子。同樣地,少數(shù)1R-MYB轉(zhuǎn)錄因子在序列上也與2R-MYB轉(zhuǎn)錄因子更為相近。3R-MYB在進(jìn)化上與2R-MYB更接近。在大多數(shù)分支末端中,MYB轉(zhuǎn)錄因子基因分別來自A、B基因,說明花生MYB轉(zhuǎn)錄因子的蛋白序列在亞基因組間具有相似性。
圖3 花生443個AhMYB基因系統(tǒng)發(fā)育Fig.3 Phylogenetic analysis of 443 AhMYB genes注:橙色基因名代表A基因組基因,綠色基因名代表B基因組基因。Notes:Orange name represents genes from A genome,and green name represents genes from B genome.
花生基因組內(nèi)部AhMYB基因也存在大量亞基因組內(nèi)的旁系同源關(guān)系,可能由染色體大片段重復(fù)而來,使AhMYB基因家族得到了進(jìn)一步的擴(kuò)張(見圖4(a),圖4(b))。此外,A、B基因組之間存在大量的AhMYB直系同源基因(見圖4(c))。在這些同源基因中,存在染色體定位對應(yīng)關(guān)系的基因?qū)礃?gòu)成部分同源基因?qū)?homoeologous gene pair)[35]。結(jié)合Bertioli等[32]的研究結(jié)果和同線性分析結(jié)果,我們共鑒定到170對AhMYB同源基因?qū)?見圖4(c)),涵蓋了327個AhMYB基因和13個與AhMYB基因配對但無完整MYB結(jié)構(gòu)域的MYB-like基因,這說明MYB轉(zhuǎn)錄因子在祖先種雜交加倍進(jìn)化形成的栽培花生亞基因組水平上保持了較高的相似性。
圖4 AhMYB基因同線性關(guān)系Fig.4 Synteny of AhMYB genes注:紅色代表部分同源基因?qū)?,黃色代表A/B基因組不同染色體上的基因同線性。Notes:Red lines represent homeologous gene pairs;yellow lines represent gene synteny on different chromosomes between A/B genome.
MYB基因的表達(dá)與植物的生長發(fā)育密切相關(guān)。利用轉(zhuǎn)錄組數(shù)據(jù)分析MYB基因的時空表達(dá)模式能夠為探究MYB轉(zhuǎn)錄因子的功能提供線索。轉(zhuǎn)錄組數(shù)據(jù)來自Clevenger等[36]的研究,其樣品共有19個組織和時期,分別是屬于營養(yǎng)生長組織的根瘤、根、莖(主莖尖、側(cè)莖尖)、幼芽葉、葉(主莖葉、側(cè)莖葉)和屬于生殖生長組織的花、雌蕊、雄蕊、莢針(地上、地下)、莢皮(3期、5期)、莢果(3期、5期、6期、7期、8期、10期)。根據(jù)部分同源基因?qū)ε鋵η闆r,AhMYB基因被分為“配對”和“無配對”兩組,共獲得116個無配對的AhMYB基因和170對AhMYB部分同源基因?qū)Α=Y(jié)果表明,不同AhMYB基因的表達(dá)模式存在非常大的差異(見圖5)。在116個無配對的AhMYB基因中(見圖5(a)),有21個基因在19個組織中均維持低表達(dá)量(TPM <1),有20個基因在19個組織中均維持較高表達(dá)量(TPM ≥ 1),只在營養(yǎng)生長組織中或生殖生長組織中高或較高表達(dá)的無配對AhMYB基因分別有8個和13個。在170對AhMYB部分同源基因?qū)χ?見圖5(b)),有9對在19個組織中均維持低表達(dá)量,有29對在19個組織中均維持較高表達(dá)量,只在營養(yǎng)生長組織或生殖生長組織中高或較高表達(dá)的AhMYB基因?qū)Ψ謩e有21對和14對,以上結(jié)果表明,不同的AhMYB基因在不同的時空條件下發(fā)揮轉(zhuǎn)錄調(diào)控的功能,其功能很可能差異且互補。
圖5 AhMYB基因各組織表達(dá)分析Fig.5 Expression analysis of AhMYB genes in diverse tissues and different stages注:TPM:每百萬轉(zhuǎn)錄本,相對表達(dá)量計量單位。組織類型(從左至右):Nod,根瘤;Root,根;VegSht,主莖;RepSht,側(cè)莖;Seedling_Leaf,幼芽葉;Main_Leaf,主莖葉 Lat_Leaf,側(cè)莖葉;Flwr,花;Pistil,雌蕊;Stamen,雄蕊;AerPeg,地上莢針;SubPeg,地下莢針;PerPt5,莢皮(第5時期);PerPt6,莢皮(第6時期);PodPt3,莢果(第5時期);SdPt6,莢果(第6時期);SdPt7,莢果(第7時期);SdPt8,莢果(第8時期);SdPt10,莢果(第10時期)。Notes:TPM:transcript per million,unit of relative expression level.The tissues are(from left to right):Nod,nodule;Root,root;VegSht,vegetative shoot tip;RepSht,reproductive shoot tip;Seedling_Leaf,seedling leaf;Main_Leaf,main stem leaf;Lat_Leaf,lateral stem leaf;Flwr,flower;Pistil,pistil;Stamen,stamen;AerPeg,aerial gynophore tip;SubPeg,subterranean gynophore tip;PerPt5,pattee 5 pericarp;PerPt6,pattee 6 pericarp;PodPt3,pattee 3 pod;SdPt6,pattee 6 seed;SdPt7,pattee 7 seed;SdPt8,pattee 8 seed;SdPt10,pattee 10 seed.
花生是一個復(fù)雜的異源四倍體,理論上,每一個花生共同祖先的基因在花生的基因組中都分別在A、B基因組上有部分同源基因,它們很可能對植株的表型有不同的貢獻(xiàn)。在此前的研究中,Bertioli等[32]確認(rèn)了花生中15 328對部分同源基因?qū)?。結(jié)合該數(shù)據(jù)和同線性分析記過,我們從中找出了由MYB組成的部分同源基因?qū)?70對(見圖4(c))。表達(dá)偏向分析的結(jié)果顯示,在170對AhMYB部分同源基因中,有72對在至少1個組織中表現(xiàn)出表達(dá)偏向性(見圖6)。在這72對基因中,有34對表現(xiàn)出完全的A基因組傾向,如AhMYB217A-AhMYB442B、AhMYB73A-AhMYB298B和AhMYB66A-AhMYB290B,它們分別在18個、7個和4個組織中表現(xiàn)出表達(dá)偏向性,且全部高表達(dá)A基因組基因;有33對表現(xiàn)出完全的B基因組傾向,如AhMYB80A-AhMYB305B、AhMYB73A-AhMYB298B和AhMYB66A-AhMYB290B,它們分別在11個、17個和9個組織中呈現(xiàn)表達(dá)偏向性,且全部高表達(dá)B基因組基因。還有5對基因在不同組織中呈現(xiàn)了不同的表達(dá)偏向性,如AhMYB94A-AhMYB318B,其在10個組織和發(fā)育時期中呈現(xiàn)表達(dá)偏向性,其中9個組織和發(fā)育時期內(nèi)主要表達(dá)AhMYB318B,但在雌蕊中主要表達(dá)AhMYB94A,以及AhMYB56A-AhMYB282B,其在根瘤中高表達(dá)B基因組的AhMYB282B,在側(cè)莖葉中高表達(dá)A基因組的AhMYB56A。
圖 6 72對AhMYB部分同源基因?qū)υ?9個組織中的部分同源表達(dá)偏向Fig.6 Homoeologous expression bias of 72 AhMYB homoeologous gene pairs in 19 tissues
依照是否存在部分同源基因以及所在基因?qū)Φ谋磉_(dá)偏向性,將AhMYB基因分為A基因組偏向性基因?qū)Α基因組偏向性基因、無基因組偏向性 基因、無配對基因4類。功能富集分析(見圖7)顯示,四類AhMYB基因在功能上既有共同之處,也有獨特之處。四類AhMYB基因在生長素響應(yīng)、脫落酸響應(yīng)、乙烯響應(yīng)、赤霉素響應(yīng)、水楊酸響應(yīng)等激素響應(yīng)進(jìn)程中均有高富集度,意味著大多數(shù)AhMYB基因能響應(yīng)植物激素的刺激,在次級細(xì)胞壁生物合成調(diào)控中也高度富集。此外,四類AhMYB基因均有特定的功能富集條目,如A偏向性AhMYB基因?qū)υ诩?xì)胞分裂素依賴的信號通路中顯著富集,B偏向性AhMYB基因?qū)t在根部發(fā)育調(diào)控、分生組織調(diào)控和莖組織發(fā)育等功能中顯著富集,無偏向性AhMYB基因?qū)υ诰郯鳖惙纸獯x、香豆素生物合成、花粉精細(xì)胞分化、苯丙烷代謝調(diào)控以及花藥壁絨氈層發(fā)育等進(jìn)程中顯著富集,而無配對AhMYB基因在長日照光周期開花、節(jié)律等生物進(jìn)程中顯著富集。此外,無偏向性基因和無配對基因富集在赤霉素合成、細(xì)胞程序性死亡等功能,而受傷響應(yīng)、缺水響應(yīng)只有A偏向性AhMYB基因沒有顯著富集,磷酸轉(zhuǎn)移信號傳導(dǎo)功能只有B偏向性AhMYB基因沒有顯著富集??傮w而言,每一類AhMYB都有其特有的富集功能,也存在共有的富集功能。
圖 7 4類AhMYB基因的功能富集分析Fig.7 GO enrichment analysis of four groups of AhMYB genes
植物MYB轉(zhuǎn)錄因子共存在三種MYB結(jié)構(gòu)域[4],其中R1在間隔R2結(jié)構(gòu)域在色氨酸殘基之間多為19個間隔殘基,R3結(jié)構(gòu)域在色氨酸殘基之間多為18個間隔殘基[2]。對花生MYB轉(zhuǎn)錄因子三種MYB結(jié)構(gòu)域的序列分析結(jié)果顯示,花生中R1結(jié)構(gòu)域的保守程度最低,三個關(guān)鍵的色氨酸殘基均存在被替換的現(xiàn)象,與大多數(shù)高等植物中的R1結(jié)構(gòu)域情況相似;R2包含3個極度保守的色氨酸殘基,但色氨酸殘基之間的氨基酸數(shù)目為20個,而R3第一個色氨酸殘基雖然存在替換情況,但第二、三色氨酸的保守程度非常高,且三個保守殘基之間間隔的氨基酸殘基均為18個,與多數(shù)高等植物中的R3結(jié)構(gòu)域相同。經(jīng)過Pfam與SMART數(shù)據(jù)庫的驗證,共發(fā)現(xiàn)443個AhMYB基因。對所有AhMYB基因的MYB結(jié)構(gòu)域數(shù)量進(jìn)行統(tǒng)計后,共發(fā)現(xiàn)219個1R-MYB蛋白、209個2R-MYB蛋白、12個3R-MYB蛋白以及3個4R-MYB蛋白。MYB轉(zhuǎn)錄因子的MYB結(jié)構(gòu)域多靠近蛋白序列的N端[2,4-5],但本次研究發(fā)現(xiàn)的花生MYB轉(zhuǎn)錄因子中,部分1R-MYB蛋白的MYB結(jié)構(gòu)域位于C端附近,如AhMYB37A、AhMYB189A、AhMYB257B、AhMYB411B等。根據(jù)Du等對1R-MYB蛋白的分類[37],這些MYB轉(zhuǎn)錄因子很可能屬于1R-MYB亞家族中的類TBP亞組(TPB-like subgroup),而MYB結(jié)構(gòu)域分布于蛋白序列中部區(qū)域的1R-MYB蛋白,如AhMYB148A、AhMYB179A、AhMYB368B、AhMYB405B等,則很可能屬于類CCA1/R-R亞組(CCA1-like/R-R subgroup)。這些結(jié)果說明1R-MYB轉(zhuǎn)錄因子無論是在MYB結(jié)構(gòu)域的相對位置還是MYB結(jié)構(gòu)域的序列上,其多樣性均高于2R-MYB轉(zhuǎn)錄因子,很可能承載了更多的花生進(jìn)化信息。此外,花生的MYB轉(zhuǎn)錄因子家族中1R-MYB成員數(shù)目高于2R-MYB成員數(shù)目,這與多數(shù)植物中MYB轉(zhuǎn)錄因子有所不同,表明花生很可能經(jīng)歷了更為特殊的進(jìn)化、馴化過程。不過,少數(shù)1R-MYB轉(zhuǎn)錄因子在系統(tǒng)發(fā)育樹分支上與2R-MYB轉(zhuǎn)錄因子相鄰(見圖1),說明部分1R-MYB轉(zhuǎn)錄因子在序列上與2R-MYB轉(zhuǎn)錄因子相似。考慮到MYB結(jié)構(gòu)域信息很可能由于轉(zhuǎn)錄本的錯誤拼接而缺失,導(dǎo)致MYB結(jié)構(gòu)域數(shù)目減少,最終影響其分類并使得花生MYB轉(zhuǎn)錄因子家族成員中的1R-MYB多于2R-MYB,不能排除該部分1R-MYB應(yīng)為2R-MYB的可能性,因此對于各類MYB轉(zhuǎn)錄因子數(shù)量的確認(rèn)工作仍有提升空間。
基因表達(dá)模式、表達(dá)豐度與基因的功能密切相關(guān),通過研究不同組織和發(fā)育時期中AhMYB基因的表達(dá)情況可以發(fā)現(xiàn)特定組織和時期中發(fā)揮作用的功能基因。已有研究均證實MYB轉(zhuǎn)錄因子參與多種植物的生命活動,Pan等[38]發(fā)現(xiàn),只在水稻花藥中相對高表達(dá)的OsMYB80有多個潛在的調(diào)控基因,敲除OsMYB80會引起絨氈層細(xì)胞凋亡,導(dǎo)致雄性不育;BnTT8主要在油菜種子各發(fā)育時期表達(dá),在bntt8突變體中,油菜種子的脂肪酸生物合成受到了極大的影響[17]。基于轉(zhuǎn)錄組數(shù)據(jù),本研究發(fā)現(xiàn)部分AhMYB基因在不同組織和種子發(fā)育時期特異表達(dá)。例如AhMYB159A和AhMYB382B在根部高表達(dá);AhMYB114A和AhMYB347B在花中表達(dá)量極高;AhMYB25A、AhMYB143A和AhMYB388B則在莢皮中高表達(dá)。這些特定時空條件下高表達(dá)豐度的基因很可能與對應(yīng)組織的發(fā)育生長或特定的次生代謝活動密切相關(guān)。此外,本研究還發(fā)現(xiàn)AhMYB92A和AhMYB317B在19個組織和發(fā)育時期中均呈現(xiàn)高或較高的表達(dá)量,同時這兩個基因還組成部分同源基因?qū)?,由此推測它們很可能組成型參與多種生物學(xué)途徑的調(diào)控,與花生的正常生長發(fā)育高度相關(guān)。
異源多倍化能夠引起編碼或非編碼DNA序列缺失、表觀遺傳修飾和基因表達(dá)模式的改變[39],且不同的基因組很可能受到不同程度的影響[40],是植物進(jìn)化的重要動力[41],花生的形成就是異源多倍化成功推動物種形成的經(jīng)典例子之一。異源多倍化在轉(zhuǎn)錄組水平上引起的變化表現(xiàn)為部分同源基因偏向性表達(dá)。異源多倍體中,每一對部分同源基因來源于共同祖先中的同一基因,因此理論上部分同源基因?qū)Φ膫€體在表達(dá)水平上應(yīng)該相似。然而,在多倍體物種中,普遍存在同源基因、部分同源基因的偏向性表達(dá)[41-43]。在AhMYB基因中,我們確認(rèn)了170對包含MYB轉(zhuǎn)錄因子的部分同源基因?qū)?。在這170對花生MYB轉(zhuǎn)錄因子部分同源基因?qū)χ?,?2對在至少一個組織中表現(xiàn)出部分同源表達(dá)偏向,其中A偏向性與B偏向性的基因?qū)鶠?5對。功能富集分析結(jié)果顯示,A基因組偏向性的AhMYB基因?qū)μ禺惖馗患诩?xì)胞分裂素依賴的信號通路中,B基因組偏向性的AhMYB基因?qū)t在根形態(tài)發(fā)育、莖形態(tài)發(fā)育等功能中顯著富集。不同基因組偏向性的AhMYB在功能上展現(xiàn)了一定的富集差異,說明不同亞基因組中的AhMYB基因在部分功能上很可能受到了不同程度的選擇壓力,使得某種偏向性的基因?qū)υ谔囟üδ苤谐霈F(xiàn)富集。此外,5對部分同源基因?qū)υ诓煌M織中表現(xiàn)不同的基因組偏向性,這說明它們的轉(zhuǎn)錄本序列雖然高度相似,但很可能經(jīng)歷了亞功能化或者產(chǎn)生了新功能。
本研究在栽培花生中共鑒定到443個MYB轉(zhuǎn)錄因子基因,包括219個1R-MYB、209個2R-MYB、12個3R-MYB以及3個4R-MYB,它們在MYB結(jié)構(gòu)域具有各自獨特的保守性。這些MYB轉(zhuǎn)錄因子基因中,共有170對部分同源基因?qū)Γ渲?2對在至少一個組織和發(fā)育時期中表現(xiàn)出偏向性表達(dá)。具有表達(dá)偏向性的基因和無偏向性的基因在功能上具有明顯不同的富集。本研究為AhMYB基因功能的深入研究奠定了一定的基礎(chǔ)。