鄭斌 武紅霞 王松標 馬小衛(wèi) 許文天 羅純 姚全勝
摘 要 MYB家族作為植物中較大的轉錄因子家族之一,參與調控植物的多種生理活動。本研究基于芒果果實轉錄組測序結果,鑒定出71個MYB家族蛋白,其中包含1個4R-MYB蛋白、3個R1R2R3-MYB蛋白、60個R2R3-MYB蛋白和7個MYB相關蛋白。進化樹及基序分析表明:除個別蛋白外,相同類型的MYB蛋白均聚在一起,且相近分支的MYB蛋白具有相同或相似的基序。60個全長MYB家族蛋白中,大部分為不穩(wěn)定蛋白,且均為不含跨膜結構和信號肽的親水性蛋白,亞細胞定位分析均定位于細胞核。進化樹分析發(fā)現(xiàn)芒果R2R3-MYB蛋白與擬南芥有較高的保守性。R2R3-MYB蛋白保守域分析發(fā)現(xiàn),R2和R3結構域均有多個氨基酸保守不變。GO分析發(fā)現(xiàn)芒果R2R3-MYB蛋白共注釋到生物學過程、細胞組分和分子功能3大類功能的15個亞類。
關鍵詞 芒果;MYB家族基因;R2R3-MYB;生物信息學
中圖分類號 S667.7 文獻標識碼 A
Abstract As one of the large transcription factor families, MYB family is involved in regulating a variety of physiological processes in plants. Based on the results of transcriptome sequencing of the fruits in mango, 71 sequences of MYB family proteins, including one 4R-MYB protein, three R1R2R3-MYB proteins, 60 R2R3-MYB proteins and 7 MYB related proteins, were identified in the study. The phylogenetic tree and motifs analyses showed that, with a few individual exceptions, MYB proteins of the same type clustered together, and the majority of the close members in the phylogenetic tree exhibited same or similar motifs compositions. 60 full-length MYB proteins were analyzed, in which most were unstable, and all of those proteins were hydrophilic proteins, without a signal-peptide and transmembrane region. Subcellular localization analysis indicated that those proteins were located in nucleus. In addition, the phylogenetic analyses of the mango(60 members)and Arabidopsis(126 members)R2R3-MYB proteins showed that those proteins were highly conserved between mango and Arabidopsis. Conserved domain(R2 and R3 repeats)of mango R2R3-MYB proteins contained multiple conserved amino residues. GO(Gene Ontology)annotation showed that those proteins could be categorized into 15 function subgroups of three main categories: biological processes, cellular components and molecular function.
Key words Mango(Mangifera indica L.); MYB family genes; R2R3-MYB; bioinformatics
doi 10.3969/j.issn.1000-2561.2017.07.017
轉錄因子即反式作用因子,是一類調控蛋白,能夠與真核基因啟動子區(qū)域中的順式作用元件發(fā)生特異性結合,通過轉錄因子之間以及轉錄因子與其他相關蛋白之間的相互作用激活或抑制靶基因的轉錄[1]。MYB家族是植物中較大的轉錄因子家族之一。最早的MYB基因u-myb是1982年發(fā)現(xiàn)于鳥類的原癌病毒[2],植物中發(fā)現(xiàn)的第一個MYB基因為ZmC1[3]。MYB轉錄因子在N端具有保守的DNA結合結構域[4],該結構域通常由1~4個氨基酸序列重復區(qū)(R)組成,每個R區(qū)大約由52個氨基酸組成,但是各個R區(qū)之間不是完全重復。根據(jù)相鄰的R區(qū)的個數(shù)(1,2,3或4)可以把MYB蛋白分成MYB相關蛋白(含1個或多個R區(qū))、R2R3-MYB蛋白、R1R2R3-MYB蛋白和4R-MYB蛋白4種不同類型[5]。
MYB蛋白參與調控植物的多種生理活動,如細胞形態(tài)建成、生物和非生物脅迫應答、植物次生代謝等[6-7],但目前對植物MYB轉錄因子的了解非常有限,大量MYB轉錄因子還未被鑒定出來。近年來,高通量測序和生物信息學的快速發(fā)展為基因的鑒定及功能分析提供了新思路。利用生物信息學方法,吳家勝等[8]從粳稻基因組數(shù)據(jù)中鑒定出126個R2R3-MYB蛋白、6個R1R2R3-MYB蛋白以及60個MYB相關蛋白,宋楊等[9]從越橘果實轉錄組數(shù)據(jù)中鑒定出21個R2R3-MYB基因。
芒果(Mangifera indica L.)作為五大熱帶水果之一,風味獨特,營養(yǎng)豐富,被譽為“熱帶果王”,主要分布在海南、廣東、廣西、云南、四川、福建等?。▍^(qū))[10]。目前關于芒果MYB基因的研究較少,武紅霞[11]利用轉錄組測序對參與花色苷合成的MYB基因進行了篩選分析,而關于MYB家族基因的系統(tǒng)鑒定與分析還未見報道。本研究基于芒果果實轉錄組測序結果,利用生物信息學手段對MYB家族基因進行鑒定和分析,為進一步探究芒果MYB家族基因的功能提供基礎。
1 材料與方法
1.1 材料
芒果蛋白序列來源于本課題組構建的轉錄組數(shù)據(jù)庫(GenBank accession SRP035450)。擬南芥MYB家族氨基酸序列下載于擬南芥信息資源(TAIR)數(shù)據(jù)庫(http://www.arabidopsis.org/)。
1.2 方法
1.2.1 芒果MYB家族蛋白的鑒定 從Pfam 30.0[12]數(shù)據(jù)庫(http://pfam.xfam.org/)下載MYB結構域種子文件PF00249、PF8914、PF13921、PF12776、PF13873、PF13837和PF15963,用HMMER 3.1b2[13]軟件分別構建Profile HMM(數(shù)值表格型隱馬可夫模型)并檢索芒果轉錄組蛋白數(shù)據(jù)庫,對檢索結果進行整合去冗余,得到候選蛋白。將候選蛋白用SMART[14](http://smart.embl-heidelberg.de/)和InterPro[15](http://www.ebi.ac.uk/interpro/)分析SANT/MYB結構域,同時用NCBI blast(https://blast.ncbi.nlm.nih.gov/Blast.cgi)和植物轉錄因子數(shù)據(jù)庫[16](PlantTFDB)(http://planttfdb.cbi.pku.edu.cn/)進行進一步分析鑒定。
1.2.2 芒果MYB家族蛋白系統(tǒng)發(fā)育樹構建及基序分析 利用MEGA 6.0軟件內置的Clustal W程序對芒果MYB家族蛋白的氨基酸序列進行比對分析,將比對結果采用鄰接法構建系統(tǒng)發(fā)育樹,并進行自舉評估(Bootstrap),重復次數(shù)為1 000次,其它參數(shù)使用默認值[17]。運用MEME 4.11.02程序[18]分析芒果MYB家族蛋白的基序,設定基序寬度為6~50,基序數(shù)量為10,其余參數(shù)為默認值。
1.2.3 芒果MYB家族蛋白生物信息學分析 選擇具有全長氨基酸序列的芒果MYB家族蛋白,利用在線工具ProtParam(http://web.expasy.org/protparam/)對其進行理化性質分析,并用SOPMA[19](https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)在線軟件分析其二級結構,信號肽的預測應用SignalP 4.1 Server[20](http://www.cbs.dtu.dk/services/SignalP/)軟件進行分析,最后分別采用TMHMM Server v. 2.0(http://www.cbs.dtu.dk/services/TMHMM/)和BaCelLo[21](http://gpcr.biocomp.unibo.it/bacello/)在線軟件完成跨膜結構和亞細胞定位分析。
1.2.4 芒果和擬南芥R2R3-MYB進化樹構建 使用MEGA 6.0軟件將芒果R2R3-MYB蛋白(60個)和擬南芥R2R3-MYB蛋白(126個)共同構建進化樹,參數(shù)設置同1.2.2。
1.2.5 芒果R2R3-MYB蛋白保守域分析 使用DNAMAN軟件(Version5.2.2)對芒果R2R3-MYB蛋白保守域進行比對,將比對結果用在線軟件WebLogo 3(http://weblogo.threeplusone.com/create.cgi)分析保守域序列標簽。
1.2.6 芒果R2R3-MYB蛋白GO分析 首先使用Blast2GO 4.0軟件[22]對芒果R2R3-MYB蛋白序列進行GO(Gene Ontology)注釋,然后用在線軟件WEGO[23](http://wego.genomics.org.cn/cgi-bin/wego/index.pl)繪制GO功能分類圖。
2 結果與分析
2.1 芒果MYB家族成員的獲得
本研究從芒果轉錄組49117個蛋白序列中篩選出395個具有SANT/MYB結構域的候選蛋白序列,通過進一步分析去冗余,共獲得71個芒果MYB家族蛋白序列(表1),其中60個為全長序列。71個MYB家族蛋白中包含1個4R-MYB蛋白、3個R1R2R3-MYB蛋白、60個R2R3-MYB蛋白和7個MYB相關蛋白,其中不具有全長蛋白序列的Unigene9486、Unigene6062和Unigene8022雖僅含一個SANT/MYB結構域,但同源分析發(fā)現(xiàn)其均為R2R3-MYB蛋白序列。
2.2 芒果MYB家族蛋白進化樹及基序分析
芒果MYB家族蛋白結構域、進化樹及基序分析見圖1。由圖1可知,60個R2R3-MYB蛋白除CL6663.Contig1外均聚在一起,3個R1R2R3-MYB蛋白聚在一個分支,7個MYB相關蛋白除CL11270.Contig2外均聚在一起。
本研究分析了芒果MYB家族的10個基序(圖2),基序1為R2R3結構域基序,基序2、基序4和基序10為R2結構域基序。由表1可知,基序2存在于所有具有全長的MYB家族蛋白,基序1存在于所有具有全長的R2R3-MYB蛋白。結合進化樹(圖1)可以看出,相近分支MYB蛋白基序的類型和位置相同或相近。
2.3 芒果MYB家族蛋白特性分析
芒果MYB家族蛋白理化性質及二級結構分析見表2。由表2可以看出,60個全長MYB家族蛋白的相對分子量在21.24~115.88 ku之間,其中含33個酸性蛋白(理論等電點<7)、1個中性蛋白(理論等電點=7)和26個堿性蛋白(理論等電點>7);平均疏水指數(shù)均小于0,為親水性蛋白;不穩(wěn)定指數(shù)(II)分析發(fā)現(xiàn)除Unigene1513為穩(wěn)定蛋白外(II<40),其余均為不穩(wěn)定蛋白(II>40)。60個MYB家族蛋白均不含信號肽和跨膜結構,亞細胞定位均定位于細胞核。二級結構分析發(fā)現(xiàn):芒果MYB家族蛋白中無規(guī)卷曲和α-螺旋所占比例較大,其中48個為無規(guī)卷曲所占比例最大,11個為α-螺旋所占比例最大,CL9291.Contig2二級結構中α-螺旋和無規(guī)卷曲所占比例一致。
2.4 芒果與擬南芥R2R3-MYB蛋白系統(tǒng)發(fā)育樹比對
芒果與擬南芥R2R3-MYB蛋白系統(tǒng)進化樹見圖3。由圖3可以看出,大部分芒果R2R3-MYB蛋白與擬南芥不同亞組的R2R3-MYB蛋白聚在一起,說明芒果R2R3-MYB蛋白與擬南芥有較高的保守性。擬南芥相同亞組的R2R3-MYB蛋白具有相同或相似的功能[5],推測聚在不同亞組的芒果R2R3-MYB蛋白與擬南芥該亞組具有相同或相似的功能,其中與擬南芥S4亞組處于同一分支的CL10982.Contig2、Unigene13684和CL6446.Contig2可能參與調控相關基因的表達從而抑制花色苷的合成,與擬南芥S5亞組及AtMYB5處于同一大分支的Unigene13160、CL2107.Contig1、Unigene1513、Unigene12158和CL6888.Contig2以及與S6亞組處于同一分支的CL5638.Contig1和CL5638.Contig2可能具有促進花色苷合成的作用。
2.5 芒果R2R3-MYB蛋白保守域分析
芒果R2R3-MYB蛋白R2R3高度保守DNA binding結合域見圖4。由圖4可以看出,芒果R2R3-MYB蛋白R2結構域的4(W)、8~9(E、D)、12(L)、20(G)、25(W)、38(R)和41~47(K、S、C、R、L、R、W)等多個位點保守不變,R3結構域的10(E)、14(I)、18(H)、22~23(G、N)、25(W)、28(I)、33~38(P、G、R、T、D、N)、41~42(K、N)和44(W)等位點保守不變。
2.6 芒果R2R3-MYB蛋白GO聚類分析
芒果R2R3-MYB蛋白GO功能分類見圖5。由圖5可以看出,60個R2R3-MYB蛋白注釋到生物學過程、細胞組分和分子功能3大類功能的15個亞類。細胞組分類別中,有4、3和3個R2R3-MYB蛋白分別注釋到細胞(Cell)、細胞部分(Cell part)和細胞器(Organelle)。分子功能類別中,58個R2R3-MYB蛋白注釋到結合功能(binding),1個注釋到催化活性(Catalytic activity)。生物學過程類別中,6個R2R3-MYB蛋白注釋到細胞過程(cellular process),注釋到代謝過程(metabolic process)、發(fā)育過程(developmental process)和刺激響應(response to stimulus)的分別為4個、4個和2個,注釋到其他亞類的僅為1個。
3 討論
MYB蛋白參與植物激素合成、信號轉導、初生代謝、次生代謝和類黃酮合成等生理生化過程[24]。Cao等[25]、Aoyagi等[26]和Liao等[27]分別利用生物信息學分析技術從蘋果、大豆和木薯基因組數(shù)據(jù)中鑒定出222、264和166個R2R3-MYB基因,并對其中部分基因進行了功能分析。對于沒有基因組信息的物種可以利用表達序列標簽(ESTs)和轉錄組數(shù)據(jù)進行家族基因的挖掘,Chen等[28]從歐洲油菜表達序列標簽(ESTs)中獲得72個R2R3-MYB基因,Wang等[29]從地黃轉錄組數(shù)據(jù)中鑒定出165個MYB序列,其中40個序列具有完整的開放閱讀框。
本研究基于芒果果實轉錄組數(shù)據(jù),鑒定出71個MYB家族蛋白,其中包含1個4R-MYB蛋白、3個R1R2R3-MYB蛋白、60個R2R3-MYB蛋白和7個MYB相關蛋白。進化樹及基序分析發(fā)現(xiàn),除個別基因外,不同類型的MYB蛋白分別聚在一起,且相近分支的MYB蛋白具有相同或相似的基序,這與魏海超[30]對大豆和擬南芥MYB家族基因的分析結果是一致的。
對具有全長的60個芒果MYB家族蛋白進行了生物信息學分析,其中酸性蛋白所占比例較大,大部分為不穩(wěn)定蛋白,且均為不含跨膜結構和信號肽的親水性蛋白,亞細胞定位均定位于細胞核,大部分MYB家族蛋白二級結構中無規(guī)卷曲所占比例最大。
從芒果和擬南芥R2R3-MYB蛋白共同構建的進化樹發(fā)現(xiàn),芒果R2R3-MYB蛋白與擬南芥有較高的保守性;芒果R2R3-MYB蛋白保守域分析發(fā)現(xiàn),其R2和R3結構域均有多個氨基酸保守不變,該結果與Chen等[28]對歐洲油菜R2R3-MYB蛋白的分析結果相似。GO分析發(fā)現(xiàn)芒果R2R3-MYB蛋白共注釋到生物學過程、細胞組分和分子功能3大類功能的15個亞類,其中96.67%注釋到結合功能。
MYB蛋白參與植物的多個生命活動,本研究從芒果轉錄組數(shù)據(jù)中鑒定出71個MYB家族蛋白,為今后芒果MYB家族蛋白的研究提供了基礎。由于取樣及測序的局限性,所鑒定的僅為芒果MYB家族的部分蛋白序列,因此,芒果MYB家族蛋白還有待進一步挖掘和研究。
從進化樹分析可以看出,大部分的芒果R2R3-MYB蛋白與擬南芥不同亞組的R2R3-MYB蛋白聚在一起,推測芒果R2R3-MYB蛋白與擬南芥具有相似的功能,該分析可為下一步芒果R2R3-MYB蛋白的功能分析提供參考。宋楊等[9]利用此方法結合基因表達分析鑒定出6個可能與越橘著色相關的基因,而芒果R2R3-MYB蛋白的功能還有待進一步研究明確。
參考文獻
[1] 劉 強, 張貴友, 陳受宜. 植物轉錄因子的結構與調控作用[J]. 科學通報, 2000, 45(14): 1 465-1 474.
[2] Klempnauer K H, Gonda T J, Bishop J M. Nucleotide sequence of the retroviral leukemia gene v-myb and its cellular progenitor c-myb: the architecture of a transduced oncogene[J]. Cell, 1982, 31(2): 453-463.
[3] Pazares J, Ghosal D, Wienand U, et al. The regulatory c1 locus of Zea mays encodes a protein with homology to myb proto-oncogene products and with structural similarities to transcriptional activators[J]. Embo Journal, 1987, 6(12): 3 553-3 558.
[4] Lipsick J S. One billion years of Myb[J]. Oncogene, 1996, 13(2): 223-235.
[5] Dubos C, Stracke R, Grotewold E, et al. MYB transcription factors in Arabidopsis[J]. Trends in Plant Science, 2010, 15(10): 573-581.
[6] Kranz H D, Denekamp M, Greco R, et al. Towards functional characterisation of the members of the R2R3-MYB gene family from Arabidopsis thaliana[J]. Plant Journal for Cell & Molecular Biology, 1998, 16(2): 263-276.
[7] Chen Y, Yang X, He K, et al. The MYB transcription factor superfamily of Arabidopsis: expression analysis and phylogenetic comparison with the rice MYB family[J]. Plant Molecular Biology, 2006, 60(1): 107-124.
[8] 吳家勝, 趙彥宏, 汪旭升. 粳稻MYB蛋白家族的生物信息學分析[J]. 華南農業(yè)大學學報, 2009, 30(4): 43-47.
[9] 宋 楊, 劉紅弟, 張紅軍, 等. 越橘果實轉錄組及R2R3-MYB轉錄因子分析[J]. 園藝學報, 2015, 42(12): 2 383-2 394.
[10] 馬小衛(wèi), 李 麗, 武紅霞, 等. 不同品種芒果果實品質、糖組分及抗氧化性的分析[J]. 廣東農業(yè)科學, 2011, 38(20): 38-39.
[11] 武紅霞.芒果花色苷合成與調控的生理與分子機制[D]. 杭州: 浙江大學, 2015.
[12] Finn R D, Mistry J, Schuster-Bockler B, et al. Pfam: clans, web tools and services[J]. Nucleic Acids Research, 2006, 34(suppl_1): 247-251.
[13] Finn R D, Clements J, Eddy S R. HMMER web server: interactive sequence similarity searching[J]. Nucleic Acids Research, 2011, 39(suppl_2): 29-37.
[14] Letunic I, Doerks T, Bork P. SMART 7: recent updates to the protein domain annotation resource[J]. Nucleic Acids Research, 2012, 40(Databaseissue): 302-305.
[15] Mitchell A, Chang H Y, Daugherty L, et al. The InterPro protein families database: the classification resource after 15 years[J]. Nucleic Acids Research, 2015, 43(Database issue): 213-221.
[16] Jin J P, Tian F, Yang D C, et al. PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants[J]. Nucleic Acids Research, 2016, doi: 10.1093/nar/gkw982.
[17] Hall B G. Building phylogenetic trees from molecular data with MEGA[J]. Molecular Biology and Evolution, 2013, 30(5): 1 229-1 235.
[18] Bailey T L, Elkan C. Fitting a mixture model by expectation maximization to discover motifs in biopolymers[C]. International Conference on Intelligent Systems for Molecular Biology. Proc Int Conf Intell Syst Mol Biol, 1994: 28-36.
[19] Geourjon C, Deléage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Computer Applications in the Biosciences Cabios, 1995, 11(6): 681-684.
[20] Petersen T N, Brunak S, Von H G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nature Methods, 2010, 8(10): 785-786.
[21] Pierleoni A, Martelli P L, Fariselli P, et al. BaCelLo: a Balanced subCellular Localization predictor[J]. Bioinformatics, 2006, 22(14): 408-416.
[22] Conesa A, Gotz S, Garcíagómez J M, et al. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research[J]. Bioinformatics, 2005, 21(18): 3 674-3 676.
[23] Ye J, Fang L, Zheng H, et al. WEGO: a web tool for plotting GO annotations[J]. Nucleic Acids Research, 2006, 34(Web Server issue): 293-297.
[24] Qi L, Yang J, Yuan Y, et al. Overexpression of two R2R3-MYB genes from Scutellaria baicalensis induces phenylpropanoid accumulation and enhances oxidative stress resistance in transgenic tobacco[J]. Plant Physiology & Biochemistry, 2015, 94: 235-243.
[25] Cao Z H, Zhang S Z, Wang R K, et al. Genome wide analysis of the apple MYB transcription factor family allows the identification of MdoMYB121 gene confering abiotic stress tolerance in plants[J]. Plos One, 2013, 8(7): e69955.
[26] Aoyagi L N, Lopescaitar V S, de Carvalho M C, et al. Genomic and transcriptomic characterization of the transcription factor family R2R3-MYB in soybean and its involvement in the resistance responses to Phakopsora pachyrhizi[J]. Plant Science, 2014, 229: 32-42.
[27] Liao W, Yang Y, Li Y, et al. Genome-wide identification of cassava R2R3 MYB family genes related to abscission zone separation after environmental-stress-induced abscission[J]. Scientific Reports, 2016, 6. doi: 10.1038/srep32006.
[28] Chen B, Niu F, Liu W Z, et al. Identification, cloning and characterization of R2R3-MYB gene family in canola (Brassica napus L.) identify a novel member modulating ROS accumulation and hypersensitive-like cell death[J]. DNA Research, 2016, 23(2): 101-114.
[29] Wang F, Suo Y, He W, et al. Identification and characterization of 40 isolated Rehmannia glutinosa MYB family genes and their expression profiles in response to shading and continuous cropping[J]. International Journal of Molecular Sciences, 2015, 16(7): 15 009-15 030.
[30] 魏海超. PIGR與MYB基因家族的生物信息學研究[D]. 濟南: 山東師范大學, 2012.