李成慧,蔡 斌
(1.蘇州農(nóng)業(yè)職業(yè)技術(shù)學(xué)院,江蘇 蘇州 215008;2.南京農(nóng)業(yè)大學(xué) 園藝學(xué)院,江蘇 南京 210095)
轉(zhuǎn)錄因子(transcription factors)在植物的生長發(fā)育及其對外界環(huán)境的反應(yīng)中起著重要的調(diào)控作用。轉(zhuǎn)錄因子通過與基因啟動子區(qū)域特異性結(jié)合,激活或抑制下游基因的轉(zhuǎn)錄,在信號傳導(dǎo)和誘導(dǎo)下游相關(guān)功能基因表達中起著關(guān)鍵作用[1-2]。大部分的轉(zhuǎn)錄因子是以多基因家族的形式存在的。WRKY基因家族是植物中的一類重要轉(zhuǎn)錄因子家族。WRKY轉(zhuǎn)錄因子是鋅指蛋白家族的一個亞家族,其N端包含一個由50個氨基酸組成的高度保守的結(jié)構(gòu)域。WRKY轉(zhuǎn)錄因子結(jié)構(gòu)域中的N端因有高度保守的7個氨基酸特征序列WRKYGQK而得名,其C末端為一個鋅指結(jié)構(gòu)。WRKY基因家族主要存在于植物中,在植物的生長和發(fā)育、環(huán)境信號刺激及其對病原物的防御反應(yīng)過程中發(fā)揮著非常重要的作用(如損傷反應(yīng)[3]、種子發(fā)育[4]、葉片衰老[5]、調(diào)控植物防御反應(yīng)相關(guān)基因[6]等方面的作用)。WRKY基因還參與植物的抗非生物脅迫(如干旱[7-8]、高鹽[9]、高溫[10]等)反應(yīng)。
葡萄在世界果樹生產(chǎn)中占有重要的位置,具有很高的經(jīng)濟價值[11]。葡萄為完成全基因組測序的第一種水果作物和第四種開花植物[12]。有關(guān)葡萄WRKY轉(zhuǎn)錄因子的研究起步較晚,有關(guān)葡萄抗生物和非生物脅迫反應(yīng)方面的研究有個別報道[13]。目前對葡萄WRKY轉(zhuǎn)錄因子的系統(tǒng)分析和功能研究還未見報道,因此,文中以12×葡萄基因組蛋白序列為數(shù)據(jù)來源,在全基因組水平上識別和分析WRKY基因家族,對其進行了系譜發(fā)生、共線性和表達譜等方面的分析,以期為進一步開展葡萄WRKY轉(zhuǎn)錄因子基因家族的基因功能和分子進化機制的研究奠定理論基礎(chǔ)。
從 CRIBI Genomics(http://genomics.cribi.unipd.it)中下載歐亞種Vitis viniferaL.黑比諾PN4002全基因組的注釋序列。從Pfam數(shù)據(jù)庫(http://www.sanger.ac.uk/Software/Pfam/) 中下載WRKY結(jié)構(gòu)域的隱馬可夫模型(HMM)PF03106。
用 HMMER3(http://hmmer.janelia.org/)軟件包以PF03106隱馬可夫模型對葡萄蛋白組進行搜索,所用選項為“cut_ga”。將得到的基因提交到NCBI上的保守結(jié)構(gòu)域數(shù)據(jù)庫CCD(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)中搜索WRKY結(jié)構(gòu)域進行驗證。
用WRKY基因的全長氨基酸序列作多序列聯(lián)配,所用軟件為ClustalX2,參數(shù)使用默認值。根據(jù)多序列聯(lián)配的結(jié)果,使用MEGA5[14]軟件構(gòu)建系統(tǒng)發(fā)生樹,所用算法為鄰近法(neighbor joining,NJ),對構(gòu)建的樹進行自舉檢驗,重復(fù)設(shè)為1 000。
所用軟件為MicroSyn[15],采用該軟件檢測各基因所在基因組區(qū)段之間同源基因在數(shù)量和順序上的保守程度。文中每個基因組區(qū)段包含100 個基因,在其中間位置為WRKY基因。
Illumia RNA-Seq數(shù) 據(jù) 從NCBI的GEO(http://www.ncbi.nlm.nih.gov/gds)中下載,登陸號為GSE37743。表達量的單位以RPKM表示, 即每百萬個測序片段(reads)中每個基因在1 kb長度上所對應(yīng)的片段數(shù)。數(shù)據(jù)經(jīng)log 2轉(zhuǎn)換后提取WRKY基因的表達數(shù)據(jù),制作熱圖(heatmap)。
以WRKY基因的HMM在葡萄全基因組蛋白序列中進行搜索,并將搜索到的基因提交到NCBI上的保守結(jié)構(gòu)域數(shù)據(jù)庫CCD中進行搜索,最后得到55個WRKY基因。根據(jù)WRKY基因在染色體上的位置給基因命名,這些基因的名稱詳見表1中的VvWRKY1~VvWRKY55。目前公布的12×葡萄基因組序列被組裝成若干染色體序列,其中“chrN”(N代表染色體的編號,為1~19)表示將相應(yīng)的序列骨架(contig)按位置和方向定位到染色體N上,無法定位到相應(yīng)染色體上的序列骨架則組裝到“chrUn”上。54個WRKY基因可以定位到18個染色體上,1個WRKY基因位于chrUn(如圖1所示)。第4號染色體上WRKY基因的數(shù)量最多,為8個,第7號染色體上分布的數(shù)量次之,為7個,而在第6、9、11和18號染色體上分別只有1個WRKY基因,而第3號染色體上沒有WRKY基因的分布。
為了考察WRKY基因家族在葡萄中的系譜發(fā)生關(guān)系,在多序列聯(lián)配的基礎(chǔ)上,以NJ法構(gòu)建WRKY基因家族的系譜發(fā)生樹。為了更好地對葡萄WRKY基因家族進行分類,我們把葡萄的55個WRKY基因和擬南芥的70個WRKY基因作聯(lián)合系譜發(fā)生樹(如圖2所示)。根據(jù)自舉值的大小(一般>50%)和擬南芥中WRKY基因的分類信息,將葡萄的55個WRKY基因分為7個亞家族,分別命名為Ⅰ、Ⅱa、Ⅱb、Ⅱc、Ⅱd、Ⅱe和Ⅲ。其中,Ⅱa和Ⅱb的進化關(guān)系較近,Ⅱd和Ⅱe的進化關(guān)系較近。
在葡萄和擬南芥的聯(lián)合進化樹中,亞家族Ⅱ b包 含VvWRKY37、VvWRKY2、VvWRKY50、VvWRKY42、VvWRKY20、VvWRKY29、VvWRKY35和VvWRKY52等8個基因。利用MircoSyn軟件對包含這些基因的基因組區(qū)段進行共線性分析。結(jié)果表明,在葡萄基因組內(nèi),VvWRKY2、VvWRKY42和VvWRKY50彼此之間存在顯著的共線性關(guān)系,區(qū)段間所有同源基因?qū)Φ耐x突變率(Ks)平均值也比較相近(如表2)。同樣,VvWRKY29、VvWRKY35和VvWRKY52之間也存在顯著的共線性關(guān)系,區(qū)段間所有同源基因?qū)Φ腒s平均值也比較相近。VvWRKY2、VvWRKY42和VvWRKY50分別位于第1、14和17號染色體上,而這3條染色體存在三體(triplet)的關(guān)系。據(jù)Jaillon等人[12]的研究結(jié)果,葡萄基因組內(nèi)同源區(qū)段大部分以三體的形式出現(xiàn),即一個基因組區(qū)域和另外兩個區(qū)域存在同源關(guān)系,這種基因組三體的特性可能是由于葡萄基因組來源于古代的三個近緣基因組,發(fā)生了“古代六倍體化”事件。根據(jù)VvWRKY2、VvWRKY42和VvWRKY50之間的共線性關(guān)系和系譜發(fā)生樹中亞家族Ⅱb成員間的拓撲關(guān)系,我們可以推測,位于第1號染色體上的VvWRKY2、第14號染色體上的VvWRKY42及第17號染色體上的VvWRKY50可能在葡萄物種的“古代六倍體化”過程中形成。同樣,位于第10號染色體上的VvWRKY29、第12號染色體上的VvWRKY35及第19號染色體上的VvWRKY52也可能起源于這個“古代六倍體化”過程中。
表1 葡萄WRKY基因的鑒定結(jié)果?Table 1 WRKY genes in grape
圖1 葡萄WRKY基因在染色體上的定位圖Fig.1 Chromosomal locations of WRKY genes in grape
圖2 葡萄和擬南芥中WRKY蛋白的聯(lián)合系譜發(fā)生樹Fig.2 Joined phylogenetic tree of WRKY proteins in grape and Arabidopsis
GSE37743包含了葡萄非生物脅迫(紫外線和物理傷害)和生物脅迫(霜霉病侵染)的Illumia RNA-Seq數(shù)據(jù),圖3為各處理條件下跟對照相比表達值的熱圖。結(jié)果顯示,有9個基因在植物受傷、紫外線照射和受到霜霉病侵染后,基因表達量顯著提高。在這些基因中,有4個基因?qū)儆冖騜亞家族,其他5個基因則屬于Ⅱc亞家族。
表2 亞家族Ⅱb內(nèi)各基因之間的共線性關(guān)系?Table 2 Colinear relationships of the genes in Ⅱb subfamily
植物轉(zhuǎn)錄因子在細胞發(fā)育、抗逆和信號轉(zhuǎn)導(dǎo)等方面具有重要作用,而大部分的轉(zhuǎn)錄因子是以多基因家族的形式存在的。隨著愈來愈多物種全基因組的公布,從全基因組水平上鑒定和分析轉(zhuǎn)錄因子家族,已成為基因組學(xué)研究的重點之一。WRKY轉(zhuǎn)錄因子家族在植物生長發(fā)育和植物防衛(wèi)機制上具有重要作用。文中利用生物信息學(xué)的方法在葡萄全基因組中鑒定了55個WRKY基因,并對其進行了系譜分類和進化分析。系譜分析結(jié)果表明,葡萄WRKY基因家族的55個成員可以劃分為7個亞家族。
圖3 葡萄WRKY基因家族在非生物和生物脅迫條件下的表達水平熱圖Fig.3 Heat map of expression of WRKY gene family under different abiotic and biotic stress
在其亞家族Ⅱb中的8個WRKY基因中,VvWRKY2、VvWRKY42和VvWRKY50及VvWRKY29、VvWRKY35和VvWRKY52可能起源于形成葡萄物種的一次“古代六倍體化”過程中;另外2個成員VvWRKY20和VvWRKY37和其他成員間不存在共線性關(guān)系,我們推測,VvWRKY20和VvWRKY37可能存在于“古代六倍體化”事件之前。從表達數(shù)據(jù)來看,VvWRKY20、VvWRKY37、VvWRKY50和VvWRKY52對生物和非生物脅迫的反應(yīng),具有相似的表達譜模式(圖3),說明這4個WRKY基因在“古代六倍體化”事件之前已經(jīng)參與逆境脅迫的調(diào)控網(wǎng)絡(luò),而VvWRKY2、VvWRKY42、VvWRKY29和VvWRKY35在進化過程中其表達特性發(fā)生趨異分化現(xiàn)象。
參考文獻:
[1] Latchman D S.Transcription factors: an overview[J].Int J Biochem Cell Biol,1997,29(12):1305-1312.
[2] 張 莉,蘇曼琳.植物抗旱基因HDCS1的克隆和表達載體的構(gòu)建[J].中南林業(yè)科技大學(xué)學(xué)報,2012,32(6):115-117.
[3] Hara K, Yagi M, Kusano T,et al.Rapid systemic accumulation of transcripts encoding a tobacco WRKY transcription factor upon wounding [J].Mol Gen Genet, 2000, 263(1):30-37.
[4] Luo M, Dennis E S, Berger F,et al.MINISEED3 (MINI3), a WRKY family gene, andHAIKU2 (IKU2), a leucine-rich repeat(LRR)KINASEgene, are regulators of seed size inArabidopsis[J].Proc Natl Acad Sci USA,2005,102(48): 17531-17536.
[5] Robatzek S, Somssich I E.A new member of theArabidopsisWRKY transcription factor family, AtWRKY6, is associated with both senescence- and defence-related processes [J].Plant J,2001,28(2):123-133.
[6] Pandey S P, Somssich I E.The role of WRKY transcription factors in plant immunity[J].Plant Physiol, 2009, 150(4):1648-1655.
[7] Wu X, Shiroto Y, Kishitani S,et al.Enhanced heat and drought tolerance in transgenic rice seedlings overexpressing OsWRKY11 under the control of HSP101 promoter [J].Plant Cell Rep,2009,28(1):21-30.
[8] Wang Z, Zhu Y, Wang L,et al.A WRKY transcription factor participates in dehydration tolerance inBoea hygrometricaby binding to the W-box elements of the galactinol synthase(BhGolS1) promoter [J].Planta, 2009,230(6):1155-1166.
[9] Jiang Y, Deyholos M K.Functional characterization of Arabidopsis NaCl-inducible WRKY25 and WRKY33 transcription factors in abiotic stresses [J].Plant Mol Biol, 2009,69(1-2): 91-105.
[10] Li S, Fu Q, Huang W,et al.Functional analysis of anArabidopsistranscription factor WRKY25 in heat stress [J].Plant Cell Rep,2009, 28(4): 683-693.
[11] 彭麗麗,姜衛(wèi)兵,健 韓.源庫關(guān)系變化對果樹產(chǎn)量及果實品質(zhì)的影響[J].經(jīng)濟林研究,2012,30(3):134-140.
[12] Jaillon O, Aury J M, Noel B,et al.The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla [J].Nature, 2007, 449(7161): 463-467.
[13] Marchive C, Leon C, Kappel C,et al.Over-expression of VvWRKY1 in grapevines induces expression of jasmonic acid pathway-related genes and confers higher tolerance to the downy mildew [J].PLoS One, 2013, 8(1): 54185.
[14] Tamura K, Peterson D, Peterson N,et al.MEGA5: molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance, and maximum parsimony methods [J].Mol Biol Evol, 2011, 28(10): 2731-2739.
[15] Cai B, Yang X, Tuskan G A,et al.MicroSyn: a user friendly tool for detection of microsynteny in a gene family [J].BMC Bioinformatics, 2011, (12):79.