袁 月,張亞光,高世敏,陶建敏
?
葡萄基因家族生物信息學(xué)及表達(dá)
袁 月,張亞光,高世敏,陶建敏
(南京農(nóng)業(yè)大學(xué)園藝學(xué)院,南京210095)
【目的】OVATE是一類調(diào)控植物生長發(fā)育的轉(zhuǎn)錄抑制因子,對葡萄基因家族()進(jìn)行生物信息學(xué)和組織特異性表達(dá)分析,為該類基因的功能研究奠定基礎(chǔ)。【方法】根據(jù)OVATE保守域蛋白序列(PF04844)對葡萄基因家族進(jìn)行鑒定,利用生物信息學(xué)方法對葡萄基因家族染色體定位、基因結(jié)構(gòu)、保守結(jié)構(gòu)域、亞細(xì)胞定位等方面進(jìn)行預(yù)測和分析,并分析葡萄和擬南芥基因家族的進(jìn)化關(guān)系。采用實(shí)時(shí)熒光定量PCR技術(shù)檢測組織表達(dá)特性?!窘Y(jié)果】葡萄基因家族包含17個(gè)成員,不均勻地分布在11條染色體上,均沒有內(nèi)含子結(jié)構(gòu),編碼115—444個(gè)氨基酸,等電點(diǎn)4.55—9.69,均為親水蛋白;所有蛋白均包含完整的OVATE保守結(jié)構(gòu)域,亞細(xì)胞定位主要在細(xì)胞核中。根據(jù)進(jìn)化樹拓?fù)浣Y(jié)構(gòu),將葡萄和擬南芥OVATE蛋白家族聚為六類(I—VI),其中,Ⅱ、Ⅲ、Ⅴ類僅包含兩個(gè)基因,Ⅰ、Ⅳ、Ⅵ類中和相互交錯(cuò)地聚類在一起;和共包含10個(gè)未知基序,保守元件1和2位于OVATE結(jié)構(gòu)域區(qū)域,此外,在OVATE結(jié)構(gòu)域外每個(gè)類別均包含特有基序。具有組織表達(dá)特異性,12個(gè)基因在根、莖、葉、花和果實(shí)中均可以檢測到表達(dá),其余5個(gè)基因僅在特定組織中表達(dá)。多數(shù)在根、嫩莖和花中表達(dá)量較高,在嫩葉和果實(shí)中僅檢測到少數(shù)基因表達(dá);在不同發(fā)育期表達(dá)量存在差異,通常在開花前1周和開花期表達(dá)量較高,而花后4周果實(shí)中表達(dá)量較低。1對旁系同源基因表達(dá)模式相似,3對旁系同源基因產(chǎn)生了新的表達(dá)模式?!窘Y(jié)論】葡萄OVATE結(jié)構(gòu)域序列比較保守,其在不同組織中呈現(xiàn)出多種表達(dá)模式,推測其可能參與了葡萄生長發(fā)育的調(diào)控。
葡萄;基因家族;生物信息學(xué);表達(dá)
【研究意義】OVATE是一類植物轉(zhuǎn)錄因子[1-5],調(diào)控植物生長發(fā)育的多個(gè)方面,包括胚囊和花粉發(fā)育[1]、次生細(xì)胞壁合成[5]以及果實(shí)形狀[6-7]等。葡萄(L.)具有5 000多年的栽培歷史[8],其保留著古老的開花植物的基因組結(jié)構(gòu),是非常有用的模式植物[9]。對葡萄基因家族進(jìn)行生物信息學(xué)分析,對于葡萄功能基因組學(xué)的研究發(fā)展有重要意義?!厩叭搜芯窟M(jìn)展】LIU等[6]首次在番茄中克隆出,研究發(fā)現(xiàn)其能夠控制番茄果實(shí)形狀,該基因的一個(gè)點(diǎn)突變導(dǎo)致翻譯提前終止,使得野生番茄果實(shí)縱徑增長,頸部生長受到限制,從而由圓形果實(shí)發(fā)育成梨形果實(shí)。編碼一個(gè)親水蛋白,該蛋白的C末端結(jié)構(gòu)域DUF623在擬南芥、水稻和番茄中具有保守性,被命名為OVATE結(jié)構(gòu)域,凡含有該結(jié)構(gòu)域的蛋白,均屬于OVATE蛋白家族。目前關(guān)于OVATE蛋白家族的研究主要集中在擬南芥、番茄和水稻中,其中,擬南芥基因組中共被鑒定出18個(gè)OVATE蛋白,功能分析表明這些蛋白作為轉(zhuǎn)錄抑制因子,調(diào)控植株生長發(fā)育的多個(gè)過程[3,5]。在酵母雙雜交試驗(yàn)中,9個(gè)OVATE蛋白被發(fā)現(xiàn)與TALE同源異型盒蛋白相互作用,且AtOFP1和AtOFP5共同調(diào)控一個(gè)TALE同源異型盒蛋白BLH1的亞細(xì)胞定位,當(dāng)這兩個(gè)基因在煙草葉片中共表達(dá)時(shí),BLH1蛋白從細(xì)胞核運(yùn)輸?shù)郊?xì)胞質(zhì)中[1]。TALE同源異型盒蛋白包含一個(gè)三氨基酸殘基環(huán)連接兩個(gè)螺旋的結(jié)構(gòu)[10],分為KNOX和BELL兩個(gè)子類[11-13],KNOX和BELL蛋白相互作用形成異源二聚體,調(diào)控植物的生長發(fā)育[14-18],因此,擬南芥OVATE蛋白可以通過與TALE蛋白相互作用而間接調(diào)控植物生長發(fā)育,不僅如此,OVATE蛋白還可以直接調(diào)控靶基因的表達(dá)。是赤霉素合成關(guān)鍵酶基因,染色質(zhì)免疫共沉淀表明該基因是AtOFP1蛋白的靶基因,AtOFP1通過抑制該基因的表達(dá),調(diào)控赤霉素的生物合成,從而導(dǎo)致包括蓮座葉、下胚軸、莖葉、花序梗、花器官和角果在內(nèi)的地上部器官變短,該家族其他基因的過表達(dá)也具有相似的生理效應(yīng)[3]。此外,沉默、、、、和中任一個(gè)基因,植株的表型并未發(fā)生變化,表明這些家族成員間存在功能冗余[4]。AtOFP1還與AtKu70相互作用,參與DNA非同源末端修復(fù)[19]。AtOFP4能夠與KNAX7蛋白的相互作用,進(jìn)而調(diào)控次生細(xì)胞壁的形成[5]。AtOFP5通過抑制BLH1-KNAT3復(fù)合物活性在胚囊的發(fā)育早期發(fā)揮作用[2]。在番茄全基因組中共預(yù)測了31個(gè)家族基因,其中和在生殖器官中的表達(dá)量高于營養(yǎng)器官,而和在苗期的根、幼葉和下胚軸中表達(dá)量較高,表明番茄家族成員在植株發(fā)育調(diào)控中發(fā)揮著不同的作用[20]。在水稻的基因組中共預(yù)測出31個(gè)家族基因,這些基因同樣具有組織表達(dá)特異性,接近一半的基因在苗期表達(dá)量較高;外施油菜素內(nèi)酯可以顯著影響和的表達(dá)[21]。辣椒OVATE蛋白家族成員CaOVATE也是通過抑制表達(dá),從而改變果實(shí)形狀[7]。香蕉OVATE蛋白家族成員MaOFP1與香蕉MuMADS1蛋白存在互作,兩者共同調(diào)控香蕉果實(shí)的發(fā)育,在香蕉果實(shí)發(fā)育前期表達(dá)量較高,后期表達(dá)則受到乙烯的抑制[22]。在最近的研究[23]中,包含擬南芥、水稻、番茄在內(nèi)的13種植物基因家族被鑒定出來,共有265個(gè)OVATE蛋白序列,這些物種包含較古老的苔蘚和石松門植物,生物信息學(xué)分析表明,基因家族存在不同的進(jìn)化機(jī)制,主要為保守進(jìn)化和分散擴(kuò)增兩種方式?!颈狙芯壳腥朦c(diǎn)】目前,僅有一篇外文文獻(xiàn)報(bào)道葡萄全基因組中包含9個(gè)家族成員,鑒定出的基因數(shù)目較少,且未詳細(xì)地進(jìn)行生物信息學(xué)和表達(dá)分析,因此,有必要對葡萄基因家族進(jìn)行全面鑒定和分析。【擬解決的關(guān)鍵問題】在葡萄全基因組中搜索鑒定基因家族成員,全面分析基因結(jié)構(gòu)、染色體定位、蛋白保守結(jié)構(gòu)域及系統(tǒng)發(fā)育等信息,同時(shí)研究葡萄基因家族的組織表達(dá)特征,為進(jìn)一步探究基因功能提供依據(jù)。
1.1 材料
供試品種為二倍體‘寶滿’葡萄,種植于南京農(nóng)業(yè)大學(xué)園藝學(xué)院湯山葡萄基地,以每個(gè)花序一半以上的小花開放作為開花期,分別于2015年5月5日(花前一周)采集花蕾,5月12日(開花期)采集開放的小花(含花冠和花藥),6月12日(花后四周)采果實(shí),采集新稍上完全展開的嫩葉和嫩莖。根取自組培苗,組培苗由南京農(nóng)業(yè)大學(xué)園藝學(xué)院果樹生物技術(shù)實(shí)驗(yàn)室培養(yǎng),培養(yǎng)條件是光照時(shí)間16 h,光照強(qiáng)度2 000 lx,培養(yǎng)溫度25℃。材料用液氮速凍后,保存于-80℃冰箱。
1.2 方法
1.2.1 葡萄和擬南芥基因家族的鑒定 擬南芥全基因組的注釋序列在NCBI(http://www.ncbi. nlm.nih.gov/)中下載,葡萄全基因組注釋序列分別在Grape Genome[9](http://genomes.cribi.unipd.it/grape/)和NCBI(http://www.ncbi.nlm.nih.gov/)中下載,在Pfam數(shù)據(jù)庫[24](http://pfam.xfam.org/)中下載葡萄和擬南芥OVATE蛋白保守域序列(PF04844),利用Bioedit軟件在葡萄和擬南芥的蛋白組中搜索這些序列的同源蛋白,刪除重復(fù)序列,將得到的序列在Pfam上搜索,去除沒有OVATE保守域的序列,最終獲得葡萄和擬南芥家族基因。
1.2.2 葡萄基因家族的生物信息學(xué)分析 利用在線網(wǎng)站EXPASY(http://web.expasy.org/protparam/)中ProtParam工具[25]對葡萄OVATE家族蛋白的氨基酸組成、疏水性、等電點(diǎn)等理化性質(zhì)進(jìn)行分析;在NCBI上下載葡萄和擬南芥OVATE家族基因的CDS序列和基因組定位信息,利用在線軟件GSDS2.0[26](http://gsds.cbi.pku.edu.cn/index.php)繪出基因結(jié)構(gòu)圖,并運(yùn)用MapInspect工具進(jìn)行染色體定位作圖;利用序列分析軟件 clustalX2.0,Jalview2.8和在線軟件WebLogo3[27](http://weblogo.threeplusone.com/)分析葡萄OVATE家族蛋白的OVATE保守結(jié)構(gòu)域序列;使用在線軟件CelloV.2.5[28](http://cello.life.nctu.edu. tw/),WOLF PSORT(http://www.genscript.com/wolf- psort.html),以及在線網(wǎng)站Soft Berry(http://linux1. softberry.com/berry.phtml)中的PROTCOMP程序共同對葡萄OVATE家族基因進(jìn)行亞細(xì)胞定位預(yù)測,利用MEGA5.0[29]軟件對已鑒定的葡萄和擬南芥OVATE家族蛋白進(jìn)行序列比對,并用鄰位(Neighbor-Joining)算法構(gòu)建系統(tǒng)進(jìn)化樹,進(jìn)行Bootstrap測試,重復(fù)設(shè)置1 000;基序預(yù)測采用在線軟件MEME[30](http://meme- suite.org/tools/meme),參數(shù)設(shè)置為:預(yù)測數(shù)目10,氨基酸數(shù)目4—70,位點(diǎn)數(shù)2—300。
1.2.3 葡萄基因家族表達(dá)分析 根據(jù)基因序列設(shè)計(jì)實(shí)時(shí)熒光定量PCR特異引物(表1),以葡萄(XM_002265440)作為內(nèi)參基因,采用成都福際公司的多糖多酚植物組織總RNA提取試劑盒提取RNA,利用TaKaRa公司的反轉(zhuǎn)錄試劑盒PrimeScript? 1st Strand cDNA Synthesis Kit反轉(zhuǎn)錄合成cDNA第一條鏈,稀釋后的cDNA用于實(shí)時(shí)熒光定量PCR。PCR采用20 μL反應(yīng)體系:cDNA 1 μL,2×SYBR Premix EX TaqTM(TaKaRa)10 μL,上、下游引物各0.2 μL,滅菌后ddH2O 8.6 μL;反應(yīng)程序:95℃預(yù)變性4 min;95℃變性20 s,60℃退火20 s,72℃延伸40 s,40個(gè)循環(huán)。每個(gè)處理3次重復(fù),采用ABI7300system軟件和2-ΔΔCT[31]方法分析數(shù)據(jù)。
表1 引物序列
2.1鑒定及蛋白質(zhì)理化性質(zhì)分析
通過搜索葡萄全基因組數(shù)據(jù)庫,共鑒定出17個(gè)葡萄基因家族成員,根據(jù)其在染色體上的位置,依次命名為—。這些基因的編碼區(qū)長度在348—1 335 bp,編碼115—444個(gè)氨基酸,等電點(diǎn)在4.55—9.69,氨基酸序列的平均親水系數(shù)在-1.032—-0.283,均為負(fù)值,表明這些蛋白均為親水蛋白,但親水程度不同,詳見表2。
表2 葡萄OVATE家族基因信息和理化性質(zhì)分析
2.2 VvOFPs的OVATE保守域的鑒定和分析
通過Pfam在線數(shù)據(jù)庫對候選的葡萄OVATE家族蛋白進(jìn)行鑒定,所有候選基因在C末端均含有OVATE保守結(jié)構(gòu)域,下載這些蛋白的OVATE結(jié)構(gòu)域序列,利用clustalX2.0軟件進(jìn)行序列比對,并使用Jalview2.8繪制并分析比對序列,WebLogo3創(chuàng)建保守域Logo,最終拼接得到圖1,由圖1可知,葡萄OVATE結(jié)構(gòu)域序列比較保守,氨基酸數(shù)目在55—61,所有蛋白的OVATE結(jié)構(gòu)域序列都比較完整,結(jié)合基序分析結(jié)果,基序1全部位點(diǎn)均在OVATE結(jié)構(gòu)域區(qū)域,其中保守性強(qiáng)的氨基酸有亮氨酸(L35)、天冬酰胺(N43)、異亮氨酸(I51)及苯丙氨酸(F55);基序2大部分位點(diǎn)位于結(jié)構(gòu)域區(qū)域,其中保守性強(qiáng)的氨基酸有絲氨酸(S1,S11)、脯氨酸(P4)、蛋氨酸(M12)。
圖1 葡萄OVATE蛋白家族的保守結(jié)構(gòu)域序列比對
2.3的染色體定位分析
葡萄家族的17個(gè)基因不均等地分布在11條染色體上,1、2、3、12、14、15、17、19號染色體上均沒有分布,其中,在6號和8號染色體上分布的基因最多,分別有3個(gè)基因;4號、10號染色體各分布2個(gè)基因;其余7條染色體均只含有1個(gè)基因。此外,6號染色體上的和及8號染色體上的和物理距離較近,分別為8.7和6.4 kb,以串聯(lián)的方式排列在染色體上(圖2)。
圖2 葡萄OVATE基因家族的染色體定位
2.4 VvOFPs的進(jìn)化樹分析
構(gòu)建葡萄和擬南芥OVATE蛋白家族系統(tǒng)進(jìn)化樹(圖3-A),根據(jù)進(jìn)化樹的拓?fù)浣Y(jié)構(gòu)對兩個(gè)物種OVATE家族蛋白進(jìn)行聚類,可分為六類,分別是Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ和Ⅵ。其中,Ⅱ、Ⅲ、Ⅴ類所包含的基因較少,均只有兩個(gè)基因,均包含1個(gè)和1個(gè),說明該分支內(nèi)基因進(jìn)化速度相對緩慢,推測其基因功能相對保守。Ⅰ類包含2個(gè)和4個(gè),Ⅳ類包含5個(gè)和4個(gè),Ⅵ類包含7個(gè)和7個(gè),在Ⅰ、Ⅳ、Ⅵ類中,和,和,和的親緣關(guān)系較近,可能具有相似的功能,其余和相互交錯(cuò)地聚類在一起,形成了4對旁系同源基因?qū)Γǎ?,形成?對旁系同源基因?qū)Γā?、、)?/p>
2.5 VvOFPs的基序分析
利用在線軟件MEME對葡萄和擬南芥OVATE家族的蛋白序列進(jìn)行基序預(yù)測,結(jié)果表明,葡萄OVATE蛋白家族共包含10個(gè)未知基序(圖3-B)。每個(gè)蛋白序列的C末端均含有保守元件1和2,位于OVATE結(jié)構(gòu)域區(qū)域,推測這兩個(gè)基序可能與OVATE結(jié)構(gòu)域的功能相關(guān),結(jié)合進(jìn)化樹分析,Ⅴ類的基因僅有基序1和2,除Ⅰ和Ⅲ類之外,Ⅱ、Ⅳ和Ⅵ類中也分別存在1—2個(gè)基因僅有這兩個(gè)基序。除基序1和2外,有些基序也在不同的類別中同時(shí)存在,如Ⅱ類中的1個(gè)基因與Ⅵ類中的4個(gè)基因共享基序7,Ⅳ類中的5個(gè)基因與Ⅰ類中的2個(gè)基因共享基序9;而有些基序是各類別所特有的,Ⅰ類中全部基因都共享保守元件3,該基序位于N末端DNA結(jié)合域中;Ⅲ類的兩個(gè)基因共享基序10;Ⅳ類中3個(gè)基因共享未知基序8;Ⅵ類中6個(gè)基因同時(shí)共享基序4、5和6,基序分析結(jié)果和進(jìn)化樹分類結(jié)果基本一致。
基因登錄號分別是:AtOFP1,At5g01840;AtOFP2,At2g30400;AtOFP3,At5g58360;AtOFP4,At1g06920;AtOFP5,At4g18830;AtOFP6,At3g52525;AtOFP,At2g18500;AtOFP8,At5g19650;AtOFP9,T24H24.4;AtOFP10,At5g22240;AtOFP11,At4g14860;AtOFP12,At1g05420;AtOFP13,At5g04820;AtOFP14,At1g79960;AtOFP15,At2g36050;AtOFP16,At2g32100;AtOFP17,At2g36026;AtOFP18,At3g52540;系統(tǒng)發(fā)育樹樹枝上面或下面的數(shù)字代表自舉值
2.6的內(nèi)含子和外顯子分析
利用Pfam數(shù)據(jù)庫中OVATE保守結(jié)構(gòu)域序列對擬南芥全基因組序列進(jìn)行BLAST,并在植物轉(zhuǎn)錄因子數(shù)據(jù)庫PlnTFDB(3.0)中搜索AtOFP9,共鑒定出18個(gè)家族基因,根據(jù)兩個(gè)物種的基因組和CDS序列,繪制兩個(gè)物種的基因結(jié)構(gòu)圖。圖3-C表明擬南芥和葡萄家族基因均沒有內(nèi)含子,此外,葡萄家族有兩個(gè)基因結(jié)構(gòu)不完整,分別是缺少3′非編碼區(qū),既缺少非5′編碼區(qū),也沒有3′非編碼區(qū);擬南芥家族只有6個(gè)基因包含完整的結(jié)構(gòu),、、、、、、和既缺少非5′編碼區(qū),也沒有3′非編碼區(qū),、和缺少5′非編碼區(qū),缺少3′非編碼區(qū)。
2.7 VvOFPs的亞細(xì)胞定位
在3個(gè)亞細(xì)胞定位網(wǎng)站上分析葡萄OVATE蛋白家族,預(yù)測的結(jié)果存在差異(表3),其中在CelloV2.5 預(yù)測結(jié)果中,15個(gè)蛋白被定位在細(xì)胞核,VvOFP9被定位在葉綠體和細(xì)胞外,VvOFP5被定位在細(xì)胞膜和細(xì)胞外;根據(jù)WOLF PSORT 預(yù)測結(jié)果,17個(gè)蛋白被定位在細(xì)胞核,12個(gè)在線粒體,11個(gè)在葉綠體,9個(gè)在三者中均被定位,還有少數(shù)蛋白被定位在細(xì)胞外、細(xì)胞膜、內(nèi)質(zhì)網(wǎng)和高爾基體上;在PROTCOMP預(yù)測結(jié)果中,8個(gè)蛋白被定位在細(xì)胞核,其余7個(gè)蛋白被定為在細(xì)胞外。綜合分析預(yù)測結(jié)果,5個(gè)蛋白定位結(jié)果一致,定位在細(xì)胞核的分值最高,分別是VvOFP6、VvOFP7、VvOFP11、VvOFP13和VvOFP14,另外12個(gè)蛋白在兩種或一種定位方法中被定為在細(xì)胞核,這符合轉(zhuǎn)錄因子在細(xì)胞核中調(diào)控基因表達(dá)的作用特點(diǎn)。
表3 葡萄OVATE蛋白家族的亞細(xì)胞定位預(yù)測
nucl:細(xì)胞核,plas:質(zhì)膜,extr:細(xì)胞外,cyto:細(xì)胞質(zhì),mito:線粒體,E.R.:內(nèi)質(zhì)網(wǎng),chlo:葉綠體,golg:高爾基體。括號內(nèi)的數(shù)值代表預(yù)測的綜合得分
nucl: nucleus, plas: plasma membrane, extr: extracellular, cyto: cytoplasm, mito: mitochondria, E.R.: endoplasmic reticulum, chlo: chloroplast, golg: golgi. The numbers in parenthesis mean the integral prediction scores of protein location
2.8家族基因在不同組織中表達(dá)分析
對葡萄基因家族在不同組織的表達(dá)結(jié)果(圖4)進(jìn)行分析,表明這些基因具有組織表達(dá)特異性,12個(gè)基因在各個(gè)組織中均可以檢測到表達(dá),其余基因、、、、僅在幾個(gè)組織中檢測到表達(dá),且這5個(gè)基因集中在Ⅲ類和Ⅵ類。在根中表達(dá)量較高的是、、、、;在莖中表達(dá)量較高的是、、、、、;在花前1周的花蕾表達(dá)量較高的有、、、、、、、;在開花期的小花中表達(dá)量較高的有、、、。這些基因在葉片和花后4周的果實(shí)中表達(dá)量均較低。對比不同時(shí)期花和果實(shí)的表達(dá)量,可以發(fā)現(xiàn)全部基因在花后4周的果實(shí)中表達(dá)量均顯著下降,大部分基因花前1周花蕾中的表達(dá)量高于開花期,這說明葡萄OVATE家族基因?qū)麑?shí)發(fā)育的調(diào)控在開花期及其前1周。此外,和這對旁系同源基因表達(dá)模式相似,主要在生殖器官中表達(dá);而和,和,和,這3對旁系同源基因表達(dá)模式不同。
R:根,YS:嫩莖,YL:嫩葉,1BA:花蕾(花前1周),A:小花(開花期),4AA:果實(shí)(花后4周);垂直線表示的是3個(gè)生物學(xué)重復(fù)相對表達(dá)量之間的正偏差
本文利用Pfam數(shù)據(jù)庫中OVATE保守結(jié)構(gòu)域序列對葡萄全基因組序列進(jìn)行BLAST,共獲得葡萄基因家族成員17個(gè),經(jīng)過保守結(jié)構(gòu)域分析鑒定,這些基因均屬于基因家族。LIU等[23]根據(jù)已報(bào)道的擬南芥OVATE蛋白序列以及番茄OVATE蛋白(AAN17752),在Phyzome和Genoscope兩個(gè)基因組網(wǎng)站上進(jìn)行Blast,共獲得9個(gè)葡萄基因家族成員,比本文獲得的基因數(shù)少了8個(gè)。本文所鑒定的擬南芥基因家族成員與前人報(bào)道不盡相同,HACKBUSCH等[1]根據(jù)番茄OVATE蛋白結(jié)構(gòu)域序列在擬南芥基因組數(shù)據(jù)庫TAIR(http://www.arabidopsis.org/)中進(jìn)行BLAST,獲得18個(gè),WANG等[4]發(fā)現(xiàn)(登錄號At4g04030)編碼的蛋白中缺少OVATE結(jié)構(gòu)域,本文利用Pfam數(shù)據(jù)庫中OVATE保守結(jié)構(gòu)域序列對擬南芥全基因組序列進(jìn)行BLAST,只獲得了17個(gè)基因,缺少(登錄號At4g04030),在植物轉(zhuǎn)錄因子數(shù)據(jù)庫PlnTFDB(3.0)中查找到含有OVATE結(jié)構(gòu)域的,將該蛋白序列在NCBI上BLAST,獲得相似度100%的序列(登錄號AF075598),該序列是通過細(xì)菌人工染色體克隆獲得,氨基酸數(shù)目為411個(gè),而氨基酸數(shù)目僅為128個(gè),兩個(gè)基因均位于4號染色體,存在部分重疊區(qū)域,因此,本研究認(rèn)為即是。
葡萄和擬南芥均屬于雙子葉植物,前人研究[21,23]發(fā)現(xiàn)在單子葉植物的家族基因數(shù)目高于雙子葉植物,高等植物家族多數(shù)基因缺少內(nèi)含子結(jié)構(gòu),其中帶有內(nèi)含子的基因一般只有1個(gè)內(nèi)含子,這可能是因?yàn)榛蚣易逶谶M(jìn)化過程中相對保守。本文對葡萄和擬南芥家族基因結(jié)構(gòu)進(jìn)行分析,發(fā)現(xiàn)兩個(gè)物種均沒有內(nèi)含子結(jié)構(gòu)。本研究根據(jù)葡萄和擬南芥基因家族的蛋白序列進(jìn)行進(jìn)化樹構(gòu)建,并根據(jù)進(jìn)化樹的拓?fù)浣Y(jié)構(gòu)分為6類,基序分析表明在OVATE結(jié)構(gòu)域外,每個(gè)類別包含特有基序,這也同時(shí)驗(yàn)證了分類結(jié)果。在多項(xiàng)OVATE蛋白家族聚類分析研究中也采用了此類方法[4,20-21,23]。LIU等[23]提出基因家族包括保守進(jìn)化和發(fā)散擴(kuò)增兩種進(jìn)化機(jī)制,一方面有些分支每個(gè)物種僅有1—2個(gè)基因,這些基因在功能上相對保守,可能對植物的發(fā)育有著非常重要的作用;另一方面有些分支每個(gè)物種包含很多基因,這些基因在功能上發(fā)生了分化,擁有這個(gè)物種所特有的功能,本文也有類似的情況,如Ⅱ、Ⅲ、Ⅴ類中僅包含兩個(gè)基因,可能發(fā)生了保守進(jìn)化,產(chǎn)生相似的功能。
葡萄在生長發(fā)育過程中要經(jīng)歷營養(yǎng)生長和生殖生長兩個(gè)時(shí)期,基因在不同發(fā)育期不同組織的表達(dá)特性反應(yīng)了基因的功能,本研究表明葡萄基因家族在不同組織中特異表達(dá),有些基因在某個(gè)組織中特異表達(dá),例如只在花前一周和開花期檢測到表達(dá),說明該基因可能在花中發(fā)揮調(diào)控作用;有些基因在生殖器官或營養(yǎng)器官中表達(dá)量較高,例如,在花中表達(dá)量較高,而在根、葉中表達(dá)量極少,推測該基因可能參與了葡萄生殖生長的調(diào)控;有些基因在各組織中表達(dá)量差異不大,如在葉、莖,花前1周和開花期的花中表達(dá)量差異不大,推測該基因可能調(diào)控葡萄生長發(fā)育的多個(gè)過程。對比擬南芥基因家族組織表達(dá)研究結(jié)果[4],發(fā)現(xiàn)一些直系同源的葡萄和擬南芥家族基因也存在類似的表達(dá)特性,推測這些基因可能行使相似的功能,例如,和被檢測到在嫩莖中表達(dá)量較高和在花蕾中表達(dá)量較高和在根中被檢測到表達(dá)量較高。LIU等[23]研究發(fā)現(xiàn)番茄中旁系同源基因存在兩種表達(dá)模式,一種是保持復(fù)制前的功能,兩個(gè)基因具有相似的表達(dá)模式;另一類是兩個(gè)基因的功能發(fā)生了變異,其中1個(gè)基因保留著原始的功能,而另1個(gè)基因則產(chǎn)生了新的表達(dá)模式。本研究中也有類似的發(fā)現(xiàn),如和這對旁系基因在生殖器官中的表達(dá)量較高;、與屬于直系同源基因,和在根中的表達(dá)量較高,而在根部的表達(dá)量很低,在花前1周的花蕾中表達(dá)量較高。
通過分析葡萄基因家族的染色體定位、基因結(jié)構(gòu)、亞細(xì)胞定位、保守域分析、系統(tǒng)進(jìn)化和基序鑒定等多方面的生物學(xué)信息,較為系統(tǒng)地鑒定了葡萄基因家族,葡萄OVATE結(jié)構(gòu)域序列比較保守;其在不同組織中呈現(xiàn)出多種表達(dá)模式,推測其可能參與了葡萄生長發(fā)育的調(diào)控。
[1] HACKBUSCH J, RICHTER K, MULLER J, SALAMINI F, UHRIG J F. A central role ofovate family proteins in networking and subcellular localization of 3-aa loop extension homeodomain proteins., 2005, 102(13): 4908-4912.
[2] PAGNUSSAT G C, YU H J, SUNDARESAN V. Cell-fate switch of synergid to egg cell inmutant embryo sacs arises from misexpression of the BEL1-like homeodomain gene., 2007, 19(11): 3578-3592.
[3] WANG S, CHANG Y, GUO J, CHEN J G.ovate family protein 1 is a transcriptional repressor that suppresses cell elongation., 2007, 50(5): 858-872.
[4] WANG S, CHANG Y, GUO J, ZENG Q, ELLIS B E, CHEN J G.ovate family proteins, a novel transcriptional repressor family, control multiple aspects of plant growth and development., 2011, 6(8): e23896.
[5] LI E, WANG S, LIU Y, CHEN J G, DOUGLAS C J. OVATE FAMILY PROTEIN4 (OFP4) interaction with KNAT7 regulates secondary cell wall formation in., 2011, 67(2): 328-341.
[6] LIU J, VAN ECK J, CONG B, TANKSLEY S D. A new class of regulatory genes underlying the cause of pear-shaped tomato fruit., 2002, 99(20): 13302-13306.
[7] TSABALLA A, PASENTSIS K, DARZENTAS N, TSAFTARIS A S. Multiple evidence for the role of angene in determining fruit shape in pepper., 2011, 11: 46.
[8] 陳杰忠. 果樹栽培學(xué)各論. 北京: 中國農(nóng)業(yè)出版社, 2011.
CHEN J Z.. Beijing: China Agriculture Press, 2011. (in Chinese)
[9] VITULO N, FORCATO C, CARPINELLI E C, TELATIN A, CAMPAGNA D, D'ANGELO M, ZIMBELLO R, CORSO M, VANNOZZI A, BONGHI C, LUCCHIN M, VALLE G. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype., 2014, 14: 99.
[10] BERTOLINO E, REIMUND B, WILDT-PERINIC D, CLERC R G. A novel homeobox protein which recognizes a TGT core and functionally interferes with a retinoid-responsive motif., 1995, 270(52): 31178-31188.
[11] HAY A, TSIANTIS M. A KNOX family TALE., 2009, 12(5): 593-598.
[12] HAMANT O, PAUTOT V. Plant development: a TALE story., 2010, 333(4): 371-381.
[13] HAY A, TSIANTIS M. KNOX genes: versatile regulators of plant development and diversity., 2010, 137(19): 3153-3165.
[14] BELLAOUI M, PIDKOWICH M S, SAMACH A, KUSHALAPPA K, KOHALMI S E, MODRUSAN Z, CROSBY W L, HAUGHN G W. TheBELL1 and KNOX TALE homeodomain proteins interact through a domain conserved between plants and animals., 2001, 13(11): 2455-2470.
[15] SMITH H M, HAKE S. The interaction of two homeobox genes,and, regulates internode patterning in theinflorescence.2003, 15(8): 1717-1727.
[16] SMITH H M, BOSCHKE I, HAKE S. Selective interaction of plant homeodomain proteins mediates high DNA-binding affinity., 2002, 99(14): 9579-9584.
[17] CHEN H, BANERJEE A K, HANNAPEL D J. The tandem complex of BELL and KNOX partners is required for transcriptional repression of., 2004, 38(2): 276-284.
[18] COLE M, NOLTE C, WERR W. Nuclear import of the transcription factor SHOOT MERISTEMLESS depends on heterodimerization with BLH proteins expressed in discrete sub-domains of the shoot apical meristem of., 2006, 34(4): 1281-1292.
[19] WANG Y K, CHANG W C, LIU P F, HSIAO M K, LIN C T, LIN S M, PAN R L. Ovate family protein 1 as a plant Ku70 interacting protein involving in DNA double-strand break repair., 2010, 74(4/5): 453-466.
[20] HUANG Z, VAN HOUTEN J, GONZALEZ G, XIAO H, VAN DER KNAAP E. Genome-wide identification, phylogeny and expression analysis of,andgene family in tomato., 2013, 288(3/4): 111-129.
[21] YU H, JIANG W, LIU Q, ZHANG H, PIAO M, CHEN Z, BIAN M. Expression pattern and subcellular localization of the ovate protein family in rice., 2015, 10(3): e118966.
[22] LIU J, ZHANG J, HU W, MIAO H, ZHANG J, JIA C, WANG Z, XU B, JIN Z. Banana Ovate family protein MaOFP1 and MADS-box protein MuMADS1 antagonistically regulated banana fruit ripening., 2015, 10(4): e123870.
[23] LIU D, SUN W, YUAN Y, ZHANG N, HAYWARD A, LIU Y, WANG Y. Phylogenetic analyses provide the first insights into the evolution of OVATE family proteins in land plants., 2014, 113(7): 1219-1233.
[24] FINN R D, COGGILL P, EBERHARDT R Y, EDDY S R, MISTRY J, MITCHELL A L, POTTER S C, PUNTA M, QURESHI M, SANGRADORVEGAS A. The Pfam protein families database: towards a more sustainable future., 2015, 44(Database issue): D279-D285.
[25] WALKER J M.. Humana Press, 2005.
[26] HU B, JIN J, GUO A Y, ZHANG H, LUO J, GAO G. GSDS 2.0: an upgraded gene feature visualization server., 2014, 31(8): 1296.
[27] CROOKS G E, HON G, CHANDONIA J M, BRENNER S E. WebLogo: a sequence logo generator., 2004, 14(6): 1188-1190.
[28] CHIN-SHENG Y, YU-CHING C, CHIH-HAO L, JENN-KANG H. Prediction of protein subcellular localization., 2006, 64(3): 643-651.
[29] TAMURA K, PETERSON D, PETERSON N, STECHER G, NEI M, KUMAR S. MEGA5: molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods., 2011, 28(10): 2731-2739.
[30] BAILEY T L, MIKAEL B, BUSKE F A, MARTIN F, GRANT C E, LUCA C, JINGYUAN R, LI W W, NOBLE W S. MEME SUITE: tools for motif discovery and searching., 2009, 37(Suppl2): W202-W208.
[31] LIVAK K J, SCHMITTGEN T D. Analysis of relative gene expression data using real-time quantitative PCR and the 2(-Delta delta C(T)) method., 2001, 25(4): 402-408.
(責(zé)任編輯 趙伶俐)
Bioinformatics and Expression of theGene Family in Grape
YUAN Yue, ZHANG Ya-guang, GAO Shi-min, TAO Jian-min
(College of Horticulture, Nanjing Agricultural University, Nanjing 210095)
【Objective】OVATE is a class of transcriptional repressor that regulates plant growth and development. In this study, the authors analyzed the grapegene family () from the aspects of bioinformatics and tissue-specific expression in order to lay a foundation for the functional studies in future. 【Method】Based on the conserved OVATE domain (PF04844),genes were identified from grape genome. Chromosome location, gene structure, conserved domain and subcellular localization were also analyzed by the bioinformatics methods. A phylogenetic analysis was conducted based on the alignment of the OVATE proteins from grape andgenomes. The expression patterns ofwere tested via quantitative real-time polymerase chain reaction (qRT-PCR). 【Result】Seventeen putativewere identified in the grape genome and they unevenly distributed on the eleven chromosomes. No intron was found in the gene structures of. Theencoded hydrophilic proteins, containing 115-444 amino acids, and their isoelectric points ranged from 4.55-9.69. In addition, all the VvOFPs contained the entire OVATE domain and were predicted to be located in the nucleus. According to the topology of phylogenetic tree, OVATE proteins from grape andwere divided into six groups (I-VI). Group II, III and V contained only two members, whilst members of groups I, IV and VI were clustered in the species-specific pattern. VvOFPs and AtOFPs contained 10 uncharacterized motifs. Motifs 1 and 2 were located in the OVATE domain region. Besides, group-specific motifs were also found outside the OVATE domain. qRT-PCR analysis showed thatexhibited different tissue-specific expression patterns. Interestingly, twelvewere found to be expressed in the detected organs of roots, stems, leaves, flowers and fruits while the others were expressed in the specific organ tissues. Most of thewere more highly expressed in roots, stems and flowers, whereas a little gene was detected with low level in leaves and fruits. Meanwhile,expressed differently at different developmental stage. Transcripts in flowers a week before or at anthesis were at a high level, while low in fruits four weeks after anthesis. In addition, one pair of paralogues exhibited the same expression patterns, whereas the other three pairs of paralogues exhibited divergent expression patterns. 【Conclusion】Results of this study showed that grape OVATE domain is conserved.exhibited different expression patterns and may be involved in regulation of plant growth and development.
grape;gene family; bioinformatics; expression
2016-03-16;接受日期:2016-06-07
國家現(xiàn)代農(nóng)業(yè)葡萄產(chǎn)業(yè)技術(shù)體系項(xiàng)目(CARS-30)、國家“948”重點(diǎn)項(xiàng)目(2016-X19)、淮安科技局葡萄新品種引進(jìn)及設(shè)施栽培技術(shù)研究與應(yīng)用項(xiàng)目(HAC2014019)、江蘇省科技廳設(shè)施條件下葡萄高效栽培新技術(shù)研究與應(yīng)用項(xiàng)目(SBE2014030811)
袁月,Tel:15150536081;E-mail:2013104040@njau.edu.cn。通信作者陶建敏,Tel:13905160976,E-mail:tjm266@sina.com