雷忠萍,賀道華,海江波,邢宏宜,趙俊興,程雪妮
(1.西北農(nóng)林科技大學(xué) 農(nóng)學(xué)院,陜西 楊凌 712100;2.西北農(nóng)林科技大學(xué) 生命科學(xué)學(xué)院,陜西 楊凌 712100)
雷蒙德氏棉擴(kuò)展蛋白基因家族的鑒定和特征分析
雷忠萍1,2,賀道華1,海江波1,邢宏宜1,趙俊興1,程雪妮2
(1.西北農(nóng)林科技大學(xué) 農(nóng)學(xué)院,陜西 楊凌 712100;2.西北農(nóng)林科技大學(xué) 生命科學(xué)學(xué)院,陜西 楊凌 712100)
擴(kuò)展蛋白具有松馳細(xì)胞壁和增加細(xì)胞壁柔韌性的功能。為了弄清該基因家族在雷蒙德氏棉中的特征,利用隱馬爾科夫模型(HMM)在雷蒙德氏棉基因組中進(jìn)行擴(kuò)展蛋白家族基因成員的鑒定,獲得了39個擴(kuò)展蛋白基因家族成員,分布在12條染色體上。系統(tǒng)發(fā)育分析將其歸入EXPA、EXPB、EXLA和EXLB共4個亞家族,分別含有26,4,3,6個基因。各亞家族中擴(kuò)展蛋白基因具有相對多樣化的基因結(jié)構(gòu);擴(kuò)展蛋白基因家族在進(jìn)化中經(jīng)歷了3次擴(kuò)張;染色體片段重復(fù)是該基因家族擴(kuò)張的主要方式;擴(kuò)張后純化選擇占主導(dǎo)地位。比較棉纖維發(fā)育不同時期及葉片、花瓣的深度測序和基因芯片表達(dá)譜,發(fā)現(xiàn)大部分?jǐn)U展蛋白基因參與了雷蒙德氏棉纖維、葉片和花瓣的生長發(fā)育,在不同的時空范圍均表現(xiàn)出表達(dá)多樣性。GrEXLA1、GrEXLA2和GrEXPA16在花瓣中優(yōu)勢表達(dá),GrEXPA23和GrEXPA24在葉片中表達(dá)水平較高,推測這些基因的表達(dá)分別參與了花瓣和葉片的發(fā)育進(jìn)程;其余的基因,在纖維的不同發(fā)育階段,表現(xiàn)出不同的表達(dá)豐度。研究結(jié)果有助于了解棉屬擴(kuò)展蛋白基因家族的特征及功能,為深入剖析棉纖維發(fā)育過程中的分子調(diào)控機(jī)理提供了基礎(chǔ)。
雷蒙德氏棉;擴(kuò)展蛋白;基因結(jié)構(gòu);系統(tǒng)發(fā)育分析;進(jìn)化分析;表達(dá)模式
擴(kuò)展蛋白(Expansin)是一類植物細(xì)胞壁伸展蛋白,是植物細(xì)胞壁的重要組分,廣泛存在于各種植物細(xì)胞組織中。擴(kuò)展蛋白一般由205~275個氨基酸組成,氨基末端含有1個長度為20~30個氨基酸的信號肽[1];中段含有1個類似于Glycoside hydrolase family 45的結(jié)構(gòu)域DPBB_1,長度為120~135個氨基酸;羧基端含有結(jié)構(gòu)域Pollen_allerg_1,長度為90~120個氨基酸。在植物細(xì)胞壁伸展研究中,Mcqueen-Mason等[2]首次從黃瓜胚軸中分離出擴(kuò)展蛋白。近年來,由多基因家族編碼的擴(kuò)展蛋白在越來越多的物種中被鑒定,如葡萄(29個擴(kuò)展蛋白家族成員[3])、蘋果(41個[4])、楊樹(36個[5])、玉米(88個[6])、大豆(75個[7])和大白菜(53個[8])。依據(jù)系統(tǒng)進(jìn)化關(guān)系,擴(kuò)展蛋白可以分為4個亞家族,分別是EXPA、EXPB、EXLA和EXLB(也稱α、β、γ和δ亞家族[9])。其中,亞家族EXPA在大多數(shù)植物中是最大的1個亞家族,其次是亞家族EXPB[10]。
功能研究表明,擴(kuò)展蛋白參與許多生長發(fā)育過程,如種子發(fā)芽[11]、根毛的起始和伸長[12-13]、木質(zhì)部形成[14]、花粉管伸長[15-16]、水果成熟軟化[17]和葉片脫落[18]等;在植物抗逆[19-20]中擴(kuò)展蛋白也有重要作用。研究表明,擴(kuò)展蛋白在特定的pH梯度下,以酶催化的作用方式,使細(xì)胞壁組分間疏松,細(xì)胞伸展,細(xì)胞的柔韌性增強(qiáng),以此緩解各種環(huán)境因子對細(xì)胞的機(jī)械壓力[2,10]。EXPA亞家族更多作用于植物的生長發(fā)育[12,21]和抗性[22],EXPB亞家族則趨向于在生殖系統(tǒng)[23-24]中起作用。然而,EXLA和EXLB兩類亞家族僅僅知道其基因序列[1],尚沒有試驗證據(jù)發(fā)現(xiàn)其具有增加細(xì)胞壁柔韌性的功能[5]。
棉纖維是世界上重要的紡織原料之一,具有極其重要的經(jīng)濟(jì)價值。它是由胚珠外珠被表皮層的單細(xì)胞分化發(fā)育而成,大約歷時45~50 d,包含著4個依次并部分重疊的發(fā)育時期:纖維原始細(xì)胞的分化和突起、初生細(xì)胞壁伸長、次生細(xì)胞壁加厚和脫水成熟。研究表明纖維的發(fā)育涉及大量基因的表達(dá)和蛋白相互作用[25]。因此,棉纖維是單細(xì)胞生長發(fā)育的典型模型[26]和最佳研究材料,剖析其發(fā)育過程的機(jī)理意義重大[27]。纖維的伸長與細(xì)胞壁的松弛密切相關(guān),而擴(kuò)展蛋白能夠打斷纖維素微絲間的氫鍵,從而使細(xì)胞壁延展疏松。EST數(shù)據(jù)庫分析顯示,在纖維細(xì)胞迅速伸長時期,4個編碼擴(kuò)展蛋白的基因轉(zhuǎn)錄水平較高,而在后續(xù)的次生壁合成期后這4個基因的轉(zhuǎn)錄量顯著降低[28],暗示了它們主要在棉纖維細(xì)胞伸長期發(fā)揮功能。
目前,異源四倍體的陸地棉(Gossypiumhirsutum,染色體組AADD)是栽培面積及經(jīng)濟(jì)價值最大的棉種。普遍認(rèn)為,在100~200萬年前,雷蒙德氏棉(G.raimondii,染色體組DD)的祖先與亞洲棉(G.arboreum,染色體組AA)的祖先之間發(fā)生遠(yuǎn)緣雜交,雜交后代經(jīng)染色體加倍然后進(jìn)化成現(xiàn)今的陸地棉。雷蒙德氏棉基因組的測序工作已完成[29-30],為棉屬基因組的研究開創(chuàng)了新局面。本研究利用生物信息學(xué)方法,對雷蒙德氏棉全基因組的擴(kuò)展蛋白家族基因進(jìn)行了預(yù)測和系統(tǒng)進(jìn)化分析,并對其在棉纖維等組織發(fā)育過程中的表達(dá)模式進(jìn)行分析,旨在為棉花優(yōu)質(zhì)、高產(chǎn)等重要農(nóng)藝性狀提供候選基因,為基因組水平上的棉花分子育種工作提供基礎(chǔ)研究依據(jù)。
1.1 雷蒙德氏棉中搜索擴(kuò)展蛋白基因家族成員
本試驗的雷蒙德氏棉(G.raimondii)基因組及蛋白質(zhì)序列均來自于DOE Joint Genome Institute(JGI)網(wǎng)站(ftp://ftp.jgipsf.org/pub/)。擴(kuò)展蛋白家族成員序列信息下載于Daniel Cosgrove實驗室的網(wǎng)站(http://www.personal.psu.edu/)。擴(kuò)展蛋白特有的保守結(jié)構(gòu)域DPBB_1(pfam03330)和Pollen_allerg_1(pfam01357)來自網(wǎng)站http://pfam.xfam.org/。利用基于隱馬爾可夫模型的軟件HMMER(http://hmmer.janelia.org/)和本地化的Blast 2.2.26(ftp://ncbi.nlm.nih.gov/blast/executables/)軟件,在雷蒙德氏棉全蛋白質(zhì)序列數(shù)據(jù)庫中搜索擴(kuò)展蛋白基因。
1.2 系統(tǒng)發(fā)育樹的構(gòu)建及基因命名
利用ClustalW對雷蒙德氏棉擴(kuò)展蛋白家族的氨基酸序列(以擬南芥、水稻的擴(kuò)展蛋白序列作為outgroup)進(jìn)行序列比對,利用MEGA v5.1采用Neighbor-Joining算法構(gòu)建系統(tǒng)發(fā)育樹,從而將鑒定出來的雷蒙德氏棉擴(kuò)展蛋白進(jìn)行亞家族分類,在亞家族內(nèi)根據(jù)其在染色體上的位置順序進(jìn)行命名。
1.3 擴(kuò)展蛋白家族基因的結(jié)構(gòu)、染色體物理定位和基因復(fù)制共線性分析
利用擴(kuò)展蛋白基因的編碼區(qū)序列(CDS)與全基因組序列比對,在網(wǎng)站http://bio.ieo.eu/fancygene/得到基因結(jié)構(gòu)圖。利用Blast工具將所獲得的擴(kuò)展蛋白基因序列,定位到基因組的各染色體上;同時,在Phytozome的數(shù)據(jù)庫中對結(jié)果進(jìn)行驗證。利用MCScanX進(jìn)行擴(kuò)展蛋白家族基因成員倍增模式(基因復(fù)制共線性)分析,利用Circos繪制擴(kuò)展蛋白基因在染色體上的物理位置及基因間的共線性關(guān)系。利用perl代碼計算具有共線性關(guān)系的旁系同源基因?qū)﹂g的Ks、ω值(Ka/Ks)和4DTv。
1.4 擴(kuò)展蛋白序列分析及理化性質(zhì)分析
采用軟件BioEdit v7.1對雷蒙德氏棉中擴(kuò)展蛋白家族成員的mRNA和氨基酸序列進(jìn)行一致性分析;使用DnaSP 5.10程序?qū)酌傻率厦拗袛U(kuò)展蛋白密碼子偏好性(Codon Usage Bias)進(jìn)行統(tǒng)計;在http://www.cbs.dtu.dk/services/SignalP/分析信號肽;通過軟件MEME 4.8.0以及在線軟件ProtParam對雷蒙德氏棉中擴(kuò)展蛋白的結(jié)構(gòu)保守性、蛋白穩(wěn)定性及相關(guān)的理化性質(zhì)進(jìn)行考察;利用Euk-mPLoc 2.0 (http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/#)預(yù)測每個蛋白的亞細(xì)胞定位信息。
1.5 深度測序表達(dá)譜的獲得與分析
雷蒙德氏棉的葉片、纖維和胚珠不同時期的深度測序和基因芯片表達(dá)譜數(shù)據(jù)下載于NCBI網(wǎng)站SRA數(shù)據(jù)庫和GEO數(shù)據(jù)庫。表達(dá)譜原始數(shù)據(jù)文件登錄號見表1。參照He等[31]方法分析擴(kuò)展蛋白基因家族每個基因的表達(dá)量,并識別差異表達(dá)基因。
表1 雷蒙德氏棉擴(kuò)展蛋白家族基因表達(dá)譜分析數(shù)據(jù)Tab.1 Details of RNA-seq and microarray dataset mined for analysis of expansin expression profiles
2.1 雷蒙德氏棉擴(kuò)展蛋白基因家族
根據(jù)擴(kuò)展蛋白特有的保守結(jié)構(gòu)域DPBB_1和Pollen_allerg_1,運用HMMER軟件將多序列比對結(jié)果轉(zhuǎn)化為擴(kuò)展蛋白基因家族的HMM profile文件,在蛋白序列庫搜索具有目標(biāo)結(jié)構(gòu)域的蛋白序列。在雷蒙德氏棉全基因組中共檢索到39個擴(kuò)展蛋白基因家族成員,經(jīng)過Blast 和結(jié)構(gòu)域分析,確定這39個基因均具有擴(kuò)展蛋白家族的保守結(jié)構(gòu)域。其中,26個基因?qū)儆贓XPA亞家族,4個基因歸為EXPB亞家族,3個基因歸為EXLA亞家族,6個基因歸為EXLB亞家族。按其在染色體上的位置分布,將這39個擴(kuò)展蛋白基因依次命名為:GrEXPA01~GrEXPA26、GrEXPB1~GrEXPB4、GrEXLA1~GrEXLA3和GrEXLB1~GrEXLB6(表2)。與擬南芥(Arabidopsisthaliana)及楊樹(Populustrichocarpa)基因組相比較,雷蒙德氏棉基因組中包含較低比例的EXPA亞家族基因,約占基因家族總成員數(shù)的67%。在已測序的同為雙子葉植物的擬南芥和楊樹基因組中,這一比例分別為72%和75%(表3)。而在已測序的單子葉植物的水稻(Oryzasativa)基因組中,EXPA亞家族擴(kuò)展蛋白基因的比例為59%。比較而言,雷蒙德氏棉中EXLA亞家族擴(kuò)展蛋白基因的比例較小,約為7.7%,同為雙子葉植物的擬南芥和楊樹中的這一比例約為8.3%和5.6%,而單子葉植物水稻中的EXLA亞家族擴(kuò)展蛋白基因的比例為6.9%(表3)。
2.2 擴(kuò)展蛋白基因在染色體上的分布及共線性分析
雷蒙德氏棉基因組包含13對染色體,根據(jù)基因組測序結(jié)果,將雷蒙德氏棉擴(kuò)展蛋白基因家族的39個成員進(jìn)行染色體定位。結(jié)果表明,除了染色體Gr10外,39個擴(kuò)展蛋白基因分別位于雷蒙德氏棉的其余12條染色體上,并且擴(kuò)展蛋白基因在染色體上的分布較為分散(圖1)。染色體Gr03上僅1個擴(kuò)展蛋白基因,染色體Gr04上多達(dá)7個擴(kuò)展蛋白基因,且染色體Gr04上3個擴(kuò)展蛋白基因緊密串聯(lián)(成簇分布),4條染色體(Gr05、Gr07、Gr11和Gr12號)上均具有3個擴(kuò)展蛋白基因。
表2 雷蒙德氏棉擴(kuò)展蛋白基因家族成員鑒定Tab.2 Identification of expansin gene family members from G.raimondii
注:(+)和(-)分別表示該基因位于染色體正鏈和負(fù)鏈上。
Note:(+) and(-) indicated the forward and reverse orientation,respectively.
表3 不同植物擴(kuò)展蛋白及其4類亞家族基因數(shù)目Tab.3 Number of expansin family members identified in various organisms
共線性分析顯示,部分?jǐn)U展蛋白基因之間存在著交叉的共線性關(guān)系,如GrEXPA01/GrEXPA04/GrEXPA10、GrEXPA05/GrEXPA08/GrEXPA09、GrEXPA16/GrEXPA20/GrEXPA21/GrEXPA23、GrEXLA1/GrEXLA2/GrEXLA3等(圖1),表明這些擴(kuò)展蛋白基因位于染色體倍增塊(Duplicated block)上,即基因組進(jìn)化過程中,含有這些擴(kuò)展蛋白基因的染色體區(qū)段(大片段)發(fā)生了倍增(Duplication或Paleopolyploidy)。數(shù)據(jù)顯示,共有30個擴(kuò)展蛋白基因分屬于11組染色體倍增塊上(表4),其中5組倍增塊由2個以上的染色體區(qū)段構(gòu)成,說明這些擴(kuò)展蛋白基因還存在著交叉匹配的現(xiàn)象。例如:GrEXPA01、GrEXPA04和GrEXPA10倍增塊;GrEXPA16、GrEXPA20、GrEXPA21和GrEXPA23倍增塊。這些倍增塊的產(chǎn)生可能是由于染色體多次復(fù)制,從而使得倍增塊內(nèi)的數(shù)個基因間具有共線性的旁系同源或橫向同源關(guān)系(Paralog)。這些信息顯示了擴(kuò)展蛋白基因家族在雷蒙德氏棉中的擴(kuò)張歷程。表4顯示,倍增塊內(nèi)基因間的ω值(Ka/Ks)<1,顯示在經(jīng)歷了古老的基因組加倍(Paleopolyploidy)后,擴(kuò)展蛋白成員數(shù)增加,但主要經(jīng)歷著純化選擇(Purifying selection),所以倍增塊內(nèi),基因間差異較小。Ks分布密度(圖2)顯示出3個峰值(0.516 9,1.275 3和1.685 4),表明了在17.2(Million years),98.1,129.6 Myr前擴(kuò)展蛋白家族基因所在區(qū)段發(fā)生了3次擴(kuò)張。數(shù)據(jù)顯示,具有共線性的旁系同源基因?qū)?,?DTv(4倍簡并位點)值大部分(75%)為0.393 9~0.952 2,表明旁系同源基因?qū)?jīng)歷了很漫長的進(jìn)化歷程。
外層圓圈表示染色體Gr01-Gr13;圈內(nèi)曲線表示基因間存在共線性。Chromosome(Gr) 01-13 are depicted as curve bars;Curve lines denote collinear regions containing expansin family genes.
2.3 雷蒙德氏棉擴(kuò)展蛋白家族基因結(jié)構(gòu)分析
對雷蒙德氏棉擴(kuò)展蛋白基因序列統(tǒng)計分析顯示,各擴(kuò)展蛋白基因在基因組中的長度為981~2 922 bp (只有基因GrEXPA12,因為第3個內(nèi)含子極長(圖3),所以其核苷酸序列長達(dá)7 372 bp;黃瓜中也存在一個內(nèi)含子極其長的EXPA基因[32]),而編碼蛋白的外顯子部分序列全長為735~870 bp,可編碼244~289個氨基酸(但也存在特例,如:GrEXPB3短至176 aa,GrEXPA07長至303 aa)。植物擴(kuò)展蛋白基因的內(nèi)含子模式(Intron pattern:losses,presence and location(in the gene) of intron)具有較大的保守性,Sampedro等[33]對不同物種擴(kuò)展蛋白基因內(nèi)含子序列的統(tǒng)計分析發(fā)現(xiàn),不同內(nèi)含子可能具有不同的起源,并由此將其分為G、A、B、C、F 和H共6種不同的類型。在雷蒙德氏棉中,全部擴(kuò)展蛋白基因均含有A類型內(nèi)含子,82.1%(32/39)的成員含有B類型內(nèi)含子,而含有G、C、F和H類型內(nèi)含子的擴(kuò)展蛋白基因比例分別為15.4%(6/39),25.6%(10/39),28.2%(11/39)和2.6%(1/39)。EXPA亞家族擴(kuò)展蛋白基因含有4種內(nèi)含子結(jié)構(gòu)模式([A]、[AB]、[GAB]和[ABH]),EXPB亞家族成員的內(nèi)含子結(jié)構(gòu)模式為[AB]、[ACB]、[ABF],EXLA亞家族成員的內(nèi)含子結(jié)構(gòu)模式為[ACBF],而EXLB亞家族的結(jié)構(gòu)模式則為[ACF]、[ACBF]和[GACF]。
表4 雷蒙德氏棉擴(kuò)展蛋白基因倍增模式Tab.4 The segmental duplication events of expansin gene superfamily in G.raimondii
注:倍增基因?qū)?具有共線性關(guān)系的基因集合。
Note:Set.Collinear gene set.
圖2 具有共線性關(guān)系的expansin基因間Ks分布頻率Fig.2 Frequency distributions of Ks of collinear paralogous expansin gene pairs in G.raimondii
2.4 序列一致性分析及系統(tǒng)進(jìn)化樹
擴(kuò)展蛋白基因序列一致性比較發(fā)現(xiàn),同一亞家族內(nèi)成員間編碼區(qū)核苷酸序列的一致性均在48.4%以上,氨基酸序列的一致性高于44.8%;而亞家族成員間,編碼區(qū)核苷酸序列的一致性均低于45.28%,氨基酸序列的一致性則低于34.38%(表5)。相對而言,EXPA與EXPB亞家族之間親緣關(guān)系較近,氨基酸序列一致性為15.0%~31.5%;EXLA與EXLB亞家族間親緣關(guān)系更近,氨基酸序列一致性為29.5%~37.3%,而EXPA或EXPB與EXLA或EXLB間的氨基酸序列一致性相對較低(一般小于28.9%)。因此,基因編碼區(qū)序列一致性比對可以作為擴(kuò)展蛋白亞家族分型的重要依據(jù)。
表5 雷蒙德氏棉擴(kuò)展蛋白家族成員間核苷酸及氨基酸序列一致性分析Tab.5 Identity of nucleotides(above) and amino acid(below) between two subfamilies of expansin genes in G.raimondii
依據(jù)擴(kuò)展蛋白基因的氨基酸序列構(gòu)建系統(tǒng)進(jìn)化樹顯示,每一亞家族的成員往往聚集成群(圖3)。依據(jù)內(nèi)含子特點、相似程度的差異以及共線性分析[5,33],這些基因可進(jìn)一步劃分為15個大的分支(EXPA、EXPB、EXLA和EXLB亞家族分別包含10,2,1,2個分支),每1分支中的擴(kuò)展蛋白基因之間,無論是氨基酸序列還是基因的結(jié)構(gòu)組成都具有更大的一致性。如具有共線性關(guān)系的基因GrEXPA01/GrEXPA04/GrEXPA10、GrEXPA05/GrEXPA08/GrEXPA09、GrEXPA06/GrEXPA17/GrEXPA24、GrEXPA16/GrEXPA20/GrEXPA21/GrEXPA23、GrEXLA1/GrEXLA2/GrEXLA3分別位于同一分支上,其氨基酸序列的相似性分別達(dá)到79.0%,77.3%,81.0%,90.1%,80.0%,并且外顯子數(shù)量、每個外顯子大小也保持較高的一致性,預(yù)示其基因起源甚至功能方面有一定的關(guān)聯(lián),也暗示著高等植物進(jìn)化過程中普遍存在三倍化(Triplicated)甚至四倍化(Tetraplicated)事件等。
2.5 雷蒙德氏棉擴(kuò)展蛋白密碼子偏好性分析
蛋白質(zhì)中的氨基酸是由mRNA中三聯(lián)體密碼子決定,每種氨基酸至少對應(yīng)著1個密碼子,最多的對應(yīng)著6個密碼子(即同義密碼子)。在蛋白質(zhì)的合成過程中,同義密碼子的使用概率并不相同,對雷蒙德氏棉擴(kuò)展蛋白基因家族39個成員的10 041個密碼子的使用偏好性進(jìn)行統(tǒng)計發(fā)現(xiàn),密碼子有效數(shù)(Effective number of codons,ENC)為53.955,密碼子偏愛指數(shù)(Codon bias index,CBI)為0.149。有些氨基酸密碼子相對使用頻率(Relative frequency of synonymous codon,RFSC)具有明顯的密碼子偏好性(表6),其中CCU(編碼Pro)、GCU(編碼Ala)、AGA 和AGG(均編碼Arg)、UAA(編碼終止子TER)分別為相應(yīng)氨基酸的高頻密碼子(相對同義密碼子使用頻率單值超過60% 或超過該組同義密碼子平均占有頻率的1.5倍的密碼子[34])。雷蒙德氏棉的4個高頻密碼子(CCU、GCU、AGA和AGG)在擬南芥、楊樹等雙子葉植物中同樣為高頻密碼子。另外,在雷蒙德氏棉中,CCG(編碼Pro)、ACG(編碼Thr)、GCG(編碼Ala)、CGG(編碼Arg)和UGA(編碼TER)屬于稀有密碼子。
圖3 雷蒙德氏棉擴(kuò)展蛋白基因的系統(tǒng)發(fā)生樹(左)、基因結(jié)構(gòu)(中)及模體結(jié)構(gòu)(右)Fig.3 Phylogenetic tree,gene structure and motif analysis of the G.raimondii expansin
表6 雷蒙德氏棉擴(kuò)展蛋白基因密碼子的相對使用頻率Tab.6 RFSC value of expansin genes in G.raimondii
注:下劃橫線和波浪線分別表示低頻和高頻密碼子。
Note:Underline and wavy-underline indicated low-frequency and high-frequency codons.
2.6 雷蒙德氏棉擴(kuò)展蛋白的一級結(jié)構(gòu)
雷蒙德氏棉擴(kuò)展蛋白和其他物種中的擴(kuò)展蛋白具有相類似的一級結(jié)構(gòu),由信號肽、催化區(qū)(DPPB_1結(jié)構(gòu)域)、結(jié)合區(qū)(Pollen_allerg_1結(jié)構(gòu)域)3部分組成[1]。MEME模體分析結(jié)果如圖(圖3,4)所示。雷蒙德氏棉中,大部分(31/39)擴(kuò)展蛋白的N端的信號肽區(qū)含有17~34個氨基酸,可以引導(dǎo)初生多肽透過內(nèi)質(zhì)網(wǎng)。MEME模體分析顯示,信號肽區(qū)段包含Motif15(圖4)。位于擴(kuò)展蛋白序列中段的是催化區(qū)(Catalysis domain),其核心序列與內(nèi)切葡聚糖酶GH45(纖維素酶系中的1個主要成分,可在葡聚糖鏈的隨機(jī)位點降解底物產(chǎn)生寡糖)具有較高的一致性,并且含有豐富的保守性很高的半胱氨酸(Cys,即C,圖4),推測與二硫鍵的形成有關(guān)[35]。MEME模體分析還顯示,雷蒙德氏棉的EXPA亞家族的催化區(qū)由Motif2(r)+Motif6+Motif3組成;其他3個亞家族的催化區(qū)由Motif11(r)+Motif10+Motif8(l)組成。另外,在EXPA和EXPB亞家族的DPPB_1結(jié)構(gòu)域中含有1個His-Phe-Asp(HFD)模體。位于擴(kuò)展蛋白羧基端的部分是纖維素結(jié)合區(qū)(Cellulose-binding domain),也叫多糖結(jié)合區(qū)(Polysaccharide-binding domain),多由最后1個外顯子編碼,長度一般為90~120個殘基,如EXPA亞家族基本上由101~104個氨基酸組成。該區(qū)段擁有豐富的色氨酸(Trp,即W),在4個亞家族之間也具有很高的保守性。有分析認(rèn)為,色氨酸微環(huán)境對pH值變化非常敏感,降低pH值可以導(dǎo)致蛋白分子構(gòu)象發(fā)生較大變化[36],并影響擴(kuò)展蛋白的功能。MEME模體分析顯示,EXPA亞家族的多糖結(jié)合區(qū)Motif1(r)+Motif4+Motif7(l);其他3個亞家族的催化區(qū)由Motif8(r)+Motif9+Motif12組成。
2.7 雷蒙德氏棉擴(kuò)展蛋白理化特征分析
蛋白質(zhì)的理化特性與其功能特征密切相關(guān)。雷蒙德氏棉39個擴(kuò)展蛋白的分子量從18.48 kDa到33.77 kDa不等,平均值為27.87 kDa;其蛋白最短的有176個氨基酸殘基,最長的有303個,平均值為256.46,跨度較大(表2)。根據(jù)擴(kuò)展蛋白的氨基酸序列,利用軟件Euk-mPLoc 2.0[37]進(jìn)行亞細(xì)胞定位預(yù)測,發(fā)現(xiàn)雷蒙德氏棉的39個擴(kuò)展蛋白全部定位于細(xì)胞外(Extracell)。
圖4 雷蒙德氏棉擴(kuò)展蛋白ExpA亞家族成員氨基酸序列保守性分析Fig.4 Conservation analysis of amino acid sequences among subfamily expansin A genes in G.raimondii genome
分析表明,家族39成員蛋白質(zhì)的理論等電點(pI)為4.44~10.45,平均值達(dá)到8.213,表明多數(shù)雷蒙德氏棉擴(kuò)展蛋白表現(xiàn)偏堿性,與楊樹的擴(kuò)展蛋白表現(xiàn)相近。對總平均疏水性(Grand average of hydropathicity,GRAVY)的計算發(fā)現(xiàn),大部分(36/39)蛋白都屬于親水性的蛋白(-0.244~-0.015,正值表示疏水性,負(fù)值表示親水性[38]),僅3個蛋白屬于弱的疏水性蛋白。家族成員的蛋白不穩(wěn)定性指數(shù)(Instability index,II)為16.96~45.39,平均值達(dá)到31.96;除GrEXPA07外,多數(shù)擴(kuò)展蛋白結(jié)構(gòu)穩(wěn)定性較好(> 40則不穩(wěn)定)。雷蒙德氏棉擴(kuò)展蛋白的脂溶指數(shù)(Aliphatic index,AI)為59.64~84.98,平均值為71.17;相對較高的脂溶指數(shù),保證該蛋白在各種環(huán)境中具有良好的穩(wěn)定性,有利于其功能的正常發(fā)揮。GrEXLA1、GrEXLA2、GrEXLA3、GrEXLB2、GrEXLB4、GrEXLB5、GrEXLB6和GrEXPB3的脂溶指數(shù)甚至超過80,屬于嗜熱型蛋白[39]。
2.8 擴(kuò)展蛋白家族成員在雷蒙德氏棉不同組織/器官、纖維發(fā)育不同時期中的表達(dá)特征分析
在雷蒙德氏棉3個不同組織/器官及纖維發(fā)育時期(成熟葉片、花瓣、0 d胚、2 d纖維、3 d胚、10 d種子、20 d種子、30 d種子和40 d種子)的轉(zhuǎn)錄組測序和芯片雜交數(shù)據(jù)中,7個基因表達(dá)試驗項目(表1)共檢測到34個擴(kuò)展蛋白基因的表達(dá)(圖5),其他5個基因(GrEXPA08、GrEXPA09、GrEXPA10、GrEXPB3和GrEXLB4)一直未檢測到表達(dá)信號,推測這5個擴(kuò)展蛋白基因為假基因。在花瓣、葉片和纖維中分別有15,10,6個基因沒有表達(dá)信號?;诨蛐酒谋磉_(dá)數(shù)據(jù)顯示:19個基因未檢測到表達(dá);深度測序數(shù)據(jù)顯示:6個基因未檢測到表達(dá)。
基因芯片和深度測序顯示:GrEXLA1、GrEXLA2和GrEXPA16在花瓣中表達(dá)量較高;在葉片中,GrEXPA23和GrEXPA24表達(dá)量較高,而GrEXLA1和GrEXPA02表達(dá)量較低。GrEXPA11、GrEXPA16、GrEXPA21和GrEXLB2在葉片和花瓣中活躍表達(dá)而在纖維中遲鈍或沉默。這些結(jié)果表明,擴(kuò)展蛋白基因的表達(dá)在不同的組織中具有特異性。
利用深度測序數(shù)據(jù)分析擴(kuò)展蛋白基因在棉纖維發(fā)育階段及成熟葉片中的表達(dá)譜。Levels of gene expression are depicted in different color on the right scale.
在纖維發(fā)育的起始階段(0~8 d),GrEXPB1、GrEXPB2和GrEXLB2的表達(dá)量極低,說明這些基因可能不會促進(jìn)胚珠的表皮細(xì)胞發(fā)育成纖維。GrEXPA22僅在起始期甚至伸長期2個時期表達(dá),后期不再表達(dá)。GrEXLA3和GrEXLB5在伸長期的表達(dá)量顯著高于纖維發(fā)育的其他時期。GrEXPA19前期(起始期、伸長期、次生壁合成期共3個時期)活躍,異常高表達(dá),在0~20 d時間內(nèi)表達(dá)量特高,進(jìn)入成熟期(20 d以后)表達(dá)量迅速下降,接近為0。GrEXPA24在纖維的整個發(fā)育期均表達(dá),但表達(dá)量持續(xù)地顯著(P<0.05)下降。與此相反,GrEXPA02、GrEXPA12、GrEXPA14、GrEXPA15、GrEXPA17、GrEXPA18、GrEXLA2和GrEXLB3在次生壁合成期及成熟期高量表達(dá)。特別是GrEXPA17和GrEXPA23,在成熟期表達(dá)量特高。GrEXPA13在次生壁合成期表達(dá)量高。這些結(jié)果都顯示,擴(kuò)展蛋白基因的表達(dá)特征呈現(xiàn)多樣化,表達(dá)在纖維發(fā)育的某一時期具有特異性。在3個基因表達(dá)研究項目(SRP017168、SRP009820和SRP001603)內(nèi),進(jìn)行組織/時期間的比較分析(圖5),發(fā)現(xiàn)18個擴(kuò)展蛋白基因的表達(dá)豐度,在不同時期內(nèi)存在顯著差異(P<0.05),推測這18個基因在棉纖維發(fā)育各個過程中均起重要作用。
總的來看,亞家族內(nèi)的不同基因有不同的表達(dá)特征,表明進(jìn)化進(jìn)程中,亞家族內(nèi)同類基因其結(jié)構(gòu)的趨異性和功能分化的多樣性可能是相互關(guān)聯(lián)的。
本試驗在全基因組水平上對雷蒙德氏棉擴(kuò)展蛋白基因進(jìn)行了鑒定和特征分析。雷蒙德氏棉擴(kuò)展蛋白家族共有39個成員,其中包括26個EXPA、4個EXPB、3個EXLA和6個EXLB基因,與擬南芥、楊樹、蘋果、菜豆中該基因家族成員個數(shù)接近(表3)。Sampedro 等[1]認(rèn)為,在植物界各物種分化前的共同祖先中,擴(kuò)展蛋白家族大約含有15~17個成員。在后續(xù)的進(jìn)化過程中,植物界各物種的基因組大多經(jīng)歷了多次的全基因組復(fù)制事件[30],這是基因家族成員數(shù)量擴(kuò)張的重要原因。本試驗表明,雷蒙德氏棉擴(kuò)展蛋白家族成員數(shù)量相比于擬南芥、楊樹、蘋果、菜豆的成員數(shù)量,在進(jìn)化過程中經(jīng)歷了相同次數(shù)的復(fù)制事件。Ks的分布頻率曲線和成員數(shù)量均表明,進(jìn)化中雷蒙德氏棉擴(kuò)展蛋白大約經(jīng)歷了3次復(fù)制事件。將蛋白序列提交Euk-mPLoc網(wǎng)站,亞細(xì)胞定位預(yù)測顯示39個成員全部定位于細(xì)胞外,表明該家族蛋白的亞細(xì)胞定位分化具有高度保守性。
雷蒙德氏棉的基因組經(jīng)歷了全基因組重復(fù)、染色體重排和串聯(lián)重復(fù)等復(fù)雜的進(jìn)化過程[40]。本試驗結(jié)果表明,染色體大片段復(fù)制在擴(kuò)展蛋白家族成員的擴(kuò)增中起到了重要作用。在雷蒙德氏棉中共有30個擴(kuò)展蛋白家族基因形成11個共線性支持的基因群(由同一基因祖先擴(kuò)增而來),基因群內(nèi)的基因在系統(tǒng)發(fā)育樹中大多也處于同一分支內(nèi)。根據(jù)系統(tǒng)發(fā)育樹的分支進(jìn)行分組,比較亞家族下的亞組(分支)內(nèi)擴(kuò)展蛋白家族基因的內(nèi)含子、外顯子排布情況、UTR長短、信號肽的有無及基序(結(jié)構(gòu)域、信號肽)的分布情況,可以發(fā)現(xiàn),同一亞組(分支)中各基因的基因結(jié)構(gòu)具有一定的差異。但利用MEME進(jìn)行模體分析,結(jié)果顯示同一亞組(分支)中各基因翻譯出的蛋白質(zhì)具有類似(相對保守)的氨基酸結(jié)構(gòu)。從不同時空的表達(dá)數(shù)據(jù)來看,這些由同一基因祖先擴(kuò)增而來的基因群,并不具有相似的表達(dá)模式,說明在進(jìn)化過程中其表達(dá)時空特性發(fā)生趨異分化現(xiàn)象,這可能與基因家族擴(kuò)張后基因結(jié)構(gòu)的趨異化有一定的聯(lián)系。
雷蒙德氏棉是現(xiàn)今四倍體栽培棉物種的D亞組染色體的祖先的現(xiàn)代種,研究擴(kuò)展蛋白基因的多次復(fù)制現(xiàn)象可以幫助人們更好地了解棉屬基因組多倍化的形成過程。將棉花與水稻、擬南芥、楊樹等12個物種的擴(kuò)展蛋白基因家族進(jìn)行比較,發(fā)現(xiàn)所列各物種的擴(kuò)展蛋白家族成員個數(shù)并不與基因組大小完全成正比,說明擴(kuò)展蛋白基因家族在各物種中的進(jìn)化和復(fù)制具有多樣性。眾所周知,多倍體化(Paleopolyploidy)在陸生植物的進(jìn)化過程中多次發(fā)生,并且這些多倍化事件對植物基因家族的擴(kuò)張起到了重要作用,最終產(chǎn)生了基因冗余。冗余是生物為適應(yīng)外界不利環(huán)境的一種對策,對生命系統(tǒng)有重要的意義[41]。雷蒙德氏棉擴(kuò)展蛋白家族基因成員的冗余,也從側(cè)面表明了該家族成員在其生長發(fā)育過程中的重要作用。該家族各亞族內(nèi)成員之間在蛋白質(zhì)水平有很強(qiáng)的保守性:MEME軟件Motif分析的結(jié)果表明,各亞族的序列相似性很高;但從基因結(jié)構(gòu)來看,各亞族的成員間基因結(jié)構(gòu)存在一定差異,如:內(nèi)含子模式存在多樣性、UTR長短不一等,這可能與基因組進(jìn)化過程中的串聯(lián)重復(fù)、隨機(jī)重復(fù)與插入等現(xiàn)象有關(guān)。據(jù)此推測,在基因冗余發(fā)生后,通過非編碼區(qū)的趨異化,從而改變?nèi)哂嗷蜷g表達(dá)的時空依賴性,達(dá)到節(jié)約胞內(nèi)資源,穩(wěn)定細(xì)胞代謝,適應(yīng)胞外環(huán)境的能力(Functional specialization)。深度測序和基因芯片的數(shù)據(jù)也表明,具有共線性關(guān)系的基因之間,其表達(dá)模式各不相同,其原因可能也在于此。擴(kuò)展蛋白家族基因從植物界共同祖先的15~17個成員擴(kuò)增到雷蒙德氏棉的39個成員,有可能經(jīng)歷了3次多倍化事件。在每次的多倍化事件后,因為基因的冗余,少數(shù)擴(kuò)展蛋白基因可能經(jīng)歷了丟失(Selective loss of genes)或者去功能化(Dysfunctional或Neo-functionalization)或者轉(zhuǎn)變(Gene conversion),剩余基因在純化選擇(Negative selection)壓力(如ω值所示)的作用下進(jìn)化成現(xiàn)今的39個成員。
纖維發(fā)育進(jìn)程中涉及大量基因的表達(dá),其中擴(kuò)展蛋白基因在處于伸長期的纖維細(xì)胞中表達(dá)異常活躍[42-44],而在短絨或無纖維突變體中下調(diào)表達(dá)[45]。因此,擴(kuò)展蛋白基因可能對纖維發(fā)育極其重要,對促進(jìn)纖維(單)細(xì)胞的胞壁的伸長具有重要的作用,從而最終影響纖維的長度和強(qiáng)度。Harmer等[43]在纖維細(xì)胞中發(fā)現(xiàn)6個編碼α擴(kuò)展蛋白的cDNA(GhExp1~GhExp6),RT-PCR表達(dá)分析表明,GhExp1(屬于擴(kuò)展蛋白A亞家族)僅在伸長期的纖維中高量表達(dá),GhExp2 (A亞家族)也是僅在伸長期的纖維中表達(dá),表明這2個基因可能促進(jìn)纖維的伸長。轉(zhuǎn)基因過量表達(dá)GhEXPA1顯示,GhEXPA1與GhRDL1互作,可以顯著地增加單株鈴數(shù),從而提高纖維產(chǎn)量40%而對纖維品質(zhì)無負(fù)面影響[46]。He等[47]通過關(guān)聯(lián)作圖發(fā)現(xiàn),基因Exp2的序列多態(tài)性與纖維品質(zhì)的變異顯著相關(guān)?;騁bEXPA2在伸長階段的纖維中顯著地上調(diào)表達(dá)[48],深入的研究發(fā)現(xiàn)GbEXPA2的啟動子主要在纖維中活躍表達(dá)[49]?;陉懙孛夼c海島棉種間滲入系的基因表達(dá)分析顯示,與纖維品質(zhì)低劣的滲入系相比較,擴(kuò)展蛋白基因(α-expansin 1、expansin-like B1等)在纖維品質(zhì)優(yōu)良的滲入系里表達(dá)更活躍,進(jìn)一步試驗發(fā)現(xiàn),在纖維的伸長階段擴(kuò)展蛋白基因表達(dá)顯著升高[50]。由此推測,擴(kuò)展蛋白家族一些基因成員在棉纖維的發(fā)育過程中對纖維細(xì)胞的伸長起到調(diào)控作用,當(dāng)這些基因表達(dá)下調(diào)時,會影響棉纖維的發(fā)育,導(dǎo)致纖維的重要品質(zhì)指標(biāo)(長度和比強(qiáng)度)下降。
本試驗對雷蒙德氏棉擴(kuò)展蛋白家族基因在不同時空范圍的表達(dá)譜進(jìn)行了分析發(fā)現(xiàn),除了5個基因外,其余擴(kuò)展蛋白基因廣泛參與到棉纖維、葉片、花瓣等組織發(fā)育的復(fù)雜生理過程中。在纖維發(fā)育的不同時期,特異性表達(dá)的擴(kuò)展蛋白基因各不相同,在纖維發(fā)育后期轉(zhuǎn)錄量上升的擴(kuò)展蛋白基因,如GrEXPA17和GrEXPA23等,可能協(xié)助纖維細(xì)胞脫水與成熟;在中期轉(zhuǎn)錄量高的基因,如GrEXPA13等,可能協(xié)同其他基因一起促進(jìn)纖維初生壁的延展和次生壁纖維素的沉積;而在分化時期轉(zhuǎn)錄水平顯著較高的擴(kuò)展蛋白基因,如GrEXPA22,可能參與胚珠表皮細(xì)胞的分化和突起過程。特別指出GrEXPA19在20 dpa前的胚珠中轉(zhuǎn)錄水平很高,推測其在纖維發(fā)育中起著重要作用。本試驗利用RNAseq數(shù)據(jù)和芯片數(shù)據(jù)對擴(kuò)展蛋白基因家族在棉花纖維等發(fā)育過程中的作用進(jìn)行了初步探索,而其參與每一發(fā)育過程的分子調(diào)控機(jī)制還有待進(jìn)一步的研究。
本試驗利用雷蒙德氏棉基因組測序的數(shù)據(jù)庫,首次對棉花中擴(kuò)展蛋白家族基因進(jìn)行了鑒定和生物信息學(xué)分析,鑒定出了39個擴(kuò)展蛋白家族的成員,并對它們進(jìn)行了進(jìn)化分析、基因結(jié)構(gòu)分析、蛋白特征分析以及時空表達(dá)模式分析,發(fā)現(xiàn)雷蒙德氏棉中擴(kuò)展蛋白家族基因成員參與了纖維、葉片、花瓣等多種組織的發(fā)育過程。鑒定和研究雷蒙德氏棉擴(kuò)展蛋白家族的特征可為進(jìn)一步探討陸地棉、海島棉相關(guān)基因的功能提供依據(jù),對創(chuàng)制優(yōu)異的種質(zhì)資源、培育優(yōu)良的棉花新品種具有重要的意義。
[1] Sampedro J,Cosgrove D J.The expansin superfamily[J].Genome Biology,2005,6(12):242.
[2] Mcqueen-Mason S,Cosgrove D J.Disruption of hydrogen-bonding between plant-cell wall polymers by proteins that induce wall extension[J].Proceedings of the National Academy of Sciences of the United States of America,1994,91(14):6574-6578.
[3] Dal Santo S,Vannozzi A,Tornielli G B,et al.Genome-Wide analysis of the expansin gene superfamily reveals Grapevine-Specific structural and functional characteristics[J].PLoS One,2013,8(4):e62206.
[4] Zhang S Z,Xu R R,Gao Z,et al.A genome-wide analysis of the expansin genes inMalus×Domestica[J].Molecular Genetics and Genomics,2014,289(2):225-236.
[5] Sampedro J,Carey R E,Cosgrove D J.Genome histories clarify evolution of the expansin superfamily:New insights from the poplar genome and pine ESTs[J].Journal of Plant Research,2006,119(1):11-21.
[6] Zhang W,Yan H W,Chen W J,et al.Genome-wide identification and characterization of maize expansin genes expressed in endosperm [J].Mol Genet Genomics,2014,289:1061-1074.
[7] Zhu Y,Wu N N,Song W L,et al.Soybean(Glycinemax) expansin gene superfamily origins:segmental and tandem duplication events followed by divergent selection among subfamilies [J].Bmc Plant Biol,2014,14(1):1-19.
[8] Krishnamurthy P,Hong J K,Kim J A,et al.Genome-wide analysis of the expansin gene superfamily revealsBrassicarapa-specific evolutionary dynamics upon whole genome triplication[J].Molecular Genetics and Genomics,2015,290(2):521-530.
[9] Kende H,Bradford K,Brummell D,et al.Nomenclature for members of the expansin superfamily of genes and proteins[J].Plant Molecular Biology,2004,55(3):311-314.
[10] Cosgrove D J,Li L C,Cho H T,et al.The growing world of expansions[J].Plant & Cell Physiology,2002,43(12):1436-1444.
[11] Yan A,Wu M J,Yan L M,et al.AtEXP2 is involved in Seed germination and abiotic stress response inArabidopsis[J].PLoS One,2014,9(1):e85208.
[12] Yu Z M,Kang B,He X W,et al.Root hair-specific expansins modulate root hair elongation in rice[J].Plant Journal,2011,66(5):725-734.
[13] Guo W B,Zhao J,Li X X,et al.A soybean beta-expansin geneGmEXPB2 intrinsically involved in root system architecture responses to abiotic stresses[J].Plant Journal,2011,66(3):541-552.
[14] Gray-Mitsumune M,Mellerowicz E J,Abe H,et al.Expansins abundant in secondary xylem belong to subgroup a of the alpha-expansin gene family [J].Plant Physiology,2004,135(3):1552-1564.
[15] Cosgrove D J,Bedinger P,Durachko D M.Group I allergens of grass pollen as cell wall-loosening agents[J].Proceedings of the National Academy of Sciences of the United States of America,1997,94(12):6559-6564.
[16] Pezzotti M,F(xiàn)eron R,Mariani C.Pollination modulates expression of thePPALgene,a pistil-specific beta-expansin[J].Plant Molecular Biology,2002,49(2):187-197.
[17] Cosgrove D J.Expansive growth of plant cell walls[J].Plant Physiology and Biochemistry,2000,38(1/2):109-124.
[18] Belfield E J,Ruperti B,Roberts J A,et al.Changes in expansin activity and gene expression during ethylene-promoted leaflet abscission inSambucusnigra[J].Journal of Experimental Botany,2005,56(413):817-823.
[19] Han Y Y,Li A X,Li F,et al.Characterization of a wheat(TriticumaestivumL.) expansin gene,TaEXPB23,involved in the abiotic stress response and phytohormone regulation[J].Plant Physiology and Biochemistry,2012,54:49-58.
[20] Zhao M R,Han Y Y,F(xiàn)eng Y N,et al.Expansins are involved in cell growth mediated by abscisic acid and indole-3-acetic acid under drought stress in wheat[J].Plant Cell Reports,2012,31(4):671-685.
[21] Choi D,Lee Y,Cho H T,et al.Regulation of expansin gene expression affects growth and development in transgenic rice plants[J].The Plant Cell,2003,15(6):1386-1398.
[22] Ding X H,Cao Y L,Huang L L,et al.Activation of the indole-3-acetic acid-amido synthetase GH3-8 suppresses expansin expression and promotes salicylate-and jasmonate-independent basal immunity in rice[J].Plant Cell,2008,20(1):228-240.
[23] Russell S D,Bhalla P L,Singh M B.Transcriptome-based examination of putative pollen allergens of rice(Oryzasativassp. japonica) [J].Molecular Plant,2008,1(5):751-759.
[24] Tabuchi A,Li L C,Cosgrove D J.Matrix solubilization and cell wall weakening by beta-expansin(group-1 allergen) from maize pollen[J].Plant Journal,2011,68(3):546-559.
[25] Ferguson D L,Turley R B,Triplett B,et al.Comparison of protein profiles during cotton(GossypiumhirsutumL.)fiber cell development with partial sequences of two proteins[J].Food Chemistry,1996,44(12):4022-4027.
[26] Haigler C H,Betancur L,Stiff M R.Cotton fiber:a powerful single-cell model for cell wall and cellulose research[J].Frontiers in Plant Science,2012,3(4):104.
[27] Xu Z Y,Kohel R J,Song G L,et al.Gene-rich islands for fiber development in the cotton genome[J].Genomics,2008,92(3):173-183.
[28] Gou J Y,Wang L J,Chen S P,et al.Gene expression and metabolite profiles of cotton fiber during cell elongation and secondary cell wall synthesis [J].Cell Res,2007,17(5):422-434.
[29] Wang K,Wang Z,Li F,et al.The draft genome of a diploid cottonGossypiumraimondii[J].Nature Genetics,2012,44(10):1098-1103.
[30] Paterson A H,Wendel J F,Gundlach H A,et al.Repeated polyploidization ofGossypiumgenomesand the evolution of spinnable cotton fibres[J].Nature,2012,492(7429):423.
[31] He D H,Lei Z P,Tang B S,et al.Identification and analysis of theTIFYgene family inGossypiumraimondii[J].Genetics and Molecular Research,2015,14(3):10119-10138.
[32] 郝 西,理向陽,臘貴曉,等 黃瓜擴(kuò)展蛋白基因家族的鑒定與生物信息學(xué)分析[J].分子植物育種,2015,13(10):2280-2899.
[33] Sampedro J,Lee Y,Carey R E,et al.Use of genomic history to improve phylogeny and understanding of births and deaths in a gene family[J].The Plant Journal:for Cell and Molecular Biology,2005,44(3):409-419.
[34] 林 濤,倪志華,沈明山,等.高頻密碼子分析法及其在煙草密碼子分析中的應(yīng)用[J].廈門大學(xué)學(xué)報:自然科學(xué)版,2002,41(5):551-554.
[35] 許成鋼,范曉軍,付月君,等.二硫鍵的形成與蛋白質(zhì)的氧化折疊[J].中國生物工程雜志,2008,28(S1):259-264.
[36] 閻伯旭,曲音波,高培基,等.色氨酸殘基在內(nèi)切酶葡聚糖酶分子中的作用[J].中國生物化學(xué)與分子生物學(xué)報,1998,14(2):181-185.
[37] Chou K C,Shen H B.A new method for predicting the subcellular localization of eukaryotic proteins with both single and multiple sites:Euk-mPLoc 2.0[J].PLoS One,2010,5(3):e9931.
[38] 付海輝,辛培堯,許玉蘭,等.幾種經(jīng)濟(jì)植物UFGT基因的生物信息學(xué)分析[J].基因組學(xué)與應(yīng)用生物學(xué),2011,30(1):92-102.
[39] Ikai A.Thermostability and aliphatic index of globular-proteins[J].Journal of Biochemistry,1980,88(6):1895-1898.
[40] Lin L F,Gj P,Bowers J E,et al.A draft physical map of a D-genome cotton species(Gossypiumraimondii) [J].BMC Genomics,2010,11(1):395.
[41] Zheng X W,Zhu J H,Kapoor A,et al.Role ofArabidopsisAGO6 in siRNA accumulation,DNA methylation and transcriptional gene silencing[J].EMBO Journal,2007,26(6):1691-1701.
[42] Arpat A B,Waugh M,Sullivan J P,et al.Functional genomics of cell elongation in developing cotton fibers[J].Plant Molecular Biology,2004,54(6):911-929.
[43] Harmer S E,Orford S J,Timmis J N.Characterisation of six alpha-expansin genes inGossypiumhirsutum(upland cotton) [J].Mol Genet Genomics,2002,268:1-9.
[44] Lacape J M,Claverie M,Vidal R O,et al.Deep sequencing reveals differences in the transcriptional landscapes of fibers from two cultivated species of cotton[J].PLoS One,2012,7(11):e48855.
[45] Padmalatha K V,Patil D P,Kumar K,et al.Functional genomics of fuzzless-lintless mutant ofGossypiumhirsutumL.cv.MCU5 reveal key genes and pathways involved in cotton fibre initiation and elongation [J].Bmc Genomics,2012,13(1):1-15.
[46] Xu B,Gou J Y,Li F G,et al.A cotton BURP domain protein interacts with-Expansin and their Co-Expression promotes plant growth and fruit production[J].Molecular Plant,2013,6(3):945-958.
[47] He D,Lei Z,Xing H,et al.Exp2 polymorphisms associated with variation for fiber quality properties in cotton(Gossypiumspp.) [J].The Crop Journal,2014,2(5):315-328.
[48] Tu L L,Zhang X L,Liang S G,et al.Genes expression analyses of sea-island cotton(GossypiumbarbadenseL.)during fiber development[J].Plant Cell Reports,2007,26(8):1309-1320.
[49] Li Y,Tu L L,Ye Z X,et al.A cotton fiber-preferential promoter,PGbEXPA2,is regulated by GA and ABA inArabidopsis[J].Plant Cell Reports,2015,34(9):1539-1549.
[50] Fang L,Tian R P,Li X H,et al.Cotton fiber elongation network revealed by expression profiling of longer fiber lines introgressed with differentGossypiumbarbadensechromosome segments[J].BMC Genomics,2014,15(1):1-15.
Genome-wide Identification and Characterization of Expansin Gene Family in Gossypium raimondii
LEI Zhongping1,2,HE Daohua1,HAI Jiangbo1,XING Hongyi1,ZHAO Junxing1,CHENG Xueni2
(1.College of Agronomy,Northwest A&F University,Yangling 712100,China; 2.College of Life Sciences,Northwest A&F University,Yangling 712100,China)
Expansin can loosen the components of rigid plant cell walls and thereby allow cell expansion.To get insight into expansin genes inGossypiumraimondii,genome-wide exploration and comprehensive characterization of theG.raimondiiexpansin gene family members were conducted,and 39 expansin genes(including 26EXPA,4EXPB,3EXLAand 6EXLB,which was classified based on the phylogenetic tree) were identified.The results revealed that expansin family genes were located on 12 of 13G.raimondiichromosomes.And the gene structures were relatively diverse(not conserved) in each subgroup.Evolutionary analysis of expansins revealed that chromosome segmental duplications contributed mainly to the three evolutionary expansions of expansin family,which had experienced negative selection pressure.The expression pattern of expansin genes under series of fiber development stages,in leaf and petal indicated that most expansin genes(showing diverse and specific expression pattern) might participate in fiber development processes including fiber initiation and elongation,and in morphogenesis of leaf and petal.This identification and characterization provided the complete profiles ofGossypiumexpansin family genes for future study on their functions related to the molecular mechanisms of fiber and other tissues development.
Gossypiumraimondii;Expansin;Gene structure;Phylogenic analysis;Biological evolution;Expression pattern
2016-07-21
現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項資金(CARS-18-45);轉(zhuǎn)基因生物新品種培育科技重大專項(2014ZX08005-002)
雷忠萍(1979-),女,湖北保康人,實驗師,在讀碩士,主要從事棉花遺傳學(xué)研究。
海江波(1966-),男,陜西扶風(fēng)人,副教授,博士,主要從事高效耕作制度及農(nóng)業(yè)生態(tài)研究。 賀道華(1975-),男,湖北隨州人,講師,博士,主要從事棉花生物技術(shù)育種研究。
Q78
A
1000-7091(2016)06-0044-12
10.7668/hbnxb.2016.06.008