付 荻,劉 赫,于 冰,李海英
(黑龍江大學(xué)生命科學(xué)學(xué)院/農(nóng)業(yè)微生物技術(shù)教育部工程研究中心/黑龍江省寒區(qū)植物基因與生物發(fā)酵重點(diǎn)實(shí)驗(yàn)室/黑龍江省普通高校分子生物學(xué)重點(diǎn)實(shí)驗(yàn)室,哈爾濱 150080)
G蛋白是普遍存在于真核生物中的一類GTP(Guanosine triphosphate)結(jié)合蛋白,按照G蛋白分子量和亞基組成分為異源三聚體G蛋白、小G蛋白和幾種特殊的GTP結(jié)合蛋白[1-2]。小G蛋白是真核細(xì)胞中最大的信號(hào)蛋白家族之一,作為分子開關(guān)在與GTP結(jié)合的活性形式和與GDP(Guanosine 5′-diphosphate)結(jié)合的非活性形式之間循環(huán),分子量通常在20~30 kD[3]。所有小G蛋白組成了Ras超家族,根據(jù)不同成員間結(jié)構(gòu)和功能相似性,將Ras超家族劃分為Ras、Rho、Ran、Rab和Arf/Sar 5個(gè)亞家族[4]。
小G蛋白R(shí)ab作為Ras超家族中最大的亞家族,在微生物、動(dòng)物和植物中廣泛存在[5]。植物小G蛋白R(shí)ab由200個(gè)左右的氨基酸組成,分子量多在22~25 kD,序列同源性在30%~55%,具有保守的結(jié)構(gòu)特征,即由保守的G結(jié)構(gòu)域和高度可變的N端和C端組成[6-7]。有研究發(fā)現(xiàn),根據(jù)小G蛋白R(shí)ab中的保守基序內(nèi)的保守氨基酸序列不同及分布位置不同,將植物中小G蛋白R(shí)ab可分為A~H共8個(gè)亞家族[8]。
小G蛋白R(shí)ab活性形式是Rab與GTP結(jié)合,主要定位在膜結(jié)構(gòu)上,而Rab與GDP結(jié)合轉(zhuǎn)化為非活性形式,從膜結(jié)構(gòu)中分離出來,主要定位在細(xì)胞質(zhì)中[9-10]。當(dāng)細(xì)胞內(nèi)激活信號(hào)存在時(shí),膜結(jié)合的Rab蛋白被鳥苷酸交換因子(GEF, GMP exchange factor)激活,將Rab蛋白由結(jié)合GDP的無活性形式轉(zhuǎn)變?yōu)榻Y(jié)合GTP的活性形式,隨后活化的Rab蛋白通過與下游蛋白相互作用,從而啟動(dòng)細(xì)胞相應(yīng)的生理過程;完成信號(hào)傳遞之后,由于Rab蛋白只有微弱的內(nèi)在GTP水解酶活性,因此需要GAP(GTPase-activating protein)激活其GTP水解酶活性,加速GTP水解,促使Rab蛋白快速失活,從而使信號(hào)傳遞得以迅速終止[11-17]。因此小G蛋白R(shí)ab作為細(xì)胞內(nèi)的“分子開關(guān)”已經(jīng)成為信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞生長和分化的重要調(diào)節(jié)因子。在植物中,小G蛋白R(shí)ab作為囊泡運(yùn)輸?shù)闹匾{(diào)控因子,廣泛分布于植物的各個(gè)器官中[18],在參與植物激素信號(hào)調(diào)節(jié)、生長發(fā)育和生物、非生物脅迫應(yīng)答等方面發(fā)揮重要作用[19]。
由于小G蛋白R(shí)ab在植物中發(fā)揮重要的作用,小G蛋白R(shí)ab基因家族的全基因組鑒定及其調(diào)控機(jī)制是近些年的研究熱點(diǎn)。已經(jīng)在擬南芥(ArabidopsisthalianaL.)[3]、水稻(OryzasativaL.)[20]、棉花(Gossypiumspp L.)[11]、番茄(SolanumlycopersicumL.)中完成了小G蛋白R(shí)ab基因家族的全基因組鑒定分析。甜菜(BetavulgarisL.)是我國重要的糖料作物,我國有30%的產(chǎn)糖原料是甜菜,多在我國北方干旱及半干旱地區(qū)廣泛種植,具有較好的耐逆能力。甜菜還可以作為飼料原料和作為能源作物進(jìn)行生物產(chǎn)氫。由甜菜開發(fā)出的甜菜紅素、甜菜堿等產(chǎn)品可以應(yīng)用于食品、藥品和化妝品等領(lǐng)域[21]。目前,對(duì)甜菜小G蛋白BvRab基因家族成員的鑒定和分析研究工作還未見報(bào)道。研究甜菜小G蛋白BvRab基因家族對(duì)挖掘甜菜優(yōu)質(zhì)基因資源,培育甜菜耐逆優(yōu)質(zhì)種質(zhì)資源具有重要意義。
本研究利用生物信息學(xué)方法對(duì)甜菜小G蛋白BvRab基因家族進(jìn)行了全基因組范圍鑒定,并對(duì)甜菜小G蛋白BvRab基因家族進(jìn)行理化性質(zhì)、基因結(jié)構(gòu)、蛋白保守基序、系統(tǒng)進(jìn)化、染色體定位及共線性、啟動(dòng)子順式作用元件和蛋白質(zhì)互作預(yù)測進(jìn)行了分析,有助于深入認(rèn)識(shí)甜菜小G蛋白BvRab基因的結(jié)構(gòu)和功能,為進(jìn)一步開展甜菜小G蛋白BvRab基因家族在生長發(fā)育和耐逆功能研究領(lǐng)域提供候選基因和實(shí)驗(yàn)基礎(chǔ)。
在NCBI數(shù)據(jù)庫(https://ncbi.nlm.nih.gov/)獲取甜菜蛋白質(zhì)組數(shù)據(jù)庫,從Pfam數(shù)據(jù)庫(http:/ /pfam.xfam.org/)獲取Ras超家族結(jié)構(gòu)域(PF00071)的HMMER文件。使用HMMER3.0(http://hmmer.org)軟件對(duì)甜菜中可能的Ras超家族蛋白進(jìn)行篩選,并提交到SMART網(wǎng)站(https://smart.embl.de/),篩選含有小G蛋白R(shí)ab家族特有Rab結(jié)構(gòu)域的蛋白質(zhì),從而獲得甜菜小G蛋白BvRab基因家族成員。通過在線網(wǎng)站ExPASy (https://web.expasy.org/protparam/)對(duì)其分子量、等電點(diǎn)等理化性質(zhì)進(jìn)行分析。
1.2.1 基因結(jié)構(gòu)分析
在NCBI數(shù)據(jù)庫中獲取甜菜小G蛋白BvRab基因家族成員對(duì)應(yīng)的基因組序列和CDS序列,將其提交至GSDS(http://GSDS.gao-lab.org/)在線軟件,繪制基因家族成員外顯子和內(nèi)含子的分布圖。
1.2.2 蛋白保守基序分析
使用Clustal X2.1(http://www.Clustal.org),對(duì)已經(jīng)鑒定獲得的甜菜小G蛋白BvRab基因家族成員編碼的氨基酸序列進(jìn)行多序列比對(duì),繪制基因家族成員蛋白保守基序。
1.2.3 系統(tǒng)進(jìn)化分析
使用MEGA5軟件對(duì)甜菜、擬南芥兩個(gè)物種小G蛋白R(shí)ab基因家族成員進(jìn)行系統(tǒng)進(jìn)化樹構(gòu)建,使用neighbor-joining(NJ)方法且Bootstrap數(shù)值設(shè)為1 000,其他數(shù)值為默認(rèn)參數(shù)。
1.2.4 染色體定位及共線性分析
使用MG2C(http://www.mg2c.iask.in/mg2c_v2.1/)在線分析工具對(duì)甜菜小G蛋白BvRab基因家族成員在染色體上的位置進(jìn)行分析標(biāo)注,使用TBtools對(duì)甜菜、擬南芥、水稻及番茄中的小G蛋白R(shí)ab基因家族進(jìn)行多物種共線性分析[22]。
1.2.5 啟動(dòng)子順式作用元件分析
將甜菜小G蛋白BvRab基因家族轉(zhuǎn)錄起始位點(diǎn)上游的2 000 bp序列輸入Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),進(jìn)行啟動(dòng)子順式作用元件預(yù)測及分析。
1.2.6 蛋白互作網(wǎng)絡(luò)預(yù)測
在plantTFDB(http://planttfdb.gao-lab.org/)下載甜菜轉(zhuǎn)錄因子蛋白序列。將甜菜小G蛋白BvRab基因家族成員的氨基酸序列和甜菜轉(zhuǎn)錄因子蛋白序列上傳至STRING數(shù)據(jù)庫(https://string-db.org/cgi-/input?sessionId=balp0yQK5OTf&input_page_active_form=multiple_sequences),預(yù)測甜菜小G蛋白BvRab基因家族成員與甜菜轉(zhuǎn)錄因子之間的相互作用,構(gòu)建蛋白互作網(wǎng)絡(luò)。
通過篩選分析,在甜菜基因組中共鑒定到58個(gè)甜菜小G蛋白BvRab基因家族成員(表1)。58個(gè)基因家族成員理化性質(zhì)見表1,結(jié)果表明甜菜小G蛋白BvRab的氨基酸數(shù)量在167~255,其中BvRabD2a的氨基酸數(shù)量最短(167 aa),BvRabF2c的氨基酸數(shù)量最長(255 aa);該基因家族成員有42個(gè)基因編碼的蛋白等電點(diǎn)大于7。
表1 甜菜小G蛋白BvRab基因家族成員及其編碼蛋白質(zhì)的理化性質(zhì)Table 1 Small GTP-binding proteins BvRab family members and their physical and chemical properties
根據(jù)甜菜小G蛋白BvRab基因家族外顯子、內(nèi)含子結(jié)構(gòu)可視化分析(圖1),顯示甜菜BvRab基因的外顯子和內(nèi)含子的數(shù)量和位置在A-H 8種不同類型中呈現(xiàn)明顯差異,但在同一類型中的不同基因的外顯子和內(nèi)含子的數(shù)量和位置較為一致。
圖1 甜菜小G蛋白BvRab基因家族成員基因結(jié)構(gòu)Fig.1 Gene structures of small GTP-binding proteins BvRab family members
根據(jù)家族基因的蛋白保守基序分析(圖2),結(jié)果顯示甜菜小G蛋白BvRab基因家族共有5個(gè)蛋白保守基序,除了個(gè)別基因外,5個(gè)蛋白保守基序在甜菜小G蛋白BvRab基因家族成員中分布順序一致,說明甜菜小G蛋白BvRab基因家族在進(jìn)化上是保守的,家族成員在功能上可能具有相似性。
圖2 甜菜小G蛋白BvRab基因家族蛋白質(zhì)保守基序Fig.2 Conserved motifs of small GTP-binding proteins BvRab family members
將甜菜和擬南芥中小G蛋白R(shí)ab共同構(gòu)建系統(tǒng)進(jìn)化樹(圖3)。結(jié)果顯示甜菜小G蛋白BvRab基因家族蛋白與擬南芥小G蛋白AtRab基因家族蛋白一樣,均共有A-H 8個(gè)亞家族[23],甜菜小G蛋白BvRab基因家族蛋白亞家族A有18個(gè)成員,亞家族F有17個(gè)成員,亞家族D與亞家族E分別有6個(gè)成員,亞家族G有5個(gè)成員,亞家族B、C和H均只有2個(gè)成員,其成員分布情況與擬南芥小G蛋白AtRab基因家族成員分布比例情況基本一致。
圖3 甜菜和擬南芥小G蛋白R(shí)ab基因家族蛋白系統(tǒng)進(jìn)化樹分析Fig.3 Phylogenetic tree analysis of small GTP-binding proteins Rab family members in sugar beet and Arabidopsis thaliana
根據(jù)染色體定位結(jié)果(圖4),表明58個(gè)甜菜小G蛋白BvRab基因家族成員分布于甜菜的9條染色體上,在Chr6上分布最為密集,而在Chr5上只有BvRabD2c1個(gè)家族成員分布。根據(jù)共線性分析結(jié)果(圖5),可以看到擬南芥和番茄中均有20個(gè)以上的基因與甜菜小G蛋白BvRab基因家族成員基因存在共線性關(guān)系,而只有9個(gè)基因與水稻基因存在共線性關(guān)系。可能原因是甜菜與番茄、擬南芥均為雙子葉植物,具有相近的親緣關(guān)系,而與單子葉植物水稻親緣關(guān)系較遠(yuǎn)。
圖4 甜菜小G蛋白BvRab基因家族染色體定位Fig.4 Chromosome localization of small GTP-binding proteins BvRab family members
圖5 甜菜與擬南芥(At)、水稻(Os)和番茄(Sl)小G蛋白 Rab基因家族的共線性分析Fig.5 Collinear analysis of small GTP-binding proteins Rab genes in sugar beet, Arabidopsis thaliana, rice and tomato
啟動(dòng)子順式元件分析的結(jié)果表明(圖6),大部分甜菜小G蛋白BvRab基因家族成員啟動(dòng)子含有脫落酸應(yīng)答元件(ABRE)、水楊酸應(yīng)答元件(TCA-element)、生長素應(yīng)答元件(TGA-element)、茉莉酸甲酯應(yīng)答元件(CGTCAmotif和TGACG-motif),表明甜菜小G蛋白BvRab基因家族成員在甜菜激素信號(hào)調(diào)節(jié)中發(fā)揮重要作用。
圖6 甜菜小G蛋白BvRab基因家族啟動(dòng)子順式作用元件分析Fig.6 Promoter cis-acting elements analysis of small GTP-binding proteins BvRab family members
此外,少數(shù)甜菜小G蛋白BvRab基因家族成員啟動(dòng)子中還發(fā)現(xiàn)了低溫應(yīng)答元件(LTR)、干旱誘導(dǎo)元件(MBS)、厭氧誘導(dǎo)元件(ARE和GC-Motif)、防御和壓力應(yīng)答元件(TC-rich repeats),表明甜菜小G蛋白BvRab基因家族成員可能參與甜菜非生物脅迫應(yīng)答調(diào)控。
根據(jù)甜菜小G蛋白BvRab基因家族蛋白與甜菜轉(zhuǎn)錄因子互作網(wǎng)絡(luò)的結(jié)果(圖7),說明不僅甜菜小G蛋白BvRab蛋白成員之間可能存在相互作用,而且甜菜小G蛋白BvRab與甜菜多個(gè)轉(zhuǎn)錄因子也可能存在互作關(guān)系。其中BvRabC1與轉(zhuǎn)錄因子BvGATA7可能存在相互作用,BvRabA4a、BvRabA4b均與轉(zhuǎn)錄因子BvMYB98可能存在相互作用,BvRabA3與轉(zhuǎn)錄因子BvHSFA-4c可能存在相互作用。
圖7 甜菜小G蛋白BvRab基因家族蛋白互作網(wǎng)絡(luò)Fig.7 Protein-protein interaction network of small GTP-binding proteins BvRab family members
本文以甜菜小G蛋白BvRab基因家族為研究對(duì)象,對(duì)其進(jìn)行了基因家族成員鑒定,并對(duì)家族成員進(jìn)行了理化性質(zhì)、基因結(jié)構(gòu)、序列特征、系統(tǒng)進(jìn)化、染色體定位及共線性、順式作用元件和蛋白互作等預(yù)測。對(duì)BvRab基因家族的鑒定與分析一定程度上填補(bǔ)了甜菜中關(guān)于小G蛋白相關(guān)研究的空白。
從甜菜基因組中共鑒定出58個(gè)甜菜小G蛋白BvRab基因家族成員,分為A-H共8個(gè)亞家族,與已研究的其他植物中小G蛋白R(shí)ab基因家族分為8個(gè)亞家族結(jié)果相一致[24-25],說明植物中小G蛋白R(shí)ab基因家族成員的進(jìn)化是相對(duì)保守的?;蚪Y(jié)構(gòu)呈現(xiàn)明顯差異,但在同一亞家族中的不同基因具有較為一致的外顯子和內(nèi)含子基因結(jié)構(gòu),家族成員共有5個(gè)蛋白保守基序。家族成員不均勻的分布在甜菜的9條染色體上,其中在Chr6上的分布最為密集,而在Chr5上只有BvRabD2c一個(gè)小G蛋白R(shí)ab基因家族成員分布。在進(jìn)一步的共線性進(jìn)化分析中,發(fā)現(xiàn)甜菜小G蛋白BvRab基因家族成員與番茄、擬南芥小G蛋白AtRab基因家族親緣關(guān)系較近,與水稻小G蛋白OsRab基因家族親緣關(guān)系較遠(yuǎn),這與甜菜和番茄、擬南芥同為雙子葉植物有關(guān)[26]。甜菜小G蛋白BvRab基因家族成員含有多種激素應(yīng)答元件,并且含有多種非生物脅迫應(yīng)答元件,在楊樹中也有類似發(fā)現(xiàn)[27],表明甜菜小G蛋白BvRab基因家族廣泛參與生長發(fā)育及應(yīng)答逆境的生物過程。通過對(duì)甜菜小G蛋白BvRab蛋白互作網(wǎng)絡(luò)的預(yù)測分析可以看到甜菜小G蛋白BvRab蛋白與多種轉(zhuǎn)錄因子可能相互作用,其中預(yù)測到BvRabC1與轉(zhuǎn)錄因子BvGATA7可能相互作用,轉(zhuǎn)錄因子GATA參與調(diào)節(jié)植物生長發(fā)育、多種物質(zhì)代謝、光響應(yīng)及冷響應(yīng)過程[28-30];BvRabA4a、BvRabA4b均預(yù)測到可能與轉(zhuǎn)錄因子BvMYB98相互作用,轉(zhuǎn)錄因子MYB98在被子植物胚囊細(xì)胞的營養(yǎng)運(yùn)輸中發(fā)揮作用[29];BvRabA3與轉(zhuǎn)錄因子BvHSFA-4c可能相互作用,轉(zhuǎn)錄因子HSFA-4c是植物中的熱激轉(zhuǎn)錄因子,在植物響應(yīng)熱脅迫中起著至關(guān)重要的作用[31-33],說明甜菜小G蛋白BvRab基因家族蛋白在植物生長發(fā)育及逆境響應(yīng)中都有可能發(fā)揮著重要作用。本研究通過對(duì)甜菜小G蛋白BvRab基因家族成員的鑒定及分析,為后續(xù)進(jìn)行BvRab基因家族基因參與植物激素信號(hào)、調(diào)節(jié)生長發(fā)育及應(yīng)答逆境功能方面研究提供了理論基礎(chǔ)。