宋 健,熊 宏,余進(jìn)德,劉小燭,丁 勇
(西南林業(yè)大學(xué) 生命科學(xué)學(xué)院,云南 昆明 650224)
麻瘋樹(shù)油質(zhì)蛋白JcOle14.3基因克隆及序列分析
宋 健,熊 宏,余進(jìn)德,劉小燭,丁 勇
(西南林業(yè)大學(xué) 生命科學(xué)學(xué)院,云南 昆明 650224)
作為最豐富的油體結(jié)合蛋白,油質(zhì)蛋白在油體的發(fā)生到分解消失過(guò)程中起著重要的生物學(xué)功能。本實(shí)驗(yàn)應(yīng)用生物信息學(xué)和分子生物學(xué)技術(shù)分離克隆了麻瘋樹(shù)Jatrophacurcas全長(zhǎng)593 bp的油質(zhì)蛋白JcOle14.3基因序列,無(wú)內(nèi)含子結(jié)構(gòu)。JcOle14.3基因轉(zhuǎn)錄的mRNA包含了完整的開(kāi)放閱讀框,推測(cè)編碼由137個(gè)氨基酸殘基組成、相對(duì)分子質(zhì)量為14.3 kD的穩(wěn)定、兩性的油質(zhì)蛋白JcOle14.3。JcOle14.3理論等電點(diǎn)為9.65,正電荷殘基(Arg+Lys)總數(shù)為10個(gè),負(fù)電荷殘基(Asp+Glu)總數(shù)為6個(gè);不穩(wěn)定系數(shù)為25.90,屬于穩(wěn)定性蛋白;其二級(jí)結(jié)構(gòu)的主要構(gòu)件為α-螺旋、隨機(jī)卷曲和延伸鏈。根據(jù)高級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果推測(cè)JcOle14.3含有N-末端兩親性結(jié)構(gòu)域、中間疏水性結(jié)構(gòu)域以及C-末端兩親性結(jié)構(gòu)域。C-末端兩親性結(jié)構(gòu)域包含1個(gè)α-螺旋結(jié)構(gòu)域,中間疏水性結(jié)構(gòu)域包含由3個(gè)α-螺旋構(gòu)成的跨膜結(jié)構(gòu)域,并具有oleosin蛋白特征性的高度保守的脯氨酸結(jié)模體,推測(cè)在oleosin蛋白與單層磷脂層和油體錨定結(jié)合上起著重要的作用。該研究為后期JcOle14.3的異源表達(dá)和功能研究奠定了基礎(chǔ)。
麻瘋樹(shù);油體;油質(zhì)蛋白;基因克??;序列分析
植物油(Plant Oil)是現(xiàn)代生物質(zhì)能源的理想來(lái)源之一。植物油廣泛存在于開(kāi)花植物的種子、花粉、根、莖和花中,但主要存在植物種子中[1-2]。植物油作為營(yíng)養(yǎng)貯存物質(zhì)積累于植物種子中,主要以甘油三酰(Triglycerides,TAGs)的形式存在。植物種子中貯存的營(yíng)養(yǎng)物質(zhì)主要有脂類、蛋白質(zhì)和碳水化合物,而脂類是植物種子貯存能量最有效形式。植物體將脂類貯存于種子的亞細(xì)胞器顆?!腕w(Oil Bodies,OBs)中并為隨后的生命活動(dòng)以及活躍的代謝過(guò)程提供碳水化合物和能量[3-4]。油體顆粒內(nèi)部主要為TAGs液態(tài)基質(zhì),外部包被磷脂單分子層(Phospholipids,PL)及嵌入其內(nèi)的油體結(jié)合蛋白(Proteins associated with oil bodies)[5]。油體結(jié)合蛋白包括油質(zhì)蛋白(Oleosin)、油體固醇蛋白-A(Steroleosin-A)和油體固醇蛋白-B(Steroleosin-B)、油體鈣蛋白(Caleosin)[6-9]。研究表明油體結(jié)合蛋白對(duì)于植物油體的形成與穩(wěn)定起著重要作用[10-12]。
麻瘋樹(shù)Jatrophacurcas L.又名小桐子、黑皂樹(shù)、膏桐等,是大戟科Euphorbiaceae麻瘋樹(shù)屬Jatropha多年落葉灌木植物[13]。麻瘋樹(shù)種子含有大量的油脂,可作為理想的現(xiàn)代生物質(zhì)能源原料,尤其作為柴油機(jī)燃料的替代品開(kāi)始凸顯其重要性[13-15]。因此,為深入研究開(kāi)發(fā)利用麻瘋樹(shù)種子的經(jīng)濟(jì)價(jià)值,油體結(jié)合蛋白及其基因已成為當(dāng)務(wù)之急。植物種子中油體結(jié)合蛋白主要為oleosin,占90%左右。Oleosin作為最豐富的油體相關(guān)蛋白,推測(cè)油體從發(fā)生到分解及消失過(guò)程中發(fā)揮著重要的生物學(xué)功能[1,16-17]。Oleosin等油體結(jié)合蛋白在植物芝麻[18-19]、油菜[20-23]、水稻[24]、擬南芥[25]和油桐[26]等得到了一定的研究,并且oleosin蛋白所對(duì)應(yīng)的基因均已被克隆并測(cè)序。作者通過(guò)NCBI網(wǎng)站對(duì)已經(jīng)注冊(cè)登錄的oleosin基因信息進(jìn)行搜索,結(jié)果顯示麻瘋樹(shù)oleosin基因mRNA全長(zhǎng)序列已有登錄(GenBank序列號(hào):EU234464.2),但目前尚無(wú)麻瘋樹(shù)oleosin基因DNA序列克隆和序列分析的相關(guān)報(bào)道。本實(shí)驗(yàn)根據(jù)NCBI網(wǎng)站登錄的麻瘋樹(shù)oleosin基因的已知信息,利用生物信息學(xué)和分子生物學(xué)等相關(guān)技術(shù)設(shè)計(jì)特異性引物,克隆了與序列EU234464.2不一致的mRNA序列,命名為麻瘋樹(shù)油質(zhì)蛋白基因JcOle14.3,同時(shí)克隆了JcOle14.3基因在染色體上的DNA序列,登錄GenBank的序列號(hào)為JX073623.1,并對(duì)JcOle14.3基因和JcOle14.3蛋白特性進(jìn)行了分析。
試驗(yàn)材料為麻瘋樹(shù)幼葉和開(kāi)花后發(fā)育6~7周的未成熟種子,采于中國(guó)科學(xué)院西雙版納植物園的3年生麻瘋樹(shù)植株,–80℃冰箱中保存?zhèn)溆谩?/p>
植物總RNA提取試劑盒(RNAiso Plus)、M-MLV反轉(zhuǎn)錄試劑盒和pMD18-T載體購(gòu)自TaKaRa公司,植物基因組DNA提取試劑盒、膠回收試劑盒購(gòu)自北京天根生物技術(shù)服務(wù)有限公司,大腸桿菌DH5α菌種為實(shí)驗(yàn)室保存,其他試劑均購(gòu)自上海生工生物工程技術(shù)有限公司。
參照丁勇等[27]方法提取麻瘋樹(shù)種子的總RNA,按照北京天根生物技術(shù)有限公司植物基因組DNA提取試劑盒說(shuō)明書提取麻瘋樹(shù)幼葉基因組DNA。采用1.2%瓊脂糖凝膠糖電泳法和紫外分光光度計(jì)法分別檢測(cè)總RNA樣品的完整性和純度,采用1.0%瓊脂糖凝膠糖電泳法和紫外分光光度計(jì)法分別檢測(cè)總DNA樣品的完整性和純度。
根據(jù)麻瘋樹(shù)oleosin基因mRNA已知序列(序列號(hào)EU234464.2),在其開(kāi)放閱讀框(ORF)區(qū)域外側(cè)設(shè)計(jì)特異性引物 1對(duì),上游引物為 JcOle14.3-F:5’-TATCACTGATCGTAAACCTCCA-3’,下游引物為JcOle14.3-R:5’-AAGCGAAAAAAGAAATACACCA-3’。取質(zhì)量好的總DNA樣品為模板,以JcOle14.3-F和JcOle14.3-R特異性引物對(duì)進(jìn)行PCR,反應(yīng)程序條件為:94℃預(yù)變性5 min;94℃變性30 s,53℃退火30 s,72℃延伸1 min,30個(gè)循環(huán);72℃延伸10 min。取質(zhì)量好的總RNA樣品為模板,以TaKaRa公司的M-MLV反轉(zhuǎn)錄酶進(jìn)行cDNA第一鏈的合成,以JcOle14.3-F和JcOle14.3-R特異性引物對(duì)進(jìn)行RT-PCR,反應(yīng)程序條件為:94℃預(yù)變性3 min;94℃變性 30 s,53℃退火 30s,72℃延伸1 min,30個(gè)循環(huán);72℃延伸10 min。
PCR產(chǎn)物和回收得到的目的片段采用濃度1%的瓊脂糖凝膠電泳檢測(cè)。將回收的目的片段連接到載體pMD19-T上,將重組質(zhì)粒轉(zhuǎn)化到大腸桿菌DH5α感受態(tài)細(xì)胞中,復(fù)蘇后的菌液涂布在含有Amp、X-Gal和IPTG的LB固體培養(yǎng)基平板上,培養(yǎng)過(guò)夜后隨機(jī)挑選白色菌落,將陽(yáng)性克隆菌液送往北京六合華大基因科技有限公司進(jìn)行測(cè)序。
利 用NCBI中BlastX和BlastN程 序?qū)π蛄衜RNA進(jìn)行相似性比對(duì),Align two sequences(bl2seq)工具比對(duì)分析DNA與mRNA序列,ORF fi nder工具分析序列mRNA的開(kāi)放閱讀框;利用在線ExPASyProtParam(http://web.expasy.org/protparam/)程序分析對(duì)預(yù)測(cè)蛋白質(zhì)的各種氨基酸含量和蛋白質(zhì)的等電點(diǎn)、分子量和穩(wěn)定性進(jìn)行預(yù)測(cè);利用NCBI BlastP程序?qū)ν茖?dǎo)的蛋白質(zhì)進(jìn)行同源搜索;運(yùn)用Jalview和Clustalx2軟件對(duì)搜索得到同源性較高的蛋白質(zhì)進(jìn)行序列比對(duì);利用MEGA5分子遺傳進(jìn)化分析軟件通過(guò)鄰位相連法(Neighborjoining)構(gòu)建系統(tǒng)發(fā)育樹(shù),系統(tǒng)發(fā)育樹(shù)每個(gè)統(tǒng)計(jì)學(xué)顯著性分析以(Boot-strp)檢驗(yàn),重復(fù)1 000次[28]; 使 用Siganal V4.0 (http://www.cbs. dtu.dk/services/SignalP-2.0/)分析蛋白質(zhì)信號(hào)肽;使用和Proscale(http://www.expasy.org/cgi-bin/protscale.pl)和TMHMM(http://www.cbs. dtu.dk/services/TMHMM)分別檢測(cè)其親水/疏水性特性和跨膜結(jié)構(gòu);利用MLRC(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_mlr.pl)程序預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu);使用NCBI提供的 Conserved Domain Search(CD-Search)服務(wù)器(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進(jìn)行蛋白功能域分析;利用Zhang Lab在線服務(wù)程序I-TASSER (http://zhanglab.ccmb.med.umich.edu/)進(jìn)行蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)。
本實(shí)驗(yàn)獲得的麻瘋樹(shù)種子總RNA經(jīng)紫外分光光度計(jì)測(cè)定,總RNA的OD(A260/A280)值處于1.8~2.0之間,1%瓊脂糖凝膠電泳結(jié)果顯示28S和18S rRNA兩條帶型完整,且前者條帶的亮度約為后者的2倍。以提取的總RNA反轉(zhuǎn)錄合成的第一鏈cDNA為模板,進(jìn)行RT-PCR擴(kuò)增,結(jié)果為一條特異性cDNA片斷(如圖1中泳道1和2),經(jīng)膠回收目的條帶、TA克隆、測(cè)序長(zhǎng)度為593 bp。以提取的麻瘋樹(shù)葉片總DNA樣品為模板,以JcOle14.3-F和JcOle14.3-R為引物進(jìn)行PCR擴(kuò)增,獲得麻瘋樹(shù)油質(zhì)蛋白JcOle14.3基因染色體DNA序列(如圖1中泳道4和5),將目的DNA回收并克隆測(cè)序,結(jié)果得到麻瘋樹(shù)油質(zhì)蛋白JcOle14.3基因在染色體上長(zhǎng)593 bp的DNA序列,該序列與克隆的593 bp的mRNA序列完全一致。本實(shí)驗(yàn)克隆的麻瘋樹(shù)油質(zhì)蛋白JcOle14.3基因序列登錄GenBank的序列號(hào)為JX073623.1。
圖1 麻瘋樹(shù)JcOle14.3基因克隆產(chǎn)物瓊脂糖凝膠電泳圖Fig.1 Agrose gel electrophoresis analysis of JcOle14.3 gene from Jatrophacurcas L.
應(yīng)用NCBI中bl2seq工具,將本實(shí)驗(yàn)克隆的593 bp的mRNA序列與麻瘋樹(shù)oleosin基因mRNA已知序列(GenBank序列號(hào):EU234464.2)進(jìn)行比對(duì)分析,結(jié)果(如圖2)顯示兩序列在比對(duì)范圍內(nèi)具有97.6%的一致性,有14個(gè)堿基位點(diǎn)的差異。表明本實(shí)驗(yàn)克隆了與序列EU234464.2不一致的麻瘋樹(shù)油質(zhì)蛋白基因序列,命名為麻瘋樹(shù)油質(zhì)蛋白基因JcOle14.3,登錄GenBank的序列號(hào)為JX073623.1。
圖2 序列JX073623.1和序列EU234464.2的相似性分析Fig.2 Similarlity anaylsis of nucleotides sequences between JX073623.1 and EU234464.2
本實(shí)驗(yàn)克隆得到的麻瘋樹(shù)油質(zhì)蛋白基因JcOle14.3的mRNA全長(zhǎng)593 bp,包括52 bp 5'末端非翻譯區(qū)(5'UTR)、414 bp完整開(kāi)放閱讀框(ORF)和127 bp3'末端非翻譯區(qū)(3'UTR),預(yù)測(cè)的PolA結(jié)構(gòu)位置起始于545位核苷酸處。在染色體水平上,麻瘋樹(shù)JcOle14.3基因只含有1個(gè)外顯子,沒(méi)有內(nèi)含子。完整的開(kāi)放閱讀框推測(cè)編碼由137個(gè)氨基酸殘基組成的14.3 kD oleosin蛋白,命名為麻瘋樹(shù)油質(zhì)蛋白JcOle14.3,在GenBank的登錄號(hào)為AFP19885.1。
通過(guò)NCBI網(wǎng)站Blastp工具對(duì)麻瘋樹(shù)JcOle14.3蛋白進(jìn)行相似性搜索分析結(jié)果所示(見(jiàn)圖3),目的蛋白包含一個(gè)潛在的保守區(qū)域“oleosindomain”,屬于油質(zhì)蛋白o(hù)leosin超家族蛋白之一。麻瘋樹(shù)JcOle14.3蛋白與麻瘋樹(shù)Jatrophacurcas的oleosin 1-like蛋白、桑樹(shù)(川桑)Morusnotabilis的Oleosin 1、油桐Verniciafordii的oleosin I蛋白、甜橙Citrus sinensis的oleosin 1-like蛋白、蓖麻Ricinuscommunis的Oleosin 2蛋白、巨桉Eucalyptus grandis的oleosin 1-like、煙草Nicotianasylvestris的oleosin 1-like、胡楊Populuseuphratica的oleosin 1-like、油茶Camellia oleifera的OleIII蛋白和芝麻Sesamumindicum的15 kD oleosin蛋白等都具有較高的相似性,E值(E-value)從2e-64到7e-87,一致性(Identity)從76%到96%,相似度(Positives)從83%到97%(見(jiàn)表1)。表明本實(shí)驗(yàn)克隆得到的JcOle14.3基因翻譯的JcOle14.3蛋白為麻瘋樹(shù)表達(dá)的oleosin家族蛋白之一。
圖3 麻瘋樹(shù)JcOle14.3蛋白氨基酸序列在NCBI中Blastp分析結(jié)果Fig.3 Blastp anaylsis result of JcOle14.3 amino acid sequence in NCBI
表1 麻瘋樹(shù)JcOle14.3蛋白與其他已知功能蛋白同源性比較Table 1 Similarlity anaylsis of JcOle14.3 with the function identidied proteins in GenBank
麻瘋樹(shù)JcOle14.3蛋白與其他物種中的oleosin蛋白的氨基酸序列比對(duì)結(jié)果(圖4)顯示,不同物種的oleosin蛋白在N端和C端具有較大的氨基酸序列差異性,而在中間氨基酸區(qū)域具有較高的保守性,尤其包含一個(gè)由3個(gè)脯氨酸和1個(gè)絲氨酸組成的脯氨酸結(jié)(Pro Knot)高度保守結(jié)構(gòu)域、即ATPLLVTFSPVLVPA模體,此脯氨酸結(jié)模體是植物油質(zhì)蛋白基因序列的標(biāo)志性結(jié)構(gòu)特征。麻瘋樹(shù)JcOle14.3和其他物種oleosin蛋白的進(jìn)化樹(shù)分析結(jié)果(圖5)顯示,JcOle14.3(AFP19885.1)和大戟科麻瘋樹(shù)oleosin 1-like(NP_001295613.1)親緣關(guān)系最近,聚為一支,和大戟科油桐oleosin I(ADB03184.1)、大戟科蓖麻Oleosin 2(XP_002511014.1)聚為一個(gè)大支;但是與麻瘋樹(shù)18.2 kDa-like(NP_001295667.1)的遺傳距離則較遠(yuǎn)。
蛋白質(zhì)理化性質(zhì)分析結(jié)果顯示推導(dǎo)得到的蛋白JcOle14.3由137個(gè)氨基酸殘基組成,相對(duì)分子質(zhì)量為14.3 kD,等電點(diǎn)pI為9.65,可知該蛋白質(zhì)在其生理?xiàng)l件下為堿性蛋白質(zhì);JcOle14.3蛋白質(zhì)由除Asn (N)之外的19種常見(jiàn)的氨基酸組成,蛋白質(zhì)氨基酸成分比例差異較大,其中Cys (C)和Trp (W)的含量最低為0.7%,Ala (A)的含量最高為12.4%,其它氨基酸的含量在1.5%~11.7%之間變化;正電荷氨基酸殘基(Arg+Lys)總數(shù)為10個(gè),負(fù)電荷氨基酸殘基(Asp+Glu)總數(shù)為6個(gè),因此在pH7.0的環(huán)境中它帶正電荷;JcOle14.3蛋白質(zhì)含有2052個(gè)總原子數(shù),其中643個(gè)碳原子(Carbon,C)、1046個(gè)氫原子(Hydrogen,H)、178個(gè)氮原子(Nitrogen,N)、182個(gè)氧原子(Oxygen,O)、3個(gè)硫原子(Sulfur,S),分子式為C643H1046N178O182S3;摩爾消光系數(shù)(Extinction coef fi cients)為8480;不穩(wěn)定系數(shù)(instability index,II)值為25.90。推測(cè)JcOle14.3屬于穩(wěn)定性蛋白質(zhì)。
圖4 麻瘋樹(shù)JcOle14.3蛋白與其他物種oleosin的氨基酸序列比對(duì)Fig.4 Amino acid sequences comparison between JcOle14.3 in Jatrophacurcas and oleosin-like in other species
圖5 JcOle14.3與其他植物oleosin的進(jìn)化樹(shù)分析Fig.5 Phylogenetic analysis of JcOle14.3 and otheroleosin-like
信號(hào)肽是編碼分泌性蛋白N端的一段氨基酸序列,是指導(dǎo)分泌性蛋白合成的關(guān)鍵因素,一般含有16~26個(gè)氨基酸殘基,在完成功能后被切除[29]。JcOle14.3蛋白信號(hào)肽分析結(jié)果顯示,最大C值(原始剪切位點(diǎn)的分值)為0.610,位于第44個(gè)氨基酸殘基;最大Y值(綜合剪切位點(diǎn)的分值)為0.161,位于第68個(gè)氨基酸殘基;最大S值(信號(hào)肽的分值)為0.983,位于第36個(gè)氨基酸殘基;平均S值為0.599,位于第1~67位氨基酸殘基之間;綜合計(jì)算信號(hào)肽存在的可能性值為0.018,信號(hào)錨定的可能性值為0.977,第46~47位氨基酸殘基之間的剪切的值為0.006。推測(cè)JcOle14.3蛋白不存在信號(hào)肽序列,為非分泌性蛋白。
蛋白質(zhì)跨膜結(jié)構(gòu)域預(yù)測(cè)結(jié)果(圖6)顯示,JcOle14.3蛋白含有2個(gè)跨膜螺旋結(jié)構(gòu)域,分別位于32~54位和64~86位氨基酸殘基區(qū)域;1~31位和87~137位氨基酸殘基區(qū)域構(gòu)成2個(gè)親水性區(qū)域,位于膜外胞質(zhì)內(nèi);32~86位氨基酸殘基區(qū)域構(gòu)成疏水性區(qū)域,位于膜內(nèi)。
圖6 JcOle14.3蛋白跨膜結(jié)構(gòu)域預(yù)測(cè)Fig.6 Prediction of transmembrane regions of JcOle14.3
蛋白質(zhì)疏水性分析一方面可以為二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果提供參考,另一方面可以為結(jié)構(gòu)域以及功能域的劃分提供依據(jù)[22]。其中,score>0,表現(xiàn)為疏水性;score<0,表現(xiàn)為親水性。通過(guò)疏水性分析結(jié)果顯示麻瘋樹(shù)JcOle14.3蛋白質(zhì)中疏水性最大值是3.256,位于第68位氨基酸殘基處;親水性最大值是-2.578,位于第123位氨基酸殘基處。蛋白質(zhì)中間區(qū)域在第21-93位氨基酸殘基區(qū)域表現(xiàn)出較強(qiáng)的疏水性,在N端1-20位和C端94-133位氨基酸殘基區(qū)域都表現(xiàn)出強(qiáng)親水性(圖7),這與該蛋白質(zhì)性質(zhì)和跨膜結(jié)構(gòu)域分析結(jié)果吻合,說(shuō)明麻瘋樹(shù)JcOle14.3蛋白質(zhì)是一種兩性蛋白質(zhì),即該蛋白質(zhì)兩末端為親水性區(qū)域,中間為疏水性區(qū)域。
圖7 JcOle14.3蛋白質(zhì)疏水性和親水性結(jié)構(gòu)分析Fig.7 Prediction structure of JcOle14.3protein hydrophobicity and hydrophilicity pro fi le
蛋白質(zhì)分子的多肽鏈通常折疊和盤曲成比較穩(wěn)定的空間結(jié)構(gòu),形成比較穩(wěn)定的二級(jí)結(jié)構(gòu),進(jìn)一步才能完成活性功能域構(gòu)象的構(gòu)建,以完成特定的生命活動(dòng)。根據(jù)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果(圖8)推測(cè)JcOle14.3蛋白二級(jí)結(jié)構(gòu)由大量的α-螺旋(Alpha helix)、隨機(jī)卷曲(Random coil)和少量的延伸鏈(Extended strand)結(jié)構(gòu)組成。α-螺旋、隨機(jī)卷曲和延伸鏈分別占49.64%、36.50%和13.87%。α-螺旋二級(jí)結(jié)構(gòu)主要位于16-26位(α1)、60-76位(α2)、83-96位(α3)和105-128位(α4)氨基酸殘基區(qū)域,隨機(jī)卷曲二級(jí)結(jié)構(gòu)主要位于1-15位、27-30位、77-82位、97-104位、129-137位氨基酸殘基區(qū)域,延伸鏈二級(jí)結(jié)構(gòu)主要位于31-36位、43-48位、54-57位氨基酸殘基區(qū)域。表明α-螺旋、隨機(jī)卷曲和延伸鏈構(gòu)成了JcOle14.3蛋白二級(jí)結(jié)構(gòu)的主要部分。
圖8 JcOle14.3蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.8 The secondary structure of the deduced JcOle14.3 protein
跨膜蛋白的三維結(jié)構(gòu)預(yù)測(cè)是生物信息學(xué)研究熱點(diǎn)之一。本實(shí)驗(yàn)構(gòu)建的麻瘋樹(shù)JcOle14.3蛋白高級(jí)結(jié)構(gòu)如圖9所示。根據(jù)三維結(jié)構(gòu)預(yù)測(cè)結(jié)果,并結(jié)合疏水性、跨膜結(jié)構(gòu)和二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果,推測(cè)麻瘋樹(shù)JcOle14.3蛋白由3個(gè)基本的結(jié)構(gòu)域組成,包括N端30個(gè)左右氨基酸殘基組成的兩親性(親水性和親脂性)區(qū)域、C端47個(gè)左右氨基酸殘基組成的兩親性α-螺旋區(qū)域和肽段中部約60個(gè)氨基酸殘基組成的高度疏水性的跨膜結(jié)構(gòu)域,符合Tzen和Huang提出的oleosin蛋白結(jié)構(gòu)模型[10]。JcOle14.3蛋白三維結(jié)構(gòu)中(圖9)顯示出蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果(圖8)中的4個(gè)α-螺旋,其中α1、α2和α3位于中心疏水性跨膜結(jié)構(gòu)域,α4位于C端兩親性α-螺旋結(jié)構(gòu)域。推測(cè)由3個(gè)脯氨酸和1個(gè)絲氨酸組成的脯氨酸結(jié)(Pro Knot)高度保守結(jié)構(gòu)域位于α1和α2之間,可能對(duì)保證JcOle14.3蛋白向PL的正確定位和維持油體結(jié)構(gòu)具有重要意義。
圖9 麻瘋樹(shù)JcOle14.3蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)Fig.9 3D structure prediction of JcOle14.3 protein
含油植物種子在發(fā)育期間累積大量的儲(chǔ)藏型油脂,主要為TAGs,作為種子萌發(fā)和隨后的幼苗生長(zhǎng)所需的碳源和能量來(lái)源。TAGs被包裹在離散的、球形的特定細(xì)胞器油體中[1,3,4]。油體表面被鑲嵌有油體結(jié)合蛋白質(zhì)的PL組成的半單位膜所包裹著[2,7,16,19,25]。油體在植物細(xì)胞中相當(dāng)穩(wěn)定,是因?yàn)橛腕w結(jié)合蛋白(主要是oleosin)提供的空間位阻(Steric Hindrance)和負(fù)電斥力(Electronegative Repulsion)效應(yīng)在起作用,因此在種子成熟過(guò)程中通過(guò)互相積壓形式而充滿整個(gè)細(xì)胞的油體不會(huì)發(fā)生聚合[10-12]。
Oleosin為一個(gè)超家族蛋白,其基因以基因家族形式存在。1987年Vance和Huang首次運(yùn)用分子克隆技術(shù)從玉米種子中成功分離16.5kD油質(zhì)蛋白cDNA序列[30],之后oleosin蛋白及其基因在不同植物如芝麻[18-19]、油菜[20-23]、水稻[24]、擬南芥[25]和油桐[26]等中得到了一定的研究,并發(fā)現(xiàn)oleosin均以多個(gè)異構(gòu)體蛋白形式存在各植物中。本實(shí)驗(yàn)從麻瘋樹(shù)種子中成功克隆了編碼14.3 kDoleosin蛋白的基因JcOle14.3(GenBank序列號(hào):JX073623.1),該基因在染色體水平上只含有1個(gè)外顯子,沒(méi)有內(nèi)含子,JcOle14.3基因DNA復(fù)制后發(fā)生轉(zhuǎn)錄生成mRNA,其完整的開(kāi)放閱讀框推測(cè)編碼由137個(gè)氨基酸殘基組成的14.3 kDJcOle14.3蛋白(GenBank序列號(hào):AFP19885.1),在mRNA序列上與已知麻瘋樹(shù)油質(zhì)蛋白基因(GenBank序列號(hào):EU234464.2)在比對(duì)范圍內(nèi)具有14個(gè)堿基位點(diǎn)的差異(圖2),在氨基酸序列上與已知麻瘋樹(shù)oleosin類似蛋白(GenBank序列號(hào):ABW90150.2)存在4%的差異性,推測(cè)oleosin蛋白在麻瘋樹(shù)中也是以不同的蛋白異構(gòu)體形式存在,本實(shí)驗(yàn)獲得的14.3 kD油質(zhì)蛋白JcOle14.3為麻瘋樹(shù)oleosin蛋白家族的新成員。
已知研究表明oleosin是一種高度疏水的堿性小分子量蛋白,只存在于植物體中[31],而來(lái)自不同植物的oleosin蛋白都具有相同的結(jié)構(gòu)特性,即具有3個(gè)基本的結(jié)構(gòu)域:40-60個(gè)氨基酸殘基組成的兼具親水性和親脂性N-末端區(qū)、68-74個(gè)氨基酸殘基組成的中間疏水區(qū)以及33-40個(gè)氨基酸殘基組成的α-螺旋兩性C-末端區(qū)[10]。本實(shí)驗(yàn)獲得的oleosin蛋白家族新成員符合Tzen和Huang提出的oleosin結(jié)構(gòu)模型,推測(cè)麻瘋樹(shù)JcOle14.3蛋白由3個(gè)基本的結(jié)構(gòu)域組成,包括N-端30個(gè)左右氨基酸殘基組成的兩親性(兼具親水性和親脂性)區(qū)域、肽段中部約60個(gè)氨基酸殘基組成的高度疏水性的跨膜結(jié)構(gòu)域和C-端47個(gè)左右氨基酸殘基組成的兩親性的α-螺旋結(jié)構(gòu)域。預(yù)測(cè)得到的4個(gè)α-螺旋(圖8)中α1、α2和α3位于中心疏水性跨膜結(jié)構(gòu)域,α4位于C端兩親性α-螺旋結(jié)構(gòu)域。根據(jù)中心疏水結(jié)構(gòu)域中氨基酸殘基的極性分布以及結(jié)構(gòu)分析,推測(cè)其為反式平行的β-折疊結(jié)構(gòu),形成發(fā)夾結(jié)構(gòu)并插入TAG中,其頂部為3個(gè)脯氨酸和1個(gè)絲氨酸(-PX5SPX2P-)組成的脯氨酸結(jié)(Pro-Knot),連接兩個(gè)分開(kāi)的α-螺旋結(jié)構(gòu)(α1和α2),這與Lacey等提出的oleosin結(jié)構(gòu)新模型一致[32],N-端兩親性區(qū)域和C-端兩親性α-螺旋結(jié)構(gòu)域分布于油體表面朝向胞漿一面。推測(cè)麻瘋樹(shù)JcOle14.3蛋白類似于其他oleosin,其整個(gè)結(jié)構(gòu)類似圖釘一樣分布在油體表面,而其中心區(qū)高度保守的由兩個(gè)α-螺旋構(gòu)成的脯氨酸結(jié)在其與PL和油體錨定結(jié)合過(guò)程起著重要的作用。
已有研究推測(cè)Oleosin作為最豐富的油體相關(guān)蛋白從油體的發(fā)生到分解及消失過(guò)程中發(fā)揮著重要的生物學(xué)功能。但植物體是如何響應(yīng)內(nèi)外源信號(hào)進(jìn)行調(diào)控JcOle14.3基因表達(dá),JcOle14.3蛋白又是如何參與到油體的形成、成熟、貯存及動(dòng)員的過(guò)程,以及在麻瘋樹(shù)種子中JcOle14.3基因表達(dá)調(diào)控與含油量之間又存在著什么樣的關(guān)系等問(wèn)題還有待深入研究。
從麻瘋樹(shù)中克隆了編碼14.3 kD油質(zhì)蛋白(oleosin)的基因JcOle14.3。全長(zhǎng)593 bp的JcOle14.3基因(GenBank序列號(hào):JX073623.1)轉(zhuǎn)錄的mRNA包含了完整的開(kāi)放閱讀框,無(wú)內(nèi)含子結(jié)構(gòu)。麻瘋樹(shù)中oleosin蛋白是由多基因家族編碼的。推測(cè)14.3 kD的oleosin蛋白(GenBank序列號(hào)AFP19885.1)為137個(gè)氨基酸殘基組成的兩性蛋白質(zhì),主要含N末端兩親性結(jié)構(gòu)域、中間疏水性結(jié)構(gòu)域和C-末端兩親性結(jié)構(gòu)域。C-末端兩親性結(jié)構(gòu)域包含一個(gè)α-螺旋結(jié)構(gòu)域。中間疏水性結(jié)構(gòu)域包含有一個(gè)由3個(gè)脯氨酸和1個(gè)絲氨酸組成的脯氨酸結(jié)(Proline-Knot)模體,在32-86位左右氨基酸殘基組成的α-螺旋跨膜區(qū)域,推測(cè)在oleosin蛋白與單層磷脂層和油體錨定結(jié)合上起著重要的作用。
[1] Huang A H C. Oil bodies and oleosins in seeds[J]. Annual review of plant biology, 1992, 43(1): 177-200.
[2] Huang A H C. Oleosin and oil bodies in seeds and other organs[J]. Plant Physiol., 1996, 110(4): 1055-1061.
[3] Yatsu L Y, Jacks T J. Spherosome membranes: Half unitmembranes[J]. Plant Physiology, 1972, 49(6): 937-943.
[4] Murphy D J. Structure, function and biogenesis of storage lipid bodies and oleosins in plants[J]. Prog Lipid Res., 1993,32(3):247-280.
[5] Tzen J T C, Cao Y Z, Laurent P, et al. Lipids, proteins, and structure of seed oil bodies from diverse species[J]. Plant Physiol., 1993, 101 (1): 267-276.
[6] Tzen J T C, Lai Y K, Chan K L, et al. Oleosin is of or ms of high and low molecular weights are present in the oil bodies of diverse seed species[J]. Plant Physiol., 1990, 94 (3): 1282-1289.
[7] Tzen J T C, Peng C C, Cheng D J, et al. A new method for seed oil body purification and examination of oil body integrity following germination[J]. J. Biochem., 1997, 121(4): 762-768.
[8] Chen E C F, Tai S S K, Peng C C, et al. Identi fi cation of three novel unique proteins in seed oil bodies of sesame[J]. Plant Cell Physiol., 1998, 39(9): 935-941.
[9] 丁 勇,徐春雷,甘 莉.植物油體及其相關(guān)蛋白的研究進(jìn)展[J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào), 2008, 27(4): 558-563.
[10] Tzen J T C, Huang A H C. Surface structure and properties of plant seed oil bodies[J]. J. Cell Biol., 1992, 117(2): 327–335.
[11] Leprince O, van Aelst A C, Pritchard H W, et al. Oleosins prevent oil-body coalescence during seed imbibition as suggested by a low-temperature scanning electron microscope study of dessication-tolerant and -sensitive oilseeds[J]. Planta, 1997,204(1): 109–119.
[12] Jiang P L, Wang C S, Hsu C M, et al. Stable oil bodies sheltered by a unique oleosin in lily pollen[J]. Plant Cell Physiol., 2007,48(6): 812–821.
[13] Openshaw K. A review of Jatrophacurcas: an oil plant of unfulfilled promise[J].Biomass Bioenergy, 2000, 19(1): 1–15
[14] 胡芳名, 譚曉風(fēng), 裴 東, 等. 我國(guó)經(jīng)濟(jì)林學(xué)科進(jìn)展[J]. 經(jīng)濟(jì)林研究, 2010, 28(1): 1-8.
[15] Augustus G D P S, Jayabalan M, Seiler G J. Evaluation and bioinduction of energy components of Jatrophacurcas[J].Biomass Bioenergy, 2002, 23(3): 161–164.
[16] Frandsen G I, Mundy J, Tzen J T C. Oil bodies and their associated proteins, oleosin and caleosin[J]. Physiol. Plant, 2001,112(1): 301-307.
[17] May fi eld J A, Fiebig A, Johnstone SE, et al. Gene families from the Arabidopsis thaliana pollen coat proteome[J]. Science,2001,292(5526): 2482-2485.
[18] Chen J C F, Tsai C C Y, Tzen J T C. Cloning and secondary structure analysis of caleosin, a unique calcium-binding protein in oil bodies of plant seed[J]. Plant Cell Physiol., 1999, 40(10): 1079-1086.
[19] Lin L J, Tai S S K, Peng C C, et al. Steroleosin, a sterol-binging dehydrogenase in seed oil bodies[J]. Plant Physiol., 2002, 128(4):1200-1211.
[20] Murphy D J, Cummins I, Kang A S. Synthesis of the major oilbody membrane protein in developing rapeseed embryos[J].Biochem. J., 1989, 258(1):285-293.
[21] Keddie J S, Hubner G, Slocombe S P, et al. Cloning and characterization of an oleosin gene from Brassica napus[J]. Plant MolBiol., 1992, 19(3): 443-453.
[22] 丁 勇, 陳慶波, 徐春雷, 等. 油菜油體鈣蛋白基因BnClo1的克隆和表達(dá)[J].作物學(xué)報(bào), 2008, 34(11): 1921-1928.
[23] 丁 勇, 常 瑋, 劉小燭. 甘藍(lán)型油菜BnClo1基因克隆、表達(dá)載體的構(gòu)建及原核表達(dá)[J].中國(guó)農(nóng)業(yè)科學(xué), 2010, 43(2):252-258.
[24] Frandsen G I, Muller-Uri F, Nielsen M, et al. Novel plant Ca2+-binding protein expressed in response to abscisic acid and osmotic stress[J]. J. Biol Chem., 1996, 271(1): 343-348.
[25] Naested H, Frandsen G I, Jauh G Y, et al. Caleosins: Ca2+-binding proteins associated with lipid bodies[J]. Plant MolBiol., 2000,44(4): 463-476.
[26] 龍洪旭,譚曉風(fēng), 陳 洪, 等. 油桐油體蛋白基因的克隆及序列分析[J].中南林業(yè)科技大學(xué)學(xué)報(bào), 2010, 30(4): 31-38.
[27] 丁 勇, 范紅波, 張高磊, 等.麻瘋樹(shù)種子總RNA提取方法研究[J].中南林業(yè)科技大學(xué)學(xué)報(bào), 2012, 32(3):158-161.
[28] Kumar S, Tamura K, Nei M. MEGA: Molecular evolutionary genetics analysis software for microcomputers[J].Comput Appl Biosci., 1994, 10 (2): 189-191
[29] 王漢屏. 不同植物防御素的生物信息學(xué)分析[J]. 植物生理學(xué)通訊, 2008, 44 (1): 25-32.
[30] Vance V B, Huang A H. The major protein from lipid bodies of maize. Characterization and structure based on cDNA cloning[J].J. BiolChem, 1987, 262(23): 11275-11279.
[31] KandpalJB,Madan M. Jatrophacurcus: a renewable source of energy for meeting future energy needs[J]. Renewable Energy,1995, 6 (2): 159-160.
[32] Lacey D J, Wellner N, Beaudoin F, et al. Secondary structure of oleosins in oil bodies isolated from seeds of safflower(Carthamustinctorius L.) and sun flower(Helianthus annuus L.)[J]. Bioche J., 1998, 334(22): 469-477.
Cloning and sequence analysis of oleosin gene JcOle14.3 in Jatrophacurcas
SONG Jian, XIONG Hong, YU Jin-de, LIU Xiao-zhu, DING Yong
(College of Life Sciences, Southwest Forestry University, Kunming 650224, Yunnan, China)
Oleosins as the most abundant oil body-associated proteins have been suggested to play an important biological function in the stability ofoil bodies, and in their synthesis and metabolism. In this study, the gene JcOle14.3 containing no intron and encoding 14.3 kD oleosin was isolated by PCR combined with bioinformatics analysis and molecular biological technique from Jatrophacurcas L..The full-length mRNAcomprised 593 nucleotides consisting of an open reading frame of 414 nucleotides encoded a putative JcOle14.3 comprising 137 amino acid residues with molecular weight of 14.3 kD. The isoelectric point of 9.65.and the total number of positively charged residues (Arg+Lys) was 10, and total number of negatively charged residues (Asp+Glu) was 6. JcOle14.3 with unstable coefficient 25.90 belongs to the stable protein. The main parts of predicted secondary structures of JcOle14.3 were α-helices, random coils and extended strand. The JcOle14.3 gene product consists of a highly hydrophobic central domain fl anked byrelatively polar N- and C-terminal domains. The results indicated that the C-terminal region forms an amphipathicα-helix. The JcOle14.3 central domain forms three α -helices and α1 and α2 were separated by the proline-knot forming a 180 turn. The oleosin central domain is highly conserved between all oleosinssequenced to date. This workalso suggested that the highly conservedproline-knotplayimportantrolesfor oil body targeting. The study results established the foundation for the heterologous expression and functional analysis of JcOle14.3.
Jatrophacurcas; oil body; oleosin;gene cloning;sequence analysis
S759.3+3
A
1673-923X(2016)06-0015-08
10.14067/j.cnki.1673-923x.2016.06.004
2015-10-20
云南省生物學(xué)優(yōu)勢(shì)特色重點(diǎn)學(xué)科建設(shè)項(xiàng)目(50097505);云南省高校林下生物資源保護(hù)及利用科技創(chuàng)新團(tuán)隊(duì)項(xiàng)目(51400605);國(guó)家自然科學(xué)基金(31460076)
宋 健,碩士研究生,熊宏為共同第一作者
丁 勇,高級(jí)實(shí)驗(yàn)師,碩士研究生導(dǎo)師;E-mail:dingyong@swfu.edu.cn
宋 健,熊 宏,余進(jìn)德,等. 麻瘋樹(shù)油質(zhì)蛋白JcOle14.3基因克隆及序列分析[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2016, 36(6):15-22.
[本文編校:吳 彬]