摘要:以擬南芥蛋白質(zhì)作“種子”在蓖麻(Riciuns communis L.)的蛋白質(zhì)數(shù)據(jù)庫中搜索,結(jié)合關(guān)鍵字搜索方法,獲得10個(gè)蓖麻油體固醇蛋白質(zhì),通過生物信息方法對(duì)這些蛋白質(zhì)進(jìn)行分析。結(jié)果表明,10個(gè)蓖麻油體固醇蛋白質(zhì)外顯子的數(shù)目和內(nèi)含子的位點(diǎn)較保守;氨基酸殘基數(shù)、分子量和等電點(diǎn)相差不大;疏水性/親水性和跨膜結(jié)構(gòu)分析表明,成員間在N-末端第25個(gè)氨基酸位點(diǎn)有一個(gè)跨膜結(jié)構(gòu);主要由α螺旋、β折疊和無規(guī)則卷曲組成;三維結(jié)構(gòu)符合SDR超家族特點(diǎn);NADPH結(jié)合區(qū)域、活性位點(diǎn)較保守,膜錨定區(qū)域和固醇結(jié)合區(qū)域差異較大。
關(guān)鍵詞:蓖麻(Riciuns communis L.);油體固醇蛋白質(zhì);生物信息學(xué)
中圖分類號(hào):S565.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2016)11-2930-04
DOI:10.14088/j.cnki.issn0439-8114.2016.11.056
蓖麻(Riciuns communis L.)是大戟科(Euphorbiaceae)蓖麻屬(Ricicuns)一年或多年生雙子葉植物,廣泛生長(zhǎng)在熱帶、亞熱帶和溫帶地區(qū),是世界十大重要油料作物之一[1]。植物種子中有一種儲(chǔ)存營(yíng)養(yǎng)物質(zhì)的細(xì)胞器——油體[2-4],其內(nèi)部主要成分為三酰甘油,外部則為磷脂單分子層及嵌入其內(nèi)的油體結(jié)合蛋白質(zhì)組成的半單位膜[5]。油體結(jié)合蛋白質(zhì)主要有三種——油脂蛋白質(zhì)、油體鈣蛋白質(zhì)和油體固醇蛋白質(zhì)。油脂蛋白質(zhì)由N-和C-末端兩個(gè)親水區(qū)域及中間疏水錨定區(qū)域組成。N-和C-末端暴露在油體表面,能夠提供空間位阻和負(fù)電斥力來維持油體的穩(wěn)定[5]。Chen等[6]在油體中發(fā)現(xiàn)了3種微量蛋白質(zhì)分別稱為Sop1、Sop2、Sop3。Sop1稱為油體鈣蛋白質(zhì)。油體鈣蛋白質(zhì)由N-端親水鈣結(jié)合區(qū)域、C-端親水性磷酸化區(qū)域和中間疏水錨定區(qū)域組成,可能在油體成熟、脂肪動(dòng)員和提高油體穩(wěn)定性方面發(fā)揮作用[5]。Sop2、Sop3被稱為油體固醇蛋白質(zhì)-A和油體固醇蛋白質(zhì)-B[7]。油體固醇蛋白質(zhì)是一種羥基固醇脫氫酶,屬于SDR家族[8,9]。N-端的疏水區(qū)域由兩個(gè)親性α螺旋夾著一個(gè)疏水錨定結(jié)構(gòu)組成,在此疏水區(qū)域中部有Pro knob結(jié)構(gòu)[10],其余部位分為NADPH、固醇結(jié)合區(qū)域和兩者之間的活性位點(diǎn)S-(12X)-Y-(3X)-K[10]。Sop3和Sop2蛋白質(zhì)的固醇結(jié)合區(qū)域不同[7]。近來發(fā)現(xiàn)油體蛋白質(zhì)也存在于根尖和芽等胚后組織中,推測(cè)在植物體內(nèi)還存在未被發(fā)現(xiàn)的信號(hào)轉(zhuǎn)導(dǎo)通路[8]。本試驗(yàn)以擬南芥蛋白質(zhì)作“種子”在蓖麻的蛋白質(zhì)數(shù)據(jù)庫中搜索,結(jié)合關(guān)鍵字搜索方法對(duì)蓖麻油體固醇蛋白質(zhì)進(jìn)行生物信息學(xué)分析,以期為該蛋白質(zhì)的鑒定提供參考。
1 材料與方法
1.1 蓖麻基因組數(shù)據(jù)庫搜索
以“Steroid dehydrogenase”為關(guān)鍵字在蓖麻基因組數(shù)據(jù)庫(http://www.phytozome.net/search.php)中搜索,下載基因、cDNA和蛋白質(zhì)序列;以6條擬南芥油體固醇蛋白質(zhì)[11]作為“種子”,分別在蓖麻數(shù)據(jù)庫(http://www.phytozome.net/search.php)中進(jìn)行Blastp搜索,E設(shè)為1×10-30,獲得同源的油體固醇蛋白質(zhì)的基因、cDNA和蛋白質(zhì)序列,去除重復(fù)后,再利用NCBI保守結(jié)構(gòu)域分析工具(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi?)對(duì)所獲得的蛋白質(zhì)家族進(jìn)行鑒定,檢測(cè)是否有SDR(短鏈脫氫/還原酶超家族)的保守結(jié)構(gòu)域。
1.2 蓖麻油體固醇蛋白質(zhì)生物信息學(xué)分析
蓖麻油體固醇蛋白質(zhì)的理化性質(zhì)采用Protparam軟件進(jìn)行預(yù)測(cè);內(nèi)含子、外顯子組成采用Spidey軟件進(jìn)行分析;疏水性/親水性采用ProtScal軟件進(jìn)行分析;蛋白質(zhì)二級(jí)結(jié)構(gòu)分析采用GOR4軟件進(jìn)行分析;蛋白跨膜結(jié)構(gòu)域采用TMHMM 2.0 Server軟件;信號(hào)肽結(jié)構(gòu)采用SignalP4.1 Server軟件進(jìn)行預(yù)測(cè);蛋白質(zhì)三維結(jié)構(gòu)分析與同源建模采用CPHmodels軟件和RasMol-Raindy軟件;進(jìn)化樹的構(gòu)建采用軟件ClustalW2軟件和MEGA 4.1軟件,所有軟件使用的都是其默認(rèn)值,部分分析軟件的網(wǎng)址見表1。
2 結(jié)果與分析
2.1 蛋白質(zhì)的一級(jí)結(jié)構(gòu)分析
2.1.1 氨基酸序列的理化性質(zhì)分析 通過綜合分析,最終獲得11條完整的蓖麻油體固醇蛋白質(zhì)基因,見表2。利用在線分析軟件Protparam對(duì)10種油體固醇蛋白質(zhì)進(jìn)行分析,得到其對(duì)應(yīng)的氨基酸序列的理化性質(zhì),結(jié)果見表2。大部分蛋白質(zhì)成員外顯子數(shù)為3或6,氨基酸殘基數(shù)為317~352,分子量為35.286 0~39.918 9 kDa,等電點(diǎn)PI為5.35~9.57。不穩(wěn)定系數(shù)表明,有8種成員在植物內(nèi)可能階段性出現(xiàn)。親水性大部分都為正值,大部分成員都為親水蛋白質(zhì)。信號(hào)肽預(yù)測(cè)表明,這11個(gè)蛋白質(zhì)不存在信號(hào)肽。由于Slo11蛋白質(zhì)基因不完整,所以后續(xù)分析中只選擇其他10個(gè)蓖麻油體固醇蛋白質(zhì)。
2.1.2 疏水性/親水性的預(yù)測(cè)和分析 采用ProtScale軟件對(duì)10個(gè)蓖麻油體固醇蛋白質(zhì)進(jìn)行分析,結(jié)果(圖1)表明,以Slo1、Slo9為例,1~40區(qū)域有強(qiáng)烈的疏水性,可能為跨膜區(qū)域與油體內(nèi)部疏水的三酰甘油相接合處,其他區(qū)域無明顯規(guī)律。
2.1.3 跨膜結(jié)構(gòu)的預(yù)測(cè)和分析 利用在線軟件TMHMM 2.0 Server對(duì)10個(gè)蓖麻油體固醇蛋白質(zhì)進(jìn)行跨膜結(jié)構(gòu)預(yù)測(cè),圖2結(jié)果表明,除了Slo5蛋白質(zhì)在氨基酸25、200位點(diǎn)各有一個(gè)跨膜區(qū),其他9個(gè)蛋白質(zhì)(如Slo9)均只在25位點(diǎn)處有一個(gè)跨膜結(jié)構(gòu)。
2.2 蛋白質(zhì)二級(jí)結(jié)構(gòu)的預(yù)測(cè)和分析
采用GOR4軟件分析蓖麻油體固醇蛋白質(zhì),結(jié)果如圖3所示,65~80、125~130、190~210、240~260范圍內(nèi)主要為α螺旋,45~55、170~180、220~230、285~290范圍內(nèi)主要為β折疊,其他部位沒有明顯的規(guī)律,從二級(jí)結(jié)構(gòu)的相似性推測(cè)他們可能有相似的空間結(jié)構(gòu)。
2.3 蛋白質(zhì)三維結(jié)構(gòu)分析與同源建模
利用CPHmodels軟件對(duì)10個(gè)蓖麻油體固醇蛋白質(zhì)進(jìn)行同源建模,并用RasMol-Raindy軟件將結(jié)果進(jìn)行處理,結(jié)果見圖4。10個(gè)蛋白質(zhì)成員主體都為α螺旋夾著6~7個(gè)β片層的結(jié)構(gòu),符合SDR超家族的特點(diǎn),推測(cè)結(jié)構(gòu)包含了NADPH和固醇的結(jié)合區(qū)域以及活性位點(diǎn),全部成員中在C-端都預(yù)測(cè)到了一個(gè)卷曲組成的長(zhǎng)鏈,可能與油脂固醇蛋白質(zhì)的功能有關(guān)。
2.4 系統(tǒng)進(jìn)化樹的構(gòu)建
采用了ClustX 1.83軟件對(duì)篩選到的10個(gè)蛋白質(zhì)進(jìn)行比對(duì),采用MEGA 4.1中的Neighbor-Joining算法,自檢舉1 000次,構(gòu)建了10個(gè)成員的系統(tǒng)進(jìn)化樹,結(jié)果如圖5所示。這10個(gè)成員可以分為2大類群,類群Ⅰ由6個(gè)成員組成,分別為Slo1、Slo2、Slo3、Slo4、Slo5、Slo6,類群Ⅱ由4個(gè)成員組成,分別為Slo7、Slo8、Slo9、Slo10。
2.5 相似性比對(duì)分析及保守區(qū)的獲得
利用在線程序ClustalW2進(jìn)行序列比對(duì),找到10個(gè)蓖麻油體固醇蛋白質(zhì)成員的保守區(qū)域。如圖6所示,活性位點(diǎn)和內(nèi)含子位置已在圖中標(biāo)出。預(yù)測(cè)1~40位為跨膜結(jié)構(gòu),40~190位為NADPH結(jié)合區(qū)域,190~210位為活性位點(diǎn)區(qū)域,210位以后為固醇結(jié)合區(qū)域。NADPH結(jié)合區(qū)域保守性較好。固醇結(jié)構(gòu)區(qū)域保守性不高,預(yù)測(cè)這些蛋白質(zhì)成員和不同的固醇結(jié)合從而發(fā)揮多種生物學(xué)功能。位于NADPH和固醇結(jié)合區(qū)域之間的序列包含了活性位點(diǎn)S-(12X)-Y-(3X)-K,其中Y和K兩個(gè)位點(diǎn)高度保守,而S位點(diǎn)不是很保守。其中在Slo1、Slo2、Slo3、Slo7、Slo10中S被A取代,在Slo8中S被Q取代,在Sol9中S被L取代。內(nèi)含子位點(diǎn)顯示了Slo1、Slo2、Slo3、Slo4、Slo5、Slo6剪接位點(diǎn)保守,Slo8、Slo9、Slo10剪切位點(diǎn)保守,而Slo7內(nèi)含子位點(diǎn)最復(fù)雜,與其他9個(gè)成員不同。
3 小結(jié)
本試驗(yàn)通過系統(tǒng)地分析蓖麻基因組數(shù)據(jù),共鑒定11個(gè)蓖麻油體固醇基因,其中10個(gè)具有完整的ORF,1個(gè)序列缺失。對(duì)10個(gè)蓖麻油體固醇蛋白質(zhì)的理化性質(zhì)、疏水性/親水性、跨膜結(jié)構(gòu)、二級(jí)結(jié)構(gòu)、三維結(jié)構(gòu)、進(jìn)化關(guān)系和相似性進(jìn)行了分析,發(fā)現(xiàn)蓖麻油體固醇蛋白質(zhì)外顯子的數(shù)目和內(nèi)含子的位點(diǎn)較保守;氨基酸殘基數(shù)、分子量和等電點(diǎn)相差不大;疏水性/親水性和跨膜結(jié)構(gòu)分析表明,成員間在N-末端第25個(gè)氨基酸位點(diǎn)有一個(gè)跨膜結(jié)構(gòu);主要由α螺旋、β折疊和無規(guī)則卷曲組成;三維結(jié)構(gòu)符合SDR超家族特點(diǎn);NADPH結(jié)合區(qū)域、活性位點(diǎn)較保守,膜錨定區(qū)域和固醇結(jié)合區(qū)域差異較大。
參考文獻(xiàn):
[1] DA SILVA N D L,MACIEL M R W,BATISTELLA C B,et al. Optimization of biodiesel production from castor oil[J]. Appl Biotechnol,2006,130(1-3):405-414.
[2] HUANG A H. Oleosin and oil bodies in seeds and other organs[J]. Plant Physiol,1996,110(4):1055-1061.
[3] MURPHY D J. The biogenesis and functions of lipid bodies in animals, plants and microorganisms[J]. Prog Lipid Res, 2001, 40(5): 325-438.
[4] NAPIER J A, STOBART A K, SHEWRY P R. The structure and biogenesis of plant oil bodies:The role of the ER membrane and the oleosin class of proteins[J]. Plant Mol Biol,1996, 31(5):945-956.
[5] 丁 勇,徐春雷,甘 莉.植物油體及其相關(guān)蛋白的研究進(jìn)展[J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào),2008,27(4):558-563.
[6] CHEN E C,TAI S S,PENG C C,et al. Identification of three novel unique proteins in seed oil bodies of sesame[J]. Plant Cell Physiol,1998,39(9):935-941.
[7] LIN L J, TZEN J T C. Two distinct steroleosins are present in seed oil bodies[J]. Plant Physiol Biochem,2004,42(7-8):601-608.
[8] VAN DER SCHOOT C, PAUL L K, PAUL S B, et al. Plant lipid bodies and cell-cell signaling: A new role for an old organelle[J]. Plant Signal Behav,2011,6(11):1732-1738.
[9] KAVANAGH K L,J?魻RNVALL H,PERSSON B,et al. The SDR superfamily:Functional and strural diversity within a family of metabolic and regulatory enzymes[J]. Cell Mol Life Sci,2008, 65(24):3895-3906.
[10] LIN L J, TAI S S, PENG C C, et al. Steroleosin, a sterol-binding dehydrogenase in seed oil bodies[J]. Plant Physilo, 2002,128(4):1200-1211.
[11] UMATE P. Comparative genomics of the lipid-body-membrane proteins oleosin, caleosin and steroleosin in magnoliophyte, lycophyte and bryophyte[J]. Genomics Proteomics Bioinformatics,2012,10(6):345-353.