?
輻射松半胱氨酸蛋白酶OTUBAIN-like基因生物信息分析*
吳建忠
(黑龍江省農(nóng)業(yè)科學(xué)院 經(jīng)濟(jì)作物研究所,哈爾濱黑龍江150086)
摘要:利用生物基因組學(xué)數(shù)據(jù)庫,對輻射松半胱氨酸OTUBAIN-like基因進(jìn)行生物信息學(xué)分析,預(yù)測該基因編碼蛋白的理化性質(zhì)、序列特征、蛋白質(zhì)結(jié)構(gòu)與生物學(xué)功能。結(jié)果表明,輻射松半胱氨酸OTUBAIN-like基因編碼的蛋白質(zhì)含294個(gè)氨基酸,具有非跨膜結(jié)構(gòu),含保守的PeptidaseC65結(jié)構(gòu)域,預(yù)測其可能在蛋白質(zhì)的翻譯、合成及代謝中對脅迫應(yīng)答和免疫應(yīng)答等功能起關(guān)鍵性作用,本研究為輻射松半胱氨酸蛋白酶的OTUBAIN-like基因功能深入研究奠定基礎(chǔ)。
關(guān)鍵詞:輻射松;半胱氨酸蛋白酶;生物信息學(xué)
半胱氨酸蛋白酶是一種蛋白水解酶,一般通過特定的抑制劑來鑒定其活化位點(diǎn),而硫醇化合物可使之活化[1]。植物中半胱氨酸蛋白酶大多屬于papain(木瓜蛋白酶)(C1)、legumain(豆類天冬氨酸蛋白內(nèi)切酶)(C13)、caspase(天冬氨酸特異性的半胱氨酸蛋白酶)(C14)和calpain(鈣依賴半胱氨酸蛋白內(nèi)切酶)(C2)家族[2]。研究發(fā)現(xiàn)了催化蛋白去泛素化的類蛋白酶和蛋白酶體[3~4]。泛素-蛋白酶體系統(tǒng)與蛋白質(zhì)質(zhì)量控制、細(xì)胞周期、DNA修復(fù)、轉(zhuǎn)錄及免疫應(yīng)激等密切相關(guān),也與許多種疾病的發(fā)生相關(guān)[5]。輻射松(Pinusradiata)體細(xì)胞胚胎發(fā)生時(shí)期對半胱氨酸蛋白酶的研究表明,一種新型的OTUBAIN-like基因優(yōu)先表達(dá),這是首次發(fā)現(xiàn)在高等植物中參與泛素途徑的prOTUBAINS家族成員[6]。本研究基于NCBI上公布的輻射松半胱氨酸蛋白酶OTUBAIN-like基因(GenBank:EF405823),進(jìn)行該基因及其編碼蛋白質(zhì)進(jìn)行了一系列的生物信息學(xué)分析,以期為半胱氨酸蛋白酶的深入研究奠定基礎(chǔ)。
1材料與方法
1.1序列來源
輻射松半胱氨酸蛋白酶OTUBAIN-like基因(EF405823)來源與NCBI網(wǎng)站的GenBank數(shù)據(jù)庫,GI號為148362048。
1.2研究方法
氨基酸序列分析通過NCBI數(shù)據(jù)庫找到輻射松半胱氨酸蛋白酶類泛素基因的mRNA完整編碼序列,用在線分析數(shù)據(jù)庫ORF Finder進(jìn)行基因開放讀碼框與其編碼氨基酸序列分析[7]。
蛋白質(zhì)基本信息分析利用ProtParam工具分析蛋白質(zhì)的基本信息[8],登錄網(wǎng)站http://www.expasy.org/tools/pi_tool推測蛋白質(zhì)的分子量和理論等電點(diǎn),ProtScale工具進(jìn)行蛋白質(zhì)疏水性/親水性分析[9],蛋白質(zhì)保守結(jié)構(gòu)域通過CDD分析獲得[10],信號肽預(yù)測通過SignalP在線分析獲得[11],跨膜區(qū)預(yù)測利用TMHMM方法在線分析[12],亞細(xì)胞定位通過TargetP分析[13],利用在線分析軟件SOPMA預(yù)測蛋白的二級結(jié)構(gòu)[14]。
蛋白功能預(yù)測在線軟件ProtFun進(jìn)行蛋白功能預(yù)測[15],采用BlastP在線軟件進(jìn)行蛋白的序列同源性分析[16]。
2結(jié)果與分析
2.1基因開放閱讀框分析
開放閱讀框(Open reading frame,ORF)是基因序列的一部分,可能是蛋白質(zhì)編碼序列的部分,包含一段可以編碼蛋白的堿基序列,不能被終止子打斷。ORF的識別是證明一個(gè)新的DNA序列為特定的蛋白質(zhì)編碼基因的部分或全部的先決條件[17]。
輻射松半胱氨酸蛋白酶OTUBAIN-like基因全長1 238 bp(base pairs)(圖1),單鏈分子量為374 364.00 D(Daltons),雙鏈分子量為751 223.00 D(Daltons),GC含量為43.38 %,AT含量為56.62 %,核苷酸數(shù)量及比例情況(表1)。該基因5’UTR長為125 bp,含15 bp的帽子結(jié)構(gòu),3’UTR長為227 bp,具有polyA尾,表明該基因結(jié)構(gòu)完整。通過數(shù)據(jù)庫ORF Finder分析發(fā)現(xiàn),該基因起始密碼子位于126 bp,終止密碼子位于1 008 bp,編碼294個(gè)氨基酸殘基組成的蛋白質(zhì)。
圖1 輻射松半胱氨酸蛋白酶類泛素基因全長及編碼蛋白質(zhì)序列
核苷酸數(shù)量比例/%A35929.00C23218.74G30524.64T34227.63
2.2基因編碼蛋白的理化性質(zhì)
蛋白質(zhì)的基本性質(zhì)包括其相對分子質(zhì)量、氨基酸組成、分子式和理論等電點(diǎn)等[18]。經(jīng)BLAST序列比對,得到輻射松半胱氨酸蛋白酶OTUBAIN-like蛋白序列(Query ID:ABQ59604)(圖1),利用ProtParam工具進(jìn)行其基本理化性質(zhì)分析,氨基酸和原子組成情況分別見表2和表3,氨基酸數(shù)目最多的是谷氨酸(Glu)和纈氨酸Val,分別占9.2 %和8.5 %,分子式為C1484H2299N383O458S12,294個(gè)氨基酸的相對分子量為33 218.59 D,消光系數(shù)在280 nm時(shí)為22 265,其不穩(wěn)定指數(shù)為45.46,表明該蛋白穩(wěn)定性一般,脂肪系數(shù)為91.77,總平均親水性為-0.115,說明該蛋白的疏水性較弱。負(fù)電荷殘基(Asp+Glu)總數(shù)為51,正電荷殘基(Arg+Lys)總數(shù)為29,經(jīng)等電點(diǎn)預(yù)測(http://cn.expasy.org/tools/pi_tool.html)顯示其理論等電點(diǎn)為4.65。
表2 氨基酸組成
表3 原子組成
圖2 蛋白序列的ProtScale分析
2.3基因編碼蛋白疏水性/親水性預(yù)測及分析
氨基酸側(cè)鏈的疏水性以各氨基酸減去甘氨酸疏水性之值來表示,蛋白質(zhì)的疏水性在保持蛋白質(zhì)三級結(jié)構(gòu)的形成和穩(wěn)定中起著重要作用[19]。利用在線分析軟件ProtScale工具進(jìn)行該OTUBAIN-like蛋白的疏水性預(yù)測分析(圖2),說明該蛋白疏水區(qū)域和親水區(qū)域均等,很難預(yù)測該蛋白的疏水性,因此結(jié)合其脂肪系數(shù)總平均親水性,可以判定該蛋白疏水區(qū)域和親水區(qū)域均等分布,進(jìn)一步表明該蛋白穩(wěn)定性一般。
2.4基因編碼蛋白結(jié)構(gòu)域預(yù)測及分析
通過CDD分析蛋白質(zhì)保守結(jié)構(gòu)域,發(fā)現(xiàn)從34到288氨基酸之間含有保守的Peptidase_C65結(jié)構(gòu)域(圖3),經(jīng)Cn3D macromolecular structure viewer進(jìn)行保守結(jié)構(gòu)域模型分(圖4),圖中A、B、C和D分別為蛋白質(zhì)Wire、Space Fill、Worms和Ball and Stick模型結(jié)構(gòu)。將OTUBAIN-like蛋白用TMHMM 2.0分析得知,該蛋白不含跨膜結(jié)構(gòu)域,表明該蛋白是非跨膜蛋白。
圖3 蛋白的保守結(jié)構(gòu)域
圖4 蛋白質(zhì)的保守結(jié)構(gòu)域模型
圖5 OTUBAIN-like蛋白的TargetP分析
2.5基因編碼蛋白亞細(xì)胞定位
為確定OTUBAIN-like基因編碼蛋白的亞細(xì)胞定位情況,采用在線軟件TargetP分析結(jié)果(圖5),表明該蛋白既不是葉綠體轉(zhuǎn)運(yùn)肽,也不是線粒體靶向肽,預(yù)測有可能是分泌通路信號肽和其他信號蛋白。利用在線軟件SignalP 4.1 Server對該OTUBAIN-like蛋白進(jìn)行信號肽結(jié)構(gòu)預(yù)測分析,發(fā)現(xiàn)該蛋白不具有信號肽結(jié)構(gòu),推測其不是分泌通路信號肽。
2.6基因編碼蛋白二級結(jié)構(gòu)預(yù)測
對輻射松半胱氨酸蛋白酶OTUBAIN-like基因編碼蛋白二級結(jié)構(gòu)的分析將為進(jìn)一步深入了解其生物學(xué)結(jié)構(gòu)及功能奠定基礎(chǔ),蛋白質(zhì)二級結(jié)構(gòu)主要是指多肽鏈依賴氫鍵排列的具有周期性結(jié)構(gòu)的構(gòu)象,對其進(jìn)行預(yù)測和分析將有助于認(rèn)識蛋白的空間結(jié)構(gòu),采用SOPMA分析軟件預(yù)測輻射松半胱氨酸蛋白酶OTUBAIN-like基因編碼蛋白的二級結(jié)構(gòu)(圖6,表4),該蛋白由44.22 %α-螺旋(Helix),14.29 %延伸鏈(Strand),8.84 %β-折疊(Turn),32.65 %無規(guī)則卷曲(Coil)組成。由此可推測,α-螺旋和無規(guī)則卷曲是該蛋白主要的蛋白質(zhì)二級結(jié)構(gòu)元件,部分的延伸鏈和β-折疊則散布于整個(gè)蛋白質(zhì)中。
圖6 蛋白質(zhì)二級結(jié)構(gòu)預(yù)測示意圖
二級結(jié)構(gòu)數(shù)量比例/%α-螺旋(Alphahelix-Hh)13044.22延伸鏈(Extendedstrand-Ee)4214.29β-折疊(Betaturn-Tt)268.84無規(guī)則卷曲(Randomcoil-Cc)9632.65
2.7基因編碼蛋白功能預(yù)測與分析
利用在線軟件ProtFun 2.2 server進(jìn)行輻射松半胱氨酸蛋白酶OTUBAIN-like基因編碼蛋白功能預(yù)測(表5),該蛋白具有蛋白質(zhì)翻譯、脂肪酸代謝、生物合成輔酶因子、嘌呤與嘧啶和能量代謝功能的可能性分別為3.254、2.690、2.144、1.601和1.561,因此預(yù)測該蛋白可能蛋白質(zhì)翻譯、生物合成及代謝過程中有重要作用,結(jié)合其在GO功能分析的結(jié)果(圖7)顯示,輻射松半胱氨酸蛋白酶OTUBAIN-like基因編碼蛋白可能在蛋白質(zhì)的翻譯、合成及代謝中其脅迫應(yīng)答和免疫應(yīng)答功能起關(guān)鍵性作用。
2.8基因編碼蛋白序列同源性分析
經(jīng)BlastP在線進(jìn)行蛋白質(zhì)的序列同源比對(圖8),輻射松半胱氨酸蛋白酶OTUBAIN-like基因編碼蛋白(ABQ59604)與北美云杉(Piceaspp.)的一個(gè)未知功能蛋白(ABK21173)序列結(jié)構(gòu)同源性最高,相似性高達(dá)98 %,與蓮花(Nelumbonucifera)泛素硫酯酶OTUBAIN-like異構(gòu)體X1(XP_010250517)及海棗(Phoenixdactylifera)泛素硫酯酶OTUBAIN-like同源性都較高,相似性分別達(dá)85 %和81 %。
表5 輻射松半胱氨酸蛋白酶OTUBAIN-like基因
圖7 輻射松半胱氨酸蛋白酶OTUBAIN-like基因編碼蛋白GO功能分類
圖8 氨基酸序列保守結(jié)構(gòu)同源分析
3結(jié)論與討論
半胱氨酸蛋白酶是植物中一類重要的蛋白酶家族。目前,在中華獼猴桃(Actinidiachinensis)果實(shí)[20]、大麥(Hordeumvulgare)種子[21]、豇豆(Vignaunguiculata)子葉[22]、豌豆(Pisumsatium)種子[23]及甘薯(Ipomoeabatatas)[24]等作物中均分離到了相關(guān)的半胱氨酸蛋白酶家族成員。研究顯示半胱氨酸蛋白酶的富集不僅出現(xiàn)在干旱[25~26]、鹽脅迫[23]等環(huán)境脅迫條件下,還與植物的細(xì)胞程序化死亡[27~28]、器官分化及木質(zhì)部發(fā)生或分化[29]存在一定的聯(lián)系,但半胱氨酸蛋白酶在植物響應(yīng)非生物及生物脅迫、器官分化及衰老的過程中所發(fā)揮的功能和作用機(jī)制尚未得到詳盡的簡析。本研究通過輻射松半胱氨酸蛋白酶OTUBAIN-like基因生物信息學(xué)分析,該基因含1 238 bp,結(jié)構(gòu)完整,編碼由249個(gè)氨基酸殘基組成的蛋白,含20種氨基酸,分子量為33 218.59 D,理論等電點(diǎn)PI為4.65,疏水性較弱,穩(wěn)定性一般,分子式為C1484H2299N383O458S12,含有保守的Peptidase_C65結(jié)構(gòu)域,不含跨膜結(jié)構(gòu),不具有葉綠體轉(zhuǎn)運(yùn)肽、線粒體靶向肽及分泌通路信號肽的亞細(xì)胞定位結(jié)構(gòu),經(jīng)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測分析,α-螺旋和無規(guī)則卷曲是該蛋白主要的蛋白質(zhì)二級結(jié)構(gòu)元件,部分的延伸鏈和β-轉(zhuǎn)角則散布于整個(gè)蛋白質(zhì)中,預(yù)測其可能在蛋白質(zhì)的翻譯、合成及代謝中其脅迫應(yīng)答和免疫應(yīng)答功能起關(guān)鍵性作用,因此,推斷該蛋白酶可能作為一種轉(zhuǎn)錄因子調(diào)節(jié)相關(guān)基因的表達(dá)。本研究將為輻射松半胱氨酸蛋白酶OTUBAIN-like基因功能的深層次挖掘研究奠定基礎(chǔ)。
參考文獻(xiàn):
[1]閆龍鳳,楊青川,韓建國,等.植物半胱氨酸蛋白酶研究進(jìn)展[J].草業(yè)學(xué)報(bào),2005,14(5):11-19.
[2]Jinq M C,Neil D R,Richard A E,etal.Identification of the active site of legumain links it to caspases,clostripain and gingipains in a new clan of cysteine endopeptidases[J].FEBS Letters,1998,441(3):361-365.
[3]Vierstra R D.The ubiquitin/26S proteasome pathway,the complex last chapter in the life of many plant proteins[J].Trends in Plant Science,2003,8(3):135-142.
[4]Basset G,Raymond P,Malek L,etal.Changes in the expression and the enzymic properties of the 20S proteasome in sugarstarved maize roots,evidence for an in vivo oxidation of the proteasome[J].Plant Physiology,2002,128(3):1149-1162.
[5]李思濱,劉英,祖元?jiǎng)?半胱氨酸蛋白酶在植物細(xì)胞程序性死亡中的作用[J].植物生理學(xué)通訊,2008,44(2):345-349.
[6]Gutierrez F,Medina C,Aquea F,etal.A novel Otubain-like cysteine protease gene is preferentially expressed during somatic embryogenesis in Pinus radiate[J].Mol Biol Rep,2008,35(4):567-573.
[7]Rombel I T,Sykes K F,Rayner S,etal.ORF-FINDER:a vector for high-throughput gene identification[J].Gene,2002,282(1):33-41.
[8]Stockinger H,Altenhoff A.M,Arnold K,etal.Fifteen years SIB Swiss Institute of Bioinformatics:life science databases,tools and support[J].Nucleic Acids Res,2014,42(W1):436-441.
[9]Linding R,Russell R B,Neduva V,etal.GlobPlot:exploring protein sequences for globularity and disorder[J].Nucleic acids research,2003,31(13):3701-3708.
[10]Marchler-Bauer A,Lu S,Anderson J B,etal.CDD:a Conserved Domain Database for the functional annotation of proteins[J].Nucleic acids research,2011,39(suppl 1):225-229.
[11]Petersen T N,Brunak S,von Heijne G,etal.SignalP 4.0:discriminating signal peptides from transmembrane regions[J].Nature methods,2011,8(10):785-786.
[12]Tusnady G E,Simon I.The HMMTOP transmembrane topology prediction server[J].Bioinformatics,2001,17(9):849-850.
[13]Emanuelsson O,Brunak S,von Heijne G,etal.Locating proteins in the cell using TargetP,SignalP and related tools[J].Nature protocols,2007,2(4):953-971.
[14]Geourjon C,Deleage G.SOPMA.significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J].Computer applications in the biosciences,CABIOS,1995,11(6):681-684.
[15]Sommer I,Rahnenführer J,Domingues F S,etal.Predicting protein structure classes from function predictions[J].Bioinformatics,2004,20(5):770-776.
[16]Lavigne R,Seto D,Mahadevan P,etal.Unifying classical and molecular taxonomic classification:analysis of the Podoviridae using BLASTP-based tools[J].Research in microbiology,2008,159(5):406-414.
[17]Vieira P,de Waal-Malefyt R,Dang M N,etal.Isolation and expression of human cytokine synthesis inhibitory factor cDNA clones:homology to Epstein-Barr virus open reading frame BCRFI [J].Proceedings of the National Academy of Sciences,1991,88(4):1172-1176.
[18]蔣彥.基礎(chǔ)生物信息學(xué)及應(yīng)用[M].北京:清華大學(xué)出版社,2003:150-160.
[19]黃曼,卞科.蛋白質(zhì)疏水性測定方法研究進(jìn)展[J].糧油食品科技,2004,12(02):31-32.
[20]Carne A,Moore C H.The amino acid sequence of the tryptic peptide from actinidin,a proteolytic enzyme from the fruit of Actinidia chinesis[J].Biochemical Journal,1978,173:73-83.
[21]Rogers J C,Dean D,Heck G R.Aleurain:a barley thiol protease closely related to mammalian cathepsin H[J].Proceedings of the National Academy of Science of the United States of America,1985,82(19):6512-6516.
[22]Akasofu H,Yamauchi D,Minamikawa T.Nucleotide sequence of the gene for the Vigna mungosulfhydryl-endopeptidase (SH-EP) [J].Nucleic Acids Research,1990,18 (7):1892.
[23]Jennifer T J,John E M.A salt-and dehydration-inducible pea gene,Cyp15a,encodes a cell-wall protein with sequence similarity to cysteine protease[J].Plant Molecular Biology,1995,28:1055-1065.
[下轉(zhuǎn)第12頁]
Bioinformatics Analysis of Cysteine Protease TUBAIN-like Gene
in Pinus radiata
WU Jian-zhong
(Institute of Industrial Crops,Heilongjiang Academy of Agricultural Sciences,Harbin Heilongjiang 150086 P.R.China)
Abstract:To forecast the physical and chemical properties, sequence characteristics,structure and biological function of the gene encoding protein,bioinformatics analysis of Cysteine Protease OTUBAIN-like gene in Pinus radiata with genomics database was conducted.The results showed that the protein encoded by the Pinus radiata Cysteine Protease OTUBAIN-like gene contains 294 amino acids,and it has the conservative PeptidaseC65 domain but no cross membrane structure.This study may play a critical role in protein synthesis and metabolism on stress response and immune response function.
Key words:Pinus radiata;OTUBAIN-like;bioinformatics
中圖分類號:S 792.252
文獻(xiàn)標(biāo)識碼:A
文章編號:1672-8246(2015)05-0001-08
作者簡介:吳建忠(1983-),男,助理研究員,博士生,主要從事亞麻遺傳育種及基因組學(xué)研究。E-mail:wujianzhong176@163.com
基金項(xiàng)目:哈爾濱市科技創(chuàng)新工程青年基金(2013RFQYJ010) 。
收稿日期:*2015-03-27
doi10.16473/j.cnki.xblykx1972.2015.05.001