, , ,2, ,2, ,2
重慶市科委項(xiàng)目(No.2015jcyA10017)和重慶市教委(No.KJ1400210)聯(lián)合資助
肺孢子菌肺炎[1],又稱卡氏肺孢子蟲(chóng)肺炎,卡氏肺囊蟲(chóng)肺炎,是由肺孢子菌引起的間質(zhì)性漿細(xì)胞性肺炎,為條件性肺部感染性疾病。本病20世紀(jì)50年代前僅見(jiàn)于早產(chǎn)兒,營(yíng)養(yǎng)不良嬰兒,近10年來(lái)隨著免疫抑制劑的應(yīng)用,腫瘤化療的普及尤其是HIV感染的出現(xiàn),發(fā)病率明顯上升,已成為HIV感染患者最常見(jiàn)的機(jī)會(huì)感染與致死的主要病因。肺孢子菌[2]主要定位在肺泡內(nèi),主要通過(guò)纖維連接蛋白等黏著蛋白被固著在肺泡巨噬細(xì)胞上。此外,菌體的一些抗原成分如主要表面糖蛋白(Major surface glycoprotein,MSG)[3]和P55同時(shí)激發(fā)宿主產(chǎn)生細(xì)胞免疫和體液免疫反應(yīng),產(chǎn)生包括α-腫瘤壞死因子、白細(xì)胞介素-2、調(diào)理素和特異性抗體等一系列細(xì)胞和體液因子,使菌體迅速被活化的巨噬細(xì)胞吞噬殺滅。但是在免疫功能缺陷的宿主體內(nèi),菌體卻能逃脫巨噬細(xì)胞的吞噬而不斷繁殖并充滿肺泡腔。如果能夠通過(guò)破壞纖維連接蛋白從而阻斷菌體侵入肺泡的橋梁,就可以為PCP的治療提供新的研究方向。蛇毒[4],其組成的蛋白質(zhì)中幾乎半數(shù)以上是具有各種催化活性的酶類(lèi),這些酶無(wú)論在生物化學(xué)研究上,還是在臨床應(yīng)用實(shí)踐中,都有其重要意義[5]。如果證明纖維連接蛋白結(jié)構(gòu)具有不穩(wěn)定性,就可以預(yù)測(cè)纖維連接蛋白很容易被破壞,然后探索纖維連接蛋白和膠原蛋白的空間結(jié)構(gòu)的相似性,就可以利用蛇毒中的膠原蛋白酶[6]來(lái)破壞纖維連接蛋白,從而阻斷纖維連接蛋白與肺孢子菌MSG(主要表面糖蛋白,Major surface glycoprotein)的結(jié)合,阻止肺孢子菌侵入肺泡。
1.1.1從GenBankTM(ftp://ncbi.nlm.nih.gov/genbank)中獲得蛋白質(zhì)序列
1.1.2用NCBI中的BLAST軟件進(jìn)行蛋白質(zhì)的序列比對(duì)
1.2.1用ProtParam(http://us.expasy.org/tools/protparam.html)預(yù)測(cè)纖維連接蛋白及膠原蛋白的分子量、等電點(diǎn)、氨基酸組成、穩(wěn)定指數(shù)等一系列理化特性
1.2.2用ProtScale(http://www.expasy.org/cgi-bin/protscale.pl)預(yù)測(cè)纖維連接蛋白的親水性/疏水性
1.2.3用BioEdit(http://www.mbio.ncsu.edu/BioEdit/BioEdit.html)分析纖維連接蛋白的親水性/疏水性
1.2.4用TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測(cè)纖維連接蛋白的跨膜結(jié)構(gòu)域
1.2.5用SignalP(http://www.cbs.dtu.dk/services/SignalP/)對(duì)纖維連接蛋白進(jìn)行信號(hào)肽的預(yù)測(cè)
1.2.6用TargetP(http://www.cbs.dtu.dk/services/TargetP/)預(yù)測(cè)纖維連接蛋白的亞細(xì)胞定位
1.3.1為準(zhǔn)確預(yù)測(cè)纖維連接蛋白和膠原蛋白的高級(jí)結(jié)構(gòu),利用 SWISS-MODEL(http://www.expasy.ch/swissmod/SWISS-MODEL.html/)和Verify3D,通過(guò)同源建模法對(duì)纖維連接蛋白和膠原蛋白進(jìn)行預(yù)測(cè),然后通過(guò)Verify3D進(jìn)行質(zhì)量評(píng)估
1.3.2采用expasy系統(tǒng)中的SMART軟件預(yù)測(cè)纖維連接蛋白和膠原蛋白的保守結(jié)構(gòu)域。
2.1纖維連接蛋白的序列查找結(jié)果 根據(jù)發(fā)現(xiàn)纖維結(jié)合素的文章所提供的提交在NCBI上的纖維連接蛋白序列號(hào)P02751從NCBI上調(diào)出該蛋白質(zhì)的序列,包含2 386個(gè)氨基酸。
2.2P02751蛋白的理化性質(zhì)分析 利用ProtParam工具分析P02751蛋白的理化性質(zhì)分析得知,P02751的蛋白分子量約為259 kDa,理論等電點(diǎn)PI為5.39,總共包括35 841個(gè)原子,分子式為C11351H17590N3169O3644S88。在組成P02751蛋白的20種氨基酸中,蘇氨酸所占的比例最高,達(dá)到10.8%,而甲硫氨酸所占的比例最低,為1.1%。P02751蛋白的不穩(wěn)定指數(shù)為40.56,脂肪指數(shù)為66.02。根據(jù)Guruprasad方法表明P02751蛋白不穩(wěn)定。
2.3P02751蛋白的疏水區(qū) 通過(guò)訪問(wèn)ExPAsy服務(wù)器,計(jì)算基于K-D法的蛋白質(zhì)疏水性,結(jié)果得知P02751蛋白有疏水區(qū)(圖1)。
圖1 ProtScale程序分析P02751蛋白的疏水性Fig.1 Analysis on the hydrophobicity of P02751 protein by ProtScale program
2.4P02751 蛋白的疏水性分析 使用生物信息學(xué)軟件BioEdit分析蛋白質(zhì)的疏水性,結(jié)果表明P02751蛋白在0-50位氨基酸之間有一個(gè)疏水區(qū),在2200-2300位氨基酸之間有一個(gè)親水區(qū),與ProtScale程序分析結(jié)果一致(圖2)。
圖2 利用BioEdit軟件分析P02751蛋白的疏水性Fig.2 Using BioEdit software to analyze the hydrophobicity of P02751 protein
2.5P02751蛋白的跨膜區(qū)分析 使用TMHMM對(duì)P02751蛋白進(jìn)行跨膜區(qū)分析,結(jié)果顯示P02751蛋白的1-2386位氨基酸全部位于細(xì)胞膜表面,表明該蛋白可能不是一個(gè)與細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)有關(guān)的膜受體蛋白,它發(fā)揮生物學(xué)功能的方式可能不是以信號(hào)轉(zhuǎn)導(dǎo)的方式。
2.6P02751 蛋白的信號(hào)肽預(yù)測(cè)結(jié)果及分析 使用SignalP3.0服務(wù)器對(duì)P02751蛋白進(jìn)行信號(hào)肽預(yù)測(cè),從結(jié)果中分析s平均值>0.5,則預(yù)測(cè)該蛋白為分泌蛋白,存在信號(hào)肽?;谏窠?jīng)網(wǎng)絡(luò)算法的結(jié)果表明,該蛋白具有信號(hào)肽序列,最可能的剪切位點(diǎn)位于第26-27位氨基酸之間,具體序列為MLRGPGPGLLLLAVQCLG,說(shuō)明P02751蛋白可能在跨膜運(yùn)輸中起信號(hào)識(shí)別作用,剪切位點(diǎn)在第26-27位氨基酸之間,表明成熟肽始于第26位氨基酸(圖3,表1)。
圖3 使用SignalP3.0軟件預(yù)測(cè)信號(hào)肽Fig.3 Using SignalP3.0 to predict signal peptide
2.7P02751蛋白的亞細(xì)胞定位預(yù)測(cè)結(jié)果及分析 通過(guò)TargetP對(duì)P02751蛋白的亞細(xì)胞定位進(jìn)行預(yù)測(cè),結(jié)果顯示目的蛋白P02751的分泌途徑為S型,即分泌通路,可靠性級(jí)別為2級(jí)(0.800>diff>0.600),與SignalP3.0服務(wù)器預(yù)測(cè)的結(jié)果一致(表2)。
表1 基于神經(jīng)網(wǎng)絡(luò)算法的SignalP預(yù)測(cè)結(jié)果
Tab.1 Prediction results of SignalP based on neural network algorithm
測(cè)量指標(biāo)位置計(jì)算值量值信號(hào)肽max. C270.303max. Y270.458max. S50.895mean S1-260.717 D1-260.5980.450YES
Name=sp_P02751_FINC_HUMAN;SP='YES' Cleavage site between pos. 26 and 27: TGA-SK D=0.598 D-cutoff=0.450;Networks=SignalP-noTM
表2 TargetP1.1Server亞細(xì)胞定位結(jié)果
Tab.2 TargetP1.1Server subcellular localization results
名稱 長(zhǎng)度線粒體導(dǎo)肽信號(hào)肽其他類(lèi)型可能定位可靠性級(jí)別sp_P02751_FINC_HUMAN 23860.1670.7970.034S2cutoff0.0000.0000.000
2.8P02751蛋白和Q99715蛋白的序列相似性比對(duì)結(jié)果 P02751蛋白質(zhì)在人類(lèi)基因組數(shù)據(jù)庫(kù)用Blastp命令、選擇Swissprot and TREMBL proteins(AA)數(shù)據(jù)庫(kù)進(jìn)行蛋白質(zhì)序列比對(duì),結(jié)果得出p02751蛋白和q99715蛋白的各個(gè)種屬均有不同程度的相似性,一致性在30%(表3)。
2.9Q99715蛋白的理化性質(zhì)分析 同樣對(duì)膠原蛋白(Q99715)進(jìn)行理化性質(zhì)分析,結(jié)果顯示膠原蛋白(Q99715)的分子質(zhì)量約為330 kDa、理論等電點(diǎn)pI為7.62,總共包括46 349個(gè)原子,分子式為C14662H23037N3975O4610S65;在組成Q99715蛋白的20種氨基酸中,甘氨酸所占的比例最高,為9.2%,半胱氨酸所占的比例最低,為0.7%;Q99715蛋白的不穩(wěn)定指數(shù)為32.52,脂肪指數(shù)為74.92,根據(jù)Guruprasad方法表明該蛋白穩(wěn)定。
2.10同源建模結(jié)果 同源建模結(jié)果及通過(guò)Verify 3D軟件對(duì)建模結(jié)果進(jìn)行質(zhì)量評(píng)估,得出p02751蛋白的質(zhì)量評(píng)估結(jié)果是89.95%,q99715蛋白的質(zhì)量評(píng)估結(jié)果是80.5%(在3D結(jié)構(gòu)中,至少80%的氨基酸的得分≥0.2分,建模結(jié)果屬于可信)。(圖4(1,2),圖5(1,2))。
2.11蛋白保守結(jié)構(gòu)域的預(yù)測(cè)結(jié)果 纖維連接蛋白和膠原蛋白的保守結(jié)構(gòu)域的預(yù)測(cè)結(jié)果及它們所屬蛋白家族,得出纖維連接蛋白和膠原蛋白的保守結(jié)構(gòu)域所屬家族同是Ensembl家族(圖6(1,2))。
表3 之間的相似性分析p02751蛋白和q99715蛋白
Tab.3 The similarity analysis between P02751 protein and Q99715 protein
類(lèi)型比對(duì)序列最大值序列總長(zhǎng)度所占百分比(%)期望值相似度登錄號(hào) Collagen alpha-1(xx)chain iso-form x5 [Homo sapiens]130307574e-2930XP011527242.1Collagen alpha-1(xx)chain precur-sor [Homo sapiens]129306574e-2930NP066933.2Collagen alpha-1(xx)chain iso-form x1 [Homo sapiens]129392568e-2930XP011527238.1Collagen alpha-1(xx)chain iso-form x2 [Homo sapiens]129395588e-2930XP011527239.1Collagen alpha-1(xx)chain iso-form x5 [Homo sapiens]129307574e-2930XP011527242.1Collagen alpha-1(xx)chain precur-sor [Homo sapiens]129306575e-2930NP065933.2Collagen alpha-1(xx)chain iso-form x2 [Homo sapiens]129395587e-2930XF011527239.1Collagen alpha-1(xx)chain iso-form x1 [Homo sapiens]129392567e-2930XF011527238.1Collagen alpha-1(xx)chain iso-form x4 [Homo sapiens]128392581e-2630XF011527241.1Collagen alpha-1(xx)chain iso-form x3 [Homo sapiens]128392591e-2830XF011527240.1
圖4(1) 纖維連接蛋白的三級(jí)結(jié)構(gòu)Fig.4(1) Three level structure of P02751 protein圖4(2) 纖維連接蛋白的同源性建模及質(zhì)量評(píng)價(jià)結(jié)果Fig.4(2) The results of homology modeling and quality evaluation of fibronectin圖5(1) 膠原蛋白的三級(jí)結(jié)構(gòu)Fig.5(1) Three level structure of Q99715 protein圖5(2) 膠原蛋白的同源性建模和質(zhì)量評(píng)價(jià)結(jié)果Fig.5(2) The results of collagen homology modeling and quality assessment
圖6(1) 纖維連接蛋白的保守結(jié)構(gòu)域圖Fig.6(1) Conserved domain of P02751 protein圖6(2) 膠原蛋白的保守結(jié)構(gòu)域圖Fig.6(2) Conserved domain of Q99715 protein
PCP是一種嚴(yán)重的機(jī)會(huì)感染性疾病, AIDS患者應(yīng)用磺胺甲惡唑/甲氧芐啶或噴他脒療程要長(zhǎng),為3周或更長(zhǎng)[7]。初期療效同非AIDS患者相似,但藥物副作用的發(fā)生率和嚴(yán)重性更明顯,復(fù)發(fā)率可高達(dá)50%[8]。目前,尚沒(méi)有研制出針對(duì)肺孢子菌的疫苗,也沒(méi)有研制出副作用較小的藥物,加之肺孢子菌在不同的生物體中的基因型有很大差異[9],如此一來(lái)對(duì)于研究靶向疫苗就成為難題了,由于該蟲(chóng)種的體外培養(yǎng)和獲取都有一定的難度,動(dòng)物模型的建立需要很長(zhǎng)的時(shí)間,最后的結(jié)果也不盡如人意,所以對(duì)于其治療手段的研究就出現(xiàn)了挑戰(zhàn)。
近年來(lái),隨著科學(xué)發(fā)展,國(guó)內(nèi)外蛇毒研究工作迅速興起,蛇毒應(yīng)用越來(lái)越廣,蛇毒的科學(xué)價(jià)值和經(jīng)濟(jì)價(jià)值逐步被認(rèn)識(shí)。例如磷酸二酯酶被用作核酸和核苷酸類(lèi)輔助因子結(jié)構(gòu)的分析[4];蛋白酶被用作蛋白質(zhì)和多肽一級(jí)結(jié)構(gòu)的測(cè)定,磷脂酶A2用作細(xì)胞膜結(jié)構(gòu)和功能的研究等[10]。膠原蛋白不被一般水解酶水解,而對(duì)動(dòng)物體內(nèi)的膠原蛋白酶(EC3,4,24)敏感。動(dòng)物體內(nèi)的膠原蛋白酶作用于膠原蛋白三螺旋體特殊部位,釋放出二種肽,分別稱為T(mén)cA和TcB,長(zhǎng)度分別為膠原蛋白單體的3/4和1/4。很早就有人懷疑蛇毒中也含有膠原蛋白酶,直到近些年才得以證實(shí)[11]。該酶和其他動(dòng)物膠原蛋白酶相似,作用于膠原蛋白螺旋區(qū)的特異部位,水解產(chǎn)生兩種肽,大小和其他動(dòng)物膠原蛋白酶水解的產(chǎn)物相似,只不過(guò)TcA分子量稍大而已,可能蛇毒膠原蛋白酶水解的部位更接近C端。它不能水解合成的蛋白酶底物TAME和A-TEE,這說(shuō)明它與胰蛋白酶、胰凝乳蛋白酶不同,而是一種特異的膠原蛋白酶[12],因此蛇毒的應(yīng)用就顯得更有意義了。但是蛇毒的獲取比較困難加上考慮到生態(tài)問(wèn)題,科學(xué)家不能大量捕殺蛇類(lèi)來(lái)做科學(xué)研究,那么通過(guò)生物信息學(xué)手段探索出哪些蛋白質(zhì)能夠被蛇毒成分中的哪些酶類(lèi)水解和破壞就顯得極其重要了。
生物信息學(xué)軟件分析[13]顯示纖維連接蛋白疏水區(qū)沒(méi)有親水區(qū)有典型優(yōu)勢(shì)。因?yàn)榘被岬氖杷南嗷プ饔肹14],在保持蛋白質(zhì)三級(jí)結(jié)構(gòu)的形成和穩(wěn)定性中起著重要作用,所以可以推測(cè)纖維連接蛋白結(jié)構(gòu)不夠穩(wěn)定[15]。而分析得知膠原蛋白屬于較穩(wěn)定蛋白,纖維連接蛋白(P02751)與膠原蛋白(Q99715)具有序列相似性,空間結(jié)構(gòu)具有相似性以及具有相似的保守結(jié)構(gòu)域,它們所屬的蛋白家族也具有相似性。纖維連接蛋白相對(duì)于膠原蛋白又較不穩(wěn)定,蛇毒中的膠原蛋白酶可以水解膠原蛋白,因此推測(cè)蛇毒中的膠原蛋白酶可以水解纖維連接蛋白,為PCP的研究提供了新的方向。纖維連接蛋白廣泛存在于動(dòng)物組織和組織液中,是一種高分子糖蛋白,具有多種生物學(xué)功能。纖維連接蛋白在進(jìn)化過(guò)程中保守性很強(qiáng),各種動(dòng)物體液中的纖維連接蛋白具有相近的結(jié)構(gòu)性質(zhì)和生物學(xué)功能,因而不同來(lái)源的纖維連接蛋白可以相互替代使用,這也給下一步探索肺孢子菌寄生在動(dòng)物和人體兩類(lèi)宿主內(nèi)的聯(lián)系和區(qū)別提供了新的線索。從另一個(gè)方面來(lái)研究,因?yàn)樯叨局羞€有一些細(xì)胞毒素,神經(jīng)毒素等可以對(duì)細(xì)胞等結(jié)構(gòu)進(jìn)行破壞,也可以作為肺孢子菌治療的研究熱點(diǎn),后續(xù)的研究需要各國(guó)科學(xué)家極力探索。