郭剛,田夢(mèng)瀟,焦紅杰,李軍,張文寶
1.新疆醫(yī)科大學(xué)第一附屬醫(yī)院臨床醫(yī)學(xué)研究院中亞高發(fā)病成因與防治國(guó)家重點(diǎn)實(shí)驗(yàn)室,新疆 烏魯木齊 830054;2.新疆醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院,新疆 烏魯木齊 830054;3.新疆醫(yī)科大學(xué)兒科學(xué)院,新疆 烏魯木齊 830054
棘球蚴病又稱包蟲病,是人感染棘球絳蟲幼蟲(棘球蚴)所致寄生蟲病,該病是一種嚴(yán)重的人畜共患疾病,呈全球性分布,嚴(yán)重威脅公共衛(wèi)生安全。家犬食入細(xì)粒棘球蚴感染病畜內(nèi)臟及狐貍等野生動(dòng)物食入泡球蚴感染小型野生嚙齒類中間宿主動(dòng)物,排出蟲卵成為傳染源,會(huì)分別導(dǎo)致人感染囊型包蟲?。╟ystic echinococcosis,CE)和泡型包蟲病(alveolar echinococcosis,AE),病原分別為細(xì)粒棘球絳蟲(Echinococcus granulosus,Eg)和多房棘球絳蟲(Echinococcus multilocularis,Em)[1]。目前棘球蚴病在預(yù)防、診斷、治療方面均存在一定難度。在預(yù)防方面,通過研制終末宿主疫苗阻斷傳播循環(huán)鏈尚處于探索階段,如何確定特異蛋白阻止幼蟲入侵宿主腸道和蟲體發(fā)育是研究的一個(gè)思路[2-3];在診斷方面,尚缺乏敏感度和特異度均較高的穩(wěn)定診斷抗原[4];在治療方面,尤其是泡球蚴感染中晚期病灶呈癌性生長(zhǎng),為手術(shù)根治帶來較大難度,借助免疫學(xué)手段通過抑制炎癥實(shí)現(xiàn)病灶向良性囊型轉(zhuǎn)變,再結(jié)合手術(shù)是未來一段時(shí)間內(nèi)的治療方向[1]。上述問題的解決,均可通過篩選特異抗原,利用基因重組技術(shù)制備蛋白來尋找突破口。
絲氨酸蛋白酶抑制劑(serine protease inhibitor,簡(jiǎn)稱Serpin)是一類結(jié)構(gòu)保守的酶活性調(diào)節(jié)劑,屬于絲氨酸蛋白酶抑制劑超家族。經(jīng)典的Serpin蛋白相對(duì)分子質(zhì)量為40 000~100 000,廣泛存在于多種生物體內(nèi),是參與免疫調(diào)節(jié)和其他生物學(xué)通路的重要因子[5]。Serpin蛋白在寄生性蠕蟲中也廣泛存在,由于Serpin發(fā)揮的重要作用,近年來對(duì)有關(guān)寄生性蠕蟲Serpin的研究日益受到重視。其主要作用如下:通過抑制宿主絲氨酸蛋白酶活性,抵抗宿主蛋白水解酶對(duì)蟲體的降解作用,在寄生蟲入侵和寄生宿主過程中發(fā)揮關(guān)鍵作用;寄生蟲分泌Serpin通過調(diào)節(jié)宿主免疫應(yīng)答和炎性反應(yīng),對(duì)宿主機(jī)體產(chǎn)生致病損傷作用[6-7]。
我們?cè)谇捌谘芯恐蟹謩e對(duì)Eg和Em各自兩種Serpin基因完成了擴(kuò)增和測(cè)序,將有突變的序列上傳GenBank,分別命名為:Eg-SerpinA(基因注冊(cè)號(hào):MT547781,與已上傳的XM_024492374.1[8]同源性為99.73%)、Eg-SerpinB(基因注冊(cè)號(hào)與已上傳的KY438963.1[9]一致)、Em-SerpinA(基因注冊(cè)號(hào)與已上傳的AJ420237.1[10]一致)、Em-SerpinB(基因注冊(cè)號(hào):MT601850)。利用免疫組化和Western blot技術(shù)發(fā)現(xiàn)SerpinA在兩種棘球絳蟲原頭蚴和成蟲發(fā)育階段均高表達(dá),而SerpinB則僅在包囊階段的生發(fā)層高表達(dá)(待發(fā)表)。本研究利用生物信息學(xué)技術(shù)對(duì)來自兩種棘球絳蟲的SerpinA和SerpinB基因編碼區(qū)及編碼蛋白進(jìn)行系統(tǒng)和全面的比較,分析其理化性質(zhì)、結(jié)構(gòu)域、信號(hào)肽等生物學(xué)信息,對(duì)進(jìn)一步確定其生物學(xué)功能、研究其對(duì)宿主的致病作用及是否可成為棘球絳蟲感染診斷和預(yù)防疫苗靶蛋白等均具有重要意義。
1.1 基因信息分析 應(yīng)用NCBI-BLAST分析Eg和Em兩種Serpin的核苷酸和氨基酸同源性。
1.2 蛋白結(jié)構(gòu)及功能預(yù)測(cè) 用ExPasy-PortParam和ExPasy-ProtScale K-D法分別分析SerpinA和SerpinB蛋白基本理化性質(zhì)和親-疏水性;TMHMM 2.0 Server預(yù)測(cè)蛋白可溶性和跨膜區(qū);Signal 5.0 Server預(yù)測(cè)蛋白信號(hào)肽;PROSITE在線搜索蛋白motif位點(diǎn);Coils Server、SMART、ExPasy-SOMPA(PSIPRED Server,http://bioinf.cs.ucl.ac.uk/psipred/)及SWISS-MODEL分別預(yù)測(cè)蛋白卷曲螺旋結(jié)構(gòu)、功能域、二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu);ElliPro[11](http://tools.iedb.org/ellipro/)預(yù)測(cè)蛋白抗原表位。
2.1 基因信息 Eg-SerpinA基因編碼區(qū)由1 104個(gè)堿基組成,編碼367個(gè)氨基酸,Em-SerpinA基因編碼區(qū)由1 065個(gè)堿基組成,編碼354個(gè)氨基酸,其核苷酸和氨基酸序列同源性分別為94.02%和92.92%;Eg-SerpinB和Em-SerpinB基因編碼區(qū)均由228個(gè)堿基組成,編碼75個(gè)氨基酸,核苷酸和氨基酸序列同源性均為100%。其中Em-SerpinA和Em-SerpinB與Sanger網(wǎng)站公布的預(yù)測(cè)核酸序列進(jìn)行比對(duì),分別與注冊(cè)編號(hào)為EmuJ_001193100.1和EmuJ_00053-4800.1的序列一致。
2.2 蛋白質(zhì)結(jié)構(gòu)及功能預(yù)測(cè)
2.2.1 基本理化性質(zhì)和親疏水性 ExPasy-PortParam和ExPasy-ProtScale K-D法分析顯示,不同來源Serpin的基本性質(zhì)存在不同,其中Eg-SerpinA和Em-SerpinA為親水性蛋白,Eg(Em)-SerpinB為疏水性蛋白,見表1。
表1 兩種棘球絳蟲來源Serpin基本理化性質(zhì)Tab.1 Basic physical and chemical properties of serine proteases from two strains of Echinococcus
2.2.2 跨膜區(qū)預(yù)測(cè)析 TMHMM 2.0 Server預(yù)測(cè)結(jié)果顯示,Eg-SerpinA、Em-SerpinA、Eg-SerpinB、Em-SerpinB所有氨基酸序列均無跨膜結(jié)構(gòu),且均位于胞外,見圖1。
圖1 兩種棘球絳蟲來源Serpin跨膜區(qū)預(yù)測(cè)結(jié)果Fig.1 Prediction of transmembrane regions of Serpin from two strains of Echinococcus
2.2.3 信號(hào)肽預(yù)測(cè) Signal 5.0 Server預(yù)測(cè)結(jié)果顯示,信號(hào)肽可能性均大于0.5,Eg-SerpinA和Em-SerpinA均為分泌蛋白,存在信號(hào)肽序列,最可能的剪切位點(diǎn)均位于19和20位氨基酸之間;Eg-SerpinB和Em-SerpinB也均為分泌蛋白,存在信號(hào)肽序列,最可能的剪切位點(diǎn)均位于18和19位氨基酸之間。見圖2。
圖2 兩種棘球絳蟲來源Serpin信號(hào)肽預(yù)測(cè)結(jié)果Fig.2 Prediction of signal peptides of Serpin from two strains of Echinococcus
2.2.4 蛋白motif位置 PROSITE搜索結(jié)果顯示,Eg-SerpinA的第338~348位氨基酸序列與Em-SerpinA第325~335位氨基酸序列(FIVDHPFIFFI)相同,為絲氨酸蛋白酶抑制劑超家族標(biāo)記。Eg(Em)-SerpinB在51~69位氨基酸(FIYGGCG GNMNQFDSKEQC)為Kunitz型胰蛋白酶抑制劑家族標(biāo)記。
2.2.5 蛋白卷曲螺旋結(jié)構(gòu) Coils Server預(yù)測(cè)結(jié)果顯示,在3種窗口寬度下檢測(cè)到Eg-SerpinA和Em-SerpinA各自均含有1個(gè)卷曲螺旋結(jié)構(gòu),參與蛋白質(zhì)寡聚化功能。而Eg(Em)-SerpinB則不含有卷曲螺旋結(jié)構(gòu)。見圖3。
圖3 兩種棘球絳蟲來源Serpin卷曲螺旋結(jié)構(gòu)預(yù)測(cè)結(jié)果Fig.3 Prediction of coil structures of Serpin from two strains of Echinococcus
2.2.6 功能域分析 SMART預(yù)測(cè)結(jié)果顯示,Eg-SerpinA第2~364位氨基酸之間和Em-SerpinA第2~351氨基酸之間為高保守的絲氨酸蛋白酶抑制劑家族結(jié)構(gòu)域;Eg(Em)-SerpinB第21~74氨基酸之間為高保守的Kunitz型胰蛋白酶抑制劑家族結(jié)構(gòu)域。見圖4。
圖4 兩種棘球絳蟲來源Serpin結(jié)構(gòu)域分析結(jié)果Fig.4 Analysis of protein domains of Serpin from two strains of Echinococcus
2.2.7 蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè) ExPasy-SOMPA和PSIPRED Server兩種預(yù)測(cè)方法得到的二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果存在一定差異,見表2和圖5。
圖5 ExPasy-SOMPA和PSIPRED Server預(yù)測(cè)兩種棘球絳蟲來源Serpin結(jié)構(gòu)域二級(jí)結(jié)構(gòu)Fig.5 Prediction of secondary structures of serine proteases from two strains of Echinococcus with ExPasy-SOMPA and PSIPRED Server
表2 兩種棘球絳蟲來源Serpin二級(jí)結(jié)構(gòu)預(yù)測(cè)(%)T ab.2 Prediction of secondary structures of serine proteases from two strains of Echinococcus(%)
2.2.8 蛋白三級(jí)結(jié)構(gòu)預(yù)測(cè) SWISS-MODEL同源建模預(yù)測(cè)結(jié)果顯示,Eg和Em SerpinA三級(jí)預(yù)測(cè)結(jié)構(gòu)較接近,而與Eg(Em)-SerpinB存在較大不同,見圖6。
圖6 SWISS-MODEL法預(yù)測(cè)兩種棘球絳蟲來源Serpin蛋白三級(jí)結(jié)構(gòu)Fig.6 Prediction of tertiary structures of Serpin from two strains of Echinococcus by SWISS-MODEL
2.2.9 抗原表位預(yù)測(cè)
2.2.9.1 B細(xì)胞抗原表位 ElliPro B淋巴細(xì)胞抗原表位預(yù)測(cè)結(jié)果顯示,Eg-SerpinA和Em-SerpinA均含9個(gè)線性表位和8個(gè)構(gòu)象表位,共有的最佳線性表位候選區(qū)域?yàn)镽CMPAPPVDFFVDHPFIFFIVTKTG IPVFMGHVVHP(316~351);共有的最佳構(gòu)象表位為F334、I335、V336、T337、K338、T339、G340、I341、P342和V343。Eg(Em)-SerpinB含4個(gè)線性表位和3個(gè)構(gòu)象表位,最佳線性表位候選區(qū)域?yàn)镹QETGQ(42~47);最佳構(gòu)象表位為N42、E44、T45、G46和Q47。見圖7。
圖7 兩種棘球絳蟲來源Serpin蛋白最佳線性表位和構(gòu)象表位3D結(jié)構(gòu)Fig.7 3D structures of optimal linear epitope and conformational epitope of Serpin from two strains of Echinococcus
2.2.9.2 T細(xì)胞抗原表位 IEDB ElliPro分析顯示,Eg-SerpinA的T細(xì)胞最佳HLAⅠ類分子抗原表位為氨基酸SPLSVYSAL(2~10),Em-SerpinA的最佳HLAⅡ類分子抗原表位為氨基酸MPAPPVDFF(318~326);Eg(Em)-SerpinB的最佳HLAⅠ類分子抗原表位為氨基酸VVISYSEAR(11~19)。
目前根據(jù)活性位點(diǎn)氨基酸種類的不同將自然界蛋白酶抑制劑分為4大類:絲氨酸蛋白酶抑制劑[7]、天冬氨酸蛋白酶抑制劑[12]、巰基(半胱氨酸)蛋白酶抑制劑[13]和金屬蛋白酶抑制劑[14]。4類天然蛋白酶抑制劑寄生蟲均可表達(dá)且發(fā)揮生物學(xué)作用,其中尤以絲氨酸蛋白酶抑制劑在生物體內(nèi)一些重要生理活動(dòng)中發(fā)揮重要調(diào)控作用,從而受到人們關(guān)注。絲氨酸蛋白酶抑制劑超家族現(xiàn)有數(shù)百種Serpin,迄今超過80種具有不同構(gòu)象結(jié)構(gòu),依其序列、拓?fù)浣Y(jié)構(gòu)及功能相似性至少可分為18個(gè)非同源家族,但典型Serpin均具有3個(gè)β片層,8~9個(gè)α螺旋,且還有1個(gè)反應(yīng)活性環(huán)(reactive central loop,RCL),可與目的蛋白互補(bǔ)互相作用[5]。
寄生性蠕蟲分泌的Serpin在蟲體和宿主之間的相互作用中發(fā)揮重要調(diào)節(jié)作用。有研究發(fā)現(xiàn),曼氏血吸蟲分泌絲氨酸蛋白酶抑制劑SMKI-1完全阻斷了中性粒細(xì)胞彈性蛋白酶的活動(dòng)位點(diǎn),具有明顯抑制中性粒細(xì)胞殺死血吸蟲的能力[15]。國(guó)內(nèi)研究發(fā)現(xiàn),偽旋毛蟲絲氨酸蛋白酶抑制劑rTp-Serpin對(duì)小鼠肥大細(xì)胞糜蛋白酶、人中性粒細(xì)胞彈性蛋白酶和豬胰臟彈性蛋白酶均有明顯抑制作用,因此推測(cè)偽旋毛蟲通過自身Serpin來抵抗源自宿主腸道消化酶對(duì)其的損傷[16]。有研究還發(fā)現(xiàn)旋毛蟲3種有活性的Serpin[17]。在棘球絳蟲研究領(lǐng)域,國(guó)外有報(bào)道從Eg中分離出相對(duì)分子質(zhì)量?jī)H為12 000的絲氨酸蛋白酶抑制劑[18],該序列與α1-抗胰蛋白酶和已知多種Serpin序列存在同源性,能夠表現(xiàn)出對(duì)彈性蛋白酶活力的抑制能力,也能夠?qū)χ行粤<?xì)胞發(fā)揮一定的調(diào)控作用。有研究表達(dá)了與Eg有關(guān)的EgK-I和EgKI-2兩種Serpin,前者高表達(dá)于六鉤蚴和卵,后者高表達(dá)于成蟲,推測(cè)兩種Serpin通過抑制酶降解和促進(jìn)免疫逃避作用,可能促進(jìn)了Eg的寄生[18]。另外值得一提的是,新近開展的動(dòng)物體內(nèi)外試驗(yàn)發(fā)現(xiàn),原核表達(dá)EgK-I蛋白可通過干擾癌細(xì)胞周期和誘導(dǎo)癌細(xì)胞凋亡來發(fā)揮抗癌作用[19]。還有研究發(fā)現(xiàn),通過原核表達(dá)獲得的Em-Serpin具有抑制劑活性,并對(duì)哺乳動(dòng)物腸道內(nèi)包括胰蛋白酶和胰彈性蛋白酶等多種蛋白水解酶活性發(fā)揮抑制作用[20]。
本研究主要從生物信息學(xué)角度出發(fā),分析了兩種棘球絳蟲蛋白結(jié)構(gòu)及功能,結(jié)合前期試驗(yàn)結(jié)果推測(cè),SerpinA可能與蟲體腸道入侵及定居并進(jìn)一步發(fā)育有關(guān),而SerpinB可能與蟲體寄生中間宿主臟器致病灶形成有關(guān)。同時(shí)我們預(yù)測(cè)了Serpin的抗原表位,對(duì)進(jìn)一步研究棘球絳蟲Serpin的生物學(xué)功能具有重要意義。目前CE和AE的診斷、藥物治療及阻斷循環(huán)鏈疫苗研制等領(lǐng)域是人們關(guān)注的熱點(diǎn)和難點(diǎn)。從構(gòu)建Eg和Em蟲體不同發(fā)育時(shí)期特有表達(dá)的Serpin重組蛋白作為候選靶分子出發(fā),進(jìn)一步篩選抗原并探尋其生物學(xué)功能及應(yīng)用價(jià)值,將是未來防治棘球絳蟲感染疾病的一個(gè)重要方向。