吳 珊,周海金,徐廣賢*
(1. 西安市人民醫(yī)院(西安市第四醫(yī)院)檢驗(yàn)科,陜西 西安 710000;2. 廣東醫(yī)科大學(xué) 醫(yī)學(xué)技術(shù)學(xué)院醫(yī)學(xué)檢驗(yàn)系,廣東 東莞 523000)
結(jié)核病是機(jī)體感染結(jié)核分枝桿菌(Mycobacteriumtuberculosis,Mtb)后發(fā)生的一種慢性傳染病,嚴(yán)重危害人類健康,據(jù)2019年世界衛(wèi)生組織(WHO)統(tǒng)計(jì),全球估算結(jié)核病死亡數(shù)約為140×104個(gè),是單一病菌感染致死率最高的傳染病之一[1]。牛結(jié)核分枝桿菌引起的牛結(jié)核病是一種全年都可能發(fā)生的慢性人畜共患病,不僅影響牛的健康和農(nóng)場(chǎng)的經(jīng)濟(jì)效益, 還影響?zhàn)B牛人員的身體健康及牛奶、牛肉等相關(guān)食品的質(zhì)量安全[2]。結(jié)核病潛伏期較長(zhǎng),目前尚缺乏特效的治療方法。結(jié)核病的難以治療和根除障礙與Mtb在宿主細(xì)胞內(nèi)生活方式復(fù)雜多變密切有關(guān),因而探索Mtb病原體-宿主細(xì)胞之間的相互作用,對(duì)結(jié)核病的診療有重要指導(dǎo)作用。
自噬(Autophagy)是細(xì)胞內(nèi)的一種“自食(Self-eating)”現(xiàn)象,是普遍存在于真核細(xì)胞中的一種高度保守的代謝過程,也是細(xì)胞內(nèi)物質(zhì)降解的主要途徑[3]。泛素介導(dǎo)的異種吞噬是一種選擇性自噬,在宿主防御包括結(jié)核分枝桿菌(Mtb)在內(nèi)的細(xì)胞內(nèi)病原體中具有至關(guān)重要的作用[4]。然而,宿主泛素靶標(biāo)侵入微生物引發(fā)異種吞噬的確切機(jī)制仍不清楚。Chai等[5]研究發(fā)現(xiàn)泛素可以識(shí)別Mtb表面蛋白PE_PGRS29,這是一種以前未發(fā)現(xiàn)的泛素結(jié)合蛋白,含有真核生物樣泛素化相關(guān)(UBA)結(jié)構(gòu)域,UBA介導(dǎo)的泛素可與PE_PGRS29直接結(jié)合,隨后招募自噬受體p62將分枝桿菌遞送至LC3相關(guān)的自噬體,PE_PGRS29-泛素相互作用的破壞減弱了巨噬細(xì)胞中Mtb的異種吞噬清除,并增加了炎癥反應(yīng)升高小鼠的細(xì)菌負(fù)荷。作為新發(fā)現(xiàn)的泛素結(jié)合蛋白,其生物學(xué)功能及可能存在蛋白與蛋白之間相互作用的網(wǎng)絡(luò)尚未完全清楚。本試驗(yàn)采用生物信息學(xué)分析方法對(duì)PE_PGRS29蛋白的結(jié)構(gòu)和功能進(jìn)行預(yù)測(cè)分析[6-9],為進(jìn)一步了解泛素靶標(biāo)入侵微生物引發(fā)異種吞噬的作用和調(diào)節(jié)機(jī)制提供理論依據(jù),有助于更好的預(yù)防和控制結(jié)核病。
Mtb H37Rv株全基因組,從美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)GenBank數(shù)據(jù)庫獲取PE_PGRS29蛋白的基因序列及氨基酸序列等信息。PE_PGRS29蛋白的Gene ID為886556,基因組序列為NC_000962.3,蛋白序列為YP_177814.1。
1.2.1 PE_PGRS29基本信息及序列分析 在NCBI中獲取PE_PGRS29蛋白的基因序列,通過ORF Finder分析其開放閱讀框。
1.2.2 PE_PGRS29蛋白基本理化性質(zhì)分析 PE_PGRS29蛋白的理化特性如分子式、分子質(zhì)量、等電點(diǎn)、不穩(wěn)定指數(shù)等通過Expasy提供的在線軟件Protparam進(jìn)行預(yù)測(cè)分析。
1.2.3 PE_PGRS29蛋白的親疏水性、跨膜結(jié)構(gòu)、信號(hào)肽、結(jié)構(gòu)域及磷酸化位點(diǎn)分析 蛋白質(zhì)的折疊情況可由氨基酸的親疏水性來反映,疏水區(qū)可能出現(xiàn)潛在的跨膜結(jié)構(gòu)區(qū)[10]。蛋白的親疏水性和跨膜區(qū)域分別用ProtScale和TMHMM Server v.2.0在線分析軟件分析;利用信號(hào)肽服務(wù)器SignalP 4.0預(yù)測(cè)PE_PGRS29蛋白的信號(hào)肽的有無及數(shù)量;用NetPhos 3.1 Server預(yù)測(cè)蛋白的磷酸化位點(diǎn)。
1.2.4 PE_PGRS29蛋白二級(jí)結(jié)構(gòu)分析與三級(jí)結(jié)構(gòu)建模 用SOPMA預(yù)測(cè)分析PE_PGRS29蛋白的二級(jí)結(jié)構(gòu),然后在SWISS-MODEL軟件中輸入蛋白的氨基酸序列,建立PE_PGRS29蛋白的三級(jí)結(jié)構(gòu)模型。
1.2.5 PE_PGRS29蛋白的B細(xì)胞抗原表位分析 登錄IEDB網(wǎng)站,輸入該蛋白的氨基酸序列,通過 Karplus & Schulz分析柔韌性、Kolaskar8. Tongaonkar預(yù)測(cè)抗原性、Emini預(yù)測(cè)抗原表面可及性、Parker預(yù)測(cè)親水性及Chou & Fasman法預(yù)測(cè)氨基酸編碼蛋白質(zhì)的β轉(zhuǎn)角[8],聯(lián)合對(duì)B細(xì)胞抗原表位進(jìn)行分析。
1.2.6 PE_PGRS29蛋白的Th細(xì)胞抗原表位分析 通過SYFPEITHI和RANKPEP對(duì)PE_PGRS29抗原蛋白Th表位進(jìn)行綜合預(yù)測(cè)。進(jìn)入SYFPEITHI首頁,選擇HLA-DRE1*0101、0401、0701、0801、0901、1101、1501這7種HLA基因分型并選取得分>18分的氨基酸序列進(jìn)行輔助T細(xì)胞表位預(yù)測(cè)分析;進(jìn)入RANKPEP主頁,選擇SYFPEITHI所預(yù)測(cè)的HLA基因分型,找出紅色標(biāo)記的結(jié)果,確定SYFPEITHI和RANKPEP的綜合預(yù)測(cè)結(jié)果,篩選出分析結(jié)果均較好的輔助T細(xì)胞表位。
1.2.7 PE_PGRS29蛋白的細(xì)胞毒性T淋巴細(xì)胞抗原表位分析 通過SYFPEITHI、NetMHCpan對(duì)PE_PGRS29抗原蛋白的細(xì)胞毒性T淋巴細(xì)胞表位進(jìn)行綜合預(yù)測(cè)。
1.2.8 PE_PGRS29蛋白的相互作用網(wǎng)絡(luò) 與PE_PGRS29蛋白相互作用的其他蛋白信息使用STRING數(shù)據(jù)庫進(jìn)行檢索。
1.2.9 PE_PGRS29蛋白與人類蛋白同源性分析 使用EXPASY對(duì)PE_PGRS29蛋白氨基酸序列與人類蛋白的同源性進(jìn)行BLAST分析。
1.2.10 PE_PGRS29蛋白的同源性預(yù)測(cè)和進(jìn)化樹構(gòu)建 運(yùn)用在線 uniprot蛋白數(shù)據(jù)庫的Blast工具,將PE_PGRS29基因序列與同源性較高的核苷酸進(jìn)行比,并用MEGA-X軟件構(gòu)建進(jìn)化樹。
Rv1468c基因(ID:886556)位于Mtb(H37Rv)的全基因組(NC_000962.3)1 655 609~1 656 721區(qū)域,全長(zhǎng)1 113 bp。PE_PGRS29蛋白在NCBI GenBank數(shù)據(jù)庫中氨基酸序列的登錄號(hào)為YP_177814.1,由370個(gè)氨基酸構(gòu)成,包含18種氨基酸,其中以甘氨酸(34.6%)、丙氨酸(19.2%)、天冬氨酸(7.0%)、絲氨酸(5.7%)的組成比例較高。經(jīng)ORF Finder工具分析,PE_PGRS29蛋白含有5個(gè)開放閱讀框,最長(zhǎng)的一個(gè)開放閱讀框顯示PE_PGRS29基因被通讀,全長(zhǎng)1 113 bp(圖1)。
圖1 PE_PGRS29蛋白的開放閱讀框分析Fig.1 Open reading box analysis of the PE_PGRS29 protein
PE_PGRS29蛋白分子式為C1375H2111N431 O465S3,原子總數(shù)為4 385,相對(duì)分子質(zhì)量為322.1567×103,消光系數(shù)為9 970,280 nm處的吸光度為0.309,脂肪族氨基酸指數(shù)為66.81。PE_PGRS29蛋白帶負(fù)電荷的殘基(Asp+Glu)12個(gè),帶正電荷的殘基(Arg+Lys)5個(gè),其理論等電點(diǎn)pI為4.66。PE_PGRS29蛋白的不穩(wěn)定性指數(shù)為15.60,提示該蛋白為穩(wěn)定蛋白。
ProtScale預(yù)測(cè)PE_PGRS29蛋白為親水性蛋白,第331位氨基酸親水性得分最高為-1.533,第51為氨基酸疏水性得分最高為2.378(圖2)。PE_PGRS29蛋白信號(hào)肽的分析結(jié)果顯示(圖3),標(biāo)準(zhǔn)值D值為0.166,小于閾值0.450,C、S、Y評(píng)分均在閾值之下,推測(cè)PE_PGRS29蛋白無信號(hào)肽。應(yīng)用TMHMM分析該蛋白的跨膜結(jié)構(gòu)(圖4),其370個(gè)氨基酸殘基跨膜概率值均未突破閾值線(圖4粉色橫線),表明該蛋白1~370位氨基酸序列均屬于膜外側(cè)(outside),不存在跨膜螺旋(TMhelix),預(yù)測(cè)該蛋白位于Mtb細(xì)胞壁和細(xì)胞膜上。用NCBI數(shù)據(jù)庫BLAST軟件分析顯示(圖5),PE_PGRS29蛋白有1個(gè)結(jié)構(gòu)域,屬于PE蛋白超家族。用NetPhos 3.1 Server軟件分析顯示(圖6),PE_PGRS29蛋白含有10個(gè)絲氨酸磷酸化位點(diǎn),2個(gè)蘇氨酸磷酸化位點(diǎn)和1個(gè)酪氨酸磷酸化位點(diǎn)。
圖2 PE_PGRS29蛋白的親(疏)水性分析Fig. 2 Hydrophilic (hydrophobic) analysis ofPE_PGRS29 protein
圖3 PE_PGRS29蛋白信號(hào)肽預(yù)測(cè)Fig. 3 PE_PGRS29 protein signaling peptide prediction
圖4 TMHMM Server, v. 2.0預(yù)測(cè)PE_PGRS29蛋白跨膜螺旋Fig. 4 TMHMM Server, v. 2.0 predicts PE_PGRS29 protein transmembrane helix
圖5 NCBI BLAST預(yù)測(cè)PE_PGRS29蛋白結(jié)構(gòu)域Fig. 5 NCBI BLAST predicts the PE_PGRS29 protein domain
圖6 NetPhos 3.1 預(yù)測(cè)PE_PGRS29蛋白磷酸化位點(diǎn)Fig. 6 NetPhos 3.1 predicts the phosphorylation sites of the PE_PGRS29 protein
通過SOPMA預(yù)測(cè)PE_PGRS29蛋白的二級(jí)結(jié)構(gòu),α-螺旋(Hh)81個(gè),占21.89%;β-轉(zhuǎn)角 (Tt)39個(gè),占10.54%;β-折疊(Ee)81個(gè),占21.89%;無規(guī)則卷曲(Cc)169個(gè),占45.68%(圖7)。PE_PGRS29蛋白的三級(jí)結(jié)構(gòu)模型通過SWISS MODEL蛋白質(zhì)分析軟件進(jìn)行構(gòu)建,結(jié)果見圖8。
圖7 PE_PGRS29蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)A.二級(jí)結(jié)構(gòu)柱狀圖;B.二級(jí)結(jié)構(gòu)序列圖;C.二級(jí)結(jié)構(gòu)峰圖Fig. 7 Prediction of secondary structure of PE_PGRS29 proteinA. Bar chart of secondary structure; B. Secondary structure sequence diagram; C. Secondary structure peak map
圖8 PE_PGRS29蛋白三級(jí)結(jié)構(gòu)同源建模Fig. 8 Homologous modeling of the tertiarystructure of PE_PGRS29 protein
PE_PGRS29蛋白的B細(xì)胞抗原表位通過IDB軟件進(jìn)行預(yù)測(cè),柔韌性參數(shù)以基線1.018為參照,大于1.018的氨基酸區(qū)段柔韌性強(qiáng),柔韌性越強(qiáng)越有利與抗體結(jié)合,是易形成抗原表位的區(qū)域。另外,結(jié)合線性表位、β轉(zhuǎn)角、可塑性、表面可及性、親疏水性、抗原等6個(gè)方面(圖9)來篩選B細(xì)胞的抗原表位,結(jié)果見表1。
圖9 IEDB預(yù)測(cè)PE_PGRS29蛋白的B細(xì)胞表位A. 線性表位預(yù)測(cè); B. β轉(zhuǎn)角預(yù)測(cè); C. 可塑性預(yù)測(cè); D. 表面可及性預(yù)測(cè); E. 親疏水性預(yù)測(cè); F. 抗原預(yù)測(cè)Fig.9 Predicrion of B cell epitopes of Rv1733e protein in IEDBA. Linear epitope prediction; B. β-rotation angle prediction; C. Plasticity prediction;D. Surface accessibility prediction; E. Hydrophlicity prediction; F Antigenicity prediction
在線預(yù)測(cè)PE_PGRS29蛋白的限制性Th細(xì)胞表位,其中HLA-DRBI*0101、HLA-DRB1*0401表型具有最多的表位;潛在的限制性Th細(xì)胞抗原表位結(jié)果見表2。對(duì)該2種方法預(yù)測(cè)分值較高的表位作進(jìn)一步統(tǒng)計(jì)分析,DRBl*0801和DRBl*0901表型的表位數(shù)量少。在分析 SYFPEITH和 RANKPEI的預(yù)測(cè)結(jié)果后,對(duì)于某個(gè)表型分值均較高的氨基酸序列進(jìn)行篩選,以作為候選Th表位,結(jié)果見表3。HLA-DRB*0101、0401亞型的共同表位分布在59~66位,HLADRBl*0101、0401和1101亞型的共同表位分布在59~62位。
表1 PE_PGRS29蛋白B細(xì)胞抗原表位預(yù)測(cè)結(jié)果Table 1 Epitope prediction of PE_PGRS29 protein B cell
表2 不同軟件預(yù)測(cè)的PE_PGRS29蛋白Th細(xì)胞表位信息Table 2 Epitope information of PE_PGRS29 protein Th cell predicted by different software
表3 PE_PGRS29蛋白Th細(xì)胞表位綜合分析Table 3 Comprehensive analysis of Th cell epitopes of PE_PGRS29 protein
限制性CTL表位HLA-A2、HLA-A3和HLA-B7的預(yù)測(cè)結(jié)果見表4。HLA表型進(jìn)行預(yù)測(cè)的分值較高的潛在CTL表位數(shù)目及選擇出每一種表型分值均較高的多肽序列,可成為CTL候選表位,其結(jié)果見表5。
表4 不同軟件預(yù)測(cè)的PE_PGRS29蛋白CTL細(xì)胞表位信息Table 4 Cell epitope information of PE_PGRS29 protein predicted
表5 PE_PGRS29蛋白CTL表位綜合分析Table 5 Comprehensive analysis of PE_PGRS29 protein CTL epitopes
經(jīng)STRING數(shù)據(jù)庫預(yù)測(cè)PE_PGRS29蛋白與ctpD(可能輸出鈷/鎳的p型ATP酶;參與重金屬穩(wěn)態(tài),屬于陽離子轉(zhuǎn)運(yùn)ATP酶)、Rv1745c、fadE15(?;o酶a脫氫酶)、mmpS1、Rv3096(假設(shè)蛋白質(zhì))、trxB1(硫氧還原蛋白)、Rv1682、Rv3732和trxA等蛋白發(fā)生相互作用(圖10)。
圖10 PE_PGRS29蛋白的相互作用網(wǎng)絡(luò)Fig.10 The interaction network of PE_PGRS29 protein
經(jīng)氨基酸序列比對(duì),結(jié)核分枝桿菌(M.H37Ra)、結(jié)核分枝桿菌(M.H37Rv)、減毒牛型結(jié)核桿菌(M. bovis BCG)、結(jié)核分枝桿菌變種??ń槊?M.variant bovis BCG )、orygis 分枝桿菌(M. orygis)、卡內(nèi)蒂分枝桿菌(M. canettii)、變種非洲K85結(jié)核分枝桿菌(M. tuberculosis variant africanum K85)、變種鰭足類結(jié)核分枝桿菌(M. tuberculosis variant pinnipedii)、decipiens分枝桿菌(M. decipiens)的序列覆蓋區(qū)域分別是100%、100%、100%、100%、100%、99.7%、99.6%、99.5%、72.6%。PE_PGRS29蛋白與以上物種的氨基酸序列相似度較高(圖11)。用MEGA-X軟件構(gòu)建系統(tǒng)進(jìn)化樹,PE_PGRS29蛋白在結(jié)核分支桿菌屬同源性較高(圖12)。
圖11 PE_PGRS29多序列比對(duì)分析Fig.11 Sequence alignment of PE_PGRS29
圖12 PE_PGRS29進(jìn)化樹Fig.12 Evolutionary tree of PE_PGRS29
1998年,法國(guó)Pasteur和英國(guó)Sanger研究所對(duì)結(jié)核分枝桿菌進(jìn)行了全基因組測(cè)序,因此一大類富含甘氨酸、N端有保守脯氨酸-谷氨酸序列(Proline-Glutamate,PE)的蛋白被發(fā)現(xiàn),并被命名為PE蛋白家族,約占全部編碼基因的6%[11]。隨后,根據(jù)編碼蛋白質(zhì)C端含有串聯(lián)重復(fù)序列的不同,PE蛋白家族進(jìn)一步分為單獨(dú)PE(PE_only)和PE_PGRS兩個(gè)相近亞家族。PE_PGRS家族因C端編碼基因富含鳥嘌呤-胞嘧啶基序(polymorphic guanine-cytosine rich sequences,PGRS)而得名,是Mtb獨(dú)有的多基因亞家族,只存在于分枝桿菌屬,且絕大多數(shù)僅存在于致病性結(jié)核分枝桿菌中,與免疫逃逸和抗原變異密切相關(guān)[12],近年來成為開發(fā)新藥物、研制疫苗和診斷試劑特異性靶點(diǎn)的熱點(diǎn)之一[13-14]。
PE_PGRS家族蛋白是由一組約104~1 901個(gè)氨基酸構(gòu)成的酸性蛋白,參與構(gòu)成Mtb的表面抗原成分,主要位于細(xì)胞壁和細(xì)胞膜上,與分枝桿菌的致病性與毒力息息相關(guān)[15]。PE_PGRS29作為該蛋白家族的一員,經(jīng)預(yù)測(cè)分析,PE_PGRS29蛋白為親水性蛋白,無信號(hào)肽,不存在跨膜螺旋,且該蛋白具有多個(gè)T、B細(xì)胞抗原表位,佐證了該蛋白位于Mtb胞膜上,參與機(jī)體對(duì)結(jié)核分枝桿菌免疫反應(yīng)。
基因序列和ORF分析結(jié)果顯示,PE-PGRS29基因編碼的蛋白由370個(gè)氨基酸構(gòu)成,包含18種氨基酸,其中以甘氨酸(34.6%)、丙氨酸(19.2%)、天冬氨酸(7.0%)、絲氨酸(5.7%)的組成比例較高。PGRS結(jié)構(gòu)域的特征性標(biāo)志是包含大量甘氨酸和丙氨酸重復(fù)序列,通常以Gly-Gly-Ala或Gly-Gly-X(X為任意氨基酸)形式存在[12]。大量甘氨酸的GGXGXD/NXUX(U指非極性或疏水性大殘基)非肽序列(nonapeptide sequence)形成一個(gè)平行β滾筒或平行β螺旋結(jié)構(gòu),可與Ca2+連接,大量Ca2+與PE_PGRS蛋白結(jié)合,從而導(dǎo)致巨噬細(xì)胞中Ca2+濃度顯著下降,吞噬溶酶體的程度受到抑制,則巨噬細(xì)胞內(nèi)的結(jié)核分枝桿菌無法被溶酶體及時(shí)清除,造成持續(xù)的慢性感染[16-17]。因此,控制巨噬細(xì)胞中Ca2+濃度或抑制Ca2+與PE_PGRS蛋白結(jié)合,可能有助于結(jié)核分枝桿菌的免疫調(diào)控。
理化性質(zhì)分析顯示PE_PGRS29蛋白帶負(fù)電荷的殘基(Asp+Glu)總數(shù)為12,帶正電荷的殘基(Arg+Lys)總數(shù)為5,該蛋白的理論等電點(diǎn)pI為4.66,消光系數(shù)為9 970,280 nm處的吸光度為0.309。預(yù)測(cè)分析PE_PGRS29蛋白不穩(wěn)定性指數(shù)為15.60,表明該蛋白為穩(wěn)定蛋白。PE_PGRS29蛋白的二級(jí)結(jié)構(gòu)分析顯示無規(guī)則卷曲(Cc)169個(gè),占45.68%,而酶活性部位和其他蛋白質(zhì)特異的功能部位經(jīng)常由這類有序的非重復(fù)性結(jié)構(gòu)構(gòu)成,BLAST軟件分析證實(shí)PE_PGRS29蛋白含有1個(gè)結(jié)構(gòu)域。Chai等[5]研究表明,PE_PGRS29蛋白含有真核生物樣泛素化相關(guān)(UBA)結(jié)構(gòu)域,UBA介導(dǎo)的泛素與PE_PGRS29的直接結(jié)合,招募自噬受體p62將分枝桿菌遞送至LC3相關(guān)的自噬體,完成巨噬細(xì)胞中Mtb的異種清除。Bachhawat[18]研究發(fā)現(xiàn),PE_PGRS蛋白中PE結(jié)構(gòu)域普遍存在保守的DEVS(1個(gè)保守的四肽基序DEVS或DXXS,X為任意氨基酸),與蛋白caspase-3的識(shí)別位點(diǎn)DEVD/E基序高度相似,caspase-3蛋白可競(jìng)爭(zhēng)性與磷酸化后的絲氨酸殘基結(jié)合,抑制細(xì)胞凋亡,有助于逃避宿主細(xì)胞的免疫反應(yīng)。預(yù)測(cè)分析PE_PGRS29蛋白含有10個(gè)絲氨酸磷酸化位點(diǎn),表明PE_PGRS29蛋白可能參與這一抑制凋亡途徑。本研究構(gòu)建了PE_PGRS29蛋白的進(jìn)化樹以及多序列比對(duì),發(fā)現(xiàn)PE_PGRS29蛋白與人類基因并無同源性,但在結(jié)核分枝桿菌菌屬中同源性極高,保守性很強(qiáng),含有多個(gè)T、B細(xì)胞抗原表位,提示PE_PGRS29蛋白可作為結(jié)核病治療的潛在分子靶點(diǎn)以及對(duì)結(jié)核病新型候選疫苗有一定的參考價(jià)值。
結(jié)核分枝桿菌引起被感染的機(jī)體細(xì)胞自噬是降解細(xì)菌的重要過程,然而引發(fā)異種自噬的確切機(jī)制仍不清楚。本研究對(duì)PE_PGRS29蛋白進(jìn)行了生物信息學(xué)分析,可為進(jìn)一步研究PE_PGRS29蛋白的結(jié)構(gòu)功能和理化性質(zhì)提供參考,以期為結(jié)核病的預(yù)防和治療提供新的分子靶點(diǎn)。