趙晏慶(綜述) 程訓佳(審校)
(復旦大學基礎醫(yī)學院病原生物學系 上海 200032)
溶組織內阿米巴(Entamoeba histolytica,Eh)是一種主要寄生在人體腸道的厭氧原蟲,可引起嚴重的阿米巴性結腸炎和腸外膿腫。阿米巴病的嚴重性在全球寄生原蟲病中居第二位,致死率僅次于瘧疾。據(jù)估計,全世界每年約有5~10 萬人死于阿米巴病,5 000 萬人出現(xiàn)Eh新感染。Eh感染人體的過程與一系列阿米巴毒力因子蛋白質相關。具有感染性的Eh包囊經口攝入人體,隨后通過胃和小腸,在回腸末端或結腸轉變?yōu)榫哂兄虏⌒缘淖甜B(yǎng)體。滋養(yǎng)體通過細胞表面的半乳糖/乙酰氨基半乳糖可抑制性 凝 集 素(galactose/N-acetyl galactosamineinhibitable lectin,Gal/GalNAc lectin)等物質黏附于宿主腸上皮細胞,隨后釋放阿米巴穿孔素(amoebapore)和半胱氨酸蛋白酶(cysteine proteases,CP)等毒力因子,通過接觸依賴性細胞溶解作用使與之接觸的細胞發(fā)生壞死或凋亡,亦或通過胞啃作用直接損傷宿主細胞,從而形成燒瓶樣的腸道潰瘍[1-4]。
結構生物學(structural biology)是一門通過交叉融合生物、化學、物理、數(shù)學和計算機等多領域知識來研究生物大分子的結構及其動態(tài)變化,進而闡明生命現(xiàn)象的學科,這門學科的出現(xiàn)與發(fā)展為藥物設計、疫苗開發(fā)和蛋白質分子性能改造等應用方向奠定了理論和技術基礎[5-6]。結構生物學的起源可以追溯到20 世紀50 年代Waston 和Crick 解析出DNA 雙螺旋結構[7]。隨著技術的不斷發(fā)展,結構生物學在核酸和蛋白質結構研究中發(fā)揮越來越重要的作用。蛋白質結構坐標數(shù)據(jù)庫(Protein Data Bank,PDB,http://www.rcsb.org/pdb)中收錄已解析的蛋白質三維結構數(shù)目從1989 年的300 余個增至156 101 個(截至2019 年9 月18 日)。結構生物學技術也已運用到現(xiàn)代生物學和醫(yī)學研究的各個領域,包括人體寄生蟲學研究領域。在人體寄生原蟲Eh中,已經解析出150 余種蟲體蛋白質的三維結構,為研究阿米巴代謝活動、致病機制以及研發(fā)藥物和疫苗等提供了重要信息。
結構生物學技術發(fā)展概況目前結構生物學的主要研究方法包括X 射線晶體學(X-ray macromolecular crystallography)、核磁共振波譜學(nuclear magnetic resonance spectroscopy)和冷凍電子顯微學(cryo-electron microscopy)。
X 射線晶體學 1957 年,英國科學家Kendrew等[8]首次將X 射線晶體學方法運用于蛋白質三維結構的解析,即獲得分辨率為6? 的抹香鯨肌紅蛋白晶體結構。之后,Kendrew 等[9]將抹香鯨肌紅蛋白晶體結構的分辨率提高到2?,并獲得1962 年諾貝爾化學獎。X 射線晶體學的基本原理是利用X 射線對高純度蛋白質晶體進行衍射,通過對衍射數(shù)據(jù)的分析處理來獲得近原子分辨率的蛋白質大分子三維結構。經過半個多世紀的理論發(fā)展和硬件設備升級,X 射線晶體學已經成為結構生物學研究中最主要的研究手段之一[10-11]。
目前PDB 數(shù)據(jù)庫收錄的蛋白質三維結構中有89.1%(139 132 個,截至2019 年9 月18 日)是通過X射線晶體學方法解析得到的。然而,X 射線晶體學的應用仍存在一定的局限,即必須先獲得可衍射的蛋白質晶體才能進行結構探測,而在實驗室獲得蛋白質結晶往往是一個非常耗時且具有挑戰(zhàn)性的工作,特別是膜蛋白和超大分子量蛋白質復合物通常難以結晶,往往需要通過誘變和高通量篩選來獲得構象穩(wěn)定的蛋白質樣品[5,12-13]。因此,一些重要的蛋白質分子難以通過X 射線晶體學方法獲得三維結構信息,需要尋求其他的解決方法。
核磁共振波譜學 20 世紀50 年代,核磁共振技術與X 射線衍射方法幾乎同時開始應用于結構生物學研究領域。1957 年,Saunders 等[14]首次成功運用核磁共振波譜學方法解析蛋白質結構即核糖核酸酶的三維結構。多維光譜學、量子計算和高通量核磁共振技術的發(fā)展,為核磁共振波譜學提供了理論和技術支撐[15-18]。目前PDB 數(shù)據(jù)庫收錄的蛋白質三維結構中有8.1%(12 657 個,截至2019 年9 月18日)是通過核磁共振波譜學方法解析得到的。
核磁共振波譜學通常用于解析溶液中蛋白質的三維結構、動力學特征以及蛋白質間相互作用。與X射線晶體學相比,核磁共振波譜技術解析出的蛋白質結構更接近于生理狀態(tài)。然而,該技術常用于解析不易結晶的小分子量蛋白質的結構,對于大分子量蛋白質復合體或難溶于水的蛋白質往往不易得到理想的結果。在21 世紀之前,通過核磁共振技術解析結構的蛋白質分子量幾乎都不超過25 000。隨著技術發(fā)展,特別是脈沖序列技術的突破,通過核磁共振解析的最大蛋白質分子量突破1MDa,因此核磁共振波譜學依然具有很好的應用前景[19-20]。
冷凍電子顯微學 冷凍電子顯微學,又稱冷凍電鏡技術,是一項從20 世紀70 年代發(fā)展起來的新興技術,現(xiàn)已成功運用于細胞生物學和結構生物學研究。2013 年,由于直接電子相機的應用,冷凍電鏡技術成功解析高分辨率膜蛋白三維結構,即分辨率為3.4 ? 的哺乳動物細胞膜蛋白辣椒素受體的三維結構[21]。在此之后,越來越多的膜蛋白和分子量較大的蛋白質及其復合物通過冷凍電鏡技術解析出三維結構。目前PDB 數(shù)據(jù)庫收錄的蛋白質三維結構中有2.4%(3 755 個,截至2019 年9 月18 日)是通過冷凍電鏡技術解析得到的。
冷凍電鏡技術的基本原理是將細胞或生物大分子樣品快速冷凍,然后利用透射電子顯微鏡收集冷凍樣品的圖像,后續(xù)通過一系列數(shù)據(jù)處理方法來重構冷凍樣品的三維結構?;痉治龇椒ò▎晤w粒三維重構法、電子晶體學方法和電子斷層掃描成像技術等,其中單顆粒三維重構法是解析蛋白質分子三維結構最常用的方法。單顆粒三維重構法是根據(jù)蛋白質分子的不同取向,將電鏡視野中數(shù)以百萬計的單個蛋白質分子顆粒圖像進行分類和平均,提高圖像信噪比,從而解析得到高分辨率的蛋白質分子三維結構[22]。在冷凍電鏡技術中,蛋白質樣品通常無需結晶,只需要很少量蛋白質溶液(如在單顆粒三維重構法中只需3 μL 左右濃度為1~10 μg/μL 的蛋白質溶液)通過快速冷凍即可進行圖像收集和處理,可以盡量保持樣品的原始狀態(tài),得到更有意義的結構分析[23-25]。
結構生物學在Eh 致病機制研究中的應用目前,PDB 數(shù)據(jù)庫中收錄的Eh蛋白質三維結構共計156 個,其中有143 個是通過X 射線晶體學方法解析的,另外13 個是通過核磁共振波譜學技術解析的,暫無通過冷凍電鏡技術解析的結構。在已解析的Eh蛋白質結構中有39 個是結構蛋白,包括肌動蛋白、肌球蛋白、鈣調蛋白等,還有117 個是非結構蛋白,主要是參與阿米巴細胞代謝的各類酶。Eh致病過程相關的重要蛋白質當中,三維結構得到解析的有阿米巴穿孔素A 和半胱氨酸蛋白酶抑制劑。
阿米巴穿孔素A 在Eh幾種重要的毒力因子蛋白質中,最先解析出三維結構的是阿米巴穿孔素A。阿米巴穿孔素是一類存在于滋養(yǎng)體細胞質顆粒中的小分子蛋白家族,包括阿米巴穿孔素A、B 和C。當阿米巴滋養(yǎng)體與靶細胞或組織接觸時,滋養(yǎng)體可以分泌出阿米巴穿孔素,使得靶細胞表面形成離子通道,破壞靶細胞膜屏障,使靶細胞或組織發(fā)生損害[26-27]。早在1982 年,科學家就已經發(fā)現(xiàn)阿米巴穿孔素,并對其功能進行研究[28]。1992 年,Leippe等[29]利用阿米巴穿孔素A 的互補脫氧核糖核酸(complementary deoxyribonucleic acid,cDNA)序列,推導出阿米巴穿孔素A 的氨基酸序列(即一級結構)是由77 個氨基酸殘基構成的,其中包括6 個半胱氨酸殘基。同年,科學家利用圓二色光譜測定出阿米巴穿孔素的二級結構為全α-螺旋構象。2004年,Hecht 等[27]利用核磁共振波譜學方法解析了阿米巴穿孔素A 的三級結構,證實了此前推測阿米巴穿孔素A 的全α-螺旋構象(圖1A),并且通過分子篩色譜、化學修飾和蛋白質交聯(lián)實驗證明了阿米巴穿孔素的激活與pH 依賴的蛋白質二聚化有關。
阿米巴穿孔素是水溶性蛋白質,但同時也可以分散在細胞膜上即具有一定的脂溶性。在阿米巴穿孔素A 的三維結構中觀察到該蛋白質的一側是親水性的,另一側是疏水性的,具有兩親性。阿米巴滋養(yǎng)體可以通過調節(jié)酸性物質的分泌調控穿孔素的活性。在酸性環(huán)境下,阿米巴穿孔素通過靜電作用發(fā)生二聚化,親水結構聚集在內側,疏水結構暴露在外側,形成整體疏水性的環(huán)狀結構(圖1B、C),使穿孔素可以更好地分布在靶細胞膜上,從而導致靶細胞膜出現(xiàn)寡聚孔。阿米巴穿孔素的二聚體活化機制提示,與阿米巴穿孔素結構類似的可溶性球狀蛋白質可能具有破壞細胞膜,從而殺死細菌和真核細胞的作用[27]。
CP 抑制劑 CP 是Eh另一種重要的毒力因子。Eh胞內含有至少50 種CP,其中最主要的是EhCP1、EhCP2 和EhCP5。CP 最初表達為無活性的酶原,其活性由阿米巴精密的調控機制進行調控,其中包含Chagasin 樣抑制劑家族的EhCP 抑制劑(Entamoeba histolyticainhibitor forcysteine proteases,EhICP),即EhICP1 和EhICP2[30-33]。2011年,Casados-Vázquez 等[34]利用X 射線衍射技術解析出EhICP2 的晶體結構(圖2A)。
圖2 EhICP2 的三維晶體結構及其與半胱氨酸蛋白酶相互作用的模型Fig 2 The crystal structure of EhICP2 and its interaction model with a cysteine protease(Papain)
EhICP2 的空間結構由8 條β 鏈構成的2 個β-折疊片組成,與免疫球蛋白的折疊方式非常相似。EhICP2 中含有致密的疏水核心集團,起到穩(wěn)定整體結構的作用(圖2A、B)。BC、DE 和FG 三個環(huán)狀結構具有一定的柔性,其功能主要與蛋白質間相互作用有關,其中BC 環(huán)中蘇氨酸和絲氨酸殘基可以與CP 活性中心即催化三聯(lián)體(His-159,Asn-175 和Cys-25)中的半胱氨酸和組氨酸殘基相互作用,從而抑制CP 活性,而DE 和FG 環(huán)在EhICP2 結合CP 時可轉變構象,起到穩(wěn)定整體結構的作用(圖2C、D)[34]。CP 抑制劑EhICP2 晶體結構的解析,有助于在原子水平上理解Eh中CP 的活性調控機制,為開發(fā)抑制蟲體CP 藥物奠定了基礎。
結構生物學在Eh 研究中的發(fā)展前景目前在Eh致病過程中起重要作用的Gal/GalNAc 凝集素、CP 和過氧化物氧化還原酶等毒力因子蛋白質的三維結構尚未得到解析[2,35-37],未來對這些毒力因子三維結構的解析可能會成為結構生物學在Eh研究領域的熱點。
以EhGal/GalNAc 凝集素為例。研究表明該凝集素包含170 000 重鏈亞單位(heavy subunit of Gal/GalNAc lectin,hgl)、150 000 中間亞單位(intermediate subunit of Gal/GalNAc lectin,igl)和35/31 kDa 輕鏈亞單位(light subunit of Gal/GalNAc lectin,lgl),其中hgl是跨膜蛋白,igl和lgl通過糖基磷脂酰肌醇(Glycosyl phosphatidyl inositol,GPI)錨定在細胞膜胞外側(圖3)。已知hgl 由于含有特異性的糖類識別位點(carbohydrate recognition domain,CRD)而具有重要作用,而igl 和lgl 在阿米巴黏附和入侵過程中發(fā)揮的作用尚不明確。另外,Gal/GalNAc 凝集素富含半胱氨酸以及由半胱氨酸殘基構成的CXXC 或CXC 基序(“C”為半胱氨酸殘基,“X”為任意氨基酸殘基),研究表明這一特點與滋養(yǎng)體吞噬宿主細胞和導致宿主細胞凋亡相關[38-41]。由于Gal/GalNAc 凝集素的三維結構尚未解析,特別是CXXC 或CXC 基序的結構特點尚不清楚,Gal/GalNAc 凝集素特別是igl 和lgl 兩個亞單位在致病過程中所扮演的角色難以從原子水平上進行推測和理解。Eh中Gal/GalNAc 凝集素定位于細胞膜上,屬于膜蛋白,不易結晶,難以通過X 射線晶體學方法解析其結構,預計將來可能通過冷凍電鏡技術獲得其三維結構。在Gal/GalNAc 凝集素中,hgl 和lgl 通過共價鍵連接形成分子量為260 000 的異源二聚體,再與igl 通過非共價鍵的方式結合。實驗條件下蛋白質間的非共價鍵不易形成,因此可能需要分別解析hgl-lgl 異源二聚體與igl 的三維結構,再對Gal/GalNAc 凝集素整體的分子結構進行分析。
圖3 Gal/GalNAc 凝集素結構模型Fig 3 Schematic structural model of Gal/GalNAc lectin
結語在Eh致病機制研究中,結構生物學作為一種新興的生物學研究方法,已經得到一定程度的應用。近些年,越來越多重要的蟲體酶、毒力因子和致病蛋白的三維結構被解析,對于Eh致病機制的理解不斷深入,并為抗蟲藥物和潛在疫苗的研發(fā)提供了必要條件。但目前Eh中還有很多重要蛋白質的三維結構尚待研究,如與阿米巴對宿主組織和細胞黏附相關的Gal/GalNAc 凝集素等。另一方面,冷凍電鏡技術尚未在Eh研究領域得到成功的運用。隨著技術的進步,特別是冷凍電鏡技術的發(fā)展,結構生物學方法將更加深入地運用到Eh致病機制的研究當中。