曹 澤,王樂童,劉振明
(北京大學(xué)藥學(xué)院天然藥物及仿生藥物國家重點實驗室,北京 100191)
嚴重急性呼吸綜合征冠狀病毒2(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)感染對全球公共衛(wèi)生構(gòu)成了巨大威脅,預(yù)測病毒的進化方向?qū)ο嚓P(guān)疾病的防控具有重大意義。SARS-CoV-2屬于冠狀病毒科β-冠狀病毒屬,其基因組為全長32 kb的正鏈RNA,復(fù)制酶轉(zhuǎn)錄酶復(fù)合物(nsp14)具有3′→5′核酸外切酶活性,該病毒的突變率高于雙鏈DNA病毒,預(yù)示強大的進化潛能[1-2]。此外,SARS-CoV-2存在大量同工翻譯產(chǎn)物,提示其變異較快并有較強的宿主適應(yīng)性[3]。
基于冠狀病毒的系統(tǒng)進化樹,SARS-CoV-2與Bat-SL-CoV ZC45序列同源性達87.99%,與SARS-CoV和中東呼吸綜合征冠狀病毒(Middle East respiratory syndrome coronavirus,MERS-CoV)的同源關(guān)系較遠,序列相似性分別為79%和50%[4]。刺突蛋白(Spike protein,S蛋白)是病毒感染宿主細胞的主要分子[5-6],包含負責結(jié)合細胞表面受體的S1亞基和介導(dǎo)膜融合的S2亞基兩部分[7]。SARS-CoV-2的S蛋白與Bat-SL-CoV的S蛋白具有80%的氨基酸序列相似性,與SARS-CoV的S蛋白具有76%的相似性,且都以人血管緊張素轉(zhuǎn)換酶2(angiotensin-converting enzyme 2,ACE2)為主要結(jié)合位點[8]。在SARS-CoV的S蛋白中,有5個氨基酸殘基位于表面(442、472、479、487、491位),是其跨物種傳播和人傳人的關(guān)鍵位點,而這5個位點在SARS-CoV-2中僅有1個氨基酸殘基位點(491位)是保守的[5]。因此,若S蛋白持續(xù)發(fā)生突變,可能導(dǎo)致與宿主受體的結(jié)合能力、對人的感染性和傳播性發(fā)生改變。已有研究表明,病毒進入細胞時,除主要受體外,細胞表面的多種受體可能會發(fā)揮輔助作用[9-11],如C型凝集素CD209L和DC-SIGN都能夠與SARS-CoV的S蛋白結(jié)合并輔助其感染細胞[12]。因此除ACE2外,SARS-CoV-2也有可能結(jié)合細胞表面的其他受體,這些位點可能成為突變累積后新的主要結(jié)合位點。以往研究證明,肉桂硫銨(cinanserin)能夠有效抑制SARS-CoV的主要蛋白酶(3CLpro)[13],aplaviroc和vicriviroc都是CCR5受體抑制劑,被廣泛用于抗人類免疫缺陷病毒(human immunodeficiency virus, HIV)的治療[14],obatoclax則是一種Bcl-2抑制劑,最初被廣泛用于治療癌癥[15],后發(fā)現(xiàn)其具有抑制多種病毒的能力[16]。有研究表明,curcumin在3~10 μm范圍內(nèi)能夠?qū)ARS-CoV產(chǎn)生抑制作用[17],但目前仍然沒有關(guān)于這些藥物小分子與ACE2親和力的分析報道。
本研究旨在通過包括序列比對、同源建模和分子對接在內(nèi)的計算建模方法探究SARS-CoV-2的S蛋白可能發(fā)生的突變,及其與人類細胞ACE2、二肽基肽酶-4(dipeptidyl peptidase-4,DPP4,又稱CD26)以及氨基肽酶N(aminopeptidase N,APN,又稱CD13)的結(jié)合能力,分析突變的S蛋白與抗病毒藥物結(jié)合能力的變化情況,從而預(yù)測可能的藥物治療方案,并為后續(xù)疫情防控和流行病學(xué)研究提供依據(jù)。
收集截至2020年4月20日,美國國家生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)數(shù)據(jù)庫發(fā)表的全部434個SARS-CoV-2的測序結(jié)果。肉桂硫銨、aplaviroc、vicriviroc和obatoclax等小分子藥物的化學(xué)結(jié)構(gòu)文件下載自PubChem數(shù)據(jù)庫。
以434條測序結(jié)果的共有序列為模板,利用Snapgene軟件對434條測序結(jié)果進行對比分析,尋找高頻突變位點,并依次構(gòu)建突變后的序列。
采用PolyPhen-2軟件對選中的36個突變位點進行單堿基突變分析,確定相應(yīng)點突變對蛋白質(zhì)功能的影響程度。通過SWISS-MODEL系統(tǒng)對構(gòu)建的突變后序列進行同源建模,獲得PDB格式的文件用于后續(xù)分析。使用PyMOL軟件對突變后蛋白質(zhì)和SARS-CoV-2原蛋白質(zhì)的三維結(jié)構(gòu)進行同源性分析,使用ZDOCK算法進行突變后蛋白質(zhì)與受體ACE2、DPP4、APN的對接模擬,并用FiPD對對接結(jié)果進行打分,評估蛋白質(zhì)與受體的結(jié)合能力。利用AutoDock軟件對藥物小分子與突變后蛋白質(zhì)進行蛋白質(zhì)對接分析,探究小分子藥物與突變蛋白質(zhì)的親和能力變化。
應(yīng)用SPSS 26.0統(tǒng)計軟件對最終結(jié)果進行聚類分析,P<0.05認為聚類結(jié)果有統(tǒng)計學(xué)意義。
SARS-CoV-2作為單股正鏈RNA病毒,其基因組具有較高的突變率,在感染傳播過程中容易發(fā)生單堿基突變,導(dǎo)致對應(yīng)蛋白質(zhì)的結(jié)構(gòu)和功能發(fā)生改變。本研究納入434條SARS-CoV-2全長測序信息,使用Snapgene分析比對得出其共有序列并以其作為模板,分析所有測序結(jié)果相對于模板在S蛋白編碼區(qū)發(fā)生的單堿基突變,共計得到33個突變位點(表1)。在自然狀態(tài)下,胞嘧啶中的氨基易被水分子中的羥基親核取代,使其突變成為尿嘧啶,經(jīng)過DNA修復(fù)或復(fù)制等過程導(dǎo)致原本與胞嘧啶配對的鳥嘌呤變?yōu)橄汆堰剩c此同時,腺嘌呤容易突變成次黃嘌呤,次黃嘌呤與腺嘌呤、尿嘧啶、鳥嘌呤均可配對,導(dǎo)致原有的位點產(chǎn)生多種突變。
表1 S蛋白突變位點的分析
在確定突變類型之后,利用PolyPhen-2軟件基于S蛋白結(jié)構(gòu)的保守性和特定結(jié)構(gòu)域的功能,分析相應(yīng)點突變是否會影響其結(jié)構(gòu)功能,分析所得結(jié)果為0~1的一個數(shù)字,值越接近于1說明該突變對蛋白質(zhì)整體結(jié)構(gòu)產(chǎn)生影響的可能性越大。該軟件將突變的影響程度分為三組:置信度在0.50(50%)以下的“無影響組”,置信度為0.50~0.95(50%~95%)的“低影響組”,以及置信度在0.95(95%)以上的“高影響組”,得分為零則表示無法通過計算模擬判斷。本研究中,上述三組分別包括11種、3種、20種S蛋白的高頻點突變類型,結(jié)果表明,多數(shù)突變對S蛋白整體結(jié)構(gòu)產(chǎn)生影響的可能性較大,預(yù)示突變后的S蛋白與受體的結(jié)合能力、與藥物小分子的親和性可能發(fā)生改變。我們發(fā)現(xiàn)在S蛋白第400~1 100位氨基酸區(qū)域發(fā)生的突變對S蛋白結(jié)構(gòu)影響較大(圖1),而該區(qū)域在先前的研究中被證明為受體結(jié)合結(jié)構(gòu)域(receptor binding domain, RBD)和重要的中間連接片段,對蛋白質(zhì)功能的影響較大,這一定程度上佐證了本研究工作分析結(jié)果的正確性。
圖1 S蛋白點突變對整體結(jié)構(gòu)產(chǎn)生影響的可能性分析
本研究綜合考慮以往曾大規(guī)模爆發(fā)的冠狀病毒(如SARS-CoV、MERS-CoV等)的進化特征,分析在自然突變情況下,SARS-CoV-2的S蛋白與各類人源受體蛋白質(zhì)結(jié)合力的變化,預(yù)測SARS-CoV-2的潛在進化方向,重點關(guān)注因為S蛋白的突變而導(dǎo)致病毒侵染細胞靶點的變化。
基于S蛋白核心結(jié)構(gòu)域(S蛋白第319~541位點)的5個高頻突變位點(A384S、Q474H、V483D、V483G、G476C),通過同源建模獲得全部23種S蛋白突變后關(guān)鍵RBD的3D模型,利用PyMOL分析得出突變蛋白質(zhì)與SARS-CoV-2現(xiàn)存的S蛋白同源性良好[均方根偏差(root mean square deviation, RMSD)為0.158]。利用分子對接分別分析23種突變后的RBD與ACE2、DPP4和APN等人源受體的親和力變化(圖2~4)。ACE2是SARS-CoV以及現(xiàn)有報道的SARS-CoV-2侵染人肺泡上皮細胞的主要受體,DPP4是MERS-CoV侵染細胞的受體,APN是hCoV-299E侵染細胞的受體,這些受體均為典型的冠狀病毒家族的親和受體,基于病毒進化的相關(guān)理論推測,經(jīng)過一定時間的自然突變,SARS-CoV-2有可能改變原有的感染機制,不再以ACE2為唯一親和位點。
A, Y28H; B, D111N; C, A348N; D, D614G; E, T723I; F, F797S; G, D936N; H, A1078V. Because of the existence of synonymous mutations and the cleavage of mutation sites in mature proteins, 33 high-frequency mutation sites eventually produced only 8 kinds of sequence changes in mature spike proteins.
分子對接結(jié)果顯示,與434條S蛋白測序結(jié)果的平均序列相比,自然突變導(dǎo)致S蛋白RBD與ACE2的親和能力減弱,而與DPP4的親和能力增強,與APN的親和能力無顯著變化(圖3),但在與所有受體親和能力的測試結(jié)果中,ACE2與S蛋白RBD的親和能力仍然保持最高(圖3),表明在一定時間段內(nèi),SARS-CoV-2仍將以ACE2為主要感染位點。S蛋白RBD與DPP4的親和能力顯著增強,并可能逐漸接近其與ACE2的親和能力,提示SARS-CoV-2在后期的進化中可能轉(zhuǎn)向以DPP4為感染位點,或不單純以ACE2為唯一感染位點。
將各類宿主細胞來源的受體與突變前后的S蛋白進行親和力差異的聚簇分析,ACE2的聚簇結(jié)果中,親和力降低組的容量最大,DPP4的聚簇結(jié)果中,親和力提高組的容量最大,APN的聚簇結(jié)果中各組容量相當(表2)。分析結(jié)果進一步佐證了SARS-CoV-2趨向于以DPP4為新的結(jié)合受體的可能性。
表2 ACE2、DPP4、APN與S蛋白各突變RBD結(jié)合能力的聚簇分析
為探究可能有效的臨床治療藥物,基于SARS-CoV-2的S蛋白中由高頻突變位點所構(gòu)建出的27種突變蛋白質(zhì),本研究選擇了5種常見的抗病毒小分子藥物cinanserin、aplaviroc、vicriviroc、obatoclax和curcumin與突變后的蛋白質(zhì)進行對接,并計算其適配度和吉布斯自由能(Gibbs free energy),據(jù)此判斷其結(jié)合能力。5種藥物為常見的抗病毒小分子藥物,包含2種證明對SARS-CoV有治療效果的藥物和其他一些在新型冠狀病毒肺炎疫情期間曾經(jīng)用于研究與臨床治療的抗病毒藥物,其抗病毒機制各不相同,具有一定的代表性。AutoDock計算結(jié)果顯示,5種藥物與突變后的27種S蛋白普遍結(jié)合能力較強,結(jié)合能力平均水平由強到弱排序依次為aplaviroc、vicriviroc、obatoclax、curcumin、肉桂硫銨。對于27種具有不同突變位點的S蛋白,curcumin的結(jié)合能力變化最大(圖5)。
A, the 3D modeling structure diagram of S protein; B, C, D, the protein structure diagrams of ACE2, DPP4, and APN, respectively; E, the structural diagram of RBD region of S protein; F, G, H, the 3D modeling structure diagrams of ACE2, DPP4, and APN, respectively binding complex with RBD region. ACE2, angiotensin-converting enzyme 2; DPP4, dipeptidyl peptidase-4; APN, aminopeptidase N; RBD, receptor binding domain.
SARS-CoV-2強大的感染力得益于充當媒介的S蛋白與人細胞表面ACE2的極高親和力,S蛋白的突變可能會通過改變病毒的感染機制而影響其感染能力,對S蛋白突變方向的研究能夠幫助預(yù)測是否存在二次爆發(fā)并在此基礎(chǔ)上指導(dǎo)制定新的公共衛(wèi)生政策。
本研究利用NCBI數(shù)據(jù)庫篩選出了SARS-CoV-2 S蛋白中的33個高頻突變位點,并基于位于S蛋白RBD的5個突變位點(A384S、Q474H、V483D、V483G、G476C)研究了可能的突變蛋白質(zhì)與3種常見的人類細胞表面受體(ACE2、DPP4、APN)的結(jié)合情況,蛋白質(zhì)對接結(jié)果表明,突變的S蛋白對DPP4的結(jié)合力增強,DPP4有一定可能成為SARS-CoV-2新的入侵細胞靶點。DPP4是一種絲氨酸外肽酶,普遍存在于內(nèi)皮細胞和上皮細胞表面[18],在肝、腸、胎盤、肺和腎等多種器官組織中表達[19-20]。有研究表明,DPP4通過與S蛋白結(jié)合從而在SARS-CoV-2感染細胞的過程中發(fā)揮輔助作用[21]。目前的數(shù)據(jù)顯示,S蛋白與DPP4的結(jié)合能力仍然低于其與ACE2的結(jié)合能力,但模擬突變的結(jié)果顯示,S蛋白與ACE2的結(jié)合能力呈現(xiàn)下降趨勢,而與DPP4的結(jié)合能力逐漸上升。由于S蛋白使用同一RBD與ACE2和DPP4結(jié)合,因而不能排除隨著病毒進化過程,DPP4將取代ACE2成為S蛋白感染細胞的主要受體。以往的證據(jù)表明,以DPP4為感染位點的MERS-CoV等病毒的致死能力顯著高于現(xiàn)有的SARS-CoV-2,而感染能力則明顯不足,推測如果SARS-CoV-2持續(xù)肆虐,可能后期的防治方式將以完全的地區(qū)性阻斷配合藥物治療為主,同時提示,早先針對MERS-CoV的小分子治療藥物可能有望用于后期SARS-CoV-2的治療。
A, the binding free energy of various small molecule drugs with various mutant RBD. The smaller the binding free energy is, the easier the binding is. Aplaviroc has the strongest binding ability with various mutant subtypes. B-F, represents the schematic diagram of 3D modeling and analysis in cinanserin, aplaviroc, vicriviroc, obatoclax, and curcumin combined with RBD, respectively. 1 kcal=4.186 8 kJ. Abbreviations as in Figure 3.
另外,S蛋白的突變使其與小分子藥物結(jié)合的能力也發(fā)生變化,本研究結(jié)果表明,突變S蛋白與aplaviroc的結(jié)合能力相對較高,后續(xù)研究可從aplaviroc著手探索針對SARS-CoV-2的潛在藥物。aplaviroc在2005年因其肝毒性[22]以及對HIV治療的低效性[23],所有相關(guān)研究均被取締,若以后希望建立以aplaviroc為基礎(chǔ)的SRAS-CoV-2治療方案,其衍生物的設(shè)計應(yīng)當優(yōu)先解決肝毒性問題。通過對突變后S蛋白與小分子藥物的親和性分析,考慮到各類小分子藥物表現(xiàn)出的對S蛋白RBD區(qū)的高親和性,有望將先前已有的抗病毒藥物或其衍生物投入到后期的新型冠狀病毒肺炎的臨床治療中。