惠子夜 于漢杰 舒 健 任夏萌 陳聞天
(西北大學生命科學學院,功能糖組學實驗室,西安710069)
冠狀病毒(coronaviruses,CoVs)對人類社會造成嚴重威脅,在哺乳動物和禽類中可引起多種疾?。?]。冠狀病毒來源于網(wǎng)巢病毒目(Nidovirales)的冠狀病毒科(Coronaviridae),是一類具有囊膜結構、單股正鏈的RNA 病毒,其形態(tài)較大,呈圓或橢圓形,直徑約為80~120 nm,因其在電鏡下呈日冕或皇冠狀而得名[2]。冠狀病毒基因組為27~32 kb,是目前已知基因組最大的RNA病毒[3]。根據(jù)血清學特性和分子進化特點,可將近百種冠狀病毒分為4 個屬,即α-、β-、γ-和δ-CoV 屬[4]。其中造成小范圍人群感染的HCoV-229E (Human coronavirus-229E) 、 HCoV-NL63 (Human coronavirus-Netherlands 63)、HCoV-OC43(Human coronavirus-organculture 43) 和 HCoV-HKU1(Human coronavirus-Hong Kong University 1)均屬于α-CoV屬;β-CoV屬成員眾多,可進一步劃分為5個亞屬[5]。嚴重急性呼吸綜合征冠狀病毒,或稱非 典 病 毒 (Severe acute respiratory syndrome coronavirus,SARS-CoV)和中東呼吸綜合征冠狀病 毒 (Middle East respiratory syndrome coronavirus,MERS-CoV)及導致全球肆虐新型冠狀病毒肺炎(coronavirus disease 2019,COVⅠD-19) 的新型冠狀病毒(Severe acute respiratorysyndrome coronavirus-2,SARS-CoV-2)均來源于β-CoV屬[2,6-9];γ-與δ-CoV屬包含較多以禽類為宿主的病毒,如雞傳染性支氣管炎病毒(Infectious bronchitis virus,ⅠBV)、鵝口瘡冠狀病毒(Thrush coronavirus HKU12) 和夜鶯冠狀病毒(Bulbul coronavirus HKU11)等[10]。冠狀病毒基因組編碼多種結構蛋白,包括刺突蛋白(spike protein,S蛋白)、膜蛋白(membrane protein,M 蛋白)、核衣殼蛋白(nucleocapsid protein,N 蛋白)和囊膜蛋白(envelope protein,E 蛋白)等,部分β-CoV 屬成員存在血凝素脂酶(haemaglutinin-esterase,HE) 蛋白。此外還可編碼16 種非結構蛋白(nonstructural proteins,nsp)。如SARS-CoV-2 的nsp1~nsp16,但來源于γ-或δ-CoV屬部分冠狀病毒含15種nsp,即nsp2~nsp16[11-12]。
糖基化(glycosylation)是最常見的生物大分子修飾方式,包括N-糖基化修飾、O-糖基化修飾和糖脂修飾等[13-14]。糖基化修飾在人體中參與多種生命活動,例如蛋白質的折疊、運輸和定位、細胞分化和發(fā)育、細胞識別、信號轉導、免疫應答等[15-20]。在含有囊膜結構的病毒中,糖基化修飾對于識別宿主細胞受體與入侵宿主、免疫逃逸、適應溫度酸堿等理化因素與子代病毒擴散等過程中發(fā)揮著重要的作用[21]。
冠狀病毒中存在極為復雜的糖基化修飾特性,本文希望通過全局性總結冠狀病毒糖蛋白的糖基化位點分布、糖鏈結構與生物學功能及糖生物學研究技術等,有助于對冠狀病毒相關的診斷、治療和疫苗開發(fā)等工作。
冠狀病毒同源三聚體S 蛋白是Ⅰ型膜蛋白,其氨基酸數(shù)目從1 150到1 450個不等,序列相似性在屬間和種間差異較大,但被描述為倒錐狀或丁香狀(clove)三維結構單元組成相同[22-23]。S 蛋白由S1和S2 亞 基 組 成[24]。S1 亞 基 包 含N 端 結 構 域(N-terminal domain,NTD) 和受體結合結構域(receptor binding domain,RBD)等,其功能是結合宿主細胞受體[25]。在SARS-CoV和SARS-CoV-2病毒中,RBD 結合人體內糖蛋白血管緊張素轉換酶2(angiotensin converting enzyme 2,ACE2)被認為是入侵宿主的第一步[11];類似的結合機制也存在于鼠肝炎病毒(Mouse hepatitis virus,MHV)與鼠癌胚抗原相關細胞黏附分子1(mouse carcino embryonic antigen-related cell adhesion molecule 1,mCEACAM1a)[26]和MERS-CoV 與T 細胞表面抗原CD26(DPP4)[27]等之間。S2 亞基富含α 螺旋結構,包含兩段七肽重復域、跨膜區(qū)和C端胞內域等[24]。當S 蛋白被宿主細胞蛋白酶裂解引發(fā)S2 亞基暴露,兩段三聚體的七肽重復域構象變化折疊成發(fā)夾狀內螺旋的六聚體結構,從而介導病毒和宿主細胞膜的融合及進一步的遺傳物質釋放[25]。不同屬或屬間S1 亞基結構差異較大,例如MHV 的NTD 具有相對較大的空間結構域[28]。在高度選擇壓力作用下,S1亞基是冠狀病毒中最易變異區(qū)域,而S2亞基相對保守[29]。
蛋白糖基化修飾現(xiàn)象非常普遍,大多數(shù)以N-糖基化修飾為主。N-糖基化發(fā)生在內質網(wǎng)和高爾基體中,其修飾位點以N-X-S/T(X不能為脯氨酸)為特征,在所有物種中高度保守[30]。囊膜病毒表面的糖蛋白布滿豐富的N-糖基化修飾位點,例如甲型流感病毒囊膜上兩種糖蛋白,血凝素(hemagglutinin, HA) 和 神 經(jīng) 氨 酸 苷 酶(neuraminidase,NA),通常含有6~12 個N 糖基化位點[31];在人類免疫缺陷病毒表面的gp160 含多達31個N-糖基化位點[32];冠狀病毒的N-糖基化修飾更加復雜多樣。
通過對S 蛋白進行生物信息學分析可見18~39個N-糖基化位點分布在4 個屬中,其中HCoVNL63中多達39個N-糖基化位點,這意味其三聚體的N-糖 基 化 位 點 數(shù) 目 可 達117 個(圖1)[33];SARS-CoV-2和SARS-CoV的S蛋白相似性為80%,均含22 個N-糖基化位點,但SARS-CoV-2 的RBD區(qū)域缺失一個N-糖基化位點(對應SARS-CoV 中的N370),會暴露更多的受體結合區(qū)域[2,22]。值得注意的是,在與SARS-CoV-2密切相關的蝙蝠來源(RaTG13)和穿山甲來源(PCoV_GX)的冠狀病毒S 蛋白序列更加相似(96.2%),但多兩個N-糖基化位點(N30 和N370)[34]。從三維結構角度看,這些N-糖基化位點分散于S1亞基外表面上,但S2的C端處6~8個保守N-糖基化位點均位于蛋白質與膜連接處,可能涉及入侵宿主的膜融合行為[35]??傊?,冠狀病毒4個屬之間糖基化位點數(shù)目和位置存在較大差異,這種差異也見于亞屬與種間(圖1)[36-39]。
由于含有至少54 個N-糖基化位點,故S 蛋白分布著高度致密的N-糖鏈結構,這些糖鏈對蛋白質折疊、宿主結合以及逃避宿主免疫系統(tǒng)均起到了重要的影響作用。但這些位點是否都會發(fā)生糖基化修飾?由于病毒不編碼糖鏈修飾相關酶,因此其糖鏈結構來源于宿主系統(tǒng):絕大多數(shù)物種的新生肽鏈位于內質網(wǎng)時,會在N-糖基化位點添加14糖前體,隨后伴隨著肽鏈的折疊與運輸,受到宿主糖基轉移酶和糖苷酶對糖鏈結構的加工與修飾[40]。而病毒中滯留信號肽(retrieval signal)的存在會引導S蛋白等在內質網(wǎng)、 內質網(wǎng)高爾基體中間體(endoplasmic reticulum-golgi intermediate compartment,ERGⅠC)或高爾基體中積累并形成出芽體,這也導致了以高甘露糖型糖鏈為代表的未完全加工N-糖鏈結構在病毒膜蛋白中較為豐富[41]。而Nal等[42]利用C端標記蛋白分析SARS病毒S蛋白的細胞定位,通過糖苷酶酶切與電泳分析等發(fā)現(xiàn),S蛋白的高甘露糖糖鏈在進入高爾基體后成為復雜型的N-糖鏈。
因為病毒不表達參與糖鏈合成與修飾相關蛋白酶,所以冠狀病毒培養(yǎng)或蛋白質表達體系不同會造成較大的糖鏈譜差異。Wang 等[43]通過特征離子觸發(fā)電子轉移/高能碰撞解離質譜(signature ionstriggered electron-transfer/higher-energy collisional dissociation (EThcD) mass spectrometry) 發(fā) 現(xiàn),相比人源HEK 細胞系表達SARS-CoV-2、SARSCoV、MERS-CoV的S蛋白富含唾液酸等雜合型糖鏈結構,昆蟲SF9 細胞系表達的SARS-CoV-2、SARS-CoV 的S 蛋白含有大量寡甘露糖(paucimannosidic) 或 截 斷 的 糖 鏈(truncated glycans)。Shajahan 等[44]通過高分辨率質譜(LCMS/MS),檢測表達于HEK293 細胞系的SARSCoV-2 中S 蛋白并鑒定出17 個位點的N-糖鏈結構,而其余5 個位點未檢測出(N17、N603、N1134、N1158 和N1173)。這些N-糖鏈包括高甘露糖型、雜合型和復雜型共3種類型,其中高甘露糖型和復雜型糖鏈占比較高;末端唾液酸基團見于大多數(shù)糖鏈結構,尤其是位于NTD 附近的N234 和N282 的糖鏈上,推測這些位點的糖鏈調節(jié)對受體蛋白或抗體的結合[45-46];相比RBD 的N331 和N343 中以高甘露糖型和少量復雜型糖鏈,Antonopoulos 等[47]對同樣來源的這兩個位點則鑒定到富含巖藻糖修飾和少見的乳糖二胺(LacdiNAc,即GalNAcβ(1-4)GlcNAc)結構的復雜型N-糖鏈,這可能與僅表達RBD 片段等因素有關;但Tian 等[48]通過LC-MS對HEK293T來源的S蛋白N-糖鏈鑒定出19個位點的N-糖鏈位點(除N74、N1158 和N1173),其中N17和N1134糖鏈末端存在唾液酸結構,而N149、N165、N657、N709、N1134 與N1194 含巖藻糖結構;Watanabe等[49]研究表達于293F細胞系SARSCoV-2的S蛋白,他們發(fā)現(xiàn)22個N-糖基化位點均發(fā)生N-糖基化修飾。這些位點上16%的糖鏈含至少一個唾液酸殘基,48%的糖鏈發(fā)生了巖藻糖基化。
Fig.1 The N-J phylogenetic tree and the distribution of N-glycosylation sites in spike proteins of CoVs圖1 冠狀病毒S蛋白的N-J進化樹與N-糖基化位點分布
由于天然病毒的N-糖鏈結構與重組表達系統(tǒng)來源具有較大的差異[50],此外S 蛋白的每個N-糖基化位點呈現(xiàn)出微不均一性的特點,而非確定性的糖鏈結構[51]。因此宿主環(huán)境與表達系統(tǒng)影響病毒糖鏈結構,值得疫苗開發(fā)工作的注意。在世衛(wèi)組織列出180 余種應對COVⅠD-19 疫情的在研疫苗中,有3 種基于植物細胞表達[52],然而在植物中特有的N-糖鏈五糖核心木糖修飾可能會對人群產(chǎn)生免疫反應[53]。在結構免疫原病毒蛋白疫苗、減毒或滅活病毒疫苗、重組載體疫苗和核酸疫苗等應對COVⅠD-19的4類疫苗中[54],前兩種疫苗中糖鏈來源于多種培養(yǎng)體系,因此N-糖鏈不同形成的空間位阻差異會影響抗原位點的遮蔽效果[55],也會影響對細胞攝取、蛋白水解過程、MHC 提呈以及隨后的T細胞啟動等[56-57]。
O-糖基化是另一種常見于病毒蛋白上的糖基化修飾,其核心結構多樣。O-糖基化修飾多發(fā)于絲氨酸或蘇氨酸上,但無固定基序。通過生物信息學方法可進行O-糖基化位點預測,但準確率相比N-糖基化位點較低[58]。例如,有學者在COVⅠD-19大流行初期針對SARS-CoV-2的S蛋白進行O-糖基化位點預測,認為673S、678T和686S極具有修飾潛力,而19T、22T、29T、250T 和349S 的潛力較高[59]。但是Hajahan等[44]僅鑒定出S1亞基的T323和S325 發(fā)生了O-糖基化修飾,這些糖鏈結構以Core-1 和Core-2 類型的O-糖鏈為主。這兩個位點位于RBD,因此該位置的O-糖基化可能在與ACE2受體結合中發(fā)揮作用。隨后越來越多工作指出S蛋白存在豐富的O-糖基化修飾,例如Dong 等[60]通過LC-MS/MS 鑒定出26 個O-糖基化位點和33 種O-糖鏈結構。目前O-糖基化修飾對冠狀病毒中生物學功能尚不明確,有研究指出,抑制O-糖鏈結構修飾對結合ACE2影響較小,但可顯著降低病毒入侵細胞能力[61]。
O-糖基化修飾的發(fā)生也與宿主系統(tǒng)有關,Bagdonaite 等[62]通過建立的O-糖鏈分析技術比較了來源于昆蟲細胞系(S2) 與人源細胞系(HEK293T)表達SARS-CoV-2 的S 蛋白,發(fā)現(xiàn)共25個O-糖基化位點。這些位點分布除在RBD上略有差異外基本相同,例如僅人源細胞系來源的T478 發(fā)生了O-糖基化修飾。有意思的是,其中16個發(fā)生于已知N-糖基化位點中。他們解釋這些O-糖基化發(fā)生率較低,但可能會形成黏蛋白樣結構域以保護抗原表位或關鍵位點。Tian 等[48]同樣驗證HEK293T 來源SARS-CoV-2 的S 蛋白中17 個O-糖基化位點有11個發(fā)生在N-糖基化位點1至3個氨基酸附近(“N±1-3”),其中的4 個位點發(fā)生了唾液酸修飾(T236、S659、T1076 和T1077)。他們通過定點突變驗證N 糖基化位點是這些O-糖基化位點出現(xiàn)的先決條件,并將此現(xiàn)象稱之為“OFollow-N”[48]。這些結論對拓展病毒的O-糖基化研究有重要意義。
M 蛋白是形成冠狀病毒蛋白外殼的重要成分,其長度為200~250 個氨基酸,如SARS-CoV-2 的M蛋白有222 個氨基酸[63]。M 蛋白氨基酸相似性在屬間極低,屬內相對較高。盡管在生物大分子蛋白質數(shù)據(jù)庫(protein data bank,PDB)中缺少M蛋白相關完整的晶體結構,但生物學信息學分析指出其包含N 端胞外域、3 次跨膜區(qū)及較長的C 端胞內域[64-65]。M 蛋白招募其他結構蛋白進入ERGⅠC,并進一步控制子代顆粒組裝和出芽[66]。M 蛋白也可能參與結合宿主細胞,例如HCoV-NL63 的M 蛋白協(xié)同S蛋白參與結合含硫酸類肝素的蛋白多糖實現(xiàn)宿主入侵[67]。
目前發(fā)現(xiàn)0~4個潛在N-糖基化位點存在于各種冠狀病毒的M蛋白中。通常大多數(shù)M蛋白包含1個N-糖基化位點(圖2);但δ屬的HKU15-CoV未發(fā)現(xiàn) 相 應 位 點[68];HKU4-2-CoV 含 有 兩 個,N4 和N20[69];γ 屬 中 部 分ⅠBV 也 含 有 兩 個,N3 和N6[70];3個位點多見于α屬,例如PEDV(Porcine epidemic diarrhea virus)的N3、N19 和N189[71],HCoV-NL63 的N3、N19 和N188[72],HCoV-229E的N5、N190 和N207[73];部分HKU2-CoV 還含有4 個N-糖 基 化 位 點,如N6、N22、N192 和N235[74]。
SARS-CoV-2 的M 蛋白N5 是唯一的N-糖基化位點[59],SARS-CoV中類似位置糖基化位點是N4,多項研究結果顯示該位點出現(xiàn)了復雜型N-糖鏈類型。Voss 等[75]通過對該位點進行缺失突變,發(fā)現(xiàn)M 蛋白的N-糖基化對于病毒的組裝和感染是必不可少的,若該位點缺失則影響子代顆粒的組裝;然而,Liang 等[76]通過定點突變與反向遺傳學技術發(fā)現(xiàn),ⅠBV中N3和N6糖基化位點缺失突變并不影響病毒復制與子代顆粒組裝,但會對病毒毒力產(chǎn)生一定影響。
Fig.2 The glycosylation sites in S-protein of SARS-CoV-2圖2 SARS-CoV-2結構蛋白中N-糖基化位點分布
除N-糖基化修飾,MHV為代表的部分冠狀病毒也發(fā)現(xiàn)數(shù)目可變的O-糖基化修飾[77]。De Haan等[78-79]通過定點突變技術并觀察表達產(chǎn)物的電泳條帶,分析發(fā)現(xiàn)T5可能是M蛋白中發(fā)生O-糖基化修飾的位點,該糖鏈中包含N-乙酰半乳糖胺、半乳糖和唾液酸等;而如果MHV中O-糖基化位點被N-糖基化取代,會造成病毒顆粒重組的效率下降。
冠狀病毒N蛋白的結構保守且表達量豐富,通過與RNA 基因組形成螺旋狀結構在病毒的感染、復制和包裝等過程中發(fā)揮作用。早期對冠狀病毒N蛋白研究表明,N蛋白是一種磷酸化蛋白[80-82]。近來在SARS-CoV-2 的N 蛋白上發(fā)現(xiàn)5 個潛在的N-糖基化位點(N47、 N77、N192、N196 和N269),但利用O18同位素標記實驗證實只有N47和N269出現(xiàn)糖基化,而這兩個位點分別以復雜型和高甘露糖型N-糖鏈占優(yōu)勢[83-84];也有學者利用LC-MS/MS分析并證明N 蛋白上發(fā)生O-糖基化修飾的T148、T165、T166、T205、S206、T391 和S404[85]。作為參與組裝和釋放病毒顆粒的多功能E 蛋白[36],也可通過生物信息學預測出來N-糖基化位點的存在,例如SARS-CoV-2 的E 蛋白中N48 和N66 都是潛在的N-糖基化位點。然而多種跡象表面,E蛋白未發(fā)生N-糖基化修飾[42]。Lo Presti 等[59]還針對SARS-CoV-2的3A蛋白進行O-糖基化分析預測出4個潛在的O-糖基化位點,但未獲得實驗驗證。
部分冠狀病毒中還存在著HE 蛋白,它與丙型流感病毒等的HE 蛋白功能相似。在包括HCoVOC43、 HCoV-HKU1、 BCoVs (Bovine coronaviruse)和MHV等的β冠狀病毒屬中,HE蛋白也可通過與S 蛋白相互作用結合含唾液酸(N-acetyl-9-O-acetylneuraminic acid)的糖鏈實現(xiàn)入侵宿主[86-88]。HE 蛋白長度為420~440 個氨基酸,生物信息學預測發(fā)現(xiàn)在多種冠狀病毒中含6~9 個N-糖基化位點,例如MHV 病毒的HE 蛋白中N54、N89、N104、N153、N236、N301、N316、N358和N417 均為潛在N-糖基化位點,而HE 發(fā)生N-糖基化修飾也可通過糖鏈切割前后的凝膠電泳證明[89]。SARS-CoV和SARS-CoV-2的基因組中不含HE基因,因此并無此蛋白質見諸報道[90]。
生物信息學在針對冠狀病毒所產(chǎn)生大數(shù)據(jù)的分析和挖掘中發(fā)揮著重要作用。糖生物信息學(glycobioinformatics)用于冠狀病毒糖基化研究主要包括:蛋白質序列比對與進化分析、糖基化位點預測、結構生物信息學分析及質譜數(shù)據(jù)解析等,具有快速、安全與前瞻性的特點,但對于預測分析結果通常需要實驗驗證[91]。
針對糖基化位點在冠狀病毒各糖蛋白的分布與協(xié)同進化有助于了解糖基化修飾在病毒的生物學功能。N-糖基化位點出現(xiàn)高度保守,因此預測軟件眾多,而NetOGlyc-4.0在線服務等則可用于不保守的O-糖基化位點預測[92]。近些年更是出現(xiàn)了通過人工神經(jīng)網(wǎng)絡或人工智能對糖基化位點的預測[93-94]。本文有關冠狀病毒糖基化位點分析均涉及上述糖生物信息學方法(圖3)。
Fig.3 The research methods in the glycosylation of Coronaviruses圖3 冠狀病毒糖基化研究方法
由于糖蛋白純化結晶用于X射線晶體衍射的技術限制,PDB 收錄的生物大分子晶體結構中不含完整糖鏈結構。利用Glycosciences 網(wǎng)站Glyprot 在線程序能夠選擇將不同類型N-糖鏈添加到N-糖基化位點,從而揭示糖鏈對相關功能區(qū)的影響[95];GlyCAM 網(wǎng)站的Glycoprotein Builder 在線程序也具有相同的功能,并且進一步實現(xiàn)了O-糖鏈添加,因此最早發(fā)布了糖基化修飾SARS-CoV-2 的S 蛋白三維結構并用于與其他分子相互作用研究[96]。
質譜分析方法具有高靈敏度和分辨率,成為分析冠狀病毒糖蛋白糖鏈結構的常規(guī)操作工具[99-100]。針對病毒糖基化分析,核心的問題就是糖基化位點鑒定與糖鏈結構解析?;诨|輔助激光解吸電離(matrix assisted laser desorption ionization,MALDⅠ)和電噴霧電離(electrospray ionization,ESⅠ)等質譜分析是現(xiàn)代糖組學中最常用工具之一。
4.2.1 質譜分析N-糖基化
糖苷酶PNGase F 被用于釋放糖蛋白/糖肽上的N-糖鏈,并使肽段產(chǎn)生0.98 u分子質量的增加;另外Endo D/F/H三種內切糖苷酶均可將N-五糖核心兩個GlcNAc之間的糖苷鍵斷開,使肽段上增加了203 u或349 u的質量標簽,因此可作為質譜鑒定糖基化位點的標志[101]。使用肼解法以釋放N-糖鏈也是一種化學法去糖鏈策略[102]。
針對冠狀病毒S蛋白、M蛋白或HE蛋白N-糖鏈鑒定大多采用類似的操作流程:蛋白質分離純化、酶切成糖肽片段、糖苷酶切除N-糖鏈、糖鏈富集與純化和MALDⅠ-MS等質譜鑒定[103]。這些操作策略早在多種冠狀病毒N-糖基化中展開,例如ⅠBV[104]、 MERS-CoV[35]、 HCoV-HKU1[105]和SARS-CoV-2等[106-108]。
4.2.2 質譜分析O-糖基化
由于O-糖鏈的結構簡單多變、缺乏保守序列模式且沒有合適的酶切方法,所以大多數(shù)病毒缺失O-糖基化報道。O-糖鏈的切除通常采用以高碘酸氧化-β 消除法等為主的化學法[109]。針對糖蛋白O-糖基化分析依然采取蛋白質分離、酶解、糖肽富集和質譜鑒定等操作思路?;诓糠帜貙-糖鏈的親和力進行分離是最新出現(xiàn)的O-糖蛋白分離/糖肽富集方法,其中VVA、PNA 和Jacalin 等都是可選凝集素[110-111]。對于O-糖鏈的富集與處理一直在改進之中,例如Zhang 等[112-113]報道了基于PVDF 膜在96 孔板平臺的細胞樣本糖鏈處理方法,釋放的糖鏈無須染色或衍生便可用多孔石墨化碳納米液相色譜(porous graphitized carbon nano-liquid chromatography)串聯(lián)質譜法分析糖鏈結構。他們針對CHO 和HEK293 細胞系表達SARS-CoV-2 的RBD 進行O-糖鏈分析,同樣發(fā)現(xiàn)T323 和S325 中以O-糖基化多以Core-1 和Core-2 型為主。還有學者將O-糖鏈末端通過ST3GAL1糖基轉移酶標記帶熒光的唾液酸,隨后采用胰蛋白酶水解等方法研究糖鏈指紋圖譜。他們發(fā)現(xiàn)SF2和HEK293細胞系表達RBD分別以Core-1和Core-2糖鏈結構為主[114]。
以凝集素和糖芯片為代表的生物芯片被廣泛應用于病毒糖生物學研究。利用凝集素(或稱糖結合蛋白)對糖鏈結構具有不同特異性和親和力結合差異的特性,可聯(lián)合數(shù)種凝集素推斷SARS-CoV-2的S 蛋白糖鏈基本特征[115],也可將幾十種凝集素點制在一張片基,以實現(xiàn)高通量快速地分析樣本糖鏈譜(圖3)[116]。由于凝集素芯片可以分析糖苷鍵的連接方式,具備質譜技術暫時無法達到優(yōu)點,因此經(jīng)常用于聯(lián)合質譜技術分析糖鏈結構[117-118]。
糖鏈分子作為病毒膜蛋白的結合靶標已在多種病毒中獲得報道,而特異性糖鏈分布往往與病毒感染宿主的范圍密切相關,因此糖芯片技術通過將各種糖鏈點制在片基上用于快速篩選病毒蛋白潛在的糖鏈結合特異性。例如,針對流感病毒HA的糖芯片分析,通過比較對α-2,6唾液酸結構與α-2,3唾液酸結構的結合差異評估其宿主特異性[119],類似的工作也在BCoV 的研究中進行[120]。針對MERSCoV的S蛋白進行糖芯片分析,發(fā)現(xiàn)其具有較強唾液酸結合能力,尤其是對α-2,3 唾液酸糖鏈[121]。Hao等[122]則制備了包含有多種在糖胺聚糖中常見的糖鏈結構,證實SARS-CoV-2 的S 蛋白也存在著對硫酸肝素的高度親和能力。Heidepriem等[123]則通過糖芯片分析愈后血清中SARS-CoV-2產(chǎn)生抗體的糖鏈結合能力,反向推斷出SARS-CoV-2中存在大量高甘露糖的N-糖鏈。此外糖組學研究的門戶網(wǎng) 站CFG (Consortium for Functional Glycomics)也提供了商品化的糖芯片并在γ 屬的火雞冠狀病毒、珍珠雞冠狀病毒及鵪鶉冠狀病毒得到應用[124]。
定點突變在病毒蛋白糖基化功能研究方面充當著重要角色,將核苷酸序列進行突變,從而造成糖基化 位 點的 缺 失 或 添加[125]。Han 等[126]針 對SARS-CoV-2 的S 蛋白N-糖基化位點進行突變缺失,發(fā)現(xiàn)其中7 個位點(N109、N118、N119、N158、N227、N589和N699)對于與ACE2相互作用有重要影響,其中N227和N699增強了病毒的傳播能力。Bouwman 等[127-128]通過對ⅠBV 的S 蛋白RBD 區(qū)域附近N-糖基化位點進行突變、反向遺傳學操作和ELⅠSA法測定,最后發(fā)現(xiàn)5個N-糖基化位點缺失會造成對α-2,3 唾液酸結合能力的喪失,部分位點變化還會導致結合其他糖鏈的能力。假病毒包裝技術也應用于膜蛋白的定點突變研究,Li等[129]利用假病毒技術構建了一系列SARS-CoV-2病毒S蛋白糖基化位點缺失突變體,用以研究一組中和抗體和恢復期病人血清。他們發(fā)現(xiàn)N331 和N343糖基化位點缺失顯著降低了感染性,N234缺失對顯著提高病毒對中和抗體的拮抗能力而N165缺失增強了對抗體的敏感性。總之定點突變技術在病毒糖基化的應用較為成熟,在疫苗和抗體的開發(fā)中已得到廣泛應用。
當下肆虐的新冠病毒引起了全球對冠狀病毒的關注,針對病毒相關研究和探討也在不斷展開和深入。糖基化修飾在病毒入侵與離開宿主細胞、引發(fā)免疫反應以及針對病毒的檢測與治療等幾乎所有環(huán)節(jié)均發(fā)揮不同作用。本文通過歸納冠狀病毒中S蛋白和M 蛋白等糖蛋白中糖基化修飾位點的分布、糖鏈結構和相關功能等,促進了對糖基化修飾在病毒的認知;對諸如糖生物信息學、生物芯片、質譜解析等糖生物學相關技術進行的總結提供了從糖生物學角度研究冠狀病毒的方法。這些內容將提高糖基化在冠狀病毒的病原學、流行病學和傳染機制等領域的重視程度,推動冠狀病毒相關的感染、傳播、診斷、治療和預防等研究工作,為盡早結束新冠大流行提供支持。