阮嘉雯,胡鵬威,蔣潘虹,鞠長(zhǎng)燕,劉楚云,袁 夢(mèng),段永翔,陳 輝,俞慕華
人冠狀病毒NL63(Human coronavirus NL63,HCoV-NL63)是呼吸道感染中常見的病毒之一,臨床表現(xiàn)主要為病毒性感冒癥狀,在嬰幼兒、老年人和免疫缺陷患者中可引起肺炎或中樞神經(jīng)系統(tǒng)疾病[1-3]。Huang等[3]發(fā)現(xiàn)在臺(tái)灣因肺炎住院病例中HCoV-NL63檢出率為8.4%。2020年深圳市某看守所發(fā)生了一起由HCoV-NL63引起的呼吸道感染聚集性疫情,感染率為35.8%,遠(yuǎn)高于研究報(bào)道的HCoV-NL63感染率(1.0%~9.3%)[4-5]。在新冠肺炎疫情期間,本課題組所在的流感監(jiān)測(cè)實(shí)驗(yàn)室進(jìn)一步擴(kuò)大對(duì)轄區(qū)內(nèi)呼吸道感染疫情的病原學(xué)監(jiān)測(cè)譜,發(fā)現(xiàn)HCoV-NL63檢出率有所上升。現(xiàn)階段我國(guó)HCoV-NL63尚未有健全的監(jiān)測(cè)網(wǎng)絡(luò),國(guó)內(nèi)的報(bào)道主要集中在HCoV-NL63在呼吸道感染病例中的檢出率,但關(guān)于其全基因組序列信息、基因型特征及進(jìn)化變異規(guī)律的報(bào)道仍較少。
HCoV-NL63為有包膜的單股正鏈RNA病毒,全長(zhǎng)約27 538 bp,基因組結(jié)構(gòu)從5′端到3′端依次為5′UTR-ORF1a/1b-S-ORF3-E-M-N-3′UTR[6]。棘突蛋白(Spike protein,S)和膜蛋白(Membrane protein, M)是HCoV-NL63兩個(gè)重要的糖蛋白。研究發(fā)現(xiàn),M蛋白在HCoV-NL63感染早期扮演重要的角色,S蛋白與M蛋白的協(xié)同作用是病毒與受體細(xì)胞結(jié)合并介導(dǎo)膜融合的先決條件[7-9]。由于HCoV-NL63和可引起重癥肺炎的冠狀病毒SARS-CoV、SARS-CoV-2均以血管緊張素轉(zhuǎn)換酶2(Angiotensin-converting enzyme 2, ACE2)為受體,具有誘發(fā)嚴(yán)重下呼吸道感染的風(fēng)險(xiǎn)[10-11],因此,監(jiān)測(cè)HCoV-NL63遺傳變異和致病性仍具有重要的現(xiàn)實(shí)意義。
本研究對(duì)新冠疫情期間深圳市南山區(qū)呼吸道感染聚集性疫情[4]和散發(fā)疫情中獲得的4株HCoV-NL63核酸陽性樣本進(jìn)行全基因組測(cè)序,并結(jié)合GenBank數(shù)據(jù)庫中其他國(guó)家和地區(qū)HCoV-NL63流行株序列信息,對(duì)HCoV-NL63基因特征及S蛋白、M蛋白的N-糖基化位點(diǎn)進(jìn)行分析比較,在一定程度上豐富了我國(guó)HCoV-NL63分子流行病學(xué)監(jiān)測(cè)數(shù)據(jù),同時(shí)也為HCoV-NL63的診斷治療及防控提供數(shù)據(jù)支持。
1.1 標(biāo)本來源 本研究中4份HCoV-NL63核酸檢測(cè)陽性標(biāo)本分別來自于深圳市南山區(qū)一起呼吸道感染聚集性疫情[4]和學(xué)校呼吸道感染散發(fā)疫情的咽拭子標(biāo)本。
1.2 病毒檢測(cè)和基因測(cè)序 通過天隆核酸提取儀(西安天隆科技有限公司)提取咽拭子標(biāo)本中病毒總RNA,利用實(shí)時(shí)熒光定量PCR法(RT-PCR)檢測(cè)HCoV-NL63,試劑為15項(xiàng)呼吸道病原體快速檢測(cè)試劑盒(聯(lián)合醫(yī)學(xué))。HCoV-NL63核酸檢測(cè)陽性樣品由深圳華大基因科技有限公司進(jìn)行二代測(cè)序。
1.3 序列分析 在GenBank數(shù)據(jù)庫中篩選并下載1983—2018年全球HCoV-NL63流行株。進(jìn)一步對(duì)比剔除相同的HCoV-NL63核苷酸序列后,利用MEGA 6.0軟件對(duì)下載的具有代表性的55條HCoV-NL63全基因組序列構(gòu)建全基因組親緣關(guān)系進(jìn)化樹。采用最大似然法(maximum likelihood,ML),選擇計(jì)算得出的GTR+G替換模型構(gòu)建系統(tǒng)發(fā)生樹,并使用p-distance估計(jì)遺傳距離,bootstrap值選擇1000次引導(dǎo)重復(fù)測(cè)試準(zhǔn)確性,bootstrap值>60%認(rèn)為分組具有統(tǒng)計(jì)學(xué)意義。采用Bioedit軟件計(jì)算本研究獲得的HCoV-NL63毒株序列與GenBank數(shù)據(jù)庫中下載的其他國(guó)家和地區(qū)55條參考株全基因組序列氨基酸熵值,分析其變異情況。同源性比較及S蛋白、M蛋白氨基酸位點(diǎn)突變分析通過MEGA 6.0軟件完成。氨基酸突變位點(diǎn)分析選用B基因型參比株AY518894.1。
2.1 基因組序列信息 本研究通過二代測(cè)序技術(shù)獲得了4株HCoV-NL63全基因組序列(表1),推測(cè)其基因組結(jié)構(gòu)從5′端到3′端依次為5′UTR、ORF1a、ORF1b、S、ORF3、E、M、N、3′UTR,基因組兩端分別含有轉(zhuǎn)錄非翻譯區(qū)(UTR)。
表1 4株HCoV-NL63毒株信息
2.2 進(jìn)化樹分析 將本研究中獲得的4株序列與GenBank數(shù)據(jù)庫中下載1983—2018年全球具有代表性的HCoV-NL63 S基因序列和全基因組序列構(gòu)建進(jìn)化樹分析。S基因的進(jìn)化樹分析結(jié)果顯示(圖1A),HCoV-NL63毒株劃分為A、B、C 3個(gè)基因型,其中本研究獲取的4株毒株均屬于B基因型B2基因亞型,在進(jìn)化樹上處于同一分支,與2018年廣州發(fā)現(xiàn)的MK334046.1、MK334047.1株親緣性關(guān)系較近。S基因的進(jìn)化樹跟全基因組進(jìn)化樹(圖1B)結(jié)果相似。
▲指本研究獲得的毒株。A: 以S基因序列構(gòu)建進(jìn)化樹; B: 以全基因組序列構(gòu)建的進(jìn)化樹。
2.3 序列同源性分析 將本研究中獲得的4株HCoV-NL63毒株和6株參考株的全序列進(jìn)行同源性分析,結(jié)果見表2。本研究獲得的4株毒株間的核苷酸(氨基酸)同源性為99.80%~99.98%(99.64%~99.93%),與2018年廣州發(fā)現(xiàn)的B基因型MK334046.1同源性為99.79%~99.90%(99.68%~99.84%),與B型參考株AY518894同源性為98.52%~98.59%(97.81%~97.90%);與原型株NC 005831.2同源性為97.64%~97.70%(96.85%~96.92%)。
表2 2020年深圳市南山區(qū)4株HCoV-NL63毒株與參考株全序列同源性分析
2.4 全基因組基因多態(tài)性分析 采用BioEdit軟件(v7.9.0)Entropy[H(X)]plot計(jì)算從NCBI數(shù)據(jù)庫中下載的55條HCoV-NL63流行株序列及本研究獲得的毒株序列各蛋白編碼區(qū)氨基酸位點(diǎn)的熵值。由圖2分析發(fā)現(xiàn),變異性較大的蛋白編碼區(qū)分別為ORF1ab蛋白、S蛋白和M蛋白。全基因組中變異熵值≥0.6的易突變氨基酸位點(diǎn)共有193個(gè),其中ORF1ab蛋白編碼區(qū)最多,有90個(gè),占蛋白編碼區(qū)總變異位點(diǎn)數(shù)46.6%;其次為S蛋白,有83個(gè)(43%)易突變位點(diǎn);M蛋白、N蛋白、E蛋白分別有9、5、2個(gè)位點(diǎn)。
圖2 全基因組各個(gè)蛋白質(zhì)編碼區(qū)氨基酸變異
將獲得的4株HCoV-NL63序列和B型的參考株進(jìn)行S蛋白、M蛋白氨基酸位點(diǎn)差異分析。結(jié)果發(fā)現(xiàn),S蛋白有48個(gè)單氨基酸多態(tài)性位點(diǎn)(圖3),其中在本研究從學(xué)校疫情獲得的3株毒株(NL63-SZNS02/2020、NL63-SZNS03/2020、NL63-SZNS04/2020)的S1蛋白區(qū)第196位均發(fā)生了亮氨酸→苯丙氨酸的突變;聚集性疫情NL63-SZNS01/2020毒株S2蛋白區(qū)第946位發(fā)生了氨基酸替換(A946S)。M蛋白有8個(gè)單氨基酸多態(tài)性位點(diǎn)(圖4)。
圖3 獲得的4株HCoV-NL63毒株與B型參考株S蛋白氨基酸差異位點(diǎn)比較
圖4 獲得的4株HCoV-NL63毒株與B型參考株M蛋白氨基酸差異位點(diǎn)比較
2.5 N-糖基化位點(diǎn)分析 通過NetNGlye 1.0在線預(yù)測(cè)了獲得的HCoV-NL63毒株S蛋白和M蛋白的N-糖基化位點(diǎn)。結(jié)果顯示,S蛋白有10個(gè)糖基化位點(diǎn)(閾值>0.5),分別為94 NISL、117 NVST、153 NATR、299 NFSS、424 NVSA、504 NISL、842 NVTS、850 NLSS、1216 NKTL、1245 NLSS;M蛋白的N-糖基化位點(diǎn)有2個(gè)(閾值>0.5),分別為3NSSV、19NFSW。
HCoV-NL63是目前已知的唯一能與SARS-CoV和SARS-CoV-2的受體ACE2結(jié)合,從而侵染細(xì)胞并在胞內(nèi)進(jìn)行病毒復(fù)制的α屬冠狀病毒[12]。Van等[13-14]發(fā)現(xiàn)在幾乎所有8歲以上兒童血清中均能檢測(cè)到針對(duì)HCoV-NL63的有效中和抗體,表明HCoV-NL63感染在嬰幼兒時(shí)期非常普遍。雖然HCoV-NL63臨床表現(xiàn)主要為輕微的呼吸道感染癥狀,但隨著病毒的持續(xù)傳播和進(jìn)化,其致病性也會(huì)發(fā)生變化。2018年Wang等[15]在廣州發(fā)現(xiàn)HCoV-NL63病毒的B基因型和C3亞型可誘發(fā)嚴(yán)重的下呼吸道感染癥狀,推測(cè)S蛋白R(shí)BD區(qū)域I507L位點(diǎn)的突變可能會(huì)加強(qiáng)HCoV-NL63的傳播力和致病力。因此,監(jiān)測(cè)HCoV-NL63基因遺傳變異特性,對(duì)評(píng)估HCoV-NL63流行風(fēng)險(xiǎn)和制定相應(yīng)的防控措施有著重要的作用。
本研究從聚集性疫情和散發(fā)疫情HCoV-NL63核酸檢測(cè)陽性標(biāo)本中,利用二代測(cè)序技術(shù)獲得了4株不同來源的HCoV-NL63全基因組序列,并進(jìn)行基因型鑒定和基因特征分析。結(jié)果顯示本研究中4株不同來源的HCoV-NL63毒株序列高度相似,并且與廣州肺炎病人的MK334046.1、MK334047.1在基因進(jìn)化樹形成一個(gè)獨(dú)立的進(jìn)化分支,提示來源于同一傳播鏈;對(duì)已報(bào)道深圳地區(qū)流行的HCoV-NL63毒株S蛋白進(jìn)行進(jìn)化分析,此次在南山區(qū)疫情中獲得的4株毒株與2014年深圳市流行的HCoV-NL63毒株被劃分為不同的基因亞型,推測(cè)深圳地區(qū)HCoV-NL63可能存在不同的傳播鏈,引起聚集性疫情和散發(fā)疫情的HCoV-NL63病毒源自廣州毒株的可能性大。由于目前已知的深圳地區(qū)HCoV-NL63毒株序列的時(shí)間空間覆蓋不足,尚不能全面的解釋深圳地區(qū)HCoV-NL63毒株變異變遷情況,后續(xù)仍需收集更多的流行毒株序列信息。
對(duì)熵值結(jié)果分析發(fā)現(xiàn),變異在基因組廣泛存在,結(jié)構(gòu)蛋白中S蛋白氨基酸變異最大,因此S蛋白經(jīng)常作為分子流行病學(xué)研究病毒傳播鏈的靶基因片段。前期研究發(fā)現(xiàn),S蛋白與M蛋白在病毒識(shí)別受體細(xì)胞、侵染細(xì)胞并在胞內(nèi)進(jìn)行病毒復(fù)制的過程中起著重要的作用[7]。S蛋白是冠狀病毒中最大的跨膜糖基化蛋白,胞外域可以被分成介導(dǎo)受體結(jié)合的S1和介導(dǎo)膜融合的S2兩個(gè)蛋白亞基。S1亞基是主要的功能區(qū),包含兩個(gè)功能域:N端結(jié)構(gòu)區(qū)(N-terminal region,NTR)和受體結(jié)合區(qū)(Receptor binding domain,RBD)(476~616 aa)[15-16]。目前認(rèn)為N端結(jié)構(gòu)區(qū)是S蛋白中基因變異頻率最高的區(qū)域,含有多個(gè)潛在的N-糖基化位點(diǎn)[17]。S2亞基進(jìn)一步使病毒包膜和細(xì)胞膜重新排列,拉近病毒膜和細(xì)胞膜間的距離,啟動(dòng)膜融合的發(fā)生,介導(dǎo)病毒侵入細(xì)胞[18]。與B型參考株相比,本研究獲得的4株HCoV-NL63株的S蛋白中發(fā)現(xiàn)2處氨基酸位點(diǎn)變異:位于散發(fā)疫情毒株S1蛋白NTR區(qū)L196F和位于聚集性疫情毒株S2蛋白A946S。A946S突變是否會(huì)影響聚集性疫情毒株與細(xì)胞膜融合過程從而引起感染率升高,仍需深入研究。進(jìn)一步對(duì)GenBank數(shù)據(jù)庫中HCoV-NL63病毒B基因型流行株序列分析發(fā)現(xiàn),2018年來中國(guó)廣東地區(qū)B基因型流行株中S1亞基94氨基酸發(fā)生了替換(K94N),增加了94位N-糖基化位點(diǎn)94 NISL。S1蛋白區(qū)域的N-糖基化位點(diǎn)增加可能會(huì)引起氨基酸空間構(gòu)象的改變,可能會(huì)在一定程度上幫助病毒逃逸宿主中和抗體識(shí)別[19-20]。本研究獲得的廣東地區(qū)HCoV-NL63 B基因型流行株中N-糖基化位點(diǎn)增加對(duì)病毒抗原性及機(jī)體免疫的影響還有待進(jìn)一步的探討。
M蛋白通過與宿主細(xì)胞表面硫酸肝素糖蛋白(HSPGs)結(jié)合,介導(dǎo)病毒附著于宿主細(xì)胞,在HCoV-NL63早期感染階段起著重要的作用。M蛋白包含一個(gè)氨基端膜外區(qū)、一個(gè)跨膜區(qū)和一個(gè)羧基端膜內(nèi)區(qū),氨基端153~226 aa區(qū)被認(rèn)為是HSPG結(jié)合位點(diǎn)[7, 21-22]。對(duì)GenBanK數(shù)據(jù)庫中HCoV-NL63病毒B基因型流行株M蛋白分析發(fā)現(xiàn),本研究發(fā)現(xiàn)M蛋白153~226 aa區(qū)域較為保守,與B型參比株相比均沒有發(fā)生氨基酸替換;在廣東流行株中均發(fā)現(xiàn)3個(gè)特異性的氨基酸位點(diǎn)變異(L43F、V76I、L122I),這些氨基酸位點(diǎn)的突變對(duì)HCoV-NL63的致病力和傳播能力的影響仍有待研究。
本研究對(duì)深圳地區(qū)聚集性疫情和散發(fā)疫情獲得的4株HCoV-NL63進(jìn)行全基因組測(cè)序和基因特征分析,初步分析了與病毒入侵相關(guān)的S蛋白、M蛋白的氨基酸變異情況及潛在的N-糖基化位點(diǎn),在一定程度上豐富了我國(guó)HCoV-NL63基因特征信息,為相關(guān)的防控工作提供生物學(xué)依據(jù)。
利益沖突:無
引用本文格式:阮嘉雯,胡鵬威,蔣潘虹,等.2020年深圳地區(qū)4株冠狀病毒HCoV-NL63基因組特征分析[J].中國(guó)人獸共患病學(xué)報(bào),2022,38(1):35-41.DOI:10.3969/j.issn.1002-2694.2021.00.178