馮 驍 孟子延 高 楊 徐祥雄 馬丹婧 李琦涵
根據(jù)基因組序列的進(jìn)化分析,新型冠狀病毒SARS-CoV-2屬于正冠狀病毒亞科、β冠狀病毒屬,是感染人類的冠狀病毒家族中的第7個成員[1,2]。SARS-CoV-2的S蛋白能與血管緊張素轉(zhuǎn)化酶2(angiotensin converting enzyme-2,ACE2)蛋白結(jié)合從而感染細(xì)胞,入侵宿主[3]。ACE2 蛋白廣泛存在于口腔、鼻黏膜、鼻咽、肺、胃、小腸、結(jié)腸等人體器官和組織中,其在肺泡上皮細(xì)胞和小腸上皮細(xì)胞表面表達(dá)量較高,這為SARS-CoV-2提供了可能的入侵途徑[4]。SARS-CoV-2致死性與 MERS-CoV和SARS-CoV相比較弱,但SARS-CoV-2卻具有在人群中傳播的高風(fēng)險[5,6]。
病毒的基因組決定了其高傳播性[7]。隨著時間的發(fā)展,病毒在人群中的不斷傳播會使其發(fā)生基因突變,進(jìn)而可能導(dǎo)致病毒致病特性的改變。本研究意在探究SARS-CoV-2各分支的時空傳播規(guī)律及人群傳播特點(diǎn),以期從分子流行病學(xué)的角度分析不同突變分支的致病特性,為病毒的致病機(jī)制研究提供線索。
1.基本資料:GISAID來源的2019年12月24日~2020年7月10日的病例元數(shù)據(jù)共3247條,包含分支、來源、性別、年齡、采樣日期等信息。全球疫情共享網(wǎng)站GISAID截止到2020年7月18日共收錄了來自全球200多個國家和地區(qū)的全基因組測序數(shù)據(jù)60830條。該網(wǎng)站根據(jù)其系統(tǒng)發(fā)育樹聚類分析將SARS-CoV-2分為S、L、V、O、G、GR、GH等7種分支。
2.方法:從元數(shù)據(jù)的信息中篩選出性別、年齡、病毒株型等信息,進(jìn)一步整理獲得株型-采樣日期信息、年齡-分支信息、性別-分支等信息。統(tǒng)計每個月中各分支的占比。以年齡劃分組別,每20歲劃分為一組,統(tǒng)計各組中每種分支的數(shù)量;以性別劃分組別,統(tǒng)計各組中每種分支的數(shù)量。
3. 統(tǒng)計學(xué)方法: 繪制各分支隨時間發(fā)展的占比變化面積圖。利用SPSS 22.0統(tǒng)計學(xué)軟件分析各分支在各個年齡段(0~19歲、20~39歲、40~59歲、≥60歲)及性別之間占比的差異,以P<0.05為差異有統(tǒng)計學(xué)意義。
最終獲得有效的分支-采樣日期信息2649條,性別-分支信息2117條,年齡-分支信息2200條。
截止到2020年1月底,按照GISAID網(wǎng)站上6萬多基因組構(gòu)成的系統(tǒng)進(jìn)化樹的分型分析,分支L最先被檢測到且占比最大,其次是分支S、O。SARS-CoV-2的7種分支已于2020年1月底前完成從原始株的變異分化,并相對穩(wěn)定的遺傳至今??傮w來看,分支L、S、O隨時間的變化逐漸減少,G系列分支逐漸增多,現(xiàn)為全球主要流行株系(圖1)。當(dāng)然,系統(tǒng)發(fā)育樹以及分支命名是隨基因組的增加而動態(tài)變化的。以現(xiàn)有的系統(tǒng)發(fā)育分型來命名疫情發(fā)生之初的分支也是基于穩(wěn)定的變異位點(diǎn)。穩(wěn)定變異有助于新型冠狀病毒傳播過程中的適應(yīng)性進(jìn)化,種內(nèi)變異的發(fā)現(xiàn)有助于了解病毒的演化方向和流行趨勢,為新型冠狀病毒監(jiān)測和溯源提供參考依據(jù)。
圖1 各分支的流行變化情況
總體比較各分支在各年齡段分布的差異(表1),SARS-CoV-2的7種分支在各年齡段的分布比較,差異有統(tǒng)計學(xué)意義(P=0.000)。進(jìn)一步將每兩組進(jìn)行比較,除了0~19歲組與20~39歲組間比較差異無統(tǒng)計學(xué)意義(P=0.679),其余的組間比較差異均有統(tǒng)計學(xué)意義(表2)。從圖1中可直觀觀察到組間差異明顯的分支,分支O隨著年齡的增加占比增加,相反分支G、S隨著年齡的增加占比減少(圖2)。比較各分支的分布在不同性別間的差異,SARS-CoV-2的7種分支在不同性別間的占比比較差異無統(tǒng)計學(xué)意義(P=0.114,表3)。
表1 不同分支在各年齡段的分布及方差分析
表2 不同分支在各年齡段分布的兩兩比較(方差分析)
圖2 各分支在各年齡段的占比分布
表3 各分支在不同性別的分布及秩和檢驗(yàn)
SARS-CoV-2暴發(fā)以來的1個月內(nèi)已經(jīng)傳播至各個大洲并初步進(jìn)化為如今的7種分支,由此可見SARS-CoV-2具有非常高的傳播力和快速突變的特性。L、S分支為主要流行株,而后被G系列分支所取代,并在短時間內(nèi)成為全球流行株。SARS-CoV-2各分支在各年齡段的占比存在顯著差異,這似乎提示了各分支具有一定的人群偏好,而各分支在性別中的占比差異無統(tǒng)計學(xué)意義。
目前對于疫情的起源眾說紛紜,本研究結(jié)果顯示,疫情之初分支L最先被檢測到且占比最大,其次是分支S、O[8~10]。有專家從全基因組測序和系統(tǒng)發(fā)育樹等結(jié)果分析,分支S比L更古老,推測分支S是最先出現(xiàn)的原始毒株[11]。當(dāng)然,病毒的發(fā)生、發(fā)展是復(fù)雜的過程,這需要將流行病學(xué)調(diào)查與全基因組測序結(jié)合起來,找到中間宿主,才能真正判斷病毒的起源。
可直觀地分析出目前G、GH、GR分支為全球主要流行毒株,G系列分支以D614G突變?yōu)樘卣鱗12]。從病毒本身的角度出發(fā),其獨(dú)特的突變位點(diǎn)D614G可能改變了病毒的特性,造成其進(jìn)一步的傳播。另外,各個國家和地區(qū)的防控政策、隔離措施、反應(yīng)速度、執(zhí)行力度的不同,以及各種措施的滯后加上復(fù)雜的人口流動等都有可能加速其傳播。
本研究結(jié)果顯示,SARS-CoV-2各分支在各年齡段的分布存在顯著差異,這似乎提示了各分支具有一定的人群偏好。分支O隨著年齡的增加占比增加,相反分支G、S隨著年齡的增加占比減少。據(jù)流行病學(xué)調(diào)查顯示,隨著年齡的增加,SARS-CoV-2的患病風(fēng)險和重癥風(fēng)險都會顯著增加[13~15]。據(jù)此推測,相對其他年齡段,老年人中O分支占比多,G、S分支占比少可能是導(dǎo)致老年人易感的原因??傊?,本研究為探究老年易感染SARS-CoV-2提供了一種新思路——病毒不同突變位點(diǎn)可能會與老年人的人體狀況相適應(yīng),進(jìn)而使老年群體易患SARS-CoV-2。
據(jù)流行病學(xué)調(diào)查顯示,男性比女性更易感染,且男性的相關(guān)死亡風(fēng)險比女性高1.59倍[13,16]。本研究結(jié)果顯示,各分支在男性、女性中的分布差異無統(tǒng)計學(xué)意義。這提示了各分支不具有性別偏好,病毒的不同分支不會使男性、女性感染SARS-CoV-2存在差異。另有研究顯示造成性別感染的差異可能是由于宿主原因。
綜上所述,SARS-CoV-2具有高傳播性和突變性,追溯病毒的起源還需更多的全基因組測序數(shù)據(jù)的支持。G系列分支成為全球流行株除了探究病毒本身的特性外,還需結(jié)合不同政策及人口流動等原因綜合分析。SARS-CoV-2各分支具有一定的人群偏好,病毒不同的突變位點(diǎn)可能與老年人群的身體機(jī)能相適應(yīng),進(jìn)而使老年群體易感。這為研究老年群體易感染SARS-CoV-2提供了一種新思路,為探究SARS-CoV-2的致病機(jī)制提供了思路。