李 馮,賓 晟,孫更新
(青島大學計算機科學技術(shù)學院,山東 青島 266071)
截至2021年4月18日,中國累計報告新型冠狀病毒肺炎(COVID-19)確診病例103 274人,全世界累計確診病例141 381 051人。新型冠狀病毒作為一種新型傳染病毒,其流行病學、發(fā)病率、突變頻率、基本再生數(shù)等傳播特性和以往有很大不同,不僅具有潛伏期且處于潛伏期的患者具有傳染性,在病毒感染者中存在大量的無癥狀感染者。在醫(yī)療檢測條件尚未完備的疫情初期,無癥狀感染患者極難被發(fā)現(xiàn),這意味著此類病毒攜帶者在不受控制的情況下自由傳播病毒,屬于非常危險的一類群體。在傳染病模型的研究中考慮無癥狀感染患者的影響是十分必要的,相應(yīng)的研究成果也能為今后具有相似傳播特性的病毒防控提供重要參考。
自新型冠狀病毒爆發(fā)以來,國內(nèi)外研究人員利用傳播模型做了大量有關(guān)COVID-19的研究工作[1-6]。其中大多數(shù)研究都是基于SIR[7]、SEIR[8]等經(jīng)典傳播模型的改進:喻孜等人[9]采用基于時變參數(shù)的SIR模型對疫情進行評估和預測,得到了預期拐點和最大確診數(shù);Joseph T Wu等人[10]基于SEIR模型,利用馬爾科夫鏈蒙特卡羅算法估計了基本再生數(shù),并預測了COVID-19的傳播風險;林俊峰[11]在傳統(tǒng)SEIR模型基礎(chǔ)上,重新將潛伏者定義為體溫檢測和出行軌跡中存在疑點的人群,將感染者定義為“可疑人群”中被確診感染COVID-19的人群;文獻[12]提出了一種SIRU模型,此模型首次提出了未報告的有癥狀病例的數(shù)量,并且在不同等級的公共衛(wèi)生防控措施上預測疾病趨勢;文獻[13]提出了一種SEllaHR模型,研究了隱性感染和隔離對COVID-19的影響;Ivan Korolev等人[14]將死亡病例單獨建立艙室,提出了SEIRD模型;Zhai Z M等人[15]建立了一個新的預測建模,通過逆推理分析確定了美國、英國、意大利和西班牙的COVID-19開始于元旦前后。然而,目前大多數(shù)針對COVID-19的傳播模型研究具有以下3個缺陷:1)模型中涉及的參數(shù)都是固定不變的,但在實際情況中,部分參數(shù)將隨時間變化;2)涉及的影響因素過于簡單,未充分考慮COVID-19的傳播特性;3)模型中狀態(tài)的定義不符合實際群體特征?;谏鲜?,本研究考慮新型冠狀病毒特有的傳播特性,引入無癥狀感染狀態(tài),重新定義了潛伏者為病毒傳播過程中的密切接觸者,建立了基于時變參數(shù)的SCUIR傳染病模型。
根據(jù)疫情實際傳播情況,本文所建立模型基于如下假設(shè):
1)忽略少數(shù)非接觸性傳播病例。
2)假設(shè)確診者出現(xiàn)癥狀且被隔離后,不再與易感者接觸。
3)忽略病毒傳播期間人口的自然死亡及自然出生。
4)不考慮連續(xù)變化情況,只考慮以天為單位的離散變化。
在傳統(tǒng)的SEIR模型中,研究對象存在的狀態(tài)通常分為S(Susceptible)、E(Exposed)、I(Infected)、R(Removed)4種類型,詳細解釋如下:
1)S:易感者,表示健康人群,接觸傳染源可被感染。單位時間內(nèi)平均有λ個易感者與感染者接觸,接觸后被傳染的概率為φ。
2)E:潛伏者,表示感染了病毒但尚未出現(xiàn)癥狀的人群。此階段病毒尚未發(fā)作,不具有傳染性。單位時間內(nèi)會有比例ρ的潛伏者出現(xiàn)癥狀轉(zhuǎn)化為感染者,其中ρ為潛伏期的倒數(shù)。
3)I:確診者,表示已經(jīng)出現(xiàn)癥狀的染病者,具有較強的傳染性,可將易感者同化。
4)R:移除者,表示感染病毒后死亡或康復的人,感染者在痊愈后獲得抗體,不會再恢復到易感狀態(tài),感染者單位時間內(nèi)的移除率為γ。
圖1展示了SEIR模型各狀態(tài)之間的轉(zhuǎn)換,可以看出模型相對簡單,不足以模擬COVID-19的實際傳播情況。
圖1 傳統(tǒng)SEIR模型示意圖Fig.1 Schematic diagram of the traditional SEIR model
在COVID-19的防控中,主要存在兩個傳播特點:1)病毒的密切接觸者通過一段時間的隔離觀察,可以確定是否被傳染,因此可以通過追蹤密切接觸者來監(jiān)控病毒傳播情況;2)存在大量具有傳染性的無癥狀感染者,這部分人群攜帶病毒但卻被當成健康人,在被發(fā)現(xiàn)或出現(xiàn)癥狀前一直處于自由傳播狀態(tài),在醫(yī)療檢測條件并不充足的疫情初期,無癥狀感染者難以被第一時間發(fā)現(xiàn)并隔離,所以此類人群對疫情的發(fā)展將產(chǎn)生重要影響。
綜上所述,本文基于SEIR模型做出如下改進,提出SCUIR模型:
1)重新定義潛伏者(E)為病毒的密切接觸者C(Contacted),即未采取有效防護措施與傳染源近距離接觸的易感者。此類人群可能攜帶病毒也可能不攜帶病毒,密切接觸者中的病毒攜帶者當處于醫(yī)學觀察或被隔離狀態(tài)時,一旦出現(xiàn)癥狀將立即成為確診病例,而未攜帶病毒的密切接觸者經(jīng)過觀察期后回歸到易感人群中。
2)引入無癥狀感染者狀態(tài)U(Undiscovered)。將病毒傳播過程中未出現(xiàn)癥狀且混在健康人群中的病毒攜帶者定義為無癥狀感染者(U),此類人群具有傳染能力卻未被發(fā)現(xiàn),未受到任何強制隔離措施,在病毒潛伏期一直處于自由傳播狀態(tài),這種情況下,其傳播能力將遠大于攜帶病毒的密切接觸者(C),將無癥狀感染者群體單獨分離建立的傳染病模型更能模擬出真實的傳播情況。
3)重新定義確診者(I)。由于密切接觸者(C)群體處于實時監(jiān)控狀態(tài),出現(xiàn)臨床感染癥狀后會被第一時間執(zhí)行嚴格的隔離措施,并且隨著疫情防控措施的升級,無癥狀感染者(U)出現(xiàn)癥狀后也會第一時間做核酸檢測或上報政府,進而被隔離。在絕大多數(shù)情況下,處于隔離治療狀態(tài)的感染者不會再與易感者接觸,直至死亡或治愈出院。故本文認為確診者(I)不具備傳染性。
本文提出的SCUIR模型中各狀態(tài)轉(zhuǎn)換示意如圖2所示:
圖2 SCUIR模型示意圖Fig.2 Schematic diagram of the SCUIR model
本研究認為易感者(S)可被感染病毒的密切接觸者(C)、無癥狀感染者(U)傳染。病毒感染者在被確診后,與他在無有效防護情況下有過密切接觸的人就會被轉(zhuǎn)化為密切接觸者(C),假設(shè)感染病毒的密切接觸者在潛伏期間平均密切接觸λ1個易感者(S),被確診的無癥狀感染者在未出現(xiàn)癥狀前平均密切接觸λ2個易感者(S),無癥狀感染者(U)在單位時間內(nèi)可將α個易感者傳染轉(zhuǎn)化為無癥狀感染者。則易感者的動力學方程可表示為
(1)
密切接觸者(C)可由易感者(S)轉(zhuǎn)化,感染病毒的密切接觸者(占C比例為p)在經(jīng)過病毒潛伏期后出現(xiàn)癥狀,轉(zhuǎn)化為感染者(I),μ為單位時間內(nèi)感染病毒的密切接觸者轉(zhuǎn)化為感染者的比例,同時未感染病毒的密切接觸者(占C比例為1-p)經(jīng)過觀察期后回歸易感狀態(tài)。則密切接觸者(C)的動力學方程為
(2)
無癥狀感染者(U)可通過接觸將病毒傳播給易感者(S),將其轉(zhuǎn)化為U類人群,也可能在檢測時被發(fā)現(xiàn)感染病毒,轉(zhuǎn)化為確診者(I)。無癥狀感染者分為兩類,一類是由于監(jiān)測措施尚未到位,健康群體中存在許多未檢測出來的病毒攜帶者,另一類人群攜帶病毒,但是由于機體免疫力較強,未出現(xiàn)染病癥狀,經(jīng)過一段時間會自愈。無癥狀感染者的動力學方程為
(3)
密切接觸者(C)出現(xiàn)臨床癥狀后被確診成為感染者(I),無癥狀感染者在經(jīng)過潛伏期后出現(xiàn)癥狀也會被確診,感染者(I)經(jīng)過隔離治療后會康復或死亡,從而轉(zhuǎn)化為移除者(R)。感染者(I)的動力學方程為
(4)
移除者(R)由無癥狀感染者(U)中的自愈者和感染者(I)中的康復者或死亡者組成,其動力學方程如式(5)所示。
(5)
官方公布的數(shù)據(jù)均以天為單位,因此本文僅考慮離散變化情況,將微分方程轉(zhuǎn)換為如式(6)的差分方程。
(6)
本文所建立的模型中共包含9個參數(shù),其詳細含義如表1所示。根據(jù)官方公布的真實數(shù)據(jù),可以對{α,β1,β2,μ}的值進行估計,{λ1,λ2,p}的值無法通過已知數(shù)據(jù)直接獲取,將采用參數(shù)反演來測定最優(yōu)值。
表1 模型參數(shù)解釋Tab.1 Model′s parameters
參數(shù)優(yōu)化方程式如(7),優(yōu)化目標為實際數(shù)據(jù)值與模擬數(shù)據(jù)值的偏差最小。本文介紹兩種式(7)的求解方法,其中一種是,在已知{α,β1,β2,μ}值的情況下,分別求{λ1,λ2,p}的偏導數(shù),得到一個三元方程組,求解方程組即可得到參數(shù)最優(yōu)值,此外,也可采用枚舉法得到最優(yōu)值。
(7)
考慮部分參數(shù)會隨時間增長發(fā)生變化,故本文將其設(shè)置為時變參數(shù)。設(shè)γc,t和γd,t分別為日治愈率和日死亡率,其數(shù)值為當天新增出院人數(shù)和新增死亡人數(shù)占前一天感染者人數(shù)的比率,對實際數(shù)據(jù)進行擬合,結(jié)果如圖3所示。
圖3 時變參數(shù)擬合結(jié)果Fig.3 Fitting results for time-varying parameter
湖北省的治愈率和死亡率呈現(xiàn)出明顯的隨時間變化而變化的趨勢(見圖3),因此,采用時變參數(shù)才能正確模擬疫情發(fā)展的真實情況。時變參數(shù)擬合結(jié)果使用Power函數(shù)描述,結(jié)果如表2所示。
表2 時變參數(shù)擬合結(jié)果Tab.2 The fitting results for time-varying parameter
本研究基于中國湖北省衛(wèi)生健康委員會官網(wǎng)(http://wjw.hubei.gov.cn)公布的湖北省2020年1月15日—2020年4月26日的疫情數(shù)據(jù)進行實驗。為驗證本文模型的性能優(yōu)越性,同時基于SIR模型、SEIR模型進行模擬實驗,并對比結(jié)果,評價指標為與實際活躍病例數(shù)的均方根誤差(RMSE)和平均相對誤差(MAPE)。由于2020年2月12日之前,國家衛(wèi)生健康委員會公布的確診病例數(shù)據(jù)不包括臨床診斷病例,導致實際數(shù)據(jù)在2020年2月12日出現(xiàn)斷層。此外,在中國政府針對新冠肺炎疫情采取的一系列重要措施的影響下,新增確診人數(shù)于2020年3月18日實現(xiàn)了第1次新增確診人數(shù)為0,標志著疫情被基本控制。綜合以上數(shù)據(jù)特征,本文選取湖北省2020年1月25日至2020年3月18日的數(shù)據(jù)進行擬合,并以2020年2月12日為時間節(jié)點,分為兩個時間段進行分析:1)第1階段為2020年1月25日至2020年2月11日;2)第2階段為2020年2月12日至2020年3月18日。
疫情初期官方公布的數(shù)據(jù)中并未包括無癥狀感染者數(shù)量,本文根據(jù)無癥狀感染者占活躍病例的平均比例來設(shè)定U0值,S0值為去除非易感狀態(tài)人群的湖北省總?cè)丝?,{C0,I0,R0}值采用2020年1月25日湖北省的真實數(shù)據(jù),實驗結(jié)果如表3、圖4所示。圖4顯示:SIR模型擬合結(jié)果在2月5日前明顯低于實際值,并于2月11日呈現(xiàn)出提前出現(xiàn)拐點的趨勢;SEIR模型擬合結(jié)果呈現(xiàn)出加速上漲趨勢,至2月12日較真實數(shù)據(jù)誤差超過14%;SCUIR模型擬合趨勢明顯更好,并且相對誤差始終保持在4%以內(nèi)。表4展示了3種模型的評價結(jié)果,SCUIR模型的擬合精度最高,其中,均方根誤差值(RMSE)比SIR模型縮小了14%,比SEIR模型縮小了39%,平均相對誤差值(MAPE)比SIR模型縮小了16.8%,比SEIR模型縮小了32%。
表3 湖北省第1階段參數(shù)值Tab.3 The first stage simulation parameter value of Hubei Province
圖4 第1階段模擬結(jié)果Fig.4 The first stage simulation results
表4 第1階段模型評價Tab.4 The evaluation for the first stage model
表3所示第1階段各參數(shù)值中,無癥狀感染者平均感染人數(shù)達到了0.473人,這表明:由于民眾自我防控意識低、醫(yī)療檢測條件尚未完善等原因,導致無癥狀感染者完全屬于自由傳播狀態(tài),屬于高傳播風險水平。密切接觸者的密切接觸人數(shù)λ1與無癥狀感染者的密切接觸人數(shù)λ2分別為1.18人、2.11人,λ2值為λ1值的1.78倍,說明無癥狀感染者的危險性要遠高于密切接觸者中的病毒攜帶者。此外,第1階段密切接觸者中的病毒攜帶者比例(p值)達到35.5%,這表明通過追蹤并隔離密切接觸者人群可以控制大部分被傳染的患者,從而有效防止病毒的進一步擴散。
第2階段模型初始值設(shè)置為湖北省衛(wèi)生健康委員會官網(wǎng)2020年2月12日公布的數(shù)據(jù),由于第2階段國家采取的防控措施與第1階段存在差異,將導致模型參數(shù)發(fā)生變化,實驗結(jié)果如表5、圖5所示。
表5展示了湖北省疫情第2階段的實驗結(jié)果,其中,無癥狀感染者平均感染人數(shù)α較第1階段減小了94.1%,無癥狀感染者平均密切接觸人數(shù)λ2減小了40.3%,說明隨著中國政府限制大規(guī)模集會、控制出行等措施的開展以及民眾自我防護意識的增強,疫情正在被有效控制。另外,無癥狀感染者的日確診率β1增大了3.83倍,說明隨著病毒檢測周期的縮短,隱藏在人群中的無癥狀感染者在被快速發(fā)現(xiàn)。觀察圖5、表6可以看到本文模型很好地復現(xiàn)了2020年2月12日至2020年3月18日湖北省疫情發(fā)展趨勢,并且相比于SIR模型的RMSE值、MAPE值分別縮小了9.5%,8.3%,比SEIR模型的RMSE值、MAPE值分別縮小了10.5%,13.2%,進一步體現(xiàn)了本文模型的優(yōu)越性。
表5 湖北省第2階段參數(shù)值Tab.5 The second stage simulation parameter value of Hubei Province
圖5 第2階段模擬結(jié)果Fig.5 Second stage simulation results
表6 第2階段模型評價Tab.6 The evaluation for the second stage model
對完整時間段(2020年1月25日—2020年4月26日)的回溯中,2020年1月25日—2020年2月12日數(shù)據(jù)采用調(diào)整后的數(shù)據(jù)(加上2月12日之前官方未公布的臨床診斷病例)。圖6a展示了3種模型的擬合結(jié)果,從宏觀趨勢來看,SCUIR模型的擬合結(jié)果相比較于SIR模型、SEIR模型與實際疫情發(fā)展趨勢最為吻合。其中,SIR模型由于未能考慮疾病的潛伏期、無癥狀感染者等傳播特性,導致擬合結(jié)果中的活躍病例數(shù)呈現(xiàn)隨時間快速上升/下降,擬合活躍病例數(shù)峰值大于疫情的實際規(guī)模且峰值出現(xiàn)時間有較大偏差。SEIR模型雖然考慮了疾病的潛伏期,但是未考慮無癥狀感染者的自愈以及確診者的嚴格隔離對病毒傳播的阻斷作用,盡管模型擬合的活躍病例數(shù)峰值出現(xiàn)的時間與實際情況很接近,但是其模擬結(jié)果與實際疫情發(fā)展規(guī)模依舊存在較大偏差。而SCUIR模型補充了上述模型的不足,并且治愈率、死亡率采用了更為合理的時變參數(shù),因此,實驗結(jié)果中的病例數(shù)峰值出現(xiàn)時間、疫情發(fā)展趨勢都與實際數(shù)據(jù)最為吻合,模擬精度最高,與實際數(shù)據(jù)的擬合誤差較SIR模型、SEIR模型分別縮小了47.6%,26.4%。
除了官方數(shù)據(jù)涉及的人群分類,SCUIR模型還能夠計算出官方數(shù)據(jù)無法完全統(tǒng)計的無癥狀感染人群數(shù)量(見圖6b)。無癥狀感染者在未采取隔離措施的情況下自由傳播病毒,具有相當大的危險性,在整個疫情傳播期間持續(xù)出現(xiàn)了無癥狀感染病例,尤其在疫情后期,現(xiàn)存無癥狀感染病例數(shù)量甚至超過了活躍確診病例數(shù)量,因此,政府等相關(guān)機構(gòu)不可放松警惕,應(yīng)加強對無癥狀感染者的發(fā)現(xiàn)、報告和管理工作。
本文結(jié)合COVID-19的特殊傳播特性,采用時變參數(shù),提出了一種包括“易感狀態(tài),密切接觸狀態(tài),無癥狀感染狀態(tài),確診狀態(tài),移除狀態(tài)”等5類狀態(tài)的SCUIR傳播模型。利用中國湖北省的真實疫情數(shù)據(jù)進行了實驗驗證,結(jié)果表明:1)SCUIR模型對于COVID-19的歷史數(shù)據(jù)具有更高的擬合精度,各離散點的相對誤差基本在5%以內(nèi),比SIR模型總體降低了8.3%~47.6%的擬合誤差,比SEIR模型總體降低了10.5%~32%的擬合誤差;2)SCUIR模型可以挖掘出在實際疫情數(shù)據(jù)統(tǒng)計中難以完全統(tǒng)計的隱藏數(shù)據(jù),例如本實驗中的無癥狀感染者數(shù)量,進一步刻畫了疫情傳播機理。不僅如此,本文模型可以通過定量控制參數(shù)模擬不同防控措施,相應(yīng)的模型擬合結(jié)果可以更直觀地評估不同措施對疫情發(fā)展的影響,有利于制定合理、高效的防疫政策??偠灾琒CUIR模型對于與COVID-19有相似傳播特性的疫情防控有較大的指導和參考價值。