周彩霞, 張濤, 滕懿振, 劉加榮
2019冠狀病毒疾病(coronavirus disease 2019,COVID -19)是由嚴(yán)重急性呼吸綜合征冠狀病毒2型(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)引起的。該病毒是一類β-冠狀病毒,有許多潛在的自然宿主、中間宿主和最終宿主,由于其具有較高的傳染性和傳播力,迅速導(dǎo)致了全球大流行,對公共衛(wèi)生系統(tǒng)構(gòu)成嚴(yán)重威脅[1-3]。為了遏制病毒的傳播,我國積極開展COVID -19疫情防控工作,包括大規(guī)模隔離、社會隔離、社區(qū)遏制和交通限制[4]。此外,政府不斷加大對COVID -19患者醫(yī)療資源的投入[5]。目前我國的疫情形勢已得到較好的控制,但無癥狀感染者具有病毒傳播能力,且臨床癥狀隱匿而無法有效識別,這容易形成防控措施的漏洞[6-9]。截至2020年7月14日24時,據(jù)31個省(自治區(qū)、直轄市)和新疆生產(chǎn)建設(shè)兵團報告,累計追蹤到密切接觸者767 432人,尚在醫(yī)學(xué)觀察的密切接觸者3 577人[10]。雖然,目前國內(nèi)疫情已基本穩(wěn)定,但密切接觸者可能會造成無癥狀感染者數(shù)量的上升,從而影響高校復(fù)學(xué)。學(xué)生數(shù)量較大的高校何時復(fù)學(xué),以及采取何種管控措施,降低在校感染的風(fēng)險,成為目前社會關(guān)注的重點。因此本研究通過建立數(shù)學(xué)模型,對世界主要國家的疫情發(fā)展趨勢進行預(yù)測,并對中國高校復(fù)學(xué)時間及方式進行分析。
根據(jù)國家衛(wèi)生健康委員會官網(wǎng)公開的疫情相關(guān)數(shù)據(jù),統(tǒng)計2020年1月22日—7月14日的中國內(nèi)地累計確診人數(shù)、累計死亡人數(shù)、累計治愈人數(shù)、累計密切接觸者數(shù)量、累計無癥狀感染者數(shù)量以及美國、意大利累計確診人數(shù),基于深度學(xué)習(xí)進行建模。
1.2.1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型本文通過Matlab軟件,構(gòu)建了三層BP神經(jīng)網(wǎng)絡(luò)(BPNN):輸入層(x),隱藏層(h),輸出層(y)。如圖1所示,該模型可依據(jù)疫情更新數(shù)據(jù)進行自我學(xué)習(xí),調(diào)整內(nèi)部的權(quán)重參數(shù),具有較好的識別、訓(xùn)練和容錯能力。定義的輸入和輸出節(jié)點數(shù)均為1個,時間作為輸入節(jié)點,確診人數(shù)作為輸出節(jié)點。通過經(jīng)驗公式設(shè)定隱含層節(jié)點數(shù)量為5個,目標(biāo)誤差設(shè)置在0.000 5,經(jīng)過多次擬合,選取學(xué)習(xí)效率為0.35,模型的預(yù)測精度較高。利用BP神經(jīng)網(wǎng)絡(luò)在復(fù)雜系統(tǒng)評價中具有的評價精度較高的優(yōu)點,考慮了三個分別采取了不同程度隔離措施的國家疫情數(shù)據(jù)樣本,根據(jù)數(shù)據(jù)擬合結(jié)果評價,中國隔離措施為嚴(yán)格,意大利隔離措施為一般嚴(yán)格,美國隔離措施為不嚴(yán)格。在此次建模過程中分別對2020年1月22日—2020年7月14日三個國家的疫情確診數(shù)據(jù)進行訓(xùn)練并預(yù)測了三個國家未來180天的疫情數(shù)據(jù)。鑒于數(shù)據(jù)樣本過小,本文訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)保持一致,均為全部數(shù)據(jù)集,以此來驗證模型的預(yù)測精度。
1.2.2 SEIR模型SEIR模型適用于具有一定潛伏期的傳染性疾病,是傳染病預(yù)測最為常用的模型之一。在SEIR模型中(見圖2),人群被定義為四部分:第一部分為易感者(susceptible),表示人群中易于被病毒感染的人數(shù),用S表示;第二部分為潛伏者(exposed),表示人群中感染未出現(xiàn)癥狀人數(shù),用E表示;第三部分為感染者(infectives),表示人群中患病的人數(shù),用I表示;第四部分為恢復(fù)人群(recovered),表示患病后恢復(fù)的人數(shù),用R表示;即N=S+E+I+R。P為感染系數(shù)1,代表易感人群與感染者接觸后被感染的概率。Pa為感染系數(shù)2,代表易感人群與潛伏者接觸被感染的概率,τ代表潛伏者轉(zhuǎn)化為感染者的概率,γ代表恢復(fù)概率。本文對各種傳染指標(biāo)進行了數(shù)據(jù)擬合,考慮了在采取不同管控措施及不同復(fù)學(xué)規(guī)模下,與感染者和潛伏者接觸的易感人群數(shù)量的變化,通過SEIR模型迭代未來300天的數(shù)據(jù)來分析潛伏者和感染者數(shù)量是否會存在二次高峰,以此來評價不同復(fù)學(xué)時間及復(fù)學(xué)方式的可行性。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)原理圖
圖2 SEIR模型
本研究利用MatlabR 2018、Python 3.7.0仿真平臺進行分析。
本研究統(tǒng)計了2020年1月22日-7月14日中國、意大利和美國官方報道的累計確診病例數(shù)。如圖3(A-C)所示,每個國家包含175個數(shù)據(jù),訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)保持一致,均為全部數(shù)據(jù)集,以此來驗證模型的預(yù)測精度。并進行了模型預(yù)測的相對誤差分析(見圖3 D-F),在模型訓(xùn)練后期,相對誤差基本趨于0。結(jié)果表明,利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測的COVID -19確診人數(shù)與前期已知階段的實際確診人數(shù)基本相符。該模型可以對中國、美國和意大利的疫情發(fā)展趨勢進行合理預(yù)測。因此,本研究對以上三個國家未來半年(180天)累計確診病例數(shù)進行了預(yù)測。目前,中國疫情形勢已趨于穩(wěn)定,將在9月中旬達到峰值,累計確診人數(shù)預(yù)測值約為87 231(見圖 3 G);意大利將在11月初達到峰值,累計確診人數(shù)預(yù)測值約為294 083(見圖3 H);美國在不加強防控的情況下,峰值的出現(xiàn)將不早于明年1月中旬,累計確診人數(shù)預(yù)測值約為6 549 553(見圖3 I)。
注:A為中國疫情數(shù)據(jù)訓(xùn)練預(yù)測對比;B為意大利疫情數(shù)據(jù)訓(xùn)練預(yù)測對比;C為美國疫情數(shù)據(jù)訓(xùn)練預(yù)測對比;D為中國疫情數(shù)據(jù)訓(xùn)練樣本誤差;E為意大利疫情數(shù)據(jù)訓(xùn)練樣本誤差;F為美國疫情數(shù)據(jù)訓(xùn)練樣本誤差;G為中國未來180天疫情預(yù)測結(jié)果;H為意大利未來180天疫情預(yù)測結(jié)果;I為美國未來180天疫情預(yù)測結(jié)果圖3 BP神經(jīng)網(wǎng)絡(luò)模型驗證及各國疫情預(yù)測結(jié)果
根據(jù)擬合的各參數(shù)值,利用SEIR模型分析高校復(fù)學(xué)情況下COVID -19疫情的發(fā)展趨勢。假設(shè)某高???cè)藬?shù)(易感者)為10萬,從2020年1月23日起居家隔離,均有采取嚴(yán)格的管控措施,易感者數(shù)量會顯著降低;潛伏者與感染者數(shù)量會在達到峰值后降低,并逐漸趨近為零;康復(fù)者數(shù)量上升并趨于穩(wěn)定。見圖4。
若在疫情發(fā)生120天后(即4月底)采取部分分批復(fù)學(xué)的形式,疫情基本不會因?qū)W生在校產(chǎn)生二次暴發(fā)。潛伏者與感染者數(shù)量會在疫情發(fā)生160天后清零。若188天后(兩個醫(yī)學(xué)觀察期)在無外來病例輸入的情況下,基本不會出現(xiàn)在校感染。見圖4 A。
若在疫情發(fā)生120天后采取嚴(yán)格管控下的全面復(fù)學(xué),疫情在學(xué)校出現(xiàn)二次暴發(fā)的可能性很小。但潛伏者與感染者數(shù)量清零可能會推遲到疫情發(fā)生的220天后。若248天后(兩個醫(yī)學(xué)觀察期)在無外來病例輸入的情況下,基本也不會出現(xiàn)在校感染。見圖4 B。
若在疫情發(fā)生120天后采取無嚴(yán)格管控下的全面復(fù)學(xué),疫情可能在學(xué)校出現(xiàn)二次暴發(fā)。同時潛伏者與感染者數(shù)量清零可能會推遲到疫情發(fā)生的240天后,若268天后(兩個醫(yī)學(xué)觀察期)在無外來病例輸入的情況下,在校感染可能性較低。見圖4 C。
與SARS和MERS相比,雖然COVID -19的死亡率較低,但其傳染性明顯更強[11]。自日本鉆石公主號發(fā)現(xiàn)大量COVID -19感染者以來,世界各國相繼出現(xiàn)確診病例,疫情形勢日趨嚴(yán)重,這對各國衛(wèi)生系統(tǒng)和經(jīng)濟等造成了重創(chuàng)。自COVID -19疫情暴發(fā)以來,國內(nèi)外多項研究提出傳染病動力學(xué)模型,依托疫情相關(guān)數(shù)據(jù),科學(xué)預(yù)測疫情發(fā)展趨勢,為公共衛(wèi)生管理者的決策與高效干預(yù)措施的實施提供了重要依據(jù)[11-16]。范如國等[13]建立了SEIR傳染病動力模型,對三種不同潛伏期下的武漢疫情拐點和COVID -19確診病例數(shù)的峰值進行了預(yù)測;魏鳳英等[14]利用SEIR模型對全球主要疫情國家的總體態(tài)勢進行了研判,并針對復(fù)工復(fù)產(chǎn)對疫情發(fā)展可能產(chǎn)生的影響進行了數(shù)值模擬;Tomar等[11]利用Long-short term memory(LSTM)模型和曲線擬合,評估了印度未來30天COVID -19確診病例數(shù),并檢驗了隔離措施的有效性;Chimmula等[15]利用LSTM模型預(yù)測加拿大COVID -19傳播的時間序列,并比較了加拿大、意大利和美國的傳播率;也有研究采用基于循環(huán)神經(jīng)網(wǎng)絡(luò)的LSTM模型預(yù)測SARS-CoV-2未來的突變率[16]。但這些研究大都立足于疫情早期的數(shù)據(jù),著重于疫情峰值、拐點、傳播率和防控措施有效性等問題,未在此基礎(chǔ)上進一步考慮疫情趨于穩(wěn)定后的具體復(fù)學(xué)方案。本研究利用最新的疫情數(shù)據(jù)建立了BP神經(jīng)網(wǎng)絡(luò)模型,分析三個采用不同程度隔離措施的國家(中國、意大利和美國)的疫情形勢,并預(yù)測其未來半年累計確診病例數(shù)。中國疫情形勢已趨于穩(wěn)定,不會出現(xiàn)“二次高峰”。意大利采取了全國停課、封鎖交通等防控措施,累計確診人數(shù)預(yù)計在11月初達到峰值。而美國雖然疫情出現(xiàn)較晚,但防控措施不夠嚴(yán)格,預(yù)測累計確診人數(shù)峰值不會早于2021年1月中旬。對比分析三個國家的疫情發(fā)展趨勢,可以看出中國疫情防控取得了重大戰(zhàn)略成果。在此基礎(chǔ)上企事業(yè)單位也精準(zhǔn)有序復(fù)工復(fù)產(chǎn)。因此現(xiàn)階段國內(nèi)更關(guān)心的問題在于高校復(fù)學(xué)、大型體育賽事、演唱會和商業(yè)集會的重啟。雖然某些高校已采取部分、分批的復(fù)學(xué)形式,但鑒于高校學(xué)生數(shù)量大,管控措施的實施可能存在諸多困難,還應(yīng)考慮復(fù)學(xué)是否會造成疫情“二次高峰”。因此,本研究依托國內(nèi)最新疫情數(shù)據(jù)建立了SEIR模型,分析高校復(fù)學(xué)時間及復(fù)學(xué)規(guī)模對高校疫情的影響。結(jié)果顯示,在疫情發(fā)生后188天左右(7月上旬),高??梢圆扇?yán)格管控的部分復(fù)學(xué),這與部分高校和教育部政策基本相符。在疫情發(fā)生后248天左右(9月上旬),高??梢圆扇?yán)格管控的全面復(fù)學(xué)。從理論上分析,在疫情發(fā)生后268天左右(9月底),高??梢圆扇o嚴(yán)格管控的全面復(fù)學(xué)。但鑒于預(yù)測結(jié)果顯示,在疫情發(fā)生120天后采取無嚴(yán)格管控的全面復(fù)學(xué)將出現(xiàn)疫情二次暴發(fā)、潛伏者及感染者數(shù)量上升。因此,不能排除在9月底采取無嚴(yán)格管控的全面復(fù)學(xué)后潛伏者及感染者數(shù)量上升的可能性。
注:A為采取措施的部分復(fù)學(xué);B為采取措施的全面復(fù)學(xué);C為未采取措施的全面復(fù)學(xué)圖4 基于SEIR模型的高校復(fù)學(xué)分析
本文采取的BP神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射能力、自學(xué)習(xí)能力、泛化能力、容錯能力。這些優(yōu)點使其廣泛應(yīng)用于傳染病疫情預(yù)測、疾病的臨床診斷與治療分析等方面。但是隨著應(yīng)用范圍的逐步擴大,BP神經(jīng)網(wǎng)絡(luò)也暴露出了一些不足,主要是存在局部極小化問題和樣本依賴性問題[17-18]。SEIR模型加入了人口流動和潛伏者兩個影響因素,相較于SIR考慮更為全面,能夠較好地對病毒潛伏者乃至整個疫情的趨勢進行預(yù)測。但SEIR模型對人群的分類還不夠細(xì)致,對數(shù)據(jù)的初值較為敏感,可能會對結(jié)果的穩(wěn)健性產(chǎn)生很大影響[12,19]。此外,BP神經(jīng)網(wǎng)絡(luò)和SEIR模型更好的有機性融合也將是下一步研究的重點。
綜上所述,該模型預(yù)測的結(jié)果與疫情實際發(fā)展趨勢和相關(guān)部門出臺的政策基本吻合,可為高校下一步復(fù)學(xué)計劃提供理論參考,同時可進一步推廣至大型體育賽事、演唱會、商業(yè)集會等重啟時間的分析,刺激消費,推動經(jīng)濟復(fù)蘇。