楊安吉,顏忠誠(chéng)
(首都師范大學(xué)生命科學(xué)學(xué)院,北京 100048)
2019年12月,在湖北武漢出現(xiàn)了多例新型冠狀病毒肺炎病例,2020年1月12日世界衛(wèi)生組織(WHO)將其命名為2019-nCoV病毒,并于2月11日將新型冠狀病毒肺炎命名為COVID-19(corona virus disease 2019)[1].截至2020年4月 18日,COVID-19的大規(guī)模傳播已造成全國(guó)82 735例確診患者和4 632例死亡患者[2],在全國(guó)COVID-19疫情暴發(fā)前期,相關(guān)研究多圍繞在流行病學(xué)(35.70%)、診斷治療(24.60%)、病毒研究(13.50%)等方面[3],而對(duì)COVID-19疫情發(fā)展趨勢(shì)的研究分析相對(duì)較少.趨勢(shì)分析是通過(guò)研究相關(guān)指標(biāo)的變化,初步預(yù)測(cè)發(fā)展趨勢(shì)的方法,可以為疫情的防控工作提供有效的幫助.回歸分析法是一種利用統(tǒng)計(jì)原理對(duì)數(shù)據(jù)進(jìn)行數(shù)學(xué)處理,并確定因變量與自變量的相關(guān)關(guān)系,建立回歸方程加以外推,用于預(yù)測(cè)因變量變化的分析方法[4].
目前針對(duì)COVID-19疫情發(fā)展的探究,有研究者采用一般增長(zhǎng)[5]、二階導(dǎo)數(shù)[6]、指數(shù)平滑[7]和離散隨機(jī)[8]等模型進(jìn)行分析,此類(lèi)模型在疫情的一定階段內(nèi)擬合程度較高,適用于反映患者數(shù)量的短期變化,也有研究者基于 SIR[9-10]或 SEIR[11-12]及其復(fù)合模型[13-15]、人工神經(jīng)網(wǎng)絡(luò)[16-18]等方法對(duì)疫情的傳播機(jī)理進(jìn)行了解釋.然而從早期研究認(rèn)定潛伏期中位數(shù)的 3.0 d[19],到后來(lái)的 5.1 d[20],都證實(shí)了 2019-nCoV病毒具有明顯的潛伏特征,SIR模型沒(méi)有考慮潛伏期的問(wèn)題.SEIR模型可以加入潛伏期的參數(shù),根據(jù)國(guó)家衛(wèi)生健康委員會(huì)公布的數(shù)據(jù)[21],只能通過(guò)假設(shè)接觸率、傳染率等重要參數(shù)來(lái)分析疫情的發(fā)展趨勢(shì),由SEIR模型改進(jìn)的復(fù)合模型也具有同樣局限性,并且模型的相關(guān)參數(shù)在不同地區(qū)有較大的差異.網(wǎng)絡(luò)動(dòng)力學(xué)模型可以納入更多參數(shù)來(lái)提升擬合精度,但是各國(guó)在疫情初期檢測(cè)力度普遍較低,數(shù)據(jù)更新周期較長(zhǎng),可用于訓(xùn)練模型的數(shù)據(jù)與實(shí)際情況差異較大,限制了模型預(yù)測(cè)的可靠性.
本研究通過(guò)擬合患者比例和增長(zhǎng)率的變化來(lái)分析疫情趨勢(shì),將復(fù)雜的外界影響因素視為患者數(shù)量增長(zhǎng)的環(huán)境壓力,以擬合生態(tài)增長(zhǎng)曲線(xiàn)的方式解讀2019-nCoV病毒的感染患者例數(shù)變化,分析全國(guó)COVID-19疫情現(xiàn)狀并預(yù)估全球發(fā)展趨勢(shì).
本文針對(duì)近期出現(xiàn)的COVID-19疫情進(jìn)行數(shù)據(jù)分析,其中全國(guó)31個(gè)?。ㄗ灾螀^(qū)、直轄市)和新疆生產(chǎn)建設(shè)兵團(tuán)(未包含中國(guó)香港、澳門(mén)特別行政區(qū)及臺(tái)灣地區(qū))的原始數(shù)據(jù)均來(lái)自中華人民共和國(guó)衛(wèi)生健康委員會(huì)每日發(fā)布的疫情消息[21],數(shù)據(jù)采集時(shí)間為2020年1月10日—4月18日,共計(jì)100 d,采用了網(wǎng)站報(bào)道中的每日新增確診病例、死亡病例和治愈出院患者例數(shù),以及累計(jì)確診病例、死亡病例和治愈出院患者例數(shù)共6項(xiàng)數(shù)據(jù),計(jì)算每日確診增長(zhǎng)率、治愈增長(zhǎng)率和死亡增長(zhǎng)率3項(xiàng)數(shù)值輔助展開(kāi)分析.
全球COVID-19疫情的原始數(shù)據(jù)來(lái)自WHO每日發(fā)布的情況報(bào)告[22],數(shù)據(jù)采集時(shí)間為2020年1月20日—4月28日,共計(jì)100 d,采用了報(bào)道中世界各個(gè)國(guó)家或地區(qū)的累計(jì)確診患者例數(shù).根據(jù)WHO的地理劃分,結(jié)合疫情各國(guó)輸入途徑和最早確診時(shí)間,將世界主要分為6個(gè)內(nèi)部交流密集的區(qū)域,分別是除去中東地區(qū)的亞洲及太平洋國(guó)家組成的亞太地區(qū),歐洲地區(qū),阿拉伯半島、東北非和西亞構(gòu)成的中東地區(qū),非洲地區(qū),美國(guó)和加拿大為主的北美地區(qū),中美洲和南美洲組成的拉美地區(qū)等.
曲線(xiàn)擬合是指選擇適當(dāng)?shù)那€(xiàn)類(lèi)型來(lái)擬合觀(guān)測(cè)數(shù)據(jù),并用擬合的曲線(xiàn)方程分析變量之間的關(guān)系.本文將每日疫情數(shù)據(jù)制成散點(diǎn)圖,采用單個(gè)變化量對(duì)時(shí)間的響應(yīng)進(jìn)行線(xiàn)性或非線(xiàn)性回歸,通過(guò)比對(duì)不同模型的擬合程度,選取擬合程度高的模型進(jìn)行迭代計(jì)算,取得擬合方程的系數(shù),并繪制回歸曲線(xiàn).數(shù)據(jù)均采用Microsoft Excel 2019進(jìn)行整理與分析.
結(jié)合S、R2以及殘差分析對(duì)擬合程度進(jìn)行判斷,其中S描述了數(shù)據(jù)值與擬合值的距離,表示評(píng)估模型描述響應(yīng)值的程度,其值越低,模型描述響應(yīng)的程度越高;R2是度量擬合優(yōu)度的統(tǒng)計(jì)量,介于0~1,也稱(chēng)擬合的確定系數(shù),R2越高可表示擬合優(yōu)度越高;殘差分析可以通過(guò)回歸數(shù)值與殘差的散點(diǎn)圖來(lái)檢驗(yàn)曲線(xiàn)的擬合程度,在擬合正常的殘差圖中,散點(diǎn)分布在以原點(diǎn)為中心的帶狀區(qū)域上,帶狀區(qū)域的寬度越狹窄,說(shuō)明模型擬合的精度越高.
增長(zhǎng)曲線(xiàn)被用來(lái)描述物種遷入到新生態(tài)系統(tǒng)后的數(shù)量變化,物種的初始數(shù)量一般小于環(huán)境最大容納量[23],又因?yàn)樽匀簧鷳B(tài)系統(tǒng)中的資源有限,所以物種的增長(zhǎng)函數(shù)滿(mǎn)足logistic方程式:
式中N為物種數(shù)量,t為時(shí)間,r為增長(zhǎng)速度,k為環(huán)境最大容納量.
在分析COVID-19疫情變化時(shí),可以將患者看作在限定環(huán)境中數(shù)量增長(zhǎng)的物種,實(shí)際中病毒的傳播也存在人為管控或自然阻力,因此,2019-nCoV病毒的感染者例數(shù)不會(huì)無(wú)限制的增長(zhǎng),在一定空間范圍內(nèi)應(yīng)符合logistic增長(zhǎng)曲線(xiàn),其積分方程式為
式中k可以通過(guò)實(shí)際數(shù)值、曲線(xiàn)擬合和多點(diǎn)法預(yù)估等方式獲得,本次分析通過(guò)曲線(xiàn)擬合法求得k值;a表示初始患者數(shù)在k中的所占比例;r表示病例數(shù)在無(wú)干擾下的增長(zhǎng)速度.a、r可通過(guò)進(jìn)行線(xiàn)性回歸統(tǒng)計(jì)得到[24],方程式為
通過(guò)4個(gè)參數(shù)的擬合算法對(duì)logistic增長(zhǎng)曲線(xiàn)進(jìn)行處理,得到
根據(jù)實(shí)際情況可代入數(shù)據(jù)轉(zhuǎn)化為
式中N為患者例數(shù),k為環(huán)境最大容納量,也就是預(yù)估的患者總例數(shù),N0為初始患者例數(shù),x為時(shí)間,T為增長(zhǎng)速度最大時(shí)所對(duì)應(yīng)的時(shí)間,p是該點(diǎn)對(duì)應(yīng)的曲線(xiàn)斜率.
全國(guó)COVID-19疫情確診病例變化趨勢(shì)及回歸分析如圖1所示.數(shù)據(jù)顯示,2020年1月10—15日確診患者例數(shù)無(wú)增長(zhǎng),一直保持在41例,1月16日后確診患者例數(shù)逐漸上漲,由于前期COVID-19疫情患者基數(shù)較小,所以增長(zhǎng)率較高且波動(dòng)較大,曾于1月18日達(dá)95.16%的增長(zhǎng)率峰值.增長(zhǎng)率曲線(xiàn)顯示出后因患者數(shù)量不斷增多,每日增長(zhǎng)數(shù)量上升但增長(zhǎng)率下降,實(shí)際中于2月4和12日2次達(dá)到的確診患者例數(shù)增長(zhǎng)峰值,此階段內(nèi)每日增量維持在較高水平.2月14日后增長(zhǎng)率開(kāi)始持續(xù)下降,3月7日后每日增長(zhǎng)率維持在0.05%以下,增長(zhǎng)數(shù)量大體呈每日減少的狀態(tài).因此,確診患者例數(shù)的變化表現(xiàn)出了前期增速較緩慢、中期增速加快、后期增速又趨于緩慢的大趨勢(shì).
圖1 全國(guó)COVID-19疫情確診病例數(shù)據(jù)
2020年4月13日及其前后各5 d內(nèi)確診病例的實(shí)際數(shù)值和logistic增長(zhǎng)曲線(xiàn)擬合值如表1所示.擬合值與去除境外輸入的實(shí)際值總體較為接近,數(shù)據(jù)來(lái)源中3月4日前的每日新增病例包含了境外輸入患者例數(shù),模型內(nèi)也將此類(lèi)引起的增長(zhǎng)納入k值的預(yù)估,因此,k會(huì)稍高于國(guó)內(nèi)實(shí)際增長(zhǎng)的確診患者.3月份后因境外輸入病例持續(xù)增多并在國(guó)內(nèi)造成傳染,導(dǎo)致邊境口岸、發(fā)達(dá)城市等地區(qū)檢測(cè)出新的確診患者,全國(guó)本土確診病例的變化變?yōu)榕及l(fā)性增加,4月16日湖北省核增確診病例數(shù)后,實(shí)際值與擬合值出現(xiàn)了較大差異.
表1 累計(jì)確診病例數(shù)據(jù)對(duì)比 單位:例
全國(guó)COVID-19疫情治愈病例變化趨勢(shì)及回歸分析如圖2所示.增長(zhǎng)率曲線(xiàn)顯示,前期因?yàn)椴±鶖?shù)小、治愈患者少的前提下,增長(zhǎng)率變化波動(dòng)較大.自2月份起,治愈病例數(shù)開(kāi)始出現(xiàn)每日增長(zhǎng)率下降,但數(shù)量穩(wěn)固上升的情況;在2月底,隨著新確診病例數(shù)和剩余患者例數(shù)的大量減少,每日新增的治愈例數(shù)也較之前有所減少.總體來(lái)說(shuō),累計(jì)治愈例數(shù)的增加也表現(xiàn)出了前期增速慢,中期增速快,后期增速慢的變化趨勢(shì).
圖2 全國(guó)COVID-19疫情累計(jì)治愈病例數(shù)據(jù)
2020年4月13日及其前后各5 d內(nèi)治愈病例的實(shí)際數(shù)值和logistic增長(zhǎng)曲線(xiàn)擬合值如表2所示.數(shù)據(jù)來(lái)源中3月28日后開(kāi)始公布境外輸入患者的治愈情況,因此,有部分境外輸入的治愈病例被納入k預(yù)估,3月30日—4月16日實(shí)際值和擬合值差距逐漸加大,4月17日國(guó)家衛(wèi)生健康委員會(huì)重新核算內(nèi)地治愈病例數(shù)后,觀(guān)測(cè)值與本研究長(zhǎng)期擬合數(shù)值的差異迅速縮小.
表2 累計(jì)治愈病例數(shù)據(jù)對(duì)比 單位:例
全國(guó)COVID-19疫情死亡病例變化趨勢(shì)及回歸分析如圖3所示.增長(zhǎng)率曲線(xiàn)顯示死亡病例具有前期波動(dòng)較大、增長(zhǎng)率較高的特點(diǎn),湖北省因?yàn)橐咔閲?yán)重,統(tǒng)計(jì)困難,先后于2020年2月13日核減108例、4月17日核增1 290例,導(dǎo)致死亡病例增長(zhǎng)率在疫情中后期出現(xiàn)2次較大波動(dòng).累計(jì)死亡病例的總體增長(zhǎng)趨勢(shì)為:1月10日—21日增長(zhǎng)不明顯;1月22日后隨確診病例、重癥患者例數(shù)的大幅度增多而增加;2月25日后因?yàn)樾略霾±?、正在就醫(yī)患者例數(shù)的普遍減少,增長(zhǎng)速度開(kāi)始明顯下降.全國(guó)COVID-19疫情死亡病例顯示出了logistic增長(zhǎng)曲線(xiàn)的變化趨勢(shì).
圖3 全國(guó)COVID-19疫情累計(jì)死亡病例數(shù)據(jù)
2020年4月13日及其前后各5 d內(nèi)死亡病例的實(shí)際數(shù)值和logistic增長(zhǎng)曲線(xiàn)擬合值如表3所示.4月13—18日全國(guó)實(shí)際增加死亡病例1例,與logistic增長(zhǎng)曲線(xiàn)擬合結(jié)果一致,醫(yī)療水平的提高促使全國(guó)COVID-19確診患者治愈出院的比例上升,4月份后死亡病例數(shù)增長(zhǎng)緩慢,基本表現(xiàn)為間隔性增加,其中大部分為湖北患者,推測(cè)與該地區(qū)在4月1日還有400例未治愈的重癥患者有關(guān).
表3 累計(jì)死亡病例數(shù)據(jù)對(duì)比 單位:例
全球6個(gè)區(qū)域COVID-19疫情累計(jì)確診例數(shù)變化如圖4所示.亞太地區(qū)于2020年2月中旬開(kāi)始出現(xiàn)增長(zhǎng),時(shí)間略早于其他地區(qū);歐洲、北美和中東地區(qū)于2月下旬開(kāi)始暴發(fā);拉美地區(qū)出現(xiàn)病例相對(duì)較晚但增長(zhǎng)速度快,5月后有可能出現(xiàn)疫情暴發(fā).2020年4月28日的全球數(shù)據(jù)擬合曲線(xiàn)顯示各區(qū)域確診病例數(shù)在5—6月內(nèi)仍然會(huì)有較大增長(zhǎng),北美可能在5月中旬附近超過(guò)歐洲成為全球確診病例最多的區(qū)域,非洲、拉美地區(qū)因?yàn)閿?shù)據(jù)較少,擬合確診病例數(shù)的變化幅度較小.
圖4 全球6個(gè)區(qū)域COVID-19疫情確診病例變化趨勢(shì)
表4 基于logistic增長(zhǎng)曲線(xiàn)預(yù)測(cè)不同時(shí)間節(jié)點(diǎn)下不同區(qū)域的累計(jì)確診患者數(shù)
本文基于logistic模型對(duì)全國(guó)和全球6個(gè)區(qū)域的COVID-19疫情進(jìn)行了分析,全國(guó)COVID-19疫情的累計(jì)確診例數(shù)、累計(jì)治愈例數(shù)和累計(jì)死亡例數(shù)變化趨勢(shì)基本符合logistic增長(zhǎng)曲線(xiàn).盡管每日數(shù)據(jù)中存在人為統(tǒng)計(jì)原因造成的波動(dòng),logistic模型仍較好地?cái)M合了全國(guó)疫情的發(fā)展趨勢(shì),因?yàn)閘ogistic增長(zhǎng)曲線(xiàn)不同于解釋病毒傳播機(jī)理的模型,是一類(lèi)描述數(shù)據(jù)變化的模型,擬合數(shù)值時(shí)疫情傳播過(guò)程中時(shí)間、空間和感染能力等差異對(duì)參數(shù)的影響較小,參數(shù)可以通過(guò)處理數(shù)據(jù)直接獲取,模型在達(dá)到增速峰值后,具有較好的發(fā)展預(yù)測(cè)能力,說(shuō)明使用生態(tài)模型來(lái)分析疫情變化有一定的可行性.
通過(guò)模型預(yù)估出整個(gè)增長(zhǎng)周期為120 d左右,考慮到缺少1月10日之前的數(shù)據(jù),實(shí)際的疫情可能會(huì)相較于擬合數(shù)值有所延長(zhǎng),如果能補(bǔ)充早期的發(fā)病數(shù)據(jù),將可以提升logistic模型的精確性.本研究數(shù)據(jù)來(lái)源選擇了我國(guó)31個(gè)?。ㄗ灾螀^(qū)、直轄市)和新疆生產(chǎn)建設(shè)兵團(tuán),是因?yàn)檫@些地區(qū)受到中國(guó)政府的統(tǒng)一調(diào)控較強(qiáng),可以視為一個(gè)限制因素類(lèi)似的整體環(huán)境,從國(guó)家衛(wèi)生健康委員會(huì)發(fā)布的消息,港、澳、臺(tái)地區(qū)的增長(zhǎng)周期要比內(nèi)地晚近2周的時(shí)間,故未將其計(jì)入此次的分析數(shù)據(jù)中,模型擬合也證實(shí)全國(guó)的COVID-19疫情變化趨勢(shì)較符合logistic增長(zhǎng)曲線(xiàn).據(jù)此推測(cè)使用回歸分析法研究疫情走勢(shì)需注意其適用條件,在一定地理范圍內(nèi),且外界壓力變化相似的情況下,logistic模型的擬合程度會(huì)更高.
2019-nCoV病毒的潛伏期較長(zhǎng),大眾起初對(duì)疫情的認(rèn)識(shí)不夠透徹,部分國(guó)家的早期檢測(cè)例數(shù)很少,在暴發(fā)前有將近20 d的低或無(wú)增長(zhǎng)確診病例的階段,而實(shí)際感染者數(shù)量可能已經(jīng)高于當(dāng)時(shí)的報(bào)道,按照l(shuí)ogistic曲線(xiàn)方式出現(xiàn)了增長(zhǎng),只是隨著近期開(kāi)展的大面積檢疫工作才被顯現(xiàn)出來(lái),導(dǎo)致確診病例數(shù)的急劇增長(zhǎng).因此,在預(yù)測(cè)全球COVID-19疫情形勢(shì)時(shí),暫時(shí)不能將世界看作一個(gè)整體,因?yàn)楦鞯貐^(qū)的增長(zhǎng)情況表現(xiàn)出了較強(qiáng)的異質(zhì)性,本研究認(rèn)為在數(shù)據(jù)過(guò)少、全球拐點(diǎn)來(lái)臨前,分區(qū)進(jìn)行回歸分析,可以較好地預(yù)測(cè)COVID-19疫情在全球的變化.
3月份后中國(guó)境外輸入患者逐漸增多,造成了內(nèi)地病例數(shù)再次增長(zhǎng),同時(shí)全球COVID-19疫情出現(xiàn)了更多影響確診患者數(shù)量的因素,logistic增長(zhǎng)曲線(xiàn)無(wú)法擬合出人員流動(dòng)、區(qū)域二次增長(zhǎng)等狀況引發(fā)的病例數(shù)變化,數(shù)據(jù)大幅度調(diào)整對(duì)擬合的影響較大,并且增大現(xiàn)有數(shù)據(jù)與擬定拐點(diǎn)對(duì)應(yīng)日期的距離,將導(dǎo)致擬合值的不確定性增強(qiáng),因此,擬合結(jié)果只能表示該區(qū)域最終確診病例數(shù)的大致范圍,表現(xiàn)出模型受已知數(shù)據(jù)影響較大的局限性.但利用此方法可以通過(guò)補(bǔ)充數(shù)據(jù)而使擬合數(shù)值更加精確,在得知拐點(diǎn)后可預(yù)測(cè)疫情大致的持續(xù)時(shí)間,以生態(tài)學(xué)的角度來(lái)估測(cè)可能被感染的例數(shù),為今后的防疫工作提供思路和參考.
本文通過(guò)生態(tài)模型分析COVID-19的發(fā)展趨勢(shì),為研究疫情變化提供了新的思路.全國(guó)病例數(shù)的變化趨勢(shì)基本符合logistic增長(zhǎng)曲線(xiàn),隨著數(shù)據(jù)的不斷積累會(huì)修正曲線(xiàn)系數(shù),能有效提高logistic模型的擬合程度.全國(guó)的疫情變化已趨于穩(wěn)定,世界其他地區(qū)所處狀態(tài)各不相同,建議下一步可以在全球疫情的模型構(gòu)建方面開(kāi)展相關(guān)研究,為防控工作提供更多的參考.抗擊疫情需要全世界人民的攜手努力,希望在各國(guó)家和地區(qū)的疾病預(yù)防與控制部門(mén)和醫(yī)療單位合理、規(guī)范、安全和透明的調(diào)查與救治下,此次疫情能早日結(jié)束.