王麗, 曹世義, 宋開發(fā), 黃繼貴
2008年,手足口病在安徽省阜陽(yáng)市開始流行,之后逐漸蔓延到全國(guó)各地,同年5月手足口病開始按法定傳染病丙類管理[1]。手足口病每年在我國(guó)約有200萬(wàn)病例報(bào)告,位列我國(guó)法定傳染病報(bào)告數(shù)之首,且有增長(zhǎng)趨勢(shì)[2],手足口病已成為我國(guó)影響兒童健康的重要公共衛(wèi)生問(wèn)題[3]。近年來(lái),很多數(shù)學(xué)模型被用來(lái)預(yù)測(cè)傳染病發(fā)病趨勢(shì),比如傳染病動(dòng)力學(xué)模型、空間統(tǒng)計(jì)學(xué)、神經(jīng)網(wǎng)絡(luò)模型等[4-6]。2012—2021年荊州市手足口病年均發(fā)病率在33.84/10萬(wàn)~158.22/10萬(wàn)[7],高于國(guó)內(nèi)其他地方報(bào)道[8-9]。本研究利用2012—2021年荊州市手足口病發(fā)病數(shù)據(jù)建立ARIMA模型并進(jìn)行檢驗(yàn),同時(shí)對(duì)2021—2022年手足口病發(fā)病趨勢(shì)進(jìn)行預(yù)測(cè),并與觀測(cè)值的波動(dòng)趨勢(shì)進(jìn)行分析,為荊州市手足口病動(dòng)態(tài)監(jiān)測(cè)、早期預(yù)測(cè)和防控提供依據(jù)。
從中國(guó)疾病預(yù)防控制信息管理系統(tǒng)收集2012—2021年荊州市手足口病發(fā)病資料,人口數(shù)據(jù)資料來(lái)自荊州市統(tǒng)計(jì)年鑒。
運(yùn)用ARIMA模型理論,該模型(自回歸綜合移動(dòng)平均模型)是傳染病預(yù)測(cè)中常用的模型之一,可較好地?cái)M合季節(jié)性的時(shí)間序列,稱之為季節(jié)性ARIMA模型(seasonal ARIMA models)。季節(jié)性發(fā)病是手足口病的重要特征,因此采用季節(jié)性SARIMA(p,d,q)×(P,D,Q)s。MA是滑動(dòng)平均,AR是自回歸,p是自回歸,d是普通差分階數(shù),q是移動(dòng)平均階數(shù),P是季節(jié)性自回歸,Q是移動(dòng)平均階數(shù),D是季節(jié)性差分階數(shù),s為季節(jié)周期,本研究發(fā)病率用的是月度發(fā)病資料,因此s=12。
用Excel 2019整理發(fā)病率資料,導(dǎo)入SPSS 18.0軟件建立序列圖,分析變化趨勢(shì)。對(duì)數(shù)據(jù)進(jìn)行差分處理,分析自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF)判斷數(shù)據(jù)平穩(wěn)性。再用SPSS 18.0專家建模器構(gòu)建ARIMA模型,并對(duì)模型進(jìn)行顯著性檢驗(yàn),以P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。制作殘差A(yù)CF圖和PACF圖,用Ljung-Box殘差白噪聲來(lái)檢驗(yàn)和判定殘差序列是不是白噪聲序列,如殘差為白噪聲序列,說(shuō)明數(shù)據(jù)提取很充分,模型建立得當(dāng)。通過(guò)貝葉斯準(zhǔn)則來(lái)判斷模型的擬合優(yōu)度情況,一般來(lái)說(shuō)BIC值越小的模型擬合優(yōu)度越好。驗(yàn)證模型用2021年荊州市實(shí)際發(fā)病率與預(yù)測(cè)發(fā)病率比較,評(píng)價(jià)模型預(yù)測(cè)準(zhǔn)確性。
根據(jù)2012—2020年荊州市手足口病月發(fā)病率資料,繪制荊州市手足口病月發(fā)病率時(shí)間序列圖。由圖可見,荊州市手足口病發(fā)病率總體趨于平穩(wěn),無(wú)明顯上升或下降趨勢(shì),但有明顯的季節(jié)波動(dòng)周期,每年4-6月和9-11月分別為發(fā)病的大、小高峰,1-2月和7-8月為發(fā)病低估,總周期為1年。見圖1。
圖1 荊州市2012—2020年手足口病時(shí)間序列圖
2.2.1 序列預(yù)處理和模型識(shí)別根據(jù)時(shí)間序列圖特征,總體平穩(wěn),有季節(jié)周期,對(duì)數(shù)據(jù)考慮一階季節(jié)性差分處理(d=0,D=1)并繪制ACF圖、PACF圖,處理后的自相關(guān)函數(shù)ACF、偏自相關(guān)函數(shù)PACF均呈拖尾衰減現(xiàn)象,可判定該序列經(jīng)過(guò)季節(jié)性差分后達(dá)到平穩(wěn),數(shù)據(jù)可以建立ARIMA模型。見圖2、圖3。
圖2 荊州市手足口病時(shí)間序列自相關(guān)函數(shù)圖
圖3 荊州市手足口病時(shí)間序列偏自相關(guān)函數(shù)圖
2.2.2 建立模型并對(duì)模型進(jìn)行參數(shù)估計(jì)與診斷利用SPSS 18.0統(tǒng)計(jì)軟件專家建模器建立ARIMA模型,軟件給出的最優(yōu)模型為ARIMA(2,0,0)(0,1,1)12,使用Ljung-Box對(duì)殘差進(jìn)行殘差白噪聲檢驗(yàn),統(tǒng)計(jì)量為14.974,P=0.453,大于檢驗(yàn)水準(zhǔn),可判定殘差序列為白噪聲。從殘差序列ACF和PACF圖看,無(wú)明顯的趨勢(shì)特征(拖尾或截尾)。結(jié)合以上信息可以認(rèn)為該模型殘差為白噪聲,數(shù)據(jù)提取充分,建立的模型可以用于預(yù)測(cè)。該模型的平穩(wěn)R2=0.848,標(biāo)準(zhǔn)化的BIC=2.502,各參數(shù)檢驗(yàn)差異均有統(tǒng)計(jì)學(xué)意義。見圖4和表1。
表1 ARIMA(2,0,0)(0,1,1)12模型參數(shù)估計(jì)
圖4 荊州市手足口病模型殘差序列ACF、PACF圖
2.2.3 模型預(yù)測(cè)效果評(píng)價(jià)應(yīng)用ARIMA(2,0,0)(0,1,1)12對(duì)荊州市2021年1-12月手足口病發(fā)病率進(jìn)行預(yù)測(cè),并與實(shí)際觀測(cè)值進(jìn)行比較,1-12月的觀測(cè)值均在預(yù)測(cè)值95%CI范圍內(nèi),誤差最大的為1月份的-18.94%,最小的為3月份的2.41。全年預(yù)測(cè)累計(jì)發(fā)病率84.90/10萬(wàn),實(shí)際觀測(cè)發(fā)病率81.06/10萬(wàn),總體誤差率為4.74%。預(yù)測(cè)值與觀測(cè)值的波動(dòng)趨勢(shì)基本一致??梢娫撃P蛯?duì)荊州市手足口病發(fā)病率擬合效果較好,可以用于預(yù)測(cè)荊州市手足口病發(fā)病趨勢(shì)。見表2。
表2 荊州市2021年手足口病月發(fā)病率實(shí)際值與預(yù)測(cè)值比較 單位:/10萬(wàn)
2.2.4 模型預(yù)測(cè)利用ARIMA(2,0,0)(0,1,1)12對(duì)荊州市2022年1—12月手足口病發(fā)病率進(jìn)行預(yù)測(cè)。預(yù)測(cè)值發(fā)病率最高的月份是5月的13.26/10萬(wàn),最低的是2月的2.02/10萬(wàn)。各月發(fā)病率相加,估計(jì)2022年荊州市手足口病發(fā)病率為91.45/10萬(wàn)。見表3和圖5。
表3 荊州市2022年手足口病發(fā)病率預(yù)測(cè)結(jié)果 單位:/10萬(wàn)
圖5 ARIMA模型對(duì)荊州市2022年足口病月發(fā)病率進(jìn)行預(yù)測(cè)
手足口病防控與預(yù)測(cè)是疾病預(yù)防控制機(jī)構(gòu)的一項(xiàng)重要工作。動(dòng)態(tài)監(jiān)測(cè)可以評(píng)價(jià)手足口病疫情變化,并可為手足口病防控提供科學(xué)依據(jù)[10]。高效而快速地對(duì)手足口病發(fā)病趨勢(shì)進(jìn)行預(yù)測(cè),通常是工作中的重點(diǎn)[11]。時(shí)間序列中常用的模型是ARIMA模型,它被廣泛運(yùn)用于傳染病預(yù)測(cè)分析,原理是利用已知的數(shù)據(jù),分析其變化規(guī)律,再建立適宜的數(shù)學(xué)模型,預(yù)測(cè)將來(lái)短期趨勢(shì)[12]。近些年來(lái),利用手足口病數(shù)據(jù)來(lái)構(gòu)建適宜的ARIMA模型并預(yù)測(cè)發(fā)病趨勢(shì)的研究有很多[13-14],均能較好地?cái)M合和預(yù)測(cè)手足口病的發(fā)病率。
荊州市手足口病各年份發(fā)病較平穩(wěn),但有明顯的季節(jié)周期性,可利用發(fā)病率數(shù)據(jù)建立ARIMA模型,該模型預(yù)測(cè)2021年累計(jì)發(fā)病率為84.90/10萬(wàn),實(shí)際觀測(cè)發(fā)病率為81.06/10萬(wàn),總體誤差率為4.74%,預(yù)測(cè)的2021年各月發(fā)病率與實(shí)際發(fā)病率基本吻合,說(shuō)明該模型預(yù)測(cè)效果較好。利用該模型預(yù)測(cè)的2022年荊州市手足口病發(fā)病率為91.45/10萬(wàn),較2021年略有上升,低于中國(guó)大陸平均發(fā)病率[15],高于重慶市大足區(qū)、周口市年均發(fā)病率[16-17]。荊州市手足口病防控要加強(qiáng)手足口病監(jiān)測(cè)和病原學(xué),關(guān)注優(yōu)勢(shì)病原[7];在發(fā)病高發(fā)季節(jié),托幼機(jī)構(gòu)要加強(qiáng)晨檢及午檢制度,避免交叉感染造成聚集性疫情發(fā)生[18];鼓勵(lì)適齡兒童接種EV71疫苗,預(yù)防EV71型病毒感染引起的重癥手足口病[19]。
ARIMA建模需要平穩(wěn)的時(shí)間序列,實(shí)際工作數(shù)據(jù)可能需要進(jìn)行平穩(wěn)性轉(zhuǎn)換和季節(jié)差分后保證數(shù)據(jù)的平穩(wěn)性。本研究采用手足口病月發(fā)病人數(shù)資料,根據(jù)其長(zhǎng)期趨勢(shì)和周期性建立ARIMA模型,以月發(fā)病人數(shù)資料預(yù)測(cè)手足口病發(fā)病情況,其結(jié)果更直觀、更科學(xué)可靠。預(yù)測(cè)是基于前期數(shù)據(jù)來(lái)預(yù)測(cè)未發(fā)展變化,但實(shí)際觀測(cè)值不可能和預(yù)測(cè)值完全相同。特別是手足口病發(fā)病趨勢(shì)的預(yù)測(cè),手足口病的發(fā)病受到諸多因素的影響,比如流行病原的變化、季節(jié)氣候因素[18,20]、防控政策的變化(比如2020年新冠病毒疫情導(dǎo)致封控)等,其中任何一個(gè)因素變化都可能造成手足口病發(fā)病趨勢(shì)發(fā)生改變,最終致使預(yù)測(cè)值有一定誤差,因此預(yù)測(cè)結(jié)果僅能作為參考。