袁永旭,宋立群,吳文婧,李 黛,尚有為,于 琦
手足口?。╤and-foot-mouth disease,HFMD)是一種兒童常見的傳染性疾病,是由人腸道病毒(human enterovirus,HEV)為主要病原體引起的傳染病,多發(fā)生于5 歲及以下兒童。HEV 類型眾多,同種型的病毒通常可以導(dǎo)致多種病癥或疾病,其中以柯薩奇病毒A 組16 型(CoxA16 型)和腸道病毒71 型(EV71 型)最為常見[1]。手足口病的主要臨床表現(xiàn)為經(jīng)常性的口痛,手部、足部、口腔等小皰疹感染及潰瘍,絕大多數(shù)患者約1 周即可基本治愈。有報道個別重癥兒童病情的進(jìn)展速度快,可致死亡[2]。我國于2008 年將手足口病納入丙類傳染?。?],2016 年中共中央、國務(wù)院印發(fā)了《“健康中國2030”規(guī)劃綱要》[4],要求加強重大傳染病的防控,改革并完善傳染病監(jiān)測預(yù)警機制,進(jìn)一步擴大國家免疫規(guī)劃。我國的首個腸道病毒71 型(EV71 型)疫苗第1 期的臨床研究試驗疫苗已于2016 年春季上市,是我國唯一的可用于防治兒童手足口病的疫苗[5]。同時,為適應(yīng)社會對聯(lián)合疫苗與多價疫苗研發(fā)的需求,中國食品藥品檢定研究院完成了柯薩奇病毒A 組16 型(CA16 型)疫苗國家抗原標(biāo)準(zhǔn)品的研制[5],但就目前情況來看仍然缺乏有效的臨床治療藥物,各地居民對腸道病毒71 型(EV71)疫苗的認(rèn)識也仍然處于較低水平[6]。因此,手足口病防控形勢嚴(yán)峻,不容小覷[7]。
國內(nèi)學(xué)者對各省市手足口病進(jìn)行了不同方向的研究。有學(xué)者通過采集上海市寶山區(qū)2015-2016年手足口病標(biāo)本進(jìn)行實驗室檢測和數(shù)據(jù)聚類分析,對上海市手足口病的發(fā)病時間與特征進(jìn)行了有依據(jù)的推斷預(yù)測[8];有學(xué)者根據(jù)沈陽市2008-2017年手足口病的流行特點及趨勢,采用描述流行病學(xué)的方法對沈陽市手足口病疫情流行發(fā)病率進(jìn)行了分析[9]。近年來,山西省手足口病發(fā)病率呈平穩(wěn)略下降趨勢,但防控形勢仍然非常嚴(yán)峻,全省各縣市均出現(xiàn)了不同程度的流行情況。山西省衛(wèi)生和計劃生育委員會在防治手足口病新聞通氣會上表示,本省的手足口病病例主要分布在太原市、晉中市等地,其原因可能為城市人口密度過大、人群跨地區(qū)流動頻繁、國家三胎政策開放后新生兒數(shù)量增多,但針對兒童的醫(yī)療衛(wèi)生措施未有效實施,城市改造建設(shè)發(fā)展增快導(dǎo)致環(huán)境惡化,從而造成手足口病的持續(xù)高發(fā)[10]。因此,對手足口病發(fā)病率趨勢的預(yù)測就顯得尤為重要。本文基于山西省2007-2017年手足口病的月發(fā)病率數(shù)據(jù),利用差分整合移動平均自回歸模型(autoregressive integrated moving average model,ARIMA)進(jìn)行匯總分析,預(yù)測山西省2022-2023 年手足口病的月發(fā)病率和高發(fā)期,為山西省手足口病的早期預(yù)警與防控提供依據(jù)。
從公共衛(wèi)生科學(xué)數(shù)據(jù)中心(www.phsciencedata.cn)收集下載、整理山西省2007-2018 年手足口病的月發(fā)病率相關(guān)數(shù)據(jù)資料。使用Excel 2019 軟件建立樣本數(shù)據(jù)庫和整合預(yù)測數(shù)值表,利用R4.0.0 軟件進(jìn)行數(shù)據(jù)處理及繪圖,并查閱山西省疾病預(yù)防控制中心相關(guān)資訊和統(tǒng)計信息,補充2019-2021 年未公示數(shù)據(jù)帶來的預(yù)測缺失部分,所獲得的數(shù)據(jù)一律保留4 位小數(shù),數(shù)據(jù)真實、可靠。然后,利用山西省2007-2017 年手足口病的月發(fā)病率數(shù)據(jù)建立相關(guān)模型并進(jìn)行擬合外推,以2018 年實際發(fā)病率數(shù)據(jù)檢驗所建立模型的預(yù)測效果,進(jìn)一步佐證模型精度。
ARIMA 模型為差分集成移動(又稱“滑動”)平均自回歸模型,也叫“博克斯-詹金斯模型”[11]。其建模過程可分為4 步:序列平穩(wěn)性檢驗及平穩(wěn)化處理、模型識別、參數(shù)估計、模型檢驗及預(yù)測。該模型簡單靈活,被廣泛應(yīng)用于傳染性疾病、呼吸系統(tǒng)疾病等的發(fā)病率預(yù)測研究[12]。
將用軟件推算出的模型與山西省2007-2018 年手足口病的月發(fā)病率實際數(shù)據(jù)進(jìn)行對比,并進(jìn)行擬合圖像分析,根據(jù)對比結(jié)果,采用平均絕對誤差評價模型精度,誤差數(shù)值越小表示模型預(yù)測能力越強。
采集2007 年1 月至2017 年12 月共132 個月的山西省手足口病月發(fā)病率數(shù)據(jù)(表1)。
表1 山西省2007-2017 年手足口病月發(fā)病率(1/10 萬)
根據(jù)表1 數(shù)據(jù),利用R 軟件建立2007-2017年山西省手足口病月發(fā)病率時序圖(圖1)。圖1顯示,山西省手足口病月發(fā)病率有明顯的周期性和趨勢性,且月報告病例總數(shù)整體呈現(xiàn)上升趨勢,呈現(xiàn)周期性波動上升的特點,其中2009 年、2012 年、2014 年為高發(fā)年,但上升或下降幅度不大。
圖1 山西省2007-2017 年手足口病月發(fā)病率的時序圖
2.2.1 序列平穩(wěn)性檢驗及平穩(wěn)化處理
為觀察原始數(shù)據(jù)的趨勢,利用代碼df-ts-stl<-decompose(train)plot(df-ts-stl)將時間序列進(jìn)行季節(jié)性分解。從時間序列的分解圖上看,山西省手足口病月發(fā)病率的趨勢性和周期性占比相當(dāng),并且周期性十分明顯(圖1、圖2)。
圖2 山西省2007-2017 年手足口病月發(fā)病率的時間序列季節(jié)性分解圖
如圖2 所示,山西省手足口病的月發(fā)病率數(shù)據(jù)存在較為明顯的規(guī)律性和周期性,但部分趨勢呈無序狀,無法認(rèn)定其為平穩(wěn)序列,故判定其為非季節(jié)性ARIMA 模型,不能直接進(jìn)行ARIMA 模型的模型識別與參數(shù)統(tǒng)計。所以下面要對原始時間序列進(jìn)行一階差分,消除對其不平穩(wěn)規(guī)律性和周期性的影響,實現(xiàn)序列的平穩(wěn)化處理。
原始時間序列一階差分后的時間序列圖、自相關(guān)圖和偏自相關(guān)圖如圖3、圖4、圖5 所示。
圖3 一階差分后的時間序列圖
圖4 一階差分后的自相關(guān)圖
圖5 一階差分后的偏自相關(guān)圖
可以看出,差分后的序列整體平穩(wěn),自相關(guān)函數(shù)(autocorrelation function,ACF)和偏自相關(guān)函數(shù)(partial autocorrelation function,PACF)的數(shù)值非顯著為零,然后進(jìn)行單位根檢驗得到假定值P為0.01,小于0.05,進(jìn)一步判斷出此時的序列具有了平穩(wěn)性,說明接下來可以對一階差分后的序列進(jìn)行ARIMA 的建模與分析。
2.2.2 模型識別與參數(shù)估計
根據(jù)以上的整理分析,開始進(jìn)行ARIMA 建模。非季節(jié)性 ARIMA 模型的原始形態(tài)為 ARIMA(p,d,q)(P,D,Q)[12],p、d、q 分別代表自回歸、差分和移動平均的階次,這里的P、D、Q 分別代表季節(jié)性的自回歸、差分及移動平均的階次,以大寫與非季節(jié)性的p、d、q 進(jìn)行區(qū)分[13]。首先在R 軟件中輸入代碼“fic<-auto.arima(train,ic=”aic”,trace=1)”來確定p、d、q、P、D、Q 等參數(shù)的值,R 軟件自動計算比較所建立模型中最優(yōu)的一個。
根據(jù)AIC 最小原則,函數(shù)自動識別模型為ARIMA(2,0,0)(2,1,0)[12]模型,根據(jù)此模型對R 軟件擬合模型的殘差進(jìn)行隨機性白噪聲檢驗,求得假定值P為0.9725,明顯大于0.05,說明通過白噪聲檢驗;當(dāng)P>0.05 時,擬合殘差項中不再蘊含任何相關(guān)信息,擬合模型顯著有效[14]。
2.2.3 模型精度評價
利用已建立的最優(yōu)ARIMA(2,0,0)(2,1,0)[12]模型“反向預(yù)測”2018 年1-12 月的手足口病月發(fā)病率,以實際值與預(yù)測值進(jìn)行模型精度對比評價。山西省2018 年手足口病月發(fā)病率的預(yù)測值與實際值比較及預(yù)測精度見表2。
表2 山西省2018 年手足口病月發(fā)病率的預(yù)測值與實際值比較及預(yù)測精度
表2 顯示,2018 年5 月、6 月和8 月絕對誤差分別為4.5759、7.3613 和2.8540,明顯大于1,說明預(yù)測結(jié)果異常;雖然4 月、7 月、11 月的絕對誤差分別約為1.6、1.9 和1.7,也大于1,但相較于5月、6 月和8 月絕對誤差偏小,所以可認(rèn)為除5 月、6 月和8 月外其余9 個月的絕對誤差均保持在1左右。山西省衛(wèi)生和計劃生育委員會2018 年發(fā)布的相關(guān)數(shù)據(jù)顯示[10],當(dāng)年為手足口病高峰年,整體流行強度高于往年,因此2018 年5 月、6 月和8月的預(yù)測值與實際數(shù)值存在相對大的偏差。
利用代碼R2(pred$mean,test)計算出R2為0.751 1868,R是相關(guān)系數(shù),R2指擬合優(yōu)度。當(dāng)R2>0.75 時,說明模型擬合度很好,該預(yù)測模型精度較高。
再利用已建立的ARIMA(2,0,0)(2,1,0)[12]模型預(yù)測山西省2007 年1 月至2018 年12 月手足口病的月發(fā)病率,用2007 年1 月至2018 年12 月的實際月發(fā)病率數(shù)據(jù)與已預(yù)測的月發(fā)病率數(shù)據(jù)進(jìn)行趨勢擬合分析,結(jié)果如圖6 所示。
圖6 山西省2007-2018 年手足口病月發(fā)病率實際值與模型預(yù)測值的趨勢擬合
圖6 顯示,本文建立的ARIMA 預(yù)測模型所預(yù)測的山西省2007 年1 月至2018 年12 月手足口病的月發(fā)病率趨勢與實際發(fā)病率趨勢走向整體上大致相同,進(jìn)一步肯定了ARIMA(2,0,0)(2,1,0)[12]模型的可用性和準(zhǔn)確性,因此可以使用該模型預(yù)測山西省2019-2023 年手足口病月發(fā)病率。
2.2.4 模型預(yù)測
ARIMA 模型的功能之一是預(yù)測未來連續(xù)年份的發(fā)病率,目前大量研究者均用該模型預(yù)測各種疾病未來5 年的發(fā)病率。同時,本文將2018 年實際數(shù)據(jù)與預(yù)測數(shù)據(jù)進(jìn)行對比,驗證結(jié)果顯示模型預(yù)測值與實際值契合度較高,因此利用該模型進(jìn)行5年趨勢外推具有可行性。
用選定的ARIMA(2,0,0)(2,1,0)[12]模型對山西省2019 年1 月至2023 年12 月份手足口病發(fā)病率進(jìn)行預(yù)測,預(yù)測結(jié)果見表3。表3 顯示每年6-8月份手足口病的月發(fā)病率仍然高于其他月份,需要在這段時間內(nèi)加大預(yù)防力度。為更加直觀地說明問題,將表格中的預(yù)測數(shù)據(jù)轉(zhuǎn)換成趨勢圖(圖7)。
表3 山西省2019-2023 年手足口病發(fā)病率預(yù)測值(1/10 萬)
圖7 山西省2019-2023 年手足口病月發(fā)病率預(yù)測趨勢
ARIMA(2,0,0)(2,1,0)[12]模型預(yù)測結(jié)果顯示,山西省未來5 年的手足口病月發(fā)病率仍呈現(xiàn)周期性波動,波動規(guī)律平穩(wěn),或?qū)⒊尸F(xiàn)略微上升趨勢。
本文通過建立ARIMA(2,0,0)(2,1,0)[12]模型預(yù)測了2019-2023 年山西省手足口病的月發(fā)病率,結(jié)果顯示手足口病發(fā)病率呈平穩(wěn)趨勢,且存在周期性,每年4-7 月為春夏季發(fā)病高峰期,10-11月為秋季發(fā)病高峰期。
登錄山西省疾病預(yù)防控制中心官方網(wǎng)站(http://www.sxcdc.cn/index.htm),查閱發(fā)布的傳染病疫情統(tǒng)計信息,比較實際數(shù)據(jù)和預(yù)測數(shù)據(jù)的差距。比較結(jié)果顯示,2019-2021 年的4、5、6 月份發(fā)布的丙類傳染病病例當(dāng)中,包含手足口病在內(nèi)的3 種傳染病占報告發(fā)病數(shù)的90%以上。雖然山西省疾病預(yù)防控制中心提示春季是呼吸道傳染病和手足口病等腸道傳染病的高發(fā)季節(jié)[15],與模型預(yù)測每年7 月是手足口病發(fā)病率最高的月份有所出入,但究其原因,主要是每年春季手足口病發(fā)病初期疾病防控部門都會進(jìn)行干預(yù),因而防止了手足口病月發(fā)病率到達(dá)模型預(yù)測出的最高點,側(cè)面驗證了模型精度。
針對山西省手足口病發(fā)病率常年波動且緩慢上升的趨勢,建議采取以下手足口病的綜合防治措施。
利用可獲得的數(shù)據(jù)對山西省手足口病月發(fā)病率進(jìn)行預(yù)測預(yù)警,可以有效提醒山西省衛(wèi)生健康委員會、山西省疾病控制中心等有關(guān)部門提前加強流行病宣傳教育,尤其是對易發(fā)生手足口病的地區(qū)或單位開展重點人群宣傳教育。同時,醫(yī)院與社區(qū)等有關(guān)單位在做好日常宣傳的基礎(chǔ)上,定期舉辦手足口病知識普及活動,對手足口病的傳播途徑和病原寄生方式進(jìn)行科普,使公眾充分了解相關(guān)癥狀、危害及預(yù)防方式,以及更好地了解手足口病的流行規(guī)律,為制定相關(guān)防治策略提供中肯意見及參考依據(jù),以有效應(yīng)對流感、手足口病等重點傳染病疫情,保證易感人群的健康。
實施流行病綜合防控戰(zhàn)略,加強省內(nèi)的國家流行病綜合防控示范區(qū)建設(shè),建立預(yù)防手足口病的專門機構(gòu),設(shè)立相關(guān)崗位,如手足口病宣傳員、防疫員等,吸納高素質(zhì)前沿人才,建立強大的山西省醫(yī)療人才儲備軍,確保防疫工作順利開展;提高省內(nèi)防治手足口病資金支持力度,加大對醫(yī)療設(shè)備、藥品、人才的投入,建立健全覆蓋全省的公共衛(wèi)生服務(wù),防治手足口病等重大突發(fā)疫病。
在現(xiàn)有防控措施的基礎(chǔ)上,與相關(guān)機構(gòu)緊密協(xié)作,規(guī)范病例監(jiān)測報告,開展手足口病咨詢服務(wù),進(jìn)行手足口病知識培訓(xùn),加大宣傳教育的力度,使公眾深入了解手足口病的傳染方式、防治措施等知識,規(guī)范做好疫苗預(yù)防接種。在自愿、自費原則的前提下,積極動員適齡兒童接種手足口病疫苗,并提供安全、規(guī)范的預(yù)防接種服務(wù),保障人民群眾身體健康。
在傳染病發(fā)病率預(yù)測研究中,常用的模型預(yù)測方法有很多,ARIMA 模型因其便捷易行且模型精度較高而被廣泛使用。本文利用山西省2007-2017年手足口病的月發(fā)病率數(shù)據(jù)構(gòu)建ARIMA 模型,經(jīng)過序列平穩(wěn)化平穩(wěn)性檢驗處理、模型定階、參數(shù)估算及模型的檢驗等步驟計算得出最優(yōu)模型ARIMA(2,0,0)(2,1,0)[12],其預(yù)測值與實際月發(fā)病率基本在模型擬合的95%置信區(qū)間內(nèi),說明當(dāng)月疫情無異常,該模型精度較高,可用來對山西省手足口病月發(fā)病率進(jìn)行短期預(yù)測。
本研究還存在以下局限。一是ARIMA 模型依賴于數(shù)據(jù)本身且要求時序數(shù)據(jù)穩(wěn)定,用此模型對手足口病發(fā)病率進(jìn)行預(yù)測分析時難以兼顧外部環(huán)境的變化,如人群的變化、空氣質(zhì)量變化、氣溫異常變化等;二是所能查閱到的官方數(shù)據(jù)資料只更新到2018 年,而2019 年至今的數(shù)據(jù)沒有在正規(guī)的網(wǎng)站上公布,因此存在數(shù)據(jù)滯后的問題;三是判斷模型精度時只使用了平均絕對誤差這一種標(biāo)準(zhǔn),沒有采用更多的標(biāo)準(zhǔn)進(jìn)行比較,雖然結(jié)果可靠,但仍沒有達(dá)到最精確的水平。今后的研究將完善模型精確度,以獲得更嚴(yán)謹(jǐn)、更全面的山西省手足口病月發(fā)病率預(yù)測結(jié)果。