肖占沛 王燕 張肖肖 路明霞 馬雅婷 張延煬
[摘要]目的建立乘積季節(jié)自回歸移動(dòng)平均(ARIMA)模型,觀察其對河南省流行性腮腺炎疫情預(yù)測的可行性。方法利用河南省2004~2013年分月的流行性腮腺炎疫情監(jiān)測資料建立乘積季節(jié)ARIMA模型,利用2014年1~12月的流行性腮腺炎疫情資料評價(jià)該模型的預(yù)測效能。結(jié)果河南省2004~2013年流行性腮腺炎發(fā)病呈現(xiàn)明顯的季節(jié)效應(yīng),且發(fā)病數(shù)在2006年后呈現(xiàn)逐年增多的趨勢;模型ARIM(1,0,2)(0,1,1)12能較好地?cái)M合既往的流行性腮腺炎報(bào)告病例數(shù),且對2014年1~12月按月報(bào)告的流行性腮腺炎病例數(shù)的預(yù)測值與實(shí)際值基本吻合。結(jié)論ARIMA模型能較好地模擬、預(yù)測河南省流行性腮腺炎的發(fā)病情況。
[關(guān)鍵詞]乘積季節(jié)自回歸移動(dòng)平均模型;流行性腮腺炎;疾病預(yù)測
[中圖分類號(hào)]R512.1 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]2095-0616(2016)02-07-04
流行性腮腺炎是一種由腮腺炎病毒引起的急性呼吸道傳染病,其傳染性僅次于麻疹和水痘,嚴(yán)重影響了青少年兒童的身體健康。近年來,河南省流行性腮腺炎發(fā)病呈現(xiàn)上升趨勢,其防控形勢不容樂觀,因此,為科學(xué)有效地應(yīng)對流行性腮腺炎防控,有必要對流行性腮腺炎發(fā)病水平進(jìn)行短期預(yù)測,國內(nèi)外有研究者利用疫情監(jiān)測數(shù)據(jù)構(gòu)建自回歸移動(dòng)平均(ARIMA)模型,根據(jù)近幾年某傳染病的流行特點(diǎn),來進(jìn)一步預(yù)測該傳染病的發(fā)病情況和發(fā)展趨勢,取得了較好的預(yù)測效果。本研究利用河南省2004~2013年分月流行性腮腺炎疫情監(jiān)測數(shù)據(jù)建立ARIMA模型,并利用2014年的監(jiān)測數(shù)據(jù)評價(jià)ARIMA模型的預(yù)測效果,進(jìn)而探討河南省流行性腮腺炎發(fā)病趨勢預(yù)測預(yù)警的方法。
1.資料與方法
1.1一般資料
資料來源于《中國疾病監(jiān)測信息報(bào)告系統(tǒng)》中河南省2004年1月-2014年12月流行性腮腺炎月發(fā)病病例數(shù)共169 537例。
1.2研究方法
基于2004年1月~2013年12月流行腮腺炎發(fā)病數(shù)資料建立乘積季節(jié)ARIMA模型,用2014年流行腮腺炎發(fā)病數(shù)資料來驗(yàn)證模型的預(yù)測效果。ARIMA模型包括:自回歸模型(AR)、移動(dòng)平均模型(MA)和ARIMA模型,一般包括4個(gè)步驟,分別為:序列平穩(wěn)化、模型的識(shí)別、參數(shù)估計(jì)和模型診斷、預(yù)測應(yīng)用,依據(jù)2004年1月~2013年12月流行腮腺炎發(fā)病數(shù)資料,通過這3個(gè)步驟反復(fù)建模,篩選出最優(yōu)的預(yù)測模型。(1)模型識(shí)別:觀察2004~2013年流行腮腺炎分月監(jiān)測數(shù)據(jù)的時(shí)間序列的平穩(wěn)性,如若是非平穩(wěn)序列,要通過數(shù)據(jù)轉(zhuǎn)化和一階周期為12的季節(jié)性差分將序列平穩(wěn)化。首先,根據(jù)平穩(wěn)序列的ACF圖和PACF圖,來識(shí)別序列的季節(jié)性成分,然后,再根據(jù)殘差序列的ACF圖和PACF圖,識(shí)別非季節(jié)性成分,最終識(shí)別模型。(2)參數(shù)估計(jì):依據(jù)最大似然法或無約束最小二乘法原則,根據(jù)序列的自相關(guān)系數(shù)和偏相關(guān)系數(shù),經(jīng)過不同方法的參數(shù)選擇、比較、篩選,估計(jì)出自回歸移動(dòng)平均過程的系數(shù),并對各系數(shù)進(jìn)行顯著性假設(shè)檢驗(yàn)。(3)模型檢驗(yàn):預(yù)測模型是否合適,取決于其殘差序列是否為白噪音序列,合適的模型其殘差呈白噪音,其ACF和PACF與零應(yīng)無統(tǒng)計(jì)學(xué)差異,利用此標(biāo)準(zhǔn)對所建立的ARIMA模型是否合適作出診斷。若幾個(gè)模型都能滿足要求,選取AIC、BIC較小者及R2較大者,則模型效果較好。(4)模型預(yù)測:對序列進(jìn)行平穩(wěn)化后,選擇最優(yōu)的模型,對河南省2014年1~12月的按月報(bào)告的流行腮腺炎病例數(shù)的數(shù)據(jù)進(jìn)行預(yù)測,觀察其預(yù)測效果。
1.3統(tǒng)計(jì)學(xué)處理
采用Excel 2007建立河南省流行性腮腺炎月報(bào)告發(fā)病數(shù)數(shù)據(jù)庫,運(yùn)用PASW statistics19.0軟件進(jìn)行ARIMA模型構(gòu)建及統(tǒng)計(jì)分析。
2.結(jié)果
2.1河南省2004~2013年流行性腮腺炎報(bào)告病例數(shù)的變化趨勢
河南省2004~2013年流行性腮腺炎報(bào)告病例數(shù)呈現(xiàn)明顯的季節(jié)性,每年的3~7月及11月~次年1月呈現(xiàn)發(fā)病高峰,自2006年起,呈現(xiàn)上升趨勢,提示該時(shí)間序列為非平穩(wěn)序列。河南省2004~2013年流行性腮腺炎月發(fā)病數(shù)時(shí)間序列圖,見圖1。
2.2模型識(shí)別結(jié)果
從原序列圖可以看出,該序列方差不平穩(wěn),且有明顯的季節(jié)規(guī)律,為消除原序列的不平穩(wěn)趨勢,首先對其進(jìn)行對數(shù)轉(zhuǎn)換和季節(jié)差分,經(jīng)對數(shù)轉(zhuǎn)換和1次季節(jié)差分后作ACF和PACF分析(圖2)。根據(jù)圖2可以看出,ACF圖在時(shí)點(diǎn)1呈現(xiàn)一個(gè)高峰,而PACF圖在季節(jié)性時(shí)點(diǎn)1、13、25處呈現(xiàn)指數(shù)衰減,由上述特點(diǎn)可初步選定季節(jié)模型是ARIMA(0,1,1)12。
同時(shí)圖2中,ACF圖在12點(diǎn)處還出現(xiàn)了一個(gè)單一的季節(jié)性低估。我們對ARIMA(0,1,1)12殘差序列進(jìn)行ACF和PACF分析(圖3),與標(biāo)準(zhǔn)的ACF和PACF圖比較,非季節(jié)模型可能是ARIMA(1,0,1)、ARIMA(1,0,0)或者ARIMA(1,0,2),因此,可擬合3個(gè)備選混合效應(yīng)模型ARIMA(1,0,1)(0,1,1)12,ARIMA(1,0,0)(0,1,1)12和ARIMA(1,0,2)(0,1,1)12。
2.3參數(shù)估計(jì)及檢驗(yàn)
3個(gè)備選模型的參數(shù)估計(jì)及檢驗(yàn)結(jié)果見表1,經(jīng)過參數(shù)比較和選擇,根據(jù)BIC最小和R2最大的準(zhǔn)則和模型簡潔原則,初步判斷為模型ARIMA(1,0,2)(0,1,1)12。
2.4模型診斷
在SPSS19.0中對模型ARIM(1,0,2)(0,1,1)12的殘差進(jìn)行Q檢驗(yàn),結(jié)果顯示,Ljung-Box Q=19.765,P=0.138,差異無統(tǒng)計(jì)學(xué)意義,說明模型ARIMA(1,0,2)(0,1,1)12殘差序列呈白噪聲,提示所選模型恰當(dāng),適用于預(yù)測。
2.5模型擬合和預(yù)測
本研究用ARIMA(1,0,2)(0,1,1)12模型對原序列進(jìn)行了擬合和預(yù)測,見圖4,擬合值的動(dòng)態(tài)趨勢與實(shí)際值具有基本相似的升降規(guī)律,這說明擬合效果較好。
運(yùn)用模型ARIMA(1,0,2)(0,1,1)12對河南省2014年1-12月流行性腮腺炎的報(bào)告病例數(shù)進(jìn)行預(yù)測,結(jié)果見圖5,預(yù)測值均在實(shí)際值的95%可信區(qū)間范圍內(nèi),且預(yù)測值的動(dòng)態(tài)趨勢與實(shí)際值基本一致。
3.討論
ARIMA模型是一種基于時(shí)間序列分析、預(yù)測和控制的方法,是一種精度較高的短期預(yù)測法,其基本思想是利用時(shí)間序列的觀測值所具有的依存關(guān)系或相關(guān)特點(diǎn),依據(jù)預(yù)測對象發(fā)展的延續(xù)性,預(yù)測對象發(fā)展的未來值或變化趨勢,該模型能綜合考慮季節(jié)、趨勢和隨機(jī)干擾等因素,所以,特別適用于時(shí)序規(guī)律不明顯,或有明顯季節(jié)性和周期性的情況。在國內(nèi)相關(guān)研究中,ARIMA模型在流行性腮腺炎發(fā)病率預(yù)測方面,其可行性與準(zhǔn)確性已得到充分地驗(yàn)證。
本研究利用河南省2004-2013年流行性腮腺炎的月發(fā)病數(shù)擬合了ARIMA(1,0,2)(0,1,1)12模型,并對2014年1~12月的發(fā)病情況進(jìn)行了回代預(yù)測,其結(jié)果顯示,模型擬合值與實(shí)際發(fā)病數(shù)基本一致,預(yù)測值均在實(shí)際值的95%可信區(qū)間范圍內(nèi),預(yù)測精確度較高,這提示該模型有較好的預(yù)測效果,對河南省流行性腮腺炎發(fā)病趨勢的預(yù)測具有可行性,在河南省流行性腮腺炎發(fā)病預(yù)測中具有推廣應(yīng)用的實(shí)際價(jià)值,但是該模型也有不足之處:(1)建立此預(yù)測模型需要很大數(shù)量的歷史數(shù)據(jù),且數(shù)據(jù)越多,預(yù)測效果越好;(2)該預(yù)測模型只能用于短期預(yù)測,在實(shí)際工作中,應(yīng)注意數(shù)據(jù)的及時(shí)性,動(dòng)態(tài)掌握流行性腮腺炎的發(fā)病變化趨勢,以新數(shù)據(jù)來重新擬合預(yù)測模型,同時(shí),建立動(dòng)態(tài)分析評價(jià)該序列的策略,從而采取具有針對性、預(yù)見性和主動(dòng)性的防控措施。