河南省疾病預(yù)防控制中心信息中心(450016) 陳正利 陳 偉 許汴利
應(yīng)用ARIMA模型對(duì)河南省1991-2011年乙型肝炎發(fā)病趨勢(shì)分析
河南省疾病預(yù)防控制中心信息中心(450016) 陳正利 陳 偉 許汴利
目的 探討應(yīng)用ARIMA模型對(duì)河南省進(jìn)行乙肝發(fā)病趨勢(shì)進(jìn)行預(yù)測(cè),為制定防控策略提供科學(xué)依據(jù)。方法 采用SPSS15.0軟件對(duì)河南省1991~2011年乙型肝炎發(fā)病率擬合ARIMA模型進(jìn)行預(yù)測(cè),將預(yù)測(cè)值與實(shí)際值進(jìn)行比較。結(jié)果 確定模型為ARIMA(0,1,1),殘差序列為隨機(jī)序列,預(yù)測(cè)值和實(shí)際值平均相對(duì)誤差為10.04%,預(yù)測(cè)2012年乙肝發(fā)病率為182.1/10萬(wàn)。結(jié)論 ARIMA(0,1,1)模型可以很好擬合乙肝發(fā)病趨勢(shì),可為乙肝防治提供科學(xué)依據(jù)。2012年預(yù)測(cè)結(jié)果提示乙肝發(fā)病有上升趨勢(shì),當(dāng)?shù)乜芍贫ㄏ鄳?yīng)防控策略。
乙型肝炎 ARIMA 時(shí)間序列分析 預(yù)測(cè)
乙型肝炎(簡(jiǎn)稱乙肝)是由乙型肝炎病毒(HBV)感染引起的傳染病,目前已成為影響我國(guó)居民健康的重要公共衛(wèi)生問題〔1-2〕。河南省又是乙肝高發(fā)區(qū),多年來法定傳染病報(bào)告中乙肝發(fā)病均居首位,根據(jù)河南省1991-2011年乙型肝炎發(fā)病資料探討預(yù)測(cè)分析方法,為乙肝防治提供科學(xué)的依據(jù)。
1.資料來源 河南省1991-2011年乙型肝炎疫情數(shù)據(jù)來自《疾病監(jiān)測(cè)信息報(bào)告系統(tǒng)》網(wǎng)絡(luò)直報(bào)的訂正數(shù)據(jù)。
2.分析方法 運(yùn)用SPSS 15.0軟件的ARIMA模型做預(yù)測(cè)分析。
ARIMA模型(自回歸綜合移動(dòng)平均模型)是Box-Jenkins方法中常用的時(shí)間序列分析模型。ARIMA模型的建模分三步〔3〕:第一步,模型的識(shí)別:利用自相關(guān)分析和偏自相關(guān)分析等方法,判定時(shí)間序列的隨機(jī)性、平穩(wěn)性和季節(jié)性,并采用差分的方法對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)化處理,根據(jù)自相關(guān)和偏自相關(guān)圖的截尾性判定模型的階數(shù)。第二步,模型的參數(shù)估計(jì):利用時(shí)間序列的數(shù)據(jù)估計(jì)模型的參數(shù),并進(jìn)行檢驗(yàn),以判定該模型是否恰當(dāng)。如不恰當(dāng),重新選定模型。第三步,預(yù)測(cè)分析:用選定的模型對(duì)將來某個(gè)時(shí)期的數(shù)值及可信區(qū)間做出預(yù)測(cè)。
1991~2011年河南省乙型肝炎發(fā)病率在21.2/10萬(wàn)~159.4/10萬(wàn)波動(dòng),具有明顯的上升趨勢(shì)。見圖1
(1)模型的識(shí)別
本研究資料原始時(shí)間序列不滿足隨機(jī)性、平穩(wěn)性的要求,對(duì)序列采取了一階差分消除趨勢(shì)的影響,得到了平穩(wěn)的時(shí)間序列,符合了ARIMA模型的要求。根據(jù)自相關(guān)圖和偏相關(guān)圖分析初步確定模型形式ARIMA(0,1,1),R2=0.95,NormalizedBIC=5.305。一階差分后的自相關(guān)圖和偏相關(guān)圖見圖2。
圖1 1992~2011年乙肝發(fā)病趨勢(shì)及擬合預(yù)測(cè)
圖2
(2)模型的參數(shù)估計(jì)
參數(shù)檢驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義(P=0.025)。對(duì)殘差序列進(jìn)行白噪聲檢驗(yàn),Ljung-Box(18)=14.39(P=0.639),殘差序列的自相關(guān)系數(shù)均落在95%的可信區(qū)間內(nèi),說明誤差項(xiàng)是隨機(jī)的,可認(rèn)為殘差序列是白噪聲,說明模型已經(jīng)充分提取信息,模型是適宜的,可進(jìn)行預(yù)測(cè)。見圖3。
圖3 殘差序列自相關(guān)和偏自相關(guān)圖
(3)預(yù)測(cè)分析
根據(jù)建立的模型對(duì)1992-2011年河南省乙型肝炎發(fā)病率進(jìn)行回代,平均絕對(duì)誤差百分比為10.04%,結(jié)果顯示的動(dòng)態(tài)趨勢(shì)和實(shí)際情況吻合,模型擬合較好。預(yù)測(cè)2012年乙型肝炎發(fā)病率為182.1/10萬(wàn),95%可信區(qū)間(156.5,207.6)。擬合及預(yù)測(cè)結(jié)果見圖1。
河南省是乙肝高發(fā)區(qū),多年來法定傳染病報(bào)告中乙肝發(fā)病均居首位,根據(jù)近二十年乙肝發(fā)病趨勢(shì)看,乙肝發(fā)病率呈逐年上升趨勢(shì),這與其他省份的研究報(bào)道一致〔4-5〕。2004年后較2003年前大幅度上升可能與2004年開始實(shí)行了傳染病網(wǎng)絡(luò)直報(bào)制度有關(guān)。乙肝對(duì)居民的身體健康造成巨大威脅,給國(guó)家和居民個(gè)人帶來了沉重的經(jīng)濟(jì)負(fù)擔(dān)和社會(huì)問題,已成為現(xiàn)階段重要的公共衛(wèi)生問題,對(duì)乙肝發(fā)病率的預(yù)測(cè)可以為衛(wèi)生部門制定防控策略提供科學(xué)的依據(jù),具有重要意義。
時(shí)間序列分析是根據(jù)事物自身變動(dòng)情況建立動(dòng)態(tài)模型,利用現(xiàn)代數(shù)理方法,擬合最優(yōu)模型,對(duì)未來進(jìn)行統(tǒng)計(jì)推斷〔6〕。ARIMA是時(shí)間序列預(yù)測(cè)方法中最復(fù)雜、最高級(jí)的方法,是由美國(guó)威斯康辛大學(xué)Box-Jenkins于70年代提出,近年來已被公共衛(wèi)生學(xué)者重視,廣泛應(yīng)用在醫(yī)療公共衛(wèi)生各個(gè)領(lǐng)域中〔7〕。運(yùn)用數(shù)學(xué)模型探索疾病發(fā)病規(guī)律的方法,在傳染病控制方面取得了良好的發(fā)展〔8-9〕,目前國(guó)內(nèi)外應(yīng)用時(shí)間序列法對(duì)乙肝資料進(jìn)行分析和預(yù)測(cè)的研究均有報(bào)道〔10-11〕。本文根據(jù)乙肝發(fā)病情況建立動(dòng)態(tài)模型,通過運(yùn)用ARIMA(0,1,1)進(jìn)行模型擬合并外推預(yù)測(cè),殘差序列為隨機(jī)序列,預(yù)測(cè)的動(dòng)態(tài)趨勢(shì)和實(shí)際情況吻合,很好擬合了原始發(fā)病序列的趨勢(shì),預(yù)測(cè)精度較高,模型擬合較好。外推預(yù)測(cè)2012年乙肝發(fā)病率有上升趨勢(shì),結(jié)果可用于乙肝發(fā)病率趨勢(shì)的分析和預(yù)測(cè),為近階段制定相應(yīng)的防治措施提供依據(jù)。
本次研究資料來源于傳染病網(wǎng)絡(luò)直報(bào)系統(tǒng)報(bào)告的乙肝病例,疫情報(bào)告是否能真實(shí)反映乙肝發(fā)病情況,還需進(jìn)一步研究。2010年對(duì)乙肝報(bào)告進(jìn)行了規(guī)范,明確要求在集體體檢中發(fā)現(xiàn)的乙肝只進(jìn)行紙質(zhì)登記而不再進(jìn)行網(wǎng)絡(luò)報(bào)告,所以2010年乙肝發(fā)病率比往年明顯下降,本次預(yù)測(cè)未考慮疫情報(bào)告及質(zhì)量等因素,所以2010年預(yù)測(cè)值與真實(shí)值誤差較在,這在一定程度對(duì)預(yù)測(cè)結(jié)果會(huì)有影響。因此研究所建模型并非一成不變,可在一段時(shí)間內(nèi)進(jìn)行修正,以提高預(yù)測(cè)的敏感性。
1.王曉軍,張榮珍,胡苑笙,等.我國(guó)病毒性肝炎流行現(xiàn)狀研究.疾病監(jiān)測(cè),2004,19(8):209-292.
2.莊輝.乙型肝炎流行病學(xué)研究進(jìn)展.國(guó)外醫(yī)學(xué),流行病學(xué)傳染病學(xué)分,2004,6(3):133.
3.盧紋岱.SPSS for windows統(tǒng)計(jì)分析.第2版.北京:電子工業(yè)出版社,2002:412-433.
4.張發(fā)香,葉建君,鄭莉,等.湖北省乙肝疫情流行病學(xué)分析,公共衛(wèi)生與預(yù)防醫(yī)學(xué),2008,19(3):10-12.
5.鄭能雄,林云欽,鄭高.1994~2003年福州市乙型肝炎發(fā)病趨勢(shì)分析,中國(guó)公共衛(wèi)生管理,2005,21(4):311-314.
6.陶莊,金水高.時(shí)間序列分析簡(jiǎn)明攻略.中國(guó)衛(wèi)生統(tǒng)計(jì),2003,20(3):151-153.
7.章?lián)P熙著.醫(yī)學(xué)統(tǒng)計(jì)預(yù)測(cè).第1版.北京:中國(guó)科學(xué)技術(shù)出版社,1995:64.
8.馮超,白杉.時(shí)間序列模型擬合艾滋病發(fā)病趨勢(shì)預(yù)測(cè),中國(guó)公共衛(wèi)生,2005,21(7):893.
9.許筱紅,金小林.GM(1,1)數(shù)學(xué)模型在瘧疾疫情預(yù)測(cè)中的應(yīng)用,中國(guó)寄生蟲病防治雜志,2005,18(13):178-179.
10.徐元勇,溫亮,李申龍,等.應(yīng)用隨機(jī)時(shí)間序列分析法對(duì)軍隊(duì)乙型肝炎疫情的預(yù)測(cè)研究.現(xiàn)代預(yù)防醫(yī)學(xué),2008,35(18):3475-3478.
11.王春平,王志峰,單杰,等.隨機(jī)時(shí)間序列分析法在傳染病預(yù)測(cè)中的應(yīng)用.中國(guó)醫(yī)院統(tǒng)計(jì),2006,13(3):229-232.
(責(zé)任編輯:劉 壯)
中國(guó)衛(wèi)生統(tǒng)計(jì)2013年3期