朱佳佳 胡登利 呂媛
【摘要】目的 探討ARIMA模型在我國甲肝發(fā)病預(yù)測(cè)中的可行性。方法 采用我國2004年~2016年的甲肝月發(fā)病資料擬合ARIMA乘積季節(jié)模型,并用2017年發(fā)病資料驗(yàn)證模型的預(yù)測(cè)效果。結(jié)果 ARIMA
(0,1,1)(0,1,1)12模型能夠較好地?cái)M合我國2004年~2016年甲肝的時(shí)間序列,2017年甲肝月發(fā)病數(shù)預(yù)測(cè)值均落入95%置信區(qū)間內(nèi),且與實(shí)際發(fā)病數(shù)值基本吻合。結(jié)論 ARIMA乘積季節(jié)模型較好反映了我國甲肝發(fā)病情況,對(duì)甲肝未來的疫情有很好的的短期預(yù)測(cè)能力。
【關(guān)鍵詞】ARIMA乘積季節(jié)模型;甲肝;預(yù)測(cè)
【中圖分類號(hào)】R181.3 【文獻(xiàn)標(biāo)識(shí)碼】B 【文章編號(hào)】ISSN.2095-6681.2018.22..02
甲型病毒性肝炎(Hepatitis A),簡(jiǎn)稱甲肝,是甲肝病毒(Hepatitis A virus,HAV)引起的,主要經(jīng)糞-口途徑傳播的急性傳染病。甲肝在全球均有報(bào)道,但由于經(jīng)濟(jì)衛(wèi)生條件差異,各個(gè)國家和地區(qū) 的甲肝流行趨勢(shì)呈現(xiàn)明顯差異。研究表明,收入水平和清潔飲用水可及性越高的國家和地區(qū),甲肝發(fā)病率較低[1]。全球每年新發(fā)HAV感染者約140萬人,我國各地每年均有病例報(bào)告,呈高度散發(fā),暴發(fā)主要集中在學(xué)校等人群密集區(qū)域,西部地區(qū)省份發(fā)病率較高[2]。近年來我國甲肝發(fā)病率呈下降趨勢(shì),但發(fā)病人數(shù)中兒童和青少年占有很大比例[3]。本研究將采用自回歸移動(dòng)平均模型(autoregressive integrated moving average model,ARIMA)分析我國甲肝的時(shí)間分布特征并就發(fā)病趨勢(shì)進(jìn)行預(yù)測(cè),探討其在甲肝發(fā)病預(yù)測(cè)中的可行性。
1 資料與方法
1.1 一般資料
2004年1月~2017年12月全國各省甲肝月發(fā)病數(shù)監(jiān)測(cè)數(shù)據(jù),來源于“中國疾病預(yù)防控制信息系統(tǒng)”網(wǎng)絡(luò)報(bào)告系統(tǒng)。
1.2 方法
基于2004年1月~2016年12月全國甲肝月發(fā)病數(shù)建立ARIMA乘積季節(jié)模型,并用2017年發(fā)病數(shù)據(jù)進(jìn)行驗(yàn)證預(yù)測(cè)效果。統(tǒng)計(jì)分析采用SPSS 23.0。
ARIMA模型的建立過程主要分為以下幾步[4]:原始序列平穩(wěn)化處理、模型的識(shí)別、模型的參數(shù)估計(jì)和模型的診斷。
2 結(jié) 果
2.1 全國甲肝發(fā)病變化趨勢(shì)
繪制2004年1月~2016年12月全國甲肝月發(fā)病數(shù)時(shí)間序列圖(見圖1),發(fā)現(xiàn)我國甲肝全年均有發(fā)病,但發(fā)病數(shù)逐年遞減。每年6月~10月是發(fā)病高峰期,呈現(xiàn)一定的季節(jié)性波動(dòng),周期為12個(gè)月。故甲肝發(fā)病序列并不是穩(wěn)定的時(shí)間序列。
2.2 時(shí)間序列的平穩(wěn)化處理
對(duì)原始序列進(jìn)行一階普通差分和一階周期為12的季節(jié)性差分后,發(fā)現(xiàn)時(shí)序圖趨于平穩(wěn),且自相關(guān)系數(shù)函數(shù)圖(ACF)截尾,偏自相關(guān)函數(shù)圖(PACF)拖尾,說明此時(shí)的序列為平穩(wěn)序列,符合ARIMA模型要求。
2.3 模型識(shí)別
由上述初步確定建立ARIMA(p,1,q)(P,1,Q)12模型,p,q和P,Q是連續(xù)模型和季節(jié)模型中的自回歸階數(shù)和移動(dòng)平均階數(shù),需依據(jù)平穩(wěn)序列的ACF和PACF確定。相關(guān)文獻(xiàn)提示均不會(huì)超過2階,故采用由低階到高階方式擬合模型。經(jīng)比較,ARIMA(0,1,1)(0,1,1)12模型的標(biāo)準(zhǔn)化BIC最小(12.954),且R2(0.884)和標(biāo)準(zhǔn)化R2(0.381)較高,擬合優(yōu)度較高,因此可視為本研究的最優(yōu)模型。
2.4 模型參數(shù)的估計(jì)與模型診斷
ARIMA(0,1,1)(0,1,1)12模型殘差的ACF和PACF均落在95%置信區(qū)間內(nèi)(見圖2),提示殘差是隨機(jī)分布的。模型的參數(shù)估計(jì)結(jié)果見表1,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。Box-Ljung Q檢驗(yàn)結(jié)果顯示殘差序列為白噪聲序列(P=0.907),說明模型對(duì)數(shù)據(jù)信息的提取較為充分。
2.5 模型預(yù)測(cè)
ARIMA(0,1,1)(0,1,1)12模型對(duì)我國2017年1月~12月的甲肝發(fā)病的預(yù)測(cè)值和實(shí)際發(fā)病數(shù)比較結(jié)果見
表2。所有預(yù)測(cè)值均落入95%置信區(qū)間內(nèi),二者基本吻合,預(yù)測(cè)值與實(shí)際值之間的相對(duì)誤差范圍為2.4%~37.1%,說明該模型對(duì)我國甲肝的實(shí)際發(fā)病有較好的的預(yù)測(cè)能力。
3 討 論
時(shí)間序列分析[4]能將影響疾病發(fā)生的多種因素綜合考慮于時(shí)間變量中,分析發(fā)病數(shù)據(jù)隨時(shí)間發(fā)展變化規(guī)律,并能進(jìn)行有效外推預(yù)測(cè)[5]。ARIMA模型是時(shí)間序列分析最常用的方法之一,本文將ARIMA乘積季節(jié)模型應(yīng)用于我國甲肝的發(fā)病規(guī)律研究中,利用2004年~2016年共156個(gè)月份的甲肝發(fā)病監(jiān)測(cè)資料建立的ARIMA(0,1,1)(0,1,1)12模型,較好地反映了我國甲肝發(fā)病序列的特征。2017年1月~6月的驗(yàn)證數(shù)據(jù)與實(shí)際值的吻合度較高,發(fā)病趨勢(shì)與往年基本一致,相對(duì)誤差較小,而7月~12月的預(yù)測(cè)數(shù)據(jù)相對(duì)誤差較大,表明利用ARIMA乘積季節(jié)模型可以對(duì)我國甲肝發(fā)病趨勢(shì)進(jìn)行短期預(yù)測(cè)。
本研究的數(shù)據(jù)來源于我國傳染病報(bào)告信息系統(tǒng),質(zhì)量可靠,但應(yīng)注意的是,ARIMA模型適合疾病的短期預(yù)測(cè)[6],因此要不斷納入新的發(fā)病數(shù)據(jù),調(diào)整模型參數(shù)以適應(yīng)疾病的實(shí)際發(fā)生情況。此外,由于甲肝的發(fā)生還受諸多因素的影響,故后續(xù)研究中應(yīng)嘗試將影響因素納入模型中以提高模型預(yù)測(cè)的精確性和準(zhǔn)確性。
參考文獻(xiàn)
[1] Elisabetta F,Cristina M,Laura S,et al.Hepatitis A:Epidemiology and prevention in developing countries[J].World J Hepatol,2012,4(3):68-73.
[2] 黃建華,蒙世庭.甲性病毒性肝炎流行病學(xué)研究進(jìn)展[J].實(shí)用預(yù)防醫(yī)學(xué),2012,19(5):799-800.
[3] 張 鋒,姜立民,朱 赟.中國大陸地區(qū)2004-2012年甲型肝炎的流行特征分析[J].國際流行病學(xué)傳染病學(xué)雜志,2014,41(5):305-307.
[4] 張愛紅,周 培,申銅倩,彭志行,等.乘積季節(jié)ARIMA模型在食源性疾病預(yù)測(cè)中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計(jì),2014,31(1):68-73.
[5] Chen B,Sumi A,Toyoda S,Hu Q,et al.Time series analysis of reported cases of hand,foot,and mouth disease from 2010 to 2013 in Wuhan,China[J].BMC Infect Dis,2015,15:495.
[6] 孟 蕾,王新華,白亞娜,李保娣,等.甘肅省哨點(diǎn)醫(yī)院流感樣病例ARIMA模型預(yù)測(cè)[J].中國公共衛(wèi)生,2014,30(2):228-230.
本文編輯:劉欣悅