侯麗英 柳麗花 焦建利 孔 平
“其他感染性腹瀉”是指除去霍亂、痢疾、傷寒和副傷寒以外的感染性腹瀉病,包括例如細(xì)菌、病毒、寄生蟲等病原體所引起的人體腸道感染[1]。上海市雖然經(jīng)濟(jì)較發(fā)達(dá),衛(wèi)生條件較好,但每年仍有一定程度的流行,使得該病的防控仍是一個(gè)重要的公共衛(wèi)生問(wèn)題。本文運(yùn)用時(shí)間序列分析中的自回歸綜合移動(dòng)平均模型(autoregressive integrated moving average model,ARIMA),結(jié)合上海市2011年3月-2017年l2月間的其他感染性腹瀉數(shù)據(jù)的分布特征,在模型比較、檢驗(yàn)基礎(chǔ)上建立擬合模型,并進(jìn)行預(yù)測(cè),為其他感染性腹瀉疾病的防控策略提供依據(jù)。
上海市2011年3月-2017年l2月的其他感染性腹瀉的發(fā)病資料和相應(yīng)的人口學(xué)資料來(lái)源于上海市衛(wèi)生和計(jì)劃生育委員會(huì)網(wǎng)站及相應(yīng)的上海市法定傳染病疫情報(bào)告[2]。
自回歸移動(dòng)平均模型(autoregressive moving average model,ARMA)是一種適用于短期且滿足平穩(wěn)性的時(shí)間序列預(yù)測(cè)模型,對(duì)于非平穩(wěn)序列,可以通過(guò)取對(duì)數(shù)或者差分等方法實(shí)現(xiàn)平穩(wěn)化,統(tǒng)稱為ARIMA(p,d,q)模型。如果序列還包含一定的季節(jié)周期性,則要考慮帶季節(jié)性的乘積模型ARIMA(p,d,q)(P,D,Q)s,模型建立的步驟一般可分為:序列的識(shí)別與平穩(wěn)化、參數(shù)估計(jì)、模型診斷與預(yù)測(cè)三個(gè)階段[3]。
(1)序列的識(shí)別與平穩(wěn)化。首先通過(guò)繪制時(shí)間序列圖像,觀察數(shù)據(jù)的分布特點(diǎn)和變化趨勢(shì),然后利用對(duì)數(shù)轉(zhuǎn)換與適當(dāng)?shù)牟罘?將序列變?yōu)槠椒€(wěn)時(shí)間序列。
(2)參數(shù)估計(jì)。參數(shù)估計(jì)是根據(jù)AIC(Akaike’s information criterion)或BIC(Schwarz’S Bayesian information criterion)最小信息準(zhǔn)則,進(jìn)行參數(shù)選擇與比較,進(jìn)而確定ARIMA中參數(shù)。
(3)模型診斷與預(yù)測(cè)。這一步是對(duì)模型的殘差序列進(jìn)行自相關(guān)、偏相關(guān)或白噪聲檢驗(yàn),判斷模型中是否還包含其他信息,當(dāng)模型達(dá)到預(yù)期精度要求時(shí),進(jìn)一步進(jìn)行預(yù)測(cè)[4]。
根據(jù)上海市2011年3月-2017年6月期間報(bào)告的“其他感染性腹瀉”月發(fā)病率數(shù)據(jù)繪制序列分布(圖1),可見(jiàn)發(fā)病率整體分布在0.48/10萬(wàn)~7.35/10萬(wàn)之間,具有長(zhǎng)期趨勢(shì),有明顯的季節(jié)性,一般在每年8月常會(huì)出現(xiàn)發(fā)病率的高峰,低點(diǎn)在2、3、4月。
圖1 上海市2011年3月-2017年6月其他感染性腹瀉月發(fā)病率時(shí)間序列分布
原序列在垂直方向上表現(xiàn)出平穩(wěn)性,但仍然具有季節(jié)的周期性,對(duì)原始序列進(jìn)行一階周期為12的季節(jié)性差分,新序列(圖2)自相關(guān)函數(shù)ACF圖形很快收斂,變得不顯著,表現(xiàn)為拖尾現(xiàn)象,因此可以認(rèn)為新序列已經(jīng)為一個(gè)平穩(wěn)序列。偏相關(guān)函數(shù)ACF圖形在一步之后,均落在可信區(qū)間之內(nèi),滿足一步截尾特點(diǎn),因此可以判斷它是一個(gè)一階自回歸序列(autoregressive series,AR(1))。初步確定模型參數(shù)為p=1,d=0,D=1,采用模型ARIMA(1,0,q)(P,1,Q)12。另外三個(gè)參數(shù)q、P、Q的確定,采取從低階到高階逐個(gè)嘗試的辦法,同時(shí)檢驗(yàn)各個(gè)模型的擬合優(yōu)度,進(jìn)行比較而得到[5]。
圖2 經(jīng)季節(jié)差分后序列自相關(guān)和偏相關(guān)圖
表1給出了ARIMA(1,0,0)(1,1,1)12,ARIMA(1,0,1)(0,1,1)12,ARIMA(1,0,0)(0,1,1)12三個(gè)模型的擬合優(yōu)度檢驗(yàn)結(jié)果,根據(jù)BIC信息準(zhǔn)則以及簡(jiǎn)約性原則,選擇BIC、標(biāo)準(zhǔn)誤差均最小、R2值接近1的模型,即 ARIMA(1,0,0)(0,1,1)12。
表1 備選模型的擬合優(yōu)度檢驗(yàn)
ARIMA(1,0,0)(0,1,1)12模型參數(shù)估計(jì)見(jiàn)表2,非季節(jié)自回歸參數(shù)為0.609,季節(jié)滑動(dòng)平均參數(shù)為0.788,常數(shù)為0.169,t檢驗(yàn)的P值均小于0.05,差異有統(tǒng)計(jì)學(xué)意義。
表2 模型參數(shù)估計(jì)
綜上分析,建立ARIMA季節(jié)模型方程為
(1-0.609B)(1-B12)Yt=0.169+(1-0.788B12)εt。
從ARIMA(1,0,0)(0,1,1)12模型的殘差序列自相關(guān)和偏自相關(guān)圖可見(jiàn),殘差均在可信區(qū)間之內(nèi),并不表現(xiàn)為任何規(guī)律,為白噪聲序列,說(shuō)明擬合效果好[6]。
圖3 ARIMA(1,0,0)(0,1,1)12殘差自相關(guān)和偏相關(guān)圖
利用已建立的ARIMA(1,0,0)(0,1,1)12模型,給出上海市2017年7月至12月其他感染性腹瀉的發(fā)病率預(yù)測(cè)值及95%預(yù)測(cè)區(qū)間值,見(jiàn)表3。
通過(guò)圖4,我們可以直觀地觀察ARIMA(1,0,0)(0,1,1)12模型對(duì)上海市2011年3月-2017年12月期間報(bào)告的其他感染性腹瀉月發(fā)病率序列的擬合、預(yù)測(cè)情況,其中細(xì)實(shí)線表示觀測(cè)值,虛線表示擬合曲線,粗黑線為預(yù)測(cè)值曲線。
表3 ARIMA模型預(yù)測(cè)上海市2017年7月-12月其他感染性腹瀉發(fā)病率(1/10萬(wàn))結(jié)果
圖4 上海市其他感染性腹瀉發(fā)病率ARIMA季節(jié)模型擬合預(yù)測(cè)圖
本文以上海市衛(wèi)生與計(jì)劃生育委員會(huì)網(wǎng)站及相應(yīng)的法定傳染病疫情報(bào)告2011年3月-2017年12月其他感染性腹瀉數(shù)據(jù)為基礎(chǔ),對(duì)其流行病學(xué)的季節(jié)周期性表現(xiàn),通過(guò)一階季節(jié)差分,實(shí)現(xiàn)序列的平穩(wěn)化,進(jìn)一步參數(shù)估計(jì)和檢驗(yàn),得到ARIMA(1,0,0)(0,1,1)12模型,BIC=-2.025,R2=0.956。應(yīng)用模型預(yù)測(cè)上海市2017年7月~12月其他感染性腹瀉,結(jié)果顯示擬合值的動(dòng)態(tài)趨勢(shì)表現(xiàn)出與實(shí)際值極為相似的升降規(guī)律,較好地模擬出其他感染性腹瀉發(fā)病率序列的波動(dòng)趨勢(shì)和季節(jié)要素,預(yù)測(cè)精度較高。
ARIMA模型結(jié)合了自回歸和移動(dòng)平均方法的長(zhǎng)處,具有不受數(shù)據(jù)類型束縛、適用性強(qiáng)的特點(diǎn),對(duì)于短期預(yù)測(cè),能收到較好的效果[4]。但考慮到傳染病流行規(guī)律的復(fù)雜性,ARIMA模型的長(zhǎng)期應(yīng)用要及時(shí)補(bǔ)充新的數(shù)據(jù),對(duì)模型類型、參數(shù)不斷地進(jìn)行完善與修正,才能確保預(yù)測(cè)結(jié)果的精度,及時(shí)準(zhǔn)確地為疾病的預(yù)警和預(yù)防控制提供科學(xué)依據(jù)。
模型的擬合、預(yù)測(cè)結(jié)果提示上海市發(fā)病高峰在8月,占全年總發(fā)病的20%~23%。而全國(guó)范圍的調(diào)查結(jié)果是在每年的9~10月期間其他感染性腹瀉事件呈高發(fā)期[7]。這個(gè)差別與各地的氣候條件有關(guān),上海屬熱帶濕潤(rùn)季風(fēng)氣候,通常8月份最熱,適合其他感染性腹瀉的各類傳染源的滋生,易發(fā)生飲用水污染、食物污染和生活接觸傳播。上海的衛(wèi)生機(jī)構(gòu)應(yīng)在7、8月份采取有針對(duì)性的預(yù)防措施,如進(jìn)行飲用水監(jiān)測(cè)、食物污染監(jiān)測(cè),減少此類疾病的發(fā)生,則可有效減少全年的總發(fā)病率,做到事半功倍。
其他感染性腹瀉位居夏季丙類傳染病發(fā)病之首,主要因?yàn)樵擃惣膊“ǘ喾N感染性疾病,病因比較復(fù)雜,診斷需依據(jù)臨床表現(xiàn)、實(shí)驗(yàn)室檢查和流行病學(xué)資料進(jìn)行綜合判斷[1]。但由于醫(yī)療機(jī)構(gòu)受實(shí)驗(yàn)室檢驗(yàn)條件的限制,其他感染性腹瀉病例的實(shí)驗(yàn)室診斷率低,很難明確具體病原菌,且缺乏有效的疫苗進(jìn)行預(yù)防,故明確其月度發(fā)病規(guī)律對(duì)于控制其流行非常關(guān)鍵。上海作為人口密集、流動(dòng)性強(qiáng)的超大型城市,對(duì)該疾病發(fā)病規(guī)律的科學(xué)預(yù)測(cè)是制定防控工作近期或遠(yuǎn)期策略的前提,顯得尤為重要。
中國(guó)衛(wèi)生統(tǒng)計(jì)2019年1期