陳偉
移動(dòng)平均法就是將數(shù)據(jù)按照時(shí)間排列,以一定的跨越期進(jìn)行移動(dòng)平均得出平均值進(jìn)行預(yù)測(cè)的一種方法。該方法能夠消除時(shí)間序列中的偶然因素對(duì)預(yù)測(cè)結(jié)果的影響,突出反映趨勢(shì)性和周期性的變動(dòng),適用于一年期等短期預(yù)測(cè),現(xiàn)已被廣泛應(yīng)用于各種疾病及醫(yī)院統(tǒng)計(jì)預(yù)測(cè)中。本研究探討如何采用Excel函數(shù)的方法計(jì)算移動(dòng)平均數(shù)(預(yù)測(cè)值),并繪制移動(dòng)平均線,進(jìn)行肺結(jié)核疫情預(yù)警分析。
疾病監(jiān)測(cè)信息報(bào)告管理系統(tǒng)中,報(bào)告日期為2006—2009年以及2010年上半年,報(bào)卡中患者現(xiàn)住址為合肥市(統(tǒng)計(jì)對(duì)象不限制患者戶籍所在地)的肺結(jié)核數(shù)據(jù)。
1.基礎(chǔ)數(shù)據(jù)處理
將已收集的報(bào)告日期為2006—2009年以及2010年上半年報(bào)卡現(xiàn)住址為合肥市的肺結(jié)核報(bào)告數(shù)據(jù)進(jìn)行整理,去除已刪除卡、結(jié)核性胸膜炎及其他疾病,保留疾病診斷為涂陽(yáng)、菌陰、未痰檢3類肺結(jié)核已終審卡數(shù)據(jù)。
在傳染病監(jiān)測(cè)預(yù)警分析中,目前一般以周為單位,步長(zhǎng)采用2(即數(shù)據(jù)統(tǒng)計(jì)時(shí)變動(dòng)范圍為前后2周)為宜[1]。因此,對(duì)整理后的2006—2009年數(shù)據(jù),按照?qǐng)?bào)告日期,劃分為全年52周,列出每周報(bào)告肺結(jié)核患者數(shù),形成基礎(chǔ)數(shù)據(jù)表。
2.指標(biāo)分類和意義
根據(jù)基礎(chǔ)數(shù)據(jù)表數(shù)據(jù),按照周次和每周患病數(shù),將2006—2009年4年數(shù)據(jù)形成患病數(shù)數(shù)列,利用Excel函數(shù),計(jì)算該數(shù)列的殘差、標(biāo)準(zhǔn)差和回歸曲線方程(W=(其中W 為預(yù)測(cè)值為截距,μα為斜率,Si為預(yù)測(cè)年份累積周次),利用得到的回歸方程,代入預(yù)測(cè)年份(第5年)的累積周次,即第 209~260周(1年有52周,第5年為209~260周),得出的數(shù)據(jù),即是預(yù)測(cè)年每周的預(yù)測(cè)患病數(shù),并繼續(xù)計(jì)算2倍標(biāo)準(zhǔn)差(預(yù)警值)、3倍標(biāo)準(zhǔn)差(行動(dòng)值),根據(jù)數(shù)據(jù)繪制相應(yīng)的線圖。
正常情況下,實(shí)際預(yù)測(cè)年份每周患病數(shù)應(yīng)在預(yù)測(cè)值的上下進(jìn)行波動(dòng)。當(dāng)實(shí)際值超過(guò)預(yù)警值時(shí),提示該周患者數(shù)超過(guò)預(yù)期,應(yīng)予以關(guān)注,分析導(dǎo)致病例突然增高的原因,實(shí)施干預(yù);當(dāng)實(shí)際值超過(guò)行動(dòng)值時(shí),應(yīng)立刻分析原因,判斷是否局部疫情暴發(fā),立即采取干預(yù)措施,控制疫情的發(fā)展。
3.統(tǒng)計(jì)學(xué)處理
將預(yù)測(cè)值數(shù)列利用K-S檢驗(yàn)方法進(jìn)行檢驗(yàn),取得Z值和P值,按α=0.05檢驗(yàn)水準(zhǔn)判斷數(shù)據(jù)資料是否符合正態(tài)分布。如符合正態(tài)分布,再用t檢驗(yàn)比較2010年上半年實(shí)際值數(shù)列和預(yù)測(cè)值數(shù)列之間的差異是否具有統(tǒng)計(jì)學(xué)意義,從而判斷合肥市的肺結(jié)核疫情資料是否符合移動(dòng)平均分布。
利用Excel表格計(jì)算2006—2009年每周患病數(shù)數(shù)列的回歸方程:W=-0.25Si+116.26,其中 W 為預(yù)測(cè)值,Si為預(yù)測(cè)年份累積周次,即第209~260周。
回歸方程相關(guān)數(shù)據(jù)見(jiàn)表1。
利用得到的回歸方程,代入預(yù)測(cè)年份(第5年)的累積周次(即第209~260周),得出的數(shù)據(jù),即是預(yù)測(cè)年每周的預(yù)測(cè)患病數(shù)(預(yù)測(cè)值),并繼續(xù)計(jì)算每周患病數(shù)的2倍標(biāo)準(zhǔn)差為預(yù)警值,3倍標(biāo)準(zhǔn)差為行動(dòng)值。詳細(xì)數(shù)據(jù)見(jiàn)表2。
將預(yù)測(cè)值、預(yù)警值、行動(dòng)值3個(gè)系列數(shù)據(jù)填充至Excel數(shù)據(jù)表格中,繪制預(yù)警監(jiān)測(cè)圖。將2010年每周患病數(shù)錄入后,形成實(shí)際周患病數(shù)曲線,通過(guò)實(shí)際周患病數(shù)曲線在預(yù)測(cè)曲線、預(yù)警曲線、行動(dòng)曲線之間的波動(dòng)范圍,即可開(kāi)展預(yù)警工作(詳細(xì)圖形判讀見(jiàn)方法中的指標(biāo)分類和意義)。
1.將預(yù)測(cè)值數(shù)列利用K-S檢驗(yàn)方法進(jìn)行檢驗(yàn),得Z值為0.774,P=0.586,按α=0.05檢驗(yàn)水準(zhǔn)可認(rèn)為數(shù)據(jù)資料符合正態(tài)分布。
表1 回歸方程數(shù)據(jù)
表2 合肥市2006—2009年肺結(jié)核周患病數(shù)情況及2010年預(yù)警分析
圖1 2010年合肥市結(jié)核病疫情預(yù)測(cè)圖
2.用t檢驗(yàn)比較2010年上半年實(shí)際值數(shù)列和預(yù)測(cè)值數(shù)列之間差異是否具有統(tǒng)計(jì)學(xué)意義。得t(雙尾)值為2.02,P=0.07>0.05,按α=0.05檢驗(yàn)水準(zhǔn)可認(rèn)為,2010年上半年實(shí)際報(bào)告組和預(yù)測(cè)組之間差異無(wú)統(tǒng)計(jì)學(xué)意義,預(yù)測(cè)值數(shù)列構(gòu)成的移動(dòng)平均線與實(shí)際疫情曲線擬合一致,能夠反映實(shí)際疫情發(fā)展的趨勢(shì),可認(rèn)為合肥市的肺結(jié)核疫情資料符合移動(dòng)平均分布。
基線數(shù)據(jù)是決定預(yù)警效果的重要因素。自2005年以后,我市肺結(jié)核疫情呈顯著下降趨勢(shì),在這種情況下,疫情預(yù)測(cè)基礎(chǔ)數(shù)據(jù)時(shí)間太長(zhǎng),會(huì)大大降低預(yù)警的敏感性[3]。所以,筆者選擇2006—2009年4年作為基礎(chǔ)數(shù)據(jù)時(shí)間,并以大疫情終審報(bào)卡為數(shù)據(jù)來(lái)源校正漏報(bào)率,以涂陽(yáng)、菌陰、未痰檢三類疾病診斷校正病例定義的改變,同時(shí)去除刪除卡避免錯(cuò)誤統(tǒng)計(jì),保證基線數(shù)據(jù)的真實(shí)可靠。
為解決因數(shù)據(jù)數(shù)量可能偏少,一些統(tǒng)計(jì)指標(biāo)的計(jì)算和數(shù)據(jù)模型的穩(wěn)定性有可能受到影響的問(wèn)題,美國(guó)疾病預(yù)防控制中心作預(yù)警時(shí),將預(yù)警時(shí)間單位向前和向后各移動(dòng)2個(gè)單位,數(shù)據(jù)量增加,并證明這種處理方法是可行的[4]。本研究借用了這個(gè)方法,將2007年的原前2周數(shù)據(jù),同時(shí)作為2006年的第53周和 54周數(shù)據(jù);將 2006年的 51、52兩周數(shù)據(jù)作為2007年的前2周數(shù)據(jù)。以此類推,從而將每年的觀察周數(shù)增加至54周,并且可有效避免各年份之間人為劃分時(shí)間段對(duì)數(shù)據(jù)分析結(jié)果帶來(lái)的影響。
通常移動(dòng)平均線期限愈長(zhǎng),愈能表現(xiàn)安定的特性,即移動(dòng)平均線不輕易波動(dòng),必須趨勢(shì)真正明朗了,移動(dòng)平均線才會(huì)延伸。而這恰恰符合肺結(jié)核疫情長(zhǎng)期趨勢(shì)穩(wěn)定的特征:每年第13周左右為高峰期,后逐漸下降,至次年的第4周左右達(dá)到低谷。因此,采用移動(dòng)平均線評(píng)價(jià)合肥市肺結(jié)核疫情的趨勢(shì)較為合適。
移動(dòng)平均線主要依據(jù)某一時(shí)期及其相鄰時(shí)期內(nèi)的時(shí)間序列數(shù)據(jù)的算術(shù)平均值數(shù)列進(jìn)行繪制,因此存在數(shù)據(jù)慣性問(wèn)題,即在疫情暴發(fā)早期監(jiān)測(cè)數(shù)據(jù)逐步抬升過(guò)程中,存在著滯后效應(yīng),對(duì)疫情的早期發(fā)現(xiàn)不敏感。這點(diǎn)必須引起疫情預(yù)警監(jiān)測(cè)人員的高度重視,可考慮采用求和自回歸移動(dòng)平均(ARIMA)模型的方法提高早期預(yù)警的靈敏度。
[1]仝振東,林君芬,陳國(guó)水,等.應(yīng)用移動(dòng)平均數(shù)法開(kāi)展傳染病疫情監(jiān)測(cè)預(yù)警的探討.疾病監(jiān)測(cè),2007,22(8):523-525.
[2]胡躍強(qiáng),龐志峰.移動(dòng)平均數(shù)在金華市痢疾疫情監(jiān)測(cè)預(yù)警中的應(yīng)用.現(xiàn)代預(yù)防醫(yī)學(xué),2008,35(10):1809-1010.
[3]楊維中,邢慧嫻,王漢章,等.七種傳染病控制圖法預(yù)警技術(shù)研究.中華流行病學(xué)雜志,2004,25(12):1039-1041.
[4]Costagliola D, Flahaul t A , Galin ec D, et al . A routine tool fordetect ion and assessment of epidemics of influenza-like syndromesin France. Am J Public Health , 1991 , 81(1):97-99.