江蘇省疾病預(yù)防控制中心,南京(210009)
劉文東 胡建利 艾 靜 吳 瑩 戴啟剛 梁 祁 李 媛 湯奮揚(yáng)△ 朱葉飛△
近年來(lái),早期預(yù)警已成為傳染病防制領(lǐng)域的研究熱點(diǎn),許多國(guó)家廣泛開(kāi)展了相應(yīng)的理論及應(yīng)用研究,引進(jìn)了一系列預(yù)警模型,進(jìn)而建立了早期預(yù)警應(yīng)用系統(tǒng)[1-2]。2003年SARS發(fā)生后,我國(guó)也積極開(kāi)展傳染病預(yù)警應(yīng)用研究[3],2004年實(shí)現(xiàn)傳染病網(wǎng)絡(luò)直報(bào)之后相繼開(kāi)發(fā)了國(guó)家傳染病自動(dòng)預(yù)警系統(tǒng)(China infectious diseases automated alert and response system,CIDARS),并在全國(guó)范圍內(nèi)推廣運(yùn)行[4]。但幾年的實(shí)踐表明,該系統(tǒng)應(yīng)用的預(yù)警方法過(guò)于簡(jiǎn)單和單一,預(yù)警分析的靈敏度、特異度及時(shí)效性均不夠理想,有必要引入新的方法技術(shù),改善預(yù)警效果,從而提高該系統(tǒng)在傳染病應(yīng)急防制中的應(yīng)用價(jià)值[5-6]。
在我國(guó),流行性腮腺炎(以下簡(jiǎn)稱(chēng)腮腺炎)是引發(fā)傳染病突發(fā)公共衛(wèi)生事件最多的病種之一,因此,研究腮腺炎的早期預(yù)警具有典型意義。本文以江蘇省腮腺炎疫情資料為基礎(chǔ),探討累積和控制圖模型(cumulative sum control chart,CUSUM)在腮腺炎早期預(yù)警中的應(yīng)用價(jià)值,同時(shí)也為其他傳染病的預(yù)警研究提供參考和借鑒。
1.資料來(lái)源
2004-2012年江蘇省腮腺炎疫情數(shù)據(jù)來(lái)自“中國(guó)疾病預(yù)防控制信息系統(tǒng)”子系統(tǒng)——“疾病監(jiān)測(cè)信息報(bào)告管理系統(tǒng)”(即傳染病網(wǎng)絡(luò)直報(bào)系統(tǒng)),2012腮腺炎突發(fā)公共衛(wèi)生事件數(shù)據(jù)來(lái)自子系統(tǒng)“突發(fā)公共衛(wèi)生事件報(bào)告管理系統(tǒng)”;從另一個(gè)子系統(tǒng)“國(guó)家傳染病自動(dòng)預(yù)警系統(tǒng)(CIDARS)”中下載2012年 全省腮腺炎自動(dòng)預(yù)警數(shù)據(jù)。
2.CUSUM模型及國(guó)家傳染病自動(dòng)預(yù)警系統(tǒng)(CIDARS)簡(jiǎn)介
(1) CUSUM模型
CUSUM模型是英國(guó)劍橋大學(xué)Page于1954年提出的一種控制圖模型,其原理是通過(guò)不斷累積觀(guān)察值與基線(xiàn)水平的差值,放大觀(guān)察數(shù)據(jù)出現(xiàn)的波動(dòng),從而可以更加迅速、靈敏地探測(cè)到微小的異常情況。預(yù)警統(tǒng)計(jì)量S計(jì)算公式如下:
S0=0
Si=max[0,Si-1+zi-k]
其中,k為參考值,是CUMSUM模型的兩個(gè)待定參數(shù)之一;Si表示當(dāng)前期的預(yù)警統(tǒng)計(jì)量,Si-1為上一期的預(yù)警統(tǒng)計(jì)量,zi為當(dāng)前期觀(guān)察值相對(duì)于歷史基線(xiàn)的偏移量,其計(jì)算公式如下:
預(yù)警分析時(shí),首先判斷Si>h是否成立(h為預(yù)警閾值,是CUSUM模型中另一個(gè)待定參數(shù)),即當(dāng)前預(yù)警統(tǒng)計(jì)量是否超過(guò)預(yù)警閾值h,如果超過(guò)則發(fā)出預(yù)警信號(hào)。
(2) CIDARS
CIDARS是中國(guó)疾控中心在傳染病網(wǎng)絡(luò)直報(bào)系統(tǒng)基礎(chǔ)上開(kāi)發(fā)的傳染病早期預(yù)警應(yīng)用系統(tǒng),并于2008年4月開(kāi)始在全國(guó)范圍內(nèi)正式投入運(yùn)行。該系統(tǒng)對(duì)于鼠疫、霍亂、傳染性非典型肺炎、脊髓灰質(zhì)炎、人感染高致病性禽流感、肺炭疽、白喉、絲蟲(chóng)病、不明原因肺炎等9個(gè)低發(fā)或罕見(jiàn)病種采用單病例預(yù)警,即發(fā)現(xiàn)一例即產(chǎn)生預(yù)警;對(duì)于包括流行性腮腺炎在內(nèi)的19個(gè)常見(jiàn)多發(fā)的病種采用移動(dòng)百分位數(shù)法進(jìn)行預(yù)警,其中腮腺炎預(yù)警閾值為P80(第80百分位數(shù))。
3.預(yù)警分析與效果評(píng)價(jià)
以江蘇省2012年報(bào)告的腮腺炎突發(fā)公共衛(wèi)生事件作為目標(biāo)事件。CUSUM模型統(tǒng)計(jì)量的計(jì)算采用短基線(xiàn)法,為了消除周末效應(yīng)的影響,根據(jù)當(dāng)前日是工作日或周末建立不同的歷史基線(xiàn):如果是工作日則向后回溯14個(gè)工作日作為歷史基線(xiàn);如果是周末,則向后回溯14個(gè)休息日(周六或周日)作為歷史基線(xiàn)。
分析CUSUM模型及CIDARS的預(yù)警信號(hào),如果一條預(yù)警信號(hào)落在某一起突發(fā)共衛(wèi)生事件起止時(shí)間范圍內(nèi),則視為對(duì)該事件的有效預(yù)警,反之則為錯(cuò)誤預(yù)警;對(duì)于同一個(gè)事件的時(shí)間區(qū)間內(nèi)產(chǎn)生的多次預(yù)警計(jì)為1次有效預(yù)警。用靈敏度、特異度、及時(shí)性等3個(gè)指標(biāo)對(duì)CUSUM模型以及CIDARS的預(yù)警效果進(jìn)行評(píng)價(jià)和比較:
靈敏度=有效預(yù)警事件數(shù)/報(bào)告的事件總數(shù)×100%
特異度=無(wú)預(yù)警信號(hào)產(chǎn)生的天數(shù)/無(wú)突發(fā)公共衛(wèi)生事件發(fā)生的天數(shù)×100%
及時(shí)性(天)=某事件有效預(yù)警日期-該事件的起始日期
本研究中原始數(shù)據(jù)的整理在Excel 2007中完成,CUSUM模型預(yù)警試驗(yàn)在Matlab2011b中完成,CUSUM模型與自動(dòng)預(yù)警系統(tǒng)之間預(yù)警效果的假設(shè)檢驗(yàn)在SAS8.1中完成。
1.江蘇省腮腺炎流行概況
我省自2004年開(kāi)始腮腺炎疫情網(wǎng)絡(luò)直報(bào),近10年間全省腮腺炎流行起伏波動(dòng)較大,有一定的周期性流行的傾向,但由于數(shù)據(jù)積累年份太少無(wú)法進(jìn)行檢驗(yàn);2010年報(bào)告病例數(shù)最低,全省僅有553例;2012年則是高發(fā)年份,全省報(bào)告發(fā)病19104例,較2011年增加115.50%。見(jiàn)圖1。
圖1 2004-2012年江蘇省流行性腮腺炎流行趨勢(shì)
我省腮腺炎流行有明顯的季節(jié)性,全年呈雙峰型分布,發(fā)病最高峰出現(xiàn)在5-6月,次高峰出現(xiàn)在11-12月。各地區(qū)發(fā)病數(shù)差異較大,2012年報(bào)告發(fā)病數(shù)前3位的地區(qū)依次是蘇州市(3208例)、徐州市(2751例)、連云港市(2207例),計(jì)占全省發(fā)病總數(shù)的42.75%;發(fā)病數(shù)后3位依次是鹽城市(400例)、泰州市(471例)、揚(yáng)州市(705例)。
2012年全省報(bào)告腮腺炎突發(fā)公共衛(wèi)生事件14起,其中13起發(fā)生在3-6月,1起在12月;14起事件均為某一個(gè)區(qū)縣范圍內(nèi)的局部暴發(fā)疫情,發(fā)生場(chǎng)所均在學(xué)校,發(fā)病數(shù)最多262例、最少12例。所有事件中,從首例病例發(fā)生日期到該事件確認(rèn)報(bào)告日期之間的間隔時(shí)間(即事件報(bào)告及時(shí)性)最短為1天,最長(zhǎng)達(dá)29天,中位數(shù)為8天。另外值得注意的是,有4起事件的所有病例均集中在同一天報(bào)告,占事件總數(shù)的28.57%。
2.CUSUM模型預(yù)警分析與評(píng)價(jià)
(1) 模型參數(shù)選擇
以2011年11月1日-2012年12月31日全省110個(gè)區(qū)縣每日發(fā)病數(shù)為實(shí)驗(yàn)數(shù)據(jù),從2012年1月1日起以CUSUM模型進(jìn)行前瞻性試驗(yàn)。模型中的兩個(gè)待定參數(shù)h(h=1,2,3,4)、k(k=0.5,1.0,1.5,2.0,2.5)依次選擇不同數(shù)值進(jìn)行組合試驗(yàn),計(jì)算每一種組合下的預(yù)警靈敏度、特異度,以靈敏度為縱坐標(biāo)、1-特異度為橫坐標(biāo)繪制ROC曲線(xiàn),最終確定模型參數(shù)為h=3,k=0.5,見(jiàn)圖2。
圖2 ROC曲線(xiàn)
(2) CUSUM模型預(yù)警分析及效果評(píng)價(jià)
CUSUM模型全年共產(chǎn)生1688條預(yù)警信號(hào),每天信號(hào)數(shù)最少0條,最多22條,平均每天4.62條;各區(qū)縣全年產(chǎn)生信號(hào)數(shù)最少0條,最多24條,平均15.35條。CIDARS全年發(fā)出預(yù)警信號(hào)2609條,每天信號(hào)數(shù)最少1條,最多38條,平均每天7.15條;各區(qū)縣全年預(yù)警信號(hào)最少0條,最多達(dá)67條,平均23.72條。
對(duì)于14起目標(biāo)事件,CUSUM模型均發(fā)出了有效預(yù)警,靈敏度為100%,CIDARS對(duì)9起事件發(fā)出了有效預(yù)警,靈敏度為64.29%,CUSUM模型預(yù)警靈敏度顯著高于CIDARS(χ2=6.09,P=0.0136)。CUSUM模型和CIDARS特異度分別為95.84%、94.35%,前者高于后者,差異有統(tǒng)計(jì)學(xué)意義(χ2=602.48,P<0.0001)。從事件開(kāi)始日期到發(fā)出預(yù)警日期之間的時(shí)間間隔(即預(yù)警及時(shí)性),CUSUM模型最短0天,最長(zhǎng)29天,中位數(shù)為3.5天;CIDARS最短2天,最長(zhǎng)23天,中位數(shù)為6天;CUSUM模型與CIDARS預(yù)警及時(shí)性無(wú)統(tǒng)計(jì)學(xué)差異(Z=0.9173,P=0.359)。CUSUM模型及CIDARS對(duì)目標(biāo)事件的預(yù)警分析結(jié)果見(jiàn)表1。
CUSUM模型是常見(jiàn)的傳染病突發(fā)公共衛(wèi)生事件早期預(yù)警方法之一,是當(dāng)前國(guó)外一些傳染病預(yù)警應(yīng)用系統(tǒng)的核心方法[7-9]。國(guó)內(nèi)也有學(xué)者開(kāi)展CUSUM模型的應(yīng)用研究[10-11]。本文研究中,CUSUM模型對(duì)于腮腺炎局部暴發(fā)疫情的早期探測(cè)效果良好,預(yù)警分析的靈敏度、特異度均明顯高于CIDARS的移動(dòng)百分位數(shù)法,并且預(yù)警信號(hào)數(shù)比CIDARS減少35.30%,可以極大地降低基層預(yù)警信號(hào)核實(shí)的工作量,減少傳染病預(yù)警的運(yùn)行成本,提高可接受性。
表1 CUSUM模型與自動(dòng)預(yù)警系統(tǒng)預(yù)警結(jié)果統(tǒng)計(jì)
本研究中同時(shí)也存在一些有待改進(jìn)和完善之處:
(1)CUSUM模型對(duì)于腮腺炎預(yù)警分析的及時(shí)性不夠理想,其原因主要在于數(shù)據(jù)質(zhì)量較差。14起目標(biāo)事件中,普遍存在病例報(bào)告延遲的現(xiàn)象,其中近1/3的事件所有病例均在事件確認(rèn)后在某一天集中進(jìn)行網(wǎng)絡(luò)直報(bào),致使模型無(wú)法在事件萌芽階段及時(shí)做出預(yù)警。本研究的所有目標(biāo)事件均發(fā)生在各級(jí)各類(lèi)學(xué)校,因此加強(qiáng)學(xué)校公共衛(wèi)生管理,建立晨檢制度和傳染病零報(bào)告制度,提高學(xué)校傳染病報(bào)告及時(shí)性,可以從根本上解決這一問(wèn)題。
(2)本研究中以區(qū)縣為單位進(jìn)行預(yù)警分析,但當(dāng)前的傳染病突發(fā)公共衛(wèi)生事件多是局部暴發(fā)疫情,疫情波及范圍多局限于某區(qū)縣的一個(gè)或幾個(gè)鄉(xiāng)鎮(zhèn),由于暴發(fā)規(guī)模小,發(fā)生病例少,必須累積到一定數(shù)量才能在區(qū)縣水平上發(fā)現(xiàn)異常。因此可以考慮將預(yù)警分析的空間尺度進(jìn)一步縮小,以鄉(xiāng)鎮(zhèn)為單位進(jìn)行實(shí)時(shí)預(yù)警將進(jìn)一步提高模型的靈敏度和特異度、及時(shí)性。
(3)當(dāng)前,包括CUSUM模型在內(nèi)的各種控制圖模型在傳染病監(jiān)測(cè)預(yù)警中的應(yīng)用都是以現(xiàn)行的行政區(qū)劃為基礎(chǔ)[3,11]。有研究表明,我國(guó)傳染病突發(fā)公共衛(wèi)生事件主要發(fā)生在學(xué)校[12-13],如果以學(xué)校為單位開(kāi)展預(yù)警分析將極大提高模型的預(yù)警效能。但在傳染病網(wǎng)絡(luò)直報(bào)系統(tǒng)中學(xué)生所在學(xué)校多填在“患者工作單位一欄”,而且不是必填字段,因此學(xué)生所在學(xué)校信息大多缺失,不能用于學(xué)校突發(fā)事件的早期探測(cè),因此建議在網(wǎng)絡(luò)直報(bào)系統(tǒng)中盡量完善所在學(xué)校信息。
(4)當(dāng)前以控制圖模型為基礎(chǔ)的預(yù)警方法多是對(duì)各個(gè)空間單位獨(dú)立進(jìn)行預(yù)警探測(cè)[7,9,11],忽略了空間相關(guān)性的存在,對(duì)于跨區(qū)域的局部暴發(fā)事件(即同時(shí)波及幾個(gè)相鄰空間單位)探測(cè)能力降低。因此,如果在CUSUM模型算法中引入空間相關(guān)性將具有突破性意義??梢钥紤]建立空間鄰接矩陣,以此明確各空間單位之間的(一階或多階)鄰接關(guān)系,進(jìn)而通過(guò)不同的權(quán)重將具有鄰接關(guān)系的空間單位合成一個(gè)新的空間單位,再對(duì)其進(jìn)行預(yù)警分析。
(5)不同的預(yù)警模型在預(yù)警分析時(shí)具有各自的優(yōu)勢(shì),在實(shí)際運(yùn)用中可以考慮將定性方法與定量方法相結(jié)合、將時(shí)間預(yù)警技術(shù)與空間預(yù)警技術(shù)相結(jié)合,通過(guò)多種預(yù)警技術(shù)的聯(lián)合應(yīng)用提高預(yù)警分析的能力[14]。
參 考 文 獻(xiàn)
1.Tsui FC,Espino JU,Dato VM,et al.Technical description of RODS:a real-time public health surveillance system.Journal of the American informatics association,2003,10(5):399-408.
2.Desenclos JC.RAISIN-a national programme for early warning,investigation and surveillance of healthcare-associated infection in France.Euro surveill,2009,14(46):1-8.
3.楊維中,郉慧嫻,王漢章,等.七種傳染病控制圖法預(yù)警技術(shù)研究.中華流行病學(xué)雜志,2004,25(12):1039-1041.
4.楊維中,蘭亞佳,李中杰,等.國(guó)家傳染病自動(dòng)預(yù)警系統(tǒng)的設(shè)計(jì)與應(yīng)用.中華流行病學(xué)雜志,2010,31(11):1240-1244.
5.楊維中,李中杰,賴(lài)圣杰,等.國(guó)家傳染病自動(dòng)預(yù)警系統(tǒng)運(yùn)行狀況分析.中流行病學(xué)雜志,2011,3(5):431-435.
6.梁萬(wàn)年.加強(qiáng)我國(guó)傳染病預(yù)警的研究與應(yīng)用.中華流行病學(xué)雜志,2011,32(5):429-430.
7.Watkins RE,Eagleson S,Bert V,et al.Applying cusum-based methods for the detection of outbreaks of Ross River virus disease in Western Australia.BMC medical informatics and decision making,2008,8:37.
8.Boyle JR,Sparks RS,Keijzers GB,et al.Prediction and surveillance of influenza epidemics.MJA,2011,194(4):S28-S33.
9.Fricker RD,Hegler BL,Dunfee DA.Comparing syndromic surveillance detection methods:EARS’ versus a CUSUM-based methodology.Statist Med,2008,27:3407-3429.
10.張洪龍,賴(lài)圣杰,李中杰,等.累積和控制圖法在傳染病暴發(fā)探測(cè)中的應(yīng)用.中華流行病學(xué)雜志,2010,31(12):1406-1409.
11.竇相峰,王全意,賈蕾,等.累積和模型在細(xì)菌性痢疾早期預(yù)警中的應(yīng)用.首都公共衛(wèi)生,2010,4(5):201-204.
12.魯琴寶,龔震宇,林君芬.浙江省2004-2007年學(xué)校突發(fā)公共衛(wèi)生事件流行病學(xué)分析.中國(guó)學(xué)校衛(wèi)生,2008,29(8):718-719.
13.劉文東,吳瑩,梁祁,等.江蘇省2006-2009年突發(fā)公共衛(wèi)生事件流行特征分析.現(xiàn)代預(yù)防醫(yī)學(xué),2012,39(5):1071-1074.
14.楊維中.傳染病預(yù)警理論與實(shí)踐.北京:人民衛(wèi)生出版社,2012.