陶芳芳 趙耐青 何 懿 林慶能 毛智盛 孫曉冬
細(xì)菌性痢疾是常見的法定報(bào)告腸道傳染病,在上海市甲乙類腸道傳染病發(fā)病中居首位。上海市細(xì)菌性痢疾發(fā)病有明顯的季節(jié)性,一年四季均有發(fā)病,夏秋季尤為高發(fā)。隨著全球氣溫的變暖,氣象因素對(duì)腸道傳染病的影響已受到越來越多學(xué)者的關(guān)注〔1-3〕。已有文獻(xiàn)證明氣溫、降雨量等對(duì)細(xì)菌性痢疾發(fā)病影響較大〔4-6〕。
細(xì)菌性痢疾是對(duì)本市公共衛(wèi)生影響較大的重點(diǎn)傳染病,了解細(xì)菌性痢疾的流行趨勢(shì),盡早發(fā)現(xiàn)其流行隱患及爆發(fā)和流行先兆,在疾病爆發(fā)前及時(shí)提供準(zhǔn)確的疾病動(dòng)態(tài)及預(yù)警預(yù)報(bào),以便采取措施進(jìn)行預(yù)防控制,從而降低發(fā)病率和死亡率,達(dá)到控制疾病蔓延的目的。
傳染病的準(zhǔn)確預(yù)警依賴于正確地使用預(yù)測(cè)方法。本研究將氣象因素作為細(xì)菌性痢疾發(fā)病的影響因素,采用非參數(shù)廣義相加模型(generalized additive model,GAM)建立細(xì)菌性痢疾預(yù)測(cè)模型。GAM是廣義線性模型的非參數(shù)擴(kuò)展,適用范圍更廣,GAM可擬合非參數(shù)回歸,適用于處理應(yīng)變量和眾多解釋變量間過度復(fù)雜的非線性關(guān)系,近年來在環(huán)境流行病學(xué)中〔7-9〕的應(yīng)用越來越多,已被廣泛應(yīng)用于環(huán)境污染對(duì)人體健康危害的研究〔10〕。
本研究探討使用此模型進(jìn)行菌痢發(fā)病預(yù)測(cè)和預(yù)警的可行性,為其防控工作提供科學(xué)依據(jù)。
1.資料
上海市2004年1月1日至2008年12月31日每日細(xì)菌性痢疾發(fā)病數(shù)資料和氣象資料分別來源于國(guó)家疾病監(jiān)測(cè)信息報(bào)告管理系統(tǒng)和上海市氣象局城市環(huán)境氣象中心。氣象因素資料主要包括平均氣溫、最高溫度、最低溫度、濕度、降水量、風(fēng)速、氣壓等。
2.分析方法
(1)模型擬合
本研究中,假定第t天細(xì)菌性痢疾日?qǐng)?bào)告病例數(shù)Yt近似服從Poisson分布,均數(shù)(期望值)為μt,考慮均數(shù)μt可能受氣溫、氣壓、濕度及發(fā)病趨勢(shì)的影響,而這些因素與均數(shù)μt的關(guān)聯(lián)性不是線性關(guān)系,因此采用GAM,其連接函數(shù)(link function)為對(duì)數(shù)函數(shù),基本形式如下:
其中Yt是第t天的細(xì)菌性痢疾日?qǐng)?bào)告病例數(shù),f1(x1t),f2(x2t),…,fp(xpt)是自然樣條函數(shù)(natural spline,ns),樣條函數(shù)本質(zhì)上是把自變量范圍分割成若干個(gè)互不重合的區(qū)間,在每個(gè)區(qū)間函數(shù)表達(dá)式為二階或三階多項(xiàng)式(如二階多項(xiàng)式為拋物線),但要求在兩個(gè)區(qū)間相鄰點(diǎn)上的函數(shù)曲線是連續(xù)和光滑的,x1t,x2t,…,xpt是氣溫、氣壓、濕度及發(fā)病趨勢(shì)等協(xié)變量。
(2)預(yù)測(cè)應(yīng)用
由于模型擬合使用2004年1月1日至2008年12月31日每日?qǐng)?bào)告細(xì)菌性痢疾病例數(shù)的趨勢(shì)較平穩(wěn),未出現(xiàn)暴發(fā)流行,可認(rèn)為細(xì)菌性痢疾發(fā)病處于常態(tài)。在常態(tài)下建立氣象因素與細(xì)菌性痢疾發(fā)病的預(yù)測(cè)模型是可行的。用選定的模型對(duì)細(xì)菌性痢疾發(fā)病作出預(yù)測(cè),利用在不同氣象條件下預(yù)測(cè)值的95%范圍的上限值作為預(yù)警限。
結(jié) 果
1.細(xì)菌性痢疾日?qǐng)?bào)告病例數(shù)的趨勢(shì)分析
2004年1月至2008年12月上海市每日細(xì)菌性痢疾報(bào)告數(shù)每年均出現(xiàn)較一致的報(bào)告高峰,呈明顯的季節(jié)性波動(dòng)。1~4月一直呈低發(fā)狀態(tài),5月后開始增加,7月份快速上升,到8~9月左右達(dá)到最高峰,然后開始下降,到12月回到1月左右水平。
2.模型擬合
經(jīng)過實(shí)際數(shù)據(jù)的擬合,最后得到下列模型:
表1 模型參數(shù)估計(jì)結(jié)果
表1 中的 ns(temp,3)1,ns(temp,3)2 和 ns(temp,3)3是氣溫樣條函數(shù)的三個(gè)自然樣條基函數(shù),自由度為 3,ns(lns2s8,14)1,ns(lns2s8,14)2,…,ns(lns2s8,14)14是細(xì)菌性痢疾日?qǐng)?bào)告病例數(shù)的7天滑動(dòng)和的樣條函數(shù)的14個(gè)自然樣條基函數(shù)。
選擇研究日前1天的溫度,引入前8天的病例數(shù),分析過去一周里病例數(shù)及氣溫對(duì)細(xì)菌性痢疾發(fā)病的影響。結(jié)合Akaike's信息標(biāo)準(zhǔn)(Akaike's information criterion,AIC)來選擇最優(yōu)模型。模型決定系數(shù) R2=0.9202。
圖1 模型估計(jì)發(fā)病數(shù)與實(shí)際發(fā)病數(shù)的散點(diǎn)圖
3.預(yù)測(cè)預(yù)警分析
用模型對(duì)2009年1月~12月上海市細(xì)菌性痢疾每日?qǐng)?bào)告數(shù)進(jìn)行計(jì)算,結(jié)果顯示預(yù)測(cè)值與實(shí)際值較吻合,預(yù)測(cè)的動(dòng)態(tài)趨勢(shì)與實(shí)際情況基本一致,模型的擬合效果較好。采用本模型來預(yù)測(cè)細(xì)菌性痢疾發(fā)病水平是可行的。擬合及預(yù)測(cè)的具體結(jié)果見圖2。同時(shí)根據(jù)預(yù)測(cè)數(shù)據(jù)的可信限,可以判斷實(shí)際發(fā)病情況是否在正常范圍波動(dòng)〔11〕,如果實(shí)際病例數(shù)在預(yù)測(cè)值95%范圍內(nèi)波動(dòng),表明細(xì)菌性痢疾疫情基本穩(wěn)定,如果超出模型預(yù)測(cè)值95%范圍的上限,表明當(dāng)日細(xì)菌性痢疾疫情已不同于以往規(guī)律,如果連續(xù)兩天實(shí)際值均超出預(yù)測(cè)值95%范圍的上限,則發(fā)出提示性預(yù)警。圖2可以看到2009年1月1日至12月31日上海市細(xì)菌性痢疾日發(fā)病數(shù)基本上在95%范圍內(nèi),因此本研究采用基于預(yù)測(cè)值的預(yù)警策略是可行的。
圖2 2009年1月1日至2009年12月31日上海市細(xì)菌性痢疾日?qǐng)?bào)告病例數(shù)擬合及預(yù)測(cè)結(jié)果
細(xì)菌性痢疾的發(fā)病率受自然因素、社會(huì)因素、氣象因素以及病原學(xué)特點(diǎn)等影響〔12〕,且存在明顯的季節(jié)差異,利用傳統(tǒng)的時(shí)間序列模型并不合適。本研究以廣義相加模型為基本統(tǒng)計(jì)模型,運(yùn)用時(shí)間序列格式的資料,盡可能地控制混雜因素的影響。模型中應(yīng)用趨勢(shì)樣條函數(shù)控制了時(shí)間的長(zhǎng)期趨勢(shì)影響,對(duì)于可能存在的星期效應(yīng),模型中以啞元變量的形式進(jìn)行控制,在此基礎(chǔ)上擬合溫度、濕度與細(xì)菌性痢疾發(fā)病的二次函數(shù)關(guān)系。根據(jù)擬合模型回歸系數(shù)的檢驗(yàn)結(jié)果發(fā)現(xiàn),由于引入前8天的細(xì)菌性痢疾發(fā)病數(shù)作為自變量,而這些自變量與當(dāng)前的氣溫和濕度都有關(guān)聯(lián),以致濕度的效應(yīng)在模型中的檢驗(yàn)無統(tǒng)計(jì)學(xué)意義,因此在模型中剔除濕度指標(biāo)。最后模型擬合了氣溫與細(xì)菌性痢疾發(fā)病的關(guān)系,可根據(jù)氣溫和前8天細(xì)菌性痢疾發(fā)病水平預(yù)測(cè)發(fā)病數(shù)。
廣義相加模型適用于多種分布資料的分析,模型中既可以包括參數(shù)擬合部分也可包括非參數(shù)擬合部分,甚至可以全部是非參數(shù)擬合,模型的構(gòu)建靈活,并不拘泥于某一種形式的函數(shù)。當(dāng)解釋變量的個(gè)數(shù)較多或反應(yīng)量與解釋變量之間的關(guān)系不明確,反應(yīng)變量的分布不易判定或不符合所要求的分布時(shí)均可考慮用廣義相加模型。
預(yù)測(cè)預(yù)警研究是一項(xiàng)很復(fù)雜的研究,除了傳染病的影響因素較復(fù)雜外,預(yù)測(cè)預(yù)警分析的統(tǒng)計(jì)方法也有較高要求。本文所建立的細(xì)菌性痢疾預(yù)測(cè)模型只納入了氣溫因素,分析了日均氣溫對(duì)細(xì)菌性痢疾發(fā)病的影響,但是影響細(xì)菌性痢疾發(fā)病和流行的因素還有很多,現(xiàn)階段我們也開展了相應(yīng)的監(jiān)測(cè),收集了大量的監(jiān)測(cè)資料,包括癥狀監(jiān)測(cè)、病原學(xué)監(jiān)測(cè)等,由于監(jiān)測(cè)資料之間缺乏統(tǒng)一性,無法納入數(shù)學(xué)模型,在以后的工作中,將進(jìn)一步深入研究。
1.Akari T,Michio Y,Taiichi H,et al.Climate impact on seasonal patterns of diarrhea diseases in Tropical area.www.hyarc.nagoya-u.a(chǎn)c.jp/game/6thconf/html/abs.html/pdfs/T6AT09Aug04093113.pdf.
2.Hayashi T.Impact of meteorological elements on diarrhea diseases in Bangladesh.Preprints.Meteor.Soc,2004,86:257.
3.鄭能雄,林云欽,鄭高,等.福州市主要傳染病與氣象因素關(guān)系的研究.中國(guó)公共衛(wèi)生管理,2004,20:343-346.
4.孫培源,張德山,韋懿蕓,等.北京市海淀區(qū)細(xì)菌性痢疾與氣象因素的關(guān)系.首都公共衛(wèi)生,2008,2(3):100-103.
5.黃成鋼,金如鋒,邱宏,等.我國(guó)某地區(qū)痢疾發(fā)病率與氣象因素的關(guān)系及其預(yù)測(cè)模型.現(xiàn)代預(yù)防醫(yī)學(xué),2009,36(7):1207-1210.
6.廖洪秀,張強(qiáng),杜長(zhǎng)慧,等.主成分回歸分析在細(xì)菌性痢疾與氣象因素關(guān)系中的應(yīng)用.現(xiàn)代預(yù)防醫(yī)學(xué),2009,36(5):813-815.
7.董英,趙耐青,湯克軍,等.廣義相加模型在氣溫健康效應(yīng)研究中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25(2):144-146.
8.Simon N,Wooda,Nicole H,et al.GAMs with integrated model selection using gernalized regression splines and applications to environmental modeling.Ecological Modelling,2002,(157):1572177.
9.Laurent F,Alain LT,Isabelle B,et al.Difference in the relation between daily mortality and air pollution among elderly and all-ages populations in south western France.Environmental Research,2004(94):249-253.
10.余松林,彭曉武.廣義加性模型配合時(shí)間序列資料時(shí)消除殘差自相關(guān)性的一種方法.中國(guó)衛(wèi)生統(tǒng)計(jì),2010,27(5):450-454.
11.張文增,冀國(guó)強(qiáng),史繼新,等.ARIMA模型在細(xì)菌性痢疾預(yù)測(cè)預(yù)警中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2009,26(6):636-639.
12.施侶元,李立明,葉冬青,等.流行病學(xué).第5版.北京:人民衛(wèi)生出版社,2003:464-465.