孫建偉 王大江 許汴利 黃學(xué)勇△
衛(wèi)生相關(guān)事件數(shù)據(jù)時間聚集性的綜合分析與判定*
孫建偉1王大江2許汴利1黃學(xué)勇1△
目的 探討衛(wèi)生相關(guān)事件數(shù)據(jù)時間聚集性的綜合分析與判定。方法 應(yīng)用集中度、負(fù)二項分布、聚類分析、圓分布四種方法對河南省某縣狂犬病門診就診人群月分布數(shù)據(jù)進行分析。結(jié)果 集中度法M=0.54,說明就診人群具有較強季節(jié)性;負(fù)二項分布P=0.3119,可認(rèn)為就診人群時間分布以天為單位具有時間聚集性;聚類分析顯示春夏季是就診人群集中季節(jié),3-6月為就診高峰,5月就診人數(shù)最多;圓分布法計算結(jié)果顯示日就診高峰在5月8日。結(jié)論 集中度、負(fù)二項分布、聚類分析、圓分布等方法可用于衛(wèi)生相關(guān)事件數(shù)據(jù)時間聚集性的綜合分析與判定。
時間聚集性 集中度 負(fù)二項分布 聚類分析 圓分布
衛(wèi)生相關(guān)事件年度數(shù)據(jù),如某種疾病發(fā)病時間分布、門診就診人群時間分布、病媒數(shù)量的月分布等,其有無時間聚集性及時間聚集性綜合分析與判定是相關(guān)科學(xué)研究的重要內(nèi)容之一。通過衛(wèi)生相關(guān)事件年度數(shù)據(jù)時間聚集性分析,既可為疾病病因研究提供線索,又可為疾病暴露時間或潛伏期研究提供支持,還可以用于評價不同時期某種疾病防控效果,為制定有效防制措施和衛(wèi)生決策提供科學(xué)依據(jù)。本文以河南省某縣2015年狂犬病暴露預(yù)防處置門診就診人數(shù)月分布數(shù)據(jù)的綜合分析為例,介紹集中度、負(fù)二項分布、聚類分析、圓分布四種方法在數(shù)據(jù)時間聚集性分析與判定中的應(yīng)用,并對結(jié)果進行比較,探討適用范圍和價值。
1.資料
來自2015年河南省某縣狂犬病暴露預(yù)防處置門診監(jiān)測數(shù)據(jù)報表門診就診人群分日、分月數(shù)據(jù)。
2.方法
(1)集中度[1]表示發(fā)病時間季節(jié)性強弱的指標(biāo),由各月發(fā)病數(shù)與全年發(fā)病總數(shù)之比通過下式計算:
M表示集中度,R表示離散度,ri表示月發(fā)病數(shù)與全年發(fā)病總數(shù)之比。M為1時說明病例集中在一個月內(nèi);在0.9以上說明發(fā)病有嚴(yán)格季節(jié)性;在0.7~0.9之間,說明發(fā)病有很強的季節(jié)性;在0.5~0.7之間說明發(fā)病有較強季節(jié)性;在0.3~0.5之間說明發(fā)病有一定季節(jié)性;在0.3以下說明發(fā)病時間分布比較均勻; 為0表示病例均勻分布在12個月內(nèi)。
(1)
(2)
再根據(jù)
(3)聚類分析[4]聚類分析是研究事物分類的一種統(tǒng)計方法,是在所關(guān)注對象分類面貌尚不清楚情況下,通過彼此之間的比較而將性質(zhì)相近的歸為一類,性質(zhì)差別較大的歸為不同類。在Q型聚類(對樣品的聚類)中衡量對象性質(zhì)相近程度的距離指標(biāo)常用歐式距離,其計算公式如下:
式中:Xik表示第i對象的第k個指標(biāo)的觀察值,Xjk表示第j個對象的第k個指標(biāo)觀察值;m是觀察指標(biāo)的總數(shù)。dij表示第i個對象與第j個對象間的距離,dij越小,對象“性質(zhì)”越接近。在實例分析中,對象為月份,指標(biāo)是不同年份,觀察值是發(fā)病數(shù)。
(4)圓分布法[5]是將具有周期性變化的資料通過三角函數(shù)的變換使原始數(shù)據(jù)成線性資料的一種統(tǒng)計學(xué)方法。一組圓分布資料如果有集中分布的傾向,這一傾向性可用平均角表示。將1年365天轉(zhuǎn)化為360°,1天則對應(yīng)0.9863°,以每月中間一天為組中值,換算成對應(yīng)的角度,如1月16日對應(yīng)16×0.9863°=15.78°,2月14日對應(yīng)(31+14)×0.9863°=44.38°,余類推。通過以下公式求得平均角 ,換算成對應(yīng)的月日即為發(fā)病高峰期時間。
1.門診就診人群時間分布概況 該縣狂犬病暴露預(yù)防處置門診2015年共接診9800例,就診時間多在2-8月,占全年病例的92.27%,其中5月發(fā)病數(shù)最多為1782例。
圖1 河南省某狂犬病門診就診人數(shù)月分布
2.集中度法M=0.54,表明該狂犬病門診人群就診時間有較強季節(jié)性。
表1 門診人群就診時間(日)分布的負(fù)二項分布擬合
*:χ2=2.33,P=0.3119。
4.聚類分析 若聚為兩類,則2-8月為一類,1月、9-12月為一類;2-8月又可分為兩類,3-6月為一類,2月、7-8月為一類;3-6月又可分為5月及3、4、6月兩類。結(jié)果見圖2。
圖2 河南省某狂犬病門診就診人群分月聚類分析
表2 門診人群就診時間聚集性的圓分布法統(tǒng)計
在該狂犬病門診就診人群時間聚集性分析中,四種分析方法得出了相一致的結(jié)論,即發(fā)病具有時間聚集性,但結(jié)論側(cè)重點各不相同。集中度分析認(rèn)為發(fā)病具有較強季節(jié)性[6];負(fù)二項分布以某一時間或空間單位為觀察對象,得出事件數(shù)據(jù)在該時間或空間單元層面具有聚集性[7];聚類分析側(cè)重于按某一事件數(shù)據(jù)對月份進行不同層次的歸類[8];圓分布法除得出具有聚集性外還推算出具體的發(fā)病高峰[9]。從方法的繁易程度看,聚類分析可通過SPSS、SAS等快速實現(xiàn),最為簡便,其次是集中度分析,而圓分布法和負(fù)二項分布的計算相對繁瑣。從適用的時間范圍看,集中度分析最為局限,其余三種方法適用時間范圍則廣泛、靈活[10]。負(fù)二項分布常用于傳染病空間與時間聚集性的分析[11],有文獻曾用于釘螺分布的擬合[12],這種方法關(guān)注的時間單位可以為時、日、周、年等,關(guān)注的空間單位可以是縣、鄉(xiāng)、村、街道等,可得出在所關(guān)注的時間或空間單位層面發(fā)病是否具有聚集性,若有2組以上結(jié)果,可以通過聚集參數(shù) 的大小比較聚集程度。聚類分析更適宜于某一事件連續(xù)多年數(shù)據(jù)時間分布特征的分析,得出所關(guān)注時間單位的不同聚類結(jié)果。圓分布法適宜的時間范圍更廣、更靈活,關(guān)鍵是所關(guān)注的單位時間與角度的互算,同時需要進行平均角的雷氏檢驗,這種方法最大的優(yōu)點是能推算出發(fā)病高峰的時間點及不同置信度可信區(qū)間所在。
綜上所述,在衛(wèi)生相關(guān)事件時間聚集性分析和判定中,根據(jù)事件特點不同、關(guān)注時間范圍不同、分析研究目的不同,可以靈活采取不同方法。若是以月份為單位進行年度分析,如對于流行性乙型腦炎、細(xì)菌性痢疾等具有顯著發(fā)病高峰季節(jié)的傳染病,用圖示法或者聚類分析即可,對于事件或疾病無顯著高峰期的,首選集中度法判定發(fā)病季節(jié)性的強弱;若研究關(guān)注的是不同年代或不同地區(qū)某事件某一數(shù)據(jù)高峰期的比較及動態(tài)變化,則首選圓分布法;若要比較前后不同時期數(shù)據(jù)聚集性強弱則可由負(fù)二項分布擬合實現(xiàn)。同時,應(yīng)以動態(tài)變化的觀點看待衛(wèi)生相關(guān)事件數(shù)據(jù)時間聚集性,其分析和判定的主要目的是為該事件存在、發(fā)生、流行等相關(guān)影響因素分析提供線索,為疾病潛伏期或者暴露時間等事件關(guān)鍵點研究提供支持,為有效控制事件發(fā)展或者疾病防制措施的制訂和完善提供科學(xué)依據(jù)。
[1]聶軼飛,王海峰,李孟磊,等.應(yīng)用集中度和圓形分布法探討河南省2010年手足口病流行規(guī)律.中國衛(wèi)生統(tǒng)計,2013,30(3):410-411.
[2]索瑞鑫,仇玉蘭,王彤.基于負(fù)二項分布的確切推斷在微核試驗數(shù)據(jù)分析中的模擬研究.中國衛(wèi)生統(tǒng)計,2012,29(1):2-5.
[3]金丕煥.醫(yī)用統(tǒng)計方法.第2版.上海:復(fù)旦大學(xué)出版社,2008.
[4]張英杰,王超,曹凱,等.中國大陸2008-2010年手足口病流行特征聚類分析.中國公共衛(wèi)生,2015,31(5):541-544.
[5]梁筱露,白海濤,蘇喆,等.圓形分布法分析北海市流行性感冒的季節(jié)性和長期趨勢.現(xiàn)代預(yù)防醫(yī)學(xué),2015,42(8):1383-1385.
[6]雷靜,李霞,楊浩,等.應(yīng)用集中度分析銀川市2004-2010年細(xì)菌性痢疾的發(fā)病季節(jié)和年齡分布特征.寧夏醫(yī)學(xué)雜志,2012,34(1):60-62.
[7]孫建偉,陳豪敏,許汴利.河南省2010年縣區(qū)層面狂犬病病例空間聚集性的Poisson分布與負(fù)二項分布擬合.鄭州大學(xué)學(xué)報(醫(yī)學(xué)版), 2012, 47(1):98-100.
[8]李亮,梁祁,祁賢.江蘇省2009年手足口病流行特征的聚類分析.江蘇預(yù)防醫(yī)學(xué),2010,21(6):4-6.
[9]張世勇,高秋菊.圓形分布法分析石家莊市2004-2010年布魯桿菌病的高發(fā)季節(jié).中國人獸共患病學(xué)報,2012,28(3):312-314.
[10]李凱杰,林文,范志誠,等.湖北省間日瘧發(fā)病與傳瘧按蚊關(guān)系的圓形分布法分析.中華疾病控制雜志,2015,19(10):983-985.
[11]韓新煥.負(fù)二項分布的性質(zhì)特征及在流行病學(xué)研究中的應(yīng)用.數(shù)理醫(yī)藥學(xué)雜志,2009,22(2):138-140.
[12]張志杰,彭文祥,Ong Senghuat,等.廣義負(fù)二項分布對釘螺分布的擬合.中國衛(wèi)生統(tǒng)計,2008,25(1):2-6.
(責(zé)任編輯:張 悅)
河南省醫(yī)學(xué)科技攻關(guān)計劃項目(201503193)
1.河南省疾病預(yù)防控制中心傳染病預(yù)防控制所(450016)
2.河南省桐柏縣疾病預(yù)防控制中心
△ 通信作者:黃學(xué)勇,E-mail:hxyzzu@163.com