首都醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(100069)
胥 芹 王 超 潘 蕾 曹 凱 劉 龍 郭秀花△
·論著·
廣義相加模型在北京市PM2.5與救護車出車次數(shù)關(guān)聯(lián)性研究中的應(yīng)用
首都醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(100069)
胥 芹 王 超 潘 蕾 曹 凱 劉 龍 郭秀花△
目的 探討北京市每日PM2.5濃度變化與救護車出車次數(shù)的關(guān)聯(lián)性。方法 應(yīng)用廣義相加模型,在控制多種可能混雜因素的基礎(chǔ)上,分析北京市2012年10月8日至2012年12月31日PM2.5污染當天(lag 0)至滯后第7天(lag 7)PM2.5對救護車出車次數(shù)的影響。結(jié)果 模型擬合結(jié)果顯示PM2.5對滯后第4天救護車出車次數(shù)的影響有統(tǒng)計學(xué)意義(Z=2.461,P=0.0139),PM2.5每增加50 μg/m3,救護車出車次數(shù)增加的相對危險度為1.028(95%CI1.006~1.050)。結(jié)論 北京市PM2.5濃度的增加對救護車出車次數(shù)的增加有影響,廣義相加模型應(yīng)用靈活性較強。
PM2.5污染 救護車出車次數(shù) 廣義相加模型 時間序列
Hastie 和 Tibshirani于1990 年在廣義線性模型和加性模型的基礎(chǔ)上提出廣義相加模型(generalized additive model,GAM)后,模型在各個領(lǐng)域得到了廣泛地應(yīng)用[1-2],近年來,由于其在控制時間的長期變化趨勢和季節(jié)性趨勢、氣象因素等混雜因素時有較好的作用,已經(jīng)被廣泛應(yīng)用于評價大氣污染短期暴露的急性健康效應(yīng)[3-4]。目前,有很多研究者借助于居民死亡統(tǒng)計數(shù)據(jù)、醫(yī)院門急診數(shù)據(jù)研究PM2.5的人群健康效應(yīng),結(jié)果表明PM2.5與人群全死因死亡、與心血管疾病和呼吸系統(tǒng)疾病的急性發(fā)作和死亡都有較大的相關(guān)性[5-7],救護車出車情況能相對及時和敏銳地反映人群健康狀況的變化,因此能較好地體現(xiàn)出PM2.5對人群健康的影響,而對于PM2.5與救護車出車次數(shù)的關(guān)聯(lián)性研究還未見報道。近兩年北京市PM2.5的污染尤為嚴重,本研究選擇北京市作為研究現(xiàn)場,應(yīng)用廣義相加模型來分析北京市2012年10月8日至2012年12月31日每日PM2.5濃度變化和救護車出車次數(shù)的相關(guān)關(guān)系,為醫(yī)療急救資源的應(yīng)急分配提供一定的參考。
1.資料
PM2.5質(zhì)量濃度數(shù)據(jù)來自于北京市環(huán)境保護監(jiān)測中心網(wǎng)站(http://zx.bjmemc.com.cn/),由35個監(jiān)測站點所記錄的PM2.5日均濃度平均值代表全市的PM2.5日均濃度,利用SPSS20.0軟件將缺失值采用線性內(nèi)插法補齊。氣溫、相對濕度等氣象因素數(shù)據(jù)主要來自于中國氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)。救護車急救信息數(shù)據(jù)來自于北京市120急救中心,資料主要包括時間、地點、患者、性別、年齡、主訴、初診原因和病種判斷等信息,本研究排除了由中毒、外傷、車禍、自殺、他殺、懷孕等外部原因引起的急救。運用Microsoft Excel建立數(shù)據(jù)庫。
2.統(tǒng)計分析方法
(1)模型基本理論
廣義相加模型的一般形式為:
g(u)=β0+s0+s1(x1)+s2(x2)+…sn(xn)
(1)
式中,g(u)代表各種連接函數(shù)關(guān)系,可以是多種概率分布,主要有正態(tài)分布、二項分布、負二項分布和Poisson分布等;s(x)代表平滑函數(shù),包括平滑樣條(smoothing spline,s)、自然立方樣條(natural cubic spline,ns)、懲罰樣條(penalized spine,ps)等。s(x)是非參數(shù)形式,可以控制自變量的非線性效應(yīng),使得模型非常靈活。
GAM應(yīng)用的潛在假設(shè)為自變量的函數(shù)是可加的,并且各部分是平滑的。在實際應(yīng)用中,若每個解釋變量的關(guān)系都用非參數(shù)擬合會出現(xiàn)計算量大、過度擬合等問題,因此,GAM也可以納入?yún)?shù)部分,這樣就出現(xiàn)了半?yún)?shù)廣義相加模型(semi-parametric generalized additive models),其形式為:
g(u)=α+β1x1+…βnxn+∑si(xi)
(2)
(2)建模策略
將救護車出車次數(shù)、PM2.5濃度、溫度、相對濕度通過日期鏈接,采用以對數(shù)鏈接的半?yún)?shù)廣義相加模型進行分析。在全人群中,由于救護車急救相對于總?cè)巳簛碚f是小概率事件,救護車出車次數(shù)基本近似服從Poisson 分布,因此鏈接函數(shù)選用Poisson 回歸。
本次研究采取的建模策略是:①采用自然立方樣條(natural cubic spline,ns)函數(shù)控制救護車出車次數(shù)隨時間變化的長期波動和季節(jié)性波動趨勢。②采用偏自相關(guān)函數(shù)(partial auto-correlation function,PACF)來指導(dǎo)時間平滑樣條中自由度的選擇。對時間趨勢采用3~8df/年,當圖前2個滯后的絕對數(shù)值小于0.3,我們認為基本模型已經(jīng)很好地控制了序列相關(guān)性。當這一條件得不到滿足,我們加入最大滯后天數(shù)為7的自回歸(auto-regression,AR)項,以改善模型。③采用自然立方樣條函數(shù)控制溫度和相對濕度對救護車人次的非線性影響,根據(jù)文獻報道,將其自由度均設(shè)為3。④采用以上建模策略,采用7df/年的自由度足以控制時間的長期和季節(jié)變化趨勢。⑤在此基礎(chǔ)上對最終模型的殘差進行分析,根據(jù)殘差是否滿足白噪聲來進一步檢驗?zāi)P偷臄M合優(yōu)度。
本次研究所擬合的半?yún)?shù)廣義相加模型為:
logE(Yt)=α+βPM2.5+ns(time,df)+ns(temperature,df)+ns(humid,df)
(3)
式中:E(Yt)為觀察日t救護車出車次數(shù)的期望值;α為殘差;β是回歸系數(shù);PM2.5是當日的PM2.5日均濃度;ns是自然立方樣條函數(shù);df為自由度;time為時間,temperature為溫度,humid為相對濕度。
目前,國際上一般采用R軟件中的mgcv軟件包擬合時間序列的GAM模型,本研究采用R 3.0.2來建立模型。根據(jù)GAM模型估算出PM2.5的回歸系數(shù)β,計算相對危險度(RR),RR=exp(50×β),在此基礎(chǔ)上計算出RR的95%可信區(qū)間(confidence interval,CI),公式為exp[50×(β±1.96SE)],表示PM2.5每增加50 μg/m3引起救護車出車次數(shù)增加的相對危險度??紤]到空氣污染產(chǎn)生的健康效應(yīng)可能存在滯后,本文分析了污染當天(lag 0)至滯后第7天(lag 7)的效應(yīng)。
1.統(tǒng)計描述結(jié)果
排除外部原因后,研究期間北京市每日救護車出車次數(shù)平均為622次。根據(jù)我國最新公布的環(huán)境空氣質(zhì)量標準(GB3095-2012)中PM2.5二級標準日均濃度限值75 μg/m3,研究期間內(nèi)PM2.5超標日為57天,約占研究天數(shù)的62%,這給研究PM2.5的急性健康效應(yīng)提供了良好的條件。
對研究變量檢驗其正態(tài)性,可知救護車出車次數(shù)、日均溫度和日均濕度均不符合正態(tài)分布,故用Spearman秩相關(guān)分析研究變量之間的相關(guān)關(guān)系,分析結(jié)果見表2。
**:P<0.01,*:P<0.05。
2.回歸模擬結(jié)果
分別采用當日(lag 0)-滯后第7日(lag 7)PM2.5的平均濃度作為PM2.5的暴露水平,擬合PM2.5與救護車出車次數(shù)的時間序列模型,結(jié)果見表3和圖1。由此可知,PM2.5對救護車出車次數(shù)的影響在滯后第4天的效應(yīng)有統(tǒng)計學(xué)意義(P=0.0139),且RR(1.028)及95%CI(1.006~1.050)均大于1。另外,PM2.5對當日救護車出車次數(shù)的影響也有統(tǒng)計學(xué)意義(P=0.0353),但是,lag0的RR(0.980)及95%CI(0.956~0.998)均小于1,表示PM2.5每增加50ug/m3,救護車出車次數(shù)反而下降。其他滯后天的結(jié)果均沒有統(tǒng)計學(xué)意義(P>0.05)。
3.敏感性分析
采用每年自由度為7,PM2.5濃度為lag4天的平均濃度進行建模后,由每日救護車出車次數(shù)的殘差圖(圖2)和殘差的偏自相關(guān)函數(shù)(PACF)圖(圖3)可知,基本上,殘差已變?yōu)橐?為中軸的隨機波動,滿足白噪聲,表明模型的擬合優(yōu)度滿足要求。救護車出車次數(shù)殘差的偏自相關(guān)函數(shù)也滿足要求。
廣義相加模型的構(gòu)建十分靈活,模型中既可包括參數(shù)擬合部分也可包括非參數(shù)擬合部分,甚至可以全部是非參數(shù)擬合,當自變量的個數(shù)較多或者因變量與自變量之間的關(guān)系不明確時,因變量的分布不容易判定或不符合所要求的分布時均可考慮應(yīng)用廣義相加模型。目前還未見研究PM2.5濃度變化與救護車出車次數(shù)關(guān)聯(lián)性的報道,本研究以廣義相加模型為基本統(tǒng)計模型,運用時間序列方法,分析了日均PM2.5濃度變化對救護車出車次數(shù)的影響,救護車出車次數(shù)近似服從Poisson分布,而時間和氣象因素對救護車出車次數(shù)的作用形式不明,應(yīng)用廣義相加模型可通過平滑函數(shù)控制這些混雜因素的作用,應(yīng)用靈活方便。
本次模型擬合結(jié)果表明,PM2.5濃度對救護車出車次數(shù)的影響存在一定的滯后效應(yīng),在滯后的第4天有意義。國內(nèi)外的很多研究也表明,PM2.5的急性健康效應(yīng)存在一定的滯后時間,Huang等分析了2004年到2008年西安市戶籍居民的每日因病和自然死亡率與PM2.5的關(guān)系,結(jié)果顯示,PM2.5質(zhì)量濃度每增加103g/m3時,居民全部死因的超額死亡風(fēng)險會增加2.29%,滯后時間在1~2d[8]。滯后時間不一致的可能原因為,本次研究納入只有3個月的數(shù)據(jù),研究時間較短,因此,有必要進行更長時間的研究,以進一步探討每日PM2.5濃度變化與救護車出車次數(shù)的關(guān)系。
本研究控制了多種可能混雜因素的影響,較為客觀地分析了每日PM2.5濃度變化與救護車出車次數(shù)的關(guān)系,可以為醫(yī)療急救資源的應(yīng)急分配提供一定的參考,比如已知某地區(qū)存在嚴重的PM2.5污染,衛(wèi)生部門可以提前通知120急救中心做好充分的準備,合理分配和使用各個地區(qū)的應(yīng)急車輛。由于本次研究資料獲得不易,研究時間段相對較短,在以后條件允許的情況下,將進一步深入研究。
[1]陶芳芳,趙耐青,何懿,等.廣義相加模型在細菌性痢疾預(yù)警中的應(yīng)用.中國衛(wèi)生統(tǒng)計,2012,29(4):481-483.
[2]牟喆,彭麗,花靜,等.上海市溫濕度與感冒就診人次的時間序列研究.中國衛(wèi)生統(tǒng)計,2013,30(2):237-239.
[3]Díaz-Robles LA,Fu JS,Vergara-Fernández A,et al.Health risks caused by short term exposure to ultrafine particles generated by residential wood combustion:a case study of Temuco,Chile.Environment International,2014,66:174-181.
[4]Neuberger M,Moshammer H,Rabczenko D.Acute and subacute effects of urban air pollution on cardiopulmonary emergencies and mortality:time series studies in Austrian cities.International Journal of Environment Research and Public Health,2013,10(10):4728-4751.
[5]Heo J,Schauer JJ,Yi O,et al.Fine particle air pollution and mortality:importance of specific sources and chemical species.Epidemiology,2014,25(3):379-388.
[6]Samoli E,Stafoggia M,Rodopoulou S,et al.Which specific causes of death are associated with short term exposure to fine and coarse particles in Southern Europe?Results from the MED-PARTICLES project.Environment International,2014,67:54-61.
[7]Dominici F,Peng RD,Bell ML,et al.Fine particulate air pollution and hospital admission for cardiovascular and respiratory diseases.The journal of the American Medical Association,2006,10(295):1127-1134.
[8]Huang W,Cao J,Tao Y,et al.Seasonal variation of chemical species associated with short-term mortality effects ofPM2.5in Xi’an,a Central City in China.American Journal of Epidemiology,2012,175(6):556-566.
(責任編輯:郭海強)
The Application of Generalized Additive Model in the Association Study of PM2.5Concentrations Change with Daily Ambulance Dispatches in Beijing
Xu Qin,Wang Chao,Pan Lei,et al.
(School of Public Health in Capital Medical University(100069),Beijing)
Objective To research the relationship between daily PM2.5concentration change and the ambulance dispatches.Methods Generalized additive model was used to study the association of PM2.5pollution with ambulance dispatches from October to December in 2012,Beijing,after controlling for long-term trend,temperature and humid.Results Lag effect of the fourth day is statistically significant(Z=2.461,P=0.0139),with the PM2.5concentration increase 50 μg/m3,the relative risk of the ambulance dispatches increase is 1.028(95%CI:1.006~1.050).Conclusion The increase of PM2.5concentration has an impact on the increase of ambulance dispatches in Beijing.The application of generalized additive mode is flexible.
PM2.5pollution;Ambulance dispatches;Generalized additive model;Time series
△通信作者:郭秀花,E-mail:gouxiuh@ccmu.edu.cn