何 俊 胡平成 金若剛 羅 磊 李繼猛
?
長沙市金屬和類金屬職業(yè)病危害因素檢測超標(biāo)率時間序列分析*
何 俊1胡平成2金若剛1羅 磊1李繼猛1
目的 了解長沙市金屬和類金屬職業(yè)病危害因素檢測超標(biāo)率變化趨勢,建立季節(jié)性ARIMA模型進(jìn)行短期預(yù)測,為控制工作場所金屬和類金屬危害提供措施建議。方法 利用2008-2015年檢測數(shù)據(jù)為訓(xùn)練集進(jìn)行建模,利用2016年上半年數(shù)據(jù)為驗證集檢驗,并進(jìn)一步預(yù)測2016-2017年的超標(biāo)率。結(jié)果 金屬和類金屬超標(biāo)率長期趨勢為逐年下降,且具有一定的季節(jié)效應(yīng),其中二、三季度較高,一、四季度較低。建立ARIMA(0,1,1)×(0,1,1)4模型,經(jīng)檢驗殘差為白噪聲序列,預(yù)測的平均絕對誤差(MAE)為4.54%。結(jié)論 長沙市金屬與類金屬危害的控制近年來取得了一定的成效,超標(biāo)率呈逐年下降趨勢。2017年第二季度是金屬與類金屬危害控制的重點。季節(jié)性ARIMA模型在金屬與類金屬檢測超標(biāo)率預(yù)測方面有一定的可行性,今后可以和其他模型聯(lián)合降低預(yù)測誤差。
金屬與類金屬 職業(yè)病危害因素 超標(biāo)率 ARIMA模型
長沙市工業(yè)企業(yè)以機械制造、金屬加工、汽車制造、電氣電子、化工等產(chǎn)業(yè)為主導(dǎo),存在錳、鉛、錫、鋅、銅、鎘、鉻、磷、砷等多種金屬和類金屬職業(yè)病危害因素。勞動者在生產(chǎn)過程中可能因意外事故、燃燒或焊接吸入高濃度金屬煙霧導(dǎo)致急性中毒,低劑量長時間接觸金屬和類金屬也可引起慢性中毒[1]。預(yù)防和控制金屬和類金屬職業(yè)病危害因素對保護(hù)勞動者身體健康至關(guān)重要。
自回歸滑動平均混合模型簡稱ARIMA模型,目前已在公共衛(wèi)生領(lǐng)域得到廣泛應(yīng)用,如流感、結(jié)核、乙肝、猩紅熱、甲肝、呼吸道傳染病、手足口病、梅毒的發(fā)病預(yù)測[2-9],住院人數(shù)、門診量、門診收入變化趨勢的季節(jié)調(diào)整等方面[10-12],但在職業(yè)衛(wèi)生領(lǐng)域的應(yīng)用還鮮有報道。本文通過分析2008-2016年上半年長沙市工業(yè)企業(yè)金屬和類金屬職業(yè)病危害因素的檢測結(jié)果,利用季度超標(biāo)率建立季節(jié)性ARIMA模型,對未來金屬和類金屬危害的變化趨勢進(jìn)行預(yù)測,以制定降低工作場所有害物質(zhì)濃度和保護(hù)勞動者健康的策略與措施。
1.資料來源
本研究資料來自2008-2016年上半年長沙市疾病預(yù)防控制中心依法對長沙市用人單位每年一次的定期檢測,這里對用人單位的定義與《中華人民共和國職業(yè)病防治法》的闡述保持一致,即存在粉塵、放射性物質(zhì)和其他有毒、有害因素的企業(yè)、事業(yè)單位和個體經(jīng)濟(jì)組織。長沙市疾病預(yù)防控制中心定期檢測的用人單位主要來自職業(yè)衛(wèi)生服務(wù)市場化前的主管企業(yè),分布在全市各行業(yè)和地區(qū),可基本代表長沙市存在職業(yè)病危害因素用人單位的危害狀況。
2.分析方法
ARIMA模型是Box-Jenkins方法中成熟的時間序列分析預(yù)測方法,模型主要分析時間序列的隨機性、平穩(wěn)性和季節(jié)性,根據(jù)Akaike′s information Criterion(AIC)和Schwarz′s Bayesian Criterion(BIC)選擇合適的參數(shù)進(jìn)行預(yù)測,并通過Box-Ljung檢驗、平均絕對誤差(MAE)、平均相對誤差(MAPE)對模型進(jìn)行評價。ARIMA建模主要包括三個內(nèi)容:自回歸、滑動平均、差分求和,季節(jié)性模型一般表示為ARIMA(p,d,q)×(P,D,Q)s,其中p、P表示模型的普通、季節(jié)自回歸階數(shù),d、D分別表示普通、季節(jié)平穩(wěn)化的差分階數(shù),q、Q表示普通、季節(jié)移動平均階數(shù)[13]。模型公式為:
φ(B)=1-φ1B-φ2B2-…-φpBp
θ(B)=1+θ1B+θ2B2+…+θqBq
ΦP(Bs)=1-Φ1Bs-Φ2B2s-…-ΦPBPs
ΘQ(Bs)=1+Θ1Bs+Θ2B2s+…+ΘQBQs
▽d=(1-B)d
本研究采用excel 2016進(jìn)行數(shù)據(jù)錄入?yún)R總,利用R(3.3.1)進(jìn)行ARIMA建模、檢驗、預(yù)測和繪圖。
1.金屬和類金屬超標(biāo)率序列特征
本研究數(shù)據(jù)為2008-2016年上半年金屬和類金屬檢測數(shù)據(jù),選擇2008-2015年數(shù)據(jù)為訓(xùn)練集,2016年上半年數(shù)據(jù)為驗證集進(jìn)行建模。對訓(xùn)練集數(shù)據(jù)用stl函數(shù)進(jìn)行分解,圖1展現(xiàn)了原始序列、季節(jié)性、長期趨勢、不規(guī)則變化四個部分,序列長期趨勢明顯,基本呈下降趨勢,且具有一定的季節(jié)效應(yīng),高峰位于每年的第二、三季度,而第一、四季度較低。
圖1 超標(biāo)率時間序列分解圖
2.季節(jié)性ARIMA模型的建立
(1)序列平穩(wěn)化
金屬和類金屬超標(biāo)率時間序列有明顯的長期趨勢,提示可能為非平穩(wěn)序列,由于原始序列部分季度數(shù)據(jù)為0,為降低序列波動,采用加1后自然對數(shù)變換的方式進(jìn)行統(tǒng)計變換。對新序列進(jìn)行普通差分并繪制ACF(自相關(guān)系數(shù))圖和PACF(偏相關(guān)系數(shù))圖,其中ACF圖顯示序列存在一定的周期性,第1、5、9、13階相關(guān)系數(shù)顯著增大,對序列再進(jìn)行季節(jié)性差分,經(jīng)ADF單位根檢驗,統(tǒng)計量為-6.23,P=0.01<0.05,說明兩次差分后的序列無單位根,為平穩(wěn)序列,見圖2。
(2)模型的識別與建立
圖2兩次差分后的序列仍存在一定的周期性,其中ACF圖第1、5、13階相關(guān)系數(shù)增大,可視為季節(jié)性1階后截尾或拖尾,PACF圖第1、4、5、8、9、12、13、16階顯著增大,可視為季節(jié)性1階后截尾、3階后截尾或拖尾,則P、Q有(0,1)、(1,0)、(1,1)、(3,0)、(3,1)五種可能。
圖2 兩次差分的ACF圖和PACF圖
周期內(nèi)ACF圖可看做1階后截尾或拖尾,PACF圖可看做拖尾,則p、q有(0,1)、(1,1)兩種可能。利用P、Q、p、q可能的參數(shù)組合分別建模,由于是差分序列,各模型均未包含常數(shù)項,計算得AIC和BIC值見表1。其中ARIMA(0,1,1)×(0,1,1)4的AIC和BIC值均最小,t檢驗表明模型參數(shù)不為零,ARIMA(0,1,1)×(0,1,1)4為最優(yōu)模型,表達(dá)式為:(1-B4)(1-B)xt=(1-0.68B4)(1-0.95B)wt,各參數(shù)見表2。
表1 模型的AIC、BIC值
表2 ARUNA(0,1,1)×(0,1,1)4模型參數(shù)
(3)模型的診斷與驗證
對ARIMA(0,1,1)×(0,1,1)4模型回歸殘差進(jìn)行Ljung-Box檢驗,滯后3階到16階的自相關(guān)系數(shù)相應(yīng)Ljung-Box檢驗統(tǒng)計量的概率值都大于0.05,可以認(rèn)為模型序列不存在自相關(guān),為白噪聲序列,見圖3。
圖3 Ljung-Box檢驗結(jié)果
為驗證ARIMA(0,1,1)×(0,1,1)4模型的效果,利用模型對長沙市2016年第一、二季度金屬類職業(yè)病危害因素檢測超標(biāo)率預(yù)測,預(yù)測結(jié)果分別為1.48%、4.89%,實際超標(biāo)率為0、12.5%,所選模型的平均絕對誤差(MAE)為4.54%。
(4)預(yù)測
將2016年上半年實際數(shù)據(jù)加入ARIMA(0,1,1)×(0,1,1)4重新建模,經(jīng)Box-Ljung檢驗,3-16階P值均大于0.05,殘差為白噪聲序列。利用新模型對2016-2017年長沙市金屬類職業(yè)病危害因素檢測超標(biāo)率進(jìn)行預(yù)測,6個季度超標(biāo)率分別為2.63%、1.95%、0、5.89%、0.93%、0.26%,超標(biāo)率峰值在第二季度,見圖4。
圖4 長沙市金屬類職業(yè)病危害因素檢測超標(biāo)率預(yù)測
金屬和類金屬是長沙市用人單位存在的主要職業(yè)病危害因素之一,控制其工作場所濃度和降低超標(biāo)率是急慢性中毒類職業(yè)病防治的重中之重[15]。本研究采用季節(jié)性ARIMA模型對金屬和類金屬超標(biāo)率歷史數(shù)據(jù)進(jìn)行了分析,對短期內(nèi)超標(biāo)率進(jìn)行了預(yù)測,旨在發(fā)現(xiàn)近年來長沙市金屬和類金屬職業(yè)病危害變化的特點和規(guī)律,從而制定有力的控制措施。
時間序列的長期趨勢顯示檢測超標(biāo)率呈逐年下降趨勢,表明長沙市職業(yè)病防治工作近年來取得了一定的成效。時間序列同時也存在一定的季節(jié)性,二、三季度較一、四季度有更高的超標(biāo)率,一方面這可能與某些毒物在氣溫較高時容易揮發(fā)和擴散有關(guān),另一方面長沙市疾病預(yù)防控中心檢測行業(yè)的季度分布并不均勻,機械加工和電氣電子等金屬和類金屬工藝較多的用人單位在二、三季度檢測較多,從而導(dǎo)致金屬類職業(yè)病危害超標(biāo)率更高[15]。
本研究利用長沙市金屬與類金屬職業(yè)病危害因素的季度超標(biāo)率建立ARIMA(0,1,1)×(0,1,1)4模型,對未來超標(biāo)率進(jìn)行了短期預(yù)測。模型2016年上半年超標(biāo)率的驗證表明預(yù)測值與實際值的發(fā)展趨勢一致,通過診斷和檢驗說明該模型對長沙市金屬與類金屬超標(biāo)率的預(yù)測具有一定的可行性,但2016年第二季度還存在較大預(yù)測誤差,在以后的研究中可試驗ARIMA與其他模型聯(lián)合提高預(yù)測能力。
長沙市金屬與類金屬類職業(yè)病危害因素有較明顯的時間趨勢和季節(jié)趨勢,根據(jù)序列的規(guī)律對未來超標(biāo)率進(jìn)行預(yù)測,可預(yù)先了解金屬與類金屬類職業(yè)病危害情況的發(fā)展?fàn)顩r,以提前發(fā)現(xiàn)高風(fēng)險企業(yè),采取適當(dāng)?shù)目刂拼胧┙档徒饘倥c類金屬對勞動者身體健康的損害。預(yù)測顯示2017年第二季度金屬與類金屬的危害較大,提示我們在工作中尤其要關(guān)注此時期內(nèi)檢測企業(yè)的金屬與類金屬危害,發(fā)現(xiàn)問題需及時向安全生產(chǎn)監(jiān)管等政府部門進(jìn)行反饋,密切注意工作場所金屬與類金屬濃度的變化,從而防患于未然,降低職業(yè)性急性金屬與類金屬中毒的發(fā)病率。模型以歷史超標(biāo)率數(shù)據(jù)建立,在今后的預(yù)測中還需加入每年的新數(shù)據(jù)進(jìn)行修正,提高金屬與類金屬超標(biāo)率預(yù)測的準(zhǔn)確性[9]。
[1]孫貴范.職業(yè)衛(wèi)生與職業(yè)醫(yī)學(xué).第7版.北京:人民衛(wèi)生出版社,2012.
[2]Song X,Xiao J,Deng J,et al.Time series analysis of influenza incidence in Chinese provinces from 2004 to 2011.Medicine,2016,95(26):e3929.
[3]Li XX,Wang LX,Zhang H,et al.Seasonal variations in notification of active tuberculosis cases in China,2005-2012.Plos One,2013,8(7):e68102.
[4]陳正利,陳偉,許汴利.應(yīng)用ARIMA模型對河南省1991-2011年乙型肝炎發(fā)病趨勢分析.中國衛(wèi)生統(tǒng)計,2013,30(3):401-402.
[5]朱玉.單純ARIMA模型和ARIMA-GRNN組合模型在猩紅熱月發(fā)病率中的預(yù)測效果比較.合肥:安徽醫(yī)科大學(xué),2011.
[6]朱奕奕,馮瑋,趙琦,等.ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預(yù)測中的應(yīng)用.復(fù)旦學(xué)報(醫(yī)學(xué)版),2012,39(5):460-464.
[7]時照華.探索ARIMA模型在呼吸道傳染病疫情預(yù)測中的應(yīng)用.合肥:安徽醫(yī)科大學(xué),2013.
[8]董晶.長沙市手足口病疫情分布特征及預(yù)測模型的建立與評估.長沙:中南大學(xué),2014.
[9]陳偉,陳正利,李少芳,等.ARIMA模型在河南省梅毒月發(fā)病率預(yù)測中的應(yīng)用.中國衛(wèi)生統(tǒng)計,2013,30(4):604-606.
[10]薛允蓮,張晉昕,劉貴浩,等.醫(yī)院住院人數(shù)序列的春節(jié)效應(yīng)調(diào)整.中國衛(wèi)生統(tǒng)計,2010,27(5):473-476.
[11]王玖,韓春蕾,欒奕昭.組合預(yù)測在醫(yī)院門診量預(yù)測中的應(yīng)用.中國衛(wèi)生統(tǒng)計,2012,29(6):881-883+886.
[12]郭志武,蒲繼紅,滕國召.基于ARIMA模型的春節(jié)因素調(diào)整方法研究.中國衛(wèi)生統(tǒng)計,2009,26(6):573-576+579.
[13]孫振球,徐勇勇.醫(yī)學(xué)統(tǒng)計學(xué).第4版.北京:人民衛(wèi)生出版社,2014.
[14]Shumway RG,Stoffer DS.Time series analysis and its applications with R examples.Third Edition.Springer,2010:83-161.
[15]何俊.2008-2013年長沙市工業(yè)企業(yè)職業(yè)病危害因素縱向研究.長沙:中南大學(xué),2014.
(責(zé)任編輯:郭海強)
2016年湖南省衛(wèi)生計生委科研項目(B2016231)
1.長沙市疾病預(yù)防控制中心職業(yè)病防治所(410004)
2.中南大學(xué)湘雅公共衛(wèi)生學(xué)院