王旭峰,沈斐敏
(福州大學(xué)土木工程學(xué)院,福建福州 350116)
建筑業(yè)是我國(guó)國(guó)民經(jīng)濟(jì)的支柱產(chǎn)業(yè)之一,2013年建筑業(yè)總產(chǎn)值已達(dá)159 313億元.然而由于行業(yè)特點(diǎn)、工人素質(zhì)、管理難度、文化觀念和社會(huì)發(fā)展水平等原因,建筑業(yè)安全生產(chǎn)形勢(shì)嚴(yán)峻,已經(jīng)成為我國(guó)所有工業(yè)部門中僅次于采礦業(yè)的最危險(xiǎn)的行業(yè)[1].因此,提高建筑業(yè)安全生產(chǎn)管理水平,減少?gòu)臉I(yè)人員生命財(cái)產(chǎn)的損失具有重大意義.事故預(yù)測(cè)作為安全管理工作的一個(gè)重要內(nèi)容,是指在對(duì)已發(fā)生事故的歷史資料進(jìn)行統(tǒng)計(jì)、分析和處理的基礎(chǔ)上,應(yīng)用一定的預(yù)測(cè)技術(shù)和手段,對(duì)預(yù)測(cè)對(duì)象的安全狀況和趨勢(shì)進(jìn)行預(yù)測(cè)和預(yù)報(bào)[2].它能為生產(chǎn)企業(yè)制定安全生產(chǎn)目標(biāo)和安全管理部門進(jìn)行宏觀決策提供理論和技術(shù)支持.
當(dāng)前,應(yīng)用于安全事故定量預(yù)測(cè)的方法主要包括時(shí)間序列預(yù)測(cè)法、馬爾科夫預(yù)測(cè)法、灰色預(yù)測(cè)法、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法、回歸分析預(yù)測(cè)法等,其中每種預(yù)測(cè)方法都有其自身的特點(diǎn).如果單單依據(jù)預(yù)測(cè)誤差的大小或者操作復(fù)雜性的難易就將某種預(yù)測(cè)法摒棄或排除,這可能會(huì)失去安全事故預(yù)測(cè)中的大量有效信息[3].組合預(yù)測(cè)可以綜合利用各種預(yù)測(cè)方法提供的有用信息,以有效提高預(yù)測(cè)精度,改變由于各預(yù)測(cè)模型自身局限性帶來(lái)的預(yù)測(cè)誤差[4].但如何建立有效的組合預(yù)測(cè)模型,實(shí)現(xiàn)各種預(yù)測(cè)方法的優(yōu)勢(shì)互補(bǔ),從而達(dá)到預(yù)測(cè)精度的提高,仍然有待進(jìn)一步研究.
因此,本文根據(jù)1999-2011年建筑施工事故統(tǒng)計(jì)數(shù)據(jù)的特點(diǎn),選用非線性回歸、三次指數(shù)平滑、灰色預(yù)測(cè)法分別建立單項(xiàng)預(yù)測(cè)模型.并以綜合利用各單項(xiàng)預(yù)測(cè)模型所提供的有效信息為基礎(chǔ),建立線性組合預(yù)測(cè)模型,并建立基于BP神經(jīng)網(wǎng)絡(luò)的非線性組合預(yù)測(cè)模型.對(duì)上述各預(yù)測(cè)模型的擬合與預(yù)測(cè)精度進(jìn)行比較,證明所建非線性模型能夠有效實(shí)現(xiàn)各單項(xiàng)預(yù)測(cè)模型的綜合利用,其擬合及預(yù)測(cè)精度均比其它模型有了較明顯的提高.最后用其對(duì)未來(lái)幾年我國(guó)建筑施工事故進(jìn)行了預(yù)測(cè).
參考近年來(lái)研究建筑施工事故預(yù)測(cè)的文獻(xiàn),當(dāng)前用來(lái)衡量建筑業(yè)安全生產(chǎn)水平的指標(biāo)主要有單一指標(biāo),如建筑事故次數(shù)[5]和建筑事故死亡人數(shù)[6],選擇這類指標(biāo)在一定程度上體現(xiàn)了行業(yè)安全生產(chǎn)水平,但同時(shí)存在未綜合考慮生產(chǎn)規(guī)模的問(wèn)題.例如同期相比北京的建筑事故次數(shù)以及死亡人數(shù)數(shù)據(jù)比西藏的要高,但不能簡(jiǎn)單據(jù)此判斷北京的建筑業(yè)安全生產(chǎn)水平比西藏的低,應(yīng)該同時(shí)考慮到兩地建筑業(yè)規(guī)模之間的區(qū)別;以及復(fù)合指標(biāo)如百萬(wàn)工時(shí)事故次數(shù)[7-8],這類指標(biāo)能夠較為綜合地體現(xiàn)某時(shí)段的行業(yè)安全生產(chǎn)水平,但工時(shí)數(shù)據(jù)往往由各施工企業(yè)單獨(dú)統(tǒng)計(jì),并未對(duì)外公開.因此,本文選擇綜合考慮事故死亡人數(shù)以及建筑業(yè)總產(chǎn)值的復(fù)合指標(biāo)百萬(wàn)元產(chǎn)值死亡率用來(lái)衡量建筑業(yè)安全生產(chǎn)水平[9],也將之作為本文的預(yù)測(cè)研究對(duì)象(詳見表1).
表1 1999~2013建筑施工事故統(tǒng)計(jì)數(shù)據(jù)Tab.1 Construction accident statistics from 1999 to 2013
以1999-2010年全國(guó)建筑施工事故百萬(wàn)元產(chǎn)值死亡率為樣本建立單項(xiàng)預(yù)測(cè)模型,以2011-2013年數(shù)據(jù)作為模型預(yù)測(cè)精度的檢驗(yàn),其擬合與預(yù)測(cè)曲線如圖1所示.從圖1可看出,樣本數(shù)據(jù)呈現(xiàn)明顯的非線性,因此所有的線性預(yù)測(cè)模型都不予考慮.
圖1 各預(yù)測(cè)模型的百萬(wàn)元產(chǎn)值死亡率擬合與預(yù)測(cè)曲線Fig.1 Fitted and forecasted curves of mortality of per million output value using different models
應(yīng)用SPSS軟件對(duì)樣本數(shù)據(jù)進(jìn)行曲線估計(jì),其中指數(shù)曲線所建模型的判定系數(shù)R2=0.916,F(xiàn)=109.6,sig=0,模型顯著,擬合精度高[9],所得的預(yù)測(cè)模型為:其中:t為預(yù)測(cè)時(shí)間;x^t為時(shí)間t時(shí)的預(yù)測(cè)值.
利用上述模型所得計(jì)算結(jié)果見表2,其擬合平均誤差為14.36%,預(yù)測(cè)平均誤差為24.20%.?dāng)M合及預(yù)測(cè)誤差均較大,這是由實(shí)際數(shù)據(jù)與理想曲線有較大偏差造成的,因此非線性回歸的精度往往較低.
表2 各預(yù)測(cè)模型的百萬(wàn)元產(chǎn)值死亡率擬合與預(yù)測(cè)數(shù)據(jù)Tab.2 Fitted and forecasted data of mortality of per million output value using different models(人·百萬(wàn)元-1)
指數(shù)平滑法只需要?dú)v史數(shù)據(jù)資料,是一種比較簡(jiǎn)單易行、能快速地獲得結(jié)果的預(yù)測(cè)方法,三次指數(shù)平滑是在二次平滑值的基礎(chǔ)上又進(jìn)行了一次平滑,從而使其能夠跟蹤時(shí)序的非線性變化趨勢(shì)[9-10].考慮到樣本數(shù)據(jù)是非線性的時(shí)間序列,選擇三次指數(shù)平滑法對(duì)其進(jìn)行擬合.
指數(shù)平滑加權(quán)系數(shù)a代表模型對(duì)時(shí)間序列變化的反應(yīng)速度[11],本文經(jīng)過(guò)試算比較,取a=0.48.另根據(jù)經(jīng)驗(yàn)取初始平滑值為1999年百萬(wàn)元產(chǎn)值死亡率.應(yīng)用Matlab建立預(yù)測(cè)模型,所得計(jì)算結(jié)果見表2,其擬合平均誤差為31.37%,預(yù)測(cè)平均誤差為5.67%.其擬合誤差較大,預(yù)測(cè)精度較高,這是因?yàn)榍捌跀?shù)據(jù)的時(shí)序變化率較大,而后期其時(shí)序變化率逐漸趨于穩(wěn)定造成的.
灰色系統(tǒng)理論是鄧聚龍教授1982于年創(chuàng)立的[12],灰色預(yù)測(cè)方法己廣泛應(yīng)用于各個(gè)領(lǐng)域的預(yù)測(cè)之中,適合于隨時(shí)間序列變化不大的數(shù)據(jù)序列的預(yù)測(cè)[7,13].應(yīng)用Matlab建立灰色預(yù)測(cè)模型,所得計(jì)算結(jié)果見表2,其擬合平均誤差為3.68%,預(yù)測(cè)平均誤差為10.48%.其擬合精度較高,預(yù)測(cè)誤差較大,但其對(duì)2011年及2012年的預(yù)測(cè)誤差均小于5%,這與灰色預(yù)測(cè)模型預(yù)測(cè)區(qū)間較短[3]的特點(diǎn)相符合.
當(dāng)式(2)中p取1時(shí),就得到線性加權(quán)組合預(yù)測(cè)模型.建立該模型的關(guān)鍵在于確定各單項(xiàng)預(yù)測(cè)模型的權(quán)重.本文以預(yù)測(cè)誤差平方和最小為準(zhǔn)則[15-16]求解上述問(wèn)題,即:
其中:et為時(shí)間t時(shí)組合預(yù)測(cè)值與實(shí)際值的誤差;xt為時(shí)間t時(shí)的實(shí)際值;x^t為時(shí)間t時(shí)的組合預(yù)測(cè)值.
式(2)、(3)所確定的是一個(gè)具有線性約束的非線性函數(shù)最小值問(wèn)題,利用Matlab編制程序,以前述各單項(xiàng)模型的計(jì)算結(jié)果作為輸入值,可得各單項(xiàng)預(yù)測(cè)模型權(quán)重系數(shù),所得線性組合預(yù)測(cè)模型如下:
其中:x^2t為時(shí)間t時(shí)的三次指數(shù)平滑預(yù)測(cè)值;x^3t為時(shí)間t時(shí)的灰色模型預(yù)測(cè)值.所得計(jì)算結(jié)果見表2,其擬合平均誤差為5.26%,預(yù)測(cè)平均誤差為9.33%.
上述線性組合模型是式(2)中p值取1的結(jié)果,是最簡(jiǎn)單的形式.p的取值大小勢(shì)必會(huì)影響組合預(yù)測(cè)模型的精度,但如何確定p的最優(yōu)值目前還沒(méi)有一個(gè)明確的方法[15],即p取何值才能實(shí)現(xiàn)各單項(xiàng)模型的最優(yōu)組合依然有待研究.然而,如果能夠在避開p取值問(wèn)題的同時(shí)有效利用各單項(xiàng)模型的信息,就能從另一個(gè)角度進(jìn)行組合建模,而BP神經(jīng)網(wǎng)絡(luò)恰好具備實(shí)現(xiàn)這一思路的特性.
BP神經(jīng)網(wǎng)絡(luò),是基于誤差反向傳播算法的人工神經(jīng)網(wǎng)絡(luò).由于BP神經(jīng)網(wǎng)絡(luò)具有高度的非線性映射能力、有很強(qiáng)的容錯(cuò)性和很快的處理速度、強(qiáng)有力在線自學(xué)習(xí)和自適應(yīng)能力,因此它可以實(shí)現(xiàn)輸入和輸出的任意非線性映射[17-18].即在實(shí)現(xiàn)各單項(xiàng)預(yù)測(cè)模型擬合、預(yù)測(cè)值與實(shí)際值的非線性映射的同時(shí),不用考慮上述p的取值,也不用求解各單項(xiàng)預(yù)測(cè)模型在組合模型中的權(quán)重,只需確定合適網(wǎng)絡(luò)結(jié)構(gòu)以及激活和訓(xùn)練函數(shù),就能夠構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)的非線性組合預(yù)測(cè)模型.
預(yù)測(cè)模型構(gòu)建分三步:
1)輸入因子與輸出因子.將前文所構(gòu)建的三種單項(xiàng)預(yù)測(cè)模型對(duì)1999-2010年的擬合結(jié)果作為輸入因子,各年的實(shí)際百萬(wàn)元產(chǎn)值作為輸出因子,從而確定模型的輸入節(jié)點(diǎn)數(shù)為3;輸出節(jié)點(diǎn)數(shù)為1.
2)激活函數(shù)和訓(xùn)練函數(shù).激活函數(shù)采用tansig-purelin,訓(xùn)練函數(shù)選擇帶自適應(yīng)學(xué)習(xí)率和動(dòng)量的用梯度下降法的訓(xùn)練函數(shù)traingdx.網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),學(xué)習(xí)速率選為0.01,訓(xùn)練次數(shù)上限為10 000次,訓(xùn)練精度要求為 0.000 1.
3)隱含層神經(jīng)元數(shù)目.理論證明3層BP神經(jīng)網(wǎng)絡(luò),當(dāng)各層神經(jīng)元均采用S型函數(shù),可滿足任意復(fù)雜的非線性函數(shù)擬合逼近問(wèn)題[19].因此本文選擇3層BP神經(jīng)網(wǎng)絡(luò)模型,即3-j-1結(jié)構(gòu).當(dāng)前對(duì)于隱含層神經(jīng)元數(shù)目j的確定還沒(méi)有統(tǒng)一的結(jié)論,但普遍認(rèn)為增加隱含層神經(jīng)元數(shù)目可以提高模型的精度,主要的觀點(diǎn)有[20-21]:
其中:j為隱含層神經(jīng)元數(shù)目;s為輸入層節(jié)點(diǎn)數(shù);l為輸出層節(jié)點(diǎn)數(shù).
結(jié)合上述觀點(diǎn),分別取隱含層神經(jīng)元個(gè)數(shù)為10、20、30和40進(jìn)行了模擬訓(xùn)練,結(jié)果表明,只有當(dāng)隱含層神經(jīng)元個(gè)數(shù)為30個(gè)時(shí),該網(wǎng)絡(luò)的收斂速度及訓(xùn)練精度能夠滿足要求(見圖2),進(jìn)而取隱含層神經(jīng)元為29、31進(jìn)行模擬訓(xùn)練,得到與上一步相同的結(jié)論,因而最終確定的是3-30-1的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).
利用Matlab編制程序,所得計(jì)算結(jié)果見表2,其擬合平均誤差為0.46%,預(yù)測(cè)平均誤差為1.88%.
圖2 不同隱含層神經(jīng)元網(wǎng)絡(luò)訓(xùn)練結(jié)果Fig.2 The training results of neural network with different hidden layer
利用所構(gòu)建的單項(xiàng)及組合預(yù)測(cè)模型進(jìn)行計(jì)算,所得結(jié)果見表2.由表2可得以下3個(gè)主要結(jié)果.:
1)對(duì)于各單項(xiàng)預(yù)測(cè)方法而言,擬合精度較高的不一定預(yù)測(cè)精度也高,反之?dāng)M合精度較低的,也可能預(yù)測(cè)精度卻比較高.證明了各單項(xiàng)預(yù)測(cè)方法都有其自身特點(diǎn)的論點(diǎn).
2)線性組合預(yù)測(cè)模型的擬合與預(yù)測(cè)精度均較高,但其擬合精度低于灰色模型,預(yù)測(cè)精度低于三次指數(shù)平滑.證明線性組合在一定程度上綜合了各單項(xiàng)預(yù)測(cè)方法提供的信息,但并不是最優(yōu)組合模型.
3)基于BP神經(jīng)網(wǎng)絡(luò)的非線性組合預(yù)測(cè)模型的擬合及預(yù)測(cè)精度較之其它預(yù)測(cè)模型均有明顯提高.因此,該組合模型較好地綜合利用了各單項(xiàng)預(yù)測(cè)方法提供的信息,有效地提高了擬合和預(yù)測(cè)精度,將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于非線性組合預(yù)測(cè)模型的構(gòu)建是可行的.
鑒于前述,應(yīng)用基于BP神經(jīng)網(wǎng)絡(luò)的非線性組合預(yù)測(cè)模型,以1999-2013年數(shù)據(jù)為樣本,對(duì)2014-2016年全國(guó)建筑施工百萬(wàn)元死亡率進(jìn)行了預(yù)測(cè),結(jié)果見表3.
表3 2014-2016年百萬(wàn)元死亡率預(yù)測(cè)值Tab.3 Forecasted results of mortality of per million output value from 2014 to 2016
1)以提高全國(guó)建筑施工事故的預(yù)測(cè)精度為目的,根據(jù)統(tǒng)計(jì)數(shù)據(jù)的特點(diǎn),以百萬(wàn)元產(chǎn)值死亡率為預(yù)測(cè)對(duì)象,分別建立了非線性回歸模型、三次指數(shù)平滑模型、灰色預(yù)測(cè)模型,以最小誤差平方和為準(zhǔn)則建立了線性組合預(yù)測(cè)模型,基于BP神經(jīng)網(wǎng)絡(luò)建立了非線性組合預(yù)測(cè)模型.
2)擬合及預(yù)測(cè)結(jié)果證明各單項(xiàng)預(yù)測(cè)模型都有其自身特點(diǎn),均能提供部分有效信息,線性組合模型在一定程度上綜合利用了各單項(xiàng)模型的信息,但不是最優(yōu)組合模型.
3)基于BP神經(jīng)網(wǎng)絡(luò)的非線性組合較好地利用各單項(xiàng)模型所提供的信息,擬合及預(yù)測(cè)精度較其它模型均有明顯提高.證明應(yīng)用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行非線性組合建模是可行的.
4)應(yīng)用基于BP神經(jīng)網(wǎng)絡(luò)的非線性組合預(yù)測(cè)模型對(duì)2014-2016年全國(guó)建筑施工百萬(wàn)元死亡率進(jìn)行了預(yù)測(cè),結(jié)果表明,今后幾年建筑安全生產(chǎn)的發(fā)展將會(huì)較為平緩,需要從管理或技術(shù)角度進(jìn)行創(chuàng)新,以提供新的發(fā)展動(dòng)力.