鐘燕華
(上海震旦職業(yè)學(xué)院, 上海 201908)
目前,我國(guó)正在進(jìn)行世界上規(guī)模最大的基礎(chǔ)設(shè)施建設(shè),建筑業(yè)已成為國(guó)民經(jīng)濟(jì)發(fā)展的支柱產(chǎn)業(yè)之一,對(duì)經(jīng)濟(jì)可持續(xù)發(fā)展發(fā)揮著重大作用。國(guó)家每年對(duì)基本建設(shè)的投入約占國(guó)民生產(chǎn)總值的15%左右,建筑業(yè)從業(yè)人數(shù)約占全國(guó)總從業(yè)人數(shù)的1/3[1]。由于作業(yè)條件復(fù)雜、高空作業(yè)多等特點(diǎn),建筑業(yè)是僅次于礦業(yè)的高危行業(yè)。因此,做好建筑業(yè)的安全管理工作越來越緊迫。建筑施工事故預(yù)測(cè)可為企業(yè)制定安全生產(chǎn)目標(biāo)和安監(jiān)部門宏觀決策提供依據(jù),是加強(qiáng)安全管理工作的有效途徑[2]。
傳統(tǒng)的施工事故預(yù)測(cè)方法有灰色預(yù)測(cè)方法、神經(jīng)網(wǎng)絡(luò)及其改進(jìn)算法等[3-5]。灰色預(yù)測(cè)法對(duì)呈指數(shù)變化趨勢(shì)的原始樣本擬合較好,但是對(duì)于數(shù)值波動(dòng)比較大的樣本無能為力。神經(jīng)網(wǎng)絡(luò)由于存在網(wǎng)絡(luò)結(jié)構(gòu)難以確定、過擬合等問題,給實(shí)際應(yīng)用帶來一定困難。最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)能夠避免神經(jīng)網(wǎng)絡(luò)過擬合和標(biāo)準(zhǔn)支持向量機(jī)訓(xùn)練耗時(shí)長(zhǎng)的問題,泛化能力強(qiáng)[6-9]。LSSVM建模中,模型參數(shù)對(duì)預(yù)測(cè)精度有很大影響。粒子群算法(particle swarm optimization,PSO)是一種智能隨機(jī)優(yōu)化算法,具有很強(qiáng)的全局搜索能力,非常適合于LSSVM參數(shù)優(yōu)化。
本文采用PSO算法優(yōu)化LSSVM向量參數(shù),在此基礎(chǔ)上構(gòu)建建筑施工事故預(yù)測(cè)的PSO-LSSVM模型,并通過仿真實(shí)驗(yàn)對(duì)模型進(jìn)行驗(yàn)證。
對(duì)一組訓(xùn)練樣本集D={(xk,yk)|k=1,2,…,N},其中xk∈Rn,yk∈R,xk表示輸入向量,yk表示輸出數(shù)據(jù),n為訓(xùn)練樣本數(shù)。在特征空間中LSSVM模型可表示為[10-11]:
y=wTφ(x)+b
(1)
式中:φ(·)表示非線性映射函數(shù);w表示特征空間的權(quán)向量;b表示偏置量。
根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,最小二乘支持向量機(jī)的函數(shù)估計(jì)問題可描述為:
(2)
約束條件為:
yk=wTφ(xk)+b+ek
(3)
構(gòu)建非線性映射函數(shù)的目的是提取原始空間的特征,將原始空間中的樣本映射到高維空間,從而解決原始空間中的線性不可分問題。根據(jù)式(2),可定義拉格朗日函數(shù)如下:
L(w,b,e;α)=J(w,e)-
(4)
式中αk表示拉格朗日乘子,αk∈R。
根據(jù)KKT條件,對(duì)式(4)進(jìn)行優(yōu)化,即:
(5)
(6)
其中:
y=[y1,y2,…,yN],α=[α1,α2,…,αN]
lv=[1,1,…,1],Ω=φT(xk)φ(xl)
(l=1,2,…,N)
根據(jù)Mercer條件,存在映射φ和核函數(shù)K(·,·),使:
K(xk,xl)=φT(xk)φ(xl)
(7)
由式(6)和式(7)聯(lián)立求出α和b后,得到LSSVM回歸算法的函數(shù)估計(jì)式:
(8)
式(8)取不同的核函數(shù)生成不同的支持向量,主要有B樣條核函數(shù)、多項(xiàng)式核函數(shù)和徑向基核函數(shù)(RBF)等。為了獲得最優(yōu)的核函數(shù)參數(shù)σ和誤差懲罰參數(shù)γ,減少主觀經(jīng)驗(yàn)選取參數(shù)的盲目性和重復(fù)性,本文采用PSO算法確定最優(yōu)的σ和γ。
PSO算法是由鳥類群體行為啟發(fā)而提出的一種全局優(yōu)化算法。PSO通過個(gè)體之間的協(xié)作尋求最優(yōu)解,尤其善于解決連續(xù)域優(yōu)化問題[12-17]。
PSO初始化為一群隨機(jī)粒子,通過多次迭代搜索最優(yōu)解,粒子優(yōu)劣由適應(yīng)度函數(shù)決定。每個(gè)粒子代表一個(gè)可能的解向量,通過跟蹤2個(gè)最優(yōu)解(個(gè)體最優(yōu)解、全局最優(yōu)解)來更新自己的位置和速度,實(shí)現(xiàn)全局尋優(yōu)。設(shè)粒子的位置和運(yùn)動(dòng)速度為別為X和V,d為決策變量的維數(shù),則第i個(gè)粒子的參數(shù)可表示為:
Xi=(xi1,xi2,…,xid)
Vi=(vi1,vi2,…,vid)
更新策略為:
(9)
(10)
(11)
用PSO算法優(yōu)化LSSVM參數(shù),流程如圖1所示,基本步驟如下:
步驟1 初始化PSO算法的參數(shù):群體規(guī)模、學(xué)習(xí)因子、最大迭代次數(shù)、粒子的初始位置和速度等。
步驟2 用每個(gè)粒子對(duì)LSSVM訓(xùn)練樣本進(jìn)行學(xué)習(xí),得到各粒子當(dāng)前位置的訓(xùn)練誤差,作為各粒子的適應(yīng)度值。將各粒子的當(dāng)前適應(yīng)度值與該粒子的最優(yōu)適應(yīng)度值進(jìn)行對(duì)比,如果更優(yōu),則將當(dāng)前位置作為該粒子的最優(yōu)位置。
步驟3 用式(11)計(jì)算慣性權(quán)重,用式(9)、式(10)更新粒子的速度和位置。
步驟4 判斷是否滿足尋優(yōu)終止條件(設(shè)定的最大迭代次數(shù)或精度),如果滿足則求出最優(yōu)解,如果不滿足則轉(zhuǎn)至步驟2。
圖1 PSO優(yōu)化LSSVM參數(shù)的基本流程
LSSVM對(duì)0到1之間的數(shù)據(jù)學(xué)習(xí)效果最佳,為此,在進(jìn)行機(jī)器學(xué)習(xí)之前首先將原始樣本用下式進(jìn)行歸一化處理:
(12)
式中:xi表示原始樣本;ximax、ximin分別為原始樣本的最大值和最小值,
最后,對(duì)建筑施工事故預(yù)測(cè)結(jié)果進(jìn)行反歸一化處理,即:
(13)
對(duì)于一組給定的樣本序列:
{x1,x2,…,xN}
假定已知x(t),預(yù)測(cè)x(t+1),可建立映射函數(shù):
f∶Rm→R
于是
(14)
LSSVM預(yù)測(cè)器的拓?fù)浣Y(jié)構(gòu)如圖2所示。
LSSVM預(yù)測(cè)器的待優(yōu)化參數(shù)為γ、σ,即:
(15)
參數(shù)優(yōu)化的目的是提高預(yù)測(cè)精度,構(gòu)建訓(xùn)練樣本的適應(yīng)度函數(shù):
(16)
圖2 LSSVM預(yù)測(cè)器的拓?fù)浣Y(jié)構(gòu)
通常表征預(yù)測(cè)結(jié)果精度的指標(biāo)有:平均絕對(duì)值相對(duì)誤差(MAPE)、均方根誤差(RMSE)和相對(duì)誤差(RE)等。本文采用預(yù)測(cè)結(jié)果的MAPE作為預(yù)測(cè)精度評(píng)價(jià)指標(biāo)[18]:
(17)
本文預(yù)測(cè)樣本來源于文獻(xiàn)[4]建筑施工事故數(shù)據(jù)。選擇嵌入維數(shù)為5,將原始樣本分為11組。前9組為訓(xùn)練樣本,用于構(gòu)建LSSVM預(yù)測(cè)器,后2組為預(yù)測(cè)樣本,用于檢驗(yàn)PSO-LSSVM預(yù)測(cè)能力。
選取核函數(shù)為RBF核函數(shù),用LSSVM將重構(gòu)的建筑施工事故訓(xùn)練樣本進(jìn)行訓(xùn)練。
PSO參數(shù)設(shè)置為:種群數(shù)N=30,最大迭代次數(shù)為Gmax=100,學(xué)習(xí)因子c1=1.5,c2=1.5,慣性權(quán)重ω=0.7。在Matlab R2011a環(huán)境下優(yōu)化PSO-LSSVM模型,得到最優(yōu)的寬度參數(shù)σ2=0.34,誤差懲罰參數(shù)γ=151。
PSO對(duì)LSSVM參數(shù)的尋優(yōu)過程如圖3所示。從圖3中可以看出:PSO對(duì)LSSVM的尋優(yōu)速度很快,經(jīng)過不到20次迭代基本能夠得到最優(yōu)的LSSVM參數(shù)。
圖3 PSO參數(shù)尋優(yōu)過程
得到最優(yōu)的模型參數(shù)后,對(duì)建筑施工事故訓(xùn)練樣本進(jìn)行訓(xùn)練,結(jié)果如圖4所示。從圖4中可以看出:PSO-LSSVM輸出值和真實(shí)值基本重合,說明建模精度非常高。
圖4 建筑施工事故的PSO-LSSVM訓(xùn)練結(jié)果
用訓(xùn)練好的PSO-LSSVM模型對(duì)建筑施工事故進(jìn)行預(yù)測(cè),同時(shí)與文獻(xiàn)[4]進(jìn)行對(duì)比,結(jié)果見表1。
表1 建筑施工事故的PSO-LSSVM預(yù)測(cè)結(jié)果
從表1可以看出:PSO-LSSVM對(duì)2008年、2009年的預(yù)測(cè)結(jié)果相對(duì)誤差均小于5%,能夠滿足工程精度要求,計(jì)算得MAPE(PSO-LSSVM)=2.99%,相比同類文獻(xiàn)算法MAPE(灰色馬爾可夫)=4.62%而言,PSO-LSSVM對(duì)建筑施工事故預(yù)測(cè)的精度更高,更具先進(jìn)性。
1) 建筑施工事故具有影響因素錯(cuò)綜復(fù)雜、少樣本、隨機(jī)波動(dòng)大的特點(diǎn),用傳統(tǒng)預(yù)測(cè)方法很難進(jìn)行準(zhǔn)確建模,并且計(jì)算較為復(fù)雜。
2) LSSVM對(duì)隨機(jī)波動(dòng)較大的樣本具有較大優(yōu)勢(shì)、泛化能力強(qiáng)。粒子群算法能夠運(yùn)用于LSSVM參數(shù)尋優(yōu)中,并且計(jì)算簡(jiǎn)單、運(yùn)算速度快,仿真案例驗(yàn)證了2種算法的綜合優(yōu)勢(shì)。
3) 預(yù)測(cè)結(jié)果表明,采用PSO-LSSVM的平均絕對(duì)值相對(duì)誤差為2.99%,并且每年的預(yù)測(cè)相對(duì)誤差都低于5%,能夠滿足工程應(yīng)用要求,充分說明了本文所提方法的有效性。
4) 本文借用同類文獻(xiàn)的數(shù)據(jù),時(shí)效性稍差,但不影響說明所建預(yù)測(cè)模型的正確性和所用方法的先進(jìn)性。