王 鵬 董建房
(陸軍炮兵防空兵學(xué)院基礎(chǔ)部 合肥 230031)
近年來,隨著科技的快速發(fā)展,社會(huì)的不斷進(jìn)步,各行各業(yè)對電力供給的要求不斷提高,但是電力人員死亡事故、大規(guī)模停電事件還是不時(shí)發(fā)生,這引起了政府和公眾的注意,特別是電力人員傷亡事件更是每年在各地都有發(fā)生,極大地影響了電力的供給,而在這些電力人員傷亡事故中人因又占了90%[1],因此對電力行業(yè)的生產(chǎn)安全現(xiàn)狀進(jìn)行評估和預(yù)測成為了一件刻不容緩的工作,對電力安全的評估和預(yù)測可以為改良電力行業(yè)生產(chǎn)模式,減少電力安全事故發(fā)生數(shù)量,提高電力生產(chǎn)行業(yè)安全性提供有效參考。目前國內(nèi)外對人因事故[2~3]評估模型主要有層次分析法[4]、模糊綜合評判法[5]、貝葉斯網(wǎng)絡(luò)[6~7]等,但是這些評估方法具有太多主觀因素,而支持向量機(jī)[8~10]是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的學(xué)習(xí)方法,SVM 的原則是實(shí)現(xiàn)結(jié)構(gòu)風(fēng)險(xiǎn)最小化,因此SVM 在小樣本、非線性問題中表現(xiàn)突出,而電力人因事故每年的發(fā)生次數(shù)并不是很多,但是每次發(fā)生都影響廣泛,造成極嚴(yán)重的后果,而利用一般的方法如線性規(guī)劃等對電力人因事故進(jìn)行預(yù)測效果并不理想,但是支持向量機(jī)完美契合了電力人事故的特點(diǎn),因此選用支持向量機(jī)對電力人因事故進(jìn)行預(yù)測比較合適。所以,為對電力行業(yè)安全生產(chǎn)情況進(jìn)行預(yù)測,本文基于蟻群算法優(yōu)化的支持向量機(jī)建立了電力人因事故數(shù)量預(yù)測模型,并且根據(jù)全國2009 年~2018 年10 年內(nèi)的電力人因事故數(shù)據(jù),進(jìn)行評估和預(yù)測,達(dá)到了較好的預(yù)測精度。
支持向量機(jī)[11]的工作目標(biāo)是最大化不同類別之間的間隔,使得支持向量機(jī)的分類具有更高的可信度和泛化能力。支持向量是指在支持向量機(jī)分類過程中那些靠近邊界的數(shù)據(jù)點(diǎn)。支持向量機(jī)的目標(biāo)是尋找一個(gè)最優(yōu)超平面,這個(gè)最優(yōu)超平面能夠正確地分割正類和負(fù)類樣本。最優(yōu)超平面ωT x+b=0 可通過做一個(gè)非線性映射得到。當(dāng)樣本集線性可分時(shí),尋優(yōu)問題為
當(dāng)樣本集線性不可分時(shí),加入松弛變量ξi>0和懲罰因子C,它代表了對離群點(diǎn)的容忍程度,因此,式(1)成為凸二次規(guī)劃問題:
為解決線性不可分問題,通常方法是尋找核函數(shù)[12~13]。將一個(gè)低維的樣本集向高維空間做映射,在這個(gè)過程中找到的一種函數(shù),它能夠使得樣本集在低維空間與高維空間的內(nèi)積結(jié)果一致,這種函數(shù)稱為核函數(shù)。常用的核函數(shù)有高斯徑向基核函數(shù)、多項(xiàng)式核函數(shù)等。
引入核函數(shù)k(xi,xj)和拉格朗日乘子αi,可以將式(2)變?yōu)槿缦滦问剑?/p>
本文選用應(yīng)用較為廣泛的徑向基核函數(shù),其表達(dá)式為
其中g(shù)為核參數(shù),代表了徑向基核函數(shù)作用的寬度,C為懲罰因子,因此,為使得本文的電力人因事故數(shù)量預(yù)測模型更加精確,必須要選擇合適的參數(shù)。
蟻群算法是一種主要用于尋找最優(yōu)路徑的算法,作為一種仿生算法,它主要運(yùn)用了正反饋和分布式計(jì)算的特征進(jìn)行搜索[14],是一種貪婪式啟發(fā)式的優(yōu)化算法。利用上述特點(diǎn),本文利用蟻群算法[15~16]來選擇合適的參數(shù),優(yōu)化參數(shù)的選擇過程,建立精度更高的的電力人因事故數(shù)量預(yù)測模型。結(jié)合傳統(tǒng)的支持向量機(jī)和蟻群算法,建立基于改進(jìn)支持向量機(jī)的電力人因事故預(yù)測回歸模型,目標(biāo)函數(shù)為
其中l(wèi)為樣本的數(shù)量;yi為實(shí)際值;f(xi)為預(yù)測值。
蟻群算法的具體搜索方法如下:1)初始化相關(guān)參數(shù);2)生成節(jié)點(diǎn)及路徑;3)迭代搜索;4)終止。
以我國2009 年~2018 年電力人因事故死亡人數(shù)為例,運(yùn)用改進(jìn)的支持向量機(jī)進(jìn)行電力人因事故死亡人數(shù)預(yù)測,使用Matlab 軟件進(jìn)行運(yùn)算,過程如下。
步驟一:數(shù)據(jù)歸一化。為更加方便地進(jìn)行對比和運(yùn)算,利用本文的模型得到更加精準(zhǔn)的預(yù)測結(jié)果,對統(tǒng)計(jì)得到的數(shù)據(jù)進(jìn)行歸一化,可得到處理結(jié)果如表1所示。
表1 事故死亡人數(shù)歸一化
步驟二:利用蟻群算法優(yōu)化參數(shù)選擇路徑。利用蟻群算法對本文的支持向量機(jī)預(yù)測模型進(jìn)行參數(shù)優(yōu)化,首先初始化相關(guān)參數(shù):c取值為(0.01,200),ε取值為(0,0.8),σ取值為(0.001,100);m=50 ,Nmax=500 ,ρ=0.7 ,α=1 ,β=5 ,Q=100。利用計(jì)算軟件Matlab 進(jìn)行計(jì)算,可得到最優(yōu)訓(xùn)練參數(shù)。
步驟三:將上一步驟中得到的最優(yōu)參數(shù)代入回歸方程,可以得到電力人因事故死亡人數(shù)預(yù)測結(jié)果如表2。
表2 ACA-SVM預(yù)測結(jié)果
為了確定本文提出的基于優(yōu)化支持向量機(jī)的電力人因事故預(yù)測模型的正確性,本文利用傳統(tǒng)的支持向量機(jī)方法對同樣的數(shù)據(jù)樣本進(jìn)行回歸計(jì)算,得到了預(yù)測結(jié)果。為更加直觀地對比兩種預(yù)測結(jié)果,本文使用相對誤差來判斷兩種方法的預(yù)測精度。對于從傳統(tǒng)支持向量機(jī)模型,選擇最優(yōu)參數(shù)后,代入模型,可得到預(yù)測結(jié)果如表3所示。
表3 ACA-SVM與SVM對比結(jié)果
為方便進(jìn)行對比分析,將人因事故的實(shí)際值、ACA-AVM 的預(yù)測值、SVM 的預(yù)測值做成對比圖,如圖1 所示。圖2 為ACA-AVM、SVM 的兩種方法進(jìn)行預(yù)測的相對誤差。
圖1 預(yù)測值對比
圖2 相對誤差對比
由表對比可知,使用蟻群算法優(yōu)化的支持向量機(jī)對電力人因事故預(yù)測精度比單純使用支持向量機(jī)高,這說明使用蟻群算法優(yōu)化的支持向量機(jī)可以較為準(zhǔn)確地預(yù)測近年的電力人因事故數(shù),從而為電力行業(yè)的發(fā)展提供一定的依據(jù)。
在對比完成后,利用蟻群算法優(yōu)化的支持向量機(jī)對2019 年、2020 年的電力安全人因事故數(shù)量進(jìn)行預(yù)測,得到結(jié)果為67、84,雖然因?yàn)殡娏θ艘蚴鹿蕿樾颖镜脑?,可能預(yù)測精度不是很高,也可能會(huì)發(fā)生很大的誤差,但是根據(jù)上文實(shí)驗(yàn)的相對誤差情況分析,支持向量機(jī)的預(yù)測結(jié)果還是具有一定參考價(jià)值的。分析10 年來的電力人因事故數(shù)量,從2009 年~2018 年電力人因事故數(shù)量呈現(xiàn)波浪狀起伏態(tài)勢,2017、2018 兩年電力人因事故數(shù)量很少,所以2019、2020 年事故數(shù)量上升是有一定意義的。
1)支持向量機(jī)建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上,在小樣本、高維、非線性問題上表現(xiàn)突出。因此作者利用SVM 構(gòu)建了電力人因事故數(shù)據(jù)統(tǒng)計(jì)模型,用該模型能夠較為準(zhǔn)確地預(yù)測電力人因事故次數(shù),能夠增加管理部門決策的科學(xué)性和準(zhǔn)確性。
2)兩種不同預(yù)測模型的對比結(jié)果顯示,基于蟻群算法的支持向量機(jī)電力人因事故預(yù)測模型預(yù)測精度更高,誤差更小,可以用來進(jìn)行電力人因事故預(yù)測,在實(shí)際生產(chǎn)生活中具有一定的應(yīng)用價(jià)值。