劉延霞,李建剛,任子暉
(中國礦業(yè)大學(xué) 信息與電氣工程學(xué)院,江蘇 徐州 221116)
煤礦主通風(fēng)機(jī)是很多工礦企業(yè)生產(chǎn)活動中的關(guān)鍵設(shè)備,其平穩(wěn)可靠地運行對企業(yè)的安全生產(chǎn)以及社會和經(jīng)濟(jì)效益起著至關(guān)重要的作用.及時準(zhǔn)確的對通風(fēng)機(jī)早期故障進(jìn)行預(yù)測和診斷不僅可以提高設(shè)備的穩(wěn)定性和安全性,也是防止和減少重大事故發(fā)生的一種重要途徑.近年來,人們將人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)應(yīng)用于設(shè)備故障診斷,由于ANN是一種模仿人腦神經(jīng)元結(jié)構(gòu)而演算出來的一種具有良好記憶、學(xué)習(xí)、聯(lián)想功能以及自適應(yīng)性的數(shù)學(xué)模型,具備以任意精確精度逼近任何連續(xù)非線性網(wǎng)絡(luò)的能力,這為風(fēng)機(jī)故障診斷開辟了新的途徑,但很多神經(jīng)網(wǎng)絡(luò)訓(xùn)練和學(xué)習(xí)是建立在大量的故障數(shù)據(jù)和經(jīng)驗知識基礎(chǔ)上,在實際生產(chǎn)過程中很難得到大量的訓(xùn)練樣本,這將影響診斷結(jié)果的可靠性和精確度.支持向量機(jī) (Support Vector Machine,SVM) 是在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)之上發(fā)展起來的,它是基于結(jié)構(gòu)風(fēng)險最小化原理,不同于基于經(jīng)驗風(fēng)險最小化原理的神經(jīng)網(wǎng)絡(luò)方法,適合小樣本情況下機(jī)器的學(xué)習(xí),克服機(jī)械故障診斷中廣泛存在典型故障數(shù)據(jù)不足的問題[1].本文采用最小二乘支持向量機(jī)(LS-SVM)算法進(jìn)行通風(fēng)機(jī)的故障診斷研究.
進(jìn)行機(jī)器學(xué)習(xí)的原因是想根據(jù)現(xiàn)場或者已有的采樣樣本得到研究設(shè)備或者研究系統(tǒng)的輸入輸出關(guān)系模型,從而達(dá)到對未來數(shù)據(jù)進(jìn)行預(yù)測的目的,機(jī)器學(xué)習(xí)可以用以下數(shù)學(xué)關(guān)系式進(jìn)行描述:對于m個獨立并且同分布的的先驗采樣樣本集,如下面所表示:
(1)
其中R(w)為期望的風(fēng)險,就是使風(fēng)險最小化的含義也就是建立輸入輸出的關(guān)系時使得錯誤率最小,F(x,y)為m個獨立并且同分布先驗采樣樣本的聯(lián)合分布概率,L(y,f(x,w))稱損失函數(shù),是指在一個樣本空間中一個元素映射到一個表達(dá)式.
圖1 二維情況下最優(yōu)分類面示意圖
支持向量機(jī)(SVM)就是根據(jù)上述的統(tǒng)計學(xué)習(xí)理論中的結(jié)構(gòu)風(fēng)險最小化原則提出的,它一方面能提高學(xué)習(xí)機(jī)器的推廣性能,另一方面支持向量機(jī)本質(zhì)上屬于一種凸二次優(yōu)化的問題,并且它自身能保證找到的極值解就是要求解的全局最優(yōu)解,使得它成為一種非常好的基于樣本數(shù)據(jù)的機(jī)器學(xué)習(xí)算法[2].SVM的理論首先是從最優(yōu)分類面問題的分析開始的,如圖1所示.圖1中分別用方塊以及空心表示兩類不同的數(shù)據(jù)采樣樣本,其中H是兩類樣本的最優(yōu)分類線.超平面可以簡單表示為(w,b),滿足下面的情況.
yi(w·xi+b)≥0i=1,2…n
(2)
因此,最優(yōu)分類面問題可以表示成如下的約束優(yōu)化問題,即求如下函數(shù)的最小值:
(3)
定義如下的Lagrange函數(shù):
(4)
在式(4)中,αi≥0且被稱作Lagrange乘子.為了計算上述Lagrange函數(shù)式最小值,需要對w、b、αi三個參量進(jìn)行偏微分求解并使得偏微分結(jié)果等于0,于是問題就轉(zhuǎn)化為凸二次優(yōu)化的對偶問題:
(5)
將支持向量(xi,yi)、w*以及αi帶入約束條件αi[yi(w·xi+b)-1]=0求解即可,最后解得的最優(yōu)分類面函數(shù)[3]如下:
(6)
支持向量分類機(jī)求解的是二次規(guī)劃問題,約束條件是不等式,而最小二乘支持向量(LS-SVM)分類機(jī)的原始問題是在等式的約束條件下,然后通過求解對偶問題可得問題解為一系列線性方程組的解[4].
由Lagrange數(shù)乘法可得與式(5)對偶的線性方程組:
(7)
其中,Y=(y1,…,yl)T,α=(α1,…,αl)為Lagrange乘子向量,I=(1,…,1)T,Ω=[yiyjK(xi,xj)]l×l,K(xi,xj)=φ(xi)·φ(xj),K(·)是需要事先選定的滿足Mercer條件的核函數(shù).
(8)
對應(yīng)于原始問題的分類面和分類決策函數(shù)分別為:
(9)
(10)
這樣,最小二乘支持向量機(jī)只需求解一個線性方程組就可得到分類面,比起標(biāo)準(zhǔn)的支持向量機(jī)需求二次規(guī)劃問題要簡單的多,且存儲量得以減少,訓(xùn)練速度得以提高.本文在風(fēng)機(jī)故障診斷方法上采用了最小二乘支持向量機(jī).
風(fēng)機(jī)電機(jī)轉(zhuǎn)子振動是反映系統(tǒng)整體及其變化規(guī)律的主要信號,蘊含著豐富的故障征兆信息. 本設(shè)計所監(jiān)控風(fēng)機(jī)常見故障類型主要有喘振、質(zhì)量不對中、喘振、油膜振蕩4種類型.在這些故障發(fā)生時,會伴隨溫度升高、雜音、強(qiáng)烈振動等現(xiàn)象.通過現(xiàn)場安裝的速度傳感器采集到的振動信號在10個主要頻段上的譜峰能量值的改變對應(yīng)了上述4種故障參數(shù)的變化.
在對總頻譜能量進(jìn)行了歸一化處理后,要對采樣樣本數(shù)據(jù)的泛化,即計算各頻段能量占總能量的百分比以及總的頻譜能量. 由于文中分析了4種常見風(fēng)機(jī)故障,對于支持向量機(jī)來說,也就是存在著4種類別,即1、2、3、4,分別代表著喘振、質(zhì)量不對中、氣動力偶、油膜振蕩4種典型故障[5].
表1 部分樣本數(shù)據(jù) (10-4)
由于試驗中采用的故障診斷樣本數(shù)不是特別多,此處采用留一交叉驗證法來評價分類器的泛化性能.將已標(biāo)記的G個樣本每次取出第g個樣本,剩下的G-1個樣本訓(xùn)練分類器,用構(gòu)造的分類器測試樣本g,如此重復(fù)G次,統(tǒng)計錯分樣本數(shù)G*,記分類器的正確率(擬合精度)為r=1-G*/G,然后將訓(xùn)練好的分類器用于分類未標(biāo)記的樣本,r越大,表明分類器的分類泛化能力越強(qiáng).
表2 不同核函數(shù)下的仿真結(jié)果
由于風(fēng)機(jī)的故障診斷屬于多分類情況,在本文的Matlab仿真中采用了支持向量機(jī)的一對多多分類算法,核函數(shù)采用了線性核函數(shù)、徑向基核函數(shù)以及多項式函數(shù),松弛因子選擇1×10-4,線性核函數(shù)下的懲罰因子初始值選擇4,徑向基核函數(shù)的懲罰因子初始值為5,σ=2,多項式函數(shù)懲罰因子初始值選擇20,p=4,采用上文提到的交叉驗證法進(jìn)行懲罰因子以及核函數(shù)參數(shù)的優(yōu)化,其仿真結(jié)果如表2.
表3 基于LS-SVM的部分診斷結(jié)果
注:上述數(shù)據(jù)都是×10-4,W2表示這組應(yīng)該屬于第2分類,但是分類錯誤,W3、W4解釋同W2.
由表2可以看出,采用三種核函數(shù)的效果相當(dāng),而基于線性核函數(shù)和多項式核函數(shù)的分析結(jié)果稍微好于基于徑向基核函數(shù)的結(jié)果,本文中選用了線性核函數(shù),線性核函數(shù)下部分診斷結(jié)果如表3所表示:
為了更好評價基于最小二乘支持向量機(jī)分類器的風(fēng)機(jī)故障診斷方法,本設(shè)計進(jìn)一步采用三層BP神經(jīng)網(wǎng)絡(luò)對故障進(jìn)行分類,進(jìn)而和基于最小二乘支持向量機(jī)的分類結(jié)果做比較.
由特征量的提取理論知識可知,本文選擇了10個特征量,并且有4個分類結(jié)果,所以BP神經(jīng)網(wǎng)絡(luò)采用了10個輸入節(jié)點,4個輸出節(jié)點,而隱含層節(jié)點的選擇則應(yīng)用美國科學(xué)家Hebb提出的公式選取法,如式(11)所示.
t=(n+m)0.5+δ
(11)
其中t是隱含層節(jié)點數(shù)、n是輸入節(jié)點數(shù)、m是輸出節(jié)點數(shù)、δ是1~10之間的數(shù),這里δ選擇5,所以,隱含層節(jié)點數(shù)選擇為9個,而輸入層到隱含層選擇tanSig函數(shù),隱含層到輸出層選擇purelin函數(shù),期望誤差選擇0.005,最大訓(xùn)練次數(shù)5000次,初始學(xué)習(xí)速率0.05,初始權(quán)值和閾值由matlab的神經(jīng)網(wǎng)絡(luò)初始化函數(shù)自動選取[6].
表4 基于BP神經(jīng)網(wǎng)絡(luò)的部分診斷結(jié)果
注:A1表示喘振,A2質(zhì)量不對中,A3氣動力偶,A4油膜振蕩,R表示正確,W錯誤
經(jīng)過測試,三層BP神經(jīng)網(wǎng)絡(luò)的正確診斷結(jié)果為92%,75組數(shù)據(jù)有6組驗證錯誤,而選用線性核函數(shù)的支持向量機(jī)正確診斷結(jié)果為96%,雖然只有4%的差別,但仍然可以看出本文選用的基于最小二乘支持向量機(jī)分類器的風(fēng)機(jī)故障診斷方法還是好于基于三層BP神經(jīng)網(wǎng)絡(luò)的診斷方法[7]. 部分BP神經(jīng)網(wǎng)絡(luò)測試樣本診斷結(jié)果如上表所示.
本文在提取了四類風(fēng)機(jī)故障的頻域特征量后,采用了最小二乘支持向量機(jī)分類器對故障進(jìn)行了分類,并且對比了不同核函數(shù)下的分類效果,最后與三層BP神經(jīng)網(wǎng)絡(luò)的診斷效果進(jìn)行了對比.由于LS-SVM在有限容量樣本的情況下很容易計算出現(xiàn)有信息的最優(yōu)解而不是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在樣本數(shù)趨于無窮大時取得最優(yōu)值,以結(jié)構(gòu)風(fēng)險最小化代替經(jīng)驗風(fēng)險最小化,有效地克服了風(fēng)機(jī)故障樣本較少的這一難題.在進(jìn)行風(fēng)機(jī)振動信息故障診斷時,增強(qiáng)了樣本模型的收斂性,縮短了訓(xùn)練時間,提高了系統(tǒng)識別的精度.實驗結(jié)果達(dá)到了預(yù)期的目標(biāo),仿真結(jié)果驗證了LS-SVM能夠很好地對風(fēng)機(jī)故障進(jìn)行分類,說明了SVM故障診斷的正確性.LS-SVM算法專門針對樣本數(shù)量少的情況,將實際故障樣本通過非線性變換映射到高維的特征空間,在小樣本情況下很好的達(dá)到分類推廣的目的,所以在機(jī)械故障診斷方法這一領(lǐng)域支持向量機(jī)算法具有很好的應(yīng)用前景.
參考文獻(xiàn):
[1]周德廉,過威克.小波包分析方法在齒輪箱振動信號處理中的應(yīng)用[J].徐州師范大學(xué)學(xué)報,2002,20(4):57-59.
[2]張雨,徐小林,張建華.設(shè)備狀態(tài)監(jiān)測與故障診斷的理論和實踐[M].北京:國防科技大學(xué)出版社,2000.
[3]盛兆順,尹琦嶺.設(shè)備狀態(tài)監(jiān)測與故障診斷技術(shù)及應(yīng)用[M].北京:化學(xué)工業(yè)出版社,2003.
[4]曹志彤,陳宏平,何國光.電機(jī)故障診斷支持向量機(jī)[J].儀器儀表學(xué)報,2004,25(6): 738-741.
[5]Cristianinin,Taylojs. 支持向量機(jī)導(dǎo)論[M]. 北京: 電子工業(yè)出版社,2004.
[6]Poyhonen,Negrea M. Fault diagnostics of an electrical machine with multiple support vector classifiers[R]. Proc of the 2002 IEEE international symposium on intelligent control vancouver,Canada: 2002.
[7]翟永杰,王東風(fēng),韓璞.基于多類支持向量機(jī)的汽輪發(fā)電機(jī)組故障診斷[J].動力工程,2003,23(5):94-98.