柴美娟,柳桂國
(浙江工商職業(yè)技術(shù)學(xué)院設(shè)備與設(shè)備管理辦公室,浙江寧波 315012)
根據(jù)統(tǒng)計數(shù)據(jù)表明約有30%的滾動機械事故是由滾動軸承故障引發(fā)[1],故作為滾動機械重要部件之一的滾動軸承,其性能直接影響著整個機械裝置的性能,滾動軸承一旦發(fā)生故障,勢必對整個機械造成損壞或停機,甚至造成人員傷亡事故,滾動軸承技術(shù)水平直接影響著機械行業(yè)的發(fā)展。目前,我國的滾動軸承行業(yè)發(fā)展迅速,市場需求不斷擴大,但生產(chǎn)的滾動軸承大多為中低端產(chǎn)品,高質(zhì)量產(chǎn)品主要依賴進口。滾動軸承行業(yè)這一現(xiàn)象的根本原因主要是缺少先進的檢測和分析技術(shù)[2]。因此,對滾動軸承故障診斷方法進行研究具有一定的價值。
隨著滾動軸承生產(chǎn)技術(shù)的發(fā)展,解析模型方法作為一種傳統(tǒng)的滾動軸承故障診斷方法,已不適合解決越來越復(fù)雜的系統(tǒng)[3-4]。與其相比,以傳統(tǒng)統(tǒng)計學(xué)為基礎(chǔ)的基于數(shù)據(jù)學(xué)習(xí)的智能和信號處理方法,在處理復(fù)雜系統(tǒng)時表現(xiàn)出較大優(yōu)勢[5-6],但其需要的樣本數(shù)目較大。而在實際的滾動軸承故障診斷采的樣本集往往有限。Vapnik V N于1995提出的支持向量機(Support Vector Machines,SVM[7])是一種基于結(jié)構(gòu)風(fēng)險最小化準(zhǔn)則的新統(tǒng)計學(xué)理論,該方法對小樣本、非線性以及高維問題有較大優(yōu)勢。正是基于該算法的這一特點,李凌均在2002年將SVM應(yīng)用于機械故障診斷中[8],獲得了較好的效果。在最小二乘支持向量機(LS_SVM)的基礎(chǔ)上,萬書亭教授于2009年提出基于LS_SVM的滾動軸承故障診斷方法[9],并驗證了該算法在保證了正確率的同時,還降低了計算復(fù)雜度,縮短了訓(xùn)練時間,該算法利用的是已知故障類型的有標(biāo)簽樣本,屬于監(jiān)督式學(xué)習(xí)方法。
在實際的滾動軸承故障診斷應(yīng)用中,大量統(tǒng)計樣本的故障類型是未知的,即訓(xùn)練集中不單含有標(biāo)簽樣本,同時還含有大量無標(biāo)簽樣本。而同時利用有標(biāo)簽樣本和無標(biāo)簽樣本的半監(jiān)督學(xué)習(xí)方法[10-11],理論上可以彌補基于LS_SVM的滾動軸承故障診斷方法的不足。文中將半監(jiān)督學(xué)習(xí)與LS_SVM相結(jié)合,給出一種基于LS_SVM的半監(jiān)督學(xué)習(xí)滾動軸承故障診斷新方法(SLS_SVM),該方法充分利用了訓(xùn)練集中的有標(biāo)簽樣本和無標(biāo)簽樣本所蘊含的信息,既具有LS_SVM的優(yōu)點,縮短訓(xùn)練所需時間,也具有半監(jiān)督學(xué)習(xí)的優(yōu)點,利用無標(biāo)簽樣本,改善分類器的正確率,在實際的滾動軸承故障診斷應(yīng)用中,表現(xiàn)出有較好的性能。
LS_SVM是將正則化理論應(yīng)用于標(biāo)準(zhǔn)的SVM中的一種算法,該方法基本思想為:在標(biāo)準(zhǔn)SVM算法基礎(chǔ)上,損失函數(shù)則采用LS線性系統(tǒng),即優(yōu)化指標(biāo)采用平方項,提出數(shù)據(jù)中隱含的信息,并將SVM中的不等式約束轉(zhuǎn)化為等式約束問題,故將二次規(guī)劃的參數(shù)求解問題轉(zhuǎn)變成解線性方程組問題,使計算復(fù)雜性降低,提高了計算速度,由于LS在求解不一致問題時,最小化誤差平方之和,這就提高了 LS_SVM算法精度。
LS_SVM應(yīng)用于滾動軸承故障診斷的兩類分類算法描述過程如下:
預(yù)先統(tǒng)計出一個滾動軸承故障診斷訓(xùn)練集{(xi,yi),i=1,2,…,N},其中(xi,yi)為第 i個樣本,yi∈{-1,+1}為一維輸出類別,xi為n維輸入訓(xùn)練向量,N為訓(xùn)練集中含有的樣本數(shù)。LS_SVM算法的目標(biāo)是確定一個超平面y(x),將訓(xùn)練集分成兩類:
其中,當(dāng)ωTφ(x)+b為正時,符號函數(shù)sign(·)為1,即y(x)=+1,反之為-1;ω為超平面法向量,b為超平面偏置常量,這兩個參數(shù)都是待估計的未知參數(shù)。而非線性映射函數(shù)φ(x)將訓(xùn)練樣本映射到高維特征空間,以線性不可分問題,即將原訓(xùn)練集映射到高維特征空間進行線性分類。
根據(jù)結(jié)構(gòu)分先最小化原理,將其表示成一個等式約束優(yōu)化問題,即可通過優(yōu)化如下目標(biāo)函數(shù),獲取LS_SVM的未知參數(shù)ω,b
其中,ei∈RN×1為誤差向量;γ≥0 為正則化參數(shù)。
為求解式(2)的優(yōu)化問題,先將此約束優(yōu)化問題轉(zhuǎn)化為無約束優(yōu)化問題,故引入 Lagr-ange多項式
其中,αi是Lagrange乘子,在等式約束情況下,其值可為正或負(fù)。由KKT條件可知,上式優(yōu)化條件為
則上式可用如下線性方程組替代上式
其中,Z=[yiφ(x1),y2φ(x2),…,yNφ(xN)]T,y=[y1,y2,…,yN]T,e=[e1,e2,…,eN]T,1=[1,1,…,1]T,α =[α1,α2,…,αN]T。
經(jīng)過對上式進行消元,消除ei和ω后,在利用Mercer條件,最后形成如下矩陣形式
其中,Ω 中的元素 Ωij=yiyjφ(xi)Tφ(xj)=yiyjΨ(xi,xj),再規(guī)定 A=Ω +γ-1I,故 A 為對稱半正定矩陣,其逆矩陣 A-1存在,對線性方程組式(6)進行求解得
將式(7)中的α代入式(4)中的第一個等式,求出超平面法向量,并再將獲得的ω和式(7)中的b一起代入式(1)中,則獲得LS_SVM分類器的模型為
經(jīng)過以上LS_SVM原理推導(dǎo),不難發(fā)現(xiàn),與SVM相比,其具有減小了計算復(fù)雜度以及提高了計算精度等優(yōu)點。
但在實際的滾動軸承故障診斷應(yīng)用中,在統(tǒng)計的故障訓(xùn)練集中,大量統(tǒng)計樣本的故障類型是未知的,即訓(xùn)練集中不但含有標(biāo)簽樣本,同時還含有大量無標(biāo)簽樣本,此時的LS_SVM分類算法就會表現(xiàn)出其固有缺陷,由于該算法只能利用有標(biāo)簽樣本訓(xùn)練出分類超平面進行分類,沒有利用無標(biāo)簽樣本,也就沒有充分利用訓(xùn)練集中的有效信息。因此,可將半監(jiān)督學(xué)習(xí)思想與LS_SVM原理進行結(jié)合,以充分利用滾動軸承故障診斷訓(xùn)練集中的有效信息,提高訓(xùn)練正確率。
標(biāo)準(zhǔn)的LS_SVM分類器利用人工分類好的樣本來訓(xùn)練分類器,是一種有監(jiān)督的學(xué)習(xí)方法,沒有利用滾動軸承故障診斷訓(xùn)練集中的無標(biāo)簽樣本。而半監(jiān)督學(xué)習(xí)分類器則可以利用無標(biāo)簽樣本,以改善分類器性能,因此,根據(jù)實際滾動軸承故障診斷的特點,探討一種將LS_SVM與半監(jiān)督學(xué)習(xí)相結(jié)合的分類方法,應(yīng)用于實際的滾動軸承故障診斷中,具有重要的理論意義和應(yīng)用價值。
1998年,Kristin率先利用混合整數(shù)規(guī)劃思想,將SVM與半監(jiān)督學(xué)習(xí)想結(jié)合,提出一種有效的分類方法[12],并吸引了大量學(xué)者深入研究,隨后提出了一系列改進分類算法[13-14]。而最早進行LS_SVM與半監(jiān)督學(xué)習(xí)相結(jié)合的理論研究是張健沛教授,于2008年提出基于LS_SVM的半監(jiān)督學(xué)習(xí)算法(SLS_SVM)[15],并在理論上驗證了該方法的巨大優(yōu)勢。但到目前為止,將基于SLS_SVM分類算法應(yīng)用到實際中的研究還很少,且還沒有文獻(xiàn)將SLS_SVM分類算法應(yīng)用與滾動軸承故障診斷之中。因此,在此根據(jù)滾動軸承故障診斷訓(xùn)練集特點,充分利用訓(xùn)練集樣本信息,提出一種基于SLS_SVM的滾動軸承故障診斷方法,以改善分類器的訓(xùn)練正確率。
基于SLS_SVM的滾動軸承故障診斷方法的目的是在利用LS加快訓(xùn)練速度的同時,結(jié)合半監(jiān)督學(xué)習(xí),提高訓(xùn)練正確率。基本思想為:先利用滾動軸承故障診斷訓(xùn)練集中的有標(biāo)簽樣本,用LS_SVM訓(xùn)練出一個原始分類器,再用該原始分類器對無標(biāo)簽樣本進行分類,并進行相應(yīng)的標(biāo)注,在利用LS_SVM對新有標(biāo)簽樣本進行標(biāo)簽動態(tài)更新。
在滾動軸承故障診斷中,診斷的可能結(jié)果有內(nèi)環(huán)故障、外環(huán)故障、滾動體故障、其他故障、以及正常狀態(tài)5類。在利用SL_SVM對訓(xùn)練集進行分類時,在此采用一對多分類方式,即訓(xùn)練樣本具有M個類時,建立M個二值分類器,每一個類與其他類區(qū)別對待,也就是把當(dāng)前類的輸出定為1,而其他類的輸出定為-1,所以,在對M類滾動軸承故障診斷時,需要建立M個分類器。一般情況下,可分5類滾動軸承故障診斷問題,故一對多滾動軸承故障診斷如圖1所示。
圖1 一對多滾動軸承故障診斷圖
基于SLS_SVM的滾動軸承故障診斷方法的操作過程如下:
(1)提出故障診斷訓(xùn)練集的特征參數(shù)。
(2)利用LS_SVM對有標(biāo)簽樣本進行一次訓(xùn)練,獲取一個原始分類器y0。
(3)利用當(dāng)前分類器對故障診斷訓(xùn)練集中的無標(biāo)簽樣本進行分類,并進行相應(yīng)賦值。對位于現(xiàn)在的超平面邊界區(qū)域中的無標(biāo)簽樣本進行區(qū)域標(biāo)注。
(4)重置無標(biāo)簽故障診斷樣本的標(biāo)簽。對所有樣本進行再次訓(xùn)練,獲取一個新的分類器y',再用該分類器對無標(biāo)簽的故障診斷樣本進行重新分類,并將此次無標(biāo)簽樣本分類結(jié)果與上一次的分類結(jié)果進行對比,然后根據(jù)標(biāo)簽重置法則確定該樣本的新標(biāo)簽。
(5)在當(dāng)前邊界區(qū)域內(nèi)符合新加標(biāo)簽條件下,但還沒有添加標(biāo)簽的無標(biāo)簽樣本,使用區(qū)域標(biāo)注法對其進行添加標(biāo)簽,并返回步驟(4)。若沒有這樣的無標(biāo)簽樣本,就利用現(xiàn)在的分類器對剩余無標(biāo)簽樣本進行分類,并添加標(biāo)簽。算法結(jié)束,并輸出結(jié)果。
基于SLS_SVM的滾動軸承故障診斷方法,具有LS_SVN優(yōu)點,同時,也具有半監(jiān)督學(xué)習(xí)的優(yōu)點,使?jié)L動軸承故障診斷的訓(xùn)練時間得到縮短,也使訓(xùn)練正確率得到提高。
為驗證SLS-SVM在軸承故障診斷中的應(yīng)用效果,將其與標(biāo)準(zhǔn) SVM[7]、半監(jiān)督 SVM[12]兩種模型進行對比。并全部用以下6個特征參數(shù),將特征參數(shù)L,C,K,M,CL,S,輸入到最小二乘支持向量機多值分類器中,進行滾動軸承故障的模式識別。
實驗選擇3類不同的滾動軸承故障診斷訓(xùn)練集,從每一種軸承中選取25%作為有標(biāo)簽樣本,另外75%作為無標(biāo)簽樣本,分別在3種方法中進行獨立實驗,其實驗結(jié)果如表1所示。
表1 本算法與傳統(tǒng)算法的比較
分析表1中數(shù)據(jù)可知,在A類情況下,標(biāo)準(zhǔn)SVM、半監(jiān)督學(xué)習(xí)SVM、以及文中的SLS_SVM所需時間分別為8.452 s、10.071 s和8.546 s,它們的訓(xùn)練正確率分別為94.3%、99%和100%,SLS_SVM相比沒有利用最小二乘法的半監(jiān)督學(xué)習(xí)SVM,縮短了時間。而在正確率方面,SLS_SVM相對于前兩種算法分別提高了5.7%、1%,故該算法能提高訓(xùn)練正確率。同理,通過分析B類和C類情況下的訓(xùn)練時間和訓(xùn)練正確率,依然能得到以上結(jié)果,實驗結(jié)果與理論相符。
與標(biāo)準(zhǔn)SVM和半監(jiān)督學(xué)習(xí)SVM方法相比,SLS_SVM方法在滾動軸承故障診斷應(yīng)用中,能提高訓(xùn)練的正確率,也能縮短訓(xùn)練所需時間,更適合實際工程應(yīng)用。
在基于實際的滾動軸承故障診斷應(yīng)用,針對統(tǒng)計的故障統(tǒng)訓(xùn)練集中,大量統(tǒng)計樣本的故障類型是未知特點,給出一種新的基于SLS_SVM分類方法,該方法在利用LS_SVM對有標(biāo)簽樣本進行處理的基礎(chǔ)上,結(jié)合半監(jiān)督學(xué)習(xí)思想,對大量無標(biāo)簽樣本進行處理,以改進分類器性能。理論上闡明該方法的可行性,并通過滾動軸承故障診斷實驗,驗證了該算法的可行性,與標(biāo)準(zhǔn)SVM和半監(jiān)督學(xué)習(xí)SVM方法相比,該方法能提高訓(xùn)練的正確率,也能縮短訓(xùn)練所需時間,具有較好的應(yīng)用價值。
[1] 梅宏斌.滾動軸承振動監(jiān)測與診斷[M].北京:機械工業(yè)出版社,1995.
[2] 王雷,張華良,余光偉.滾動軸承故障只能診斷系統(tǒng)[J].軸承,2006(8):31-33.
[3] FRANK P M.Fault diagnosis in dynamic systems using analytical and knowledge-based redundancy a survey and some new results[J].Automatic,1990,26(3):459 -474.
[4] 彭濤.基于傳感器最優(yōu)配置的故障檢測方法研究[D].長沙:中南大學(xué),2005.
[5] PACHAUD C,SALVETAT R.Crest factor and kurtosis contributions to identify defects inducing periodical impulse forces[J].Systems and Signal Processing,1997,11(6):903 -916.
[6] PENG Tao,GUI Weihua,WU Min,et al.Fault diagnosis based on intelligent infor-mation processing technology[C].Beijing:2002 IEEE Region 10 Conference on Computers,Communication,Control and Power Engineering,2002:1708-1712.
[7] VAPNIK V N.The nature of statistical learning theory[M].New York:Springer Verlag,1995.
[8] 李凌均,張周鎖,何正嘉.支持向量機在機械故障診斷中的應(yīng)用研究[J].計算機工程與應(yīng)用,2002(19):19-21.
[9] 萬書亭,佟海俠,董炳輝.基于最小二乘支持向量機的滾動軸承故障診斷[J].震動、測試與診斷,2009,30(2):149 -152.
[10]徐慶伶,汪西莉.一種基于支持向量機的半監(jiān)督分類方法[J].計算機技術(shù)與發(fā)展,2010,20(10):115 -121.
[11]夏士雄,李佑文,周勇.一種半監(jiān)督局部線性嵌入算法的文本分類方法[J].計算機應(yīng)用研究,2010,27(1):64 -67.
[12] KRISTIN P B,AYHAN D.Semi- supervised support vector machines[C].Cambridge:Proceedings of the 1998 Conference on Advances in Neural Information Processing Systems,MIT Press,1998:368 -374.
[13] JOACHIM S T.Making large-scale SVM learning practical[C].Cambridge:Advances in Kernel Method-Support Vector Learning,1999:169 -184.
[14]陳毅松,汪國平,董士梅.基于支持向量機的漸進直推式分類學(xué)習(xí)算法[J].軟件學(xué)報,2003,14(3):451 -460.
[15]張健沛,趙瑩,楊靜.最小二乘支持向量機的半監(jiān)督學(xué)習(xí)算法[J].哈爾濱工程大學(xué)學(xué)報,2008,29(10):1088-1092.