楊建偉, 白永亮, 武慧杰, 化鳳芳
(1.北京建筑大學 機電與車輛工程學院 城市軌道交通車輛服役性能保障北京市重點實驗室, 北京 100044)
?
基于FS- PCA- MSCD的地鐵軸承可視化診斷方法
楊建偉, 白永亮, 武慧杰, 化鳳芳
(1.北京建筑大學 機電與車輛工程學院 城市軌道交通車輛服役性能保障北京市重點實驗室, 北京 100044)
針對地鐵軸承的可視化故障診斷能力,本文提出了基于特征選擇(Feature Selection,F(xiàn)S)與多尺度類距離(Multi Scale Class Distance, MSCD)的軸承故障診斷方法. 首先對地鐵齒輪箱軸承振動信號進行采集,獲得不同故障類型的軸承故障樣本集;然后基于FS方法提取故障樣本中存在的敏感特征值,并利用獲得的特征向量進行主成分分析(Principal Component Analysis, PCA),基于MSCD方法對各故障聚類進行再分類,提高故障類的可分性,獲得可視化程度高的故障診斷結(jié)果. 利用該方法對地鐵齒輪箱軸承故障數(shù)據(jù)進行可視化故障診斷,診斷結(jié)果表明該方法能夠提取敏感故障特征并獲得具有較高故障可分性與可視化的診斷結(jié)果. 該方法為地鐵軸承在線故障分析能力提供了技術(shù)支持,在地鐵運行維護與故障診斷方面均具有廣闊的應用前景.
地鐵軸承; 特征選擇; 類距離; 可視化診斷
由于地鐵的工作特性,載客量及速度在短時間內(nèi)頻繁產(chǎn)生劇烈變化,這使得地鐵軸承常運行在惡劣工況下,容易產(chǎn)生故障. 由于地鐵齒輪箱本身機械結(jié)構(gòu)的復雜性,及振動信號在從故障點傳輸至傳感器的過程中不可避免的衰減、調(diào)制等特性,地鐵軸承的故障信號往往表現(xiàn)出強烈的復雜性,這大大加強了地鐵軸承的故障診斷難度[1]. 因此,通過研究先進的信號處理方法來提取敏感的狀態(tài)特征量,已成為旋轉(zhuǎn)機械故障診斷學科最活躍的領域之一[2]. 其中,主成分分析(Principal Component Analysis, PCA)是一種行之有效的故障特征值提取方法. PCA方法在各個變量之間相關(guān)關(guān)系研究的基礎上,用一組較少的、互不相關(guān)的新變量(即主元)代替原來較多的變量, 并使這些新變量盡可能多地保留原來復雜變量所反映信息的一種基于二階統(tǒng)計的數(shù)據(jù)分析方法, 具有較好的降維去噪能力[3].
在PCA處理故障信號中,為了對機械故障進行準確、有效地判斷,就必須要提取大量的故障特征,獲得盡可能多的、從各個方面反應故障的特征信息,但這會造成特征集的維數(shù)過高同時引入非敏感特征,嚴重影響診斷精度[4]. 因此,需要對輸入PCA的特征向量進行選擇,提取出敏感特征,降低特征集維數(shù)的同時提高診斷故障精度[5]. 同時由于PCA分類結(jié)果可視化程度不高,基于類內(nèi)類間距離的可分性判據(jù)利用的是各類特征向量之間的平均距離[6],當類間間距相較類內(nèi)間距較大時,故障的可視化程度低,無法完成故障分類需求,因此需要對聚類結(jié)果進行再分配,提高診斷結(jié)果的可視化程度與魯棒性能.
國內(nèi)外學者對相關(guān)領域進行了研究,李海峰等人[7]針對特征提取及聚類分析中類距離的判別準則,提出了優(yōu)于傳統(tǒng)類內(nèi)類間距離的可分離性判據(jù),并將之應用于特征提取過程;劉華文[8]采用互信息和關(guān)聯(lián)系數(shù)分別表示特征間的類內(nèi)距離與類間距離,在保證選擇的特征子集具有最小冗余性和最大相關(guān)性的前提下,利用信息熵準則優(yōu)化敏感特征的選擇過程,提高了分類效果;湯保平等人[9]研究了基于多準則融合敏感特征選擇和自適應鄰域的故障診斷方法,利用多種特征評價準則對原始高位特征進行排序,再根據(jù)融合序列選擇敏感特征構(gòu)成優(yōu)化高位特征集,從而改善了非敏感特征干擾的問題;王紅軍等人[10]研究了利用EEMD與小波變換構(gòu)建早期故障敏感特征的方法,利用IMF進行信息重構(gòu),并利用WPT獲得變換后的小波系數(shù),從而獲得早期故障的敏感特征,能夠?qū)崿F(xiàn)快速準確的診斷過程.
1.1 敏感特征選擇
特征選擇是指根據(jù)給定的評判標準,從輸入特征空間中選擇一個子集,使其與目標概念最相關(guān)的過程[11]. 具體到故障診斷的樣本故障分類過程中,則表現(xiàn)為樣本的特征或者屬性使得決策能力更高,樣本的特征越敏感,所具有的信息含量越多,則該分類算法的決策能力就越強,但是如果選擇的特征并不敏感,即該特征子集不能夠代替原始的特征空間,這會使得特征子集包含信息與原始空間不對等[12],進而影響取樣過程中的維數(shù)約減結(jié)果,使得聚類分析過程復雜,且獲得無法解釋的輸出結(jié)果. 因此,需要對樣本進行敏感特征選擇,常用的用于故障診斷的敏感特征有時域特征、頻域特征、時頻域特征、頻譜向量等,本文對這幾種特征向量分別進行聚類分析,通過具體分類結(jié)果獲得適用于地鐵軸承故障診斷的敏感特征集.
1.2 多尺度類距離
獲得敏感特征集后,利用聚類分析方法對該特征集所代表的樣本進行分類,進而基于可分性分類結(jié)果,進行可視化故障診斷. 基于傳統(tǒng)的類內(nèi)類間距離的可分性判據(jù)定義如下:
(1)
(2)
由此可推得:
Jd(x)=sb+sw=tr(Sb+Sw)
(3)
其中,
式中,mi表示第i類樣本集的均值;m表示所有各類的樣本集總均值向量;稱Sb為類間離散度矩陣;Sw為類內(nèi)離散度矩陣;sb為類間離散度,sw為類內(nèi)離散度. 直觀上,人們希望被提取特征的類間離散度sb盡量大,類內(nèi)離散度sw盡量小,但實際過程中這二者通常無法同時滿足. 本文基于類距離理論,提出多尺度類距離(Multi Scale Class Distance,MSCD)方法,MSCD方法從聚類結(jié)果整體尺度出發(fā),逐層進行聚類再分配,從而多尺度的進行聚類劃分,提高聚類的可分性與可視化程度. 具體推導過程如下:
(4)
(5)
(6)
(7)
通過MSCD方法,可以多尺度的將類進行再分配,獲得可分性高、可視化程度好的診斷結(jié)果.
2.1 樣本信號采集
為了對以上所提出結(jié)論進行驗證,利用試驗臺
采集地鐵軸承故障數(shù)據(jù)進行驗證. 本實驗采用SpectraQuest公司生產(chǎn)的地鐵齒輪箱試驗臺進行數(shù)據(jù)采集,該試驗臺按照實際地鐵齒輪箱結(jié)構(gòu)設計,試驗臺與實際地鐵齒輪箱比例為1∶3,通過不同的組裝方式可獲得不同的故障類型,能夠充分的模擬實際地鐵軸承運行過程中的振動特性. 該齒輪箱故障試驗臺外形見圖1.
本文采用ICP加速度計作為傳感器,安裝于試驗臺軸承座上,采集加速度信號作為振動信號. 試驗中所用的軸承為圓柱滾子軸承,軸承狀態(tài)分別為健康、內(nèi)圈故障、滾動體故障和外圈故障,各故障軸承故障均為電火花加工在相應部位加工出的凹槽,用來模擬實際軸承的故障類型,文中所用各軸承見圖2.
實驗所用各項采樣參數(shù)見表1.
為了確保實驗樣本的準確性及充分性,本文多對每種狀態(tài)下的軸承分別采集30組樣本,共4種狀態(tài)的軸承,即共120組振動樣本數(shù)據(jù). 從4種狀態(tài)中各取1組原始振動信號進行頻譜分析,結(jié)果見圖3.
由圖3可知,通過簡單的時域、頻域波形無法分出各軸承的具體故障狀態(tài),因此需要對該信號進行進一步分析.
2.2 FS- PCA
對該樣本信號進行特征向量選擇. 分別選擇樣本的時域特征、頻域特征、時頻域特征及頻譜向量作為PCA的特征輸入向量,進行故障分類. 其中樣本時域特征共16維,分為有量綱與無量綱特征,其中有量綱時域特征包括:均值、均方根值、方根幅值、絕對平均值、偏斜度、峭度、方差、最小值、最大值、峰峰值,無量綱時域特征包括:波形指標、峰值指標、脈沖指標、裕度指標、偏斜度指標、峭度指標;樣本頻域特征共13維,分別包括:均值頻率、頻率標準差、頻譜聚散度、頻率中心、均方根頻率、主頻帶位置等特征元素;樣本時頻域特征即將時頻域共29維特征合并作為特征向量輸入;樣本頻譜向量即直接將各樣本的頻譜分布作為輸入向量,本文采用5 120作為頻譜分析點數(shù),即沒個頻譜向量為5 120維. 4組不同的輸入特征向量維數(shù)見表2.
采樣參數(shù)采樣頻率/Hz采集時長/s輸入轉(zhuǎn)頻/Hz故障樣本/個軸承型號加速度計型號參數(shù)值5K13030NU202ECPSQI608A11-10F
對4組信號進行特征向量選擇,并進行PCA處理,獲得結(jié)果見圖4.
由圖4可知,選擇不同的特征向量直接關(guān)系到PCA的處理結(jié)果好壞,其中以頻譜向量為輸入特征向量的一組故障分類結(jié)果較好,能夠明顯的將4種不同的軸承狀態(tài)區(qū)分出來,因此選擇該特征向量作為故障軸承的狀態(tài)向量,并將該分類結(jié)果保留,進行基于多尺度類距離的聚類再分配,提高故障類的可視化程度.
2.3 MSCD方法
利用基于多尺度類距離對基于頻譜向量的PCA分類結(jié)果進行再分配,結(jié)果見圖5.
表2 特征向量維數(shù)
由圖5可知,對原本可視化程度并不高的PCA分類結(jié)果進行基于MSCD的聚類再分配后,得到的聚類分析結(jié)果具有明顯的可分性,大大提高了故障診斷結(jié)果的可視化程度.
本文提出了基于FS- PCA- MSCD的地鐵軸承可視化診斷方法,證實了該方法能夠有效提取敏感特征向量并得到可視化程度高的地鐵軸承故障診斷結(jié)果. 首先基于FS方法,提取地鐵軸承振動信號的敏感特征向量,包括時域、頻域及頻譜特征,進而利用PCA方法對各特征向量進行聚類分析,獲得初步診斷結(jié)果,實際振動信號證明頻譜向量作為特征輸入時PCA具有更好的可分性. 利用MSCD方法對初步診斷結(jié)果進行多尺度的聚類再分配,以獲得可視化程高的聚類再分配結(jié)果. 具體實驗驗證了該方法的有效性,成功的對4種不同狀態(tài)的地鐵軸承進行了可視化的區(qū)分,獲得了明顯可分的診斷結(jié)果. 理論推導與實驗結(jié)果證明了該方法對地鐵軸承的可視化故障診斷具有的重要作用.
[1] 白永亮,楊建偉.基于改進TDA與WPA的地鐵齒輪箱振動信號消噪研究[J].北京建筑大學學報, 2016, 32(2):52-54
[2] Randall R B, Antoni J. Rolling element bearing diagnostics-A tutorial[J]. Mechanical Systems and Signal Processing, 2011,25(2): 485-520
[3] Raik o T, Ilin A, Karhunen J. Principal component analysis for sparse high-dimensional data [ M]. Neural Information Processing. Berlin:Springer-Verlag, 2008:566-575
[4] 蘇祖強,湯寶平,姚金寶.基于敏感特征選擇與流形學習維數(shù)約簡的故障診斷[J].振動與沖擊, 2014, 33(3):71-74
[5] 化鳳芳,楊建偉,張福生.軌道車輛齒輪箱故障診斷系統(tǒng)研究與開發(fā)[J].北京建筑大學學報, 2013, 29(4):59-60
[6] Jian A K, Dubes R C. Algorithms for clustering data [M].Englewood Cliffs, NewJersey: Prentice-Hall,1988:432-436
[7] 李海峰,張建洲,游志勝.基于類距離的可分離性判據(jù)[J].計算機工程與應用, 2003, 39(26):97-99
[8] 劉華文.基于信息熵的特征選擇算法研究[D].長春:吉林大學, 2010
[9] 湯寶平.多準則融合敏感特征選擇和自適應鄰域的流行學習故障診斷[J].儀器儀表學報, 2014, 35(11):2416-2418
[10] 王紅軍,萬鵬.基于EEMD和小波包變換的早期故障敏感特征獲取[J].北京理工大學學報, 2013, 33(9):946-948
[11] Liu H, Motoda H. Feature selection for knowledge discovery and data mining [M]. Boston:Kluwer Academic Publishers, 1998:71-76
[12] Liu H, Yu L. Toward integrating feature selection algorithms for classification and clustering [J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(4): 491-502
[責任編輯:牛志霖]
Visualization Diagnosis Method of Metro Bearing Based on FS- PCA- MSCD
Yang Jianwei, Bai Yongliang, Wu Huijie, Hua Fengfang
(School of Mechanical-Electronic and Vehicle Engineering, Beijing Key Laboratory of Performance Guarantee of Urban Rail Transit Vehicles, Beijing University of Civil Engineering Architecture, Beijing 100044)
Aiming at the problem of visualization diagnosis of metro bearing, a diagnosis method based on Feature Selection and Multi Scale Class Distance was introduced in this paper. First, metro bearing vibration signals were collected to create bearing fault sample set for different fault types, and then the sensitive features of fault samples were extracted with feature selection. Next, the feature vectors of fault samples were used to PCA to realize principal component analysis, and the MSCD were used to re-classify the fault class to get a better visualization fault diagnosis results. Real metro bearing vibration signals were collected to prove the reliability of this visualization fault diagnosis method, and the results shows that this method can extract sensitive features and obtained better visualization results of fault diagnosis. This method can be an effective technique support to online metro bearing fault diagnosis and can be used wildly in operation and maintenance of subway and fault diagnosis.
metro bearing; feature selection; class distance; visualization fault diagnosis
1004-6011(2016)03-0116-05
2016-08-31
長城學者培養(yǎng)計劃項目(CIT&TCD20150312); 國家自然科學基金項目(51605023)
楊建偉(1971—),男, 教授, 博士生導師, 博士, 研究方向:車輛系統(tǒng)動力學及控制,故障診斷學.
TH17
A