穆麗蓉,胡磊,b,c
(武漢理工大學 a.能源與動力工程學院;b.船舶動力工程技術(shù)交通行業(yè)重點實驗室; c.船舶與海洋工程動力系統(tǒng)國家工程實驗室,武漢 430063)
軸承是軸系和旋轉(zhuǎn)機械的重要部件,其運行狀態(tài)直接影響系統(tǒng)的可用性和可靠性,隨著軸承載荷的增加,其發(fā)生故障的可能性也越來越大。目前,軸承狀態(tài)監(jiān)測主要采用振動法[1],根據(jù)故障機理提取相關(guān)特征參數(shù),通過閾值或概率進行故障診斷,但基于機理的振動信號判據(jù)與軸承的結(jié)構(gòu)和類型密切相關(guān),通用性不好。充分利用基于機理的多維振動特征參數(shù),融合機理與數(shù)據(jù)驅(qū)動診斷方法,研究具有一定通用性的診斷算法,實現(xiàn)軸承狀態(tài)的自動識別,對提高軸承健康管理和故障預測(prognostic and health management,PHM)水平具有重要意義。
本文首先以滾動軸承為對象,通過時頻分析提取振動信號特征參數(shù),經(jīng)標準化處理后,選擇T-SNE降維技術(shù),獲得訓練樣本,研究基于隨機森林的故障診斷模型,以識別滾動軸承運行狀態(tài),最后將該方法應(yīng)用于滑動軸承,驗證方法的適用性。
目前振動法廣泛應(yīng)用于滾動軸承故障診斷與預測,常用的振動信號特征參數(shù)有時域特征和頻域特征。傳統(tǒng)的診斷方法在于對特征參數(shù)進行閾值或概率判斷[2],而基于機器學習的診斷方法,可以通過刪減或選擇從多維特征參數(shù)中提取有效特征參數(shù)[3]。在試驗中,測取驅(qū)動端和風扇端的軸承振動信號,并分別提取9個時域特征參數(shù)與3個頻域特征參數(shù)共24維樣本數(shù)據(jù),分別為均值、RMS值、時域峰值、方差、峭度、峰值因子、波形因數(shù)、脈沖指標、裕度系數(shù)、基頻振幅、0.5倍頻振幅和2倍頻振幅等[4-5]。
由于各特征參數(shù)之間數(shù)量級差距過大,會影響故障診斷結(jié)果,降低診斷準確度,需對特征參數(shù)進行標準化處理,將有量綱的特征參數(shù)變成無量綱的標量。本文采用min-max標準化方法,將特征值歸一化為0~1之間的量綱一的量數(shù)字,如式(1)所示。
Xnor=(X-Xmin)/(Xmax-Xmin)
(1)
式中:X為標準化前的特征參數(shù)值;Xnor為標準化之后的特征參數(shù)值;Xmax為該列特征參數(shù)的最大值;Xmin為該列特征參數(shù)的最小值。
特征參數(shù)選取包括特征選擇與數(shù)據(jù)降維。
特征選擇通常根據(jù)特征的貢獻率,從大到小排序得到累積貢獻率超過k值的前n個特征值,刪除其他貢獻率低于1-k的特征值。
特征降維是通過相關(guān)算法對高維數(shù)據(jù)進行融合,獲得新的低維特征參數(shù)標量。本文采用T-SNE流形學習方法對高維數(shù)據(jù)進行降維分析。T-SNE降維是t分布與隨機鄰接嵌入(SNE)的融合,降維之后的數(shù)據(jù)看作t分布,較高斯分布而言,t分布峰值更低、尾端更高,分布更平緩,可避免將距離較大的數(shù)值簇通過分布概率降維后距離拉近,解決了擁擠問題。
隨機森林是監(jiān)督學習常用方法之一,為了提高診斷率,選用KNN、決策樹、SVM、隨機森林4種方法進行對比。KNN是基于訓練數(shù)據(jù)之間的歐氏距離進行分類,對測試樣本的標簽劃分進行投票,票數(shù)多的一類即為測試樣本標簽類別;決策樹通過二分法對樣本數(shù)據(jù)進行逐步分類,通過自學習內(nèi)部節(jié)點及分支,輸出若干葉節(jié)點,直到每個葉節(jié)點代表一類標簽;SVM是在若干樣本之間找到分類超平面,通過距離最大的原則找到超平面與樣本之間的支持向量,從而實現(xiàn)最優(yōu)分類[6];隨機森林則是Bagging套袋法與決策樹的結(jié)合,Bagging在原始訓練樣本集中隨機選擇若干個訓練樣本,進行k輪選擇,建立k個小樣本集,并且每個小樣本之間相互獨立,樣本元素可重復,每個小樣本都訓練一個分類模型,最終分類結(jié)果由每個分類模型投票決定[7],而在隨機森林中,每個小樣本的分類模型為決策樹模型,具有極高的準確率,訓練速度快,不容易實現(xiàn)過擬合。故障診斷技術(shù)路線見圖1。
圖1 故障診斷技術(shù)路線
本文引用凱斯西儲大學滾動軸承故障模擬實驗數(shù)據(jù)[8],該試驗臺架包含1個1.5 kW機、1個轉(zhuǎn)矩傳感器和其他電子設(shè)備,見圖2。測試的振動信號來自于支撐電機的軸承處,軸承類型為SKF滾動軸承。使用電火花加工技術(shù)在如圖2所示驅(qū)動端軸承內(nèi)圈、滾動體和外圈的3個方向上模擬單點故障,故障點直徑分別為0.18、0.36和0.54 mm,共設(shè)置13種故障狀態(tài),每種狀態(tài)單獨運行4種轉(zhuǎn)速,采樣率為12 kHz,采樣時間10~11 s,故障設(shè)置見表1。
圖2 試驗臺架及軸承結(jié)構(gòu)
表1 驅(qū)動端軸承故障設(shè)置
每種故障狀態(tài)下的振動時域特征信號是不同的,僅依靠時域波形并不能明顯區(qū)分各種故障狀態(tài),表中部分故障狀態(tài)下采集的時域信號見圖3。
圖3 故障狀態(tài)時域信號
軸承旋轉(zhuǎn)2轉(zhuǎn)提取一組樣本數(shù)據(jù),每個轉(zhuǎn)速提取145個樣本,每種狀態(tài)145×4=580個樣本,共有580×13=7 540個樣本。對24維特征參數(shù)貢獻率進行排序,選擇累積貢獻率超過90%的特征,共13個特征參數(shù),分別為:驅(qū)動端RMS值、時域峰值、方差、峭度、峰值因子、裕度系數(shù),風扇端RMS值、時域峰值、方差、峰值因子、波形因數(shù)、脈沖指標、裕度系數(shù)。
選擇PCA線性降維與T-SNE非線性降維方法,將24維數(shù)據(jù)降為二維和三維并進行可視化見圖4。二維圖中的坐標x、y和三維圖中的坐標x、y、z均為降維之后量綱一的量的標量數(shù)據(jù),每個標號及其顏色代表一種故障狀態(tài)。
圖4 降維樣本分類
由圖4可見,PCA降維方法與T-SNE降維方法都可以將訓練樣本數(shù)據(jù)的狀態(tài)分離,但PCA降維使得同類狀態(tài)的樣本間距離不緊湊,不同類狀態(tài)的樣本間距離不分散,而T-SNE恰好相反,能夠?qū)⑼悩颖揪奂?,不同類樣本分散,且三維比二維在空間中樣本數(shù)據(jù)的分散性更好一些。
對特征參數(shù)進行降維之后,分別選擇KNN、SVM、決策樹、隨機森林4種分類算法進行故障診斷,共有樣本數(shù)7 540,選取其3/4為訓練樣本,1/4為測試樣本,分類效果見表2。
表2 故障診斷準確率 %
由表2可見,選用T-SNE降三維之后的隨機森林故障診斷效果最佳。
為了驗證此診斷算法的通用性,使用滑動軸承狀態(tài)數(shù)據(jù)進行驗證。采用柴油機滑動主軸承磨損實驗數(shù)據(jù)[9],通過添加紫銅片的方法模擬4120SG型柴油機第4檔主軸承的3種不同軸承間隙(0.16,0.25,0.32 mm),并測取每種軸承間隙下的振動信號,采樣頻率為40 kHz。按照模型流程先對數(shù)據(jù)進行時頻分析,提取12維振動特征參數(shù),共提取3個狀態(tài)的6 239個樣本;對每一維特征參數(shù)進行貢獻率分析,使用累積貢獻率超過90%選擇了六維特征參數(shù),分別為:RMS值、峭度、峰值因子、裕度指標、基頻振幅、2倍頻振幅;對六維特征參數(shù)進行歸一化和T-SNE降三維處理,可視化圖形見圖5。
圖5 降維樣本分類
對6 239個樣本進行劃分,選取3/4為訓練樣本,1/4為測試樣本,輸入隨機森林故障診斷模型中,得到狀態(tài)診斷準確率為94.615%。
1)采用T-SNE降維方法能夠?qū)φ駝佣嗑S特征參數(shù)進行良好的融合,能夠更好區(qū)分不同類型樣本數(shù)據(jù),使得類別分界線更加清晰。
2)振動特征參數(shù)對軸承的狀態(tài)變化較為敏感,在對特征參數(shù)進行分析與處理后,隨機森林算法診斷效果相對較優(yōu)。
3)研究表明:T-SNE降維與隨機森林算法相結(jié)合的軸承故障診斷方法具有通用性,體現(xiàn)了基于機理與數(shù)據(jù)驅(qū)動混合診斷的優(yōu)越性。