戶文剛,張燕霞
(甘肅交通職業(yè)技術(shù)學(xué)院,蘭州 730070)
滾動軸承是離心泵的關(guān)鍵部件,其正常與否決定著離心泵的穩(wěn)定運(yùn)行,有研究統(tǒng)計(jì)數(shù)據(jù)表明30%以上的離心泵故障是軸承故障引起的,因此研究離心泵滾動軸承故障診斷方法具有重要意義[1]。離心泵滾動軸承運(yùn)行過程中的振動信號往往包含著豐富的狀態(tài)信息,通過分析處理滾動軸承的振動信號并基于時域、頻域和時頻分析提取特征向量,利用提取的特征向量進(jìn)行軸承故障辨識是廣泛應(yīng)用的故障診斷方法。離心泵滾動軸承的振動信號往往表現(xiàn)出非線性、非平穩(wěn)特點(diǎn),并且早期微弱故障信號易受噪聲干擾而難以提取和識別,因此,如何有效提取早期微弱故障特征及準(zhǔn)確辨識故障,對實(shí)現(xiàn)離心泵運(yùn)行狀態(tài)監(jiān)測及故障早期預(yù)判等具有重要意義與價值[2-3]。
傳統(tǒng)的振動信號分析方法如傅里葉變換、小波變換、希爾伯特-黃變換等大多在處理非線性和非平穩(wěn)振動信號時存在局限性[4-5]。為解決傳統(tǒng)振動信號分析方法的缺陷,Norden等[6]提出經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)方法;Smith[7]提出了局部均值分解(Local Mean Decomposition,LMD)方法;Wu等[8]在EMD的基礎(chǔ)上提出了集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)方法;Gilles[9]提出經(jīng)驗(yàn)小波變換(Empirical wavelet transform,EWT)。它們都可以自適應(yīng)非線性和非平穩(wěn)振動信號處理,但是仍存在一定的缺陷,其中EMD算法存在模態(tài)混疊現(xiàn)象、邊界效應(yīng)、對噪聲敏感、依賴插值方法選擇等問題,LMD有計(jì)算量大、平滑次數(shù)最優(yōu)確定等問題,EEMD在中低頻存在模態(tài)混疊現(xiàn)象,EWT在面對復(fù)雜頻譜是存在過切分問題。Dragomiretskiy等[10-12]提出變分模態(tài)分解(Variational Modal Decomposition,VMD)方法,變分模態(tài)分解是近些年廣泛應(yīng)用的一種新的自適應(yīng)信號分解方法,它從低到高排序信號頻率,自適應(yīng)分解成多個模態(tài)分量(IMF),在處理非線性、非平穩(wěn)信號能取得理想的效果。該方法克服了EMD等方法模態(tài)混疊現(xiàn)象、噪聲敏感,同時避免了遞歸模型的缺陷。
傳統(tǒng)的故障識別方法主要有k近鄰分類器(K-nearest Neighbor Classification,KNN)[13]、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)[14]、支持向量機(jī)(Support Vector Machine,SVM)[15]。這些方法在故障診斷方面應(yīng)用頗多,KNN簡單、易懂,在處理分類問題時對異常值不敏感,分類準(zhǔn)確度高,但是KNN無法給出數(shù)據(jù)的內(nèi)在含義,同時計(jì)算復(fù)雜度高,無法處理樣本不平衡問題。ANN具有較強(qiáng)的自學(xué)能力與泛化能力、較好的適應(yīng)性、能很好的非線性逼近等優(yōu)點(diǎn),但是ANN也存在參數(shù)多及優(yōu)化難、學(xué)習(xí)時間過長等缺點(diǎn)。SVM作為比較經(jīng)典的分類算法,克服了ANN學(xué)習(xí)速度慢和過擬合的問題,但也存在面對大樣本數(shù)據(jù)時處理能力不足以及解決多分類問題時分類精度較低等缺陷。隨機(jī)森林(Random Forests,RF)[16-17]是比較經(jīng)典的集成學(xué)習(xí)算法,其將隨機(jī)性引入決策樹,改善了決策樹易過擬合的問題,并具有較強(qiáng)的抗噪聲能力,能夠解決ANN繁瑣的參數(shù)尋優(yōu)過程、收斂速度過慢問題,同時解決了SVM在面對大樣本數(shù)據(jù)時處理能力不足與分類精度低的缺點(diǎn)?;谏鲜龇治?,本文將變分模態(tài)分解(Variational Modal Decomposition,VMD)方法與隨機(jī)森林(Random Forests,RF)相結(jié)合,提出基于基于VMD和隨機(jī)森林的離心泵滾動軸承故障診斷。RF不需要繁瑣的參數(shù)尋優(yōu)過程和最優(yōu)的特征向量選擇。
變分模態(tài)分解(Variational Modal Decomposition,VMD)[8]是Dragomiretskiy和Zosso于2014年提出的一種新的非線性非平穩(wěn)信號自適應(yīng)分解計(jì)算方法,VMD方法通過預(yù)設(shè)分解個數(shù)K值,尋找變分模型最優(yōu)解確定各模態(tài)分量相關(guān)中心頻率和帶寬帶,自適應(yīng)將原始信號分成K個模態(tài)分量(Intrinsic Modal Function,IMF)。假定一原始信號x(t),通過VMD分解為K個離散模態(tài)分量uk(t),k=1,2,…,K。算法的具體步驟如下:
(1)對每一個模態(tài)分量uk(t)應(yīng)用Hilbert變換獲取其單邊譜:
式中:δ(t)為脈沖函數(shù)。
(2)將每個模態(tài)分量uk(t)頻譜轉(zhuǎn)移到到相應(yīng)基頻帶:
式中:wk為uk(t)的中心頻率。
(3)通過對各模態(tài)分量uk(t)解調(diào)信號的高斯平滑方式估算各模態(tài)分量的帶寬,構(gòu)造約束變分模型:
式中:?t表示對t求偏導(dǎo),表示L2范數(shù)。
為了求解上述變分問題,引入懲罰因子α和拉格朗日乘法算子λ,從而將約束問題轉(zhuǎn)變?yōu)闊o約束的問題,得到擴(kuò)展的Lagrange表達(dá)式為:
式中:ε為求解精度。
求解過程中的單個變量更新表達(dá)式如下:
式中:n為正整數(shù);∧為傅里葉變換;τ為保真系數(shù)或者噪聲容限參數(shù)。
根據(jù)實(shí)際信號的頻域特性進(jìn)行信號頻帶的自適應(yīng)分割,原始信號被分解成K個有限帶寬值的IMF分量。變分模態(tài)分解具體分解流程如圖1所示。
圖1 變分模態(tài)分解流程Fig.1 Flow chart of variational modal decomposition
隨機(jī)森林(Random Forest,RF)是Leo Breiman等在決策樹的基礎(chǔ)上提出的一種組合分類器,通過引入隨機(jī)屬性選擇,由多個決策樹的投票來決定最終的分類結(jié)果,相比單個分類器有更高的分類結(jié)果,可以有效地提升學(xué)習(xí)系統(tǒng)的泛化能力。
給定數(shù)據(jù)集D={Xi,Yi},Xi∈Rk,Yi∈{1,2,…,c},由多個決策樹{h( )x,θm,m=1,2,…,M}組成森林,隨機(jī)森林的基決策樹在輸入樣本x情況下給出各自的分類結(jié)果,最后利用投票方式輸出最終的分類結(jié)果。隨機(jī)森林算法步驟如下。
(1)從原始數(shù)據(jù)集中利用bootstrap重采樣方法隨機(jī)抽取n個樣本組成單決策樹的訓(xùn)練集,其大小約為原始數(shù)據(jù)集的2∕3,依次為每一個bootstrap訓(xùn)練集訓(xùn)練組建分類數(shù),共產(chǎn)生n棵決策樹構(gòu)成一片“森林”,這些決策樹均不進(jìn)行剪枝。
(2)隨機(jī)森林自上而下從單棵決策樹的根節(jié)點(diǎn)開始遞歸分裂。定義訓(xùn)練樣本的輸入特征個數(shù)為M,在每個節(jié)點(diǎn)上進(jìn)行分裂時,從M個特征向量里隨機(jī)(無放回)選擇m(m保持不變)個特征向量,然后按照分裂節(jié)點(diǎn)不純度最小的原則從上述特征中挑選出一個最好的特征進(jìn)行分裂生長,重復(fù)上述過程依次分裂直至該決策樹遍歷所有的特征屬性。
(3)在分類階段,集合n棵決策樹的分類結(jié)果,利用投票決策最終的類別。
隨機(jī)森林的分類原理降低了數(shù)之間的相關(guān)性,保證了因模型輸入數(shù)據(jù)維數(shù)上升過高情況下,仍能獲得良好的分類效果。分類過程如圖2所示。
圖2 隨機(jī)森林分類過程Fig.2 Randomforest classification process
基于VMD和隨機(jī)森林的離心泵滾動軸承故障辨識具體實(shí)現(xiàn)步驟如下:
(1)從待測設(shè)備采集振動信號并進(jìn)行VMD分解,得到K個模態(tài)分量IMF;
(2)基于模態(tài)分量IMF,提取如表1所示時域和頻域方面特征指標(biāo),構(gòu)建原始信號特征向量集;
表1 各通道故障特征參數(shù)Tab.1 Fault characteristic parametersof each channel
(3)將構(gòu)建的原始信號特征集輸入RF中進(jìn)行訓(xùn)練學(xué)習(xí);
(4)將測試集輸入到RF分類器中進(jìn)行模式識別,得到測試數(shù)據(jù)的故障分類診斷結(jié)果。
基于VMD和隨機(jī)森林的離心泵滾動軸承故障診斷的基本流程如圖3所示。
圖3 故障診斷流程Fig.3 Fault diagnosis flowchart
本文采用如圖4所示某型號離心泵作為試驗(yàn)對象進(jìn)行故障診斷試驗(yàn)驗(yàn)證。通過振動傳感器采集驅(qū)動端軸承振動數(shù)據(jù),設(shè)定電機(jī)轉(zhuǎn)速2 600 r∕min,采樣頻率為6 kHz,通過振動加速度傳感器分別采集滾動軸承正常狀態(tài)、內(nèi)環(huán)裂紋、外環(huán)裂紋、滾動體損壞4種狀態(tài)下的振動信號,其中軸承故障由電火花加工技術(shù)而成,如圖5所示。
圖4 離心式化工泵故障模擬實(shí)驗(yàn)臺Fig.4 Centrifugal chemical pump fault simulation test bench
圖5 故障軸承Fig.5 Faulty bearing
為了更完整表征滾動軸承故障狀態(tài),采集各狀態(tài)信號各60組,以其中的40組作為訓(xùn)練樣本,20組作為測試樣本。滾動軸承幾種狀態(tài)的原始振動信號波形圖如圖6所示。
圖6 滾動軸承在不同狀態(tài)下的振動信號Fig.6 Vibration signalsof rollingbearingsin different states
選擇內(nèi)圈故障信號進(jìn)行VMD分解,分解結(jié)果如圖7所示。根據(jù)文獻(xiàn)[12],設(shè)定K=7。由圖可知,原始振動信號被分解成7個IMG分量。基于表1提取各IMF分量特征向量,構(gòu)建原始信號特征向量集,即提取此狀態(tài)下第一組信號經(jīng)VMD分解的特征向量,得到7×14=98個特征向量,同理提取其他狀態(tài)的98個特征向量。最后得到一個維數(shù)為1 680×14的特征向量矩陣。
圖7 內(nèi)圈故障樣本的VMD分解結(jié)果Fig.7 VMDdecomposition resultsof inner ringfault samples
將得到的1 680×7特征向量矩陣隨機(jī)抽取各故障模式數(shù)據(jù)組成比例為(1 120,560)的訓(xùn)練集與測試集,利用訓(xùn)練集訓(xùn)練RF模型,在RF訓(xùn)練完成后,通過測試集驗(yàn)證模型分類的精度,如表2所示。由表可知,每種故障狀態(tài)的分類識別正確率都比較高,平均分類準(zhǔn)確率達(dá)到了97.96%,因此表明基于VMD-RF的故障辨識是可行的且有效的。
表2 各故障狀態(tài)的識別準(zhǔn)確率Tab.2 Recognition accuracy rateof each fault state
為了進(jìn)一步驗(yàn)證所提方法的優(yōu)越性,分別建立VMD-RF、VMD-BP和VMD-SVM模型并分類。3種模型的分類結(jié)果如表3所示。結(jié)果表明,3類模型中VMD-RF分類的準(zhǔn)確率最高,而VMD-BP分類誤差最大,VMDSVM介于兩者之間。由此可以看出VMD分解提取的信號特征有效地表征了原始信號的信息,同時說明VMD-RF模型在滾動軸承故障識別方面要優(yōu)于傳統(tǒng)的BP和SVM,驗(yàn)證了本文所提方法具有一定的可行性。
表3 各分類模型的識別準(zhǔn)確率Tab.3 Recognition accuracy rate of each classification model
故障診斷的本質(zhì)是模式識別,為了更直觀地表達(dá)故障類型的分類效果,將各分類方法的可視化三維分類結(jié)果繪制成如圖8所示的散點(diǎn)圖。從圖8中可以很直觀地看出,基于VMD-RF的滾動軸承不同故障模式的特征具有很好的可分性,分類效果很理想,而其他組合方法VMD-BP和VMD-SVM幾類故障模式有一定的重疊。
圖8 各分類方法的三維可視化分類結(jié)果Fig.8 Three-dimensional visual classification results of each classification method
為解決離心泵滾動軸承的故障診斷問題,本文將變分模態(tài)分解與隨機(jī)森林相結(jié)合,提出了基于VMD和隨機(jī)森林的離心泵滾動軸承故障診斷方法。首先對滾動軸承振動信號進(jìn)行VMD分解得到K個IMF分量;然后基于時頻域指標(biāo)構(gòu)建各IMF分量的特征向量,以此作為隨機(jī)森林分類的依據(jù);最后利用離心泵軸承數(shù)據(jù)對該方法進(jìn)行了可行性驗(yàn)證,結(jié)果表明所提方法可以有效對滾動軸承故障類型進(jìn)行識別分類,與BP和SVM傳統(tǒng)分類方法相比,本文提出的VMD與隨機(jī)森林結(jié)合的方法具有更高的分類準(zhǔn)確率,為滾動軸承故障診斷提供了新的思路。