郭梓良, 郝如江, 王一帆, 楊文哲, 趙瑞祥
(石家莊鐵道大學(xué)機(jī)械工程學(xué)院,河北 石家莊 050043)
對(duì)工作中的軸承進(jìn)行故障識(shí)別與診斷的過(guò)程中,常常受到噪聲的干擾導(dǎo)致故障識(shí)別準(zhǔn)確率降低。因此對(duì)噪聲進(jìn)行篩選和處理,是滾動(dòng)軸承故障識(shí)別的關(guān)鍵所在[1]。
當(dāng)今的軸承故障診斷主要是圍繞著故障振動(dòng)信號(hào)的特征提取和分類(lèi)等方面進(jìn)行研究。史東海等[2]通過(guò)使用傳統(tǒng)方法對(duì)信號(hào)進(jìn)行處理后使用PCA降維,隨后采用K近鄰算法對(duì)結(jié)果進(jìn)行分類(lèi)。姚峰林等[3]通過(guò)使用小波包變換對(duì)滾動(dòng)軸承數(shù)據(jù)消噪處理后再進(jìn)行極限學(xué)習(xí)機(jī)特征提取分類(lèi)。汪朝海等[4]對(duì)原數(shù)據(jù)通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解后使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行故障分類(lèi)。上述方法對(duì)原始故障信號(hào)進(jìn)行相應(yīng)處理,削弱了噪聲干擾信號(hào)所帶來(lái)的影響,從而使得信號(hào)特征更易提取,但是仍存在著一定的不足。傳統(tǒng)方法雖然能減少噪聲帶來(lái)的信號(hào)干擾,但是由于初始參數(shù)的影響,常常導(dǎo)致有用的特征信號(hào)被篩選清除。使用小波分解處理方法,因小波基參數(shù)需要多次實(shí)驗(yàn)分析確定,缺少信號(hào)處理的泛化性。EMD可以對(duì)信號(hào)進(jìn)行自適應(yīng)分解,但是會(huì)產(chǎn)生嚴(yán)重的端點(diǎn)效應(yīng)并具有模態(tài)混疊的缺點(diǎn)。
為了解決上述問(wèn)題,本文采用一種集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)、主成分分析算法(Principal Component Analysis,PCA)和一維卷積神經(jīng)網(wǎng)絡(luò)(one-Dimensional Convolutional Neural Network,1D-CNN)相結(jié)合的軸承故障識(shí)別的方法:首先將原始數(shù)據(jù)進(jìn)行重構(gòu)分解得到若干個(gè)本征模函數(shù)(Intrinsic Mode Function,IMF)分量,通過(guò)篩選能夠充分表達(dá)出數(shù)據(jù)特征的一條IMF分量再進(jìn)行PCA算法去冗余處理,其次將原始數(shù)據(jù)也經(jīng)過(guò)PCA去冗余處理,并采用將PCA-IMF分量和經(jīng)過(guò)處理的新數(shù)據(jù)作為一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)的輸入數(shù)據(jù),最后把處理后的數(shù)據(jù)投入到網(wǎng)絡(luò)中進(jìn)行多次迭代訓(xùn)練特征提取分類(lèi),為滾動(dòng)軸承故障預(yù)防和故障研究提供了一種新方法。
EEMD方法是為了彌補(bǔ)EMD模態(tài)混疊現(xiàn)象而提出的,通過(guò)對(duì)EMD分解后的若干個(gè)IMF分量添加對(duì)應(yīng)的高斯白噪聲來(lái)改變分解過(guò)程中極值點(diǎn)的位置,從而可以有效地抑制模態(tài)混疊的產(chǎn)生。具體步驟如下:
(1)設(shè)定EEMD的運(yùn)算次數(shù)z和高斯白噪聲標(biāo)準(zhǔn)差n。
(4)重復(fù)步驟(1)和步驟(2)的操作z次后,篩選適當(dāng)?shù)腎MF分量進(jìn)行信號(hào)重構(gòu)。
當(dāng)振動(dòng)信號(hào)經(jīng)過(guò)EEMD分解后仍存在干擾和冗余,這些干擾在網(wǎng)絡(luò)訓(xùn)練時(shí)會(huì)影響網(wǎng)絡(luò)準(zhǔn)確性,因此需要篩選并去除其中的干擾值,提高IMF分量的表現(xiàn)力。
PCA算法通過(guò)計(jì)算樣本向量中的特征值和均值,并通過(guò)投影運(yùn)算便可以達(dá)到降維的目的。主要步驟如下:
(1)首先將數(shù)據(jù)進(jìn)行中心化。
(2)計(jì)算樣本的協(xié)方差矩陣ZZi。
(3)對(duì)協(xié)方差矩陣ZZi進(jìn)行特征值分解。
(4)取最大的d個(gè)特征值所對(duì)應(yīng)的特征向量ωi。
(5)將ωi投影成矩陣。
隨著機(jī)器學(xué)習(xí)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)處理及分類(lèi)等方面取得了巨大的進(jìn)步。卷積神經(jīng)網(wǎng)絡(luò)是通過(guò)類(lèi)似神經(jīng)元的反應(yīng)及反饋,利用卷積運(yùn)算提取訓(xùn)練樣本中的特征,其主要包括卷積層、池化層和全連接層。由于CNN超強(qiáng)的學(xué)習(xí)和特征提取能力因此廣泛用于工學(xué)的各個(gè)領(lǐng)域。
卷積層是通過(guò)卷積塊對(duì)數(shù)據(jù)進(jìn)行局部運(yùn)算并產(chǎn)生特征圖。池化層可以通過(guò)特征降維,提高網(wǎng)絡(luò)活性。全連接層是將上層傳入的數(shù)據(jù)進(jìn)行進(jìn)一步特征提取并將提取出的特征輸入Softmax函數(shù)進(jìn)行分類(lèi)。
為了防止EEMD分解所帶來(lái)的特征缺失,提高模型的魯棒性和泛化性,提出基于EEMD分解和原始數(shù)據(jù)相互結(jié)合的方法。具體滾動(dòng)軸承故障識(shí)別實(shí)驗(yàn)方法如圖1所示。
圖1 EEMD-PCA-1D-CNN故障分類(lèi)流程
本文數(shù)據(jù)是采用美國(guó)西儲(chǔ)大學(xué)電機(jī)軸承故障狀況實(shí)驗(yàn),通過(guò)人為電火花破壞滾動(dòng)軸承形成三種故障類(lèi)型,對(duì)比正常類(lèi)型,并篩選不同工況、載荷以及轉(zhuǎn)速下的振動(dòng)信號(hào),具體數(shù)據(jù)選取如表1所示。
表1 軸承信號(hào)選取參數(shù)
根據(jù)本文上述的實(shí)驗(yàn)方法,首先對(duì)數(shù)據(jù)進(jìn)行EEMD處理,通過(guò)篩選適合的IMF分量對(duì)分解后的信號(hào)進(jìn)行重構(gòu)。相關(guān)系數(shù)可以用來(lái)表現(xiàn)分解后的IMF分量與原數(shù)據(jù)的相關(guān)程度。通過(guò)計(jì)算振動(dòng)信號(hào)的譜峭度值ku可以發(fā)現(xiàn)運(yùn)行系統(tǒng)中的異常,當(dāng)軸承在正常運(yùn)行時(shí),譜峭度ku約等于3;當(dāng)軸承發(fā)生故障或者運(yùn)行不正常時(shí),此時(shí)的譜峭度將會(huì)偏離正常值[5]。
相關(guān)系數(shù)的計(jì)算公式:
(1)
式中:i,j為兩個(gè)變量;Cov()為i,j的協(xié)方差;Var[]為i,j的方差。求得各IMF分量的相關(guān)系數(shù)并取絕對(duì)值,絕對(duì)值越大則表明該IMF分量所體現(xiàn)的故障振動(dòng)信號(hào)所包含的原始信號(hào)相關(guān)程度越高。
根據(jù)上述的方法,計(jì)算各個(gè)IMF分量的相關(guān)系數(shù)和譜峭度,部分結(jié)果如表2、表3所示。為了體現(xiàn)EEMD算法更能體現(xiàn)出故障信號(hào)特征,因此將原始數(shù)據(jù)經(jīng)過(guò)EMD分解設(shè)置為對(duì)照組,并計(jì)算對(duì)照組的相關(guān)系數(shù)和譜峭度值,部分結(jié)果同見(jiàn)表2、表3。
由表2、表3可知,軸承故障越嚴(yán)重,數(shù)據(jù)經(jīng)過(guò)EEMD分解后所得譜峭度與正常值偏差更大,故障特征信息更明顯。由表2、表3可知,EEMD相比于EMD可以更有效的提取軸承信號(hào)的故障信息。通過(guò)計(jì)算分解后的各個(gè)IMF分量,將含有故障的軸承進(jìn)行分解篩選,選取譜峭度與正常值3偏差較大、相關(guān)系數(shù)的絕對(duì)值較大的分量進(jìn)行數(shù)據(jù)重構(gòu),并作為神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)集。
表2 EEMD-滾動(dòng)體故障和EMD-滾動(dòng)體故障(0.007 in)
表3 EEMD-滾動(dòng)體故障和EMD-滾動(dòng)體故障(0.014 in)
將重構(gòu)后的信號(hào)輸入主成分分析算法中計(jì)算,按照7∶3的比例分為測(cè)試集與訓(xùn)練集,放入一維卷積神經(jīng)網(wǎng)絡(luò)中。本文基于經(jīng)典卷積網(wǎng)絡(luò)LeNet-5模型并多次調(diào)試,最終選取的各個(gè)參數(shù)如表4所示。
表4 卷積層參數(shù)
本次實(shí)驗(yàn)所使用的深度學(xué)習(xí)框架為T(mén)ensorflow,編程語(yǔ)言為Python。計(jì)算機(jī)配置為銳龍R7-5800H,英偉達(dá)GeForce RTX3050Ti,16G內(nèi)存。此次實(shí)驗(yàn)每組數(shù)據(jù)中包括1 000個(gè)數(shù)據(jù)點(diǎn),通過(guò)五折交叉驗(yàn)證法確定最優(yōu)網(wǎng)絡(luò)模型,測(cè)試階段重復(fù)5次,最終測(cè)試結(jié)果取均值。
通過(guò)多次對(duì)比實(shí)驗(yàn),10類(lèi)故障信號(hào)分類(lèi)準(zhǔn)確率和損失值如圖2、圖3所示,經(jīng)過(guò)500次迭代后準(zhǔn)確率趨于穩(wěn)定。通過(guò)t-SNE技術(shù)對(duì)原始數(shù)據(jù)和經(jīng)過(guò)訓(xùn)練的模型進(jìn)行特征可視化分類(lèi),如圖4所示(只模擬分類(lèi)擬合情況,橫、縱坐標(biāo)無(wú)實(shí)際意義),未經(jīng)過(guò)模型訓(xùn)練的各個(gè)故障混亂,經(jīng)過(guò)訓(xùn)練后的模型故障標(biāo)簽7和標(biāo)簽8發(fā)生分類(lèi)錯(cuò)誤。通過(guò)圖5可知EEMD算法過(guò)程中存在端點(diǎn)效應(yīng)而導(dǎo)致分類(lèi)錯(cuò)誤。
圖2 準(zhǔn)確率 圖3 損失值
圖4 特征可視化 圖5 混淆矩陣
為了驗(yàn)證本文所采用的軸承診斷方法的適用性和準(zhǔn)確性,通過(guò)使用機(jī)器學(xué)習(xí)中的分類(lèi)方法對(duì)處理后的數(shù)據(jù)進(jìn)行對(duì)比。將上述處理好的數(shù)據(jù)作為輸入數(shù)據(jù)輸入到EEMD-CNN和隨機(jī)森林中,10次實(shí)驗(yàn)測(cè)試結(jié)果為:本文方法平均準(zhǔn)確率98.6%,EEMD-CNN平均準(zhǔn)確率92.3%,EEMD-隨機(jī)森林平均準(zhǔn)確率86.6%??芍ㄟ^(guò)使用EEMD-PCA-1DCNN的方法可以有效的提取故障類(lèi)型的振動(dòng)信號(hào)特征并分類(lèi),相比于其他算法有最高的平均準(zhǔn)確率(98.6%),特征識(shí)別及分類(lèi)效率有著明顯的提高,證明本文所提方法的可行性與有效性。
因軸承故障的振動(dòng)信號(hào)復(fù)雜且包含有多種干擾,本文提出一種基于EEMD-PCA-1D-CNN的故障診斷方法,由對(duì)比結(jié)果可知,本文的方法在軸承故障診斷分類(lèi)中準(zhǔn)確率更高。本文在EEMD處理時(shí)數(shù)據(jù)產(chǎn)生了端點(diǎn)效應(yīng)而導(dǎo)致準(zhǔn)確率降低,還應(yīng)探究多種網(wǎng)絡(luò)及算法優(yōu)化以獲得最優(yōu)模型,并通過(guò)變工況設(shè)計(jì)實(shí)驗(yàn)增加網(wǎng)絡(luò)模型的魯棒性和泛化性。