陳 劍,黃凱旋,呂伍佯,劉圓圓,楊 斌,劉幸福,蔡坤奇
(1.合肥工業(yè)大學(xué) 噪聲振動(dòng)研究所,安徽 合肥 230009;2.安徽省汽車NVH技術(shù)研究中心,安徽 合肥 230009)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械的重要元件之一,在交通、工程機(jī)械等領(lǐng)域中獲得廣泛應(yīng)用。隨著旋轉(zhuǎn)機(jī)械高轉(zhuǎn)速、大載荷、工作時(shí)間長的發(fā)展趨勢,軸承的運(yùn)行工況逐漸復(fù)雜,實(shí)際故障類型通常是變工況下的復(fù)合型故障。然而,現(xiàn)有故障診斷方法使用的軸承數(shù)據(jù)集大多來源于穩(wěn)態(tài)轉(zhuǎn)速或轉(zhuǎn)速變化較小,與實(shí)際工況差異較大。因此,適用于變工況的軸承故障診斷方法具有重大意義。
由于旋轉(zhuǎn)機(jī)械工況復(fù)雜,采集的振動(dòng)信號混疊多種頻率成分,有效的特征提取成為故障診斷的關(guān)鍵。文獻(xiàn)[1]提出了自適應(yīng)分解信號的變分模態(tài)分解,實(shí)現(xiàn)了不同頻率成分的有效分離。文獻(xiàn)[2~4]分別將變分模態(tài)分解與廣義分形維數(shù)矩陣、馬田系統(tǒng)、數(shù)據(jù)驅(qū)動(dòng)時(shí)域分析方法結(jié)合,實(shí)現(xiàn)軸承的故障診斷。
近年來,深度學(xué)習(xí)憑借強(qiáng)大的自適應(yīng)特征提取優(yōu)勢,擺脫了傳統(tǒng)機(jī)器學(xué)習(xí)過于依賴特征提取的缺點(diǎn),在數(shù)據(jù)診斷、數(shù)據(jù)監(jiān)測等方向得到廣泛應(yīng)用。文獻(xiàn)[5~7]分別將Inception-v3網(wǎng)絡(luò)、離散小波變換、奇異值分解與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,實(shí)現(xiàn)了有效的故障診斷。文獻(xiàn)[8]構(gòu)建了引入領(lǐng)域適配約束的深度殘差網(wǎng)絡(luò),遷移了實(shí)驗(yàn)積累的故障診斷數(shù)據(jù),實(shí)現(xiàn)對工程實(shí)際裝備的故障診斷。文獻(xiàn)[9]將支持向量機(jī)融入卷積神經(jīng)網(wǎng)絡(luò)模型,提升了故障識別準(zhǔn)確率、模型收斂速度和泛化能力。
根據(jù)上述研究,本文提出基于變分模態(tài)分解(variational mode decomposition,VMD)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的變工況軸承故障診斷方法。使用固有模態(tài)函數(shù)(intrinsic mode function,IMF)分解后的IMF構(gòu)造特征圖,設(shè)計(jì)了對應(yīng)的卷積層和池化層結(jié)構(gòu),充分利用卷積神經(jīng)網(wǎng)絡(luò)的特征提取能力,直接進(jìn)行特征提取并分類。同時(shí),通過加入激活函數(shù)、正則化損失函數(shù)、調(diào)整優(yōu)化方法等手段提高模型的適應(yīng)性和泛化性。最終,該模型不僅在穩(wěn)態(tài)轉(zhuǎn)速數(shù)據(jù)上取得較高的準(zhǔn)確率,而且適用于變轉(zhuǎn)速數(shù)據(jù)的識別,能取得較好的結(jié)果。
VMD 算法將原始信號放入變分模型進(jìn)行分解,計(jì)算得到IMF。變分模型的構(gòu)建如下:1)對每個(gè)模態(tài)函數(shù)uk(t),經(jīng)Hilbert變換得到解析信號;2)通過增加指數(shù)項(xiàng)e-jωkt調(diào)節(jié)每個(gè)模態(tài)的預(yù)估中心頻率,將各模態(tài)的頻譜變換到基帶上;3)采用高斯平滑估計(jì)解析信號的帶寬,得到變分約束模型,見式(1):
(1)
同時(shí),VMD算法加入二次懲罰因子α和拉格朗日乘法算子λ,將式(1)構(gòu)建成無約束問題,其增廣的拉格朗日表達(dá)式見式(2)。
(2)
VMD分解層數(shù)根據(jù)譜相關(guān)系數(shù)確定。使用式(3)計(jì)算各分量與原始信號的譜相關(guān)系數(shù),尋找其最小值低于閾值的情況,進(jìn)而確定分解層數(shù)。
(3)
式中:X(k)、Y(k)分別表示兩信號的傅里葉變換的模;n表示頻域離散值序列號。
本文軸承試驗(yàn)信號的每個(gè)樣本包含1000個(gè)數(shù)據(jù)點(diǎn),利用IVMD計(jì)算得到樣本集最優(yōu)分解層數(shù)為3,即單個(gè)樣本數(shù)據(jù)分解后轉(zhuǎn)化為1000×3的格式。
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),一般包含卷積層、池化層、全連接層和輸出層。卷積層由若干個(gè)卷積核組成,用于提取局部區(qū)域的特征。訓(xùn)練時(shí)卷積核根據(jù)設(shè)定步長做空間移動(dòng),對全局進(jìn)行特征提取獲得特征圖,數(shù)學(xué)模型見式(4)。
(4)
池化層對卷積后的特征圖進(jìn)行降采樣,減小數(shù)據(jù)的規(guī)模,突出提取后的特征。全連接層能將池化后的特征圖轉(zhuǎn)化為一維向量,實(shí)現(xiàn)對局部特征數(shù)據(jù)的整合。經(jīng)過輸出層的Softmax分類器處理后,可得到特征圖的最終診斷結(jié)果,完成對輸入特征的診斷和識別。
本文將單個(gè)樣本的數(shù)據(jù)格式構(gòu)建成100×10×3,用于神經(jīng)網(wǎng)絡(luò)的輸入層。第二層是卷積層,選取32個(gè)3×3卷積核,卷積后輸出32個(gè)98×8的特征圖。第三層是池化層,采用2×2最大池化,池化不改變特征圖個(gè)數(shù),尺寸變?yōu)?9×4。第四層卷積層使用64個(gè)4×3卷積核,輸出46×2特征圖。第五層池化層參數(shù)與第二層相同。第六、七層為全連接層,分別包含512、256個(gè)隱含節(jié)點(diǎn),實(shí)現(xiàn)對特征圖的非線性變換。輸出層有11個(gè)隱含節(jié)點(diǎn),加入Softmax函數(shù)計(jì)算特征數(shù)據(jù)屬于每個(gè)類別的概率,從而得到識別結(jié)果,模型示意圖見圖1。
圖1 卷積神經(jīng)網(wǎng)絡(luò)模型示意圖Fig.1 Convolution neural networkmodel diagram
為了防止模型過度擬合訓(xùn)練數(shù)據(jù),在第六、七層加入Dropout處理[10]。訓(xùn)練時(shí),Dropout會隨機(jī)使一定比例的隱含節(jié)點(diǎn)暫停工作,輸出值為0,這樣等于每個(gè)樣本只有部分?jǐn)?shù)據(jù)參與全連接層運(yùn)算,間接創(chuàng)造了很多新的隨機(jī)樣本。即使樣本數(shù)據(jù)存在缺失,也不會過多的影響模型的效果,防止模型過擬合。驗(yàn)證時(shí),卷積神經(jīng)網(wǎng)絡(luò)模型則不執(zhí)行Dropout,全連接層的所有隱含節(jié)點(diǎn)參與運(yùn)算。
各神經(jīng)層需要通過激活函數(shù)為模型引入非線性特征。修正線性單元(rectified linear unit,ReLU)[11]類似人腦的閾值響應(yīng)機(jī)制,神經(jīng)元平時(shí)處于抑制狀態(tài),信號超過閾值則被激活。本文選用ReLU6函數(shù),抑制ReLU線性增長部分,將上限設(shè)定為6,在低精度計(jì)算中有更好的魯棒性[12],見式(5)。
y=min(max(x,0),6)
(5)
交叉熵?fù)p失函數(shù)通過計(jì)算真實(shí)值與預(yù)測值之間的距離,評價(jià)模型的準(zhǔn)確程度;再通過正則化引入刻畫模型復(fù)雜程度的指標(biāo)。最終由交叉熵?fù)p失函數(shù)和正則化損失構(gòu)成模型的損失函數(shù),見式(6)。
(6)
式中:p(x)表示真實(shí)概率分布;q(x)表示預(yù)測的概率分布;λ表示正則化系數(shù);w表示正則化的權(quán)值。
采用ADAM優(yōu)化算法更新卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)。ADAM以梯度的一階矩估計(jì)和二階矩估計(jì)自適應(yīng)調(diào)整參數(shù)的學(xué)習(xí)率,在反向傳播過程中不斷更新權(quán)值以獲得全局最優(yōu)解,使損失函數(shù)值最小。模型測試的硬件環(huán)境為 Intel i7-8750H+GTX 1050ti,軟件環(huán)境為 Windows10+Python3.6+TensorFlow。
試驗(yàn)數(shù)據(jù)來自合肥工業(yè)大學(xué)高速軸承試驗(yàn)機(jī),結(jié)構(gòu)如圖2所示[13]。試驗(yàn)軸承為單列圓柱滾子軸承,型號分別為內(nèi)圈可拆的NU1010EM和外圈可拆的N1010EM,以方便使用激光打標(biāo)機(jī)和線切割加工出軸承故障損傷點(diǎn)。軸承故障類型不僅有內(nèi)圈、外圈、滾動(dòng)體的單點(diǎn)損傷,還包括了多點(diǎn)損傷以及復(fù)合型故障損傷,總計(jì)11種故障類型,具體見表1。
圖2 軸承信號采集試驗(yàn)裝置Fig.2 Bearing signal acquisition test device
表1 滾動(dòng)軸承故障參數(shù)Tab.1 Parameters of rolling bearing fault
試驗(yàn)數(shù)據(jù)利用LMS Test.lab軟件進(jìn)行采集,采樣頻率為20.48 kHz,分別測試了以上11種故障類型的滾動(dòng)軸承在2,4 kN載荷下,在2000,3000,4000 r/min等3種穩(wěn)態(tài)轉(zhuǎn)速工況和2000~4000 r/min變轉(zhuǎn)速運(yùn)行工況下的振動(dòng)信號數(shù)據(jù),具體工況描述見表2。
表2 工況參數(shù)Tab.2 Parameters of working condition
數(shù)據(jù)集分為訓(xùn)練集和兩個(gè)測試集,訓(xùn)練集和測試集1為穩(wěn)態(tài)工況下的數(shù)據(jù);測試集2為變工況的數(shù)據(jù)。采用獨(dú)熱碼對11種故障類別進(jìn)行編碼,每種類別對應(yīng)一個(gè)向量,維數(shù)為11。例如,正常狀態(tài)的軸承對應(yīng)類別1,編碼為[1,0,0,0,0,0,0,0,0,0,0],以此類推構(gòu)建出全部標(biāo)簽。每個(gè)樣本的采樣點(diǎn)數(shù)為1000,具體數(shù)量和對應(yīng)工況見表3。
表3 方法驗(yàn)證數(shù)據(jù)集Tab.3 Data set for verifying method
本文使用分類混淆矩陣表示模型的預(yù)測結(jié)果?;煜仃嚨男斜硎緮?shù)據(jù)的真實(shí)類別,列表示模型預(yù)測的類別。類別1對應(yīng)正常信號,其余10種類別對應(yīng)10種故障,用第1行第1列的數(shù)據(jù)除以第1行和第1列所有數(shù)據(jù)之和,其商值定義為判斷軸承是否故障的診斷準(zhǔn)確率。對角線所有數(shù)據(jù)的平均值定義為分辨軸承故障類別的識別準(zhǔn)確率。
卷積神經(jīng)網(wǎng)絡(luò)使用訓(xùn)練集進(jìn)行參數(shù)的訓(xùn)練,分別使用穩(wěn)態(tài)轉(zhuǎn)速的測試集1和變化轉(zhuǎn)速的測試集2驗(yàn)證模型的診斷和識別能力,得到分類混淆矩陣,結(jié)果見圖3。
圖3 CNN在測試集1、測試集2的分類混淆矩陣Fig.3 Classification confusion matrix of CNN for sets 1 and sets 2
由圖3計(jì)算可得,模型在測試集1的診斷/識別準(zhǔn)確率分別為100%/99.83%;在測試集2的診斷/識別準(zhǔn)確率分別為100%/98.86%。從結(jié)果可以看出,當(dāng)轉(zhuǎn)速在2000~4000 r/min變化時(shí),模型的診斷準(zhǔn)確率沒有變化,可以正確判斷軸承是否發(fā)生故障;識別準(zhǔn)確率降低0.97%,對工況8~11這4種復(fù)合型故障的混淆概率增加。這是因?yàn)閺?fù)合型故障包含兩種故障成分,損傷點(diǎn)之間相互接觸,波形混疊情況更嚴(yán)重,干擾了特征的提取??傮w上說,模型在穩(wěn)態(tài)轉(zhuǎn)速和變轉(zhuǎn)速下均實(shí)現(xiàn)了較高的診斷/識別率,轉(zhuǎn)速變化對模型的影響較小。
考慮到不同的數(shù)據(jù)格式和Dropout值會影響模型的診斷結(jié)果,進(jìn)行了多組試驗(yàn),得到不同參數(shù)下模型在測試集1、測試集2上的診斷/分類準(zhǔn)確率,見表4。格式100×10×3在4種Dropout值時(shí)的診斷準(zhǔn)確率均為100%,分類準(zhǔn)確率也普遍高于另外2種,因此將其確定為模型的輸入數(shù)據(jù)格式。而Dropout值為0.6時(shí),該數(shù)據(jù)格式的診斷/分類準(zhǔn)確率的平均值更高,最終將Dropout值定為0.6。
表4 不同參數(shù)下的診斷結(jié)果Tab.4 Diagnosis results under different parameters (%)
為了進(jìn)一步驗(yàn)證本文模型的性能,選擇深度殘差網(wǎng)絡(luò)(deep residual network,ResNet)[14]和支持向量機(jī)(support vector machine,SVM)進(jìn)行診斷效果對比。ResNet是2015年提出的深度學(xué)習(xí)模型,曾在ImageNet比賽中獲得冠軍。SVM是軸承故障診斷常用的機(jī)器學(xué)習(xí)模型,能實(shí)現(xiàn)不錯(cuò)的分類效果。
由于SVM需要預(yù)先對數(shù)據(jù)集提取特征,這里計(jì)算每個(gè)IMF的平均值、峰值、均方根、波峰因子、裕度因子、脈沖系數(shù)、形狀系數(shù)、偏度、峭度、方差[3],用這些常用參數(shù)構(gòu)成特征參數(shù)集。訓(xùn)練時(shí)使用訓(xùn)練集對應(yīng)的特征參數(shù)集進(jìn)行SVM模型的訓(xùn)練,驗(yàn)證在測試集1、測試集2對應(yīng)的特征參數(shù)集上的診斷結(jié)果。
圖4 SVM在測試集1、測試集2的分類混淆矩陣Fig.4 Classification confusion matrix of SVM for sets 1 and sets 2
SVM的分類混淆矩陣見圖4。計(jì)算可知,在測試集1的診斷/識別準(zhǔn)確率為91.67%/91.35%;在測試集2的診斷/識別準(zhǔn)確率為80.10%/84.27%??梢姡琒VM的預(yù)測結(jié)果一般,對軸承正常/故障的診斷存在偏差,對復(fù)合型故障類型的識別效果較差,轉(zhuǎn)速變化對SVM的診斷率和識別率影響較大。
圖5 ResNet在測試集1、測試集2的分類混淆矩陣Fig.5 Classification confusion matrix of ResNet for sets 1 and sets 2
ResNet的分類混淆矩陣見圖5,診斷/識別準(zhǔn)確率為99.50%/99.84%、98.03%/95.82%。
ResNet對2個(gè)測試集的診斷結(jié)果高于SVM,體現(xiàn)了深度學(xué)習(xí)模型在復(fù)雜數(shù)據(jù)的自適應(yīng)特征提取和多分類問題的處理上具有一定的優(yōu)勢。對于穩(wěn)態(tài)工況,ResNet模型與本文CNN相差不大,但對于變轉(zhuǎn)速工況,ResNet模型的診斷/識別率均低于本文CNN模型,說明其適應(yīng)性不如本模型,進(jìn)一步證實(shí)了本文方法的有效性。
為了驗(yàn)證VMD分解對本模型的作用,現(xiàn)在使用訓(xùn)練集對應(yīng)的原始樣本對模型進(jìn)行訓(xùn)練,使用測試集1、2對應(yīng)的原始樣本進(jìn)行驗(yàn)證,結(jié)果見表5。從表中可以看出,未使用VMD分解的模型在測試集1、2下的診斷結(jié)果低于本文模型,說明通過VMD分解構(gòu)建多層IMF分量的方法有助于本文卷積神經(jīng)網(wǎng)絡(luò)的特征提取,能夠取得更好的診斷結(jié)果。
表5 本模型在兩種方法下的診斷結(jié)果Tab.5 Diagnosisresults of databy two CNN methods
本文提出了基于VMD和卷積神經(jīng)網(wǎng)絡(luò)的變工況滾動(dòng)軸承故障診斷方法,經(jīng)對比驗(yàn)證后得到以下結(jié)論:1)提出的卷積神經(jīng)網(wǎng)絡(luò)模型可以自適應(yīng)提取特征,有效實(shí)現(xiàn)滾動(dòng)軸承振動(dòng)信號的故障診斷,省去特征參數(shù)的選擇過程;2)通過結(jié)構(gòu)設(shè)計(jì)和優(yōu)化技術(shù)提高了模型的適應(yīng)性,用穩(wěn)態(tài)轉(zhuǎn)速下的數(shù)據(jù)集訓(xùn)練,對在其轉(zhuǎn)速區(qū)間內(nèi)變化的軸承數(shù)據(jù)仍有較好的診斷和識別效果,更適合復(fù)雜工況的旋轉(zhuǎn)機(jī)械。