李澤東, 李志農(nóng), 陶俊勇, 毛清華, 張旭輝
(1.南昌航空大學(xué) 無損檢測(cè)教育部重點(diǎn)實(shí)驗(yàn)室, 江西 南昌 330063;2.國防科技大學(xué) 裝備綜合保障技術(shù)重點(diǎn)實(shí)驗(yàn)室, 湖南 長沙 410073;3.陜西省礦山機(jī)電裝備智能監(jiān)測(cè)重點(diǎn)實(shí)驗(yàn)室, 陜西 西安 710054)
滾動(dòng)軸承作為航空發(fā)動(dòng)機(jī)的關(guān)鍵部件,通常處于高轉(zhuǎn)速、大噪聲環(huán)境下,極易產(chǎn)生故障,從而影響發(fā)動(dòng)機(jī)正常有效的工作。因此,有必要研究高轉(zhuǎn)速下航空發(fā)動(dòng)機(jī)滾動(dòng)軸承的故障診斷方法。
近年來,基于深度學(xué)習(xí)的滾動(dòng)軸承智能診斷方法取得了很大進(jìn)展。其基本思路是提取振動(dòng)信號(hào)的時(shí)頻特征、灰度圖等,然后,輸入到深度學(xué)習(xí)網(wǎng)絡(luò)中進(jìn)行故障識(shí)別[1-5]。例如,文獻(xiàn)[1]中先將軸承振動(dòng)信號(hào)通過傅里葉變換預(yù)處理為頻譜圖,然后將頻譜圖作輸入到深度卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行軸承故障診斷。文獻(xiàn)[2]將軸承振動(dòng)信號(hào)預(yù)處理為時(shí)頻圖,再將時(shí)頻圖作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入以識(shí)別不同類型的軸承故障。文獻(xiàn)[3]中將振動(dòng)信號(hào)轉(zhuǎn)換為灰度圖像,再結(jié)合深度卷積神經(jīng)網(wǎng)絡(luò)診斷軸承不同類型的故障。文獻(xiàn)[4]中利用連續(xù)小波變換對(duì)軸承的原始振動(dòng)信號(hào)處理為時(shí)頻圖,再結(jié)合深度卷積神經(jīng)網(wǎng)絡(luò)識(shí)別不同故障。文獻(xiàn)[5]中結(jié)合紅外熱圖像和深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)軸承進(jìn)行故障診斷。還有以端到端的方式直接對(duì)振動(dòng)信號(hào)進(jìn)行訓(xùn)練從而進(jìn)行故障診斷[6-10]。文獻(xiàn)[6-10]中均將軸承的原始振動(dòng)信號(hào)直接作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入,形成了端到端的故障診斷。這些方法都是建立在深度卷積神經(jīng)網(wǎng)絡(luò)中卷積層可以自適應(yīng)地提取信號(hào)特征的基礎(chǔ)上[11]。然而,深度卷積神經(jīng)網(wǎng)絡(luò)中的卷積層在對(duì)輸入進(jìn)行卷積運(yùn)算時(shí),主要針對(duì)局部感受野提取信息,容易忽略全局信息??紤]到注意力機(jī)制是一種可以捕捉全局感受野捕捉的方法,通過對(duì)不同特征賦予不同權(quán)重,以提取更加有用的局部信息[12]。目前,一些結(jié)合注意力機(jī)制和深度卷積神經(jīng)網(wǎng)絡(luò)的方法已經(jīng)被應(yīng)用到故障診斷中。文獻(xiàn)[13-14]將軸承故障振動(dòng)信號(hào)轉(zhuǎn)換為時(shí)頻圖后,輸入到深度卷積神經(jīng)網(wǎng)絡(luò)中,利用注意力機(jī)制進(jìn)行融合圖像的多通道信息,進(jìn)行故障識(shí)別。文獻(xiàn)[15]通過構(gòu)建多尺度的卷積神經(jīng)網(wǎng)絡(luò)對(duì)信號(hào)進(jìn)行訓(xùn)練,利用注意力機(jī)制對(duì)多尺度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行融合,實(shí)現(xiàn)軸承的故障診斷。文獻(xiàn)[16]提出一種特征注意力機(jī)制,考慮了故障信號(hào)時(shí)間尺度的干擾,從而進(jìn)行滾動(dòng)軸承的故障診斷。然而,上述關(guān)于注意力機(jī)制與深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)合是將兩個(gè)孤立部分機(jī)械式地結(jié)合,注意力機(jī)制要么在深度卷積神經(jīng)網(wǎng)絡(luò)之前,要么在深度卷積神經(jīng)網(wǎng)絡(luò)之后,注意力機(jī)制中的參數(shù)未參與到整個(gè)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中。很顯然,這種注意力機(jī)制與深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)合,若注意力機(jī)制中的參數(shù)選擇不恰當(dāng),往往得不到滿意的故障識(shí)別效果。因此,有必要探討新的注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)以克服此不足。
基于此,本文提出一種基于注意力增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)(AACNN)的機(jī)械故障診斷方法。相對(duì)傳統(tǒng)的注意力卷積神經(jīng)網(wǎng)絡(luò),所提方法將注意力機(jī)制和卷積層結(jié)合構(gòu)造了注意力增強(qiáng)卷積層,使得注意力參數(shù)和卷積參數(shù)在整個(gè)網(wǎng)絡(luò)中進(jìn)行正向傳播和反向調(diào)優(yōu)。然后,將所提方法應(yīng)用到航空發(fā)動(dòng)機(jī)滾動(dòng)軸承故障診斷中,并與傳統(tǒng)的注意力卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比研究,以驗(yàn)證構(gòu)建的AACNN有效性。
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算主要針對(duì)局部感受野進(jìn)行的,因此,在提取特征時(shí)會(huì)失去一些全局信息。而注意力機(jī)制具有捕獲遠(yuǎn)程交互的作用,可以更好地關(guān)注全局信息。因此,將注意力機(jī)制和卷積運(yùn)算融合起來構(gòu)造了一種注意力增強(qiáng)卷積運(yùn)算。該運(yùn)算可以通過注意力機(jī)制將輸入經(jīng)卷積后的映射圖進(jìn)行級(jí)聯(lián)來提取和融合特征,并且將注意力機(jī)制貫穿整個(gè)神經(jīng)網(wǎng)絡(luò)模型。AACNN中使用多頭注意力機(jī)制與卷積融合構(gòu)造注意力增強(qiáng)卷積層,使模型對(duì)數(shù)據(jù)在高維空間和特征子空間中進(jìn)行融合,具體過程如下。
(1)
MHA(X)=Concat[O1,…,ONh]WO
(2)
式中:Concat[]表示將每個(gè)單頭的輸出串聯(lián)到一起;Wo表示線性變換矩陣,Wo∈dv×dv。
(3)
(4)
(5)
注意力增強(qiáng)卷積采用多頭注意力機(jī)制共同構(gòu)建原始空間,每一個(gè)頭都對(duì)應(yīng)自己的特征子空間。同時(shí),將卷積操作加入對(duì)局部特征提取,所得注意力增強(qiáng)卷積可以更容易地對(duì)不同空間維度的輸入X進(jìn)行操作,其輸出XAA為
XAA=Concat[Conv(X),MHA(X)]
(6)
式中:Conv(·) 為標(biāo)準(zhǔn)卷積運(yùn)算。
輸入通過注意力增強(qiáng)卷積層提取融合特征后,接下來需要進(jìn)行標(biāo)準(zhǔn)的卷積運(yùn)算。對(duì)于經(jīng)過注意力增強(qiáng)卷積層后的輸出XAA,通過卷積核繼續(xù)計(jì)算其不同的特征,具體的卷積過程為
(7)
卷積層之后通常是池化層,用于對(duì)經(jīng)過卷積操作后得到的高維輸出的降維,池化的具體計(jì)算為
(8)
池化的方式通常有最大池化和平均池化等。經(jīng)過卷積和池化后,通常會(huì)對(duì)池化后的輸出進(jìn)行鋪平操作,再通過全連接層進(jìn)行連接,最后進(jìn)行分類輸出。
(9)
(10)
(11)
在模型的訓(xùn)練反向傳播中,以(12)式所示的交叉熵?fù)p失函數(shù),作為模型的損失函數(shù),用于衡量模型輸出yo與真實(shí)輸出y之間的誤差。對(duì)模型進(jìn)行反向求導(dǎo),訓(xùn)練的目標(biāo)就是使輸出值與真實(shí)值盡可能地接近。
loss=-(ylg (yo)+(1-yo)lg (1-y))
(12)
(13)
式中:L(fθ(θw;X,y))為每次迭代中所有樣本的損失;m為總樣本數(shù)。
為了加快尋找最優(yōu)值的速度,利用Adam優(yōu)化器對(duì)損失函數(shù)進(jìn)行優(yōu)化,具體過程如下:
在每次迭代t(t=1,2,…,N,N為最大迭代次數(shù))中,對(duì)θw求梯度gt,得
(14)
式中:“:=”表示更新運(yùn)算。
計(jì)算1階矩估計(jì)mt和2階矩估計(jì)vt,可得
mt=β1mt-1+(1-β1)gt
(15)
(16)
式中:β1為控制動(dòng)量與當(dāng)前梯度的指數(shù)衰減率;β2為控制之前梯度的平方影響情況的指數(shù)衰減率。為防止mt和vt在初始化時(shí)偏向0,采用(17)式和(18)式對(duì)其進(jìn)行糾正:
(17)
(18)
對(duì)參數(shù)集θw進(jìn)行更新,可得
(19)
式中:η為學(xué)習(xí)率;ε為避免除數(shù)為0的修正項(xiàng)。
基于AACNN進(jìn)行滾動(dòng)軸承故障定性診斷時(shí),分為信號(hào)采集與樣本劃分、樣本信號(hào)特征模量提取、數(shù)據(jù)集構(gòu)建、AACNN設(shè)計(jì)與訓(xùn)練、航空發(fā)動(dòng)機(jī)滾動(dòng)軸承故障診斷5個(gè)步驟,流程如圖1所示。圖1中head1和head2為注意力機(jī)制操作的輸出對(duì)象。
圖1 面向故障診斷的AACNNFig.1 Fault diagnosis model based on AACNN
具體步驟如下:
1)信號(hào)采集與樣本劃分:通過加速度傳感器采集滾動(dòng)軸承的振動(dòng)信號(hào),利用等長的窗口進(jìn)行劃分,得到信號(hào)的樣本。為了對(duì)數(shù)據(jù)增強(qiáng)處理,采用重疊切片方法,即劃分樣本的窗口長度小于單個(gè)樣本信號(hào)。
2)樣本信號(hào)特征模量提?。涸诟咿D(zhuǎn)速、大噪聲條件下,滾動(dòng)軸承的振動(dòng)信號(hào)非線性、非平穩(wěn)性較強(qiáng)。因此,通過信號(hào)處理的方式,如經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)、變分模態(tài)分解(VMD)和小波包分解(WPD)等,將原始振動(dòng)信號(hào)分解成不同尺度的特征模量。
3)數(shù)據(jù)集構(gòu)建:將上述特征模量按順序堆疊成一個(gè)多通道樣本,將所有樣本進(jìn)行同樣的操作構(gòu)造多通道樣本數(shù)據(jù)集。創(chuàng)建好多通道數(shù)據(jù)集后,將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集。
4)AACNN設(shè)計(jì)與訓(xùn)練:AACNN的性能與卷積層的數(shù)量和大小密切相關(guān)。其中卷積核尺寸大小需要根據(jù)一些基本的設(shè)計(jì)來確定,相對(duì)小卷積核來說,大卷積核可以提高感受野。但是AACNN中包含注意力增強(qiáng)卷積層,它可以通過多頭注意力機(jī)制關(guān)注全局感受野。因此,AACNN具有強(qiáng)大的自適應(yīng)提取和融合特征的能力。在設(shè)計(jì)時(shí),注意力增強(qiáng)卷積層的注意力機(jī)制頭數(shù)目等于輸入多通道特征模量數(shù)。其余卷積層采用小尺寸的卷積核,目的是加深網(wǎng)絡(luò),從而更好地學(xué)習(xí)特征,提高網(wǎng)絡(luò)的表達(dá)能力。
按照上述原則建立AACNN模型,通過反復(fù)實(shí)驗(yàn)調(diào)整參數(shù),模型具體參數(shù)如表1所示。為防止模型過擬合,在模型中加入Dropout,它將網(wǎng)絡(luò)中的神經(jīng)元以一定的概率置為0,以提高網(wǎng)絡(luò)的泛化能力。用構(gòu)建好的訓(xùn)練集進(jìn)行訓(xùn)練,調(diào)試超參數(shù),獲得性能較好的AACNN模型。
5)航空發(fā)動(dòng)機(jī)滾動(dòng)軸承故障診斷:利用測(cè)試集驗(yàn)證AACNN模型故障診斷的有效性,并使用10-fold交叉驗(yàn)證方式來評(píng)估模型的性能。為了驗(yàn)證模型的泛化能力,通過不同信噪比的信號(hào)來測(cè)試模型。
本文所提方法通過信號(hào)處理的方式對(duì)高轉(zhuǎn)速下的滾動(dòng)軸承振動(dòng)信號(hào)提取特征模量,利用AACNN對(duì)特征模量按一定權(quán)重進(jìn)行自適應(yīng)特征融合和選擇,更好地適用于高轉(zhuǎn)速下的滾動(dòng)軸承故障診斷。
表1 AACNN模型結(jié)構(gòu)參數(shù)Table 1 Parameters of the AACNN model
實(shí)驗(yàn)數(shù)據(jù)來源于高速環(huán)境下航空發(fā)動(dòng)機(jī)滾動(dòng)軸承測(cè)試臺(tái)[18],如圖2所示。實(shí)驗(yàn)臺(tái)上包含一個(gè)帶有3個(gè)軸承的高速主軸(見圖3),一套動(dòng)力系統(tǒng),潤滑器和兩個(gè)加速度傳感器等。動(dòng)力系統(tǒng)通過一個(gè)滑架為軸承加載,潤滑系統(tǒng)通過油脂潤滑的方式為軸承潤滑,主軸的速度是通過變頻器的控制面板設(shè)置的。主軸安裝時(shí),在兩個(gè)相同的滾柱軸承外圈帶有一對(duì)支撐架(見圖3中的位置B1和B3)。該高速軸專門設(shè)計(jì)用于高達(dá)35 000 r/min的速度。本文采用的航空高速軸承數(shù)據(jù)是在12 000 r/min轉(zhuǎn)速下和無負(fù)載條件下采集的,采樣頻率為51 200 Hz,共采集了B1位置的軸承7種不同損傷程度工況進(jìn)行故障診斷,包含正常工況,450 μm內(nèi)圈故障,250 μm內(nèi)圈故障,150 μm內(nèi)圈故障,450 μm滾動(dòng)體故障,250 μm 滾動(dòng)體故障和150 μm滾動(dòng)體故障,每種工況400個(gè)樣本。
圖2 實(shí)驗(yàn)臺(tái)Fig.2 Test rig
圖3 航空發(fā)動(dòng)機(jī)滾動(dòng)軸承和主軸Fig.3 Rolling bearings and spindle of an aero-engine
為驗(yàn)證AACNN對(duì)航空高速軸承故障診斷的效果,將其與注意力機(jī)制+深度卷積神經(jīng)網(wǎng)絡(luò)(ACNN)進(jìn)行對(duì)比研究。首先,分別對(duì)軸承振動(dòng)信號(hào)進(jìn)行WPD[19]、VMD[20]和EMD[21],提取特征模量;然后,將特征模量分別通過AACNN與ACNN進(jìn)行訓(xùn)練,AACNN按上述1.2節(jié)中第4步設(shè)計(jì),對(duì)比的ACNN模型則將注意力增強(qiáng)卷積層直接換為“注意力機(jī)制+卷積層”,其他參數(shù)不變。通過模型對(duì)比驗(yàn)證所提方法的自適應(yīng)特征提取能力和故障識(shí)別能力。
對(duì)于WPD-AACNN模型,將采集到的信號(hào)樣本進(jìn)行WPD,對(duì)其進(jìn)行3層分解,得到8個(gè)低頻和高頻分量信號(hào)特征模量,如圖4所示。然后將其堆疊成一個(gè)多通道的信號(hào)特征樣本。按圖1中的故障診斷流程,通過AACNN對(duì)其進(jìn)行特征融合和分類識(shí)別,識(shí)別結(jié)果如圖5所示,訓(xùn)練集和測(cè)試集的損失函數(shù)曲線逐漸收斂并穩(wěn)定下降,測(cè)試集準(zhǔn)確率約為99%,兩條曲線幾乎重合,模型過程中也并未產(chǎn)生過擬合。
圖4 軸承250 μm內(nèi)圈故障WPD特征模量Fig.4 Feature modulus of the faults of a 250 μm inner ring using WPD
圖5 WPD-AACNN 模型診斷曲線圖Fig.5 Diagnostic curve of the WPD-AACNN model
為更好地對(duì)模型進(jìn)行分析,挖掘模型提取的隱式特征,采用t-SNE算法對(duì)模型中的卷積層的高維輸出進(jìn)行降維,使高維數(shù)據(jù)可視化。由于散點(diǎn)圖的坐標(biāo)軸無實(shí)際意義,采用P1、P2來表示[22]。圖6為輸入數(shù)據(jù)經(jīng)WPD-AACNN模型訓(xùn)練后注意力增強(qiáng)卷積層和其余卷積層的輸出特征可視化散點(diǎn)圖。觀察圖6可以發(fā)現(xiàn),經(jīng)過卷積層提取特征后,不同故障特征逐漸聚攏,到了第4層各狀態(tài)特征之間已經(jīng)明顯分開。
圖6 WPD-AACNN模型卷積層t-SNE特征散點(diǎn)圖Fig.6 Scatter plot of features extracted by convolution layers of the WPD-AACNN model using t-SNE
同樣,采用相同的多通道特征模量樣本,訓(xùn)練WPD-ACNN模型,所得結(jié)果如圖7所示,準(zhǔn)確率為95%左右,損失函數(shù)曲線平穩(wěn)收斂,模型收斂較好。圖8是輸入數(shù)據(jù)經(jīng)WPD-ACNN模型訓(xùn)練后各卷積層的特征可視化散點(diǎn)圖??梢园l(fā)現(xiàn)每層的不同故障特征逐漸聚攏,到了第4層各狀態(tài)特征之間已經(jīng)明顯分開。但與圖6相比,由于AACNN關(guān)注了全局信息,可以將不同工況下故障特征聚合得更好、更精確。
圖7 WPD-ACNN模型診斷曲線圖Fig.7 Diagnostic curve of the WPD-ACNN model
圖8 WPD-ACNN模型卷積層t-SNE特征散點(diǎn)圖Fig.8 Scatter plot of features extracted by convolution layers of WPD-ACNN model using t-SNE
對(duì)于VMD-AACNN模型,通過VMD對(duì)信號(hào)進(jìn)行分解。將原始信號(hào)進(jìn)行分解為如圖9所示的3層,并作為特征模量構(gòu)造多通道樣本輸入,進(jìn)行AACNN模型訓(xùn)練。所得結(jié)果如圖10所示。準(zhǔn)確率為95%左右,訓(xùn)練集和測(cè)試集兩條曲線幾乎重合,訓(xùn)練集和測(cè)試集損失函數(shù) 曲線逐漸收斂并穩(wěn)定下降,模型過程中也并未產(chǎn)生過擬合。圖11是輸入經(jīng)過VMD-AACNN模型訓(xùn)練后注意力增強(qiáng)卷積層和其余卷積層的輸出特征可視化散點(diǎn)圖??梢园l(fā)現(xiàn)不同故障特征逐漸聚攏,到了第4層各狀態(tài)特征之間幾乎明顯分開,只有部分特征重疊,不同類故障未完全分開。
圖9 軸承250 μm內(nèi)圈故障VMD特征模量Fig.9 Feature moduli of the faults of a 250 μm inner ring by VMD
圖10 VWD-AACNN損失函數(shù)曲線和準(zhǔn)確率曲線Fig.10 Diagnostic curve of the VMD-AACNN model
圖11 VWD-AACNN卷積層t-SNE特征散點(diǎn)圖Fig.11 Scatter plot of features extracted by convolution layers of the VMD-AACNN model using t-SNE
同樣,采用相同的VMD多通道特征模量樣本,訓(xùn)練VMD-ACNN模型,所得結(jié)果如圖12所示,準(zhǔn)確率為87%左右,損失函數(shù)曲線平穩(wěn)收斂,模型收斂較好。圖13為輸入經(jīng)VMD-ACNN模型后各卷積層的特征可視化散點(diǎn)圖,可以發(fā)現(xiàn)每層的不同故障特征逐漸聚攏,但是到了第4層,部分狀態(tài)特征之間已經(jīng)明顯分開,還有一些工況特征重疊,沒有完全分開。
圖12 VWD-ACNN模型損失函數(shù)曲線和準(zhǔn)確率曲線Fig.12 Diagnostic curve of the VMD-ACNN model
圖13 VWD-ACNN模型卷積層t-SNE特征散點(diǎn)圖Fig.13 Scatter plot of features extracted by convolution layers of the VMD-ACNN model using t-SNE
對(duì)于EMD-AACNN模型,在提取特征模量時(shí),由于EMD對(duì)信號(hào)樣本分解不確定性,通過峭度指標(biāo)對(duì)內(nèi)稟模式函數(shù)(IMF)分量進(jìn)行選擇有效的IMF。軸承250 μm內(nèi)圈故障通過EMD分解的IMF分量峭度值如圖14所示,為了清楚展示取了6個(gè)樣本。其中一個(gè)樣本只被分解了5次,與其他樣本分解值相差較大,剔除該樣本,得到圖15所示的IMF分量。對(duì)于樣本的峭度值從大到小的順序排列,即IMF3、IMF5、IMF6、IMF2、IMF4和IMF1,按此順序?qū)?個(gè)IMF分量進(jìn)行堆疊成一個(gè)多通道的不同特征樣本。
圖14 軸承250 μm內(nèi)圈故障EMD分解IMFs分量峭度值Fig.14 Kurtosis value of IMFs decomposed by EMD for the fault of a 250 μm inner ring bearing
圖15 軸承250 μm內(nèi)圈故障EMD信號(hào)分解特征模量Fig.15 Feature moduli of faults of a 250 μm inner ring by EMD
將上述構(gòu)建好的多通道特征模量樣本輸入到AACNN模型中進(jìn)行訓(xùn)練,所得結(jié)果如圖16所示。訓(xùn)練集和測(cè)試集的損失函數(shù)曲線逐漸收斂并穩(wěn)定下降,測(cè)試集準(zhǔn)確率約為85%,兩條曲線幾乎重合,模型過程中也并未產(chǎn)生過擬合。圖17為輸入經(jīng)EMD-AACNN模型訓(xùn)練后注意力增強(qiáng)卷積層和其余卷積層特征的可視化散點(diǎn)圖??梢园l(fā)現(xiàn)每層的不同故障特征逐漸聚攏,但是各工況特征之間并沒有明顯分開。
圖16 EMD-AACNN模型損失函數(shù)曲線和準(zhǔn)確率曲線Fig.16 Diagnostic curve of the EMD-AACNN model
圖17 EMD-AACNN卷積層t-SNE特征散點(diǎn)圖Fig.17 Scatter plot of features extracted by convolution layers of the EMD-AACNN model using t-SNE
同樣,采用EMD多通道特征模量樣本,訓(xùn)練EMD-ACNN模型,所得結(jié)果如圖18所示。準(zhǔn)確率約為76%左右,損失函數(shù)曲線平穩(wěn)收斂。圖19為輸入經(jīng)EMD-ACNN模型訓(xùn)練后各卷積層的特征可視化散點(diǎn)圖??梢园l(fā)現(xiàn)每層的不同故障特征聚類效果不好,各狀態(tài)特征之間特征混雜,從而反映了EMD-ACNN模型識(shí)別效果不好。
圖18 EMD-ACNN模型損失函數(shù)曲線和準(zhǔn)確率曲線Fig.18 Diagnostic curve of the EMD-ACNN model
圖19 EMD-ACNN模型卷積層t-SNE特征散點(diǎn)圖Fig.19 Scatter plot of features extracted by convolution layers of the EMD-ACNN model using t-SNE
對(duì)上述所建模型通過10-Fold交叉驗(yàn)證來驗(yàn)證模型的性能,所得結(jié)果如圖20所示。WPD-AACNN的平均準(zhǔn)確率為99.02±0.37,VMD-AACNN的平均準(zhǔn)確率為95.22±0.83,EMD-AACNN的平均準(zhǔn)確率為85.02±1.01,WPD-ACNN的平均準(zhǔn)確率為94.85±0.61,VMD-ACNN的平均準(zhǔn)確率為87.25±1.21,以及EMD-ACNN的平均準(zhǔn)確率為76.11±1.40。
圖20 10-Fold交叉驗(yàn)證診斷結(jié)果Fig.20 Diagnosis result of 10-fold cross validation
綜上所述, AACNN可以有效地對(duì)高轉(zhuǎn)速下的滾動(dòng)軸承進(jìn)行診斷,可以有效地融合通過信號(hào)處理提取的特征模量,而且相比于ACNN,其在融合特征信息時(shí),收斂速度更快。因此,所提算法可以有效地診斷不同損傷程度的滾動(dòng)軸承故障。
在實(shí)際應(yīng)用中,航空發(fā)動(dòng)機(jī)滾動(dòng)軸承處于噪聲的干擾,判斷模型是否適應(yīng)噪聲的分析尤為重要。上述實(shí)驗(yàn)中,數(shù)據(jù)為不添加噪聲的原始數(shù)據(jù),為更好地驗(yàn)證模型在噪聲環(huán)境下的泛化能力,將上述實(shí)驗(yàn)數(shù)據(jù)添加不同信噪比的高斯白噪聲以模擬噪聲信號(hào)。信噪比SNR定義為信號(hào)功率與噪聲功率的比值,通常用分貝表示,定義如下:
SNR=10lg(Psignal/Pnoise)
式中:Psignal表示信號(hào)的功率值;Pnoise表示噪聲的功率值。將SNR設(shè)置為-6~4 dB,為信號(hào)添加噪聲,信噪比越小,噪聲功率越大。通過對(duì)含噪數(shù)據(jù)進(jìn)行訓(xùn)練,不同信噪比下的測(cè)試集識(shí)別準(zhǔn)確率如表2所示。由表2分析可知,在添加噪聲后,信噪比越低,原信號(hào)的能量比越小,通過WPD、VMD和EMD構(gòu)建的多通道特征模量樣本也會(huì)包含更多的噪聲信息,通過WPD提取的特征模量包含各頻率的故障信息,在輸入網(wǎng)絡(luò)時(shí)更容易選擇有用的故障特征模量進(jìn)行特征提取。AACNN相對(duì)于“注意力機(jī)制+深度卷積神經(jīng)網(wǎng)絡(luò)”而言,注意力機(jī)制參數(shù)也參與了訓(xùn)練,在提取故障信息時(shí)選擇和關(guān)注的信息更精準(zhǔn)。雖然AACNN和ACNN都隨著信噪比的提升測(cè)試集準(zhǔn)確率提升,但AACNN模型在低信噪比下依舊能獲得較高的準(zhǔn)確率,而且在信噪比-2~4 dB中模型較為穩(wěn)定,能保持較高的準(zhǔn)確率。因此,所提模型在強(qiáng)噪聲下的環(huán)境下,對(duì)于滾動(dòng)軸承可以有效地進(jìn)行故障診斷。
表2 不同信噪比模型測(cè)試準(zhǔn)確率Table 2 Test accuracy of different SNR models
1)本文提出一種AACNN的滾動(dòng)軸承故障診斷方法,沿整個(gè)網(wǎng)絡(luò)架構(gòu)使用了注意力機(jī)制,關(guān)注全局信息,彌補(bǔ)了深度卷積神經(jīng)網(wǎng)絡(luò)卷積層局部感受野特征提取的不足。
2)本文方法可以更好地對(duì)信號(hào)處理方式提取的特征模量進(jìn)行融合,進(jìn)行自適應(yīng)選擇和融合特征模量,更好地關(guān)注了全局空間和特征子空間。
3)將本文方法應(yīng)用于高轉(zhuǎn)速下的航空發(fā)動(dòng)機(jī)滾動(dòng)軸承故障診斷中,對(duì)于不同損傷程度的故障可以有效地識(shí)別。
4)在不同信噪比的條件下,對(duì)本文方法進(jìn)行訓(xùn)練測(cè)試。測(cè)試結(jié)果表明,本文模型的抗噪性能得到明顯提升,并保持一定的診斷精度。