錢(qián)思宇,秦東晨,陳江義,袁峰
(鄭州大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,鄭州 450001)
機(jī)電驅(qū)動(dòng)系統(tǒng)和電動(dòng)機(jī)的大多數(shù)故障由滾動(dòng)軸承損壞引起,這可能導(dǎo)致設(shè)備停機(jī),造成經(jīng)濟(jì)損失或安全事故,因此滾動(dòng)軸承的故障檢測(cè)尤為重要。
近幾年,深度學(xué)習(xí)方法大量應(yīng)用于軸承故障診斷領(lǐng)域,利用其深度學(xué)習(xí)的特點(diǎn)自動(dòng)提取原始數(shù)據(jù)的層次表示特征[1-2]:文獻(xiàn)[3]提出一種基于深度殘差神經(jīng)網(wǎng)絡(luò)的智能故障診斷方法,并使用多傳感器融合對(duì)其改進(jìn),實(shí)現(xiàn)了信噪比0~10 dB范圍內(nèi)軸承故障振動(dòng)信號(hào)的分析;文獻(xiàn)[4]通過(guò)對(duì)堆疊式去噪自編碼器進(jìn)行遷移性學(xué)習(xí)的研究,提高了編碼器在低噪聲干擾環(huán)境下的樣本分類(lèi)正確率;文獻(xiàn)[5]提出了基于神經(jīng)網(wǎng)絡(luò)的領(lǐng)域自適應(yīng)故障診斷,可將舊領(lǐng)域?qū)W習(xí)到的知識(shí)應(yīng)用到新領(lǐng)域;文獻(xiàn)[6]提出通過(guò)最小化最大均值差異來(lái)實(shí)現(xiàn)領(lǐng)域共享特征技術(shù);文獻(xiàn)[7]提出用于軸承時(shí)序振動(dòng)信號(hào)的卷積模型,在不同數(shù)據(jù)集上表現(xiàn)良好,而且將批量自適應(yīng)標(biāo)準(zhǔn)化引入模型,從而提高了模型的抗噪性能。
上述研究沒(méi)有涉及無(wú)噪和有噪領(lǐng)域的遷移,且提出的抗噪模型在高噪環(huán)境下表現(xiàn)不佳。因此,提出一種基于卷積-注意力機(jī)制-強(qiáng)制特征適配(Attention Mechanism Convolutional Neural Network—Mandatory Feature Adaptation,AMCNN-MFA)的軸承故障診斷模型,其具備以下特點(diǎn):1)實(shí)現(xiàn)端到端的軸承故障診斷模式,無(wú)需對(duì)數(shù)據(jù)進(jìn)行相關(guān)信號(hào)處理;2)模型結(jié)構(gòu)簡(jiǎn)單,網(wǎng)絡(luò)參數(shù)規(guī)模??;3)模型能夠應(yīng)對(duì)不同程度的噪聲干擾,診斷精度高。
在傳統(tǒng)領(lǐng)域,軸承故障類(lèi)型和工況保持不變的情況下,傳感器采集到的軸承振動(dòng)信號(hào)雖然會(huì)由于其他機(jī)械部件的噪聲干擾而有所區(qū)別,但通過(guò)傳統(tǒng)信號(hào)處理得到的軸承故障特征是不會(huì)改變或不會(huì)有太大波動(dòng),也就是說(shuō)噪聲干擾不會(huì)改變軸承本應(yīng)存在的故障特征。而在深度學(xué)習(xí)中,標(biāo)簽相同的樣本經(jīng)過(guò)模型網(wǎng)絡(luò)層會(huì)得到類(lèi)似的樣本特征,本文的故障特征(通過(guò)卷積特征提取層得到,沒(méi)有具體的物理意義,與傳統(tǒng)信號(hào)領(lǐng)域具有實(shí)際物理意義的故障特征有所區(qū)別)適配就是在這種背景下,將無(wú)噪聲樣本(傳感器采集的原始樣本)與高噪聲樣本(添加高強(qiáng)度隨機(jī)干擾后的樣本)的故障特征進(jìn)行適配,即將特征的數(shù)據(jù)分布映射到同一空間,減小兩類(lèi)樣本故障特征的距離,以確保故障特征不會(huì)有太大的數(shù)值波動(dòng),使深度學(xué)習(xí)模型挖掘信號(hào)數(shù)據(jù)中的有效故障特征,從兩類(lèi)樣本中獲取不變特征,以增強(qiáng)模型的抗噪性。
對(duì)于共享標(biāo)簽的原始數(shù)據(jù)和加噪數(shù)據(jù)(通過(guò)對(duì)原始數(shù)據(jù)添加高強(qiáng)度噪聲得到),強(qiáng)制特征適配(MFA)根據(jù)標(biāo)簽類(lèi)別對(duì)卷積模型特征提取層得到的高層故障特征進(jìn)行正確的特征分布?xì)w一化,并減小特征分布偏移程度。
強(qiáng)制特征適配中的數(shù)據(jù)分為兩類(lèi):服從數(shù)據(jù)分布p的原始特征Ds(xs,ys),服從數(shù)據(jù)分布q的加噪特征Dt(xt,yt)。其中,x為樣本特征數(shù)據(jù),y為樣本標(biāo)簽,ys和yt共享標(biāo)簽。強(qiáng)制特征適配的示意圖如圖1所示,其原理為:使用評(píng)估原始域和加噪域數(shù)據(jù)分布偏移程度的相關(guān)方法,利用2個(gè)域的正確標(biāo)記將相同類(lèi)別的振動(dòng)信號(hào)樣本經(jīng)過(guò)卷積模型特征提取后得到的高層故障特征強(qiáng)制性進(jìn)行數(shù)據(jù)分布重合(盡可能減小特征數(shù)據(jù)的分布偏移),使深度學(xué)習(xí)模型從加噪樣本中學(xué)習(xí)到與原始樣本通用的故障特征,從而能夠應(yīng)對(duì)復(fù)雜的高噪場(chǎng)景。
圖1 強(qiáng)制特征適配示意圖
最大均值差異(Maximum Mean Discrepancy,MMD)[8]是目前遷移學(xué)習(xí),尤其是域適應(yīng)(Domain Adaptation)中使用最廣泛的一種損失函數(shù),主要用來(lái)度量2個(gè)不同但相關(guān)的分布(p,q)的距離。2個(gè)分布的距離定義為
(1)
式中:xs為源域數(shù)據(jù);xt為目標(biāo)域數(shù)據(jù);H表示這個(gè)距離由φ(·)將數(shù)據(jù)映射到再生核希爾伯特空間中進(jìn)行度量;E表示對(duì)映射到再生核希爾伯特空間的樣本特征取均值。利用最大均值差異可以很好地評(píng)估軸承振動(dòng)信號(hào)原始樣本與高噪樣本之間故障特征的差異性。
無(wú)偏估計(jì)是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)時(shí)的一種無(wú)偏推斷,dH(p,q)的無(wú)偏估計(jì)為
(2)
原始樣本特征與加噪樣本特征之間的數(shù)據(jù)分布偏移距離可以用最大均值差異表示,對(duì)于故障特征向量屬于故障類(lèi)別c的偏移距離為
(3)
式中:xs為原始樣本的特征向量;xt為加噪樣本的特征向量。
由于每個(gè)樣本都有長(zhǎng)度為類(lèi)別總數(shù)C的標(biāo)簽向量(獨(dú)熱編碼),向量中只有1個(gè)位置為1,其余C-1個(gè)位置都為0,所以在計(jì)算所有樣本的屬于類(lèi)別c的故障特征均值時(shí),由于所有樣本的類(lèi)別標(biāo)簽并非都是c,在計(jì)算有效樣本總數(shù)時(shí)應(yīng)該去除類(lèi)別標(biāo)簽不為c的無(wú)效樣本,即
(4)
(5)
(6)
(7)
AMCNN-MFA模型由特征提取層、分類(lèi)層、特征適配模塊等構(gòu)成,具體算法流程如圖2所示。
圖2 AMCNN-MFA軸承故障診斷模型結(jié)構(gòu)示意圖
通道注意力機(jī)制能夠使模型將更多的注意力集中在更重要的特征上,其具體算法如圖3所示,因此在模型引入通道注意力以權(quán)衡卷積層所得特征數(shù)據(jù)中每個(gè)通道特征信息的重要程度,增強(qiáng)模型的魯棒性和分類(lèi)聚類(lèi)效果。在卷積特征提取層的首尾兩層引入通道注意力,將經(jīng)過(guò)卷積層后得到的特征H經(jīng)過(guò)一定處理后的數(shù)值送入sigmoid函數(shù),通過(guò)計(jì)算得到不同特征維度各自的權(quán)重系數(shù)(0~1),再將得到的系數(shù)與輸入特征進(jìn)行對(duì)應(yīng)通道相乘組成新的特征H′,這些新特征便是經(jīng)過(guò)權(quán)重分配的特征,能夠幫助模型獲得更關(guān)鍵和重要的信息,使模型做出更準(zhǔn)確的判斷。
圖3 通道注意力機(jī)制
l=lJ+αlMFA,
(8)
(9)
式中:α用于權(quán)衡域適配損失在模型總損失中所占的權(quán)重。
AMCNN模型的具體參數(shù)見(jiàn)表1:在模型輸入的開(kāi)始加入隨機(jī)采樣層,相當(dāng)于對(duì)數(shù)據(jù)加入適度噪聲,使網(wǎng)絡(luò)提取的故障特征更具魯棒性;網(wǎng)絡(luò)模型中,除了提取振動(dòng)信號(hào)高級(jí)特征的一維卷積神經(jīng)網(wǎng)絡(luò)層外,還在卷積模塊的首尾添加通道注意力模塊,為特征通道分配不同的權(quán)重,以增大有效特征在總特征域的占比,減少無(wú)效特征的干擾。
表1 AMCNN軸承故障診斷模型的具體參數(shù)
模型使用Adam優(yōu)化器,加速模型尋優(yōu)過(guò)程,減少迭代次數(shù)。在網(wǎng)絡(luò)迭代過(guò)程中,為避免學(xué)習(xí)率過(guò)大導(dǎo)致迭代路徑振蕩過(guò)大,使用學(xué)習(xí)率指數(shù)衰減策略,以確保模型在迭代循環(huán)中能夠越來(lái)越逼近最優(yōu)解。學(xué)習(xí)率指數(shù)衰減策略為
(10)
式中:lR為初始學(xué)習(xí)率;e為當(dāng)前訓(xùn)練步數(shù);et為模型總訓(xùn)練步數(shù);λ為衰減速率參數(shù)。
基于Python-Pytorch搭建深度學(xué)習(xí)模型,在不同類(lèi)型的數(shù)據(jù)集上進(jìn)行5次訓(xùn)練和測(cè)試并對(duì)測(cè)試結(jié)果取平均值,與其他模型進(jìn)行性能對(duì)比,驗(yàn)證本文提出的AMCNN-MFA模型的抗噪聲能力和泛化能力。
3.1.1 CWRU軸承數(shù)據(jù)集
選取凱斯西儲(chǔ)大學(xué)(CWRU)軸承數(shù)據(jù)集[10]中的驅(qū)動(dòng)端軸承SKF6205在2hp工況下的數(shù)據(jù)進(jìn)行試驗(yàn),振動(dòng)信號(hào)的采樣頻率為48 kHz,不對(duì)數(shù)據(jù)進(jìn)行任何預(yù)處理,實(shí)現(xiàn)端輸入,數(shù)據(jù)長(zhǎng)度為1 600(軸承運(yùn)轉(zhuǎn)一圈的采樣點(diǎn)),數(shù)據(jù)采取半周期重疊采樣以擴(kuò)充數(shù)據(jù)量。具體數(shù)據(jù)集構(gòu)成見(jiàn)表2,其中,訓(xùn)練集分為源域(原始樣本,不作任何處理)和目標(biāo)域(加噪樣本,在原始樣本中添加信噪比-10 dB的高斯白噪聲[11]);驗(yàn)證集為加噪樣本(在原始樣本中添加信噪比-10 dB的高斯白噪聲);測(cè)試集為加噪樣本(在原始樣本中添加信噪比-10~10 dB的高斯白噪聲)。
表2 CWRU軸承數(shù)據(jù)集
訓(xùn)練集中一隨機(jī)原始故障信號(hào)及其加噪信號(hào)(添加-10 dB的隨機(jī)噪聲)的時(shí)域波形如圖4所示,加噪信號(hào)與原始信號(hào)差異很大,原始信號(hào)的幅值在0.5 m/s2以?xún)?nèi),而加噪信號(hào)的幅值大部分在0.5~1.0 m/s2,小部分超過(guò)1.0 m/s2。模型的作用是在2個(gè)不同信號(hào)中提取公共的故障特征。
(a)原始信號(hào)
3.1.2 PB軸承數(shù)據(jù)集
采用帕德博恩大學(xué)(PB)滾動(dòng)軸承人工損傷數(shù)據(jù)集[12]中的6203軸承在N15M07F10工況(轉(zhuǎn)速1 500 r/min,轉(zhuǎn)矩0.7 N·m,徑向載荷1 000 N)下的數(shù)據(jù)進(jìn)行試驗(yàn),振動(dòng)信號(hào)的采樣頻率為64 kHz,采樣長(zhǎng)度為2 560,噪聲配置同表2。故障缺陷由電動(dòng)雕刻機(jī)單點(diǎn)加工,加工位置為軸承內(nèi)、外圈,根據(jù)不同的加工深度(1~2 mm)將故障程度分為等級(jí)Ⅰ和Ⅱ,結(jié)合軸承健康運(yùn)轉(zhuǎn)狀況共構(gòu)成5種故障類(lèi)型,具體數(shù)據(jù)集構(gòu)成見(jiàn)表3。
表3 PB軸承數(shù)據(jù)集
3.1.3 加速壽命試驗(yàn)真實(shí)損傷數(shù)據(jù)集
真實(shí)損傷軸承數(shù)據(jù)來(lái)自帕德博恩大學(xué)滾動(dòng)軸承加速壽命試驗(yàn)[12],試驗(yàn)軸承為6203型深溝球軸承,通過(guò)加速壽命試驗(yàn)使軸承產(chǎn)生疲勞損壞,大多以點(diǎn)狀剝落的形式出現(xiàn),損傷程度分為等級(jí)Ⅰ和Ⅱ,損傷位置為內(nèi)、外圈,與健康狀況共構(gòu)成5類(lèi)故障類(lèi)別。本文選擇運(yùn)行在N15M07F10工況的故障軸承數(shù)據(jù),振動(dòng)信號(hào)的采樣頻率為64 kHz,采樣長(zhǎng)度為2 560,數(shù)據(jù)集(PB-Reality)的最終構(gòu)成與3.1.2中的表3完全一致。
模型訓(xùn)練參數(shù)見(jiàn)表4,采用Kaiming進(jìn)行網(wǎng)絡(luò)初始化[13],分別使用3個(gè)數(shù)據(jù)集中的訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,其中,CWRU訓(xùn)練集的具體訓(xùn)練過(guò)程如圖5所示:各損失曲線在訓(xùn)練過(guò)程中逐漸收斂趨于0;訓(xùn)練集、驗(yàn)證集的分類(lèi)正確率緩慢增長(zhǎng)并趨于穩(wěn)定。
表4 AMCNN軸承故障診斷模型訓(xùn)練參數(shù)
圖5 模型訓(xùn)練過(guò)程(CWRU訓(xùn)練集)Fig.5 Model training process(CWRU training sets)
為確保試驗(yàn)結(jié)果的可靠性,進(jìn)行5次訓(xùn)練并對(duì)測(cè)試集的分類(lèi)正確率取平均值。本文搭建的AMCNN-MFA模型通過(guò)特征適配提高抗噪能力,除此之外,還采用具備抗噪能力的機(jī)器學(xué)習(xí)模型和其他深度學(xué)習(xí)模型進(jìn)行對(duì)比分析:使用高斯徑向基核函數(shù)的支持向量機(jī)(SVM)、深度神經(jīng)網(wǎng)絡(luò)[14](DNN)、第一層寬卷積核深度卷積神經(jīng)網(wǎng)絡(luò)[7](WDCNN)、深度殘差收縮卷積神經(jīng)網(wǎng)絡(luò)[15](DRSN)、基于訓(xùn)練干擾的卷積神經(jīng)網(wǎng)絡(luò)[16](TICNN),同時(shí)使用未添加注意力機(jī)制模塊的CNN-MFA模型進(jìn)行消融試驗(yàn),驗(yàn)證注意力機(jī)制在模型中的作用。所有模型都使用相同的時(shí)序數(shù)據(jù)結(jié)構(gòu)輸入,其中,DNN中大量引入Dropout層, WDCNN中引入隨機(jī)采樣層,DRSN中引入自適應(yīng)軟閥值去噪模塊,TICNN引入AdaBN,用于增強(qiáng)各模型的抗噪能力。
各軸承數(shù)據(jù)的測(cè)試集在不同模型中的分類(lèi)結(jié)果如圖6和圖7所示,具體的分類(lèi)準(zhǔn)確率見(jiàn)表5,分析可知:
表5 各軸承數(shù)據(jù)測(cè)試集在不同模型中的分類(lèi)準(zhǔn)確率
Tab.5 Classification accuracy of each bearing data test set in different models
模型參數(shù)量CWRU軸承數(shù)據(jù)集PB軸承數(shù)據(jù)集PB-Reality軸承數(shù)據(jù)集SVM—38.04%±1.32%33.37%±2.07%34.03%±2.01%DNN2 476 74483.22%±2.41%66.20%±3.01%79.29%±1.93%WDCNN50 63674.75%±1.56%87.13%±1.76%89.98%±1.03%DRSN63 69674.56%±2.59%62.26%±2.02%78.10%±1.59%TICNN60 28885.54%±1.03%91.89%±1.32%96.65%±0.56%CNN-MFA30 74494.20%±0.51%95.13%±0.43%99.59%±0.21%AMCNN-MFA30 75696.79%±0.23%96.14%±0.34%99.92%±0.05%
圖6 各軸承數(shù)據(jù)測(cè)試集在不同模型中的分類(lèi)結(jié)果Fig.6 Classification results of each bearing data test set in different models
圖7 各軸承數(shù)據(jù)測(cè)試集的消融試驗(yàn)結(jié)果
1)AMCNN-MFA模型總體性能最可靠,平均分類(lèi)準(zhǔn)確率最高,均高于96%且波動(dòng)不超過(guò)0.4%;在高噪聲(低信噪比,-10~0 dB)場(chǎng)景下,AMCNN-MFA模型的性能大幅度領(lǐng)先其他模型,在最強(qiáng)噪聲(信噪比-10 dB)下的分類(lèi)準(zhǔn)確率也能達(dá)到80%以上的,遠(yuǎn)高于其他模型;在低噪聲(高信噪比,0~10 dB)場(chǎng)景下,AMCNN-MFA模型的性能也能以較小優(yōu)勢(shì)領(lǐng)先其他模型,分類(lèi)準(zhǔn)確率都在98%以上。
2)相對(duì)于CNN-MFA模型,在使用注意力機(jī)制的情況下,AMCNN-MFA模型總體增加的參數(shù)量可忽略不計(jì),但分類(lèi)準(zhǔn)確率均有不同程度的提升,在3個(gè)數(shù)據(jù)集上的平均性能提升分別為2.59%,1.01%,0.33%。
利用TSEN[17]可視化方法對(duì)CWRU軸承數(shù)據(jù)測(cè)試集(信噪比-5 dB)在AMCNN-MFA和CNN-MFA模型中進(jìn)行各網(wǎng)絡(luò)層的二維可視化,并對(duì)測(cè)試得到的預(yù)測(cè)標(biāo)簽和真實(shí)標(biāo)簽求取混淆矩陣,結(jié)果如圖8和圖9所示:
圖8 CWRU軸承數(shù)據(jù)測(cè)試集(信噪比-5 dB)在AMCNN-MFA模型上的可視化圖及混淆矩陣Fig.8 Visualization and confusion matrix of CWRU bearing data test set(SNR-5 dB)on AMCNN-MFA model
圖9 CWRU軸承數(shù)據(jù)測(cè)試集(信噪比-5 dB)在CNN-MFA模型上的可視化圖
1)原始信號(hào)在特征空間中幾乎不可區(qū)分;隨著層級(jí)深入,模型可區(qū)分出健康和故障狀態(tài),并逐漸對(duì)故障類(lèi)型進(jìn)行細(xì)分,通道注意力模塊2已可對(duì)10類(lèi)故障狀態(tài)完全聚類(lèi)。
2)由混淆矩陣可知,在整個(gè)測(cè)試集中,模型只對(duì)故障類(lèi)別1和8產(chǎn)生錯(cuò)誤判別,圖8h同樣反映了這一現(xiàn)象。
3)與CNN-MFA模型相比,AMCNN-MFA模型中,通道注意力模塊1將卷積層1得到的特征類(lèi)別7和9更明顯地聚類(lèi),通道注意力模塊2將卷積層4得到的特征類(lèi)別1,2,3,5,8,9十分明顯的聚類(lèi),表明注意力機(jī)制能夠提高模型對(duì)各故障類(lèi)別的聚類(lèi)能力,提高模型的魯棒性。
本文提出的一種新的抗不同程度噪聲干擾的AMCNN-MFA模型,其是基于卷積神經(jīng)網(wǎng)絡(luò)、注意力機(jī)制、強(qiáng)制特征適配模塊搭建而成的高性能模型,具備以下特點(diǎn):
1)AMCNN-MFA模型可實(shí)現(xiàn)端到端的診斷模式,無(wú)需對(duì)原始診斷數(shù)據(jù)進(jìn)行任何處理,避免了傳統(tǒng)故障診斷方法需人工提取故障特征的步驟,診斷信號(hào)輸入模型后可直接輸出分類(lèi)結(jié)果。
2)AMCNN-MFA模型具備最少的參數(shù)量,結(jié)構(gòu)簡(jiǎn)單且訓(xùn)練難度較小,對(duì)不同軸承數(shù)據(jù)集的平均分類(lèi)準(zhǔn)確率均高于96%且波動(dòng)不超過(guò)0.4%。
3)采用通道注意力機(jī)制,使AMCNN-MFA模型3個(gè)軸承數(shù)據(jù)集上的平均性能分別提高了2.59%,1.01%,0.33%,有效提升了模型的診斷性能和分類(lèi)魯棒性。