趙曉輝,田玉玲
(太原理工大學(xué)信息與計(jì)算機(jī)學(xué)院,山西晉中 030600)
在旋轉(zhuǎn)機(jī)械的故障中,軸承損壞的故障約占30%,滾動(dòng)軸承的故障診斷是機(jī)械設(shè)備故障診斷技術(shù)的重要內(nèi)容。滾動(dòng)軸承正常運(yùn)轉(zhuǎn)與否,對(duì)于整體機(jī)器的精度、可靠性、壽命等有著重要的影響[1]。研究人員在故障診斷方面做了大量的工作,提出了基于信號(hào)處理[2]、多元統(tǒng)計(jì)分析[3]、深度學(xué)習(xí)[4]等多種診斷方法。研究主要集中在特征提取和模式識(shí)別這兩個(gè)部分。連續(xù)小波變換(Continuous Wavelet Transform,CWT)作為分析信號(hào)時(shí)頻特征的重要工具,具有良好的時(shí)頻窗口特性,Gao 等人利用連續(xù)復(fù)Morlet 小波變換得到的時(shí)頻圖對(duì)CNN 進(jìn)行訓(xùn)練,實(shí)現(xiàn)故障識(shí)別[5]。Chen 等人利用雙樹復(fù)小波變換和拉普拉斯特征映射結(jié)合的方法實(shí)現(xiàn)行星齒輪故障識(shí)別[6]。Zhang 等人采用了多個(gè)Q 因子的Gabor 小波得到時(shí)頻圖特征,并送進(jìn)分類器進(jìn)行故障識(shí)別[7]。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)作為模式識(shí)別中一個(gè)重要的特征提取方法,其具有平移不變性、參數(shù)共享性等特點(diǎn),因此基于CNN的故障診斷研究在近年來不斷地被學(xué)者們研究。Zhao 等人將CNN 提取到的原始信號(hào)的局部特征輸入到雙向LSTM 中,從而獲取特征之間的時(shí)間依賴關(guān)系,最后實(shí)現(xiàn)故障診斷[8]。Liao 等人將數(shù)據(jù)分段重構(gòu),再輸入到改進(jìn)的GRU 中,從而實(shí)現(xiàn)故障分類[9]。Peng 等人利用濾波技術(shù)將信號(hào)分解成多個(gè)尺度,對(duì)多個(gè)尺度進(jìn)行特征融合,從而實(shí)現(xiàn)故障診斷[10]。時(shí)間領(lǐng)域自適應(yīng)(Domain Adaptation)是遷移學(xué)習(xí)的重要方法,它的核心思想是把不同分布的源域和目標(biāo)域映射到同一個(gè)特征空間,并在該空間內(nèi)不斷拉近彼此的距離。Tong 等人通過快速傅里葉變換將原始數(shù)據(jù)進(jìn)行處理,得到數(shù)據(jù)集,使用最大均值差異作為度量,最小化邊緣分布和條件分布,從而實(shí)現(xiàn)故障識(shí)別[11]。Li 等人通過人工生成假樣本并使用最大均值差異進(jìn)行域自適應(yīng),在少量機(jī)器故障條件下測(cè)試數(shù)據(jù),實(shí)現(xiàn)跨域診斷[12]。域?qū)股窠?jīng)網(wǎng)絡(luò)模型(Domain-Adversarial Training of Neural Networks,DATNN)的提出[13],為領(lǐng)域自適應(yīng)方法提供了新的思路。Tang 等人提出了用腦電圖訓(xùn)練域自適應(yīng)網(wǎng)絡(luò),該模型引入了新的條件域判別器與標(biāo)簽分類器進(jìn)行對(duì)抗,學(xué)習(xí)共享特征,從而實(shí)現(xiàn)腦電信號(hào)的分類[14]。雖然這些遷移模型實(shí)現(xiàn)了域的自適應(yīng),但只考慮了域與域之間的整體遷移,仍然存在負(fù)遷移的問題。
針對(duì)以上問題,文中提出了結(jié)合小波時(shí)頻圖與多對(duì)抗域適應(yīng)網(wǎng)絡(luò)(CWT-MADA)結(jié)合的故障診斷模型。模型以CWT 得到的時(shí)頻圖為輸入,使用有標(biāo)簽的源域數(shù)據(jù)和無標(biāo)簽的目標(biāo)域數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,旨在實(shí)現(xiàn)同類的跨域?qū)R,減少整體域遷移造成的誤差,從而實(shí)現(xiàn)多工況下的故障診斷。
多工況故障診斷是指利用一個(gè)工況下的數(shù)據(jù)來訓(xùn)練標(biāo)簽分類器,并用于其他工況下數(shù)據(jù)的故障分類。對(duì)于給定的源域數(shù)據(jù)Ds,其中ns條樣本數(shù)據(jù)xs帶有其對(duì)應(yīng)的故障類別標(biāo)簽ys,即目標(biāo)域數(shù)據(jù)集為Dt,其中nt條樣本數(shù)據(jù)xt不帶標(biāo)簽,即分類的任務(wù)是在帶有標(biāo)簽的源域數(shù)據(jù)上學(xué)習(xí)一個(gè)魯棒性良好的分類器,并能預(yù)測(cè)目標(biāo)域數(shù)據(jù)的故障分類情況。
CWT-MADA 模型結(jié)構(gòu)如圖1 所示。從功能的角度出發(fā),模型可以大致分為三部分,即特征提取器、故障分類器和域分類器。特征提取器Gf由雙流卷積構(gòu)成,用于提取來自源域和目標(biāo)域的數(shù)據(jù)樣本的組合故障特征F;故障分類器Gy由全連接層和Softmax 分類器組成,輸出樣本的類別標(biāo)簽;域分類器=1,…,K,每個(gè)分類器被設(shè)計(jì)用來匹配與第k個(gè)類相關(guān)聯(lián)的源域和目標(biāo)域數(shù)據(jù),域分類器輸出每個(gè)樣本的域標(biāo)簽。模型在梯度反轉(zhuǎn)層GRL 的作用下,實(shí)現(xiàn)多對(duì)抗域適應(yīng)網(wǎng)絡(luò)的結(jié)構(gòu)。
圖1 CWT-MADA跨域故障診斷模型
在這一部分中,采用雙流卷積結(jié)構(gòu)來實(shí)現(xiàn)特征提取器,包括基于原始數(shù)據(jù)的一維卷積結(jié)構(gòu)和基于相對(duì)應(yīng)時(shí)頻圖的二維卷積,這樣的好處在于能夠?qū)颖镜奶卣餍畔⒊浞职l(fā)揮且互為補(bǔ)充,其結(jié)構(gòu)如圖2所示。首先將840×1 的原始數(shù)據(jù)經(jīng)過CWT 并壓縮至64×64×3 大小的時(shí)頻圖,把二維時(shí)頻圖和一維原始數(shù)據(jù)作為輸入送入特征提取器中,分別得到特征F1和特征F2,然后將兩個(gè)特征合并得到特征F,作為特征提取器的輸出,其參數(shù)如表1 所示。
表1 特征提取器參數(shù)
圖2 特征提取器
假設(shè)有K個(gè)故障類別,那么就構(gòu)建K個(gè)域分類器=1,…,K,每個(gè)域分類器對(duì)應(yīng)著每個(gè)類別,實(shí)現(xiàn)同類的跨域?qū)R。然而,由于目標(biāo)域樣本沒有標(biāo)簽,所以每個(gè)分類器無法判定樣本特征屬于哪個(gè)類別,但可以從故障分類器得到每個(gè)樣本實(shí)例xi的預(yù)測(cè)標(biāo)簽每個(gè)反映出每個(gè)實(shí)例樣本xi屬于第k個(gè)類的概率。將分類到對(duì)應(yīng)的=1,…,K中,并將其作為特征值的權(quán)重進(jìn)行訓(xùn)練。
所以,域分類器的目標(biāo)函數(shù)定義為:
其中,n=ns+nt,Gf是特征提取器,Gdk表示第k個(gè)域分類器,di表示樣本xi的域標(biāo)簽,表示交叉熵?fù)p失。
多域?qū)咕W(wǎng)絡(luò)通過同一類別的跨域匹配,增強(qiáng)了正遷移,避免了整體遷移的錯(cuò)誤對(duì)其造成的負(fù)遷移。
為了使得源域特征和目標(biāo)域特征混淆,采用最大化域分類器參數(shù)最小化特征提取器參數(shù)與故障分類器參數(shù)θy,實(shí)現(xiàn)源域和目標(biāo)域同類的對(duì)齊。
故障分類器Gy對(duì)應(yīng)的損失定義為:
其中,Gy是故障分類器,yi是源域數(shù)據(jù)樣本xi對(duì)應(yīng)的標(biāo)簽,Ly是交叉熵?fù)p失。
綜合所有參數(shù)考量整個(gè)模型,其總的目標(biāo)損失函數(shù)定義為:
其中,λ是平衡Ly和Ld的對(duì)抗平衡參數(shù)。所以整體最優(yōu)問題就是尋找參數(shù)的最優(yōu)解:
由于最大化在反向傳播更新參數(shù)時(shí),梯度方向與最小化的梯度方向相反,這樣會(huì)使得梯度消失,反轉(zhuǎn)層(GRL)的添加使得在反向傳播過程中梯度方向保持一致,其定義如下:
梯度反轉(zhuǎn)層設(shè)置在特征提取器與域分類器之間,在前向傳播過程中實(shí)現(xiàn)恒等不變,這樣總的優(yōu)化目標(biāo)都變成了最小。
對(duì)于模型最優(yōu)參數(shù)的搜索算法,文中采用動(dòng)量為0.9 的隨機(jī)梯度下降算法,并根據(jù)迭代次數(shù)設(shè)置學(xué)習(xí)率,其更新公式如下:
其中,α0=0.01,β=0.75,p表示迭代訓(xùn)練過程中0 到1 的線性變換,這樣可以提高收斂速度并降低源域和目標(biāo)域的誤差。
實(shí)驗(yàn)采用美國凱斯西儲(chǔ)大學(xué)開放的滾動(dòng)軸承數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證[15]。文中所采用的振動(dòng)數(shù)據(jù)是在4 種不同的的工況下(0、1、2 和3 hp)從電機(jī)驅(qū)動(dòng)端采集的內(nèi)圈故障(IF)、外圈故障(OF)和滾動(dòng)體故障(BF)的振動(dòng)數(shù)據(jù)。這3種故障均由電火花加工產(chǎn)生,直徑分別為0.177 8 cm、0.355 6 cm 和0.533 4 cm。因此,考慮了4種負(fù)載下的10種軸承狀態(tài),如表2所示。
表2 軸承狀態(tài)信息
對(duì)采集到的樣本進(jìn)行分割,每個(gè)樣本包含840個(gè)數(shù)據(jù)點(diǎn),這樣一個(gè)樣本就中包含2 個(gè)故障周期,移動(dòng)步長為400 個(gè)采樣點(diǎn),因此取每種軸承狀態(tài)的145個(gè)樣本,每種工況下總共1 450 個(gè)樣本數(shù)據(jù),訓(xùn)練樣本數(shù)和測(cè)試集樣本數(shù)按照7:3 的比例進(jìn)行分割,在訓(xùn)練集樣本中3 份作為源域樣本,4 份作為目標(biāo)域樣本。文中設(shè)計(jì)的遷移任務(wù)有12 個(gè),分別為T0,1、T0,2、T0,3、T1,0、T1,2、T1,3、T2,0、T2,1、T2,3、T3,0、T3,1、T3,2,其下標(biāo) 直觀地表達(dá)了任務(wù)情況。例如T1,3描述了以1 hp 負(fù)載數(shù)據(jù)集為源域,以3 hp 負(fù)載數(shù)據(jù)集為目標(biāo)域的遷移任務(wù)。
為了驗(yàn)證提出的模型對(duì)目標(biāo)域故障狀態(tài)預(yù)測(cè)的有效性,將所提出的方法與現(xiàn)有CNN、雙流CNN、TCA(Transfer Component Analysis)[16]、DAN(Deep Adaptation Netowrk)[17]、JDA(Joint Distribution Adaptation)[18]、DDC(Deep Domain Confusion)[19]、DANN 等研究 方法進(jìn) 行比較。
表3中展示了各個(gè)方法在不同遷移任務(wù)下的診斷結(jié)果,其中文中所提出的模型準(zhǔn)確率平均值為94.99%,相比于其他深度遷移學(xué)習(xí)方法準(zhǔn)確率高出至少2.69%,這是由于文中采用多域?qū)沟姆绞健谋碇锌梢钥闯?,雙流CNN 的準(zhǔn)確率要比2D-CNN 的準(zhǔn)確率平均值高出4.64%,證明了雙流結(jié)構(gòu)的可靠性。
表3 對(duì)比實(shí)驗(yàn)準(zhǔn)確率結(jié)果
綜合以上實(shí)驗(yàn)結(jié)果表明,提出的模型具有良好的故障診斷能力,并取得了較高的實(shí)驗(yàn)準(zhǔn)確率,因此可以說明,該模型能夠有效地減少不同域之間的分布差異,實(shí)現(xiàn)域的對(duì)齊并最終實(shí)現(xiàn)不同工況下的故障診斷。
為了更好地展示所提出模型的可靠性,以任務(wù)T1,3為例,利用t-SNE 算法對(duì)提取的特征進(jìn)行可視化,直觀理解模型的遷移分類過程。特征可視化如圖3所示。圖3(a)是雙流CNN未添加域?qū)箼C(jī)制的特征輸出。從圖中可以看出,源域和目標(biāo)域分布不一致,會(huì)導(dǎo)致故障分類器分類錯(cuò)誤。圖3(b)為文中模型填加了多個(gè)域分類器的域?qū)菇Y(jié)構(gòu)的特征輸出,可以看出,提取到的源域和目標(biāo)域的特征基本重合,表明在對(duì)抗機(jī)制下,模型的泛化能力大幅度增加,模型提取到了在工況1 和工況3 下均可以使用的可遷移特征。
圖3 特征t-SNE可視化對(duì)比圖
文中在任務(wù)T1,3上展示了幾個(gè)基于深度遷移方法的收斂性能,如圖4 所示??梢钥闯觯容^方法的測(cè)試誤差隨著迭代次數(shù)的增加而下降。提出的CWT-MADA 相比于DAN 和DANN 方法具有更好的收斂效果,且收斂穩(wěn)定性能也更好,從而證明了模型的有效性。
圖4 DAN、DANN和CWT-MADA在任務(wù)T1,3的收斂性能比較
文中提出了一種基于連續(xù)復(fù)小波變換和域?qū)惯w移的跨域故障診斷模型。該模型以滾動(dòng)軸承的一維振動(dòng)信號(hào)和二維小波時(shí)頻圖作為輸入,通過雙流CNN 的特征提取,并在域?qū)箼C(jī)制的作用下實(shí)現(xiàn)了遷移,最終實(shí)現(xiàn)了多工況下的滾動(dòng)軸承故障診斷。通過對(duì)比不同的遷移學(xué)習(xí)方法,證明了提出的方法能夠減少了負(fù)遷移帶來的誤差,學(xué)習(xí)到了更為精準(zhǔn)的遷移特征,獲得了更好實(shí)驗(yàn)效果。