王 鵬,李丹青,王 恒
(南通大學(xué) 機(jī)械工程學(xué)院,江蘇 南通 226019)
滾動軸承是機(jī)械旋轉(zhuǎn)設(shè)備的關(guān)鍵零部件,機(jī)械設(shè)備的整體性能和工作效率與滾動軸承的運(yùn)行狀態(tài)息息相關(guān),持續(xù)的損傷誘因和惡劣的運(yùn)行環(huán)境都會導(dǎo)致軸承發(fā)生故障,使得實(shí)際的生產(chǎn)效率大大降低[1]。
傳統(tǒng)的滾動軸承故障診斷方法利用信號分析的方法對軸承的振動信號進(jìn)行特征提取[2]。不足之處在于過多依賴于人工的先驗(yàn)知識[3],并且往往需要針對特定的診斷任務(wù)調(diào)整計算過程中的參數(shù),很難具有良好的泛化能力[4]。近年來,基于深度學(xué)習(xí)的軸承故障智能診斷,以卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN) 為代表的方法可以特征自提取以完成故障診斷[5]。雷春麗等[6]提出一種基于馬爾科夫轉(zhuǎn)移場(Markov transition field,MTF) 與條紋池化卷積神經(jīng)網(wǎng)絡(luò)(stripe pooling convolutional neural networks,SPCNN) 的小樣本滾動軸承變工況故障診斷方法。Xu等[7]利用在線傳遞卷積神經(jīng)網(wǎng)絡(luò)(online transfer convolutional neural network,OTCNN) 提出了滾動軸承故障診斷模型,通過離線卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)初始化離在線卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)。上述研究表明CNN取得了很好的診斷效果,但是需要滿足兩個基本假設(shè):①有大量的樣本數(shù)據(jù)以供訓(xùn)練;②樣本數(shù)據(jù)需要滿足獨(dú)立同分布。實(shí)際中采集的軸承信號,因設(shè)備復(fù)雜、多變的運(yùn)行工況,很難滿足以上假設(shè),導(dǎo)致深度學(xué)習(xí)模型的分類效果大大降低。
遷移學(xué)習(xí)(transfer learning,TL)[8]可以在樣本數(shù)據(jù)缺失條件下幫助深度學(xué)習(xí)模型實(shí)現(xiàn)高精度故障診斷,在視覺處理等領(lǐng)域取得了成功應(yīng)用。同時跨域的數(shù)據(jù)分布差異問題也得到解決,在軸承故障診斷領(lǐng)域也有應(yīng)用[9]。Zhou等[10]針對CNN面臨著訓(xùn)練不完整和訓(xùn)練時間長的問題,提出了一種殘差網(wǎng)絡(luò)結(jié)合遷移學(xué)習(xí)的滾動軸承診斷方法。Wang等[11]針對實(shí)際工業(yè)中小故障樣本上訓(xùn)練的模型精度較差,提出一種具有遷移學(xué)習(xí)和集成學(xué)習(xí)的長短期記憶(long short term memory,LSTM) 神經(jīng)網(wǎng)絡(luò),提高模型的精度。邵海東等[12]采用仿真數(shù)據(jù)驅(qū)動獲得豐富的故障信息以降低對試驗(yàn)臺資源的依賴,提高無監(jiān)督跨域場景下的故障診斷精度。
以上方法主要針對同種型號軸承變工況遷移的故障診斷。相比于同種型號的軸承,不同型號軸承之間的振動信號數(shù)據(jù)分布差異更大,所需要的模型的泛化能力更高。加上實(shí)際中采集的軸承故障信號多為小故障樣本或者無故障樣本,這給故障特征提取帶來了巨大的難度,使得軸承故障診斷識別率很難提高。加上現(xiàn)研究階段大多遷移學(xué)習(xí)只是將不同的損失函數(shù)進(jìn)行加權(quán)組合,這會增加反向傳播的計算難度,進(jìn)而影響網(wǎng)絡(luò)的訓(xùn)練時間和訓(xùn)練效率。
針對以上問題,本文提出了一種基于改進(jìn)交替遷移學(xué)習(xí)的滾動軸承故障診斷算法,采用美國凱斯西儲大學(xué)(Case Western Reserve University,CWRU)滾動軸承數(shù)據(jù)集進(jìn)行了變工況、跨軸承型號和小樣本條件下的遷移試驗(yàn)研究。與其他算法對比,本文算法有效地減少了源域與目標(biāo)域數(shù)據(jù)之間的特征分布差異,具有較高的故障分類準(zhǔn)確率,證明了本文算法的有效性和可行性。
CNN屬于前饋神經(jīng)網(wǎng)絡(luò)[13],網(wǎng)絡(luò)結(jié)構(gòu)可分為輸入層、卷積層、池化層、全連接層和輸出層。卷積層的卷積核按照設(shè)置的步長對輸入進(jìn)行局部卷積運(yùn)算,再經(jīng)過激活函數(shù)后輸出特征。
池化層可以實(shí)現(xiàn)二次特征提取、降低卷積層輸出的特征維度和減少CNN的參數(shù)。原輸入特征經(jīng)過池化層大小為n×n的運(yùn)算后,輸出特征變?yōu)樵瓉淼?/n2,個數(shù)保持不變。
CNN的最后是全連接層,全連接層可以將卷積層和池化層運(yùn)算得到的特征映射到目標(biāo)低維空間進(jìn)行展平。全連接層再經(jīng)過基于激活函數(shù)后即可獲得模型的學(xué)習(xí)成果,實(shí)現(xiàn)數(shù)據(jù)的多分類。
遷移學(xué)習(xí)過程如圖1所示。在遷移學(xué)習(xí)中有領(lǐng)域(domain)和任務(wù)(task)兩個概念[14],領(lǐng)域D分為源域DS和目標(biāo)域DT,對應(yīng)的任務(wù)T也分為源任務(wù)TS和目標(biāo)任務(wù)TT。領(lǐng)域D由特征空間X以及對應(yīng)的邊緣概率分布P(X)構(gòu)成。
圖1 遷移學(xué)習(xí)過程
D={x,P(X)}
(1)
任務(wù)T由特征空間γ和目標(biāo)函數(shù)f(·)組成。
T={γ,f(·)}
(2)
遷移學(xué)習(xí)可以將從源域DS到源任務(wù)TS中學(xué)到的知識遷移到與源域DS相似的目標(biāo)域DT和目標(biāo)域任務(wù)TT中,通過減少跨域的分布差異、學(xué)習(xí)域不變特性,進(jìn)行分類。在軸承故障診斷領(lǐng)域,源域中的數(shù)據(jù)一般都是帶標(biāo)簽的軸承故障數(shù)據(jù),多來自實(shí)驗(yàn)室,目標(biāo)域數(shù)據(jù)大都不帶數(shù)據(jù)標(biāo)簽。本文使用基于模型參數(shù)的遷移學(xué)習(xí)方法,針對軸承型號、故障類型、運(yùn)行工況等,按照是否帶標(biāo)簽,將滾動軸承的振動信號分成源域與目標(biāo)域,對源域的任務(wù)學(xué)習(xí)得到的知識進(jìn)行遷移,實(shí)現(xiàn)對目標(biāo)域數(shù)據(jù)的準(zhǔn)確分類。
本文提出模型的特征提取模塊由改進(jìn)的深度卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成。針對軸承故障診斷對CNN參數(shù)進(jìn)行試驗(yàn)選擇。
(1) 卷積層、池化層設(shè)計
卷積層在CNN中負(fù)責(zé)完成對二維圖像的特征提取,卷積運(yùn)算表達(dá)式為
(3)
池化層對卷積層中輸出的圖像特征進(jìn)行池化操作,具有降維效果,簡化網(wǎng)絡(luò)的計算復(fù)雜度,便于提取主要特征。較多的網(wǎng)絡(luò)層會帶來過擬合域復(fù)雜的計算量,較少的網(wǎng)絡(luò)層則能以處理復(fù)雜問題,因此網(wǎng)絡(luò)層的選取對特征提取的結(jié)果有很大的影響。本文選取多種卷積層與池化層方案組合進(jìn)行對比試驗(yàn),以選擇最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建模型。
(2) 批量標(biāo)準(zhǔn)化層優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)
批量標(biāo)準(zhǔn)化層(batch normalization,BN)[15],通過規(guī)范化手段,把每層網(wǎng)絡(luò)的輸入值的分布服從(0,1)的標(biāo)準(zhǔn)正態(tài)分布,這樣網(wǎng)絡(luò)的輸出值不會突變,以獲得較大的梯度,避免梯度消失,同時梯度變大代表學(xué)習(xí)收斂速度變得更快,能大大加快訓(xùn)練速度。因此,本文在每一個卷積層后添加BN層,達(dá)到加快網(wǎng)絡(luò)的訓(xùn)練和收斂的速度、降低梯度發(fā)散的概率和防止過擬合的目的。
(3) 激活函數(shù)
ReLU(·)函數(shù)不僅運(yùn)算簡單、計算高效,還可以加快梯度下降的收斂速度,避免出現(xiàn)梯度消失的問題,因此具有良好的稀疏性。本文分別選擇ReLU(·)函數(shù)與Softmax(·)函數(shù)作為隱藏層與全連接層的激活函數(shù)。
現(xiàn)有的遷移學(xué)習(xí)都是將損失函數(shù)進(jìn)行加權(quán)組合相加,這會使得網(wǎng)絡(luò)的計算量在反向傳播的過程中大大地增加。為了進(jìn)一步縮小滾動軸承在不同領(lǐng)域之間的距離,找到它們之間的內(nèi)在不變性,本文在文獻(xiàn)[16]的基礎(chǔ)上,對遷移學(xué)習(xí)的損失函數(shù)及其訓(xùn)練方式進(jìn)行了改進(jìn),提出了一種改進(jìn)的交替遷移學(xué)習(xí)(improved alternately transfer learning,IATL)算法,即在第一個卷積層后計算CORAL[17]損失函數(shù),CORAL損失函數(shù)是通過計算不同領(lǐng)域之間的協(xié)方差,縮小網(wǎng)絡(luò)訓(xùn)練中從源域和目標(biāo)域?qū)W習(xí)到的特征值的大小和范圍;在全連接層中計算領(lǐng)域數(shù)據(jù)的最大均值差異(maximum mean discrepancy,MMD)損失與分類損失和作為損失函數(shù)。這樣在不同的層中交替計算損失函數(shù),并完成網(wǎng)絡(luò)參數(shù)交替更新,以提高遷移學(xué)習(xí)的效果。
定義CORAL損失函數(shù)為L1,MMD損失與分類損失和作為損失函數(shù)L2。源域數(shù)據(jù)集與目標(biāo)域數(shù)據(jù)集的特征協(xié)方差矩陣CS與CT定義為
(4)
(5)
式中:DS為源域數(shù)據(jù)集;DT為目標(biāo)域數(shù)據(jù)集;nS為源域中樣本數(shù)量;nT為目標(biāo)域中樣本數(shù)量。
則源域和目標(biāo)域特征的二階統(tǒng)計量的距離為
(6)
由深度卷積神經(jīng)網(wǎng)絡(luò)代表的模塊,對源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)進(jìn)行特征提取,再通過域分類器分類,得到樣本數(shù)據(jù)集特征標(biāo)簽的概率分布,最后計算真實(shí)標(biāo)簽與預(yù)測標(biāo)簽之間的特征分布差異,可以得到樣本數(shù)據(jù)的分類損失,即交叉熵函數(shù),公式為
(7)
假設(shè)兩域數(shù)據(jù)的特征集合為Ds和Dt,在CNN中,源域數(shù)據(jù)集與目標(biāo)域數(shù)據(jù)集通過網(wǎng)絡(luò)的特征提取后,兩個數(shù)據(jù)集的特征分布差異留在全連接層。特征集合Ds和Dt在再生核希爾伯特空間(reproducing kernel Hilbert space,RKHS) 中的分布差異用MMD來度量,MMD的定義為
(8)
則損失函數(shù)L2公式為
L2=LC+λ·DH(Ds,Dt)
(9)
(10)
式中:超參數(shù)λ為最大均值差異權(quán)重系數(shù);p為當(dāng)前的訓(xùn)練進(jìn)度,范圍為0~1,例:設(shè)置網(wǎng)絡(luò)的訓(xùn)練次數(shù)為100次,當(dāng)前網(wǎng)絡(luò)已經(jīng)迭代訓(xùn)練了50次,則p=0.5。
本文提出改進(jìn)的交替遷移學(xué)習(xí)算法通過交替計算不同的損失函數(shù)并完成其反向傳播,降低了網(wǎng)絡(luò)的計算難度,在每一次網(wǎng)絡(luò)的前向傳播中只計算一次領(lǐng)域數(shù)據(jù)之間的特征分布差異,實(shí)現(xiàn)不同損失函數(shù)之間的優(yōu)勢互補(bǔ),可以最大限度地提高不同損失在迭代中的性能,從而獲得更好的訓(xùn)練效果。
基于改進(jìn)交替遷移學(xué)習(xí)的滾動軸承故障診斷算法示意如圖2所示。
圖2 基于改進(jìn)交替遷移學(xué)習(xí)的滾動軸承故障診斷
本文提出基于改進(jìn)交替遷移學(xué)習(xí)的故障診斷算法流程如圖3所示。步驟如下:
圖3 故障診斷算法流程圖
(1) 將采集得到的軸承振動信號進(jìn)行源域和目標(biāo)域的劃分,將其中的源域數(shù)據(jù)帶標(biāo)簽,目標(biāo)域數(shù)據(jù)不帶標(biāo)簽,標(biāo)簽為故障標(biāo)簽。
(2) 從每個樣本數(shù)據(jù)中截取數(shù)據(jù),構(gòu)建二維灰度矩陣,以發(fā)揮CNN對二維特征優(yōu)秀的提取能力,并對數(shù)值做歸一化處理,用于模型的特征提取。將數(shù)據(jù)集劃分為訓(xùn)練集和測試集,分別用于訓(xùn)練模型和驗(yàn)證模型的有效性。
(3) 建立深度卷積神經(jīng)網(wǎng)絡(luò)故障診斷模型,并初始化網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)、損失函數(shù)的最大迭代次數(shù)、Epoch值和超參數(shù)λ。
(4) 將源域數(shù)據(jù)與目標(biāo)域訓(xùn)練集數(shù)據(jù)對深度卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)訓(xùn)練,并保存預(yù)訓(xùn)練模型。
(5) 在卷積層1后計算CORAL損失(即損失函數(shù)L1),接著進(jìn)行提取特征,利用反向傳播算法更新各層網(wǎng)絡(luò)權(quán)重與偏置參數(shù),對模型進(jìn)行更新。
(6) 由分類器對源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)進(jìn)行分類,得到的對應(yīng)的特征概率分布和標(biāo)簽差異,計算分類損失(交叉熵?fù)p失)與分布差異(MMD損失),最后輸出總損失(即損失函數(shù)L2),利用反向傳播算法更新各層網(wǎng)絡(luò)權(quán)重與偏置參數(shù),對模型進(jìn)行更新。
(7) 重復(fù)步驟(5)和(6),直到達(dá)到最大迭代次數(shù),然后停止訓(xùn)練。
(8) 將目標(biāo)域的測試集數(shù)據(jù)和對應(yīng)的真實(shí)標(biāo)簽輸入訓(xùn)練好的模型,進(jìn)行故障類型的識別,計算模型對目標(biāo)域測試集數(shù)據(jù)的診斷精度。
本文試驗(yàn)采用美國凱斯西儲大學(xué)電氣工程實(shí)驗(yàn)室的滾動軸承數(shù)據(jù)開展應(yīng)用研究。該試驗(yàn)中,驅(qū)動端與風(fēng)扇端軸承型號為SKF公司的6203-2RS和6205-2RS深溝球軸承,采樣頻率為12 kHz,,電機(jī)轉(zhuǎn)速分別為1 797 r/min,1 772 r/min,1 750 r/min和1 730 r/min,負(fù)載為0,745 W,1 470 W,2 205 W。軸承故障是電火花加工的單點(diǎn)故障,軸承有4種運(yùn)行狀態(tài):正常狀態(tài)(N)、外圈故障(O)、內(nèi)圈故障(I)和滾動體故障(R),軸承故障損傷直徑有0.177 8 mm、0.355 6 mm和0.533 4 mm三種類型,共10種不同的故障工況。
試驗(yàn)1:跨工況遷移故障診斷試驗(yàn)
以6203-2RS軸承為例,選取不同的工況將軸承數(shù)據(jù)集劃分為4組(A、B、C、D),每組數(shù)據(jù)集包括正常狀態(tài)和3種故障狀態(tài),故障狀態(tài)中又包含3種故障尺寸,共10種故障工況。為了驗(yàn)證本文遷移算法的有效性,在不同的數(shù)據(jù)集上設(shè)置不同的故障類型的遷移任務(wù),即跨工況遷移故障診斷試驗(yàn)。
以遷移任務(wù)A→B為例,則A為源域數(shù)據(jù)集,B為目標(biāo)域數(shù)據(jù)集,該遷移任務(wù)的試驗(yàn)數(shù)據(jù)具體構(gòu)成如表1所示。
表1 試驗(yàn)1遷移任務(wù)A→B的數(shù)據(jù)集構(gòu)成
根據(jù)CWRU采樣數(shù)據(jù)長度,將每個任務(wù)中的分類標(biāo)簽分成300個數(shù)據(jù)樣本,共計3 000個數(shù)據(jù)樣本,樣本長度為1 024。對每一個樣本進(jìn)行數(shù)據(jù)預(yù)處理,轉(zhuǎn)給為二維灰度圖,并將源域數(shù)據(jù)集與目標(biāo)域的80%軸承數(shù)據(jù)隨機(jī)分為訓(xùn)練集,剩余的20%分為測試集。
試驗(yàn)2:跨軸承型號遷移故障診斷試驗(yàn)
選擇試驗(yàn)1中6203-2RS風(fēng)扇端軸承信號為目標(biāo)域數(shù)據(jù),6205-2RS驅(qū)動端軸承信號為源域數(shù)據(jù),進(jìn)行跨軸承型號遷移故障診斷試驗(yàn)。目標(biāo)域數(shù)據(jù)集由6203-2RS軸承構(gòu)成,與試驗(yàn)1一致;源域數(shù)據(jù)集由6205-2RS軸承構(gòu)成,源域數(shù)據(jù)按照不同的工況將軸承數(shù)據(jù)集劃分為4組(0、1、2、3),試驗(yàn)2的域數(shù)據(jù)故障工況劃分方式與試驗(yàn)1相同。為了驗(yàn)證本文算法在跨軸承型號遷移故障診斷的有效性,在不同的數(shù)據(jù)集上設(shè)置不同的故障類型的遷移任務(wù),即跨軸承型號遷移故障診斷試驗(yàn)。
以遷移任務(wù)0→B為例,則0為源域數(shù)據(jù)集,B為目標(biāo)域數(shù)據(jù)集,該遷移任務(wù)的數(shù)據(jù)集如表2所示,試驗(yàn)2數(shù)據(jù)樣本標(biāo)簽具體設(shè)置、數(shù)據(jù)預(yù)處理與試驗(yàn)1相同。
表2 試驗(yàn)2遷移任務(wù)0→B的數(shù)據(jù)集構(gòu)成
試驗(yàn)3:少量帶故障標(biāo)簽樣本條件下遷移故障診斷試驗(yàn)
為了驗(yàn)證本文算法在目標(biāo)樣本較小條件下的可行性,在試驗(yàn)2的基礎(chǔ)上,僅使用5%的目標(biāo)域數(shù)據(jù)集進(jìn)行訓(xùn)練,剩余95%數(shù)據(jù)集作為測試集數(shù)據(jù),以測試本文算法在小樣本故障數(shù)據(jù)下的軸承診斷效果。
3.3結(jié)果分析
為驗(yàn)證本文所提算法的有效性,與遷移成分分析(transfer component analysis,TCA)、深度域適應(yīng)網(wǎng)絡(luò)(deep domain adaptation network,DAN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、CNN-MMD、CNN-CORAL和LATL。其中TCA是一種傳統(tǒng)遷移學(xué)習(xí)算法,將處于不同分布的領(lǐng)域映射到高維空間中,在最小化域間距離的同時保留原有屬性;CNN網(wǎng)絡(luò)結(jié)構(gòu)中不加入遷移學(xué)習(xí)成分,且構(gòu)架與本文提出的相同;CNN-MMD與CNN-CORAL指單獨(dú)使用該損失表示遷移損失,以降低領(lǐng)域間的特征分布差異,CNN-MMD與CNN-CORAL的網(wǎng)絡(luò)構(gòu)架也與本文相同;LATL網(wǎng)絡(luò)結(jié)構(gòu)與文獻(xiàn)[16]保持一致。
試驗(yàn)1:
選取多種卷積層與池化層方案組合進(jìn)行對比試驗(yàn),對比結(jié)果如表3所示。5個卷積層和2個池化層的準(zhǔn)確率最高,為99.22%,損失率最低,為1.74%。故本文選擇5個卷積層和2個池化層。
表3 不同網(wǎng)絡(luò)層對比
最終,試驗(yàn)1選取的深度卷積神經(jīng)網(wǎng)絡(luò)特征提取模塊結(jié)構(gòu)參數(shù)如表4所示。每次循環(huán)批量大小Batch size=64,學(xué)習(xí)率ε=0.001,迭代次數(shù)Epoch=100。
表4 深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
基于跨工況遷移故障診斷試驗(yàn),設(shè)置了12種遷移任務(wù)。將本文算法與其它四種算法在本文所提的模型上進(jìn)行測試,本試驗(yàn)取5次結(jié)果的平均值,故障診斷結(jié)果如表5所示。
表5 試驗(yàn)1不同算法下故障診斷結(jié)果
根據(jù)表5中的數(shù)據(jù),可以得到以下結(jié)論:
(1) 對于12個遷移任務(wù),本文算法故障診斷準(zhǔn)確率最高均值達(dá)到了97.73%,優(yōu)于所有對比算法。
(2) 在該試驗(yàn)中,TCA雖是在高維空間中最小化源域與目標(biāo)域距離,但因其衡量分布差異能力較弱,丟失了有用的分布信息,導(dǎo)致該算法的準(zhǔn)確率最低。CNN可以從二維信號中學(xué)習(xí)到分布特征,平均診斷率為85.21%,究其原因是訓(xùn)練集數(shù)據(jù)與測試集數(shù)據(jù)分布差異較大,說明CNN需要借助遷移學(xué)習(xí)以獲得更高的準(zhǔn)確率。
(3) 由于CNN-MMD只計算源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)之間的距離損失,只獲得均值為85.91%診斷精度。而CNN-CORAL在網(wǎng)絡(luò)訓(xùn)練中,在卷積層使用CORAL損失函數(shù)以減小了領(lǐng)域間數(shù)據(jù)的特征分布差異,進(jìn)一步縮小從領(lǐng)域間數(shù)據(jù)學(xué)習(xí)得到的特征大小和特征范圍,診斷結(jié)果優(yōu)于CNN-MMD,獲得均值為87.90%診斷精度。
(4) LATL雖然具有復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),交替計算兩種損失函數(shù),但是其訓(xùn)練時間過長,無法滿足應(yīng)用場景下的監(jiān)測系統(tǒng)實(shí)時性的需要,且在本文設(shè)置的試驗(yàn)一中,其故障診斷準(zhǔn)確率均值為94.92%,低于本文算法。
由于篇幅有限,僅可視化基于本文算法下的遷移任務(wù)A→B的過程和結(jié)果。遷移任務(wù)A→B的源域與目標(biāo)域的時域波形與灰度圖如圖4所示,由于不同故障尺寸的時域波形與灰度圖較為相似,本文僅展示4種故障類型的時域波形與灰度圖??梢娫从驍?shù)據(jù)集A與目標(biāo)域數(shù)據(jù)集B的時域波形與灰度圖存在一定差異,表明領(lǐng)域間數(shù)據(jù)具有不同的分布特征。遷移結(jié)果準(zhǔn)確率見表5,部分算法遷移結(jié)果的混淆矩陣如圖5所示??梢钥闯?本文算法分類準(zhǔn)確率較高,基本達(dá)到99%,有效地減少混淆樣本的數(shù)量,對其他算法中錯誤分類的樣本進(jìn)行了正確分類。
(a) 源域
(a) CNN
試驗(yàn)2:
網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)選擇方法與試驗(yàn)1相同,由于篇幅原因不予展示,基于跨軸承型號遷移故障診斷試驗(yàn),設(shè)置了16種遷移任務(wù)。本試驗(yàn)取5次結(jié)果的平均值,對不同遷移任務(wù)使用不同診斷算法,故障診斷結(jié)果如表6所示。
表6 試驗(yàn)2不同算法下故障診斷結(jié)果
結(jié)果說明:
(1) 在跨軸承型號的遷移任務(wù)中,本文算法平均診斷率均值達(dá)94.58%,優(yōu)于其他4種算法。證明本文算法在跨軸承型號條件下對軸承的故障也有較高識別率。
(2) 對于在源域與目標(biāo)域具有不同特征分布的樣本數(shù)據(jù),本文所提算法能學(xué)習(xí)更多的特征,進(jìn)一步減少兩域之間的混淆樣本數(shù)量,證明本文提出的模型具有較好的泛化能力。
(3) 與其他算法相比,本文算法準(zhǔn)確率最高,證明本文算法通過分次計算CORAL和MMD損失函數(shù),發(fā)揮了兩種損失函數(shù)的性能,降低了領(lǐng)域間特征分布差異,能有效地提高模型的診斷效果。
由于篇幅有限,僅可視化基于本文算法下的遷移任務(wù)0→A過程和結(jié)果,其中數(shù)據(jù)集0為源域,數(shù)據(jù)集A為目標(biāo)域,也展示4種故障類型的時域波形與灰度圖。遷移任務(wù)0→A的源域數(shù)據(jù)集0的時域波形與灰度圖如圖6所示。
圖6 遷移任務(wù)0→A中源域的時域波形與灰度圖
從圖6中可以看出數(shù)據(jù)集0與數(shù)據(jù)集A的時域波形不同,對應(yīng)的圖7灰度圖也存在一定差異,具有不同的特征。遷移結(jié)果準(zhǔn)確率見表6,遷移結(jié)果的混淆矩陣如圖7所示??梢?本文算法分類準(zhǔn)確率較高,均值達(dá)到94.58%,減少了兩類的混淆樣本的數(shù)量,對其他算法中錯誤分類的樣本進(jìn)行了正確分類。
(a) CNN
試驗(yàn)3:
試驗(yàn)3網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)選擇方法與試驗(yàn)1一致,基于少量帶故障標(biāo)簽樣本條件下遷移故障診斷試驗(yàn),設(shè)置了16種遷移任務(wù),遷移任務(wù)與試驗(yàn)2保持一致。本試驗(yàn)取5次結(jié)果的平均值,對不同遷移任務(wù)使用不同診斷算法,故障診斷結(jié)果如圖8所示。
圖8 不同算法下的故障診斷結(jié)果比較
由圖8可知,在16個目標(biāo)域的樣本較少的遷移任務(wù)試驗(yàn)中,本文算法平均診斷率最佳,均值達(dá)87.65%,證明本文算法能在小樣本數(shù)據(jù)條件下對軸承的故障有高識別率;與其他算法相比,本文算法準(zhǔn)確率最高,證明通過交替計算CORAL和MMD損失函數(shù),降低了計算難度,也充分發(fā)揮了不同損失函數(shù)的特點(diǎn),實(shí)現(xiàn)了不同衡量域內(nèi)數(shù)據(jù)特征分布差異公式的優(yōu)勢互補(bǔ),能有效地提高模型的診斷效果。
由于篇幅有限,僅可視化基于本文算法下的遷移任務(wù)0→A的結(jié)果,遷移任務(wù)0→A的t-SNE可視化結(jié)果如圖9所示。
圖9 t-SNE可視化結(jié)果圖
由圖9可知,利用本文算法提取的特征在4種故障狀態(tài)下的分布有較大區(qū)分度,且源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)在這些故障狀態(tài)下特征分布空間的位置也大致相同??梢?本文算法可以有效保證不同故障類別間的特征可分性,同時將不同領(lǐng)域數(shù)據(jù)間的特征分布差異縮小,即縮小類內(nèi)距,使得模型的故障診斷識別率得到提高。
針對變工況下不同的滾動軸承故障信號特征分布差異大,導(dǎo)致特征提取困難,提出了一種基于改進(jìn)交替遷移學(xué)習(xí)的滾動軸承故障診斷算法,通過試驗(yàn)對比證明,結(jié)論總結(jié)如下:
(1) 將軸承一維振動信號轉(zhuǎn)化為二維灰度圖輸入到網(wǎng)絡(luò)中,發(fā)揮CNN對二維特征的優(yōu)秀提取能力,減少了信號在與處理中的丟失,有效地實(shí)現(xiàn)了對故障特征的提取。
(2) 使用IATL遷移學(xué)習(xí)方式,通過分層計算不同的損失函數(shù),解決了源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)特征知識空間內(nèi)的分布差異大的問題,降低了網(wǎng)絡(luò)的計算難度。同時發(fā)揮了不同損失函數(shù)之間的特點(diǎn),可以最大限度地提高不同損失在迭代中的性能,獲得了更好的訓(xùn)練效果。
(3) 針對變工況、跨軸承型號和小樣本數(shù)據(jù)條件下進(jìn)行遷移試驗(yàn),本文模型泛化能力強(qiáng),可以將源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)有很大差異的特征對準(zhǔn),實(shí)現(xiàn)滾動軸承故障診斷,對故障的類型有很好的判別能力,有著較高準(zhǔn)確率。
(4) 需要注意的是本文所提算法并未在實(shí)際場景中使用,實(shí)際場景中運(yùn)行的滾動軸承不一定有足夠的故障樣本數(shù)據(jù)以供故障診斷。利用軸承機(jī)理模型產(chǎn)生與實(shí)際數(shù)據(jù)有相似特征的數(shù)據(jù)進(jìn)行遷移學(xué)習(xí),幫助實(shí)際場景中的軸承進(jìn)行故障診斷,以及實(shí)現(xiàn)跨機(jī)械設(shè)備故障診斷是我們下一步研究的重點(diǎn)。