徐易蕓,馬 健,陳 良,沈長青,李 奇,孔 林
(1.蘇州大學(xué) 機(jī)電工程學(xué)院,江蘇 蘇州 215131;2.蘇州大學(xué) 軌道交通學(xué)院,江蘇 蘇州 215131;3.長光衛(wèi)星技術(shù)有限公司,長春 130102)
旋轉(zhuǎn)機(jī)械出現(xiàn)故障不僅會帶來重大經(jīng)濟(jì)損失[1],而且可能危害到操作人員的生命安全,造成嚴(yán)重事故[2]。軸承是一種應(yīng)用廣泛并且極其重要的旋轉(zhuǎn)機(jī)械部件,針對軸承故障的診斷方法受到越來越多研究者的關(guān)注。利用軸承振動信號,文獻(xiàn)[3]提出了較多故障診斷方法,包括多項(xiàng)邏輯回歸,支持向量機(jī)(support vector machine,SVM)[4]和小波包變換[5]等。經(jīng)典方法如Kankar等[6]將小波包變換運(yùn)用到多邏輯回歸算法中,建立了故障診斷模型,證明了能量和峰值可以作為用來分辨故障種類的兩個特征。
為了獲得更深層次的故障特征表示,基于深度學(xué)習(xí)的軸承故障智能診斷方法成為近年來的研究熱點(diǎn)。通過卷積神經(jīng)網(wǎng)絡(luò)[7](convolutional neural networks,CNN),自編碼器[8](autoencoder,AE),深度置信網(wǎng)絡(luò)[9](deep belief network,DBN),循環(huán)神經(jīng)網(wǎng)絡(luò)[10](recurrent neural network,RNN),生成對抗網(wǎng)絡(luò)[11](generative adversarial networks,GAN)等新的機(jī)器學(xué)習(xí)模型能夠自動從原始輸入信號中挖掘故障特征并且進(jìn)行診斷。王應(yīng)晨等[12]提出了一種降噪自編碼器和深度置信網(wǎng)絡(luò)相融合模型來實(shí)現(xiàn)滾動軸承的故障診斷。洪驥宇等[13]在降噪自編碼器的基礎(chǔ)上,將改進(jìn)的神經(jīng)網(wǎng)絡(luò)故障狀態(tài)識別方法應(yīng)用于航空發(fā)動機(jī)的故障診斷。以上研究表明,使用現(xiàn)有的深度學(xué)習(xí)故障診斷方法已經(jīng)能夠在一定程度上提升故障診斷性能。在實(shí)際工業(yè)場景中,工況往往復(fù)雜多變,且無法對所有工況數(shù)據(jù)進(jìn)行有效標(biāo)注。因此,基于已知域的有限有標(biāo)簽數(shù)據(jù)訓(xùn)練故障診斷模型,實(shí)現(xiàn)跨域場景下對其他異常工況的有效診斷,縮小由于工況變化和測試環(huán)境變化等因素帶來的故障特征分布差異,是故障智能診斷領(lǐng)域所需要解決的關(guān)鍵問題。
遷移學(xué)習(xí)有助于解決這一問題。利用遷移學(xué)習(xí)從有標(biāo)簽的源域數(shù)據(jù)中學(xué)到知識,將這些知識遷移到無標(biāo)簽的目標(biāo)域中完成診斷分類。Lu等[14]提出了一種深度域適應(yīng)方法,通過使用最大平均差異(maximum mean discrepancy,MMD)將數(shù)據(jù)映射到再生核希爾伯特空間來減小分布差異,同時通過權(quán)重正則化項(xiàng)來增強(qiáng)原始數(shù)據(jù)的代表性特征,從而在目標(biāo)域內(nèi)獲得較高的分類精度。Guo等[15]提出了深度卷積遷移學(xué)習(xí)網(wǎng)絡(luò)(deep convolutional transfer learning network,DCTLN)。DCTLN利用CNN自動學(xué)習(xí)特征,域自適應(yīng)模塊通過最大化域間判別誤差,最小化域內(nèi)概率分布距離幫助CNN學(xué)習(xí)域不變特征。Wen等[16]建立了一種新的深度遷移學(xué)習(xí)方法,利用三層稀疏自編碼器來提取特征,并利用MMD來最小化訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)特征之間的分布差異。
使用遷移學(xué)習(xí)方法能夠?qū)Σ煌r下滾動軸承故障進(jìn)行有效診斷。然而已有的遷移學(xué)習(xí)方法在模型訓(xùn)練過程中學(xué)習(xí)到的特征可能并不具有較高的特征相似性。由于異常工況的多樣性、時變性和強(qiáng)非線性,低相關(guān)性特征往往更容易產(chǎn)生偏差,高相關(guān)性特征能更正確地表示對應(yīng)的故障類型,由此,需要增加高相關(guān)性特征對模型的貢獻(xiàn)度。針對此問題,本文提出一種基于相似性度量遷移學(xué)習(xí)的軸承故障診斷方法,采用滾動軸承的振動信號作為模型輸入,通過CNN對故障特征自適應(yīng)提??;結(jié)合遷移學(xué)習(xí)和相似性度量思想對損失函數(shù)改進(jìn),在域間相關(guān)對齊的同時減少類內(nèi)的差異,利用相關(guān)對齊[17](correlation alignment,CORAL)損失最小化源域和目標(biāo)域之間的分布差異。最大化輸入特征與中心特征之間的相似性,用目標(biāo)域預(yù)測標(biāo)簽中包含的故障分類信息作為特征聚類的劃分中心,使模型能夠?qū)W習(xí)與故障類型具有高相關(guān)性的特征,減小每個故障類別的類內(nèi)距離,提升跨域的泛化能力,使用故障分類器實(shí)現(xiàn)多工況軸承故障診斷,結(jié)果表明,提出的方法具有更高的診斷精度。
遷移學(xué)習(xí)為一類源域和目標(biāo)域之間存在差異的問題提供了一種可行的解決方案[18]。圖1給出了遷移學(xué)習(xí)故障診斷的基本原理示意圖。
圖1 遷移學(xué)習(xí)故障診斷基本原理示意圖Fig.1 Principle of transfer learning-based fault diagnosis
本文提出的故障診斷模型由CNN構(gòu)成。由于網(wǎng)絡(luò)結(jié)構(gòu)對模型的泛化能力有影響,針對不同問題對CNN結(jié)構(gòu)參數(shù)可做適當(dāng)優(yōu)化,通過對CNN參數(shù)進(jìn)行試驗(yàn)選擇,考慮到計(jì)算量和效率,最終選定CNN模型如表1所示。
表1 CNN結(jié)構(gòu)詳細(xì)信息Tab.1 The details of CNN network
CNN模型包括特征提取器和故障分類器。特征提取器對故障特征自適應(yīng)提取,使用二維卷積來保留數(shù)據(jù)的結(jié)構(gòu)信息。輸入由采集的軸承振動信號構(gòu)建,輸入尺寸的3個維度分別為通道數(shù)、特征圖長與寬。特征提取器中共有5個卷積層,每一層卷積后都使用帶泄露的線性修正單元(leaky rectified linear units,LeakyReLU)作為,它在訓(xùn)練過程中能夠改善梯度消失或梯度爆炸的問題,使CNN獲得更好的性能。卷積層特征計(jì)算公式為
Out=LeakyReLU(W*X+b)
(1)
式中:Out為卷積層的輸出;*為卷積操作;W為卷積核;X為輸入特征;b為對應(yīng)的偏移量;LeakyReLU為激活函數(shù)。
故障分類器基于特征提取器學(xué)習(xí)的特征來識別健康狀況。在分類器中經(jīng)過一層卷積Conv6、LeakyReLU整合提取到的特征。為了在保持重要空間信息的同時減小特征圖的維數(shù),P1層對特征平均池化。再將學(xué)習(xí)到的特征平鋪到兩層全連接層FC1、FC2,最后連接輸出層FO,給出故障診斷結(jié)果。
為了實(shí)現(xiàn)多工況軸承故障診斷,本文提出一種基于相似性度量遷移學(xué)習(xí)的軸承故障診斷方法。如圖2所示,模型將特征分布差異度量和相似性度量與特征提取器連接,幫助CNN學(xué)習(xí)域不變特征。根據(jù)優(yōu)化目標(biāo)分為3個部分介紹:① 源域數(shù)據(jù)的健康狀況分類損失;②源域和目標(biāo)域數(shù)據(jù)特征之間的CORAL損失;③源域與目標(biāo)域之間的相似性度量。
圖2 故障診斷模型Fig.2 Fault diagnosis model
(1) 分類損失。采用交叉熵函數(shù)使源域訓(xùn)練數(shù)據(jù)的健康狀況分類損失最小,定義如下
(2)
得到FOS層輸出的預(yù)測值和真實(shí)標(biāo)簽值的損失函數(shù),將學(xué)習(xí)到的特征輸入分類器按照源域已知故障標(biāo)簽的監(jiān)督,通過前向和反向傳播的計(jì)算和優(yōu)化對模型進(jìn)行更新,使得診斷模型對已知標(biāo)簽的各個領(lǐng)域數(shù)據(jù)進(jìn)行有效識別。
(2) CORAL損失。使用CORAL損失最小化源域FC2S和目標(biāo)域FC2T層之間的特征分布差異距離,計(jì)算源域和目標(biāo)域特征的二階統(tǒng)計(jì)量間的距離
(3)
源域和目標(biāo)域數(shù)據(jù)集的特征協(xié)方差矩陣定義為
(4)
(5)
在處理協(xié)方差時,源域和目標(biāo)域共享網(wǎng)絡(luò)參數(shù)。
通過鏈?zhǔn)椒▌t計(jì)算出CORAL損失相對于輸入特征的梯度
(6)
(7)
(3) 相似性度量。當(dāng)數(shù)據(jù)來自不同域時,一些特征與標(biāo)簽的關(guān)系會出現(xiàn)跨域變化[19],造成輸入特征與中心特征之間的相似性減小。因此使用相似性度量來約束相似性之間的差異,最大化類內(nèi)的相似性度量,即從數(shù)據(jù)中提取出與故障類型高度相關(guān)的特征。中心特征用數(shù)據(jù)標(biāo)簽提供的故障分類信息表示,但由于遷移學(xué)習(xí)中目標(biāo)域數(shù)據(jù)無標(biāo)簽,無法在訓(xùn)練階段提供故障信息,因此使用模型預(yù)測的目標(biāo)域標(biāo)簽,使用預(yù)測標(biāo)簽中包含的分類信息為輸入特征提供聚類中心,將數(shù)據(jù)劃分為不同的簇。在訓(xùn)練中通過前向傳播計(jì)算和反向傳播更新不斷優(yōu)化,目標(biāo)域預(yù)測的準(zhǔn)確度逐步提高,為特征聚類提供更準(zhǔn)確的中心位置。
令f(x)為模型的預(yù)測輸出,將中心特征與輸入特征相似性最大化,就是最小化特征的類內(nèi)距離J
(8)
式中:μk=Ex~D(x∣y=k)[f(x)]為預(yù)測輸出的期望;β為正則化參數(shù);k為數(shù)據(jù)種類;D為數(shù)據(jù)分布。
結(jié)合上述3個部分,最終的損失函數(shù)寫為
L=LC+λD+μJ
(9)
式中,超參數(shù)λ和μ分別為域適應(yīng)和相似性度量的權(quán)重系數(shù)。
本文提出的故障診斷方法流程如圖3所示,具體步驟如下:
圖3 故障診斷方法流程圖Fig.3 The flow chart of diagnosis method
步驟2模型訓(xùn)練。讀取源域和目標(biāo)域的訓(xùn)練數(shù)據(jù)集,建立故障診斷模型。初始化故障診斷模型的待訓(xùn)練參數(shù),設(shè)置學(xué)習(xí)率ε和超參數(shù)λ,μ。
前向傳播:將源域和目標(biāo)域訓(xùn)練數(shù)據(jù)作為輸入,通過CNN提取特征。計(jì)算式(9)中源域和目標(biāo)域訓(xùn)練數(shù)據(jù)特征的CORAL損失,源域與目標(biāo)域之間的特征相似度和源域數(shù)據(jù)的健康狀況分類損失,輸出最終的損失函數(shù)。
反向傳播:使用Adam優(yōu)化算法[20]反向逐層傳遞,對模型進(jìn)行更新。
步驟3故障診斷。將目標(biāo)域測試數(shù)據(jù)輸入最終訓(xùn)練好的模型,面對不同領(lǐng)域的故障數(shù)據(jù),該模型能夠有效地識別故障類型,返回預(yù)測的健康狀態(tài)。
本試驗(yàn)采用美國凱斯西儲大學(xué)的CWRU軸承數(shù)據(jù)集[21]。軸承型號為SKF6205-2RS,試驗(yàn)平臺如圖4所示。通過電火花加工模擬軸承的多種健康狀況,數(shù)據(jù)通過16通道的數(shù)據(jù)記錄儀采集得到,采樣頻率為12 kHz。數(shù)據(jù)集包含正常狀態(tài)和外圈故障、內(nèi)圈故障、滾動體故障3種故障類型,軸承故障尺寸包含177.8 μm,355.6 μm和533.4 μm,共10類不同的健康狀態(tài)。
圖4 CWRU軸承試驗(yàn)臺Fig.4 CWRU bearing experimental platform
在數(shù)據(jù)采集試驗(yàn)中,根據(jù)負(fù)載不同設(shè)置4種不同工況:0,0.75 kW,1.49 kW,2.24 kW,一種工況對應(yīng)一個數(shù)據(jù)集。每個數(shù)據(jù)集包括4 000個訓(xùn)練樣本和2 000個測試樣本。每次試驗(yàn)從4個數(shù)據(jù)集中選取2個數(shù)據(jù)集,分別作為一個遷移任務(wù)的源域和目標(biāo)域,共12個不同的遷移任務(wù)。
試驗(yàn)中超參數(shù)λ和μ的選擇經(jīng)過網(wǎng)格搜索法進(jìn)行優(yōu)化,分別從{0.001,0.005,0.01,0.05,0.1}和{1,5,10,15,20}尋優(yōu)范圍中選擇參數(shù)λ和μ。如圖5所示,為0~1遷移任務(wù)中選擇不同λ和μ的診斷精度,因此設(shè)置超參數(shù)λ=0.01,μ=10。每次循環(huán)批量大小Batch size=64,學(xué)習(xí)率ε=0.000 1,設(shè)定迭代次數(shù)Epoch=100。
圖5 不同λ和μ的診斷精度Fig.5 Diagnosis accuracy with varying λ and μ
為驗(yàn)證本文方法的診斷性能,與5種不同方法進(jìn)行對比分析。根據(jù)比較目的不同,將5種方法分為3種類型:
(1)傳統(tǒng)遷移學(xué)習(xí)方法:遷移成分分析(transfer component analysis,TCA)[22]、聯(lián)合分布自適應(yīng)(joint distribution adaptation,JDA)[23]。TCA和JDA在源域和目標(biāo)域處于不同數(shù)據(jù)分布時,將2個領(lǐng)域的數(shù)據(jù)一起映射到一個高維的再生核希爾伯特空間。在此空間中,最小化源域和目標(biāo)域數(shù)據(jù)的距離,同時最大程度地保留它們各自的內(nèi)部屬性。
(2)未使用遷移學(xué)習(xí)的CNN。對比試驗(yàn)CNN的網(wǎng)絡(luò)與提出的架構(gòu)相同,其損失函數(shù)僅使用交叉熵計(jì)算分類損失,即L=Lc。
(3)MMD和CORAL。未使用相似性度量,分別利用MMD損失和CORAL損失降低領(lǐng)域間特征分布的差異。MMD和CORAL與CNN的架構(gòu)相同,最小化FC2層上特征的分布差異,即損失函數(shù)為L=Lc+λD,λ為域適應(yīng)權(quán)重系數(shù)。
12個遷移任務(wù)的故障診斷準(zhǔn)確率如表2所示,可以看出所提方法的診斷性能優(yōu)于對比方法,得到以下3個觀察結(jié)論:
表2 CWRU試驗(yàn)臺不同方法的故障診斷結(jié)果Tab.2 Fault diagnosis results of different methods on CWRU experimental platform %
(1)對于不同工況下的故障診斷任務(wù),本文方法在12個遷移任務(wù)中準(zhǔn)確率平均值為86.81%,優(yōu)于對比方法。
(2)在故障診斷試驗(yàn)中,TCA和JDA將振動數(shù)據(jù)映射到高維空間中最小化域間距離,CNN、MMD、CORAL和本文方法直接從振動信號中學(xué)習(xí)特征,能夠防止丟棄有用的條件表示信息,因此使用深度學(xué)習(xí)方法學(xué)習(xí)到的特征優(yōu)于傳統(tǒng)方法提取的特征。在相同的CNN架構(gòu)中,在FC2層使用CORAL減小分布差異的診斷結(jié)果優(yōu)于MMD。
(3)與遷移學(xué)習(xí)方法CORAL相比,本文提出方法在12個遷移任務(wù)中獲得了更高的健康狀況,本文方法比CORAL更有效地學(xué)習(xí)到具有高相關(guān)性的特征,減少域間數(shù)據(jù)的分布差異。
為進(jìn)一步驗(yàn)證本方法性能,在實(shí)驗(yàn)室自搭建軸承數(shù)據(jù)采集實(shí)驗(yàn)平臺上進(jìn)行了驗(yàn)證,如圖6所示。
圖6 自搭建軸承試驗(yàn)臺Fig.6 Self-built bearing experimental platform
自搭建試驗(yàn)平臺采集電機(jī)負(fù)載為0,1 kN,2 kN和3 kN時不同健康狀況的軸承振動信號,試驗(yàn)采用的軸承型號為SKF6205-2RS,軸承健康狀況分別為正常、外圈故障、內(nèi)圈故障和滾動體故障,軸承故障尺寸為0.2 mm,0.4 mm和0.6 mm。如表3所示,將上述10種不同的健康狀態(tài)分別設(shè)置為0~9類標(biāo)簽。其他試驗(yàn)設(shè)置與CWRU試驗(yàn)相同。
表3 自搭建軸承故障數(shù)據(jù)Tab.3 Fault data of self-built bearing
在本試驗(yàn)臺上進(jìn)行了12個遷移任務(wù)的試驗(yàn),如圖7所示。在不同的遷移任務(wù)中,本文方法平均診斷精度為82.7%。與CNN、MMD和CORAL相比,本文方法的準(zhǔn)確率高于對比方法,證明加入相似性度量后能夠有效提高模型的診斷效果。
圖7 自搭建試驗(yàn)臺故障診斷結(jié)果比較Fig.7 Comparison of fault diagnosis results on self-built experimental platform
圖8為本試驗(yàn)中0~1遷移任務(wù)結(jié)果的混淆矩陣。結(jié)果表明,本文方法在正常和9種故障狀態(tài)下的平均測試精度為94.7%,標(biāo)準(zhǔn)偏差為5.3%,優(yōu)于對比方法,證明了本文方法學(xué)習(xí)特征具有更高的故障相關(guān)性,在不同工況下具有較好的區(qū)分度。試驗(yàn)結(jié)果進(jìn)一步驗(yàn)證了本文方法的有效性和優(yōu)越性。
圖8 0→1遷移任務(wù)測試數(shù)據(jù)分類的混淆矩陣Fig.8 Confusion matrix for the classification of test data of 0→1 transfer task
本文將相似性度量遷移學(xué)習(xí)應(yīng)用于故障診斷領(lǐng)域,提出了一種軸承變工況跨域故障診斷新方法。將遷移學(xué)習(xí)和相似性度量結(jié)合,增加高相關(guān)性特征的貢獻(xiàn)度,減小非相關(guān)特征的影響;通過相關(guān)對齊損失最小化源域和目標(biāo)域特征之間的分布差異,最大化輸入特征與中心特征之間的相似性。與未加入相似性度量的遷移學(xué)習(xí)診斷方法相比,本文所提模型經(jīng)過訓(xùn)練后,能夠有效地獲得相關(guān)性較高的泛化特征,可以獲得更高的軸承健康狀態(tài)識別精度,從而有效解決特征分布偏移帶來的故障診斷難點(diǎn)問題,具有較好的應(yīng)用前景。