劉嘉濛,鄭凡帆,梁麗冰,馬 波,2*
(1.北京化工大學(xué) 發(fā)動機健康監(jiān)控及網(wǎng)絡(luò)化教育部重點實驗室,北京 100029;2.北京化工大學(xué) 高端機械裝備健康監(jiān)控與自愈化北京市重點實驗室,北京 100029)
機械設(shè)備振動信號因其信息豐富,能夠很好地反映設(shè)備的運行狀態(tài),成為設(shè)備故障診斷中最常用的物理參數(shù)[1]。基于振動信號的故障診斷模式一般為:振動信號-特征提取-分類識別。
近年來,在以信號處理為基礎(chǔ)的故障診斷研究中,傳統(tǒng)的特征提取模式與機器學(xué)習(xí)分類模式相結(jié)合的方法取得了不錯的成果,如利用K最近鄰分類算法[2-3]、支持向量機方法[4-5]以及BP神經(jīng)網(wǎng)絡(luò)方法[6-7]等。但以上方法中,都是以傳統(tǒng)信號處理方法提取到的故障特征作為模型輸入,某些故障特征在診斷過程中與訓(xùn)練集差距較大,且無法滿足訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)具有相同分布的前提需求,因而在應(yīng)用方面具有局限性。
為克服上述影響,一些學(xué)者在研究中降低了故障特征與工況的關(guān)聯(lián)性,從而能夠提取更深層次的特征,取得了良好的效果。YANG等[8]提出了一種基于變量預(yù)測分類的故障模型,將局域均值分解和階次跟蹤分析相結(jié)合,用于變轉(zhuǎn)速滾動軸承振動故障特征的提??;BORGHESANI等[9]采用倒譜分析法對信號進行了預(yù)白化處理,實現(xiàn)了變工況條件下的損傷識別;陳小旺等[10]提出了一種迭代廣義同步壓縮變換方法,提高了時變信號的可讀性;孟玲霞等[11]則通過濾波與盲源分離對信號消噪,以此為基礎(chǔ)選取了若干對工況變化不敏感的時域、頻域特征作為風(fēng)電機組預(yù)警指標。
以上方法雖然取得了不錯的效果,但仍依賴于復(fù)雜的信號處理手段和專家經(jīng)驗,且難以保證故障特征對所有故障都具備敏感性,選取上存在較大困難。因此,也有一部分學(xué)者提出了采用深度學(xué)習(xí)方法,利用其強大的特征學(xué)習(xí)能力,實現(xiàn)了故障特征自適應(yīng)提取。JIA等[12]采用了堆疊降噪自動編碼器預(yù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)(deep neural network, DNN),對齒輪傳動系統(tǒng)進行了故障診斷;趙光權(quán)[13]使用深度置信網(wǎng)絡(luò)(deep belief network, DBN)對軸承數(shù)據(jù)進行了故障識別;ZHANG[14]設(shè)計了一種“第一層寬卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural networks with wide first-layer kernel,WDCNN)”,并在軸承數(shù)據(jù)集上取得了不錯的效果。總體而言,基于深度學(xué)習(xí)的方法能夠自適應(yīng)地學(xué)習(xí)出表征設(shè)備運行狀態(tài)的深層次特征,無需根據(jù)故障類型針對性地選取敏感特征,但由于其大多為直接輸入時域或頻域信號,導(dǎo)致學(xué)習(xí)出的故障特征仍會受到因訓(xùn)練樣本的變化所帶來的影響。
近年來,遷移學(xué)習(xí)受到機器學(xué)習(xí)領(lǐng)域的廣泛關(guān)注,ARNOLD[15]以解決不同類型文章中的詞匯分類問題為出發(fā)點,提出了遷移學(xué)習(xí)的概念,闡述了機器學(xué)習(xí)中測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)分布不一致的問題,并將其歸結(jié)為跨域?qū)W習(xí)問題,對應(yīng)的解決方案稱為領(lǐng)域自適應(yīng)(domain adaptation, DA)。在DA中,模型的訓(xùn)練數(shù)據(jù)屬于源域,與訓(xùn)練數(shù)據(jù)分布不同的測試數(shù)據(jù)屬于目標域,其目標之一是通過訓(xùn)練對領(lǐng)域差異不敏感的特征提取器,使不同域數(shù)據(jù)中提取的特征具有相似的分布。2016年,GANIN Y[16]借鑒了生成式對抗網(wǎng)絡(luò)(generative adversarial networks, GAN)[17]中生成器和判別器對抗訓(xùn)練,并最終使生成的樣本欺騙過判別器這一策略,提出了領(lǐng)域?qū)咕W(wǎng)絡(luò)(domain adversarial neural networks, DANN),對模型中的特征提取器和領(lǐng)域判別器實行了對抗訓(xùn)練,使領(lǐng)域判別器無法辨別特征的真實來源,達成了特征不受領(lǐng)域變化影響的目的。該方法已在計算機視覺、語音識別、文本處理與情感分析[18-20]中取得了較好的跨域?qū)W習(xí)效果。
針對傳統(tǒng)信號處理方法和傳統(tǒng)機器學(xué)習(xí)方法的局限性,本文將借鑒DANN在其他領(lǐng)域的成功應(yīng)用,提出一種基于DANN的故障診斷方法。
DANN結(jié)構(gòu)如圖1所示。
圖1 DANN結(jié)構(gòu)示意
DANN結(jié)構(gòu)由3部分組成,分別為:基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[21]的特征提取器Gf、故障分類器Gy和領(lǐng)域判別器Gd。
為實現(xiàn)不同領(lǐng)域特征之間的對抗訓(xùn)練,DANN在Gf后引入Gd,并在其間添加梯度反轉(zhuǎn)層(gradient reversal layer, GRL)。
GRL的前向計算和反向傳播過程可表示為:
(1)
式中:I—單位矩陣。
領(lǐng)域?qū)乖砣鐖D2所示。
圖2 領(lǐng)域?qū)乖?/p>
訓(xùn)練過程中,特征提取器Gf通過最大化領(lǐng)域判別器的損失函數(shù)Ld來學(xué)習(xí)參數(shù)θf,領(lǐng)域判別器Gd通過最小化損失函數(shù)Ld來調(diào)整領(lǐng)域判別器的參數(shù)θd。DANN的優(yōu)化目標還包括最小化故障分類器的分類誤差Ly。
整體目標函數(shù)如下:
(2)
式中:yi—故障類別;di—領(lǐng)域類別;θf—Gf參數(shù);θy—Gy參數(shù);θd—Gd參數(shù)。
其中:n=nS+nT。
(3)
(4)
在實際工程環(huán)境中,設(shè)備所處工作環(huán)境復(fù)雜多變,導(dǎo)致待診斷的振動數(shù)據(jù)與用于訓(xùn)練模型的振動數(shù)據(jù)分布特性存在較大差異,即測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)屬于不同領(lǐng)域。DANN學(xué)習(xí)具備領(lǐng)域不變性特征的能力,可降低其帶來的影響,因此,筆者將其應(yīng)用于設(shè)備變工況診斷任務(wù)中。
令(W,b)為矩陣向量對,通過下式對振動數(shù)據(jù)樣本Ds∈Rm實現(xiàn)維度轉(zhuǎn)換:
Gf(Ds;W,b)=sigm(W·Ds+b)
(5)
通過下式對Gy:RD→[0,1]L進行訓(xùn)練:
Gy(Gf(Ds);V,c)=softmax(VGf(Ds)+c)
(6)
其中:(V,c)∈RL×D×RL;softmax(a)=
此時對于Ds來說,損失函數(shù)為:
(7)
對整個神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練便可得到如下式的源域上的最優(yōu)解:
(8)
式中:λ—超參數(shù)加權(quán)值。
此時Ds和DT的H值差異為:
(9)
令S(Gf)={Gf(x)|x∈S},且T(Gf)={Gf(x)|x∈T},則可得到領(lǐng)域差異:
(10)
經(jīng)過以上步驟,即可實現(xiàn)基于DANN的故障診斷過程。
實驗數(shù)據(jù)來自美國凱斯西儲大學(xué)軸承數(shù)據(jù)中心,振動信號由軸承測試系統(tǒng)測得。
筆者所使用的滾動軸承測試系統(tǒng)如圖3所示。
圖3 滾動軸承測試系統(tǒng)
測試系統(tǒng)由電機(左),測功器(右)以及控制電路組成,軸承型號為SKF6205。軸承均為單一損傷,由電火花機分別在軸承內(nèi)圈、滾珠和外圈加工制成,損傷直徑分別為0.177 8 mm, 0.355 6 mm 和 0.533 4 mm,共計9種故障狀態(tài)。本研究將16通道的加速度傳感器垂直固定在電機輸出軸支撐軸承上方的殼上進行數(shù)據(jù)采集,采樣頻率為12 kHz。
試驗準備了3種不同轉(zhuǎn)速及負載工況下的數(shù)據(jù)集,實驗數(shù)據(jù)詳情如表1所示。
表1 實驗數(shù)據(jù)集詳情
表1為數(shù)據(jù)集A、數(shù)據(jù)集B、數(shù)據(jù)集C具體損傷直徑和訓(xùn)練測試數(shù)。
3組數(shù)據(jù)集在實驗工況詳情如表2所示。
表2 實驗工況詳情
為了更準確地驗證算法的全面性,本次實驗共進行6組。第1組和第2組實驗將數(shù)據(jù)集A作為源域訓(xùn)練集,分別將數(shù)據(jù)集B和數(shù)據(jù)集C作為目標域測試集,分別用A→B和A→C表示;第3組和第4組實驗將數(shù)據(jù)集B作為源域訓(xùn)練集,數(shù)據(jù)集A和數(shù)據(jù)集C作為目標域測試集,分別用B→A、B→C表示;第5組和第6組實驗將數(shù)據(jù)集C作為源域訓(xùn)練集,數(shù)據(jù)集A和數(shù)據(jù)集B作為目標域測試集,分別用C→A和C→B表示。
實驗?zāi)P筒捎脛恿刻荻认陆邓惴ㄟM行訓(xùn)練,源域數(shù)據(jù)的訓(xùn)練批次大小為192,在領(lǐng)域?qū)闺A段,目標領(lǐng)域數(shù)據(jù)的批次大小也取192;學(xué)習(xí)速率lr取0.001。
權(quán)衡參數(shù)λ在模型訓(xùn)練過程中進行自適應(yīng)調(diào)整,如下式所示:
(11)
式中:step—當(dāng)前迭代次數(shù);steps—總迭代次數(shù)。
實驗設(shè)置steps為10 000,當(dāng)模型的損失沒有明顯變化時就停止訓(xùn)練。
模型的結(jié)構(gòu)參數(shù)如表3所示。
表3 模型參數(shù)設(shè)置
表3中,特征提取器的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)借鑒了文獻[22]中的“第一層寬卷積核”的設(shè)計方法;故障分類器和領(lǐng)域判別器[23]的全連接層均使用Dropout[24]以及L2正則化[25]進行訓(xùn)練防止過擬合;故障分類器Softmax層輸出的結(jié)果為10種故障類別,領(lǐng)域判別器的Softmax層輸出的結(jié)果為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)對應(yīng)的2種工況類別。
基于DANN的軸承故障診斷結(jié)果如表4所示。
表4 提出方法診斷結(jié)果
從表4可以看出:模型在源域和目標域上都具有很高的診斷準確率,表明提出方法受源域訓(xùn)練集和目標域測試集差異變化影響的程度較小。
為了驗證提出方法的診斷準確度,本文在相同實驗數(shù)據(jù)的條件下進行了兩種類型的對比,以驗證DANN在軸承故障診斷上具有較高的準確性。
3.4.1 與其他深度學(xué)習(xí)方法對比
將本文提出方法與WDCNN方法、DNN方法和MLP方法[26]進行實驗對比驗證。
這些方法在單一工況下均取得了較好的診斷結(jié)果。
該實驗測試得出的變工況診斷準確率與其他深度學(xué)習(xí)方法對比如表5所示。
表5 與其他深度學(xué)習(xí)方法對比
由表5可以看出:使用DNN與MLP在目標域的診斷準確率較不理想,二者學(xué)習(xí)出的特征受數(shù)據(jù)集差異變化影響仍比較大;WDCNN的診斷準確率較前二者有了一定提升,但在實驗A→C和C→A中,準確率仍沒有DANN結(jié)果高。
為更清晰地展現(xiàn)提出方法的特征適應(yīng)訓(xùn)練集與測試集變化的能力,本文使用t-SNE[27]方法對3組故障分類器的輸出層特征(源域和目標域每種類別特征各取100組,共2 000組)進行可視化。
實驗A→B、B→A及C→B的故障分類器輸出層特征可視化如圖4所示。
圖4 故障分類器輸出層特征可視化
由圖4可知:未經(jīng)領(lǐng)域?qū)褂?xùn)練的特征聚集性較差,不同故障的特征之間有較多重疊;而通過DANN法學(xué)習(xí)出的特征聚集較集中,同一種故障狀態(tài)的特征僅有極少數(shù)離群點,且不同類別的故障特征之間幾乎沒有交叉重疊現(xiàn)象。
該結(jié)果表明,所提出的方法經(jīng)過領(lǐng)域?qū)褂?xùn)練之后,學(xué)習(xí)出的特征對領(lǐng)域變化較不敏感,且具備很強的故障識別能力。
3.4.2 與“傳統(tǒng)信號處理+機器學(xué)習(xí)”方法對比
為與傳統(tǒng)的“傳統(tǒng)信號處理+機器學(xué)習(xí)”方法診斷結(jié)果進行比較,本文采用對工況變化不敏感的經(jīng)驗特征組作為評價指標(包括峰值、偏度、歪度、峭度等時域和頻域特征),結(jié)合KNN算法進行診斷實驗,并進行對比。
DANN方法與“經(jīng)驗特征+機器學(xué)習(xí)”方法對比結(jié)果如表6所示。
表6 與“經(jīng)驗特征+機器學(xué)習(xí)”方法對比結(jié)果明細
對比方法在6個實驗中取得了平均85.52%的準確率,表明該方法所選取的特征在診斷過程中有較高的穩(wěn)定性。
但該方法在特定故障診斷的過程中,每組實驗都會出現(xiàn)幾組診斷準確率非常低的情況。反之,本文所提出方法不僅具備較高的平均診斷準確率,且對所有類型故障都能保持高診斷準確率。
傳統(tǒng)信號處理方法無法保證對于所有故障特征信號都具備足夠的識別能力,而提出方法由于使用領(lǐng)域?qū)菇Y(jié)合分類優(yōu)化訓(xùn)練策略,能夠在保證故障特征對工況不敏感的情況下最大程度地提升故障識別能力,具備更強的通用性。
針對現(xiàn)階段設(shè)備故障診斷的準確率受工作條件等變化影響,導(dǎo)致待診斷數(shù)據(jù)與訓(xùn)練數(shù)據(jù)分布特性存在較大差異的問題,本文提出了一種基于領(lǐng)域?qū)咕W(wǎng)絡(luò)的設(shè)備故障診斷方法,采用領(lǐng)域?qū)购头诸悆?yōu)化相結(jié)合的訓(xùn)練策略,在保證故障特征對工況變化不敏感的前提下,提升故障識別能力。
通過軸承多種故障診斷實驗結(jié)果及對比,表明提出方法具備兩點優(yōu)勢:
(1)相較于其他深度學(xué)習(xí)方法,提出方法由于對故障特征進行了領(lǐng)域?qū)褂?xùn)練,能夠適應(yīng)工況變化,具備更高的診斷準確率;
(2)相較于“傳統(tǒng)信號處理+機器學(xué)習(xí)”方法,提出方法提取的故障特征能夠保證對所有故障都具備足夠的敏感性,通用性更強;且提出方法不依賴于復(fù)雜的信號處理技術(shù)與專家經(jīng)驗,降低了應(yīng)用難度。