韓特 劉超 沈長青 史紅梅 司瑾 蔣東翔
摘要 傳統(tǒng)數據驅動的機械裝備故障診斷方法依賴目標工況下的完備數據,而裝備實際運行工況復雜多變,難以預測,且數據獲取困難。針對上述問題,提出了一種深度嵌入度量網絡(Deep Embedding Metric Network, DEMN)的機械跨工況故障識別方法,該方法利用裝備在已知工況下的數據學習魯棒特征表示,建立適用于未知工況場景下的泛化智能故障識別模型?;诙喑叨染矸e神經網絡(Multiscale Convolutional Neural Network, MCNN)獲取故障信號的深度嵌入特征;用度量學習方法引導判別性特征學習,構建特征嵌入空間下的三元組損失(Triplet Loss, TL);利用粒子群算法(Particle Swarm Optimization, PSO)對間隔參數進行尋優(yōu)。所提方法有效縮小裝備健康狀態(tài)類內距離、擴大類間距離,降低工況變化對健康狀態(tài)映射關系的影響。實驗結果表明,該方法在齒輪箱跨工況故障診斷實驗中表現(xiàn)出良好的識別精度與泛化性能。
關鍵詞 故障診斷; 齒輪箱; 卷積神經網絡; 度量學習; 跨工況
引 言
機械裝備如風力發(fā)電機、航空發(fā)動機等,正在朝著復雜化、精密化、大容量的方向發(fā)展。時變轉速、復雜載荷以及大沖擊擾動等惡劣運行工況極易引發(fā)各類故障,嚴重影響了裝備的安全性和可靠性。開發(fā)具有實時數據處理、分析、決策的狀態(tài)監(jiān)測與故障診斷系統(tǒng)對于提高機械裝備安全可靠性具有重要的意義[1]。
隨著工業(yè)互聯(lián)網技術的快速發(fā)展,傳感器網絡實時收集并存儲機械裝備運行數據,機械大數據的時代隨之來臨。近年來,結合數據驅動和人工智能技術的機械裝備智能故障診斷理論方法得到了越來越廣泛的研究與實踐,為實時分析機械運行數據、監(jiān)測裝備健康狀態(tài)提供了新的思路和解決途徑[2?3]。其中,深度學習方法備受青睞。Zhao等[4]系統(tǒng)綜述了基于深度學習模型的機械健康狀態(tài)監(jiān)測方法,并結合刀具磨損開展案例研究。Khan等[5]圍繞深度學習在裝備健康管理中的應用發(fā)表綜述文章。盡管深度學習的成功案例被不斷報道,但將其靈活應用于機械裝備故障診斷中仍然任重道遠。現(xiàn)有研究通?;趦蓚€假設:①模型訓練數據和布署場景中的測試數據遵從獨立同分布;②可以獲取大量典型標記的故障數據進行模型訓練。
在工程實踐中,上述假設往往難以成立,究其原因為機械裝備運行工況復雜,如轉速和負載多變。具體而言,① 機械監(jiān)測物理量既攜帶了裝備運行狀態(tài)的信息,如性能和故障特征等,又包含工況信息。二者在監(jiān)測信號中相互耦合。當運行工況發(fā)生改變,測試信號中的故障特征信息也隨之變化[6],即數據故障特征分布發(fā)生漂移。故障診斷模型訓練數據與目標工況下的測試數據之間獨立同分布的假設很難滿足;② 由于機械裝備在實際運行環(huán)境中工況多變,診斷模型實際布署場景的運行工況未知且難以預測。目標工況下的可用數據獲取困難,無法重新訓練學習故障診斷模型。綜上所述,機械裝備復雜工況對智能故障診斷方法的有效性提出了挑戰(zhàn)。亟需開展跨工況故障診斷方法研究,即在特定工況數據中構建診斷模型,并當工況發(fā)生改變時仍能夠準確識別裝備健康狀態(tài)[7]。如何挖掘訓練數據中的魯棒特征表示,降低工況變化對健康狀態(tài)映射關系的影響是跨工況故障診斷方法的核心問題。
為了打破智能故障診斷中訓練數據與測試數據獨立同分布的假設,開發(fā)適應于跨工況乃至跨領域的靈活智能故障診斷方法,基于遷移學習的智能故障診斷方法應運而生[8?9]。Lu等[10]首次在深度模型中考慮輔助域和目標域數據分布的最大均值差異(Maximum Mean Discrepancy, MMD)最小化,并在軸承與齒輪箱跨工況診斷實驗中進行方法驗證。Zhang等[11]利用Wasserstein距離評估軸承在不同轉速下數據分布的差異,以對抗訓練(Adversarial Training, AT)的方式學習領域不變性特征表示,實現(xiàn)了在跨工況場景下的軸承故障遷移診斷。Chen等[12]提出了一種領域對抗遷移網絡(Domain Adversarial Transfer Network, DATN), 解決了旋轉機械在不同轉速條件和噪聲環(huán)境下的跨工況故障診斷問題。遷移學習方法為不同工況下的診斷任務建立起橋梁,緩解模型對目標工況故障訓練數據的依賴。但與此同時,該類方法在工程實踐中依然存在一定局限性,即假設目標工況已知,且存在一定數據進行遷移學習,如少量標記故障數據或包含裝備故障信息的無標記數據。
針對上述問題,本文將從泛化建模角度開展機械裝備跨工況故障診斷方法研究。僅利用已知工況下的數據訓練模型,重點關注模型在未知目標工況場景下的魯棒性與泛化能力。提出了一種深度嵌入度量網絡。在深度特征嵌入空間中,利用度量學習挖掘機械裝備不同健康狀態(tài)數據的內在判別結構,構建決策邊界泛化的分類模型,準確識別未知目標工況下機械裝備健康狀態(tài)。
1 多尺度卷積神經網絡
1.1 Inception單元模塊
深度學習通過構建多層網絡結構以獲取高度非線性空間變換能力。卷積神經網絡(Convolutional Neural Network, CNN)是深度學習中的最重要的模型之一。本文將在CNN框架下開展研究。CNN模型主要由前端卷積?池化模塊f進行特征學習和提取,并由后端分類模塊C進行識別。
傳統(tǒng)CNN模型單個卷積層通常采用單一尺寸的卷積核。由于機械裝備工況信息和故障信息的相互調制,工況變化會引起故障特征頻率以及尺度的改變。單一尺度的卷積核無法有效捕獲不同時間尺度下的故障特征表達,模型容易過擬合于特定工況訓練數據。受GoogLeNet中的Inception單元啟發(fā)[13],可以將多個不同尺寸的卷積核集成,對信號進行卷積操作和多尺度特征提取。不同卷積核的輸出最后被級聯(lián),傳送至下一層。其結構如圖1所示,該模塊分別采用了1×1,1×3和1×5的卷積核。值得注意的是:① 較大的卷積核適用于機械信號中的時間尺度較大的慢變分量,而較小的卷積核則能更加有效地提取信號中的瞬態(tài)成分;② 通道級聯(lián)意味著不同尺度特征的融合;③ 使用1×1卷積核可以改變通道數,降低特征維度;④ 模塊中通過嵌入最大池化操作,進一步增強模型魯棒性。
1.2 基礎網絡模型設計
基于上述Inception單元的多尺度特征提取,本文設計了一種多尺度卷積神經網絡,用于不同工況下的機械信號故障特征學習。網絡輸入為原始一維時域信號。CNN第一層作用類似于Gabor濾波器組,對原始信號在頻域的不同尺度上進行特征提取。鑒于此,網絡第一層采用16通道的1×128大尺寸卷積核,提取信號中體現(xiàn)故障本質特征,如沖擊、諧波等信息,捕獲中低頻段低層特征[14]。然后,網絡包含兩個多尺度特征提取模塊。由于經過第一層大尺寸卷積核的特征仍然具有較高維度,第一個多尺度特征提取模塊首先分別采用1×31和1×15的長卷積核,然后采用1×5卷積核提取抽象特征組合。第二個多尺度特征提取模塊采用了和Inception單元相同的參數設置。經過前端的多尺度特征提取,可以獲取原始信號在深度模型中的特征嵌入。然后,采用全局平均池化(Global Average Pooling, GAP)對特征嵌入進行降維,并與輸出層進行全連接,輸出裝備健康狀態(tài)識別結果。所設計的網絡結構及參數如圖2所示。
2 深度嵌入度量學習故障診斷方法
2.1 深度嵌入度量損失優(yōu)化
為了進一步建立對未知工況數據魯棒的故障診斷模型,需要誘導深度網絡學習具有強判別性和泛化能力的故障特征表示。本文考慮在深度特征嵌入空間下引入度量學習方法。利用已知工況訓練數據和機械健康狀態(tài)監(jiān)督信息,優(yōu)化得到新的特征嵌入空間,使得同類樣本特征之間距離縮小,不同類樣本特征差異增大。
在度量學習方法中,損失函數設計至關重要,其中,三元組損失應用較為廣泛[15]。所謂三元組,即為包含錨點樣本(anchor, xai)、正樣本(positive, xpi)和負樣本(negative, xni)的樣本組(xai,xpi,xni)。其中,xai與xpi為同類樣本,xai與xni不屬于同類樣本。通過構造上述三元組,并輸入到深度學習模型中,獲得高維空間下的深度特征嵌入(f(xai),f(xpi),f(xni)),其中f(?)表示將原始樣本映射到特征嵌入空間的函數。模型優(yōu)化將縮小f(xai)與f(xpi)的類內距離,擴大f(xai)與f(xni)的類間距離。該過程可以表示為:
式中 α表示間隔參數,保證三元組中類間距離大于類內距離。
對于給定訓練數據,可以構造三元組集合,三元組損失定義如下:
式中 Ntr為三元組個數。
本質上,對于特定機械健康狀態(tài),工況變化致使的數據分別漂移可視為樣本的類內差異?;诖?,在深度特征嵌入空間下考慮三元組損失優(yōu)化可以有效降低工況變化對特征分布的影響,建立決策邊界泛化的診斷模型,優(yōu)化過程如圖3所示。
如何構造合適的三元組對于模型訓練至關重要。對于遍歷得到的三元組集合中,可以分為以下三類:① 簡單三元組(Easy triplets):自然滿足式(1);② 半難三元組(Semi?hard triplets):由下式定義:
③ 困難三元組(Hard triplets):由下式定義:
簡單三元組對應的損失函數值為0,因此將忽略此類三元組,重點優(yōu)化半難和困難三元組度量距離損失。
2.2 深度嵌入度量網絡
在MCNN中考慮上述三元組損失,本文所提的DEMN模型結構如圖4所示。通過多尺度特征提取,獲得原始信號的深度特征嵌入,隨后分別計算由分類器模塊輸出的交叉熵損失與三元組度量損失。網絡總體損失函數定義如下:
式中 Lc為交叉熵損失項;Lt為三元組度量損失項,Lweight為網絡參數正則化項,用以約束模型復雜度,避免過擬合;λ和μ為平衡系數,統(tǒng)一取0.01;θ為模型參數。交叉熵損失計算公式如下:
式中 N表示訓練樣本個數;Nc表示裝備健康狀態(tài)類別個數;(xi,yi)為訓練樣本和對應的健康狀態(tài)標簽;P(y?i=j|xi)為網絡輸出層預測樣本xi屬于第j類健康狀態(tài)的概率。
2.3 度量間隔參數尋優(yōu)
度量損失優(yōu)化目標中雖然只有間隔參數α需要設定,但其選擇直接影響模型性能。因此,本文利用粒子群算法(Particle Swarm Optimization, PSO)進行自適應參數尋優(yōu)。
一般而言,適應度函數可以選用測試集樣本準確率。由于跨工況故障診斷問題中的目標工況樣本未知,需要利用已知訓練數據構造適應度函數指導參數尋優(yōu)??紤]到度量損失優(yōu)化目標中的類內差異縮小、類間距離擴大可以有效降低模型分類診斷的不確定性,在交叉驗證意義下,利用訓練集樣本健康狀態(tài)概率分布的信息熵作為PSO算法的適應度函數。計算公式如下:
2.4 跨工況故障診斷方法流程
提出的深度嵌入度量學習故障診斷方法流程如圖5所示,詳細實驗步驟如下:
(1) 利用振動傳感器獲取機械裝備關鍵部件處的振動信號,并進行降噪、歸一化等預處理。將振動信號切割成固定大小的樣本,為輸入DEMN做準備。
(2) 將已知工況條件下的數據用于模型訓練。待模型訓練完畢,測試樣本為布署場景監(jiān)測數據。實際布署場景運行工況未知,假設不同于訓練數據來源工況。
(3) 利用一維多尺度卷積神經網絡進行原始數據自適應特征提取,獲取深度特征嵌入。
(4) 利用PSO算法對三元組損失中的間隔參數進行尋優(yōu)。
(5) 基于獲取的最優(yōu)間隔參數,在已知工況數據中訓練DEMN模型。
(6) 將目標工況下的測試樣本輸入訓練完成的模型中,得到故障診斷結果。
3 齒輪箱故障診斷實驗驗證
為了驗證本文提出的DEMN模型對機械跨工況故障識別的有效性與優(yōu)越性,以工業(yè)齒輪箱為對象,分別采用預診斷與健康管理 (Prognostics and Health Management, PHM) 協(xié)會公開的定軸齒輪箱數據[16]、清華大學故障診斷實驗室的HS?200行星齒輪箱數據[7]和HD?FD?03X轉子齒輪故障模擬實驗臺的行星齒輪故障數據進行實驗驗證和對比分析。
3.1 跨工況故障診斷實驗案例
PHM齒輪箱故障數據集:該數據集實驗裝置如圖6所示。齒輪箱為兩級直齒齒輪箱。齒輪箱振動信號由安裝在箱體上的加速度傳感器測量獲得。本文選取靠近輸出端的加速度信號進行分析。信號采樣頻率為66.67 kHz。經過預處理切割的單個樣本包含4096采樣點。齒輪箱輸出軸轉頻分別為30,35,40,45和50 Hz。實驗采集了8種齒輪箱健康狀態(tài)下的運行數據,包括健康和7種故障類型,詳細健康狀態(tài)描述見參考文獻[16]。
根據實驗輸入軸轉速,設計了3個跨工況故障診斷實驗E1~E3,如表1所示。以E1為例,表示利用40,45,50 Hz工況下的數據訓練模型,利用30,35 Hz工況下數據測試模型效果。
清華大學齒輪箱故障數據集:第二個案例基于作者開展的行星齒輪箱故障模擬實驗展開[7]。所采用的齒輪箱型號為HS?200減速機。該齒輪箱為單級行星齒輪結構,減速比為3.57。利用電機驅動齒輪箱,輸出端連接風力機風輪作為負載。齒輪箱振動信號由箱體上水平和豎直方向的加速度傳感器進行測量收集,信號采樣頻率為20 kHz。經過預處理切割的單個樣本包含4096采樣點。實驗裝置如圖7所示。實驗采集了9個不同健康狀態(tài)的齒輪箱振動信號。齒輪箱健康狀態(tài)描述如表2所示。齒輪箱輸入軸轉速范圍為20~40 Hz,設計了2個跨工況故障診斷實驗E4和E5,如表1所示。
北京交通大學齒輪箱故障數據集:第三個案例數據來源于北京交通大學軌道交通智能檢測技術研究所的HD?FD?03X轉子齒輪故障模擬實驗臺。實驗裝置如圖8所示。齒輪箱由電機驅動,輸出端負載由制動加載器提供。實驗選取了齒輪箱上水平和豎直兩個方向的加速度信號進行分析,信號采樣頻率為20 kHz。經過預處理切割的單個樣本包含2048采樣點。電機轉速為2000 r/min,負載分別為0,3和5 N。實驗對5種齒輪箱健康狀態(tài)進行識別,分別為健康,太陽輪磨損,行星輪斷齒,行星輪裂紋,行星輪點蝕。根據不同負載狀態(tài),設計了2個跨工況故障診斷實驗E6和E7,如表1所示。
3.2 模型參數及對比研究
本文提出的DEMN由MCNN基礎網絡和深度嵌入度量損失優(yōu)化模塊組成。其中MCNN結構參數如圖2所示,包括前段的大尺寸卷積核、2個多尺度特征提取模塊以及分類模塊。除最后一層激活函數使用Softmax外,其余各層均使用LeakyReLU。為了避免模型過擬合,在卷積層后加入Dropout。深度嵌入度量損失優(yōu)化模塊無網絡結構參數。模型執(zhí)行框架為PyTorch,優(yōu)化器選擇SGD,學習率為0.001,批量大小為32個樣本,模型訓練終止策略采用Early Stopping,Patience選擇20。
為了驗證DEMN模型的優(yōu)越性,實驗選取了四種典型故障診斷模型進行對比研究。詳細介紹如下:① 基于大尺寸卷積核的CNN模型[14] (Deep CNN with Wide First?layer Kernels, WDCNN), 模型包含5個卷積層、5個池化層以及2層全連接,其中第一層卷積層采用大尺寸卷積核提高全局特征提取能力。② MCNN,為DEMN的基礎網絡。③ 殘差網絡[17] (Residual Network, ResNet),利用殘差結構有效提高模型深度,增強模型故障特征學習能力,包含1個大尺寸卷積層,4個殘差學習單元,3個全連接層。每個殘差單元包含2層卷積。④ 膠囊網絡[18] (Capsule Network, CapsuleNet),包含一系列向量神經元的膠囊結構,保證在特征映射中的時移不變性和特征表示中的同變性,在基于短時傅里葉變換時頻圖信號的軸承故障診斷中表現(xiàn)出良好的泛化能力。
3.3 實驗結果與討論
3.3.1 跨工況故障診斷實驗結果分析
各方法在7個跨工況診斷實驗中的故障識別結果如表3和圖9所示。每次結果為5次隨機實驗的平均值和標準差??梢钥闯觯酓EMN在7個跨工況診斷實驗中均表現(xiàn)出最優(yōu)的識別精度。相比于基礎MCNN網絡,考慮了深度嵌入度量損失優(yōu)化后,診斷準確率分別提高:19.2%,13.5%,5.2%,11.2%,13.2%,3.6%,7.3%。實驗結果表明:考慮度量學習優(yōu)化的深度特征嵌入具有更強的魯棒性和抗工況干擾能力。因此,本文方法在處理跨工況故障診斷問題時具有良好的泛化能力。此外,MCNN的整體表現(xiàn)優(yōu)于WDCNN,多尺度特征提取模塊可以學習不同工況下更加本質的機械故障特征。對于另外兩種深度學習模型,ResNet和CapsuleNet平均診斷準確率均在80%附近,較WDCNN和MCNN無明顯優(yōu)勢,表明了現(xiàn)有深度學習模型在跨工況故障診斷問題中的局限性。
3.3.2 跨工況特征分布可視化
為了直觀解釋DEMN方法在跨工況故障診斷場景下的機理,本文利用t分布隨機鄰域嵌入(t?distributed Stochastic Neighbor Embedding, t?SNE)對深度特征嵌入空間向量進行降維,獲得不同工況、不同健康狀態(tài)下的數據特征分布。由于篇幅限制,僅對E1和E4展示特征分布可視化,結果如圖10和11所示,其中□表示已知工況下訓練樣本,×表示目標工況下的測試樣本。不同顏色代表齒輪箱不同健康狀態(tài)。
通過分析圖10和11可知:①在MCNN中,同類健康狀態(tài)的已知工況訓練樣本和目標工況測試樣本的特征分布出現(xiàn)明顯漂移,即模型在訓練樣本中學習的故障特征表示無法有效避免工況干擾。例如,圖10中狀態(tài)3和狀態(tài)4的訓練與測試樣本特征分布差異明顯,且測試樣本分布出現(xiàn)明顯混疊。②通過引入度量損失優(yōu)化,DEMN極大程度上縮小了已知工況數據特征分布的類內距離、擴大了類間距離。相比于MCNN,同類訓練樣本的聚集性,以及不同類樣本的可分性得到進一步提升。③值得強調的是,DEMN有效消除了已知工況與目標工況樣本特征分布的漂移。在無目標工況數據參與模型訓練的前提下,基本實現(xiàn)遷移學習方法的預期目標。本質上,在已知工況訓練數據特征嵌入空間下,類內距離縮小、類間距離擴大可以有效增強模型故障特征判別能力,提升決策邊界泛化能力,進而降低工況變化對健康狀態(tài)映射關系的影響。
圖12采用混淆矩陣對DEMN診斷結果進行展示。以實驗E1為例,狀態(tài)4和狀態(tài)5的部分樣本被誤識別,這與特征分布可視化結果一致,即在目標工況下兩種健康狀態(tài)的測試樣本分布接近。總體而言,所提方法在齒輪箱跨工況故障診斷實驗中表現(xiàn)出較高的診斷精度和良好的泛化性能,具有較強的工程實際應用價值。
3.3.3 間隔參數尋優(yōu)對診斷結果影響
進一步對間隔參數α的選擇進行討論, PSO算法種群數量為50,迭代次數為20,慣性權重為0.9,學習因子為0.5和0.3,間隔參數α的優(yōu)化區(qū)間為[0, 100]。在7個跨工況診斷實驗中,分別以人工設定的間隔參數和經過PSO算法尋優(yōu)后的間隔參數進行模型訓練,得到的診斷結果在表4中給出??梢钥闯?,本文方法可以有效選取最優(yōu)間隔參數,指導三元組構建及深度模型訓練,所提DEMN均取得最高的診斷準確率。
3.3.4 不同噪聲環(huán)境下診斷結果分析
機械裝備運行工況復雜,外部噪聲往往對監(jiān)測數據造成干擾。因此,需要驗證本文方法在不同噪聲環(huán)境下的泛化性能。對測試樣本添加不同程度的高斯白噪聲,其信噪比(Signal?to?Noise Ratio, SNR)范圍為[0 dB, 30 dB],模型訓練樣本不變。以實驗E1和E4為例,基礎模型MCNN和所提DEMN結果對比如圖13和14所示。
測試樣本進一步加噪后,模型將同時面臨轉速、負載變化和噪聲的干擾。訓練樣本與測試樣本的分布漂移將進一步加劇??梢钥闯?,隨著噪聲水平的提高,兩種模型的精度都出現(xiàn)了不同程度的下降。相比于基礎模型MCNN,所提DEMN依然可以抵制一定程度的噪聲干擾,表現(xiàn)出較強的魯棒性。以實驗E4為例,隨著SNR降低,MCNN平均識別準確率持續(xù)降低。而在[10 dB, 30 dB]范圍內,DEMN表現(xiàn)穩(wěn)定,識別準確率超過91%。在2 dB的低信噪比場景中,MCNN和DEMN識別準確率分別為57.7%和80.4%,較無噪聲場景,模型精度下降比例分別為33.1%和17.5%,DEMN優(yōu)勢明顯。上述結果表明,基于度量學習優(yōu)化的深度特征嵌入空間在未知噪聲環(huán)境具有更強的泛化能力。
4 結 論
針對機械裝備工況變化致使的數據分布漂移問題,本文提出了一種深度嵌入度量學習的跨工況故障診斷方法。所提方法能夠利用已知工況數據構建泛化診斷模型,解決機械裝備實際運行工況多變且缺乏相應數據進行診斷模型訓練的難題。主要結論如下:
(1) 在深度特征嵌入空間下優(yōu)化度量學習損失,縮小特征類內距離,擴大類間差異有利于構建泛化決策邊界,降低工況變化對故障映射關系的影響,有效提高模型在跨工況故障診斷任務中的識別精度。
(2) 通過PSO算法對度量間隔參數進行尋優(yōu),指導三元組構造及度量損失計算,增強網絡的判別性特征學習能力。
(3) 在三個齒輪箱故障診斷案例中,相較于現(xiàn)有深度學習模型,所提DEMN在目標工況和噪聲環(huán)境下取得了更優(yōu)的故障識別精度和泛化性能。
參考文獻
1周陳林, 董紹江, 李玲, 等. 滾動軸承多狀態(tài)特征信息的改進型卷積神經網絡故障診斷方法[J]. 振動工程學報, 2020, 33(4): 854-860.
ZHOU Chenlin, DONG Shaojiang, LI Ling, et al. Method to improve convolutional neural network in rolling bearing fault diagnosis with multi-state feature information[J]. Journal of Vibration Engineering, 2020, 33(4): 854-860.
2李霽蒲, 黃如意, 陳祝云, 等.一種用于主軸軸承故障診斷的深度卷積動態(tài)對抗遷移網絡[J]. 振動工程學報, 2022, 35(2): 446-453.
LI Jipu, HUANG Ruyi, CHEN Zhuyun, et al. A deep convolutional dynamic adversarial transfer network for spindle bearing fault diagnosis[J]. Journal of Vibration Engineering, 2022, 35(2): 446-453.
3雷亞國, 賈峰, 孔德同, 等.大數據下機械智能故障診斷的機遇與挑戰(zhàn)[J].機械工程學報, 2018, 54(5): 94-104.
LEI Yaguo, JIA Feng, KONG Detong, et al. Opportunities and challenges of machinery intelligent fault diagnosis in big data era[J]. Journal of Mechanical Engineering, 2018, 54(5): 94-104.
4ZHAO R, YAN R, CHEN Z, et al. Deep learning and its applications to machine health monitoring[J]. Mechanical Systems and Signal Processing, 2019, 115: 213-237.
5KHAN S, YAIRI T. A review on the application of deep learning in system health management[J]. Mechanical Systems and Signal Processing, 2018, 107: 241-265.
6趙明. 變轉速下機械動態(tài)信息的自適應提取與狀態(tài)評估[D]. 西安:西安交通大學, 2013.
ZHAO Ming. Adaptive dynamic information extraction and state evaluation for machinery under varying speeds[D]. Xi'an: Xi'an Jiaotong University, 2013.
7韓特. 基于深度遷移學習的旋轉機械故障診斷方法研究[D]. 北京:清華大學, 2020.
HAN Te. Research on fault diagnosis method for rotating machinery based on deep transfer learning[D]. Beijing: Tsinghua University, 2020.
8沈飛, 陳超, 徐佳文, 等. 基于時間遷移模型的旋轉機械實時故障診斷[J].儀器儀表學報, 2019, 40(10): 84-94.
SHEN Fei, CHEN Chao, XU Jiawen, et al. Time transfer model based rotating machine real-time fault diagnosis[J]. Chinese Journal of Scientific Instrument, 2019, 40(10): 84-94.
9YAN R, SHEN F, SUN C, et al. Knowledge transfer for rotary machine fault diagnosis[J]. IEEE Sensors Journal, 2019, 20:8374-8393.
10LU W, Liang B, Cheng Y. Deep model based domain adaptation for fault diagnosis[J]. IEEE Transactions on Industrial Electronics, 2017, 64(3): 2296-2305.
11ZHANG M, WANG D, LU W, et al. A deep transfer model with Wasserstein distance guided multi-adversarial networks for bearing fault diagnosis under different working conditions[J]. IEEE Access, 2019, 7: 65303-65318.
12CHEN Z, HE G, LI J, et al. Domain adversarial transfer network for cross-domain fault diagnosis of rotary machinery[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(11): 8702-8712.
13Szegedy C, Ioffe S, Vanhoucke V, et al. Inception-v4: Inception-ResNet and the impact of residual connections on learning[C]. Proceedings of the AAAI Conference on Artificial Intelligence, AAAI 2017. Palo Alto, CA, USA, 2017: 4278-4284.
14ZHANG W, PENG G, LI C, et al. A new deep learning model for fault diagnosis with good anti-noise and domain adaptation ability on raw vibration signals[J]. Sensors, 2017, 17(2): 425.
15Schroff F, Kalenichenko D, Philbin J. FaceNet: a unified embedding for face recognition and clustering[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2015: 815-823.
16Alatat H, Siegel D, Lee J. A systematic methodology for gearbox health assessment and fault classification[J]. International Journal of Prognostics and Health Management, 2011, 2(1): 16-22.
17YANG B, LEI Y, JIA F, et al. A polynomial kernel induced distance metric to improve deep transfer learning for fault diagnosis of machines[J]. IEEE Transactions on Industrial Electronics, 2020, 67(11): 9747?9757.
18ZHU Z, PENG G, CHEN Y, et al. A convolutional neural network based on a capsule network with strong generalization for bearing fault diagnosis[J]. Neurocomputing, 2019, 323: 62?75.
Deep embedding metric learning for machinery fault identification across different working conditions
HAN Te 1 ?LIU Chao 2 ?SHEN Chang-qing 3SHI Hong-mei 4SI Jin 4JIANG Dong-xiang 2
1. Department of Industrial Engineering, Tsinghua University, Beijing 100084, China;
2. Department of Energy and Power Engineering, Tsinghua University, Beijing 100084, China;
3. School of Rail Transportation, Soochow University, Suzhou 215131, China;
4. Key Laboratory of Vehicle Advanced Manufacturing, Measuring and Control Technology of Ministry of Education, Beijing Jiaotong University, Beijing 100044, China
Abstract The complete training data under target working conditions are necessary for the traditional data-driven fault diagnosis methods of machinery. However, the actual working conditions of mechanical equipment are complicated and difficult to predict, and thus it is difficult to obtain sufficient training data. To solve this problem,this paper proposed a deep embedding metric net?work(DEMN)for mechanical fault identification across different working conditions. The proposed method uses the data underknown working conditions to learn robust feature representation, and then establish the generalized fault diagnosis model for the unseen working conditions. First, the deep embedding features of fault signal are extracted by the multiscale convolutional neural network(MCNN). Then, the triplet loss-based metric learning objective is optimized to enhance the discriminant ability of classification boundary. Particle swarm optimization(PSO)algorithm is executed to the search the optimal margin in triplet loss. By facilitating the intra-class compactness and the inter-class separability, the influence of working condition changes to fault relationship mapping is significantly reduced. The experimental results show that the proposed method presents superior accuracy and generalization performance in gearbox fault diagnosis across different working conditions.
Keywords fault diagnosis; gearbox; convolutional neural network; metric learning; across working conditions