摘 要:現(xiàn)有基于深度學(xué)習(xí)的軸承故障診斷方法對(duì)數(shù)據(jù)具有一定的依賴性,要求訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)具有相同的分布。在變工況的條件下,網(wǎng)絡(luò)模型的故障診斷精度會(huì)因數(shù)據(jù)分布發(fā)生變化而下降。為保證網(wǎng)絡(luò)模型能夠在變工況條件下對(duì)軸承的健康狀態(tài)進(jìn)行準(zhǔn)確識(shí)別,基于無(wú)監(jiān)督域自適應(yīng)理論,提出一種新穎的智能故障診斷網(wǎng)絡(luò)模型——?jiǎng)討B(tài)卷積多層域自適應(yīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)一方面充分利用動(dòng)態(tài)卷積強(qiáng)有力的特征提取能力,提取更多有效的故障特征;另一方面采用相關(guān)對(duì)齊實(shí)施非線性變換,同時(shí)對(duì)齊多層故障特征分布的二階統(tǒng)計(jì)量,促進(jìn)源域的診斷知識(shí)向目標(biāo)域遷移,提高了模型在目標(biāo)域無(wú)故障標(biāo)簽條件下的故障識(shí)別準(zhǔn)確率。最后,在兩個(gè)數(shù)據(jù)集共14個(gè)遷移任務(wù)下進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,動(dòng)態(tài)卷積多層域自適應(yīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)較高的故障診斷識(shí)別精度。
關(guān)鍵詞:軸承;智能故障診斷;無(wú)監(jiān)督域自適應(yīng);動(dòng)態(tài)卷積
中圖分類號(hào):TH212;TH213.3 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2022)07-028-2098-06
doi:10.19734/j.issn.1001-3695.2021.11.0652
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目;陜西省自然科學(xué)基礎(chǔ)研究計(jì)劃資助項(xiàng)目;十四五裝發(fā)預(yù)先研究項(xiàng)目
作者簡(jiǎn)介:周華鋒(1998-),男,江西吉安人,碩士研究生,主要研究方向?yàn)闄C(jī)械故障診斷與健康監(jiān)測(cè);程培源(1967-),男,陜西咸陽(yáng)人,教授,碩士,主要研究方向?yàn)殡娏ο到y(tǒng)及其自動(dòng)化;邵思羽(1991-),女(通信作者),山東鄒城人,講師,博士,主要研究方向?yàn)樯疃葘W(xué)習(xí)、遷移學(xué)習(xí)、機(jī)電設(shè)備健康狀態(tài)檢測(cè)與故障診斷(cathygx.sy@gmail.com);趙玉偉(1987-),男,山東青州人,講師,博士,主要研究方向?yàn)殡娏ο到y(tǒng)及其自動(dòng)化;焦曉璇(1990-),男,山西運(yùn)城人,講師,博士,主要研究方向?yàn)樾畔⑷诤?、故障診斷與預(yù)測(cè)研究.
Bearing fault diagnosis based on dynamic convolution multi-layer domain adaptive
Zhou Huafenga,Cheng Peiyuana,Shao Siyua?,Zhao Yuweia,Jiao Xiaoxuanb
(a.Air Defense amp; Missile Defense Academy,b.School of Aeronautical Engineering,Air Force Engineering University,Xi’an 710051,China)
Abstract:The existing deep learning-based bearing fault diagnosis methods always depend on data,and require that training data and testing data have the same distribution.Under the condition of variable working conditions,the model classification accuracy for fault diagnosis may decrease due to the change of data distribution.In order to ensure that fault diagnosis model can effectively identify the bearing working states under various conditions,this paper proposed a novel intelligent fault diagnosis network,called dynamic convolutional multilayer domain adaptation (DCMDA),which based on the theory of unsupervised domain adaptation.On the one hand,the proposed model made full use of the powerful feature extraction capability of dynamic convolution to extract more effective fault features.On the other hand,the proposed framework used correlation alignment (CORAL) to perform nonlinear transformation,at the same time,it aligned the second-order statistics of the multi-layer fault feature distribution.The proposed model promoted the transfer of diagnostic knowledge from the source domain to the target domain,and improved the fault recognition accuracy without fault labels from the target domain.Experimental verification on two datasets with a total of 14 transfer tasks show that the dynamic convolution multilayer domain adaptation network can achieve effective fault diagnosis with high recognition accuracy.
Key words:bearing;intelligent fault diagnosis;unsupervised domain adaptation;dynamic convolution
0 引言
隨著工業(yè)生產(chǎn)和制造技術(shù)的蓬勃發(fā)展,收集、存儲(chǔ)、處理數(shù)據(jù)能力的不斷提高,各種傳感器數(shù)據(jù)及儀器儀表數(shù)據(jù)不斷被挖掘,進(jìn)而為設(shè)備維修保障策略提供了新的機(jī)遇[1,2]。各種數(shù)據(jù)驅(qū)動(dòng)的診斷方法被廣泛應(yīng)用于機(jī)械設(shè)備健康監(jiān)測(cè)領(lǐng)域[3],并取得了一些顯著成果[4~7]。
雖然基于深度學(xué)習(xí)的智能診斷方法能夠有效識(shí)別設(shè)備的健康狀態(tài),但其首要前提是訓(xùn)練和測(cè)試數(shù)據(jù)必須在同樣的環(huán)境和工況下收集且都需要有標(biāo)簽。機(jī)械設(shè)備在實(shí)際運(yùn)行過(guò)程中,這種假設(shè)幾乎不可能實(shí)現(xiàn)。因?yàn)樵O(shè)備在實(shí)際工作中通常具有多種工況,其所處的環(huán)境以及運(yùn)行條件都在發(fā)生變化,如轉(zhuǎn)速、負(fù)載等條件都不盡相同,故其在不同工況下收集得到的數(shù)據(jù)概率分布也不同。文獻(xiàn)[8]也充分地證實(shí)了這一點(diǎn),機(jī)器智能故障診斷的有效應(yīng)用依賴于訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)服從相同的分布。因此,當(dāng)其概率分布不同時(shí),會(huì)導(dǎo)致利用訓(xùn)練數(shù)據(jù)訓(xùn)練出的網(wǎng)絡(luò)模型在測(cè)試數(shù)據(jù)上故障診斷性能下降[9]。
為了解決變工況下模型診斷精度下降的問(wèn)題,目前,已經(jīng)提出了幾種基于遷移學(xué)習(xí)[10~13]的智能故障診斷方法,并且獲得了良好的診斷效果。Wen等人[10]采用三層稀疏自編碼器提取原始數(shù)據(jù)的特征,并利用最大均值差異最小化訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)之間的特征差異,使其在測(cè)試集上有良好的診斷性能。Yang等人[11]使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)提取原始振動(dòng)數(shù)據(jù)的可遷移特征,利用領(lǐng)域自適應(yīng)和偽標(biāo)簽學(xué)習(xí)的正則化條件對(duì)CNN參數(shù)進(jìn)行約束,以減小可遷移特征的分布差異和類間距離。Lu等人[12]提出通過(guò)在源域中訓(xùn)練分類器或回歸模型,以適應(yīng)不同但相關(guān)的目標(biāo)域。
從上述文獻(xiàn)可以看出,現(xiàn)有故障診斷方法主要是通過(guò)最小化源域和目標(biāo)域之間的最大平均差異(MMD)[14]來(lái)提取域不變特征,實(shí)現(xiàn)在無(wú)標(biāo)簽?zāi)繕?biāo)域下的故障診斷。作為一種內(nèi)核方法,MMD存在一些缺點(diǎn),如全局泛化能力較低、對(duì)內(nèi)核選擇的敏感性高[15]以及對(duì)大規(guī)模應(yīng)用的可擴(kuò)展性[16]。且上述文獻(xiàn)都只度量了網(wǎng)絡(luò)中的某一層分布差異,忽略了卷積神經(jīng)網(wǎng)絡(luò)其他層提取到的特征。
基于此,為了使網(wǎng)絡(luò)模型同時(shí)在帶故障標(biāo)簽的源域與無(wú)故障標(biāo)簽的目標(biāo)域上有更好的診斷效果,本文提出了一種新穎的動(dòng)態(tài)卷積多層域自適應(yīng)網(wǎng)絡(luò)(DCMDA)。其一方面充分利用動(dòng)態(tài)卷積強(qiáng)有力的特征提取能力,提取更多有效的故障特征;另一方面采用相關(guān)對(duì)齊(CORAL)[17]執(zhí)行一個(gè)非線性變換,同時(shí)對(duì)齊多層故障特征分布的二階統(tǒng)計(jì)量以最小化源域與目標(biāo)域之間的差異,促進(jìn)源域的診斷知識(shí)向目標(biāo)域的遷移,提高模型在目標(biāo)域無(wú)故障標(biāo)簽條件下的故障識(shí)別準(zhǔn)確率。
1 基本概念
領(lǐng)域自適應(yīng),即給定一個(gè)有標(biāo)記的源域Ds={xi,yi}nsi=1和一個(gè)無(wú)標(biāo)記的目標(biāo)域Dt={xj}ntj=1,假定它們的特征空間相同,即χs=χt,它們的類別空間也相同,即ys=yt。但這兩個(gè)域的邊緣分布不同,即Ps(xs)≠Pt(xt)。遷移學(xué)習(xí)的目標(biāo)就是利用有標(biāo)記的數(shù)據(jù)Ds去學(xué)習(xí)一個(gè)分類器網(wǎng)絡(luò)來(lái)預(yù)測(cè)目標(biāo)域Dt的標(biāo)簽yt。
本文使用從機(jī)械設(shè)備某一工況下收集而來(lái)的帶標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練網(wǎng)絡(luò)模型,其訓(xùn)練完成的網(wǎng)絡(luò)模型能夠識(shí)別其他工況下機(jī)械設(shè)備的健康狀態(tài),如圖1所示,即本文在不同工況環(huán)境下進(jìn)行遷移學(xué)習(xí)。
更加具體地來(lái)講,在某一工況下收集而來(lái)的帶標(biāo)簽數(shù)據(jù)記為源域Ds={xi,yi}ni=1,其中{xi,yi}分別表示一個(gè)數(shù)據(jù)和相對(duì)應(yīng)的標(biāo)簽。與源域工況不同環(huán)境下收集而來(lái)的數(shù)據(jù)記為目標(biāo)域Dt={xj}ntj=1,其中xj是目標(biāo)域的一個(gè)數(shù)據(jù)樣本,與源域相比其不帶故障類別標(biāo)簽。本文假設(shè)源域與目標(biāo)域具有相同的標(biāo)簽空間,源域與目標(biāo)域的主要差別是不同工況下數(shù)據(jù)的概率分布不一致。本文提出的網(wǎng)絡(luò)結(jié)構(gòu)主要是通過(guò)衡量源域與目標(biāo)域之間的差異并減小差異,使深度卷積網(wǎng)絡(luò)能夠從中學(xué)習(xí)到域不變故障特征,從而能夠有效地對(duì)未帶標(biāo)記的目標(biāo)域故障數(shù)據(jù)進(jìn)行正確的故障分類。因此,能夠有效學(xué)習(xí)到域不變特征是完成域自適應(yīng)任務(wù)的關(guān)鍵。
2 網(wǎng)絡(luò)結(jié)構(gòu)
為了更好地提取故障特征,提高網(wǎng)絡(luò)的診斷性能,本文引入動(dòng)態(tài)卷積[18],其具有k個(gè)卷積核,它們具有相同的核大小和輸入輸出維度。通過(guò)注意力權(quán)重{πk(x)}進(jìn)行聚合,計(jì)算公式為
其中:k和k分別對(duì)應(yīng)第k個(gè)卷積核的權(quán)重向量與偏置向量;πk(x)是通過(guò)注意力模塊學(xué)習(xí)到的注意力權(quán)重。
在聚合卷積后使用批歸一化和激活函數(shù)(如ReLU)來(lái)構(gòu)建動(dòng)態(tài)卷積層,可作為一個(gè)模塊替代簡(jiǎn)單卷積,其結(jié)構(gòu)如圖2所示。
本文DCMDA網(wǎng)絡(luò)主要由故障模式分類模塊與域自適應(yīng)模塊兩個(gè)模塊組成。故障模式分類模塊主要用于自動(dòng)學(xué)習(xí)故障特征,并能夠準(zhǔn)確地對(duì)故障類別進(jìn)行分類。域自適應(yīng)模塊主要是為了減小源域與目標(biāo)域之間振動(dòng)數(shù)據(jù)的差異,使特征提取器提取到其共有的故障特征。域自適應(yīng)模塊主要包括多層度量差異結(jié)構(gòu),同時(shí)利用相關(guān)對(duì)齊[14]執(zhí)行一個(gè)非線性變換來(lái)對(duì)齊兩個(gè)分布的二階統(tǒng)計(jì)量,最小化源域與目標(biāo)域之間的差異。網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
2.1 故障分類模塊
故障分類模塊由一個(gè)數(shù)據(jù)輸入層、四個(gè)動(dòng)態(tài)卷積層、四個(gè)池化層、三個(gè)全連接層和一個(gè)softmax輸出分類層組成,其中最后一層利用softmax激活函數(shù)作為軸承健康狀態(tài)分類器。網(wǎng)絡(luò)主要參數(shù)如表1所示。
2.2 域自適應(yīng)模塊
域自適應(yīng)模塊主要利用相關(guān)對(duì)齊(CORAL)度量多層特征的二階統(tǒng)計(jì)量(協(xié)方差)[14]來(lái)最小化分布差異,使網(wǎng)絡(luò)結(jié)構(gòu)能夠?qū)W習(xí)到域不變特征。假設(shè)源域的訓(xùn)練樣本DS={xi},x∈d且其標(biāo)簽為L(zhǎng)S={yi},i∈{1,…,L},未標(biāo)記的目標(biāo)域數(shù)據(jù)DT={ui},u∈d,DijS(DijT)表示第i個(gè)源域(目標(biāo)域)的第j個(gè)維度的向量樣本,CS(CT)表示特征協(xié)方差矩陣。將CORAL損失定義為源域和目標(biāo)域的二階統(tǒng)計(jì)量之間的距離,如式(2)所示。
其中:‖·‖F(xiàn)表示其F范數(shù);源域Ds和目標(biāo)域Dt的特征協(xié)方差矩陣由式(3)(4)給出。
其中:1是所有元素等于1的列向量;需要學(xué)習(xí)的特征分別是hs=fθe(Ds)和ht=fθe(Dt),θe是對(duì)應(yīng)網(wǎng)絡(luò)層的可學(xué)習(xí)參數(shù)。對(duì)于本文提出的多層域適應(yīng)是去度量每一層的協(xié)方差,則其Ds和Dt分別對(duì)應(yīng)源域和目標(biāo)域的對(duì)應(yīng)層特征。
2.3 優(yōu)化目標(biāo)
本文提出的DCMDA網(wǎng)絡(luò)主要有以下兩個(gè)優(yōu)化目標(biāo):
a)最小化源域數(shù)據(jù)集上故障類別的分類損失。為了使DCMDA網(wǎng)絡(luò)能夠正確地識(shí)別機(jī)器的健康狀態(tài)類別并提取域不變特征,需要計(jì)算源域數(shù)據(jù)在訓(xùn)練過(guò)程中的分類損失。對(duì)于具有k種故障類別的數(shù)據(jù)集,其損失可以定義為標(biāo)準(zhǔn)的softmax分類損失,如式(5)所示。
其中:m是訓(xùn)練樣本的批次大?。籯是故障類別;I(·)是相應(yīng)的標(biāo)簽函數(shù),即若類別是k,則I[yi=k]=1,否則等于0;p(y|xs)是以xs為輸入相對(duì)應(yīng)的類別k的輸出概率。
b)最小化源域和目標(biāo)域多層特征的二階統(tǒng)計(jì)量差異,如式(6)所示。
結(jié)合以上提出的兩個(gè)損失,聯(lián)合最小化分類損失和CORAL損失同時(shí)進(jìn)行訓(xùn)練,更新網(wǎng)絡(luò)參數(shù),不僅能夠保證模型的分類準(zhǔn)確率,同時(shí)能夠提高其在目標(biāo)域上的泛化性能,其總損失定義為
其中:t表示網(wǎng)絡(luò)中需要適應(yīng)CORAL損失層的數(shù)量;λi是對(duì)應(yīng)層下的域自適應(yīng)損失權(quán)重;η是對(duì)應(yīng)分類損失的權(quán)重。為了使CLASS和CORAL兩個(gè)損失能夠在訓(xùn)練過(guò)程中達(dá)到平衡并且能夠充分發(fā)揮網(wǎng)絡(luò)性能,在實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn),其每一層的損失值權(quán)重會(huì)對(duì)網(wǎng)絡(luò)的性能造成較大的影響,故本文采用動(dòng)態(tài)調(diào)整對(duì)應(yīng)損失的權(quán)重參數(shù),即通過(guò)衡量每一層損失占總損失的比重,以此來(lái)分配每一層的權(quán)重大小,從而能夠使網(wǎng)絡(luò)能夠在目標(biāo)域上有更好的診斷性能。利用如式(8)(9)所示方法動(dòng)態(tài)調(diào)整超參數(shù)λi、η,其中iCORAL是計(jì)算出的每一層源域與目標(biāo)域的二階統(tǒng)計(jì)量的差異,λi是每一層的損失權(quán)重大小,η是分類損失占總損失的權(quán)重大小。
對(duì)于需要目標(biāo)損失函數(shù)最小化如式(10)所示。其中θf(wàn)、θd分別是特征模式識(shí)別分類模塊和域自適應(yīng)模塊所需更新的網(wǎng)絡(luò)權(quán)重參數(shù)。
接下來(lái)需采用更新梯度的優(yōu)化算法對(duì)網(wǎng)絡(luò)模型的權(quán)重參數(shù)進(jìn)行梯度更新。對(duì)于本文網(wǎng)絡(luò)結(jié)構(gòu)采用隨機(jī)梯度下降優(yōu)化算法進(jìn)行梯度更新。其對(duì)網(wǎng)絡(luò)權(quán)重參數(shù)的更新過(guò)程如式(11)(12)所示。
其中:ε為更新過(guò)程中的學(xué)習(xí)率??偟膩?lái)說(shuō),將帶標(biāo)記的源域故障數(shù)據(jù)和未帶標(biāo)記的目標(biāo)域故障數(shù)據(jù)送入網(wǎng)絡(luò)之后,按上述優(yōu)化目標(biāo)對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行更新。網(wǎng)絡(luò)訓(xùn)練結(jié)束之后,其能夠?qū)W習(xí)到源域和目標(biāo)域的域不變故障特征,具有很強(qiáng)的域自適應(yīng)能力,能夠在未標(biāo)記的變工況目標(biāo)域上具有很好的故障識(shí)別效果。
3 實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證DCMDA網(wǎng)絡(luò)在未標(biāo)記目標(biāo)域有很好的診斷效果,同時(shí)說(shuō)明網(wǎng)絡(luò)有很好的域自適應(yīng)能力,能夠?qū)W習(xí)到域不變特征,本文在軸承數(shù)據(jù)集和齒輪箱數(shù)據(jù)集共14個(gè)遷移任務(wù)上進(jìn)行了實(shí)驗(yàn)。
3.1 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理和分割是影響診斷模型性能的兩個(gè)重要方面。本文對(duì)故障樣本預(yù)處理時(shí)不采用數(shù)據(jù)增強(qiáng),劃分每個(gè)時(shí)域樣本的信號(hào)長(zhǎng)度為1 024,然后將長(zhǎng)度為1 024的時(shí)域故障樣本信號(hào)通過(guò)快速傅里葉變換(FFT)變換到頻域,由于變換后的頻域信號(hào)樣本具有對(duì)稱性,故取一半長(zhǎng)度,即以經(jīng)過(guò)FFT處理后,長(zhǎng)度為512的頻域信號(hào)作為診斷網(wǎng)絡(luò)的輸入,以此來(lái)訓(xùn)練網(wǎng)絡(luò)模型。同時(shí)為了提高模型的可信度,避免診斷模型在訓(xùn)練過(guò)程中使用測(cè)試數(shù)據(jù),按照訓(xùn)練集:測(cè)試集=8:2劃分?jǐn)?shù)據(jù)集,其中測(cè)試故障樣本只用于評(píng)估網(wǎng)絡(luò)的診斷性能,不參與模型的訓(xùn)練過(guò)程,其劃分方式如圖4所示。
對(duì)FFT變換后的數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化,使輸入值保持在一定的范圍內(nèi),如式(13)所示。
其中:xi是輸入數(shù)據(jù);xmeani是xi的均值;xstdi是xi的標(biāo)準(zhǔn)差。
3.2 凱斯西儲(chǔ)大學(xué)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
凱斯西儲(chǔ)大學(xué)(CWRU)軸承數(shù)據(jù)集是從圖5實(shí)驗(yàn)平臺(tái)收集而來(lái)的[19]。本文使用了采樣頻率為12 kHz的驅(qū)動(dòng)端的故障樣本數(shù)據(jù),共十種健康狀況,包含一種健康軸承(NA)和三種故障類型,并依據(jù)故障尺寸大小共分為十類(一個(gè)健康狀態(tài)和九個(gè)故障狀態(tài)),如表2所示。
此外, CWRU數(shù)據(jù)集包含四種不同的工況,每種工況下電機(jī)的負(fù)載與轉(zhuǎn)速不同,如表3所示。遷移任務(wù)0→1表示源域是0 HP、轉(zhuǎn)速為1 797 rpm下收集的數(shù)據(jù)。目標(biāo)域是1 HP、轉(zhuǎn)速為1 772 rpm下收集的數(shù)據(jù)。因此在本數(shù)據(jù)集上共設(shè)置了12個(gè)遷移學(xué)習(xí)任務(wù)。
利用本文提出的DCMDA網(wǎng)絡(luò)模型對(duì)已經(jīng)按照要求劃分的數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,分別在不同的工況下進(jìn)行域自適應(yīng)任務(wù)實(shí)驗(yàn)。由于其在源域測(cè)試集上的準(zhǔn)確率都能達(dá)到100%,故只討論在目標(biāo)域測(cè)試集上的診斷性能。利用本文提出的域自適應(yīng)方法,其在12個(gè)不同遷移任務(wù)下,每個(gè)遷移任務(wù)進(jìn)行20次實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖6所示。
可以發(fā)現(xiàn),DCMDA網(wǎng)絡(luò)模型在12個(gè)遷移任務(wù)的目標(biāo)域上的故障識(shí)別準(zhǔn)確率都在99%以上,很好地解決了無(wú)標(biāo)簽?zāi)繕?biāo)域工況發(fā)生變化、故障診斷性能下降的問(wèn)題。
此外,DCMDA分別與單層CORAL[17]、多核最大平均差異(MK-MMD)[20]、聯(lián)合最大平均差異(JMMD)[21]、域?qū)咕W(wǎng)絡(luò)(DANN)[22]和條件域?qū)咕W(wǎng)絡(luò)(CDAN)[23]五種域自適應(yīng)方法進(jìn)行對(duì)比。單層CORAL利用相關(guān)對(duì)齊(CORAL)只對(duì)齊某一層兩個(gè)分布,學(xué)習(xí)域不變特征[17];MK-MMD利用不同的內(nèi)核來(lái)對(duì)齊分布,從而選擇最優(yōu)內(nèi)核的方法來(lái)增強(qiáng)特征表示的可遷移性[20];JMMD準(zhǔn)則通過(guò)對(duì)齊多個(gè)領(lǐng)域特定層跨領(lǐng)域的聯(lián)合分布來(lái)學(xué)習(xí)領(lǐng)域不變特征;DANN在基于反向傳播的訓(xùn)練過(guò)程中,通過(guò)梯度反轉(zhuǎn)層將梯度乘以一定的負(fù)常數(shù),將一個(gè)域分類器連接到特征提取器,實(shí)現(xiàn)無(wú)監(jiān)督域自適應(yīng),最小化標(biāo)簽預(yù)測(cè)損失(對(duì)于源域)和域分類損失(對(duì)于所有示例),從而產(chǎn)生域不變的特征[22];CDAN條件域?qū)咕W(wǎng)絡(luò)對(duì)抗學(xué)習(xí)被嵌入到深度網(wǎng)絡(luò)中,學(xué)習(xí)可遷移特征,實(shí)現(xiàn)多模式域的區(qū)別對(duì)抗適應(yīng),從而實(shí)現(xiàn)領(lǐng)域自適應(yīng)[23]。它們?cè)诓煌蜃赃m應(yīng)任務(wù)下的準(zhǔn)確率如圖7所示。
從以上實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),所有的域自適應(yīng)方法在12個(gè)遷移任務(wù)上的故障識(shí)別準(zhǔn)確率都高達(dá)90%以上,但DCMDA的故障識(shí)別準(zhǔn)確率都優(yōu)于其他五種域自適應(yīng)方法。這是因?yàn)閱螌覥ORAL、MK-MMD、JMMD、DAAN、CDAN都只對(duì)單層的特征分布進(jìn)行對(duì)齊,沒(méi)有考慮其他高層的特征。而DCMDA方法采用動(dòng)態(tài)卷積,能夠提取更多的有效特征,同時(shí)采用對(duì)齊多層特征分布,能夠有效地促進(jìn)模型的正遷移,提高故障識(shí)別準(zhǔn)確率。
3.3 東南大學(xué)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
東南大學(xué)(SEU)數(shù)據(jù)集是由東南大學(xué)嚴(yán)如強(qiáng)團(tuán)隊(duì)提供的變速箱數(shù)據(jù)集[24]。該數(shù)據(jù)集包含軸承和齒輪的故障樣本數(shù)據(jù),這些數(shù)據(jù)集均從圖8所示實(shí)驗(yàn)臺(tái)收集而來(lái)。
在實(shí)驗(yàn)期間,共通過(guò)八個(gè)傳感器通道收集數(shù)據(jù),本文使用來(lái)自通道2的振動(dòng)數(shù)據(jù)。SEU數(shù)據(jù)集根據(jù)轉(zhuǎn)速和負(fù)載的不同,分別設(shè)置20 Hz-0 V和30 Hz-2 V兩種不同的工作條件,記為0和1兩個(gè)任務(wù),每種工況下的數(shù)據(jù)集共有10種健康類別,如表4所示。例如,任務(wù)0→1表示源域故障樣本是在工作條件為20 Hz轉(zhuǎn)速和0 V負(fù)載下收集的,目標(biāo)域故障樣本是在30 Hz轉(zhuǎn)速和2 V負(fù)載條件下收集的,總共有0→1和1→0兩個(gè)遷移學(xué)習(xí)任務(wù)。
利用本文DCMDA網(wǎng)絡(luò)模型對(duì)已經(jīng)按照要求劃分的數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,分別在0→1和1→0上與未進(jìn)行遷移的網(wǎng)絡(luò)模型進(jìn)行對(duì)比實(shí)驗(yàn)。由于其利用有標(biāo)簽的源域數(shù)據(jù)進(jìn)行訓(xùn)練,在源域測(cè)試集上的準(zhǔn)確率都能達(dá)到100%,故只討論在目標(biāo)域測(cè)試集上的性能,共訓(xùn)練100次,在目標(biāo)域測(cè)試集上進(jìn)行測(cè)試的結(jié)果如圖9所示。從實(shí)驗(yàn)結(jié)果可以看出,采用本文DCMDA方法相較于未采用遷移方法而言,其準(zhǔn)確率都有一個(gè)較大的提高,尤其是在0→1的遷移任務(wù)上,其在目標(biāo)域測(cè)試集上的準(zhǔn)確率提高了30%以上,證明了本文方法的有效性。
本文DCMDA模型在0→1和1→0的遷移學(xué)習(xí)任務(wù)中,在目標(biāo)域測(cè)試集上的故障模式分類性能如圖10所示。從其混淆矩陣可以看出,其在大部分故障類別的診斷上都有很好的分類效果。
在此基礎(chǔ)上,為了進(jìn)一步說(shuō)明本文方法的有效性,避免實(shí)驗(yàn)的隨機(jī)性,保證對(duì)比實(shí)驗(yàn)的可信度,使用相同的數(shù)據(jù)預(yù)處理方法,將DCMDA網(wǎng)絡(luò)與其他五種域自適應(yīng)方法進(jìn)行對(duì)比分析。分別在域自適應(yīng)任務(wù)0→1和1→0上進(jìn)行了20次實(shí)驗(yàn),每次實(shí)驗(yàn)訓(xùn)練過(guò)程都在驗(yàn)證集上進(jìn)行驗(yàn)證,最后計(jì)算其20次實(shí)驗(yàn)的平均準(zhǔn)確率與標(biāo)準(zhǔn)差。結(jié)果如表5、圖11所示。
通過(guò)以上對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),相較于其他域自適應(yīng),DCMDA網(wǎng)絡(luò)具有一定的優(yōu)勢(shì),故障分類準(zhǔn)確率在不同遷移任務(wù)上的準(zhǔn)確率都在90%以上,在不同遷移任務(wù)上都有很好的適用性。
為了進(jìn)一步證實(shí)DCMDA網(wǎng)絡(luò)的優(yōu)越性,直觀了解遷移學(xué)習(xí)對(duì)目標(biāo)域故障特征的影響,使用隨機(jī)分布鄰域嵌入(t-SNE)技術(shù)將高維特征映射到二維空間,對(duì)不同的域自適應(yīng)方法在東南大學(xué)(SEU)數(shù)據(jù)集上0→1遷移任務(wù)上的結(jié)果進(jìn)行可視化表示,觀察其故障類別的分布如圖12所示。相較于其他域自適應(yīng)方法,通過(guò)可視化特征發(fā)現(xiàn),利用DCMDA網(wǎng)絡(luò),其在目標(biāo)域上的故障特征分類邊界更加明顯,所以在目標(biāo)域上的故障識(shí)別準(zhǔn)確率更高,優(yōu)于其他域自適應(yīng)方法。
另外,現(xiàn)有的一些無(wú)監(jiān)督域自適應(yīng)方法容易產(chǎn)生負(fù)遷移。為了對(duì)比在各個(gè)類別上的遷移效果,本文以沒(méi)有使用域自適應(yīng)算法的卷積神經(jīng)網(wǎng)絡(luò)作為基準(zhǔn),計(jì)算每一個(gè)類別的遷移率,其計(jì)算公式為
其中:Ri代表計(jì)算第i類的遷移率;Si是域自應(yīng)方法預(yù)測(cè)第i類正確的樣本數(shù);Ci是CNN預(yù)測(cè)第i類正確的樣本數(shù);Ni是第i類的總樣本數(shù)。各種域自適應(yīng)方法在不同類別上的遷移率如圖13所示。
通過(guò)對(duì)每個(gè)類別的遷移率進(jìn)行分析可以清晰地看出,DCMDA網(wǎng)絡(luò)有效地促進(jìn)了模型的正遷移,而其他域自適應(yīng)方法在某些故障類別上發(fā)生了一定的負(fù)遷移。此外,DCMDA的遷移率在大多數(shù)類別上高于其他方法,這也進(jìn)一步說(shuō)明了DCMDA網(wǎng)絡(luò)模型的優(yōu)勢(shì),能夠有效識(shí)別無(wú)標(biāo)簽?zāi)繕?biāo)域的軸承健康狀態(tài)。
4 結(jié)束語(yǔ)
本文將無(wú)監(jiān)督遷移學(xué)習(xí)應(yīng)用到機(jī)械智能故障診斷領(lǐng)域,提出了一種新的用于在不同工況下進(jìn)行域自適應(yīng)故障診斷的方法,通過(guò)實(shí)驗(yàn)證實(shí)了本文方法的有效性。根據(jù)實(shí)驗(yàn)結(jié)果可以得出以下三個(gè)結(jié)論:
a)DCMDA網(wǎng)絡(luò)結(jié)構(gòu)利用動(dòng)態(tài)卷積有效地提取多層特征,訓(xùn)練過(guò)程中動(dòng)態(tài)調(diào)整每層損失的權(quán)重超參數(shù),對(duì)多層特征進(jìn)行對(duì)齊,提高了網(wǎng)絡(luò)的診斷性能。
b)DCMDA網(wǎng)絡(luò)有效地解決了目標(biāo)領(lǐng)域內(nèi)無(wú)故障標(biāo)簽,模型診斷性能因數(shù)據(jù)分布不同而下降的實(shí)際問(wèn)題,提高了在無(wú)標(biāo)簽?zāi)繕?biāo)域的故障診斷準(zhǔn)確率,有效解決了變工況的故障診斷問(wèn)題。
c)在不同的域自適應(yīng)任務(wù)下的故障診斷實(shí)驗(yàn)中,DCMDA網(wǎng)絡(luò)模型都優(yōu)于目前提出的域自適應(yīng)方法,充分說(shuō)明了DCMDA網(wǎng)絡(luò)的有效性與優(yōu)異性。
參考文獻(xiàn):
[1]苗強(qiáng),蔣京,張恒,等.工業(yè)大數(shù)據(jù)背景下的航空智能發(fā)動(dòng)機(jī):機(jī)遇與挑戰(zhàn)[J].儀器儀表學(xué)報(bào),2019,40(7):1-12.(Miao Qiang,Jiang Jing,Zhang Heng,et al.Development of aviation intelligent engine under industrial big data:chances and challenges[J].Journal of Instrumentation,2019,40(7):1-12.)
[2]雷亞國(guó),賈峰,孔德同,等.大數(shù)據(jù)下機(jī)械智能故障診斷的機(jī)遇與挑戰(zhàn)[J].機(jī)械工程學(xué)報(bào),2018,54(5):94-104.(Lei Yaguo,Jia Feng,Kong Detong,et al.Opportunities and challenges of machinery intelligent fault diagnosis in big data era[J].Journal of Mechanical Engineering,2018,54(5):94-104.)
[3]Jia Feng,Lei Yaguo,Lin Jing,et al.Deep neural networks:a promising tool for fault characteristic mining and intelligent diagnosis of rotating machinery with massive data[J].Mechanical Systems and Signal Processing,2016,72:303-315.
[4]陳保家,陳學(xué)力,沈保明,等.CNN-LSTM深度神經(jīng)網(wǎng)絡(luò)在滾動(dòng)軸承故障診斷中的應(yīng)用[J].西安交通大學(xué)學(xué)報(bào),2021,55(6):28-36.(Chen Baojia,Chen Xueli,Shen Baoming,et al.An application of convolution neural network and long short-term memory in rolling bearing fault diagnosis[J].Journal of Xi’an Jiaotong University,2021,55(6):28-36.)
[5]He D,Li Ruoyu,Zhu Junda.Plastic bearing fault diagnosis based on a two-step data mining approach[J].IEEE Trans on Industrial Electronics,2012,60(8):3429-3440.
[6]彭成,王松松,賀婧,等.基于離散小波變換和隨機(jī)森林的軸承故障診斷研究[J].計(jì)算機(jī)應(yīng)用研究,2021,38(1):101-105.(Peng Cheng,Wang Songsong,He Jing,et al.Research on bearing fault diagnosis based on discrete wavelet transform and random forest[J].Application Research of Computers,2021,38(1):101-105.)
[7]陳志強(qiáng),陳旭東,李川,等.深度學(xué)習(xí)在設(shè)備故障預(yù)測(cè)與健康管理中的應(yīng)用[J].儀器儀表學(xué)報(bào),2019,40(9):206-226.(Chen Zhiqiang,Chen Xudong,Li Chuan,et al.Application of deep learning in equipment prognostics and health management[J].Journal of Instrumentation,2019,40(9):206-226.)
[8]Zhang Ran,Tao Hongyang,Wu Lifeng,et al.Transfer learning with neural networks for bearing fault diagnosis in changing working conditions[J].IEEE Access,2017,5:14347-14357.
[9]Lu Weining,Liang Bin,Cheng Yu,et al.Deep model based domain adaptation for fault diagnosis[J].IEEE Trans on Industrial Electronics,2016,64(3):2296-2305.
[10]Wen Long,Gao Liang,Li Xinyu.A new deep transfer learning based on sparse auto-encoder for fault diagnosis[J].IEEE Trans on Systems,Man,and Cybernetics:Systems,2017,49(1):136-144.
[11]Yang Bin,Lei Yaguo,Jia Feng,et al.An intelligent fault diagnosis approach based on transfer learning from laboratory bearings to locomotive bearings[J].Mechanical Systems and Signal Processing,2019,122:692-706.
[12]Lu Weining,Liang Bin,Cheng Yu,et al.Deep model based domain adaptation for fault diagnosis[J].IEEE Trans on Industrial Electronics,2016,64(3):2296-2305.
[13]張釗,李新宇,高亮.基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的無(wú)監(jiān)督故障診斷方法[J/OL].計(jì)算機(jī)集成制造系統(tǒng).[2022-01-11].http://kns.cnki.net/kcms/detail/11.5946.TP.20201202.1822.017.html.(Zhang Zhao,Li Xinyu,Gao Liang.Unsupervised fault diagnosis method based on domain adaptive neural network and joint distributed adaptive[J/OL].Computer Integrated Manufacturing System.[2022-01-11].http://kns.cnki.net/kcms/detail/11.5946.TP.20201202.1822.017.html.)
[14]Gretton A,Borgwardt K,Rasch M,et al.A kernel two-sample test[J].The Journal of Machine Learning Research,2012,13(1):723-773.
[15]Sejdinovic D,Sriperumbudur B,Gretton A,et al.Equivalence of distance-based and RKHS-based statistics in hypothesis testing[J].The Annals of Statistics,2013,41(5):2263-2291.
[16]Long Mingsheng,Wang Jianmin,Cao Yue,et al.Deep learning of transferable representation for scalable domain adaptation[J].IEEE Trans on Knowledge amp; Data Engineering,2016,28(8):2027-2040.
[17]Sun Baochen,Saenko K.Deep CORAL:correlation alignment for deep domain adaptation[C]//Proc of European Conference on Computer Vision.Cham:Springer,2016:443-450.
[18]Chen Yinpeng,Dai Xiyang,Liu Mengchen,et al.Dynamic convolution:attention over convolution kernels[C]//Proc of IEEE/CVF Conference on Computer Vision and Pattern Recognition.Piscataway,NJ:IEEE Press,2020:11030-11039.
[19]Case Western Reserve University.Bearing data center seeded fault test data[EB/OL].https://engineering.case.edu/bearingdatacenter.
[20]Long Mingsheng,Cao Yue,Cao Zhangjie,et al.Transferable representation learning with deep adaptation networks[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2018,41(12):3071-3085.
[21]Long Mingsheng,Zhu Han,Wang Jianmin,et al.Deep transfer lear-ning with joint adaptation networks[C]//Proc of the 34th Internatio-nal Conference on Machine Learning.2017:2208-2217.
[22]Ganin Y,Ajakan H,Germain P,et al.Domain-adversarial training of neural networks[J].The Journal of Machine Learning Research,2016,17(1):2030-2096.
[23]Long Mingsheng,Cao Zhangjie,Wang Jianmin,et al.Conditional adversarial domain adaptation[C]//Proc of the 32nd International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2018:1647-1657.
[24]Shao Siyu,McAleer S,Yan Ruqiang,et al.Highly accurate machine fault diagnosis using deep transfer learning[J].IEEE Trans on Industrial Informatics,2018,15(4):2446-2455.