張 釗,李新宇,高 亮
(華中科技大學 機械科學與工程學院,湖北 武漢 430000)
故障診斷對于機械設(shè)備的健康管理十分重要,也是智能制造領(lǐng)域的研究熱點之一。目前,常用的故障診斷方法主要有3類[1]:基于模型的方法、基于信號處理的方法和基于數(shù)據(jù)驅(qū)動的方法。由于制造業(yè)信息化與數(shù)字化的不斷進步,基于數(shù)據(jù)驅(qū)動的故障診斷方法已成為了當前的研究熱點,該類方法包括貝葉斯網(wǎng)絡(luò)(Bayes)[2-3]、支持向量機(Support Vector Machine,SVM)[4-5]、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)[6-9]等。CAI等[10]介紹了近幾十年來使用貝葉斯網(wǎng)絡(luò)進行故障診斷的應(yīng)用研究;YIN等[11]介紹了基于支持向量機的故障診斷與監(jiān)測方法的研究現(xiàn)狀;ALI等[12]提出了選擇最重要固有模式函數(shù)(Intrinsic Mode Functions, IMF)的數(shù)學分析方法,將所選特征用于人工神經(jīng)網(wǎng)絡(luò)的訓練,完成對軸承缺陷的分類任務(wù)。
上述基于數(shù)據(jù)驅(qū)動的故障診斷方法一般采用傳統(tǒng)機器學習方法,它們大部分建立在訓練數(shù)據(jù)與測試數(shù)據(jù)分布相同的假設(shè)上。然而,當訓練數(shù)據(jù)與測試數(shù)據(jù)的數(shù)據(jù)分布不同時,傳統(tǒng)機器學習方法往往表現(xiàn)不佳[13]。實際生產(chǎn)過程中,機械設(shè)備的工作狀態(tài)與條件往往是動態(tài)變化的,設(shè)備所產(chǎn)生的故障診斷數(shù)據(jù)分布也會隨之改變。另外,在故障診斷中,高質(zhì)量的帶標簽的數(shù)據(jù)通常較少,這給故障診斷帶來了較大的挑戰(zhàn)。
為了解決故障診斷數(shù)據(jù)不足的問題,無監(jiān)督的故障診斷方法受到了廣泛關(guān)注,LIU等[14]提出一種分類對抗自編碼器(Categorical Adversarial Autoencoder, CatAAE),用于滾動軸承的無監(jiān)督故障診斷。該模型通過對抗訓練過程訓練自動編碼器,嘗試對數(shù)據(jù)進行聚類;HE等[15]提出一種基于深度信念網(wǎng)絡(luò)(Deep Belief Network, DBN)的人工智能方法,用于齒輪傳動鏈的無監(jiān)督故障診斷,并采用遺傳算法對網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)進行優(yōu)化;SONG等[16]提出了一種基于迭代多流形譜聚類(Iterative Multi-manifold Spectral Clustering, IMMSC)的無監(jiān)督故障診斷方法,采用基于局部切線空間構(gòu)造親和矩陣的IMMSC來提高多流形分布數(shù)據(jù)的譜聚類性能;ZHANG等[17]提出一種稱為通用歸一化稀疏濾波(General Normalized Sparse Filtering, GNSF)的新型無監(jiān)督學習方法,用于智能故障診斷,該算法通過基于特征矩陣的廣義范數(shù)優(yōu)化目標函數(shù),實現(xiàn)了特征稀疏度的度量。以上無監(jiān)督故障診斷方法大多采用聚類的方法對故障數(shù)據(jù)進行分析,從而實現(xiàn)無監(jiān)督,沒有針對故障診斷數(shù)據(jù)分布不同這一類問題進行無監(jiān)督故障診斷的討論。
由于大多數(shù)無監(jiān)督故障診斷方法對故障診斷數(shù)據(jù)分布變化這類問題討論較少,為了解決機械設(shè)備因工作狀態(tài)變化導(dǎo)致數(shù)據(jù)分布變化,標簽故障數(shù)據(jù)較少的問題,考慮到遷移學習的主要任務(wù)是將一個領(lǐng)域所學習到的知識遷移到另外一個領(lǐng)域中,輔助另外一個領(lǐng)域的模型學習。其中的域適應(yīng)方法可以解決源域與目標域的數(shù)據(jù)分布不同的問題。因此,將遷移學習與深度學習結(jié)合,可以在獲得深度學習模型較好特征表現(xiàn)能力的同時,在一定程度上解決故障診斷中數(shù)據(jù)分布變化的問題。
基于遷移學習的故障診斷研究也有一些成果,GUO等[18]提出一種由條件識別模塊和域自適應(yīng)模塊組成的深度卷積遷移學習網(wǎng)絡(luò)(Deep Convolutional Transfer Learning Network, DCTLN);YANG等[19]提出一種基于特征的遷移學習網(wǎng)絡(luò)(Feature-based Transfer Neural Network, FTNN),設(shè)計了卷積神經(jīng)網(wǎng)絡(luò)模型損失函數(shù)的正則化項,以減少數(shù)據(jù)分布差異;SHEN等[20]提出一種基于遷移學習的軸承故障診斷方法,利用輔助數(shù)據(jù)來輔助目標域的數(shù)據(jù)分類;馮毅雄等[21]提出一種集成遷移學習的軸件表面缺陷實時檢測方法,建立了高速生產(chǎn)狀態(tài)下的軸件表面缺陷實時檢測模型;LI等[22]提出使用域適應(yīng)深度自編碼器方法來實現(xiàn)故障診斷,首先使用自動編碼器結(jié)構(gòu)將不同設(shè)備的特征投影到相同的子空間中,然后采用域自適應(yīng)算法,最大程度地減少來自不同機器的數(shù)據(jù)之間的分布差異;LU等[23]提出了域自適應(yīng)性的深度神經(jīng)網(wǎng)絡(luò)模型,用于故障診斷,并探索出模型最佳超參數(shù)的幾種策略。目前,現(xiàn)有的遷移學習與域自適應(yīng)方法更多傾向于解決加速模型訓練、輔助數(shù)據(jù)分類、學習特征的域不變性的問題,對于如何更好地提取數(shù)據(jù)的特征與分層次的學習特征的域不變性缺乏討論。
針對故障診斷中數(shù)據(jù)分布變化的問題,本文提出了基于域適應(yīng)的神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的無監(jiān)督故障診斷方法,重點解決源域有標簽。而目標域沒有標簽的情況,則考慮通過源域的標簽直接將模型遷移至目標域,完成無監(jiān)督分類任務(wù)。將域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法相結(jié)合,可以很好地在利用好域適應(yīng)神經(jīng)網(wǎng)絡(luò)的深度網(wǎng)絡(luò)的特征提取與遷移能力的同時,進一步利用聯(lián)合分布自適應(yīng)方法的遷移能力,在提取的特征上進行遷移。該方法采用了信號轉(zhuǎn)圖像方法,并使用卷積神經(jīng)網(wǎng)絡(luò)的方法對診斷數(shù)據(jù)進行特征提取,分層次地采用了深度遷移學習與傳統(tǒng)淺層遷移學習方法,對診斷數(shù)據(jù)進行了深度與淺層的特征域遷移。在深度網(wǎng)絡(luò)中,將由深度網(wǎng)絡(luò)所生成的源域與目標域特征通過最小化最大均值差異(Maximum Mean Discrepancy, MMD)損失,使得兩個域的特征分布靠近;在淺層網(wǎng)絡(luò)中,聯(lián)合分布自適應(yīng)方法通過減少源域與目標域的邊緣分布與條件分布的差異,達到遷移學習效果。
目前,基于數(shù)據(jù)驅(qū)動的故障診斷方法大部分使用的是傳統(tǒng)的機器學習方法。傳統(tǒng)機器學習方法是解決訓練數(shù)據(jù)與測試數(shù)據(jù)的數(shù)據(jù)分布相同且訓練任務(wù)和測試任務(wù)也相同的問題,但無法解決故障診斷數(shù)據(jù)分布發(fā)生變化的情況;而遷移學習是解決不同數(shù)據(jù)分布,或者不同學習任務(wù)的問題。PAN等[13]總結(jié)了遷移學習有3種類型,分別是源域與目標域數(shù)據(jù)有分布差異、源任務(wù)與目標任務(wù)有差異或兩者兼而有之。而其中域自適應(yīng)方法[24]作為一種遷移學習,主要解決源域任務(wù)與目標域任務(wù)相同,源域數(shù)據(jù)分布與目標域數(shù)據(jù)分布不同的問題。故障診斷問題中,數(shù)據(jù)分布變化的診斷數(shù)據(jù)可以看作是遷移學習中的數(shù)據(jù)分布不同的源域與目標域,因此域自適應(yīng)方法就可以解決數(shù)據(jù)分布變化的故障診斷問題。
在域自適應(yīng)方法中,有兩個域:具有足夠標記數(shù)據(jù){Xs,Ys}的源域和沒有標記數(shù)據(jù){Xt}的目標域。根據(jù)CSURKA等[25]的觀點,深度域適應(yīng)可以概括為3種情況:基于差異的深度域自適應(yīng)方法[26]、基于對抗網(wǎng)絡(luò)的深度域自適應(yīng)方法[27]和基于重構(gòu)的深度域自適應(yīng)方法[28]。
域適應(yīng)神經(jīng)網(wǎng)絡(luò)方法由GHIFARY等[29]提出,該方法屬于域自適應(yīng)方法,在給定分別屬于不同數(shù)據(jù)分布的源域Ds={Xs,Ys}與目標域{Xt}下,能夠準確地對無標簽數(shù)據(jù)的目標域數(shù)據(jù)進行分類。該方法采用了一個簡單的神經(jīng)網(wǎng)絡(luò)模型來處理領(lǐng)域自適應(yīng)問題。將最大平均差異度量作為源域監(jiān)督學習中的正則化方法,以減少特征空間中源域和目標域之間的數(shù)據(jù)分布不匹配性。
所用到的最大平均差異度量是衡量兩個樣本中概率分布之間差異的方法。給定源域與目標域之間的條件概率分布分別為p與q,則最大平均差異度量(MMD)定義如下:
(1)
式中:X′S和X′T是XS和XT的映射,X′S={x′Si}={?(xSi)},X′T={x′Ti}={?(xTi)} ;?(·)是映射函數(shù),該映射函數(shù)主要是將源域與目標域映射至高維希爾伯特空間上,在該空間里,源域與目標域的數(shù)據(jù)分布差距能夠減少。
這種MMD方法在域適應(yīng)與遷移學習方法中已經(jīng)被廣泛使用,PAN等[30]提出了基于主成分分析(Principal Components Analysis, PCA)模型的遷移成分分析(Transfer Component Analysis, TCA)方法,采用MMD來衡量樣本間的差異;CHEN等[31]提出了具有數(shù)據(jù)分布自適應(yīng)功能的屬性網(wǎng)絡(luò)嵌入(Attributed Network Embedding with Data Distribution Adaptation, ANEDDA)方法,利用TCA方法來識別通用特征。實驗證明該度量函數(shù)的確可以有效地度量兩個樣本分布的情況,減小MMD的方法能夠有效地進行遷移學習。
域適應(yīng)神經(jīng)網(wǎng)絡(luò)方法將MMD度量方法作為正則化方法嵌入到有監(jiān)督的反向傳播訓練中。 通過這種正則化方法,旨在訓練網(wǎng)絡(luò)參數(shù),從而優(yōu)化監(jiān)督準則,使得源域與目標域的隱藏層特征表示數(shù)據(jù)分布差異減少。其方法的損失函數(shù)如下:
JDANN=JNNs+γMMD。
(2)
式中:JNNs表示域適應(yīng)神經(jīng)網(wǎng)絡(luò)中由源域數(shù)據(jù)訓練得到的分類損失;MMD表示源域數(shù)據(jù)與目標域數(shù)據(jù)在網(wǎng)絡(luò)隱藏層特征之間的分布差異;γ為對兩個損失之間的權(quán)重平衡參數(shù)。
聯(lián)合分布自適應(yīng)方法由LONG等[32]提出。在該方法中,源域Ds={Xs,Ys},目標域Dt={Xt},包括兩個假設(shè):①源域和目標域邊緣分布不同:Ps(xs)≠Pt(xt);②源域和目標域條件分布不同:Qs(ys|xs)≠Q(mào)t(yt|xt) 。聯(lián)合分布自適應(yīng)方法的目標就是尋找一個變換A,使經(jīng)過變換后的邊緣分布Ps(ATxs)與Pt(ATxt)、條件分布Ps(ys|ATxs)與Pt(yt|ATxt)同時相近。
首先減小邊緣概率分布差異,使得Ps(ATxs)與Pt(ATxt)盡可能相近,同TCA方法一樣,仍然采用最大均值化差異MMD距離來衡量兩個分布的邊緣概率分布差異。其中ns與nt分別表示源域與目標域的樣本個數(shù)。
(3)
(4)
然后對源域與目標域的條件概率分布進行適配,使得Ps(ys|ATxs)與Pt(yt|ATxt)的距離也盡可能的小。得到總的優(yōu)化目標為:
(5)
式中:Θ為拉克朗日乘子;H為中心矩陣;I為單位矩陣。
該無監(jiān)督故障診斷方法包括信號預(yù)處理階段、基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)模型深度訓練階段和聯(lián)合分布自適應(yīng)淺層訓練3個階段,方法整體流程框架如圖1所示。該方法主要包括3個步驟:①將源域有標簽的故障診斷數(shù)據(jù)與目標域無標簽的故障的數(shù)據(jù)均轉(zhuǎn)化為RGB圖像。②將源域所轉(zhuǎn)化的RGB圖像訓練卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)構(gòu)成特征生成器與Softmax分類器,與源域標簽一起訓練得到一個源域的特征生成器與分類器,再將目標域所轉(zhuǎn)化的RGB圖像也參與原始特征生成器與分類器的訓練,在分類損失函數(shù)的基礎(chǔ)上加入MMD最大平均差異度量損失函數(shù),最終實現(xiàn)基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)模型的訓練。③源域數(shù)據(jù)與目標域數(shù)據(jù)經(jīng)過深度域適應(yīng)網(wǎng)絡(luò)模型得到的源域特征與目標域特征,將所得到的特征作為聯(lián)合分布自適應(yīng)方法的輸入,構(gòu)建MMD矩陣,尋求自適應(yīng)矩陣,將源域特征與目標域特征進一步映射至域相近的高維空間,然后使用K-近鄰方法,最終完成目標域的預(yù)測。
該方法主要適用于機械設(shè)備工作環(huán)境經(jīng)常發(fā)生變化、故障數(shù)據(jù)分布發(fā)生改變的情況,機械設(shè)備在某一工作條件下,已經(jīng)獲得了較多的振動信號的標簽故障數(shù)據(jù),當機械設(shè)備工作環(huán)境發(fā)生變化,能夠獲得該機械設(shè)備的相同類型的振動故障數(shù)據(jù)時,可以通過該方法,在無需任何該工作條件下的帶標簽故障數(shù)據(jù),就能提高機械設(shè)備在這一工作條件下的故障診斷的精度。
由于故障診斷信號一般為一維的時序振動信號,而卷積神經(jīng)網(wǎng)絡(luò)在對圖像進行特征提取上具有杰出的表現(xiàn),為了使卷積神經(jīng)網(wǎng)絡(luò)能對故障診斷信號進行較好的特征提取,將一維的時序信號轉(zhuǎn)化為圖像信號。
假設(shè)圖像的大小為n×n,截取的步長為a,則第m個截取部分應(yīng)為L(m×a+x)。 對截取部分使用快速傅立葉變換(Fast Fourier Transform, FFT),abs(·)函數(shù)對FFT變換結(jié)果取絕對值。然后,使用round(·)對信號進行四舍五入,最后將信號轉(zhuǎn)換為RGB圖像。
L(m×a+x)=abs(FFT(L(m×a+x))),
(6)
(7)
如圖2所示,神經(jīng)網(wǎng)絡(luò)中特征生成器由3個卷積層、3個批標準化(Batch Normalization, BN)層、兩個Max_poll2d層和一個全連接層組成,激活函數(shù)為線性整流函數(shù)(Rectified Linear Unit, ReLU)。分類器部分包括兩個完全連接層和兩個BN層。特征生成器部分生成的源域特征與目標域特征將用于計算源域與目標域之間的MMD損失,并將損失直接加入模型的分類損失中。域適應(yīng)神經(jīng)網(wǎng)絡(luò)訓練步驟如下:
輸入:源域Ds={Xs,Ys},目標域Dt={Xt}; 輸出:特征生成器G,分類器F,源域與目標域特征。 開始 前向傳播: 使用源域Ds={Xs,Ys},目標域Dt={Xt},獲得源域特征與目標域特征 反向傳播: 計算MMD損失,與源域的分類損失JNNs,總損失JDANN=JNNs+γMMD,對模型進行反向傳播直到收斂 返回特征生成器G,分類器F1,F2,源域與目標域特征。
將基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)方法與聯(lián)合分布自適應(yīng)方法在著名的滾動軸承數(shù)據(jù)集上進行實驗。該實驗在目標域沒有任何標簽樣本數(shù)據(jù)下,對目標域進行無監(jiān)督故障診斷,通過與其他實驗進行對比,來討論該方法在處理由于工作條件變化而帶來的故障診斷無監(jiān)督問題上的有效性與適用性。另外,為了模擬故障診斷問題在實際生產(chǎn)過程中的情況,逐步降低源域中標簽樣本數(shù)量,討論源域中標簽樣本數(shù)量變化對該方法所產(chǎn)生的影響,進一步討論該方法在無監(jiān)督故障診斷問題上的有效性與適用性。
本實驗采用Python編程,程序的運行環(huán)境是Win10系統(tǒng),Inter i7處理器,9 750H CPU,主頻2.6 GHz。
凱斯西儲大學(Case Western Reserve University, CWRU)數(shù)據(jù)集[33]是著名的機械設(shè)備故障診斷數(shù)據(jù)集,由Reliance電動機驅(qū)動,驅(qū)動軸上安裝扭矩傳感器,將故障植入到驅(qū)動和風扇端軸承。故障類型有內(nèi)圈斷層、外圈斷層和球斷層,這3種故障均有3種不同的尺寸大小,分別是0.007英尺、0.014英尺和0.021英尺。加上健康類型,因此CWRU數(shù)據(jù)集的故障診斷數(shù)據(jù)有10種故障類型。這10種故障類型在0~3馬力的負載下都有記錄。因此,整個CWRU故障診斷數(shù)據(jù)集可以獲得4個不同的工作條件下的實驗數(shù)據(jù)。如圖3所示為CWRU數(shù)據(jù)集試驗臺。
CWRU數(shù)據(jù)集有4種工作狀態(tài)下的數(shù)據(jù),為了驗證所提方法是否能夠處理故障診斷的數(shù)據(jù)分布不同的問題,本節(jié)將討論CWRU數(shù)據(jù)集在不同工作狀態(tài)下的數(shù)據(jù)以及其數(shù)據(jù)分布是否會發(fā)生變化為了更加直觀地體現(xiàn)CWRU數(shù)據(jù)集的數(shù)據(jù)分布,采用隨機近鄰嵌入(T-distributed Stochastic Neighbor Embedding, TSNE)的方法,先對不同工作狀態(tài)下的1 024維特征的數(shù)據(jù)進行聚類,投射到二維空間,然后再根據(jù)真實標簽,畫出其數(shù)據(jù)分布,如圖4~圖7所示。圖4~圖7中橫縱坐標分別代表該聚類后二維空間的坐標,圖中不同顏色代表在該工作狀態(tài)下數(shù)據(jù)的真實標簽??偣?0種類別,分別對應(yīng)10種顏色。
從圖4~圖7可以看出,CWRU數(shù)據(jù)集中,不同馬力負載下,不同類別的數(shù)據(jù)經(jīng)過TSNE聚類后,在二維空間的分布情況發(fā)生了不同程度的變化,證明其原始數(shù)據(jù)的數(shù)據(jù)分布均發(fā)生了不同程度的變化,若直接將在某一馬力負載下訓練出來的模型運用在另一負載下,其模型性能將會大大降低,因此所提的方法在該情況下具有較大意義,使用CWRU數(shù)據(jù)集完成所提方法有效性驗證具有較大說服力。
CWRU數(shù)據(jù)集是著名的滾動軸承數(shù)據(jù)集,數(shù)據(jù)集內(nèi)采集了不同工作狀態(tài)的機械振動信號,3.2節(jié)也證明了不同工作狀態(tài)的機械振動信號,其數(shù)據(jù)分布也不同。因此,本節(jié)將基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法用于該數(shù)據(jù)集進行無監(jiān)督故障診斷的方法驗證,將某一工作狀態(tài)下的數(shù)據(jù)作為源域數(shù)據(jù),將另一工作狀態(tài)下的數(shù)據(jù)作為目標域數(shù)據(jù)??紤]到在實際生產(chǎn)過程中,源域的數(shù)據(jù)也可能會較少,為了進一步驗證所提方法的有效性與可行性,在目標域無任何標簽數(shù)據(jù)的情況下,減少源域的標簽數(shù)據(jù),討論源域訓練樣本數(shù)據(jù)量變化對該方法所產(chǎn)生的影響。本部分實驗將原始源域訓練數(shù)量從16 000幅降低為1 600幅。為了保證實驗的一般性,每組實驗均連續(xù)運行了10次,并將4種不同狀態(tài)的數(shù)據(jù)分別當作源域和目標域進行了實驗。如表1所示,L0、L1、L2與L3分別代表0馬力負載、1馬力負載、2馬力負載與3馬力負載的情況。例如L0-L1代表將0馬力負載的數(shù)據(jù)作為源域、1馬力負載的數(shù)據(jù)作為目標域而進行的實驗,表中給出的為95%的置信區(qū)間。表1給出了源域標簽數(shù)量為16 000時,目標域作為測試集的實驗準確率,表2給出了源域標簽數(shù)量為1 600時,目標域作為測試集的實驗準確率。
表1 源域標簽數(shù)據(jù)量為16 000時目標域?qū)嶒灉蚀_率
表2 源域標簽數(shù)據(jù)量為1 600時目標域?qū)嶒灉蚀_率
從表1和表2可以看出,在未經(jīng)過任何域自適應(yīng)遷移學習方法的處理下,只利用源域數(shù)據(jù)訓練的CNN模型在目標域上的準確率較低,分別經(jīng)過域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法處理過的模型,可以適當?shù)靥岣吣繕擞驘o監(jiān)督故障診斷的準確性與穩(wěn)定性,同時經(jīng)過域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法處理過的模型,能夠達到更高的準確性與穩(wěn)定性。另外,在面臨更為嚴峻的故障診斷條件下,即源域的標簽數(shù)據(jù)減少到1 600時,只利用CNN模型的方法準確率下降明顯,分別只利用域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法的模型,準確性也下降較多,基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的方法均優(yōu)于其他方法。
為了進一步說明所提方法的優(yōu)勢,證明所提方法的有效性與可行性,將基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的方法與已有的其他遷移學習模型方法進行比較(如表3),分別為:由ZHANG等[34]提出的自適應(yīng)批量歸一化方法(Adaptive Batch Normalization, AdaBN)方法,LI等[35]提出的多層最大平均化差異方法(Maximum Mean Discrepancies-Multiple Layers, MMD-ML),ZHANG等[36]提出的對抗域適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)(Adversarial Adaptive Convolutional Neural Networks,A2CNN)方法。表3中,其他方法在文獻中只給出了部分遷移學習情況的數(shù)據(jù)結(jié)果,并且只有平均值,未給出置信區(qū)間。本文所提方法給出了全部測試情況的95%的置信區(qū)間結(jié)果。
表3 所提的方法與其他模型比較
由表3可以看出,所提方法在平均準確率上高于其他方法,這是因為所提方法使用了特征提取能力較強的CNN網(wǎng)絡(luò),并多次使用域適應(yīng)方法,使得源域與目標域的特征能夠在高維空間維度上盡可能地相近,從而進一步證明了所提方法的有效性。
綜上所述,基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法在目標域的無監(jiān)督故障診斷上可以達到較高的準確率,因此基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的方法可以有效地對知識進行遷移,所提方法能夠處理由于數(shù)據(jù)分布改變造成的無監(jiān)督故障診斷問題,該方法可以訓練出更高的準確率與更具魯棒性的無監(jiān)督深度學習故障診斷模型。
為了解決由于工件狀態(tài)經(jīng)常發(fā)生變化,訓練集與測試集數(shù)據(jù)分布不同,導(dǎo)致的目標域中無標簽樣本的故障診斷問題,本文提出一種基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的無監(jiān)督故障診斷方法,通過CNN卷積神經(jīng)網(wǎng)絡(luò)模型從預(yù)先轉(zhuǎn)化為圖片的故障振動信號數(shù)據(jù)中提取深度特征,利用域適應(yīng)神經(jīng)網(wǎng)絡(luò)模型將不同數(shù)據(jù)分布的數(shù)據(jù)在深度特征維度上進行數(shù)據(jù)分布的拉近,再利用聯(lián)合分布自適應(yīng)方法,再次將訓練得到的深度特征映射至高維特征空間,使得源域與目標域的邊緣數(shù)據(jù)分布與條件分布進一步靠近,最后得到分類結(jié)果。在凱斯西儲大學的數(shù)據(jù)集上完成了實驗驗證,對故障診斷條件進一步限制,逐步降低源域中標簽樣本數(shù)量,以驗證模型的有效性與可行性。結(jié)果表明,基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法的模型能夠在無監(jiān)督故障診斷問題上得到更高準確率與更具魯棒性的結(jié)果,從而驗證了算法具有可行性與有效性。
本研究只對故障診斷中的故障振動信號進行了討論,未討論其他類別的故障診斷信號,因此未來可以針對不同類別的故障診斷信號提出合適的模型。