周華鋒, 程培源, 邵思羽, 趙玉偉
(空軍工程大學(xué) 防空反導(dǎo)學(xué)院,西安 710051)
隨著工業(yè)4.0時(shí)代的到來,海量的數(shù)據(jù)、智能化信息處理方法、面向未來技術(shù)的工廠不斷涌現(xiàn)[1],互聯(lián)網(wǎng)與物聯(lián)網(wǎng)技術(shù)快速發(fā)展需要更為智能化的狀態(tài)監(jiān)測(cè)與故障診斷系統(tǒng)。利用智能工廠內(nèi)的各類傳感器采集狀態(tài)信息,構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)模型,可以有效地對(duì)設(shè)備運(yùn)行狀態(tài)進(jìn)行監(jiān)測(cè)[2]。許多專家學(xué)者也將智能識(shí)別算法應(yīng)用到故障診斷任務(wù)之中,實(shí)現(xiàn)端到端的診斷,并且取得了較好的診斷效果[3-7]。然而,其較好的診斷效果往往要求訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)來源于同一概率分布且均有大量可靠的標(biāo)簽信息[8]。在實(shí)際工程應(yīng)用中,這兩種設(shè)定是難以滿足的。一方面,由于機(jī)械設(shè)備運(yùn)行時(shí)的轉(zhuǎn)速、負(fù)載、環(huán)境噪聲等工況在時(shí)刻變化,傳感器所收集到的數(shù)據(jù)分布也將發(fā)生改變;另一方面,機(jī)械設(shè)備從正常到發(fā)生故障需要一定的時(shí)間且故障不易察覺,收集標(biāo)簽信息并進(jìn)行有效標(biāo)注是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作。
為了解決上述問題,許多專家學(xué)者將無監(jiān)督域自適應(yīng)算法引入到智能故障診斷領(lǐng)域當(dāng)中[9]。通過尋找機(jī)械系統(tǒng)在數(shù)據(jù)空間上的相似性,實(shí)現(xiàn)故障診斷任務(wù)中知識(shí)的遷移。例如Cheng等[10]提出基于Wasserstein距離的深度遷移學(xué)習(xí)(WD-DTL)網(wǎng)絡(luò)模型,通過最小化源域和目標(biāo)域之間的分布差異,學(xué)習(xí)兩個(gè)領(lǐng)域間的不變特征。Han等[11]將聯(lián)合分布適應(yīng)(JDA)應(yīng)用于故障診斷領(lǐng)域,使源域和目標(biāo)域的條件分布對(duì)齊,提高故障的識(shí)別準(zhǔn)確率。Qian等[12]提出了基于高階Kullback-Leibler(HKL)散度的分布差異測(cè)量算法,構(gòu)建了在變工況情況下具有魯棒性的故障診斷網(wǎng)絡(luò)。An等[13]提出了一個(gè)基于多層多核最大平均差異的網(wǎng)絡(luò)模型,將來自不同領(lǐng)域的特征映射到再生核希爾伯特空間,最小化特征分布差異。Wang等[14]利用相關(guān)對(duì)齊(CORAL)進(jìn)行非線性變換來對(duì)齊兩個(gè)分布的二階統(tǒng)計(jì)量,以此來最小化源域與目標(biāo)域之間的差異,提取域不變特征,實(shí)現(xiàn)無監(jiān)督域自適應(yīng)故障診斷。
綜上所述,大多數(shù)已有文獻(xiàn)都是利用距離度量函數(shù)度量源域與目標(biāo)域的差異,并最小化該差異以實(shí)現(xiàn)源域和目標(biāo)域的全局對(duì)齊,使網(wǎng)絡(luò)模型同時(shí)在源域和目標(biāo)域上均有較好的診斷效果,如圖1(a)所示。但由于其對(duì)整個(gè)域進(jìn)行對(duì)齊,忽略了不同類之間的差異,沒有考慮到每個(gè)類別的細(xì)粒度信息,使得模型在類的邊界處分類誤差變大,模型整體的識(shí)別準(zhǔn)確率有待提高。為了更好地利用每個(gè)類別的決策邊界,提高模型的識(shí)別精度,本文提出了一種子域自適應(yīng)對(duì)抗網(wǎng)絡(luò)(subdomain adaptive adversarial network,SAAN)。通過考慮相關(guān)任務(wù)的決策邊界來調(diào)整領(lǐng)域分布,同時(shí)將局部最大平均差異引入到模型結(jié)構(gòu)中,對(duì)齊源域和目標(biāo)域中的每個(gè)類空間,實(shí)現(xiàn)子域自適應(yīng),如圖1(b)所示。
(a) 全局域自適應(yīng)
(b) 子域自適應(yīng)圖1 領(lǐng)域自適應(yīng)Fig.1 Domain adaptation
同時(shí),本文在兩個(gè)數(shù)據(jù)集上對(duì)SAAN模型的有效性進(jìn)行驗(yàn)證,并與現(xiàn)有的域自適應(yīng)算法進(jìn)行比較。SAAN方法解決了不同工況下因其數(shù)據(jù)分布不同而導(dǎo)致診斷精度下降的問題,提高了模型在不同工況下的泛化性能,診斷性能優(yōu)于其他域自適應(yīng)算法,有著更高的診斷精度。
針對(duì)變工況下故障診斷精度下降和目標(biāo)域無標(biāo)簽的問題,無監(jiān)督域自適應(yīng)算法可以利用在A工況下收集旋轉(zhuǎn)零部件的有標(biāo)簽數(shù)據(jù)和B工況下未標(biāo)記的數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)模型,提取兩種工況下數(shù)據(jù)中的相似特征,使網(wǎng)絡(luò)模型在變工況的條件下表現(xiàn)出良好的泛化能力,能夠同時(shí)有效識(shí)別A、B兩種工況下旋轉(zhuǎn)零部件的運(yùn)行狀態(tài),以實(shí)現(xiàn)對(duì)無標(biāo)簽變工況下軸承的健康狀態(tài)進(jìn)行識(shí)別。
最大平均差異(maximum mean discrepancy,MMD)[15-16]被廣泛應(yīng)用于領(lǐng)域自適應(yīng)和遷移學(xué)習(xí)中,提取源域與目標(biāo)域的相似特征,并取得了一定的效果。但MMD只關(guān)注了整個(gè)域的全局分布對(duì)齊,而忽略了相關(guān)子域間的關(guān)系。為了進(jìn)一步提高域自適應(yīng)方法的分類準(zhǔn)確率,需要充分考慮每個(gè)子類的細(xì)粒度信息。Zhu等[17]在最大平均差異的基礎(chǔ)上提出了局部最大平均差異,將局部最大平均差異應(yīng)用到深度子域適應(yīng)網(wǎng)絡(luò)(deep subdomain adaptation network,DSAN),并探究得到結(jié)論,即大多數(shù)前饋網(wǎng)絡(luò)模型均可使用局部最大平均差異(local maximum mean discrepancy,LMMD)實(shí)現(xiàn)子域自適應(yīng)。
本文將局部最大平均差異引入到對(duì)抗網(wǎng)絡(luò)中以實(shí)現(xiàn)子域的對(duì)齊,保證模型有更高的診斷精度。為了更好的表述LMMD,將其距離定義如式(1)所示
(1)
為了適應(yīng)對(duì)應(yīng)層的輸出特征,將上式重新表述為式(2),以此來計(jì)算對(duì)應(yīng)層的局部最大平均距離。
(2)
在普通卷積中,其卷積核參數(shù)經(jīng)訓(xùn)練后對(duì)所有輸入樣本都是確定的。普通卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)特征提取能力的提高,依賴于卷積神經(jīng)網(wǎng)絡(luò)深度(卷積層數(shù))和寬度(通道數(shù))的增加。然而通過上述方法必然會(huì)使網(wǎng)絡(luò)模型的計(jì)算復(fù)雜度增加。為了可以在不增加網(wǎng)絡(luò)深度和寬度的情況下,提高網(wǎng)絡(luò)的整體計(jì)算能力,動(dòng)態(tài)卷積[18]通過多卷積核融合提高模型的特征提取能力,并結(jié)合注意力機(jī)制,動(dòng)態(tài)聚合多個(gè)并行卷積核。通過注意力權(quán)重以非線性方式進(jìn)行聚合,使其具有強(qiáng)大的特征提取能力。為便于介紹動(dòng)態(tài)卷積,先介紹動(dòng)態(tài)感知機(jī),其計(jì)算公式如式(3)所示
(3)
圖2 動(dòng)態(tài)卷積層結(jié)構(gòu)Fig.2 Dynamic convolutional layer structure
模型具有k個(gè)卷積核,它們共享相同的核大小和輸入輸出尺寸,同時(shí)借鑒通道注意力機(jī)制產(chǎn)生注意力權(quán)重{πk(x)},通過使用注意力權(quán)重{πk(x)}進(jìn)行聚合,最后對(duì)聚合之后的特征使用批量歸一化(batch normalization,BN)和激活函數(shù)(ReLu)來構(gòu)建動(dòng)態(tài)卷積層。
本文提出的SAAN網(wǎng)絡(luò)主要由特征生成網(wǎng)絡(luò)、兩個(gè)分類器網(wǎng)絡(luò)以及局部最大平均差異距離度量結(jié)構(gòu)組成,結(jié)構(gòu)如圖3所示。
圖3 SAAN網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 The network structure of SAAN
為了更好實(shí)現(xiàn)源域和目標(biāo)域的子域自適應(yīng),捕獲類別的細(xì)粒度信息。一方面,因?yàn)閮蓚€(gè)分類器在網(wǎng)絡(luò)初始化時(shí)采用隨機(jī)初始化,設(shè)定不同的隨機(jī)種子,保證了網(wǎng)絡(luò)初始化及訓(xùn)練完成后的權(quán)重是不一致,使得源域之外的目標(biāo)域樣本被兩個(gè)分類器以不同方式進(jìn)行分類,所以可以通過最大化兩個(gè)分類器之間局部最大平均差異dH(p,q)來檢測(cè)遠(yuǎn)離源域的目標(biāo)域樣本;另一方面為了使生成器生成的特征都在源域內(nèi),通過最小化局部最大平均差異dH(p,q),能夠使源域和目標(biāo)域的子域?qū)R,從而完成子域自適應(yīng)。該方法成功實(shí)現(xiàn)主要有兩個(gè)關(guān)鍵點(diǎn):① 網(wǎng)絡(luò)模型能夠很好的識(shí)別遠(yuǎn)離源域的目標(biāo)域樣本,使得經(jīng)過源域樣本學(xué)習(xí)的分類器不容易將其誤分類;② 目標(biāo)域樣本使生成器生成的特征盡可能在源域的范圍之內(nèi),通過考慮類邊界和目標(biāo)域樣本之間的關(guān)系,對(duì)齊源域和目標(biāo)域。
實(shí)現(xiàn)源域和目標(biāo)域的子域自適應(yīng),使模型具有較好的泛化性能,能夠準(zhǔn)確識(shí)別不同工況下軸承的健康狀態(tài)。模型訓(xùn)練和參數(shù)更新可分為三個(gè)階段,每個(gè)階段都有不同的損失函數(shù)與之對(duì)應(yīng),其示意如圖4所示。圖中G代表生成器,C代表分類器,xs和xt分別代表源域樣本與目標(biāo)域樣本,下面將分別介紹訓(xùn)練過程。
圖4 訓(xùn)練步驟Fig.4 Training steps
步驟1把生成器和分類器作為一個(gè)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以源域樣本作為輸入,使其能夠正確地分類源域樣本。讓分類器和生成器構(gòu)成的網(wǎng)絡(luò)能夠?qū)收咸卣鬟M(jìn)行正確分類,這一步是至關(guān)重要的。其優(yōu)化的目標(biāo)函數(shù)是使多分類的交叉熵?fù)p失函數(shù)最小。如式(4)所示
(4)
式中:I[ys=k]表示標(biāo)簽函數(shù),即若類別是k,則I[ys=k]=1,否則等于0;p(y|xs)指以xs為輸入相對(duì)應(yīng)的類別k的輸出概率,即由網(wǎng)絡(luò)最后的Softmax層計(jì)算而來;(xs,ys)~(Xs,Ys)表示對(duì)其總和取平均值。
步驟2凍結(jié)生成器的可訓(xùn)練參數(shù),以源域樣本和目標(biāo)域樣本作為輸入,通過最大化兩個(gè)分類器之間的局部最大平均差異(LMMD)來更新分類器網(wǎng)絡(luò)的可訓(xùn)練參數(shù),以發(fā)現(xiàn)遠(yuǎn)離源域的目標(biāo)樣本。同時(shí)為了使其能夠?qū)υ从驑颖具M(jìn)行正確分類,保證網(wǎng)絡(luò)的分類性能不下降,其優(yōu)化目標(biāo)不僅包括兩個(gè)分類器的局部最大平均差異的損失,也包括在源域樣本上的分類損失。如式(5)所示
(5)
式中:L(Xs,Ys)與式(4)的計(jì)算方式一致;dH(p,q)即上文提到的LMMD損失,與式(1)的計(jì)算方式一致;p和q分別表示源域與目標(biāo)域最終分類時(shí)的輸出概率向量。
步驟3凍結(jié)兩個(gè)分類器C1與C2的網(wǎng)絡(luò)可訓(xùn)練參數(shù),用目標(biāo)域樣本訓(xùn)練網(wǎng)絡(luò),通過最小化兩個(gè)分類器之間的局部最大平均差異(LMMD),使生成器生成的特征能夠落在源域的范圍內(nèi),其優(yōu)化的目標(biāo)損失函數(shù)如式(6)所示
(6)
本文的試驗(yàn)環(huán)境配置:CPU為Intel(R) Core(TM) i5-10200H,GPU為NVIDIA GeForce GTX 1650Ti,操作系統(tǒng)為Windows 10,深度學(xué)習(xí)框架為Pytorch 1.7,軟件平臺(tái)為python。模型訓(xùn)練批次大小設(shè)為16,訓(xùn)練次數(shù)為50次。模型訓(xùn)練過程中使用自適應(yīng)動(dòng)量(Adam)隨機(jī)優(yōu)化算法應(yīng)用于梯度下降過程中,優(yōu)化網(wǎng)絡(luò)權(quán)重參數(shù)。其初始學(xué)習(xí)率設(shè)置為lr=0.015,按照lr=lr×γ進(jìn)行衰減,衰減間隔為10,衰減因子γ=0.9,即每訓(xùn)練10次,學(xué)習(xí)率按照γ=0.9在上一次學(xué)習(xí)率的基礎(chǔ)上衰減一次。Adam優(yōu)化器其它參數(shù)保持默認(rèn),即一階矩估計(jì)的指數(shù)衰減率為0.9,二階矩估計(jì)的指數(shù)衰減率為0.999,權(quán)重衰減(L2正則化)為0。
每次訓(xùn)練都重復(fù)以上三個(gè)步驟,通過最大最小化兩個(gè)分類器之間的局部最大平均差異損失,使生成器和分類器進(jìn)行對(duì)抗訓(xùn)練,最終能夠使源域和目標(biāo)域的子域?qū)R,對(duì)故障樣本進(jìn)行正確的分類。
為了得到較為理想的故障診斷結(jié)果,在進(jìn)行試驗(yàn)驗(yàn)證之前,首先需要進(jìn)行數(shù)據(jù)預(yù)處理和數(shù)據(jù)分割。SAAN網(wǎng)絡(luò)是將實(shí)測(cè)振動(dòng)信號(hào)轉(zhuǎn)換為頻域信號(hào)作為模型的輸入。具體的數(shù)據(jù)預(yù)處理方式如圖5所示。
圖5 數(shù)據(jù)預(yù)處理Fig.5 Data preprocessing
首先,對(duì)樣本進(jìn)行不重疊的切分,切分后每個(gè)樣本的時(shí)域信號(hào)長(zhǎng)度為1 024個(gè)采樣點(diǎn),將切分得到的時(shí)域樣本通過快速傅里葉變換(FFT)變換到頻域,由于頻譜系數(shù)的對(duì)稱性,每個(gè)樣本的長(zhǎng)度變?yōu)?12;此后,對(duì)經(jīng)過FFT變換后的數(shù)據(jù)樣本幅值進(jìn)行Z分?jǐn)?shù)標(biāo)準(zhǔn)化,使輸入值保持在一定的范圍內(nèi)。如式(7)所示
(7)
式中:x為經(jīng)過FFT變換后的幅值特征向量;μx與σx分別為幅值特征向量x的均值和標(biāo)準(zhǔn)差,經(jīng)過Z分?jǐn)?shù)標(biāo)準(zhǔn)化后的結(jié)果Zx的均值為0,標(biāo)準(zhǔn)差為1。
為了使模型的故障診斷性能達(dá)到最佳,并且要避免在訓(xùn)練網(wǎng)絡(luò)模型過程中發(fā)生測(cè)試泄漏問題,需要將訓(xùn)練集、測(cè)試集按照8∶2的比例進(jìn)行隨機(jī)劃分,測(cè)試集只用于評(píng)估模型而不參與訓(xùn)練過程。
凱斯西儲(chǔ)大學(xué)(Case Western Reserve University, CWRU)軸承數(shù)據(jù)集是從CWRU提供的軸承試驗(yàn)平臺(tái)收集而來的[19]。本文使用了采樣頻率為12 kHz的驅(qū)動(dòng)端的傳感器數(shù)據(jù),根據(jù)不同故障類型和故障尺寸共分為十類,如表1所示。
表1 凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集故障狀態(tài)信息Tab.1 Bearing data set failure status information of CWRU
此外CWRU數(shù)據(jù)集分別從四種不同的工況(0HP、1HP、2HP、3HP)下收集而來,本文將不同工況視為不同的遷移任務(wù),如表2所示。例如0→1表示,源域?yàn)?HP工況下向目標(biāo)域?yàn)?HP下進(jìn)行遷移,所以該試驗(yàn)共有12組遷移試驗(yàn)任務(wù)。
表2 CWRU數(shù)據(jù)集工況信息Tab.2 CWRU data set working condition information
為了驗(yàn)證SAAN模型方法的有效性,避免試驗(yàn)的偶然性,每個(gè)遷移任務(wù)采取10次重復(fù)試驗(yàn)并對(duì)結(jié)果進(jìn)行統(tǒng)計(jì)分析。每次試驗(yàn)訓(xùn)練50個(gè)批次,取每次試驗(yàn)最后一個(gè)批次測(cè)試集在模型上的故障識(shí)別精度作為該次試驗(yàn)的最終結(jié)果。在試驗(yàn)過程中發(fā)現(xiàn),由于SAAN模型在源域上的識(shí)別準(zhǔn)確率都高達(dá)100%,因此在結(jié)果展示上只考慮在目標(biāo)域上的識(shí)別結(jié)果。試驗(yàn)結(jié)果如圖6所示。本文所提出的方法在目標(biāo)域上的故障識(shí)別精度可達(dá)99%以上,試驗(yàn)結(jié)果證實(shí)了SAAN模型的有效性。
圖6 不同遷移任務(wù)下的目標(biāo)域識(shí)別精度Fig.6 Target domain recognition accuracy under different tasks
本文進(jìn)行對(duì)比試驗(yàn),分別與相關(guān)對(duì)齊[20](CORAL)、多核最大平均差異[21](MK-MMD)、聯(lián)合最大平均差異[22](JMMD),域?qū)咕W(wǎng)絡(luò)[23](DANN)和條件域?qū)咕W(wǎng)絡(luò)[24](CDAN)五種域自適應(yīng)方法進(jìn)行對(duì)比,其中相關(guān)對(duì)齊(CORAL)、多核最大平均差異(MK-MMD)、聯(lián)合最大平均差異(JMMD)都是通過距離函數(shù)來度量源域與目標(biāo)域之間的差異,并在訓(xùn)練過程中最小該距離差異以實(shí)現(xiàn)特征分布對(duì)齊;其中DANN是將額外的一個(gè)域分類器連接到特征提取器,通過最小化標(biāo)簽預(yù)測(cè)損失和域分類損失,提取域不變特征用于分類。CDAN通過鑒別器與生成器對(duì)抗訓(xùn)練,對(duì)齊特征與類別的聯(lián)合分布,實(shí)現(xiàn)無監(jiān)督領(lǐng)域自適應(yīng),從而對(duì)軸承的健康狀態(tài)進(jìn)行分類。SAAN網(wǎng)絡(luò)不僅利用了新穎的LMMD距離度量?jī)蓚€(gè)分類器之間的差異,并最小化該距離,縮小源域與目標(biāo)域的類間距離,同時(shí)通過生成器與兩個(gè)分類器之間對(duì)抗學(xué)習(xí)的方式來調(diào)整決策邊界。各種不同遷移方法在目標(biāo)域下的故障識(shí)別準(zhǔn)確率如圖7所示。
圖7 CWRU數(shù)據(jù)集不同域適應(yīng)方法故障識(shí)別準(zhǔn)確率對(duì)比Fig.7 Comparison of fault recognition accuracy of different domain adaptation methods in CWRU data set
結(jié)果表明,上述域自適應(yīng)方法在所有遷移任務(wù)中的平均準(zhǔn)確率都可達(dá)85%以上,都具有一定的域自適應(yīng)能力。SAAN域自適應(yīng)方法相較于其他五種域自適應(yīng)方法而言,在所有遷移任務(wù)中的故障診斷準(zhǔn)確率都高達(dá)99%以上,說明SAAN網(wǎng)絡(luò)模型的故障識(shí)別準(zhǔn)確率優(yōu)于其他五種域自適應(yīng)方法,具有良好的泛化能力。
為了驗(yàn)證模型的抗噪性能,本文采取對(duì)所有樣本數(shù)據(jù)按照SNR(dB)=10lg(Psignal/Pnoise)加入信噪比SNR(dB)=-5,-2,0,2,5的高斯噪聲進(jìn)行試驗(yàn),其中Psignal和Pnoise分別為原始信號(hào)和噪聲的功率大小。原始信號(hào)、噪聲信號(hào)及加入噪聲后的復(fù)合信號(hào)如圖8所示。
圖8 原始信號(hào)、-5 dB噪聲信號(hào)及復(fù)合信號(hào)Fig.8 Original signal,-5 dB noise signal and composite signal
對(duì)添加噪聲后的復(fù)合信號(hào)采用上述相同的數(shù)據(jù)預(yù)處理方法,每個(gè)遷移任務(wù)都進(jìn)行10次重復(fù)試驗(yàn),計(jì)算其平均值與標(biāo)準(zhǔn)差。在加入不同的噪聲強(qiáng)度后,SAAN網(wǎng)絡(luò)在各個(gè)遷移任務(wù)下的試驗(yàn)結(jié)果如圖9所示。
圖9 不同噪聲強(qiáng)度在各遷移任務(wù)下的準(zhǔn)確率Fig.9 Accuracy of different noise intensities under transfer task
通過試驗(yàn)結(jié)果我們可以發(fā)現(xiàn),添加-5 dB的強(qiáng)噪聲,SAAN網(wǎng)絡(luò)模型在所有遷移任務(wù)上的準(zhǔn)確率都能夠達(dá)到85%以上,能夠有效的抵抗噪聲的干擾。此外,為了進(jìn)一步驗(yàn)證SAAN網(wǎng)絡(luò)模型優(yōu)越的抗噪性能,在0HP→1HP的遷移任務(wù)上進(jìn)行抗噪試驗(yàn),加入不同強(qiáng)度的噪聲,與本文提到的其他域自適應(yīng)方法進(jìn)行對(duì)比,試驗(yàn)結(jié)果如表3、圖10所示。
表3 0HP→1HP下不同域自適應(yīng)方法在不同噪聲強(qiáng)度下的準(zhǔn)確率Tab.3 Accuracy of adaptive methods in different domains under different noise intensities under 0HP→1HP
圖10 0HP→1HP下不同域自適應(yīng)方法在不同噪聲強(qiáng)度下的準(zhǔn)確率Fig.10 Accuracy of adaptive methods in different domains under different noise intensities under 0HP→1HP
由圖10可以清晰的看出SAAN網(wǎng)絡(luò)的抗噪性能在各個(gè)噪聲強(qiáng)度下的故障診斷準(zhǔn)確率都高于其他域自適應(yīng)方法,在-5 dB的強(qiáng)噪聲環(huán)境下,更是比其他域自適應(yīng)方法的準(zhǔn)確率高出10%左右,充分的說明了SAAN網(wǎng)絡(luò)有良好的抗噪性能。
為了進(jìn)一步驗(yàn)證本文提出的SAAN模型,本文將在東南大學(xué)數(shù)據(jù)集上進(jìn)一步試驗(yàn)。東南大學(xué)(SEU)數(shù)據(jù)集是由東南大學(xué)提供的變速箱數(shù)據(jù)集[25],該數(shù)據(jù)集由兩個(gè)子數(shù)據(jù)集組成,包括軸承數(shù)據(jù)集和齒輪數(shù)據(jù)集,共有10種故障類別,如表4所示。
表4 東南大學(xué)齒輪箱數(shù)據(jù)集故障狀態(tài)信息Tab.4 Fault status information of SEU gearbox data set
數(shù)據(jù)集具有轉(zhuǎn)速和負(fù)載配置兩種不同的工況分別設(shè)置為20 Hz-0 V和30 Hz-2 V,任務(wù)0→1表示源域是數(shù)據(jù)具有20 Hz轉(zhuǎn)速、0 V負(fù)載,目標(biāo)域是具有30 Hz旋轉(zhuǎn)速度和2 V負(fù)載的數(shù)據(jù)。因此,該數(shù)據(jù)集共有0→1和1→0兩種遷移任務(wù)。
在東南大學(xué)數(shù)據(jù)集(SEU)訓(xùn)練SAAN網(wǎng)絡(luò)模型,在不同遷移任務(wù)上訓(xùn)練過程如圖11所示。通過訓(xùn)練曲線我們可以發(fā)現(xiàn),模型在0→1和1→0遷移任務(wù)上具有較高的故障診斷精度,在源域上可達(dá)99%以上的識(shí)別準(zhǔn)確率,在目標(biāo)域上也能夠達(dá)到95%以上的準(zhǔn)確率,證明了SAAN模型方法的有效性,能夠?qū)o標(biāo)簽?zāi)繕?biāo)域的健康狀態(tài)進(jìn)行正確識(shí)別。
圖11 訓(xùn)練過程的診斷精度Fig.11 Diagnostic accuracy during training
此外,為了說明SAAN模型采用的動(dòng)態(tài)卷積結(jié)構(gòu)能夠提升模型的性能,提高故障類別的識(shí)別精度,將其中的動(dòng)態(tài)卷積結(jié)構(gòu)更換為普通卷積進(jìn)行對(duì)比試驗(yàn)。同時(shí),為了避免試驗(yàn)的偶然性,分別進(jìn)行10次獨(dú)立試驗(yàn)且觀察在不同任務(wù)下目標(biāo)域上的故障識(shí)別準(zhǔn)確率,并計(jì)算10次試驗(yàn)下的標(biāo)準(zhǔn)偏差作為該遷移任務(wù)下的誤差,其試驗(yàn)結(jié)果如圖12所示。通過結(jié)果可以發(fā)現(xiàn)動(dòng)態(tài)卷積的性能明顯優(yōu)于其普通卷積。
圖12 普通卷積與動(dòng)態(tài)卷積的性能對(duì)比Fig.12 Performance comparison between ordinary convolution and dynamic convolution
另一方面,采用不同的域自適應(yīng)方法進(jìn)行了對(duì)比試驗(yàn),MK-MMD、CORAL、JMMD、DANN、CDAN五種域自適應(yīng)方法不同遷移任務(wù)下目標(biāo)域的識(shí)別精度對(duì)比如表5、圖13所示。通過圖表可以清晰的看到SAAN模型在不同遷移任務(wù)下的識(shí)別精度都要高于其他五種域自適應(yīng)方法。
圖13 SEU數(shù)據(jù)集不同域適應(yīng)方法故障識(shí)別準(zhǔn)確率對(duì)比Fig.13 Comparison of fault recognition accuracy of different domain adaptation methods in SEU data set
表5 不同域自適應(yīng)方法在SEU數(shù)據(jù)集上的診斷準(zhǔn)確率Tab.5 Diagnosis accuracy rate of different domain adaptive methods on SEU data set
為了從視覺上直觀了解SAAN網(wǎng)絡(luò)模型對(duì)目標(biāo)域特征的影響,對(duì)SAAN網(wǎng)絡(luò)模型在東南大學(xué)(SEU)數(shù)據(jù)集上0→1和1→0遷移任務(wù)上的結(jié)果進(jìn)一步分析,使用t分布隨機(jī)鄰域嵌入(t-SNE)技術(shù)將高維特征映射到二維空間內(nèi),并將二維特征進(jìn)行可視化展示,如圖14所示。通過可視化分析,相較于未遷移網(wǎng)絡(luò)而言,可以清楚看出SAAN網(wǎng)絡(luò)能夠較好的實(shí)現(xiàn)每個(gè)類別的子域自適應(yīng),使故障類別在類空間的角度實(shí)現(xiàn)了對(duì)齊。此外,通過與其他五種域自適應(yīng)方法的可視化特征圖進(jìn)行對(duì)比,如圖15所示,可以從特征圖中看出,SAAN模型得到特征圖的可分性要優(yōu)于其他域自適應(yīng)方法,有著更為明顯決策邊界,進(jìn)一步說明其故障識(shí)別精度要高于其他域自適應(yīng)方法。
1→0 SAAN遷移圖14 不同遷移任務(wù)下源域和目標(biāo)域的t-SNE可視化Fig.14 The t-SNE visualization of source domain and target domain under different migration tasks
圖15 不同域自適應(yīng)方法在0→1任務(wù)下目標(biāo)域的t-SNE可視化Fig.15 The t-SNE visualization of the target domain under the 0→1 task with different domain adaptive methods
本文將無監(jiān)督子域自適應(yīng)方法應(yīng)用到軸承智能故障診斷任務(wù)中,提出了一種新的SAAN模型,用于不同工況下的軸承智能故障診斷方法。通過2個(gè)數(shù)據(jù)集,共14個(gè)遷移任務(wù)證實(shí)了SAAN模型的有效性。同時(shí),根據(jù)試驗(yàn)結(jié)果得出以下三個(gè)結(jié)論。
(1) SAAN模型在不增加卷積網(wǎng)絡(luò)深度和寬度的情況下,利用動(dòng)態(tài)卷積提取更多的有效特征,相比普通卷積而言能夠在目標(biāo)域獲得更高的識(shí)別精度;
(2) SAAN模型與大多數(shù)域自適應(yīng)方法不同,通過捕獲類別的細(xì)粒度信息,充分利用每個(gè)故障類別的決策邊界,使源域和目標(biāo)域在類空間上實(shí)現(xiàn)對(duì)齊,避免了源域與目標(biāo)域樣本在決策邊界附近出現(xiàn)類混淆。
(3) SAAN模型不僅在不同工況下具有良好的泛化性能,有效地解決了目標(biāo)域無標(biāo)簽和變工況下因數(shù)據(jù)分布不同而導(dǎo)致模型診斷準(zhǔn)確率下降的問題,同時(shí)具有良好的抗噪性能。相較于其他域自適應(yīng)方法,具有一定的優(yōu)越性。