董紹江 周存芳 陳里里 徐向陽
摘要:針對不同工況下采集的滾動軸承振動數(shù)據(jù)特征分布不一致且噪聲成分難以去除的問題,提出一種基于判別性特征提取和雙重域?qū)R的深度遷移學(xué)習(xí)故障診斷方法。首先,將帶標(biāo)簽的振動信號和未帶標(biāo)簽的振動信號通過固定長度的數(shù)據(jù)分割方法制作成數(shù)據(jù)集;其次,為了減少實際工況中噪聲信號的干擾,采用通道注意力機制SENet(squeeze-and-excitation networks)及判別損失項來輔助特征提取器提取具有區(qū)分度的特征;再次,為了解決數(shù)據(jù)特征分布不一致的問題,采用最大均值差異來對齊源域和目標(biāo)域的全局域分布,并采用條件對抗方法來對齊兩域的子領(lǐng)域分布,實現(xiàn)雙重域?qū)R。最后,在兩個公開變工況滾動軸承故障數(shù)據(jù)集上進行試驗驗證,結(jié)果表明,所提方法平均識別準(zhǔn)確率達到98%以上,并將其與不同診斷方法進行了對比分析,證明了所提方法的有效性與優(yōu)越性。
關(guān)鍵詞:滾動軸承;故障診斷;遷移學(xué)習(xí);判別性特征;最大均值差異
中圖分類號:TH133.33
DOI:10.3969/j.issn.1004-132X.2023.15.010
Cross-domain Fault Diagnosis of Bearings Based on Discriminant Feature Extraction and Dual-domain Alignment
DONG Shaojiang ZHOU Cunfang CHEN Lili XU Xiangyang
School of Mechanical,Electrical and Vehicle Engineering,Chongqing Jiaotong University,Chongqing,400074
Abstract: A deep transfer learning method was proposed to address the challenge of inconsistent feature distributions and difficulties in removing noise components in vibration data collected under different operating conditions for rolling bearings. The method utilized a combination of discriminative feature extraction and dual-domain alignment. Firstly, the labeled vibration signals and unlabeled vibration signals were segmented into fixed-length data sets using a data segmentation method. To mitigate the interference of noise signals in practical operating conditions, a channel attention mechanism known as SENet was employed. Additionally, a discriminative loss term was incorporated to assist the feature extractor in extracting features that exhibit discriminative properties. To handle the issue of inconsistent data feature distributions, the MMD was utilized to align the global domain distributions between the source and target domains. Furthermore, conditional adversarial learning techniques were employed to align the sub-domain distributions, resulting in dual-domain alignment. Experimental validation was conducted on two publicly available rolling bearing fault datasets collected under different operating conditions. The results show that the proposed method achieves an average recognition accuracy of over 98%. Comparative analyses with different diagnostic methods further demonstrate the effectiveness and superiority of the proposed method.
Key words: rolling bearing; fault diagnosis; transfer learning; discriminant feature; maximum mean discrepancy(MMD)
0 引言
滾動軸承是大多數(shù)旋轉(zhuǎn)機械中的關(guān)鍵機械零部件[1]。滾動軸承在工作時一旦出現(xiàn)故障問題,輕則會造成經(jīng)濟損失,重則會引起人員傷亡,因此,滾動軸承故障診斷方面的研究具有重要意義[2]。
近年來通過深度學(xué)習(xí)模型進行故障診斷逐漸成為新的熱點問題。張龍等[3]通過構(gòu)建雙通道特征融合網(wǎng)絡(luò)進行齒輪箱和軸承的故障診斷,這種端到端的方法極大地提高了故障診斷的效率。ZHANG等[4]將原始的時間信號作為深度神經(jīng)網(wǎng)絡(luò)的輸入,實現(xiàn)了對滾動軸承故障的精準(zhǔn)分類。然而,以上都是針對單一的工況下滾動軸承故障診斷的方法,但在實際工作條件下,滾動軸承的運行工況是復(fù)雜多變的,不同工況下相同故障的特征表征也有所不同,這將導(dǎo)致訓(xùn)練樣本和測試樣本產(chǎn)生較大的特征分布差異。因此,通過訓(xùn)練數(shù)據(jù)訓(xùn)練得到的網(wǎng)絡(luò)應(yīng)用于測試數(shù)據(jù)時,模型性能將急劇下降,所以需要更有效的方法來利用一種工況下的標(biāo)記訓(xùn)練數(shù)據(jù)來診斷另一種工況下的未標(biāo)記測試數(shù)據(jù)。
最近,遷移學(xué)習(xí)在解決跨工況的任務(wù)上得到了廣泛的應(yīng)用[5-7]。YANG等[8]將卷積神經(jīng)網(wǎng)絡(luò)結(jié)合多層最大均值差異(maximum mean discrepancy,MMD),通過最小化MMD距離來減小源目標(biāo)域與源域之間的分布差異,實現(xiàn)特征的域適應(yīng)。WEN等[9]提出了一種頂層深度適應(yīng)方法,該方法使用三層稀疏自動編碼器(sparse auto encoder,SAE)提取功率譜的特征,并應(yīng)用MMD項來適應(yīng)特征數(shù)據(jù)之間的分布差異。
主流的遷移學(xué)習(xí)故障診斷往往存在以下問題:①在實際工業(yè)環(huán)境下,采集到的數(shù)據(jù)可能由于噪聲或其他干擾,導(dǎo)致不同的故障特征因噪聲的混入而難以被區(qū)分開來,使得分類器的決策邊界處往往存在難以區(qū)分的樣本;②大多數(shù)遷移學(xué)習(xí)的策略僅對齊源域和目標(biāo)域的全局域分布來進行遷移,忽略了全局空間下的子領(lǐng)域?qū)R,導(dǎo)致相同故障類型的子領(lǐng)域不能夠充分對齊,訓(xùn)練的模型精度不高。
為了克服上述問題,本文提出了一種基于判別性特征提取和雙重域?qū)R的軸承跨域故障診斷的方法。首先提出了一種注意力機制和判別損失項,將信號中的噪聲部分去除。其次采用域?qū)购陀蜻m應(yīng)的雙重對齊方法,縮小不同工況下的數(shù)據(jù)分布差異。
1 理論基礎(chǔ)
1.1 領(lǐng)域自適應(yīng)
目前遷移學(xué)習(xí)的思想通常是將源域和目標(biāo)域的樣本映射到特征空間中,在這個特征空間內(nèi)尋找一個度量準(zhǔn)則,來使源域和目標(biāo)域的特征分布盡可能地相近,即領(lǐng)域自適應(yīng)。
MMD可以用來度量源域和目標(biāo)域之間的距離,直觀判斷兩個數(shù)據(jù)的分布。假設(shè)源域數(shù)據(jù)集Xs={xs1,xs2,…,xsn}和目標(biāo)域數(shù)據(jù)集Xt={xt1,xt2,…,xtm}滿足不同的分布,存在一個再生Hilbert空間和一個映射函數(shù)φ(·),可以將數(shù)據(jù)集從原始空間映射到Hilbert空間。則MMD損失的定義如下:
其中,n、m分別為源域和目標(biāo)域的樣本數(shù)量。高斯核函數(shù)具有可以映射無窮維空間的優(yōu)勢,所以本文采用高斯核函數(shù)作為映射函數(shù)φ(·)。
1.2 條件領(lǐng)域?qū)褂蜻m應(yīng)
除了采用度量準(zhǔn)則來進行領(lǐng)域自適應(yīng)的方法之外,采用對抗性思想進行域適應(yīng)也是遷移學(xué)習(xí)的一種方法,主要的代表性工作是GANIN等[10]提出的領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)(domain adversarial training of neural network,DANN)。WANG等[11]將DANN引入跨域故障診斷。DANN網(wǎng)絡(luò)由以下三部分組成:特征提取器F、領(lǐng)域判別器D和標(biāo)簽預(yù)測器G。在前向傳播過程中,F(xiàn)=F(x)中x為輸入的數(shù)據(jù),F(xiàn)為輸入數(shù)據(jù)的特征。G=G(F)中G為輸入特征所預(yù)測的標(biāo)簽。D是一個二元分類器,用于指示特征是來自源域還是目標(biāo)域。
F的主要用途是它的參數(shù)被訓(xùn)練成最大化Ld來混淆D,Ld為領(lǐng)域判別損失。而D的參數(shù)被訓(xùn)練成最小化Ld來正確預(yù)測域標(biāo)簽。通過這種對抗性的訓(xùn)練過程,很難區(qū)分源特征和目標(biāo)特征,從而減少了它們的分布差異。整個網(wǎng)絡(luò)的損失由標(biāo)簽分類器損失Lg和領(lǐng)域判別損失Ld組成:
其中,E為期望,nc為類的數(shù)量,Gc(fsi)為將第i個源樣本的特征預(yù)測到第c類的概率。fsi表示第i個源樣本的特征。D(fsi)取值范圍為0~1,表示fsi來自源域還是目標(biāo)域。領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)的總體優(yōu)化目標(biāo)為
其中,λ1是一個權(quán)衡參數(shù),用于平衡Lg和Ld之間的貢獻。特征提取器F的參數(shù)通過最大化Ld來優(yōu)化,D的參數(shù)通過最小化Ld來優(yōu)化,G和F的參數(shù)通過最小化Lg來優(yōu)化。利用上述優(yōu)化目標(biāo)訓(xùn)練模型后,可以使用標(biāo)記源數(shù)據(jù)訓(xùn)練的標(biāo)簽預(yù)測器來正確分類未標(biāo)記的目標(biāo)數(shù)據(jù)。
在故障診斷領(lǐng)域中,同一故障類型之間的標(biāo)簽預(yù)測比不同故障類型之間的標(biāo)簽預(yù)測更接近。考慮到標(biāo)簽預(yù)測器G含有預(yù)測的標(biāo)簽信息,將預(yù)測結(jié)果G同特征F聯(lián)合起來輸入領(lǐng)域判別器D中,可以更好地對齊屬于同一類別的源域和目標(biāo)域的特征。
據(jù)分布背后的多模態(tài)結(jié)構(gòu)以及特征和分類器預(yù)測之間的乘法交互,故本文使用多線性映射來對F和G進行聯(lián)結(jié):
1.3 判別損失項
在計算機視覺領(lǐng)域,已經(jīng)出現(xiàn)改進特征識別的算法來提高模型的泛化性能。WEN等[12]提出聯(lián)合優(yōu)化SoftMax損失函數(shù)和中心損失函數(shù),用于最小化特征的類內(nèi)距離,以獲得更加高效有用的特征和魯棒的卷積神經(jīng)網(wǎng)絡(luò)。但僅縮小特征的類內(nèi)距離是不夠的,還應(yīng)該使不同故障的特征之間離得越遠(yuǎn)越好,特征才會更加具有區(qū)分度。
為了獲得更加具有區(qū)分度的特征,本文提出一種判別損失項,如圖1所示。判別損失項本質(zhì)上是一種損失函數(shù),該損失函數(shù)作用在源域上,對源域的特征進行約束,判別損失項模塊的作用是使同一類別的特征更加緊湊,不同類別的特征更加分散,使得特征變得更加具有區(qū)分度,那么相應(yīng)的目標(biāo)域的數(shù)據(jù)進行對齊后也會更加具有區(qū)分度。
損失計算公式為
式中,β為權(quán)衡參數(shù);nbs為批次大??;fsi為提取的深度特征;ci、cj為通過平均當(dāng)前批次的源域特征計算的當(dāng)前批次的類中心;cyi為源特征的第i個類別的全局類中心。
全局類中心cyi在每次迭代中更新如下:
其中,γ為cyi進行參數(shù)更新時的學(xué)習(xí)率,t為迭代次數(shù)。cyi被初始化為第一批的全局類中心。隨著迭代次數(shù)的增加,cyi將更接近全局類中心。
1.4 注意力機制
滾動軸承在運行狀況下所采集的信號中由于周邊環(huán)境等其他因素的影響會包含噪聲信號在內(nèi),而這些噪聲信號可能會被當(dāng)成有用的信息被提取出來,這些信息會影響網(wǎng)絡(luò)的性能,本文采用SENet(squeeze-and-excitation networks)[13]注意力模塊,該模塊可以通過模型的訓(xùn)練來自動地學(xué)習(xí)一組權(quán)重系數(shù),學(xué)習(xí)到的權(quán)重系數(shù)通過加權(quán)的方法來提高對特征重要的通道的權(quán)值,同時低權(quán)重系數(shù)會減弱干擾信息帶來的負(fù)面影響。
注意力機制的流程如圖2所示,整個模塊包含三個主要步驟:Fsq為壓縮(squeeze)操作,F(xiàn)ex為激勵(excitation)操作,F(xiàn)scale 為乘積(reweight)操作。具體流程為將H×W×C維的特征圖通過壓縮操作和激勵操作變?yōu)镃個權(quán)重系數(shù),將得到的權(quán)重系數(shù)與原有的特征進行Fscale 操作后即可得到反映通道重要性的新的特征矩陣,從而完成對原有特征在通道維度的重新加權(quán)。
首先Fsq壓縮操作是對特征圖的每個通道進行全局平均池化,將H×W×C維的特征圖壓縮成1×1×C的特征向量,其中每個通道的二維特征矩陣被壓縮成一個具有全局感受野的特征響應(yīng)值。計算過程如下:
式中,VC為特征圖中第C個通道的特征向量。
接下來進行Fex激勵操作,激勵操作主要是通過兩層全連接層和一個Sigmoid激活函數(shù)來實現(xiàn),通過兩層全連接更好地融合輸入的特征信息,Sigmoid則是輸入的特征映射為0~1之間的歸一化權(quán)重,計算過程如下:
zC′=Fex(zC)=σ(ω2(ω1(zC)))(11)
式中,σ為Sigmoid函數(shù);ω1、ω2為2個全連接層的權(quán)重;zC′為Fex激勵操作后的輸出。
最后的Fscale 乘積操作是將壓縮、激勵后得到的權(quán)重與原有的特征圖通道的特征矩陣進行點乘運算,得到重新標(biāo)定后的特征:
整個過程中,特征圖的尺寸和通道維度都未改變。
2 網(wǎng)絡(luò)模型
2.1 判別性特征提取和雙重域?qū)R網(wǎng)絡(luò)模型
本文提出的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3所示。
本文優(yōu)化的具體計算公式為
F的參數(shù)通過最大化Ld來優(yōu)化,D的參數(shù)通過最小化Ld′來優(yōu)化,G和F的參數(shù)通過最小化Lg、Lc和LMMD來優(yōu)化。θf為特征提取器參數(shù),θg為標(biāo)簽預(yù)測器參數(shù),θd為領(lǐng)域判別器參數(shù),η為學(xué)習(xí)率。參數(shù)θf、θg、θd通過反向傳播更新,公式如下:
2.2 雙重對齊域自適應(yīng)神經(jīng)網(wǎng)絡(luò)模型診斷流程
首先,通過傳感器獲得旋轉(zhuǎn)機械系統(tǒng)振動信號并進行數(shù)據(jù)分割處理,制作成樣本。其次,將有標(biāo)簽的源數(shù)據(jù)和沒有標(biāo)簽的目標(biāo)數(shù)據(jù)用于模型的訓(xùn)練,將源數(shù)據(jù)和目標(biāo)數(shù)據(jù)同時輸入特征提取器中,獲得提取到的特征;之后將提取的特征進行判別性特征損失計算,目的是獲得高效有用的特征;再次特征被輸送到雙重對齊域自適應(yīng)網(wǎng)絡(luò)中,計算領(lǐng)域判別器的損失和域?qū)R器的損失。目標(biāo)函數(shù)LMMD、Lg、Ld′、Lc和總目標(biāo)函數(shù)分別由式(1)、式(2)和式(6)、式(7)、式(13)計算得到,采用反向傳播算法更新所有參數(shù),最后,softmax分類器對無標(biāo)簽的目標(biāo)域數(shù)據(jù)進行故障診斷。故障診斷流程如圖4所示。
當(dāng)網(wǎng)絡(luò)模型訓(xùn)練完成后,選取分類準(zhǔn)確率最高的網(wǎng)絡(luò)模型進行參數(shù)保存,將保存好的參數(shù)放入特征提取器和標(biāo)簽預(yù)測器中,之后將未標(biāo)記標(biāo)簽的原始振動數(shù)據(jù)通過特征提取器實現(xiàn)特征提取,然后在此基礎(chǔ)上通過分類器進行特征信息的分類,最后得到的標(biāo)簽也就是網(wǎng)絡(luò)模型認(rèn)為輸送的數(shù)據(jù)最有概率的類別,便完成了模型的診斷應(yīng)用。模型應(yīng)用流程如圖5所示。
3 實驗分析
3.1 實驗一:凱斯西儲大學(xué)(CWRU)軸承故障數(shù)據(jù)驗證
3.1.1 數(shù)據(jù)集介紹
美國凱斯西儲大學(xué)(CWRU)軸承故障數(shù)據(jù)集[14]的采樣頻率為12 kHz,對于軸承的故障,采用的方法是電火花加工,通過電火花加工將3種不同尺寸的單點故障分別加工在軸承的內(nèi)圈、外圈、滾動體上。本文所使用的振動數(shù)據(jù)是通過安裝在電機外殼驅(qū)動端上的加速度計采集的,數(shù)據(jù)描述見表1。實驗中采用了四種電機負(fù)載,分別為0、745 W、1470 W、2205 W。
3.1.2 遷移任務(wù)設(shè)置
設(shè)0、1、2、3分別表示0、745 W、1470 W、2205 W的電機負(fù)載。通過對四種操作條件的排列,構(gòu)建了12個傳輸任務(wù):0-1、0-2、0-3、1-0、1-2、1-3、2-0、2-1、2-3、3-0、3-1、3-2。例如,0-1表示源域數(shù)據(jù)在0負(fù)載下采集,目標(biāo)域數(shù)據(jù)在745 W負(fù)載下采集。源域和目標(biāo)域數(shù)據(jù)的每一類都包含400個樣本,因此有10個類的4000個標(biāo)記源樣本和4000個未標(biāo)記目標(biāo)樣本可供訓(xùn)練。每個由1024個點組成的樣本是原始時域振動信號的一段。
3.1.3 對比實驗方法介紹
為了對比本文方法與其他方法的優(yōu)越性,在數(shù)據(jù)集上使用了以下四種方法進行比較。方法一:使用18層的ResNet,輸入為一維時間序列,
只使用源數(shù)據(jù)訓(xùn)練模型,不考慮目標(biāo)數(shù)據(jù)。然后直接用訓(xùn)練好的模型對未標(biāo)記的目標(biāo)數(shù)據(jù)進行測試。方法二:在方法一的特征提取器和標(biāo)簽預(yù)測器之間增加了一個適應(yīng)層,并在優(yōu)化目標(biāo)中增加了MMD距離損失。方法三:根據(jù)DANN[11]的領(lǐng)域?qū)顾枷?,引入領(lǐng)域判別器D以及梯度反轉(zhuǎn)層。方法四:在方法三的基礎(chǔ)上進一步改進,加入了多線性映射以及熵權(quán)重。本文方法:采用添加注意力機制的特征提取器和標(biāo)簽預(yù)測器(SE-Resnet18),采用基于MMD距離度量和條件對抗方法的雙重對齊方法,并在優(yōu)化目標(biāo)中加入特征判別損失。
3.1.4 實驗參數(shù)設(shè)置
為保證本文方法與對比方法在訓(xùn)練時的一致性,所有方法均采用等效超參數(shù)。使用動量為0.9的小批SGD,每個域的批大小設(shè)置為128。學(xué)習(xí)率的調(diào)整公式為η=0.01(1+10p)-0.75,其中p是訓(xùn)練進度從0到1的線性變化。其他參數(shù)經(jīng)過多次預(yù)實驗確定。λ1設(shè)置為0.01,λ2設(shè)置為0.005,γ=0.01,β固定為0.5。
3.1.5 實驗結(jié)果分析
不同模型的準(zhǔn)確率見表2,遷移任務(wù)0-1表示0負(fù)載數(shù)據(jù)為源域,745 W負(fù)載數(shù)據(jù)為目標(biāo)域。
(1)由對比模型的準(zhǔn)確率可以看出,采用遷移學(xué)習(xí)思想的方法均高于方法一,說明引入遷移學(xué)習(xí)的思想可以有效地解決針對軸承跨域故障診斷的問題。
(2)由表2可知,方法二的精度略低于對抗方法的精度,原因是:方法二僅對齊了全局域分布,故精度較低;僅僅使用一層MMD對齊會導(dǎo)致特征不能充分地對齊,使得模型識別精度不高。
(3)方法四的精度要高于方法三的精度,說明在進行域?qū)R的時候,盲目對齊全局域分布是不夠的,還應(yīng)該考慮子領(lǐng)域的對齊。
(4)由表2可知方法四的精度略低于本文方法的精度,究其原因是方法四沒有注意力機制和判別損失項來提取關(guān)鍵特征,同時導(dǎo)致網(wǎng)絡(luò)在特征提取過程中特征丟失,從而影響故障診斷結(jié)果。
綜上所述,本文方法平均精度達99.88%,是所有模型中效果最好的,具有更高的特征表征能力且具有一定的遷移診斷精度。一方面,針對采集的數(shù)據(jù),在提取特征的時候引入注意力機制和判別損失項,使得提取的特征更加高效有用,增強了模型的泛化能力;另一方面,在進行遷移學(xué)習(xí)的過程中采用了雙重對齊的方法,該方法能夠明顯縮小不同工況下數(shù)據(jù)之間的分布差異。
3.1.6 結(jié)果可視化分析
為了更加直觀地看到本文方法對軸承跨域診斷的有效性,選擇遷移任務(wù)為3-0,利用t-分布鄰域嵌入(t-distribution stochastic neighbor embedding,t-SNE)[15]算法將提取的目標(biāo)域和源域的特征降至二維平面進行可視化,如圖6所示。
由圖6可知,方法一效果最差,因為并未進行遷移操作,所以源域和目標(biāo)域之間不同的故障類別發(fā)生了嚴(yán)重的混疊。
方法二與本文方法相比較,發(fā)現(xiàn)存在特征混疊現(xiàn)象,這是由于方法二僅僅對齊了兩域的全局域分布,忽略子領(lǐng)域的對齊。
由表2的對比結(jié)果可知,方法三的分類性能要明顯優(yōu)于方法二,但缺點同樣是只對齊了全局域分布而沒有考慮細(xì)粒度的區(qū)分。由方法四的可視化圖可以看出,由于方法四考慮了子領(lǐng)域的對齊,效果比前三種方法要好,但由圖6的可視化特征圖明顯可以看到,本文特征的類內(nèi)緊湊型和類間可分性要好于方法四,說明方法四模型泛化能力較弱。
結(jié)合表2及圖6,證明了本文方法通過雙重域?qū)R將來自源域和目標(biāo)域相同故障種類樣本更緊密地聚類在一起;其次在判別損失項及注意力機制的輔助下,使得提取的特征更加高效有用,間接增強了模型的泛化性。
3.2 實驗二:江南大學(xué)軸承故障數(shù)據(jù)驗證
3.2.1 數(shù)據(jù)集介紹
江南大學(xué)數(shù)據(jù)集[16]為江南大學(xué)獲取的軸承數(shù)據(jù)集。對NA(正常)、IF(內(nèi)圈故障)、OF(外圈故障)和BF(滾動體故障)4種不同狀態(tài)進行了測試。在三種轉(zhuǎn)速(600 r/min、800 r/min和1000 r/min)下采樣振動信號,采樣頻率為50 kHz。數(shù)據(jù)描述見表3。
3.2.2 遷移任務(wù)設(shè)置
設(shè)置為600 r/min、800 r/min和1000 r/min的三個轉(zhuǎn)速被認(rèn)為是不同的任務(wù),分別表示任務(wù)0、任務(wù)1和任務(wù)2,見表4。通過對三個任務(wù)的排列,總共有六種遷移學(xué)習(xí)設(shè)置,分別為0-1、0-2、1-0、1-2、2-0、2-1。
3.2.3 實驗結(jié)果分析
為了驗證本文方法的有效性,設(shè)置對比實驗,對比實驗的模型以及模型參數(shù)與3.1節(jié)中的實驗一保持一致,得到表5所示的診斷精度。
分析表5可知,在所有的遷移任務(wù)中,方法一的準(zhǔn)確率低于其他遷移學(xué)習(xí)方法的準(zhǔn)確率,說明遷移學(xué)習(xí)的確能夠解決跨工況的問題。方法二效果弱于方法三,是由于方法二只是對最后一層全連接進行了MMD對齊,并未充分對齊,而方法三是自適應(yīng)的對齊,所以其效果好于方法二。方法四在大多情況下要優(yōu)于方法三,原因是方法四算法考慮了子領(lǐng)域的對齊。
本文方法平均精度為98.32%,是所有模型中精度最高的,說明本文方法在特征提取方面能夠有效地提取有用的特征,同時在域?qū)R階段能夠有效地減小源域和目標(biāo)域的差異,使其充分對齊。
3.2.4 結(jié)果可視化分析
為了更好地展現(xiàn)本文模型的效果,針對遷移任務(wù)中的1-0,采用T-sne可視化方法對提取的特征進行二維可視化,如圖7所示??梢钥闯?,本文方法效果明顯高于其他模型,并且聚類效果好,各類特征之間距離較遠(yuǎn),說明模型泛化能力強。
3.3 實驗三:模型泛化性能驗證
為了驗證本文提出的判別損失項及注意力機制能夠有效地抑制噪聲,提取有用特征,采用的驗證方法是對原有的信號進行加噪處理。本文所添加的噪聲是高斯白噪聲。選取4種信噪比情況下的噪聲數(shù)據(jù),即-4 dB,-2 dB,2 dB,4 dB。取3HP作為源域數(shù)據(jù),0HP作為目標(biāo)域數(shù)進行模型訓(xùn)練,在本次實驗中,采用含噪聲的信號作為訓(xùn)練集輸送到網(wǎng)絡(luò)進行訓(xùn)練,然后使用不含噪聲的測試集進行測試,得到不同方法的實驗精度結(jié)果,見表6,精度對比如圖8所示。
由表6和圖8可知,本文方法的精度在不同噪聲含量的信號中均最高,這是由于本文采用了判別損失項和注意力機制,注意力機制可以使網(wǎng)絡(luò)關(guān)注信號的重要成分,而判別損失項則是通過度量的思想,使得同一類別的特征變得更加緊湊,
不同類別的特征更加分散,也就意味著本模型能夠有效地提取信號中的有用特征,消除了噪聲特征,進而提高了模型的診斷精度。
4 結(jié)論
(1)本文方法在CWRU軸承故障診斷數(shù)據(jù)集和江南大學(xué)軸承數(shù)據(jù)集兩個數(shù)據(jù)集驗證后的表現(xiàn)都達到了最高的精度,并且由可視化圖可以看出,本文方法能夠充分減小跨域的分布差異,提取有效特征,增強模型的泛化能力。
(2)本文方法通過雙重域?qū)R,使特征在對齊全局域分布的條件下,也同時對齊子領(lǐng)域分布,提高了模型識別精度。
(3)通過實驗三的實驗驗證,本文所提的基于注意力和判別損失項的特征提取網(wǎng)絡(luò)能夠提取更加有效的特征,在強噪聲的環(huán)境下仍然具有較高的診斷精度。
參考文獻:
[1] MA Z H, WANG S P, SHI J, et al. Fault Diagnosis of an Intelligent Hydraulic Pump Based on a Nonlinear Unknown Input Observer[J]. Chinese Journal of Aeronautics, 2018, 31(2):385-394.
[2] 雷亞國, 賈峰, 孔德同, 等. 大數(shù)據(jù)下機械智能故障診斷的機遇與挑戰(zhàn)[J]. 機械工程學(xué)報, 2018, 54(5):94-104.
LEI Yaguo, JIA Feng, KONG Detong, et al. Opportunities and Challenges of Mechanical Intelligent Fault Diagnosis under Big Data[J]. Journal of Mechanical Engineering, 2018, 54(5):94-104.
[3] 張龍, 甄燦壯, 易劍昱, 等. 雙通道特征融合CNN-GRU齒輪箱故障診斷[J]. 振動與沖擊, 2021, 40(19):239-245.
ZHANG Long, ZHEN Canzhuang, YI Jianyu, et al. Fault Diagnosis of Dual-channel Feature Fusion CNN-GRU Gearbox[J]. Vibration and Shock, 2021, 40(19):239-245.
[4] ZHANG W, LI C H, GAO L, et al. A Deep Convolutional Neural Network with New Training Methods for Bearing Fault Diagnosis under Noisy Environment and Different Working Load[J]. Mechanical Systems and Signal Processing, 2018, 100:439-453.
[5] 雷亞國, 楊彬, 杜兆鈞, 等. 大數(shù)據(jù)下機械裝備故障的深度遷移診斷方法[J]. 機械工程學(xué)報, 2019, 55(7):1-8.
LEI Yaguo, YANG Bin, DU Zhaojun, et al. Deep Migration Diagnosis Method of Mechanical Equipment Fault under Big Data[J]. Journal of Mechanical Engineering, 2019, 55(7):1-8.
[6] 雷亞國, 楊彬, 李乃鵬, 等. 跨設(shè)備的機械故障靶向遷移診斷方法[J]. 機械工程學(xué)報, 2022, 58(12):1-9.
LEI Yaguo, YANG Bin, LI Naipeng, et al. Diagnostic Method of Cross-equipment Mechanical Fault Targeted Migration[J]. Journal of Mechanical Engineering, 2022, 58(12):1-9.
[7] ZHENG H, WANG R, YANG Y, et al. Cross-domain fault Diagnosis Using Knowledge Transfer Strategy:a Review[J]. IEEE Access, 2019, 7:129260-129290.
[8] YANG B, LEI Y G, JIA F, et al. An Intelligent Fault Diagnosis Approach Based on Transfer Learning from Laboratory Bearings to Locomotive Bearings[J]. Mechanical Systems and Signal Processing, 2019, 122:692-706.
[9] WEN L, GAO L, LI X. A New Deep Transfer Learning Based on Sparse Auto-encoder for Fault Diagnosis[J]. IEEE Transactions on Systems, Man, and Cybernetics:Systems, 2019, 49(1):136-144.
[10] GANIN Y, USTINOVA E, AJAKAN H, et al. Domain-adversarial Training of Neural Networks[J]. Journal of Machine Learning Research, 2017, 17(1):2096-2030.
[11] WANG Q, MICHAU G, FINK O. Domain Adaptive Transfer Learning for Fault Diagnosis[C]∥ Prognostics and System Health Management Conference(PHM-Paris). Paris, 2019:18821345.
[12] WEN Y, ZHANG K, LI Z, et al. A Discriminative Feature Learning Approach for Deep Face Recognition[C]∥European Conference on Computer Vision. Cham, 2016:499-515.
[13] HU J, SHEN L, SUN G. Squeeze-and-excitation Networks[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City, 2018:7132-7141.
[14] Case Western Reserve University. Case Western Reserve University(CWRU)Bearing Data Center[EB/OL]. https:∥csegroups. case. edu/bearingdatacenter/pages/download-data-file/.
[15] LAURENS V D M, HINTON G. Visualizing Data Using t-SNE[J]. Journal of Machine Learning Research, 2008, 9(86):2579-2605.
[16] LI Ke, PING Xueliang, WANG Huaqing, et al. Sequential Fuzzy Diagnosis Method for Motor Roller Bearing in Variable Operating Conditions Based on Vibration Analysis[J]. Sensors, 2013, 13(6):8013-8041.