李 可, 何堅光, 宿 磊, 顧杰斐, 包靈昊, 薛志鋼
(1.江南大學(xué) 機械工程學(xué)院江蘇省食品先進制造裝備技術(shù)重點實驗室,江蘇 無錫 214122;2.江蘇省特種設(shè)備安全監(jiān)督檢驗研究院無錫分院,江蘇 無錫 214071)
滾動軸承作為旋轉(zhuǎn)機械的關(guān)鍵部件,往往工作在大負荷、高速旋轉(zhuǎn)等惡劣環(huán)境下,因此不可避免地會產(chǎn)生故障。若故障不能及時被發(fā)現(xiàn),將嚴(yán)重危害人身財產(chǎn)安全[1-2]。因此,對滾動軸承進行故障診斷具有重要意義。
基于信號處理方法的振動檢測技術(shù)是常用的滾動軸承故障診斷方法,但其往往依賴于人工經(jīng)驗選擇所要提取的特征。深度學(xué)習(xí)因其具有自主特征學(xué)習(xí)能力,在故障診斷領(lǐng)域得到了廣泛的關(guān)注,其中卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、深度置信網(wǎng)絡(luò)(deep belief network,DBN)、自編碼器(autoencoder,AE)等深度網(wǎng)絡(luò)模型已獲得成功應(yīng)用。雷春麗等[3]采用馬爾科夫轉(zhuǎn)移場編碼方式將原始一維振動信號轉(zhuǎn)化為二維特征圖像,再將特征圖作為CNN的輸入進行自動特征提取和故障診斷。楊宇等[4]提出一種結(jié)構(gòu)自適應(yīng)DBN的滾動軸承故障診斷方法,通過自適應(yīng)確定網(wǎng)絡(luò)結(jié)構(gòu)提高診斷效率。Shi等[5]提出一種基于稀疏自編碼器的故障診斷方法,并結(jié)合壓縮感知和小波包能量熵進行故障特征降維。大量研究表明,深度學(xué)習(xí)在滾動軸承故障診斷領(lǐng)域具有良好的應(yīng)用前景[6]。然而,深度學(xué)習(xí)模型往往依賴于大量帶標(biāo)簽的數(shù)據(jù),但滾動軸承的故障樣本通常難以采集。因此,如何在故障樣本不足的情況下保證深度網(wǎng)絡(luò)模型的診斷精度是一項具有挑戰(zhàn)的任務(wù)。
Goodfellow等[7]提出的生成對抗網(wǎng)絡(luò)(generative adversarial network,GAN)模型能夠生成具有與真實數(shù)據(jù)分布相似的數(shù)據(jù),可以有效緩解因樣本獲取困難而引起的類不平衡問題[8]。GAN目前在圖像生成、圖像辨識和風(fēng)格遷移等領(lǐng)域有較多應(yīng)用,并且衍生出了不同的變體如條件GAN、深度卷積GAN等。在軸承故障診斷領(lǐng)域,GAN也展現(xiàn)出巨大的應(yīng)用潛力。Liu等[9]提出一種深度特征增強GAN模型,解決了實際工程中故障數(shù)據(jù)不平衡問題。Liu等[10]提出一種基于改進多尺度殘差GAN和特征增強驅(qū)動膠囊網(wǎng)絡(luò)的方法,增強了診斷模型對故障敏感特征的關(guān)注。然而,GAN存在模式崩潰和訓(xùn)練困難的缺陷。Mao等[11]提出最小二乘生成對抗網(wǎng)絡(luò)(least squares GAN,LSGAN),利用最小二乘損失代替GAN的交叉熵損失,提高了生成數(shù)據(jù)的質(zhì)量。為了解決訓(xùn)練困難問題,Park等[12]提出一種基于流行匹配的損失函數(shù)約束生成器,從而使生成樣本匹配真實樣本。Tran等[13]提出一種潛在數(shù)據(jù)距離約束,加強潛在生成樣本和真實樣本之間的兼容性,緩解了生成器模式崩潰的問題。Rumelhart等[14]提出AE(autoencoder),相比于GAN訓(xùn)練更為容易。Meng等[15]通過重復(fù)利用相鄰樣本間的數(shù)據(jù)點,改變降噪自編碼器各層的單元數(shù)來改變超參數(shù)以提高模型的故障識別率。Wang等[16]提出一種堆疊降噪自編碼器與CNN相結(jié)合的故障診斷方法,將堆疊降噪自編碼器處理后的數(shù)據(jù)輸入到CNN模型中進行軸承故障分類。研究表明,將AE與GAN有機結(jié)合能有效提高生成樣本的質(zhì)量。Makhzani等[17]提出一種對抗式自編碼器(adversarial autoencoder,AAE),利用AE對生成器進行約束,將生成的潛在特征向量映射到特定的概率分布空間上,使之生成有意義的樣本。Wu等[18]提出一種雙自編碼器GAN,用于平衡多數(shù)類和少數(shù)類,提高模型的準(zhǔn)確率。Zhang等[19]提出一種翻轉(zhuǎn)AAE的方法,在最大程度上減少潛在空間中的重編碼錯誤,并利用數(shù)據(jù)空間中的對抗準(zhǔn)則捕捉豐富的數(shù)據(jù)語義表示。
當(dāng)滾動軸承訓(xùn)練樣本的不平衡性極強時,現(xiàn)有生成式模型(如GAN、AE和AAE)通常會更加關(guān)注正常樣本,導(dǎo)致生成樣本與正常樣本更為相似,容易發(fā)生模式崩潰。本文提出一種基于約束式自編碼器-生成對抗網(wǎng)絡(luò)(constrained autoencoder-generative adversarial network,CAE-GAN)的故障診斷方法。首先構(gòu)建一種結(jié)合自編碼器和生成對抗網(wǎng)絡(luò)的生成模型,以有效擴充故障樣本的數(shù)量。為進一步解決模式崩潰問題,提出一種考慮距離約束的改進方法。通過約束不同類別生成樣本之間的距離來保持真實樣本的分布,防止生成器從不同的真實樣本中生成極其相似的樣本。滾動軸承故障診斷實驗結(jié)果表明,CAE-GAN方法有效提升了生成樣本的質(zhì)量,相較于其他對比方法具有更高的故障診斷精度。
GAN由生成器(G)和判別器(D)組成,如圖1所示。GAN通過G和D的對抗訓(xùn)練產(chǎn)生與真實樣本相似的生成樣本。首先將隨機噪聲向量z輸入G得到生成數(shù)據(jù)G(z),然后將真實數(shù)據(jù)x和生成數(shù)據(jù)G(z)輸入D,D需要判別生成數(shù)據(jù)和真實數(shù)據(jù),并將判別梯度信息反饋給G,指導(dǎo)數(shù)據(jù)生成的訓(xùn)練方向。G和D這兩個模型構(gòu)成了極大極小對抗性訓(xùn)練,通過不斷迭代逐步提高生成數(shù)據(jù)的真實性。當(dāng)D不能準(zhǔn)確判別數(shù)據(jù)來源時,生成樣本與真實樣本具有相同的分布。GAN的目標(biāo)函數(shù)如下
圖1 GAN模型結(jié)構(gòu)
Ez~Pz[lg(1-D(G(z)))]
(1)
式中:E為數(shù)學(xué)期望;Pd與Pz分別為真實數(shù)據(jù)x與隨機噪聲z的分布。
AE由編碼器(encoder)和解碼器(decoder)組成,可通過無監(jiān)督學(xué)習(xí)提取輸入數(shù)據(jù)特征。解碼器還可以隨機生成與訓(xùn)練數(shù)據(jù)類似的數(shù)據(jù),從而用于數(shù)據(jù)重構(gòu)。AE的損失函數(shù)如下
L=(x-De(En(x)))2
(2)
式中:En為編碼器;De為解碼器;En(x)為樣本x經(jīng)過編碼器映射后的潛在空間向量;De(En(x))為重構(gòu)樣本。通過最小化重構(gòu)誤差提高真實樣本和重構(gòu)樣本的相似性,此時解碼器學(xué)習(xí)到最接近真實樣本的空間分布。
AE-GAN模型結(jié)構(gòu),如圖2所示。真實樣本x經(jīng)過編碼器En生成潛在特征向量,潛在特征向量與噪聲向量輸入解碼器De得到重構(gòu)樣本和假樣本,通過判別器D區(qū)分真實樣本和假樣本。
圖2 AE-GAN模型結(jié)構(gòu)
在GAN模型中,引起模式崩潰的主要原因是兩個相距較遠的樣本被映射到了較為相近的低維空間。使用AE優(yōu)化生成器雖然在一定程度上可以緩解生成器崩潰,但仍不能完全避免模式崩潰的發(fā)生。為有效解決該問題,本文提出一種限制不同樣本之間距離的約束方法(CAE-GAN),以避免高維空間中相距較遠的數(shù)據(jù)被映射到同一點。
以二分類情況為例展示樣本生成過程,如圖3所示。首先分別計算真實樣本的類別一中i樣本和類別二中j樣本之間的距離Dij,以及生成樣本類別一中i樣本和類別二中j樣本之間的距離dij,最小化Dij與dij之差以保證樣本分布的相似性。然而,約束生成樣本與真實樣本的距離完全一致會導(dǎo)致生成樣本缺乏多樣性,因此進一步放松約束條件,即令:
(3)
圖3 生成樣本變化圖
式中:R為真實樣本與生成樣本同一類別之間相似度的正則項,即通過允許兩者存在一定的差異性以保證樣本多樣性,提高模型泛化能力。
(4)
最小化Ld既可以保證生成樣本服從真實分布,又使得生成樣本具有一定的多樣性,避免發(fā)生模式崩潰現(xiàn)象。距離約束損失函數(shù)如下
(5)
式中,u和v分別代表類別一和類別二的樣本數(shù)。
真實樣本首先經(jīng)過編碼器映射為潛在特征向量,再經(jīng)過解碼器生成重構(gòu)樣本。編碼器目標(biāo)函數(shù)如下:
(6)
式中:若L1<0,生成樣本的類間距離大于真實樣本的類間距離,此時不需距離約束;若L1>0,生成樣本與真實樣本的分布相差較大,需要施加距離約束。
解碼器目標(biāo)是使得假樣本De(z)的判別概率D(De(z))最大化,即(1-D(De(z)))最小化,并且希望產(chǎn)生與真實樣本相近、能夠欺騙判別器的生成樣本。具體的目標(biāo)函數(shù)如下:
(7)
通過式(7)反向傳播優(yōu)化解碼器的參數(shù),不斷提高其生成能力。
判別器的目標(biāo)是使得當(dāng)輸入真實樣本x時,判別器最大化判別得分D(x);當(dāng)輸入來自假樣本De(z)時,判別器最小化得分D(De(z)),即最大化(1-D(De(z))),具體的目標(biāo)函數(shù)如下:
Ez~Pz[lg(1-D((De(z)))]
(8)
通過式(8)反向傳播優(yōu)化判別器的參數(shù),不斷提高其判別能力。
在使用CAE-GAN模型有效擴充各種故障樣本數(shù)量后,將帶標(biāo)簽的軸承數(shù)據(jù)一同輸入Resnet18分類網(wǎng)絡(luò)進行訓(xùn)練,從而實現(xiàn)軸承故障類型的識別。分類損失函數(shù)如下
(9)
式中:P為真實樣本與重構(gòu)樣本的實際標(biāo)簽;Q為真實樣本與重構(gòu)樣本的預(yù)測標(biāo)簽。
為驗證本文方法的有效性,搭建滾動軸承故障診斷試驗平臺,如圖4所示。滾動軸承型號為NSK 6205,通過電腐蝕方式模擬了內(nèi)圈故障、外圈故障及滾動體故障,如圖5所示。將滾動軸承安裝于QABP 132S2A電動機的末端,主軸轉(zhuǎn)速2 400 r/min,在電機的外部軸承端布置傳感器,采集負載恒為87.5 Nm和負載逐漸從0增大到87.5 Nm這兩種不同工況下的軸承信號,采樣頻率為10 kHz。
圖4 滾動軸承故障診斷試驗平臺
(a) 內(nèi)圈故障
共采集了滾動軸承在正常(No)、內(nèi)圈故障(In)、外圈故障(Ou)和滾動體故障(Ro)這四種不同狀態(tài)下的振動信號,每種狀態(tài)信號波形圖的上下兩幅分別是常載荷和變載荷工況下采集的數(shù)據(jù),如圖6所示。
圖6 滾動軸承4種狀態(tài)信號波形圖
將本文提出的故障診斷模型應(yīng)用于所采集的軸承信號,以驗證模型的有效性。正常數(shù)據(jù)樣本為300個,正常數(shù)據(jù)與每類故障樣本的比例分別為10∶1,15∶1,30∶1,60∶1和100∶1,通過約束式AE-GAN擴充每類故障樣本直至與正常樣本具有近似數(shù)量。測試樣本每類100個,共400個測試樣本,如表1所示。
表1 樣本數(shù)據(jù)
算法在win 10操作系統(tǒng)下運行,編程語言為Python 3.7,框架為Pytorch-GPU。工作站處理器為AMD Ryzen Threadripper PRO 3975WX,顯卡為NVIDIA RTX A5000,顯存為24GB,通過CUDA加速運算提高深度學(xué)習(xí)模型的運算速率。
CAE-GAN模型初始學(xué)習(xí)率為0.000 1,選用Adam為優(yōu)化器對學(xué)習(xí)率進行動態(tài)優(yōu)化,迭代次數(shù)為10 000。每輪隨機采樣8個樣本進行網(wǎng)絡(luò)訓(xùn)練,使用的噪聲向量長度為256。
故障診斷結(jié)果如表2和表3所示。在兩種工況下CAE-GAN模型的診斷準(zhǔn)確率均為最高。若直接使用ResNet18網(wǎng)絡(luò)對不平衡數(shù)據(jù)進行分類,隨著數(shù)據(jù)不平衡比例增大,診斷準(zhǔn)確率呈明顯下降趨勢。當(dāng)數(shù)據(jù)不平衡比例為100∶1時,常載荷和變載荷工況下采集的數(shù)據(jù)的診斷準(zhǔn)確率分別為79.00%和76.00%。表中的其余模型均先擴充樣本,再用ResNet18進行分類。由于訓(xùn)練GAN達到納什均衡極為困難,故GAN的訓(xùn)練往往是不穩(wěn)定的,導(dǎo)致生成的樣本質(zhì)量較差。當(dāng)樣本比例為10∶1時,常載荷與變載荷工況下的準(zhǔn)確率僅為58.50%和54.00%。LSGAN和BIGAN作為GAN的改進模型,可較大程度提高軸承故障診斷的準(zhǔn)確率。AE通過重構(gòu)樣本獲得與真實樣本相似的生成樣本,但AE實質(zhì)為真實樣本的還原,故導(dǎo)致樣本缺乏多樣性,診斷準(zhǔn)確率較低。雖然AE-GAN用AE優(yōu)化GAN,但樣本質(zhì)量仍可進一步提高。
表2 常載荷工況下分類模型準(zhǔn)確率
表3 變載荷工況下分類模型準(zhǔn)確率
CAE-GAN模型由于施加了距離約束,即使不平衡比例達到100∶1時,每次迭代依舊能生成質(zhì)量較好的樣本,避免了模式崩潰的問題。由表2和表3可知,在各種不同情況下CAE-GAN的分類模型準(zhǔn)確率均高于AE-GAN,且隨著不平衡比例的不斷增大,CAE-GAN和AE-GAN之間的準(zhǔn)確率差距不斷增大。在常載荷工況下,不平衡比例為100∶1時,CAE-GAN的分類模型準(zhǔn)確率達到89.00%,較AE-GAN準(zhǔn)確率增加了3.75%。在變載荷工況下,CAE-GAN分類模型的準(zhǔn)確率也達到了85.00%,相比AE-GAN準(zhǔn)確率增加了4.25%。
當(dāng)ResNet18網(wǎng)絡(luò)的訓(xùn)練樣本中正常數(shù)據(jù)和故障數(shù)據(jù)比例為100∶1時,采用t分布-隨機近鄰嵌入(t-distributed stochastic neighbor embedding,tSNE)對兩種工況的數(shù)據(jù)進行可視化分析,結(jié)果如圖7和圖8所示。
(a) 常載荷下CAE-GAN的分類模型特征可視化
(a) 變載荷下CAE-GAN的分類模型特征可視化
從圖7可知,AE-GAN模型不同狀態(tài)的特征點區(qū)分并不明顯,尤其是滾動體故障、外圈故障和內(nèi)圈故障三種故障重疊面積較大,而CAE-GAN的特征散點聚合情況明顯好于AE-GAN。從圖8可知,AE-GAN模型的滾動體故障、內(nèi)圈故障和外圈故障這三部分重疊嚴(yán)重,導(dǎo)致ResNet18分類較為困難,而CAE-GAN模型減小了三種故障間的重疊面積。
為了更準(zhǔn)確評估CAE-GAN模型生成樣本的多樣性和真實性,采用MS(mode score)和MMD(maximum mean discrepancy)指標(biāo)來評價生成樣本質(zhì)量[20]。MS值越小,差異性越小;MMD值越大,真實性越低。表4和表5為不同模型在樣本比例為100∶1下生成樣本的MS和MMD值。
表4 常載荷工況下不同模型MS和MMD值比較
表5 變載荷工況下不同模型MS和MMD值比較
從表4和表5可知,CAE-GAN的MS值均高于其他模型,而MMD值在所有模型中最低,證明了CAE-GAN模型生成的樣本能更好擬合真實數(shù)據(jù)分布,從而有效擴充故障樣本的數(shù)量。
本文針對滾動軸承故障數(shù)據(jù)稀缺導(dǎo)致訓(xùn)練樣本不平衡的問題,提出一種基于CAE-GAN的故障診斷方法。基于AE-GAN為骨干網(wǎng)絡(luò)的框架,通過對生成樣本施加距離約束,獲得了更高質(zhì)量的生成樣本,進而訓(xùn)練ResNet18分類網(wǎng)絡(luò)以實現(xiàn)高精度的滾動軸承故障診斷,得出以下結(jié)論:
(1) CAE-GAN有效擴充了故障樣本數(shù)量,通過對AE-GAN施加距離約束限制可以避免網(wǎng)絡(luò)發(fā)生模式崩潰。
(2) 與其它模型相比,CAE-GAN的MS值最高,MMD值最低,假樣本的質(zhì)量最佳,軸承故障診斷準(zhǔn)確率最高。