郭俊鋒,王淼生,孫 磊,續(xù)德鋒
(蘭州理工大學 機電工程學院,甘肅 蘭州 730050)
在現(xiàn)代工業(yè)中,機械設備正朝著高精度、高效率、自動化、復雜化的方向發(fā)展,故障甚至事故更加頻繁發(fā)生[1],這對機械設備的可靠性和安全性提出了更高的要求。滾動軸承是旋轉(zhuǎn)機械的重要支撐部件,其健康狀況會影響整個設備的工作性能,一旦發(fā)生故障,輕則降低生產(chǎn)效率,耽誤生產(chǎn)進度;重則造成影響惡劣的生產(chǎn)事故。因此,及時對滾動軸承進行狀態(tài)監(jiān)測以及可靠的故障診斷具有重要意義。
機器學習,尤其是深度學習[2]已經(jīng)被廣泛地用于旋轉(zhuǎn)機械的軸承狀態(tài)監(jiān)測和故障診斷。與依賴于人工提取特征的傳統(tǒng)方法相比,深度學習模型具有強大的深層次特征提取的能力[3-5],已經(jīng)在機器狀態(tài)監(jiān)測故障診斷的最新應用中取得了巨大成功。沈濤等[6]提出一種卷積長短時記憶網(wǎng)絡(Convolutional Neural Networks—Long Short Term Memory, CNN-LSTM)批標準化診斷模型,實驗表明該方法優(yōu)于傳統(tǒng)的深度學習診斷模型。
對于深度學習模型,訓練數(shù)據(jù)是影響其性能的重要因素。為了獲得準確的故障診斷,需要大量的平衡數(shù)據(jù)對深度診斷模型進行訓練。在實際情況下,機械設備在大多數(shù)時間里在正常的工作條件下運行,可以很容易地收集到足夠多的機械設備在正常狀況下工作的數(shù)據(jù)。然而,機械設備很少在故障狀況下運行,故很難收集到足夠多的故障樣本[7]。因此,很難得到大量且平衡的數(shù)據(jù)訓練深度學習模型,這極大地限制了深度學習模型實現(xiàn)準確故障診斷的能力。
為了解決不平衡數(shù)據(jù)集的故障診斷問題,現(xiàn)有方法主要分為算法優(yōu)化和數(shù)據(jù)合成。算法優(yōu)化的目的在于優(yōu)化模型結(jié)構(gòu)和損失函數(shù),使分類器盡可能地關(guān)注少數(shù)類別。ZHANG等[8]提出一種基于原型學習網(wǎng)絡的滾動軸承診斷的深度對抗半監(jiān)督方法。JIA等[9]提出深度歸一化卷積神經(jīng)網(wǎng)絡來改善訓練過程,加權(quán)SoftMax損失有助于解決分類不平衡的問題。WU等[10]開發(fā)了一個加權(quán)的長循環(huán)卷積LSTM模型,并利用欠采樣策略和加權(quán)的代價敏感損失函數(shù)來解決不平衡數(shù)據(jù)集故障診斷的問題。但是,基于算法優(yōu)化的方法主要針對數(shù)據(jù)集各類別樣本數(shù)量比例固定的情況,不能很好地解決數(shù)據(jù)集各類別樣本數(shù)量比例變化的問題。而機械設備在運行過程中,數(shù)據(jù)集的不平衡率會發(fā)生變化[11]。因此,合成少數(shù)類別以平衡數(shù)據(jù)集是提高分類器性能的最優(yōu)方案。
當使用設備運行中產(chǎn)生的數(shù)據(jù)解決數(shù)據(jù)集不平衡的故障分類問題時,生成對抗網(wǎng)絡(Generative Adversarial Net, GAN)為生成少數(shù)類別樣本提供了一個選擇[12]。GAN最初被用作生成圖像的框架,已被證明在圖像生成方面具有強大的能力。但是,由于GAN訓練不穩(wěn)定,使用GAN生成的數(shù)據(jù)質(zhì)量非常差。因此,已經(jīng)有很多關(guān)于提高GAN性能的研究。ZHENG等[13]提出一種有監(jiān)督的條件生成對抗網(wǎng)絡(Conditional Generative Adversarial Network, CGAN)模型用于生成大量的故障數(shù)據(jù),并用生成的數(shù)據(jù)代替真實的故障數(shù)據(jù),構(gòu)成一個新的數(shù)據(jù)集來訓練分類器。WGAN(Wasserstein GAN)[14]試圖形成一個新的損失函數(shù),以獲得更好的穩(wěn)定性和圖像生成效果,但同時也給判別器網(wǎng)絡帶來了新的限制,這一限制使得網(wǎng)絡存在訓練困難的問題。李亞鑫[15]針對工業(yè)環(huán)境無故障樣本的問題,結(jié)合有限長單位脈沖響應帶通濾波器和深度卷積生成對抗網(wǎng)絡,僅采用行星齒輪箱結(jié)構(gòu)參數(shù)和健康的行星齒輪箱振動信號,搭建了行星齒輪箱關(guān)鍵零部件故障檢測框架。ZHANG等[16]提出一種使用條件生成對抗網(wǎng)絡解決數(shù)據(jù)集不平衡的問題,采用多個生成模塊來進行少數(shù)類的數(shù)據(jù)擴充。SHAO等[7]開發(fā)了一個基于輔助分類器的GAN框架,從機械振動信號中學習并生成逼真的一維原始數(shù)據(jù)。但上述模型依舊存在著各自的問題,并未解決生成對抗模型梯度消失、模式崩潰、訓練過程不穩(wěn)定以及生成樣本質(zhì)量較差和沒有指向性等問題。同時,GAN作為圖像生成框架,只有將其用于生成圖像樣本,才能更好地發(fā)揮它在樣本生成方面的優(yōu)勢。
本文利用小波分析(Wavelet Transform, WT)[17]將一維原始振動信號轉(zhuǎn)換為二維時頻圖,并將其作為條件梯度懲罰生成對抗網(wǎng)絡(Conditional Wasserstein GAN—Gradient Penalty, CWGAN-GP)模型的輸入。通過將小波時頻分析與CWGAN-GP相結(jié)合,充分利用了原始信號的時頻域信息,同時將時頻圖作為生成目標也能更好地發(fā)揮CWGAN-GP圖像生成的優(yōu)勢。此外,該方法也解決了原始GAN訓練過程不穩(wěn)定、梯度消失、生成樣本質(zhì)量差和訓練一次只能生成一類樣本的問題。實驗結(jié)果表明,提出的方法能夠生成高質(zhì)量的樣本,具有很好的魯棒性,且在數(shù)據(jù)集不平衡的情況下也具有不錯的診斷性能。
小波變換被稱為信號分析顯微鏡,它可以大規(guī)模地全局顯示低頻信息,而在小范圍內(nèi)可以局部顯示高頻特性。雖然可以采用WV(Wigner-Vile)分布、短時傅里葉變換和小波變換等多種方法將原始信號轉(zhuǎn)換為時頻圖像,但其中的一些方法存在一定的局限性。短時傅里葉變換的窗口大小是固定的。WV分布會受到交叉項的干擾[18]。在時域中,一般的小波變換可以表示為:
(1)
式中:x(t)為給定的時間序列,φ為母小波,φ*為φ的復共軛,a為可以控制小波展開的比例,b為標識其位置的平移因子。
本文采用小波變換,從一維原始信號中提取時頻圖像特征,使其作為生成對抗網(wǎng)絡的輸入。除此之外,Morlet是應用最廣泛的小波基,并且非常適合于旋轉(zhuǎn)機械的故障特征提取,因此選擇Morlet作為小波變換的小波基。
生成對抗網(wǎng)絡是一種無監(jiān)督的深度學習模型框架,最初由GOODFELLOW等[12]提出,框架中通常包括生成器和判別器兩部分。該模型具有很強的學習數(shù)據(jù)表示的能力,其訓練過程是一個零和博弈過程。簡單的噪聲分布,如高斯分布或均勻分布作為生成器的輸入,生成器G將其映射到與輸入的真實樣本相同的數(shù)據(jù)空間,通過訓練,盡可能生成與真實樣本相似的樣本。同時,判別器D被用來判別生成的樣本和真實的樣本,并訓練判別器不被生成的樣本所欺騙。當訓練過程達到納什均衡時,生成樣本的分布將與真實樣本的分布一樣接近,GAN的目標函數(shù)如式(2)所示:
Ex~Pg[log(1-D(x)]。
(2)
式中:Pr是真實數(shù)據(jù)的分布,Pg是由兩個隱式x=G(z)和z~p(z)定義的生成數(shù)據(jù)的分布,其中z是從簡單的噪聲分布中采樣得到的。D的目標是最大化識別出輸入樣本來自真實樣本的概率,G的目標是使生成樣本的分布無限接近真實樣本的分布。
在生成器和判別器中加入指導樣本生成的輔助信息y就得到了GAN的變體CGAN,輔助信息y可以是類別標簽,也可以是任何其他類型的信息。輔助信息的加入能夠提高生成樣本的質(zhì)量[19]。CGAN的訓練過程與GAN相同,目標函數(shù)如式(3)所示:
Ex~Pg[log(1-D(x|y))]。
(3)
式中Pr和Pg的意義與在GAN中的相同。
在式(2)和式(3)中,兩項均值之和即為JS(Jensen-Shannon)散度。在每一次訓練過程中通過最大化JS散度使判別器達到最優(yōu),然后固定判別器,最小化JS散度使生成器生成的數(shù)據(jù)盡可能真實。經(jīng)過大量訓練以后,使得判別器無法判別樣本是真實樣本還是生成樣本。但是,實際訓練過程是很不穩(wěn)定的,很容易出現(xiàn)梯度消失、模式崩潰等問題,導致生成樣本單一甚至訓練無法繼續(xù),這是由于JS散度是離散的,即使兩個分布不重疊或者當重疊部分可以忽略不計時,JS散度都恒為常數(shù)。
為解決JS散度不連續(xù)導致梯度消失的問題,提出了WGAN。WGAN使用EM(earth-mover)距離,也被稱為Wasserstein-1距離作為衡量真實樣本分布和生成樣本分布之間距離的度量,且Wasserstein距離是連續(xù)的,這使得WGAN的訓練過程更加穩(wěn)定。WGAN的目標函數(shù)如式(4)所示:
Ex~Pg[D(x)]。
(4)
然而,在式(4)中,Δ表示1-Lipschitz函數(shù)集。因此,要實現(xiàn)WGAN,判別器D應該屬于1-Lipschitz函數(shù)。這一限制可以通過乘以比例因子放寬,通過將判別器中每一層的權(quán)重裁剪到[-c,c]就可以使式(4)中判別器屬于K-Lipschitz函數(shù),也會使WGAN的訓練過程更穩(wěn)定。但是在某些情況下,WGAN會出現(xiàn)訓練過程不收斂,生成樣本質(zhì)量差的問題。而這些問題的發(fā)生就是因為為了放寬Lipschitz約束而使用了權(quán)重裁剪。權(quán)重裁剪導致WGAN無法學習復雜樣本的分布。除此之外,權(quán)重裁剪也將各層的權(quán)重限制在一個很小的范圍內(nèi),而這很容易導致梯度消失。
為了解決上述問題,提出了WGAN-GP(WGAN with gradient penalty),該方法進一步改進了WGAN的損失函數(shù),它用梯度懲罰滿足Lipschitz條件。WGAN-GP的目標函數(shù)如式(5)所示:
(5)
(6)
在實際應用中,WGAN-GP具有更快的收斂速度以及更穩(wěn)定的訓練過程,并且可以在幾乎不調(diào)整默認參數(shù)的情況下,獲得高質(zhì)量的生成樣本。
受到GAN的變體CGAN的啟發(fā),同時為了解決GAN在訓練過程中梯度消失、訓練過程不穩(wěn)定以及生成樣本單一以及WGAN-GP一次只能生成一類樣本的問題,提出了CWGAN-GP。同時在WGAN-GP的生成器和判別器中加入條件輔助信息y,在這里y可以是任何類型的輔助信息,CWGAN-GP的目標函數(shù)如下:
(7)
判別器和生成器的目標函數(shù)最小化后,
(8)
(9)
在實際應用中,CWGAN-GP具有收斂速度快、生成樣本質(zhì)量高且一次訓練就可以生成多類樣本的數(shù)據(jù)生成能力,同時也不存在GAN和WGAN在訓練過程中梯度消失,訓練過程不穩(wěn)定的問題,而且?guī)缀醪恍枰薷哪J超參數(shù)就可以生成高質(zhì)量的樣本數(shù)據(jù),解決了GAN訓練困難的問題。
本文的目的是利用CWGAN-GP模型生成高質(zhì)量的樣本對軸承不平衡數(shù)據(jù)集進行擴充與平衡,然后將其用于軸承故障診斷。在實際應用中,不平衡數(shù)據(jù)集會嚴重制約故障診斷模型的性能,而基于CWGAN-GP模型生成的高質(zhì)量樣本能夠豐富原始數(shù)據(jù)集,為模型訓練提供更多有價值的信息,從而有助于實現(xiàn)準確的故障診斷。診斷過程如下:首先,利用小波變換對原始振動信號進行時頻分析,將原始一維振動信號通過提取特征轉(zhuǎn)換為二維時頻圖樣本;其次,利用提出的CWGAN-GP模型進行樣本生成,用于平衡數(shù)據(jù)集;最后,使用平衡后的數(shù)據(jù)集進行故障診斷。診斷方法如圖1所示。故障診斷流程圖如圖2所示,具體步驟如下:
步驟1從試驗臺收集軸承原始振動信號進行信號預處理,并使用小波變換將其轉(zhuǎn)換為時頻圖像。
步驟2將轉(zhuǎn)換后的時頻圖像按一定比例分為訓練集和測試集。
步驟3利用訓練集中的樣本訓練生成對抗網(wǎng)絡模型,對生成的樣本進行相似度驗證,從而生成更多的訓練樣本。
步驟4用生成的樣本和原始訓練集中的樣本組成新的訓練集用于訓練故障診斷模型。
步驟5利用測試集測試訓練好的故障診斷模型。
步驟6輸出故障診斷結(jié)果。
本文采用CWGAN-GP模型用于樣本生成,具體是將一維時域信號經(jīng)過小波變換后得到的時頻圖輸入CWGAN-GP模型。其中生成器采用反卷積結(jié)構(gòu),判別器采用卷積結(jié)構(gòu)。如圖3所示,生成器中有5個反卷積層。一個服從高斯分布的100維噪聲隨機變量被映射和整形為許多卷積表示的特征圖,最后這些特征圖被轉(zhuǎn)換為64×64×3大小的圖像。另外,判別器中有4個卷積層,輸入為64×64×3的圖像,隨后被映射和整形為許多卷積表示的特征圖。最后,一個全連接層作為輸出層。在生成器中,前4層卷積核的大小為5×5,最后一層為3×3。在判別器中,卷積核的大小均為3×3。
實驗數(shù)據(jù)來源于凱斯西儲大學(CRWU)軸承數(shù)據(jù)中心的開放數(shù)據(jù)集,該數(shù)據(jù)集在故障診斷領(lǐng)域得到了廣泛的應用。利用電火花對軸承內(nèi)圈、外圈和滾珠進行損傷,損傷直徑分別為0.007英寸、0.014英寸、0.021英寸和0.028英寸。然后在0 hp~3 hp的不同載荷下采集各種振動信號。該數(shù)據(jù)集包含正常狀況、內(nèi)圈故障、外圈故障和滾珠故障4種工作狀況。數(shù)據(jù)集的振動信號是由加速度計從軸承實驗臺收集的,實驗臺示意圖如圖4所示。在本實驗中,選擇實驗臺驅(qū)動端的深溝球軸承作為研究對象,采樣頻率為12 kHz。
在本實驗中,以工作負載分別在0 hp和1 hp且故障直徑在0.007、0.014、0.021英寸的故障軸承為研究對象。為了驗證本文所提出的方法對不同類型的故障能夠?qū)崿F(xiàn)很好的診斷效果,采用表1數(shù)據(jù)集作為實驗數(shù)據(jù)。在能夠區(qū)分不同類型故障的基礎(chǔ)上,為了進一步驗證本文方法對同一類型不同故障程度的識別效果,又采用了表2數(shù)據(jù)集,其中既包括不同故障類型又包括同一類型不同故障程度的數(shù)據(jù)。本文研究遵循循序漸進的過程。實驗軸承在每種不同的故障狀況下有120 000個數(shù)據(jù)點,以600個數(shù)據(jù)點為一段,為了獲得更多的樣本,相鄰的段之間有300個點重復。經(jīng)過小波時頻分析,在每種工作條件下,可以得到400張時頻圖像。然后隨機的選擇200張用于訓練GAN和分類器,剩下的200張用于測試和評價模型。詳細信息如表1和表2所示。
表1 四類數(shù)據(jù)集信息(0 hp)
表2 十類數(shù)據(jù)集信息(1 hp)
續(xù)表2
圖5給出了在4類數(shù)據(jù)集下真實樣本的時頻圖和利用CWGAN-GP模型生成的時頻圖樣本。很明顯,在圖5中,生成樣本與真實樣本非常相似。雖然在一些地方有很小的差別,但是可以發(fā)現(xiàn)生成樣本中的特征與真實樣本的特征基本具有相同的分布。除此之外,這些細微的差別也可以說明生成對抗網(wǎng)絡學習到了真實數(shù)據(jù)的分布,生成的樣本是從真實分布中采樣得到的,而不是對原始樣本的簡單復制,由此可以增強故障診斷模型的魯棒性,提高分類模型的泛化能力。
本文采用t-分布隨機領(lǐng)域嵌入(t-distributed Stochastic Neighbor Embedding, t-SNE)[20]驗證生成數(shù)據(jù)與真實數(shù)據(jù)的相似性。t-SNE是一種用于降維和數(shù)據(jù)可視化的算法,該方法通常被用作驗證數(shù)據(jù)相似性,它通過仿射變換將數(shù)據(jù)點映射到概率分布上。在映射的過程中,高維空間的點需與低維空間中的點一一對應,但低維空間的點存在一個隨機的過程,因此在本文中會導致真實數(shù)據(jù)的位置不相同。
在本文t-SNE的實驗結(jié)果中,只要各類別生成樣本和真實樣本可以聚合為一類以及各故障類別樣本有清晰的邊界,就可以說明本文所提方法的有效性,樣本的位置并不影響實驗結(jié)果。實驗中所有對照實驗使用的真實樣本均為同一批。圖6和圖7展示了真實樣本和生成樣本在4類和10類數(shù)據(jù)集上的t-SNE圖,為了驗證兩類樣本的相似性,隨機地從各類真實樣本和生成的樣本中分別選擇50個樣本。圖6和圖7分別展示了GAN、CGAN、WGAN、WGAN-GP、CWGAN-GP五種生成模型在4類和10類滾動軸承數(shù)據(jù)集上生成樣本和真實樣本的分布。結(jié)果表明,隨著模型的改進,生成樣本和真實樣本的分布越來越趨于一致。同時,通過將兩個分布之間的衡量標準由JS散度替換為EM距離也進一步使生成樣本和真實樣本的分布更加相似。在4類數(shù)據(jù)集的t-SNE圖中可以發(fā)現(xiàn),雖然前3種生成模型生成的樣本能夠與真實樣本聚合為一類,并且4類故障之間有清晰的邊界,但是這3類模型生成的樣本沒有分布在真實樣本之間,而是自成一類分布在真實樣本周圍,說明這3種模型生成的樣本與真實樣本的相似性不足。雖然最后兩種模型生成的樣本和真實樣本非常相似,但是可以發(fā)現(xiàn)本文中提出的模型生成的樣本與真實樣本有更好的相似性,其分布更接近真實樣本的分布。
同時,在10類數(shù)據(jù)集的t-SNE圖中可以發(fā)現(xiàn),前3種模型生成的樣本與不同類的真實樣本和生成樣本混疊在一起,沒有清晰的分類邊界。最后兩種模型生成的樣本與真實樣本之間雖然存在分類邊界,但是第4種模型的少數(shù)類別之間依舊存在著樣本混疊,而CWGAN-GP模型生成的每一類樣本基本與其他類別樣本沒有混淆。通過分析,本文提出的模型與第4種模型相比,由于加入了故障類別輔助信息,生成的樣本與真實樣本更相似。這說明條件信息對樣本生成具有積極的指導作用。
為了說明本文使用的生成模型生成的樣本數(shù)據(jù)對故障分類有積極的影響,將從10類數(shù)據(jù)集中隨機選擇50個真實樣本得到的數(shù)據(jù)集和將使用該數(shù)據(jù)集訓練不同的生成網(wǎng)絡模型后生成的各類樣本全部添加到該數(shù)據(jù)集中的得到的數(shù)據(jù)集分別進行t-SNE可視化展示,數(shù)據(jù)分布結(jié)果如圖8所示。從圖中可以發(fā)現(xiàn)未添加生成樣本的10類故障的數(shù)據(jù)的分布之間沒有明顯的邊界,存在混疊現(xiàn)象。而添加了全部生成樣本的10類故障數(shù)據(jù)之間存在明顯的邊界,由此可以說明,生成樣本與真實樣本有著很強的相似性,同時,生成的樣本對故障分類有著非常積極的作用。除此之外,與圖7e對比也可以發(fā)現(xiàn),添加的生成樣本越多,各故障類別之間的邊界越明顯。這說明樣本數(shù)量影響類別邊界,從而影響故障分類的準確率。
為了從統(tǒng)計的角度評估真實樣本和生成樣本的相似性,本文引入歐幾里得距離和余弦相似性兩個指標,這兩個指標展示了生成模型樣本生成的平均性能。
歐幾里得距離,也稱歐氏距離,它衡量的是空間中各點的絕對距離,跟各個點所在的位置坐標直接相關(guān)。它主要被用于評價在歐幾里得空間中兩個向量在位置上的差異性,其值越小,表明相似度越大。兩個空間向量的歐幾里得距離計算公式如下:
(10)
余弦相似性,也稱余弦距離,是用向量空間中兩個向量的余弦值作為衡量兩個個體差異大小的指標。相比歐幾里得距離,余弦距離更加關(guān)注兩個向量在方向上的差異,其值越小,表明兩個個體越相似。兩個向量的余弦距離計算公式如下:
(11)
圖9展示了4類和10類數(shù)據(jù)集上所有類別統(tǒng)計指標的箱線圖。箱線圖的中位數(shù)表示了樣本數(shù)據(jù)的平均水平,箱線圖的高度表示數(shù)據(jù)的波動程度,箱線圖上方和下方的線表示指標的最大值和最小值。從圖中可以發(fā)現(xiàn),在4類數(shù)據(jù)集上GAN、CGAN以及WGAN生成的樣本與真實樣本之間的距離較大,樣本相似性不足,且各類別生成樣本的質(zhì)量差異較大。而WGAN-GP雖然從圖中表明其與CWGAN-GP模型的平均性能基本一致,但是兩類指標箱線圖的高度高于CWGAN-GP模型,這說明WGAN-GP模型生成的各類樣本質(zhì)量差異較大。在10類數(shù)據(jù)集上,GAN生成的樣本相似性不足,且生成樣本的質(zhì)量波動較大。CGAN和WGAN模型生成樣本的質(zhì)量以及各類別樣本質(zhì)量差異較大。WGAN-GP和CWGAN-GP模型生成樣本的質(zhì)量以及各類別樣本質(zhì)量的差異性遠遠優(yōu)于其他3種生成模型,且CWGAN-GP生成的樣本質(zhì)量明顯優(yōu)于WGAN-GP。綜上所述,CWGAN-GP模型有更好的魯棒性與多類別數(shù)據(jù)生成能力,其性能優(yōu)于其他模型。
在實際的場景下,本文收集到的軸承各類故障數(shù)據(jù)是極不平衡的,即軸承處在正常狀態(tài)的樣本遠遠多于處在故障狀態(tài)下的樣本。這種情況下,傳統(tǒng)的各種故障診斷方法的性能將會被限制。為了進一步驗證本文所使用的生成對抗模型在數(shù)據(jù)增強方面的有效性,本文將4類和10類原始數(shù)據(jù)集中的各類別故障樣本的數(shù)量縮減到原始規(guī)模的10%,得到不平衡數(shù)據(jù)集Origin,并使用各生成模型生成的數(shù)據(jù)平衡該數(shù)據(jù)集,基于上述兩個數(shù)據(jù)集,使用其分別訓練支持向量機(Support Vector Machine, SVM)、隨機森林(Random Forest, RF)、多層感知器(Multilayer Perceptron, MLP)、卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks, CNN)、一維卷積神經(jīng)網(wǎng)絡(One Dimensional Convolutional Neural Network, CNN-1D),并使用測試數(shù)據(jù)測試兩個數(shù)據(jù)集在5種分類器下的準確率,測試結(jié)果如圖10所示。
由圖10可知,無論使用何種樣本生成模型擴充數(shù)據(jù)集,在4類和10類數(shù)據(jù)集上的故障分類準確率都明顯地提高了。尤其是明顯地提高了10類數(shù)據(jù)集上的故障分類準確率,這說明本文使用的數(shù)據(jù)擴充方法非常有效。數(shù)據(jù)擴充后,使用CNN和CNN-1D在4類數(shù)據(jù)集上進行故障分類,準確率達到了98%以上,在10類數(shù)據(jù)集上的準確率也達到了97%以上。其中,基于SVM和MLP的分類模型最為明顯。此外,基于CWGAN-GP的樣本擴充方法在所有的故障分類器上都具有最高的分類準確率。這說明基于CWGAN-GP的生成模型生成的樣本能夠用于替代真實樣本平衡數(shù)據(jù)集。同時可以發(fā)現(xiàn),基于CNN的分類方法在平衡后的數(shù)據(jù)集上都獲得了最高的分類準確性,這也說明將一維數(shù)據(jù)轉(zhuǎn)變?yōu)槎S數(shù)據(jù)進行樣本生成是非常合適的。
總之,基于CWGAN-GP的數(shù)據(jù)擴充方法為數(shù)據(jù)集不平衡的軸承故障診斷提供了一種非常有效的方法,并且它在分類模型上有著較高的故障分類準確率和較好的魯棒性。
為了進一步驗證本文所提方法的有效性,在10類數(shù)據(jù)集的訓練集上設定了正常樣本與故障樣本的多種不平衡率,然后基于上述5種分類模型在測試集上進行了測試,結(jié)果如表3所示。
表3 不平衡率差異下10類數(shù)據(jù)集上的故障分類準確率
由表3可知,即使正常樣本和故障樣本的不平衡率達到100∶1,在利用本文所提方法生成的樣本平衡數(shù)據(jù)集之后,軸承故障分類的準確率在兩種卷積神經(jīng)網(wǎng)絡的方法下也保持在很小的范圍內(nèi)變化。這進一步說明生成對抗網(wǎng)絡已經(jīng)學習到了真實樣本的分布,利用本文所使用的方法是解決不平衡數(shù)據(jù)集故障診斷問題的有效方法。此外可以發(fā)現(xiàn),通過將訓練集樣本的數(shù)量擴大,無論哪種分類器,故障分類準確率都有所提高,尤其是基于SVM的方法最為明顯。這說明樣本數(shù)量也是制約分類器準確率的一個重要因素。總之,生成的樣本已經(jīng)可以與真實樣本相媲美。
最后,由于本文使用的數(shù)據(jù)集是由圖片樣本組成的,并且CNN在各種數(shù)據(jù)集平衡模型上都得到了非常高的準確率,而且CNN在圖像特征提取方面有很大的優(yōu)勢,為了評估模型在各個故障類別上的表現(xiàn),本文選用CNN作為故障分類器,使用圖8b所使用的數(shù)據(jù)集,訓練100個Epoch之后繪制出了在10類數(shù)據(jù)集上的混淆矩陣,如圖11所示,Ball1故障中很小的一部分被錯誤地分類到了Ball3故障,Ball2故障的很小一部分也被錯誤地分類到了Ball3故障,Ball3故障的很小一部分被錯誤分類到了Ball2故障,而且在圖中可以發(fā)現(xiàn)所有故障類型的診斷結(jié)果均在99%以上,這說明本文所使用的數(shù)據(jù)擴充方法能夠很好地生成各種類型的故障樣本,對于解決不平衡數(shù)據(jù)集的故障診斷,本文提出的故障診斷方法是比較理想的選擇。
為了進一步說明本文所提出的滾動軸承不平衡數(shù)據(jù)集故障診斷方法的及時性,分別統(tǒng)計了生成樣本耗時、在圖8b所使用的數(shù)據(jù)集下不同故障診斷模型的訓練耗時以及每個樣本的故障診斷耗時。實驗電腦系統(tǒng)為Windows10;CPU為Intel Corei7-9700F,3.00 GHz;RAM為16 GB;顯卡為GTX1660。編程軟件為Python 3.6版本,深度學習框架為Keras。4類和10類數(shù)據(jù)集上的故障診斷耗時如表4和表5所示。
表4 4類數(shù)據(jù)集上不同診斷方法的耗時 s
表5 10類數(shù)據(jù)集上不同診斷方法的耗時 s
由表4和表5可以發(fā)現(xiàn),所有方法中主要耗時為生成樣本耗時,由于5種方法都采用了相同的樣本生成方法,具有相同的生成樣本耗時;在診斷模型訓練耗時方面,本文所提方法CWGAN-GP+CNN耗時最長,這是由于為提高分類準確率采用了深層學習機制,模型參數(shù)多,導致訓練時間長,在一些對訓練時間要求較高的場合可以提前進行離線訓練;從故障診斷耗時來看,本文方法耗時最長,但是也僅僅在微秒級,在實際應用中影響很小。結(jié)合診斷精度和診斷模型的魯棒性來看,本文方法在耗時影響不大的情況下可以取得很好的故障診斷效果。
本文提出一種新的基于CWGAN-GP的不平衡數(shù)據(jù)集故障診斷方法。通過將一維原始振動信號換為時頻圖像,充分地利用了信號在時頻域的信息。并且該方法結(jié)合了CGAN模型利用條件信息將無監(jiān)督學習轉(zhuǎn)變?yōu)楸O(jiān)督學習生成多類別數(shù)據(jù)以及WGAN-GP模型在樣本生成過程中避免模式崩潰、梯度消失、收斂慢和訓練過程不穩(wěn)定的優(yōu)點。利用生成的高質(zhì)量樣本進行數(shù)據(jù)集擴充與平衡,能夠解決分類模型在訓練過程中因數(shù)據(jù)集不平衡導致的故障分類準確率低的問題。在CRWU數(shù)據(jù)集上的實驗結(jié)果表明:
(1)本文所使用的方法能夠在幾乎不調(diào)節(jié)超參數(shù)的情況下生成質(zhì)量更高的樣本,并且有助于提高故障診斷的準確率。利用小波變換得到的時頻圖作為CWGAN-GP模型的輸入能夠取得不錯的效果。
(2)t-SNE可視化方法以及分類模型的結(jié)果表明,數(shù)據(jù)量的大小會影響分類模型的準確率,數(shù)據(jù)量越大,分類模型越能夠取得不錯的分類結(jié)果。同時,在生成模型中添加類別輔助信息有助于提高生成樣本的質(zhì)量。
(3)10類數(shù)據(jù)集上的混淆矩陣表明,本文所使用的方法生成的樣本用以平衡數(shù)據(jù)集可以在各故障類型的診斷中取得非常不錯的效果,從而表明該方法具有較好的魯棒性。
雖然本文所提方法在數(shù)據(jù)集不平衡的滾動軸承故障診斷問題上取得了不錯的效果,但是由于本文所提出的樣本生成方法在模型訓練時耗時長,故難以實現(xiàn)對新的故障的快速診斷,在未來還需進一步研究如何縮短模型的訓練時間,綜合利用新的信息實現(xiàn)準確故障診斷的方法。