佟 博,劉 韜,劉 暢
(昆明理工大學(xué) 機(jī)電工程學(xué)院,云南 昆明 659500)
在故障診斷領(lǐng)域中,對(duì)機(jī)械系統(tǒng)運(yùn)行狀況的監(jiān)控具有合理安排生產(chǎn)計(jì)劃、提升生產(chǎn)效率等很多重要意義。據(jù)統(tǒng)計(jì),軸承故障在旋轉(zhuǎn)機(jī)械故障的故障類(lèi)別中超過(guò)了30%。因此,對(duì)軸承進(jìn)行故障診斷的相關(guān)算法研究以提高機(jī)械系統(tǒng)故障診斷準(zhǔn)確率和診斷效率非常重要[1-4]。但是在實(shí)際應(yīng)用的過(guò)程中,因?yàn)椴煌ぷ鳝h(huán)境之間的差異等原因,一臺(tái)設(shè)備上的數(shù)據(jù)無(wú)法簡(jiǎn)單遷移到另一臺(tái)上使用。因此,在實(shí)際生產(chǎn)中,往往會(huì)面臨只有正常工作的數(shù)據(jù),而缺乏失效階段數(shù)據(jù)的情況[5]。針對(duì)這種情況,國(guó)內(nèi)外學(xué)者做了大量研究,例如假設(shè)符合軸承壽命符合威布爾分布[6-7],劉海濤等[8]得到了可靠性參數(shù)的 Bayes 估計(jì)等等。但是上述方法都是基于統(tǒng)計(jì)模型,不得不面對(duì)小樣本、準(zhǔn)確的是小分部難以估計(jì)等問(wèn)題。
考慮到以上因素,本文將生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)模型引入故障診斷領(lǐng)域。Goodfellow等[9-10]最早提出生成對(duì)抗網(wǎng)絡(luò)框架,該模型有著強(qiáng)大的建模能力,可以捕捉到高維、難以追蹤的數(shù)據(jù)分布并進(jìn)一步運(yùn)用到圖像分割[11]、視頻預(yù)測(cè)[12]、風(fēng)格遷移等領(lǐng)域[13]。Martin A等[14-15]在原始框架上通過(guò)改進(jìn)損失函數(shù)、優(yōu)化算法等,解決了GAN訓(xùn)練不穩(wěn)定、梯度消失等問(wèn)題。綜上所述,本文結(jié)合傳統(tǒng)的振動(dòng)分析技術(shù),為故障診斷領(lǐng)域一直存在的數(shù)據(jù)缺失問(wèn)題提供了一種新的解決思路。
生成對(duì)抗網(wǎng)絡(luò)由一個(gè)生成器網(wǎng)絡(luò)G與一個(gè)判別器網(wǎng)絡(luò)D構(gòu)成。生成器與判別器的網(wǎng)絡(luò)結(jié)構(gòu)皆為多層感知器。生成對(duì)抗網(wǎng)絡(luò)的目的是學(xué)習(xí)到真實(shí)數(shù)據(jù)的分布Pdata,為了學(xué)習(xí)該分布,給定真實(shí)數(shù)據(jù)樣本集Xs{x1,…,xn}。設(shè)生成器的輸入數(shù)據(jù)為基底信號(hào),從其已知分布Pz(例如高斯分布)中進(jìn)行隨機(jī)采樣得到數(shù)據(jù)集Z{z1,…,zm},接下來(lái)將其映射到數(shù)據(jù)空間G(z,θg),這里的G是一個(gè)以θg作為參數(shù)的多層感知網(wǎng)絡(luò)構(gòu)成的生成模型。此外,定義一個(gè)判別模型D(x,θd)用來(lái)判斷輸入的數(shù)據(jù)是來(lái)自生成模型還是真實(shí)數(shù)據(jù),D的輸出為x是訓(xùn)練數(shù)據(jù)的概率。網(wǎng)絡(luò)優(yōu)化過(guò)程可以簡(jiǎn)單描述為一個(gè)“二元極大極小”問(wèn)題。根據(jù)原始論文,生成模型G與判別模型之間的對(duì)抗關(guān)系可以如下表達(dá)
Ez~Pz (z){log[1-D(G(Z))]}
(1)
其中,Pdata表示目標(biāo)數(shù)據(jù)的數(shù)據(jù)分布;PZ是基底信號(hào)的數(shù)據(jù)分布;G(Z)表示生成模型生成數(shù)據(jù)。即表示判別器的訓(xùn)練集取自真實(shí)數(shù)據(jù)的分布和生成數(shù)據(jù)的分布。其判別器的損失函數(shù)表示為[16]
JD=-Ex~Pdata (x)[logD(x) ]-Ez~Pz(z){log[1-D(G(Z))]}
(2)
理想情況下,判別器可以完全分辨出訓(xùn)練樣本數(shù)據(jù)與生成數(shù)據(jù),即判別器D的輸出為0或1,真實(shí)數(shù)據(jù)為1,生成數(shù)據(jù)為0。
生成器的損失函數(shù)即為判別器的相反
JG=-JD
(3)
實(shí)際應(yīng)用時(shí),生成器的損失函數(shù)經(jīng)常采用為
JG=-Ez~pz(z){logD[G(Z)]}
(4)
值得說(shuō)明的是,D和G的需要交替優(yōu)化,在訓(xùn)練數(shù)據(jù)有限時(shí),先進(jìn)性判別器D的優(yōu)化會(huì)導(dǎo)致過(guò)擬合的現(xiàn)象產(chǎn)生,從而使模型無(wú)法收斂。
在實(shí)際工程應(yīng)用中進(jìn)行軸承時(shí),會(huì)面臨以下問(wèn)題:
(1)當(dāng)采用實(shí)驗(yàn)室人造故障并模擬真實(shí)工況采集數(shù)據(jù)時(shí),真實(shí)故障與實(shí)驗(yàn)室人造故障存在客觀(guān)差異。同時(shí),某些故障也無(wú)法通過(guò)實(shí)驗(yàn)室制造;
(2)當(dāng)采用機(jī)理分析的方法使用相關(guān)函數(shù)人為生成軸承振動(dòng)的仿真信號(hào)時(shí),仿真信號(hào)也與真實(shí)故障信號(hào)存在差異。在進(jìn)行故障診斷或性能評(píng)估時(shí),仿真信號(hào)與真實(shí)信號(hào)相比往往缺少最關(guān)鍵軸承失效階段的樣本數(shù)據(jù)。這是由多種原因引起的,包括信噪比的選擇、部分參數(shù)的調(diào)校等。目前對(duì)于最接近真實(shí)信號(hào)的噪音信噪比問(wèn)題無(wú)明確的理論基礎(chǔ),在實(shí)際生產(chǎn)中通常依靠人為經(jīng)驗(yàn)。以此為基礎(chǔ)的數(shù)據(jù),無(wú)論是用以訓(xùn)練診斷的判別模型還是性能評(píng)估模型,都不能提供有力的數(shù)據(jù)支撐。
本文引入生成對(duì)抗網(wǎng)絡(luò)后,生成器產(chǎn)生的生成信號(hào)結(jié)合仿真信號(hào)和基底信號(hào)的特性,即同時(shí)具有故障信號(hào)的特征頻率、沖擊和輸入的正常信號(hào)等特征,在對(duì)比兩種方式產(chǎn)生的人造信號(hào)時(shí)會(huì)更像真實(shí)信號(hào)。
為解決上文提到的問(wèn)題,在基于軸承振動(dòng)信號(hào)的故障診斷領(lǐng)域引入GANs,為故障診斷模型提供所需的數(shù)據(jù)支撐。
以辛辛那提大學(xué)的軸承全壽命振動(dòng)數(shù)據(jù)為例,將軸承全壽命數(shù)據(jù)的早期正常工況下的數(shù)據(jù)作為生成器G的輸入數(shù)據(jù),訓(xùn)練樣本數(shù)據(jù)則采用人造仿真信號(hào)。其目的在于,以早期的正常工況信號(hào)為基底,向軸承仿真故障信號(hào)進(jìn)行映射,在訓(xùn)練生成器G的過(guò)程中,一方面將原始工況下的機(jī)械特性保留在生成信號(hào)中,另一方面則在映射過(guò)程中加入該軸承故障時(shí)的故障特性,從而將仿真信號(hào)與真實(shí)的機(jī)械特性相結(jié)合,最終得到比仿真信號(hào)更加真實(shí)的故障信號(hào)。
為避免名詞混亂及結(jié)合故障診斷領(lǐng)域的稱(chēng)呼習(xí)慣,在接下來(lái)的相關(guān)工作闡述中,將輸入生成器的數(shù)據(jù)Z稱(chēng)為基底信號(hào);生成器生成的數(shù)據(jù)稱(chēng)為生成信號(hào);作為“真”信號(hào)與生成信號(hào)一起作為判別器訓(xùn)練集的是使用函數(shù)生成的人造仿真信號(hào),稱(chēng)為仿真信號(hào);真實(shí)信號(hào)表示辛辛那提大學(xué)的軸承全壽命實(shí)驗(yàn)信號(hào)。
2.3.1 網(wǎng)絡(luò)結(jié)構(gòu)
整體生成對(duì)抗網(wǎng)絡(luò),由兩部分組成,一部分是生成器模型,一部分是判別器模型。生成器模型包括一個(gè)輸入層、一個(gè)隱層和一個(gè)輸出層。生成器模型同樣包括一個(gè)輸入層、一個(gè)隱層和一個(gè)輸出層,二者通過(guò)生成器的最后一層和分類(lèi)器的第一層連接在一起,共同組成生成對(duì)抗網(wǎng)絡(luò),如圖1所示。
生成模型的輸入層輸入基底信號(hào),在早期的GANs模型中,輸入信號(hào)取白噪聲,同隱層及輸出層全連接。
2.3.2 模型輸入輸出
結(jié)合實(shí)驗(yàn)要求,本文的實(shí)驗(yàn)數(shù)據(jù)有辛辛那提全壽命實(shí)驗(yàn)數(shù)據(jù)及以仿真信號(hào)。其中,基底信號(hào)為軸承全壽命數(shù)據(jù)正常階段的數(shù)據(jù),即數(shù)據(jù)集Z;仿真信號(hào)作為分類(lèi)器的判定對(duì)比信號(hào),即Xs,二者均是單個(gè)樣本為1×870的向量。而Xfake作為生成器的輸出結(jié)果也是一個(gè)1×870的向量。
本文研究所需得到的是訓(xùn)練完畢的生成器生成的數(shù)據(jù)Xfake??紤]到模型訓(xùn)練時(shí)間成本和最終結(jié)果等因素,通過(guò)實(shí)驗(yàn)選取輸入生成器的Z和輸入分類(lèi)器的Xs的數(shù)據(jù)點(diǎn)長(zhǎng)度截取為870個(gè)數(shù)據(jù)點(diǎn)的時(shí)域振動(dòng)數(shù)據(jù)。
2.3.3 模型超參數(shù)確定
GANs模型中的超參數(shù)主要包括模型結(jié)構(gòu)參數(shù)迭代次數(shù)等,這些參數(shù)的取值會(huì)直接影響最終的信號(hào)生成結(jié)果。
(1)結(jié)構(gòu)參數(shù):生成器和分類(lèi)器均采用3層結(jié)構(gòu)。在原始的GANs中,是從噪聲中映射出圖像信號(hào);但是在故障診斷中,則是從一段真實(shí)的正常工況中映射出在該相同工況下的故障狀態(tài)信號(hào)。因此,從直觀(guān)機(jī)理和實(shí)驗(yàn)結(jié)果兩方面來(lái)考慮,生成器采用3層網(wǎng)絡(luò)的結(jié)果。同時(shí),3層神經(jīng)元數(shù)不采用逐層增加的方式,即每層神經(jīng)元數(shù)目相同,每層神經(jīng)元數(shù)目均為870個(gè)。分類(lèi)器同樣采用3層結(jié)構(gòu),第一層和分類(lèi)器的最后一層重合;第二、三層等差降低神經(jīng)元數(shù)目,也就是第二層采用第一層的半數(shù),即435個(gè)神經(jīng)元,最后一層為1個(gè)神經(jīng)元;
(2)傳遞函數(shù)均采用Sigmoid函數(shù),同時(shí)為匹配該傳遞函數(shù),學(xué)習(xí)率采用較小的0.01;
(3)訓(xùn)練過(guò)程中,每次導(dǎo)入訓(xùn)練樣本個(gè)數(shù)為5,同時(shí)由于本文中生成數(shù)據(jù)的針對(duì)性,其樣本不會(huì)太多,因此不采用梯度共享,即每個(gè)樣本獨(dú)立使用梯度;
(4)訓(xùn)練過(guò)程中,每回合隨機(jī)采樣樣本迭代步數(shù)設(shè)為30步。由于訓(xùn)練回合數(shù)會(huì)直接會(huì)影響最終的生成效果。因此,經(jīng)過(guò)實(shí)驗(yàn)后發(fā)現(xiàn)在上述參數(shù)及實(shí)驗(yàn)數(shù)據(jù)下,回合數(shù)在約3 500次能取得較好生成結(jié)果。
在設(shè)定訓(xùn)練終止條件時(shí),從小到大逐步擴(kuò)大訓(xùn)練回合數(shù),直到概率分布和真實(shí)數(shù)據(jù)相接近為止。訓(xùn)練過(guò)程如圖2所示,圖2(a)~圖2(e)分別為節(jié)選100、1 000、2 000、3 500、5 000回合時(shí)的概率分布對(duì)比結(jié)果。
式(2)和式(4)定義的損失函數(shù)為GANs的目標(biāo)函數(shù),但是它引起了GANs在訓(xùn)練時(shí)不穩(wěn)定及訓(xùn)練不收斂的問(wèn)題,比較顯著的缺陷為以下兩點(diǎn):(1)誤差函數(shù)本質(zhì)上是對(duì)比JS散度,當(dāng)對(duì)比的兩個(gè)分布存在不可忽略的重疊時(shí),會(huì)最終導(dǎo)致梯度消失等問(wèn)題出現(xiàn);(2)訓(xùn)練的周期越長(zhǎng),生成的結(jié)果越逼真,但是無(wú)法從計(jì)算式中得出訓(xùn)練應(yīng)該什么時(shí)候停止。
在故障診斷領(lǐng)域中,對(duì)于缺陷(1),振動(dòng)信號(hào)的概率分布同為高斯分布,在歸一化后,重疊度很高。對(duì)于缺陷(2),在實(shí)際應(yīng)用當(dāng)中,并不需要將輸入生成器的基底數(shù)據(jù)通過(guò)生成器完全映射成訓(xùn)練樣本數(shù)據(jù),僅需要保留一部分原始的機(jī)械系統(tǒng)的特性,所以在此并不能通過(guò)誤差等條件判定終止訓(xùn)練。
本文的實(shí)驗(yàn)數(shù)據(jù)來(lái)源包含辛辛那提大學(xué)的全壽命實(shí)驗(yàn)信號(hào)和人造仿真信號(hào)。
如圖3所示,辛辛那提大學(xué)的軸承全壽命實(shí)驗(yàn)工作臺(tái)是將4個(gè)軸承安裝在軸上。通過(guò)皮帶的傳動(dòng),帶動(dòng)連接到軸的AC電動(dòng)機(jī)上的主軸轉(zhuǎn)動(dòng),并將軸的轉(zhuǎn)速保持恒定在2 000 rpm。通過(guò)彈簧機(jī)制在軸和軸承上施加6 000 lb的徑向載荷。同時(shí),所有軸承都經(jīng)過(guò)強(qiáng)制潤(rùn)滑。
本文的實(shí)驗(yàn)軸承型號(hào)為Rexnord ZA-2115雙列軸承,該種軸承安裝在軸上。如圖3所示,PCB 353B33高靈敏度石英ICP加速度計(jì)安裝在軸承箱上。每個(gè)軸承配備兩個(gè)加速度傳感器,分別安裝于水平方向(x方向)與豎直方向(y方向)。通過(guò)傳感器采集到的信號(hào)組成數(shù)據(jù)集1、數(shù)據(jù)集2和數(shù)據(jù)集3。值得說(shuō)明的是,所有故障都發(fā)生在超過(guò)軸承1億轉(zhuǎn)的設(shè)計(jì)使用壽命之后,即所有故障都是在超過(guò)設(shè)計(jì)壽命后發(fā)生的。所采集數(shù)據(jù)的運(yùn)行時(shí)間是從2004年3月4日9點(diǎn)27分46秒運(yùn)行至2004年4月4日19點(diǎn)01分57秒,最終因?yàn)?號(hào)軸承外圈故障而終止實(shí)驗(yàn)。軸承全壽命實(shí)驗(yàn)臺(tái)架如圖所示。
根據(jù)下式生成所需故障及正常工況下軸承振動(dòng)信號(hào)[17]
(5)
其中
Ai=A0cos(2πQt+φA)+CA
(6)
s(t)=e-Btsin(2πfnt+φW)
(7)
合成信號(hào)相關(guān)參數(shù)如表1所示。
表1合成信號(hào)參數(shù)Table 1.Parameters of simulated signal
其中,上述合成信號(hào)的相關(guān)參數(shù)參照真實(shí)信號(hào)失效階段仿真而成,一個(gè)周期產(chǎn)生的數(shù)據(jù)點(diǎn)長(zhǎng)度為87個(gè)數(shù)據(jù)點(diǎn)。
本文從概率分布、包絡(luò)譜、峭度及裕度做全壽命曲線(xiàn)擬合,通過(guò)評(píng)估上述4個(gè)方面指標(biāo)來(lái)比較仿真信號(hào)與生成信號(hào)與真實(shí)信號(hào)的接近程度。
需要指出的是,因?yàn)樵跊](méi)有真正得到失效信號(hào)時(shí)無(wú)法預(yù)知信號(hào)的幅值,因此后續(xù)的包絡(luò)譜、概率分布及特征的對(duì)比都是在歸一化的條件下進(jìn)行。
在進(jìn)行歸一化后,圖4(a)表示真實(shí)故障信號(hào)和仿真信號(hào)的概率分布對(duì)比,圖4(b)表示真實(shí)故障信號(hào)和生成器G生成信號(hào)的概率分布對(duì)比。
需要指出的是,在采集真實(shí)的故障信號(hào)時(shí),由于受到車(chē)間環(huán)境、機(jī)械系統(tǒng)干擾等因素干擾,故存在一定的信噪比。而在仿真信號(hào)時(shí),如果直接為其添加噪聲,一方面缺少提示信噪比增加量的參考依據(jù);另一方面,增加的噪聲會(huì)使包括峭度在內(nèi)的很多特征發(fā)生改變,在后續(xù)的性能評(píng)估或模式識(shí)別模型中都會(huì)有不容忽視的消極影響。因此,通過(guò)降低信噪比的方式來(lái)使仿真信號(hào)的概率分布更接近真實(shí)信號(hào)的做法并不可取。
上述對(duì)比說(shuō)明了生成信號(hào)的概率分布與真實(shí)信號(hào)從概率分布的角度來(lái)看很“像”,需再結(jié)合包絡(luò)譜進(jìn)一步分析3種信號(hào)包絡(luò)譜如圖5所示。其中,圖5(a)所示為仿真信號(hào)的包絡(luò)譜,在圖中可以清晰的發(fā)現(xiàn)設(shè)定的外圈故障理論特征頻率為229.9 Hz。同時(shí),由于是仿真信號(hào),整體包絡(luò)譜頻率清晰,無(wú)可見(jiàn)噪聲和頻率模糊的情況出現(xiàn)。圖5(b)所示為真實(shí)軸承全壽命故障信號(hào)的包絡(luò)譜,其外圈故障時(shí)的故障頻率在230 Hz左右。由于是真實(shí)工況下采集的軸承振動(dòng)數(shù)據(jù),因此除了噪聲外,還在3 918 Hz、8 957 Hz處存在幅值。進(jìn)一步結(jié)合圖5(c)所示的生成信號(hào)的包絡(luò)譜,對(duì)比可知,除了在包絡(luò)譜中可以清晰地看到外圈故障的特征頻率229.9 Hz外,還可以看到生成信號(hào)在4 138 Hz也類(lèi)似于真實(shí)信號(hào)在3 918 Hz處出現(xiàn)了一個(gè)異常幅值,整體形狀相較之仿真信號(hào)與真實(shí)信號(hào)更加相似,其信噪比也更接近真實(shí)信號(hào)。
為進(jìn)一步對(duì)比生成信號(hào)與真實(shí)信號(hào)的相似程度,本研究對(duì)3種信號(hào)進(jìn)行特征提取。同時(shí),為了更好對(duì)比擬合效果,數(shù)據(jù)前部分的正常及早期故障均采用相同數(shù)據(jù),即軸承真實(shí)實(shí)驗(yàn)數(shù)據(jù)。將生成的失效信號(hào)、仿真的失效信號(hào)和真實(shí)的失效信號(hào)在最后位置重復(fù)放置,進(jìn)而擬合曲線(xiàn)來(lái)對(duì)比三者差異。
圖6、圖7截取部分正常工況的數(shù)據(jù)、早期故障及失效階段的數(shù)據(jù),并在此基礎(chǔ)上提取了數(shù)據(jù)的峭度和裕度特征進(jìn)行全壽命的曲線(xiàn)擬合。由圖6可以看出,利用峭度擬合時(shí),在最后的失效階段,真實(shí)數(shù)據(jù)的峭度達(dá)到22.03左右,仿真信號(hào)為11.37,誤差為48.39%,生成信號(hào)為12.08,誤差為45.17%,即生成的失效信號(hào)較之仿真信號(hào)對(duì)于真實(shí)信號(hào)來(lái)說(shuō),相似程度提升了3%。由圖7可以看出,利用裕度擬合時(shí),在最后的失效階段,真實(shí)數(shù)據(jù)的裕度達(dá)到約18.49,仿真信號(hào)為16.43,誤差為11.14%,生成信號(hào)為7.197,誤差為61.08%,即生成的失效信號(hào)較之仿真信號(hào)對(duì)于真實(shí)信號(hào)來(lái)說(shuō)相似程度提升了接近50%。
同時(shí),結(jié)合上述兩圖中擬合曲線(xiàn)可以發(fā)現(xiàn),生成信號(hào)比仿真信號(hào)明顯更接近真實(shí)信號(hào)。由圖4~圖7綜合對(duì)比可以看出,利用生成對(duì)抗網(wǎng)絡(luò)生成的信號(hào)對(duì)比仿真信號(hào)時(shí),在譜分析、概率分布、特征提取及擬合曲線(xiàn)方面都與真實(shí)信號(hào)更加相似,尤其是采用裕度特征時(shí),數(shù)值及擬合曲線(xiàn)效果更加顯著。
深度學(xué)習(xí)模型在故障診斷領(lǐng)域中具有非常大的發(fā)展?jié)摿Α5腔谀P偷墓收显\斷系統(tǒng)所面臨的一大重要障礙就是,在實(shí)際生產(chǎn)中缺少真實(shí)且可用于訓(xùn)練或調(diào)整模型的失效信號(hào)。本文利用GAN生成故障信號(hào)并證明其較之仿真信號(hào)更接近真實(shí)信號(hào),可在一定程度上為解決故障診斷領(lǐng)域數(shù)據(jù)缺失的問(wèn)題提供新的啟示。本文的研究仍存在進(jìn)一步研究空間,例如將時(shí)域信號(hào)換成振動(dòng)的頻譜信號(hào);當(dāng)訓(xùn)練好模型時(shí),改變基底信號(hào)以進(jìn)行全壽命曲線(xiàn)的預(yù)測(cè)等。