呂 哲,馬 波,2,于功也,陳一偉
(1.北京化工大學 機電工程學院,北京 100029;2.北京化工大學 高端機械裝備健康監(jiān)控與自愈化北京市重點實驗室,北京 100029;3.生態(tài)環(huán)境部核與輻射安全中心,北京 100082)
隨著《中國制造2025》戰(zhàn)略目標的提出,以智能制造為核心的工業(yè)技術發(fā)展受到了專家學者的廣泛關注[1]。
目前 ,旋轉機械廣泛應用于電力、石化、冶金等領域,對其運行狀態(tài)進行監(jiān)測與診斷意義重大[2]。神經網絡[3]、支持向量機[4]、聚類分析[5]等機器學習算法的發(fā)展極大地豐富了旋轉機械故障診斷方法。
在具備豐富的各類健康狀態(tài)樣本時,基于數據驅動的故障診斷方法可以取得較好的診斷效果。但是在實際的工程應用中,卻常常會因為缺乏足夠的待測設備故障樣本,而導致該方法的診斷精度不高。
領域自適應(domain adaptation,DA)是一種將源域學習到的知識應用于目標域的遷移學習方法[6]。該方法被眾多學者認為是解決缺乏目標域故障樣本的有效途徑。
在故障診斷領域,待測設備樣本空間稱為目標域,具有各狀態(tài)充足數據的設備樣本空間稱為源域[7]。唐藝璠等人[8]設計了網絡聯合分布自適應代價函數,對故障診斷模型進行了參數重調,在模型中通過匹配源域和目標域數據,提升了其遷移性能。吳定會等人[9]基于少量目標域故障數據,對診斷模型進行了微調,減少了目標域數據的使用量。彭雪瑩等人[10]使用Wasserstein距離來度量兩個數據分布間的差異,通過最小化數據分布差異,以實現對模型的遷移。
綜上可知,在實際應用中,現有的故障診斷方法需有足夠的目標域故障數據,才能構建診斷模型。但在實際生產中,往往因缺失目標域故障樣本,導致其故障診斷準確率低。
生成樣本是解決目標域故障樣本數據缺失問題的有效途徑。董韻佳[11]基于動力學,建立了滾動軸承故障仿真模型,并從仿真時域信號中學習故障診斷知識。陳露[12]建立了五自由度的故障軸承動力學模型及動力學方程,并將仿真數據用于故障軸承診斷。
基于動力學仿真的方法均是基于一定的簡化條件構建的仿真模型,未考慮設備的實際運行狀態(tài)。對此,馬波等人[13]提出了一種基于個性機理模型(MCGM)的診斷方法,該方法通過故障機理與設備個性特征生成個性化虛擬故障樣本。但該方法中對反映設備故障狀態(tài)的共性參數需要依據經驗設定,受人為因素的影響過大。于功也等人[14]提出了一種基于故障機理與領域自適應混合驅動的機械故障智能遷移診斷方法(domain adaptive fault diagnosis based on MCGM,DA-MCGM),該方法使用高斯混合模型(Dirichlet process gaussian mixture model,DPGMM)估計MCGM分布中的共性參數的分布。然而該參數分布方式缺乏理論依據,且研究者也未采用其他分布模型做驗證。
生成式對抗網絡(GAN)最早由GOODFELLOW I J等人[15]于2014年提出的。由于GAN具有極強的擬合真實數據分布的能力,其在數據擴充和輔助解釋方面極具應用前景[16]。隨著相關研究的深入,GAN衍生出了各種變體。孫哲等人[17]使用Wasserstein生成對抗網絡(Wasserstein GAN,WGAN),學習故障數據分布,實現了對故障數據集的擴充。周強等人[18]基于條件生成對抗網絡(conditional generative adversarial nets,CGAN),對不完備數據進行了數據增強。
由于GAN直接對復雜函數進行擬合,易出現梯度爆炸等問題,因此,使用時往往要將總任務進行拆分,逐個訓練。
綜上所述,筆者在DA-MCGM方法研究的基礎上做出改進,提出一種基于GAN-MCGM的旋轉機械故障智能診斷方法。
該方法首先采用GAN確定共性參數分布規(guī)律,然后結合MCGM與目標域正常狀態(tài)數據實現樣本生成模型對目標域的自適應,最后通過虛擬故障樣本與目標域正常狀態(tài)樣本訓練卷積神經網絡(convolutional neural networks,CNN),得到目標域故障診斷模型。
領域自適應旨在學習一個模型,使得在源域獲取的知識能夠在目標領域得到較好的應用[19]。筆者將各類狀態(tài)數據充足的樣本空間稱為源域,將只具有正常狀態(tài)數據的待測設備樣本空間被稱為目標域。
源域數據集表達式如下:
(1)
(2)
目標域正常狀態(tài)的樣本數據集為:
(3)
目標域數據集及標簽為:
(4)
式中:Dt—待分類數據組成的數據集;nt—目標域數據集的樣本總數;mt—Dt狀態(tài)標簽總數。
yt和ys范圍如下式所示:
(5)
式中:yt—目標域待測標簽數;ys—源域標簽數。
GAN模型采用博弈論的思想,由一個生成器G和判別器D所構成。生成器接收一個隨機生成的多維隨機數z,捕捉真實數據樣本的潛在分布,并生成一個新的數據樣本G(z)。判別器作為一個二分類器,判別輸入是真實樣本x還是生成樣本G(z)[20]。
GAN對抗訓練過程如圖1所示。
圖1 GAN對抗訓練過程
生成器的優(yōu)化方向是得到趨近于真實樣本的數據分布,其損失函數J(G)如下式所示:
(6)
式中:E(*)—分布函數的期望值;pdata(z)—噪聲分布。
判別器的優(yōu)化方向是準確的判別出輸入樣本是真實樣本x還是生成樣本G(z),其損失函數J(D)如下式所示:
(7)
式中:pdata(x)—真實樣本的分布。
在G與D的對抗訓練過程中,GAN的優(yōu)化目標函數V(D,G)如下式所示:
(8)
由上式可看出,其訓練過程為優(yōu)化G以最小化目標函數,優(yōu)化D以使其最大化,最終目的是得到訓練樣本的真實概率分布[21]。
由于制造及安裝誤差,正常運轉的設備會出現初始不平衡量、初始不對中量等個性特征。發(fā)生故障時,頻譜上會表現出特定故障頻率,即共性特征。
(9)
此處以滾動軸承內圈故障為例,依據故障機理分析,其頻域分布存在內圈缺陷頻率fIR,以及fIR的倍頻和邊帶,以上3種頻率即為軸承內圈故障頻率相關成分。
3項共性參數如圖2所示。
圖2 軸承內圈故障頻譜示意圖A1—缺陷頻率fIR的幅值大小k;θ—缺陷頻率倍頻幅值的相對變化系數;邊帶幅值大小;φ—主頻與邊頻幅值相對變化系數
綜上所述,筆者提出一種基于GAN-MCGM的旋轉機械故障智能診斷方法,以滾動軸承為例,對上述智能診斷方法進行論述。
對于旋轉機械智能診斷方法缺少故障樣本的問題,MCGM提供了一種效果很好的虛擬故障樣本生成方法。其生成過程是在設備正常運轉時的個性特征上,添加反映設備故障的共性特征,該共性特征由共性參數k,θ,φ計算得到。虛擬故障樣本的生成質量與共性參數大小密切相關。然而受旋轉機械本身結構、載荷和工況差異的影響,共性參數分布難以通過簡單的數學模型進行描述。
基于大量的無標簽數據,GAN可以構建具備生成各種形態(tài)數據能力的生成器。這種性質一方面可應用于估計未知的參數分布,另一方面可利用生成的樣本進行數據增強,生成與給定數據分布相一致的樣本,拓展不完備的固有信息。
其具體流程如圖3所示。
圖3 基于GAN-MCGM診斷方法應用流程
(1)構建共性參數分布模型。將Ds從時域數據轉化為頻域數據,從Ds中提取共性參數k、θ、φ作為GAN的輸入數據,訓練得到共性參數分布模型;
(3)訓練診斷模型?;趥€性化樣本,訓練CNN得到設備故障診斷模型;
(4)故障診斷。輸入待測設備數據Dt至故障診斷模型中,完成故障診斷。
筆者提出的方法將源域數據Ds從時域轉化到頻域,并從中提取k、θ、φ作為樣本,輸入至GAN網絡中,獲取共性參數生成模型ψ=(k,θ,φ)。
為避免原始的GAN存在的梯度消失與梯度爆炸的問題,訓練過程中需要將總任務進行分解,單次訓練分布一致的同種參數,降低了訓練難度。例如IN2層輸入(k1,k2,k3)。
GAN網絡訓練過程如圖4所示。
圖4 GAN網絡結構圖
GAN網絡參數如表1所示。
表1 GAN網絡結構參數
其計算方法如下:
(1)從生成模型ψt中取出一組共性參數向量(kt,θt,φt);
(2)計算故障頻率理論值f;
(3)計算倍頻幅值Ai,如下式所示:
(10)
式中:k—主頻幅值;θ—倍頻幅值比;Ai—倍頻幅值。
(4)計算邊頻幅值Bi,如下式所示:
Bi=Ai×φi
(11)
式中:φi—主頻與邊頻之比;Ai—倍頻幅值;Bi-邊頻幅值;i—取值范圍為[1,2,3,4,5]。
筆者將目標域正常狀態(tài)樣本與虛擬故障樣本輸入至CNN中訓練,得到設備故障診斷模型。
其網絡結構,即故障診斷模型結構圖如圖5所示。
圖5 故障診斷模型結構圖
設備故障診斷模型的網絡參數如表2所示。
卷積層參數—深度*寬度*高度*卷積核寬度*卷積核高度;池化層參數—最大池化的寬度、高度和步長;I—輸入層;O—輸出層;Conv—卷積層;FC1—全連接層;S—Softmax層;V—旋轉機械源域標簽種類數量
筆者將目標域待測數據Dt輸入至故障診斷模型,得到故障診斷結論。
筆者以滾動軸承為例,基于CWRU[22]、MFPT[23]公開數據集和故障模擬實驗臺數據,對基于GAN-MCGM的診斷方法的有效性進行驗證。
該方法驗證環(huán)境使用Python3.7.9語言、PyTorch 1.6機器學習方法框架,計算機操作系統(tǒng)為Windows 10。
基于上述數據組成的數據集A、B、C、D如表3所示。
表3 軸承數據集
在表3中,數據集A、B、C為連續(xù)數據,因此,筆者采用重疊采樣的方法分割得到多組數據。每組數據基于希爾伯特變換的包絡譜,頻域分辨率為1 Hz。數據集D的分辨率為1.562 5 Hz(25 600 Hz/16 384)。
為了驗證基于GAN-MCGM的旋轉機械智能診斷方法的準確性,筆者搭建了軸承故障模擬實驗臺,如圖6所示。
圖6 軸承故障模擬實驗臺
由圖6可知:實驗臺由電機、加速箱、配重盤、軸承、傳感器等部件組成。
實驗軸承安裝于右側軸承座內,其型號為N205EM圓柱滾子軸承。通過實驗模擬了軸承正常、內圈故障和外圈故障共3種狀態(tài)數據。
實驗轉速為1 200 r/min,通過右側軸承座上的E048211型傳感器采集3組實驗的振動信號。
筆者分別以A,B,C作為源域,組成6項診斷任務對方法進行驗證。
診斷任務如表4所示。
表4 診斷任務列表
在診斷任務C中,筆者將基于GAN-MCGM的旋轉機械智能診斷方法得到的共性參數分布,與源域的真實共性參數分布作對比。
內圈故障生成參數與真實參數對比如圖7所示。
圖7 內圈故障生成參數與真實參數
外圈故障生成參數與真實參數如圖8所示。
圖8 外圈故障生成參數與真實參數
從圖(7,8)中可看出:(1)共性參數散點分布呈塊狀,主要集中在某一確定區(qū)域,服從一定的分布規(guī)律;(2)通過GAN訓練出的共性參數分布模型與真實共性參數分布相似。
筆者以A→B為例,依據A的共性參數模型與B的正常數據,生成數據集B中的虛擬故障樣本及真實故障樣本,如圖9所示。
圖9 真實故障樣本與虛擬故障樣本fIR—內圈故障特征頻率;fOR—外圈故障特征頻率;fBF—滾動體故障特征頻率;Fn—頻率;A—幅值
由圖9中可看出:虛擬故障樣本與真實故障樣本存在一定的差異,但二者頻率分布相近;虛擬故障樣本保留頻率分布信息的同時,更突出了其特征頻率。
筆者分別對6項模型泛化遷移診斷任務進行五重驗證測試,模型診斷準確率如表5所示。
表5 五重驗證診斷準確率(%)
由表5可知:不同診斷任務的準確率存在一定差異;診斷任務A→B準確率較低,其余準確率均高于90%。
為了解A→B準確率較低的原因,筆者分析不同故障下的診斷準確率。
單類型故障診斷實驗結果如表6所示。
表6 單類型故障診斷結果(%)
由表6可看出:內外圈故障的診斷準確率較高,而滾動體故障的診斷準確率只有38%,這是造成A→B診斷任務總體準確率不高的主要原因。
由圖9也可看出:在滾動體故障的生成樣本中,特征頻率不明顯,容易淹沒在其他頻率中。而MCGM依據故障機理生成虛擬故障樣本,因此,在滾動體故障在特征不明顯的情況下與其他故障相比,診斷準確率較低。
3.3.1 參數分布模型對比分析
為進一步驗證方法的有效性,筆者分析不同的共性參數分布模型以及對比方法的實驗結果。
筆者將T分布與高斯混合模型擬合的共性參數分布與基于GAN-MCGM的診斷方法,在6項診斷任務中的診斷準確率進行對比,分析不同參數分布模型對診斷準確率的影響,其實驗結果如圖10所示。
圖10 各分布模型診斷結果對比圖
對比使用T分布與DPGMM估計共性參數分布下得到的故障診斷結論可看出:在各項診斷任務中,GAN網絡擬合的共性參數分布模型的平均準確率最高,達到92.50%;不同分布模型下,故障診斷準確率差別較大,這也進一步驗證了不同的共性參數分布對生成樣本質量具有重要影響[24,25]。
3.3.2 方法對比及分析
筆者將基于GAN-MCGM的診斷方法與DA-MCGM,測地流核函數(geodesic flow kernel,GFK)[26],基于余弦相似度(cosine similarity,CS)與最大均值差異(maximum mean discrepancy,MMD)[27]的領域對抗網絡(domain adaptive neural network,DaNN),CNN模型的診斷結果進行對比。
對比方法說明如表7所示。
表7 對比方法說明
在6項診斷任務中的對比實驗結果,如表8所示。
表8 對比實驗結果(%)
由表8中的實驗結果可看出:GAN-MCGM方法平均準確率最高,達到92.50%,相較DA-MCGM診斷方法,其平均準確率提升了6.56%;在其他方法中,基于MMD的DaNN方法平均準確率最高,但相比基于GAN-MCGM的診斷方法低了48.21%。
實驗具體分析如下:
(1)總體來看,在6項診斷任務中,GAN-MCGM模型的平均準確率均高于其他方法;比起DA-MCGM診斷模型,在各項任務的診斷結果準確率上均有一定提升。其中,基于GAN-MCGM的方法在診斷任務C→D的準確率達到100%;
(2)從單個方法的實驗結果分析,DaNN等方法在A到B數據集上的診斷準確率最高,相較其他診斷任務而言,基于GAN-MCGM的診斷方法在A→B診斷任務的準確率較低。
由于A,B數據集工況相似,源域和目標域數據較為相似,因此,映射高維特征空間的遷移診斷方法應用于A,B數據集具有一定優(yōu)勢。
基于GAN-MCGM的診斷方法如何結合其他方法的優(yōu)勢,在復雜工況下得到更準確的診斷結論,在該方面還值得做進一步研究。
針對旋轉機械故障樣本缺失,導致診斷模型構建困難的問題,筆者提出了一種基于GAN-MCGM的智能診斷方法。該方法首先依據GAN構建了共性參數分布模型,然后結合MCGM與目標域正常狀態(tài)數據,實現了樣本生成模型對目標域的自適應,最后通過虛擬故障樣本與目標域正常狀態(tài)樣本訓練,得到了目標域故障診斷模型。
研究結論如下:
(1)基于GAN-MCGM的診斷方法在缺失旋轉機械故障樣本的情況下,仍可準確實現適用于待測設備的個性化診斷模型構建,相比現有方法具有更高的診斷準確率;
(2)采用GAN確定共性參數分布模型的方法,可為其他涉及參數分布規(guī)律估計問題的解決提供一定的指導;
(3)基于GAN-MCGM的診斷方法拓寬了基于故障機理生成虛擬樣本的思路,同時提高了虛擬樣本替代真實樣本方法的可靠性,對于其他領域小樣本問題的解決具有一定借鑒意義。
未來,筆者將重點研究故障信息表征方法,以提高診斷模型在各應用條件下的魯棒性。