摘要:針對卷積神經(jīng)網(wǎng)絡及其與信號降噪預處理集成方法面臨高噪聲環(huán)境和低質(zhì)量數(shù)據(jù)挑戰(zhàn)時難以有效地提取信號有用特征的問題,提出了一種融合Geronimo-Hardin-Massopust多小波分解的深度卷積神經(jīng)網(wǎng)絡模型(GHMMD-DCNN)。該模型思想是將多小波包分解與卷積神經(jīng)網(wǎng)絡深度融合,即設計多個一級多小波分解層以提取信號的低頻分量和高頻分量,再將多個一級多小波分解層與卷積層交替聯(lián)接,使模型能夠多尺度地提取并學習信號有用的時頻域信息,信號分解和特征學習交替執(zhí)行,進而實現(xiàn)強噪聲魯棒特征提取。在不同工況下的航空高速軸承振動數(shù)據(jù)上進行測試,結(jié)果表明:所提模型訓練時能夠快速達到穩(wěn)定收斂,并且識別準確率均能達到99.9%以上;提出的方法在強噪聲干擾下的故障辨識準確度和識別穩(wěn)定性均優(yōu)于對比方法,驗證了其優(yōu)秀的抗噪聲干擾能力;在少訓練樣本測試中,提出的方法在單類訓練樣本數(shù)量為60時的平均診斷準確率高達91.19%,相比于其他方法最低提升了13.19%,驗證了GHMMD-DCNN模型具有更優(yōu)的低樣本泛化能力。
關(guān)鍵詞:多小波分解;卷積神經(jīng)網(wǎng)絡;深度學習;軸承故障診斷
中圖分類號:TH17.文獻標志碼:A
DOI:10.7652/xjtuxb202405004.文章編號:0253-987X(2024)05-0031-11
Bearing Fault Diagnosis Method of Deep Convolutional Neural Network Based on Multiwavelet Decomposition
Abstract:To tackle the challenge of convolutional neural network and its integration methods with denoising preprocessing methods struggling to effectively extract useful signal features amidst high noise environments and low-quality data, a deep convolutional neural network model based on the Geronimo-Hardin-Massopust multiwavelet decomposition (GHMMD-DCNN) is proposed. The model’s concept revolves around deeply integrating the multiwavelet packet decomposition with the convolutional neural network. In other words, this involves the creation of multiple first-level multiwavelet decomposition layers to extract the low-frequency and high-frequency signal components, and these layers are lined alternately with the convolutional layer. This approach enables the model to extract and learn the useful time-frequency information of the signal on a multiscale basis. The signal decomposition and the feature learning are executed alternately, and robust feature extraction is realized even under strong noise conditions. Tests are carried out using aerospace high-speed bearing vibration data under different working conditions. The results show that the proposed model is able to reach stable convergence quickly and the recognition accuracy surpasses 99.9%. The proposed method showcases superior fault recognition accuracy and stability in the presence of significant noise interference compared to contrast methods, which demonstrates its excellent anti-noise ability. In the test of fewer training samples, the proposed method achieves an impressive average diagnosis accuracy of 91.19% with only 60 training samples per class. This represents a 13.19% enhancement over alternative methods, verifying the GHMMD-DCNN’s exceptional low-sample generalization ability.
Keywords:multiwavelet decomposition; convolutional neural network; deep learning; bearing fault diagnosis
2021年,國家工業(yè)和信息化部先后發(fā)布了《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》和《“十四五”智能制造發(fā)展規(guī)劃》,強化以數(shù)據(jù)驅(qū)動發(fā)展新興產(chǎn)業(yè)并加快產(chǎn)業(yè)變革的戰(zhàn)略導向,力爭未來15年內(nèi)基本實現(xiàn)規(guī)模以上制造業(yè)企業(yè)全面普及數(shù)字化[1-2]。隨著數(shù)字化產(chǎn)業(yè)的推進,機械裝備逐漸朝著精密化、復雜化的方向發(fā)展,設備間的關(guān)聯(lián)性愈加緊密,機械故障診斷技術(shù)成為穩(wěn)步推進制造業(yè)發(fā)展的重要保障[3-4]。滾動軸承作為機械設備關(guān)鍵部件之一,廣泛應用于兵器裝備、航空航天、風力發(fā)電等領(lǐng)域[5]。統(tǒng)計表明,軸承故障約占達旋轉(zhuǎn)類機械總故障的30%~40%[6]。因此,對軸承進行及時準確地故障診斷能夠有效保障現(xiàn)代化機械設備的安全運行。
目前,多數(shù)基于數(shù)據(jù)驅(qū)動的軸承故障診斷方法建立于分析振動信號的基礎上,傳統(tǒng)信號分析方法、淺層機器學習方法、深度學習方法是目前廣為應用的故障診斷方法[7]。傳統(tǒng)信號分析方法基于時頻域分析等方法進行特征提取,通過專家知識進行特征頻率分析從而辨識故障,因此該方法依賴于操作人員的專業(yè)性。淺層機器學習方法通常采用核主成分分析[8]、K-L變換[9]等方法,對所提取的特征向量進行特征選擇,再設計分類器進行分類,如人工神經(jīng)網(wǎng)絡[10]、隱馬爾可夫模型[11]和支持向量機[12]等。淺層機器學習方法在故障特征選擇與辨識上減少了人工的參與,但仍然依賴人工經(jīng)驗優(yōu)選特征向量。深度學習方法具有自動提取故障特征的能力[13],避免了對專家知識的依賴,其強大的特征學習能力顯著提高了故障識別準確率,是目前“大數(shù)據(jù)”時代國內(nèi)外各領(lǐng)域廣為關(guān)注的技術(shù)之一。
2012年,卷積神經(jīng)網(wǎng)絡(CNN)[14]在圖像識別展現(xiàn)出來的巨大優(yōu)勢迅速成為學術(shù)界研究的熱點。該網(wǎng)絡結(jié)構(gòu)主體一般由卷積層、激活層、池化層等組成,整個特征提取過程具有權(quán)值共享和空間不變性的特性[15]。近年來,CNN因其強大的自適應特征提取能力在機械故障診斷領(lǐng)域中發(fā)揮出驚人的作用。Zhang等[16]提出了基于寬卷積核的深度卷積神經(jīng)網(wǎng)絡(WDCNN)模型,在第一個卷積層引入了大卷積核,有效捕捉了軸承振動信號的中低頻特征??禎龋?7]將通道和時間注意力機制與多尺度CNN相融合,有力地提升了模型對軸承關(guān)鍵故障特征的提取能力。
滾動軸承在實際運行環(huán)境中常常受到機器系統(tǒng)和周圍環(huán)境的噪聲干擾,軸承發(fā)生故障時產(chǎn)生的瞬態(tài)故障脈沖成分通常淹沒在這些強背景噪聲中,導致CNN算法過度擬合無效特征而難以準確識別故障。針對該問題的常見解決方案有兩種:①集成CNN模型與獨立的信號預處理步驟;②將傳統(tǒng)信號處理思想與CNN模型進行融合。前者通常獨立進行信號降噪預處理,再將處理過的信號輸送至CNN中進行特征提取,實現(xiàn)難度低。但是,若信號降噪不足,模型仍將受到噪聲影響。反之,若信號降噪過度,有用信息也隨之減少,模型將過度擬合無效特征。因此,CNN與信號降噪預處理集成方法存在難以合理保留有用信息而導致有效特征提取不足的問題。后者能避免這一缺陷,并能充分發(fā)揮出傳統(tǒng)信號處理方法和CNN網(wǎng)絡各自的優(yōu)勢。例如,深度殘差收縮網(wǎng)絡(DRSN-CW)[18]融合了小波閾值去噪思想,添加了殘差模塊和自適應閾值門限,使得學習到的高級特征可以變得更具鑒別性。Li等[19]將CNN第一層卷積核核函數(shù)更改為Laplace小波核函數(shù),使CNN融合了連續(xù)小波變換的優(yōu)勢。Wang等[20]受小波包分解機制啟發(fā),提出了一種融合多層小波注意力機制的卷積神經(jīng)網(wǎng)絡(MWA-CNN)框架,其策略是將小波包分解與CNN深度融合,將多個單小波分解層嵌入CNN模型,使信號能夠逐層分解和特征學習,有效地提升了CNN模型的抗噪聲能力。然而,目前將傳統(tǒng)信號處理方法和深度學習網(wǎng)絡深度融合的方式并不普遍,這是因為二者在特征提取方面可能存在沖突,模型的開發(fā)難度較高。因此,這種融合方法目前仍處于探索階段,但是該方法可以充分發(fā)揮兩者的優(yōu)勢,對于提高信號處理和模式識別的性能仍具有很大的潛力。
受MWA-CNN啟發(fā),將有明確物理意義的傳統(tǒng)信號處理方法與CNN深度融合,是提升CNN特征提取性能的有效手段。相比于單小波,多小波兼具對稱性、正交性、短支撐性、高階消失矩的獨特優(yōu)勢[21],且多小波變換是一個多輸入-多輸出系統(tǒng),這為無額外數(shù)據(jù)增強條件下實現(xiàn)少標簽樣本及強背景噪聲的軸承故障診斷提供了一種可能。
針對卷積神經(jīng)網(wǎng)絡易受噪聲干擾、識別性能嚴重依賴于大規(guī)模和高質(zhì)量數(shù)據(jù)的問題,以及CNN與信號降噪預處理集成方法存在難以合理地保留有用信息而導致有效特征提取不足的問題,本文基于機械故障診斷領(lǐng)域常用的Geronimo-Hardin-Massopust多小波,即GHM多小波,提出了一種融合GHM多小波分解的深度卷積神經(jīng)網(wǎng)絡(GHMMD-DCNN)軸承故障診斷模型。該模型將多個一級GHM多小波分解層與卷積層交替聯(lián)接,使模型能夠多尺度地學習信號有用的時頻域信息。模型將在航空發(fā)動機高速軸承振動信號數(shù)據(jù)上進行實驗測試,并與WDCNN、集成經(jīng)驗模態(tài)分解方法的WDCNN(WDCNN-EMD)、DRSN-CW和以單小波為基礎的MWA-CNN進行性能對比。
1.多小波變換理論
1.1.多小波理論
多小波理論的基本思想是,由多尺度函數(shù)生成多分辨率分析空間,在正交多分辨率分析空間中,其r重多尺度函數(shù)Φ(t)和r重多小波函數(shù)Ψ(t)滿足以下兩尺度關(guān)系[22]
式中:Hk與Gk為r×r的低通濾波器系數(shù)矩陣和高通濾波器系數(shù)矩陣;l為系數(shù)矩陣總數(shù)。
本文采用機械故障診斷領(lǐng)域中常用的GHM多小波[23],該小波為二重多小波,因此后文的分析均是在r=2的基礎上討論的,將不再重復說明。與單小波相比,GHM多小波在相同逼近階下具備更短的支撐,可以保證信號特征提取過程中能量分布更加集中;此外,GHM多小波具有兩個不同時頻性質(zhì)的基函數(shù),能夠多尺度地提取信號特征的不同部分[24]。GHM多小波兩尺度矩陣序列[25]分別為GHM多小波的多尺度函數(shù)1、2和多小波函數(shù)ψ1、ψ2如圖1所示??梢詮膱D中明確看出,1的支撐區(qū)間為[0,1],2、ψ1和ψ2的支撐區(qū)間為[0,2],GHM多小波的最大支撐區(qū)間為2,具有短支撐性。
1.2.離散多小波分解
離散多小波分解算法與單小波的Mallat塔形算法相似,不同之處在于多小波為r重矢量輸入。在進行GHM多小波分解前,需要將一維信號轉(zhuǎn)為2維矢量輸入。重復預處理的前處理方式在信號降噪中已被證明效果較好[26],因此本文采用該處理方式對信號進行預處理,即
式中:xk為一維信號輸入;c0,k為前處理后的二維矢量輸出;Q為重復預處理矩陣,具體為
離散GHM多小波分解過程如圖2所示,其中H和G分別為低通濾波器和高通濾波器的矩陣表示,2↓表示隔2抽樣,離散多小波分解算法表達式[27]如下
式中:cj-1,n為2維低頻分量;dj-1,n為2維高頻分量。
1.3.離散多小波包分解
離散多小波包分解同經(jīng)典小波包分解一樣,可以將細節(jié)分量進行再分解,進而提高細節(jié)分量的頻率分辨率[28]。軸承損傷所引發(fā)的振動沖擊會激發(fā)系統(tǒng)固有振蕩,在高頻出現(xiàn)調(diào)制峰,因此對高頻部分進行細分能夠更好地診斷故障,引入小波包分解是有必要的。多小波包分解過程如圖3所示,可以看出,多小波包分解對細節(jié)分量也按照樹結(jié)構(gòu)進行了分解,每次分解也是矩陣運算。
2.GHMMD-DCNN模型
本文結(jié)合GHM多小波包分解能夠多尺度提取出更豐富的頻率信息和CNN卷積采樣自動提取局部特征的優(yōu)勢,將多個GHM多小波分解層與卷積層深度集成,構(gòu)建了融合GHM多小波分解的深度卷積神經(jīng)網(wǎng)絡模型,整體架構(gòu)如圖4所示。整個網(wǎng)絡由1個重復預處理層、5個一級多小波分解模塊、6個卷積模塊、1個全局平均池化層和1個全連接層組成。
首先,將原始一維軸承振動信號按照固定樣本長度分割,得到足夠數(shù)量的一維樣本序列,將歸一化后的樣本序列輸送到預處理層中按式(5)和式(6)進行重復預處理,轉(zhuǎn)換為二維矢量輸入,每一維向量長度與初始長度一致。然后,將二維矢量輸送到多小波分解模塊,按式(7)和式(8)進行一級GHM多小波分解,得到低頻分量和高頻分量,將兩分量拼接組合后輸送到卷積模塊中進行自動特征提取。卷積模塊由卷積層、批歸一化層(BN)、ReLU激活層組成,卷積層提取時域和頻域的重要特征,BN層能夠提升網(wǎng)絡訓練效率,ReLU層將所有的負值設置為0,網(wǎng)絡的稀疏性得以提高,能夠節(jié)省計算資源。由于多小波分解層中包含降采樣操作,因此本模型不采用最大池化層進行特征降維。
卷積模塊從各頻段分量學習有用的故障特征信息,將所提取特征分量再輸送到多小波分解層,進行一級GHM多小波分解,得到多個特征分量的多頻段信息,再次將這些分量組合拼接輸送至卷積模塊。一級多小波分解層與卷積層再循環(huán)3次交替執(zhí)行,該循環(huán)執(zhí)行完成后,使用卷積模塊進行重復特征提取。信號的時域特征和頻率特征能夠被逐層分解和學習,在深層信號分解和特征學習的過程中,模型能夠更加有效地區(qū)分出有效信號與噪聲信號的信息差異,從而學習到有價值的信息。
為了防止過擬合,在一級多小波分解層后引入隨機失活層,隨機失活率設為0.2。同樣地,為防止全連接輸出層中權(quán)重參數(shù)過多而導致網(wǎng)絡過擬合,將全局平均池化層置于最后一個卷積模塊后,用于計算特征分量每個通道平均值,最后利用全連接層和Softmax函數(shù)量衡出每個類別節(jié)點對應的概率值。模型采用交叉熵損失函數(shù)衡量輸出類別與真實類別的差距,公式為
式中:J為軸承健康狀態(tài)總類別數(shù)量;q(xj)為樣本屬于第j類的預測概率;p(xj)為樣本屬于第j類的真實概率。
在模型結(jié)構(gòu)參數(shù)設置上,信號的輸入長度為4 096。多小波分解層中對輸入信號進行周期延拓以保證所分解得到的信號長度為原始信號長度的一半,其輸出通道為輸入通道的2倍。本文模型具體參數(shù)如表1所示,其中輸出維度“2×4 096”表示通道數(shù)為2,長度為4 096,卷積核參數(shù)“4×16×3×2”為輸入通道×輸出通道×核大小×步長。
模型的訓練流程如圖5所示,采用具有自適應學習率特性的Adam優(yōu)化器更新網(wǎng)絡參數(shù),初始學習率設定為0.001,最大輪次設置為100。為防止學習率過大導致模型無法穩(wěn)定地收斂到最優(yōu)解,采用固定步長學習率衰減,在第40輪、第80輪學習率以0.1的衰減率進行衰減。記錄并保存100輪內(nèi)驗證效果最優(yōu)的網(wǎng)絡參數(shù),最后在測試集上進行故障診斷測試,實現(xiàn)軸承故障辨識任務。
3.實驗驗證與分析
3.1.數(shù)據(jù)集準備
本文使用的軸承振動信號數(shù)據(jù)集來源于意大利都靈理工大學機械和航天工程系搭建的航空發(fā)動機高速軸承實驗臺[29],其全局構(gòu)造如圖6(a)所示,軸承與加速度傳感器安裝位置如圖6(b)所示。其中B1、B2和B3處分別安裝3個同軸連接的航空發(fā)動機高速軸承,軸承如圖6(c)所示,軸承詳細信息可參見文獻[29],其中B1為被試軸承。圖6(b)中A1、A2處均采用加速度傳感器分別記錄x、y和z方向的輸出,輸出共計為6個通道的數(shù)據(jù)。6個通道的數(shù)據(jù)均在采樣頻率51 200 Hz下收集,采樣時長為10 s。軸承存在無損傷、壓痕直徑為450、250、150 μm的內(nèi)圈損傷、壓痕直徑為450、250、150 μm的滾動體損傷,共計7種狀態(tài),7種狀態(tài)依次記為0~6。
本文在3個工況下測試所提出模型的性能,為了簡潔表達,分別標記為WC1、WC2和WC3,具體信息如表2所示。實驗采用4 096個數(shù)據(jù)點作為一段信號輸入,并做最大最小值歸一化處理。每一工況下每一類軸承故障振動信號有6×512 000個樣本點,以相鄰兩段信號的重疊率為26%的方式進行數(shù)據(jù)分割,可以準備1 000個樣本。其中,訓練、驗證和測試樣本數(shù)量分別為500、200和300,即對于每一工況下的數(shù)據(jù)集,共計訓練樣本3 500個、驗證樣本1 400個和測試樣本2 100個,測試、驗證與訓練樣本之間無樣本點重疊。
3.2.GHMMD-DCNN模型故障診斷結(jié)果分析
本文基于Pytorch框架搭建GHMMD-DCNN模型,計算機顯卡為NVIDIA GeForce RTX 2080 GPU。為降低深度網(wǎng)絡訓練學習隨機性的影響,進行5次重復實驗,3個工況WC1、WC2、WC3下的準確率分別為(99.990 5±0.0261)%、100%、100%,可以發(fā)現(xiàn)模型的穩(wěn)定性很好,在不同工況下也能夠保證識別準確率達到99.9%以上。為進一步測試模型的訓練性能,在工況WC2下觀測模型在訓練集和驗證集上的損失函數(shù)與識別準確率隨訓練輪次變化的曲線,分別如圖7和圖8所示??梢钥闯?,模型在訓練集與驗證集上的曲線變化高度一致,表明模型沒有發(fā)生過擬合現(xiàn)象,而且模型的收斂速度很快,訓練集約在第11輪訓練時識別準確率達到99%,約在第41輪訓練后訓練集和驗證集的識別準確率均達到100%。模型保持穩(wěn)定收斂,表明所設計的GHMMD-DCNN模型是合理可行的。
3.3.不同方法診斷結(jié)果對比分析
為更全面地測試GHMMD-DCNN模型的性能,與WDCNN、WDCNN-EMD、DRSN-CW、MWA-CNN方法進行對比測試。WDCNN為普通的卷積神經(jīng)網(wǎng)絡,特別之處在于第一個卷積層選取大卷積核,此處卷積核大小設為64;WDCNN-EMD方法先將振動信號進行經(jīng)驗模態(tài)分解和重構(gòu),再將處理后的信號輸送至WDCNN訓練;DRSN-CW為殘差網(wǎng)絡的改進模型,能逐層實現(xiàn)信號自適應降噪;本文所提出GHMMD-DCNN模型是在MWA-CNN的基礎上改進的,區(qū)別在于MWA-CNN使用的是單小波,此處選用文獻[20]中優(yōu)選的“db16”小波。
圖9為工況WC3下各方法的診斷結(jié)果,可明確看出,本文提出方法GHMMD-DCNN在識別準確性及診斷穩(wěn)定性均表現(xiàn)為最優(yōu);MWA-CNN和DRSN-CW的識別性能次之,準確率分別為(99.895 2±0.118 6)%和(99.666 7±0.134 7)%,診斷穩(wěn)定性較高;WDCNN-EMD方法的識別準確率最低,為(94.238 1±1.105)%,實驗結(jié)果波動較大,表明該方法的性能易受數(shù)據(jù)擾動。與WDCNN方法相比,WDCNN-EMD的平均準確率降低了2.038 1%,表明卷積神經(jīng)網(wǎng)絡對經(jīng)過EMD分解重構(gòu)預處理后的信號特征提取效果并不如直接對原始信號進行特征提取,說明信號在預處理過程中雖去除了部分噪聲信息,但也去除了部分關(guān)鍵故障信息,CNN存在有效特征提取不足的情況。
為進一步驗證所提出方法在特征提取能力方面的優(yōu)越性,使用t分布隨機近鄰嵌入(t-SNE)方法對各模型輸出的特征降維,可視化結(jié)果如圖10所示。在圖10(a)和10(b)中可發(fā)現(xiàn),各類特征類內(nèi)聚合程度較好,但標簽為2、3、5的三類故障特征在降維空間中存在重疊現(xiàn)象,分類邊界混淆,即WDCNN和WDCNN-EMD難以完全區(qū)分壓痕直徑為250、150 μm的內(nèi)圈損傷和壓痕直徑為250 μm的滾動體損傷。根據(jù)圖10(c),DRSN-CW能夠較好地區(qū)分出7種軸承健康狀態(tài),但分類邊界冗余復雜,部分類內(nèi)部存在多個聚類簇,類內(nèi)數(shù)據(jù)點聚合程度較差,表明模型沒有學習到足夠泛化的特征;MWA-CNN的特征降維結(jié)果仍存在同樣的問題,從圖10(d)可以看出,標簽為0、2、3、4的故障特征類內(nèi)聚合程度較差,即無損傷、壓痕直徑為250、150 μm的內(nèi)圈損傷和壓痕直徑為450 μm的滾動體損傷的類內(nèi)特征差異被過度學習,存在過擬合現(xiàn)象。根據(jù)圖10(e),GHMMD-DCNN的t-SNE結(jié)果最優(yōu),各類的分類邊界清晰分明,不同類別的數(shù)據(jù)點距離較大,類內(nèi)數(shù)據(jù)點聚合程度高,表明模型的具有更優(yōu)的數(shù)據(jù)聚類和分離能力。對MWA-CNN和DRSN-CW的特征表征效果不佳問題進行分析,可能的原因是數(shù)據(jù)多樣性不足或數(shù)據(jù)量不足,模型過度適應訓練數(shù)據(jù)的細節(jié)特點,導致泛化性能較差。這表明所提出模型GHMMD-DCNN能夠在少量帶標簽訓練樣本上訓練出泛化性能較強的模型,從而高效率且高準確率地實現(xiàn)軸承故障診斷。
為了進行噪聲魯棒性故障診斷測試,對原始振動數(shù)據(jù)添加不同強弱的高斯白噪聲,采用信噪比(R)來評價噪聲強弱,公式為
式中:Ps和Pn分別表示原始振動信號與額外添加高斯白噪聲信號的能量。
本次實驗將在信噪比分別為-4、-2、0、2、4 dB的5種噪聲條件下進行故障識別測試,每次測試仍然進行5次重復實驗。圖11和圖12分別為工況WC1、WC2下的準確率結(jié)果,可以看出,WDCNN和WDCNN-EMD的性能嚴重受噪聲干擾,經(jīng)過經(jīng)驗模態(tài)分解預處理的信號并沒有起到提高模型性能的作用,甚至降低了模型的分類準確度;而GHMMD-DCNN在兩個工況的不同噪聲條件下的診斷結(jié)果均表現(xiàn)出色。
在WC1下,WDCNN、WDCNN-EMD、DRSN-CW、MWA-CNN和GHMMD-DCNN方法在R=4 dB下的準確率分別為(87.581±1.136 1)%、(84.762±1.407 8)%、(97.619±0.436 4)%、(98.352 4±0.524 5)%、(99.21±0.114 7)%。在R=-4 dB下,5種方法的準確率分別為(50.305±2.873)%、(50.152 4±1.374)%、(80.552 4±1.661 4)%、(86.409 5±1.464 1)%、(89.276 2±0.311 2)%,平均識別準確率相比于R=4 dB下的診斷結(jié)果分別下降了37.276%、34.609 5%、17.066 7%、11.942 9%和9.933 3%。所提出GHMMD-DCNN模型的識別準確率顯著高于WDCNN、WDCNN-EMD和DRSN-CW,比WDCNN的準確率提升了38.971 2%,而相比于MWA-CNN方法,GHMMD-DCNN的準確率約提升2.866 7%。對比該工況下WDCNN、WDCNN-EMD結(jié)果可發(fā)現(xiàn),在這5種不同強弱的噪聲環(huán)境中,WDCNN-EMD的識別準確率均不如WDCNN,表明在強噪聲背景下使用信號降噪預處理方法容易去除有用的故障信息。
相比于WC1,WC2為負載高轉(zhuǎn)速較低的工作環(huán)境,因此故障特征更加微弱隱蔽,對比圖11和圖12,可以發(fā)現(xiàn)各方法的識別準確率均有下降。兩個普通的CNN方法的平均分類準確率在R=-4 dB時僅為29.666 7%和28.4%,嚴重受噪聲干擾,顯然模型過擬合噪聲細節(jié),很難提取出有用的故障信息。根據(jù)圖12可知,GHMMD-DCNN模型的識別準確性和識別穩(wěn)定性顯著優(yōu)于WDCNN、WDCNN-EMD和DRSN-CW;與MWA-CNN相比,GHMMD-DCNN模型在信噪比為-4、-2、0、2、4 dB情況下的平均準確率分別提升了4.485 7%、3.4%、2.552 4%、1.876 2%和1.333 3%,且GHMMD-DCNN的穩(wěn)定性仍優(yōu)于MWA-CNN,表明模型具有較優(yōu)的噪聲魯棒性。
為進一步考察GHMMD-DCNN模型的泛化能力,在工況WC1下對每類帶標簽訓練樣本數(shù)量分別為30、60、90、120的數(shù)據(jù)進行測試,每類測試集樣
本數(shù)量為300,對比方法仍然為前文所述的4種方法,實驗結(jié)果如表3所示。可以看出,GHMMD-DCNN模型的識別準確率顯著高于其他4類方法,在單類訓練樣本數(shù)量為30時平均診斷準確率比WDCNN、WDCNN-EMD、DRSN-CW、MWA-CNN分別提升了29.31%、29.44%、17.2%、8.57%;所提方法在單類訓練樣本數(shù)量為60時的平均識別準確率達91.19%,比其他4類方法分別提升了28.84%、30.74%、14.84%、13.19%。GHMMD-DCNN模型為MWA-CNN的改進模型,相比于MWA-CNN,本文模型在單類訓練樣本數(shù)量為90和120條件下的識別準確率仍然有所提升,分別提升了7.96%和7.86%。以上結(jié)果表明,本文模型具有更優(yōu)的低樣本泛化能力。
4.結(jié).論
本文從信號處理方法與卷積神經(jīng)網(wǎng)絡深度融合的角度出發(fā),提出了一種能夠多尺度地提取并學習信號有用信息的GHMMD-DCNN模型,在航空發(fā)動機高速軸承上進行了故障診斷測試,得到了以下結(jié)論。
(1)所提出模型GHMMD-DCNN交替執(zhí)行信號分解和特征學習兩過程,深層次并多尺度地從多個頻帶分量中學習故障特征信息與噪聲細節(jié)的差別,進而提高模型的抗噪聲能力。實驗結(jié)果表明,提出的模型能夠快速收斂達到穩(wěn)定,在無額外噪聲添加的情況下識別準確率均能達到99.9%,所提取特征的t-SNE結(jié)果中,類間邊界分明、類內(nèi)數(shù)據(jù)點聚合程度高,表明所提出模型具有良好的泛化能力。
(2)抗噪性能測試結(jié)果表明,GHMMD-DCNN模型的識別準確性和識別穩(wěn)定性均顯著優(yōu)于普通CNN方法和集成經(jīng)驗模態(tài)分解信號預處理的CNN方法,且該模型在各個噪聲條件下的診斷結(jié)果均優(yōu)于MWA-CNN,表明將多小波分解方法與卷積神經(jīng)網(wǎng)絡深度融合的GHMMD-DCNN模型對于抗噪聲干擾是有效的。
(3)低訓練樣本測試結(jié)果表明,所提出方法顯著優(yōu)于其他對比方法。與原基礎模型MWA-CNN相比,所提出的模型在單類訓練樣本數(shù)量為30、60、90和120的平均識別準確率分別提升了8.57%、13.19%、7.96%和7.86%,表明該模型在訓練樣本量少的條件下仍能學習到數(shù)據(jù)的真實分布和特征,模型存在更優(yōu)的低樣本泛化能力。
參考文獻:
[1]趙碧. “十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃發(fā)布 [J]. 中國產(chǎn)經(jīng)新聞, 2021-12-02(2).
[2]董凱. “十四五”智能制造發(fā)展規(guī)劃解讀及趨勢研判 [J]. 中國工業(yè)和信息化, 2022(1): 24-29.
DONG Kai. Interpretation and trend analysis of the 14th Five Year Plan for the development of intelligent manufacturing China industry and information technology [J]. China Industry amp; Information Technology, 2022(1): 24-29.
[3]陳雪峰, 訾艷陽. 智能運維與健康管理 [M]. 北京: 機械工業(yè)出版社, 2018.
[4]雷亞國, 賈峰, 孔德同, 等. 大數(shù)據(jù)下機械智能故障診斷的機遇與挑戰(zhàn) [J]. 機械工程學報, 2018, 54(5): 94-104.
LEI Yaguo, JIA Feng, KONG Detong, et al. Opportunities and challenges of machinery intelligent fault diagnosis in big data era [J]. Journal of Mechanical Engineering, 2018, 54(5): 94-104.
[5]何正嘉, 陳進, 王太勇, 等. 機械故障診斷理論及應用 [M]. 北京: 高等教育出版社, 2010.
[6]時獻江, 王桂榮, 司俊山. 機械故障診斷及典型案例解析 [M]. 北京: 化學工業(yè)出版社, 2013.
[7]LEI Yaguo, YANG Bin, JIANG Xinwei, et al. Applications of machine learning to machine fault diagnosis: a review and roadmap [J]. Mechanical Systems and Signal Processing, 2020, 138: 106587.
[8]LIU Xiaozhi, XIE Jie, LUO Yanhong, et al. A novel power transformer fault diagnosis method based on data augmentation for KPCA and deep residual network [J]. Energy Reports, 2023, 9(8): 620-627.
[9]徐統(tǒng), 王紅軍, 宋智勇, 等. 基于K-L散度的VMD瞬時能量與PNN的滾動軸承故障診斷 [J]. 電子測量與儀器學報, 2019, 33(8): 117-123.
XU Tong, WANG Hongjun, SONG Zhiyong, et al. Rolling bearing fault diagnosis using VMD energy feature and PNN based on Kullback-Leibler divergence [J]. Journal of Electronic Measurement and Instrumentation, 2019, 33(8): 117-123.
[10]UNAL M, ONAT M, DEMETGUL M, et al. Fault diagnosis of rolling bearings using a genetic algorithm optimized neural network [J]. Measurement, 2014, 58: 187-196.
[11]LPEZ C, NARANJO , LU Siliang, et al. Hidden Markov model based stochastic resonance and its application to bearing fault diagnosis [J]. Journal of Sound and Vibration, 2022, 528: 116890.
[12]張鑫, 趙建民, 李海平, 等. 基于NIC-DWT-WOASVM的齒輪箱混合故障診斷 [J]. 振動與沖擊, 2020, 39(11): 146-151, 164.
ZHANG Xin, ZHAO Jianmin, LI Haiping, et al. Compound fault diagnosis for gearbox based on NIC-DWT-WOASVM [J]. Journal of Vibration and Shock, 2020, 39(11): 146-151, 164.
[13]HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks [J]. Science, 2006, 313(5786): 504-507.
[14]KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [J]. Communications of the ACM, 2017, 60(6): 84-90.
[15]MCAULEY J J, RAMISA A, CAETANO T S. Optimization of robust loss functions for weakly-labeled image taxonomies [J]. International Journal of Computer Vision, 2013, 104(3): 343-361.
[16]ZHANG Wei, PENG Gaoliang, LI Chuanhao, et al. A new deep learning model for fault diagnosis with good anti-noise and domain adaptation ability on raw vibration signals [J]. Sensors, 2017, 17(2): 425.
[17]康濤, 段蓉凱, 楊磊, 等. 融合多注意力機制的卷積神經(jīng)網(wǎng)絡軸承故障診斷方法 [J]. 西安交通大學學報, 2022, 56(12): 68-77.
KANG Tao, DUAN Rongkai, YANG Lei, et al. Bearing fault diagnosis using convolutional neural network based on a multi-attention mechanism [J]. Journal of Xi’an Jiaotong University, 2022, 56(12): 68-77.
[18]ZHAO Minghang, ZHONG Shisheng, FU Xuyun, et al. Deep residual shrinkage networks for fault diagnosis [J]. IEEE Transactions on Industrial Informatics, 2020, 16(7): 4681-4690.
[19]LI Tianfu, ZHAO Zhibin, SUN Chuang, et al. Wavelet KernelNet: an interpretable deep neural network for industrial intelligent diagnosis [J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2022, 52(4): 2302-2312.
[20]WANG Huan, LIU Zhiliang, PENG Dandan, et al. Interpretable convolutional neural network with multilayer wavelet for noise-robust machinery fault diagnosis [J]. Mechanical Systems and Signal Processing, 2023, 195: 110314.
[21]劉志剛, 錢清泉. 自適應閾值多小波故障暫態(tài)信號去噪方法 [J]. 系統(tǒng)工程與電子技術(shù), 2004, 26(7): 878-880.
LIU Zhigang, QIAN Qingquan. Adaptive shrinkage value de-noising method of fault transient signals with multiwavelets [J]. Systems Engineering and Electronics, 2004, 26(7): 878-880.
[22]袁靜, 何正嘉, 王曉東, 等. 平移不變多小波相鄰系數(shù)降噪方法及其在監(jiān)測診斷中的應用 [J]. 機械工程學報, 2009, 45(4): 155-160.
YUAN Jing, HE Zhengjia, WANG Xiaodong, et al. Translation-invariant multiwavelets denoising using neighboring coefficients and its application to monitoring and diagnosis [J]. Journal of Mechanical Engineering, 2009, 45(4): 155-160.
[23]洪連環(huán). 面向航空發(fā)動機轉(zhuǎn)子系統(tǒng)故障識別的多小波方法研究 [D]. 南京: 南京航空航天大學, 2020.
[24]陳景龍. 自適應多小波的時頻域優(yōu)化構(gòu)造與機械故障特征提取方法 [D]. 西安: 西安交通大學, 2014.
[25]GERONIMO J S, HARDIN D P, MASSOPUST P R. Fractal functions and wavelet expansions based on several scaling functions [J]. Journal of Approximation Theory, 1994, 78(3): 373-401.
[26][JP+4]BUI T D, CHEN Guangyi. [JP+5]Translation-invariant denoising using multiwavelets [J]. IEEE Transactions on Signal Processing, 1998, 46(12): 3414-3420.
[27]SUN Hailiang, HE Zhengjia, ZI Yanyang, et al. Multiwavelet transform and its applications in mechanical fault diagnosis: a review [J]. Mechanical Systems and Signal Processing, 2014, 43(1/2): 1-24.
[28]李東敏. 基于多小波包和人工神經(jīng)網(wǎng)絡的電力系統(tǒng)故障類型識別研究 [D]. 成都: 西南交通大學, 2008.
[29]DAGA A P, FASANA A, MARCHESIELLO S, et al. The Politecnico di Torino rolling bearing test rig: description and analysis of open access data [J]. Mechanical Systems and Signal Processing, 2019, 120: 252-273.