董路南, 鄧艾東, 范永勝, 劉 洋
(1. 東南大學(xué) 能源與環(huán)境學(xué)院, 南京 210096; 2. 大型發(fā)電裝備安全運行與智能測控國家工程研究中心, 南京 210096; 3. 國家能源集團江蘇電力有限公司, 南京 215433)
隨著科學(xué)技術(shù)的不斷發(fā)展,機械設(shè)備成為許多生產(chǎn)過程中的關(guān)鍵部件,而旋轉(zhuǎn)機械設(shè)備對于制造業(yè)的發(fā)展十分重要[1]。風電機組滾動軸承是大型旋轉(zhuǎn)機械的關(guān)鍵部件,在設(shè)備運行過程中,滾動軸承承受巨大的載荷,容易發(fā)生故障。資料顯示,在旋轉(zhuǎn)機械故障中40%以上是軸承故障,其運行狀況影響著整機性能[2],會對安全運行造成巨大影響。因此,有必要對滾動軸承進行故障診斷,提前發(fā)現(xiàn)異常并進行調(diào)整,從而預(yù)防事故發(fā)生[3-5]。
滾動軸承故障診斷方法已經(jīng)有了一定發(fā)展,但目前存在2個主要問題:(1) 需要人為提取傳統(tǒng)特征,針對不同工況下的故障需要提取不同的特征,這將會需要更多的專家經(jīng)驗[6];(2) 在強噪聲、變工況條件下故障特征難以提取,無法有效完成滾動軸承故障診斷。
可采用深度學(xué)習來進行滾動軸承故障診斷,其可以減少對于專家經(jīng)驗的依賴,無需人工提取故障特征,因此在旋轉(zhuǎn)機械故障診斷中得到越來越多的應(yīng)用[7-10]。但是,傳統(tǒng)的深度學(xué)習魯棒性差,容易出現(xiàn)梯度消失,在強噪聲下準確率不高。為此,一些研究者從數(shù)據(jù)和算法兩方面,提出了抵抗噪聲干擾效果較好的模型。李濤等[11]使用自編碼對信號進行降噪,然后輸入到卷積神經(jīng)網(wǎng)絡(luò)完成故障診斷,但過程中需要訓(xùn)練2個模型。文獻[12]~文獻[15]提出了具有一定抗噪性能的模型,不用對數(shù)據(jù)進行處理,但是能實現(xiàn)的最低信噪比為0 dB,對于低于0 dB的強噪聲診斷效果較差。
綜上所述,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)只能利用單一特征,無法提取振動信號更深層次的特征,導(dǎo)致診斷效率不高。結(jié)合自編碼模型后,雖然能夠有效實現(xiàn)故障診斷,但是需要訓(xùn)練2個模型,診斷時間過長。此外,其他傳統(tǒng)深度學(xué)習模型在信噪比低于0 dB的強噪聲環(huán)境下,診斷效果較差。
針對上述問題,筆者提出一種基于變分模態(tài)分解(VMD)和改進的稠密連接網(wǎng)絡(luò)(DenseNet)模型。VMD能夠?qū)⒄駝有盘柊凑疹l率進行劃分,通過相關(guān)系數(shù)法篩選出相關(guān)性最小的本征模態(tài)分量(IMF),再將其余模態(tài)分量重構(gòu),實現(xiàn)信號的初步降噪。DenseNet網(wǎng)絡(luò)首先利用“卷積+池化”單元提取多維特征,再引入通道注意力機制使模型更關(guān)注具有區(qū)分度的特征,從而加強模型特征提取能力,然后利用多個DenseBlock塊實現(xiàn)特征重用,加強了特征的傳遞,從而提取更多的有效特征。同時其訓(xùn)練參數(shù)更少,有效緩解了梯度消失問題,從而更高效地實現(xiàn)滾動軸承故障診斷。
變分模態(tài)分解是一種基于經(jīng)典維納濾波和希爾伯特變換的自適應(yīng)和完全非遞歸的模態(tài)變分和信號處理方法。該方法的優(yōu)點是可以確定模態(tài)分解的個數(shù),自適應(yīng)性表現(xiàn)為可以根據(jù)實際情況確定模態(tài)分解的個數(shù)、最佳中心頻率和有限帶寬,分解之后得到的固有模態(tài)分量可以將原始信號按照頻域進行有效劃分。變分模態(tài)分解的核心思想是構(gòu)建和求解變分問題。
變分問題的約束條件為所有模態(tài)之和與原始信號相同。變分模型如下:
(1)
式中:uk為各模態(tài)分量;ωk為各模態(tài)分量的中心頻率;δ(t)為脈沖函數(shù);k為模態(tài)數(shù);f為原始信號;t為時間。
求解變分問題,引入拉格朗日乘子λ和二次懲罰因子α,將構(gòu)造的變分模型轉(zhuǎn)化為無約束變分求解問題,拉格朗日函數(shù)L({uk},{ωk},λ)如下:
(2)
(3)
(4)
拉格朗日算子更新公式如下:
(5)
當滿足式(6),則停止迭代:
(6)
其中,當ε為10-7時計算結(jié)束。
為了更好地進行特征提取,深度網(wǎng)絡(luò)需要不斷增加網(wǎng)絡(luò)深度。但是,隨著深度神經(jīng)網(wǎng)絡(luò)層數(shù)的不斷增加,會出現(xiàn)梯度消失或者爆炸等情況,阻礙了深度神經(jīng)網(wǎng)絡(luò)的發(fā)展。DenseNet網(wǎng)絡(luò)突破了傳統(tǒng)思維,不再使用加深網(wǎng)絡(luò)層數(shù)和加寬網(wǎng)絡(luò)結(jié)構(gòu)的方式,而是從特征的角度出發(fā),采用特征重用和旁路的設(shè)置,以前面所有層的輸出作為輸入。同時網(wǎng)絡(luò)更窄,這樣可以大大減少網(wǎng)絡(luò)參數(shù),有效避免梯度消失的產(chǎn)生。
DenseBlock和Transitionlayer是DenseNet的重要部分。
(1) DenseBlock
DenseBlock作為DenseNet的核心組成部分,其結(jié)構(gòu)如圖1所示。DenseBlock在層之間的計算公式如下:
xl=Hl([x0,x1,x2,…,xl-1])
(7)
式中:xl為第l層網(wǎng)絡(luò)的輸出;x0,x1,…,xl-1為各個輸入層的輸入;Hl為非線性變換函數(shù),是一種組合運算,包括BN+Relu+1×1Conv+BN+Relu+3×3Conv。
DenseBlock中還有一個重要參數(shù)K,稱為增長率(GrowthRate)。假設(shè)輸入特征圖的通道數(shù)為K0,那么第l層的通道數(shù)就變成K0+(l-1)K。從第二層開始,每一層都會按照設(shè)定的增長率增加通道數(shù),然后和前一層進行拼接。
(2) Transitionlayer
經(jīng)過DenseBlock層之后,輸出特征圖像的維度會急劇增加。因此,在2個DenseBlock之間增加Transitionlayer,傳導(dǎo)層是由1×1卷積和2×2的AvgPool組成。其中,1×1的卷積層在提取特征的同時可以減少通道數(shù)量,具有壓縮模型的作用,池化層可以對提取的特征圖進行降維。
當滾動軸承出現(xiàn)故障時,局部故障源和健康部位沖擊產(chǎn)生振動,不同部位發(fā)生故障產(chǎn)生的振動信號不完全相同,為了增大不同故障的區(qū)分度,引入通道注意力機制。
加入通道注意力機制可以對不同特征賦予不同的權(quán)重,故障特征的權(quán)重更大,使得模型更加關(guān)注故障特征,從而增強了模型的診斷性能。模型如圖2所示。
圖2 通道注意力機制Fig.2 Channel attention mechanism
設(shè)輸入通道注意力機制的矩陣為X∈RH×1×W,其中H為通道數(shù),W為數(shù)據(jù)長度。中間向量c∈RH/R×1×1,R為通道壓縮量。2個擠壓-激勵網(wǎng)絡(luò)輸出結(jié)果相加得到新的特征向量c′=RH×1×1。通道注意力機制輸出矩陣C為:
C=X·σ(c′)
(8)
其中,σ表示sigmoid函數(shù)。
所提出的模型為VMD和改進的DenseNet,該模型以加噪聲的振動信號作為輸入,首先經(jīng)過VMD分解,根據(jù)經(jīng)驗選取K=4,α=2 000,然后根據(jù)相關(guān)系數(shù)篩選出相關(guān)性較大的3個模態(tài)分量,將這些模態(tài)進行重構(gòu)。再將重構(gòu)信號轉(zhuǎn)化為二維圖像,最后將二維圖像送入DenseNet網(wǎng)絡(luò)。
DenseNet網(wǎng)絡(luò)首先經(jīng)過一個“卷積+池化”單元,用來提取多維特征。然后增加一個通道注意力機制使模型更加關(guān)注具有區(qū)分度的特征,從而加強模型特征提取能力。再分別經(jīng)過DenseBlock、Transitionlayer、AvgPool和Softmax等結(jié)構(gòu)完成故障診斷。模型結(jié)構(gòu)如圖3所示,模型具體參數(shù)見表1。
圖3 VMD和改進DenseNet模型Fig.3 VMD and improved DenseNet model
表1 模型結(jié)構(gòu)參數(shù)Tab.1 Structural parameters of the model
為了驗證所提模型的有效性,實驗采用凱斯西儲大學(xué)(CWRU)滾動軸承振動數(shù)據(jù)集。該試驗臺是由1.5 kW的電動機和功率計組成,軸承包括驅(qū)動端和風扇端,驅(qū)動端軸承型號為SKF-6205,其采樣頻率為12 kHz,轉(zhuǎn)速為1 797 r/min,包括0 hp、1 hp、2 hp和3 hp 4種負載(1 hp=735.499 W)。軸承數(shù)據(jù)包括正常數(shù)據(jù)、內(nèi)圈故障數(shù)據(jù)、外圈故障數(shù)據(jù)和滾動體故障數(shù)據(jù)4種類型。每種故障數(shù)據(jù)又包括3種尺寸:0.007 in、0.014 in和0.021 in(1 in=2.54 cm)。最終軸承數(shù)據(jù)分為10種,包括9種故障數(shù)據(jù)和1種正常數(shù)據(jù)。
為避免數(shù)據(jù)過少導(dǎo)致模型出現(xiàn)過擬合,采取數(shù)據(jù)重疊分割的方法進行數(shù)據(jù)增強。從正常數(shù)據(jù)起始點開始采集,每次采集1 024個點,采集結(jié)束后向后移動200個點繼續(xù)采集,最終共6 000個樣本。其中,4 500個樣本劃分為訓(xùn)練集,1 500個樣本劃分為測試集。創(chuàng)建數(shù)據(jù)集見表2。
實驗在pytorch深度學(xué)習框架下進行,訓(xùn)練前將數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集,比例分別為65%、10%和25%。epoch取100,learningrate為0.001,損失函數(shù)選用交叉熵損失函數(shù),DenseNet網(wǎng)絡(luò)輸入的圖像尺寸為32×32。
表2 實驗數(shù)據(jù)匯總
網(wǎng)絡(luò)模型中DenseBlock數(shù)量選取為3。在相同實驗數(shù)據(jù)下對比數(shù)量不同的Denselayer對診斷準確率的影響。當Denselayer取1時準確率為98.53%;取2時,準確率為99.60%;取3時,準確率為96.60%。因此,最終確定本文模型中的Denselayer數(shù)量為2。
CWRU滾動軸承振動數(shù)據(jù)是在試驗環(huán)境中進行的,與實際工業(yè)場景相比缺少了噪聲干擾。為了還原真實的工業(yè)環(huán)境,加入一定信噪比(S)的白噪聲來驗證所提方法的有效性。信噪比是衡量信號中所含噪聲大小的重要指標,計算公式如下:
(9)
式中:Psignal為信號功率;Pnoise為噪聲功率。
3.3.1 VMD降噪
當原始振動信號加入一定信噪比的噪聲后,原始信號的特征信息會被噪聲淹沒,這將會加大故障診斷的難度。筆者將正常狀態(tài)的軸承原始振動信號加入信噪比為-4 dB的噪聲信號,然后經(jīng)過VMD分解進行降噪。降噪過程如圖4所示。
從圖4可以看出,加入噪聲后,原始振動信號完全被淹沒,只能看到均勻的噪聲信號。經(jīng)過VMD分解,選取相關(guān)性較高的IMF,然后重構(gòu)信號。從圖4可以看出,VMD分解后噪聲信號明顯減少,表明了VMD在降噪方面的優(yōu)勢。
3.3.2 模型診斷準確率對比
采用CWRU軸承數(shù)據(jù)集,選用0 hp負載數(shù)據(jù)。加入-4 dB信噪比的噪聲進行分析,在相同數(shù)據(jù)集下將對比分析本文模型、膠囊網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)(FD-CNN)[16]、基于多層降噪技術(shù)及改進卷積神經(jīng)網(wǎng)絡(luò)(ICNN)[17]、CNN、VMD-CNN和VMD-DenseNet。不同模型的診斷準確率如圖5所示。
(a) 正常狀態(tài)
圖5 診斷準確率對比Fig.5 Comparison of diagnostic accuracy
由圖5可知,在S=-4 dB環(huán)境下,CNN模型的診斷準確率為84.05%,效果較差;VMD-CNN模型的診斷準確率有所提升,體現(xiàn)了VMD在降噪方面的優(yōu)勢;與CNN模型相比,FD-CNN和ICNN模型的診斷準確率分別提升12.46%和15.35%;VMD-DenseNet模型的診斷準確率相對較高,體現(xiàn)了DenseNet網(wǎng)絡(luò)的優(yōu)越性;本文模型診斷準確率最高,為99.87%,說明通過VMD初步降噪,結(jié)合DenseNet強大的特征提取能力,并引入通道注意力機制,能夠更高效地實現(xiàn)強噪聲下的滾動軸承故障診斷。
3.3.3 模型抗噪性能分析
為了進一步驗證所提模型的優(yōu)越性,改變噪聲大小,在-10~10 dB噪聲范圍內(nèi)驗證本文模型的抗噪性。由于ICNN、VMD-DenseNet及本文模型的診斷準確率相對較高,因此,對這3種模型進行比較,結(jié)果如圖6所示。
圖6 不同噪聲下的模型準確率Fig.6 Model accuracy under different noise
由圖6可知,信噪比為-10 dB時,VMD-DenseNet模型和ICNN模型的診斷準確率分別為96.17%和85.39%,本文模型準確率為99.27%;信噪比為-6 dB時,ICNN模型和VMD-DenseNet模型的診斷準確率分別為95.17%和97.35%,本文模型診斷準確率為99.80%;隨著信噪比的不斷增加,診斷準確率主要取決于模型自身特征提取的能力,各模型的診斷準確率逐漸趨近于100%。因此,本文模型在不同信噪比的噪聲下均具有更好的診斷性能。
3.3.4 訓(xùn)練過程分析
為了分析本文模型的訓(xùn)練情況與性能,圖7給出了模型診斷準確率和損失函數(shù)在訓(xùn)練過程中的變化情況。
由圖7(a)可以看出,迭代次數(shù)為20時,模型準確率已達97%,迭代次數(shù)為80時,模型完成收斂,準確率到達穩(wěn)定。由圖7(b)可以看出,損失函數(shù)下降很快,迭代次數(shù)為20時,損失函數(shù)已下降到很低,迭代次數(shù)為80時模型基本達到穩(wěn)定,說明模型訓(xùn)練過程較為穩(wěn)定。
3.3.5 診斷結(jié)果分析
為進一步分析本文模型在10種不同類別下的預(yù)測準確率,圖8為本文模型在信噪比為-4 dB時的診斷準確率混淆矩陣。其中,“Normal”代表正常狀態(tài);“B007”代表故障尺寸為0.007 in的滾動體故障;“IR”、“OR”分別代表內(nèi)圈和外圈故障。
從圖8可以看出,在“Normal”等8種類別下的診斷準確率達到了100%,而在“B014”和“IR021”2種類別下出現(xiàn)了錯誤,診斷準確率為99%。
(a) 診斷準確率
(b) 損失函數(shù)圖7 訓(xùn)練過程分析Fig.7 Analysis of training process
圖8 診斷準確率混淆矩陣Fig.8 Diagnostic accuracy confusion matrix
(1) 對比FD-CNN模型、ICNN模型、CNN模型、VMD-CNN模型和VMD-DenseNet模型,本文模型在不同信噪比情況下均具有較高的故障診斷精度,訓(xùn)練過程穩(wěn)定,收斂速度快,魯棒性好。
(2) 本文模型在強噪聲下的優(yōu)勢主要是利用了VMD降噪、DenseNet網(wǎng)絡(luò)強大的特征提取能力以及通道注意力機制對故障特征的關(guān)注。