劉 嵐,侯立群
(華北電力大學 自動化系,河北 保定 071003)
故障特征提取和故障分類是設備故障診斷的兩個主要步驟。故障特征提取方法可分為時域法、頻域法和時頻分析法。時域法和頻域法的統(tǒng)計參數很難充分反映設備運行狀態(tài)的動態(tài)變化,而時頻分析法獲得的故障特征通常維度較高、數據量大。此外,設備運行環(huán)境和工況的變化也會增加故障特征的復雜性。這無疑增加了常用故障分類器(如支持向量機和人工神經網絡)的訓練難度[1]。
深度學習具有超強的學習能力。卷積神經網絡(CNN)作為深度學習的重要模型之一,得到了廣泛應用[2,3]。由于2D CNN在圖像識別領域的成功應用,許多研究者利用2D CNN進行故障診斷[4,5]。也有文獻發(fā)現,與單獨使用CNN相比,利用組合方法,先對故障信號進行處理,再進行故障分類,能提高分類精度[6-8]。但是,振動信號是時域下的一維信號,上述方法可能會導致原始振動信號部分特征信息的丟失。此外,信號變換過程往往需要依賴專家經驗,這可能造成原始特征的丟失。因此,適用于圖像處理的2D CNN并不是最適合1D信號處理的網絡模型。
一維卷積神經網絡(1D CNN)的卷積核是一維的,振動信號無需復雜的信號處理就可直接輸入1D CNN。近年來,研究者們開始嘗試利用1D CNN進行故障診斷[9-12]。例如,Turker Ince等人[12]將電機電流信號輸入1D CNN,同時實現故障特征提取與故障分類。
然而,上述網絡也存在一些問題。1D CNN直接輸入高維信號時,需要增加網絡層數來增強對輸入信號深層特征的提取能力,這明顯增加了網絡結構和參數量[13]、計算復雜度和計算資源消耗量,還容易導致梯度消失或梯度爆炸等問題[14]。Kaiming He等人提出的深度殘差網絡[15](ResNet)解決了上述問題,并成功地應用于圖像處理領域。傳統(tǒng)深度殘差網絡(ResNet)的卷積核是二維的,其殘差塊僅有一條殘差連接通道,可通過殘差學習訓練網絡權重,從而有效地解決了深度CNN梯度爆炸和性能下降問題,提高了網絡訓練效率,并成功地應用于故障診斷領域[16-18]。Li等人[18]提出用一維的卷積核代替?zhèn)鹘y(tǒng)殘差網絡卷積核的一維殘差卷積神經網絡(1D-RCNN)進行軸承故障診斷,以便直接從原始信號中提取特征。
雖然,殘差網絡展現了訓練深層網絡的優(yōu)越性,但也存在一些問題。例如,需要倍增網絡層來提高識別準確率[19]、參數量大。因此,如何減少特征重用,提高訓練效率是訓練深層網絡需要解決的重要問題。針對上述問題,本文將一維卷積網絡與改進的殘差網絡相結合,提出了一種基于改進一維殘差網絡的軸承故障診斷方法。該方法對傳統(tǒng)殘差網絡的殘差塊連接方式進行了改進,通過添加一條殘差連接通道的方式來增加殘差網絡寬度,減少網絡層數,提高網絡診斷準確率。該方法無需額外的信號處理和專家經驗,便能有效提取軸承故障特征。
一維卷積網絡的卷積層能夠從原始信號中提取特征,避免了信號處理算法帶來的誤差。但是,分類較長的原始信號往往需要更多的卷積層。為了提高故障特征提取效率,簡化網絡權值的訓練過程,本文將一維卷積網絡與改進的殘差網絡結合,提出了一種基于改進一維殘差網絡的軸承故障診斷方法。
本文所用CNN的網絡結構如圖1所示。
圖1 本文所用CNN的網絡結構Fig.1 Network structure of this paper
輸入層:將不同工況下的一維振動信號作為輸入信號,并采用滑動分割法,獲得更多的實驗樣本?;瑒臃指罘ǖ幕驹砣鐖D2所示。該方法可保持信號的連續(xù)性,使模型具有更強的魯棒性,并有效減少過擬合現象。其分段計算公式如下所示:
圖2 滑動分割法Fig.2 Sliding segmentation method
其中,n為振動信號的采樣點數;L0為重疊的數據點;L為每個樣本所包含的數據點數;N為每類樣本數量。
本文中L0為256,L為1024,N為150。本文共采用6種軸承狀態(tài),每種軸承狀態(tài)150個樣本,共900個樣本。
卷積層:卷積層通過卷積核與其覆蓋區(qū)域的數據進行點積運算來提取高維特征。一維卷積運算輸出特征圖的大小如下所示:
其中,H0是輸出特征圖大??;Hi是輸入特征圖大?。籏是卷積核大??;P是補零層大小;S是卷積步長。本文所用網絡的第一層卷積核大小為1×30,核數為24,步長為2。
全局平均池化層:由于全連接層參數量較大,在深度學習中常采用全局平均池化層代替全連接層,本文所用全局平均池化層大小為1×23,步長為1。
在訓練深度學習網絡時,由于其初始權值一般接近零,淺層參數可能無法更新,容易產生梯度消失問題。隨著訓練的加深,冗余的網絡層學習了不是恒等映射的參數,就會產生退化現象。深度殘差網絡[15](ResNet)的提出可使網絡的信息跨層流動,能減少因多層非線性變換造成的原始特征流失,充分發(fā)揮深層CNN強大的學習能力。殘差網絡將由多個非線性層擬合的復函數L(x)轉化為殘差函數(R(x)=L(x)-x),其中,x是這些層的輸入。殘差連接輸出為:
其中,yl是殘差連接的輸出;xi是輸入;F(xi,Wi)表示神經網絡的非線性變換層;h(xi)表示旁路的傳遞函數。
傳統(tǒng)殘差網絡(ResNet)的殘差塊如圖3所示,輸出Y由卷積層的輸出與殘差通道的輸出相加求得。卷積層之后加入批量歸一化(BN)規(guī)范化前一層輸出,ReLu函數添加在卷積層之后。如果兩層卷積層的輸出與殘差通道的輸出維度相同,則只需要簡單地線性相加,如圖3(a)所示。若維度大小不相同,需要設置殘差連接上1×1卷積核的步長,如圖3(b)所示,來更改低層網絡輸出的維度大小。
圖3 傳統(tǒng)殘差網絡的殘差塊Fig.3 Residual blocks of traditional residual network
傳統(tǒng)殘差網絡(ResNet)的殘差塊只有一個殘差連接通道將低層網絡的特征輸入到高層網絡。當誤差反向傳播時,殘差塊并沒有足夠的權重來學習特征,大部分殘差塊只能共享少量信息,這就造成了故障特征重用的減少[19]。
本文設計了一種加寬的一維殘差塊,其結構如圖4所示,圖4(a)適用于輸入輸出數據維度相同的情況,圖4(b)適用于輸入輸出維度不同的情況。
和傳統(tǒng)的殘差塊相比,該加寬一維殘差塊的卷積核都是一維的,并增加了一條殘差連接通道。1×3卷積核的參數量僅為傳統(tǒng)3×3卷積核的1/3。一個加寬一維殘差塊的參數量也僅為一個傳統(tǒng)殘差塊的2/3。因此,該殘差塊能夠有效減少網絡參數量,提高網絡訓練效率。此外,加寬的網絡結構能使每一層網絡獲得更加豐富的故障特征[20]。因此,無需增加殘差塊的數量便可提高故障分類的正確率。本文所提網絡的4個寬殘差塊采用圖4(b)所示的結構,殘差塊中每一個通道的卷積步長分別為2、1,1×1卷積核的步長為2。核數分別為24、12、6、n。其中,n是待分類的軸承狀態(tài)數。本文是對6種軸承狀態(tài)進行分類,因此殘差單元核數為6。
圖4 加寬的一維殘差塊Fig.4 Widened 1D residual blocks
實驗采用凱斯西儲(CWRU)軸承數據中心[21]驅動端故障和風機端故障的數據。兩種數據的軸承型號分別為SKF6205和SKF6203。安裝在驅動端的加速度傳感器負責采集振動數據,采樣頻率為12kHz。電機轉速為1797r/min,載荷是0HP。
CNN在故障診斷方面的應用往往基于海量數據的訓練學習,實際應用中可供網絡訓練的樣本數往往較少。為了研究所提網絡在不同訓練樣本與測試樣本數量比下所能達到的分類正確率,將900個樣本打亂并從中隨機劃分訓練樣本與測試樣本。其比率設置為7:3,5:5,3:7,1:9。
本實驗對正常與故障尺寸為0.007英寸的驅動端故障和正常與故障尺寸為0.021英寸的驅動端故障進行診斷。每次實驗選取6種軸承狀態(tài),具體見表1。
表1 軸承實驗數據集Table 1 Experimental data set of bearing
每種軸承狀態(tài)取150個樣本,共900個樣本。由于外圈故障是靜止故障,因而故障相對于軸承負載區(qū)的位置直接影響軸承系統(tǒng)的振動響應。為了測試網絡是否能明確區(qū)分外圈不同位置的故障,本實驗選用了外圈6點、外圈3點和外圈12點,3種外圈故障。為了增強數據表現,提高網絡訓練效率,使用min-max標準化方法預處理正常與故障尺寸為0.007英寸的數據,將其映射到[-1,1]區(qū)間。采用Z-score標準化方法預處理正常與故障尺寸為0.021英寸的數據,使之均值為0,標準差為1。
實驗結果見表2。可見,本文所提網絡在4種訓練與測試樣本比率下的正確率均在99%以上,當訓練樣本數僅為總樣本數的10%時(樣本總數900,訓練樣本數90),兩個數據集的錯分樣本數也不超過3個。上述結果表明,在分類正常和驅動端故障數據時,本文所提網絡在樣本數量較少時仍有不俗的表現。
表2 不同比率下兩個軸承數據集的測試結果Table 2 Test results of two bearing datasets at different ratios
兩次實驗中,訓練樣本與測試樣本為1:9的混疊矩陣如圖5所示。
由于從打亂的900個樣本中隨機劃分訓練樣本與測試樣本,因而各種軸承狀態(tài)的測試樣本數量并不全是總測試樣本數的1/6。例如,圖5(a)中并不是每種軸承狀態(tài)的測試樣本個數都是135,其中NOR是137,DE-IR是135、DE-B是 141、DE-OR6是 127、DE-OR3是 138、DEOR12是 131。
圖5 比率為1:9時兩個數據集的混疊矩陣Fig.5 Confusion matrix of two datasets with ratios of 1:9
為了測試網絡對風機端故障的分類效果,利用1797r/min轉速下的正常狀態(tài)(NOR)和故障尺寸為0.007英寸的風機端的內圈故障(FE-IR)、滾珠故障(FE-B)、外圈6點故障(FE-OR6)、外圈3點故障(FE-OR3)、外圈12點故障(FE-OR12)數據對網絡進行測試,每種軸承狀態(tài)取150個樣本。使用min-max標準化方法預處理數據,將其映射到[-1,1]區(qū)間。實驗結果見表3。
1:9比率下的混疊矩陣如圖6所示。
圖6 比率為1:9時正常和風機端故障的混疊矩陣Fig.6 Confusion matrix for normal and fan end failure at ratios of 1:9
由表3可知,當樣本比率為1:9時故障診斷正確率為90.49%;但當訓練樣本數達到總樣本數的30%以上時,分類正確率能達到97.3%以上。
表3 不同比率下正常和風機端故障的測試結果Table 3 Test results of normal and fan end failure under different ratios
本節(jié)采用5倍交叉驗證技術對網絡泛化能力進行進一步評估,測試數據為上述2.1節(jié)、2.2節(jié)所用的測試數據。5倍交叉驗證是將所有樣本數據平均分為5份,每次取其中的4份用來訓練網絡剩下的1份進行測試。通過對5次不同數據分類結果取平均值的方法,避免了因隨機劃分訓練樣本與測試樣本對網絡分類正確率的影響,能夠更好地評估網絡在該組數據下的泛化能力。
經實驗驗證,網絡在這3類測試數據下的5倍交叉驗證的平均結果均能達到100%,說明所提網絡在這3種測試數據下,能夠正確區(qū)分各類軸承狀態(tài),有顯著的泛化能力。
為了進一步驗證網絡的優(yōu)越性,將傳統(tǒng)的一維卷積網絡(1D CNN)、一維深度殘差網絡(1D ResNet)與本文提出的網絡進行對比。測試數據為0.007英寸故障的驅動端和風機端數據,即2.1節(jié)中的數據集1和2.2節(jié)所用數據。1D ResNet的卷積核是一維的,每個殘差塊只有1個殘差連接通道,參數與本文提出的網絡參數相同。為了避免隨機劃分測試集和訓練集的不均衡問題和初始化對實驗結果的影響,比率為1:9時,取10次運行結果的平均值作為最終結果。實驗結果見表4、表5。
表4 3種網絡正常和驅動端故障的正確率Table 4 Correct rate of normal and drive end failure of three kinds of networks
表5 3種網絡正常和風機端故障的正確率Table 5 Correct rate of normal and fan end failure of three kinds of networks
可見,雖然當樣本比率為1:9時,3種網絡的正確率均較低,但是本文所提網絡的故障分類正確率高于1D CNN和1D ResNet的正確率。
本文將一維卷積網絡與改進的殘差網絡結合,提出了一種基于改進一維殘差網絡的軸承故障診斷方法,并利用6種軸承狀態(tài)對所提方法進行了實驗驗證。實驗結論如下:
1)該方法能從原始振動信號中直接提取有效故障特征,避免了依靠人工經驗提取故障特征的影響。
2)加寬的殘差網絡改善了殘差網絡特征重用減少的問題,能夠從較長的原始信號中學習更豐富的特征,提高了診斷精度,簡化故障診斷過程。
3)利用6種軸承狀態(tài)對所提方法進行了分類效果測試。當訓練樣本為90,測試樣本為810(訓練與測試樣本比為1:9)時,驅動端故障診斷的正確率為99.6%;當訓練樣本為270,測試樣本為630(訓練與測試樣本比為3:7)時,風機端故障的正確率為97.3%。本文所提網絡的故障診斷正確率高于1D CNN和1D ResNet。此外,5倍交叉驗證實驗的結果,證明了所提網絡具有較強的泛化能力。