彭彬森,夏 虹,王志超,朱少民,楊 波,張汲宇
(核安全與仿真技術國防重點學科重點實驗室(哈爾濱工程大學),哈爾濱 150001)
滾動軸承是很多旋轉機械設備傳動裝置的關鍵部件,由于其運行環(huán)境復雜多樣,因此也是發(fā)生故障最多部件之一[1].一旦發(fā)生故障,輕則影響設備的正常運行,重則引起嚴重的安全事故,并造成巨大的經濟損失及人員傷亡,因此為了提高滾動軸承的安全性,防范事故的發(fā)生,對滾動軸承的運行狀態(tài)進行監(jiān)測及診斷是十分有意義的.
當前針對像滾動軸承的故障診斷方法主要分為兩類:一類是以信號分析為主的傳統(tǒng)診斷方法,這類分析方式需要大量的專家知識;一類是以數據驅動為主的智能機器學習方法,這類方法不需要大量的專家知識,而是依靠模型自動學習數據中的特征信息,從而實現故障診斷,然而對于數據量大,數據維度更高,非線性關系更強的大數據,傳統(tǒng)智能方法特征提取能力很有限,無法完全提取數據的本質特征.因此需要學習能力更強的方法去提取數據的本質特征.
隨著2006年深度學習概念的提出,為解決復雜數據的學習問題提供了有效解決途徑[2-3].經過近幾年的不斷發(fā)展,目前深度學習已成為機器學習中最流行的一個分支,它的實用性范圍廣,極大地促進了人工智能的發(fā)展.當前已有一些采用深度神經網絡去解決滾動軸承故障診斷問題的研究成果,文獻[4]提出深度置信網絡對滾動軸承進行診斷,并用粒子群算法對網絡結構進行了優(yōu)化,采用模擬數據和實驗數據驗證了方法的可靠性.針對旋轉機械的運行條件總是復雜多變,難以從測得的振動信號中自動有效地捕獲有用的故障特征的問題,文獻[5]提出了一種基于深度自編碼器的故障診斷方法,并采用人工魚群算法優(yōu)化深度自動編碼器的關鍵參數,最后用齒輪箱和電力機車滾動軸承的實驗數據對所提方法進行了驗證.針對傳統(tǒng)基于最小二乘支持向量機的故障診斷方法需要手動去提取故障特征的不足,文獻[6]提出了深度棧式最小二乘支持向量機故障診斷模型去自動學習故障特征,所提出的方法在滾動軸承實驗中取得了良好的診斷效果.
考慮到深度學習方法具有強大的學習能力,因此可以獲得比淺層學習方法更好的結果,然而若要使用神經網絡提取到數據的本質特征,則需要的神經網絡層數越多,隨著神經網絡的層數加深,所需要訓練的參數越來越多,計算量也會成倍增長,神經網絡的性能也會出現退化,為了改善這種現象,本文擬采用殘差神經網絡(Residual neurnal network,RNN)來對這種現象進行改進.同時為了增強模型的魯棒性,本文采用多傳感器技術對RNN模型進行改進,建立了多傳感器融合改進的深度殘差神經網絡(Deep residual neural netuork,DRNN)故障診斷模型:DRNN-3S.
CNN模型起源于生物神經視覺研究,通過3個重要思想(稀疏交互、參數共享、等變表示)減少了自由變量的數量,提高了模型的泛化能力,并且提高了訓練速度.經過多年的發(fā)展,已有相對成熟的結構.CNN的基本結構由輸入層、卷積層、池化層、全連接層及輸出層構成[7].卷積過程可視為特征提取的過程,用一張二維圖像I作為輸入,K為卷積核,Z為卷積結果,則卷積過程定義為
(1)
式中:(m,n)為卷積核K的大小,(i,j)為卷積位置.一個卷積層中一般包含多個卷積核,以便提取更多的特征信息.然后將卷積結果輸入到激活函數,計算后得到卷積層的輸出y,計算過程定義為
y=g(Z·W+b).
(2)
式中:W為權值矩陣;b為偏置;g(·)為激活函數.本文設置為常用的線性整流函數(ReLU)[8],定義為
g(x)=max(x,0).
(3)
池化層也稱為子采樣層,通常跟隨在卷積層之后,依據一定的下采樣規(guī)則對特征圖進行下采樣,常用的下采樣方法有max-pooling,mean-pooling等.假設Zsub是池化層的輸出,subsampling(·)為采樣函數,則
Zsub=subsampling(y).
(4)
理論上來說深度神經網絡的結構越深,越能提取到數據的本質特征,然而現有的研究表明深度卷積神經網絡(Deep Convolution neural network,DCNN)將層數提高到一定層數時,模型會出現退化,比如梯度消失或者爆炸.因此,研究人員不斷尋求新的思路來改進模型,現有的改進思路主要分為兩種,一種是改進神經網絡的求解器,然而這種思路在短時間內很難有很大的突破,模型性能提升有限;另一種是改進模型的結構,比如文獻[7,9-10]等提出的深度神經網絡模型.本文選擇新型神經網絡模型RNN作為故障診斷識別模型,它由He等[11]在2015年提出,作為一種新的網絡結構使性能得到很大的提升,并在圖像識別,目標檢測,目標定位等公開數據及上取得了很高的識別率.
一般的CNN是由卷積層、池化層交替堆疊,而RNN由殘差塊構成,其基本結構如圖1所示.
圖1 殘差網絡結構簡圖
圖中x為殘差模塊的輸入,F(x,{Wi})為待訓練的殘差函數,通過跳層連接技術將恒等映射x與F(x,{Wi})相加得到x的估計值H(x),這樣不僅提高了隨機梯度下降算法的學習能力,而且加快了模型收斂速度,提高了模型的泛化能力[12].
本文采用隨機梯度下降法(Stochastic gradient descent,SGD)訓練DRNN,SGD是一種神經網絡優(yōu)化算法,通過在每次迭代訓練過程中從總樣本集中隨機抽取獨立同分布的小樣本,然后用梯度下降法訓練深度神經網絡,這樣能夠提高在樣本集很大時的訓練效率,因此成為了目前深度神經網絡訓練過程中用的最多方法[13].訓練流程如圖2所示,訓練過程可以看作是對DRNN的參數θ={W,b}進行迭代更新求解,其中W為權值矩陣,b為偏置向量,訓練結束后將最后一次訓練的結果保存,作為測試模型.
圖2 神經網絡訓練過程
根據滾動軸承的特征,設計了如圖3所示故障診斷流程,包括離線訓練和在線診斷兩個步驟構成.在離線訓練過程中,首先通過多傳感器采集設備的運行狀態(tài)數據,然后通過數據預處理技術從原始數據中提取特征數據,最后用特征數據去訓練故障診斷模型.在線診斷過程中,首先將在線采集的數據輸入到預處理模塊得到特征數據,然后將特征數據輸入到訓練好的診斷模型中,最后經過識別得到診斷結果.
圖3 滾動軸承故障診斷流程
為了驗證本文提出方法的有效性,用西儲大學的軸承故障實驗數據集[14]測試所提出的方法,實驗臺架如圖4所示.數據集包含3個分別布置在馬達驅動端,風扇端和支撐基板的加速度傳感器(SDE,SFE,SBA)所采集的數據,采樣頻率為12 000 Hz.由于正常狀態(tài)缺乏位于支撐基板傳感器的數據,故用0補全正常狀態(tài)下該傳感器的數據.當前多數研究只針對10種(包括正常、3種不同故障直徑的滾珠故障、3種不同故障直徑的內圈故障、3種不同故障直徑的外圈故障)或者4種(包括正常、滾珠故障、內圈故障、外圈故障)故障狀態(tài)進行診斷識別[15-19],為了體現算法的優(yōu)勢,本文針對其中40種故障狀態(tài)(包括上述10種和4種故障類型)展開了研究,包含4種正常運行狀態(tài),12種滾珠故障,12種內圈故障,12種外圈故障,詳細故障類型及編碼見表1.
表1 故障類型及編碼
圖4 軸承實驗臺
3.2.1短時傅里葉變換(STFT)
當前很多針對振動信號分析方式采用的是頻域分析或時域分析,這樣有可能造成部分特征信息缺失,為了綜合利用時域和頻域的特征信息,本文采用STFT對振動信號進行初級特征提取[20].STFT是一種時頻分析方法,它可以通過窗函數獲取信號特定時間的頻率分布,同時通過在時間軸上移動窗函數,又可以獲取不同頻率的時間分布,因此可以同時提
取頻域特征,又可以提取時域特征.短時傅里葉變換的表達式為
(5)
式中:*為復共軛符號;g(t)為窗函數;f(t)為待分析信號.信號的STFT結果S(ω,τ)反映了待分析信號在τ時刻、頻率為ω的信號分量.
本文窗函數選擇漢明窗函數,窗長度為512,相鄰窗函數采樣重疊率為384,選取連續(xù)8個窗函數提取的頻域特征組成大小為256*8的時頻譜,其時間分辨率為0.085 3 s,頻率范圍為0~6 000 Hz,圖5為一組正常信號的時頻譜,橫坐標包含8個時間點,縱坐標包含256個頻率點,幅值大小用不同的顏色表示,本文既可觀察某一時刻的頻率分布,又可以觀察到某一頻率的時間分布.通過對3個傳感器采集的數據分別進行STFT,然后將單個傳感器信號的時頻譜合并,得到單個大小為256*8*3的樣本數據.將所有故障的特征信號進行變換后,得到大小為5 909的故障樣本集,故障樣本的分布見表2.
圖5 時頻特征頻譜圖
表2 故障樣本分布
3.2.2 數據標準化
在使用機器學習算法之前,常常需要對數據進行標準化處理,這樣可以避免不同量綱的特征參量降低機器學習算法的性能,從而提高訓練效率和準確度.本文采用z-score標準化方法[21]對樣本數據進行預處理,公式定義為
(6)
式中:x為原始數據;x′為標準化后的數據;μ為原始數據的平均值;σ為原始數據的標準差,標準化后的數據服從均值為0,方差為1的標準正態(tài)分布.
本文采用的DRNN-3S模型包含8個殘差模塊,1個卷積層和1個邏輯回歸層,共18層網絡,其結構簡圖如圖 6所示,相關結構參數見表 3.網絡的輸入包含3個通道,輸入值分別為每個傳感器標準化后的初級特征矩陣,每個殘差模塊都可以視為一個特征提取器,它包含兩個卷積層,輸出層的輸出為每種故障的概率.
圖6 殘差網絡結構
表3 DRNN-3S的參數設置
針對滾動軸承故障診斷問題,DCNN是目前研究最多,且診斷精度較高的深度學習方法,故本文選取DCNN作為對比方法進行測試,并基于3個傳感器的特征數據,建立了深度卷積神經網絡故障診斷模型:DCNN-3S;DCNN-3S的結構與參數初始值和DRNN-3S均保持一致,每個卷積層之間用池化層進行優(yōu)化,但沒有跳層連接. 神經網絡訓練參數設置為:學習率α=1,最大迭代次數N=720,小批量大小m=128,訓練方式:GPU;樣本集按照8∶2的比例分為訓練樣本和測試樣本.
圖7為DRNN-3S模型與DCNN-3S模型的訓練精度隨迭代次數變化曲線圖,從中可以看出DRNN-3S的收斂速度明顯要比DCNN-3S快很多,約100次迭代就達到了100%的訓練精度,而DCNN的訓練精度最終在99%處上下波動;圖8為DRNN-3S與DCNN-3S損失函數隨迭代次數變化曲線圖,從中可以看出DRNN-3S的損失函數值的收斂速度也比DCNN-3S快,損失函數值的收斂數量級達到了10-5,而DCNN-3S損失函數值的收斂數量級只有10-3.
圖7 訓練精度變化曲線
圖8 損失函數變化曲線
訓練完成后,用測試數據測試兩個模型的泛化性能,針對40類故障的測試數據,最終,DRNN-3S模型的測試精度為100%,DCNN-3S的測試精度為99.74%.
綜上所述,DRNN-3S在訓練過程中,性能表現更好,充分說明優(yōu)化殘差函數要比原函數要容易的多,且更容易收斂,在測試過程中,DRNN-3S模型的測試精度比DCNN-3S要高,說明DRNN-3S的泛化性能要比DCNN-3S好.
為體現多傳感器融合的優(yōu)勢,分別用一個傳感器(SDE)、兩個傳感器(SDE,SFE)和3個傳感器(SDE,SFE,SBA)采集的數據去構建3個DRNN模型: DRNN-1S, DRNN-2S, DRNN-3S,模型輸入層數據輸入通道分別為1,2和3,其他結構參數和訓練參數均與模型訓練保持一致,圖 9、10分別是不同傳感器數據下的訓練精度收斂曲線和損失函數收斂曲線,從中可以發(fā)現,3個模型的訓練精度最終都可以達到100%,當模型精度達到100%,且損失函數值趨于穩(wěn)定時,模型DRNN-1S, DRNN-2S, DRNN-3S訓練所用的次數分別約為600,350,100次.綜上所述,訓練數據所用的傳感器數量越多,訓練過程收斂速度越快,越穩(wěn)定,因為數據源越多,所提供的信息越豐富,只需要較低的迭代次數,便能找到數據的內在規(guī)律.
圖9 不同傳感器數下訓練精度變化曲線
圖10 不同傳感器數下損失函數變化曲線
實際運行環(huán)境中,采集到的滾動軸承振動信號基本上會受到噪聲的影響,這對故障診斷模型的適應能力形成巨大的考驗.本文通過在原始振動信號中加入高斯白噪聲來模擬實際嘈雜的工作環(huán)境中采集的數據,并用含噪聲的數據來評估故障診斷模型的抗噪性能.根據不同環(huán)境下,噪聲程度不同,本文用信噪比(SNR)來衡量噪聲程度,定義如下:
(7)
式中:Ps為信號功率,Pn為噪聲功率.本文分別用SNR范圍為0~10 dB的噪聲對單個傳感器的數據和所有傳感器的數據進行污染,共得到4組含噪聲的測試數據,然后用包含噪聲的測試數據對DRNN-3S和DCNN-3S模型進行測試,測試結果見表4.從表4中可以看出,在單一傳感器受到噪聲污染的情況下,在不同噪聲程度下,DRNN-3S模型的性能均比DCNN-3S要好,即使信噪比低至0 dB時,DRNN-3S模型均能保持94%以上的診斷精度,其中在只有傳感器SBA受到噪聲感染情況下,模型診斷精度在99.9%以上.當模型的診斷精度保持在100%時,傳感器SDE,SFE,SBA信號的最低SNR分別為8,6,2 dB,因此對DRNN-3S模型而言,傳感器的抗噪能力排名為:SBA>SFE>SDE.在所有傳感器均受到噪聲污染的情況下,相比于單個傳感器受到噪聲污染,模型性能會有所下降,但DRNN-3S模型的性能依舊要比DCNN-3S出色,當噪聲程度SNR≥6 dB時,模型診斷精度在99%以上,而DCNN-3S模型最大診斷精度也只有83.49%.
表4 DRNN-3S模型和 DCNN-3S模型的抗噪測試結果
為了體現多傳感器融合的優(yōu)勢,本文同樣測試了基于單個傳感器采集的數據建立的DRNN診斷模型的抗噪能力.分別用SDE、SFE、SBA采集的數據訓練了3個單傳感器DRNN故障診斷模型:DRNN-DE,DRNN-FE和DRNN-BA,用不含噪聲的測試數據對模型進行測試,可得到模型的測試精度分別為100.00%,100.00%,80.14%.因為傳感器SBA采集的數據沒有正常狀態(tài)的數據,本文中正常狀態(tài)下的數據均由0補充,故造成識別率偏低.
本文首先用信噪比為0~10 dB的噪聲分別對SDE、SFE、SBA采集的數據進行污染,然后用含噪聲的數據對上述模型進行測試,測試結果見表5,通過將結果與表4中的DRNN-3S模型結果進行對比,可以發(fā)現多傳感器融合改進模型在不同信噪比下,診斷精度都比單傳感器模型的精度高,尤其在傳感器SBA受到噪聲污染時,DCNN-BA模型的診斷精度低并且抗噪能力低,然而DRNN-3S模型卻沒有這些短板,這充分說明了多傳感器融合改進模型的抗噪能力更好.
表5 單傳感器故障診斷模型抗噪測試結果
綜上所述,基于多傳感器融合改進的DRNN故障診斷模型DRNN-3S的抗噪能力是相當突出的,不僅提升故障診斷模型的魯棒性,而且具有較強的環(huán)境適應能力.
1)本文針對滾動軸承的故障診斷問題提出了一種基于多傳感器融合改進的深度殘差神經網絡的故障診斷方法,構建了故障診斷模型DRNN-3S,并用滾動軸承實驗數據集對所提出方法的有效性進行了驗證.
2)在模型訓練和多傳感器性能測試階段,DRNN-3S模型的訓練收斂速度更快,且能保持較高的訓練精度和測試精度,均達到100%,充分體現了殘差模型和多傳感器融合的優(yōu)勢.
3)在抗噪能力測試中,DRNN-3S模型表現出良好的抗噪能力.當單一傳感器采集的數據受到噪聲污染時,DRNN-3S 模型能保持至少93.78%的診斷精度,當所有傳感器采集的數據受到噪聲污染時,DRNN-3S模型能保持至少82.54%的診斷精度.