雷高偉,張清華,蘇乃權(quán),邵龍秋
(廣東石油化工學院,廣東省石化裝備故障診斷重點實驗室,廣東茂名 525000)
旋轉(zhuǎn)機械廣泛應(yīng)用于石化、冶金、鋼鐵以及軌道交通等領(lǐng)域,滾動軸承是旋轉(zhuǎn)機械的關(guān)鍵部件之一,并且旋轉(zhuǎn)機械45%~55%故障是由滾動軸承引起的,因此對滾動軸承進行狀態(tài)監(jiān)測和故障診斷有著重要的實際意義。
針對滾動軸承故障診斷,基于振動信號的故障監(jiān)測也存在一定的缺陷,尤其對于大型復(fù)雜的設(shè)備,軸承的振動信號相對于設(shè)備其他部件如轉(zhuǎn)軸、設(shè)備外殼等振動信號強度一般較弱,很容易被淹沒,特別是在軸承早期輕微故障時,振動信號上并沒有反應(yīng),利用聽診棒,卻能聽到軸承運行聲音信號發(fā)生異常。另外,振動監(jiān)測技術(shù)需要把振動傳感器放到特定的位置才能得到較為準確有意義的數(shù)據(jù),并且振動數(shù)據(jù)分布會隨著傳感器的位置不同而改變,而聲傳感器可以放在被監(jiān)測器械外圍方便的地方,且聲學監(jiān)測對故障信號比振動傳感器更敏感。因此,與基于振動信號的監(jiān)測方法相比,基于聲學的監(jiān)測方法具有一定的優(yōu)勢。聽診已被設(shè)備維護工程師使用多年,并被證明是用于檢測軸承和機器運行狀況變化的簡單、有效的方法,幾乎已普及至各工業(yè)領(lǐng)域。傳統(tǒng)的聽診方法包括使用改錐、聽棒(銅棒)等?,F(xiàn)在,電子聽診器已成為企業(yè)設(shè)備巡檢員/點檢員、維護工程師使用的常見的基本檢測儀器。聽診器探針傳聲質(zhì)量高,與麥克風采集的聲音信號相比,不容易被環(huán)境噪聲污染,可以獲得更高的信噪比。在實際中,設(shè)備管理檢修人員對軸承進行巡檢時,常常通過聽軸承的運行聲音是否有異來判斷軸承狀態(tài)的好壞以及故障類型,該方法簡單易行,而且非常有效。但是該做法對人員要求高,而且不能實現(xiàn)自動化診斷。利用深度卷積神經(jīng)網(wǎng)絡(luò)進行滾動軸承故障診斷,具有“一體化”的特點,即將信號濾波、特征提取、特征分類以及故障識別所有過程集成化處理。因此,本文作者提出一種電子聽診器與深度學習相結(jié)合的故障診斷方法。
目前,深度學習被廣泛應(yīng)用于故障診斷領(lǐng)域,并且取得了顯著的診斷效果。文成林、呂菲亞全面總結(jié)了深度學習在故障診斷研究中所使用的算法模型,并提出了“集成創(chuàng)新”、“數(shù)據(jù)+知識”和“多技術(shù)融合”等故障診斷思想。陳保家等利用DBN網(wǎng)絡(luò)強大的自動提取特征能力獲取故障信號的特征,然后對故障信號進行傅里葉變換,再利用DBNs進行故障診斷,獲得高達99.7%的正確率。GAN等利用一種基于CNN的兩層分層檢測網(wǎng)絡(luò),檢測軸承的故障類型和故障程度。曲建嶺等提出一種“端到端”具有自適應(yīng)能力的一維卷積神經(jīng)網(wǎng)絡(luò)故障診斷算法,所搭建的模型在美國凱斯西儲大學(CWRU)滾動軸承數(shù)據(jù)庫上能夠達到99%以上的正確率,并具有良好的泛化能力識別未知故障情況,具有一定的實用性。HOANG、KANG利用基于二維的卷積神經(jīng)網(wǎng)絡(luò)在CWRU軸承數(shù)據(jù)集上識別振動圖像,進行故障的檢測和分類。孫文珺等提出一種將去噪自編碼與稀疏自動編碼器相結(jié)合的深度神經(jīng)網(wǎng)絡(luò)方法,并在訓練過程中運用“dropout”函數(shù)防止過擬合,最終模型的故障診斷能力高于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)。王崇宇等針對汽輪機轉(zhuǎn)子不平衡與不對中故障,提出一種卷積神經(jīng)網(wǎng)絡(luò)的診斷方法,實現(xiàn)了故障類別、位置以及程度的診斷。EREN提出一種利用一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNNs)實現(xiàn)軸承故障快速準確檢測的方法。在計算復(fù)雜度方面,1D-CNNs的實現(xiàn)使得系統(tǒng)更加高效,在不影響故障檢測精度的前提下,降低了計算復(fù)雜度。將深度學習強大的特征提取能力與機械故障大數(shù)據(jù)的特點相結(jié)合,雷亞國等提出了一種新的機械裝備健康監(jiān)測方法,實現(xiàn)了變工況下不同故障位置不同故障類型的故障診斷問題。為了解決深度學習模型訓練數(shù)據(jù)不平衡的問題,JIA等提出了一種深度歸一化卷積神經(jīng)網(wǎng)絡(luò),并在滾動軸承故障診斷中達到較高的準確率。李濤等人提出了一種基于粒子群優(yōu)化(PSO)算法的自適應(yīng) CNN 故障診斷方法,解決了卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型構(gòu)建缺乏自適應(yīng)性等問題。
深度卷積神經(jīng)網(wǎng)絡(luò)起源于圖像處理,具有強大的圖像處理能力,是一種二維卷積神經(jīng)網(wǎng)絡(luò)模型。由于聲音信號屬于一維信號,并不適用于直接處理,因此構(gòu)建一維卷積神經(jīng)網(wǎng)絡(luò)模型,包括三部分,輸入層、特征提取層以及輸出層,其中特征提取層包括卷積層、池化層和全連接層。完整的一維卷積神經(jīng)網(wǎng)絡(luò)如圖1所示。
圖1 一維深度卷積神經(jīng)網(wǎng)絡(luò)模型
卷積層主要用來提取高維特征,對每個卷積中輸出的logits值運用激活函數(shù)進行非線性變換。激活函數(shù)的作用是將原本線性不可分割的多維特征映射到另一個空間中,從而增強特征的線性可分性。采用ReLU函數(shù)作為激活函數(shù),當輸入變量大于零時,其導(dǎo)數(shù)恒為1,解決了梯度彌散問題。卷積運算及輸出數(shù)學表達式為
(1)
其中:為卷積層輸出;為卷積層輸入;為權(quán)值;為偏置;為卷積核大小。
池化層采用降采樣操作,用于提取主要特征和降低維度,可以防止過擬合以及降低計算量。
(2)
全連接層的每一個結(jié)點都與上一層的所有結(jié)點相連,用來把前邊卷積層提取到的局部特征綜合起來。其數(shù)學表達式如式(3):
(3)
Softmax激活函數(shù)又稱歸一化指數(shù)函數(shù),它能將全連接層網(wǎng)絡(luò)輸出的最后一層神經(jīng)元的每一個數(shù)值映射到0~1的一個實數(shù)空間,并且使得所有神經(jīng)元的數(shù)值加起來為1,其數(shù)學表達式如式(4)所示:
(4)
其中:表示輸出層第個神經(jīng)元的值;為類別的個數(shù)。
文中的數(shù)據(jù)是利用瑞典斯凱孚公司的TMST3電子聽診器進行聲音信號采集,軸承型號為6309深溝球軸承,運行在同樣轉(zhuǎn)速2 000 r/min、負載2×10N條件下的運行數(shù)據(jù)。一共包括5種狀態(tài),分別為正常狀態(tài)、內(nèi)圈損傷、外圈損傷、滾動體受損以及煙灰污染狀態(tài),畫出它們的時域波形,如圖2所示。
圖2 5種不同狀態(tài)的軸承聲音信號波形
針對軸承5種不同的狀態(tài),在其穩(wěn)定運行狀態(tài)下,利用電子聽診器采集音頻數(shù)據(jù),每種狀態(tài)音頻時長為12 s,采樣頻率為32 kHz,把12 s音頻數(shù)據(jù)以3∶1的比例分成兩段,9 s作為訓練數(shù)據(jù),3 s作為模型測試數(shù)據(jù),故障樣本數(shù)據(jù)集見表1。其中訓練數(shù)據(jù)集采用重疊采樣的數(shù)據(jù)集增強方法進行處理,每個樣本的長度按照軸承旋轉(zhuǎn)周期進行截取,長度為960個數(shù)據(jù)點,重疊長度為480個數(shù)據(jù)點。測試數(shù)據(jù)集不采用重疊采樣。重疊采樣過程如圖3所示。
表1 滾動軸承故障樣本數(shù)據(jù)集
圖3 重疊采樣過程
為了構(gòu)建具有最佳性能的1D-CNN故障診斷模型,針對模型優(yōu)化器類型、學習率、卷積層數(shù)目、卷積核大小以及每批次處理樣本的數(shù)目等參數(shù),通過反復(fù)試驗的方法進行參數(shù)選擇。
優(yōu)化器是提高訓練速度的一個重要因素。目前常用的最佳優(yōu)化器為Adam,并且與B N聯(lián)合使用在一定程度上防止過擬合作用。若選擇的學習率過高,會導(dǎo)致?lián)p失函數(shù)振蕩,難收斂到最優(yōu)值;相反學習率過低,則訓練效率低,達到收斂所需要的時間較長。在實驗過程中設(shè)置Adam的學習率為0.1、0.01、0.001、0.001 2、0.000 1,在相同數(shù)據(jù)集下保持其他參數(shù)不變,進行200次迭代,得到的結(jié)果記錄見表2。
表2 不同學習率下訓練記錄
從表2可以看出:學習率為0.1、0.01較高時,訓練的正確率偏低,而且訓練過程顯示損失函數(shù)處于較高值,且反復(fù)振蕩,200次迭代都沒有收斂的趨勢;而當學習率為0.000 1時,訓練平均正確率能達到98.3%的高值,但是在訓練過程中其正確率提升的速度較慢,并且可能會陷入局部最優(yōu)的情況,因此綜合考慮選擇學習率為0.001 2。雖然0.001和0.001 2的正確率相差不遠,速度也差不多,但是訓練過程中發(fā)現(xiàn)0.001 2的訓練正確率更穩(wěn)定出現(xiàn)98.9%附近的數(shù)值,損失函數(shù)值的震蕩更小。
嚴格來說卷積層數(shù)不屬于超參數(shù),但是對模型有著重要的影響,所以放在這里和超參數(shù)一起討論。卷積層數(shù)決定了網(wǎng)絡(luò)模型的深度,一定程度上模型深度越深越能充分地提取高維非線性特征,但是層數(shù)過多會導(dǎo)致參數(shù)過多影響訓練的速度,同時增加過擬合的風險。另外,針對不同的對象及任務(wù),卷積層數(shù)也不同,因此需要選擇合適的卷積層數(shù)。卷積核的作用主要用來提取特征,一般來說核的數(shù)量越多,特征提取越充分,并且隨著模型深度的增加,卷積核的數(shù)量倍增。而卷積核的大小則選擇比較常用的兩種3×1和5×1進行實驗,實驗結(jié)果見表3。
表3 不同卷積層數(shù)、卷積核個數(shù)實驗記錄
綜合考慮此數(shù)據(jù)集訓練得到的卷積層數(shù)、卷積核尺寸、準確率以及訓練時間,最終的模型卷積層層數(shù)為4層,每層卷積核個數(shù)分別為16、32、64、128,卷積核尺寸為5×1。
Batch_Size的值太小,會造成模型訓練時間長,收斂速度慢甚至無法收斂;若Batch_Size的值過大,首先顯存可能無法支撐,其次會造成迭代次數(shù)變少而使得參數(shù)修正變得緩慢。通過設(shè)計不同大小的Batch_Size量來訓練模型,并將結(jié)果記錄在表4。
表4 批量處理量對模型判準率的影響
從表4可以看出:Batch_Size的值為16時,雖然正確率高,但訓練模型所需要花費的時間太長;Batch_Size的值為512時,雖然訓練時間短,但正確率低。綜合訓練時間效率以及性能方面考慮,確定1D-CNN故障診斷模型批量處理量為128。
經(jīng)過前面的實驗,最終確定1D-CNN的模型參數(shù)如表5所示。
表5 1D-CNN故障診斷模型參數(shù)
確定最后模型之后,利用表1中的數(shù)據(jù)集進行模型測試,得到的準確率曲線如圖4所示。
圖4 1D-CNN模型訓練正確率曲線
深度學習一直被說成是一個黑匣子。為了更直觀地理解模型的工作過程,利用可視化工具t-SNE對分類過程進行可視化。t-SNE是在SNE(Stochastic Neighbor Embedding)的基礎(chǔ)上發(fā)展而來,由Geoffrey HINTON等于2008年提出,是目前最理想的一種降維機器學習算法,可將高維數(shù)據(jù)降到2維或3維進行可視化,為實現(xiàn)可視化帶來了極大的方便。分類過程可視化結(jié)果如圖5所示。
從圖5可以直觀地看到:原始數(shù)據(jù)全部混和聚集在一起無法分開,隨著不同類別的數(shù)據(jù)隨著模型深度的增加,從不同卷積層輸出的結(jié)果逐漸被分開,到全連接層輸出的結(jié)果幾乎完全分開,這說明了模型的有效性以及網(wǎng)絡(luò)深度的必要性。
圖5 1D-CNN分類過程可視化
針對滾動軸承的故障診斷,提出一種基于電子聽診器與深度學習的故障診斷方法,利用深度卷積神經(jīng)網(wǎng)絡(luò)進行滾動軸承故障診斷,可以直接作用于時域信號,實現(xiàn)“端到端”的學習,具有“一體化”的特點,即將信號濾波、特征提取、特征分類以及故障識別所有過程集成化處理;和傳統(tǒng)采集聲音信號利用麥克風不同,采用的是電子聽診器,利用電子聽診器采集的聲音信號不容易被周圍噪聲污染,得到的信號信噪比更高,不需要去噪處理。