顧 鑫,唐向紅,2,3,陸見光,2,3,黎書文
(1.貴州大學(xué) 現(xiàn)代制造技術(shù)教育部重點實驗室,貴陽 550025;2.貴州大學(xué) 機械工程學(xué)院,貴陽 550025;3.貴州大學(xué) 公共大數(shù)據(jù)國家重點實驗室,貴陽 550025;4.貴州理工學(xué)院 機械工程學(xué)院,貴陽 550003)
滾動軸承是旋轉(zhuǎn)機械中的核心部件,它的穩(wěn)定運轉(zhuǎn)是保證設(shè)備正常工作的重要前提,一旦軸承出現(xiàn)故障,不僅影響設(shè)備的正常運行,還會對工人的生命安全造成隱患[1]。因此,研究軸承的故障診斷具有重要意義。近年來,隨著大數(shù)據(jù)和人工智能的興起[2],基于深度學(xué)習(xí)的軸承故障診斷也隨之成為研究的熱點課題[3]。深度卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)算法中的典型代表之一,在軸承故障診斷的研究中取得了一定的進展。李恒等[4]通過對輸入的振動信號進行短時傅里葉變換,利用深度卷積神經(jīng)網(wǎng)絡(luò)診斷軸承故障,結(jié)果表明該方法有效的實現(xiàn)了“端到端”的故障診斷。文獻[5]中通過對振動信號先進行離散小波變換再通過卷積神經(jīng)網(wǎng)絡(luò)對故障進行分類識別,實驗證明了該方法的有效性。文獻[6]提出一種卷積降噪自編碼器和深度CNN結(jié)合的軸承故障方法,從而實現(xiàn)軸承故障的準確分類。文獻[7]在LeNet-5的基礎(chǔ)上提出基于一維深度CNN的軸承故障診斷方法,實驗結(jié)果表明,該方法不僅有效的識別故障類型而且還提高了模型的抗噪性能。曲建嶺等[8]提出了基于CNN的層級化軸承故障診斷方法,結(jié)果表明該方法具有良好的故障識別性能和泛化性能。上述研究在軸承故障診斷方面取得了較好的效果,深度卷積神經(jīng)網(wǎng)絡(luò)通過逐層交替的卷積層和池化層提取特征,在特征提取方面發(fā)揮出了良好的特性,但是,深度卷積神經(jīng)網(wǎng)絡(luò)采用梯度下降的方法來尋找最合適的權(quán)重值,這導(dǎo)致訓(xùn)練過程會耗費大量的時間,因此,深度卷積神經(jīng)網(wǎng)絡(luò)可以作為一個良好的特征提取器。極限學(xué)習(xí)機ELM是在2006年由Huang等[9]提出的一種單隱層的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,因其具有訓(xùn)練速度快和泛化性能好等優(yōu)勢被廣泛應(yīng)用在各個領(lǐng)域[10-11],可以作為模型的分類器很好的彌補深度CNN訓(xùn)練時間長的缺點。綜上所述,本文提出一種基于深度CNN和極限學(xué)習(xí)機ELM相結(jié)合的故障診斷方法。首先利用深度CNN的強大自適應(yīng)提取特征的能力提取振動信號的特征,然后構(gòu)建ELM分類模型,借助其訓(xùn)練速度快的優(yōu)勢,實現(xiàn)對軸承故障類別的快速有效的分類。實驗結(jié)果表明,該方法可以實現(xiàn)實時高效的“端到端”軸承故障診斷。
卷積神經(jīng)網(wǎng)絡(luò)CNN是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一。近年來,卷積神經(jīng)網(wǎng)絡(luò)CNN被廣泛應(yīng)用在各個領(lǐng)域,比如:在語音識別、人臉識別、自然語言處理甚至腦電波分析等方面均有突破[12]。一個典型的CNN網(wǎng)絡(luò)通常包含輸入層、卷積層、池化層、全連接層和輸出層,其結(jié)構(gòu)如圖1所示。
圖1 典型的CNN網(wǎng)絡(luò)結(jié)構(gòu)示意圖
卷積層中的每個卷積核都代表著一個特征圖,這些卷積核通過一組權(quán)重來卷積前一層的輸入并組成一組特征輸出,成為下一層的輸入。卷積操作過程的數(shù)學(xué)表示為:
(1)
卷積層的后面常接入的是池化層(下采樣層),池化層會對卷積層得到的特征圖進行降維操作,同時在一定程度上也控制了過擬合。常用的池化方法有: 最大值池化(max-pooling)、平均值池化(mean-pooling)、全局最大池化(global average pooling)、隨機池化(stochastic-pooling)等[13]。池化層一般只進行降維操作,沒有參數(shù),不需要進行權(quán)值更新。池化層的數(shù)學(xué)表達式為:
X=f(αdown(x)+b)
(2)
式中:X為輸出;f(·)為激活函數(shù);α為乘性偏置,down()為下采樣函數(shù);b為偏置項。
經(jīng)過前面的卷積層和池化層后,會接一個全連接層進行匯合,然后通過Softmax分類器進行分類。假設(shè)有M類的分類問題,Softmax 分類的數(shù)學(xué)模型表示為:
(3)
式中:S是最終輸出,W是卷積核的權(quán)重矩陣;b是偏置項。
極限學(xué)習(xí)機ELM是一種單隱層前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí)算法,最初是由新加坡南洋理工大學(xué)的Huang教授等人提出的[9,14]。它通常由輸入層、隱藏層、輸出層組成,其中,輸入層的神經(jīng)元個數(shù)由輸入向量的維數(shù)決定,輸出層的神經(jīng)元個數(shù)由輸出的類別決定[15-16]。其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 ELM分類器網(wǎng)絡(luò)結(jié)構(gòu)示意圖
假設(shè)有N個不同的隨機樣本(χm,tm),m=1,2,…,N,
其中:
χm=[χm1,χm2,…,χmn]T∈Rn
tm=[tm1,tm2,…,tmn]T∈Rn
則樣本的線性表達式為:
Wβ=Y
(4)
其中,W表示神經(jīng)網(wǎng)絡(luò)隱藏層的輸出向量:
(5)
Y表示樣本的實際輸出向量:
(6)
h(χ)=g(ω·χ+b)
(7)
式中:g(·)為激活函數(shù);ω為輸入權(quán)重;b為偏置。
則β可以表示為:β=WTY,其中,WT是W的廣義逆矩陣。
本文提出的DCNN-ELM模型結(jié)構(gòu)如圖3所示。
圖3 DCNN-ELM模型結(jié)構(gòu)示意圖
具體的算法步驟如下:1)CNN的輸入:采用重疊取樣的方式對振動信號進行取樣,直接輸入到深度CNN中;
2)深度CNN特征提?。翰捎弥饘咏惶娴木矸e層和最大池化層提取特征,并將此特征輸入到Flatten層展平成一維特征向量,該特征向量通過全連接層做一個特征空間變換,把前面提取到的特征加以提取整合。
3)ELM分類輸出:將步驟2)提取整合到的特征向量作為極限學(xué)習(xí)機ELM的輸入并搭建ELM模型加以訓(xùn)練,利用訓(xùn)練好的ELM模型測試故障類型得出分類準確率的結(jié)果。
為驗證本文所提方法的有效性和泛化性,采用CUT-2軸承實驗平臺采集振動信號對本文方法進行實驗,實驗平臺裝置如圖4所示。該實驗平臺采用的軸承型號為6900ZZ,滾動軸承的故障通過電火花加工技術(shù)點蝕在軸承內(nèi)圈、外圈、球體上,故障直徑為0.2 mm和0.3 mm,軸承故障位置如圖5所示。為全面采集軸承故障的振動信號,振動信號由X、Y、Z軸三方向的加速度傳感器在1 500 r/min的轉(zhuǎn)速下采集得到,采樣頻率為2 kHz。
本次實驗的具體樣本數(shù)據(jù)集如表1所示,共10種軸承故障類型,分別為正常軸承、內(nèi)圈故障(故障直徑0.2 mm)、外圈故障(故障直徑0.2 mm)、滾動體故障(故障直徑0.2 mm)、內(nèi)圈故障(故障直徑0.3 mm)、外圈故障(故障直徑0.3 mm)、滾動體故障(故障直徑0.3 mm)、外圈和滾動體組合故障、外圈和內(nèi)圈組合故障、滾動體和內(nèi)圈組合故障,每類故障類型包含400個樣本,每個樣本包含1 024個數(shù)據(jù)點。故障樣本按照隨機70%的訓(xùn)練集和30%的測試集進行訓(xùn)練和測試。
圖4 CUT-2軸承實驗平臺裝置
圖5 軸承故障位置
表1 CUT-2 樣本數(shù)據(jù)集
經(jīng)多次實驗測試,最終確定的模型參數(shù)如表2所示。
表2 DCNN-ELM模型參數(shù)
本次實驗在Keras框架下完成,硬件環(huán)境為:Windows7 64位操作系統(tǒng),Intel(R)Core(TM)i7-6700 CPU,主頻3.40 GHz,內(nèi)存8 G。
為驗證本文所提方法(DCNN-ELM)的有效性和泛化性,將其與極限學(xué)習(xí)機(ELM),支持向量機(SVM)以及 DCNN-SVM算法在分類準確率、查準率、召回率、F1-Score等4個方面進行比較。在支持向量機SVM模型中,提取時頻域上的六類特征作為輸入,并對其進行數(shù)據(jù)標準化,采用線性核函數(shù)進行分類。其余參數(shù)設(shè)置均與本文方法相同。為避免實驗結(jié)果的偶然性,每種算法均重復(fù)進行10次取平均值,結(jié)果如圖6所示:
由圖6可知,極限學(xué)習(xí)機ELM模型的各項評價指標均為最低,這是因為極限學(xué)習(xí)機為單隱層的學(xué)習(xí)算法,不能很好的提取特征來對軸承故障進行分類。支持向量機SVM模型不僅由于其本身的淺層結(jié)構(gòu)限制了模型性能的提升,而且其需要人工主觀提取特征,過度依賴專家經(jīng)驗,不具有自適應(yīng)性能。值得注意的是,本文提出的DCNN-ELM模型的各項評價指標均高達99%且均略高于DCNN-SVM模型,這得益于深度卷積神經(jīng)網(wǎng)絡(luò)強大的自學(xué)習(xí)提取特征能力。
圖6 不同方法的性能
為了凸顯本文在分類識別階段所用ELM分類器的優(yōu)勢,分別計算了softmax分類器、支持向量機SVM分類器在平均診斷精度、訓(xùn)練時間、測試時間的具體數(shù)據(jù),為避免實驗結(jié)果的偶然性,每種算法均重復(fù)進行10次取平均值,結(jié)果如表3所示。由表3可知,本文在分類識別階段使用的ELM分類器在平均診斷精度方面高于SVM分類器,在訓(xùn)練時間上明顯低于SVM分類器和Softmax分類器,這是因為ELM算法在訓(xùn)練迭代過程中需要調(diào)整的參數(shù)量少,從而縮短了計算時間。因此,綜上所述,本文所提方法可以有效的識別故障類別并可以達到實時性的識別要求。
表3 不同分類器的性能數(shù)據(jù)
為了進一步直觀展示本文所提出的DCNN-ELM模型對各個故障類別的識別結(jié)果,引入混淆矩陣對分類結(jié)果進行展示,如圖7所示。由圖可知,本文所提模型除對個別故障類別的其他故障診斷精度均可以達到100%,可見,本文所提方法對各故障類別具有良好的識別效果。
圖7 DCNN-ELM模型的分類混淆矩陣
1)提出并實現(xiàn)了一種基于深度CNN和極限學(xué)習(xí)機ELM的自適應(yīng)故障診斷方法,該方法結(jié)合了深度CNN強大的有效提取特征的性能和極限學(xué)習(xí)機ELM快速分類的優(yōu)勢。
2)提出的方法能有效的識別軸承的故障類型,在較短時間內(nèi)達到較高的診斷精度,滿足魯棒性和實時性的應(yīng)用要求,為滾動軸承的故障診斷方法提供了新的思路。