陳志強, 鄧生財, 陳旭東,2, 李 川
(1.重慶工商大學(xué) 國家智能制造服務(wù)國際科技合作基地,重慶 400067;2.重慶工商大學(xué) 計算機科學(xué)與信息工程學(xué)院,重慶 400067)
在故障自動診斷領(lǐng)域,存在兩大主流技術(shù):數(shù)學(xué)模型驅(qū)動的故障診斷技術(shù)和數(shù)據(jù)驅(qū)動下的故障診斷技術(shù)[1]。對于復(fù)雜的機械系統(tǒng),獲取精確的數(shù)學(xué)模型難度很大。因此數(shù)學(xué)模型驅(qū)動的故障診斷技術(shù)受到的局限性相當大[2]。而數(shù)據(jù)驅(qū)動的故障診斷技術(shù),主要是利用機械系統(tǒng)的狀態(tài)信號中包含的豐富的設(shè)備狀態(tài)信息,基于信號分析和人工智能等技術(shù),識別故障。計算機科學(xué)技術(shù)的發(fā)展和人工智能技術(shù)的快速發(fā)展,推動了后者在故障診斷領(lǐng)域中的應(yīng)用。
在海量狀態(tài)數(shù)據(jù)驅(qū)動下,機器學(xué)習(xí)方法被廣泛應(yīng)用于機械設(shè)備故障診斷。其中最廣泛使用的是支持向量機[3-4](Support Vector Machine, SVM)和神經(jīng)網(wǎng)絡(luò)[5](Neural Networks, NN)。圍繞著SVM和NN, 相當數(shù)量的變種也不斷被提出。但是傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)屬于淺層學(xué)習(xí),并且易陷入局部最優(yōu),因此不能夠深入的學(xué)習(xí)到數(shù)據(jù)中的大量潛在特征,而SVM模型中不同核函數(shù)的選擇,對實驗結(jié)果也有不同的影響。
為了克服以上問題,深度學(xué)習(xí)技術(shù)正日益成為機械設(shè)備智能故障領(lǐng)域深具潛力的工具。文獻[6]提出了基于卷積神經(jīng)網(wǎng)絡(luò)的方法進行齒輪箱故障診斷,文獻[7]提出了基于深度信念網(wǎng)的方法進行往復(fù)式壓縮機閥門故障識別,文獻[8]利用深度波爾茲曼機(Deep Boltzmann Machines,DBM)模型進行手寫數(shù)字的識別,并取得了不錯的效果。
工作中,擬將深度解析深度玻爾曼茲機在故障診斷中的應(yīng)用。首先,基于一個滾動軸承故障實驗平臺,對提出的深度玻爾曼茲機故障診斷系統(tǒng)進行了性能評估。7種故障模式的海量振動信號被采集,然后對采集的振動信號進行分析,提取其時域、頻域和時頻域的特征,采用DBM方法進行更深層次的特征學(xué)習(xí)與滾動軸承的故障識別。然后,將提出的玻爾曼茲機故障診斷系統(tǒng)應(yīng)用于真實的航空渦噴發(fā)動機系統(tǒng)的故障診斷。
深度波爾茲曼機是一個隨機對稱聯(lián)接的無向二部圖結(jié)構(gòu)[9],它可簡單的看作由若干個受限波爾茲曼機(Restricted Boltzmann Machines, RBM)堆棧而成。RBM具有一個可視層和一個隱藏層,其中可視層的神經(jīng)元用于數(shù)據(jù)輸入,隱含層的神經(jīng)元用于特征學(xué)習(xí),相同層之間的神經(jīng)元無連接,不同層之間的神經(jīng)元全連接且相互獨立。圖1所示為一個堆疊了L層RBM的DBM模型結(jié)構(gòu)圖。
圖1 L個隱藏層的DBM結(jié)構(gòu)圖
1.1.1 RBM模型定義
對于一個可見層具有m個神經(jīng)元,隱藏層具有n個神經(jīng)元的RBM模型的能量函數(shù)定義如式(1)所示[9-10]:
(1)
v和h分別表示隱藏層神經(jīng)元和可見層神經(jīng)元, 為待求參數(shù),b和c分別表示與隱藏層神經(jīng)元和可見層神經(jīng)元相關(guān)的偏置, 表示隱藏層神經(jīng)元與可見層神經(jīng)元連接的權(quán)重。基于能量函數(shù),則(v,h)的聯(lián)合概率分布為:
(2)
其中Z(θ)為歸一化因子。根據(jù)能量函數(shù),則每個可見層神經(jīng)元與隱藏層神經(jīng)元被激活的條件概率如下:
(3)
(4)
1.1.2 模型參數(shù)求解
對于一個實際問題,真正關(guān)心的是觀測數(shù)據(jù)v的真實分布,即p(v|θ)。假設(shè)給定T個訓(xùn)練樣本,訓(xùn)練RBM模型的目的是求解最優(yōu)的參數(shù)θ的值,則問題可轉(zhuǎn)化為求解最大化對數(shù)似然函數(shù)的參數(shù)估計問題,即:
(5)
為了便于標記,分別用d和m表示
p(h|vt,θ)和p(v,h|θ)的概率分布,則對于參數(shù)θ中每個參數(shù)求偏導(dǎo)數(shù)有:
(6)
由于式〈?〉m含有歸一化因子Z(θ),使得模型難以求解,對此,Salakhutdinov等[9]提出了基于吉布斯采樣的對比散度算法來近似求解。
1.1.3 DBM模型訓(xùn)練
文獻[9]介紹了一種逐層訓(xùn)練棧式RBM的貪婪算法來訓(xùn)練DBM模型,文獻[10]提出基于對比散度(CD)算法來訓(xùn)練RBM,從而使得重構(gòu)誤差更快收斂。DBM模型的訓(xùn)練過程包含兩個階段:
第一階段:采用無監(jiān)督學(xué)習(xí)訓(xùn)練網(wǎng)絡(luò),訓(xùn)練過程如下:
(1) 將特征數(shù)據(jù)輸入第一個受限玻爾曼茲機RBM1,假設(shè)其可視層為v,采用一步對比散度算法, 基于重構(gòu)的可視層矢量中場值,學(xué)習(xí)計算得到隱藏層第一層h(1)、層間自頂向下的連接權(quán)值W(1),層間自底向上的連接權(quán)值矩陣為2W(1);
(2) 凍結(jié)RBM1的自底向上的連接權(quán)值矩陣為2W(1),按照條件概率P(h(1)|v;2W(1))抽樣,提取特征h(1)作為第一個受限玻爾曼茲機RBM2的輸入;RBM2自頂向下和自底向上兩個方向的連接權(quán)值都為2W(2),基于重構(gòu)的可視層矢量中場值,采用一步對比散度算法,訓(xùn)練RBM2;
(3) 凍結(jié)RBM2的連接權(quán)值矩陣為2W(2), 按照條件概率P(h(2)|v;2W(1),2W(2))抽樣提取特征h(2),作為RBM3的輸入,訓(xùn)練方式同步驟(1)和(2);
(4) 步驟(3)進行遞歸處理,直到L-1層,L指深度波爾曼茲機的隱藏層數(shù);
(5) 使用一步對比散度算法訓(xùn)練頂層的受限玻爾曼茲機RBM,約束條件為:自底向上的連接權(quán)重為W(L),自頂向下的連接權(quán)重為2W(L);
(6) 使用連接權(quán)值{W(1),W(2),…,W(L)},構(gòu)建一個深度波爾曼茲機;
第二階段:采用有監(jiān)督學(xué)習(xí),利用梯度下降方法,對整個網(wǎng)絡(luò)進行參數(shù)微調(diào)。
基于DBM構(gòu)建的設(shè)備故障診斷系統(tǒng)如圖2所示。
圖2 DBM設(shè)備故障診斷系統(tǒng)
機械的振動信號包含了豐富的狀態(tài)信息。如設(shè)備的某個部件失效時,會引起振動信號振幅、頻率和相位等信息的變化。振動特征參數(shù)比起其他參數(shù)(如介質(zhì)溫度、聲學(xué)信號等)更能直接快速準確地反映系統(tǒng)結(jié)構(gòu)的運行狀態(tài),所以設(shè)備的振動狀態(tài)、測量和分析振動信號是設(shè)備的故障診斷與維護的主要手段,也是機器運行狀態(tài)診斷的主要依據(jù)之一。振幅、頻率、相位是分析振動信號主要特征參數(shù)。這里的特征可以是振動幅值的變化、頻率的變化、相位的變化、調(diào)制參數(shù)的變化等多種形式。在工作中,基于采集的振動信號,對設(shè)備進行狀態(tài)分析和故障診斷。從振動信號的時域、頻域和時頻域3個角度進行預(yù)處理,以此進行融合,作為DBM模型輸入。
時域統(tǒng)計特征的計算分析,可以反映信號在不同時刻的相關(guān)性,可獲得設(shè)備在運行狀態(tài)時的特征參數(shù),可以為機械設(shè)備動態(tài)分析和故障診斷提供有效的信息。選取的時域統(tǒng)計特征有均值、標準差、均方根、峰度、形態(tài)因子、峰值因子和脈沖因子共7個參數(shù)。這些時域特征的計算公式同文獻[6]。
時域的統(tǒng)計特征,包含的振動信號信息完全還不足以客觀的反映滾動軸承的運行狀態(tài),因此還要結(jié)合頻域特征分析。工作中,振動信號的頻域特征提取如下:首先將振動信號進行快速傅里葉變換,然后將頻率均分成若干頻帶,并求出每段頻帶的均方根來表達頻域特征。其計算公式同文獻[6]。
不同頻帶的能量譜也可以反應(yīng)機械設(shè)備的運行狀態(tài),使用6層小波包分解的方法把滾動軸承的原始振動信號分解到不同的頻帶中,采用各頻帶的能量值來代表時頻特征。每個子頻帶的能量值計算如下:
(7)
上述3種振動信號特征,包括7個時域特征,125個頻帶的均方根值,以及64個能量值特征,融合成一個特征向量,并以此代表每個振動信號特征參數(shù),作為DBM模型輸入。
圖3實驗平臺
Fig.3Experimentalplatform
實驗平臺如圖3所示、振動信號采集條件如表1所示,7種軸承故障狀態(tài)模式如表2所定義。每種模式各采集了450段振動信號數(shù)據(jù)集,合計采集3 150個信號樣本。其中隨機抽取2 200個樣本作為分類模型的訓(xùn)練樣本,剩余的作為測試樣本。
表1 信號采集條件
表2 故障模式定義
通過把第二部分提取的時域、頻域和時頻域組成的特征向量作為參數(shù)輸入DBM模型,然后對DBM模型的4個參數(shù)進行了挖掘與分析,來評估分類方法對于軸承故障分類的有效性。這4個參數(shù)分別是:DBM分類模型的隱藏層數(shù)(NL)、隱藏層神經(jīng)元數(shù)(Nu)、預(yù)訓(xùn)迭代次數(shù)Epoch1、預(yù)訓(xùn)的學(xué)習(xí)率η。
深度學(xué)習(xí)問題中,隱藏層數(shù)的確定沒有一個完全確定的理論支撐,一般來說,隱藏層數(shù)太少,難以學(xué)習(xí)數(shù)據(jù)的全部特征,造成特征缺失,從而導(dǎo)致欠擬合的現(xiàn)象,但是,如果隱藏層數(shù)太多,可能會造成過度學(xué)習(xí),導(dǎo)致特征冗余和過擬合的現(xiàn)象,因此合適的隱藏層數(shù)選擇對分類模型的有效性顯得至關(guān)重要。通過試探性實驗來確定隱藏層的數(shù)量。實驗結(jié)果如表3所示。
表3 隱藏層數(shù)調(diào)整
由表3可知,隨著隱藏層數(shù)的增加,DBM模型分類的準確率在明顯的下降,當隱藏層數(shù)為1時,故障分類準確率最高,達到了98.29%。
隱藏層神經(jīng)元的個數(shù)對特征學(xué)習(xí)也有很重要的影響,一般來說,各神經(jīng)元個數(shù)越多,特征學(xué)習(xí)越充分,但是當超過某一個度時,仍然會造成過擬合的現(xiàn)象,從而導(dǎo)致分類準確率下降,影響模型的分類性能,神經(jīng)元數(shù)量調(diào)整實驗結(jié)果如表4所示。
表4 神經(jīng)元數(shù)量調(diào)整
由表4可知,當神經(jīng)元數(shù)量由50增加到100時,DBM模型的故障分類準確率隨著神經(jīng)元數(shù)量的增加而增加,但當神經(jīng)元數(shù)量繼續(xù)增加時,DBM模型故障分類準確率在下降。當神經(jīng)元數(shù)量為100時,分類準確率最高為99.43%。
DBM模型是由若干個RBM堆棧而成,因此每個RBM訓(xùn)練的好壞直接影響著DBM模型的分類效果。而訓(xùn)練每個RBM的時,預(yù)訓(xùn)迭代次數(shù)參數(shù)將會對RBM的性能產(chǎn)生重要影響。圖4記錄了每個RBM在不同迭代次數(shù)下,最終的DBM的分類準確率。由圖4知,當增大RBM的預(yù)訓(xùn)迭代次數(shù)時,DBM的分類準確率在下降,當預(yù)訓(xùn)迭代次數(shù)為1時獲得最高分類準確率。
圖4 預(yù)訓(xùn)迭代次數(shù)調(diào)整
預(yù)訓(xùn)學(xué)習(xí)率η也是影響DBM分類準確率的重要參數(shù),一般來說,學(xué)習(xí)率過小,則導(dǎo)致模型收斂的速度較慢,訓(xùn)練時間過長,會增加時間成本;學(xué)習(xí)率過大,雖然能夠快速收斂于局部最小值,但最終分類效果可能不好。在考慮時間成本和硬件成本的前提下,圖5記錄了4組在不同學(xué)習(xí)率下,DBM模型的分類準確率。
圖5顯示,當RBM學(xué)習(xí)率較小時,DBM的分類準確較高,在0.001時分類準確率最高,為99.52%,但是隨著學(xué)習(xí)率的增大,模型分類準確率逐漸下降,在學(xué)習(xí)率為0.5和1時,模型的分類準確率低于30%。
圖5 預(yù)訓(xùn)學(xué)習(xí)率調(diào)整
綜上分析,最優(yōu)參數(shù)組合如下:隱藏層數(shù)NL=1、隱藏層神經(jīng)元數(shù)Nu=100、預(yù)訓(xùn)迭代次數(shù)Epoch1=1、預(yù)訓(xùn)的學(xué)習(xí)率η=0.001。
2.3.1 DBM最優(yōu)參數(shù)分類結(jié)果
基于最優(yōu)參數(shù)組合的DBM分類,圖6混淆矩陣展示了1 150個測試樣本的分類結(jié)果。在1 150個測試樣本中,屬于第1類有143個,第2類有139個,第3類有167個,第4類有139個,第5類有161個,第6類有151個,第7類有150個。其中,第2, 3, 4, 5, 6, 7類的分類準確率為100%,第1類中有5個樣本被錯誤的分到了第6類中。
分類結(jié)果表明,一共1 150個樣本僅有5個樣本被錯誤分類,基于DBM模型的軸承故障分類準確率高達99.52%。
輸出類標簽123456713800005096.5%013900000100%001670000100%000139000100%000016100100%000001510100%000000150100%100%100%100%100%100%100%100%99.52%1234567
圖6混淆矩陣
Fig.6Confusionmatrix
2.3.2 對比分析
為了驗證基于DBM滾動軸承故障診斷的有效性和可靠性,將在同一組數(shù)據(jù)集上采用BP神經(jīng)網(wǎng)絡(luò)與SVM分類模型與其進行對比。并且為了避免偶然性的影響,采用的每種分類方法都運行了5次,最后取分類準確率的平均值來分析。具體實驗結(jié)果如表5所示:
表5 滾動軸承故障識別精度
由表5可知,經(jīng)過5次分類求平均值,基于DBM模型的故障識別平均正確率最高,這說明DBM模型比BPNN與SVM識別模型具有更高的特征學(xué)習(xí)和故障分類能力。
為了進一步分析評估DBM在故障診斷領(lǐng)域的性能,工作中,將其應(yīng)用于一個真實的渦噴航空發(fā)動機系統(tǒng)故障診斷。圖7所示為航空渦噴發(fā)動機故障診斷綜合實驗平臺。渦噴發(fā)動機的推力為20 kg。工作中,專注于發(fā)動機的軸承系統(tǒng)的故障診斷。軸承系統(tǒng)的參數(shù)如下:滾動軸承的型號為MHB 608-2RS1;滾珠直徑為:d= 3.428 mm;滾珠數(shù)量為:n= 7;接觸角:α= 0°;
圖7 渦噴發(fā)動機實驗平臺
軸承節(jié)徑為:D= 14.986 mm。軸承系統(tǒng)的故障模式定義如表6所示。
表6 故障模式定義
基于表6定義的故障模式,3種渦噴發(fā)動機的振動信號數(shù)據(jù)數(shù)據(jù)集采集如下:
抽樣頻率:200 kHz;
每次抽樣時間:3~5 s;
每種模式采樣次數(shù):5次;
發(fā)動機轉(zhuǎn)速:50 Hz,100 Hz,67 Hz;
數(shù)據(jù)集1(Data I):包含8種滾珠故障(BF1~BF8),樣本總數(shù)為4 200;
數(shù)據(jù)集2(Data II):包含6種外圈故障(OF1~OF6),樣本總數(shù)為3 700;
數(shù)據(jù)集3(Data III):包含6種滾珠故障(BF1~BF6),5種外圈故障(OF1~OF4)和一種內(nèi)圈故障(IF),樣本總數(shù)為5 720。
表7 發(fā)動機故障識別精度
表7所示為分別采用基于DBM、SVM和BPNN的故障識別系統(tǒng),對航空渦噴發(fā)動機的故障識別精度。參數(shù)設(shè)置同上一節(jié)。正如表7所示,基于DBM模型的故障識別精度高達0.99以上,且優(yōu)于SVM和BPNN模型。
構(gòu)建了基于深度玻爾曼茲機的故障診斷系統(tǒng),并分別應(yīng)用于一個滾動軸承故障實驗臺的故障診斷和航空渦噴發(fā)動機的故障診斷,通過參數(shù)挖掘,比較驗證進行了深度解析。對滾動軸承的故障識別正確率高達99.52%;對渦噴發(fā)動機的故障識別正確率同樣高達99.71%以上。并同基于SVM和BPNN的故障診斷模型進行了對比,試驗結(jié)果表明:基于深度玻爾曼茲機的故障診斷系統(tǒng),在故障診斷中,具有更高的故障識別精度,是可靠有效的故障診斷工具。
參考文獻(References):
[1] JIE L, WILSON W,F(xiàn)ARID G. An Enhanced Diagnostic Scheme for Bearing Condition Monitoring[J]. IEEE Transtractions on Instrumentation and Measurement, 2010,59:309-321
[2] 王學(xué)東,張文志. 基于小波變換的滾動軸承故障診斷[J]. 中國機械工程,2012(3):295-298
WANG X D,ZHANG W Z. Fault Diagnosis of Rolling Bearing Based on Wavelet Transform[J].China Mechanical Engineering, 2012(3):295-298
[3] 康守強, 王玉靜. 基于經(jīng)驗?zāi)B(tài)分解和超球多類支持向量機的滾動軸承故障診斷方法[J]. 中國電機工程學(xué)報,2011(14):96-102
KANG S Q, WANG Y J.Rolling Bearing Fault Diagnosis Method Using Empirical Mode Decomposition and Hypersphere Multiclass Support Vector Machine [J]. Proceedings of the CSEE, 2011(14):96-102
[4] LI C, SANCHEZ R, ZURITA G. Multimodal Deep Support Vector Classification with Homologous Features and Its Application to Gearbox Fault Diagnosis[J]. Neurocomputing,2015(15):119-127
[5] 姜濤, 袁勝發(fā). 基于改進小波神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷[J]. 華中農(nóng)業(yè)大學(xué)學(xué)報,2014(1):131-136
JIANG T, YUAN S F. Rolling Bearing Faults Diagnosis Based on the Improved Wavelet Neural Network [J]. Journal of Huazhong Agricultural University, 2014(1):131-136
[6] CHEN Z Q, LI C. Gearbox Fault Identification and Classification with Convolutional Neural Networks[J]. Shock and Vibration,2015(2):1-10
[7] TRAN V T,THOBIANI F A. An Approach to Fault Diagnosis of Reciprocating Compressor Valves using Teager-Kaiser Energy Operator and Deep Belief Networks[J]. Expert Systems with Applications,2014(9): 4113-4122
[8] SALAKHUTDINOV R, HINTON G. An Efficient Learning Procedure for Deep Machines[J]. Neural Computation , 2012(8):1967-2006
[9] SALAKHUTDINOV R, HINTON G. Deep Boltzmann Machines[J]. Journal of Machine Learning Research. 2009(2): 448-455
[10] HINTON G. Products of Experts[J]. ICANN, 1999(12):1-6