陳 劍,黃 志,徐庭亮,孫太華,李雪原
(合肥工業(yè)大學 a.噪聲振動工程研究所;b.安徽省汽車NVH技術(shù)研究中心,合肥 230009)
滾動軸承是旋轉(zhuǎn)機械最易磨損、更換的部件之一,在設備運轉(zhuǎn)過程中,如果滾動軸承出現(xiàn)故障,容易造出重大損失,甚至發(fā)生安全事故,因此,對滾動軸承的工作狀態(tài)進行監(jiān)測尤為重要[1]。滾動軸承的故障振動信號大都呈現(xiàn)出非平穩(wěn)性特點,時頻分析方法依靠專業(yè)知識從源信號中提取含有故障信息的特征分量進行故障診斷。唐貴基等[2]使用改進的小波包變換來分離滾動軸承單通道振動信號中的復合特征故障,而后重構(gòu)軸承的單點故障信號,實現(xiàn)滾動軸承故障特征的分離和提取;蘇文勝等[3]將經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)應用在滾動軸承的降噪預處理過程中,使用EMD對采樣信號進行預處理,凸顯信號的高頻共振部分,再利用帶通濾波和包絡解調(diào)實現(xiàn)故障診斷。這些經(jīng)典的時頻分析故障診斷技術(shù)十分依賴故障特征設計,且在處理復雜信號時,分解閾值的設置需要多次實驗,耗時長,效果也不夠理想。
隨著深度學習算法的引進,傳統(tǒng)故障診斷方法與深度學習相融合的研究逐漸成為主流。崔鵬宇等[4]把軸承振動信號的時頻域特征參數(shù)和熵特征參數(shù)融合,構(gòu)建特征矩陣,然后輸入到優(yōu)化的反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡中進行故障診斷;程軍圣等[5]中先對源信號做EMD分解,然后建立起內(nèi)涵模態(tài)分量(intrinsic mode functions,IMF)的自回歸模型(autoregressive model,AR),用AR的自回歸參數(shù)和殘差方差構(gòu)建特征向量,再輸入支持向量機(support vector machine,SVM)中進行故障診斷。但傳統(tǒng)時頻分析方法具有一定的局限性,尤其對軸承這類多分量信號處理時,變分模態(tài)分解(variational modal decomposition,VMD)容易發(fā)生頻率混疊,計算速率會受到中心頻率初值選擇的影響,計算效果又受到分解個數(shù)和懲罰因子的制約,此外,EMD的端點效應也會導致深度學習算法的診斷效果不理想[6-7]。LMD是在EMD的基礎上提出,用來處理多分量信號,LMD分解后得到乘積函數(shù)(product function,PF)分量,其頻率和幅值都較完整的蘊含在PF分量中,對于多分量軸承振動信號,LMD是一個非常適合的預處理方法[8-10]。
本文利用LMD對軸承振動信號進行分解,計算各PF的散布熵和時域指標,構(gòu)建特征矩陣,再使用加權(quán)慣性權(quán)重改進BPSO中的固定權(quán)重,并用改進BPSO優(yōu)化DBN的隱含層神經(jīng)元個數(shù)和學習率,得到IBPSO-DBN診斷模型,實現(xiàn)滾動軸承故障的診斷和分類。同時為了驗證所提方法的優(yōu)越性,用試驗數(shù)據(jù)訓練IBPSO-DBN模型并與DBN、PSO-DBN、BPSO-DBN模型做對比,結(jié)果表明,基于LMD的IBPSO-DBN故障診斷模型能有效診斷滾動軸承故障。
LMD是一種自適應時頻分析方法,其本質(zhì)是利用信號自身的局部均值點,通過自適應迭代分解把多分量信號分解成若干個含有物理意義的PF分量與殘余項之和的形式,具體分解過程如式(1)、式(2)所示。
經(jīng)LMD迭代分解得到的PF分量表達式為:
PF1=a1(t)s1n(t)
(1)
式中:PF1中的包絡信號a1(t)代表源信號的最高頻率,s1n(t)為一個純調(diào)頻信號,能計算PF1的瞬時頻率為:
(2)
然后,再從Y(t)中去除PF1,得到一個新的信號,重復此過程k次,直到uk為一個單調(diào)函數(shù)為止。uk的迭代過程如式(3)所示。
(3)
至此,源信號Y(t)重構(gòu)為式(4):
(4)
散布熵通過符號化時間序列,比對信號之間幅值的關(guān)系來計算模式的重復概率,能夠有效降低原始序列中的噪聲干擾。因此,PF分量散布熵能很好抑制PF分量含有的噪聲成分。
(5)
(6)
式中:round()表示取整函數(shù),c表示散布熵符號化時間序列過程中的類別數(shù)。
(7)
式中:i=1,2,…N-(m-1)d。
再計算每個嵌入向量散布模式的概率p(πo0o1…om-1):
(8)
式中:count{ }表示嵌入向量映射到散布模式的個數(shù)。計算時間序列的散布熵值:
(9)
把LMD分解后的各PF分量作為散布熵的輸入,求出各PF分量的散布熵。
IBPSO-DBN診斷模型的構(gòu)建分為兩步:首先是DBN模型初始化,其次是改進BPSO優(yōu)化DBN隱含層神經(jīng)元個數(shù)和學習率,得到最優(yōu)粒子,構(gòu)建IBPSO-DBN模型。
1.3.1 DBN網(wǎng)絡結(jié)構(gòu)初始化
DBN是由多個受限玻爾茲曼機(restricted boltzmann machines,RBM)堆疊而成,具有3個RBM的DBN網(wǎng)絡如圖1所示,每個RBM由可視層和隱含層構(gòu)成,RBM層間通過權(quán)重w連接,數(shù)據(jù)特征在RBM間逐層映射傳遞,即前一個RBM的輸出特征是后一個RBM的輸入特征[13]。每層RBM保證該層隱含層對可視層特征的最優(yōu)映射,從而高層RBM具有抽象性和表征力更好的特征向量輸出。然后從最高層RBM的開始,自頂向下微調(diào)DBN模型參數(shù)。本文的DBN網(wǎng)絡結(jié)構(gòu)初始化分為無監(jiān)督和有監(jiān)督兩部分,無監(jiān)督部分使用大量無標簽數(shù)據(jù)得到DBN初始網(wǎng)絡結(jié)構(gòu)參數(shù)和少量有標簽數(shù)據(jù),有監(jiān)督部分使用少量有標簽數(shù)據(jù)進行反向微調(diào),從而獲得理想的DBN網(wǎng)絡結(jié)構(gòu)參數(shù)[14]。
(a) 含有3層RBM的DBN網(wǎng)絡結(jié)構(gòu) (b) 含有n個可視神經(jīng)元和m個隱藏神經(jīng)元的RBM圖1 DBN結(jié)構(gòu)模型
RBM是基于能量的函數(shù),能量最小時RBM為最優(yōu)值,預訓練的目的即最小化RBM。RBM能量函數(shù)定義為:
(10)
由圖1a和式(10)可知,RBM中可視層v=(v1,v2,…vn)有n個神經(jīng)元,隱含層h=(h1,h2,…h(huán)m)有m個神經(jīng)元,vi表示可視層第i個神經(jīng)元的狀態(tài),hj表示隱含層第j個神經(jīng)元的狀態(tài),ai,bj表示神經(jīng)元偏置,wij為可視層和隱含層的連接權(quán)重,由此定義初始參數(shù)θ={a,b,w},計算基于RBM能量函數(shù)的可見層和隱含層的神經(jīng)元聯(lián)合概率分布,即:
(11)
(12)
考慮到同層神經(jīng)元的獨立性,可以求得vi=1的概率為:
(13)
同理可求得hj=1的概率為:
(14)
Sigmoid()函數(shù)為激活函數(shù):
(15)
RBM預訓練的目的就是為了初步得到最優(yōu)初始參數(shù)θ,用θ*表示,得到具有較好擬合效果的DBN初始結(jié)構(gòu),此時DBN中的樣本統(tǒng)計概率和模型生成概率最大化相等,θ*計算公式為:
(16)
式中:T表示訓練樣本總數(shù)。
DBN網(wǎng)絡結(jié)構(gòu)經(jīng)過預訓練得到了初始參數(shù),反向微調(diào)階段就是為了提高模型的擬合效果。反向微調(diào)從DBN最高層出發(fā),自頂向下使用預訓練得到的少量標簽數(shù)據(jù)逐層向低層微調(diào)初始參數(shù)。一般采用Soft-max做為最后的分類器,使用BP算法實現(xiàn)微調(diào)過程。設定DBN網(wǎng)絡有l(wèi)個RBM,則預訓練輸出為:
ul(x)=Sigmoid(al+wlul-1(x))
(17)
Soft-max會以最大概率(預測類別)的形式判斷DBN的輸出。
DBN網(wǎng)絡結(jié)構(gòu)初始化完成后,得到了DBN模型,但在初始化的過程中,隱含層神經(jīng)元和學習率反映了DBN挖掘數(shù)據(jù)特征的能力,隱含層神經(jīng)元個數(shù)過多,DBN的迭代時間延長,過少又會導致特征挖掘不充分,分類效果差。針對此問題,本文提出采用BPSO優(yōu)化DBN的隱含層神經(jīng)元個數(shù)和學習率。
1.3.2 BPSO優(yōu)化DBN網(wǎng)絡結(jié)構(gòu)
標準的粒子群算法適用于在連續(xù)空間中進行,對于優(yōu)化DBN隱含層結(jié)構(gòu)和學習率這樣的離散搜索空間問題,粒子群算法局限性較大。針對離散搜索解空間的問題,本文提出BPSO算法對DBN結(jié)構(gòu)中的隱含層神經(jīng)元個數(shù)和學習率進行優(yōu)化。針對BPSO固定權(quán)重會影響粒子尋優(yōu)效果的問題,提出加權(quán)慣性權(quán)重對BPSO算法的固定權(quán)重進行改進。二進制粒子群算法理論為:
二進制粒子群算法中各個粒子的位置使用了二進制編碼方式,如X=(x1,x2,…,xM)表示粒子種群的位置矩陣,xi=(xi1,xi2,…,xiN)表示第i個體粒子在第N次迭代的位置,其速度為連續(xù)變化的值,qi=(qi1,qi2,…,qiN)。BPSO的粒子位置和速度更新[15]為:
(18)
(19)
(20)
由式(18)~式(20)的位置和速度更新公式可知,BPSO算法中粒子的位置依靠更新,對于慣性權(quán)重來說,慣性權(quán)重較大,就會加快粒子在解空間中的搜索速度,避免陷入局部收斂的情況;慣性權(quán)重較小,就會降低粒子在解空間中的搜索速度,雖然搜索細致度提升,但搜索空間變小,反而有利于收斂。但是隨著迭代次數(shù)的增加,搜索解空間的細致度提升,固定權(quán)重不能很好滿足優(yōu)化要求,比如算法計算初期著力于全局搜索,需要較大的慣性權(quán)重,然而在算法計算末期,需要讓盡快收斂,那么就需要較小的慣性權(quán)重,為了解決固定權(quán)重不能很好適配算法迭代過程的需要,本文提出加權(quán)慣性權(quán)重來改進二進制粒子群算法的固定權(quán)重。
(21)
改進BPSO的速度更新公式為:
(22)
BPSO優(yōu)化DBN網(wǎng)絡結(jié)構(gòu)參數(shù)步驟如下:
步驟1:DBN網(wǎng)絡結(jié)構(gòu)初始化,得到初始參數(shù)和網(wǎng)絡結(jié)構(gòu)參數(shù);
步驟2:初始化粒子群,采用二進制編碼方式得到初始種群;
步驟3:計算粒子適應度值,本文用準確率做適應值,計算本輪迭代中的粒子自身最優(yōu)解pbest,ij和全局最優(yōu)解gbest,ij;
步驟4:依據(jù)式(19)、式(20)和式(22)更新粒子位置和速度;
步驟5:更新判定,若適應度值或迭代更新次數(shù)滿足條件,優(yōu)化完成跳轉(zhuǎn)到步驟6,否則跳轉(zhuǎn)到步驟3,開始新一輪更新(更新次數(shù)加1);
步驟6:得到最優(yōu)粒子,即最優(yōu)DBN隱含層神經(jīng)元個數(shù)和學習率。
軸承的時域特征是研究軸承故障的有力工具,當軸承發(fā)生如點蝕、磨損等故障時,其相應的時域特征指標也會發(fā)生改變,為了把時域指標有效利用起來,本文把PF分量的散步熵與時域指標融合,構(gòu)建特征矩陣,輸入IBPO-DBN診斷模型中進行訓練,然后用測試集驗證。
基于LMD分解和改進BPSO-DBN神經(jīng)網(wǎng)絡的軸承故障診斷方法的實現(xiàn)框圖如圖2所示。
圖2 基于LMD分解和IBPSO-DBN故障診斷流程
步驟1:截取采集的滾動軸承原始振動信號,保證每個樣本中都包含軸承旋轉(zhuǎn)一周的時域信號,一共選取8種工況(見表2所列),每種工況60個樣本,樣本長度為1024;
步驟2:對8種工況的振動信號依次采用LMD分解,得到一系列PF分量,統(tǒng)計出這些PF分量標準差、峭度、均方根、波峰指標、脈沖指標、偏度、裕度指標、波形指標等8個時域特征指標,得到維度為24的特征向量;
步驟3:特征融合與提取。提取步驟2的時域指標與PF分量進行融合。將融合后的特征進行歸一化處理,消除不同參數(shù)數(shù)量級對變量的影響,得到故障特征向量;
步驟4:構(gòu)建數(shù)據(jù)集。將步驟3的故障特征向量作為診斷模型的輸入數(shù)據(jù),為了對數(shù)據(jù)進行標簽化處理,采用one-hot編碼對數(shù)據(jù)進行標簽化處理,接著,將數(shù)據(jù)集劃分為測試集和訓練集。為了確保數(shù)據(jù)集的隨機性和可靠性,需要將480個樣本隨機打亂,然后從中隨機選取280個樣本作為訓練集,200個樣本作為測試集。這樣可以有效地避免數(shù)據(jù)集中存在的偏差和干擾,提高模型的魯棒性和泛化能力;
步驟5:初始化粒子群。DBN初始訓練,得到深度置信神經(jīng)網(wǎng)絡初始參數(shù)和初始網(wǎng)絡結(jié)構(gòu),將DBN三層隱含層中n1、n2、n3個神經(jīng)元以及學習率L通過二進制編碼得到初始化粒子群;
步驟7:終止條件判定。如果訓練樣本的適應度值滿足設定條件或者迭代次數(shù)等于N,則IBPSO優(yōu)化結(jié)束,否則轉(zhuǎn)到步驟5,同時N自加1,重復執(zhí)行步驟5,直到滿足判別條件;
步驟8:故障診斷與分類。得到最優(yōu)粒子構(gòu)建最優(yōu)DBN網(wǎng)絡,使用訓練集對診斷模型進行訓練,訓練完成后,經(jīng)測試集輸入DBN網(wǎng)絡模型中,輸出診斷結(jié)果。
本文軸承實驗數(shù)據(jù)來自于某大學航空發(fā)動機主軸軸承試驗機上采集的不同類型軸承故障振動數(shù)據(jù)。軸承試驗機的配置如圖3所示。
圖3 軸承試驗機
實驗的軸承型號為NU1010EM和N1010EM的單列圓柱滾子軸承,軸承相關(guān)參數(shù)如表1所示。
表1 實驗軸承參數(shù)
為了得到不同故障類型的軸承,對軸承內(nèi)圈故障采用激光加工獲得,外圈和滾子故障采用線切割獲得。試驗軸承的工況如表2所示,共8種工況。
表2 軸承工況參數(shù)
圖4為本實驗驗證所采用的不同工況的滾動軸承振動信號的原始信號圖,圖4中R表示r/min。
圖4 實驗原始信號
將3.1節(jié)如圖4所示采集到的數(shù)據(jù)按照如圖2所示流程進行處理。同時,DBN開始初始化訓練,再用IBPSO對DBN的網(wǎng)絡結(jié)構(gòu)參數(shù)進行優(yōu)化,得到經(jīng)過IBPSO優(yōu)化后的DBN網(wǎng)絡參數(shù)如表3所示。
表3 BPSO-DBN網(wǎng)絡結(jié)構(gòu)參數(shù)
本文隨機選取采集數(shù)據(jù)的60%作為IBPSO-DBN的訓練集,剩下的數(shù)據(jù)作為測試集,然后開展故障診斷工作。為了驗證所提方法有效性,將BPSO-DBN分別于PSO-DBN、DBN、BPSO-DBN做比較,得出以下結(jié)論。
(1)診斷準確率明顯提高。不同模型的對比驗證如表4所示,IBPSO-DBN的正確率為99.3%,DBN、PSO-DBN網(wǎng)絡的正確率分別為89.36%和90.64%,未經(jīng)優(yōu)化的BPSO-DBN的正確率為93.75%。
表4 模型對比驗證
(2)擬合效果、診斷正確率明顯提高。如圖5所示,IBPSO-DBN的損失值約在100次迭代后約為0,而PSO-DBN需要迭代約200次,DBN的損失值則陷入局部收斂,可見IBPSO-DBN的擬合效果更好。
圖5 IBPSO-DBN、PSO-DBN、DBN損失對比 圖6 IBPSO-DBN、BPSO-DBN正確率對比
如圖6所示,IBPSO-DBN的正確率在迭代至115次左右時非常接近100%,且迭代過程正確率函數(shù)曲線較平滑,而BPSO-DBN的正確率函數(shù)在迭代至300次左右才逐漸平穩(wěn),且迭代過程正確率函數(shù)波動較大,表明迭代過程中陷入局部收斂的情形較多,可見BPSO-DBN的診斷正確率和擬合效果優(yōu)于BPSO-DBN方法。
(3)分類效果好。如圖7所示的混淆矩陣可知,在對正常軸承和滾子故障診斷中出現(xiàn)了誤分類現(xiàn)象,分類正確率為96%,這是由于實驗結(jié)構(gòu)系統(tǒng)噪聲的干擾導致。
圖7 診斷結(jié)果的混淆矩陣
除此之外,IBPSO-DBN方法對其他類型的故障的分類識別率都是100%,綜合分類正確率為99%。可見IBPSO-DBN算法的故障診斷和分類效果很好。
本文把LMD與DBN神經(jīng)網(wǎng)絡相結(jié)合,把PF分量散布熵和時域指標融合,構(gòu)建特征矩陣,針對DBN網(wǎng)絡結(jié)構(gòu)參數(shù):隱含層神經(jīng)元個數(shù)和學習率設置不當?shù)膯栴},提出BPSO優(yōu)化DBN網(wǎng)絡結(jié)構(gòu)參數(shù),針對BPSO迭代過程中固定權(quán)重導致BPSO尋優(yōu)效果不理想的問題,提出加權(quán)慣性權(quán)重改進BPSO的迭代過程。最后,把特征矩陣輸入IBPSO-DBN模型中訓練,獲得IBPSO-DBN診斷模型。軸承試驗結(jié)果與模型對比試驗表明:
(1)基于LMD分解的BPSO-DBN滾動軸承故障診斷分類方法能夠有效識別滾動軸承的工作狀態(tài)和故障類型,診斷正確率優(yōu)于DBN、PSO-DBN和BPSO-DBN神經(jīng)網(wǎng)絡結(jié)構(gòu),擬合效果優(yōu)于PSO-DBN和DBN網(wǎng)絡。
(2)采用加權(quán)慣性權(quán)重改進BPSO方法,并用IBPSO對DBN網(wǎng)絡的隱含層神經(jīng)元個數(shù)和學習率進行優(yōu)化,構(gòu)建最優(yōu)DBN網(wǎng)絡,獲取IBPSO-DBN故障診斷模型,對于提高滾動軸承在運轉(zhuǎn)過程中的故障識別和診斷率有著重要意義。