焦瀚暉,胡明輝,*,王 星,馮 坤,石?;?/p>
(1.北京化工大學(xué) 發(fā)動機(jī)健康監(jiān)控及網(wǎng)絡(luò)化教育部重點(diǎn)實(shí)驗(yàn)室,北京 100029;2.北京化工大學(xué) 高端機(jī)械裝備健康監(jiān)控與自愈化北京市重點(diǎn)實(shí)驗(yàn)室,北京 100029;3.中國石化銷售股份有限公司華南分公司,廣東 廣州 510180)
機(jī)泵是各工業(yè)領(lǐng)域的一種關(guān)鍵旋轉(zhuǎn)機(jī)械,由于其結(jié)構(gòu)越來越復(fù)雜,工作在高溫、高速的惡劣條件下,使其比較容易發(fā)生各種機(jī)械故障,輕則產(chǎn)生巨大的運(yùn)行噪音,影響泵的工作效率和流程工業(yè)正常進(jìn)行,造成企業(yè)經(jīng)濟(jì)損失,重則引起設(shè)備損壞甚至造成重大事故。因此,研究并發(fā)展機(jī)泵的故障識別技術(shù)是當(dāng)前科技和工業(yè)發(fā)展的重要研究課題之一[1]。
傳統(tǒng)機(jī)泵故障識別方法主要是針對機(jī)組振動設(shè)置固定報(bào)警閾值。當(dāng)觸發(fā)報(bào)警時,技術(shù)人員對現(xiàn)場監(jiān)測信號進(jìn)行趨勢分析、頻譜分析及包絡(luò)分析等,依靠技術(shù)人員的專業(yè)知識及經(jīng)驗(yàn)對機(jī)泵運(yùn)行狀態(tài)及故障類型作出判斷。但這一過程存在如下兩個問題:(1)要想實(shí)現(xiàn)準(zhǔn)確的故障分析,現(xiàn)場技術(shù)人員不但要具備全面的故障診斷專業(yè)知識和振動信號處理理論,還需要積累足夠的現(xiàn)場經(jīng)驗(yàn),然而這些要求對大多數(shù)現(xiàn)場來說均難以滿足;(2)現(xiàn)場測試所得的振動信號往往包含復(fù)雜的環(huán)境噪聲,會對振動報(bào)警值設(shè)定、信號濾波分析產(chǎn)生極大阻礙。
近年來,隨著對深度學(xué)習(xí)模型研究的深入,越來越多的模型被應(yīng)用到設(shè)備故障智能診斷中。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)方法的典型模型之一,在很多領(lǐng)域有著出色的表現(xiàn),尤其是在圖像處理領(lǐng)域發(fā)揮著重要的作用,國內(nèi)外學(xué)者也逐漸將其應(yīng)用到設(shè)備故障診斷中。肖雄[2]利用信號-圖像轉(zhuǎn)換技術(shù)將振動信號轉(zhuǎn)換為不同維度的信號,并對二維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了優(yōu)化,利用軸承實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證了該方法在軸承故障識別中的有效性。Chen等[3]通過繪制振動信號的特征統(tǒng)計(jì)圖作為CNN的輸入,成功實(shí)現(xiàn)了齒輪箱故障診斷。孫偉芳[4]提出了一種采用雙樹復(fù)小波變換(DTCWT)來獲取多尺度信號的特征,并利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法,自動識別了來自多尺度信號特征的故障特征,通過齒輪故障試驗(yàn)數(shù)據(jù)驗(yàn)證了該方法能有效識別齒輪故障。Lu等[5]將CNN應(yīng)用到滾動軸承的故障診斷中,并驗(yàn)證了該方法在噪聲環(huán)境下的魯棒性。Ma等[6]通過對振動信號進(jìn)行小波包變換提取頻域信息,在此基礎(chǔ)上提出了一種基于深度殘差卷積網(wǎng)絡(luò)的輕量級深度學(xué)習(xí)故障預(yù)測方法。Wen等人[7]利用時域振動信號,直接寫入二維矩陣中,利用該方法實(shí)現(xiàn)了CNN在多種設(shè)備故障診斷的應(yīng)用。李桓[8]利用短時傅里葉變換將振動信號轉(zhuǎn)化為時頻圖,然后利用CNN實(shí)現(xiàn)了軸承故障診斷。熊鵬[9]利用小波包變換,將小波包系數(shù)作為二維矩陣輸入,利用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了行星齒輪箱的故障診斷。陳仁祥等人[10]利用離散小波變換得到了時頻圖,基于二維卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了滾動軸承的故障診斷。胡蔦慶等人[11]利用經(jīng)驗(yàn)?zāi)B(tài)分解和深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了行星輪系齒輪箱故障診斷。
目前,基于卷積神經(jīng)網(wǎng)絡(luò)建立故障診斷模型的研究已經(jīng)初見成效,但以上方法均存在計(jì)算量龐大,進(jìn)而難以實(shí)現(xiàn)實(shí)際工程應(yīng)用的問題。由于二維卷積神經(jīng)網(wǎng)絡(luò)需要二維輸入,需要對振動信號進(jìn)行繁瑣的處理和轉(zhuǎn)化,才能將一維信號轉(zhuǎn)化為二維圖片信息,而信號維度轉(zhuǎn)換是導(dǎo)致其計(jì)算量龐大的核心因素。
為解決上述問題,基于旋轉(zhuǎn)設(shè)備振動信號特點(diǎn)和卷積神經(jīng)網(wǎng)絡(luò),筆者建立機(jī)泵故障智能識別模型,提出一種新的快速生成二維輸入矩陣的方法。
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),對圖像有良好的識別性能,現(xiàn)在已經(jīng)被大規(guī)模應(yīng)用于圖形識別等領(lǐng)域。
卷積神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、全連接層以及輸出層構(gòu)成。卷積層的輸入為一系列特征圖,每一個特征圖都對應(yīng)卷積層內(nèi)部一個卷積核。這些卷積核通過一組權(quán)重來實(shí)現(xiàn)卷積運(yùn)算,其輸出作為下一層的輸入。
以最先應(yīng)用的圖像識別為例,CNN中卷積層實(shí)現(xiàn)過程如下:從圖像某一子塊學(xué)習(xí)得到一些特征后,將這些特征作為探測器,應(yīng)用到所有子塊中去,獲取不同子塊的激活值。CNN中的卷積就利用了圖像的這種固有特性,每個卷積核檢測輸入特征圖所有位置上的特定特征,實(shí)現(xiàn)了同一輸入特征圖上的權(quán)值共享。
卷積的計(jì)算公式如下:
x=f(∑x?wij+b)
(1)
式中:?—二維離散運(yùn)算符;b—偏置;wij—卷積核;x—輸入特征圖;f(·)—激活函數(shù)。
池化層的功能有兩個:(1)大幅度減少輸入卷積層的維度,降低計(jì)算成本;(2)可以控制過擬合,使測試集準(zhǔn)確度更接近訓(xùn)練集準(zhǔn)確度,并提高模型的魯棒性。
主流的池化方式有最大池化和平均池化。池化的一般公式為:
x=f(βdown(x)+b)
(2)
式中:β—乘性偏置;down()—下采樣函數(shù);b—偏置;f(·)—激活函數(shù)。
全連接層與上一層輸出的所有神經(jīng)元節(jié)點(diǎn)相互相連,最終利用softmax完成分類。其輸出如下式所示:
h(x)=f(wx+b)
(3)
式中:x—全連接層的輸入;h(x)—全連接層的輸出層;w—權(quán)值;b—加性偏置;f(·)—激活函數(shù)。
頻譜分析是機(jī)泵振動分析的核心手段。對于機(jī)泵故障診斷而言,除了常規(guī)的轉(zhuǎn)速一倍頻、二倍頻等低階諧波成分需重點(diǎn)關(guān)注外,滾動軸承、齒輪所產(chǎn)生的沖擊成分以及葉片通過頻率等成分亦是故障識別不可忽視的成分。
筆者提出利用轉(zhuǎn)子工頻及其倍頻之間頻帶峰值和能量的變化情況來反映設(shè)備的運(yùn)行狀態(tài),其具體實(shí)現(xiàn)步驟如下:
(1)利用傅里葉變換得到時域振動信號的頻譜。傅里葉變換公式如下:
(4)
式中:X(f)—頻域波形;x(t)—時域波形;f—頻率;e—自然對數(shù)的底;j—虛數(shù)單位。
(2)以轉(zhuǎn)速頻率fr為基準(zhǔn)將頻譜分割,分割個數(shù)為n,其計(jì)算如下(即頻譜被分割成(0,fr],(fr,2fr],
(2fr,3fr]…(n-1)fr,Fmax]共n個分量):
(5)
式中:Fmax—分析頻率;ceil(·)—向上取整數(shù),如ceil(0.2)=1;n—頻率分量個數(shù)。
(3)求解每個分量的頻譜峰值和頻譜能量。
頻譜峰值的求解公式為:
本文旨在揭示數(shù)值格式的適度耗散可由色散-耗散條件確定. 作為演示驗(yàn)證, 將色散-耗散條件用于減弱以往發(fā)展的加權(quán)基本無振蕩格式WENO-CU6-M2[15]所造成的偽波, 通過數(shù)值算例給出該格式的兩種直接改進(jìn)并加以對比確認(rèn).
(6)
式中:Mi—頻譜峰值;i—表示頻段序號;j—單個頻段內(nèi)頻譜成分的序號;fij—第i個頻段內(nèi)第j個信號分量的幅值。
頻譜能量的求解公式為:
(7)
式中:Ei—頻譜能量。
(4)構(gòu)造二維特征矩陣。為使卷積神經(jīng)網(wǎng)絡(luò)充分考慮頻譜中所有成分的影響,將2n個元素M1,M2…Mn,E1,E2…En均作為特征矩陣的元素;為便于卷積神經(jīng)網(wǎng)絡(luò)分析且盡可能減小計(jì)算量,上述2n個元素盡量只在特征矩陣中出現(xiàn)一次,同時該特征矩陣形式上應(yīng)盡可能接近于方陣。
因此,矩陣列數(shù)取為s,其計(jì)算如下:
(8)
式中:s—特征矩陣維度;2n—所有特征值個數(shù)。
將M1,M2…Mn,E1,E2…En等特征值依次從矩陣首行填入特征矩陣中,最后一行未填滿元素補(bǔ)0,可得二維特征矩陣T,其表達(dá)式如下:
(9)
上述二維特征矩陣即可作為卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)。由于該矩陣元素?cái)?shù)遠(yuǎn)小于原振動波形的點(diǎn)數(shù),導(dǎo)致其計(jì)算量小、構(gòu)造速度快;同時,該矩陣充分考慮了適用于機(jī)泵振動信號分析的主要關(guān)注成分,即從故障診斷意義上來說,特征集構(gòu)造過程未造成顯著的有效信息丟失,使其能夠準(zhǔn)確地描繪和反映設(shè)備狀態(tài),最終用于故障識別。
筆者提出基于卷積網(wǎng)絡(luò)的機(jī)泵故障智能識別模型,該故障識別模型如圖2所示。
具體實(shí)現(xiàn)步驟如下:
圖2 故障識別模型
(1)二維特征矩陣構(gòu)造。利用2.1節(jié)所述的方法,使用訓(xùn)練樣本中設(shè)備正常和故障狀態(tài)下的振動時域信號分別構(gòu)造特征集,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入;
(2)初始網(wǎng)絡(luò)建立。初始化網(wǎng)絡(luò)參數(shù),給定網(wǎng)絡(luò)初始化參數(shù),包括:卷積層尺寸、池化方式及尺寸、學(xué)習(xí)率、批處理個數(shù)、最大迭代次數(shù),生成初始網(wǎng)絡(luò);
(3)網(wǎng)絡(luò)模型訓(xùn)練及生成。將訓(xùn)練樣本輸入至神經(jīng)網(wǎng)絡(luò)中,對模型進(jìn)行訓(xùn)練,當(dāng)模型Loss函數(shù)值α低于0.5%后,保存模型,即建立了該機(jī)泵的故障識別模型;
(4)故障識別。將待分析數(shù)據(jù)(即測試樣本)輸入模型,即可進(jìn)行該數(shù)據(jù)的分類,即實(shí)現(xiàn)故障識別。
筆者使用的振動數(shù)據(jù)均來自石化企業(yè)現(xiàn)場的在線監(jiān)測數(shù)據(jù)。
具體的樣本數(shù)據(jù)集如表1所示。
表1 樣本數(shù)據(jù)集
本研究共選取兩臺設(shè)備數(shù)據(jù):
(1)設(shè)備1。某石化催化裝置油漿泵為懸臂離心泵,轉(zhuǎn)速為2 890 r/min,運(yùn)行過程中發(fā)生了不平衡故障,選取該泵無故障及不平衡故障數(shù)據(jù)進(jìn)行分析;
(2)設(shè)備2。某石化常減壓裝置底油為雙支撐離心泵,轉(zhuǎn)速為2 890 r/min,運(yùn)行過程中發(fā)生了軸承故障,選取該泵無故障及軸承故障數(shù)據(jù)進(jìn)行分析。
上述信號均為泵軸承座處振動加速度,采樣頻率為25.6 kHz,每個樣本采樣時間為0.64 s,樣本數(shù)據(jù)長度均為16 384,4組狀態(tài)下一半樣本作為訓(xùn)練樣本,一半作為測試樣本。
將訓(xùn)練集中每個樣本數(shù)據(jù)按照本文第2.1節(jié)方法構(gòu)造二維特征集。
設(shè)備1無故障和不平衡故障的特征集可視化灰度圖如圖3所示。
圖3 設(shè)備1二維特征集可視化
設(shè)備2無故障和軸承故障的特征集可視化灰度圖如圖4所示。
圖4 設(shè)備2二維特征集可視化
將數(shù)據(jù)集進(jìn)行歸一化處理,圖(3,4)中顏色由白色到黑色數(shù)值逐漸變大,最小為0,最大為1。設(shè)備1模型中90組生成特征集耗時0.7 s,設(shè)備2模型中65組訓(xùn)練樣本生成特征集耗時0.6 s,即平均每組樣本生成特征集耗時小于10 ms,完全可滿足實(shí)時化應(yīng)用需求。
參考其對網(wǎng)絡(luò)參數(shù)設(shè)置的研究[12],筆者確定本文使用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)本文模型參數(shù)如表2所示。
表2 模型參數(shù)表
本文模型由2個卷積層,2個最大池化層和一個全連接層組成。為保障神經(jīng)網(wǎng)絡(luò)具有豐富的感知視野以提取到更多的有效特征,同時避免冗余計(jì)算,卷積核的大小和數(shù)量須適當(dāng)。
筆者將表1中訓(xùn)練樣本數(shù)據(jù)生成的二維特征矩陣作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本,特征集維度分別為24×24。當(dāng)模型Loss函數(shù)值低于0.5%后,保存模型,即分別建立了該機(jī)泵的故障識別模型。
模型訓(xùn)練Loss函數(shù)曲線如圖5所示。
圖5 模型訓(xùn)練Loss函數(shù)曲線
由圖5可知:以二維特征集作為卷積神經(jīng)網(wǎng)絡(luò)輸入,Loss函數(shù)收斂曲線平滑,幾乎接近于0,即分類效果較佳。
設(shè)備1網(wǎng)絡(luò)訓(xùn)練時間為34.348 s,設(shè)備2網(wǎng)絡(luò)訓(xùn)練時間為22.341 s。
由于模型訓(xùn)練只需要在剛開始應(yīng)用或新案例識別效果不好情況下再次開展,并非每組測試數(shù)據(jù)都需要重新訓(xùn)練,上述訓(xùn)練時間已非常理想。
將4種狀態(tài)下的測試樣本分別輸入對應(yīng)模型進(jìn)行計(jì)算,測試集信息及結(jié)果如表3所示。
表3 測試集信息及結(jié)果
主要結(jié)果如下:
(1)對于設(shè)備1的50組無故障測試樣本,模型誤識別率為0%;對于設(shè)備1的50組不平衡故障測試樣本,模型的故障識別準(zhǔn)確率為95%;
(2)對于設(shè)備2的50組無故障測試樣本,模型誤識別率為2%;對于設(shè)備2的15組軸承故障測試樣本,模型的故障識別準(zhǔn)確率為100%;
(3)模型1的100組測試樣本測試時間0.11 s,設(shè)備2的65組測試樣本測試時間0.15 s。
由識別結(jié)果可以看出,筆者提出的故障診斷識別模型對不平衡、軸承故障都有理想的識別效果。同時,未出現(xiàn)明顯的無故障數(shù)據(jù)誤識別問題。此外,每組樣本測試時間均小于3 ms,完全可滿足工程應(yīng)用中的實(shí)時化要求。
為說明該方法在機(jī)泵故障識別中的優(yōu)勢,筆者將該方法與文獻(xiàn)中的方法進(jìn)行對比。以軸承故障為例,筆者分別從特征集生成時間、模型訓(xùn)練時間、模型收斂情況和模型識別準(zhǔn)確度4個方面進(jìn)行全面的對比。
方法1。使用振動原始數(shù)據(jù)作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,將振動信號直接寫入輸入矩陣中,利用卷積神經(jīng)網(wǎng)絡(luò)對振動信號進(jìn)行特征提取、濾波和降維,最終實(shí)現(xiàn)故障識別[13]。
方法2。利用復(fù)雜的算法,將一維振動信號轉(zhuǎn)化為具有故障特征的二維圖片特征,利用時頻變換的方法將振動信號轉(zhuǎn)化為時頻譜圖,以時頻譜圖作為卷積神經(jīng)網(wǎng)絡(luò)的輸入和檢測樣本[14]。
在相同的計(jì)算條件下,使用石化現(xiàn)場設(shè)備2的無故障及軸承故障數(shù)據(jù)作為訓(xùn)練樣本,利用文獻(xiàn)中的2種方法和該方法分別搭建模型,不同方法訓(xùn)練和檢測結(jié)果如表4所示。
表4 不同方法訓(xùn)練和檢測結(jié)果
以相同的訓(xùn)練樣本數(shù)量作為輸入,文獻(xiàn)中兩種方法均出現(xiàn)過擬合的現(xiàn)象。
文獻(xiàn)方法Loss函數(shù)曲線如圖6所示。
圖6 文獻(xiàn)方法Loss函數(shù)曲線
由于過擬合現(xiàn)象的出現(xiàn),導(dǎo)致以上兩種方法訓(xùn)練得到的故障識別模型均未能達(dá)到訓(xùn)練預(yù)期目標(biāo),故障識別率低,正常數(shù)據(jù)誤識別率高;同時,訓(xùn)練所需時間遠(yuǎn)遠(yuǎn)超過筆者提出的方法。
對比筆者提出的方法可知,在快速生成輸入樣本的前提下,能夠準(zhǔn)確識別故障;在特征集生成時間、模型訓(xùn)練時間、模型收斂情況和模型識別準(zhǔn)確度等方面均有明顯優(yōu)勢。
通過利用現(xiàn)場數(shù)據(jù),對不同模型進(jìn)行的對比結(jié)果,證明筆者所提的方法更適用于工程中機(jī)泵故障的識別。
基于機(jī)泵振動信號特點(diǎn),筆者提出了一種新的二維特征集快速構(gòu)造方法。該方法通過對頻譜進(jìn)行截?cái)?,利用頻譜分量的峰值和能量,快速構(gòu)造卷積神經(jīng)網(wǎng)絡(luò)二維特征集,特征集中全面包含了機(jī)泵故障診斷的關(guān)注信息,同時特征集構(gòu)造過程計(jì)算簡單,實(shí)現(xiàn)了快速降維。
該算法每組數(shù)據(jù)特征值構(gòu)造不超過8 ms,解決了構(gòu)造卷積神經(jīng)網(wǎng)絡(luò)輸入計(jì)算量巨大、耗時長,無法實(shí)現(xiàn)現(xiàn)場實(shí)時化的問題。
基于特征快速構(gòu)造算法和卷積神經(jīng)網(wǎng)絡(luò),筆者提出了一種機(jī)泵故障智能識別模型;利用石化現(xiàn)場機(jī)泵的軸承和不平衡故障數(shù)據(jù),對故障識別模型進(jìn)行了測試,識別準(zhǔn)確率均達(dá)95%以上。從特征集生成時間、訓(xùn)練識別速率及識別準(zhǔn)確率四方面,與其他故障模型相比,筆者提出的模型在機(jī)泵故障智能識別中具有明顯的優(yōu)勢。