焦瀚暉, 胡明輝, 江志農(nóng), 馮 坤
(1. 北京化工大學(xué) 發(fā)動(dòng)機(jī)健康監(jiān)控及網(wǎng)絡(luò)化教育部重點(diǎn)實(shí)驗(yàn)室,北京 100029;2. 北京化工大學(xué) 高端機(jī)械裝備健康監(jiān)控與自愈化北京市重點(diǎn)實(shí)驗(yàn)室,北京 100029)
離心泵是石油化工、冶金、電力及國防工業(yè)的一種關(guān)鍵旋轉(zhuǎn)機(jī)械,由于其工作轉(zhuǎn)速高、介質(zhì)溫度壓力高等運(yùn)行特點(diǎn),使其容易發(fā)生各種機(jī)械故障。同時(shí),雖然大多數(shù)離心泵均有備臺(tái)可切換,但由于其介質(zhì)部分具有可燃性,導(dǎo)致其故障危害性往往較大,近年來石化企業(yè)發(fā)生多起由于關(guān)鍵離心泵故障引起的惡性事故,嚴(yán)重影響了流程工業(yè)的可靠運(yùn)行和生產(chǎn)安全。目前在線監(jiān)測(cè)技術(shù)已經(jīng)廣泛應(yīng)用于各類大型企業(yè),但是對(duì)于故障識(shí)別及診斷主要依賴于現(xiàn)場(chǎng)相關(guān)人員以人工的方式,通過監(jiān)測(cè)數(shù)據(jù)進(jìn)行趨勢(shì)分析、頻譜分析及包絡(luò)分析等技術(shù),并結(jié)合自身知識(shí)和經(jīng)驗(yàn)對(duì)離心泵的運(yùn)行狀態(tài)進(jìn)行判斷。隨著我國各類企業(yè)對(duì)無人或少人化生產(chǎn)的推進(jìn),上述診斷方式已顯示出明顯的弊端,主要存在以下兩個(gè)問題:①人工診斷對(duì)人的要求較高,若想實(shí)現(xiàn)準(zhǔn)確的故障分析,要求相關(guān)人員不僅具備全面的故障診斷專業(yè)知識(shí)和信號(hào)處理分析理論,還需具備豐富的實(shí)際現(xiàn)場(chǎng)經(jīng)驗(yàn);②人工診斷效率難以滿足企業(yè)大批量離心泵的故障分析需求,各大型企業(yè)現(xiàn)場(chǎng)的離心泵數(shù)量往往較多,少則數(shù)百臺(tái),多則上千臺(tái),具備診斷能力的專家有限,難以滿足及時(shí)診斷的需求。因此,離心泵故障的智能診斷是一個(gè)亟需解決的問題。
針對(duì)離心泵的智能診斷,目前研究主要集中于兩個(gè)方向:一是基于知識(shí)規(guī)則的自動(dòng)診斷,將專家的診斷規(guī)則程序化[1-3],但由于人在根據(jù)規(guī)則進(jìn)行診斷時(shí)帶有明顯的閾值容偏性,而程序?qū)Υ穗y以較好實(shí)現(xiàn),因此該類方法雖然研究的起步較早,但目前仍主要停留在半自動(dòng)診斷的狀態(tài),未實(shí)現(xiàn)廣泛的工程應(yīng)用;二是基于故障數(shù)據(jù),利用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)方法進(jìn)行智能診斷,其研究起步較晚,目前仍處于理論研究階段。
卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)方法的經(jīng)典模型之一,具備高度的非線性抽象和擬合功能,不僅在機(jī)器視覺和圖片識(shí)別等領(lǐng)域取得了重大突破[4],也逐漸應(yīng)用在設(shè)備故障診斷領(lǐng)域。在服務(wù)于設(shè)備故障診斷方面,國內(nèi)外學(xué)者主要開展了如下兩方面的探索研究。第一方面,利用傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò),將振動(dòng)數(shù)據(jù)轉(zhuǎn)換為二維特征進(jìn)行故障識(shí)別。Zhang等[5-6]提出將一維信號(hào)按照規(guī)定步長(zhǎng)寫入二維矩陣,從而將一維信號(hào)轉(zhuǎn)化至二維,并利用卷積神經(jīng)網(wǎng)絡(luò)識(shí)別軸承故障。李恒等[7-9]利用時(shí)頻變換將時(shí)域信號(hào)轉(zhuǎn)換為時(shí)頻圖,基于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)不同設(shè)備的故障識(shí)別。以上方法是卷積神經(jīng)網(wǎng)絡(luò)在故障診斷中的大膽嘗試,并取得了一定效果。但振動(dòng)信號(hào)作為一維序列信號(hào),各個(gè)時(shí)刻的數(shù)據(jù)點(diǎn)具有關(guān)聯(lián)性,若直接將其轉(zhuǎn)換為二維圖片,信號(hào)中空間相關(guān)性會(huì)遭到破壞,可能丟失部分故障相關(guān)信息。第二方面,將傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),直接以振動(dòng)數(shù)據(jù)為輸入,利用卷積神經(jīng)網(wǎng)絡(luò)具有自動(dòng)特征提取和模式識(shí)別的特點(diǎn)進(jìn)行故障診斷。Sun等[10]提出一種采用雙樹復(fù)小波變換來獲取多尺度信號(hào)的特征,并利用一維卷積神經(jīng)網(wǎng)絡(luò)方法自動(dòng)識(shí)別來自多尺度信號(hào)特征的故障特征,通過齒輪故障識(shí)別實(shí)驗(yàn)驗(yàn)證了該方法能有效識(shí)別齒輪故障。Jia等[11]提出DNCNN(deep normalized convolutional neural network)模型,用于不平衡故障識(shí)別,并對(duì)卷積核學(xué)習(xí)所得一維特征圖的物理意義進(jìn)行探究。胡曉依等[12]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和SVM(support vector machine),提出以時(shí)域波形為輸入,適用于軸承故障診斷的深度卷積神經(jīng)網(wǎng)絡(luò)模型。
基于卷積神經(jīng)網(wǎng)絡(luò)建立故障診斷模型的研究已經(jīng)初見成效,但目前仍存在如下問題:①直接以振動(dòng)波形、頻譜及多域特征打包作為網(wǎng)絡(luò)輸入,造成網(wǎng)絡(luò)的輸入特征維度高,計(jì)算量大導(dǎo)致其難以在實(shí)時(shí)狀態(tài)監(jiān)測(cè)中應(yīng)用,同時(shí)輸入維度高易引入和故障不相關(guān)的特征進(jìn)而導(dǎo)致過擬合等問題;②所需訓(xùn)練樣本數(shù)量多,而離心泵故障案例數(shù)據(jù)收集并不容易,訓(xùn)練樣本不足則易造成識(shí)別準(zhǔn)確率低等問題。
針對(duì)以上問題,本文提出一種基于補(bǔ)償距離評(píng)估和一維卷積神經(jīng)網(wǎng)絡(luò)的離心泵故障快速智能識(shí)別方法。首先,為提高單個(gè)訓(xùn)練樣本的利用率以達(dá)到小樣本訓(xùn)練的目標(biāo),提取時(shí)域、頻域、時(shí)頻域及能量等混合域全特征,使網(wǎng)絡(luò)輸入特征盡可能多地涵蓋故障相關(guān)信息;然后,為同時(shí)滿足工程中故障識(shí)別率和算法運(yùn)行實(shí)時(shí)性兼顧的要求,使用補(bǔ)償距離評(píng)估方法對(duì)特征集進(jìn)行預(yù)處理,保留與故障有關(guān)的特征,去除冗余特征,提高算法效率。最后,以降維后的特征集作為輸入,使用一維卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)故障快速智能識(shí)別。經(jīng)實(shí)際案例驗(yàn)證,該方法故障識(shí)別率高,可利用小樣本訓(xùn)練構(gòu)建模型,同時(shí)其特征計(jì)算、訓(xùn)練收斂及測(cè)試集分析速度快,適用于工程中離心泵的故障智能識(shí)別。
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),主要應(yīng)用于圖像、視頻等二維數(shù)據(jù)的識(shí)別。卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、全連接層以及輸出層構(gòu)成,其網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。
圖1 傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of typical convolution neural network
卷積層和池化層主要用于輸入數(shù)據(jù)的特征自學(xué)習(xí)。卷積層通常由多個(gè)卷積核構(gòu)成,通過卷積核對(duì)輸入的數(shù)據(jù)做卷積運(yùn)算,自動(dòng)提取特征。池化層是對(duì)卷積得到的特征做池化運(yùn)算。主流的池化方式有最大池化和平均池化。經(jīng)過卷積計(jì)算和池化計(jì)算,將結(jié)果輸入到全連接層,最后由softmax回歸層完成分類。
將一維信號(hào)轉(zhuǎn)換為二維特征信息的維度轉(zhuǎn)換會(huì)導(dǎo)致龐大的計(jì)算量,解決一維信號(hào)的分析識(shí)別問題,最好的方式是使用一維識(shí)別模型。因此,本文基于一維卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建故障診斷模型。本模型在傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,將卷積核和池化核由二維改為一維,實(shí)現(xiàn)對(duì)一維振動(dòng)信號(hào)的處理和識(shí)別,不再需對(duì)原始信號(hào)進(jìn)行二維轉(zhuǎn)換,顯著減少了信號(hào)分析及計(jì)算工作量。一維卷積層計(jì)算公式如式(1)所示,最大池化層計(jì)算公式如式(2)所示。
(1)
(2)
現(xiàn)場(chǎng)采集到的離心泵振動(dòng)信號(hào)中包含復(fù)雜的環(huán)境噪聲,若直接將波形數(shù)據(jù)作為輸入特征,神經(jīng)網(wǎng)絡(luò)內(nèi)部難以實(shí)現(xiàn)時(shí)域到頻域、時(shí)頻域的轉(zhuǎn)換,易造成部分故障特征無法被網(wǎng)絡(luò)感知、噪聲引起網(wǎng)絡(luò)誤感知等問題。同時(shí),現(xiàn)場(chǎng)故障樣本數(shù)據(jù)收集難度大,故障案例樣本數(shù)量遠(yuǎn)小于無故障樣本,因此在模型訓(xùn)練中需盡可能將故障樣本的特征信息更全面地進(jìn)行挖掘,進(jìn)而在小樣本狀態(tài)下實(shí)現(xiàn)有效的模型訓(xùn)練。
針對(duì)上述問題,基于離心泵振動(dòng)信號(hào)分析基礎(chǔ)理論,本文構(gòu)建混合域全特征集作為神經(jīng)網(wǎng)絡(luò)的原始輸入特征,其包含元素分以下三類,共101維,如表1所示。
表1 混合域全特征集組成Tab.1 Composition of the full feature sets in mixed domains
時(shí)域及頻域特征多為離心泵振動(dòng)信號(hào)分析常用指標(biāo),對(duì)能量及熵特征的計(jì)算作如下說明:為了更好的反映故障引起的非平穩(wěn)動(dòng)態(tài)響應(yīng),本文使用小波包變換對(duì)信號(hào)進(jìn)行時(shí)頻分析。選擇常用的正交小波基db3,進(jìn)行3層小波包分解。并對(duì)分解后的分量求解小波包能量、能量矩。從衡量系統(tǒng)的混亂程度的角度上,引入熵的概念。計(jì)算近似熵、樣本熵、排列熵等熵特征[15]。
為實(shí)現(xiàn)小樣本狀態(tài)下有效的模型訓(xùn)練,構(gòu)建混合域全特征集作為神經(jīng)網(wǎng)絡(luò)的原始輸入特征。若將此特征集直接輸入神經(jīng)網(wǎng)絡(luò),即未考慮故障對(duì)特征的敏感性,將與故障相關(guān)、不相關(guān)特征均作為輸入,必然導(dǎo)致如下兩個(gè)問題:①神經(jīng)網(wǎng)絡(luò)內(nèi)部特征維度高,模型實(shí)際應(yīng)用時(shí)占用計(jì)算機(jī)資源較多;②特征計(jì)算及模型訓(xùn)練、檢測(cè)所需時(shí)間長(zhǎng),難以滿足應(yīng)用中實(shí)時(shí)化要求。要實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型在實(shí)際中的應(yīng)用,快速計(jì)算分析是其中一個(gè)關(guān)鍵問題,需要在保證輸入特征滿足故障識(shí)別率要求的前提下盡可能降低輸入特征維度。
針對(duì)上述問題,本文提出基于補(bǔ)償距離評(píng)估的輸入特征降維優(yōu)化,充分考慮特征對(duì)故障分類識(shí)別的敏感性,篩選出故障敏感特征,其算法原理如下所述。
假設(shè)具有C個(gè)類w1,w2,w3,…,wc的特征集[16-17]
{pc,m,k,c=1,2,…,C;m=1,2,…,Mc;
k=1,2,…,K}
(3)
式中:pc,m,w為c狀態(tài)下第m個(gè)樣本第k個(gè)特征;Mc為c狀態(tài)下樣本總數(shù);K為每個(gè)樣本特征數(shù)目。在c類狀態(tài)下,可得Mc個(gè)樣本,因此總共可得Mc×C個(gè)樣本集。從而得到Mc×C×K個(gè)特征,定義為{pc,m,k}。
(1)計(jì)算Mc×C類中所有特征向量
(4)
對(duì)dc,k(c=1,2,…,C)求平均后得平均類內(nèi)距離
(5)
(6)
(3)計(jì)算C個(gè)模型類的類間距離
(7)
(8)
(5)定義并計(jì)算補(bǔ)償因子
(9)
(10)
對(duì)αk歸一化處理,得補(bǔ)償距離評(píng)估指標(biāo)為
(11)
本文提出基于距離評(píng)估技術(shù)和卷積神經(jīng)網(wǎng)絡(luò)的離心泵故障智能識(shí)別模型,其實(shí)現(xiàn)流程如圖2所示,主要包含如下4個(gè)步驟:
步驟1混合域全特征集構(gòu)造。基于離心泵振動(dòng)信號(hào)及其分析理論,構(gòu)造三類101維混合域全特征集。其中包括16維時(shí)域特征、13維頻域特征及小波包分解信號(hào)的72維能量及熵特征,具體組成如表1所示。此特征集可較全面地涵蓋數(shù)據(jù)中的故障特征信息,通過此特征集進(jìn)行故障識(shí)別模型訓(xùn)練可充分挖掘訓(xùn)練樣本中的故障信息,進(jìn)而提高單個(gè)訓(xùn)練樣本的利用率,使故障識(shí)別降低對(duì)大樣本的依賴,具備小樣本深挖掘的能力。
步驟3故障識(shí)別模型建立。首先,以一維卷積神經(jīng)網(wǎng)絡(luò)建立故障識(shí)別模型,初始化網(wǎng)絡(luò)參數(shù)。然后,使用訓(xùn)練樣本降維后的特征集進(jìn)行模型訓(xùn)練,以達(dá)到Loss曲線收斂為訓(xùn)練目標(biāo),不斷優(yōu)化網(wǎng)絡(luò)參數(shù),最終建立針對(duì)該離心泵的基于一維卷積神經(jīng)網(wǎng)絡(luò)的故障識(shí)別模型,將模型進(jìn)行保存固化,上述模型可用于該泵n類故障(訓(xùn)練集中包含的故障類型)的分類識(shí)別。
步驟4測(cè)試樣本故障識(shí)別。以待分析數(shù)據(jù)為原始輸入,首先計(jì)算步驟2中確定的k維特征,然后將該特征集輸入至步驟3中保存的故障識(shí)別模型,即可輸出故障識(shí)別結(jié)論。故障識(shí)別模型在實(shí)時(shí)故障分析中應(yīng)用時(shí),只需進(jìn)行本步計(jì)算,無需每次都重新進(jìn)行特征降維優(yōu)化與模型訓(xùn)練,保證了故障識(shí)別的快速實(shí)現(xiàn)。
步驟5模型升級(jí)與優(yōu)化。若出現(xiàn)新的故障類型,即原來訓(xùn)練集未包含該類故障,則將新的故障數(shù)據(jù)加入訓(xùn)練集,再對(duì)步驟2的降維特征集和步驟3的故障識(shí)別模型進(jìn)行升級(jí)與優(yōu)化。
圖2 離心泵故障快速智能識(shí)別方法流程圖Fig.2 Flow chart of the fast and intelligent fault identification method for centrifugal pump
選取兩臺(tái)離心泵現(xiàn)場(chǎng)案例,使用本文提出方法進(jìn)行分析,以驗(yàn)證該方法在離心泵故障識(shí)別中的有效性。
離心泵1為某石化煉油廠石腦油塔底泵,懸臂結(jié)構(gòu),轉(zhuǎn)速為1 450 r/min,運(yùn)行過程中發(fā)生了抽空故障。在線監(jiān)測(cè)系統(tǒng)采集的振動(dòng)信號(hào)為軸承座處振動(dòng)加速度,數(shù)據(jù)信息如表2所示。每類訓(xùn)練樣本數(shù)均小于20,為同類測(cè)試樣本的20%以下,以模擬小樣本訓(xùn)練條件。其中一組正常和故障樣本時(shí)域波形如圖3所示。
表2 離心泵1振動(dòng)數(shù)據(jù)集Tab.2 Vibration data of pump 1
圖3 離心泵1振動(dòng)加速度時(shí)域波形Fig.3 Acceleration waveform of pump 1
3.1.1 混合域全特征集構(gòu)造
將表2中訓(xùn)練樣本提取三類101維混合域全特征集,并對(duì)其進(jìn)行歸一化處理。無故障和抽空故障特征如圖4所示,對(duì)比可知部分特征在無故障和故障狀態(tài)下區(qū)分度不高,即全特征集中存在部分冗余特征。
圖4 離心泵1的全特征集對(duì)比Fig.4 Comparison of all features of pump 1
3.1.2 輸入特征降維優(yōu)化
表3 時(shí)域特征距離評(píng)估指標(biāo)Tab.3 Indications of features in time domain
表4 離心泵1降維后特征集組成Tab.4 Features after dimension reduction of pump 1
有效特征在無故障和抽空故障狀態(tài)下的對(duì)比,如圖5(b)所示。由圖可知降維后的有效特征能夠較為理想地區(qū)分無故障和抽空故障狀態(tài)。
圖5 離心泵1特征降維Fig.5 Dimension reduction for features of pump 1
3.1.3 故障識(shí)別模型建立
設(shè)定離心泵1故障識(shí)別模型架構(gòu)如下:兩個(gè)卷積層,兩個(gè)最大池化層和一個(gè)全連接層[19]。合理的配置卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)、卷積核個(gè)數(shù)及大小,可以使神經(jīng)網(wǎng)絡(luò)獲得豐富的感知視野以提取到更多的有效特征[20],同時(shí)可避免冗余計(jì)算。通過多次測(cè)試,定義初始模型具體參數(shù)如表5所示,模型架構(gòu)如圖6所示。
表5 模型參數(shù)表Tab.5 Parameters of the model
圖6 一維卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)Fig.6 Structure of the 1D convolution neural network
如表2所述,將17組無故障樣本和13組抽空故障樣本作為訓(xùn)練集,按照表4計(jì)算其27維有效特征集。然后將上述特征輸入前面定義的故障識(shí)別初始模型進(jìn)行訓(xùn)練,模型的Loss函數(shù)曲線如圖7所示。
圖7 離心泵1故障識(shí)別模型訓(xùn)練Loss函數(shù)曲線Fig.7 Loss curve of the fault identification model of pump 1
由圖7可知,通過上述訓(xùn)練集對(duì)識(shí)別模型進(jìn)行訓(xùn)練后,步數(shù)為1 200左右時(shí)Loss函數(shù)值已收斂至0,即訓(xùn)練生成了有效的模型,保存該模型為離心泵1的故障識(shí)別模型。
3.1.4 測(cè)試樣本故障識(shí)別
如表2所述,將130組無故障樣本和80組抽空故障樣本作為測(cè)試集,按照表4計(jì)算其27維有效特征集。然后將上述特征輸入保存的故障識(shí)別模型,故障識(shí)別結(jié)果如表6所示。
表6 離心泵1故障識(shí)別結(jié)果Tab.6 Fault identification results of pump 1
由表6可知:①130組無故障測(cè)試樣本識(shí)別準(zhǔn)確率為100%,80組抽空故障測(cè)試樣本識(shí)別準(zhǔn)確率為96.3%,總準(zhǔn)確率達(dá)到98.6%,識(shí)別準(zhǔn)確率高,可用于離心泵故障的分類識(shí)別;②單組數(shù)據(jù)故障識(shí)別時(shí)間為2.41 s,計(jì)算速度快,可用于離心泵實(shí)時(shí)故障分析。
離心泵2為某石化常減壓裝置底油泵,雙支承結(jié)構(gòu),轉(zhuǎn)速為2 980 r/min,運(yùn)行過程中發(fā)生了滾動(dòng)軸承內(nèi)圈損傷故障。在線監(jiān)測(cè)系統(tǒng)采集的振動(dòng)信號(hào)為軸承座振動(dòng)加速度,數(shù)據(jù)信息如表7所示,樣本選擇上繼續(xù)模擬小樣本條件。其中一組正常和故障樣本時(shí)域波形如圖8所示。
表7 離心泵2振動(dòng)數(shù)據(jù)集Tab.7 Vibration data of pump 2
圖8 離心泵2振動(dòng)加速度時(shí)域波形Fig.8 Acceleration waveform of pump 2
3.2.1 混合域全特征集構(gòu)造
同3.1.1節(jié),計(jì)算訓(xùn)練樣本的101維混合域全特征集,并作歸一化處理。無故障和軸承損傷故障特征對(duì)比如圖9所示,全特征集中亦存在大量冗余特征。
圖9 離心泵2的全特征集對(duì)比Fig.9 Comparison of all features of pump 2
3.2.2 輸入特征降維優(yōu)化
同3.1.2節(jié),對(duì)混合域全特征集進(jìn)行降維優(yōu)化,距離評(píng)估及有效特征對(duì)比,如圖10所示。
圖10 離心泵2特征降維Fig.10 Dimension reduction for features of pump 2
由圖10可知,選取出的有效特征能夠較為理想地區(qū)分無故障和軸承內(nèi)圈損傷故障狀態(tài),特征維數(shù)由101降為13,降維后特征組成如表8所示。
表8 離心泵2降維后特征集組成Tab.8 Features after dimension reduction of pump 2
3.2.3 故障識(shí)別模型建立
離心泵2故障識(shí)別初始模型同離心泵1。如表7所示,將255組無故障樣本和25組滾動(dòng)軸承損傷故障樣本作為訓(xùn)練集,按照表8計(jì)算其13維有效特征集。然后將上述特征輸入前面定義的故障識(shí)別初始模型進(jìn)行訓(xùn)練,模型的Loss函數(shù)曲線如圖11所示。
圖11 離心泵2故障識(shí)別模型訓(xùn)練Loss函數(shù)曲線Fig.11 Loss curve of the fault identification model of pump 2
由圖11可知,通過上述訓(xùn)練集對(duì)識(shí)別模型進(jìn)行訓(xùn)練后,步數(shù)為1 800左右時(shí)Loss函數(shù)值已收斂至接近于0,即訓(xùn)練生成了有效的模型,保存該模型為離心泵2的故障識(shí)別模型。
3.2.4 測(cè)試樣本故障識(shí)別
如表7所示,將255組無故障樣本和25組滾動(dòng)軸承損傷故障樣本作為測(cè)試集,按照表8計(jì)算其13維有效特征集。然后將上述特征輸入保存的故障識(shí)別模型,故障識(shí)別結(jié)果如表9所示。
表9 離心泵2故障識(shí)別結(jié)果Tab.9 Fault identification results of pump 2
由表9可知:① 255組無故障測(cè)試樣本識(shí)別準(zhǔn)確率為98.8%,25組滾動(dòng)軸承內(nèi)圈故障測(cè)試樣本識(shí)別準(zhǔn)確率為100%,總準(zhǔn)確率達(dá)到98.9%,識(shí)別準(zhǔn)確率高,可用于離心泵故障的分類識(shí)別。②單組數(shù)據(jù)故障識(shí)別時(shí)間為2.29 s,計(jì)算速度快,可用于離心泵實(shí)時(shí)故障分析。
為驗(yàn)證本文提出的故障識(shí)別方法在離心泵故障識(shí)別準(zhǔn)確率和識(shí)別速度方面的優(yōu)勢(shì),選取其他三種相似方法對(duì)上述兩個(gè)案例數(shù)據(jù)進(jìn)行分析。
方法1使用原始振動(dòng)波形作為輸入,以一維卷積神經(jīng)網(wǎng)絡(luò)建立故障識(shí)別模型[21]。將無故障和故障樣本數(shù)據(jù)分為數(shù)據(jù)長(zhǎng)度為1 024的時(shí)域波形作為輸入,其中一組輸入波形如圖12所示。
方法2使用振動(dòng)信號(hào)變換得到的時(shí)頻圖為輸入,以傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)建立故障識(shí)別模型。將無故障和故障樣本時(shí)域波形經(jīng)過小波時(shí)頻變換得到小波時(shí)頻圖,其中一組時(shí)頻圖如圖13所示。
方法3對(duì)本文提出方法進(jìn)行修改,去掉方法2的輸入特征降維優(yōu)化,即以混合域全特征集作為一維卷積神經(jīng)網(wǎng)絡(luò)的輸入。
圖12 方法1振動(dòng)波形輸入Fig.12 The input of method 1
圖13 方法2時(shí)頻圖輸入Fig.13 The input of method 2
在相同的計(jì)算條件下,訓(xùn)練樣本與測(cè)試樣本設(shè)置與3.1節(jié)及3.2節(jié)一致,模擬小樣本測(cè)試條件,使用上述三種方法及本文方法分別進(jìn)行分析,訓(xùn)練情況和識(shí)別結(jié)果如表10所示。
表10 4種模型性能對(duì)比Tab.10 Performance comparison of four models
由表10分析結(jié)果對(duì)比可知:
(1) 在小樣本訓(xùn)練條件下,本文提出方法及其簡(jiǎn)化版(即方法3)可成功完成模型訓(xùn)練,即其具備小樣本訓(xùn)練下建立模型的能力。而方法1和方法2出現(xiàn)了過擬合現(xiàn)象,即Loss函數(shù)曲線難以收斂至接近于0,如圖14和圖15所示,因此判斷這兩種方法不太適用于小樣本訓(xùn)練條件。目前解決過擬合問題的有效方法為增加樣本數(shù)量[22],但需要增加的故障樣本數(shù)量往往較大,不太符合實(shí)際生產(chǎn)安全需求。
(2) 本文提出方法及其簡(jiǎn)化版(即方法3)的故障識(shí)別準(zhǔn)確率均在98%以上,識(shí)別效果理想,其中全特征輸入的識(shí)別率略高于降維特征輸入。方法1和方法2由于過擬合現(xiàn)象的出現(xiàn),導(dǎo)致建立的模型故障識(shí)別效果較差,為50%~65%。
(3) 本文提出方法及方法1、方法2在單組數(shù)據(jù)故障識(shí)別時(shí)間及模型訓(xùn)練總時(shí)間方面存在明顯優(yōu)勢(shì),其中單組數(shù)據(jù)識(shí)別時(shí)間均在3 s左右及以下,故障識(shí)別速度快,可滿足實(shí)時(shí)故障識(shí)別的需求。而方法3由于每組數(shù)據(jù)均需構(gòu)造101維全特征集,導(dǎo)致其單組數(shù)據(jù)識(shí)別時(shí)間為14 s以上,為本文提出方法的6倍以上,難以滿足實(shí)時(shí)故障識(shí)別的要求。上述分析結(jié)果證明本文提出的基于補(bǔ)償距離評(píng)估的特征降維優(yōu)化方法可去除全特征集中的冗余信息,保留故障敏感特征,從而顯著減少特征構(gòu)造與故障識(shí)別時(shí)間。
因此,對(duì)比上述四種方法,本文提出方法在小樣本條件下模型訓(xùn)練效果、故障識(shí)別準(zhǔn)確率、識(shí)別時(shí)間及訓(xùn)練時(shí)間4個(gè)方面均具有明顯優(yōu)勢(shì),可用于工程中離心泵故障的快速智能識(shí)別。
圖14 離心泵1故障識(shí)別模型訓(xùn)練的Loss函數(shù)曲線Fig.14 Loss function curve of the fault identification model for pump 1
圖15 離心泵2故障識(shí)別模型訓(xùn)練的Loss函數(shù)曲線Fig.15 Loss function curve of the fault identification model for pump 2
(1) 本文提出的基于補(bǔ)償距離評(píng)估和一維卷積神經(jīng)網(wǎng)絡(luò)的故障快速智能識(shí)別方法能十分有效地實(shí)現(xiàn)離心泵故障的識(shí)別,故障識(shí)別準(zhǔn)確率高且識(shí)別速度快,可滿足工程應(yīng)用需求。
(2) 通過混合域全特征集的構(gòu)造,可充分挖掘訓(xùn)練樣本中的故障信息,提高單個(gè)樣本的利用率,進(jìn)而使模型具備小樣本訓(xùn)練的能力。
(3) 通過補(bǔ)償距離評(píng)估方法對(duì)全特征集進(jìn)行降維優(yōu)化,可在保留故障相關(guān)信息的同時(shí)顯著降低特征維度,進(jìn)而大幅降低特征構(gòu)造、故障識(shí)別與模型訓(xùn)練所需時(shí)間,使模型具備快速故障識(shí)別的能力。
(4) 使用已有案例數(shù)據(jù)訓(xùn)練由上述方法建立的故障識(shí)別模型,模型內(nèi)部可自動(dòng)生成對(duì)應(yīng)故障的識(shí)別方法,進(jìn)而用于后期監(jiān)測(cè)數(shù)據(jù)的智能分析與故障智能診斷。