姜萬錄, 趙亞鵬, 張淑清, 李 滿
(1. 燕山大學(xué) 河北省重型機械流體動力傳輸與控制重點實驗室,河北 秦皇島 066004;2. 燕山大學(xué) 先進鍛壓成形技術(shù)與科學(xué)教育部重點實驗室,河北 秦皇島 066004;3. 燕山大學(xué) 電氣工程學(xué)院,河北 秦皇島 066004)
液壓泵作為液壓系統(tǒng)的動力源,經(jīng)常工作在高轉(zhuǎn)速高負載狀態(tài),其健康狀態(tài)將直接影響整套設(shè)備的正常工作,因此對液壓泵的故障診斷研究具有非常重要的意義。當液壓泵出現(xiàn)故障時,采集到的振動信號通常會表現(xiàn)出復(fù)雜的非線性、非平穩(wěn)特征并且容易受到環(huán)境噪聲的干擾,由于傳統(tǒng)的時域和頻域分析方法存在一定的局限性,所以無法準確地提取特征信息。
基于各類熵值的非線性動力學(xué)分析方法已經(jīng)廣泛地應(yīng)用在機械故障診斷領(lǐng)域。熵值反映了時間序列復(fù)雜度的大小,常用的有近似熵(approximate entropy, AE)[1]、樣本熵(sample entropy, SE)[2]、排列熵(permutation entropy, PE)[3]、符號動態(tài)熵(symbolic dynamic entropy, SDE)[4]、散布熵(dispersion entropy, DE)[5]等。這些熵被用來量化單一時間尺度上信號的不規(guī)律性,但無法分析多個時間尺度上的信息。為了克服這一局限性,人們將這些熵值算法與粗?;喑叨确椒ê途殢?fù)合多尺度化方法結(jié)合,推廣到了多尺度分析領(lǐng)域。
這些多尺度熵算法廣泛地應(yīng)用在旋轉(zhuǎn)機械故障診斷中。文獻[6]將多尺度樣本熵(multiscale sample entropy, MSE)[7]應(yīng)用在生理信號和旋轉(zhuǎn)機械特征提取中,但是由于樣本熵算法的局限性,在處理短信號時不夠穩(wěn)定,且可能沒有模板向量彼此匹配而無法定義熵值,在實際工程應(yīng)用時計算速度也不夠快。多尺度排列熵(multiscale permutation entropy, MPE)[8]基于排列熵算法,考慮了時間序列信號幅值排列模式或順序關(guān)系,計算速度快,文獻[9-10]將MPE應(yīng)用在滾動軸承和液壓泵的故障診斷中。但MPE僅考慮了幅值的順序而忽略了幅度的信息,也沒有考慮嵌入向量中出現(xiàn)相等幅值時的影響,并且對噪聲敏感[11]。
散布熵的提出克服了上述缺點,計算速度快,穩(wěn)定性高,并且抗噪能力有大幅提升,而且振動信號微小的變化不會改變其映射后的類別標簽[12]。文獻[13-18]將多尺度散布熵(multiscale dispersion entropy, MDE)[19]和精細復(fù)合多尺度散布熵(refined composite multiscale dispersion entropy, RCMDE)應(yīng)用在滾動軸承、滑動軸承、齒輪箱等旋轉(zhuǎn)機械的故障診斷中,取得了良好的診斷效果。但散布熵僅考慮了幅值的絕對性而沒有考慮相對性,無法對信號的波動性進行評估。符號動態(tài)熵的概念與散布熵相似,文獻[20-21]已將其用于滾動軸承和齒輪箱的故障診斷中。但符號動態(tài)熵只能提取信號的狀態(tài)模式和狀態(tài)轉(zhuǎn)移概率,沒有考慮到信號的波動性。
Azami等[22]提出了基于波動散布熵(fluctuation-based dispersion entropy, FDE),并推廣為多尺度波動散布熵(multiscale fluctuation-based dispersion entropy, MFDE)和精細復(fù)合多尺度波動散布熵(refined composite multiscale fluctuation dispersion entropy, RCMFDE)[23],波動散布熵考慮了時間序列的波動性,對基線漂移有更強的魯棒性,并且在相同參數(shù)下,由于所有可能散布模式的減少使熵的計算速度更快。文獻[24]將波動散布熵的復(fù)合多尺度形式應(yīng)用在滾動軸承的故障診斷中。復(fù)合多尺度方法和精細復(fù)合多尺度方法的結(jié)果相似,但后者效果更好。
支持向量機(support vector machines, SVM)[25]作為一種常用的機器學(xué)習工具,非常適合解決小樣本、非線性、高維度的分類問題。但實際應(yīng)用中核函數(shù)類型、核函數(shù)參數(shù)、懲罰因子的選取對SVM的分類效果有很大影響。粒子群優(yōu)化算法(particle swarm optimization, PSO)[26]是受到鳥群或魚群覓食的社會行為啟發(fā)的群體智能優(yōu)化方法,具有很好的全局尋優(yōu)能力,因此可用于對支持向量機的超參數(shù)進行優(yōu)化。
鑒于RCMFDE在非線性動力學(xué)復(fù)雜性刻畫方面的綜合優(yōu)勢,本文將其引入液壓泵的故障診斷中,提出了一種基于RCMFDE和粒子群優(yōu)化的支持向量機(RCMFDE-PSO-SVM)相結(jié)合的故障診斷方法。首先,通過RCMFDE對液壓泵不同故障狀態(tài)的振動信號提取多尺度熵值。然后,選取合適尺度的多個熵值組成的特征向量構(gòu)成特征樣本輸入到PSO-SVM分類器中進行故障診斷。將所提出的故障診斷方法分別與基于MSE,MPE,MSDE,MDE,RCMDE,MFDE的特征提取方法以及SVM,KNN分類器進行對比,結(jié)果表明RCMFDE-PSO-SVM方法具有更高的診斷效率和故障識別正確率。
FDE與DE不同,F(xiàn)DE考慮了信號之間的相對關(guān)系而不是絕對關(guān)系,其計算步驟如下:
步驟1對于給定的一維時間序列x={x1,x2,…,xN},將x映射到{1,2,…,c}。為此,首先利用正態(tài)累積分布函數(shù)(normal cumulative distribution function,NCDF)將時間序列x映射到y(tǒng)={y1,y2,…,yN},yj∈(0,1),即
(1)
式中,μ和σ2分別為原始序列的期望和方差,再通過線性變換
(2)
將y映射到{1,2,…,c}的范圍內(nèi)。式中:round()為四舍五入取整函數(shù);c為類別個數(shù)。
(3)
(4)
步驟3計算每個可能的散布模式πv0v1…vm-1的概率p(πv0v1…vm-1)
(5)
步驟4最后根據(jù)香農(nóng)熵的定義,計算基于波動的散布熵
(6)
FDE計算中考慮散布模式相鄰元素之間的差異,稱為基于波動的散布模式。在這種算法中,能得到維數(shù)為m-1的模式向量,模式向量的每個元素范圍為-c+1~c-1,因此,總共有(2c-1)m-1種基于波動的散布模式。當所有散布模式具有相等的概率值時,熵值最大,為ln[(2c-1)m-1],此時信號是完全隨機的。
MFDE是基于粗粒化時間序列和FDE的結(jié)合,計算過程如下:
對于給定的時間序列u={u1,u2,…,uL},首先,利用向下取整將其分成長度為?L/τ」的非重疊片段,τ為尺度因子,?」為下取整運算。然后,計算出每個片段的平均值,得到時間序列
(7)
然后計算尺度因子τ下的FDE,得到尺度因子τ的函數(shù)MFDE
(8)
傳統(tǒng)的粗粒化多尺度方法由于截取的是非重疊片段,沒有充分考慮每個片段兩端相鄰元素之間的關(guān)系,隨著比例因子的增加,計算結(jié)果的穩(wěn)定性變差。所以用精細復(fù)合多尺度化方法進行替代,其計算過程如下:
(9)
(10)
ERCMFD(x,m,c,d,τ)=
(11)
在上述兩種多尺度化方法中,不僅僅是粗?;cFDE的結(jié)合,而且在所有尺度的NCDF映射中都要保持原始信號的μ和σ2不變,這類似于MSE算法中要保持相似容限r(nóng)恒定,因為保持r恒定比獨立計算每個尺度下的r效果更好[27-28]。
MFDE和RCMFDE的參數(shù)有時延d、嵌入維數(shù)m、類別個數(shù)c和尺度因子τ。對于時延d通常設(shè)置為1,因為當d>1時可能會丟掉一些重要的頻率信息導(dǎo)致混疊。只有采樣頻率遠大于信號的最高頻率分量時,可以選擇其他的時延。嵌入維數(shù)m太小可能檢測不到信號中的動態(tài)變化,而較大的m無法觀察到微小的變化,應(yīng)用中通常選擇2≤m≤5。為了避免噪聲對信號的影響,應(yīng)該使用較小的類別個數(shù)c,但過小的c值會丟失數(shù)據(jù)的詳細信息導(dǎo)致錯誤的概率估計,因此通常取3≤c≤8。
在復(fù)雜性評估算法研究中,通常都利用白噪聲和粉紅噪聲作為評估對象來驗證算法性能。為了評估RCMFDE的性能,下面將其與MSE,MPE,MSDE,MDE,RCMDE,MFDE 6種算法進行比較。分別選取50組長度為4 096點的高斯白噪聲(white Gaussian noise, WGN)和粉紅噪聲(1/fnoise)信號,分別計算20個尺度下上述7種熵的均值和標準差,繪制誤差棒圖,如圖1所示。MSE的參數(shù)設(shè)置為m=3,r=0.15σ(σ為標準差);MPE的參數(shù)設(shè)置為m=3;MSDE,MDE,RCMDE,MFDE,RCMFDE的參數(shù)設(shè)置為m=3,c=6,d=1。
圖1 粉紅噪聲和高斯白噪聲的7種熵值的誤差棒圖Fig.1 Error bars of seven entropies of 1/f noise and WGN
從圖1中可以看出,除MPE外,其余熵算法均能明顯地區(qū)分出兩種噪聲,且熵值曲線趨勢相同。在較低尺度上高斯白噪聲的熵值更高,隨著尺度因子的增加,高斯白噪聲熵值單調(diào)下降,而粉紅噪聲的熵值基本保持不變。這是由于粉紅噪聲具有長程相關(guān)性,其1/f衰減在時間上產(chǎn)生分形結(jié)構(gòu)。而高斯白噪聲結(jié)構(gòu)簡單,各成分相關(guān)性小。仿真結(jié)果與兩種噪聲的理論分析一致,即粉紅噪聲有比高斯白噪聲更復(fù)雜的結(jié)構(gòu),而高斯白噪聲更不規(guī)則。
由于標準差可能會隨著平均值的變化而變化,變異系數(shù)(coefficient of variation, CV)可以消除測量尺度和量綱不統(tǒng)一對數(shù)據(jù)離散程度大小的影響。分別計算上述7種熵值的變異系數(shù),其結(jié)果如圖2所示。
圖2 粉紅噪聲和高斯白噪聲7種熵的變異系數(shù)Fig.2 CVs of the seven entropies of 1/f noise and WGN
從圖2中可以看出,在高斯白噪聲中MPE的變異系數(shù)最小,但無法區(qū)分兩種噪聲?;贒E和FDE算法的變異系數(shù)比MSE的小,基于FDE算法的變異系數(shù)比基于DE算法的小。兩種噪聲中精細復(fù)合多尺度方法的變異系數(shù)都最小,穩(wěn)定性最高。
圖3 7種熵算法的平均計算時間隨高斯白噪聲信號長度的變化Fig.3 Average calculation times of the seven entropies with different lengths of WGN
從圖3中可以看出,7種熵的計算時間隨著數(shù)據(jù)長度的增加而增加。MSE算法的時間復(fù)雜度為O(N2)。由于SDE,DE和FDE算法的時間復(fù)雜度為O(N),MSDE,MDE,RCMDE,MFDE,RCMFDE的時間復(fù)雜度也為O(N)。在相同的參數(shù)下,F(xiàn)DE中所有可能的散布模式數(shù)量更少,從而計算速度比DE更快。對比RCMFDE和RCMDE可以看出較明顯的差異。
對于多分類問題,使用多個“一對一”分類SVM,在各個類別之間構(gòu)造分類函數(shù),對于n個類別共需要構(gòu)造n(n-1)/2個決策超平面。設(shè)訓(xùn)練樣本集為(xi,yi),i=1,2,…,N,xi∈Rd,y∈{故障模式標簽(n個)},對第r類和s類,尋找如下問題的解
(12)
(13)
分類時使用投票法,判斷xi屬于第r類故障,則第r類故障的票數(shù)加1,否則第s類故障的票數(shù)加1。所有決策函數(shù)都判斷完成之后,最終得票最多的類別為樣本點xi所屬的故障類別。
在解空間中隨機初始化m個粒子構(gòu)成初始種群,記第i個粒子當前位置為xi,每個粒子都對應(yīng)于優(yōu)化問題的一個解。為每個粒子隨機初始化一個速度vi,速度用來決定粒子在解空間中的運動。由目標函數(shù)為之確定一個適應(yīng)值,在算法的每次迭代中,粒子將跟蹤自身和種群當前找到的最優(yōu)解,其中每個粒子當前找到的極值為pi,種群當前找到的全局極值為pg,逐代搜索,直到最后得到最優(yōu)解。粒子的速度和位置更新公式為
vi+1=wvi+c1r1(pi-xi)+c2r2(pg-xi)
(14)
xi+1=xi+vi+1
(15)
式中:c1為局部學(xué)習因子;c2為全局學(xué)習因子;w為慣性因子;r1,r2為[0,1]均勻分布的隨機數(shù)。
采用PSO優(yōu)化的SVM作為分類器,以實現(xiàn)對液壓泵故障的識別。本文提出的RCMFDE-PSO-SVM液壓泵故障診斷方法的流程圖如圖4所示,診斷步驟如下:
步驟1首先,使用加速度傳感器采集不同故障類型的振動信號;
步驟2對采集的信號計算RCMFDE,分析多尺度故障信息;
步驟3選取合適尺度下的多個RCMFDE值作為特征向量,獲得故障特征樣本集;
步驟4將故障特征樣本集按比例隨機劃分為訓(xùn)練樣本集和測試樣本集,將訓(xùn)練樣本集輸入PSO-SVM訓(xùn)練模型;
步驟5將測試樣本集輸入訓(xùn)練好的模型進行故障識別。
圖4 液壓泵故障診斷流程圖Fig.4 Flow chart of hydraulic pump fault diagnosis
液壓泵振動信號采自液壓泵故障模擬試驗臺,如圖5所示。液壓泵為MCY14-1B型斜盤式軸向柱塞泵,柱塞數(shù)目為7,理論排量為10 mL/r,額定工作壓力為31.5 MPa。驅(qū)動電機型號Y132M-4,額定轉(zhuǎn)速為1 480 r/min。加速度傳感型號YD72D,頻率范圍為1 Hz~18 kHz。對液壓泵端蓋的振動信號進行采集。試驗時調(diào)定主溢流閥將系統(tǒng)壓力設(shè)置為10 MPa,采樣頻率設(shè)為10 kHz,每次采樣時長為10 s。
本試驗分別采集了液壓泵的正常狀態(tài)、中心彈簧失效、滑靴磨損、單柱塞松靴和斜盤磨損5種狀態(tài)下的振動信號,故障是用故障元件替換正常元件注入的。將每種信號不重疊地截取48組數(shù)據(jù),每組數(shù)據(jù)中含有2 048個數(shù)據(jù)點,5種狀態(tài)共獲得240組樣本。每種故障各選一組典型樣本的時域波形,如圖6所示。
圖5 液壓泵故障模擬試驗臺Fig.5 Hydraulic pump failure simulation test bench
為了比較各種熵值算法在不同尺度下的性能,計算240個樣本的RCMFDE值,同時計算出MSE,MPE,MSDE,MDE,RCMDE,MFDE值。MSE的參數(shù)選擇為m=3,r=0.15σ,d=1,τ=20。MPE的參數(shù)設(shè)置為m=3,d=1,τ=20。MSDE和基于DE,F(xiàn)DE的各種算法的參數(shù)均選取為m=3,c=6,d=1,τ=20。計算7種熵的均值和標準差,繪制誤差棒圖,如圖7所示。
圖6 振動信號時域波形Fig.6 Time-domain waveforms of vibration signal
圖7 不同故障振動信號的7種熵的誤差棒圖Fig.7 Error bars of the seven entropies of different fault vibration signals
從圖7可以看出,正常和4種故障狀態(tài)的多尺度熵值明顯不同,精細復(fù)合多尺度方法比傳統(tǒng)多尺度方法曲線更為平滑(見圖7(e)和圖7(g)),誤差更小,穩(wěn)定性更高。熵值曲線在較小和較大的尺度上有交叉或重疊,都不利于分類,所以需要選擇合適的特征向量維數(shù)。
依次將MSE,MPE,MSDE,MDE,RCMDE,MFDE,RCMFDE的前2個~20個尺度下的熵值作為特征向量構(gòu)造故障特征樣本集。訓(xùn)練集和測試集的比例劃分為7∶3,按這個比例隨機劃分訓(xùn)練集和測試集,即從每類信號中選取33個特征樣本為訓(xùn)練集,15個特征樣本為測試集。計算10次分類結(jié)果的平均準確率作為最終準確率,比較這7種算法的性能以及特征向量維數(shù)對分類結(jié)果的影響。
采用基于粒子群優(yōu)化的支持向量機對這些特征向量進行分類,以實現(xiàn)對液壓泵故障的識別。SVM的核函數(shù)選擇高斯核函數(shù),通過PSO算法尋找最優(yōu)的兩個超參數(shù),即懲罰因子C和核函數(shù)寬度系數(shù)σ。PSO算法參數(shù)設(shè)置為粒子數(shù)量25、迭代次數(shù)50、局部學(xué)習因子2、全局學(xué)習因子2、慣性因子0.8。將正常、中心彈簧失效、滑靴磨損、單柱塞松靴、斜盤磨損分別標記為類別0~4。然后,將訓(xùn)練集輸入分類器進行訓(xùn)練,選擇3次交叉驗證的最高準確率的參數(shù)作為分類器超參數(shù),再將測試集輸入到分類器對訓(xùn)練后的模型進行測試。結(jié)果如圖8所示。
圖8 不同特征向量維數(shù)的平均識別準確率Fig.8 Average recognition accuracies of different eigenvector dimensions
在圖8中,通過對比可以看出,RCMFDE取得了最好的效果,當特征向量維數(shù)為8時平均準確率最高,達到了0.99。4種基于DE和FDE算法的準確率都高于MSE,MPE和MSDE算法,其中基于FDE算法的分類效果優(yōu)于基于DE的算法,精細復(fù)合多尺度化方法比傳統(tǒng)多尺度化方法準確率更高。
為了研究訓(xùn)練集和測試集劃分比例對分類準確率的影響,選擇前8個尺度下的熵值作為特征向量構(gòu)造樣本集,將訓(xùn)練集、測試集比例分為5種情況(1∶9,3∶7,5∶5,7∶3,9∶1),分別計算20次的平均準確率。結(jié)果如圖9所示。
圖9 不同訓(xùn)練/測試集比例下平均識別準確率Fig.9 Average recognition accuracies of different training and testing set ratio
RCMFDE在不同的訓(xùn)練集、測試集比例下仍具有最高的故障識別準確率,其余趨勢也與圖8的分析結(jié)果相同。所有算法的準確率都隨著比例的增加而增加,如果訓(xùn)練樣本足夠多,可以獲得更高的正確率,然而計算成本也越高。為了在準確率和計算效率之間取得平衡,本文訓(xùn)練集和測試集的比例選為7∶3。
為了研究不同分類器對準確率和計算時間的影響,驗證RCMFDE-PSO-SVM算法的突出優(yōu)勢。對MPE,MSDE,RCMDE,RCMFDE 4種算法分別使用PSO-SVM,SVM(懲罰因子C=1,寬度系數(shù)σ=1.581),KNN(臨近系數(shù)k=5)3種分類器診斷20次,記錄平均識別準確率和計算時間(該時間包含構(gòu)造特征樣本集所用時間),結(jié)果如表1所示。
表1 3種分類器平均識別準確率和計算時間Tab.1 Average recognition accuracies and calculation times of the three classifiers
由表1對比可以看出,RCMFDE-PSO-SVM算法具有最高的分類識別準確率并且兼顧了較快的計算效率。
滑靴磨損是液壓泵主要的故障形式之一,對液壓泵進行狀態(tài)監(jiān)測和滑靴性能退化評估非常重要[29]。使用3種不同磨損程度的柱塞滑靴組件依次替換正常柱塞滑靴組件(如圖10所示),來模擬液壓泵滑靴磨損故障的退化過程。將3種滑靴磨損程度分別命名為輕度、中度、重度滑靴磨損。對液壓泵端蓋的振動信號進行采集,采樣頻率為10 kHz,每次采樣時長為10 s。將正常信號與3種故障信號不重疊地截取48組數(shù)據(jù),每組數(shù)據(jù)中含有2 048個數(shù)據(jù)點,共獲取196組樣本。
圖10 滑靴磨損柱塞與正常柱塞對比Fig.10 The comparison of loose shoe between wear and normal
為了進一步驗證精細復(fù)合多尺度方法的優(yōu)越性,使用了MSE,MPE,MSDE,RCMDE,RCMFDE 5種算法計算4種狀態(tài)下泵端蓋振動信號的熵值,繪制誤差棒圖,結(jié)果如圖11所示。
圖11 4種磨損程度下5種熵的誤差棒圖Fig.11 Error bars of the five entropies for four types of wear degrees
從圖11中可以看出:MSE的正常狀態(tài)的曲線和故障狀態(tài)曲線明顯不同,但3種故障程度曲線交叉重疊在一起,不利于區(qū)分;MPE的4條曲線交叉重疊且誤差很大;MSDE的中、重度磨損曲線幾乎完全重疊;RCMDE的3種故障程度曲線有一定的區(qū)分度,但正常狀態(tài)和滑靴重度磨損曲線在較低和較高的尺度都有重疊;RCMFDE的3種故障程度曲線在較高尺度區(qū)分度大,正常狀態(tài)曲線與故障狀態(tài)曲線在低尺度也有較好的區(qū)分性。
依次將MSE,MPE,MSDE,RCMDE,RCMFDE的前2個~20個尺度下的熵值作為特征向量構(gòu)造特征樣本集。訓(xùn)練集和測試集的比例劃分為7∶3,劃分方法為隨機劃分,即每類信號中33個特征樣本為訓(xùn)練集,15個特征樣本為測試集。選擇10次分類結(jié)果的平均準確率作為最終識別準確率,比較這5種算法的識別性能以及特征向量維數(shù)對分類結(jié)果的影響,采用PSO-SVM方法對這些特征樣本進行分類識別,結(jié)果如圖12所示。
由圖12可以看出,RCMFDE和RCMDE算法的分類效果明顯高于其余算法,RCMFDE算法取得了最好的效果,當特征向量維數(shù)為9時磨損程度平均識別準確率最高,達到了0.91。MSE,MPE,MSDE,RCMDE,RCMFDE平均診斷時間分別為20.2 s,8.2 s,7.3 s,12.6 s和10.5 s(計算環(huán)境與上文相同),RCMFDE-PSO-SVM算法在獲得最高診斷準確率的同時,耗時較短。
圖12 5種熵不同特征向量維數(shù)的平均識別準確率Fig.12 The average recognition accuracies of different eigenvector dimensions of the five entropies
將RCMFDE特征提取算法引入到液壓泵故障診斷領(lǐng)域,提出了一種基于RCMFDE-PSO-SVM的液壓泵故障診斷方法。
(1) 利用仿真信號對7種熵算法MSE,MPE,MSDE,MDE,RCMDE,MFDE,RCMFDE的性能進行了比較。結(jié)果表明RCMFDE能夠捕捉到時間序列的波動性,對基線漂移有更強的魯棒性,并且計算速度更快,穩(wěn)定性更高。
(2) 對液壓泵不同類型故障進行試驗,模擬了正常、中心彈簧失效、滑靴磨損、單柱塞松靴和斜盤磨損5種狀態(tài)。利用上述7種熵算法進行特征提取并與SVM,KNN分類器進行比較,結(jié)果表明RCMFDE-PSO-SVM方法診斷準確率最高。
(3) 將該方法用于液壓泵性能退化程度的識別,進行了輕、中、重3種滑靴磨損程度的試驗,利用5種熵算法MSE,MPE,MSDE,RCMDE,RCMFDE進行特征提取,結(jié)果再次證明RCMFDE-PSO-SVM方法的診斷準確率最高,計算時間短。
(4) 基于RCMFDE-PSO-SVM的故障診斷方法能有效地提取液壓泵的故障特征,并成功地識別不同類型、不同程度的故障。該方法在液壓泵故障診斷和性能退化評估上都具有顯著優(yōu)勢。