戴洪德,陳強強,戴邵武,朱 敏
(1.海軍航空大學(xué) 航空基礎(chǔ)學(xué)院,煙臺 264000; 2.海軍航空大學(xué) 岸防兵學(xué)院,煙臺 264000)
隨著科技的發(fā)展,航空發(fā)動機等機械設(shè)備在民用及軍用中占據(jù)著較大的比重并發(fā)揮著重要的作用。滾動軸承是各類機械設(shè)備的“基石”,其運行狀態(tài)對整個設(shè)備的性能而言至關(guān)重要。因此,為了提高機械設(shè)備的穩(wěn)定性與可靠性,實現(xiàn)對機械設(shè)備的故障診斷具有重要的理論意義和實際意義。
隨著非線性理論的深入發(fā)展,許多非線性方法被應(yīng)用于機械設(shè)備的故障診斷。Logan通過對關(guān)聯(lián)維數(shù)進行展開研究,并成功將其運用于滾動軸承故障分析[1]。文獻[2]結(jié)合經(jīng)驗?zāi)B(tài)分解,利用分形維數(shù)對轉(zhuǎn)子系統(tǒng)故障診斷進行了研究分析。文獻[3]結(jié)合非線性理論,將混沌和Lyapunov指數(shù)等理論進行結(jié)合,實現(xiàn)了汽輪發(fā)動機的故障診斷。文獻[4]提出了近似熵概念,并將其應(yīng)用于機械系統(tǒng)的健康狀態(tài)管理。然而,在這些非線性理論中,如分形維數(shù)、近似熵等研究方法存在著計算量過大,運行速度較慢等缺點,而Lyapunov等理論存在著精度不高等缺點,這在一定程度上制約了其發(fā)展。
排列熵(Permutation Entropy,PE)由Bandt和Prompe提出[5],最早應(yīng)用于檢測時間序列的隨機性和動力學(xué)突變行為[6]。文獻[7]通過對信號進行排列熵分析,證明了通過排列熵可有效放大各信號的動態(tài)變化,從而實現(xiàn)不同狀態(tài)下滾動軸承的狀態(tài)分析。文獻[8]將排列熵應(yīng)用于轉(zhuǎn)子碰摩數(shù)據(jù),并成功實現(xiàn)轉(zhuǎn)子碰摩數(shù)據(jù)的故障診斷。文獻[9]將排列熵概念引入至肌電信號的分析中并取得了很好的效果。但排列熵理論只是用于檢測時間序列在單一尺度上的隨機性和動力學(xué)突變,在精密的機械系統(tǒng)中,故障數(shù)據(jù)可能較為復(fù)雜,此時單一的排列熵無法保證信息的完整性,無法實現(xiàn)準確的特征提取。
為提升排列熵的性能,在排列熵的基礎(chǔ)上,文獻[10]提出了多尺度排列熵(Multiscale Permutation Entropy,MPE)的概念,衡量了時間序列在不同尺度下的復(fù)雜性與隨機性。文獻[11]提出了復(fù)合多尺度熵(Composite Multiscale Entropy,CMSE),通過對同一尺度下的不同時間序列的樣本熵值進行均值處理以得到特征信息。然而,多尺度化的不足之處在于基于粗?;绞蕉x的多尺度計算方法依賴于時間序列的長度。隨著粗?;蛄虚L度的改變,熵值也會發(fā)生變化。第二點不足之處在于,無論是PE、MPE以及CMSE,在計算過程中都需要確定嵌入維數(shù)、時間延遲等參數(shù)。這些參數(shù)的選擇對于熵值的計算影響較大且一般均通過經(jīng)驗選取,這在一定程度上影響著算法的自適應(yīng)性,不利于后續(xù)故障維護工作的進行。
基于上述原因,本文提出了一種新的衡量時間序列復(fù)雜程度的方法—樣本分位數(shù)排列熵,并將其運用于滾動軸承非線性故障特征提取。通過引入樣本分位數(shù)概念于排列熵計算中,克服了排列熵及其他熵值計算中的參數(shù)選擇問題,有效提高了故障特征提取的自適應(yīng)性;同時利用實驗數(shù)據(jù)進行驗證,在相同實驗條件下,樣本分位數(shù)排列熵方法能夠有效提取出不同故障數(shù)據(jù)的特征,實現(xiàn)了滾動軸承故障類型的區(qū)分,是一種新型有效的故障診斷特征提取方法。
針對長度為N的時間序列{x(i),i=1,2,…,N},對x(i)進行相空間重構(gòu)[12]:
(1)
式中:m為嵌入維數(shù),τ為延遲時間,k=N-(m-1)τ為重構(gòu)向量的個數(shù)。
將Xj中的元素按升序排列得:
x[i+(j1-1)τ]≤…≤x[i+(jm-1)τ]
(2)
式中:j1,j2,…,jm為各元素在排序之前位于相空間所在列的索引。
若Xj中有兩元素相等,則按原始順序排列。通過對相空間重構(gòu)后的時間序列分析,對于任意一個Xj,均能得到相應(yīng)的符號序列Sl={j1,j2,…,jm},其中,l=1,2,…,k,且k≤m!??啥x排列熵為[13]:
(3)
(4)
此時,Hp的取值為[0,1],可反映出時間序列的復(fù)雜度。Hp越大,則序列復(fù)雜程度越高。
在排列熵計算過程中,嵌入維數(shù)m和時間延遲τ的取值是計算中的主要參數(shù)。一般情況下均根據(jù)經(jīng)驗取得:若m取值過小,則重構(gòu)向量所包含的狀態(tài)信息過少,導(dǎo)致不能完全反映系統(tǒng)特征,從而失去算法意義;若m取值過大,則時間序列被均勻化,此時不僅擴大了計算量,時間序列的微小變化也會被忽略[14]。排列熵算法參數(shù)的選擇,在一定程度上制約了其算法的有效性。
目前文獻對于排列熵算法中參數(shù)的選擇,一般通過經(jīng)驗獲得。通過以往學(xué)者的多次仿真實驗,認為時間序列長度N越小,m取值越小[15];對于長度大于1 024的數(shù)據(jù),通常選取嵌入維數(shù)m=6。而τ對計算的影響較小,一般取τ=1。這種經(jīng)驗選取方式不具有普適性,不利于故障特征提取。
文獻[16]對排列熵算法的參數(shù)優(yōu)化進行了系統(tǒng)的分析,提出了利用重構(gòu)時間序列最佳相空間的方法來確定模型參數(shù),并介紹了m和τ獨立確定和聯(lián)合確定的方法。但其局限之處在于一是增加了計算量及復(fù)雜程度,二是在于未能本質(zhì)上改變排列熵對于復(fù)雜信號的特征提取能力。排列熵的擴展形式如多尺度排列熵、復(fù)合多尺度熵在確定參數(shù)m和τ之外還需考慮粗?;蜃拥拇笮。瑸榇_定輸入?yún)?shù)增加了難度。為了提高排列熵對于復(fù)雜信號的特征提取能力,同時避免參數(shù)選擇的困難,本文提出了一種新的方法-樣本分位數(shù)排列熵。
分位數(shù)將一個隨機變量的概率分布范圍分為等份的數(shù)值點,不考慮時間序列x(i)的時間維度特征,直接有效的刻畫信號時間序列數(shù)據(jù)波動的特征[17]。排列熵信號數(shù)據(jù)沒有明顯的周期性及變化規(guī)律,因此,可采用分位數(shù)特征提取對排列熵值的內(nèi)部特征進行深度挖掘。
設(shè)X1,X2,…,Xn為來自某總體的一個樣本,定義次序統(tǒng)計量為X(1)≤X(2)≤…≤X(n)。該樣本的p分位數(shù)可定義為[18]:
(5)
式中:[·]表示取整運算符號。p∈(0,1),常用的有0.25分位數(shù)及0.75分位數(shù)[18],本文選擇0.75分位數(shù)進行數(shù)據(jù)分析。
通過公式的分析可知,樣本分位數(shù)具有計算簡單、運算量小等優(yōu)勢。且樣本分位數(shù)是一個非參數(shù)統(tǒng)計量,可以在缺乏總體分布先驗信息的情況下,準確反映出數(shù)據(jù)在某一分位數(shù)點的聚集特征。
結(jié)合樣本分位數(shù)具有對極值點不敏感的特征,可在一定程度上緩解由于嵌入維數(shù)m選擇過大或過小而對排列熵值造成的影響。同時,樣本分位數(shù)克服了排列熵計算過程中所出現(xiàn)的離群點,提高了利用樣本分位數(shù)進行排列熵值提取的能力。
結(jié)合樣本分位數(shù)原理與排列熵定義準則,定義樣本分位數(shù)排列熵SQPE為:
(1) 針對時間序列x(i),結(jié)合排列熵定義,計算其在不同嵌入維數(shù)m下的PE值,構(gòu)建由原始時間序列的不同嵌入維數(shù)下的排列熵值所組成的向量,記為:
T=[PE1,PE2,…,PEn]
(6)
式中:結(jié)合故障診斷背景,不同的故障狀態(tài)對應(yīng)不同的時間序列,因此可將不同故障狀態(tài)下的向量T進行細致劃分,如Tnorm、Tfault。
(2) 針對向量T,對其進行樣本分位數(shù)求解,得到向量T對應(yīng)的樣本分位數(shù):
SQT=quantile(T)
(7)
式中:quantile表示公式(5)中的樣本分位數(shù)計算過程,為樣本分位數(shù)求解的Matlab函數(shù)實現(xiàn)。
(3) 利用不同狀態(tài)下的樣本分位數(shù)排列熵SQT*(i),構(gòu)建故障診斷特征向量集,采用分類算法實現(xiàn)故障診斷。其中,*和i分別代表不同狀態(tài)下不同序列的樣本分位數(shù)排列熵值。
通過樣本分位數(shù)排列熵算法,可以提高對復(fù)雜故障信號的特征值提取能力,通過對樣本分位數(shù)排列熵所構(gòu)建的特征向量進行訓(xùn)練,即可實現(xiàn)故障診斷?;跇颖痉治粩?shù)排列熵的故障診斷方法流程圖如圖1所示。
圖1 基于樣本分位數(shù)排列熵的故障診斷算法流程圖
由圖1可知,基于樣本分位數(shù)排列熵算法的故障診斷過程簡單,無須參數(shù)調(diào)整,只需要通過計算不同嵌入維數(shù)下,由時間序列的排列熵值所構(gòu)建的特征量的樣本分位數(shù)值,即可確定新的特征量,從而構(gòu)建不同故障狀態(tài)下的特征信息,在參數(shù)選擇上具有更好的自適應(yīng)性,解決了排列熵在應(yīng)用過程中的復(fù)雜性問題,證明了樣本分位數(shù)排列熵的優(yōu)越性。下面,通過實驗數(shù)據(jù)以驗證樣本分位數(shù)排列熵對于復(fù)雜故障信號的特征提取能力。
為驗證樣本分位數(shù)排列熵在故障診斷方面的可行性,采用滾動軸承試驗數(shù)據(jù)進行算法驗證。數(shù)據(jù)來源為美國Case Western Reserve University的電氣工程實驗室滾動軸承公開數(shù)據(jù)集[19]。軸承型號為6205-2RS JEM SKF深溝球軸承,電機負載為735.5 W,軸承轉(zhuǎn)速為1 772 r/min;除正常狀態(tài)(記為norm)外,三種故障狀態(tài)分別記為滾動體故障(rolling)、內(nèi)圈故障(inner)和外圈故障(outer);故障通過電火花技術(shù)布置,直徑為0.355 6 mm,深度為0.279 4 mm,4種狀態(tài)的振動信號采樣頻率為12 kHz;取正常狀態(tài)、滾動體故障、內(nèi)圈故障及外圈故障4中狀態(tài)的樣本各30組,數(shù)據(jù)樣本長度為2 048,共計120組數(shù)據(jù)。
根據(jù)文獻[12]中訓(xùn)練集及測試集選取準則,選擇4種狀態(tài)下30組數(shù)據(jù)中的20組作為訓(xùn)練集,余下10組作為測試集,以驗證算法的可行性。4種狀態(tài)下軸承的振動加速度信號,如圖2所示。
正常狀態(tài)
內(nèi)圈故障
滾動體故障
外圈故障
圖2 正常和具有故障軸承的振動信號
首先對圖2中的4×30組數(shù)據(jù)進行排列熵計算,按照文獻[12]中的參數(shù)選取方法,選擇嵌入維數(shù)m=6,得到4種狀態(tài)下分別對應(yīng)的30個排列熵,分別作為對應(yīng)樣本的特征量,如圖3所示。
圖3 正常和具有故障軸承的振動信號排列熵
如圖3所示,針對本文所選擇的實驗數(shù)據(jù),正常狀態(tài)下滾動軸承的振動信號排列熵值較小,與其他3種故障狀態(tài)具有較為明顯的區(qū)別。結(jié)合排列熵度量時間序列復(fù)雜程度的特性[12],這是因為當滾動軸承發(fā)生故障時,信號的隨機性發(fā)生改變,振動信號的動力學(xué)行為也發(fā)生了較大突變,從而導(dǎo)致熵值變大。但如果選擇排列熵作為特征量,正常狀態(tài)和滾動體故障狀態(tài)具有明顯特征,而內(nèi)圈故障和外圈故障則不易區(qū)分。為了對比說明樣本分位數(shù)排列熵的優(yōu)越性,下面統(tǒng)一選擇同一種分類方法即支持向量機(Support Vector Machine,SVM)分類器對訓(xùn)練集進行訓(xùn)練(其中標簽1,標簽2,標簽3,標簽4分別對應(yīng)正常狀態(tài)、內(nèi)圈故障、滾動體故障及外圈故障);其中,訓(xùn)練集的輸入為訓(xùn)練樣本的排列熵值,輸出為訓(xùn)練樣本對應(yīng)的標簽值,將待識別的測試集放入SVM分類器中進行識別驗證,識別輸出結(jié)果如圖4所示。
圖4 故障分類結(jié)果(PE)
如圖4所示,結(jié)合圖3結(jié)果進行分析,測試集的分類精度為85%(34/40),其中,被錯分的6個樣本分別為標簽2和標簽4,即對應(yīng)內(nèi)圈故障和外圈故障,這與圖3中的分析一致,反映出排列熵算法在復(fù)雜信號特征提取方面的不足。
為驗證樣本分位數(shù)排列熵的有效性,選擇相同的樣本作為訓(xùn)練集和測試集,分類器選擇SVM進行故障診斷。
針對選擇的120個數(shù)據(jù)集,在樣本分位數(shù)排列熵計算過程中,無需確定嵌入維數(shù)大小,直接計算其在不同嵌入維數(shù)下的排列熵大小(本文選擇m=2,3,…,8),則每一個數(shù)據(jù)序列得到其對應(yīng)的不同嵌入維數(shù)下的排列熵向量T=[PE1,PE2,…,PE7]。
對得到的樣本分位數(shù)排列熵向量T,計算其樣本分位數(shù)值,得到SQT=quantile(T)。用得到的樣本分位數(shù)排列熵SQT代替排列熵,作為新的特征量并組成特征向量,用于后續(xù)的測試集分類,以驗證樣本分位數(shù)排列熵在故障信號特征提取方面的優(yōu)勢。其中,訓(xùn)練集的輸入為訓(xùn)練樣本的樣本分位數(shù)排列熵值,輸出為訓(xùn)練樣本對應(yīng)的標簽值,將待識別的測試集放入SVM分類器中進行識別驗證。采用樣本分位數(shù)排列熵對4×30組數(shù)據(jù)進行特征提取的結(jié)果,如圖5所示。
圖5 正常和具有故障軸承的振動信號樣本分位數(shù)排列熵
Fig.5 The sample quantile permutation entropy of vibration signals from the normal and fault bearing
如圖5所示,樣本分位數(shù)排列熵仍保留著如圖3所示的信號基本信息,即正常狀態(tài)下滾動軸承的振動信號熵值較小,遵循了信號的基本內(nèi)部信息。所不同的是樣本分位數(shù)排列熵更加明顯的刻畫了時間序列內(nèi)部波動的特征,準確的反映出由不同嵌入維數(shù)下的排列熵所組成的樣本的聚集特征,將不同故障下的狀態(tài)信息更加明顯的區(qū)分出來。選擇SVM分類器對訓(xùn)練集進行訓(xùn)練,最后將測試集放入SVM分類器中進行識別驗證,識別輸出結(jié)果如圖6所示。
如圖6所示,結(jié)合圖5結(jié)果進行分析,測試集的分類精度為100%(40/40),其中,選取排列熵作為特征量時被錯分的6個樣本均完全識別,這與圖5中的分析一致,反映出樣本分位數(shù)排列熵算法在復(fù)雜信號特征提取方面的優(yōu)勢,論證了樣本分位數(shù)排列熵的有效性及可行性。
圖6 故障分類結(jié)果(SQPE)
本文結(jié)合樣本分位數(shù)與排列熵原理,提出了樣本分位數(shù)排列熵概念,并將其應(yīng)用于滾動軸承故障數(shù)據(jù)診斷。排列熵可用于信號的隨機性及動力學(xué)突變性的檢測,在多個領(lǐng)域均有應(yīng)用,但受限于振動信號的不同尺度下動力學(xué)突變,在滾動軸承故障診斷方面表現(xiàn)較差。本文采用樣本分位數(shù)原理提取滾動軸承故障數(shù)據(jù)排列熵的特征,構(gòu)建基于樣本分位數(shù)的排列熵信息作為故障特征。并將其作為特征量輸入SVM分類器,實現(xiàn)滾動軸承的故障診斷。在同等條件下,采用SVM分類器進行對比驗證,實驗結(jié)果表明:
(1) 相比排列熵算法而言,樣本分位數(shù)排列熵方法無需確定參數(shù),只需提取不同嵌入維數(shù)下排列熵值的樣本分位數(shù),即可提取出故障診斷所需的特征量,算法具有較好的自適應(yīng)性,有效提高了排列熵算法的應(yīng)用范圍。
(2) 在同等條件下,采用樣本分位數(shù)排列熵方法可以有效提取出不同狀態(tài)下的特征信息,識別率由85%提高至100%,有效實現(xiàn)了對滾動軸承故障數(shù)據(jù)的診斷。
(3) 樣本分位數(shù)排列熵方法計算簡單,理論清晰,具有一定的工程實踐意義。