楊望燦, 張培林, 張?jiān)茝?qiáng)
(軍械工程學(xué)院 七系,石家莊 050003)
軸承振動(dòng)信號是典型的非線性、非平穩(wěn)信號,從混有背景噪聲的振動(dòng)信號中提取出有效的特征參數(shù)才能提高后續(xù)模式識別的準(zhǔn)確率。EMD方法是一種適合于分析非線性、非平穩(wěn)信號的方法[1],它根據(jù)信號自身的特征時(shí)間尺度將信號依次分解為從高頻到低頻的若干個(gè)固有模態(tài)函數(shù)(IMF)分量。經(jīng)過EMD分解后,每個(gè)IMF分量集中表現(xiàn)了數(shù)據(jù)的局部特征,并且具有平穩(wěn)性的特性[2]。
AR模型是一種時(shí)間序列分析方法,其模型參數(shù)對狀態(tài)變化規(guī)律的反映最為敏感[3]。由于AR模型適用于平穩(wěn)信號,所以可以對經(jīng)過平穩(wěn)化處理的IMF分量建立AR模型,以AR模型的自回歸參數(shù)構(gòu)建故障特征子集[4]。但得到的原始特征子集中不可避免的存在一些和故障診斷不相關(guān)的特征和冗余特征,導(dǎo)致故障診斷的計(jì)算量和時(shí)間增加,診斷準(zhǔn)確率下降,因此,需要對提取的原始特征子集進(jìn)行降維和優(yōu)化選擇。
Tenenbaum等[5-7]提出流形學(xué)習(xí)的概念和方法后,流形學(xué)習(xí)成為一類重要的維數(shù)約減方法。流形學(xué)習(xí)比傳統(tǒng)的線性降維方法更能體現(xiàn)數(shù)據(jù)的內(nèi)在本質(zhì),進(jìn)而解決一些在模式識別方面存在的問題,因此,流形學(xué)習(xí)方法在人臉識別、圖像處理和故障診斷等方面得到了廣泛的應(yīng)用[8-10]。等距映射(Isomap)、局部線性嵌入(LLE)、拉普拉斯映射(LE)等算法是流形學(xué)習(xí)中的經(jīng)典算法,但這幾種算法不能提供顯式的變換或投影矩陣,無法快速有效處理新增數(shù)據(jù)。而局部保持投影(LPP)算法通過線性逼近LE,兼顧線性降維方法優(yōu)點(diǎn)和經(jīng)典流形學(xué)習(xí)算法的非線性化處理能力,并且能夠得到顯式的投影矩陣,提高了流形學(xué)習(xí)算法的泛化能力[11-13]。在LPP算法中,鄰域參數(shù)的選擇直接影響算法性能的好壞,而傳統(tǒng)的LPP算法往往根據(jù)經(jīng)驗(yàn)人為設(shè)定鄰域參數(shù),導(dǎo)致無法充分實(shí)現(xiàn)流形學(xué)習(xí)算法的優(yōu)勢,影響最終降維效果。
因此,提出了一個(gè)基于鄰域自適應(yīng)局部保持投影(NALPP)的軸承故障診斷模型。首先,利用EMD-AR方法構(gòu)建軸承振動(dòng)信號的原始特征子集;然后采用鄰域自適應(yīng)局部保持投影算法對原始特征子集進(jìn)行維數(shù)約減;最后,把低維特征向量輸入LS-SVM分類器,通過分析故障識別率和低維特征空間維數(shù)的關(guān)系,確定識別率最高時(shí)的低維特征空間維數(shù)為最優(yōu)降維維數(shù),對應(yīng)的轉(zhuǎn)換矩陣為最優(yōu)投影矩陣。根據(jù)確定的最優(yōu)降維維數(shù)采用NALPP算法得到數(shù)據(jù)樣本的低維特征向量,輸入故障分類器,識別和判斷軸承的工作狀態(tài)和故障類型。通過對實(shí)測軸承振動(dòng)信號的分析,驗(yàn)證了基于鄰域自適應(yīng)局部保持投影(NALPP)的軸承故障診斷模型的有效性和適用性。
局部保持投影本質(zhì)上是一種線性的流形學(xué)習(xí)算法,是拉普拉斯映射(LE)的線性逼近,具有一般線性降維方法不具有的流形學(xué)習(xí)的能力。LPP根據(jù)最近鄰圖建立數(shù)據(jù)間的映射,在保持?jǐn)?shù)據(jù)局部結(jié)構(gòu)特征不變的條件下,將高維空間中的數(shù)據(jù)映射到低維空間,使在高維空間中距離相近的點(diǎn)在低維空間中也距離較近。
假設(shè)X={x1,x2,…,xN}為高維空間RD中的一個(gè)數(shù)據(jù)集,LPP的目的是尋求一個(gè)投影矩陣A,使得高維空間中的數(shù)據(jù)集X映射到相對低維的特征空間Rd(d< (1) 其中:Wij為加權(quán)矩陣W的一個(gè)元素。加權(quán)矩陣W可根據(jù)ε鄰域方法由下式獲得: (2) 其中:參數(shù)t>0,為熱核寬度。 由式(1)和式(2),可以看出LPP算法通過最小化目標(biāo)函數(shù)能夠保持?jǐn)?shù)據(jù)點(diǎn)間的局部特征,即在高維特征空間相距較近的點(diǎn)投影到低維特征空間也相距較近。對目標(biāo)函數(shù)最小化的推導(dǎo)變換的過程如下: (3) 引入約束條件YDYT=1,即ATXDXTA=1,則式(3)的最優(yōu)化問題可轉(zhuǎn)化為求解下式的廣義特征值問題 XLXTA=λXDXTA (4) 令列向量a1,a2,…,ad分別為式(4)的前d個(gè)最小非零特征值對應(yīng)的特征向量,則投影矩陣A的表達(dá)式如下式所示 A={a1,a2,…,ad} (5) 在LPP算法中鄰域參數(shù)ε的選取直接影響算法的性能,若參數(shù)選取過大,則會導(dǎo)致非近鄰點(diǎn)納入近鄰中,破壞局部線性結(jié)構(gòu),影響映射結(jié)果;若參數(shù)選取過小,則會使得構(gòu)建的鄰域不關(guān)聯(lián),無法恢復(fù)數(shù)據(jù)集的全局結(jié)構(gòu),因此如何選取鄰域參數(shù)ε非常關(guān)鍵。一般情況下LPP選取的是全局統(tǒng)一的鄰域參數(shù),而實(shí)際采集到的數(shù)據(jù)樣本在空間分布并不均勻,所以若根據(jù)數(shù)據(jù)樣本的空間分布自適應(yīng)的調(diào)整鄰域參數(shù)的大小,則能夠改善LPP算法的降維效果,得到的低維特征向量也更能反映數(shù)據(jù)的內(nèi)在流形。Parzen窗概率密度估計(jì)[14]是一種非參數(shù)的概率密度估計(jì)方法,它能夠在不知道樣本總體分布的條件下,僅根據(jù)數(shù)據(jù)樣本就可以估計(jì)出總體分布的概率密度。因此,利用Parzen窗估計(jì)數(shù)據(jù)樣本空間的總體分布情況,從而根據(jù)每個(gè)數(shù)據(jù)樣本點(diǎn)鄰域的概率密度自適應(yīng)地調(diào)整鄰域參數(shù)。 X={x1,x2,…,xN}為高維空間RD中的一個(gè)數(shù)據(jù)集,對于任意數(shù)據(jù)點(diǎn)xi(i=1,2,…,N),基于Parzen窗的概率密度估計(jì)式為: (6) 窗函數(shù)φ(x)選取效果較好的高斯窗函數(shù): (7) 則點(diǎn)xi處的概率密度為: (8) 若鄰域參數(shù)初始值為ε0,樣本點(diǎn)xi的初始鄰域?yàn)镹ε0(xi),令窗寬h=ε0,則點(diǎn)xi的鄰域概率密度計(jì)算公式如下: (9) 則高維特征空間數(shù)據(jù)集中的每個(gè)數(shù)據(jù)點(diǎn)根據(jù)下式自適應(yīng)地調(diào)整鄰域參數(shù)ε。 (10) 通過式(10)可以得到,當(dāng)數(shù)據(jù)點(diǎn)的密度較小時(shí),即其鄰域數(shù)據(jù)較稀疏時(shí),自適應(yīng)地減小ε的值,從而保持鄰域的局部線性結(jié)構(gòu);當(dāng)數(shù)據(jù)點(diǎn)的密度較大時(shí),即其鄰域數(shù)據(jù)較密時(shí),又自適應(yīng)地增大ε的值,從而使相連的鄰域盡可能重疊,保證數(shù)據(jù)集全局結(jié)構(gòu)的恢復(fù)。 基于鄰域自適應(yīng)局部保持投影(NALPP)的軸承故障診斷模型如圖1所示,具體步驟如下: 圖1 基于NALPP的軸承故障診斷模型 (1)對軸承正常和各種故障的振動(dòng)信號,按一定的采樣頻率進(jìn)行采樣,得到不同工作狀態(tài)的訓(xùn)練樣本和測試樣本。 (2)對每個(gè)樣本進(jìn)行EMD分解,得到每個(gè)樣本的n個(gè)IMF分量。 (3)對每個(gè)樣本的IMF分量建立AR模型,根據(jù)FPE準(zhǔn)則確定模型階次m,用改進(jìn)的協(xié)方差法求AR模型參數(shù)θij(i為第i個(gè)IMF分量,j=1,2,…,m)。提取AR模型參數(shù)構(gòu)建訓(xùn)練樣本和測試樣本的原始特征子集Xtr和Xte。 (4)利用NALPP算法對訓(xùn)練樣本的原始特征子集Xtr進(jìn)行維數(shù)約減,得到低維特征向量Ytr和投影矩陣A。 (5)把低維特征向量Ytr分為兩部分,一部分訓(xùn)練樣本用來訓(xùn)練LS-SVM分類器,另一部分訓(xùn)練樣本用于得到故障識別率η和降維維數(shù)d之間的關(guān)系。 (6)重復(fù)步驟(4)和(5),確定最優(yōu)降維維數(shù)db。 (7)測試樣本的原始特征子集Xte,根據(jù)確定的最優(yōu)降維維數(shù)db使用NALPP算法進(jìn)行降維,得到低維特征向量Yte和最優(yōu)投影矩陣Ab,Yte輸入LS-SVM分類器,得到輸出結(jié)果。 實(shí)測軸承數(shù)據(jù)是在軸承故障試驗(yàn)臺中的單級傳動(dòng)齒輪箱上采集到的。在軸承內(nèi)圈、外圈和滾動(dòng)體上分別加工溝槽來模擬相應(yīng)部位局部裂紋故障。實(shí)驗(yàn)中,加速度傳感器安裝在軸承座上,電動(dòng)機(jī)轉(zhuǎn)速控制在1 770 r/min,采樣頻率為12 kHz,采樣點(diǎn)數(shù)為1 024,分別采集正常狀態(tài)、外圈故障、內(nèi)圈故障和滾動(dòng)體故障4種狀態(tài)振動(dòng)數(shù)據(jù)各100組,其中,隨機(jī)選取每種狀態(tài)的40組數(shù)據(jù)作為訓(xùn)練樣本,另外60組數(shù)據(jù)作為測試樣本。采集到的4類狀態(tài)軸承振動(dòng)信號如圖2所示。 對采集到的各類狀態(tài)信號進(jìn)行EMD分解。圖3給出了軸承外圈故障狀態(tài)振動(dòng)信號經(jīng)EMD分解后的各個(gè)IMF分量。 由圖3可以看出前幾個(gè)IMF分量的調(diào)幅特征較為明顯,故障信息主要集中在前幾個(gè)IMF分量。所以,對每類樣本EMD分解后的前6個(gè)IMF分量建立AR模型。根據(jù)FPE準(zhǔn)則確定AR模型階次m為8,因此,構(gòu)建的原始特征子集的維數(shù)為48維。表1列出了4種狀態(tài)下各一個(gè)樣本所提取的特征參數(shù)。c1,c2,…,c6表示對每一類軸承狀態(tài)信號進(jìn)行EMD分解得到的前6個(gè)IMF分量,θi1,θi2,…,θi8為第i(i=1,2,…,6)個(gè)IMF分量的AR模型參數(shù)。 圖2 四類狀態(tài)的振動(dòng)信號 圖3 外圈故障的IMF分量 利用NALPP算法按照步驟(4)和(5)對原始特征子集進(jìn)行維數(shù)約減。為了驗(yàn)證NALPP算法的有效性,將原始特征子集分別用主成分分析(PCA)和局部保持投影(LPP)算法進(jìn)行降維,作為對比實(shí)驗(yàn)。采用PCA算法時(shí),依據(jù)主成分的累積貢獻(xiàn)率大于或等于95%的原則確定降維維數(shù);采用LPP算法時(shí),采用和NALPP同樣的方法確定降維維數(shù)。實(shí)驗(yàn)過程中,隨機(jī)選取訓(xùn)練樣本中每類狀態(tài)的各20組數(shù)據(jù)訓(xùn)練LS-SVM,訓(xùn)練樣本中每類狀態(tài)的另外20組數(shù)據(jù)用于得到故障識別率η和降維維數(shù)d之間的關(guān)系。采用LPP和NALPP算法得到的故障識別率和降維維數(shù)間的關(guān)系如圖4所示。LPP算法中的鄰域參數(shù)ε取值為3.2,NALPP算法中鄰域參數(shù)初始值ε0設(shè)為3.2,熱核寬度t取值均為8。LS-SVM均使用徑向基核函數(shù),采用交叉驗(yàn)證的方法優(yōu)化核函數(shù)參數(shù)σ2和懲罰因子γ。 圖4 故障識別率與低維特征空間維數(shù)的關(guān)系圖 由圖4可以看出,無論是LPP算法還是NALPP算法,初始階段故障識別率隨著降維維數(shù)的增加逐漸提高。但NALPP算法由于能夠根據(jù)數(shù)據(jù)樣本的鄰域密度自適應(yīng)的調(diào)整鄰域參數(shù),而LPP算法選取的是全局統(tǒng)一的固定參數(shù),所以NALPP算法的故障識別率高于LPP算法。對于NALPP算法,當(dāng)降維維數(shù)為27維時(shí),故障識別率達(dá)到最高,為93.75%;而LPP算法,當(dāng)降維維數(shù)為29維時(shí),故障識別率最高僅為85%,所以NALPP算法的降維效果更好,更有利于后續(xù)的識別分類。隨著降維維數(shù)繼續(xù)增加,故障識別率有所下降并趨于穩(wěn)定。圖4中d=48時(shí),即不采用任何算法降維,直接將原始特征子集輸入LS-SVM分類器,由于原始特征子集中存在一些和故障診斷不相關(guān)的特征和相互冗余的特征,故障識別率只有73.75%,所以有必要對原始特征子集進(jìn)行維數(shù)約減。 對測試樣本構(gòu)建的原始特征子集分別使用PCA、LPP和NALPP三種算法進(jìn)行維數(shù)約減,PCA算法根據(jù)主成分的累積貢獻(xiàn)率大于或等于95%的原則確定降維維數(shù)為12維;LPP算法利用最優(yōu)降維維數(shù)d=29時(shí)進(jìn)行降維;NALPP算法利用最優(yōu)降維維數(shù)d=27時(shí)進(jìn)行降維。將分別利用PCA、LPP和NALPP算法得到的低維特征向量輸入LS-SVM分類器,其中隨機(jī)選取每類狀態(tài)的20組樣本訓(xùn)練LS-SVM分類器,每類狀態(tài)的另外40組完成測試,對比試驗(yàn)結(jié)果如表2所示。 表2 三種降維算法的故障識別率 由表2可以看出,由于PCA算法對原始特征子集采用線性變換得到低維坐標(biāo),忽略了數(shù)據(jù)中的非線性結(jié)構(gòu),得到的降維結(jié)果不能反映數(shù)據(jù)本質(zhì),PCA算法的故障識別率最低。LPP算法和NALPP算法通過線性逼近LE,盡量保持?jǐn)?shù)據(jù)局部結(jié)構(gòu)而完成降維,所以LPP和NALPP算法的故障識別率相比PCA算法得到了提高。NALPP算法通過自適應(yīng)的調(diào)整鄰域參數(shù),使構(gòu)建的鄰域結(jié)構(gòu)更加逼近原始特征子集的空間流形,得到的降維效果更能反映數(shù)據(jù)本質(zhì),所以經(jīng)過NALPP算法降維后的故障識別率最高,達(dá)到95%。在計(jì)算時(shí)間方面,LPP和NALPP算法采用線性逼近的方法進(jìn)行降維,所以相比線性降維的PCA算法,計(jì)算時(shí)間有所增加。但是,三種算法基本都是在瞬間完成降維過程。NALPP算法根據(jù)得到的原始特征子集的不同,自適應(yīng)的調(diào)整鄰域參數(shù)找尋原始特征子集空間中的低維流形,雖然計(jì)算時(shí)間略有增加,但故障識別率得到了較大的提高,所以NALPP算法的故障診斷效果最好,能夠滿足工程實(shí)際應(yīng)用的需求。 針對非線性、非平穩(wěn)的振動(dòng)信號,本文提出了一種基于鄰域自適應(yīng)局部保持投影(NALPP)的軸承故障診斷模型。該模型充分利用EMD能夠?qū)⒎瞧椒€(wěn)信號轉(zhuǎn)化為平穩(wěn)信號的自適應(yīng)處理能力,AR模型把IMF分量中所包含的振動(dòng)信號的特征提取出來,從而構(gòu)建振動(dòng)信號的原始特征子集。NALPP算法通過保持局部線性結(jié)構(gòu)保留原始特征子集的內(nèi)在低維特征,并利用Parzen窗自適應(yīng)的選擇鄰域參數(shù),提高降維效果。利用故障識別率和降維維數(shù)的關(guān)系得到最優(yōu)降維維數(shù)和最優(yōu)投影矩陣,根據(jù)最優(yōu)降維維數(shù)對原始特征子集進(jìn)行降維處理,得到的低維特征向量輸入LS-SVM分類器完成故障識別和診斷。得到的最優(yōu)投影矩陣,能夠更加快速地處理新增數(shù)據(jù)。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文所提模型的準(zhǔn)確性和有效性,為軸承的故障診斷提供了新的方法和途徑。 參 考 文 獻(xiàn) [1]Huang N E, Shen Z, Long S R,et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings of the Royal Society of London, 1998, 454(1):903-995. [2]張 超, 陳建軍, 郭 迅. 基于EMD能量熵和支持向量機(jī)的齒輪故障診斷方法[J]. 振動(dòng)與沖擊, 2010, 29(10):216-220. ZHANG Chao, CHEN Jian-jun, GUO Xun. A gear fault diagnosis method based on EMD energy entropy and SVM[J]. Journal of Vibration and Shock, 2010, 29(10):216-220. [3]Dron J P,Rasolofondraibe L,Couet C,et al. Fault detection and monitoring of a ball bearing benchtest and a production machine via autoregressive spectrum analysis[J]. Journal of Sound and Vibration, 1998, 218(3):501-525. [4]賈 嶸, 王小宇, 張 麗,等. 基于EMD和AR模型的水輪機(jī)尾水管動(dòng)態(tài)特征提取[J]. 電力系統(tǒng)自動(dòng)化, 2006, 30(22):77-80. JIA Rong, WANG Xiao-yu, ZHANG Li, et al. EMD and AR model based dynamic characteristic extraction of the draft tube of hydraulic turbines[J]. Automation of Electric Power Systems, 2006, 30(22):77-80. [5]Tenenbaum J B, Silva V, Langford J C. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290(5500):2319-2323. [6]Seung H S, Daniel D L. The manifold ways of perception[J]. Science, 2000, 290(5500):2268-2269. [7]Roweis S T, Saul L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000,290(5500):2323-2326. [8]魯 珂, 丁正明, 趙繼東,等. 一種基于相關(guān)反饋的視頻人臉?biāo)惴╗J]. 西安電子科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2012, 39(3):154-160. LU Ke, DING Zheng-ming, ZHAO Ji-dong, et al. Novel face recognition relevance feedback algorithm for video[J]. Journal of Xidian University(Nature Science), 2012, 39(3):154-160. [9]孫 斌, 薛廣鑫. 基于等距特征映射和支持矢量機(jī)的轉(zhuǎn)子故障診斷方法[J]. 機(jī)械工程學(xué)報(bào), 2012, 48(9):129-135. SUN Bin, XUE Guang-xin. Method of rotor fault diagnosis based on isometric feature mapping and support vector machine[J]. Journal of Mechanical Engineering, 2012, 48(9):129-135. [10]王立志, 黃 鴻, 馮海亮. 多線性局部與全局保持嵌入在高光譜遙感影像分類中的應(yīng)用[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2012, 24(6):781-786. WANG Li-zhi, HUANG Hong, FENG Hai-liang. Multi-liner local and global preserving embedding and its application in hyperspectral remote sensing image classification[J]. Journal of Computer-Aided Design and Computer Graphics, 2012, 24(6):781-786. [11]Yu J B. Bearing performance degradation assessment using locality preserving projections[J]. Expert Systems with Applications, 2011, 38(6):7440-7450. [12]張敏情, 楊曉元, 吳 翔. 基于局部保持映射的音頻數(shù)字簽名算法[J]. 解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2009, 10(3):248-252. ZHANG Min-qing, YANG Xiao-yuan, WU Xiang. Audio digital signature algorithm based on LPP[J]. Journal of PLA University of Science and Technology(Nature Science), 2009, 10(3):248-252. [13]Weng X Q, Shen J Y. Classification of multivariate time series using locality preserving projections[J]. Knowledge-Based Systems, 2008,21(7):581-587. [14]邊肇祺, 張學(xué)工. 模式識別[M]. 北京:清華大學(xué)出版社, 2000:65-71.2 鄰域參數(shù)的自適應(yīng)確定
3 基于鄰域自適應(yīng)局部保持投影(NALPP)的軸承故障診斷模型
4 實(shí)驗(yàn)驗(yàn)證
5 結(jié) 論