魏永合,劉 煒,楊艷君,王志偉
(沈陽理工大學 a.機械工程學院;b.信息科學與工程學院,沈陽 110159)
在機械工業(yè)領域中,齒輪是廣泛應用于各類機械的傳動部件之一,而齒輪振動信號與齒輪工作狀態(tài)密切相關。考慮齒輪在傳動過程中均存在振動噪聲干擾巨大、信號特征非平穩(wěn)和非線性、早期故障征兆不明顯以及各種典型故障信息之間互相耦合以及高維的數(shù)據樣本等特點[1],傳統(tǒng)的僅僅基于信號處理的方法通過采用時頻域或時頻分析等現(xiàn)代信號處理方法直接對采集的齒輪故障信號進行處理以及另一種從微觀角度研究故障的起因及其發(fā)展規(guī)律,通過系統(tǒng)結構和工作原理分析齒輪的損傷或劣化過程的方法已經都不能做到及時準確地對齒輪故障進行診斷甚至預測。而現(xiàn)在常見的主成分分析以及線性判別分析等線性方法在特征提取時又難以直接處理高維數(shù)、非結構化的非線性數(shù)據[2];而基于循環(huán)迭代求解最優(yōu)解的自組織映射神經網絡在特征提取處理數(shù)據時也存在模式識別計算復雜、變量和學習過程不穩(wěn)定的問題以及BP神經網絡算法處理數(shù)據時也會易陷入局部最優(yōu)解的風險[3]。
研究齒輪故障診斷問題的核心是模式識別的方法,而其中故障特征的選擇和提取又是齒輪故障診斷的基礎[4]。如何選擇和提取最有效的故障特征直接影響著齒輪故障診斷的精度。為了對齒輪的故障進行更加全面的描述,通常從時域、頻域等多方面選擇提取大量的高維故障特征來進行故障診斷[5]。隨著現(xiàn)代數(shù)字信號處理方法的不斷發(fā)展,一些新的高維非線性分布數(shù)據的特征提取方法相繼被提了出來。流形學習作為一類能有效發(fā)掘“高維”數(shù)據中潛在的非線性結構及其幾何特征的有效方法,具有良好的提取齒輪故障數(shù)據內在的“非線性”結構信息的能力并且近年來一些改進算法還能有效地抑制噪聲的干擾[6]。尹煥[7]利用流形學習理論改進之后的ISOMAP算法對機械故障信號數(shù)據集進行非線性降維處理,使得故障數(shù)據更加易于分類,為流形學習ISOMAP算法應用于齒輪故障診斷模型實現(xiàn)非線性故障特征壓縮提取奠定了一定的理論與實踐基礎。而LVQ神經網絡則廣泛應用于各類故障模式識別和優(yōu)化領域。楊克強[8]通過比較分別采用BP神經網絡和LVQ神經網絡對齒輪箱的機械故障已有的特征集進行模式識別的結果,提出LVQ神經網絡在機械設備故障診斷的應用中更具優(yōu)勢。
針對齒輪非平穩(wěn)、非線性故障振動信號及其高維數(shù)據樣本的特點以及流形學習ISOMAP算法對樣本噪聲很敏感的問題[6],現(xiàn)已出現(xiàn)了許多關于非平穩(wěn)振動信號的預處理方法。而本文則結合采用小波去噪的改進的集合經驗模態(tài)分解算法[9]對非平穩(wěn)、非線性的齒輪故障振動信號進行預處理的基礎上,以降低傳統(tǒng)的直接利用流形學習算法時噪聲對其低維流形結構的嚴重干擾。然后再采用流形學習方法對降噪預處理的非線性故障數(shù)據進行維數(shù)約簡,并對ISOMAP算法降維壓縮提取的齒輪故障高維非線性多域特征集內在的低維流形結構數(shù)據特征再結合采用更加高效的LVQ對其進行模式識別進一步提高了故障診斷的精度,并且降低數(shù)據維數(shù)將花費更少的時間來訓練神經網絡模型。最后通過比較實驗結果來驗證該模型的可行性。
流形學習方法可以實現(xiàn)從高維觀測數(shù)據中探測出樣本點在低維流形空間的嵌入映射結果。給定一個高維數(shù)據集D={x1,x2,…,xl}∈RN,假設它處于由坐標圖h:M→Rd所確定的內在d維(d ISOMAP是利用測地距離代替歐氏距離來改進經典多維尺度算法的一種方法,其主要步驟如下[2]: (1)基于每個數(shù)據點對xi和xj之間的歐氏距離dD(i,j)(i,j=1,2,…,l),確定哪些點是近鄰的并構建加權圖G,權重為dD(i,j); (2)在圖G上計算xi和xj之間的最短距離dG(i,j),得到圖距離矩陣DG=(dG(i,j))l×l; (3)將矩陣DG作為經典多維尺度算法的輸入得到一個d維嵌套。 學習矢量量化神經網絡(Learning Vector Quantization,LVQ)是一種用于訓練競爭層的有監(jiān)督學習方法的輸入前向神經網絡。它的自適應、自學習以及對非線性系統(tǒng)的分析能力可以有效地根據樣本的特征將樣本劃分到一定的類別中去。它由輸入層、競爭層和線性輸出層3層神經元組成,輸入層與競爭層采用全連接的方式,競爭層與線性輸出層采用部分連接的方式。而線性層則會將競爭層傳遞過來的分類信息轉換為使用者所定義的期望類別。 LVQ神經網絡算法的計算步驟如下[8]: (1)網絡初始化。用較小的隨機數(shù)設定輸入層和競爭層之間的初始權值。 (1) 式中,wij為輸入層的神經元j與競爭層的神經元i之間的權值。 (3)選擇與權值向量距離最小的競爭層神經元,若di最小,則與之連接的線性輸出層神經元的類標簽為Ci。 (4)更新連接權值。記輸入向量對應的類標簽為Cx,如果Ci=Cx,稱為正確分類,則用公式(2)調整權值: wij_new=wij_old+η(x-wij_old) (2) 如果沒有正確分類,則用公式(3)調整權值: wij_new=wij_old-η(x-wij_old) (3) (5)判斷是否滿足預先設定的最大迭代次數(shù),滿足時算法結束,否則返回步驟(2)進行下一輪神經網絡學習。 本文提出的基于流形學習與LVQ的齒輪故障診斷模型,其模型如圖1所示,主要包含以下幾個步驟: 圖1 基于流形學習與LVQ的齒輪故障診斷模型 (1)當齒輪發(fā)生故障時,由于其本身及周圍系統(tǒng)環(huán)境等振動噪聲的干擾,其故障信號往往呈現(xiàn)出非線性、非平穩(wěn)的特征,且包含的頻率成分通常都比較復雜。該模型先將原始振動信號通過結合小波去噪的改進的EEMD預處理分解為一系列的IMF分量,這些分量包含了從高到低的頻帶。通過采用皮爾遜相關系數(shù)法可得到各個IMF分量與原始振動信號的相關系數(shù)[9]。相關系數(shù)越大的IMF分量,包含原始振動信號的特征信息量就越多。選取其中與原始振動信號相關性較好的前l(fā)階IMF分量進行故障特征提取。 (2)將每階IMF分量經過傳統(tǒng)時頻域的信號處理方法,提取m個時域特征,其中包括i個有量綱時域特征參數(shù)和j個無量綱時域特征參數(shù)以及另外n個頻域特征參數(shù),總共可以提取m+n個混合域特征[10],即高維觀測樣本空間的樣本維數(shù)為m+n。 (3)將高維觀測樣本中的特征參數(shù)作為ISOMAP算法的輸入進行維數(shù)約簡,分別取嵌入維數(shù)d為1、2、3、4進行ISOMAP算法流形學習來尋找結果表達最為直觀的嵌入維數(shù),同時分別取近鄰數(shù)k為8、9、10、15、20、25、30、35對高維齒輪故障觀測樣本數(shù)據進行ISOMAP算法流形學習來尋找特征分離效果比較理想的最佳近鄰數(shù),完成對高維樣本數(shù)據進行的非線性特征提取,提取出用于齒輪分類識別的低維特征樣本,構成低維特征樣本空間。 (4)訓練設定神經網絡的相關參數(shù),隨機選取x個低維特征樣本對LVQ神經網絡進行訓練,并利用訓練好的LVQ神經網絡再對隨機選取的y個低維特征測試樣本進行模式識別。 本文采用齒輪故障診斷模擬實驗來驗證該故障診斷模型的可行性,并模擬齒輪正常狀態(tài)和齒輪齒根斷齒及齒輪齒面點蝕兩種常見的故障,分別用加速度傳感器采集多組齒輪各種狀態(tài)下的工作振動信號。 齒輪箱輸入軸小齒輪齒數(shù)為z1=55,輸出軸大齒輪齒數(shù)為z2=75,齒輪的模數(shù)m=2,齒輪箱為浸油式潤滑。電機轉速為1500 r/min,采樣頻率為5120Hz,采樣點數(shù)為8192。加速度傳感器布置在齒輪箱輸出軸的端蓋X、Y方向上來采集振動信號。圖2為齒面點蝕狀態(tài)下故障振動信號。 (a)齒面點蝕狀態(tài)下故障振動信號時域波形 (b)齒面點蝕狀態(tài)下故障振動信號EEMD分解結果圖2 齒面點蝕狀態(tài)下故障振動信號 首先為消除指標之間的量綱影響,提高故障識別的準確性,需要對采集的振動數(shù)據進行歸一化處理,即將數(shù)據映射到0~1之間標準化處理使各指標處于同一數(shù)量級,解決數(shù)據指標間的量綱差異性和可比性問題。通過結合小波技術對小波系數(shù)作軟閾值處理去噪的改進的EEMD[9]將采集的原始振動信號分解為一系列的IMF分量,由于EEMD是在EMD的基礎上進行改進的算法,它是根據EEMD的分解過程中的信號和加入的白噪聲的特點來選擇EEMD的參數(shù),算法執(zhí)行EMD的總次數(shù)為100,信號中加入白噪聲的幅值標準差比值系數(shù)為0.1。如圖2b為齒面點蝕狀態(tài)下故障振動信號EEMD分解結果。 根據皮爾遜相關系數(shù)法結果,如圖3所示,相關系數(shù)小于0.2的IMF視為偽分量予以剔除。選用齒輪的第3~6階IMF分量進行故障特征提取,對信號進行EEMD分解后的分量進行重構并選擇特征,在能保留信號主要信息的條件下有效抑制噪聲的影響。將每階IMF分量經過傳統(tǒng)時頻域的信號處理方法,提取8個時域特征,其中包括均值、均方根值、偏斜度、峭度等4個有量綱時域特征參數(shù)和波形指標、峰值指標、裕度指標、脈沖指標等4個無量綱時域特征參數(shù)以及均值頻率、頻率中心、均方根頻率、標準差頻率等4個頻域特征參數(shù),這樣,每個樣本空間都由這12個特征參數(shù)構成,來構造12維的高維觀測樣本空間。部分測試數(shù)據如表1和表2所示。 圖3 IMF分量的相關系數(shù)曲線 由12個特征參數(shù)構成的高維故障樣本空間難以直接得到滿意的故障診斷效果,并且高維故障特征間存在的大量冗余信息也會削弱故障特征的可辨識性。 表1 齒面點蝕故障的流形學習樣本特征向量 表2 齒面點蝕故障的流形學習樣本特征向量 為經EEMD預處理的d=3、k=35時提取的樣本特征,如圖4所示。 圖4 未經EEMD預處理的d=3、k=35時提取的樣本特征 首先將高維故障觀測樣本矩陣輸入ISOMAP算法,取d=3時在保證含有大部分故障樣本信息的前提下對上述齒輪三種特征量具有最佳識別效果,且選取第一個、第二個以及第三個最重要維度為坐標時結果可視化表達也最為直觀。同時通過比較結果,發(fā)現(xiàn)k=35為最佳近鄰數(shù),從圖中可以看出,齒輪正常狀態(tài)、齒輪齒面點蝕以及齒輪齒根斷齒都能非常好地區(qū)分出來,而且不同類特征聚集度非常高。其故障特征提取結果如圖5所示。 圖5 EEMD預處理后d=3、k=35時提取的樣本特征 從圖5可以看出齒輪3種不同的特征量被投影在不同的區(qū)域,并且相同的特征量呈現(xiàn)比較集中出現(xiàn)在一個區(qū)域并表現(xiàn)出具有一定的分布規(guī)律的現(xiàn)象[11]。一般來說,如果在數(shù)據映射的過程中不能很好地抑制或者消除噪聲的影響,則在低維空間就不能很好地保持原始高維數(shù)據之間的拓撲結構信息。對比圖4、圖5結果可以看出,相比沒有去噪等預處理的ISOMAP算法流形學習結果,由于噪聲的影響,高維數(shù)據在低維空間的流形結構出現(xiàn)了不同程度的扭曲、混疊和變形,一方面低維流形拓撲結構沒有完全展開并出現(xiàn)不規(guī)則的形狀,另一方面局部的各種顏色的樣本點仍混雜壓縮在一起;而采用EEMD進行預處理后再采用ISOMAP算法提取的齒輪的3種特征量之間幾乎沒有太大混疊現(xiàn)象出現(xiàn),特征提取效果比較理想,也有利于下一步故障診斷分類的進行。 將LVQ神經網絡競爭層神經元個數(shù)設定為20,用于對輸入向量進行分類。每類齒輪特征各隨機選取30個樣本。為不失一般性,隨機再從中選取60組數(shù)據作為訓練樣本,剩余30組數(shù)據作為測試樣本。由于流形學習ISOMAP算法的嵌入維數(shù)d=3,故網絡的輸入層包含3個神經元。輸出狀態(tài)設置為:齒輪正常狀態(tài)、齒輪齒根斷齒、齒輪齒面點蝕,即輸出狀態(tài)類別數(shù)為3。將3種齒輪故障特征進行狀態(tài)編碼,其中:1表示齒輪正常狀態(tài);2表示齒輪齒根斷齒;3表示齒輪齒面點蝕。圖6為LVQ神經網絡測試的效果。 圖6 LVQ神經網絡測試的效果 BP(Back Propagation Neural Network)神經網絡[12]是目前故障診斷領域應用最廣泛的神經網絡模型之一。為了便于比較,本文利用BP神經網絡和LVQ神經網絡算法分別對流形學習ISOMAP算法提取的齒輪故障特征進行診斷,通過建立LVQ神經網絡和BP神經網絡故障診斷模型,然后分別對樣本進行訓練和測試。對經過訓練后兩種模型的測試效果如圖6、圖7所示。 圖7 BP神經網絡測試的效果 表3 兩種神經網絡的診斷準確率對比 由表3可以看出,通過LVQ神經網絡對流形學習ISOMAP算法提取的故障特征進行診斷,其診斷正確率為29/30=96.7%。而通過BP神經網絡對流形學習ISOMAP算法提取的故障特征進行診斷,其診斷正確率為27/30=90.0%。相比較而言,LVQ神經網絡模型的故障診斷方法更具精確性。另外,由于流形學習對齒輪特征屬性進行了有效約簡,也使得基于流形學習與LVQ的故障診斷模型的執(zhí)行效率得到較大的提高。 本文提出一種基于流形學習與LVQ的齒輪故障診斷模型,根據實驗結果可以得出以下結論:①由于噪聲等因素對流形學習ISOMAP算法的干擾以及齒輪各高維特征間存在的大量冗余信息也會削弱特征的可辨識性,而采用EEMD+ISOMAP算法對原始高維故障特征進行特征提取可以有效提高特征分類的準確率;②齒輪故障模擬實驗的結果驗證了該模型的有效性,由實驗結果可以看出基于LVQ神經網絡模型的診斷正確率高于廣泛應用于故障診斷領域的BP神經網絡模型。 [參考文獻] [1] 宋濤,湯寶平,李鋒.基于流形學習和K-最近鄰分類器的旋轉機械故障診斷方法[J].振動與沖擊,2013,32(5):149-153. [2] 王冠偉,張春霞,莊健,等.流形學習在機械故障診斷中的應用研究[J].工程數(shù)學學報,2012,29(4):593-598. [3] 龍泉,劉永前,楊勇平.基于粒子群優(yōu)化BP神經網絡的風電機組齒輪箱故障診斷方法[J].太陽能學報,2012,33(1):120-124. [4] 蔣全勝,李華榮,黃鵬.一種基于非線性流形學習的故障特征提取模型[J].振動與沖擊,2012,31(23):132-136. [5] 蘇祖強,湯寶平,趙明航,等.基于多故障流形的旋轉機械故障診斷[J].振動工程學報,2015,28(2):309-315. [6] 李波.高維數(shù)據的流形學習分析方法[M].武漢:武漢大學出版社,2016. [7] 尹煥.基于ISOMAP的機械故障診斷方法研究與應用[D].廣州:華南理工大學,2012. [8] 楊克強.LVQ神經網絡在齒輪箱故障診斷中的研究[D].合肥:安徽農業(yè)大學,2010. [9] 魏永合,王明華,林夢菊,等.基于改進EEMD的滾動軸承故障特征提取技術[J].組合機床與自動化加工技術,2015(1):87-90. [10] Lei Y G,He Z J,Zi Y Y.A new approach to intelligent fault diagnosis of rotating machinery[J].Expert Systems with Application,2008,35(4):1593-1600. [11] 王廣斌.基于流形學習的旋轉機械故障診斷方法研究[D].長沙:中南大學,2010. [12] 于婷婷.基于BP神經網絡的滾動軸承故障診斷方法[D].大連:大連理工大學,2008.1.2 學習矢量量化神經網絡算法
2 建立基于ISOMAP和LVQ的齒輪故障診斷模型
3 實驗驗證及實驗結果分析
3.1 齒輪原始信號獲取
3.2 特征選擇與特征提取
3.3 模式識別
3.4 實驗結果比較
4 結論