周凌孟,鄧飛其,張清華,,孫國璽,蘇乃權,朱冠華
(1.華南理工大學自動化科學與工程學院,廣東廣州 510000;2.廣東石油化工學院,廣東省石化裝備故障診斷重點實驗室,廣東茂名 525000)
隨著科學技術的發(fā)展,機械結構日益復雜化且耦合程度逐漸增加,一旦某個零件發(fā)生故障將可能導致整個系統(tǒng)癱瘓甚至導致重大事故的發(fā)生。旋轉機械軸承作為機械設備中最常見且故障發(fā)生率最高的零件之一,其故障診斷一直是研究熱點[1-2]。
軸承的故障診斷本質是模式識別問題,主要分為信號采集、特征提取與選擇、分類識別[3]。在信號采集方面,振動分析方法是當前分析軸承問題最多且最有效的方法之一[4],當滾動軸承發(fā)生故障時,零件工作面與故障區(qū)域會發(fā)生碰撞,軸承的振動信號將發(fā)生變化。研究發(fā)現提取軸承的振動信號用于分析軸承故障可取得較好的診斷效果[5]。在特征提取方面,通過時域、頻域和時頻域等振動特征可以分析軸承的運行狀態(tài)并進行診斷與定位。戴邵武等[6]通過提取軸承時域特征與支持向量機結合實現了對軸承的壽命預測。通過信號分離思想對傳統(tǒng)時域量綱一化特征進行改進后,新量綱一化特征也能取得較好的診斷效果[7]。通過經驗模態(tài)分解(Empirical Mode Decomposition,EMD)方法提取軸承時頻特征,可以消除信號噪聲,對軸承實現了更加精確的診斷[8]。但是通過單域特征進行分類具有一定的局限性,復雜工況下旋轉機械的狀態(tài)特征在單域信號下有時很難體現,通過對多域特征進行選擇與融合,可以將各優(yōu)勢特征互補、減少干擾數據并且增加分類模型的魯棒性與診斷準確度。DING等[9]通過局部保持投影的特征融合方法對振動特征進行融合,融合后特征維數降低且對故障區(qū)分度更高。LI 等[10]則提出了一種加權多維特征融合方法,根據所選特征的靈敏度對多特征進行加權和融合。通過兩步振動信號融合方法對振動信號和聲音信號進行融合,大大改善了單信息源的識別效果[11]。通過特征選擇反饋網絡與證據理論結合的方法也能實現對多特征的選擇與融合[12]。主成分分析方法(Principal Component Analysis,PCA)近年來快速發(fā)展并得到了廣泛應用,在特征降維的基礎上可以降低模型復雜性、增加診斷時間與準確率[13]。
對于滾動軸承的識別分類,貝葉斯、K-近鄰算法、神經網絡、支持向量機等有監(jiān)督機器學習分類方法都得到了有效應用。石懷濤等[14]利用貝葉斯優(yōu)化長短期記憶網絡實現了早期軸承故障的檢測。YAN等[15]利用堆疊稀疏自動編碼網絡進行特征降維后,使用K-近鄰算法處理軸承的多分類問題。而卷積神經網絡(Convolutional Neural Network,CNN)作為一種新的趨勢今年來在軸承數據分類也取得了較好的效果[16],相比于其他的經典分類模型分類準確度更高。
目前軸承故障診斷的研究中,基本只提取了單域特征,但單域特征往往很難對運行在復雜環(huán)境下的旋轉機械軸承非線性故障進行區(qū)分。針對單域特征描述故障狀態(tài)的局限性,本文作者提取軸承時域、頻域和時頻域三域振動特征進行融合,將各域特征進行優(yōu)勢互補來增強模型的魯棒性與分類準確性。針對多域特征融合后的冗余性,使用PCA對融合特征進行降維來降低模型的復雜性。最后結合卷積神經網絡模型在軸承分類上的良好診斷性能實現對軸承故障的精確快速診斷。
文中軸承的故障診斷流程主要分為3步:軸承振動數據的采集;軸承時域、頻域和時頻域三域特征的提取,并使用主成分分析方法對三域特征進行融合與降維;使用卷積神經網絡對軸承狀態(tài)分類識別。
1.1.1 時域特征提取
當軸承部件發(fā)生故障時,其時域信號往往會隨之變化,時域特征提取是對原始信號幅值域的數學統(tǒng)計方法,此方法直觀簡單且便于計算。文中在傳統(tǒng)量綱一化特征的基礎上,提取時域全新量綱一化特征指標。首先通過信號分離的思想將故障信號分離為故障信號、無故障信號與噪聲信號,然后進一步構造出全新的量綱一化特征指標[7]。
觀測到的振動信號的數學模型z(t)可以定義為
z(t)=y(t)+cs(t-τ)
(1)
其中:y(t)為故障信號與噪聲信號的疊加;s(t)為無故障信號;τ為延遲時間;c為振動信號z(t)與延遲后的無故障信號s(t-τ)的相關系數。全新的量綱一化特征指標γys定義為
(2)
其中5個主要的新量綱一化特征如表1所示。
表1 五個新量綱一化特征
1.1.2 頻域特征提取
當軸承發(fā)生故障時,往往會引起信號頻域信息發(fā)生變化,而通過傅里葉變換的方法將時域信號變化到頻域,再通過統(tǒng)計頻域信息可得到此變化趨勢。主要頻域分析方法有功率譜分析、倒頻譜分析與包絡譜分析等。文中對信號的幅值譜進行分析提取頻域特征,幅值譜定義為
(3)
頻域特征指標主要有以下4個:
(1)均值頻率:
(4)
(2)重心頻率
(5)
(3)均方根頻率
(6)
(4)標準差頻率
(7)
其中:X(k)表示信號x(n)的幅值譜第k條譜線的幅值;fk表示功率譜第k條譜線的頻率值。
1.1.3 時頻域特征提取
頻域分析方法雖然對平穩(wěn)信號的分析效果較好,但它是整個時間域上的積分,不能體現局部時間內信號的頻域特性。而EMD方法能夠克服頻域分析的缺點,將非平穩(wěn)、非線性的時間信號分解成一系列頻率從高到低的線性穩(wěn)態(tài)內蘊模態(tài)函數(Intrinsic Mode Function,IMF),且每個IMF分量的頻率成分隨信號的變化而變化。
文中提出一種PCA的特征融合方法,用于融合三域特征并實現降維處理。PCA是一種基于多元統(tǒng)計技術的特征選擇方法,通過統(tǒng)計特征的多維正交線性變換將特征數據集從原始空間降維到主成分空間,將原始空間中具有一定相關性的特征重新組合,形成一組彼此互不相關的全新特征指標。
首先通過相加的方式將三域特征映射到共享子空間中,融合后特征向量矩陣表示為Xn=[xn1,xn2,xn3,…,xnl]T,n表示樣本總數,l表示融合特征個數。根據PCA方法利用方差貢獻率取前m個主成分對特征向量矩陣實現降維,降維后Xn=[xn1,xn2,xn3,…,xnm]T。處理后樣本特征維數降低,能有效降低數據分析難度和診斷模型的復雜度。
作為一個嶄新領域,神經網絡在目標檢測、自然語言處理和機器視覺等方面都取得了很好的應用效果。CNN是其中一種較為經典且得到廣泛應用的結構,卷積神經網絡通過局部連接、權值共享和最大池化等策略能有效降低神經網絡的模型復雜度,使模型具有更好的魯棒性和容錯能力。卷積神經網絡的模型結構主要有輸入層、特征提取層、全連接層以及輸出層。其分類過程如圖1所示。
圖1 卷積神經網絡分類過程
1.3.1 特征提取層
特征提取層又分為卷積層和池化層,卷積層與池化層一般有多個,通過一個卷積層連接一個池化層的方式設置模型。
(1)卷積層
卷積層是卷積神經網絡的核心,主要作用是對輸入層的數據進行特征提取。卷積層有多個特征面,每一個特征面含有多個神經元,每個神經元與輸入特征面局部連接,通過卷積核的計算將局部加權結果傳遞給激活函數即可獲得每個神經元的輸出值。由于同個輸入特征面與輸出特征面卷積核相同,可實現權值共享,能大大減小模型復雜度。假設輸入特征面神經元為xi,j,卷積核為wi,j,i和j表示第i行第j列,偏置為b,則輸出特征面對應神經元y可表示為
(8)
卷積是一種線性、平移不變的運算,而真正的特征數據往往是非線性的,故需引入激活函數來實現非線性構造。常見的激活函數有tanh函數、Sigmoid函數和ReLU函數等。假設激活函數為f(y),則每個神經元通過激活函數的輸出h可以表示為
h=f(y)
(9)
(2)池化層
池化層主要通過壓縮卷積層特征來減小模型復雜度。最常使用的池化方式有平均池化和最大池化。池化層也需定義一個類似卷積核一樣的滑動窗口來提取重要特征,但窗口本身并沒有任何權值參數。池化層的輸出特征面的每個神經元與卷積層的輸出特征面進行局部連接,使用池化窗口計算進行輸出。
1.3.2 全連接層與輸出層
全連接層將經過特征提取層提取的特征進行扁平化處理再展開成特征向量,全連接層可以有多個,每個全連接層的神經元與前一層所有神經元全連接,通過激活函數輸出。假設x為上層全連接層特征面,w為權值參數,b為偏置,下層全連接層的單個神經元輸出y可以表示為
y=w·x+b
(10)
最后的全連接層輸出值傳遞給輸出層,輸出層使用分類函數進行分類。一般使用Softmax函數進行分類,它能將全連接層網絡輸出的最后一層神經元的每一個數值映射到0~1的一個實數空間,并且使得所有神經元的數值加起來為1。假設yi表示輸出層第i個神經元的值,n為類別的個數,則:
(11)
文中基于主成分分析的多域特征融合軸承故障診斷方法診斷過程主要分為三部分:特征提取部分、特征融合與選擇部分、卷積神經網絡診斷分類部分,診斷流程如圖2所示。
圖2 診斷流程
通過傳感器采集機組的振動信號,分別提取時域、頻域與時頻域特征數據。
2.1.1 時域特征提取
提取5個新量綱一化波形、峰值、脈沖、峭度、裕度特征,具體提取流程如圖3所示。
圖3 新量綱一化特征提取流程
(1)在機械設備的運行初期,通過振動傳感器采集設備的振動信號,定義為無故障s(t)信號,對s(t)歸一化并經過快速傅里葉變換得到無故障頻域信號s(k)。
(2)采集機械設備實時振動時域信號z(t),對z(t)做快速傅里葉變換得到z(k)。
(3)對無故障頻域信號s(k)取共軛得到s*(k),將z(k)與s*(k)相乘得到h(k),對h(k)做快速傅里葉逆變換得到z(k)與s*(k)的相關函數n(t)。|n(t)|的最大值所對應的時間點為實時振動信號z(t)與無故障信號s(t)的延遲時間τ,τ=argmax|n(t)|。
(4)計算實時振動信號z(t)與延遲后的無故障信號s(t-τ)的相關系數c,c=E[z(t)s(t-τ)]。
(5)混合振動信號y(t)=z(t)-cs(t-τ)。
(6)根據表1求得5個新量綱一化特征。
2.1.2 頻域特征提取
首先通過式(3)求得振動信號的幅值譜X(k),然后通過式(4)—(7)分別提取信號的均值頻率、重心頻率、均方根頻率、標準差頻率4個頻域特征。
2.1.3 時頻域特征提取
通過EMD方法提取信號中能量占比最高的主要分量,然后通過Hilbert變換求出每個IMF分量的瞬時頻率,取每個IMF分量得平均頻率作為時頻特征,具體步驟如下:
步驟1,對信號x(t)進行EMD分解,分解成多個IMF分量:
(1)確定信號x(t)的局部極值點,判斷極值點是否大于2個,是則繼續(xù),否則結束判斷,x(t)無法進行分解。
(2)通過信號序列的極大極小值數據,通過插值法求得上下包絡線,取2條包絡線的均值為m1。
(3)求信號x(t)與m1的差值h1,并判斷h1是否符合IMF分量的判定條件。判定條件為:①在整個數據長度范圍內,極值點和過零點的個數必須相同或者相差一個。②在任意數據點,其上下包絡線的平均值為0。若h1不滿足判定條件,則將h1作為原始數據,重復(1)(2)繼續(xù)判定。若滿足判定條件,則將h1作為第一個IMF分量。
(4)取x(t)與h1的差值作為新的數據,重復(2)(3)求新的IMF分量,直到新的函數極值點少于2個,則分解結束,最終所有的IMF分量記為ci(t)(i=1,2,…,k)。
步驟2,對主IMF分量運用Hilbert變換求時頻譜圖。
由于每個IMF分量對稱且局部均值為0,滿足瞬時頻率計算對信號數據的約束條件,可以使用Hilbert變換求解每個IMF分量在時間域上的瞬時頻率。
對每個IMF分量ci(t)做Hilbert變換,得
(12)
P為柯西主值,ci(t)與Hi(t)組成一個解析信號Zi(t):
Zi(t)=ci(t)+iHi(t)=αi(t)ejθi(t)
(13)
則瞬時頻率為
(14)
均值頻率為
(15)
取m主IMF分量的均值頻率作為時頻特征。
對特征提取部分的三域特征進行融合與選擇,假設樣本總數為n,則提取的時域、頻域、時頻域特征向量矩陣可以表示為:X1=[a1,a2,a3,…,an],X2=[b1,b2,b3,…,bn],X3=[c1,c2,c3,…,cn]。將X1、X2、X3以并聯相加的方式融合成新的特征X,X=X1+X2+X3=[a1+b1+c1,a2+b2+c2,…,an+bn+cn]=[x1,x2,x3,…,xn]。使用PCA主成分分析方法將融合特征X降維到m維,具體步驟如下:
(1)將數據X平均化,即所有樣本特征減去其均值。
(2)計算協方差矩陣A=1/nXXT。
(3)計算矩陣A的特征值與特征向量。
(4)依據方差貢獻率將特征值從大到小排序,選擇其中占比95%以上的m個特征值,將對應的特征向量作為行向量組成新的特征向量矩陣P。
(5)將數據轉換到m個特征向量構建的新空間Y=PX。
將特征融合與選擇后的軸承特征數據使用卷積神經網絡分類模型進行診斷分類,具體步驟如下:
(1)將n個m維特征數據樣本分為訓練集與測試集。
(2)搭建合適的卷積神經網絡模型:①選擇合適的卷積層、池化層數量與連接方式;②初始化卷積神經網絡參數,如卷積核、迭代次數、激活函數、損失函數與優(yōu)化函數等。
(3)以批量方式將訓練集輸出到卷積神經網絡輸入端,通過前向傳播從輸出端獲得樣本診斷類別并計算損失函數。
(4)使用誤差反向傳播算法與優(yōu)化函數對神經網絡模型的權值參數進行更新。
(5)重復步驟(3)(4)直到滿足準確率或者達到迭代次數,完成模型訓練。
(6)將測試集數據輸入到訓練好的模型中測試模型診斷效果。
具體步驟如圖4所示。
圖4 卷積神經網絡診斷分類流程
為驗證基于主成分分析的多域特征融合軸承故障診斷方法的有效性,將其應用在石化大機組實驗平臺的軸承部件上進行驗證。
石化大機組實驗平臺由廣東省石化裝備故障診斷重點實驗室提供,平臺主要由離心鼓風機、振動加速度傳感器、固定架、不同狀態(tài)滾動軸承故障件、數據采集器等組成,如圖5所示。
圖5 石化大機組實驗平臺
軸承狀態(tài)有外圈故障、內圈故障、滾珠缺失和正常狀態(tài)4種,可通過數據采集器采集設備振動信號。采樣頻率為1 000 Hz,轉速為1 000 r/min,每種狀態(tài)分別采集數據點500 000個,原始數據分布情況如圖6所示。
圖6 原始數據分布
實驗分別提取時域、頻域和時頻域的特征數據用于診斷分類。
3.2.1 時域特征提取
提取5個新量綱一化特征:波形、峰值、脈沖、峭度、裕度。每1 000個數據提取5個時域特征指標,每種時域特征指標數量為500個,對不同時域特征數據做歸一化處理,不同時域特征在不同軸承狀態(tài)的數據分布如圖7所示。
圖7 時域特征數據分布
3.2.2 頻域特征提取
通過頻域特征提取方法提取均方根頻率、中心頻率、均值頻率和標準差頻率4種頻域特征,每個特征指標數量為500個,對不同頻域特征數據做歸一化處理,不同頻域特征在不同軸承狀態(tài)的數據分布如圖8所示。
圖8 頻域特征數據分布
3.2.3 時頻域特征提取
對4種軸承狀態(tài)數據運用經驗模態(tài)分解方法提取時頻特征。以軸承正常狀態(tài)中1 000個數據為例,可分解成7個IMF分量和1個殘余分量,各IMF分量與Hilbert變換譜如圖9所示。
圖9 IMF分量(a)及其Hilbert變換(b)
圖9中X1為軸承正常狀態(tài)原始數據,c1-c7為運用EMD方法分解的7個IMF分量,r為殘余分量,h(ci)為第i個IMF分量的瞬時頻率。如圖9所示,X1的能量基本集中在前4個IMF分量之中,故提取前4個IMF分量的瞬時頻率的均值作為時頻域特征指標ki(i=1,2,3,4)。
ki=mean(h(ci))i=1,2,3,4
(16)
各軸承狀態(tài)原始數據中每1 000個數據提取4個時頻域特征指標并進行歸一化處理,時頻域特征數據分布如圖10所示。
圖10 時頻域特征數據分布
實驗通過特征提取部分提取了時域、頻域與時頻域特征共13種特征,分別是5種時域特征x、4種頻域特征y和4種時頻域特征k,將三域特征融合成13維特征h,h=x+y+k。
運用主成分分析方法對13維特征數據h進行降維處理,提取主成分特征。降維后各主成分的方差值占總方差值的比例即方差貢獻率如表2所示。
表2 各主成分方差貢獻率
從表2中可知:前7個主成分主方差貢獻率達到了98.4%,故選取前7個主成分作為降維后特征數據。
3.4.1 卷積神經網絡診斷分類
文中實驗卷積神經網絡模型基本結構為:(1)2個卷積層,卷積層層數分別為5層和10層,卷積核大小都為3×3,使用的激活函數為ReLU函數,δpadding=1;(2)3個全連接層,長度分別為70、20和4,使用的激活函數為Sigmoid函數。網絡中損失函數為交叉熵函數,優(yōu)化函數為一階Adagrad函數,定義學習率lr=1×10-3,正則化系數σweight_decay=1×10-4,迭代次數為300次,批量大小為32。
將7維融合特征數據打亂后分為訓練集與測試集,測試集在卷積神經網絡中的分類準確率為86%,迭代次數與診斷準確率結果如圖11所示。
圖11 卷積神經網絡診斷結果
3.4.2 卷積神經網絡與不同算法比較
在實驗過程中,選取樸素貝葉斯分類方法、支持向量機分類方法、K-近鄰分類方法、隨機森林分類方法這幾種具有代表性的機器學習分類模型與卷積神經網絡分類模型進行比較,各模型對融合數據的診斷準確率如表3所示。
表3 不同分類算法診斷準確率
由表3可以看出:卷積神經網絡分類模型相比其他分類模型的診斷效果更好,更適用于旋轉機械軸承的故障診斷。
3.4.3 融合數據診斷分類
將單獨的時域、頻域、時頻域特征數據和經過文中特征融合選擇后的特征數據輸入到卷積神經網絡模型中進行分類,診斷分類的結果如表4所示。
表4 不同特征診斷效果
由表4可以看出:通過文中基于PCA多域特征融合的特征數據,相比單獨的時域、頻域與時頻域特征指標的診斷準確率更高,并且相比未降維的特征數據診斷時間更短,證明文中方法在軸承故障診斷中的有效性。
文中提出一種基于主成分分析的多域特征融合軸承故障診斷方法,并將它應用于石化大機組實驗平臺軸承故障診斷。診斷過程中提取了時域、頻域和時頻域三域特征,消除了單一特征在故障表達方面的不足,三域融合特征相比單域特征的診斷準確率更高,達到了86%。而主成分分析方法可以對三域融合特征進行降維,在保持原特征信息的前提下降低了模型的復雜性,減少了分類時間。卷積神經網絡分類模型也能實現對融合特征數據的精確診斷,相比其他分類模型診斷準確率更高。