時培明, 范雅斐, 伊思穎, 韓東穎
(1. 燕山大學 電氣工程學院, 河北 秦皇島 066004;2. 燕山大學 車輛與能源學院,河北 秦皇島 066004)
軸承作為基礎的支撐零件,是風機中應用最為廣泛的零件之一。風電機組工作條件惡劣,工況復雜,其減速箱軸承是故障頻繁發(fā)生的關鍵部件之一,因而針對風機軸承的故障診斷方法技術的探索一直是學術界的研究熱點[1-2]。然而, 風機軸承的振動信號一般是非線性非平穩(wěn)性的,如何從原始信號中提取有效的特征實現(xiàn)準確診斷是一個很大的挑戰(zhàn)。最新進展證明了深度學習算法[2-4]在處理復雜非線性、高維機械信號方面的高效性。其中,自動編碼器網(wǎng)絡無監(jiān)督的學習模式有其突出的優(yōu)勢。Qi等[5]提出的經(jīng)驗模態(tài)和疊加稀疏編碼器兩階段學習算法,證明了編碼器較強的特征學習能力。Li等[6]將距離度量學習和k-means聚類方法集成到自編碼網(wǎng)絡結構中,表現(xiàn)出較高的分類精度。Zhang等[7]構造了流形稀疏編碼器神經(jīng)網(wǎng)絡,試驗證明,該方法能更好地提取出偶識別性的高級特征。Jiang等[8]提出使用多個噪聲級順序地訓練降噪編碼器,從輸入數(shù)據(jù)中以不同的尺度捕獲更詳細的信息,提高診斷正確率。然而,多數(shù)算法沒有表現(xiàn)出穩(wěn)定的診斷性能,且在保證診斷率的同時需要較長的診斷時間。
本文提出基于修正的自動編碼器-層疊降噪編碼器(stacked denoising autoencoder,SDAE),通過網(wǎng)絡架構的多重非線性變換,實現(xiàn)自適應魯棒學習。結合希爾伯特振動分解(Hilbert vibration decomposition,HVD)高分解效率和小波包分解(wavelet packet decomposition,WPD)構造數(shù)據(jù)之間非線性映射關系的優(yōu)點,克服了振動信號的噪聲干擾,提高了診斷性能,同時能量熵的低維表示也降低了故障診斷時間。低維預處理結果作為SDAE的網(wǎng)絡輸入,完成網(wǎng)絡的特征學習和故障分類。試驗證明,本文提出的新的特征學習方法——HWSDAE方法能有效提高風機軸承故障分類精度。
HVD是由Feldman等提出的一種經(jīng)典的振動信號分解算法[9],將信號分解為幅值大小不同的分量之和,在處理非穩(wěn)定信號時表現(xiàn)出較為突出的優(yōu)越性。算法具體分解步驟如下。
步驟1希爾伯特變換。對于任意一個非平穩(wěn)連續(xù)時間信號x(t),其Hilbert 變換可表示為
(1)
(2)
步驟2幅值最大分量的頻率估計。多分量非平穩(wěn)信號可以進行分解,根據(jù)式(2),信號x(t)的瞬時頻率f(t)也可表示為
(3)
式中:前半部分f1(t)為信號幅值最大頻率的瞬時頻率;后半部分表示與前者相比快速變化的震蕩頻率部分。后者可以利用HVD的低通濾波器進行濾除。
步驟3同步檢測求幅值和相位。利用正余弦函數(shù)構造兩個正交信號,并同步檢測出瞬時頻率對應的瞬時幅值a(t)和相位θ(t)。
步驟4分離迭代。經(jīng)步驟1~步驟3分離得到x(t)中幅值的最大分量
(4)
將x(t)與x1(t)的差值作為初始信號x0(t),即
x0(t)=x(t)-x1(t)
(5)
重復步驟2、步驟3,可得到各層分量xi(t),i=1,2,3,…設置迭代次數(shù)N或者x0(t)的歸一化標準差σ<0.001,作為迭代的終止條件。
步驟5根據(jù)峭度與信號沖擊強弱的關系選取模態(tài)分量S。
小波包分析[10]是改進的小波變換,克服了小波變換對于高頻段的頻率分辨率較差的缺陷。將故障信號進行小波包分解,WPD序列按照頻帶由低到高的階數(shù)進行排序,計算各頻帶所占的能量熵,作為HWSDAE的輸入。詳細步驟如下。
步驟1對峭度選取分量S進行j(本文令j=5)層小波包分解。Xij為了分解后第i層中的第j個節(jié)點所在頻段的小波包分解對應的系數(shù)大小。
步驟2對底層小波包分解系數(shù)進行重構。將步驟1中得到的32個頻帶的特征信號序列進行重構。Sij為Xij對應的重構信號。S5j為第5層各節(jié)點的重構信號,則S表示為
(6)
(7)
式中:N為原始信號長度;Hij為信號的第i層第j個小波包能量熵。
使用WPD分解矩陣的優(yōu)勢顯而易見,矩陣將信號分離到單獨的頻帶中,降低了被分析信號的總體復雜度,提取頻帶內(nèi)和頻帶間的特征比直接從原始信號中提取特征更容易,有助于提高模型的故障診斷性能[11]。
Vincent等提出了一個修正版的經(jīng)典AE(auto-encoder,AE)[12],并命名為DAE(denoising autoencoder,DAE)。DAE是從AE的基本思想出發(fā),隨機破壞原始輸入信號,避免其輸出只是輸入的簡單映射,形成更具魯棒性的表示。AE通過對隱藏特征進行編碼解碼,使網(wǎng)絡輸出盡可能與輸入接近。標準的AE是一個全連接的3層神經(jīng)網(wǎng)絡:輸入層、隱藏層和輸出層。結構圖如圖1所示。
輸入層和隱藏層構成編碼網(wǎng)絡
h=f(x)=Sf(WEx+bE)
(8)
隱藏層和輸出層構成解碼網(wǎng)絡
y=g(h)=Sg(WDx+bD)
(9)
式中:x=[x1,x2,…,xn]∈Rn×1為輸入值;h=[h1,h2,…,hm]∈Rm×1為隱藏值;y=[y1,y2,…,yn]∈Rn×1為輸出值;f(·)和g(·)為激活函數(shù)。在標準的AE算法中,激活函數(shù)常采用S型函數(shù)即Sigmoid函數(shù),如式(10)所示。
圖1 標準AE模型Fig.1 Standard AE model
(10)
其中,編碼器網(wǎng)絡為ZE=WEx+bE,解碼器網(wǎng)絡為ZD=WDh+bD。WE∈Rm×n和WD∈Rn×m分別為編碼和解碼網(wǎng)絡的權值,bE∈Rm×1和bD∈Rn×1分別為偏置。AE將輸入數(shù)據(jù)加入權重參數(shù)W進行編碼,經(jīng)過激活函數(shù)并進行解碼,該訓練過程是為了尋求一組網(wǎng)絡參數(shù)最小化損失函數(shù)。損失函數(shù)定義為輸入與輸出的二范數(shù),即
(11)
式中:N為訓練樣本數(shù);‖·‖2為二范數(shù)模型。由此可知,該目標函數(shù)是一個二次凸函數(shù),依次求解偏導數(shù),采用批量梯度下降法(batch gradient descent,BGD)更新權值參數(shù),并通過反向傳播算法進行網(wǎng)絡微調(diào),最終找到全局最優(yōu)解。
(12)
層疊降噪自編碼器(stacked denoising autoencoder,SDAE)是多個DAE單元的堆棧,由一個輸入層、一個輸出層和多個隱藏層搭建而成。輸入數(shù)據(jù)通過逐層的學習表示,進行特征的空間轉(zhuǎn)換,能夠捕捉更多數(shù)據(jù)的內(nèi)在信息。另外,損壞數(shù)據(jù)輸入的訓練過程是無監(jiān)督的,其主要目的是從未標記的數(shù)據(jù)中學習特征表示,避免了人為添加樣本標簽的步驟,提高了工作效率的同時減少了對主觀經(jīng)驗的依賴,也更加適用于滾動軸承故障診斷的實際場景。輸出端添加Softmax分類層,構建一個具有特征提取和模式識別功能的深度神經(jīng)網(wǎng)絡模型。
本文提出的HWSDAE算法模型是以SDAE深度學習為改進基礎,結合HVD時頻分析工具和小波包降維算法對原振動信號進行預處理,處理結果作為模型訓練的輸入,利用SDAE網(wǎng)絡的自身特性,進行無監(jiān)督網(wǎng)絡訓練和參數(shù)優(yōu)化完成故障分類。本文所提方法流程圖(見圖2)、模型圖(見圖3)及詳細診斷步驟總結如下。
步驟1將代表不同軸承故障類型的數(shù)據(jù)根據(jù)樣本點的設定進行隨機分段,按照一定比例分配到訓練集和測試集。分別定義為Datatrain,Datatest。
步驟2試驗設定將數(shù)據(jù)進行3層HVD模態(tài)分解,選取峭度值最大的模態(tài)分解量參與下一步的降維;接著進行5層小波包分解,得到32樣本大小的能量熵,并以此構造特征向量。同理,測試集也進行上述步驟。分別定義為Trainset,Testset。
步驟3將步驟2得到的特征數(shù)據(jù)作為SDAE網(wǎng)絡的輸入,數(shù)據(jù)在深度學習網(wǎng)絡中進行噪聲破壞、隱藏層壓縮、無監(jiān)督訓練和有監(jiān)督微調(diào)等過程。網(wǎng)絡頂層添加Softmax分類層。
步驟4將步驟2得到的測試集Testset放入訓練完成的編碼器網(wǎng)絡,并給出對應的健康狀況標簽以及分類準確率。
圖2 HWSDAE故障診斷流程圖Fig.2 Flowchart of HWSDAE fault diagnosis
圖3 HWSDAE故障診斷模型圖Fig.3 Model diagram of HWSDAE fault diagnosis
為了使網(wǎng)絡模型最優(yōu)化學習,本節(jié)以西儲數(shù)據(jù)軸承外圈故障振動信號為例,進行參數(shù)選擇。相對標準差和峭度值兩個評估指標的選擇基于模態(tài)信號穩(wěn)定性和對信號敏感度的表現(xiàn)。其中,相對標準差越小表示模態(tài)信號相對原信號相似度越高;峭度值越大表示對故障信號的敏感度越高。
(1) HVD分解模態(tài)數(shù)
以5個模態(tài)分量的HVD分解為例,如圖4所示。由圖4可知,HVD分量1與原信號最接近,高頻部分較為突出;分量2,3的波形圖波動明顯,信號的低頻信息被細化分解;隨著分解模態(tài)數(shù)的增加,頻譜波動幅度和范圍變小,頻譜幅值量級在1×10-3左右,分解過程所消耗的時間也變長。圖5表明,相對標準差在3層以后趨于穩(wěn)定,且在3層分解量的峭度最大。綜上分析,我們設定HVD的模態(tài)分解數(shù)為3。
(2) 網(wǎng)絡隱藏層和節(jié)點數(shù)
由于深度學習網(wǎng)絡自身的深層挖掘特性,因此需要在進行網(wǎng)絡選擇和訓練時評估網(wǎng)絡隱藏層及節(jié)點數(shù)對診斷性能的影響。表1統(tǒng)計了上述兩個因素對系統(tǒng)模型表現(xiàn)性能的影響,由表1可知,當輸入層為單元數(shù)為32 時,一個或兩個隱藏層的設置明顯要優(yōu)于3個隱藏層,且表現(xiàn)穩(wěn)定,隨著隱藏層的增加,較深的網(wǎng)絡結構會出現(xiàn)過擬合現(xiàn)象,導致診斷性能略有下降。當隱藏層數(shù)設定為2且節(jié)點數(shù)均為100時,網(wǎng)絡的重構誤差最小,表明此時的網(wǎng)絡訓練特征包含了更多的故障信息,模型表現(xiàn)出突出穩(wěn)定的診斷性能。
基于上述試驗,選擇由32和4個神經(jīng)元構造輸入層和輸出層,兩個隱藏層均為100個神經(jīng)元的網(wǎng)絡結構,進行基于深度網(wǎng)絡的特征學習。
圖4 5個模態(tài)分量時頻圖Fig.4 Time-frequency diagram of 5 modal components
圖5 指標趨勢圖Fig.5 Indicator trend chart
表1 網(wǎng)絡隱藏層及節(jié)點設置
為了證明所提方法的穩(wěn)定有效性,采用兩個數(shù)據(jù)集進行算法驗證。訓練集、測試集均包含4種不同工況數(shù)據(jù),如表2所示。
表2 試驗數(shù)據(jù)描述
(1) 凱斯西儲數(shù)據(jù)集
圖6所示是凱斯西儲大學試驗平臺,試驗臺設置的詳細信息可在文獻[13]中找到。本文使用12 000采樣頻率下的電機載荷為0負載的4種運行狀態(tài)的驅(qū)動端加速度數(shù)據(jù)(DE),另外,外圈的損傷點選擇6點鐘方向。試驗設定每種故障各取30組,每組有3 000個樣本點,等比例分配給訓練集和測試集,其樣本空間大小均為15×3 000。
圖6 凱斯西儲大學試驗平臺Fig. 6 The experimental platform of Western Reserve University
將本文所提方法與現(xiàn)有的SAE,DBN和原數(shù)據(jù)輸入SDAE網(wǎng)絡進行比較,4種模型6次分類精度平均值以及所需的診斷時間如圖7所示。本文所提HWSDAE方法的平均準確率高達99.49%,單次診斷率可達100%。HWSDAE網(wǎng)絡比原數(shù)據(jù)直接輸入SDAE網(wǎng)絡表現(xiàn)出更為突出的診斷性能,準確率提高最為明顯,可達13.52%,導致該現(xiàn)象的原因是沒有經(jīng)過預處理的數(shù)據(jù)維度較高,含有更大比例的干擾噪聲和其他冗余信息,且非線性信號不利于深度網(wǎng)絡的訓練學習。
圖7 不同算法結果對比圖Fig.7 Comparison chart of different algorithm results
(2) 實驗室平臺數(shù)據(jù)集
第二組振動數(shù)據(jù)是在如圖8所示的實驗室平臺上采集的。在轉(zhuǎn)速為1 500 r/min,3 kHz的采集頻率下采集軸承的正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動體故障的振動數(shù)據(jù)。試驗設定每種故障各取30組,每組有1 800個樣本點,等比例分配給訓練集和測試集,其樣本空間大小均為15×1 800。
圖8 實驗室設計試驗平臺Fig. 8 The experimental platform of laboratory design
圖9為4種算法模型在第二組數(shù)據(jù)集上的試驗結果對比圖。相比第一組數(shù)據(jù)集整體準確率略有下降,但本文提出的HWSDAE算法的性能表現(xiàn)依然最為突出,準確率高達98.72%,且沒有因為網(wǎng)絡層的疊加造成時間消耗。由圖7、圖9可知,DBN網(wǎng)絡的性能表現(xiàn)較為穩(wěn)定,明顯優(yōu)于SDAE算法,但診斷時間和平均準確率都差于SAE和HWSDAE網(wǎng)絡。HWSDAE與SAE網(wǎng)絡相比獲得了更穩(wěn)定的訓練時間,主要是因為數(shù)據(jù)破壞可以減少學習到的特征的反向傳播時間,具有更好的魯棒性。同時,平均準確率相比SAE網(wǎng)絡提高了3.71%。試驗結果表明,合適比例的噪聲存在可以明顯增強網(wǎng)絡的魯棒性,提高診斷性能,即本文提出的HWSDAE算法在風電機組的故障診斷上表現(xiàn)出更高的診斷性能,具有一定的實際意義。
圖9 不同算法結果對比圖Fig.9 Comparison chart of different algorithm results
(1) 本文提出了一種新的智能算法進行風機軸承的故障診斷,自適應挖掘振動數(shù)據(jù)的潛在特征。采用聯(lián)合降維方法對信號進行特征提取,使故信息更具表現(xiàn)化,同時降低了故障診斷時間。
(2) 利用凱斯西儲軸承數(shù)據(jù)和實驗室試驗平臺數(shù)據(jù)為數(shù)據(jù)集,對所提出的HWSDAE方法和現(xiàn)有的3種深度學習網(wǎng)絡進行了算法驗證和試驗對比。結果表明,本文提出的方案模型不僅在診斷時間方面優(yōu)于其他3種模型,而且表現(xiàn)出高達99.49%的平均診斷準確率,有效識別軸承健康狀況,顯著提高了故障分類準確性。