盧艷靜,許艷英,包宋建
(1.河南師范大學 電子與電氣工程學院,河南 新鄉(xiāng) 453007;2.三門峽社會管理職業(yè)學院 信息工程學院,河南 三門峽 472000;3.重慶科創(chuàng)職業(yè)學院 人工智能學院,重慶 402160;4.重慶文理學院 電子信息與電氣工程學院,重慶 402160)
由于滾動軸承是各類工業(yè)設備中必不可少的零件,對其開展狀態(tài)監(jiān)測非常有必要[1]。在軸承的故障診斷中,信號處理、特征提取和模式識別是3個典型環(huán)節(jié),而特征提取往往被認為是故障診斷的關鍵[2,3]。
滾動軸承的振動信號為非線性、非平穩(wěn)的時間序列,線性方法對此不適用。目前,樣本熵[4]、排列熵[5]、散布熵[6]等非線性分析方法被大量應用于故障診斷領域,并取得了不錯的效果[7]。但上述方法都是從單一尺度開展信號的度量,而滾動軸承故障信號的動力學信息分布在多個尺度,只開展單個尺度的評估會造成動力學信息的丟失,進而無法準確地提取其中的故障信息[8]。
為此,學者們提出了多尺度分析方法,如多尺度樣本熵(MSE)、多尺度排列熵(MPE)和多尺度散布熵(multiscale dispersion entropy,MDE)等,將單一尺度的熵值指標擴展為多尺度計算,從而實現(xiàn)從多個尺度分析時間序列復雜性的目的。
例如,孟宗等人[9]將MSE與局部均值分解相結合,用于滾動軸承的故障診斷,取得了不錯的效果;然而MSE無法準確地分析短時間序列的復雜度。WU Shuen-de等人[10]將MPE用于滾動軸承的故障特征提取,支持向量機的分類結果驗證了MPE的有效性;但是MPE忽略了信號的振幅信息。喬新勇等人[11]將MDE與變分模態(tài)分解相結合,用于柴油機的故障診斷,驗證了MDE相較于MPE的優(yōu)越性;但MDE需要設置大量的參數(shù),參數(shù)敏感性較顯著。
Lempel-Ziv復雜度(Lempel-Ziv complexity,LZC)是LEMPEL A等人[12]提出的一種測量時間序列復雜度的指標,其完全基于數(shù)據(jù)的固有特性,因而不需要設置任何參數(shù),其泛化性較強。
YU Kun等人[13]在LZC指標的基礎上,提出了多尺度LZC(multi-scale Lempel-Ziv complexity,MLZC)指標,并用于滾動軸承的故障診斷,取得了不錯的效果;但是MLZC的粗?;幚碓谶M行粗?;倪^程中,子序列長度會隨著尺度的增加而變少,這會造成信號中的有效信息丟失,進而影響對信號的描述。張小龍等人[14]將固有時間尺度分解和LZC指標相結合,提出了自適應多尺度LZC指標,實現(xiàn)了滾動軸承故障的準確識別目的;但是該方法需要對分解后的分量進行篩選,增加了不確定性。
針對MLZC的缺陷,筆者基于時移粗?;幚淼乃枷?對LZC進行改進,提出時移多尺度Lempel-Ziv復雜度(TSMLZC),以便于更加可靠地提取軸承振動信號的故障特征,并且減少設置的參數(shù)數(shù)量;在此基礎上,提出基于TSMLZC和灰狼優(yōu)化器(GWO)-支持向量機(SVM)的滾動軸承故障檢測方法。
首先,利用TSMLZC對軸承振動信號進行分析,構造故障特征樣本;隨后,隨機選擇一部分樣本對WOA-SVM進行訓練,構建參數(shù)和泛化性最優(yōu)的分類器模型;最后,將剩余的特征樣本輸入至優(yōu)化后的分類器進行故障識別,利用2種滾動軸承故障數(shù)據(jù)對所提方法的有效性進行驗證,并將其與其他故障診斷方法進行對比。
MLZC綜合分析了信號在多個時間尺度下的結構復雜性,可以有效地描述信號的動力學變化狀況。LZC算法的原理可以參考張超等人的研究[15]。
MLZC的詳細算法如下:
對故障信號{x(i),i=1,2,3,…,N}執(zhí)行粗粒化分析生成新的子序列:
(1)
式中:[]為向下取整函數(shù);s為尺度因子。
分別計算各尺度粗?;盘柕腖ZC值,得到原始信號的MLZC。
然而,應用MLZC進行信號故障特征提取面臨下列缺陷:
1)粗?;斐尚蛄虚L度減小。對x(i)進行尺度為s的粗粒化處理,生成的粗粒序列長度為[N/s]。以s=2為例,此時的粗粒化處理如圖1所示。
圖1 MLZC粗?;^程
2)粗?;僮鞯谋举|是在信號上引入了步長為s的滑動窗口,再對每個窗口的數(shù)值取平均,以此來獲得粗?;盘?。信號中的每個數(shù)據(jù)僅使用一次,這造成不同窗口間元素的特征遺失(例如,當s=3時,粗粒信號遺漏了數(shù)據(jù)點x2、x3和x43個數(shù)據(jù)點的固有關系)。
為緩解MLZC遺漏故障信息和對數(shù)據(jù)長度的依賴,增加其描述信號復雜度的準確程度,筆者對MLZC進行了改進,提出了TSMLZC的思想。其主要原理描述如下:
對于信號{x(i),i=1,2,3,…,N},進行時移粗粒處理,獲得時移粗粒信號:
yk,β=(xk,xk+β,xk+2β,…,xΔ(k,β)β+k)
Δ(k,β)=(N-β)/k
(2)
式中:k(1≤k≤s)為粗粒信號的起點;β(β=s)為時間間隔。
(3)
根據(jù)上述步驟,TSMLZC的時移粗?;幚肀葌鹘y(tǒng)粗?;鼉?yōu),對數(shù)據(jù)的利用更加充分,對長度不敏感,因而比MLZC更優(yōu)。
尺度因子s=4時的時移粗?;幚砣鐖D2所示。
圖2 s=4時的時移粗粒化過程
由圖2可以發(fā)現(xiàn):時移粗?;幚砜紤]了相鄰數(shù)據(jù)點之間的聯(lián)系,能夠更加準確地度量時間序列的內(nèi)在特性,從而獲得更加準確的估計熵值[16]。
在TSMLZC中,僅需輸入原始故障信號和尺度因子s,因為TSMLZC對參數(shù)不敏感。筆者將s設置為20。因為TSMLZC只對信號數(shù)據(jù)長度敏感,根據(jù)經(jīng)驗,數(shù)據(jù)長度較短時,會導致信號的復雜度估計偏差較大。
為了驗證TSMLZC對數(shù)據(jù)長度的魯棒性,筆者分析了10組不同信號長度的噪聲(N=256,512,1 024,2 048,4 096,8 192)下TSMLZC和MLZC的復雜度分布;除此之外,還根據(jù)信號的復雜度均值波動來評價算法對信號長度的魯棒性。
不同噪聲信號長度下,TSMLZC和MLZC復雜度分布具體結果如圖3示。
圖3 不同噪聲信號長度下TSMLZC和MLZC復雜度分布
由圖3可以發(fā)現(xiàn):與MLZC相比,TSMLZC在不同信號長度下的復雜度分布更平滑。其中,不同數(shù)據(jù)長度噪聲(白噪聲和Fn噪聲)下平均MLZC的最大波動分別為0.176和0.417,而TSMLZC估計值的最大波動為0.047和0.245,均小于MLZC,這表明TSMLZC算法受時間序列長度的影響較小,能夠更加準確地估計信號的復雜度。
同時,比較了不同長度下信號的復雜度估計值分布,當N小于1 024時,熵值存在一定的誤差。這證明當長度小于該值時,TSMLZC和MLZC的穩(wěn)定性較差,因而信號長度必須大于1 024。因此,筆者設置N=2 048。
在該實驗中,TSMLZC用于提取故障特征,因而其能否準確分辨不同類型的信號是最關鍵的性能評價指標。
筆者分析了TSMLZC和MLZC對不同噪聲(長度2 048的白噪聲和Fn噪聲)的分辨效果,并基于復雜度值分布和變異系數(shù)來估計不同多尺度方法的分類性能,其結果如圖4所示。
圖4 MLZC和TSMLZC對兩種噪聲的分辨效果
由圖4可以發(fā)現(xiàn):TSMLZC處理得到的變異系數(shù)遠小于傳統(tǒng)的MLZC,這表明基于時移粗?;幚淼玫降亩喑叨刃畔⒏€(wěn)定可靠,間接驗證了時移分割的操作能夠很好地緩解傳統(tǒng)多尺度粗粒化操作的缺陷;此外,比較MLZC和TSMLZC的分布,可以發(fā)現(xiàn)這兩個方法在任何尺度上都沒有出現(xiàn)混疊的現(xiàn)象,這證明其均有較好的信號分辨能力。
總之,根據(jù)上述結果,可以得出結論,即TSMLZC對不同類型的噪聲信號具備有效的分辨能力。
為了對滾動軸承的不同工況和故障進行檢測,筆者在采集到原始故障信號后,計算其TSMLZC構成故障特征數(shù)據(jù)樣本,采用GWO-SVM多模式分類器進行工況識別(其中GWO-SVM分類器的參數(shù)設置和模型結構參考王貢獻等人[17]的研究)。
基于TSMLZC和GWO-SVM的損傷識別步驟如圖5所示。
圖5 故障診斷模型的流程圖
詳細步驟如下:
1)預設軸承有h種工況,每種工況采集m組信號,每組信號長度設置為2 048;
2)求出每個樣本TSMLZC值,作為分類器的輸入特征向量;
3)將TSMLZC復雜度評估結果匯總,基于工況類型賦予其類別1~h,每種工況選擇j個樣本作為訓練集,余下樣本作為測試集,匯總后分別作為訓練和測試數(shù)據(jù);
4)采用訓練數(shù)據(jù)對GWO-SVM多模式分類器進行訓練,智能地設置SVM的最佳參數(shù)組合;
5)基于完備的GWO-SVM多模式分類器實現(xiàn)對測試數(shù)據(jù)的工況識別目標。
為驗證TSMLZC+GWO-SVM在診斷滾動軸承故障中的有效性,筆者利用公開軸承數(shù)據(jù)進行分析驗證。
其中,軸承為6205-2RS深溝球軸承,基于電火花技術分別在軸承上加工出單點故障,故障尺寸分別為0.177 8 mm、0.355 6 mm和0.533 4 mm,載荷0 hp,電動機轉速為1 797 r/min;在12 kHz采樣頻率下收集正常、內(nèi)圈故障、外圈故障和滾珠故障4種狀態(tài)的振動信號。
為了開展故障類型和嚴重程度的檢測實驗,筆者將故障軸承依據(jù)故障尺寸分為輕度、中度和重度三種嚴重程度,總共獲得10種類型的信號,對應標簽為1~10,分別記為正常NOR、內(nèi)圈輕度故障IRF1、滾珠輕度故障BF1、外圈輕度故障ORF1、內(nèi)圈中度故障IRF2、滾珠中度滾珠BF2、外圈中度故障ORF2、內(nèi)圈重度故障IRF3、滾珠重度滾珠BF3和外圈重度滾珠ORF3,每種狀態(tài)挑選50個樣本。
各種類型的軸承信號數(shù)據(jù)介紹如表1所示。
表1 軸承數(shù)據(jù)介紹
滾動軸承振動信號的波形如圖6所示。
圖6 0 hp負載下的軸承信號波形
隨后,筆者采用TSMLZC為特征提取工具,對滾動軸承不同工況信號的特征進行提取。MLZC、MSE、MPE和MFE也被引入用于對比實驗。所有的模型和實驗都基于MATLAB2019b進行開發(fā)。
不同多尺度方法的參數(shù)設置如表2所示。
表2 不同多尺度方法的參數(shù)設置
5種特征提取工具所提取的故障特征如圖7所示。
圖7 5種特征提取工具提取的軸承故障特征
隨后,筆者將故障特征輸入至GWO-SVM分類器中進行故障識別,每組工況選擇25個樣本進行訓練,25個樣本進行測試。
5種方法的分類結果如圖8所示。
圖8 5種故障檢測方法的分類結果
詳細的分類結果如表3所示。
表3 5種故障檢測方法的詳細分類結果
從表3可以發(fā)現(xiàn):TSMLZC+GWO-SVM的準確率最高,達到了98.8%,證明了其能夠有效地識別滾動軸承的不同故障類型和嚴重程度。但其需要花費807.41 s來提取故障特征,時長遠遠高于其他4種方法,即其缺點在于效率偏低。
相比較而言,基于MPE+GWO-SVM方法的準確率也比較高,接近TSMLZC+GWO-SVM,同時其效率也較高,同樣適用于滾動軸承的故障診斷。
但需要指出的是,TSMLZC+GWO-SVM在特征提取階段無需設置額外參數(shù),完全基于數(shù)據(jù)自身的固有特性來估計復雜度,而其他方法均需設置較多參數(shù),因而TSMLZC+GWO-SVM能避免參數(shù)變動所導致的不利影響。
實驗中所使用的振動信號采集自驅動端,該部分離軸承較近,因而振動傳遞過程中的損耗小,大量的振動信息得以保留。但在部分情況下,傳感器只能布置在風扇端,而風扇所帶來的環(huán)境噪聲可能會削弱軸承故障所導致的振動。因此,有必要檢驗TSMLZC+GWO-SVM在使用基于風扇端數(shù)據(jù)時的有效性。
同時,為了檢驗該方法和其他對比方法在識別不同工況下故障診斷的準確率,筆者就不同負載下的振動識別進行了實驗,得到了驅動端和負載端的不同負載下的識別準確率結果,如表4所示。
表4 驅動端和負載端的不同負載下的識別準確率 (%)
由表4可以發(fā)現(xiàn):TSMLZC+GWO-SVM能夠準確地識別不同工況的故障,準確率均高于98%。此外,該方法在準確率方面普遍優(yōu)于其他4種方法,證明了該方法的魯棒性。
為了驗證TSMLZC+GWO-SVM故障診斷方法的性能,筆者利用另外的滾動軸承數(shù)據(jù)集進行實驗[18]。該滾動軸承數(shù)據(jù)有兩種系統(tǒng)負載,分別是0 V和2 V,與美國凱斯西儲大學的軸承數(shù)據(jù)類似,不同負載對應的是電機轉速差異,其它設置均不變。
文獻[18]中提供的數(shù)據(jù)包含8個通道,通道1是電機振動,通道2、3、4分別是行星齒輪箱中的滾動軸承在X、Y和Z方向上的振動,通道5是電機扭矩,通道6、7、8是平行齒輪箱中的滾動軸承在X、Y、Z方向上的振動。
筆者首先使用0 V負載下的通道4數(shù)據(jù)。所使用的滾動軸承故障類型包含正常、內(nèi)圈故障、滾珠故障、外圈故障和復合故障(內(nèi)圈故障+外圈故障),對應標簽為1~5,分別記為NOR、IRF、BF、ORF、CF。
每種狀態(tài)挑選50個樣本,軸承振動信號的時域波形圖如圖9所示。
圖9 軸承振動信號的波形圖
隨后,筆者利用TSMLZC+GWO-SVM等5種故障診斷方法來診斷滾動軸承的不同故障類型和工況,其中25組樣本作為訓練樣本,剩余25組作為測試樣本。
5種方法的分類結果如圖10所示。
圖10 5種故障檢測方法的分類結果
詳細的分類結果如表5所示。
表5 5種故障檢測方法的詳細分類結果
由表5可以發(fā)現(xiàn):TSMLZC+GWO-SVM的準確率最高,達到了94.4%,有7個被錯誤分類的樣本,總體上能夠證明其可以有效識別滾動軸承的故障類型。但同時該方法需要474.74 s來提取特征,時長高于其他方法,這證明該方法的效率偏低。
總體來看,該方法自身不需要設置參數(shù),能夠避免參數(shù)設置所帶來的不確定性。此外,該方法能夠取得較不錯的故障識別效果,證明了其可觀的性能,因此其可以用于滾動軸承的故障識別中。
隨后,為了測試5種方法在基于不同通道信號和不同負載時的故障識別性能,筆者對不同負載下的8個通道的故障識別進行了研究,結果如表6所示。
表6 驅動端和負載端的不同負載下的識別準確率 (%)
由表6可發(fā)現(xiàn):在利用TSMLZC+GWO-SVM對不同通道的數(shù)據(jù)進行特征提取時,所獲得的識別準確率差異較大,這證明每個通道所包含的信息量具有較大的差異;而MSE、MFE和MPE方法的性能相對比較穩(wěn)定,在多數(shù)時候準確率優(yōu)于TSMLZC+GWO-SVM。
在采用通道1、通道3、通道4、通道5、通道6時,TSMLZC+GWO-SVM的準確率最高,這證明了該方法具有一定的診斷可行性;但是其對信號的來源有要求。
總體而言,TSMLZC+GWO-SVM能夠在一定程度上對滾動軸承進行故障識別,并判斷軸承的工況和故障類型。
針對滾動軸承的故障特征提取困難,以及常規(guī)方法需設置較多參數(shù)的問題,筆者提出了一種基于TSMLZC和GWO-SVM的滾動軸承故障診斷方法。
利用美國西儲大學和國內(nèi)東南大學2種滾動軸承數(shù)據(jù)對該方法和其他故障診斷方法進行了實驗和對比,可以得出以下結論:
1)與MLZC相比較,TSMLZC方法在測量時間序列的復雜度方面更穩(wěn)定,變異系數(shù)更小;
2)和基于MSE、MPE、MFE和MLZC的故障診斷方法相比,TSMLZC+GWO-SVM方法的準確率更高,基于美國凱斯西儲大學軸承數(shù)據(jù)的準確率為98.8%,而東南大學軸承數(shù)據(jù)的準確率為94.4%,均高于其他幾種方法;
3)在診斷多種工況的故障時,采用TSMLZC+GW-SVM的故障診斷方法也能夠獲得不錯的識別準確率,證明其能夠適用于多個工況下的故障識別問題。
雖然筆者開發(fā)的故障診斷方法具有一定的潛力,但是其在特征提取效率方面存在明顯的不足。因此,筆者后續(xù)將就減小特征提取時間的問題進行研究,以提高該方法的故障診斷效率。