韓光信,甘群豐,于天暝,陸洋,胡云峰
(1.吉林化工學(xué)院信息與控制工程學(xué)院,吉林吉林 132000;2.東北電力大學(xué)自動(dòng)化工程學(xué)院,吉林吉林 132000;3.吉林大學(xué)通信工程學(xué)院,吉林長春 130000)
滾動(dòng)軸承被廣泛應(yīng)用于現(xiàn)代工業(yè),是旋轉(zhuǎn)機(jī)械的關(guān)鍵部件之一。滾動(dòng)軸承故障診斷不僅可以保證機(jī)械設(shè)備的平穩(wěn)性和有效性,而且有利于及時(shí)發(fā)現(xiàn)和排除意外故障。滾動(dòng)軸承故障診斷在一定程度上能防止重大事故的發(fā)生,具有重要意義。通常,由于軸承工作環(huán)境的限制,無法直接進(jìn)行診斷。傳感器可用于收集能夠反映軸承狀態(tài)的數(shù)字信號(hào),如光譜信號(hào)、聲音信號(hào)和振動(dòng)信號(hào)。頻譜信號(hào)和聲音信號(hào)可用于無損探傷,具有特征頻率明顯、故障早期預(yù)測性好的優(yōu)點(diǎn)。然而,這些方法對(duì)設(shè)備和操作員的專業(yè)素質(zhì)要求很高。軸承的振動(dòng)信號(hào)包含豐富的故障能量信息,軸承振動(dòng)信號(hào)的采集不需要復(fù)雜的設(shè)備和專業(yè)人員。然而,傳感器采集的數(shù)據(jù)規(guī)模巨大,如何快速、有效地識(shí)別故障成為了一個(gè)難題。因此,提出將軸承故障數(shù)據(jù)按照既定的標(biāo)準(zhǔn)進(jìn)行等量分割,利用專家經(jīng)驗(yàn)對(duì)片段進(jìn)行識(shí)別與標(biāo)注,并創(chuàng)新性地把軸承故障診斷問題建模為時(shí)間序列分類(Time-Series Classification,TSC)問題。通過提取異常數(shù)據(jù)和正常數(shù)據(jù)的特征,達(dá)到識(shí)別異常數(shù)據(jù)的目的。
時(shí)間序列分類的研究已經(jīng)發(fā)展了20多年,許多算法得到了發(fā)展和廣泛應(yīng)用。TSC方法大致分為4大類:基于距離的、基于特征的、基于集成的和基于深度學(xué)習(xí)的模型[1]。在基于距離的時(shí)間序列分類方法中,將最近鄰分類器與距離函數(shù)相結(jié)合是一種最常見的組合方式。當(dāng)與最近鄰分類器一起使用時(shí),動(dòng)態(tài)時(shí)間扭曲(Dynamic Time Warping,DTW)距離被證明具有非常強(qiáng)的基線[2]。LINES和BAGNALL[3]比較幾種距離度量方法,結(jié)果表明沒有一種距離度量方法明顯優(yōu)于DTW?;谔卣鞯姆椒?,通過提取原始時(shí)間序列中的有效特征進(jìn)行分類,例如SFA符號(hào)包(BOSS)[4]、時(shí)間序列林(TSF)[5]。但是,這些方法存在一定的局限性,不能很好地利用提取的有效特征。近年來,一些研究者開始關(guān)注集成方法,它優(yōu)于傳統(tǒng)方法。BAYDOGAN等[6]提出了一個(gè)基于特征包表示的時(shí)間序列分類框架,通過概率估計(jì)將位置信息集成到一個(gè)緊湊的碼本中,該方法具有較好的分類效果。BAGNALL等[7]提出將多維度的數(shù)據(jù)空間轉(zhuǎn)換成一維數(shù)據(jù),通過簡單的集成方案來提高精度。雖然這些方法已經(jīng)達(dá)到了較高的精度,但由于計(jì)算復(fù)雜度較高,無法應(yīng)用于大型數(shù)據(jù)集。目前,深度學(xué)習(xí)也被廣泛應(yīng)用于TSC。KOH等[8]提出了一種改進(jìn)網(wǎng)絡(luò)的匹配學(xué)習(xí)算法,它在反向傳播路徑中使用了梯度路由。YU等[9]提出了各種形式的RNN自動(dòng)編碼器,作為時(shí)間序列的特征提取器。上述這些方法取得了良好的效果,但也面臨著高維、復(fù)雜動(dòng)力學(xué)的問題。目前,一種基于模糊認(rèn)知圖的時(shí)間序列的分類方法被提出,該方法表現(xiàn)出了更好的分類性能[10]。
這種方法的主要思想是將時(shí)間序列轉(zhuǎn)換成FCMs的權(quán)重矩陣進(jìn)行表征。FCMs的特征提取方式與以往一些經(jīng)典特征提取方式(經(jīng)驗(yàn)?zāi)B(tài)分解、小波變換等)有所不同,以往的方式在獲取軸承信號(hào)特征分量后,需要進(jìn)一步提取,以去除不相關(guān)和冗余的特征,而FCMs所學(xué)習(xí)的權(quán)重矩陣是專有的,無需進(jìn)一步處理。FCMs具有簡單直觀的知識(shí)表示方式、非線性特性、可解釋性、模糊性等優(yōu)點(diǎn),可以利用因果關(guān)系提高分類效果。然而,文獻(xiàn)[10]中所提出的方法存在局限性,在面對(duì)包含噪聲的數(shù)據(jù)集時(shí),模糊C-mean聚類算法與梯度下降算法相結(jié)合的方式不能有效地提取數(shù)據(jù)特征。因此,提出利用奇異譜分析(Singular Spectrum Analysis,SSA)將原始時(shí)間序列擴(kuò)展到高維空間,并實(shí)現(xiàn)降噪處理;利用凸優(yōu)化算法(Convex Optimization,CVX)快速訓(xùn)練FCMs模型;利用BP神經(jīng)網(wǎng)絡(luò)(Neural Networks,NN)進(jìn)行分類,并將該方法稱為SSA-FCMs-NN。
模糊認(rèn)知圖是神經(jīng)網(wǎng)絡(luò)與模糊邏輯兩者結(jié)合的產(chǎn)物,模糊認(rèn)知圖有和神經(jīng)網(wǎng)絡(luò)相似的拓?fù)浣Y(jié)構(gòu),是一種帶反饋環(huán)的權(quán)重有向圖,它利用概念節(jié)點(diǎn)和權(quán)重邊描述物理系統(tǒng)的特性。如圖1所示,一個(gè)典型的FCMs由概念節(jié)點(diǎn)和節(jié)點(diǎn)之間的有向邊的權(quán)重組成,概念節(jié)點(diǎn)可以表示系統(tǒng)中的行為、實(shí)體、原因等,有向邊權(quán)重代表節(jié)點(diǎn)之間的關(guān)聯(lián)程度。
圖1 一個(gè)典型的FCMs
標(biāo)準(zhǔn)FCMs所蘊(yùn)含的語義可以由一個(gè)4元組U=(C,W,A,f)表示[11],其中:C=[C1,C2,…,Cm]為m個(gè)概念節(jié)點(diǎn)的集合;m為概念節(jié)點(diǎn)的個(gè)數(shù);W為m×m維的權(quán)重矩陣:
其中:Wij為概念節(jié)點(diǎn)Ci和Cj之間的因果關(guān)系的權(quán)值,Wij∈[-1,1],其值的正負(fù)號(hào)與大小分別反映概念節(jié)點(diǎn)間因果關(guān)系的影響方向和程度,Wij>0表示概念節(jié)點(diǎn)Ci增加時(shí)Cj也跟著增加,Wij<0表示概念節(jié)點(diǎn)Ci增加時(shí)Cj反而減小,Wij=0表示概念節(jié)點(diǎn)Ci和Cj之間沒有因果聯(lián)系;Ai(t)為節(jié)點(diǎn)Ci在t時(shí)刻的狀態(tài)值,該值是變動(dòng)的;f為閾值函數(shù),它是一個(gè)非線性單調(diào)遞增的函數(shù),將與目標(biāo)節(jié)點(diǎn)有關(guān)聯(lián)的所有節(jié)點(diǎn)的輸入狀態(tài)值整合到激活函數(shù)的定義域內(nèi)。Cj在t+1時(shí)刻的狀態(tài)值可通過以下公式計(jì)算:
(1)
常用的激活函數(shù)有Sigmoid函數(shù):
(2)
雙曲正切函數(shù):
(3)
其中:Sigmoid函數(shù)將節(jié)點(diǎn)的狀態(tài)值限定在區(qū)間[0,1]; 雙曲正切函數(shù)將節(jié)點(diǎn)的狀態(tài)值限定在區(qū)間[-1,1];ξ>0決定了閾值函數(shù)的陡峭程度。
將軸承故障時(shí)間序列按照預(yù)定規(guī)則進(jìn)行等量分割,產(chǎn)生樣本集,如下所示:
(4)
(5)
f-1[Ai(t+1)]=A(t)Wi
(6)
Yi=ZWi
(7)
FCMs的學(xué)習(xí)問題最終可以轉(zhuǎn)化為約束最小二乘法問題[12]。為求解權(quán)重Wi,目標(biāo)函數(shù)可表示為
(8)
圖2 SSA-FCMs-NN算法流程
使用分類準(zhǔn)確率和科恩的卡帕系數(shù)評(píng)估SSA-FCMs-NN算法的性能。分類準(zhǔn)確率公式如下所示:
(9)
其中:UT為測試樣本的總數(shù);Nerror為分類錯(cuò)誤樣本的數(shù)量。
評(píng)估給定分類器的性能并不是一件簡單的任務(wù)。如果一個(gè)或多個(gè)類別預(yù)測失敗,總體的分類并不能有效地評(píng)價(jià)模型的性能。另一個(gè)常用于多分類器基準(zhǔn)測試的方法是科恩的卡帕系數(shù)。Kappa是分類變量之間一致性的指標(biāo),一般認(rèn)為它比簡單的百分比一致性計(jì)算更可靠,其公式如下:
(10)
其中:p0為評(píng)估者之間相對(duì)觀察到的一致性;pe為偶然條件下的一致性。
在文中,應(yīng)用K-fold cross-validation提高模型的擬合能力,其中K=3。分類準(zhǔn)確率和Kappa的值取的是3次測量值的平均值。由于概念節(jié)點(diǎn)數(shù)、SSA嵌入維數(shù)L的不同和β的值都會(huì)影響最后的輸出結(jié)果,默認(rèn)選取最好的一組結(jié)果。
為驗(yàn)證所提出的SSA-FCMs-NN算法在軸承故障診斷中的有效性,利用廣泛使用的軸承故障數(shù)據(jù)集進(jìn)行對(duì)比實(shí)驗(yàn),利用不同尺寸和功率產(chǎn)生4組實(shí)驗(yàn)數(shù)據(jù)。
數(shù)據(jù)集A、B分別來自0、735 W工作負(fù)荷,采樣頻率為12 kHz驅(qū)動(dòng)端的振動(dòng)信號(hào),包含3種損壞尺寸(0.177 8、0.355 6 、0.533 4 mm)的內(nèi)圈、外圈、滾動(dòng)體的9類故障,以及1個(gè)正?;鶞?zhǔn),一共10類。
數(shù)據(jù)集C:將損壞大小固定為0.355 6 mm,并選擇3種故障類型。每種故障類型有3個(gè)電機(jī)負(fù)載。然后,得到9類方位斷層。一共得到9類采樣頻率為48 kHz驅(qū)動(dòng)端的振動(dòng)信號(hào)。
數(shù)據(jù)集D:將故障類型固定為滾動(dòng)體故障,并調(diào)整損壞大小和電機(jī)負(fù)載。3種載荷(0、735、1 470 W)和3種損壞尺寸(0.177 8、0.355 6 、 0.533 4 mm)組合了9類軸承故障,采樣頻率為48 kHz,采集驅(qū)動(dòng)端的振動(dòng)信號(hào)。
上述的數(shù)據(jù)集A、B有10種方位狀態(tài),數(shù)據(jù)集C、D有9種方位狀態(tài),將數(shù)據(jù)集A、B、C、D等距離切割,其中數(shù)據(jù)集A、B一個(gè)樣本中包含4 060個(gè)時(shí)間節(jié)點(diǎn);C、D一個(gè)樣本中包含8 125個(gè)時(shí)間節(jié)點(diǎn);數(shù)據(jù)集A、B周期為406 r/s,數(shù)據(jù)集C、D周期為1 625 r/s,采用重采樣的方式生成樣本。數(shù)據(jù)集A、B中均包含2 800個(gè)樣本和10個(gè)類別,每個(gè)類別有280個(gè)樣本數(shù);數(shù)據(jù)集C包含2 025個(gè)樣本和9個(gè)類別,每個(gè)類別有225個(gè)樣本;數(shù)據(jù)集D包含1 215個(gè)樣本和9個(gè)類別,每個(gè)類別包含135個(gè)樣本。
3.2.1 SSA分解與時(shí)間成本分析
SSA可以分離時(shí)間序列中的復(fù)雜噪聲,屬于信號(hào)加噪聲模型。圖3所示為通過SSA對(duì)軸承故障數(shù)據(jù)進(jìn)行特征提取的結(jié)果,可知時(shí)間序列的周期、振蕩、趨勢以及噪聲等特征。
圖3 原始波形與重構(gòu)序列
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是依賴隨機(jī)搜索的算法,每個(gè)粒子都會(huì)在多維搜索空間不斷通過跟蹤兩個(gè)“極值”來更新自己,以尋找到最優(yōu)值,但是它具有一定的盲目性,且效率低。為驗(yàn)證CVX算法的時(shí)間成本,對(duì)比PSO和CVX算法的時(shí)間成本,結(jié)果如表1所示。可知:與PSO相比,在同一個(gè)處理階段,CVX算法時(shí)間成本僅為PSO的1/6。
表1 PSO與CVX訓(xùn)練時(shí)間成本
3.2.2 概念選擇與對(duì)比實(shí)驗(yàn)
為評(píng)估所提出的SSA-FCMs-NN算法的性能,分析SSA-FCMs-NN的幾個(gè)參數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響。
如圖4所示,在不同的數(shù)據(jù)集下,正則化參數(shù)所取得的值也不盡相同,正則化參數(shù)的選取是經(jīng)過大量實(shí)驗(yàn)所得出的。在β=0.5和β=0.8取值下,能夠獲得一個(gè)較好的分類精度。還能夠觀察到概念節(jié)點(diǎn)的大小,也會(huì)直接影響結(jié)果。由圖4(b)可知:當(dāng)C=4時(shí),精度最低,認(rèn)為丟棄了的分量包含有效的特征;C=8時(shí),精度最高,隨后開始下降。由圖4(d)可知:隨著概念節(jié)點(diǎn)的增加,精度也隨之增加,在C=6時(shí),達(dá)到了最高值,之后精度在一定范圍內(nèi)振蕩,可以認(rèn)為SSA將原始時(shí)間序列分解為10個(gè)分量,提取前6個(gè)分量,實(shí)現(xiàn)了最大特征的提取和噪聲的濾波。由圖4(c)可知:C=8和C=9時(shí),精度幾乎相同,在考慮計(jì)算成本的情況下選擇較小的概念節(jié)點(diǎn)。圖5所示為Kappa值,它的變化基本與精度的變化趨勢一致。
圖4 SSA-FCMs-NN的精度與概念數(shù)C的關(guān)系
圖5 SSA-FCMs-NN的Kappa值與概念數(shù)C的關(guān)系
選擇近年相關(guān)文獻(xiàn)[14-15],與所提算法得出的實(shí)驗(yàn)結(jié)果進(jìn)行比較,結(jié)果如圖6和表2所示。由圖6可以看出:文獻(xiàn)中所提方法的故障分類準(zhǔn)確都達(dá)到了98%以上,與SSA-FCMs-NN算法得出的實(shí)驗(yàn)結(jié)果所差較小 。由表2可知:淺層模型(OKL、SVM、SBELM、RF)的精度比深度模型(TSTFT-CNN、MC-CNN)低很多,這意味著深度學(xué)習(xí)技術(shù)對(duì)于多種故障類型的診斷具有更好的性能,深度模型可以提取一些潛在的特征;在4個(gè)淺層模型中,OKL比其他3個(gè)模型(SVM、SBELM和RF)具有更好的精度;在數(shù)據(jù)集C中,所提出的SSA-FCMs-NN算法比SDIAE方法分類準(zhǔn)確率高2.51%,在數(shù)據(jù)集D中,精度相差不大。
圖6 SSA-FCMs-NN與其他先進(jìn)算法的比較
表2 SSA-FCMs-NN與其他先進(jìn)算法的比較 單位:%
針對(duì)傳統(tǒng)方法無法有效、快速地處理含噪聲數(shù)據(jù),提出了SSA-FCMs-NN算法。對(duì)比了PSO與CVX算法的訓(xùn)練成本,并分析了SSA的重構(gòu)數(shù)據(jù)以及概念點(diǎn)的選擇;通過對(duì)比近年相關(guān)的文獻(xiàn)說明所提算法的優(yōu)越性。