黃磊,馬圣
(1.江蘇航空職業(yè)技術(shù)學(xué)院 航空工程學(xué)院,江蘇 鎮(zhèn)江 212134;2.成都芯米科技有限公司 技術(shù)研發(fā)部,成都 610213)
軸承在旋轉(zhuǎn)機(jī)械中承載著較強(qiáng)的工作載荷,其性能好壞直接決定著旋轉(zhuǎn)機(jī)械的動(dòng)力性能。隨著對轉(zhuǎn)子動(dòng)力學(xué)的深入研究,振動(dòng)信號能夠用于揭示設(shè)備的健康狀況,但實(shí)際工程中的軸承振動(dòng)信號往往摻雜著不同部件振動(dòng)帶來的噪聲而呈現(xiàn)為非平穩(wěn)的周期信號,直接提取振動(dòng)信號的故障特征難度較大。
奇異譜分析(Singular Spectrum Analysis,SSA)是一種基于主成分分析的非參數(shù)估計(jì)方法,常用于處理包含噪聲的非平穩(wěn)信號,其主要依據(jù)軌跡矩陣的主成分進(jìn)行奇異分解、特征重組和重構(gòu),這種選擇方式對其性能影響極大[1-3]。因此,文獻(xiàn)[4]提出自適應(yīng)的信號處理方法,實(shí)現(xiàn)信號從高頻到低頻的重構(gòu);文獻(xiàn)[5]將分解后的分量進(jìn)行形態(tài)學(xué)解調(diào)以避免端點(diǎn)效應(yīng)并用于滾動(dòng)軸承故障診斷。
另外,振動(dòng)信號分析結(jié)合人工智能診斷方法成為主流,如支持向量機(jī)[7-9]、學(xué)習(xí)機(jī)[10]、人工神經(jīng)網(wǎng)絡(luò)[11]等被用于軸承故障診斷。但部分神經(jīng)網(wǎng)絡(luò)需要大量的訓(xùn)練樣本,而支持向量機(jī)(Support Vector Machine,SVM)能夠通過少量樣本解決非線性高維空間問題,推廣性較強(qiáng)。罰參數(shù)和核參數(shù)的取值影響著SVM的性能[12],粒子群算法(Particle Swarm Optimization,PSO)相比遺傳算法具有操作簡單,尋優(yōu)速度快等特點(diǎn),但易陷入局部極小值等問題限制了PSO的擴(kuò)展性[13]。
綜上所述,引入信息增益比(Information Gain Ratio,IGR)選擇SSA分解后的分量信號進(jìn)行重構(gòu)去噪,采用動(dòng)態(tài)慣性權(quán)重并引入梯度信息改進(jìn)PSO,最終使用基于信息增益比的奇異譜分析對振動(dòng)信號降噪,并結(jié)合改進(jìn)PSO(IPSO)優(yōu)化的SVM對滾動(dòng)軸承進(jìn)行故障診斷。
奇異譜分析屬于一種廣義功率譜分析,基本思想為:將一定長度的一維時(shí)間序列按照給定的嵌入窗口長度和時(shí)滯構(gòu)造成軌跡矩陣,用主成分分析方法對軌跡矩陣中的時(shí)間序列進(jìn)行分析,得到軌跡矩陣的特征向量和特征值,隨后選用其中部分特征向量和時(shí)間系數(shù)實(shí)現(xiàn)信號的重構(gòu)[14]。
使用奇異譜對時(shí)間序列x(t)進(jìn)行分解重構(gòu)時(shí),選取的Ri分量決定重構(gòu)信號的準(zhǔn)確性。一般通過比較Ri分量所構(gòu)成子矩陣的貢獻(xiàn)率與閾值η(0.85~0.95)之間的關(guān)系進(jìn)行選擇[1]。為避免Ri分量增多而引入一些差異性較小的分量,不再考慮Ri分量所構(gòu)成子矩陣的貢獻(xiàn)率,而是直接考慮軌跡矩陣X的特征值的信息增益比,構(gòu)造基于信息增益比的奇異譜分析(IGRSSA)。
為避免求解軌跡矩陣X的特征值時(shí)部分特征值的數(shù)量級存在明顯差異,對所有特征值進(jìn)行歸一化處理,即
(1)
第i個(gè)特征值的熵值pi為
(2)
則第i個(gè)特征值熵值pi的增益比gi為
(3)
在選取分量Ri時(shí),選擇特征值信息增益比大于0.01的前k個(gè)分量進(jìn)行信號重構(gòu)。
仿真信號如(4)式所示,沖擊頻率為250 Hz,信號采樣頻率為10 240 Hz,采集0.4 s共4 096個(gè)采樣點(diǎn),附帶均值為0.5的隨機(jī)噪聲r(shí)(t)。用IGRSSA與SSA對仿真信號進(jìn)行降噪分析,并結(jié)合(5)式的擬合優(yōu)度函數(shù)計(jì)算2種方法對原信號的逼近程度。IGRSSA中熵值增益比閾值設(shè)定為0.01,SSA中子矩陣貢獻(xiàn)率閾值設(shè)為0.85,IGRSSA與SSA的窗口長度均為1 333。
y(t)=y1(t)+0.5r(t)=
e-15tsin(2π×250t)+0.5r(t),
(4)
(5)
原始信號、重構(gòu)信號的時(shí)域波形分別如圖1、圖2所示,由圖可知:仿真信號在噪聲干擾下發(fā)生紊亂,IGRSSA與SSA均能有效去除噪聲,但I(xiàn)GRSSA去噪效果相比SSA好很多,尤其在采樣點(diǎn)的后段。為進(jìn)一步分析兩者的降噪程度,按照(5)式計(jì)算IGRSSA與SSA重構(gòu)信號的擬合優(yōu)度,其中IGRSSA的擬合優(yōu)度達(dá)到0.996 7,而SSA的擬合優(yōu)度僅有0.913 3,說明IGRSSA相比SSA能夠更好的對信號進(jìn)行重構(gòu)并抑制噪聲。
圖1 仿真信號的時(shí)域波形
圖2 重構(gòu)信號的時(shí)域波形
支持向量機(jī)能夠?qū)⒌途S線性不可分問題通過映射到高維空間進(jìn)行線性可分,且在小樣本下能夠表現(xiàn)出較好的性能,因而被廣泛應(yīng)用于模式識別等領(lǐng)域[12]。
支持向量機(jī)屬于數(shù)據(jù)驅(qū)動(dòng)的分類診斷模型,通常針對某類故障構(gòu)建樣本數(shù)據(jù)時(shí),提取的特征維度較高容易造成維度災(zāi)難且難以避免特征之間存在的共線性,反而容易導(dǎo)致診斷模型效果不佳。平均影響值(Mean Impact Value, MIV)用于評價(jià)自變量對因變量的影響程度,是神經(jīng)網(wǎng)絡(luò)中評價(jià)變量相關(guān)性較好的指標(biāo),其符號代表相關(guān)方向,絕對值大小代表自變量影響的重要程度[13]。假設(shè)網(wǎng)絡(luò)的訓(xùn)練樣本為P,當(dāng)網(wǎng)絡(luò)訓(xùn)練終止后,各自變量計(jì)算步驟如下[15]:
1)將訓(xùn)練樣本P中的每個(gè)自變量在其原值基礎(chǔ)上加、減10%,構(gòu)成新的訓(xùn)練樣本P1和P2。
2)用訓(xùn)練好的網(wǎng)絡(luò)對P1和P2進(jìn)行仿真,得到仿真結(jié)果Y1和Y2。
3)令YIV=Y1-Y2并按照觀測列數(shù)平均,得到自變量對因變量的MIV值。
4)重復(fù)第1—第3步,計(jì)算各自變量的MIV值,并根據(jù)MIV的絕對值大小篩選自變量。
經(jīng)典PSO算法簡單,收斂速度快,但容易陷入局部極值而導(dǎo)致趨同效應(yīng)[16],且搜索移動(dòng)時(shí)受到慣性行為影響而導(dǎo)致搜索精度較低。因此,對經(jīng)典PSO進(jìn)行改進(jìn)以在小樣本數(shù)據(jù)下取得較好的尋優(yōu)結(jié)果。
考慮到慣性權(quán)值ω決定粒子在搜索空間的搜索能力,采用動(dòng)態(tài)慣性權(quán)重,即
(6)
式中:ωmax,ωmin分別為最大、最小慣性權(quán)值;k為粒子當(dāng)前迭代次數(shù);G為粒子最大迭代次數(shù)。動(dòng)態(tài)慣性權(quán)重能夠保證在迭代次較小時(shí)權(quán)值較大,全局搜索能力強(qiáng);迭代次數(shù)增加時(shí)權(quán)值減小,局部搜索能力強(qiáng)。
為使粒子能夠較快的向最優(yōu)目標(biāo)方向進(jìn)行搜索,引入梯度信息[17]優(yōu)化SVM的罰參數(shù)c和核參數(shù)g,定義PSO優(yōu)化SVM的適應(yīng)度函數(shù)G(x)為
,(7)
式中:f(x|c,g),fo(x|c,g)分別為SVM在罰參數(shù)c、核參數(shù)g下的實(shí)際輸出和期望輸出;n為校驗(yàn)集樣本數(shù)量。
假設(shè)G(X)對于變量X(X=[c,g])的偏導(dǎo)數(shù)都存在,則
(8)
若目標(biāo)中各變量為線性時(shí),G(X)對于變量X的導(dǎo)數(shù)可表示為
(9)
(10)
式中:x(k|t+1),x(k|t)分別為t+1和t時(shí)刻個(gè)體向量中第k個(gè)變量的位置;V(t)為粒子在t時(shí)刻的速度。
如圖3所示,IPSO-SVM利用IPSO種群中的個(gè)體作為SVM的罰參數(shù)c和核參數(shù)g,校驗(yàn)集誤差作為適應(yīng)度函數(shù),按照IPSO的步驟對粒子進(jìn)行尋優(yōu)操作,找到最優(yōu)粒子位置作為SVM的罰參數(shù)c和核參數(shù)g。
圖3 IPSO-SVM流程圖
IPSO-SVM算法步驟為:
1)將SVM的罰參數(shù)c和核參數(shù)g作為待優(yōu)化變量,進(jìn)行實(shí)數(shù)編碼。
2)隨機(jī)初始化種群,種群中的每個(gè)個(gè)體向量表示SVM的一組可行解。
3)按照(7)式計(jì)算種群的適應(yīng)度值,找到個(gè)體最優(yōu)位置。
4)計(jì)算個(gè)體向量梯度并排序,按照(10)式更新粒子位置,計(jì)算適應(yīng)度值并實(shí)時(shí)更新最優(yōu)個(gè)體的位置。
5)判斷是否滿足終止條件,若不滿足則重復(fù)第3—第4步;若滿足則輸出最優(yōu)個(gè)體,并將其賦值給SVM的罰參數(shù)c和核參數(shù)g。
滾動(dòng)軸承試驗(yàn)數(shù)據(jù)來源于美國西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心[18],電動(dòng)機(jī)轉(zhuǎn)速1 796 r/min,信號采樣頻率12 kHz,每周期傳感器采樣1 024個(gè)點(diǎn)工況下,6205-2RS深溝球軸承的故障數(shù)據(jù)見表1。
軸承振動(dòng)信號某一周期內(nèi)的時(shí)域信號、經(jīng)IGRSSA算法處理后得到的重構(gòu)信號如圖4所示,經(jīng)過IGRSSA處理后,不同故障類型軸承振動(dòng)信號的幅值均有減小,且重構(gòu)信號的趨勢更為明顯。
圖4 不同故障類型軸承振動(dòng)信號及IGRSSA重構(gòu)信號
時(shí)域分析法在處理過程能夠減少信號的畸變或損失[10],因此提取平均值、峰峰值、均方根值、標(biāo)準(zhǔn)差、偏度、峭度、波峰因子和變異系數(shù)等時(shí)域特征參數(shù),每類故障樣本選擇100組,合計(jì)300組數(shù)據(jù),提取的部分時(shí)域數(shù)據(jù)見表2。
表2 軸承振動(dòng)信號的時(shí)域特征參數(shù)
考慮到變量之間耦合性等因素對自變量帶來的影響,使用MIV方法對時(shí)域特征參數(shù)進(jìn)行篩選。計(jì)算各個(gè)參數(shù)在正負(fù)10%增量時(shí)的MIV值,其負(fù)號代表相關(guān)的方向,絕對值大小表示影響程度大小。重復(fù)6次計(jì)算得到的MIV值見表3,由表可知:均值、標(biāo)準(zhǔn)差、波峰因子對仿真結(jié)果影響程度較小,可以考慮將其去除,選擇峰峰值、均方根值、偏度、峭度和變異系數(shù)建立故障診斷模型。經(jīng)過MIV篩選后的部分試驗(yàn)數(shù)據(jù)見表4。
表3 各時(shí)域參數(shù)的平均影響值
表4 最優(yōu)時(shí)域特征參數(shù)
按3∶1∶1的比例將數(shù)據(jù)集分為訓(xùn)練集、校驗(yàn)集、測試集,各樣本集的數(shù)據(jù)隨機(jī)選擇,互不重復(fù)。為驗(yàn)證IPSO-SVM方法在滾動(dòng)軸承故障診斷中的有效性,選擇常用的BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、SVM、交叉驗(yàn)證優(yōu)化的SVM(GridSearchSVM)、遺傳算法優(yōu)化的SVM(GA-SVM)、粒子群優(yōu)化的SVM(PSO-SVM)進(jìn)行對比分析。
3.3.1 對比算法的參數(shù)設(shè)置
BP神經(jīng)網(wǎng)絡(luò)絡(luò)采用5-11-1的網(wǎng)絡(luò)結(jié)構(gòu),即輸入層5個(gè)神經(jīng)元,隱含層11個(gè)神經(jīng)元,輸出層1個(gè)神經(jīng)元,權(quán)值和閾值隨機(jī)產(chǎn)生,隱含層采用S型正切函數(shù)tansig,輸出層采用S型對數(shù)函數(shù)logsig,網(wǎng)絡(luò)訓(xùn)練函數(shù)為trainlm;RBF神經(jīng)網(wǎng)絡(luò)中散布系數(shù)spread=0.5;SVM中的罰參數(shù)和核參數(shù)隨機(jī)產(chǎn)生,文中記為Rand-SVM;GridSearchSVM中交叉驗(yàn)證樣本為20;GA-SVM中,最大迭代步數(shù)為100、種群大小為30、選擇交叉概率為0.6、變異概率為0.05、優(yōu)化參數(shù)為2;PSO-SVM和IPSO-SVM中,c1=c2=1.5、迭代步數(shù)為100、粒子群大小為30、最大權(quán)重為0.9、最小權(quán)重為0.4、粒子最大搜索速度為10、最小搜索速度為-10、優(yōu)化參數(shù)為2。注意:對比算法中SVM的罰參數(shù)和核參數(shù)的范圍分別為[0.1,100]和[0.01,100]。
3.3.2 平均診斷準(zhǔn)確率
在相同訓(xùn)練集和測試集的基礎(chǔ)上,使用上述算法對滾動(dòng)軸承故障數(shù)據(jù)進(jìn)行診斷,結(jié)果見表5。其中,BP神經(jīng)網(wǎng)絡(luò)隨機(jī)產(chǎn)生初始權(quán)值和閾值的問題導(dǎo)致每次試驗(yàn)結(jié)果不一致,表中數(shù)據(jù)為BP神經(jīng)網(wǎng)絡(luò)重復(fù)試驗(yàn)30次后的平均值;Rand-SVM的結(jié)果為隨機(jī)試驗(yàn)10次后選擇的最優(yōu)值;GridSearchSVM,GA-SVM,PSO-SVM和IPSO-SVM均為某一次的診斷結(jié)果。
表5 不同算法的診斷結(jié)果
由表5可知:BP和RBF診斷方法由于參數(shù)設(shè)置問題導(dǎo)致診斷效果較差;選擇Sigmoid核函數(shù)時(shí)所有的SVM診斷效果都較差;但SVM在選擇RBF核函數(shù)和多項(xiàng)式核函數(shù)時(shí)均能達(dá)到很好的診斷效果,核函數(shù)為多項(xiàng)式時(shí)GridSearchSVM診斷效果最好(98.33%),核函數(shù)為RBF時(shí)IPSO-SVM的效果最好(98.33%)且其校驗(yàn)集誤差相對較低;由最優(yōu)罰參數(shù)和核參數(shù)可知,使得SVM達(dá)到較佳診斷效果的參數(shù)并不唯一;優(yōu)化SVM中涉及到重復(fù)運(yùn)算過程,因此診斷時(shí)間相對較長,但I(xiàn)PSO-SVM的診斷時(shí)間相對PSO-SVM和GA-SVM略短幾秒。
3.3.3 算法的穩(wěn)定性及收斂性
比較IPSO-SVM,PSO-SVM和GA-SVM對樣本的適應(yīng)性,采用對樣本進(jìn)行有放回的隨機(jī)抽樣,樣本比例分配同3.3節(jié)但每次被選擇為訓(xùn)練、校驗(yàn)、測試的樣本數(shù)據(jù)不同。在核函數(shù)為RBF的前提下重復(fù)試驗(yàn)30次,診斷結(jié)果如圖5所示,由圖可知:IPSO-SVM,PSO-SVM,GA-SVM算法均存在不同程度的波動(dòng),其最大波動(dòng)幅度分別為5.0%,6.3%,8.2%,平均準(zhǔn)確率分別為97.72%,97.17%,96.50%;IPSO-SVM和PSO-SVM的平均誤差收斂值均比GA-SVM效果好,但GA-SVM相比PSO-SVM收斂更早,IPSO-SVM平均收斂誤差最小且其收斂速度最快。綜上分析可知,IPSO-SVM的穩(wěn)定性、平均診斷準(zhǔn)確率和誤差收斂效果均比PSO-SVM和GA-SVM要好。
引入信息增益比選擇有用分量進(jìn)行重構(gòu),并與基于子矩陣貢獻(xiàn)率的奇異譜對比分析,從仿真信號重構(gòu)趨勢圖、重構(gòu)信號與原信號的擬合優(yōu)度而言,IGRSSA的去噪重構(gòu)性能比SSA的效果明顯;采用動(dòng)態(tài)慣性權(quán)值并引入梯度信息調(diào)整粒子搜索趨勢也顯著提高了PSO的性能。使用IGRSSA對軸承故障信號降噪處理并提取時(shí)域信號,采用MIV法篩選出最優(yōu)時(shí)域特征參量作為后續(xù)故障診斷的數(shù)據(jù)集,與其他算法的對比分析表明,IPSO-SVM在選擇RBF核函數(shù)時(shí)效果最好,波動(dòng)性較小,誤差收斂值小,收斂速度快,平均診斷準(zhǔn)確較高,更適合滾動(dòng)軸承的故障診斷。
圖5 不同算法的隨機(jī)抽樣結(jié)果