董曉鑫, 趙榮珍
(蘭州理工大學(xué) 機電工程學(xué)院,蘭州 730050)
機械振動信號能迅速、直接地反映機械設(shè)備運行狀態(tài),已被廣泛應(yīng)用于旋轉(zhuǎn)機械的故障診斷中[1]。為了更加準(zhǔn)確且全面地獲取機械故障狀態(tài)信息,往往需要對多通道的振動信號提取時域、頻域和時頻域的特征信息[2],這一過程不可避免地導(dǎo)致了信息冗余與“維數(shù)災(zāi)難”等問題的出現(xiàn),影響了故障辨識精度和效率。因此,可將高維故障特征集“去粗存精”的降維過程成為影響旋轉(zhuǎn)機械故障診斷的關(guān)鍵。
近年來許多降維方法已被成功應(yīng)用于機械故障診斷中。線性判別分析(linear discriminant analysis, LDA)[3]就是其中之一。該算法基本思想是通過最大化樣本類間散度與類內(nèi)散度的比值,找到最佳鑒別空間,以達到抽取分類信息和壓縮特征空間維數(shù)的效果,在故障辨識中具有一定的優(yōu)勢[4],因此基于LDA的故障診斷方法也相繼被提出。如:文獻[5]將LDA用于原始數(shù)據(jù)的預(yù)處理階段,剔除冗余信息,為后續(xù)的故障分類識別提供了便利;文獻[6]針對LDA忽視樣本局部結(jié)構(gòu)問題,提出了一種將LDA與局部保持投影(locality preserving projections,LPP)[7]相融合的局部邊緣判別投影(locality margin discriminant projection,LMDP)故障數(shù)據(jù)集降維方法,使故障分類效果有一定的提升。但文獻[8]指出真實的高維非線性數(shù)據(jù),尤其是故障類別不同的數(shù)據(jù)往往內(nèi)嵌于不同的流形上,而未對該問題進行有效考慮,導(dǎo)致故障識別精度下降。文獻[9]針對上述單一流形方法的不足,提出了一種多流形內(nèi)蘊結(jié)構(gòu)模型,并將其用于人臉識別,取得了良好的效果,但該模型的訓(xùn)練依賴大量標(biāo)簽樣本,而現(xiàn)實中大量標(biāo)簽樣本獲取存在困難。
因此,針對多流形內(nèi)蘊模型依賴于大量標(biāo)簽樣本訓(xùn)練的問題,本研究擬將其進行改進;并將改進后的內(nèi)蘊模型與樣本局部結(jié)構(gòu)信息嵌入LDA目標(biāo)函數(shù)中,提升其挖掘敏感特征的能力。欲為旋轉(zhuǎn)機械故障的智能診斷提供理論參考依據(jù)。
LDA算法基本思想是:通過最大化樣本類間散度與類內(nèi)散度的比值,進而找到最佳鑒別空間,以達到抽取分類信息和壓縮特征空間維數(shù)的效果。設(shè)高維特征集X=[x1,x2,…,xn]∈Rm×n,它由k個類別{X1,X2,…,Xk}組成,每類有c個樣本。根據(jù)文獻[10],LDA算法的類間散度Sb、類內(nèi)散度Sw可分別表示為
(1)
(2)
LDA算法的目標(biāo)函數(shù)J為
(3)
式中,g為待求解的降維投影矩陣。
多流形內(nèi)蘊模型的基本思想是:既然數(shù)據(jù)不是散亂分布于高維空間,而是聚集在幾個低維流形附近,那么這些數(shù)據(jù)應(yīng)該具有某些共性成分使它們能夠聚合,又有某些差異使它們能相互區(qū)分。該模型將通過n個樣本點張成一個不損失原始拓?fù)浣Y(jié)構(gòu)特征的子空間Ω,可表示為
Ω=span{x1-μ,x2-μ,…,xn-μ}
(4)
式中,μ為所有樣本的均值。
xi=pxi+(I-p)xi
(5)
(6)
(7)
LDA算法框架利于故障分類,卻忽略樣本多流形與局部結(jié)構(gòu)信息;內(nèi)蘊模型雖然充分考慮多流形信息卻受限于標(biāo)簽樣本的數(shù)量。因此,若能將內(nèi)蘊模型進行改進并將其與樣本局部結(jié)構(gòu)信息嵌入LDA算法框架中,將能達到高維故障特征集“去粗存精”的效果。
多流形內(nèi)蘊模型的準(zhǔn)確建立依賴于大量標(biāo)簽樣本的訓(xùn)練,若標(biāo)簽樣本較少則存在學(xué)習(xí)能力不強的問題。對此,本研究擬對多流形內(nèi)蘊模型進行強化處理,以提高該模型的學(xué)習(xí)能力。
LDA算法在建立式(1)、式(2)的類間、類內(nèi)散度矩陣時忽略了樣本數(shù)據(jù)的多流形結(jié)構(gòu)信息與局部結(jié)構(gòu)信息,導(dǎo)致故障分類困難。針對此問題本研究欲將強化后的多流形內(nèi)蘊模型與樣本局部相似度函數(shù)融入LDA散度矩陣中,進而保留更多利于分類的判別信息以提升故障辨識精度。
(8)
(9)
(10)
Wm為第m類樣本內(nèi)蘊非共性成分的相似度矩陣,其元素為
(11)
為使算法更利于故障分類,本研究依據(jù)最大化廣義瑞利商思想構(gòu)建目標(biāo)函數(shù)如式(12)所示
(12)
(13)
利用拉格朗日乘子法,式(13)可等價為
(14)
令?L/?g=0,式(14)可轉(zhuǎn)化為式(15)的廣義特征值求解問題
(15)
將特征值從大到小排序,取前d個特征值對應(yīng)的特征向量組成投影矩陣G=[g1,g2,…,gd]。
融合多流形強化內(nèi)蘊模型與局部相似度矩陣的強化內(nèi)蘊局部保持判別分析(strengthened intrinsic local preserving discriminant analysis, SILPDA)算法具體實現(xiàn)步驟如下:
當(dāng)下的學(xué)生習(xí)慣了移動終端的使用,偏愛碎片化閱讀。教師可抓住這一契機,讓學(xué)生的手機發(fā)揮正面作用,為己所用。針對易造成課堂進度差異的難點問題,可事先準(zhǔn)備好微視頻,課后發(fā)布在班級群或教學(xué)平臺上,供課上沒完全弄懂的學(xué)生消化吸收。這里的微視頻在有條件有能力的情況下最好自己設(shè)計錄制,可與自身的課堂教學(xué)完全同步,條件有限時也可將網(wǎng)上過長的講解視頻剪輯成幾小段,將對應(yīng)片段分享給學(xué)生。第二次上課時進行微視頻難點的抽測,督促第三層次的學(xué)生課后通過微視頻及時弄懂難點的同時,也起到再次回顧難點的作用。
輸入原始特征數(shù)據(jù)集X,類間、類內(nèi)近鄰個數(shù)k1,k2,強化內(nèi)蘊共性、非共性指數(shù)α,β,目標(biāo)維數(shù)d;
輸出投影矩陣G,低維特征集Y。
步驟1根據(jù)式(7)計算同類內(nèi)蘊共性矩陣p-pi、同類非共性矩陣pi,并依據(jù)具體試驗數(shù)據(jù)確定最優(yōu)的強化指數(shù)α,β與目標(biāo)維數(shù)d;
步驟3根據(jù)式(15)對目標(biāo)函數(shù)進行廣義特征值分解,取前d個最大的特征值對應(yīng)的特征向量組成投影矩陣G;
步驟4由Y=GTX計算樣本在低維空間中的投影。
將本研究提出的SILPDA降維算法用于旋轉(zhuǎn)機械的故障診斷,具體的診斷流程如圖1所示。
圖1 故障診斷流程圖Fig.1 Procedure of fault diagnosis
具體的故障診斷實施步驟如下:
步驟2將X歸一化處理后,按比例劃分訓(xùn)練集trainX與測試集testX;
步驟3設(shè)定SILPDA算法參數(shù),如類間、類內(nèi)近鄰個數(shù)k1,k2、內(nèi)蘊強化指數(shù)α,β及目標(biāo)維數(shù)d,構(gòu)建目標(biāo)函數(shù),將trainX輸入算法進行訓(xùn)練得到投影矩陣G;
步驟4根據(jù)Y=GTX對trainX和testX分別進行映射,得到低維特征集trainY與testY;
步驟5將投影后的trainY與testY輸入K近鄰分類器進行故障分類,并輸出辨識結(jié)果。
為驗證SILPDA算法的有效性與可行性,本研究擬采用如圖2所示的轉(zhuǎn)子綜合故障模擬平臺進行分析。本試驗用電渦流傳感器共采集6個通道的振動信號,包括兩個軸承座處的徑向(Y)振動信號、兩個質(zhì)量盤處的徑向(Y,X)振動信號。在采樣頻率為10 kHz,轉(zhuǎn)速為3 000 r/min的狀態(tài)下,分別模擬轉(zhuǎn)子不對中、氣流擾動、質(zhì)量不平衡、動靜碰磨、軸承座松動、正常6種不同狀態(tài)。將每種狀態(tài)進行采樣并劃分為100組樣本,按照60∶40構(gòu)建訓(xùn)練與測試數(shù)據(jù)集,再對每個通道的振動信號提取如表1所示的38個特征參數(shù),總共得到38×6=228個特征。
圖2 轉(zhuǎn)子試驗臺Fig.2 Rotor test bench
表1 特征參數(shù)Tab.1 Characteristic parameters
本研究中需要設(shè)定的參數(shù)有:約簡的目標(biāo)維數(shù)d;SILPDA算法式(8)中的近鄰數(shù)k1、強化指數(shù)α;式(10)中的近鄰數(shù)k2、強化指數(shù)β。通常將目標(biāo)維數(shù)d設(shè)定為故障的類別數(shù)減一,即d=6-1=5。近鄰數(shù)k1,k2的取值范圍分別為1≤k1≤6,6≤k2≤60[12],經(jīng)反復(fù)試驗,本研究將k1,k2分別取為3和10。強化指數(shù)α與β的設(shè)定,需要驗證不同取值對故障識別率的影響,初步擬定1≤α,β≤10,并且將取值間隔設(shè)為1。識別率η隨參數(shù)α與β的變化情況,如圖3所示。觀察圖3可知,故障識別率η先快速增大后逐漸趨于穩(wěn)定。另外,當(dāng)α=1,β=1時,模型退化為原始內(nèi)蘊模型,其準(zhǔn)確率僅為0.44;為提升降維效果的同時保證識別準(zhǔn)確率,選取參數(shù)為α=2與β=1。
圖3 參數(shù)α與β對識別準(zhǔn)確率的影響Fig.3 Parameter α and β impact on recognition accuracy
為評價低維測試集各個故障類別間的可分性,根據(jù)文獻[13]引入δ=Sb/Sw評價指標(biāo)來量化降維效果
(16)
(17)
(18)
為驗證SILPDA算法的降維效果,本研究選擇LPP,LDA,LMDP等算法進行對比分析。分別對降維后的測試數(shù)據(jù)集選取前3個主元進行可視化表示,如圖4所示;同時本研究依據(jù)4.3節(jié)計算了各算法的降維可分性指標(biāo),結(jié)果如表2所示;最后為進一步研究各降維算法對故障辨識精度的影響,本節(jié)將各算法降維后的敏感特征子集輸入K近鄰分類器中進行故障分類辨識,辨識結(jié)果如表3所示。
注:“◇”、“○”、“☆”、“?”、“?”、“□”分別代表不對中、不平衡、碰磨、氣流擾動、松動、正常。圖4 三維可視化Fig.4 3D visualization
表2 可分性指標(biāo)Tab.2 Separability index
表3 不同狀態(tài)識別率Tab.3 Recognition rate of different states 單位:%
觀察圖4,并結(jié)合表2、表3綜合分析可知,LPP算法降維效果較差,同類故障樣本較為分散,不同故障的樣本可分性較弱,其中氣流擾動樣本與軸承座松動樣本產(chǎn)生了嚴(yán)重的混疊現(xiàn)象,導(dǎo)致故障識別準(zhǔn)確率在4個算法中最低,為81.3%。原因在于該算法屬于無監(jiān)督算法,未能有效考慮類別判別信息;LDA算法與LMDP算法的降維效果優(yōu)于LPP算法,因為二者基于最大化瑞利商值構(gòu)建目標(biāo)函數(shù),在故障的分類任務(wù)中有一定優(yōu)勢,且LMDP算法考慮了樣本間相似度度量,使同類間樣本聚集效果好于LDA算法,但二者也出現(xiàn)了不同程度的異類樣本混疊現(xiàn)象,原因在于忽略了不同故障分布于不同流形上的本質(zhì)問題;相較于上述算法,SILPDA算法的故障樣本可分性最好,同類樣本聚集成團,不同故障分類清晰,沒有出現(xiàn)異類樣本的混疊現(xiàn)象,此外該算法的識別準(zhǔn)確率與可分性指標(biāo)也最高。這得益于在構(gòu)建目標(biāo)函數(shù)時充分考慮了樣本局部幾何結(jié)構(gòu)與多流形結(jié)構(gòu)的多種判別信息,挖掘出具有強判別能力的敏感特征子集,使不同故障之間的邊界更加清晰明了,有效降低了故障的分類難度。
為驗證所建立SILPDA算法的穩(wěn)定性,本研究將訓(xùn)練樣本與測試樣本的數(shù)量分別按照10/90,20/80,30/70,40/60,50/50,60/40,70/30,80/20,90/10進行劃分。將提取后的低維特征子集放入K近鄰分類器中進行分類識別,各算法準(zhǔn)確率如圖5所示。觀察圖5可知:隨著訓(xùn)練樣本比例的上升,各算法的識別準(zhǔn)確率呈上升趨勢;LPP算法與LDA算法先后出現(xiàn)了較大的波動;LMDP算法雖然表現(xiàn)得較為穩(wěn)定但在訓(xùn)練樣本較少時,準(zhǔn)確率下降明顯;相較于上述3種算法,SILPDA在保證較高準(zhǔn)確率的同時,算法的波動也最小,整體表現(xiàn)出良好的穩(wěn)定性。
圖5 不同比例對應(yīng)的識別準(zhǔn)確率Fig.5 Recognition accuracy corresponding to different proportions
因旋轉(zhuǎn)機械在真實工況中轉(zhuǎn)速存在一定的波動,故通過速度波動試驗驗證本研究建立的SILPDA算法在速度波動條件下對故障辨識準(zhǔn)確率的影響。本研究在3種轉(zhuǎn)速(2 600 r/min,2 800 r/min和3 000 r/min)下的每種故障中選取20組數(shù)據(jù)(共60組),混合后作為訓(xùn)練樣本,另取各轉(zhuǎn)速下每類故障中不重復(fù)的 20 組數(shù)據(jù)(共60組),混合后作為測試樣本,以模擬真實工況條件下的速度波動情況,并將各算法降維后的特征子集放入K近鄰分類器中進行故障辨識結(jié)果,如表4所示。分析表4可知,LPP算法準(zhǔn)確率最低,LDA算法與LMDP算法準(zhǔn)確率相近且高于LPP算法,本研究提出的SILPDA算法故障識別準(zhǔn)確率最高。說明了本算法對存在速度波動的工況適應(yīng)能力更強。
表4 速度波動情況下識別準(zhǔn)確率Tab.4 Recognition accuracy under speed fluctuation 單位:%
為驗證本研究提出的SILPDA算法的有效性與通用性,選取趙孝禮等研究中的一套雙跨轉(zhuǎn)子試驗臺作為本節(jié)的研究對象,如圖6所示。該試驗臺選用12個電渦流傳感器測取轉(zhuǎn)子6個關(guān)鍵界面的徑向(X,Y)振動信號。在采樣頻率為5 kHz,轉(zhuǎn)速為3 000 r/min的狀態(tài)下,分別模擬質(zhì)量不平衡、轉(zhuǎn)子不對中、軸承座松動、動靜碰磨、正常5種不同狀態(tài)。采樣每種狀態(tài)的100組樣本,按照60∶40構(gòu)建訓(xùn)練與測試數(shù)據(jù)集,再對每個通道的振動信號樣本按表1提取38個特征參數(shù),總共得到38×12=456個特征參數(shù)。
圖6 雙跨轉(zhuǎn)子試驗臺Fig.6 Double span rotor test bench
算法目標(biāo)函數(shù)中參數(shù)的設(shè)定需要根據(jù)具體的試驗數(shù)據(jù)確立。按照4.2節(jié)的參數(shù)設(shè)定說明,將本試驗參數(shù)設(shè)定為:近鄰參數(shù)k1=3,k2=10;內(nèi)蘊強化指數(shù)α=5,β=2;目標(biāo)維數(shù)d=4。
同樣選擇LPP,LDA,LMDP 3個算法作為對比。將提取的原始高維特征集通過各算法進行降維,并將降維后的低維特征集選取前3個主元進行可視化繪制,結(jié)果如圖7所示。此外,為使降維效果描述得更加客觀與準(zhǔn)確,本研究根據(jù)4.3節(jié)計算了各算法的降維可分性指標(biāo),如表5所示。且將各算法降維后的敏感特征子集輸入K近鄰分類器中進行故障辨識,結(jié)果如表6所示。
注:“◇”、“○”、“☆”、 “?”、“□”分別代表不對中、不平衡、碰磨、松動、正常。圖7 不同算法的降維效果Fig.7 Dimensionality reduction effects of different algorithms
表5 可分性指標(biāo)Tab.5 Separability index
表6 不同故障識別率Tab.6 Different fault identification rates 單位:%
觀察圖7并結(jié)合表5、表6綜合分析可知,經(jīng)本研究提出的SILPDA算法降維后的低維特征子集,可視化效果良好,沒有出現(xiàn)LPP,LDA,LMDP等算法中的樣本混疊現(xiàn)象,且分類指標(biāo)優(yōu)異,使同類樣本聚集較好而異類樣本實現(xiàn)了完全分離。進一步說明了本研究的SILPDA算法具有良好的降維能力與通用性。
為解決故障特征集維數(shù)過高導(dǎo)致故障分類效果不佳的現(xiàn)狀,提出了一種強化內(nèi)蘊局部保持判別分析的故障特征集降維方法。在傳統(tǒng)LDA的基礎(chǔ)上融合強化的多流形內(nèi)蘊判別信息,并引入樣本局部幾何信息,使約簡后的低維特征包含更多的分類信息,進而提升故障辨識精度。最后由轉(zhuǎn)子試驗平臺的故障特征數(shù)據(jù)集對該算法進行了驗證。結(jié)果表明,該算法相較于LPP,LDA,LMDP等算法不但在降維方面具有一定的優(yōu)勢,而且也更為穩(wěn)定可靠,有效提高了故障的辨識精度,可為旋轉(zhuǎn)機械智能故障診斷提供理論參考依據(jù)。