常書源, 趙榮珍, 石明寬
(蘭州理工大學(xué) 機(jī)電工程學(xué)院,蘭州 730050)
在對(duì)轉(zhuǎn)子進(jìn)行故障診斷時(shí),通常需要從時(shí)域、頻域和時(shí)頻域等多方面提取故障特征,以盡可能多地獲取故障信息[1]。但這種多域融合的故障特征集往往不可避免地混雜了大量的冗余信息,這無(wú)疑增加了后續(xù)算法故障識(shí)別的難度,甚至?xí)档退惴ǖ臏?zhǔn)確性。因此,需用降維方法對(duì)高維特征集進(jìn)行有效的二次特征提取,獲取分類精度高的低維敏感特征矢量[2]。
近年來(lái),在數(shù)據(jù)科學(xué)領(lǐng)域中,關(guān)于降維的問(wèn)題已取得一系列的研究進(jìn)展,如主成分分析[3](principal component analysis, PCA),局部保持投影[4](locality preserving projection, LPP),半監(jiān)督鄰域自適應(yīng)正交局部保持投影[5](semi-supervised neighborhood adaptive orthogonal locality preserving projections, SSNA-OLPP),半監(jiān)督鄰域自適應(yīng)線性局部切空間排列[6](semi-supervised neighborhood adaptive linear local tangent space alignment, SSNA-LLTSA),正交判別投影[7](orthogonal discriminant projection, ODP)等。其中,PCA在最小均方意義下尋找數(shù)據(jù)的最優(yōu)投影方向。LPP解決了PCA等傳統(tǒng)降維方法無(wú)法保持?jǐn)?shù)據(jù)非線性流形的缺點(diǎn),但只注重保持?jǐn)?shù)據(jù)的局部結(jié)構(gòu),對(duì)分類問(wèn)題無(wú)指導(dǎo)意義。SSNA-OLPP與SSNA-LLTSA分別為L(zhǎng)PP和LLTSA的半監(jiān)督改進(jìn)方法,能夠利用少量的先驗(yàn)信息對(duì)后續(xù)分類問(wèn)題起指導(dǎo)作用,但這兩種方法都只關(guān)注數(shù)據(jù)的局部信息,忽略了全局信息,由此可能導(dǎo)致數(shù)據(jù)結(jié)構(gòu)扭曲。ODP是一種新型監(jiān)督式降維方法,其通過(guò)最大化表征全局幾何結(jié)構(gòu)的全局散度矩陣,最小化表征局部幾何結(jié)構(gòu)的局部散度矩陣來(lái)尋找最佳投影子空間,因此在對(duì)高維數(shù)據(jù)進(jìn)行維數(shù)約簡(jiǎn)時(shí),顯得更加直觀和高效。然而,ODP目前仍存在以下兩個(gè)主要缺點(diǎn):①ODP在維數(shù)約簡(jiǎn)時(shí),采用的是全局統(tǒng)一鄰域參數(shù),忽略了數(shù)據(jù)局部幾何結(jié)構(gòu)的差異性,從而影響投影所得低維特征矢量的可分性;②ODP作為監(jiān)督式方法,無(wú)法利用大量的無(wú)標(biāo)記樣本,而且在標(biāo)記樣本不足時(shí)會(huì)出現(xiàn)過(guò)學(xué)習(xí)問(wèn)題。
針對(duì)上述兩點(diǎn)不足,本文欲通過(guò)引入鄰域自適應(yīng)方法克服ODP使用全局統(tǒng)一的鄰域參數(shù)的問(wèn)題;進(jìn)一步地,通過(guò)引入半監(jiān)督思想,將無(wú)標(biāo)記樣本擴(kuò)展至ODP的訓(xùn)練范圍,提出一種半監(jiān)督鄰域自適應(yīng)正交判別投影(semi-supervised neighborhood adaptive orthogonal discriminant projection, SSNA-ODP)方法。該方法充分利用有標(biāo)記和無(wú)標(biāo)記數(shù)據(jù)來(lái)構(gòu)建包含鄰域信息的權(quán)重函數(shù),使用有標(biāo)記數(shù)據(jù)最大化不同類樣本之間的可分性,使用無(wú)標(biāo)記數(shù)據(jù)估計(jì)數(shù)據(jù)的內(nèi)在幾何結(jié)構(gòu),令其具有較ODP更好的降維能力與魯棒性。
對(duì)高維特征集進(jìn)行降維后,還需采用有效的分類器建立低維特征矢量與故障類別間的對(duì)應(yīng)關(guān)系[8]。由于支持向量機(jī)[9](support vector machine, SVM)具有魯棒性好,通用性強(qiáng)等優(yōu)點(diǎn),本文選用SVM來(lái)建立低維特征矢量與故障類別間的對(duì)應(yīng)關(guān)系。基于上述分析,本研究擬對(duì)SSNA-ODP與SVM結(jié)合的轉(zhuǎn)子故障診斷方法進(jìn)行探討,欲為高維故障數(shù)據(jù)集的降維與分類提供一種理論參考依據(jù)。
正交判別投影基于圖的拉普拉斯特征譜嵌入,利用數(shù)據(jù)樣本近鄰點(diǎn)之間的局部信息和類別信息建立了具有判別性的權(quán)值函數(shù),并且同時(shí)考慮了數(shù)據(jù)的局部散度和全局散度,具有較好的魯棒性。
假設(shè)給定高維數(shù)據(jù)集X={x1,x2,…,xn}∈RD×n,及其類別信息,其中:n為樣本數(shù);D為特征維數(shù)。ODP的主要步驟如下:
步驟1采用歐氏距離度量數(shù)據(jù)樣本之間的相似性,根據(jù)k-近鄰方式選取全局統(tǒng)一的鄰域參數(shù)構(gòu)建鄰域圖G。
步驟2采用式(1)所示的權(quán)值函數(shù)為鄰域圖G的邊賦權(quán),從而構(gòu)造出權(quán)值矩陣W。
(1)
式中:d2(xi,xj)為xi與xj之間歐氏距離的平方;β為一個(gè)可調(diào)節(jié)的常數(shù)。
步驟3得到W矩陣后,根據(jù)式(2)與式(3)分別計(jì)算局部散度矩陣SL和全局散度矩陣SN
(2)
(3)
步驟4在線性投影矩陣滿足正交化約束的條件下,建立基于式(4)所示的約束目標(biāo)函數(shù)。
max tr{αATSNA-(1-α)ATSLA}
s.t.ATA=I
(4)
式中,α∈[0,1]為調(diào)節(jié)因子,用以調(diào)節(jié)不同散度對(duì)目標(biāo)函數(shù)的貢獻(xiàn)。
利用拉格朗日乘子法,可將式(4)轉(zhuǎn)換成求解廣義特征值的問(wèn)題,即
[αSN-(1-α)SL]A=λA
(5)
由第1章可知,ODP在運(yùn)行時(shí)首先需要選取一個(gè)全局統(tǒng)一的近鄰參數(shù)k,但樣本的局部分布往往不均勻,統(tǒng)一選取該參數(shù)會(huì)造成數(shù)據(jù)的鄰域結(jié)構(gòu)扭曲,進(jìn)而影響后續(xù)的降維效果;并且ODP屬于監(jiān)督式降維方法,只能利用少量有標(biāo)記樣本進(jìn)行學(xué)習(xí),從而浪費(fèi)了大量的無(wú)標(biāo)記樣本。因此,本研究擬從兩個(gè)方面對(duì)ODP進(jìn)行改進(jìn),提出一種半監(jiān)督鄰域自適應(yīng)正交判別投影(SSNA-ODP)方法:①構(gòu)建鄰域圖時(shí),將近鄰概率距離與Parzen窗概率密度估計(jì)結(jié)合實(shí)現(xiàn)對(duì)鄰域參數(shù)k的自適應(yīng)調(diào)整;②ODP方法的監(jiān)督屬性主要體現(xiàn)于式(1)所示的權(quán)值函數(shù),因此,從賦權(quán)函數(shù)的角度入手,提出一種新的半監(jiān)督權(quán)值函數(shù)并將其應(yīng)用于ODP,將無(wú)標(biāo)記樣本擴(kuò)展到該方法的學(xué)習(xí)范圍。
近鄰概率距離[10-11]是一種概率距離,在高維空間中能較歐氏距離更精準(zhǔn)地描述數(shù)據(jù)點(diǎn)的分布情況,而Parzen窗概率密度估計(jì)[12]能依據(jù)樣本分布的概率密度自適應(yīng)地調(diào)整近鄰參數(shù)的大小,因此,本文將兩者結(jié)合來(lái)改進(jìn)ODP方法的鄰域構(gòu)建方式,使得樣本點(diǎn)的近鄰參數(shù)k能夠依據(jù)數(shù)據(jù)自身分布情況進(jìn)行自適應(yīng)調(diào)整,更好地反映數(shù)據(jù)的本質(zhì)結(jié)構(gòu)。具體方法如下:
給定數(shù)據(jù)集X={x1,x2,…,xn},設(shè)置初始鄰域參數(shù)k=k0,窗寬為k0,得到xi初始的鄰域?yàn)镹k0(xi)。選用平滑性較好的正態(tài)窗函數(shù),則對(duì)于樣本點(diǎn)xi而言,其Parzen窗概率密度估計(jì)為
(6)
式中,dist(xi,xj)為樣本點(diǎn)xi與xj的近鄰概率距離,表達(dá)式如式(7)所示
(7)
式中:‖·‖為兩點(diǎn)間的歐氏距離;Pij為xi選取xj作為近鄰的概率,滿足Pii=0且數(shù)據(jù)間的相似度概率和為1,其計(jì)算公式見式(8)。
(8)
式中,λ為以xi為中心的高斯分布的方差,與選定的初始鄰域參數(shù)有關(guān)。
(9)
由式(9)可知,當(dāng)樣本周圍的數(shù)據(jù)密度小于平均密度時(shí),k將自動(dòng)減小,降低了非近鄰或噪聲點(diǎn)對(duì)鄰域結(jié)構(gòu)的影響,有利于保持鄰域的局部結(jié)構(gòu);反之,k將自動(dòng)增大,避免了因數(shù)據(jù)缺乏而導(dǎo)致的鄰域結(jié)構(gòu)扭曲。
為了將半監(jiān)督思想引入ODP方法,在式(1)的基礎(chǔ)上,提出一種式(10)所示的半監(jiān)督權(quán)值函數(shù),并采用它對(duì)自適應(yīng)鄰域圖GNA的邊賦權(quán),構(gòu)建權(quán)值矩陣S。
(10)
式中,θ=exp[-dist2(xi,xj)/σ],dist2(xi,xj)為根據(jù)式(7)與式(8)計(jì)算出xi與xj之間概率距離的平方,σ為所有樣本對(duì)之間距離均值的平方,由此θ可根據(jù)數(shù)據(jù)結(jié)構(gòu)進(jìn)行自適應(yīng)調(diào)整。
將dist2(xi,xj)/σ作為自變量,可得到權(quán)值Sij關(guān)于dist2(xi,xj)/σ的函數(shù)圖,如圖1所示。
結(jié)合式(10)與圖1可推斷半監(jiān)督權(quán)值函數(shù)模型具有如下性質(zhì):
(1)當(dāng)自變量相同時(shí),不同權(quán)值曲線大小排布為互為近鄰且標(biāo)記相同>互為近鄰且標(biāo)記不同>互為近鄰且有一點(diǎn)無(wú)標(biāo)記>其他。近鄰圖中邊的權(quán)值表示兩點(diǎn)之間的相似性,權(quán)值越大則相似性越高,其所對(duì)應(yīng)的局部散度就越大。因此,從目標(biāo)優(yōu)化的角度而言,該函數(shù)模型具有較好的判別性能。
圖1 半監(jiān)督權(quán)值函數(shù)圖Fig.1 Semi-supervised weight function graph
(2)奇異點(diǎn)或噪聲點(diǎn)可能與常規(guī)數(shù)據(jù)點(diǎn)的距離較大,某個(gè)點(diǎn)離常規(guī)點(diǎn)的距離越大,則表示該點(diǎn)是奇異點(diǎn)或噪聲點(diǎn)的可能性越大。由圖1可見,隨著距離增大,近鄰點(diǎn)間的權(quán)值減小。因此,該函數(shù)能夠削弱奇異點(diǎn)或噪聲點(diǎn)對(duì)常規(guī)點(diǎn)的影響,提高目標(biāo)函數(shù)的魯棒性。
綜上所述,SSNA-ODP方法具體實(shí)現(xiàn)步驟如下:
輸入:D維空間數(shù)據(jù)樣本集X={x1,x2,…,xnl,…,xn}∈RD×n,其中有標(biāo)記樣本數(shù)為nl,樣本總數(shù)為n,降維的目標(biāo)維數(shù)d(d 輸出: 投影轉(zhuǎn)換矩陣A,低維特征向量Y。 步驟1歸一化處理樣本集X,設(shè)定初始近鄰數(shù)k0,通過(guò)式(6)~式(8)計(jì)算出每個(gè)樣本點(diǎn)的概率密度估計(jì)值,并通過(guò)式(9)對(duì)鄰域參數(shù)ki進(jìn)行自適應(yīng)調(diào)整,從而構(gòu)造出自適應(yīng)鄰域圖GNA。 步驟2利用式(10)對(duì)自適應(yīng)鄰域圖GNA的邊賦權(quán),得到權(quán)值矩陣S,并以S代替式(2)與式(3)中的W對(duì)局部散度陣SL和全局散度陣SN進(jìn)行計(jì)算。 步驟3將得到的SL和SN代入式(4)構(gòu)建目標(biāo)函數(shù),求解式(5)所示廣義特征方程,得到前d個(gè)最大特征值所對(duì)應(yīng)的特征向量組成投影轉(zhuǎn)換矩陣A=[a1,a2,…,ad]。 步驟4根據(jù)式Y(jié)=ATX,得到低維數(shù)據(jù)Y。 本文方法在一個(gè)典型雙跨度轉(zhuǎn)子實(shí)驗(yàn)臺(tái)上進(jìn)行實(shí)驗(yàn)驗(yàn)證,如圖2所示,該方法故障診斷的流程如下: 步驟1采集轉(zhuǎn)子振動(dòng)信號(hào),并利用文獻(xiàn)[13]中的混合濾波方法對(duì)原始振動(dòng)信號(hào)進(jìn)行消噪處理,對(duì)消噪后的振動(dòng)信號(hào)進(jìn)行多域多通道特征提取,得到初始高維特征集X。 步驟2將初始高維特征集X進(jìn)行SSNA-ODP降維,得到低維特征集Y。 步驟3將低維特征集Y輸入SVM進(jìn)行模式辨識(shí),建立低維特征矢量與故障類別間的對(duì)應(yīng)關(guān)系。 圖2 基于SSNA-ODP故障診斷方法流程圖Fig.2 The flow chart of fault diagnosis method based on SSNA-ODP 本研究工作的實(shí)驗(yàn)對(duì)象為圖3所示的雙跨度轉(zhuǎn)子試驗(yàn)臺(tái)。試驗(yàn)臺(tái)共裝有13個(gè)電渦流傳感器。其中:1個(gè)傳感器設(shè)置在電機(jī)端,用于采集轉(zhuǎn)速信號(hào);12個(gè)傳感器布置在6個(gè)截面處的相互垂直方位,采集不同方位的振動(dòng)信號(hào)。在該設(shè)備上分別模擬轉(zhuǎn)子不對(duì)中、質(zhì)量不平衡、動(dòng)靜碰磨、軸承松動(dòng)和正常運(yùn)轉(zhuǎn)五種狀態(tài)實(shí)驗(yàn)。設(shè)置采樣頻率為5 000 Hz,轉(zhuǎn)速為3 000 r/min,采集各種狀態(tài)類型數(shù)據(jù)樣本80組,其中20組作為訓(xùn)練樣本,60組作為測(cè)試樣本。對(duì)每個(gè)通道采集的信號(hào)按表1所示的參數(shù)提取特征,擴(kuò)展至12個(gè)通道,構(gòu)造12×26=312維的混合域特征集,其構(gòu)造方式見表2。 表1 特征參數(shù) 圖3 雙跨度轉(zhuǎn)子實(shí)驗(yàn)臺(tái)Fig.3 Double-span rotor test bench 表2 初始高維特征集 將高維特征集輸入SSNA-ODP進(jìn)行維數(shù)約簡(jiǎn),再通過(guò)SVM進(jìn)行模式識(shí)別。使用SSNA-ODP降維時(shí),訓(xùn)練樣本中含標(biāo)記信息和未含標(biāo)記信息的樣本按1 ∶4比例隨機(jī)分配。經(jīng)多次實(shí)驗(yàn),設(shè)置鄰域參數(shù)初始值為k0=7,調(diào)節(jié)因子為α=0.3。為保留高維特征集中的本質(zhì)信息,降維目標(biāo)維數(shù)d的選取參考文獻(xiàn)[14],統(tǒng)一設(shè)置d=故障類別數(shù)-1=4。實(shí)驗(yàn)將從以下4個(gè)角度對(duì)所提方法的有效性進(jìn)行驗(yàn)證。 4.2.1 可視化降維效果與故障辨識(shí)結(jié)果對(duì)比 將高維特征集輸入SSNA-ODP中進(jìn)行維數(shù)約簡(jiǎn),作為比較,分別采用LPP、SSNA-OLPP、ODP、SS-ODP(semi-supervised-ODP)、NA-ODP (neighborhood adaptive-ODP)五種方法對(duì)原始高維特征集進(jìn)行降維(由于小樣本問(wèn)題,其中LPP和SSNA-OLPP經(jīng)過(guò)PCA預(yù)處理),測(cè)試樣本經(jīng)上述六種方法降維后的前三個(gè)主分量的低維嵌入效果見圖4。 分析圖4可知,LPP對(duì)碰磨、松動(dòng)、正常三種聚類效果較為明顯,但不對(duì)中和不平衡之間存在混疊現(xiàn)象,不平衡狀態(tài)未能實(shí)現(xiàn)較好聚類。ODP、SS-ODP和NA-ODP降維后各故障狀態(tài)分離,但類內(nèi)散度較大,類間距較小。SSNA-OLPP降維后只有碰磨狀態(tài)完全分離,不對(duì)中與不平衡之間、松動(dòng)與正常之間均存在混疊。SSNA-ODP降維后的聚類與分類效果最好,可將五種狀態(tài)完全區(qū)分開,且故障類別之間具有較高的區(qū)分度。 為定量評(píng)價(jià)文中所提出方法的性能,采用李霽蒲等研究中類間離散度與類內(nèi)離散度的相關(guān)比值Je為評(píng)價(jià)指標(biāo),進(jìn)行方法的有效性評(píng)估。Je越大,說(shuō)明分離效果越好。分別計(jì)算基于用不同方法降維所得低維特征集的Je值,結(jié)果如表3所示。 由表3可知,LPP降維效果最差,類內(nèi)離散度較大,類間離散度較小。SSNA-ODP相對(duì)于其他方法具有明顯的優(yōu)勢(shì),評(píng)價(jià)指標(biāo)Je達(dá)到36.406 0,遠(yuǎn)大于其他方法。將上述六種方法降維后得到的低維特征子集輸入SVM分類器中進(jìn)行故障模式辨識(shí)。SVM中核函數(shù)選取徑向基核函數(shù)(RBF型),選擇核參數(shù)ε= 1,懲罰參數(shù)C=1。訓(xùn)練得到不同方法降維后各類故障的識(shí)別精度如表4所示(表中G1~G5分別表示轉(zhuǎn)子不對(duì)中、質(zhì)量不平衡、動(dòng)靜碰磨、軸承松動(dòng)及正常轉(zhuǎn)動(dòng)五種狀態(tài))。 表3 六種方法類間類內(nèi)評(píng)價(jià)指標(biāo) 分析表4可知: (1)LPP的辨識(shí)精度相對(duì)較低,這是由于LPP是無(wú)監(jiān)督方法,降維過(guò)程中無(wú)法利用有標(biāo)記數(shù)據(jù)中蘊(yùn)含的先驗(yàn)信息,易造成誤學(xué)習(xí)現(xiàn)象。 (2)SSNA-OLPP的平均識(shí)別率高于LPP方法,這是因?yàn)榍罢呤前氡O(jiān)督降維方法,運(yùn)行時(shí)能夠同時(shí)利用有標(biāo)記數(shù)據(jù)和無(wú)標(biāo)記數(shù)據(jù)指導(dǎo)降維過(guò)程。但SSNA-OLPP未考慮數(shù)據(jù)的全局結(jié)構(gòu)信息與判別信息,因此其識(shí)別精度低于ODP。 (3)SS-ODP與NA-ODP的平均識(shí)別率均高于ODP方法,并且將鄰域自適應(yīng)和半監(jiān)督同時(shí)與ODP方法結(jié)合的降維識(shí)別效果要優(yōu)于僅將鄰域自適應(yīng)或半監(jiān)督與ODP結(jié)合,表3中的評(píng)價(jià)指標(biāo)亦可佐證此點(diǎn)。 (4) SSNA-ODP識(shí)別精度達(dá)到最高,這是由于其采用近鄰概率距離作為距離度量函數(shù),得到的距離更精確,且將半監(jiān)督學(xué)習(xí)和鄰域自適應(yīng)與算法結(jié)合,構(gòu)建的低維流形更能表征數(shù)據(jù)的本質(zhì)信息,使降維后獲得的低維特征集具有更好的可分性。 表4 降維方法及其SVM辨識(shí)準(zhǔn)確率 圖4 測(cè)試樣本基于不同方法的降維效果Fig.4 The test sample results based on different methods of dimensionality reduction 4.2.2 SSNA-ODP處理少標(biāo)記樣本性能與穩(wěn)定性驗(yàn)證 為驗(yàn)證SSNA-ODP綜合利用有標(biāo)記與無(wú)標(biāo)記樣本的能力,即測(cè)試訓(xùn)練樣本中有標(biāo)記樣本與無(wú)標(biāo)記樣本比例對(duì)降維效果的影響。設(shè)置訓(xùn)練樣本與測(cè)試樣本比例為20/60不變(去除小樣本因素影響),分別依次增加各類故障有標(biāo)記樣本的數(shù)目,設(shè)置各狀態(tài)有標(biāo)記訓(xùn)練樣本分別為 2個(gè)、4個(gè)、6個(gè)、8個(gè)、10個(gè)、15個(gè)、20個(gè)。采用SSNA-ODP等方法訓(xùn)練降維,并將所得低維測(cè)試樣本輸入SVM進(jìn)行分類,得到的平均識(shí)別率見圖5。 圖5 有故障標(biāo)記數(shù)目對(duì)故障診斷的影響Fig.5 The influence of fault labeled number for fault diagnosis 分析圖5可知: (1)隨著有標(biāo)記樣本數(shù)的增加,除LPP外的五種方法平均識(shí)別率隨之增加,這是因?yàn)殡S著有標(biāo)記樣本個(gè)數(shù)的增加,訓(xùn)練樣本中先驗(yàn)信息就越多,過(guò)學(xué)習(xí)現(xiàn)象隨之減少,故障識(shí)別率增加。而LPP屬于無(wú)監(jiān)督方法,無(wú)法利用有標(biāo)記樣本中所含的先驗(yàn)信息,因此有標(biāo)記樣本數(shù)的變化對(duì)其沒(méi)有影響。 (2) ODP和NA-ODP受故障標(biāo)記影響較大,識(shí)別率變化較明顯,這是由于這兩種方法作為監(jiān)督式方法,嚴(yán)重依賴故障標(biāo)記信息,在標(biāo)記信息不足的情況下泛化性較差,會(huì)產(chǎn)生過(guò)學(xué)習(xí)問(wèn)題,導(dǎo)致識(shí)別率下降。 (3)半監(jiān)督方法的穩(wěn)定性較好,其中SSNA-ODP識(shí)別準(zhǔn)確率一直高于其他方法,即使在有標(biāo)記樣本較少的情況下也能獲得較高的故障辨識(shí)精度,克服了ODP方法在有標(biāo)記樣本較少時(shí)的過(guò)學(xué)習(xí)問(wèn)題。進(jìn)而說(shuō)明該方法在處理有標(biāo)記故障樣本較少時(shí)的優(yōu)越性。 改變訓(xùn)練樣本與測(cè)試樣本的比例,以進(jìn)一步驗(yàn)證本文所提方法的穩(wěn)定性 (采用半監(jiān)督方法降維時(shí)訓(xùn)練樣本中有標(biāo)記樣本與無(wú)標(biāo)記樣本比例為1 ∶4不變),設(shè)置訓(xùn)練樣本數(shù)/測(cè)試樣本數(shù)為10/70,20/60,30/50,40/40,50/30,60/20,70/10。并得六種方法的低維測(cè)試樣本輸入SVM分類器所得的平均識(shí)別率,見圖6。 圖6 不同訓(xùn)練樣本數(shù)對(duì)應(yīng)的平均識(shí)別準(zhǔn)確率Fig.6 The average recognition accuracy of different training sample 從圖6中可以看出,總體上,降維方法的辨識(shí)精度均隨訓(xùn)練樣本數(shù)的增加而增加,這是由于訓(xùn)練樣本越多,其中所包含的判別信息就越多,因此故障識(shí)別率得到一定提升。除SSNA-ODP與SS-ODP外,其余四種方法在訓(xùn)練樣本較少的情況下,準(zhǔn)確率下降明顯。其中,SSNA-ODP的穩(wěn)定性能最好,即使在訓(xùn)練樣本較少情況下也能取得較高的識(shí)別率。 4.2.3 SSNA-ODP的抗噪性能驗(yàn)證 為驗(yàn)證本文方法的抗噪能力, 將樣本集混入干擾系數(shù)為g=0.1, 0.3, 0.5, 0.7的四種隨機(jī)噪聲, 基于不同降維方法的SVM識(shí)別率如圖7所示。 圖7 不同方法在四種隨機(jī)噪聲干擾下的平均識(shí)別準(zhǔn)確率Fig.7 Average recognition accuracy of different methods under four kinds of random noise interference 由圖7可知,隨著干擾系數(shù)遞增,所有降維方法的平均識(shí)別率總體都隨之下降,其中LPP的識(shí)別率受影響最大。SSNA-ODP的識(shí)別精度在不同的干擾情況下受影響相對(duì)最小,說(shuō)明本文方法具有穩(wěn)定的抗噪能力與較好的魯棒性。 4.2.4 變工況下SSNA-ODP的降維性能驗(yàn)證 為驗(yàn)證SSNA-ODP在變工況下的降維能力,分別設(shè)置轉(zhuǎn)速為2 800 r/min,3 000 r/min,3 200 r/min和3 400 r/min的四種工況。取40組3 000 r/min數(shù)據(jù)作為訓(xùn)練樣本,再分別取40組四種工況下數(shù)據(jù)為測(cè)試樣本進(jìn)行實(shí)驗(yàn)。各工況振動(dòng)數(shù)據(jù)經(jīng)LPP、ODP、SSNA-OLPP、SSNA-ODP四種方法降維后的SVM辨識(shí)結(jié)果見表5。 表5 不同方法在變工況下的SVM辨識(shí)結(jié)果 由表5可知,變工況下(2 800 r/min,3 200 r/min和3 400 r/min)基于不同降維方法的平均識(shí)別率均有所降低,但本文方法的識(shí)別精度優(yōu)于其他三種方法,并且降低幅度較小,說(shuō)明本文方法具有較好的適應(yīng)性。 本文提出了一種基于SSNA-ODP的轉(zhuǎn)子故障診斷方法。該方法引入半監(jiān)督思想,在降維時(shí)充分利用有標(biāo)記和無(wú)標(biāo)記數(shù)據(jù)來(lái)構(gòu)建包含鄰域信息的權(quán)重函數(shù),使用有標(biāo)記數(shù)據(jù)最大化不同類樣本之間的可分性,使用無(wú)標(biāo)記數(shù)據(jù)估計(jì)數(shù)據(jù)的內(nèi)在幾何結(jié)構(gòu),改善了數(shù)據(jù)的可區(qū)分度;同時(shí),針對(duì)ODP方法中采用統(tǒng)一鄰域參數(shù)的不足,將近鄰概率距離作為相似性度量,利用Parzen窗估計(jì)樣本點(diǎn)的空間分布情況從而自適應(yīng)地調(diào)整鄰域參數(shù),可更有效地挖掘出數(shù)據(jù)的低維本質(zhì)流形。利用 SSNA-ODP 對(duì)從高維特征集進(jìn)行維數(shù)約簡(jiǎn),將投影得到的低維特征輸入SVM 進(jìn)行分類,結(jié)合 SSNA-ODP 的降維能力和 SVM 的模式識(shí)別優(yōu)勢(shì),可對(duì)轉(zhuǎn)子故障進(jìn)行有效的診斷,提高了識(shí)別準(zhǔn)確率,為轉(zhuǎn)子故障診斷提供了一種新的解決思路。3 基于SSNA-ODP的故障診斷方法
4 實(shí)驗(yàn)結(jié)果與分析
4.1 實(shí)驗(yàn)數(shù)據(jù)說(shuō)明
4.2 應(yīng)用情況與分析
5 結(jié) 論