陶新民 李晨曦 李青
摘要: 針對(duì)不均衡數(shù)據(jù)下的軸承故障檢測(cè)問(wèn)題,提出一種最大軟間隔支持向量域描述(Maximum Soft Margin Support Vector Domain Description,MSM-SVDD)故障檢測(cè)模型。該模型通過(guò)引入最大軟間隔正則項(xiàng),將傳統(tǒng)支持向量域描述(SVDD)算法的分類邊界向故障類偏移,進(jìn)而提高算法的故障檢測(cè)性能,同時(shí)對(duì)正則化項(xiàng)系數(shù)的取值范圍進(jìn)行了理論分析。實(shí)驗(yàn)部分討論了正則化項(xiàng)系數(shù)、高斯核參數(shù)以及正常類樣本數(shù)目對(duì)模型故障檢測(cè)性能的影響,并給出了正則化項(xiàng)系數(shù)與高斯核參數(shù)的取值建議。實(shí)驗(yàn)結(jié)果表明,新提出的MSM-SVDD模型非常適合處理小樣本不均衡數(shù)據(jù)下的故障檢測(cè)問(wèn)題。最后通過(guò)實(shí)測(cè)數(shù)據(jù)的對(duì)比實(shí)驗(yàn),表明MSM-SVDD模型在不均衡數(shù)據(jù)下的故障檢測(cè)性能較其他方法有較大幅度提升。
關(guān)鍵詞: 故障檢測(cè); 軸承; 不均衡數(shù)據(jù); 最大軟間隔; 支持向量域描述
中圖分類號(hào): TH163+.3; TH133.3 ?文獻(xiàn)標(biāo)志碼: A ?文章編號(hào): 1004-4523(2019)04-0718-12
DOI:10.16385/j.cnki.issn.1004-4523.2019.04.020
引 言
在工業(yè)領(lǐng)域中,旋轉(zhuǎn)機(jī)械是應(yīng)用最為廣泛的一類機(jī)械設(shè)備,例如:汽輪機(jī)、壓縮機(jī)和傳送帶等。軸承作為旋轉(zhuǎn)機(jī)械設(shè)備的重要組成部分,其工況直接影響整個(gè)旋轉(zhuǎn)機(jī)械設(shè)備的運(yùn)行狀態(tài)。因此開展軸承早期故障檢測(cè)研究具有十分重要的現(xiàn)實(shí)意義[1]。
振動(dòng)信號(hào)分析方法[2]由于操作簡(jiǎn)單,設(shè)備研發(fā)耗費(fèi)成本較低且優(yōu)于其他方法,因此在當(dāng)前大型旋轉(zhuǎn)機(jī)械設(shè)備軸承故障檢測(cè)中得到廣泛采用。在振動(dòng)信號(hào)分析方法中,包絡(luò)分析[3]是一種常用的振動(dòng)信號(hào)處理技術(shù),其主要包括HHT[4],EMD[5]和 EEMD[6]等方法。但是受振源復(fù)雜、背景噪聲隨機(jī)以及頻譜混疊等因素的影響,上述方法的檢測(cè)效果并不理想[7]。近年來(lái),隨著人工智能技術(shù)的迅速發(fā)展,智能化已成為故障檢測(cè)技術(shù)的重要發(fā)展方向,而機(jī)器學(xué)習(xí)是提高故障檢測(cè)系統(tǒng)智能水平的主要途徑[8]。其中,作為機(jī)器學(xué)習(xí)方法典型代表的支持向量機(jī)(Support Vector Machine, SVM)算法,因其良好的非線性區(qū)分能力被廣泛應(yīng)用于機(jī)械系統(tǒng)的故障檢測(cè)[9]。但是在實(shí)際大型旋轉(zhuǎn)機(jī)械設(shè)備故障檢測(cè)應(yīng)用中故障類訓(xùn)練樣本是不易獲取的,從而導(dǎo)致正常類訓(xùn)練樣本與故障類訓(xùn)練樣本間數(shù)目不均衡。受不均衡數(shù)據(jù)的影響,SVM算法的檢測(cè)性能嚴(yán)重下降[10]。因此如何在不均衡數(shù)據(jù)下提高SVM算法的故障檢測(cè)性能成為了眾多學(xué)者關(guān)注的重點(diǎn)。近些年,相繼提出了各種處理不均衡數(shù)據(jù)故障檢測(cè)的SVM改進(jìn)算法。其中,代價(jià)敏感(Cost-sensitivity SVM, CSSVM)學(xué)習(xí)方法[11]通過(guò)把各類不同錯(cuò)分代價(jià)應(yīng)用到分類決策中去對(duì)SVM進(jìn)行改造,盡可能地降低了錯(cuò)誤分類的整體代價(jià);然而因受等式約束限制,算法性能的提升并不明顯[12]。后來(lái)提出的基于邊界人工少數(shù)類過(guò)取樣技術(shù)(Border Synthetic Minority Over-sampling Technique, BSMOTE)的代價(jià)敏感SVM[13]算法和基于BSMOTE過(guò)取樣集成SVM (Ensemble SVM, ESVM)[14]算法雖在一定程度上降低了樣本數(shù)據(jù)的非平衡度,但是上述算法均是利用已有正常類樣本信息增加規(guī)模,容易導(dǎo)致在樣本增加的同時(shí)決策域減小,算法過(guò)度擬合,從而降低故障檢測(cè)精度[15]。為此,學(xué)者們將目光投向與SVM原理相似的支持向量域描述(Support Vector Domain Description, SVDD)[16]算法。由于SVDD訓(xùn)練時(shí)不需要故障類樣本,因此較SVM更適合不均衡數(shù)據(jù)下的軸承故障檢測(cè)問(wèn)題[17]。然而正是因?yàn)镾VDD沒能考慮到少數(shù)故障類樣本信息對(duì)決策邊界的影響,使得優(yōu)化后的決策邊界緊靠正常類樣本一側(cè),導(dǎo)致算法的故障檢測(cè)性能不高。事實(shí)上,在實(shí)際不均衡數(shù)據(jù)故障檢測(cè)應(yīng)用中,雖然難獲取,但仍可以收集到少數(shù)故障類樣本。為了能利用少數(shù)故障樣本改善分類界面,學(xué)者們提出帶故障類樣本信息的支持向量域描述(Support Vector Domain Description with Negative Samples, SVDD –NEG)[18]算法,該算法通過(guò)對(duì)正常類和少數(shù)故障類中的錯(cuò)分樣本增加懲罰項(xiàng)來(lái)提高算法的泛化性能。然而正如上文所述,故障樣本雖然存在但數(shù)量較少,在這種極端不均衡情況下,故障類樣本與正常類樣本混疊概率較低,因此,在實(shí)際故障檢測(cè)應(yīng)用中通常要解決的是不均衡數(shù)據(jù)的可分問(wèn)題。由于SVDD-NEG采用的是對(duì)兩類樣本集的錯(cuò)分總和進(jìn)行懲罰來(lái)調(diào)整分類邊界,當(dāng)面對(duì)可分問(wèn)題時(shí),兩類樣本集錯(cuò)分總和通常為零,這時(shí)懲罰項(xiàng)將無(wú)法起到調(diào)整分類邊界的作用。
為此,本文在借鑒傳統(tǒng)SVM算法分類間隔最大化思想基礎(chǔ)上,對(duì)SVDD的優(yōu)化目標(biāo)進(jìn)行改進(jìn),通過(guò)增加正常類與故障類樣本間的最大軟間隔正則項(xiàng)[19],實(shí)現(xiàn)調(diào)整分類邊界的作用。在此基礎(chǔ)上提出一種基于最大軟間隔SVDD軸承故障檢測(cè)模型。該模型通過(guò)充分利用少數(shù)故障類樣本信息,將分類邊界向故障類偏移,進(jìn)而提高模型處理不均衡數(shù)據(jù)的故障檢測(cè)性能。實(shí)驗(yàn)部分將本文方法同其他方法進(jìn)行比較,結(jié)果表明本文方法在數(shù)據(jù)不均衡情況下的軸承故障檢測(cè)性能較其他方法有較大幅度提高。