石明寬 趙榮珍
摘要: 針對旋轉(zhuǎn)機(jī)械故障特征集非線性強(qiáng)、維數(shù)過高導(dǎo)致分類困難的問題,提出一種基于局部質(zhì)心均值最小距離鑒別投影(Local Centroid Mean Minimum?distance Discriminant Projection,LCMMDP)的故障數(shù)據(jù)集降維算法。該算法在考慮樣本的內(nèi)聚性和分離性的同時,能夠保持樣本局部幾何結(jié)構(gòu)信息,反映樣本與局部質(zhì)心均值之間的近鄰關(guān)系。從多個角度提取機(jī)械振動信號的混合特征,構(gòu)建原始高維特征集,通過LCMMDP提取出低維敏感特征子集,利用改進(jìn)的基于局部均值與類均值的k?近質(zhì)心近鄰分類算法(k?nearest Centroid Neighbor Classification Based on Local Mean and Class Mean,KNCNCM)進(jìn)行故障模式識別。所提方法集成了LCMMDP在維數(shù)約簡和KNCNCM在模式識別的優(yōu)勢,可得到較高的故障識別準(zhǔn)確率。分別使用一個雙轉(zhuǎn)子系統(tǒng)數(shù)據(jù)集和仿真數(shù)據(jù)集驗(yàn)證了該方法的有效性。
關(guān)鍵詞: 故障診斷; 降維; 局部質(zhì)心均值; 分類器; 模式識別
中圖分類號: TH 165+3; TN911.7 ? ?文獻(xiàn)標(biāo)志碼: A ? ?文章編號: 1004-4523(2021)02-0421-10
DOI:10.16385/j.cnki.issn.1004-4523.2021.02.023
引 言
旋轉(zhuǎn)機(jī)械在現(xiàn)代機(jī)電系統(tǒng)中起著至關(guān)重要的作用,因此對旋轉(zhuǎn)機(jī)械進(jìn)行狀態(tài)監(jiān)測和故障診斷具有極其重要的意義[1]。為了盡可能多地獲取故障信息,通常采用多個傳感器進(jìn)行多通道的監(jiān)測,提取出每個通道的多域故障特征,必不可避免地導(dǎo)致了大量的冗余信息和高度相關(guān)的信息形成的“維數(shù)災(zāi)難”問題[2]。因此,如何消除高維數(shù)據(jù)中的冗余信息,使通過積累獲得的海量故障數(shù)據(jù)資源擁有開發(fā)利用的價值,已成為當(dāng)今機(jī)械信息技術(shù)所面臨的基本問題。
伴隨著大數(shù)據(jù)技術(shù)的快速發(fā)展,數(shù)據(jù)降維已成為數(shù)據(jù)科學(xué)研究領(lǐng)域關(guān)注的熱點(diǎn)問題。典型的降維算法包括主成分分析(Principal Component Analysis,PCA)[3]與線性鑒別分析(Linear Discriminant Analysis,LDA)[4]等。其中,PCA試圖尋找一個最大協(xié)方差線性投影矩陣,LDA通過最大化類間散度的同時最小化類內(nèi)散度,尋找一個最佳投影矩陣;而PCA和LDA都是基于整體樣本結(jié)構(gòu)的降維算法,無法表征樣本的局部流形結(jié)構(gòu)。針對此問題,相關(guān)研究提出了流形學(xué)習(xí)算法,如局部保持投影(Locality Preserving Projection,LPP)[5]、局部線性嵌入(Locally Linear Embedding,LLE)[6]等算法。LPP是對傳統(tǒng)拉普拉斯特征映射算法(Laplacian Eigenmap,LE)[7]進(jìn)行線性化近似的結(jié)果,通過線性化之后的LPP能夠以較小的計算損耗獲取比較好的數(shù)據(jù)聚類效果。但LPP僅考慮了樣本的局部結(jié)構(gòu),忽略了有利于分類的類別信息,無法更多地挖掘出高維數(shù)據(jù)的幾何結(jié)構(gòu)信息。針對這種不利的局面,將LDA與LPP算法的優(yōu)勢進(jìn)行集成,提出了諸多改進(jìn)算法,如局部Fisher判別分析(Local Fisher Discriminant Analysis,LFDA)[8]、邊緣Fisher分析(Marginal Fisher Analysis,MFA)[9]、鑒別局部保持投影(Discriminant Locality Preserving Projection,DLPP)[10]、最小鑒別投影(Minimum?distance Discriminant Projection,MDP)[11]等算法。MDP通過引入類間相似度與類內(nèi)相似度,不僅描述了樣本與類中心的距離關(guān)系,同時反映出類間距與類內(nèi)距的大小關(guān)系。但MDP和LDA在高維小樣本問題中采用類均值會導(dǎo)致數(shù)據(jù)特征信息的丟失,不能更好地反映樣本類信息[12];另外MDP只考慮了樣本與類中心之間的距離關(guān)系,忽視了樣本點(diǎn)之間的局部近鄰關(guān)系,無法有效地表征樣本集的局部幾何信息。針對MDP算法的局限性,本研究提出一種基于局部質(zhì)心均值最小距離鑒別投影LCMMDP算法。LCMMDP利用樣本與其近質(zhì)心近鄰點(diǎn)的均值間的距離設(shè)計了與MDP不同的相似性度量機(jī)制,欲從流形局部學(xué)習(xí)的角度重新定義局部類間相似度和局部類內(nèi)相似度,充分利用了所有樣本的局部幾何信息和類別信息;另外,LCMMDP在計算過程中利用近質(zhì)心近鄰點(diǎn)的均值,能夠有效地抑制噪聲數(shù)據(jù)對流形學(xué)習(xí)的干擾,提高算法的魯棒性。
為實(shí)現(xiàn)利用LCMMDP降維后得到的低維敏感特征矢量與故障類型間的準(zhǔn)確識別,需選擇一種精度高、穩(wěn)定性好的分類器?;诰植烤档膋?近質(zhì)心近鄰(Local Mean?based k?nearest Centroid Neighbor,LMKNCN)分類算法是Gou等[13]為克服離群點(diǎn)對分類性能的負(fù)面影響而提出的非參數(shù)分類器,其基本思想是用待測樣本點(diǎn)到每一類的局部質(zhì)心均值點(diǎn)的距離大小來指定待測樣本的類別。LMKNCN只利用了未分類樣本在每類里的近鄰的局部均值信息,與類可分離性密切相關(guān)的類均值特性并未利用。針對上述問題,根據(jù)文獻(xiàn)[14]的思想,本研究提出一種基于局部均值與類均值的k?近質(zhì)心近鄰分類方法KNCNCM,在類均值互不相同的情況下,既利用未分類樣本在每類里的近質(zhì)心近鄰的局部均值信息,又利用類均值的整體信息進(jìn)行分類的想法,可以提高LMKNCN的分類性能。
基于上述分析,本研究對LCMMDP與KNCNCM相結(jié)合的轉(zhuǎn)子故障數(shù)據(jù)集降維和分類方法進(jìn)行探討,欲從海量數(shù)據(jù)中挖掘更充分的數(shù)據(jù)結(jié)構(gòu)信息,為智能故障模式識別技術(shù)的發(fā)展提供了一種理論參考依據(jù)。
5.2.1 參數(shù)設(shè)定
5.2.2 特征數(shù)據(jù)集的可分性分析
為了驗(yàn)證本文所提LCMMDP算法的可行性,選擇與LPP,LDA,MMC,MNMP,MDP等降維算法進(jìn)行比較。并將6種算法記為A1,A2,A3,A4,A5,A6。前三個主元的低維嵌入結(jié)果如圖5所示(圖中“◇”、“*”、 “☆”、“?”、“○”分別代表轉(zhuǎn)子不對中、質(zhì)量不平衡、動靜碰摩、軸承座松動和正常狀態(tài))。
從圖5可以看出,LPP的聚類效果最差,其中質(zhì)量不平衡、動靜碰摩、軸承座松動和正常狀態(tài)四類特征之間離的較近,不易區(qū)分;MMC,MNMP的同類特征太過分散,類內(nèi)距離過大;LCMMDP的聚類效果最好,不同類型特征之間完全分離,各類數(shù)據(jù)清晰可見,相同類型聚集成團(tuán);LPP,LDA,MMC,MNMP,MDP五種算法的不同類型特征之間都存在著一定的混疊,無法有效地區(qū)分。
為了進(jìn)一步說明本文所提LCMMDP算法的可行性,考察降維后的特征集的可分性,引入類間類內(nèi)距離的可分性參數(shù)[18]對測試樣本集的分類與聚類程度給予量化評價。設(shè)降維后的低維特征子集的C類樣本數(shù)據(jù)為特征集的類間距離、類內(nèi)距離和可分性參數(shù)分別定義為:
由定義可知,類間距Sb反映了各類別之間的分離度,類內(nèi)距Sw體現(xiàn)了每類樣本分布的緊湊程度。低維空間特征集的類間距離越大,類內(nèi)距離越小,則可分性參數(shù)值ρ就越大,特征集的可分性就越好。
按式(20)計算各降維算法降維后的特征集可分性參數(shù)值,如表3所示。從表3可以看出,MMC特征集的可分性參數(shù)最小,只有12.4167;LCMMDP特征集的可分性參數(shù)最大,可高達(dá)100.3742。綜合圖5和表3可知,相比于其他5種降維算法,LCMMDP聚類效果最好,可分性參數(shù)最大,說明LCMMDP具有較好的降維效果,在維數(shù)約簡中有明顯的優(yōu)勢。
5.2.3 故障分類效果
為了量化6種降維算法的降維效果,將各個算法降維后的低維敏感特征集輸入KNCNCM分類器中進(jìn)行故障模式識別,得到的識別率如表4所示。
結(jié)合表3和表4可以看出:①LPP的識別準(zhǔn)確率最低,這是因?yàn)長PP是無監(jiān)督算法,只側(cè)重于局部幾何結(jié)構(gòu)信息的提取,而沒有考慮類判別信息,導(dǎo)致故障特征解耦不完全,故障特征間仍存在混疊。②LDA,MMC,MNMP相較于LPP的識別率較好,是因?yàn)檫@三種算法均利用了樣本的類判別信息,同時考慮了樣本的分離性和內(nèi)聚性。然而,LDA,MMC主要側(cè)重于分析類判別信息,忽視了樣本集的局部幾何結(jié)構(gòu)信息,導(dǎo)致大量的有用故障特征信息丟失;MMC,MNMP因?yàn)椴淮嬖谛颖締栴},沒有利用PCA預(yù)維數(shù)約簡處理,因此無法有效的除去空間中的噪聲和冗余信息,導(dǎo)致提取的特征信息無法有效識別故障類別,同時降低了特征集的可分性。③LCMMDP的識別準(zhǔn)確率要遠(yuǎn)高于MDP及其他四種降維算法,是因?yàn)長CMMDP將樣本的局部幾何信息有效地融入到維數(shù)約簡過程,實(shí)現(xiàn)了類判別信息與樣本集局部幾何結(jié)構(gòu)信息的有效結(jié)合。另外,LMMDP利用了局部質(zhì)心均值,有效地克制了原始特征信息的丟失,一定程度上抑制噪聲數(shù)據(jù)對算法的影響,在挖掘故障樣本數(shù)據(jù)集中蘊(yùn)含的故障信息的同時實(shí)現(xiàn)對故障的有效解耦,可得到最有辨識力的低維特征子集,提高故障特征集的可分性。
為了進(jìn)一步驗(yàn)證LCMMDP算法的適用性,本文在選取不同的訓(xùn)練樣本數(shù)量和測試樣本數(shù)量的情況下,上述6種算法降維得到的低維敏感特征經(jīng)KNCNCM分類器進(jìn)行故障模式識別的結(jié)果如圖6所示。
圖6表明,整體上各降維算法的識別準(zhǔn)確率都隨訓(xùn)練樣本的增加而增加。由于LCMMDP充分利用了所有樣本的局部幾何信息和類別信息,故識別準(zhǔn)確率一直較高,穩(wěn)定性最好;LPP是無監(jiān)督算法,在少量訓(xùn)練樣本情況下,無法有效地保持局部結(jié)構(gòu)信息,識別準(zhǔn)確率較低;MMC是一種基于樣本整體結(jié)構(gòu)的降維算法,隨著樣本數(shù)量的不足,局部結(jié)構(gòu)信息比全局結(jié)構(gòu)信息更為重要,無法充分地利用樣本信息,導(dǎo)致故障診斷效果下降,識別準(zhǔn)確率低。
為了提高本研究所提LCMMDP算法的泛化能力,將不同算法在不同轉(zhuǎn)速(分別為2800,3000,3200 r/min)下降維得到的低維特征子集輸入KNCNCM分類器中進(jìn)行故障識別,得到的平均識別準(zhǔn)確率如圖7所示。由圖7可以看出,在不同轉(zhuǎn)速下,LCMMDP降維方法的平均識別準(zhǔn)確率都明顯優(yōu)于其他5種降維方法,表明它具有良好的適用性和更高的故障識別精度。
5.2.4 LCMMDP算法的抗干擾能力分析
為了分析LCMMDP的抗干擾能力,將系數(shù)γ=0.1,0.2,0.3,0.4的rand隨機(jī)干擾噪聲加入到原始故障集中[19?20],經(jīng)上述6種算法降維后得到低維特征集,然后輸入KNCNCM分類器進(jìn)行故障識別,得到的識別準(zhǔn)確率如圖8所示。由圖可知,隨著干擾系數(shù)的增加,6種算法的準(zhǔn)確率都有所降低,但LCMMDP降低的速率較慢,且準(zhǔn)確率都明顯高于其他算法。因此可以看出LCMMDP的抗干擾能力強(qiáng),相應(yīng)的魯棒性較好。
5.2.5 KNCNCM分類器的性能分析
為了驗(yàn)證本文所提KNCNCM分類器的魯棒性和穩(wěn)定性,向測試故障集中融入系數(shù)為a=0.1,0.2,0.3,0.4的隨機(jī)干擾噪聲,將經(jīng)LCMMDP降維后的低維敏感特征集輸入KNCNCM,LMKNCN,KNN分類器中進(jìn)行故障模式識別,得到的平均識別率如表5所示。
由表5中可以看出,LMKNCN的識別率高于KNN,原因是KNN的分類性能容易受到噪聲干擾和離群點(diǎn)的影響,而LMKNCN利用每類訓(xùn)練樣本集里未分類樣本的幾個近鄰的局部均值信息,一定程度上克服了離群點(diǎn)對分類性能的影響;隨著噪聲的增多,KNCNCM的診斷結(jié)果變化較小,平均識別率都高于其他兩種分類器,表明KNCNCM相較于LMKNCN和KNN對噪聲不敏感,具有優(yōu)異的穩(wěn)定性和識別能力。
6 結(jié) 論
為使提取的旋轉(zhuǎn)機(jī)械故障特征有利于實(shí)施故障數(shù)據(jù)集分類,本研究提出一種基于局部質(zhì)心均值最小距離鑒別投影(LCMMDP)降維方法和基于局部均值與類均值的k?近質(zhì)心近鄰分類方法(KNCNCM)相結(jié)合的旋轉(zhuǎn)機(jī)械故障診斷方法。分別通過一個雙轉(zhuǎn)子系統(tǒng)的振動信號集合和仿真數(shù)據(jù)集進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明:
(1) LCMMDP相比較于MDP,MNMP,LDA,LPP,MMC等降維方法,可提取出可分性更高的低維空間故障特征集,在進(jìn)行故障模式識別時具有一定的優(yōu)勢。
(2) KNCNCM分類方法既利用未分類樣本在每類里的近質(zhì)心近鄰的局部信息,又利用了類均值的整體知識,克服了數(shù)據(jù)離群點(diǎn)對分類性能的影響,而且一定程度上避免了噪聲的干擾,具有一定的穩(wěn)定性和準(zhǔn)確性。
(3) LCMMDP與KNCNCM相結(jié)合的維數(shù)約簡故障診斷模式能夠有效地對高維轉(zhuǎn)子故障數(shù)據(jù)集進(jìn)行維數(shù)約簡和故障分類,為旋轉(zhuǎn)機(jī)械智能故障診斷提供了一種解決方案。
參考文獻(xiàn):
[1] Wang Z Y, Lu C, Zhou B. Fault diagnosis for rotary machinery with selective ensemble neural networks[J]. Mechanical Systems and Signal Processing, 2018, 113: 112-130.
[2] SU Z, Tang B, MA J, et al. Fault diagnosis method based on incremental enhanced supervised locally linear embedding and adaptive nearest neighbor classifier[J]. Measurement, 2014, 48(1): 136-148.
[3] Turk M, Pentland A. Eigenfaces for recognition[J]. Journal of Cognitive Neuroscience, 1991, 3(1):71-86.
[4] Martinez A M, Kak A C. PCA versus LDA[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(2): 228-233.
[5] He X. Locality preserving projections[J]. Advances in Neural Information Processing System, 2003, 16(1): 186-197.
[6] ROWEIS S T,SAUL L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290(5500): 2323-2326.
[7] JIANG Quansheng,JIA Minping,HU Jianzhong, et al. Modified Laplacian eigenmap method for fault diagnosis[J]. Chinese Journal of Mechanical Engineering, 2008, 21(3): 90-93.
[8] Sugiyama M. Dimensionality reduction of multimodal labeled data by local fisher discriminant analysis[J]. Journal of Machine Learning Research, 2007, 8(1): 1027-1061.
[9] Yan S C, Xu D, Zhang B Y, et al. Graph embedding and extensions: A general framework for dimensionality reduction[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(1): 40-51.
[10] Yu W, Teng X, Liu C. Face recognition using discriminant locality preserving projections[J]. Image and Vision Computing, 2006, 24(3): 239-248.
[11] 黃璞, 唐振民. 最小距離鑒別投影及其在人臉識別中的應(yīng)用[J]. 中國圖象圖形學(xué)報, 2013, 18(02): 201-206.
Huang Pu, Tang Zhenmin. Minimum-distance discriminant projection and its application to face recognition[J]. Journal of Image and Graphics, 2013, 18(02): 201-206.
[12] 黃璞, 唐振民. 鑒別的局部中值保持投影及其在人臉識別中的應(yīng)用[J]. 計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報, 2012, 24(11): 1420-1425.
Huang Pu, Tang Zhenmin. Discriminant local median preserving projections with its application to face recognition[J]. Journal of Computer-Aided Design & Computer Graphics, 2012, 24(11): 1420-1425.
[13] Gou J, Yi Z, Du L, et al. A local mean-based k-nearest centroid neighbor classifier[J]. The Computer Journal, 2012, 55(9): 1058-1071.
[14] 曾勇, 楊煜普, 趙亮. 基于局部均值與類均值的近鄰分類[J]. 控制與決策, 2009, 24(04): 547-550.
Zeng Yong, Yang Yupu, Zhao Liang. Nearest neighbor classification based on local mean and class mean[J]. Control and Decision, 2009, 24(04): 547-550.
[15] 張曉濤, 唐力偉, 王平, 等. 基于半監(jiān)督PCA-LPP流形學(xué)習(xí)算法的故障降維辨識[J]. 中南大學(xué)學(xué)報(自然科學(xué)版), 2016, 47(05): 1559-1564.
ZHANG Xiaotao, TANG Liwei, WANG Ping, et al. Fault identification and dimensionality reduction method based on semi-supervised PCA-LPP manifold learning algorithm[J]. Journal of Central South University (Science and Technology), 2016, 47(05): 1559-1564.
[16] BLAKE C L, MERZ C J, 1998, UCI repository of machine learning databases[EB/OL]. [2019-01-12] University of California. Available online at: http://archive.Ics.Uci. edu/ml/.
[17] 蘇祖強(qiáng), 湯寶平, 姚金寶. 基于敏感特征選擇與流形學(xué)習(xí)維數(shù)約簡的故障診斷[J]. 振動與沖擊, 2014, 33(03): 70-75.
SU Zu-qiang, Tang Bao-ping, Yao Jin-bao. Fault diagnosis based on sensitive feature selection and manifold learning dimension reduction[J]. Journal of Vibration and Shock, 2014, 33(03): 70-75.
[18] 李學(xué)軍,李平,蔣玲莉.類均值核主元分析法及在故障診斷中的應(yīng)用[J]. 機(jī)械工程學(xué)報, 2014, 50(03): 123-129.
LI Xue-Jun, LI Ping, Jiang Ling-Li. Class mean kernel principal component analysis and its application in fault diagnosis[J]. Journal of Mechanical Engineering, 2014, 50(03): 123-129.
[19] Chen F, Tang B, Chen R. A novel fault diagnosis model for gearbox based on wavelet support vector machine with immune genetic algorithm[J]. Measurement, 2013, 46(1): 220-232.
[20] 趙孝禮, 趙榮珍. 全局與局部判別信息融合的轉(zhuǎn)子故障數(shù)據(jù)集降維方法研究[J]. 自動化學(xué)報, 2017, 43(04): 560-567.
Zhao Xiao-li, Zhao Rong-zhen. A method of dimension reduction of rotor faults data set based on fusion of global and local discriminant information[J]. Acta Automatica Sinica, 2017, 43(04): 560-567.
Dimensional reduction analysis of rotating machinery fault data based on local centroid mean minimum-distance discriminant projection
SHI Ming-kuan, ZHAO Rong-zhen
(School of Mechanical and Electronical Engineering, Lanzhou University of Technology, Lanzhou 730050, China)
Abstract: Aiming at the problem of classification difficulty caused by the strong nonlinearity and the high dimensionality of fault dataset of rotating machinery, a fault dataset dimension reduction algorithm local centroid mean minimum-distance discriminant projection (LCMMDP) is proposed. The algorithm can maintain the local geometric structure information of the sample while considering the cohesion and separation of the sample, reflecting the close relationship between the sample and the local centroid mean. The hybrid characteristics of rotor vibration signals are extracted from multiple angles, the original high-dimensional feature sets are constructed, and low-dimensional sensitive feature subsets are extracted by LCMMDP. The improved k-nearest centroid neighbor classification based on local mean and class mean is used (KNCNCM) for fault pattern recognition. The proposed method integrates the advantages of LCMMDP in dimension reduction and KNCNCM in pattern recognition and provides higher fault identification accuracy. The validity of the proposed method is verified by the instance of the fault diagnosis of a double-span rotor system dataset and simulation dataset.
Key words: fault diagnosis; dimension reduction; local centroid mean; classifier; pattern recognition
作者簡介: 石明寬 (1993-),男,碩士研究生。電話:18809490031;E-mail: 1937787272@qq.com
通訊作者: 趙榮珍 (1960-),女,教授,博士生導(dǎo)師。電話:13619349619;E-mail: zhaorongzhen@lut.cn