蔣玲莉 莫志軍 陳安華 李學(xué)軍
1.湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)湖南省重點實驗室,湘潭,4112012.蘇州東陵振動試驗儀器有限公司,蘇州,215163
?
一種聚類優(yōu)化融合故障診斷方法及其應(yīng)用
蔣玲莉1,2莫志軍1陳安華1李學(xué)軍1
1.湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)湖南省重點實驗室,湘潭,4112012.蘇州東陵振動試驗儀器有限公司,蘇州,215163
針對單一聚類診斷方法難以準(zhǔn)確、全面識別不同故障狀態(tài)的問題,提出了一種聚類優(yōu)化融合故障診斷方法。分別利用社團(tuán)聚類、K-均值聚類及粒子群聚類三種方法對故障進(jìn)行識別,得出三種聚類方法對應(yīng)的故障識別準(zhǔn)確率,在此基礎(chǔ)上構(gòu)建初始權(quán)值矩陣,并通過遺傳算法對初始判斷矩陣與三種聚類方法進(jìn)行優(yōu)化,得到最優(yōu)權(quán)值矩陣與優(yōu)化的聚類模型,用于融合診斷。軸承故障診斷實例結(jié)果表明,該聚類融合診斷方法能夠有效提高故障識別準(zhǔn)確率。
聚類分析;權(quán)值矩陣;融合診斷;遺傳算法
聚類分析方法被用作描述數(shù)據(jù)、衡量不同數(shù)據(jù)源間的相似性、將數(shù)據(jù)源劃分為各類集合[1-2],被廣泛應(yīng)用于故障模式識別[3-4]。大部分故障聚類診斷方法通過描述故障特征間聯(lián)系緊密程度的聚類變量來實現(xiàn)故障模式識別,聚類變量主要存在兩種方式:一是采用描述故障特征之間的接近程度的指標(biāo),例如“距離”,“距離”越小的變量越具有相似性,傳統(tǒng)的故障診斷聚類方法如K-均值聚類[6]、粒子群聚類[7]、灰色聚類[8]等的測量方式就歸于此類;二是采用表示故障特征之間相似程度的指標(biāo),例如“相關(guān)系數(shù)”,“相關(guān)系數(shù)”越大的故障特征越具有相似性,社團(tuán)聚類中的模塊度就是典型的“相關(guān)系數(shù)”[5],不僅可以表示單個樣本特征模塊之間的相似性,而且能夠描繪出大規(guī)模模塊之間的相似程度。各種聚類診斷方法各有優(yōu)劣,實際應(yīng)用中各有適用性,如K-均值聚類需知故障類別等先驗知識,粒子群聚類容易陷入局部最優(yōu),社團(tuán)聚類雖無需故障類別數(shù)等先驗知識,卻容易多分類或少分類而導(dǎo)致誤判??偠灾瑔我痪垲愒\斷方法通用性差,不具備全面的、良好的識別所有故障狀態(tài)的能力。對聚類方法進(jìn)行融合可提高故障診斷適用性,保證診斷精度?;诖?,本文提出了一種聚類優(yōu)化融合故障診斷方法,分別利用社團(tuán)聚類、K-均值聚類及粒子群聚類三種方法進(jìn)行故障識別,在此基礎(chǔ)上構(gòu)建初始權(quán)值矩陣,并通過遺傳算法對初始判斷矩陣及三種聚類方法進(jìn)行優(yōu)化,得到最優(yōu)權(quán)值矩陣與優(yōu)化的聚類模型,進(jìn)行融合診斷。最后以軸承故障診斷實例驗證了融合診斷的優(yōu)越性。
1.1聚類優(yōu)化融合診斷模型
融合診斷方法主要分為串行診斷融合與并行診斷融合,由于單一診斷方法的排列順序?qū)Υ腥诤显\斷的診斷結(jié)果影響過大,因而在本文中選取并行診斷融合。聚類優(yōu)化融合的流程框圖見圖1。
圖1 融合聚類診斷流程圖
聚類優(yōu)化融合的步驟如下:
(1)故障信號集包含m類故障,共計b個故障樣本,m類故障分別用G=(G1,G2,…,Gm)來表示,提取故障信號的N維特征向量,構(gòu)成b×N特征樣本矩陣Q,矩陣Q的每一行是一個故障樣本特征向量。本文以經(jīng)驗?zāi)B(tài)分解(EMD)所得各階能量值為特征向量[9]。
(2)采用選定的K種方法分別對矩陣Q進(jìn)行聚類診斷,得到K種方法的診斷結(jié)果,矢量Pk=(P1k,P2k, …,Pmk)T表示第k(k=1,2,…,K)類方法對第m類故障的識別正確率,矢量R=(Rk1,Rk2,…,Rkm)表示第k類方法對樣本Q(j)的判定結(jié)果(j=1,2,…,b),Rki為第k種診斷方法對應(yīng)Gi類故障的診斷結(jié)果(i=1,2, …,m),且有
本文分別用社團(tuán)聚類、K-均值聚類及粒子群聚類三種方法進(jìn)行聚類診斷。
(3)對矢量P進(jìn)行預(yù)加權(quán)調(diào)整,得到初始權(quán)值矩陣W:
(1)
(2)
其中,Wik表示第k種方法對Gi類故障判定時所占權(quán)值。
(4)由矢量R得到K種聚類診斷方法對所有單個故障樣本Q(j)的初始判定矩陣R(j):
(3)
(5)用遺傳算法優(yōu)化融合權(quán)值矩陣,迭代結(jié)束后根據(jù)適應(yīng)度函數(shù)得到優(yōu)化后的權(quán)值矩陣W1;遺傳算法在優(yōu)化權(quán)值矩陣的同時,對三種聚類方法的錯誤診斷予以修正,優(yōu)化聚類模型。
(6)故障樣本Q(j)的最終診斷結(jié)果為Val(j),則有
Vj=(V1,V2,…,Vm)=diag(W1R(j))
(4)
Vjmax=max(V1,V2,…,Vm)
(5)
當(dāng)Vi=Vjmax時,取Val(j)=i,即判定故障樣本Q(j)屬于Gi類故障。
1.2基于遺傳算法的融合權(quán)值矩陣優(yōu)化
從融合診斷模型中可以看出,權(quán)值矩陣W在很大程度上決定了最終診斷正確率,在本文中,采用遺傳算法[10]對權(quán)值矩陣W進(jìn)行優(yōu)化。
本文中遺傳算法的應(yīng)用步驟如下:
(1)將初始權(quán)值矩陣W的權(quán)值因子作為初始種群個體進(jìn)行編碼。隨機(jī)產(chǎn)生初始種群,個體數(shù)目一定,每個個體表示染色體的基因編碼,由于二進(jìn)制編碼方法的編碼、解碼操作簡單易行,且便于實現(xiàn)交叉、變異等遺傳操作,因而在本文中選用二進(jìn)制編碼方法對融合權(quán)值矩陣進(jìn)行編碼,并設(shè)定好求解精度。圖2所示為本文中權(quán)值矩陣串聯(lián)編碼組合而成的染色體。
圖2 融合權(quán)值矩陣串聯(lián)編碼組合后的染色體
(2)對個體適應(yīng)度函數(shù)值進(jìn)行計算。適應(yīng)度函數(shù)在遺傳算法中不僅表明了函數(shù)解的優(yōu)劣,而且決定了個體的進(jìn)化方向,當(dāng)適應(yīng)度函數(shù)增大到收斂時,訓(xùn)練樣本的診斷正確率相應(yīng)收斂到最大值。本文定義適應(yīng)度函數(shù)Fit(Wc)[11]如下:
(6)
(7)
(8)
其中,Wc為每一次迭代過程中的權(quán)值矩陣輸入值,當(dāng)訓(xùn)練樣本故障聚類診斷正確時,函數(shù)G(Wc)取值為1;反之,函數(shù)G(Wc)在0~1范圍內(nèi)取值,b1為訓(xùn)練樣本總數(shù)。
每一次迭代過程中,首先計算出所有個體的適應(yīng)度函數(shù)值,具體計算過程是以個體染色體解碼后得到的權(quán)值矩陣Wc作為輸入,按照式(4)、式(5)對所有訓(xùn)練樣本依次進(jìn)行診斷判定,再代入式(6)、式(7)求得個體的適應(yīng)度函數(shù)值,其值越大,復(fù)制到下一代的概率越高,根據(jù)遺傳算法的輪盤選擇機(jī)制獲取最優(yōu)遺傳個體,并判斷最優(yōu)個體是否符合優(yōu)化準(zhǔn)則,若符合,輸出自家個體代表的最優(yōu)解,并結(jié)束計算,否則繼續(xù)進(jìn)行步驟(3)。
(3)對權(quán)值矩陣進(jìn)行優(yōu)化。權(quán)值矩陣的優(yōu)化具體體現(xiàn)為種群個體適應(yīng)度函數(shù)值的提高,依據(jù)種群中個體適應(yīng)度函數(shù)選擇復(fù)制個體,適應(yīng)度高的個體選擇復(fù)制的概率高,適應(yīng)度低的個體則可能被淘汰;對當(dāng)次循環(huán)中最優(yōu)個體返回的染色體進(jìn)行解碼,即可得到當(dāng)次循環(huán)優(yōu)化后的權(quán)值矩陣。
(4)交叉生成新個體。對于步驟(3)中適應(yīng)度值低的個體,按照一定的交叉概率與交叉方法生成新的個體并添加到種群中,進(jìn)行下一輪迭代;其中交叉方法選定為單點交叉,如圖3所示。
圖3單點交叉
圖3單點交叉(5)變異生成新個體。對于步驟(3)中適應(yīng)度值低的個體,按照一定的變異概率與變異方法,生成新的個體添加到種群中,在種群個體數(shù)保持不變的情況下進(jìn)行下一輪迭代,變異方法如圖4所示。
圖4 變異
(6)迭代求取最優(yōu)權(quán)值矩陣。由交叉和變異產(chǎn)生新一代的種群,返回步驟(2),進(jìn)行下一輪迭代;通過交叉操作和變異操作,調(diào)整適應(yīng)度值低的個體權(quán)值矩陣編碼,當(dāng)訓(xùn)練樣本故障分類判定錯誤時,在下一輪迭代中,正確判定故障分類的方法權(quán)值得到提高,并相應(yīng)調(diào)低錯誤判定故障分類的方法權(quán)值,實現(xiàn)新生個體適應(yīng)度函數(shù)值的增加;當(dāng)達(dá)到設(shè)定的迭代最大次數(shù)時,迭代完成,此時若適應(yīng)度函數(shù)并未收斂,則需增大迭代次數(shù),直到滿足優(yōu)化準(zhǔn)則中的一條,結(jié)束計算,并返回最優(yōu)權(quán)值矩陣。
其中步驟(2)與步驟(6)的優(yōu)化準(zhǔn)則如下(設(shè)定滿足其中一條即可):①種群中個體的平均適應(yīng)度超過預(yù)先設(shè)定值,預(yù)先設(shè)定值由適應(yīng)度值可能達(dá)到的最大值與求解精度決定;②適應(yīng)度函數(shù)在達(dá)到種群世代數(shù)前收斂(運(yùn)行到超過預(yù)先設(shè)定值,即迭代次數(shù)達(dá)到/超過最大值)。
權(quán)值矩陣優(yōu)化流程圖如圖5所示。
圖5 權(quán)值矩陣優(yōu)化流程圖
通過機(jī)械故障綜合模擬實驗臺分別采集內(nèi)圈故障、滾珠故障、正常狀態(tài)和外圈故障4種單一模式下的軸承振動信號,每種故障狀態(tài)分別對應(yīng)一個模擬故障軸承,各軸承結(jié)構(gòu)尺寸一致,分別進(jìn)行振動測試,實驗臺工作轉(zhuǎn)頻為1797 r/min,采樣頻率為12 kHz。
隨機(jī)選取軸承內(nèi)圈故障、滾珠故障、正常狀態(tài)和外圈故障樣本各100個,共400個訓(xùn)練樣本,用EMD方法提取每類狀態(tài)的樣本特征,取每組特征向量的前7維構(gòu)成訓(xùn)練樣本矩陣Q。分別采用社團(tuán)聚類算法、K-均值聚類算法與粒子群聚類算法對軸承故障訓(xùn)練樣本進(jìn)行聚類診斷,每類算法取10次聚類診斷的平均結(jié)果作為最終診斷輸出,結(jié)果見表1。則有
表1三種聚類方法對訓(xùn)練樣本單一診斷正確率 %
內(nèi)圈故障滾珠故障正常外圈故障樣本整體社團(tuán)聚類9072968084.5K-均值聚類6660807269.5粒子群聚類9084906682.5
對P進(jìn)行預(yù)加權(quán)調(diào)整,根據(jù)式(2)有
同理,可計算得到初始權(quán)值矩陣W:
采用遺傳算法優(yōu)化初始權(quán)值矩陣,過程原理如下。
假設(shè)某一訓(xùn)練樣本j為軸承滾珠故障樣本,用社團(tuán)聚類、K-均值聚類和粒子群聚類3種診斷方法分別判定其為軸承內(nèi)圈故障、軸承滾珠故障和正常狀態(tài),由式(3)得該訓(xùn)練樣本的初始判斷矩陣R(j):
其中,初始判斷矩陣R(j)的4列分別對應(yīng)4種軸承狀態(tài):內(nèi)圈故障、滾珠故障、正常狀態(tài)和外圈故障,3行分別對應(yīng)3種診斷方法:社團(tuán)聚類、K-均值聚類和粒子群聚類。
由式(8)可得
Vjmax=0.3659,最大值處于第1列,即融合診斷后判定訓(xùn)練樣本j為內(nèi)圈故障,判定錯誤,通過交叉操作和變異操作對初始權(quán)值矩陣W進(jìn)行調(diào)整,使W11變小,W22變大,同時修正聚類模型。再對訓(xùn)練樣本j進(jìn)行判定,得
本文將初始權(quán)值矩陣W按照圖3的順序編碼成二進(jìn)制數(shù)值串,遺傳算法具體參數(shù)參照文獻(xiàn)[11]設(shè)定,見表2。
表2 遺傳算法參數(shù)設(shè)置
圖6所示為適應(yīng)度函數(shù)值隨著遺傳代數(shù)的變化曲線,設(shè)定個體平均適應(yīng)度閾值為1×10-6,可以發(fā)現(xiàn)在進(jìn)行第11次迭代時適應(yīng)度函數(shù)已經(jīng)收斂,滿足優(yōu)化準(zhǔn)則2,結(jié)束運(yùn)算,得到優(yōu)化后的權(quán)值矩陣W1:
圖6 遺傳算法適應(yīng)度函數(shù)值隨迭代次數(shù)變化
得到最優(yōu)權(quán)值矩陣W1并對聚類模型進(jìn)行優(yōu)化后,便可對樣本進(jìn)行聚類融合診斷。
隨機(jī)選取軸承內(nèi)圈故障、滾珠故障、正常狀態(tài)和外圈故障樣本各100個,對400個測試樣本進(jìn)行聚類融合診斷,診斷結(jié)果見表3。
表3 聚類優(yōu)化融合對測試樣本診斷正確率 %
對比表3與表1可知,聚類優(yōu)化融合診斷整體識別率明顯提高,滾動體故障與正常狀態(tài)能夠完全識別,內(nèi)圈故障識別率提高到96%,外圈故障識別率提高到88%。這說明聚類優(yōu)化融合診斷方法明顯優(yōu)于單一聚類診斷方法。
本文提出了一種聚類優(yōu)化融合故障診斷方法,通過單一聚類診斷獲得初始權(quán)值矩陣,利用遺傳算法優(yōu)化判定權(quán)值與聚類模型,聚類融合診斷取長補(bǔ)短,消除了單一融合診斷方法的不確定性與片面性,以軸承故障診斷實例驗證了該方法的優(yōu)越性,本文研究結(jié)果有重要的應(yīng)用參考價值。
[1]Deng Zhaohong,Choi K S,Chung Fulai,et al.Enhanced Soft Subspace Clustering Integrating within Cluster and Between-cluster Information[J].Pattern Recognition, 2010,43(3):767-781.
[2]Everitt B S,Landau S,Leese M,et al.Cluster Ana-lysis [M]. London: Wiley,2011.
[3]Park H S,Jun C H.A Simple and Fast Algorithm for K-medoids Clustering[J].Expert Systems with Applications,2009,36(2):3336-3341.
[4]陳安華,周博,張會福,等.基于改進(jìn)人工魚群算法的機(jī)械故障聚類診斷方法[J].振動與沖擊,2012,31(17):145-148.
Chen Anhua,Zhou Bo,Zhang Huifu,et al.A Clustering Method for Mechanical Fault Diagnosis Based on Improved Fish-swarm Algorithm[J].Journal of Vibration and Shock,2012,31(17):145-148.
[5]陳安華,潘陽,蔣玲莉.基于復(fù)雜網(wǎng)絡(luò)社團(tuán)聚類的故障模式識別方法研究[J].振動與沖擊,2013,32(20):129-133.
Chen Anhua,Pan Yang,Jiang Lingli.Fault Pattern Recognition Method Based on Complex Community Clustering[J].Journal of Vibration and Shock,2013,32(20):129-133.
[6]Richhariya V,Sharma N.Optimized Intrusion Detection by CACC Discretization via Naive Bayes and K-Means Clustering[J].International Journal of Computer Science & Network Security,2014,14(1):54-58.
[7]Runkler T A, Katz C.Fuzzy Clustering by Particle Swarm Optimization[C]//IEEE International Conference on Fuzzy Systems.Vancouver,2006: 601-608.
[8]Liu Y C,Xu J X.Risk Evaluation of CCIT Model in Ant Colony Housing Supply Based on AHP-grey Clustering Method[J].Applied Mechanics and Materials,2013, 380/384: 2520-2523.
[9]蔡艷平,李艾華,石林鎖,等.基于EMD與譜帩度的滾動軸承故障檢測改進(jìn)包絡(luò)譜分析[J].振動與沖擊,2011,30(2):167-172.
Cai Yanping,Li Aihua,Shi Linsuo,et al.Roller Bearing Fault Detection Using Improved Envelope Spectrum Analysis Based on EMD and Spectrum Kurtosis[J]. Journal of Vibration and Shock,2011,30(2):167-172.
[10]Holland J H.Adaptation in Natural and Artificial Systems:an Introductory Analysis with Applica-tions to Biology,Control,and Artificial Intelligence[M].2nd ed.Cambridge:MIT Press,1992.
[11]何大闊,王福利,張春梅.基于均勻設(shè)計的遺傳算法參數(shù)設(shè)定[J].東北大學(xué)學(xué)報(自然科學(xué)版),2003,24(5):409-411.
He Dakuo,Wang Fuli, Zhang Chunmei.Establishment of Parameters of Genetic Algorithm Based on Uniform Design[J].Journal of Northeastern University(Natural Science),2003,24(5):409-411.
(編輯陳勇)
Clustering Optimization Fusion Method for Fault Diagnosis and Its Applications
Jiang Lingli1,2Mo Zhijun1Chen Anhua1Li Xuejun1
1.Hunan Provincial Key Laboratory of Health Maintenance for Mechanical Equipment,Hunan University of Science and Technology, Xiangtan, Hunan, 411201 2. Suzhou Dongling Vibration Test Instrument Limited Company, Suzhou, Jiangsu, 215163
Single community diagnosis clustering methods were difficult to identify different fault states, in order to improve diagnostic accuracy, a fusion clustering method was proposed herein based on genetic optimization algorithm. Three clustering methods, the community clustering, the K-means clustering and the particle swarm clustering, were used to identify the fault states respectively. The diagnostic accuracies were used to construct an initial weight matrix. The genetic optimization algorithm was used to optimize the weight matrix. The examples of bearing fault diagnosis show that the clustering optimization fusion method may improve diagnostic accuracy.
clustering analysis;weight matrix;fusion diagnosis;genetic algorithm
2015-10-09
國家自然科學(xué)基金資助項目(51575177);湖南省教育廳優(yōu)秀青年項目(14B057) ;湖南省教育廳資助重點項目(13A023)
TP206.3 ;TH17DOI:10.3969/j.issn.1004-132X.2016.15.012
蔣玲莉,女,1981年生。湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)省重點實驗室副教授,蘇州東陵振動試驗儀器有限公司博士后研究人員。主要研究方向為動力學(xué)與故障診斷。莫志軍,男,1992年生。湖南科技大學(xué)機(jī)電工程學(xué)院碩士研究生。陳安華,男,1963年生。湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)省重點實驗室教授。李學(xué)軍,男,1969年生。湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)省重點實驗室教授。