羅怡瀾,鄒益勝,王 超,鄧佳林
(西南交通大學(xué)機械工程學(xué)院先進設(shè)計與制造研究所,四川 成都 610031)
溫度是反映軸承熱狀態(tài)的最直接參量,因此可基于溫度信號對軸承異常溫升進行診斷,進而預(yù)警熱軸故障。軸承磨損退化可能造成軸溫升高,而正常工況下軸承轉(zhuǎn)速、載荷、環(huán)境溫度的變化亦可引起軸承溫升[1]。軸承溫度信息能有效表征其健康狀況,而軸承溫升原因的不確定性是基于溫度信號進行故障診斷的難點。
在機車車輛軸溫異常判別在熱軸判別研究方面,文獻[2-5]分別基于模糊判別法、模糊神經(jīng)網(wǎng)絡(luò)、增量型極限學(xué)習(xí)機、DTW算法建立了熱軸等級判別模型,避免了絕對閾值判別的局限性,提高了熱軸判別準(zhǔn)確性,此類方法本質(zhì)上屬于建立固定異常模型,為獲得準(zhǔn)確且具有泛化能力的異常判別模型,需要大量不同工況不同等級下熱軸故障歷史數(shù)據(jù),而在車輛運行中引起軸承溫升原因多樣且耦合作用,列車軸溫測點分布于整車,測點數(shù)量多,工況差異大且熱軸故障發(fā)生次數(shù)較少,難以建立準(zhǔn)確有效的基于已標(biāo)記歷史數(shù)據(jù)的故障識別模型,且難以規(guī)避軸承溫升原因多樣性帶來的誤判。文獻[6]針對風(fēng)電設(shè)備齒輪箱狀態(tài)監(jiān)測問題、應(yīng)用非線性估計法(NSET)基于歷史數(shù)據(jù)建立了運行工況-齒輪箱溫度的狀態(tài)估計模型,以實測溫度值與模型估計值偏差統(tǒng)計量評價設(shè)備溫度異常程度。此類方法致力于構(gòu)建標(biāo)準(zhǔn)正常模型,在建模數(shù)據(jù)選取中難以保證設(shè)備不存在退化或異常狀況,而正常模型偏差量將通過估計值影響判別結(jié)果。綜上所述,在基于溫度信號的故障診斷中由引起溫升因素的多樣性和復(fù)雜性帶來的判別難點仍然未得到良好解決。
針對上述問題,提出基于關(guān)聯(lián)測點進行軸承異常溫升診斷的思想:即基于列車同車相對位置一致測點,在車輛運行過程中所受外界激勵相似,其溫度變化應(yīng)呈現(xiàn)近似趨勢的假設(shè),將異常溫升診斷問題轉(zhuǎn)化為尋找多組關(guān)聯(lián)序列中少數(shù)持續(xù)離群子序列的問題。
同時,通過對軸溫特征空間分布特點的進一步分析發(fā)現(xiàn):當(dāng)測點溫升正常時,空間分布均勻,無明顯密度差異,而當(dāng)少數(shù)測點溫升異常時,溫度特征的空間分布發(fā)生改變,具體表現(xiàn)為:(1)溫升特征空間位置分化;(2)高密度區(qū)域和低密度區(qū)域的分化。因此,對異常溫升的診斷問題進一步轉(zhuǎn)化為:(1)特征空間中少數(shù)分布位置離群樣本的檢測問題;(2)特征空間高密度區(qū)域與低密度區(qū)域的分割問題。
由于聚類算法能在沒有歷史訓(xùn)練數(shù)據(jù)的前提下較好解決離群樣本的判別問題和密度區(qū)域的分割問題,故擬采用該種算法?,F(xiàn)有聚類算法主要分為層次型聚類算法和分割式聚類算法[7]。層次型聚類算法采用自底向上的凝聚模型或自頂向下的分裂模型,不斷將相似的簇合并或不斷分裂出不同的簇。分割式聚類算法同時找出數(shù)據(jù)中相似簇,在模式識別問題中應(yīng)用更為廣泛,文獻[7]是應(yīng)用最為廣泛的分割式聚類算法,具有收斂速度快、簡單等優(yōu)點,但Kmeans以絕對距離作為相似度評價指標(biāo),并以所有樣本點到聚類中心距離的均值作為收斂標(biāo)準(zhǔn),使得其只能發(fā)現(xiàn)數(shù)據(jù)中規(guī)則的球形簇,對非規(guī)則形狀簇易出現(xiàn)樣本混疊,且聚類中心位置受噪聲點擾動較大。針對這一問題文獻[8]提出k-medias算法以中位值代替均值,增強算法抗擾動能力。文獻[9]提出核k均值法,通過將數(shù)據(jù)向核空間映射,使簇間的非規(guī)則邊界顯著化,再在核空間內(nèi)進行Kmeans聚類,提高了算法處理非規(guī)則形狀數(shù)據(jù)的能力。文獻[10]針對滾動軸承故障診斷中內(nèi)圈、滾動體或多點故障時很難從解調(diào)譜線分辨故障類型的問題,提出了一種新的基于模糊聚類的滾動軸承故障診斷方法,該方法以模糊Fisher準(zhǔn)則為聚類目標(biāo),通過對待測樣本與已知狀態(tài)樣本數(shù)據(jù)聚類,求得待測樣本隸屬度,進而判斷滾動軸承的故障類型。
經(jīng)典的Kmeans及其相關(guān)改進算法,本質(zhì)上根據(jù)樣本點之間距離評價其相似度,結(jié)合策略能有效辨別異常溫升,但不能對局部密度差異進行判別,導(dǎo)致正常溫升誤判嚴(yán)重。文獻[11]是一種基于密度的經(jīng)典聚類方法,但該算法中的簇半徑和鄰域內(nèi)最小密度這兩個參數(shù)對判別結(jié)果比較敏感,而合理選取這兩個參數(shù)主要依賴使用者的經(jīng)驗,導(dǎo)致判別結(jié)果的不確定性增大。針對參數(shù)選擇問題,文獻[11]采用K鄰域方法,文獻[12]采用網(wǎng)格劃分技術(shù)等進行了改進,但由于軸溫數(shù)據(jù)特征隨著軸承故障的動態(tài)發(fā)展在不同階段分布體現(xiàn)出不同的特點,且有較大的隨機性,因此在聚類參數(shù)選取的自適應(yīng)性方面需要進一步研究。
針對經(jīng)典聚類算法在機車車輛軸承異常溫升診斷中存在的不足,提出一種基于Kmeans-DBSCAN融合聚類的軸溫異常診斷模型。通過對同車同類關(guān)聯(lián)測點溫度特征進行聚類找出溫度變化離群測點,實現(xiàn)了無歷史訓(xùn)練模型的軸溫異常檢測。根據(jù)異常溫升測點溫度特征相比其鄰近同類測點,具有空間位置和分布局部密度差異性的特點,首先利用Kmeans對溫度特征進行聚類,對關(guān)聯(lián)測點溫度特征空間分布進行初步判斷,確定其空間位置差異性。在此基礎(chǔ)上,以多數(shù)簇半徑作為鄰域半徑進行DBSCAN聚類,確定其密度評價鄰域,實現(xiàn)溫度特征分布局部密度差異性檢測,通過兩種聚類算法的融合實現(xiàn)了異常溫升的準(zhǔn)確診斷,大大降低了漏判率和誤判率。最后通過某軌道車輛的運行數(shù)據(jù)驗證了這里方法的正確性和可靠性。
根據(jù)對軸承溫升機理的分析,軸承溫升與其轉(zhuǎn)速、載荷、環(huán)境溫度、等工況參數(shù)密切相關(guān),同列車同類溫度測點軸承運行工況參數(shù)近似,是關(guān)聯(lián)測點,如圖1所示。為同車4根軸上小齒輪箱電機側(cè)軸承測點溫度變化情況,相關(guān)測點狀態(tài)均無明顯異常,其溫度應(yīng)隨列車運行工況同步變化,趨勢近似。反之,故障軸承測點溫度與其同類關(guān)聯(lián)測點相比呈現(xiàn)明顯差異,如圖2所示。且差異持續(xù)存在并隨工況變化(加速、制動、載荷增加)趨于顯著化。從軸承可靠性設(shè)計角度出發(fā),同車同類測點在壽命周期內(nèi)同時失效的概率小于0.01%[13],且歷史履歷數(shù)據(jù)中并未發(fā)現(xiàn)多個同類測點同時發(fā)生故障的工況。基于上述分析,假設(shè)多個同類測點軸承不會同時失效,通過檢測關(guān)聯(lián)溫度測點中高溫持續(xù)離群測點,進而實現(xiàn)軸承異常溫升的診斷。
圖1 正常工況關(guān)聯(lián)測點溫度變化Fig.1 Correlation Measure Points Temperature Change in Normal Condition
圖2 異常工況下關(guān)聯(lián)測點溫度變化Fig.2 Correlation Measure Points Temperature Change in Abnormal Condition
基于上節(jié)所述思想,為避免關(guān)聯(lián)測點單個時間點溫度值比較的隨機性,側(cè)重于展現(xiàn)關(guān)聯(lián)測點間溫度變化差異隨時間變化趨勢,同時滿足后續(xù)聚類檢測中樣本數(shù)量要求,以原溫度信號輸入,采用滑動時間窗口將溫度序列從一維空間向高維空間映射,將某時刻溫度歷史鄰域劃分為多個時間窗口,提取其最大值、最小值、峰值、峰-峰值、均值、方差、均方值、均方幅值、方根幅值、平均幅值、峰值指標(biāo)、波形指標(biāo)、脈沖指標(biāo)、裕度指標(biāo)、峭度指標(biāo)15維時域特征,由于Kmeans算法及DBSCAN算法對低維度數(shù)據(jù)的聚類效果更優(yōu),且時域特征空間中存在特征冗余。在軸溫異常檢測中需構(gòu)建合理的樣本空間,使得異常測點與正常測點溫度特征分化明顯,以保證準(zhǔn)確判別異常溫升,同時避免誤判。異常溫升測點(測點3),及其關(guān)聯(lián)測點溫度時域特征空間分布情況,如圖3所示。圖3為最大值、方差特征布情況,由圖3可知,正常測點,測點1、測點2、測點4特征分布集中與異常測點3溫度特征分布分化較為顯著。波形指標(biāo)、峰值標(biāo)構(gòu)成的特征空間,其中正常測點與異常測點分布差異顯著度相對圖3較低,如圖4所示。綜上所述需對特征空間進行空間重構(gòu),消除噪聲及冗余信息。
圖3 異常溫升最大值-方差分布Fig.3 The Maximum Value and Variance Distribution of Abnormal Temperature
圖4 異常溫升波形指標(biāo)、峰值指標(biāo)分布Fig.4 Shape Factor and Crest Factor Distribution of Abnormal Temperature Rise
主成分分析法(PCA)可以將高維數(shù)據(jù)向低維空間映射,去除冗余數(shù)據(jù)同時保留原數(shù)據(jù)最主要特征[14]。將PCA應(yīng)用于15維時域特征空間,按95%特征貢獻率提取其特征主成分。異常溫升工況與正常工況下關(guān)聯(lián)測點溫度時域特征主成分,如圖5、圖6所示。由圖5可知當(dāng)異常溫升出現(xiàn)時,異常測點特征主成分離群現(xiàn)象明顯,具體體現(xiàn)為特征空間位置與局部密度的差異。而正常工況下則無特征離群測點出現(xiàn),如圖6所示。
圖5 異常溫升特征主成分分布Fig.5 The Principal Component Distribution of Abnormal Temperature Rise
圖6 正常溫升關(guān)聯(lián)測點特征分布Fig.6 The Principal Component Distribution of Normal Temperature Rise
根據(jù)對關(guān)聯(lián)測點溫度特征空間分布的分析,異常溫升測點特征相比其鄰近同類測點具有空間位置和分布局部密度差異性。Kmeans聚類算法能較好地辨識特征空間位置差異性,實現(xiàn)異常溫升的判別,但對正常溫升誤判較多,DBSCAN聚類算法能有效識別特征空間分布的密度差異,但其密度評價鄰域由輸入?yún)?shù)鄰域半徑(Eps)決定,Eps的確定需基于特征空間分布的先驗信息。高速列車軸溫的異常檢測需實時在線進行,故要求聚類算法能夠根據(jù)不同的軸溫特征分布自適應(yīng)地選擇參數(shù)。
針對上述問題提出一種基于Kmeans-DBSCAN融合聚類的異常溫升診斷模型。結(jié)合異常溫升特征空間分布特點及異常檢測二分類問題特點,先對溫度特征空間進行一次Kmeans聚類(k=2),對特征位置差異進行判斷,按各測點多數(shù)樣本所屬簇給定類標(biāo)簽,避免由于個別樣本帶來的誤判,考察是否有測點屬于孤立類,同時獲取溫度特征分布先驗信息。若存在孤立類,則以多數(shù)簇的最大半徑作為鄰域半徑Eps,以單個測點樣本數(shù)作為最小鄰域密度Minpts,進行DBSCAN聚類,判斷其分布密度是否存在顯著差異。若測點特征同時滿足位置差異性與分布密度差異性即判斷為異常溫升。算法設(shè)計針對異常溫升特征特點,結(jié)合Kmeans、DBSCAN聚類算法對不同問題的判別優(yōu)勢,最大可能避免了漏判誤判情況的發(fā)生。算法流程,如圖7所示。
圖7 基于Kmeans-DBSCAN融合聚類的異常溫升診斷模型算法Fig.7 Abnormal Temperature Rise Diagnosis Model Algorithm Based on Kmeans-DBSCAN Fusion Clustering
(1)算法步驟1
為建立測點某時刻溫度與其時間鄰域內(nèi)溫度值關(guān)聯(lián)關(guān)系,同時滿足后續(xù)聚類檢測中樣本數(shù)量要求,針對時間點t,在其歷史時間鄰域[t-T+1,t]內(nèi)設(shè)置寬度為w的滑動窗口,滑動因子為δ=1,用滑窗將同列車同類s個關(guān)聯(lián)測點溫度監(jiān)測數(shù)據(jù)片段化,提取共(T-w+1)s個時間窗口內(nèi)的最大值、最小值、峰值、峰峰值、均值、方差、均方值、均方幅值、方根幅值、平均幅值、峰值指標(biāo)、波形指標(biāo)、脈沖指標(biāo)、裕度指標(biāo)、峭度指標(biāo)共15維時域特征,得描述窗口內(nèi)溫度變化的關(guān)聯(lián)測點特征空間X,其中,單個測點樣本數(shù)N=T-w+1。
提取特征空間主成分:
(1)對15維時域特征樣本進行標(biāo)準(zhǔn)化處理消除不同特征量綱帶來的差異,得標(biāo)準(zhǔn)化特征矩陣并計算其協(xié)方差矩陣:
(2)求特征矩陣和特征值與特征向量:
(3)按特征累積貢獻率確定主成分個數(shù),特征貢獻率表征主成分表達前n維主成分所包含信息占原特征集X信息比例,取累積貢獻率大于95%確定主成分維數(shù)n。
則確定主成分分析投影方向為前n個特征值向量即V15×n=[v1,v2,…,vn]將原特征集合X向該方向投影,得降維后特征空間Y。
(2)算法步驟2
對關(guān)聯(lián)測點溫度特征主成分特征集Y進行Kmeans聚類,k=2,給定各關(guān)聯(lián)測點的數(shù)據(jù)樣本類標(biāo)簽向量label(label=1,2),按測點統(tǒng)計樣本類標(biāo)簽,對測點k(k=1,2…s)按如下準(zhǔn)則進行統(tǒng)計,以測點樣本所屬多數(shù)類作為該測點類標(biāo)簽。
得s個關(guān)聯(lián)測點類標(biāo)簽class,統(tǒng)計各類測點數(shù)量,考察是否存在孤立類測點:
式中:r0—孤立類測點判別閾值,當(dāng)某類測點數(shù)量小于r0時,outliter=1,存在孤立類測點,孤立類測點即為滿足判別條件測點。
(3)算法步驟3
若Kmeans聚類檢測出孤立測點,計算多數(shù)簇最大簇半徑:
其中:n—多數(shù)簇內(nèi)樣本數(shù)。
對關(guān)聯(lián)測點溫度特征集合D按[11]中所述流程進行DBSCAN聚類:根據(jù)關(guān)聯(lián)測點異常溫升特征呈現(xiàn),異常測點樣本分布稀疏,而多數(shù)正常測點樣本分布相對集中的特點。Eps取為上步Kmeans聚類結(jié)果中多數(shù)類樣本最大距離的一半dmax/2,Minpts設(shè)為單個測點樣本數(shù)。若多數(shù)類與少數(shù)類間分布密度差異顯著,聚類結(jié)果中出現(xiàn)多數(shù)類測點樣本均歸為同類,而少數(shù)類測點樣本全被歸為噪聲,則判定該噪聲類測點為異常測點。若多數(shù)類與少數(shù)類分布密度相近,DBSCAN聚類結(jié)果為同類,判定為不存在異常溫升測點。
以某型機車車輛履歷服役軸溫監(jiān)測數(shù)據(jù)為例,對提出的基于Kmeans-DBSCAN融合聚類的機車車輛軸承異常溫升診斷模型的有效性及優(yōu)越性進行驗證。數(shù)據(jù)來源為某型機車車輛車載軸溫監(jiān)測系統(tǒng)測得同列車上多個軸溫測點溫度,溫度傳感器為pt100采樣頻率為1Hz,監(jiān)測軸溫數(shù)據(jù)傳輸頻率為每分鐘一次,以齒輪箱軸溫測點為例,其位置分布,如圖8所示。根據(jù)同車同類測點工況相近(轉(zhuǎn)速、載荷),相對位置相近,將齒輪箱上16個軸溫測點劃分為4類關(guān)聯(lián)測點,每類包含同車4根車軸上4個測點,如表1所示。根據(jù)異常溫升測點溫度特征連續(xù)時間段內(nèi)離群,且為同類關(guān)聯(lián)測點中最高溫度測點的特點,設(shè)置預(yù)警策略。運用Kmeans-DBSCAN融合的異常診斷模型進行異常溫升預(yù)警。
圖8 測點分布位置Fig.8 Location of Measure Points
表1 關(guān)聯(lián)測點劃分Tab.1 Location of Measure Points
選取小齒輪箱電機側(cè)軸承、小齒輪箱電機側(cè)軸承軸溫數(shù)據(jù)200min,如圖9、圖10所示。其中3軸測點存在異常溫升,現(xiàn)有閾值預(yù)警法在測點絕對溫度超過環(huán)境溫度80℃時報警,分別運用這里的判別方法,Kmeans,DBSCAN(K鄰域方法確定鄰域半徑)采用同樣的預(yù)警策略結(jié)果,如表2所示。提出的Kmeans-DBSCAN融合判別方法與基于Kmeans的判別法對異常溫升的判別準(zhǔn)確率達100%,而DBSCAN由于參數(shù)選擇不當(dāng)判別準(zhǔn)確率為77.6%,較絕對閾值預(yù)警法,這里方法預(yù)警時間提前57min。選取大齒輪箱車輪側(cè)軸承溫升正常數(shù)據(jù)200min片段、大齒輪電機側(cè)溫升正常數(shù)據(jù)200min片段分別應(yīng)用三種方法對各時刻溫度數(shù)據(jù)進行異常溫升檢測其誤判率,如圖11、圖12及表3所示。Kmeans和DBSCAN最高誤判率分別為12.5%和19%,提出方法誤判率低至0.5%?;贙means-DBSCAN融合聚類的軸溫異常診斷模型相比DBSCAN、Kmeans這兩類經(jīng)典的聚類誤判率顯著降低。對軸承異常溫升與正常溫升數(shù)據(jù)檢測,Intelcore i5-7200,2.5GHz,12GB內(nèi)存,windows10操作系統(tǒng)環(huán)境下模型平均單次運行時間分別為:60ms。算法滿足實時檢測要求。
圖9 小齒輪箱電機側(cè)軸承異常溫升Fig.9 Abnormal Temperature Rise of Bearing in Small Gearbox Motor Side
圖10 小齒輪箱車輪側(cè)軸承異常溫升Fig.10 Abnormal Temperature Rise of Bearing in Small Gearbox Wheel Side
表2 異常溫升判別準(zhǔn)確率Tab.2 Diagnostic Accuracy of Abnormal Temperature Rise
綜合對異常軸承溫升診斷的準(zhǔn)確率及對正常溫升的誤判率,提出的Kmeans-DBSCAN融合聚類算法判別準(zhǔn)確性優(yōu)于兩種經(jīng)典聚類算法,且算法計算效率滿足隨車實時診斷的要求。
圖11 大齒輪箱車輪側(cè)軸承正常溫升Fig.11 Normal Temperature Rise of Bearing in Large Gearbox Wheel Side
圖12 大齒輪箱電機側(cè)軸承正常溫升Fig.12 Normal Temperature Rise of Bearing in Large Gearbox Motor Side
表3 誤判率Tab.3 Misjudgment Rate
針對高速列車異常軸溫預(yù)警中缺乏足夠的已標(biāo)記歷史數(shù)據(jù)難以建立有效的故障辨識模型,及關(guān)聯(lián)測點異常溫升判別準(zhǔn)確率低的問題進行了深入研究,獲得了以下主要結(jié)論:
(1)以工況相近的關(guān)聯(lián)測點溫度變化互為參照通過對其溫度特征進行聚類找出溫度變化離群測點,實現(xiàn)了無歷史訓(xùn)練模型的軸溫異常檢測。
(2)提出了一種基于Kmeans-DBSCAN的關(guān)聯(lián)測點軸溫融合聚類模型,并實現(xiàn)了模型參數(shù)的自適應(yīng)選擇,提高了基于聚類的異常溫升檢測算法準(zhǔn)確性。
(3)實例驗證結(jié)果表明:所提出的Kmeans-DBSCAN融合聚類的軸承異常溫升診斷模型,繼承了Kmeans和DBSCAN算法的優(yōu)點,對故障診斷的準(zhǔn)確率達100%,與Kmeans算法保持一致,比DBSCAN算法提高22.4%;誤報率低至0.5%,比Kmeans算法降低18.5%,比DBSCAN算法降低12%,較好地滿足了機車車輛對于軸承異常溫升的診斷要求,同時預(yù)警時間較現(xiàn)有基于絕對閾值的預(yù)警法提前了57min,該模型的單次運行時間為60ms,可以滿足軸溫在途診斷的實時性要求。
由于僅通過單一的測點溫度信息難以確定引起軸溫異常的原因,在下一步研究中將結(jié)合振動信號分析得出早期異常溫升原因,準(zhǔn)確評價其危害性,從而為做出合理的行車或維護策略調(diào)整提供依據(jù)。