謝鋒云,姜永奇,馮春雨,王二化,劉翊
(1.華東交通大學機電與車輛工程學院,江西南昌 330013;2.常州信息職業(yè)技術學院常州市高端制造裝備智能化技術重點實驗室,江蘇常州 213164;3.國家先進軌道交通裝備創(chuàng)新中心,湖南株洲 412000)
牽引座位于機車箱體下部縱梁上,是機車關鍵零部件之一,其作用是將機車產生的牽引和制動作用傳遞到機車走行部進而實現機車車輛的行進和制動。由于牽引座反復承受和傳遞機車產生的作用力,因此在機車運行中容易出現裂紋等機械故障,影響機車運行狀態(tài)。因為機車牽引座在機車安全可靠運行中起到的重要作用,其結構是否安全可靠將直接關系機車運行的安全性。
在以往的機械設備狀態(tài)識別研究中,由于機械設備的運轉存在平穩(wěn)性和非平穩(wěn)性,進行振動信號分析是機械設備狀態(tài)識別的重要方法。振動信號通常涵蓋了時間特征、頻率特征、能量值、信息熵等多種信息,通過分析這些信息能夠了解掌握機械設備運行狀態(tài),及時發(fā)現設備出現故障情況。所以如何能夠準確、快捷地分析采集的信號并最終得到準確分析識別結果成為了眾多學者研究的方向。馮春雨在牽引座的故障診斷方法方面進行了很多有益的嘗試和研究,特征指標參數采用時域指標和EEMD(Ensemble Empirical Mode Decomposition)分解指標,再用KNN(K-Nearest Neighbor)算法進行識別。但是在時域指標以及EEMD指標選擇上還有待進一步的研究,KNN算法輸入參數選擇上也可以進一步研究。申炎仃等提出了一種改進EMD和小波閾值的方法,用于材料斷裂故障的智能診斷。EEMD算法是對EMD算法的改進,可以有效抑制模態(tài)混疊現象,具有實際物理意義。在振動診斷過程中模式識別方法的選擇也非常重要,目前在模式識別中應用較為廣泛的方法主要有K鄰近算法(KNN)。HUANG等基于類貢獻和特征加權,得到K-最鄰近數,與平均距離結合得到最終標簽,優(yōu)化后的KNN提高了分類精度。但是,KNN算法在處理分類決策問題時仍存在不足之處,即樣本數量不滿足平衡條件時,發(fā)生近鄰樣本容錯數量過大現象,導致分類決策出現偏差,進而影響了KNN算法的廣泛應用。
機械設備故障診斷技術發(fā)展可謂日新月異,很多專家學者都對故障診斷技術應用于機車的故障診斷進行了很多有益的嘗試并取得了良好的結果,所以利用振動診斷技術進行牽引座裂紋故障狀態(tài)識別研究是可行的。因此本文作者提出基于EEMD-KNN算法方法對機車牽引座故障狀態(tài)進行識別。
EMD為數據本身驅動的自適應分解方法,可以得到一組包含真實物理意義以及瞬時頻率特性的本征模態(tài)函數(IMF)。在每個IMF分量中,過零點總數、極值點總數必須相等或者最多相差一個,每個數據點的局部極大值與極小值對應的上下包絡線的均值必須等于零。
由于振動信號采集過程中會出現脈沖、間歇性等復雜情況,EMD分解過程可能會出現模態(tài)混疊現象。EEMD即集合經驗模態(tài)分解就是為了解決該問題而產生的,因此EEMD是一種改善了EMD的局限性且非常適合分析非線性、非平穩(wěn)信號的時頻分析方法。EEMD在EMD的基礎上,向原始信號中多次增加均值為零、頻率均勻的隨機白噪聲,分解時仍然采用EMD分解方法,最后對IMF分量平均化處理。
EEMD分解步驟為:
(1)向采集振動信號中多次添加隨機白噪聲序列():
()=()+()
(1)
(2)對()進行EMD分解,重復次,獲得組IMFs;
(3)對所有IMFs求平均值,獲得最終IMF分量:
(2)
其中:,()為第次EMD分解所得到第個IMF分量。
由于KNN算法的簡單、便捷、高效性、準確性,成為了應用最廣泛的機器學習算法之一。
KNN算法流程的核心思想是統(tǒng)計未知樣本周圍一定范圍內的全部已知點及其類別,然后把樣本歸為統(tǒng)計量最多的已知點所在的類別。該算法在處理分類決策問題時,只統(tǒng)計最鄰近的已知點及其類別,單純比較已知點數量,進而判定該類別,不需要判斷其他類域等問題。因此對于類別之間交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。
KNN的算法步驟如下:
(1)統(tǒng)計未知點一定范圍內已知點及其類別;
(2)計算已知點數最多的類別;
(3)將未知點歸于上述類別;
(4)一定范圍內值一般是根據經驗設定的。
為研究早期裂紋發(fā)生以及發(fā)展的進程,實驗應盡量在同等加工條件下,采用同等材質材料;參考現行車輛段修規(guī)程,參照實際牽引座形制以及實際裂紋發(fā)生情況,采用15 mm厚鋼板制作正常、小裂紋(寬度為1 mm)以及大裂紋(寬度為2 mm)狀態(tài)的實驗模型。實驗裝置示意如圖1所示,實驗器材如圖2所示。
圖1 實驗裝置示意
圖2 實驗器材
數據采集實驗過程,利用專業(yè)采集信號軟件YE7600,調整“示波”、 “零漂采集”等標準,將觸發(fā)方式設為“定時觸發(fā)”,采樣頻率設為12 kHz,采樣時長設為5 s,采樣間隔設為30 min,以便于設備進行數據采集。為保證數據的有效性和可靠性,采集數據的過程是隨機進行的;每種狀態(tài)分別采集100組數據,一共300組,登記存儲數據zc-1,…,100;xlw-1,…,100;dlw-1,…,100。
分別截取上述采集的3種狀態(tài)(zc-10、xlw-10和dlw-10)數據的某段時長0.5 s、采樣點數6 000的數據,繪制原始信號圖,如圖3所示。
圖3 不同狀態(tài)時域分析圖
從圖3可以看出:幅值、波形等存在明顯變化情況,分別計算時域特征(峰-峰值、方差、峭度),計算結果見表1。
表1 3種狀態(tài)時域指標對比
表1計算結果的差異性驗證了所選時域特征的準確性,將上述時域特征結果合并為時域特征矩陣,記為[,,]。
原始信號經過EEMD分解,得到12個IMF分量和1個殘差分量。為了分析這些分量與原始信號的相關性,分別計算每一個分量與原始振動加速度信號之間的相關系數,計算結果如表2所示。
表2 各分量與原始信號相關系數
由表2可以看出:IMF1分量與原始信號的相關系數近似接近1.0,相關系數越大,相關性越好,則所包含的有用信息也就越多;反之則所包含的有用信息較少。綜合以上分析,最終選取前5個分量用于后面的狀態(tài)識別研究。
因KNN算法只能識別量化后的敏感特征參數,將IMF分量波形進行量化的方式是計算各分量能量所占比例,將計算結果記為特征矩陣,記為[,,,,]。
將上述特征矩陣拆分為KNN的訓練集和測試集。240個樣本的5個特征作為訓練集,42個樣本的5個特征作為測試集。對所有樣本進行歸一化,將正常、小裂紋、大裂紋3種狀態(tài)的識別結果的標簽分別記為00、01、10。經過交叉驗證以及比較認為值等于4比較好。只使用EEMD分解得到的分量作為特征矩陣,KNN算法的牽引座狀態(tài)識別結果如表3所示。
表3 各狀態(tài)識別結果
在表3中,帶下劃線的數字表示識別錯誤。表3顯示:所有42個識別結果中,有35個結果識別準確,準確率為83.3%。分析出現這個結果的原因,觀察到特征矩陣有些數據相似。
分析了EEMD特征矩陣相似性的局限后,再將時域特征加入EEMD特征矩陣構成全新的特征矩陣,即240個樣本的8個特征作為訓練集,42個樣本的8個特征作為測試集,記為[,,,,,,,]。沿用前面的便簽,同樣對所有樣本進行歸一化處理。再經過交叉驗證以及比較認為值等于6比較好。最終KNN算法的牽引座狀態(tài)識別結果如表4所示,42個結果識別正確,4個結果識別錯誤,識別率達到90.5%。表明加入時域特征后KNN算法的牽引座狀態(tài)識別率更高。
表4 各狀態(tài)識別結果
為了將故障診斷技術應用于牽引座結構缺陷裂紋狀態(tài)的識別,文中提出將時域、EEMD分解后的時頻域特征相結合作為敏感特征矩陣,構建了KNN算法識別模型,針對采集到的振動信號進行了牽引座的3種不同狀態(tài)識別。結果表明有較好的識別率,達到了83.3%。而且,加入時域敏感特征之后的識別結果顯示,KNN算法的識別效果更好,識別率達到90.5%。分析其原因,KNN算法在加入更多特征之后,每個已知點的空間定位更準確了,尋找最鄰近的個已知點時距離計算也更加精準,進而提高了KNN識別準確率。由于實驗條件和實驗平臺的局限性,以及KNN及其構建模型的局限性,得到的結果存在一定的失真性和誤差,這也為今后提高識別率提供了思考方向和研究側重點。