摘要:文章研究了基于小波變換的時(shí)頻域特征提取方法和基于隨機(jī)森林的故障診斷方法,用于機(jī)械振動(dòng)信號的故障檢測與分類。首先,文章采用小波變換對機(jī)械振動(dòng)信號進(jìn)行時(shí)頻域特征提取,生成特征向量;然后,利用隨機(jī)森林算法對提取的特征向量進(jìn)行訓(xùn)練和分類;最后,采用CWRU軸承數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),通過混淆矩陣分析模型的分類性能。結(jié)果表明,所提方法在識別正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動(dòng)體故障時(shí)具有較高的準(zhǔn)確性和魯棒性。
關(guān)鍵詞:小波變換;隨機(jī)森林;機(jī)械振動(dòng);故障檢測
中圖分類號:TH17中圖分類號 "文獻(xiàn)標(biāo)志碼:文獻(xiàn)標(biāo)志碼A
0 引言
隨著工業(yè)設(shè)備復(fù)雜性的增加和運(yùn)行條件的多樣化,傳統(tǒng)的基于規(guī)則的故障診斷方法已逐漸顯露出其局限性[1]。因此,機(jī)器學(xué)習(xí)類方法因其能夠處理非線性、高維度數(shù)據(jù)等特點(diǎn)成為當(dāng)前研究的熱點(diǎn)之一。
近年來,研究者們在機(jī)器學(xué)習(xí)驅(qū)動(dòng)的機(jī)械故障診斷領(lǐng)域取得了顯著研究進(jìn)展[2]。早期的工作集中在特征提取方法的改進(jìn)方面,如頻域分析、時(shí)域分析等[3-4],然而這些方法通常無法充分捕捉到信號的時(shí)頻特征,限制了故障診斷的準(zhǔn)確性和泛化能力。同時(shí),傳統(tǒng)的故障診斷方法在復(fù)雜環(huán)境下表現(xiàn)不佳[5]。例如,工業(yè)設(shè)備在變化多端的工況下,其故障模式通常呈現(xiàn)多樣性和隨機(jī)性,這對傳統(tǒng)方法的穩(wěn)健性提出了更高要求。
基于上述背景,本文主要聚焦于2個(gè)關(guān)鍵內(nèi)容:一是基于小波變換的時(shí)頻域特征提取方法[6-7],小波變換因其能夠同時(shí)提供時(shí)間和頻率信息而被廣泛應(yīng)用于信號處理領(lǐng)域;二是基于隨機(jī)森林的故障診斷方法[8-10]。本文結(jié)合小波變換提取的特征,構(gòu)建針對機(jī)械故障的隨機(jī)森林分類器,并在CWRU軸承數(shù)據(jù)集上進(jìn)行驗(yàn)證和評估。本研究旨在為工業(yè)設(shè)備的實(shí)時(shí)監(jiān)測與故障預(yù)測提供一種新的方法路徑,促進(jìn)機(jī)器學(xué)習(xí)在工業(yè)應(yīng)用中的進(jìn)一步推廣與應(yīng)用。
1 基于小波變換與隨機(jī)森林的故障診斷
1.1 基于小波變換的時(shí)頻域特征提取
小波變換時(shí)頻域特征提取的核心思想是將信號分解到多尺度的時(shí)頻域中并提取每個(gè)尺度上的特征信息。該方法能夠同時(shí)反映信號的時(shí)域和頻域特征,有效地捕捉信號的局部特性,從而更好地應(yīng)用于機(jī)械故障診斷等領(lǐng)域。具體而言,小波變換時(shí)頻域特征提取的核心思想可以概括為以下幾個(gè)方面。
(1)多尺度分析:小波變換是一種多尺度分析方法,可將信號分解到不同尺度的子波分量中。每個(gè)子波分量對應(yīng)于特定的頻率范圍,具有不同的時(shí)間分辨率和頻率分辨率。
(2)時(shí)頻局部化:小波變換具有良好的時(shí)頻局部化特性,這意味著其可以同時(shí)反映信號的時(shí)域和頻域特征,并能夠有效地捕捉信號的局部特性,例如瞬態(tài)沖擊、脈沖等。
(3)特征提取:在每個(gè)尺度上,小波變換都可以提取各種特征信息,例如能量、峰值、方差等。這些特征信息可以反映信號在這個(gè)尺度上的特性,并用于故障診斷等任務(wù)。
本文采用基于小波變換的時(shí)頻域特征提取方法從機(jī)械振動(dòng)信號中提取特征向量。設(shè)機(jī)械振動(dòng)信號為x(t),小波變換的連續(xù)小波系數(shù)W(a,b)定義為:
W(a,b)=∫∞-∞x(t)ψ*a,b(t)dt(1)
其中,ψa,b(t)表示尺度參數(shù)a和平移參數(shù)b下的小波函數(shù),ψ*a,b(t)表示其共軛。小波系數(shù)W(a,b)可以通過卷積操作進(jìn)行計(jì)算,其具體形式為:
W(a,b)=〈x(t),ψa,b(t)〉=∫∞-∞x(t)ψ*a,b(t)dt(2)
為了獲取機(jī)械振動(dòng)信號的特征向量,本文選取合適的小波基函數(shù)ψa,b(t),使其能夠有效地反映出振動(dòng)信號在時(shí)頻域上的特征;通過計(jì)算不同尺度a和平移b下的小波系數(shù)W(a,b),構(gòu)成特征向量W,如式(3)所示。
W=[W(a1,b1),W(a1,b2),…,W(a1,bm),W(a2,b1),…,W(an,bm)]T(3)
其中,a1,a2,…,an表示尺度參數(shù)的集合,b1,b2,…,bm表示平移參數(shù)的集合。特征向量W包含了振動(dòng)信號在不同尺度和平移下的時(shí)頻特征信息,能夠?yàn)楹罄m(xù)的故障診斷與分析提供基礎(chǔ)數(shù)據(jù)。
1.2 基于隨機(jī)森林的故障診斷
得到特征向量W后,本文采用基于隨機(jī)森林的故障診斷方法進(jìn)行分析。隨機(jī)森林的核心思想在于集成學(xué)習(xí),即通過組合多個(gè)學(xué)習(xí)器來提高整體性能,其將多棵決策樹作為基學(xué)習(xí)器,每棵決策樹在不同的訓(xùn)練數(shù)據(jù)集上訓(xùn)練,并根據(jù)投票機(jī)制進(jìn)行預(yù)測。通過融合多個(gè)學(xué)習(xí)器的優(yōu)勢,該方法可以有效降低模型的偏差和方差,提高泛化能力。對于機(jī)械故障診斷問題,隨機(jī)森林能夠有效地處理高維數(shù)據(jù)和復(fù)雜特征,適用于振動(dòng)信號的多類別分類任務(wù)。
設(shè)訓(xùn)練集包含N個(gè)樣本,每個(gè)樣本i的特征向量為Wi=[Wi(1),Wi(2),…,Wi(m)],其中m表示特征向量的維度。隨機(jī)森林的構(gòu)建包括以下步驟。
(1)決策樹的構(gòu)建:隨機(jī)森林由多棵決策樹組成,每棵決策樹通過對訓(xùn)練集進(jìn)行重復(fù)抽樣和特征隨機(jī)選擇來構(gòu)建。若假設(shè)第k棵決策樹的訓(xùn)練樣本集為Dk,則通過遞歸選擇最優(yōu)特征和劃分節(jié)點(diǎn)來生成樹結(jié)構(gòu)。
(2)集成學(xué)習(xí):每棵決策樹能夠?qū)颖具M(jìn)行獨(dú)立分類,最終的分類結(jié)果由所有決策樹投票得出。設(shè)第k棵樹的分類器為CRF(W),則隨機(jī)森林的分類器為:
CRF(W)=1K∑Kk=1Ck(W)(4)
其中,K表示隨機(jī)森林中決策樹的數(shù)量。
(3)故障診斷與預(yù)測:將待診斷的特征向量Wnew輸入隨機(jī)森林模型,通過投票機(jī)制得出樣本所屬的故障類別。設(shè)模型預(yù)測結(jié)果為y^,則最終的故障診斷結(jié)果可以表示為:
y^=CRF(Wnew)(5)
隨機(jī)森林通過集成多棵決策樹的優(yōu)勢,提高了故障診斷模型的穩(wěn)健性和泛化能力。
2 實(shí)驗(yàn)與分析
在實(shí)驗(yàn)中,本文采用了凱斯西儲大學(xué)(Case Western Reserve University,CWRU)軸承數(shù)據(jù)集對上述方法進(jìn)行測試。CWRU軸承數(shù)據(jù)集是由美國凱斯西儲大學(xué)電機(jī)與計(jì)算機(jī)工程系提供的公開數(shù)據(jù)集,被廣泛應(yīng)用于機(jī)械故障診斷領(lǐng)域研究。該數(shù)據(jù)集包含在不同工況下運(yùn)行的滾動(dòng)軸承振動(dòng)信號數(shù)據(jù),包括正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動(dòng)體故障等。實(shí)驗(yàn)平臺通過在軸承外殼上安裝加速度傳感器,采集軸承運(yùn)行時(shí)的振動(dòng)信號。數(shù)據(jù)集的豐富性和多樣性為機(jī)械故障診斷算法的研究和驗(yàn)證提供了理想的平臺,通過使用CWRU軸承數(shù)據(jù)集可以全面測試基于小波變換的時(shí)頻域特征提取方法和基于隨機(jī)森林的故障診斷模型的性能,本實(shí)驗(yàn)的步驟如下。
(1)數(shù)據(jù)預(yù)處理:對振動(dòng)信號進(jìn)行去噪處理,使用帶通濾波器去除高頻和低頻噪聲。
(2)特征提取:對預(yù)處理后的振動(dòng)信號x(t)進(jìn)行小波變換,選擇合適的Daubechies小波基函數(shù),計(jì)算不同尺度a和平移b下的小波系數(shù)W(a,b),提取時(shí)頻域特征來構(gòu)建特征向量W。
(3)構(gòu)建訓(xùn)練集和測試集:將提取的特征向量按照7∶3的比例劃分為訓(xùn)練集和測試集,確保各類故障數(shù)據(jù)在訓(xùn)練集和測試集中均勻分布。
(4)訓(xùn)練隨機(jī)森林模型:利用訓(xùn)練集中的特征向量Wtrain及其對應(yīng)的故障類別標(biāo)簽ytrain,訓(xùn)練隨機(jī)森林分類器。
(5)模型測試與評估:將測試集中的特征向量Wtest輸入訓(xùn)練好的隨機(jī)森林模型預(yù)測其故障類別y^test,計(jì)算模型的混淆矩陣,如表1所示。預(yù)測結(jié)果分為正常、內(nèi)圈故障、外圈故障、滾動(dòng)體故障4種。
在表1所示混淆矩陣中,橫軸表示模型的預(yù)測類別,縱軸表示實(shí)際類別,對角線上的數(shù)字表示正確分類的樣本數(shù)量,非對角線上的數(shù)字表示被誤分類的樣本數(shù)量。從混淆矩陣中可以看出,模型對4類故障的分類準(zhǔn)確性總體較高。正常類別的樣本有95個(gè)被正確分類,正確率為95%;內(nèi)圈故障、外圈故障和滾動(dòng)體故障類別的正確分類數(shù)分別為92、94、94,正確率分別為92%、94%、94%。這表明,模型在處理不同故障類型時(shí),能夠較為準(zhǔn)確地進(jìn)行故障分類。
盡管總體準(zhǔn)確性較高,但仍存在一定的誤分類現(xiàn)象。具體而言:正常類別有2個(gè)樣本被誤分類為內(nèi)圈故障,1個(gè)樣本被誤分類為外圈故障,2個(gè)樣本被誤分類為滾動(dòng)體故障;內(nèi)圈故障類別有3個(gè)樣本被誤分類為正常,4個(gè)樣本被誤分類為外圈故障,1個(gè)樣本被誤分類為滾動(dòng)體故障;外圈故障類別有1個(gè)樣本被誤分類為正常,3個(gè)樣本被誤分類為內(nèi)圈故障,2個(gè)樣本被誤分類為滾動(dòng)體故障;滾動(dòng)體故障類別有2個(gè)樣本被誤分類為正常,1個(gè)樣本被誤分類為內(nèi)圈故障,3個(gè)樣本被誤分類為外圈故障。
通過這些誤分類的情況,本文可以發(fā)現(xiàn)模型在區(qū)分內(nèi)圈故障和外圈故障以及正常與滾動(dòng)體故障時(shí)存在一定的混淆。這可能是由于這些故障在特定特征上具有相似性,從而導(dǎo)致模型難以完全區(qū)分。
根據(jù)誤分類的情況,未來的研究工作可以進(jìn)行以下改進(jìn)。
(1)優(yōu)化特征提取方法:盡管小波變換在特征提取中表現(xiàn)良好,但可以嘗試結(jié)合其他時(shí)頻分析方法(如短時(shí)傅里葉變換或希爾伯特黃變換)以提取更多有辨識度的特征,提高分類準(zhǔn)確率。
(2)增強(qiáng)模型訓(xùn)練:增加訓(xùn)練數(shù)據(jù)的多樣性,特別是對容易混淆的故障類型進(jìn)行更多的數(shù)據(jù)采集和增強(qiáng),提升模型的泛化能力。
(3)調(diào)整模型參數(shù):通過更精細(xì)的參數(shù)調(diào)整(如決策樹數(shù)量、樹深度等),進(jìn)一步提升隨機(jī)森林模型的分類性能。
綜上所述,通過對混淆矩陣的詳細(xì)分析,本文發(fā)現(xiàn)模型在機(jī)械故障診斷中的總體表現(xiàn)較好,但仍有改進(jìn)的空間。通過優(yōu)化特征提取方法、增強(qiáng)模型訓(xùn)練和調(diào)整模型參數(shù),可以進(jìn)一步提升故障診斷的準(zhǔn)確性和魯棒性,為工業(yè)設(shè)備的健康監(jiān)測和維護(hù)提供更加可靠的技術(shù)支持。
3 結(jié)語
本文通過研究基于小波變換的時(shí)頻域特征提取和隨機(jī)森林的故障診斷方法,成功實(shí)現(xiàn)了對機(jī)械振動(dòng)信號的高效分類與診斷。通過小波變換,振動(dòng)信號被分解為多個(gè)尺度和頻率的特征向量,準(zhǔn)確地捕捉到故障信號的時(shí)頻特性。在模型訓(xùn)練階段,隨機(jī)森林算法通過集成多棵決策樹,提高了分類的準(zhǔn)確性和模型的泛化能力。實(shí)驗(yàn)結(jié)果表明,所提方法能夠有效區(qū)分不同類型和程度的軸承故障,混淆矩陣分析進(jìn)一步驗(yàn)證了模型的可靠性和穩(wěn)健性。未來的研究可以通過優(yōu)化特征提取方法和增強(qiáng)模型訓(xùn)練,進(jìn)一步提升故障診斷的性能,為工業(yè)設(shè)備的健康監(jiān)測提供更全面的技術(shù)支持。
參考文獻(xiàn)
[1]葉永偉,程毅飛,賴劍人,等.基于改進(jìn)關(guān)聯(lián)規(guī)則的卸船機(jī)故障預(yù)測模型[J].中國機(jī)械工程,2019(20):2463-2472.
[2]翟嘉琪,楊希祥,程玉強(qiáng),等.機(jī)器學(xué)習(xí)在故障檢測與診斷領(lǐng)域應(yīng)用綜述[J].計(jì)算機(jī)測量與控制,2021(3):1-9.
[3]王金福,李富才.機(jī)械故障診斷技術(shù)中的信號處理方法:時(shí)域分析[J].噪聲與振動(dòng)控制,2013(2):128-132.
[4]王金福,李富才.機(jī)械故障診斷的信號處理方法:頻域分析[J].噪聲與振動(dòng)控制,2013(1):173-180.
[5]王國彪,何正嘉,陳雪峰,等.機(jī)械故障診斷基礎(chǔ)研究“何去何從”[J].機(jī)械工程學(xué)報(bào),2013(1):63-72.
[6]嚴(yán)海濤,毛漢領(lǐng),黃振峰,等.金屬聲發(fā)射信號三種時(shí)頻域分析的比較研究[J].計(jì)量與測試技術(shù),2008(3):32-34.
[7]王正,文傳博,董逸凡.基于小波變換和Involution卷積神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法[J].軸承,2022(11):61-67.
[8]方匡南,吳見彬,朱建平,等.隨機(jī)森林方法研究綜述[J].統(tǒng)計(jì)與信息論壇,2011(3):32-38.
[9]李兵,韓睿,何怡剛,等.改進(jìn)隨機(jī)森林算法在電機(jī)軸承故障診斷中的應(yīng)用[J].中國電機(jī)工程學(xué)報(bào),2020(4):1310-1319,1422.
[10]張鈺,陳珺,王曉峰,等.隨機(jī)森林在滾動(dòng)軸承故障診斷中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2018(6):100-104,114.
(編輯 沈 強(qiáng)編輯)
Research on mechanical fault diagnosis methods driven by machine learning
YANG" Xianfeng1,2
(1.Chengdu Industry amp; Trade College, Chengdu 611730, China; 2.Chengdu Technician College, Chengdu 611730, China)
Abstract: This paper studies the time-frequency domain feature extraction method based on wavelet transform and the fault diagnosis method based on random forest for fault detection and classification of mechanical vibration signals. Firstly, the time-frequency domain features of mechanical vibration signals are extracted by wavelet transform to generate feature vectors. Then,the extracted feature vectors are trained and classified by random forest algorithm. Finally, the CWRU bearing dataset is used in the experiment to analyze the classification performance of the model through confusion matrix. The results show that the proposed method has high accuracy and robustness in identifying normal state, inner ring fault, outer ring fault and rolling element fault.
Key words: wavelet transform; random forest; mechanical vibration; fault detection