摘 要:作為列車運行的重要部件,軸承的健康狀態(tài)是決定列車安全運行的重要因素。軸承的故障診斷一直是行業(yè)研究熱點。本文針對傳統(tǒng)模型提取特征不足、特征信息丟失嚴重、模型準確率低以及分析識別時間長等問題,結(jié)合膠囊神經(jīng)網(wǎng)絡的特征結(jié)構(gòu),提出了基于深度學習的列車軸承故障診斷研究方法。模型以凱斯西儲大學的軸承故障數(shù)據(jù)為數(shù)據(jù)集。改進后的神經(jīng)網(wǎng)絡模型在識別準確率、識別速度方面均有提升,本文算法具有一定的先進性。
關鍵詞:人工智能;膠囊神經(jīng)網(wǎng)絡;軸承故障診斷
中圖分類號:TP 207" " " 文獻標志碼:A
我國軌道交通行業(yè)取得了飛速發(fā)展,列車的穩(wěn)定運行是保障行車安全的重要一環(huán),也是目前國內(nèi)、外行業(yè)內(nèi)的研究熱點,但目前應用于列車軸承故障診斷的模型在識別準確率、識別速度方面還有待提升。如何在列車高速運行下保障行車安全成為軌道交通行業(yè)的難題,因此有必要對列車軸承故障診斷進行研究。
目前國內(nèi)許多專家學者已就軸承診斷問題進行了研究。鐵科院研發(fā)的“JSC-206機車車輛軸承診斷儀”[1]儀器可以對檢修解體后的軸承進行檢測,但系統(tǒng)的抗干擾能力較弱,無法滿足列車實際運行中的故障診斷需求[2];刁寧昆、馬懷祥基于MPE和PSO-SVM建立了軸承故障診斷模型[3];王貴勇、劉韜通過聯(lián)合MOMEDA進行故障特征提取;周志恒、賀德強基于GA-BP神經(jīng)網(wǎng)絡并針對軸承狀態(tài)建立了預防模型。但國內(nèi)目前研究結(jié)果還不能應用到軸承故障預測中,如果能夠?qū)崟r感知軸承狀態(tài)、跟蹤潛在故障并進行針對性維修,將會有效降低列車發(fā)生故障的概率。
綜上所述,本文將針對數(shù)據(jù)集不均衡、應用場景復雜多變的問題進行研究,以搭建并優(yōu)化列車軸承故障診斷模型。
1 膠囊神經(jīng)網(wǎng)絡
卷積神經(jīng)網(wǎng)路衍變歷程漫長且坎坷。作為深度學習的代表算法,其在特征提取方向上具有良好的表象能力。與常規(guī)特征提取模型相比,卷積神經(jīng)網(wǎng)絡的池化層可有效降低數(shù)據(jù)特征維度,泛化能力更突出。但是卷積神經(jīng)網(wǎng)絡需要龐大的數(shù)據(jù)集訓練模型,不能很好地應對模糊性,池化層也會丟失大量信息,使空間分辨率降低。膠囊神經(jīng)網(wǎng)絡的提出解決了卷積神經(jīng)網(wǎng)絡的這一難題。
2017年10月,深度學習之父“Hinton”提出了膠囊神經(jīng)網(wǎng)絡。膠囊神經(jīng)網(wǎng)絡摒棄了傳統(tǒng)神經(jīng)網(wǎng)絡復雜的特征提取方式,提出膠囊的概念,利用膠囊表示一個事物整體的一個局部特征,并進行高緯度分類。具體核心思路如下:第一,與傳統(tǒng)神經(jīng)網(wǎng)絡不同,膠囊神經(jīng)網(wǎng)絡的基本單元是膠囊(Capsule),其中包括多個神經(jīng)元。膠囊的輸入、輸出均為向量,向量的長度代表傳統(tǒng)神經(jīng)元中的概率,向量方向則用來表示其他信息(位置、顏色等信息)。第二,膠囊神經(jīng)網(wǎng)絡的動態(tài)路由機制替代了傳統(tǒng)卷積神經(jīng)網(wǎng)絡的最大池化方法。
2 膠囊神經(jīng)結(jié)構(gòu)
膠囊神經(jīng)網(wǎng)絡結(jié)構(gòu)分為編碼結(jié)構(gòu)和解碼結(jié)構(gòu)。
2.1 編碼結(jié)構(gòu)
以手寫體數(shù)字識別為例,如圖1所示。編碼結(jié)構(gòu)共包括三層網(wǎng)絡,第一層為卷積層(Conv1層),數(shù)據(jù)傳入膠囊神經(jīng)網(wǎng)絡先進行卷積計算,初步提取特征,手寫體數(shù)字識別模型中,卷積核的大小為9×9,包括256個通道,輸出為259個20×20的特征。此卷積層的激活函數(shù)為ReLU,卷積層初步提取特征后傳遞到下一層基礎膠囊層中。
與卷積神經(jīng)網(wǎng)絡的采樣層功能類似,編碼結(jié)構(gòu)中卷積層后面為基礎膠囊層(Primary Caps)和數(shù)字膠囊層(Digit Caps)?;A膠囊層可看作特殊的卷積層。利用多個卷積核來獲得數(shù)據(jù)中多維實體特征,將這些特征整合為矢量(8×1)并輸入數(shù)字膠囊層中。數(shù)字膠囊層與全連接層相似,接受來自基礎膠囊層的輸出矢量,其耦合系數(shù)決定每個輸入特征的接受程度。由于該模型用于識別數(shù)字手寫體,因此最終輸出10個膠囊,膠囊維度為16,每個膠囊的長度代表其數(shù)字識別的概率,長度越大,即該數(shù)字的可能性越大。模型的最終結(jié)果輸出為概率最大的數(shù)字。動態(tài)路由機制僅在基礎膠囊層和數(shù)字膠囊層之間進行。
2.2 解碼結(jié)構(gòu)
膠囊神經(jīng)網(wǎng)絡的解碼結(jié)構(gòu)共包括3個全連接層,如圖2所示。
先將原始數(shù)據(jù)輸入編碼結(jié)構(gòu)中,經(jīng)過數(shù)字膠囊層得到每種結(jié)果的預測概率。概率最高的被送入解碼結(jié)構(gòu)進行重建,獲得重建損失。
2.3 訓練過程
作為膠囊神經(jīng)網(wǎng)絡的激活函數(shù),Squashing函數(shù)將輸出向量長度歸一化。如公式(1)所示。
(1)
式中:Vj為j個膠囊的總輸出向量;Sj為j個膠囊的總輸入向量。
傳統(tǒng)網(wǎng)絡通過加權(quán)求和的方式獲得網(wǎng)絡的輸出,膠囊神經(jīng)網(wǎng)絡在傳統(tǒng)加權(quán)求和的基礎上增加了耦合系數(shù)cij,如公式(2)、公式(3)所示。
Sj=∑iCijj|i (2)
j|i=Wijui (3)
式中:ui表示第l層的第i個膠囊,為儲存局部信息;Wij代表第l層的第i個膠囊和第l+1層的第j個膠囊的權(quán)重矩陣;代表l+1層的第j個膠囊在第l層的第i個膠囊下的整體信息預測結(jié)果;Cij為每個底層膠囊與之相對應的高層膠囊之間的權(quán)重。
通過仿射變換,將ui儲存的局部信息映射為整體信息。Cij由采用的動態(tài)路由算法中的softmax函數(shù)決定,如公式(4)所示。
(4)
式中:bij為膠囊i與膠囊j相互耦合的先驗概率,bij只依賴于2個膠囊的位置與類型。
動態(tài)路由算法的具體計算過程如圖3所示。
2.4 膠囊神經(jīng)網(wǎng)絡損失函數(shù)
膠囊神經(jīng)網(wǎng)絡的損失函數(shù)為SVM中的Margin Loss函數(shù),如公式(5)所示。
Lk=Tkmax(0,m+-||vk||)2+λ(1-Tk)max(0,||vk||-m-)2 (5)
式中:Tk為分類指示函數(shù)(k類存在即為1,不存在為0);vk為網(wǎng)絡輸出數(shù)據(jù);m+為上界,懲罰假陽性,本文選取經(jīng)驗值m+=0.9;m-為下界,懲罰假陰性,m-=0.1;λ為比例系數(shù),調(diào)整兩者比重,默認初始值為0.5。
3 試驗與分析
3.1 試驗環(huán)境
基于膠囊神經(jīng)網(wǎng)絡的軸承故障診斷模型結(jié)構(gòu)復雜,為保證模型準確率,需要龐大的數(shù)據(jù)集支撐,因此試驗所用服務器CPU型號為i912900KF,顯卡采用RTX3090Ti,內(nèi)存32GB,操作系統(tǒng)為Windows10 64位。模型由Python語言編寫,采用tensorflow框架搭建。
3.2 數(shù)據(jù)集
本試驗模型訓練采用的數(shù)據(jù)集為美國凱斯西儲大學(Case Western Reserve University,CWRU)的滾動軸承數(shù)據(jù)集。該數(shù)據(jù)集是目前軸承故障診斷領域里公認的最權(quán)威的用于研究測試的數(shù)據(jù)集,頂級期刊《Mechanical Systems and Signal Processing》中有超過41篇文章是基于該數(shù)據(jù)集做的研究。凱斯西儲大學軸承數(shù)據(jù)主要由電動機、功率測試計、電子控制器及扭矩傳感器組成。數(shù)據(jù)集共包括8個正常樣本,53個外圈故障樣本,23個內(nèi)圈故障樣本及11個滾子故障樣本。
3.3 數(shù)據(jù)集預處理
本試驗選取4種數(shù)據(jù)集用于訓練模型,每種狀態(tài)共包括10萬條數(shù)據(jù)。具體故障類型及編號見表1。
為消除試驗數(shù)據(jù)中不同量綱帶來的影響,加快網(wǎng)絡模型的訓練速度,本試驗采用Max(Min-Max Normalization)標準化方式對每種數(shù)據(jù)個傳感器數(shù)據(jù)進行歸一化處理。計算方法如公式(6)所示。
(6)
將處理后的數(shù)據(jù)集按4∶1的比例劃分為訓練集和驗證集,即每組數(shù)據(jù)訓練集包括8萬條數(shù)據(jù),驗證集包括2萬條數(shù)據(jù)。
3.4 網(wǎng)絡結(jié)構(gòu)
訓練神經(jīng)網(wǎng)絡需喲啊設置好超參數(shù),包括學習率、迭代次數(shù)、隱含層數(shù)、神經(jīng)元數(shù)量、訓練批次以及激活函數(shù)等。神經(jīng)網(wǎng)絡的超參數(shù)對其訓練過程和得到的網(wǎng)絡模型適用能力具有重要影響。
通常增加神經(jīng)網(wǎng)絡的網(wǎng)絡層數(shù)能提升訓練模型的準確率,擬合效果也會更好。但網(wǎng)絡層數(shù)過多時,模型也會存在過擬合風險,因此試驗選取合適的網(wǎng)絡層數(shù),在避免過擬合的同時盡可能提升模型準確率。膠囊神經(jīng)網(wǎng)絡中卷積核大小和步長對模型的特征提取具有十分重要的影響。卷積核決定模型的感受野,卷積核越大,可提取的特征越多,但同時也增加了模型的計算量,不利于模型的深度擴充。而更小的卷積核可以捕捉到更細節(jié)的特征,通過多個小卷積核的堆疊來代替大卷積核,可減少模型參數(shù)計算并提升效率。但卷積核過小,則會導致數(shù)據(jù)集容量較少時,不能有效提取特征信息。因此選取合適的卷積核及其他超參數(shù)對模型的適用質(zhì)量十分重要,需要不斷進行測試。
為提取原始數(shù)據(jù)中更豐富的時域特征信息,增強模型的特征識別能力,本試驗在原有的膠囊網(wǎng)絡中增加了注意力機制。注意力機制將3個本征模函數(shù)重構(gòu)、融合為三通道信號,對原始信號降噪,再輸入卷積層中進行特征提取。經(jīng)過2個卷積層、2個膠囊層后,輸出判定結(jié)果。與原始的CapsNet相比,模型網(wǎng)絡結(jié)構(gòu)更深,提高了分類精度。具體網(wǎng)絡結(jié)構(gòu)如圖4、表2所示?;A膠囊層與數(shù)字膠囊層之間為全連接,所有權(quán)重由動態(tài)路由算法確定。
3.5 試驗結(jié)果與分析
訓練效果如圖5所示。本文構(gòu)建的模型經(jīng)過5h的訓練,迭代次數(shù)為6000次,模型訓練集準確率達95.37%,驗證集準確率高達93.58%。由此可見,該模型對列車軸承故障的診斷能力較高且泛化能力良好。
本文模型與其他軸承故障診斷算法的識別準確率比較見表3??梢钥闯?,同在CWRU數(shù)據(jù)樣本下,本文構(gòu)建的軸承故障診斷模型識別率明顯高于其他算法。
4 結(jié)語
本文通過試驗驗證了基于膠囊神經(jīng)網(wǎng)絡的軸承故障診斷模型比其他方法更適合列車軸承故障診斷,該模型結(jié)構(gòu)簡易,識別速度快。膠囊網(wǎng)絡模型特有的空間結(jié)構(gòu)更大限度地挖掘出了振動信號特征,提升了模型的識別準確度。目前,深度學習仍處于起步階段,今后還需要在和已經(jīng)成熟的模型相結(jié)合方面繼續(xù)探索,進一步改進其應用場景。
參考文獻
[1]吳春復.JSC—206機車軸承診斷儀的應用與體會[J].鐵道機車車輛,1998(3):53-57.
[2]張生玉,馮庚斌.JL—601機車走行部檢測系統(tǒng)[J].鐵道機車車輛,2000(5):18-20.
[3]刁寧昆,馬懷祥,王金師,等.基于MPE與PSO-SVM的滾動軸承故障診斷[J].電子測量技術,2021,44(21):44-48.
[4]孫祺淳,李媛媛.DE算法優(yōu)化CNN的滾動軸承故障診斷研究[J].噪聲與振動控制,2022,42(4):165-171,176.
通信作者:郭占廣(1996-),碩士,主要研究方向為人工智能、故障診斷等。
電子信箱:812996561@qq.com。