唐紅濤,李 冰,高晟博
(1.武漢理工大學(xué) 機(jī)電工程學(xué)院,湖北 武漢 430070;2.數(shù)字制造湖北省重點實驗室,湖北 武漢 430070)
在傳統(tǒng)的故障診斷算法中,特征提取是對多個傳感器在時域、頻域和時頻域收集的原始數(shù)據(jù)信號進(jìn)行處理和轉(zhuǎn)換,并提取有用的代表性特征用于后續(xù)故障識別[1-2]。這種方法存在的問題有:①在特征提取時,需要將時域信號轉(zhuǎn)化成頻域信號或者時頻域信號處理,增大了工作量,費時費力。②在特征選擇時,主成分分析和獨立成分分析容易丟失一些重要的特征,造成過擬合,泛化能力差。
近年來,隨著深度學(xué)習(xí)在計算機(jī)視覺、聲學(xué)識別等領(lǐng)域的廣泛成功應(yīng)用,利用深度學(xué)習(xí)方法解決故障診斷逐漸成為一個研究熱點[3-5]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)由于具有優(yōu)異的自動局部空間特征提取能力而得到了廣泛的應(yīng)用,萬齊楊等[6]利用深度卷積自編碼器對直升機(jī)自動傾斜器滾動軸承研究時,達(dá)到了一個較高的診斷準(zhǔn)確率。為了快速確定網(wǎng)絡(luò)參數(shù),Chen等[7]提出了利用PSO(particle swarm optimization)優(yōu)化算法對CNN網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,成功縮短了故障診斷時間,提高了故障診斷準(zhǔn)確率。這種方法雖然實現(xiàn)了軸承故障診斷,但是僅考慮到振動數(shù)據(jù)的空間特征而忽略了振動數(shù)據(jù)的時序特征。Pan等[8]對滾動軸承故障診斷研究時,將CNN的輸出作為LSTM(long short-time memory)的輸入進(jìn)而識別軸承故障類別。Pang等[9]對風(fēng)電機(jī)組故障研究時,將多核融合卷積神經(jīng)網(wǎng)絡(luò)提取的空間特征輸送給LSTM學(xué)習(xí)時間特征,診斷結(jié)果優(yōu)于單神經(jīng)網(wǎng)絡(luò)診斷結(jié)果。這種方法雖然考慮到時間特征的重要性,但是LSTM得到的數(shù)據(jù)是時序性特征破壞后的數(shù)據(jù),重要的時序特征可能會丟失,因此并沒有充分發(fā)揮LSTM在提取時序信號的性能優(yōu)勢。
綜上所述,單通道的CNN和CNN-LSTM沒有充分提取原始振動數(shù)據(jù)的特征,可能造成重要特征的丟失,影響故障診斷的準(zhǔn)確性。故筆者提出雙通道特征融合的CNN-LSTM故障診斷方法,將原始數(shù)據(jù)同時輸入到CNN網(wǎng)絡(luò)層和LSTM網(wǎng)絡(luò)層,充分發(fā)揮CNN提取原始振動數(shù)據(jù)的空間特征和LSTM提取原始振動數(shù)據(jù)時序信息特征的能力,將提取到的特征信息進(jìn)行融合,最后將融合后的特征輸入到softmax分類器完成故障分類。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種具有卷積計算和深層結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),最早應(yīng)用于圖像識別領(lǐng)域,典型的CNN[10]通常由輸入層,卷積層、池化層、全連接層,輸出層組成。卷積層的主要作用是對輸入數(shù)據(jù)進(jìn)行特征提取,該層包含卷積核、卷積層參數(shù)和激活函數(shù)。卷積核定期掃描輸入數(shù)據(jù),與感受野中對應(yīng)的數(shù)據(jù)進(jìn)行乘法求和,并疊加偏差。最大池化是最常見的池化操作,通過降采樣只保留突出的特征,從而避免過擬合。在池化層之后,利用全連接層將池化層所提取的重要特征全部連接起來,將輸出值傳送給分類器,輸出每個樣本對應(yīng)的類別。
長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)作為一種時間循環(huán)網(wǎng)絡(luò),可以利用特殊的“三門結(jié)構(gòu)”捕獲大范圍時間序列數(shù)據(jù)的相關(guān)性并提取最優(yōu)特征。其在循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的基礎(chǔ)上引入記憶細(xì)胞可以解決梯度爆炸及消失的一種時間循環(huán)網(wǎng)絡(luò)[11]。每一LSTM層作為一個LSTM網(wǎng)絡(luò)模型,如圖1所示。每層由若干個LSTM細(xì)胞組成,每個LSTM細(xì)胞的內(nèi)部結(jié)構(gòu)如圖2所示,方框Ⅰ代表遺忘門,方框Ⅱ代表輸入門,方框Ⅲ代表輸出門。
圖1 單層LSTM結(jié)構(gòu)
圖2 LSTM單元結(jié)構(gòu)
遺忘門的作用是決定丟棄哪些信息,通過sigmoid查看ht-1和xt信息,輸出一個0~1向量,從而決定Ct-1中的信息哪些保留哪些丟棄。輸入門先通過激活函數(shù)sigmoid決定更新哪些函數(shù),然后利用tanh層查看ht-1和xt信息得到新的信息Ct,Ct為當(dāng)前LSTM核的狀態(tài)。其本質(zhì)就是通過遺忘門選擇遺棄一部分舊信息,再通過輸入門添加一部分新的信息。輸出門決定輸出哪些信息狀態(tài)特征,首先通過sigmoid激活函數(shù)得到一個判斷條件然后與Ct經(jīng)過tanh激活函數(shù)處理后的結(jié)果進(jìn)行點乘,也就是該LSTM核的最終輸出。遺忘門、輸入門和輸出門的數(shù)學(xué)表達(dá)式如下:
ft=σ(Wf[ht-1,xt]+bf)
(1)
it=σ(Wi[ht-1,xt]+bi)
(2)
ot=σ(Wo[ht-1,xt]+bo)
(3)
(4)
(5)
ht=ot*tanh(Ct)
(6)
在以往的研究中,大多數(shù)學(xué)者在利用卷積神經(jīng)網(wǎng)絡(luò)研究軸承故障診斷時,僅考慮故障信息的空間特征,忽略了數(shù)據(jù)間的時序特征,可能會造成故障信息提取不完整,故筆者提出雙通道特征融合的CNN-LSTM故障診斷模型,可同時考慮數(shù)據(jù)的空間特性和時間特性。該模型主要由長短期記憶神經(jīng)網(wǎng)絡(luò)LSTM、卷積神經(jīng)網(wǎng)絡(luò)CNN、特征融合層和輸出層softmax 4部分組成,其結(jié)構(gòu)如圖3所示。傳統(tǒng)CNN是將一維振動數(shù)據(jù)轉(zhuǎn)化為二維圖像,這種方法不僅增大了工作量,同時也分割了時間序列數(shù)據(jù)的連續(xù)性。為了避免破壞振動數(shù)據(jù)的原始性,采用一維CNN提取原始一維振動數(shù)據(jù)空間特征信息;傳統(tǒng)LSTM獲得的數(shù)據(jù)是經(jīng)CNN卷積池化后的數(shù)據(jù),這些數(shù)據(jù)已經(jīng)喪失原始數(shù)據(jù)時序特征序列,因此利用LSTM直接處理原始振動數(shù)據(jù),以獲取原始振動數(shù)據(jù)的時序信息特征;特征融合層的作用是將振動數(shù)據(jù)的時間特征和空間特征進(jìn)行融合,融合層采用的Concatenate融合機(jī)制;輸出層是根據(jù)融合后的特征判斷相應(yīng)的故障類型。
圖3 雙通道特征融合的CNN-LSTM故障診斷模型
經(jīng)過卷積池化后的數(shù)據(jù)維度降低,為了充分提取該數(shù)據(jù)中所隱藏的特征,采用3個卷積層對故障信息進(jìn)行特征提取。網(wǎng)絡(luò)模型的具體參數(shù)如表1所示。為了減少訓(xùn)練時間以及避免梯度消失和梯度爆炸問題,本模型在卷積層之后采用了批標(biāo)準(zhǔn)化進(jìn)行處理。通常在分類層前是全連接層,但是全連接層的參數(shù)超多,會使模型變的非常臃腫,甚至產(chǎn)生過擬合,因此利用全局平均池化代替全連接層,實現(xiàn)降維的同時又極大的減少了網(wǎng)絡(luò)參數(shù),提高了模型收斂速度。
表1 雙通道特征融合的CNN-LSTM模型結(jié)構(gòu)參數(shù)
具體故障診斷步驟如下:
步驟1獲取滾動軸承的原始振動數(shù)據(jù),并將數(shù)據(jù)樣本隨機(jī)劃分成訓(xùn)練集和測試集。
步驟2初始化CNN、LSTM權(quán)重以及偏置項,將訓(xùn)練集的數(shù)據(jù)分批次同時輸入到LSTM和CNN中進(jìn)行故障特征的學(xué)習(xí),選擇合適的學(xué)習(xí)率、LSTM單元個數(shù)以及迭代次數(shù)等參數(shù)。
步驟3利用CNN和LSTM分別提取振動數(shù)據(jù)空間特征信息和時序信息特征,并進(jìn)行特征融合,將融合后的特征輸入到softmax層。
步驟4利用softmax實現(xiàn)對滾動軸承的狀態(tài)分類,根據(jù)損失值和準(zhǔn)確率的變化,對模型參數(shù)進(jìn)行微調(diào)。
步驟5當(dāng)模型訓(xùn)練完成后,將測試集數(shù)據(jù)輸入到該模型,根據(jù)預(yù)測分類的輸出結(jié)果,計算預(yù)測的分類準(zhǔn)確率。
本文實驗數(shù)據(jù)處理的運行環(huán)境為Windows10操作系統(tǒng),Tsensorflow2.0深度學(xué)習(xí)框架、Python語言編程、PyCharm編譯環(huán)境、Intel(R) Core(TM) i5-8265U CPU @ 1.60 GHz,8.00 GB的運行內(nèi)存。為了保證實驗結(jié)果的可信度,所有實驗結(jié)果均為10次實驗的平均值。
所采用的數(shù)據(jù)來自凱斯西儲大學(xué)數(shù)據(jù)中心的數(shù)據(jù),該數(shù)據(jù)被大多數(shù)學(xué)者用于軸承故障診斷研究,也是世界公認(rèn)的軸承診斷標(biāo)準(zhǔn)數(shù)據(jù)集。軸承振動數(shù)據(jù)采集實驗平臺如圖4所示。該平臺主要由電機(jī)、扭矩傳感器、功率測試儀以及其他電子控制設(shè)備組成,其中扭矩傳感器主要采集轉(zhuǎn)速和功率數(shù)據(jù)。該實驗平臺采用電火花加工技術(shù),振動數(shù)據(jù)由放置在驅(qū)動端的加速度傳感器進(jìn)行采集。
圖4 軸承振動數(shù)據(jù)采集實驗平臺
實驗的數(shù)據(jù)樣本均在采樣頻率48 kHz,電機(jī)負(fù)載工況為2/hp,轉(zhuǎn)速為1 730 r/min的工況下獲得,滾動軸承數(shù)據(jù)集詳細(xì)信息如表2所示。被檢測的軸承總共有3種故障類型,分別是內(nèi)圈故障、外圈故障和滾動體故障。每種故障類型有3種故障尺寸,再加上健康狀態(tài)總共有10種工作狀態(tài)。每種工作狀態(tài)共有400個樣本,每個樣本的采樣點是1 024,按7:3的比例隨機(jī)將樣本分為訓(xùn)練集和測試集,訓(xùn)練集樣本共有2 800個,測試集共有1 200個。
表2 滾動軸承振動數(shù)據(jù)
為了測試提出模型的性能,在使用相同數(shù)據(jù)集的前提下,將所提出的模型分別與具有相同參數(shù)、相同結(jié)構(gòu)的CNN-LSTM單通道模型、CNN模型和LSTM模型進(jìn)行故障診斷對比。當(dāng)學(xué)習(xí)率和迭代次數(shù)的初始化參數(shù)分別是0.01和30時,為了對比該模型融合特征的性能,分別獲取CNN-LSTM、LSTM、CNN所提取的特征信息,利用t-SNE(t-distributeel stochastic neighbor Embedding)技術(shù)對高維數(shù)據(jù)進(jìn)行可視化顯示,具體結(jié)果如圖5所示。
圖5 特征可視化
從圖5可知,其他3種方法不同特征之間雖然有很好的區(qū)分度,但是個別狀態(tài)特征之間存在交叉,容易造成分類錯誤。而筆者所提的方法在不同狀態(tài)特征之間的邊界更加明顯,同種狀態(tài)緊密聚集,提取的特征更易于區(qū)分。
滾動軸承分類混淆矩陣如圖6所示。從圖6可知,所提模型對每種故障類別都具有很高的分類精度,最影響該模型診斷準(zhǔn)確率的是該模型可能將外圈故障尺寸為0.021的故障類型識別為滾動體故障尺寸為0.007的故障類型。
圖6 滾動軸承分類混淆矩陣
4種模型的準(zhǔn)確率和穩(wěn)定性如圖7所示。從圖7可知,所提的故障診斷模型對滾動軸承故障診斷準(zhǔn)確率高于其他3個模型的診斷準(zhǔn)確率,所提模型的標(biāo)準(zhǔn)差低于其他3個模型的標(biāo)準(zhǔn)差。因此,所提模型具有更好的診斷性能。
圖7 不同模型的準(zhǔn)確率和穩(wěn)定性
在實際工業(yè)生產(chǎn)活動中,傳感器所采集到的振動數(shù)據(jù)不可避免會受到噪聲干擾,因此通過對原始信號添加不同信噪比SNR(signal noise ratio)[12]的高斯白噪聲模擬不同的噪音強(qiáng)度,以驗證所提方法在噪音環(huán)境下的故障診斷性能。
在結(jié)構(gòu)參數(shù)不變前提下的4種模型在不同噪聲背景下的故障診斷準(zhǔn)確率如圖8所示。從圖8可知,所提方法和CNN-LSTM方法在不同噪聲條件下診斷性能明顯優(yōu)于其他兩種網(wǎng)絡(luò)模型。當(dāng)SNR<4時,所提方法比CNN-LSTM方法更加優(yōu)越,因此當(dāng)原始數(shù)據(jù)遭到噪聲污染時,所提的方法具有更好的診斷性能。
圖8 4種模型在不同噪聲背景下診斷結(jié)果
首先,提出了雙通道特征融合的CNN-LSTM故障診斷方法,可直接以原始振動數(shù)據(jù)作為輸入,充分利用CNN提取空間特征和LSTM提取時序特征的優(yōu)勢,在豐富故障特征信息的同時,也避免了將時域信號轉(zhuǎn)化為頻域或時頻域的過程,減少了故障診斷的工作量;其次,分別在卷積層之后和輸出層之前采用了批標(biāo)準(zhǔn)化處理以及用平均池化層代替全連接層,可以避免過擬合和提高模型收斂速度;另外,經(jīng)過實驗證明,所提方法分別與同結(jié)構(gòu)、同參數(shù)的CNN-LSTM、CNN和LSTM相比,其診斷的準(zhǔn)確度最高;最后,為了驗證所提模型的抗噪性,針對不同噪音背景下的噪聲數(shù)據(jù),該方法仍能顯示出優(yōu)異的故障診斷穩(wěn)定性,故障診斷準(zhǔn)確率可達(dá)95%以上。