朱若嶺,張昊
(1.河南交通職業(yè)技術(shù)學(xué)院 汽車學(xué)院,鄭州 450000;2.東南大學(xué) 儀器科學(xué)與工程學(xué)院,南京 210096)
軸承是感應(yīng)電動機(jī)、風(fēng)力渦輪機(jī)等旋轉(zhuǎn)機(jī)械的重要組成零件[1],大約50%的風(fēng)力渦輪故障由軸承故障引起[2-3],軸承故障不僅會造成意外停機(jī),增加安全隱患,嚴(yán)重的會導(dǎo)致重大經(jīng)濟(jì)損失和人員傷亡[4]。預(yù)測與健康管理是避免這種情況發(fā)生的有效手段,軸承剩余使用壽命(Remaining Useful Life,RUL)預(yù)測是其關(guān)鍵功能,能夠較好地預(yù)測軸承發(fā)生故障的時間,及時采取相應(yīng)措施[5]。
剩余使用壽命預(yù)測可以分為基于模型的方法和基于數(shù)據(jù)驅(qū)動的方法[6]:對于基于模型的方法,由于軸承結(jié)構(gòu)復(fù)雜,工況多樣,故障不同,很難有一個定義明確的物理模型進(jìn)行軸承剩余使用壽命預(yù)測[7],而且在處理高維數(shù)據(jù)時操作難度大,對預(yù)測精度造成很大影響[8];隨著傳感器、存儲、邊緣計算、通信和信號處理等先進(jìn)技術(shù)的快速發(fā)展,許多與軸承健康狀態(tài)相關(guān)的監(jiān)測數(shù)據(jù)被廣泛使用,推動基于數(shù)據(jù)驅(qū)動的剩余使用壽命預(yù)測方法的快速發(fā)展[9]。
機(jī)器學(xué)習(xí)的方法因其計算的高效性而被用于數(shù)據(jù)驅(qū)動中[10],其能夠直接映射輸入數(shù)據(jù)與相應(yīng)剩余使用壽命之間的非線性關(guān)系,不需要構(gòu)建退化模型和計算相關(guān)函數(shù),能有效降低數(shù)據(jù)中的不確定性,且在處理高維數(shù)據(jù)和提取剩余使用壽命預(yù)測中的非線性模式方面具有一定的優(yōu)勢:文獻(xiàn)[11]提出了一種結(jié)合深度卷積神經(jīng)網(wǎng)絡(luò)和主頻譜能量特征提取的方法來預(yù)測軸承剩余使用壽命;文獻(xiàn)[12]引入收縮去噪自編碼器提取特征,利用最小二乘支持向量機(jī)訓(xùn)練模型對預(yù)測軸承剩余使用壽命;文獻(xiàn)[13]提出了一種新的網(wǎng)絡(luò)結(jié)構(gòu),通過凍結(jié)卷積和激活記憶網(wǎng)絡(luò)來預(yù)測軸承剩余使用壽命。需要注意的是,卷積神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)都是傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò),信息只能在相鄰層之間傳遞,不能在同一層中共享,無法處理和記憶時間序列信息,導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)的預(yù)測結(jié)果不夠精確。
為解決軸承退化數(shù)據(jù)中信息無法被充分發(fā)掘的問題和卷積神經(jīng)網(wǎng)絡(luò)無法處理時序問題的弊端,本文提出一種時空注意力機(jī)制(Temporal-Spatial Attention Mechanism,TSAM)的雙向門控遞歸單元(Bidirectional Gating Recursive Unit,Bi-GRU)網(wǎng)絡(luò)模型來實(shí)現(xiàn)滾動軸承的壽命預(yù)測。
剩余使用壽命預(yù)測的準(zhǔn)確度依賴于特征的相關(guān)性和網(wǎng)絡(luò)結(jié)構(gòu)的性能。軸承的退化數(shù)據(jù)是高維度且數(shù)據(jù)量龐大的時間信息,維度復(fù)雜且信息冗余,其中的噪聲和無關(guān)信號會干擾剩余使用壽命預(yù)測的精度,因此需要進(jìn)行有效的特征提取將與軸承故障的相關(guān)信息充分表示出來,進(jìn)而輸入到預(yù)測模型中得到剩余使用壽命。常用的特征提取方法有主成分分析、經(jīng)驗(yàn)?zāi)B(tài)分析等,這些方法均是對信號進(jìn)行降維處理,容易丟失重要信息。
卷積注意力機(jī)制能夠處理高維度數(shù)據(jù),具有從數(shù)據(jù)中提取相關(guān)信息并保持?jǐn)?shù)據(jù)完整性的能力,其原理與人眼視覺捕捉類似,抓取所看到圖像中最有用的特征,相對忽略其他不重要的信息,即注意力機(jī)制的關(guān)鍵在于信息權(quán)重的配比。時空注意力機(jī)制(TSAM)是這一原理的發(fā)展,TSAM不僅能在時間步方向上進(jìn)行信息的權(quán)重配比,還能夠在空間上進(jìn)行這一操作,實(shí)現(xiàn)數(shù)據(jù)的卷積降維。TSAM的組成為時間(通道)注意力和空間注意力,給定一個特征圖F∈RC×H×W作為輸入,通過一維的注意力通道Mc∈RC×1×1,通道維度不變,空間維度被壓縮,然后進(jìn)入一個二維的空間注意力通道Ms∈R1×H×W,空間維度不變,通道維度被壓縮。整個過程可表示為
Mc(F)=σ[W1(Favg)+W2(Fmax)],
(1)
Ms(F)=σ(F1avg+F1max),
(2)
式中:σ為sigmoid函數(shù);W1,W2為經(jīng)過平均池化層和最大池化層的權(quán)重;Favg,F(xiàn)max為平均池化層和最大池化層特征;RC×H×W中的C,H,W分別為圖像的通道數(shù)、高度和寬度。在運(yùn)算過程中,時間(通道)注意力值的運(yùn)算結(jié)果影響著空間注意力。
TSAM的結(jié)構(gòu)如圖1所示:時間(通道)注意力機(jī)制通過池化層將空間信息聚集起來,以此找尋有用的輸入,通過權(quán)重分配得到輸出;空間注意力機(jī)制聚焦于重新壓縮的特征F1(包含F(xiàn)1avg和F1max)的有用信息位置,利用相似的注意力機(jī)制網(wǎng)絡(luò)結(jié)構(gòu),沿通道軸前進(jìn)并依附在卷積結(jié)構(gòu)的架構(gòu)上,以此達(dá)到空間上的信息捕捉。對于軸承信號,TSAM能夠?qū)υ紨?shù)據(jù)進(jìn)行降維并捕捉其中完整的退化信息,完成特征降維和提取的輸出過程。
圖1 TSAM結(jié)構(gòu)簡圖
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)是傳統(tǒng)的時序處理網(wǎng)絡(luò),一般做數(shù)據(jù)的回歸和分類;然而,由于反向傳播過程中梯度退化,傳統(tǒng)RNN無法處理大量的長期數(shù)據(jù),僅能保留短暫的數(shù)據(jù),導(dǎo)致無法將數(shù)據(jù)相關(guān)性關(guān)聯(lián)起來,對高維數(shù)據(jù)的處理具有局限性。針對RNN的缺陷,本文引入了雙向門控遞歸單元(Bi-GRU),其結(jié)構(gòu)如圖2所示。
圖2 Bi-GRU結(jié)構(gòu)
rt=σ[Wr(ht-1,xt)],
(3)
式中:Wr為重置門的權(quán)重。
(4)
在候選狀態(tài)計算完成后,前一個時刻的信息被更新門控制,由更新門決定傳遞到下一時刻中的隱藏狀態(tài)信息數(shù)據(jù)量的大小,更新門的計算公式為
zt=σ[Wz(ht-1,xt)],
(5)
則當(dāng)前時刻的隱藏狀態(tài)為
(6)
式中:Wz為更新門的權(quán)重。
每個門控單元通過重置門和更新門狀態(tài)的更新計算得到當(dāng)前信息和上一時刻信息,通過多個單元的堆疊保留不同時刻內(nèi)前后時刻信息的關(guān)聯(lián),捕獲到時間依賴的相關(guān)性。重置門能夠頻繁計算單位時刻的信息,從而對短時信息進(jìn)行充分分析;更新門因其時間步的更新而不斷更新,能夠捕捉信息之間的相關(guān)性;Bi-GRU是GRU在2個方向的運(yùn)算,可以捕捉上一時刻與未來時刻信息的聯(lián)系。
本文將TSAM嵌入到堆疊的Bi-GRU網(wǎng)絡(luò)中,形成一個閉合的網(wǎng)絡(luò)結(jié)構(gòu),從而實(shí)現(xiàn)從輸入數(shù)據(jù)中提取特征,利用Bi-GRU進(jìn)行訓(xùn)練并計算出剩余使用壽命的目的。TSAM的作用是利用空間注意力模塊對原始信號進(jìn)行降維得到有效特征,優(yōu)化Bi-GRU的輸入,使其網(wǎng)絡(luò)對數(shù)據(jù)的處理更加高效。
提出的基于TSAM的Bi-GRU網(wǎng)絡(luò)的參數(shù)見表1,其結(jié)構(gòu)如圖3所示:首先,將振動信號數(shù)據(jù)輸入TSAM進(jìn)行特征信息的注意力權(quán)重配比,提取相關(guān)特征;其次,將提取到的特征輸入堆疊的Bi-GRU網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練找到自相關(guān)性;最后,對訓(xùn)練完成的模型進(jìn)行性能測試,將測試集作為輸入,經(jīng)過特征篩選后輸出每個時間點(diǎn)的預(yù)測值,即為軸承的剩余使用壽命預(yù)測值。
表1 壽命預(yù)測模型結(jié)構(gòu)及其參數(shù)
圖3 基于TSAM的Bi-GRU網(wǎng)絡(luò)模型結(jié)構(gòu)圖
為方便計算和后續(xù)評價模型性能,對輸出值作歸一化處理, 即將數(shù)據(jù)轉(zhuǎn)換為(0,1)之間的數(shù),其中1代表剩余使用壽命為100%,即健康;0代表剩余使用壽命為0,即軸承失效。
本試驗(yàn)中使用的軸承數(shù)據(jù)來自PRONOSTIA 測試平臺(圖4)采集的數(shù)據(jù)集(IEEE PHM Challenge 2012)[14]。加速度傳感器(采樣頻率為25.6 kHz)和溫度傳感器(采樣頻率為10 Hz)采集水平和垂直2個方向的振動信號和溫度信號。本文選取電動機(jī)轉(zhuǎn)速為1 800 r/min,載荷為4 000 N工況下的7套軸承(深溝球軸承,型號一致,壽命時間不同)的數(shù)據(jù)集(表2),該數(shù)據(jù)集包含了從初始時刻到軸承損壞時刻的全部信號幅值。
圖4 數(shù)據(jù)采集平臺
表2 試驗(yàn)軸承數(shù)據(jù)集
將振動信號輸入TSAM中進(jìn)行卷積處理來提取特征。以1#軸承為例,截取部分振動信號如圖5所示,可以看出發(fā)生磨損失效時幅值明顯變大??臻g注意力機(jī)制對振動信號進(jìn)行分解、卷積得到的子信號(截取部分長度)如圖6所示。
圖5 1#軸承的原始振動信號
圖6 利用空間注意力機(jī)制分解得到的子信號
利用時間注意力機(jī)制對經(jīng)空間注意力機(jī)制處理后得到的所有子信號進(jìn)行卷積操作提取子信號的退化特征信息。但由于每套軸承的退化特征有所差異,退化特征的選擇決定了剩余使用壽命預(yù)測的準(zhǔn)確性,故利用TSAM自動匹配與每套軸承最為相關(guān)的時域特征,以便更加準(zhǔn)確地預(yù)測剩余使用壽命。本文選擇的特征個數(shù)為4,以保持剩余使用壽命預(yù)測的靈活性和適用性。以1#軸承為例,TSAM從1#軸承所有子信號中自動提取了4個退化相關(guān)性高的特征數(shù)據(jù),分別是均方根、平均值、裕度和峭度,如圖7所示。從圖中能夠明顯看出,提取的特征都能描述軸承的退化過程,尤其在最后時刻,這些特征信號的幅值都發(fā)生了明顯波動且波動范圍較大,說明與軸承的失效有關(guān)。
圖7 基于TSAM提取的退化特征
最后將特征信息輸入到構(gòu)建好的網(wǎng)絡(luò)模型中訓(xùn)練并對測試集的軸承剩余使用壽命進(jìn)行預(yù)測。模型的初始參數(shù)設(shè)置為學(xué)習(xí)率0.001,輪數(shù)30,單個頻率下的文件數(shù)為2 560個,每個文件數(shù)的單列數(shù)據(jù)為2 800個。模型在pytorch上運(yùn)行,八核i7處理器,運(yùn)行內(nèi)存為4.8 G。
模型訓(xùn)練完成后,將測試集數(shù)據(jù)分別輸入網(wǎng)絡(luò)中得到各軸承的剩余使用壽命預(yù)測結(jié)果。以3#軸承為例,其預(yù)測結(jié)果如圖8所示,預(yù)測的初始階段離實(shí)際值較遠(yuǎn),說明此時軸承還未損壞,隨著軸承運(yùn)行時間的增加,預(yù)測值與實(shí)際值的擬合度越來越高,說明模型的擬合效果優(yōu)異。另外,在擬合效果好的條件下,預(yù)測曲線越接近真實(shí)曲線的下方,預(yù)測效果越好,即模型的預(yù)測值小于實(shí)際值時,能夠方便工人在實(shí)際操作中提前了解軸承的壽命,及時做出相應(yīng)的措施,但是預(yù)測值不能太過小于實(shí)際值,否則會造成工件的浪費(fèi)。本文的擬合效果比較理想,但仍有不足。
圖8 3#軸承的剩余使用壽命預(yù)測結(jié)果
通過均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)評估模型的預(yù)測性能,公式見(7)式和(8)式,并與其他文獻(xiàn)的方法如多通道卷積神經(jīng)網(wǎng)絡(luò)(TCNN)、門控循環(huán)單元(GRU)、多尺度卷積神經(jīng)網(wǎng)絡(luò)(MSCNN)、雙向長短時記憶(Bi-LSTM)網(wǎng)絡(luò)進(jìn)行了比較[15-16],結(jié)果見表3。
表3 各方法的預(yù)測性能指標(biāo)對比
(7)
(8)
由表3可知,本文方法的RMSE和MAPE值基本小于其他方法,說明其擬合度高且誤差較小。不同軸承的結(jié)果都比較優(yōu)異也說明了模型的魯棒性較好。
為驗(yàn)證本文方法的預(yù)測精度,利用預(yù)測剩余使用壽命和實(shí)際剩余使用壽命之間的誤差Eri來評估該方法的優(yōu)劣,即
(9)
式中:Lacti為實(shí)際剩余使用壽命;Lprei為預(yù)測剩余使用壽命。
各方法誤差Eri的對比見表4,本文所提方法相比于其他方法得到的Eri更接近0,說明其預(yù)測精度更高;本文方法的平均誤差為11.5%,與其他方法相比,誤差相對較小且更穩(wěn)定。
表4 各方法的百分比誤差
本文提出的基于時空注意力機(jī)制的Bi-GRU模型預(yù)測軸承剩余使用壽命的新方法,利用時空注意力機(jī)制提取全局和局部特征并對數(shù)據(jù)進(jìn)行降維處理,然后利用雙向門控遞歸單元堆疊構(gòu)成的網(wǎng)絡(luò)模型進(jìn)行軸承剩余壽命預(yù)測。與其他方法的比較結(jié)果表明該方法誤差率更低,擬合效果更好;但結(jié)果中仍存在滯后預(yù)測的情況,未來的研究重點(diǎn)將考慮如何更好地實(shí)現(xiàn)超前預(yù)測,并得到更準(zhǔn)確的預(yù)測值。