李卓漫 王海瑞
(昆明理工大學(xué)信息工程與自動化學(xué)院)
滾動軸承作為旋轉(zhuǎn)機械設(shè)備的重要部件之一,在進行剩余壽命預(yù)測時,如果預(yù)測不準確,會導(dǎo)致無法在機械設(shè)備出現(xiàn)問題前及時采取預(yù)防措施,進而產(chǎn)生相當(dāng)程度的經(jīng)濟損失,因此對它進行準確的壽命預(yù)測對于設(shè)備維護、提高生產(chǎn)效率都有相當(dāng)重要的意義[1,2]。 近年來,基于狀態(tài)監(jiān)測的軸承剩余壽命預(yù)測方法成為國內(nèi)外研究的熱點,同時由于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在時間序列處理方面具有優(yōu)越性而在滾動軸承剩余壽命預(yù)測方面得到廣泛應(yīng)用。 文獻[3]中提出了一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的健康指標,用于軸承剩余壽命的預(yù)測。 文獻[4]中使用具有時序功能的長短期記憶網(wǎng)絡(luò)構(gòu)建網(wǎng)絡(luò)模型,并進行剩余壽命預(yù)測。由于RNN在訓(xùn)練中會出現(xiàn)長期依賴、 梯度爆炸和消失的問題, 為此提出了長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)。 LSTM通過設(shè)計遺忘門、輸入門和輸出門結(jié)構(gòu),有效地利用了長距離的時序信息[5],提高了預(yù)測效果。 與此同時,LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測效果很大程度上依賴于參數(shù)的設(shè)置。模型使用不同參數(shù)會使其性能有所不同。且通過人為設(shè)置參數(shù),可能導(dǎo)致預(yù)測效果不穩(wěn)定。因此筆者采用粒子群算法(PSO)對LSTM網(wǎng)絡(luò)的部分需人為設(shè)定的參數(shù)進行優(yōu)化, 實驗中選擇批處理大小和隱藏層單元數(shù)目,從而構(gòu)建PSO-LSTM模型對滾動軸承的剩余壽命進行預(yù)測。
LSTM以RNN為基礎(chǔ)加入了遺忘門、輸出門和輸入門和3種特殊結(jié)構(gòu)[6],本質(zhì)是使用sigmoid激活函數(shù),使全連接層的輸出值取值范圍在[0,1],該值表示信息量通過的比例。 遺忘門表示上一時刻輸出信息量的遺忘比例, 輸入門表示當(dāng)前時刻輸入信息量的保留比例,兩者共同更新狀態(tài)值,輸出門則表示新狀態(tài)輸出比例。 文獻中最常見的LSTM網(wǎng)絡(luò)結(jié)構(gòu)最初是由Graves A和Schmidhuber J[7]提出的,結(jié)構(gòu)如圖1所示,其中x(t)為當(dāng)前輸入,h(t-1)為上一時刻輸出值,h(t)為當(dāng)前輸出值,c(t)為新狀態(tài)值,c(t-1)為上一時刻的狀態(tài)值。
圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
遺忘門是通過讀取h(t-1)和x(t)輸出介于0~1之間的一個數(shù)f(t),通過這個數(shù)來決定c(t-1)的保留程度,計算公式為:
輸入門是決定h(t-1)和x(t)中將會有哪些新的信息被傳輸給細胞狀態(tài),具體的數(shù)據(jù)處理由兩部分組成, 一是通過使用tanh激活函數(shù)輸出a(t)增加到細胞狀態(tài)中,二是通過使用sigmoid激活函數(shù)確定更新哪些值,計算公式為:
更新當(dāng)前狀態(tài)為:
輸出門的數(shù)據(jù)處理同樣由兩部分組成,一部分包括O(t)和激活函數(shù)tanh,另一部分包括h(t-1)、x(t)和激活函數(shù)sigmoid,計算公式為:
式中 b——偏置值;
U——循環(huán)權(quán)重;
W——輸入的權(quán)值矩陣;
σ——sigmoid激活函數(shù)。
由此可見,LSTM的關(guān)鍵是狀態(tài)值c(t),它在t時刻保持單元狀態(tài)的記憶,通過遺忘門f(t)和輸入門i(t)進行調(diào)節(jié)。
粒子群算法是模擬鳥類迷失的一種進化計算方法[8],其數(shù)學(xué)模型為:設(shè)粒子群的搜索空間是D維,粒子個數(shù)為n,文中取n=30。 第i個粒子在搜索過程中最優(yōu)解對應(yīng)的表達式為P(i)=[P(i1),P(i2),…,P(iD)],其中設(shè)第g個粒子搜索過程中的最優(yōu)位置P(g)為所有局部最優(yōu)解P(i)(i=1,2,…,n)中的最優(yōu)解[9];第i個粒子的速度V(i)=[V(i1),V(i2),…,V(iD)]。 每個粒子的速度和位置變化可以用下式表達:
其中,t為迭代次數(shù), 文中取t=500;c1、c2為影響因子, 分別表示粒子和全局對它的影響程度,取值范圍通常為[0,2],文中取c1+c2=2;r1、r2用于避免陷入局部最優(yōu),是取值為[0,1]之間的隨機常數(shù);w定義為慣性常數(shù),作用是保持個體原有的屬性,其取值范圍為[0,1][2],文中取w=0.7。PSO算法中需對粒子的位置和速度設(shè)置合理范圍,當(dāng)粒子迭代次數(shù)達到t或適應(yīng)度值達到設(shè)定的要求時,停止迭代。
為了更準確地預(yù)測滾動軸承的剩余壽命,筆者以擅長處理時間序列的LSTM模型為基礎(chǔ),構(gòu)建滾動軸承剩余壽命預(yù)測模型。 與此同時,為了使預(yù)測模型與不同工況下的滾動軸承剩余壽命退化數(shù)據(jù)特征更加匹配, 筆者采用了PSO算法對LSTM模型進行優(yōu)化,構(gòu)建了PSO-LSTM模型,以獲得較優(yōu)的參數(shù)組合。
模型首先將批處理大小和隱藏層單元數(shù)目在給定范圍內(nèi)隨機初始化,以此作為LSTM模型的初始參數(shù),通過劃分好的訓(xùn)練數(shù)據(jù)和驗證數(shù)據(jù)分別對初始模型和訓(xùn)練后的模型進行訓(xùn)練和預(yù)測,并將預(yù)測結(jié)果的平均絕對百分比誤差作為適應(yīng)度函數(shù)f。 適應(yīng)度函數(shù)f的定義為:
所謂評估準則,是對評估基本準則和評估執(zhí)業(yè)準則、職業(yè)道德準則的統(tǒng)稱。其中,評估基本準則由國務(wù)院有關(guān)評估行政管理部門組織制定,評估執(zhí)業(yè)準則、職業(yè)道德準則由評估行業(yè)協(xié)會依據(jù)評估基本準則制定。本項規(guī)定還提出了評估專業(yè)人員 “勤勉謹慎從事業(yè)務(wù)”的要求,這也是中介服務(wù)行業(yè)立法通常會有的要求,其重要表現(xiàn)在于評估專業(yè)人員應(yīng)當(dāng)認真履行必要情況下的現(xiàn)場調(diào)查等調(diào)查職責(zé),在獨立分析估算基礎(chǔ)上編制評估報告。
其中,y^m是第m個標簽值,ym是第m個預(yù)測值,N是樣本數(shù)量。
此時PSO算法中的粒子就對應(yīng)于所優(yōu)化的超參數(shù),通過式(7)、(8)更新粒子的速度和位置,迭代尋優(yōu)直至找到最優(yōu)值。以最優(yōu)超參數(shù)作為LSTM模型的批處理大小和隱藏層單元數(shù)目,從而完成LSTM模型的優(yōu)化。再通過原數(shù)據(jù)集完成剩余壽命預(yù)測。 PSO算法優(yōu)化LSTM的流程如圖2所示。
圖2 PSO算法優(yōu)化LSTM的流程
實驗數(shù)據(jù)集采用PHM2012挑戰(zhàn)賽的滾動軸承數(shù)據(jù)集[4],該數(shù)據(jù)集包括3種不同工況下17個軸承的運行數(shù)據(jù),每個軸承都包含水平和垂直兩個方向的振動加速度數(shù)據(jù), 數(shù)據(jù)采樣間隔為10s,單次采樣時長為0.1s,采樣頻率為25.6kHz。 筆者分別采用訓(xùn)練集和測試集的水平方向振動加速度數(shù)據(jù)展開實驗。
首先,根據(jù)原始數(shù)據(jù)提取時域特征,筆者綜合提取10個常用時域特征,分別為均值、峰值、偏斜度、均方根值、峰度、最大值、最小值、峰峰值、方差和標準差。 同時對時域特征進行最值歸一化。 將剩余壽命的模型設(shè)置為一元一次函數(shù),把數(shù)據(jù)集中各全壽命數(shù)據(jù)的數(shù)據(jù)組數(shù)作為每個軸承的初始狀態(tài)剩余壽命值,隨著工作周期數(shù)的增加,剩余壽命值逐漸遞減,直至工作到最后一個周期時,軸承剩余壽命值減至零。 分別以此作為軸承各個周期的剩余使用壽命值。
將提取的時域特征作為LSTM的輸入, 根據(jù)PSO優(yōu)化流程, 首先將數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù), 訓(xùn)練數(shù)據(jù)訓(xùn)練需要優(yōu)化的LSTM模型,訓(xùn)練過程中,通過計算粒子適應(yīng)度函數(shù),同時更新粒子位置,以得到優(yōu)化后的LSTM模型。 筆者采用Adam算法進行優(yōu)化, 并使用多層LSTM堆疊的結(jié)構(gòu),首層LSTM在每個時間步輸出結(jié)果,將返回的時間序列輸入第2層LSTM, 該層只返回最后時間步結(jié)果,在LSTM層后添加全連接,使輸出的特征維度為一維。 為防止模型過擬合,在模型中加入了隨機丟棄層,丟棄概率設(shè)置為0.2。 筆者根據(jù)軸承壽命數(shù)據(jù)實際情況,設(shè)定批處理大小的取值范圍為[10,50],隱藏層單元數(shù)目的取值范圍為[50,100]。 在不同工況條件下分別選取了軸承1-1、2-1和3-1作為訓(xùn)練數(shù)據(jù), 訓(xùn)練數(shù)據(jù)真實值與預(yù)測值對比如圖3a、c、e所示;選取軸承1-5、2-6和3-3作為測試數(shù)據(jù)進行測試,測試數(shù)據(jù)真實值與預(yù)測值對比如圖3b、d、f所示。 PSO優(yōu)化后參數(shù)批處理大小為37,兩層隱藏層單元數(shù)目分別為72、83。
從圖3中可以看出,對于不同的軸承,該模型也可以對預(yù)設(shè)的軸承壽命曲線有較好的擬合效果,預(yù)測壽命在軸承退化后期,基本吻合軸承壽命曲線,也說明了模型對于復(fù)雜工況的適應(yīng)性較好,訓(xùn)練好的模型也有較好的普適性。
圖3 不同工況下的訓(xùn)練和預(yù)測效果
與此同時,為了驗證模型的有效性,使用均方根誤差RMSE和相關(guān)指數(shù)R2作為評價預(yù)測性能的指標,以此對實驗進行結(jié)果分析,并將實驗結(jié)果與其他模型的最優(yōu)效果進行對比。
均方根誤差公式如下:
從式(10)可以看出,RMSE可以反映預(yù)測值和真實值之間的偏差,但對于差值的正負不做區(qū)分,僅憑RMSE對預(yù)測效果進行評價不夠全面。 因此,對于各個模型預(yù)測結(jié)果與軸承剩余壽命曲線的擬合程度用相關(guān)指數(shù)R2來評估,R2的值在0~1之間,其值越大,表明模型擬合效果越好。 R2定義如下:
表1 PSO-LSTM與其他4種模型的預(yù)測性能對比
通過以上分析可以看出, 筆者采用的PSOLSTM模型在RMSE和R2評價指標上都取得了較好成績,對軸承壽命預(yù)測效果較好,尤其是軸承退化后期,預(yù)測值基本與實際值吻合,因此可以通過提取時域特征, 再將數(shù)據(jù)輸入到PSO-LSTM模型中進行預(yù)測以得到剩余壽命的預(yù)估值。
筆者針對滾動軸承剩余壽命預(yù)測,首先對數(shù)據(jù)集提取時域特征, 并將它作為LSTM網(wǎng)絡(luò)的輸入,為了使網(wǎng)絡(luò)模型與數(shù)據(jù)更契合,更加符合數(shù)據(jù)特點,同時采用PSO算法對LSTM網(wǎng)絡(luò)的批處理大小和隱藏層單元數(shù)目進行優(yōu)化,再使用優(yōu)化后的LSTM網(wǎng)絡(luò)模型進行訓(xùn)練,最后實現(xiàn)軸承剩余壽命的預(yù)測工作。 通過實驗證明了該模型的可用性。