門永偉
江蘇核電有限公司 江蘇連云港 222042
近幾年,國內核電站的運轉規(guī)模逐漸擴展,所用設備的復雜性也隨之提升,使得對于設備狀態(tài)的把控程度也有更高要求,其預測準確性也變得極為重要。因為核電設備形成的信息屬于保密的范疇,再加上其他因素的影響,使得有關研究無法借助數(shù)據(jù)信息實現(xiàn)對機械工作狀態(tài)的預測。所以,分析預測機械狀態(tài)的方式具備實際價值。
核電系統(tǒng)內部框架復雜,形成的數(shù)據(jù)與其結構復雜性呈正比。常規(guī)的設備預測方式有灰色預測、非線性濾波裝置等,但此類方式僅能反映出因果循環(huán),無法判斷時序數(shù)據(jù)和裝置工作狀態(tài)的聯(lián)系。當前,基于LSTM,利用核電裝置的時序信息預測設備狀態(tài),已經(jīng)有成功經(jīng)驗。比如,以LSTM為依托,建立摩擦模型,專門判斷設備滾動摩擦,以預測出機械工作的摩擦指數(shù)。又如,將該神經(jīng)網(wǎng)絡形成的模型與分解算法聯(lián)合應用,對軸承信息的本征模函數(shù)進行分量,獲得信息和支持向量機加以比較,以此判斷設備的狀態(tài)。
預處理為發(fā)掘信息的關鍵一步,要求提供的原始信息有價值,但現(xiàn)實情況一般無法達到。而利用預處理,將專業(yè)知識當成“向導”,梳理原始數(shù)據(jù),去除與預測對象無關的因素,由此建立出更為精準的數(shù)據(jù)模型。有關此方面的理論及方式有多種,但在核電設備此種較為復雜地預處理上,還未出現(xiàn)切實深入地分析。相關表達式為:
其中,x是實驗數(shù)據(jù),μ是平均數(shù),σ是標準差。
該種神經(jīng)網(wǎng)絡是基于常規(guī)相關結構設計,增加時序數(shù)據(jù),以提高預測環(huán)境的適應度。傳統(tǒng)的RNN模型本身有梯度消失及爆炸的弊端,難以長時間工作,同時,使用該模型需實現(xiàn)設置處理窗口長度,而此參數(shù)無法準確把握。LSTM屬于RNN的一種變體,其在基礎模型上,添加記憶單元,由此達到對時序數(shù)據(jù)的監(jiān)控。各序列信息會在各單元傳遞期間,經(jīng)過多道可控門,把控以往與實時信息的遺忘指數(shù),以此實現(xiàn)長期記憶,利用此種模式,LSTM切實改進原本的缺陷,提高預測效率。
此項算法是目前相關機械領域應用頻率較高的調整方式,現(xiàn)如今已經(jīng)形成多個版本的運算方式,即Adam、RMSProp、SGD等。以SGD為例,其是在確定樣本范圍內,運用隨機抽樣方式獲得一定容量的樣本,以此代表整個樣本。此種處理形式可以在確定樣本范圍的基礎上,快速得出結果。其可避免由于樣本數(shù)量增加而影響運算效率的問題,控制機械資源占用率[1]。
預測參考的數(shù)據(jù)為單變量時序信息,預測模型分成五個單元。其一,輸入層,其負責簡單整理預測所用的信息,設定數(shù)據(jù)集,實現(xiàn)對數(shù)據(jù)的規(guī)范化管理,確保數(shù)據(jù)分割等處理,適應預測模型的輸入標準。其二,隱藏層,借助LSTM構建網(wǎng)絡神經(jīng),其中系統(tǒng)中的遺忘門影響對神經(jīng)元情況變化的保留量,而輸入門負責確定設備當前相關數(shù)據(jù)的保留量,輸出層則負責給出最終結果。利用SGD算法調整各數(shù)據(jù)的比重,兼顧準確度和效率。
第一步,設置機械的原始狀態(tài)下的時序數(shù)據(jù)。為滿足隱藏層對于輸入數(shù)據(jù)的要求,可采用分割方式整理數(shù)據(jù)集。
第二步,把整體分成兩項內容,即train_x與train_y、test_x與test_y。第三步,把train_x,train_y傳送至隱藏層中。根據(jù)初期對兩類數(shù)據(jù)集進行的參數(shù)設計,二者比值是9:1,由此得到輸出值與train_y都是 ( 0.9*t,L-m)。所以,使用均方誤差進行計算。進行預測實驗的目的是控制損失函數(shù),基于差異化的學習率及窗口長度等,利用SGD進行數(shù)據(jù)權重調整,以形成更佳的數(shù)據(jù)模型。合理運用LSTM對機械狀態(tài)加以預測,并把test_x傳送至數(shù)據(jù)模型中,并借助test_y得到較為精確的預算結果[2]。
首先,確認數(shù)據(jù)集,預測對象是核電機械中的主泵繞組,以溫度參數(shù)為預測指標。此項參數(shù)能直接反映出核電機械工作狀態(tài),而溫度是否處于適宜范圍內,決定機械當前的工作情況。本次預測實驗以1條/min的頻率進行數(shù)據(jù)采集,涉及到的數(shù)據(jù)超過370萬。
其次,度量指標。實踐訓練選用的度量方法關乎最終運算準確程度,常用方法有三種,分別計算誤差平方期望值、算術平方根以及平均數(shù)。為保障數(shù)據(jù)模型的運算準確性,一般會選用最后一種。
最后,預測結果。一方面,建立的模型參數(shù)準確性較好,使用差異化的窗口長度及學習率,進行模型實驗。經(jīng)過多次實驗記錄結果限制,在窗口長度是15,且學習率為0.02,此時該模型的狀態(tài)預測質量為最佳狀態(tài),MAE值約等于0.03。另一方面,此模型和RNN、GRU相較。為驗證該模型可以在多種工作狀態(tài)下,是否可以保持穩(wěn)定預測,實驗期間通過調整隱藏層的數(shù)據(jù),建立其他兩種模型,同時,應用一樣的數(shù)據(jù)展開實驗,由此判斷預測準確性。經(jīng)實踐數(shù)據(jù)顯示,RNN數(shù)據(jù)模型預測狀態(tài)最佳時的MAE值超過0.034,而GRU則超過0.032。通過數(shù)據(jù)對比,基本可以得出,LSTM的應用效果優(yōu)于RNN及GRU[3]。
根據(jù)實驗結果顯示,LSTM的應用性能較佳,且其在學習率的參數(shù)確定方面,有較高的敏感度,即使有細微地調整,也會改變最后結果的精度,但其訓練周期相對偏長。簡單而言,已經(jīng)證實LSTM的使用效果,并拓寬實際預測范疇。根據(jù)現(xiàn)今核電機械的運轉狀態(tài),應當繼續(xù)深化在隱藏層以及最佳參數(shù)等方面的分析,以更好地掌握核電設備的工作狀態(tài)。