朱一虎,夏虹,楊波,朱少民,張汲宇,王志超
1. 哈爾濱工程大學 核安全與先進核能技術工業(yè)和信息化部重點實驗室,黑龍江 哈爾濱 150001
2. 哈爾濱工程大學 核安全與仿真技術重點學科實驗室,黑龍江 哈爾濱 150001
核主泵是反應堆一回路壓力邊界的重要組成部分之一,是反應堆及一回路系統(tǒng)中最關鍵的旋轉設備,其主要功能是將一回路中的冷卻劑進行升壓,克服冷卻劑在設備和管道中的流動阻力,促使其將堆芯中產(chǎn)生的熱量傳遞到蒸汽發(fā)生器,保證堆芯的正常冷卻,因此保證主泵電機長期、安全、穩(wěn)定、可靠地運行至關重要。而在夏季時,由于環(huán)境溫度升高,主泵電機定子繞組運行溫度會接近其跳泵限值[1],對機組構成了潛在威脅,需要對其定子繞組溫度進行預測,以便工作人員判斷其運行趨勢并且采取相應的安全保護措施。
對于設備運行參數(shù),傳統(tǒng)的預測方法主要有3 類:回歸分析法,此方法的計算原理和結構形式都比較簡單,預測速度快,但對復雜多變的數(shù)據(jù)預測精度較低;整合移動平均自回歸(autoregressive integrated moving average, ARIMA)模型,利用差分對原始序列進行平穩(wěn)化,根據(jù)序列特性求得相關參數(shù)來進行預測,此模型較為簡單,只需要原始序列產(chǎn)生的變量而不需要其他外生變量,但其要求原始序列或原始序列差分后的序列是穩(wěn)定的,并且無法捕捉非線性關系;機器學習模型,此類方法主要以當前時間點的數(shù)據(jù)特征進行建模預測,未考慮數(shù)據(jù)的時序性,在對基于時間序列的數(shù)據(jù)進行預測時誤差較大[2]。
近年來,眾多的國內(nèi)外學者開始將深度學習用于時間序列的預測中。王鑫等[3]利用長短期記憶(long short-term memory, LSTM)神經(jīng)網(wǎng)絡對復雜系統(tǒng)的歷史故障數(shù)據(jù)進行時間序列預測,王祥雪等[4]通過對LSTM 網(wǎng)絡逐層構建和精細化調(diào)參來預測短時交通流,并且可以根據(jù)預測精度進行參數(shù)的自適應更新。牛哲文等[5]在傳統(tǒng)門控循環(huán)單元(gated recurrent unit, GRU)神經(jīng)網(wǎng)絡的基礎上融合了卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN)來預測風電場的短期風功率,并引入隨機失活(dropout)技術減少模型的過擬合現(xiàn)象。針對時間序列數(shù)據(jù)固有的不平穩(wěn)導致預測精度較低的問題,很多研究人員引入模態(tài)分解方法,去除一部分噪聲,再對不同尺度下的分量分別預測[6?12]。相較于上述應用場景,時間序列預測方法在核電站中的應用較少,武云云等[13]將ARIMA模型應用于環(huán)境放射性水平的預測,結果表明預測值與實際值基本一致。張思原等[2]提出了基于LSTM 的多特征融合多步狀態(tài)預測模型,對蒸汽發(fā)生器的蒸汽壓力進行預測,驗證了該方法的有效性。朱少民等[14]結合ARIMA 和LSTM 的優(yōu)勢,利用組合模型對核電廠主泵的運行狀態(tài)進行預測,結果表明該方法具有更加穩(wěn)健的預測性能。
本文采用自適應噪聲完備集合經(jīng)驗模態(tài)分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)與門控循環(huán)單元結合的模型來對時間序列進行預測。相比于集合經(jīng) 驗 模 態(tài) 分 解 (ensemble empirical mode decomposition, EEMD),該方法在分解過程中添加的是白噪聲經(jīng)過經(jīng)驗模態(tài)分解(empirical mode decomposition, EMD)得到的各階本征模態(tài)函數(shù)(intrinsic mode functions, IMF),最后重構信號中的噪聲殘余更小,降低了篩選次數(shù),同時也避免了各模態(tài)分量結果差異造成的集合平均難以對齊的問題。利用GRU 神經(jīng)網(wǎng)絡對分解重構得到的各分量分別建立相應的預測模型,對各預測結果進行疊加從而得到最終的預測結果。
EMD 是一種基于信號局部特征自適應的信號分解方法,它根據(jù)信號的局部特征尺度,按頻率由高到低將復雜的非線性、非平穩(wěn)信號分解為有限個本征模態(tài)函數(shù)之和。然而大量的實踐證明,EMD 分解方法存在的模態(tài)混疊現(xiàn)象限制了其應用。隨后Wu 等[15]提出了對此問題的改進措施——EEMD,即給原始信號添加均勻分布的白噪聲,使得不同尺度的信號會自動映射到合適的參考尺度上。雖然EEMD 抑制了模態(tài)混疊,但是對原序列添加的白噪聲仍有可能殘存于分解后的模態(tài)分量中,影響了后續(xù)信號的進一步分析。在此基礎上,Torres 等[16]提出在分解時添加自適應白噪聲,有效降低了EEMD 重構時的誤差。其具體步驟為:
1)對原始序列f(t)添加白噪聲序列,得到含有噪聲的信號序列fi(t),對此序列進行N次EMD 分解后取算術平均值得到第1 個模態(tài)分量FIMF1(t):式中: ε0為噪聲系數(shù),ωi(t)為第i次分解加入的服從標準正態(tài)分布的白噪聲序列。
2)計算第一殘余分量:
3)定義Ej(·)為對序列進行EMD 分解后的第j個模態(tài)分量,則對r1(t)+ε1E1(ωi(t))分解得到:
4)重復步驟2)、3)得到其余的模態(tài)分量和殘余分量,直到所得到的殘余分量極值點個數(shù)小于等于2,則停止分解,此時得到固有模態(tài)分量FIMFK
和最終殘余分量R(t)。最終殘余分量可表示為
CEEMDAN 分解通過添加自適應白噪聲對序列進行了干擾脈沖的平滑處理,進一步降低了重構時的誤差,提高了完整度。
循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)是深度學習領域中一類特殊的內(nèi)部存在自連接的神經(jīng)網(wǎng)絡,它通過隱藏層上的回路連接使得前一時刻的網(wǎng)絡狀態(tài)能夠傳遞給當前時刻,當前時刻的狀態(tài)也可以傳遞給下個時刻。LSTM 神經(jīng)網(wǎng)絡是在RNN 中梯度錯誤累積過多而導致梯度消失或梯度爆炸的基礎上所提出的,其將門控的機制引入到循環(huán)單元中,可以有選擇性地添加和刪除數(shù)據(jù)信息,起到了控制信息數(shù)據(jù)流通的作用。GRU 是一種LSTM 的變體,它將LSTM 的輸入門和遺忘門耦合為更新門,用于控制隱藏狀態(tài)的更新,減少了矩陣乘法的運算,有效加速了網(wǎng)絡的收斂。GRU 的結構如圖1 所示。
GRU 的前向傳播計算過程可表示為
式中:xt為神經(jīng)元的輸入,ht?1為前一時刻隱藏層的狀態(tài),Wr、Wz和Wh分別為重置門rt、更新門zt和隱藏層的權重矩陣。重置門由該時刻的輸入和上一時刻的隱藏狀態(tài)控制,其決定了是否將隱藏狀態(tài)的信息遺忘,從而發(fā)掘數(shù)據(jù)間的短期聯(lián)系;更新門則控制上一時刻的信息在當前時刻的保留量。
利用CEEMDAN 將原始序列分解為若干個頻率不同的固定模態(tài)分量和1 個殘余分量,同時為了降低預測建模的復雜度和避免模型過擬合,對各分量進行重新組合得到高頻分量、低頻分量和趨勢項,運用GRU 網(wǎng)絡分別對重組后的分量進行預測,最后將預測結果疊加集成得到最終的預測結果。圖2 給出了此方法的預測流程,具體步驟如下:
1)利用CEEMDAN 將繞組溫度序列分解為K個模態(tài)分量FIMFi(t)(i=1,2,···,K)和1 個殘余分量R(t);
2)分別對FIMFi(t)做顯著性水平α=0.05下均值為0 的單樣本t檢驗;
3)若FIMFm(t)為第1 個Pvalue<0.05的模態(tài)分量,則將FIMF1(t)+FIMF2(t)+···+FIMFm?1(t)的結果作為高頻分量,將FIMFm(t)+FIMFm+1(t)+···+FIMFK(t)的結果作為低頻分量,最后將殘余分量作為趨勢項;
4)針對重組得到的3 個分量,分別構建相應的GRU 預測模型,得到各分量的預測值;
5)通過疊加處理得到最終繞組溫度的預測結果。
主泵電機是核電站的關鍵設備,通常采用的是易于安裝、使用和維護的異步電動機,而同步電機與異步電機的不同之處在于轉子的結構,其定子繞組都是相同的。本文采用來自德國Universit?t Paderborn 永磁同步電機(permanent magnet synchronous motor, PMSM)的實驗數(shù)據(jù)[17]進行預測方法的驗證,數(shù)據(jù)集共有12 個特征,包括溫度傳感器測量的環(huán)境溫度、冷卻液溫度、永磁表面溫度、定子軛溫度、定子齒溫度、定子繞組溫度以及電壓d軸分量、電壓q軸分量、電機轉速、電流引起的扭矩、電流d軸分量和電流q軸分量。仿真實驗的目標特征為定子繞組溫度。數(shù)據(jù)集共包含52 個測量階段,基本涵蓋了電機溫度變化的全過程,每個測量階段通過相對應的標簽加以區(qū)分,所有測量序列均以2 Hz 的采樣頻率在測試臺上完成。為降低計算成本,本文選取某個測量階段中時間間隔為150 min 的數(shù)據(jù)作為原始序列,標準化后的繞組溫度如圖3 所示。在圖3 所示的時間區(qū)間內(nèi),繞組溫度先后大致經(jīng)歷了振蕩、上升、下降以及再振蕩的階段,構成了相對完整的溫度變化周期,使得本文建立的預測模型對繞組溫度變化的特征提取更加充分,增強了研究結論的說服力。
圖3 原始繞組溫度序列
對圖3 所示的序列進行CEEMDAN 分解,得到11 個固有模態(tài)分量和1 個殘余分量,分解結果如圖4 所示。
圖4 CEEMDAN 分解結果
按順序依次對各分量進行顯著性水平α=0.05下均值為0 的單樣本t檢驗,各模態(tài)分量的t檢驗結果如表1 所示。
表1 各分量的t 檢驗結果
由表1 可知,F(xiàn)IMF1(t)~FIMF4(t)的Pvalue均大于0.05,而FIMF5(t)~FIMF11(t)的Pvalue均小于0.05,即在當前顯著性水平下第1 個均值顯著偏離0 的模態(tài)分量為FIMF5(t)。因此可將FIMF1(t)~FIMF4(t)疊加得到高頻分量Fhigh(t),表示序列的短期波動項;將FIMF5(t)~FIMF11(t)疊加得到低頻分量Flow(t),表示序列的中期重要因素影響項;殘余分量R(t)不變,作為序列的長期趨勢項。重組后的結果如圖5所示。
圖5 分量重組結果
對于重組后的分量,采用滾動時間窗的方式對子序列進行預測,選擇前80%的數(shù)據(jù)作為訓練集,后20%的數(shù)據(jù)作為測試集。采用雙層GRU神經(jīng)網(wǎng)絡,輸入序列長度為30,即選取前30 個樣本對序列進行預測,輸出序列長度為1,同時設置失活率為0.2 的Dropout 層以抑制網(wǎng)絡的過擬合。具體的GRU 神經(jīng)網(wǎng)絡超參數(shù)如表2 所示。為了消除數(shù)據(jù)間量綱的差異,加速網(wǎng)絡的收斂,在將數(shù)據(jù)輸入網(wǎng)絡之前采用MinMaxScaler 估計器對數(shù)據(jù)進行歸一化,使數(shù)據(jù)處于[0,1],其計算公式為
表2 GRU 神經(jīng)網(wǎng)絡的超參數(shù)
預測評價指標有很多種,為了對選用的方法進行全面的分析和評價,本文選用平均絕對誤差(mean absolute error, MAE)EMA、均方根誤差(root mean square error, RMSE)ERMS、對稱平均絕對百分比誤差(symmetric mean absolute percentage error,SMAPE)ESMAP以及校正決定系數(shù)(adjustedR-square)來評估預測模型的優(yōu)劣,相應的計算公式為
經(jīng)過網(wǎng)絡的訓練和測試,高、低頻分量和趨勢項預測結果如圖6~圖8 所示,對應的預測評價指標如表3 所示。
表3 重組分量的評價指標
圖6 高頻分量預測結果
圖7 低頻分量預測結果
圖8 趨勢項預測結果
從預測曲線圖6~圖 8 中可以看出,經(jīng)過分解、重組得到的3 個分量在測試集上的預測結果均與原分量序列基本重合,即預測模型對數(shù)據(jù)具有較強的解釋能力。
將這3 個分量的預測結果進行集成重構得到繞組溫度在測試集上的預測結果,同時與傳統(tǒng)RNN、LSTM 和GRU 模型進行對照實驗,如圖9 所示。
圖9 不同模型的預測結果
為了便于在具體的部分區(qū)域上比較不同模型之間的差異,對測試集中第128~130 min 的變化趨勢進行局部放大,如圖10 所示。從圖10 中可以看出,傳統(tǒng)神經(jīng)網(wǎng)絡模型雖然在整體趨勢上與實際趨勢保持一致,但在某些極值區(qū)域的預測輸出與實際值有不小的差距;而本文提出的預測模型不僅成功預測出了繞組溫度的變化趨勢,而且在局部極值處與真實值的誤差最小,在波動頻繁的區(qū)域也能捕捉到原始序列的細節(jié)特征,具有更強的預測能力。
圖10 不同模型局部區(qū)間的預測結果
同時表4 也給出了各預測模型的評價指標結果。數(shù)據(jù)表明,相比于其他模型,本文所提出的CEEMDAN-GRU 預測模型的MAE、RMSE、SMAPE值均最小,而Adjusted-R2值最大,即認為在所給出的評價指標上優(yōu)于其他模型。同時,將本文的模型與使用GRU 直接預測相比較,當分解重構的方法融入預測模型后,預測效果均取得了較大改善,驗證了CEEMDAN 分解可以更好地提取數(shù)據(jù)的內(nèi)在特征,提高預測精度。
表4 不同模型的評價指標對比
為了提高核電站中主泵電機的預警能力,適當優(yōu)化其維護策略,本文提出了一種基于CEEMDAN-GRU 的主泵電機繞組溫度預測算法,主要包括:
1) CEEMDAN 分解善于提取復雜時間序列的波動模式,GRU 神經(jīng)網(wǎng)絡在提取數(shù)據(jù)間的長期依賴關系方面具有優(yōu)勢,將二者有效結合,建立了新的時間序列預測耦合模型;
2) 通過計算分解后各模態(tài)分量的Pvalue進行分量的重組,以此作為網(wǎng)絡的輸入,降低了預測模型的復雜度,避免了模型的過擬合;
3) 相較于其他對比模型,CEEMDAN-GRU 的耦合模型在多元評價指標中均有明顯的優(yōu)勢,具有更好的預測性能。
在后續(xù)工作中,將對GRU 的參數(shù)優(yōu)化方法等展開進一步的研究。