韓利國
(陽泉市水文水資源勘測站,山西 陽泉 045007)
徑流式水電站廣泛存在于梯級水庫中。其來水和水位預報受諸多水力和機組特性控制因素影響,變化趨勢具有較強的非線性和隨機性,難以用傳統(tǒng)水動力模型準確模擬。水位高精度預報問題已成為制約水電站精細化運行的一大障礙[1-2]。近年來,國內外對水電站來水預報及其不確定性進行了大量研究。文獻[3]采用基于混沌理論的局部逼近模型對丹江口水庫月徑流量進行了預測。模型結果達到了較高的精度。紀昌明等[4]基于梯級水電站安全運行預警機制建立梯級水電站負荷調整耦合模型,旨在解決因來水不確定性導致實際調度要求與原發(fā)電計劃偏差的問題。同時解決了電站被迫減少出力運行或因來水不確定性導致水庫棄水的問題。
隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡以其強大的非線性能力和數(shù)據(jù)驅動被學者們用于徑流預報[5-6]。紀昌明等[7]基于小波分解的投影尋蹤建立自回歸組合預測模型預報宜昌站年徑流量。朱雙等[8]采用基于灰色關聯(lián)分析的模糊支持向量機方法對金沙江上游石鼓站月徑流量進行了預測,取得了較高的預測精度。唐明等[5]采用LSTM模型對南水北調中線工程進行了水位預測。同時分析了模型參數(shù)對預測精度的影響。
而梯級水庫群系統(tǒng)不僅具有經(jīng)濟效益和防洪功能,內部成員之間還具有關聯(lián)性和補償性。因此,在單水庫水位預測中需要考慮上下游水庫徑流的水力聯(lián)系以及二者之間水位差形成的電氣聯(lián)系[2]。目前,大多數(shù)預測方法都采用長序列的實測數(shù)據(jù)進行數(shù)據(jù)建模。這種方法受地形和相關水電站運行情況的影響。一些徑流式水電站的實測數(shù)據(jù)是不斷變化的。它們預測時間短,數(shù)據(jù)樣本少,波動大,導致實際建模中存在很多問題[1,9,10]。
沙坪水電站受流域地形、上游出水量和發(fā)電計劃的影響。這導致了水位預測的困難和頻繁的閘門移動[10]。本文采用PSO-LSTM神經(jīng)網(wǎng)絡構建沙坪水電站水位預測模型,采用上游枕頭壩出庫流量、沙坪過往運行數(shù)據(jù)、未來發(fā)電計劃和閘門開度作為模型參數(shù)。與傳統(tǒng)的水平衡模型相比,模型的精度有了很大的提高。利用該模型實現(xiàn)了沙坪水電站水位的快速預報,同時減少了閘門操作次數(shù)。這些結果為徑流式水電站的水位預報和精細化管理提供了參考和借鑒。
本文以大渡河規(guī)劃的梯級水電站之一的沙坪水電站為研究對象。位于四川省樂山市峨邊彝族自治縣、金口河區(qū)境內的大渡河干流段。與下面的沙坪一級水電站、龔嘴水電站相鄰。沙坪二級水庫總庫容2084萬m3,運行水位范圍550.0~554.0m。因為550m為水庫死水位,554m為正常蓄水位。4m水位運行范圍內庫容僅585萬m3。其結果是水庫庫容小,水位可調范圍有限。因此,水庫水位對上游流量的變化十分敏感,難以準確預測。以沙坪水電站2019年1月1日—12月31日間隔5min的實測數(shù)據(jù)為研究對象。這些數(shù)據(jù)集按月的順序分為訓練集和測試集。
基于沙坪水電站的固有屬性曲線,包括水位庫容曲線、機組N-H-Q曲線、尾水位流量關系曲線等,根據(jù)水量平衡原理進行了計算。計算的前提是知道水庫當前時刻壩前水位以及未來一段時間的入庫流量和計劃負荷。具體流程如下。
根據(jù)水量平衡公式,庫容變化量等于t~(t+1)時期水電站入庫水量與出庫水量之差。這意味著水的總量始終保持不變。計算公式為:
(1)
LSTM網(wǎng)絡作為一種時間循環(huán)神經(jīng)網(wǎng)絡(RNN)的變種網(wǎng)絡,LSTM添加遺忘門來解決RNN網(wǎng)絡存在的梯度消失的問題[13-14],實現(xiàn)了時間序列數(shù)據(jù)的長期預測,是當前業(yè)界應用最成功的RNN網(wǎng)絡架構。LSTM網(wǎng)絡拓撲如圖1所示。
圖1 LSTM網(wǎng)絡結構圖
LSTM的結構單元由紅色的遺忘門、藍色的輸入門和綠色的輸出門組成[17]。遺忘門ft決定信息的去留。輸入門it用于更新細胞狀態(tài)xt,由xt和ht-1經(jīng)由sigmoid計算獲得。輸出門ot用來確定下一時刻狀態(tài)信息的值xt+1,隱藏狀態(tài)包含了先前輸入的信息。首先,sigmoid函數(shù)的輸入為前一時刻隱藏狀態(tài)ht-1和當前輸入,sigmoid傳遞狀態(tài)信息給tanh函數(shù),并通過激活函數(shù)tanh和sigmoid函數(shù)的輸出數(shù)據(jù)相乘,確定ht攜帶的數(shù)據(jù)并作為輸出傳遞給下一個時間步長。LSTM計算公式如下。
it=σ(Wi·ht-1+Wi·xt+bi)
(2)
ot=σ(Wo·ht-1+Wo·xt+bo)
(3)
ft=σ(Wf·ht-1+Wf·xt+bf)
(4)
式中,it—輸入門的計算結果;ot—輸出門的計算結果;ft—遺忘門的計算結果;Wi—輸入門的權重;Wo—輸出門的權重;、Wf—遺忘門的權重;bi—輸入門的偏執(zhí)項;、bo—輸出門的偏執(zhí)項;bf—遺忘門的偏執(zhí)項;σ—激活函數(shù)。
gt=?[Wc·(ht-1,xt)+bc]
(5)
St=ft·ct-1+it·gt
(6)
ht=ot·?(St)
(7)
式中,gt—記憶單元輸入節(jié)點;St—狀態(tài)單元的狀態(tài);?—tanh函數(shù);Wc—輸入的權重矩陣;bc—輸入狀態(tài)偏執(zhí)項。
粒子群算法(PSO)誕生于對鳥類動物種群覓食生物行為和群體行為的二維空間模擬。首先在二維空間設置了許多具有隨機位置和速度的初始搜索粒子,粒子在空間通過將速度與位置相加來引導一個最佳點,完成局部尋優(yōu)和全局尋優(yōu)[15-16]。在尋優(yōu)過程中,通過不斷的跟蹤最優(yōu)解和對比局部搜索尋找出的最佳位置,更新整個粒子群的最優(yōu)位置并保存,最終實現(xiàn)局部尋優(yōu)到全體尋優(yōu)過程的實現(xiàn)。PSO優(yōu)化算法理論簡單,易實現(xiàn)應用,廣泛應用于最優(yōu)尋解參數(shù)的自整定尋優(yōu)[19]。PSO算法的公式如下。
(8)
(9)
(10)
表1 PSO優(yōu)化的LSTM超參數(shù)
預測誤差是預測值與預測對象的真實值之間的偏差,反映了預測算法的精確度。本文選用納什效率系數(shù)(Nash-Sutcliffe efficiency coefficient,NSE)和均方根誤差(Root Mean Square Error,RMSE)作為預測模型性能評價指標,計算公式如下。
(11)
(12)
本文在MATLAB開發(fā)環(huán)境中完成融合預測模型的搭建和訓練。本文利用PSO算法進行LSTM網(wǎng)絡模型的參數(shù)自動尋優(yōu),以提高LSTM模型自動化程度和預測準確度。本文提出的PSO-LSTM的數(shù)據(jù)融合預測模型的預測流程如圖2所示。
具體計算步驟如下。
(1)數(shù)據(jù)預處理。將數(shù)據(jù)集進行數(shù)據(jù)歸一化,劃分訓練集和測試集。
輸入數(shù)據(jù)歸一化:將輸入數(shù)據(jù)的取值轉換映射到制定區(qū)域,以便進一步分析數(shù)據(jù)數(shù)據(jù)的特性。數(shù)據(jù)歸一化可以降低原始數(shù)據(jù)中較大范圍的數(shù)據(jù)造成的影響,提高模型訓練的速度和預測的精準度。本文采用min-max歸一化方法使輸入數(shù)據(jù)處于[0,1]之間,min-max的公式如下。
(13)
式中,xi—預處理輸入數(shù)據(jù);yi—標準化后的時間序列數(shù)據(jù);max(xj)—數(shù)據(jù)的最大值;min(xj)—數(shù)據(jù)的最小值。
模型預測完成后需要對預測值進行反歸一化,查看預測值和真實值的對比結果,反歸一化函數(shù)如下。
y=min(xj)+yi{[max(xj)-min(xj)]}
(14)
以沙坪水電站2019年1月1日—12月31日間隔5min的實測數(shù)據(jù)為研究對象。這些數(shù)據(jù)集按月的順序分為訓練集和測試集。
(2)特征提取。通過CNN層獲取數(shù)據(jù)蘊含的時間和空間狀態(tài)特征。
(3)PSO參數(shù)初始化。設置粒子參數(shù)的初始值,隨機設置例子的是初始位置和速度。
(4)自動參數(shù)尋優(yōu)?;赑SO算法更新參數(shù)值、粒子速度和位置,達到最大迭代次數(shù)后,計算得到全局最優(yōu)粒子,即LSTM的最優(yōu)調參。
(5)初始化LSTM網(wǎng)絡模型。輸入PSO計算的最優(yōu)調參。
(6)建立PSO-LSTM預測模型,進行預測模型的訓練、驗證、測試,輸出預測結果反歸一化結果。
(7)驗證融合預測模型的結果,并進行模型性能評價。
模型的精度通過均方根誤差(RMSE)和納什效率系數(shù)(NSE)來評斷。在水量平衡模型中,本文最后采用了水位假設的迭代方法。模型的計算精度<0.1m3/s,最大迭代次數(shù)為200次。對于陷入局部無限循環(huán)的假設迭代,假設水位從前一時刻起沒有變化。選取4個全天時段進行測試驗證,水量平衡模型的測試精度見表2。
表2 2種模型的預測精度
在PSO-LSTM模型訓練階段,利用訓練集數(shù)據(jù)對模型進行訓練,并利用驗證集數(shù)據(jù)對水庫水位進行預測。訓練階段使用的模型超參數(shù)為128個隱藏單元,最大迭代次數(shù)為200次,學習速率為0.054168988。選取4個全天時段進行試驗驗證,PSO-LSTM模型的試驗精度見表2。結果表明:水量平衡模型的最高RMSE為1.618,平均RMSE為1.039;NSE最高為-2.3,平均為-8.773。PSO-LSTM模型的RMSE最高為0.164,平均為0.099;NSE指數(shù)最高為0.985,平均為0.835。這些結果表明,PSO-LSTM的總體預測效果較好,水分平衡模型的精度較好。
基于PSO-LSTM神經(jīng)網(wǎng)絡,構建了徑流型反調節(jié)水電站水位快速預測模型。并利用沙坪II水電站進行水位預測,驗證了模型的準確性。將得到的模型結果與基于水量平衡計算的預測結果進行比較,主要結論如下:PSO-LSTM神經(jīng)網(wǎng)絡處理的是多輸入非線性模型的預測問題,建模方便,精度高。與基于水量平衡的預測模型結果相比,PSO-LSTM神經(jīng)網(wǎng)絡模型具有較高的預測精度。同時,該模型基于數(shù)據(jù)驅動,避免了水電站自身靜態(tài)曲線對預測結果的影響,具有較大的實用價值。高精度的水位預測可為水電站調度優(yōu)化、水資源合理配置和智能閘門控制提供重要參考。