李彬,胡純瑾*,王婧
(1.華北電力大學電氣與電子工程學院,北京 102206;2.國網綜合能源服務集團有限公司,北京 100052)
“雙碳”目標下,加快構建以新能源為主體的新型電力系統(tǒng)成為必然,為有效提升電網調節(jié)能力,源荷互動電網調控模式必將替代傳統(tǒng)的“源隨荷動”。2022 年,國家發(fā)展改革委、國家能源局發(fā)布《關于完善能源綠色低碳轉型體制機制和政策措施的意見》(發(fā)改能源〔2022〕206 號)[1],提出積極推動電力需求響應市場化建設,將需求側可調節(jié)資源納入電力電量平衡,發(fā)揮需求側資源削峰填谷、促進電力供需平衡和適應新能源電力運行的作用??烧{節(jié)負荷作為新興電網調節(jié)資源,能有效改善電網調節(jié)資源的局限性,實現(xiàn)“雙碳”目標。通過市場機制創(chuàng)新,可調節(jié)負荷可參與電力中長期、現(xiàn)貨、調峰、調頻、備用市場等??烧{節(jié)負荷參與市場涉及電網企業(yè)、用戶、發(fā)電企業(yè)等的切身利益[2],不同負荷側調節(jié)資源間及其與傳統(tǒng)電源側調節(jié)資源間、與調度機構間存在市場準入、調節(jié)量計算等協(xié)調需要。
文獻[3]闡述了電力負荷預測中常用的幾類深度學習算法,對比分析驗證得出長短期記憶(LSTM)神經網絡算法具有較好的預測性能。文獻[4]以卷積神經網絡(CNN)與LSTM 神經網絡對時間序列的較強處理能力,提出CNN-LSTM 混合神經網絡模型算法,對時序性短期負荷進行預測。文獻[5]在LSTM 神經網絡基礎上引入注意力機制,以突出對負荷預測起到關鍵作用的輸入特征,提出基于Attention-LSTM 網絡的短期負荷預測模型。文獻[6]在已有的LSTM 神經網絡模型和寬度&深度模型的基礎上,建立Wide&Deep-LSTM 深度學習短期負荷預測模型,有效解決臺區(qū)電力負荷預測的多特征維度及時序性特征問題。文獻[7]提出一種經驗模態(tài)分解- 堆棧式長短期記憶(Empirical Mode Decomposition-Spatial Long Short Term Memory,EMDSLSTM)組合的短期負荷預測算法,分別對分量負荷和原始負荷數(shù)據(jù)進行預測建模及其重構,結果表明經驗模態(tài)分解算法雖然能有效提高模型的預測性能,但容易出現(xiàn)模態(tài)混疊現(xiàn)象,預測模型無法達到更優(yōu)的準確度。文獻[8]通過構建集合經驗模態(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)及門控循環(huán)單元(GRU)神經網絡和多元線性回歸(MLR)組合而成的EEMD-GRU-MLR(EGM)預測方法,有效提高了電力負荷短期預測精度,但由于可調節(jié)負荷具有時間相關性,EGM 方法并不適用于可調節(jié)負荷預測。
為解決EMD 的模態(tài)混疊現(xiàn)象,同時獲取負荷序列良好的時間感知能力,本文提出一種集合經驗模態(tài)分解-雙向長短期記憶(Ensemble Empirical Mode Decomposition-Bidirectional Long Short Term Memory,EEMD-BiLSTM)組合的可調節(jié)負荷預測方法,利用EEMD 將非平穩(wěn)、非線性負荷分解為更具平穩(wěn)的分量負荷,分別對分量負荷和原始負荷數(shù)據(jù)進行預測模型及重構,再結合BiLSTM 及其參數(shù),利用雙向循環(huán)網絡使用順序和倒序2個方向對已知序列進行學習,輸出結果包含二者信息,對EEMD算法獲得的分量負荷進行訓練,對各分量結果進行線性疊加,得出最終值。試驗結果表明,EEMD 算法能極大提高模型的預測性能,BiLSTM模型能有效提升模型的時間感知能力。
可調節(jié)負荷序列是非線性且非平穩(wěn)的,對于這類信號,基于小波的去噪方法已經取得過一定的效果,但這些方法必須要預先設定基函數(shù)。文獻[9]提出的EMD 雖能快速應用于信號去噪,但當信號出現(xiàn)異常事件時,將影響極值點的選取,篩選出的本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF)分量包含了信號的固有模式和異常事件或相鄰特征時間尺度的固有模式,從而產生模態(tài)混疊現(xiàn)象。隨后文獻[10]對EMD 進行了改進,提出EEMD,有效抑制模態(tài)混合。
可調節(jié)負荷預測有助于提高發(fā)電和配電的效率,具有實時調度、提高電力系統(tǒng)可靠性、降低運行成本、影響市場收入等作用。目前國內外對提高負荷預測準確性的研究主要包括基于時間序列的各種方法:自回歸移動平均(Auto Regressive Moving Average,ARMA)模型、回歸模型、支持向量機(Support Vactor Regression,SVR)、模糊理論以及混合模型。傳統(tǒng)的預測算法由于提前假設了相關時間序列的線性關系,無法處理噪聲大、波動大、趨勢不規(guī)則、非線性的數(shù)據(jù)等問題。在實際應用中,如果原始數(shù)據(jù)收到突然變化的社會或環(huán)境因素的影響,這些預測方法的誤差都會顯著增加。
淺層學習模型更適用于適應強的非線性學習和快速計算。深度學習模型可以通過增加隱藏層的數(shù)量從可調節(jié)負荷中提取深度信息。最常用的技術包括遞歸神經網絡(Recurrent Neural Network,RNN)、CNN 和LSTM。文獻[11]提出了一種具有LSTM 的循環(huán)神經網絡。LSTM 克服了RNNs 的長期以來性問題,LSTM 使用單元狀態(tài)、輸入門、遺忘門、輸出門4 部分在序列中保持長期和短期的依賴關系。然而,傳統(tǒng)的LSTM 只提供以前的數(shù)據(jù),它通過隱藏狀態(tài)以forward 方式接受輸入。為解決這個問題,提出了BiLSTM。在BiLSTM網絡中,輸入可以同時在2 個方向上進行處理,通過擬合2 個LSTM 的輸出得到最終結果。與LSTM 相比,對于相同的輸入序列,BiLSTM的預測精度更高。
EMD 在分析非平穩(wěn)、非線性的時間序列數(shù)據(jù)時具有自適應且高效分解的特點。根據(jù)原始數(shù)據(jù)信號的局部特征,通過EMD 技術從任何復雜信號中逐級提取不同尺度的波形或趨勢,將原始序列分解為相對穩(wěn)定的IMF和殘差分量。各IMF必須滿足以下2個條件。
(1)整個信號區(qū)間中的極值點數(shù)等于零點或差值為1。
(2)信號的平均極值為0。
EMD分解流程如圖1所示。首先計算原始信號上下極值點,畫出基于極值點的上下包絡線,根據(jù)上下線畫出均值包絡線,將原始信號減去均值包絡線,檢查得到中間信號是否滿足IMF條件,若滿足則選中為IMF分量,若不滿足則迭代上述步驟,經過多次迭代得到滿足IMF條件的分量和1個殘差值。
圖1 EMD分解流程Fig.1 EMD decomposition
循環(huán)神經網絡中輸出對張量Wxh,Whh和偏置b均可導,利用自動梯度算法來求解網絡的梯度,其中誤差L為最終輸出值ot與真實值之間的差距。
式中:x(t)為原始信號;IMFn(t)為IMF 分量;r(t)為殘差分量。
對于2個局部最小值或最大值點,c(t)作為平均值為零的振蕩函數(shù),取值為零。信號分解過程的理論基礎表達式為
式中:x(t)為非平穩(wěn)振蕩信號;c(t)為振蕩分量;r(t)為殘差分量,r0表示過程的初始剩余。
EEMD 本質上是用給定的試驗次數(shù)對原始負荷序列反復應用EMD,然后對所有分解結果取平均值。與EMD 不同,在每次EEMD 嘗試中,將頻率范圍均勻分布的高斯白噪聲加入到原序列中,使得具有噪聲輔助的原始負荷序列不僅具有均勻分布特性,還具有平滑等特性。
EEMD[12]的簡要步驟如下。
(1)給原始負荷序列添加1 個給定振幅的白噪聲。
(2)對加入白噪聲的負荷序列進行EMD 處理,得到IMF分量和剩余分量。
(3)按照給定試驗次數(shù)重復步驟(1)和步驟(2),在每次試驗中,IMF數(shù)量為常數(shù)。
誤差的最終標準偏差為輸入信號和相應IMF之間的差值,計算公式為
式中:N為IMF 分量數(shù);A為附加噪聲的振幅;ε為誤差的最終標準偏差。EEMD分解流程如圖2所示。
圖2 EEMD分解流程Fig.2 EEMD decomposition
在LSTM 模型中,c為LSTM 模型的狀態(tài)向量,h為LSTM 網絡的輸出向量,利用門控值向量σ(g)表示閥門開關程度。輸入門和遺忘門的典型行為見表1。
表1 輸入門和遺忘門的典型行為Table 1 Typical behavior of input and forget gates
LSTM記憶細胞的運算過程為
LSTM 模型雖然可以捕捉到較長距離的依賴關系,但LSTM 模型中一般將過去的信息作為輸入和隱藏層,而忽略了未來信息。
BiLSTM 在LSTM 基礎上,采用2 個獨立的隱藏層對序列數(shù)據(jù)進行正向和反向處理,將2 個連接層連接到同一輸出層,將之前的信息和之后的信息作為時間序列數(shù)據(jù)的當前時間基礎。使用BiLSTM 網絡進行預測,其對于連續(xù)時間序列有很好的表達能力,權重參數(shù)復用使得其對數(shù)據(jù)的要求更低。BiLSTM模型如圖3所示[13]。
圖3 BiLSTM 模型Fig.3 BiLSTM model
因此,在數(shù)據(jù)預處理階段,針對可調節(jié)負荷序列,采用EEMD能有效解決電力負荷數(shù)據(jù)的非線性、非平穩(wěn)問題,通過將具有頻率范圍內均勻分布的統(tǒng)計特性的白噪聲添加到負荷序列中,使得負荷序列具有均勻的分解尺度和平滑性。在負荷預測階段,將扁平化的數(shù)據(jù)輸入BiLSTM,改善負荷序列提取時相互依存的問題。BiLSTM模型中,前向層從負荷序列的起點開始輸入,反向層由數(shù)列的末端開始輸入,通過多次迭代最終將2層的輸出結果進行擬合,有效提高預測精度。
步驟1:添加正態(tài)分布高斯白噪聲εs到原始負荷序列Y,然后輸入新的負荷序列
基于高斯分布的統(tǒng)計特性,EEMD 方法可以有效抑制EMD 分解過程中由于IMF 的間歇性而引起的模態(tài)混合問題。由于電力負荷序列具有非線性、非平穩(wěn)特性,電力負荷序列更適用于EEMD 分解處理,使用獲得的子序列進行訓練,得到各個訓練后的結果,線性疊加后就是最終值[15]。
在BiLSTM 模型中,前向層和后向層共同連接著輸出層,其中包含了6個共享權值w1~w6。在前向層從時刻1~t正向計算一遍,得到并保存每個時刻向前隱含層的輸出。在后向層沿著時刻t~1 反向計算一遍,得到并保存每個時刻向后隱含層的輸出。最后在每個時刻結合前向層和后向層相應時刻輸出的結果得到最終的輸出[16]。
數(shù)學表達式為
式中:x1為t時刻的輸入量;ht和h′t為t時刻的前向層與后向層的輸出量;ot為t時刻輸出層的輸出;f為前向層與后向層的激活函數(shù);g為輸出層的激活函數(shù);w1為輸入層映射到前向層的權重矩陣;w3為輸入層映射到前向層的權重矩陣;w2為前向層前一時刻輸出映射到當前計算時刻的權重矩陣;w5為后向層前一時刻輸出映射到當前計算時刻的權重矩陣;w4為前向層的輸出映射到輸出層的權重矩陣;w6為后向層的輸出映射到輸出層的權重矩陣。
結合各方法的優(yōu)勢,構建EEMD-BiLSTM 可調節(jié)負荷預測模型,流程如圖4所示。
圖4 基于EEMD-BiLSTM 可調節(jié)負荷預測模型流程Fig.4 Adjustable load prediction model based on EEMD-BiLSTM
選取可調節(jié)負荷數(shù)據(jù),分析數(shù)據(jù)集是否存在異常值或缺失值等情況,針對異常值利用函數(shù)進行修補或剔除,針對異常值一般采用刪除或補全法,完成可調節(jié)負荷數(shù)據(jù)的清洗。對清洗后的可調節(jié)負荷序列進行EEMD分解,將分解后的序列作為輸入,建立BiLSTM 模型,初始化參數(shù),通過模型訓練尋找最優(yōu)Epoch和Adam 優(yōu)化器,設置提前停止機制防止模型過擬合,選擇合適的誤差函數(shù)對比驗證預測模型結果,確認模型預測精度。
數(shù)據(jù)選取國內某地區(qū)連續(xù)5年涵蓋日需求負荷的真實運行數(shù)據(jù)作為原始負荷數(shù)據(jù)集,日平均負荷曲線如圖5所示,縱坐標為日平均負荷量。
圖5 2009—2014年日平均負荷曲線Fig.5 Average daily load from 2009 to 2014
觀察原始負荷曲線圖,發(fā)現(xiàn)部分日平均負荷出現(xiàn)極低的情況,可能是由于大停電等特殊情況或電表監(jiān)測失誤所形成。每年2月出現(xiàn)集中日平均負荷極低的情況,分析可能是2月春節(jié)放假期間,辦公地區(qū)及工廠等工作區(qū)域用電量驟降。
2014年4月前后該地區(qū)的日平均負荷與其他月份相比較低,考慮到溫度影響,認為4月基本沒有溫度敏感性負荷。
從5月開始,隨著溫度升高,日平均負荷曲線開始逐漸升高,溫度敏感性負荷開始大量使用。至10月溫度再次回歸適宜,但與4月相比,日平均負荷稍有增加,考慮是由于公共區(qū)域人流量較上半年有所增加,用電負荷相應有所增長。進入冬季后,地區(qū)溫度下降,溫度敏感性負荷再次增長,用電量再次升高。將溫度設定為23 ℃,觀察溫度歷史數(shù)據(jù)集,發(fā)現(xiàn)4 月13 日溫度恰好適宜,選取當日平均負荷作為基本正常負荷,將溫度上升后5—9月扣除基本正常負荷,獲得剩余日總負荷視作可調節(jié)負荷,如圖6所示。
圖6 2014年可調節(jié)負荷曲線Fig.6 Adjustable load curve in 2014
針對提取的可調節(jié)負荷序列,采用EEMD 方法分解得到5 個IMF 分量,將每個分量數(shù)歸一化到[0,1]內,將歸一化的數(shù)據(jù)作為輸入,在BiLSTM 模型中進行預測,選取2009—2012年可調節(jié)負荷序列作為訓練集,2013 年可調節(jié)負荷序列作為驗證集,2014年可調節(jié)負荷數(shù)據(jù)作為預測集。
將預測結果反歸一化后,各分量預測結果線性疊加得出預測結果,將預測結果與原始負荷數(shù)據(jù)進行對比,對比預測結果與原始負荷數(shù)據(jù),計算參數(shù)優(yōu)化的EEMD-BiLSTM 模型預測精度。
在BiLSTM 模型訓練階段,通過多次迭代得出權重的最優(yōu)值,而Epoch 參數(shù)的大小與預測結果息息相關。Epoch 參數(shù)過大時,網絡分類復雜,模型不僅學習到正確信息,也會從一些錯誤信息中學習,會造成訓練結果出現(xiàn)過擬合現(xiàn)象,而Epoch 參數(shù)較小時,網絡分類過于簡單,模型無法學習到正確信息,會造成訓練結果出現(xiàn)欠擬合現(xiàn)象。選用Tensorflow-keras 庫中的EarlyStoping 函數(shù),提前停止機制防止過擬合現(xiàn)象[17]。
當網絡模型層數(shù)較深時,Sigmoid 函數(shù)容易出現(xiàn)梯度彌散現(xiàn)象,導致預測精度下降,而ReLU 函數(shù)在x<0 時梯度值恒為0,容易出現(xiàn)梯度彌散現(xiàn)象,因此針對可調節(jié)負荷序列,選取tanh 函數(shù)作為激活函數(shù),Adam 作為模型優(yōu)化器搭建訓練環(huán)境。將參數(shù)優(yōu)化后的EEMD-BiLSTM 模型與LSTM 模型、EEMD-LSTM 模型和BiLSTM 模型選用誤差函數(shù)平均絕對誤差(MAE)、均方根誤差(RMSE)對預測結果進行評估??烧{節(jié)預測負荷曲線對比情況如圖7所示。
圖7 可調節(jié)預測負荷曲線對比Fig.7 Comparison of adjustable load prediction curve
各模型評價指標對比見表2。觀察曲線圖及其誤差函數(shù)可知,加入高斯白噪聲后,運用EEMD分解方法對原始可調節(jié)負荷序列進行分解,EEMDLSTM 模型預測精度高于LSTM 模型,EEMDBiLSTM模型預測精度高于BiLSTM模型。
表2 各模型預測情況對比Table 2 Comparison of prediction made by different model
此外,觀察對比圖7 可知,BiLSTM 模型預測精度高于LSTM 模型,EEMD-BiLSTM 模型預測精度高于BiLSTM 模型,BiLSTM 模型具有更優(yōu)秀的時間序列感知力,能夠從訓練集中提取更多的有效信息進而提高預測精度,與BiLSTM 模型相比,LSTM 模型稍有滯后效應。EEMD-BiLSTM 模型不僅具有良好的時間序列感知力,可以從較長訓練集中提取更多有效信息以提高預測精度,在面對較長訓練集時,EEMD 有效降低了尺度混合對分解的影響,提高了模型的預測精度。
本文分析了EEMD和BiLSTM算法的原理,提出了EEMD-BiLSTM 模型應用到可調節(jié)負荷預測中。對預處理后的可調負荷進行EEMD 分解,試驗設計了BiLSTM 架構及其參數(shù),分別對分量負荷和原始負荷進行訓練和重構預測。試驗結果表明,EEMD分解算法能有效規(guī)避EMD 分解算法中的模態(tài)混疊問題,有效提高模型的預測性能。同時,基于BiLSTM 的學習方法可以將過去和未來的數(shù)據(jù)序列統(tǒng)一為輸入值,考慮數(shù)據(jù)的反向關系,有效預測可調節(jié)負荷序列的動態(tài)趨勢。由于在LSTM 的基礎上增加了反向結構,BiLSTM模型明顯延長了模型的訓練時間,降低了運算速度。因此在選擇預測模型時,應權衡模型的訓練效率和預測精度,選擇更適合的訓練模型。