(上海電力大學 自動化工程學院,上海 200090)
隨著全球能源需求的不斷增長,化石能源日益短缺[1]。為緩解能源危機,減小環(huán)境污染帶來的影響,新能源發(fā)電越來越受關(guān)注。2011 年,美國學者杰里米·里夫金(Jeremy Rifkin)在其著作《第三次工業(yè)革命》中,以新能源技術(shù)和信息技術(shù)的深入結(jié)合為特征,首次提出能源互聯(lián)網(wǎng)的概念[2]。能源互聯(lián)網(wǎng)包括廣域能源互聯(lián)網(wǎng)和區(qū)域能源互聯(lián)網(wǎng),廣域能源互聯(lián)網(wǎng)一般承擔遠距離的大型輸電,連接兩地大型能源基地;區(qū)域能源互聯(lián)網(wǎng)作為能源互聯(lián)網(wǎng)的重要表現(xiàn)形式,主要進行近距離輸配電,多用于經(jīng)濟開發(fā)區(qū)、工業(yè)園區(qū)、電動汽車充放電等[3]。能源互聯(lián)網(wǎng)主要由天然氣、風電、光伏、儲能提供電熱,因此推進了多種能源形式協(xié)同運行,通過燃氣內(nèi)燃機、燃氣輪機、風光發(fā)電以及生物質(zhì)能發(fā)電,實現(xiàn)了能源的梯級利用和優(yōu)勢互補,符合“融合”“統(tǒng)一”“高效”“清潔”的理念[4]。能源互聯(lián)網(wǎng)以其強大的耦合性為可再生能源產(chǎn)業(yè)發(fā)展提供保障,同時也成為智能電網(wǎng)的重要組成部分。
針對電網(wǎng)的可靠運行問題,很多學者進行了相關(guān)研究。文獻[5]介紹了神經(jīng)網(wǎng)絡的特點,說明了能夠有效處理電力短期負荷預測數(shù)據(jù)的非線性變化問題。文獻[6]能夠達到較高的精度,但其優(yōu)化尋優(yōu)算法考慮的因素較多,模型復雜,訓練時間長,給實際應用帶來困難。文獻[7-8]采用人工神經(jīng)網(wǎng)絡對負荷參數(shù)模型進行預測,但是精度不夠理想。文獻[9]采用改進的遺傳算法搜索全局最優(yōu)值,以優(yōu)化極限學習機算法等建立負荷預測的模型,預測結(jié)果基本可以滿足精度要求,但預測模型考慮了較多因素,模型構(gòu)建復雜。文獻[10]對配電網(wǎng)進行負荷預測,并對不同層數(shù)的神經(jīng)網(wǎng)絡模型進行了對比,結(jié)果顯示對于差異性較大的模型尚不能達到最優(yōu)效果。文獻[11-12]闡述深度學習在電力負荷預測中的應用,列舉了常用的深度學習算法,對比分析之后驗證出LSTM(長短期記憶神經(jīng)網(wǎng)絡)算法具有較高的精度,能夠較好地預測負荷的短期功率,因此本文算例分析中采用LSTM 算法進行建模。文獻[13]提出了一種改進的最小二乘向量機負荷預測模型,但模型預測結(jié)果依然存在較大誤差,無法保證整體相對平穩(wěn)的預測精度。
與大電網(wǎng)相比,區(qū)域能源互聯(lián)網(wǎng)負荷隨機性很強,歷史負荷曲線相似度低,基本沒有規(guī)律可循;并且用戶容量有限,各用戶間負荷特征不夠明顯。本文算例分析中采用EEMD(集合經(jīng)驗模態(tài)分解)方法對原始數(shù)據(jù)進行分解,能夠有效避免模態(tài)混疊現(xiàn)象[14];同時基于LSTM 較精準的預測效果,利用LSTM 對EEMD 方法得到的每個分量分別進行預測,以獲得更好的預測結(jié)果。
EEMD 由EMD(經(jīng)驗模態(tài)分解)加入白噪聲后改進得出。對于非平穩(wěn)數(shù)據(jù),不需要考慮其他因素影響,可以使用EMD 方法得到一組能夠表現(xiàn)信號特征的數(shù)據(jù)。與小波變換等方法相比,這種方法是直觀的和自適應的。因為分解是基于信號序列時間尺度的局部特征,而EEMD 作為一種白噪聲輔助分析方法,在原始信號中加入多組隨機的白噪聲信號,能夠更有效地降低原始序列的波動性,其分解過程如圖1 所示。利用EEMD 方法可以將能源互聯(lián)網(wǎng)負荷序列分解成數(shù)個相對平穩(wěn)的分量。相比于小波分析,EEMD 不需要對信號進行預先分析和研究,而是直接進行分解。
圖1 EEMD 過程
在本次模型建立中,將能源互聯(lián)網(wǎng)原始負荷序列x(t)中加入隨機白噪聲序列nm(t),得到加入噪聲信號后的待處理序列:
式中:N 為EMD 總體平均次數(shù)。
運用EMD 方法加入100 組有差別的隨機白噪聲序列,標準差取0.2。將區(qū)域能源互聯(lián)網(wǎng)原始負荷序列分解一次之后再加入均方根相等的白噪聲序列,經(jīng)過N 次EMD,使信號重構(gòu)達到較好的效果。通過此次分解,原始數(shù)據(jù)68 個典型日的采樣點共得到了7 個IMF 分量和1 個剩余分量,也就是區(qū)域能源互聯(lián)網(wǎng)原始負荷序列的EEMD結(jié)果。EEMD 能夠克服基函數(shù)無自適應的問題,把時間序列分解成若干個IMF 分量和殘余項R(t),即某個時刻采樣點的數(shù)值等于對應的各個IMF分量與殘余項相加。
為了解決RNN(循環(huán)神經(jīng)網(wǎng)絡)在處理長期依賴性時產(chǎn)生的梯度消失問題,提出了在RNN 基礎上的改進算法LSTM,該算法在每個隱藏層中引入柵極和存儲單元的概念。一個LSTM 內(nèi)存塊主要由輸入門、遺忘門、輸出門和自連接存儲單元4 個部分組成。輸入門控制對存儲單元的激活輸入,能夠?qū)W習如何過濾和輸出到連續(xù)網(wǎng)絡的激活單元。遺忘門幫助網(wǎng)絡忘記過去的輸入數(shù)據(jù)并重新設置記憶細胞,由sigmoid 單元將權(quán)重設置為0 和1 之間的值:當權(quán)重為0 時,表示將上一狀態(tài)的信息全部舍棄;當權(quán)重為1 時,表示將上一狀態(tài)的信息全部保留。此外,應用乘法門使存儲單元可以長時間訪問和存儲信息,每個單元中都包含存儲前一時刻信息的記憶細胞。因此,LSTM 作為一種深度神經(jīng)網(wǎng)絡,具有更多的隱藏層,增加了計算的精度優(yōu)勢。LSTM 的典型結(jié)構(gòu)如圖2 所示,單個LSTM 神經(jīng)元的預測結(jié)構(gòu)如圖3 所示。LSTM 記憶細胞的運算過程為:
候選時刻記憶單元狀態(tài):
當前時刻記憶單元狀態(tài):
式中:Wf,Wi,Wc,Wo分別為遺忘門、輸入門、細胞狀態(tài)、輸出 門的權(quán)重矩陣;bf,bi,bc,bo分別為對應的偏置矢量;xt為輸入值;σ 為sigmoid函數(shù);下標t 表示當前時刻,t-1 表示前一時刻。
圖2 LSTM 典型結(jié)構(gòu)
從圖3 中可以看出,LSTM 包括各個向量的交互,使得結(jié)構(gòu)相比于單一的神經(jīng)網(wǎng)絡具有更多的層級。圖中“+”表示矩陣相加,“×”表示矩陣相乘。在進行負荷預測時,結(jié)合當前時刻的負荷輸入值與前一時刻的負荷輸出值賦予不同的權(quán)重矩陣和偏置矢量,使用tanh 函數(shù)和sigmoid 單元進行細胞狀態(tài)的更新。本次試驗設置隱藏層數(shù)為2,采用前48 個時刻預測后24 個時刻,訓練集和測試集設置比例為7:3。首先利用EEMD 方法對原始負荷數(shù)據(jù)進行分解,得出一組具有不同特征的分量;然后將分解后的各個分量分別送入LSTM 進行預測;最后將各個分量值累加,得到預測結(jié)果。
圖3 單個LSTM 神經(jīng)元的預測結(jié)構(gòu)
本文提出基于EEMD-LSTM 的區(qū)域能源互聯(lián)網(wǎng)系統(tǒng)日前小時負荷預測模型,對應流程如圖4所示。對于歷史區(qū)域能源互聯(lián)網(wǎng)小時出力序列,首先采用EEMD 方法分解得到一組分量,每個分量數(shù)據(jù)歸一化到[0,1]范圍內(nèi),然后建立對應的LSTM 模型進行預測,將結(jié)果進行反歸一化,并疊加各個分量即日前區(qū)域能源互聯(lián)網(wǎng)系統(tǒng)小時負荷預測值,最后將輸出的預測結(jié)果與原始負荷數(shù)據(jù)進行對比,并進行誤差分析。
為了更直觀地對比預測結(jié)果,本次算例選用預測結(jié)果誤差分析常用的APE(相對百分比誤差,量符號為EAP)進行作圖分析,對比各個算法的誤差結(jié)果。使用MAPE(平均絕對百分比誤差,量符號為EMAP)、MSE(均方誤差,量符號為EMS)和RMSE(均方根誤差,量符號為ERMS)分別對預測結(jié)果進行評估,各個誤差的表達式分別為:
圖4 EEMD-LSTM 流程
式中:n 為數(shù)據(jù)總個數(shù);Yi為第i 個實際值;yi為第i 個預測值。
本文以某區(qū)域能源互聯(lián)網(wǎng)系統(tǒng)各單元總負荷數(shù)據(jù)為研究對象,選取2017 年1 月1 日00:00 至2017 年3 月9 日24:00,共計68 個典型日,采樣時間間隔為1 h,共計1 632 個點。LSTM 的迭代次數(shù)設置為100 次,隱藏層數(shù)為2,訓練集和測試集設置比例為7:3。尋找最優(yōu)的預測模型之后,把預測樣本作為輸入值代入最優(yōu)模型中并得到2017 年3 月9 日的預測值。采用EEMD 方法對原始負荷序列進行分解,結(jié)果如圖5 所示。
通過圖5 各個分量圖可以更直觀地看出,所有IMF 分量均反映出頻率從高到低的不同尺度的系統(tǒng)負荷序列波動特性。IMF1 的平均振幅小,在所有分量中頻率最高,并且規(guī)律性不明顯,可以判斷為負荷序列中的隨機分量;IMF2—IMF4具有較好的規(guī)律性,周期性較為明顯,而且曲線的幅值隨著時間的推移有所增長,可以反映出負荷序列的局部波動情況,因此這些IMF 分量可判定為負荷序列的細節(jié)分量;其余的IMF 分量和余量R(t)的平均振幅大,具有很好的周期性和規(guī)律性,尤其是余項反映了負荷曲線的全局變化趨勢,因此IMF5—IMF7 以及余量R(t)為負荷序列的趨勢分量。
圖5 原始負荷數(shù)據(jù)的EEMD 結(jié)果
為了驗證本文預測模型的可行性,選取了另外3 種模型與其進行對比,其中一個模型采用單一的LSTM,另一個模型采用EMD-LSTM 算法,最后一個為其他的單一神經(jīng)網(wǎng)絡模型——Elman神經(jīng)網(wǎng)絡。選取2017-01-01 T 00:00—03-09 T 24:00 期間,時間間隔1 h 的采樣點,共計1 632個點。對后24 個采樣點進行預測,即對3 月9 日00:00 —24:00 采樣點數(shù)據(jù)進行對比分析。預測結(jié)果如圖6 所示,預測相對誤差如圖7 所示,預測誤差數(shù)據(jù)對比見表1。
圖6 系統(tǒng)3 月9 日負荷預測結(jié)果(采樣間隔1 h)
圖7 系統(tǒng)3 月9 日負荷預測相對誤差對比(采樣間隔1 h)
由圖7 可以看出,EEMD-LSTM 算法的相對誤差波動性較小。由表1 可以看出,采用EEMDLSTM 模型的預測精度最高,其MAPE 和MSE 比其他模型的值都要小,驗證了LSTM 算法的可行性,同時證明了EEMD 方法能降低原始序列的非平穩(wěn)性對預測精度的影響。
表1 系統(tǒng)負荷預測誤差數(shù)據(jù)對比(采樣間隔1 h)
由表1 可以看出,單一神經(jīng)網(wǎng)絡進行比較時,LSTM 的預測精度比Elman 要高,加入白噪聲運用EEMD 方法進行原始負荷數(shù)據(jù)分解后,能夠克服EMD 方法分解的不足,預測精度有明顯提高。從整體來看,基于EEMD-LSTM 算法的預測結(jié)果很少出現(xiàn)相對誤差極大的點。而另外兩種模型的預測結(jié)果中,往往會出現(xiàn)較多相對誤差極大的“失真點”。采用MAPE,MSE 和RMSE 作為評價指標,算例分析得出的值越小,說明模型的預測精度越高。
為了驗證本文提出算法的有效性和適用性,使用間隔15 min 采樣點進行預測對比?,F(xiàn)仍采用2017-01-01 T 00:00—03-09 T 24:00 期間,時間間隔為15 min 的采樣點,共計6 528 個點。對后24 個采樣點進行預測,即對3 月9 日19:00—24:00采樣點數(shù)據(jù)進行對比分析。預測結(jié)果如圖8 所示,為便于與前例對比分析,誤差預測結(jié)果如圖9 所示,預測誤差數(shù)據(jù)對比見表2。
由表1 和表2 對比分析可以得出,數(shù)據(jù)量由1 632 個采樣點增大到6 528 個采樣點時,EEMDLSTM 構(gòu)造的預測模型的精度最高。同時,驗證了在單一算法中LSTM 相對于Elman 的優(yōu)越性。在組合預測中,EEMD-LSTM 能夠比EMD-LSTM取得更好的效果,算法對比表明了EEMD-LSTM的優(yōu)越性。
使用同時段的數(shù)據(jù),采樣時間間隔15 min,共計6 528 個采樣點,預測3 月9 日全天的負荷預測值,結(jié)果如圖10 所示。訓練集與測試集比例不變,將迭代次數(shù)增加至150 次,EEMD-LSTM模型的MAPE 維持在3.5%左右,進一步驗證了數(shù)據(jù)量增大時EEMD-LSTM 算法的優(yōu)越性。由于預測點增多,需要擴大預測的維度及增加迭代次數(shù)。當需要預測的點增加時,精度會有所下降,計算時間也會增長。但相比于原始數(shù)據(jù)采樣點較少時的預測結(jié)果來說,當數(shù)據(jù)量增大時,EEMDLSTM 的預測結(jié)果能夠達到更精準的效果。
圖8 系統(tǒng)3 月9 日19:00—24:00 負荷預測結(jié)果(采樣間隔15 min)
圖9 系統(tǒng)3 月9 日19:00—24:00 負荷預測相對誤差對比(采樣間隔15 min)
表2 預測誤差數(shù)據(jù)對比(采樣間隔15 min)
圖10 系統(tǒng)3 月9 日全天負荷預測結(jié)果(采樣間隔15 min)
針對區(qū)域能源互聯(lián)網(wǎng)發(fā)電短期負荷功率預測的準確性問題,本文提出了一種基于EEMDLSTM 算法的區(qū)域能源互聯(lián)網(wǎng)系統(tǒng)小時負荷預測模型。EEMD-LSTM 模型能夠有效克服原始信號中的不確定因素,并且利用LSTM 存儲單元長時間學習和保留電力負荷歷史數(shù)據(jù)中的有用信息,并使用遺忘門將無用信息去除,然后將EEMD 得出的每一個分量送入LSTM 算法中進行預測,對結(jié)果進行疊加處理后得出最終的預測結(jié)果。
為便于對比分析,本文使用傳統(tǒng)的Elman 算法、單一的LSTM 算法以及EMD-LSTM 構(gòu)建模型,使用相同的數(shù)據(jù)采樣點建模,對比各個模型預測結(jié)果曲線的擬合情況,并對結(jié)果進行了誤差分析。針對區(qū)域能源互聯(lián)網(wǎng)系統(tǒng)短期負荷序列的無規(guī)律波動特性,與EMD 相比,EEMD 能更有效地降低對預測結(jié)果的影響,EEMD-LSTM 能夠更準確地對負荷進行預測。當需要預測的數(shù)據(jù)增多時,預測模型的運算時間會稍有延長。當原始數(shù)據(jù)量增大而需要預測的采樣點不增加時,EEMD-LSTM 體現(xiàn)出了精度更高的優(yōu)越性。因此,EEMD-LSTM 基本能夠滿足區(qū)域能源互聯(lián)網(wǎng)短期負荷預測的要求,為能源互聯(lián)網(wǎng)電力系統(tǒng)的平穩(wěn)運行提供一定參考。