葛磊蛟,趙 康,孫永輝,王 堯,牛 峰
(1. 天津大學智能電網(wǎng)教育部重點實驗室,天津市 300072;2. 山東科技大學電氣與自動化工程學院,山東省青島市 266590;3. 河海大學能源與電氣學院,江蘇省南京市 210098;4. 省部共建電工裝備可靠性與智能化國家重點實驗室(河北工業(yè)大學),天津市 300130)
精準的短期負荷預測是配電網(wǎng)安全穩(wěn)定運行、調(diào)度優(yōu)化和降低運營成本的重要保障[1]。隨著智能電網(wǎng)、能源互聯(lián)網(wǎng)的快速發(fā)展,電網(wǎng)企業(yè)獲取了大量的電力負荷數(shù)據(jù),尤其是中國智能配電網(wǎng)數(shù)據(jù)存儲容量每年達PB 級,這為配電網(wǎng)負荷預測提供了重要的數(shù)據(jù)資源。然而,若直接將這些數(shù)據(jù)全部作為負荷預測的原始數(shù)據(jù)集輸入,將會大大增加負荷預測不必要的負擔,反而降低預測精度[1]。因此,選擇合適的負荷數(shù)據(jù)預處理方法,對于提高預測模型的準確度具有重要的意義及較高的工程應用價值。
一般來說,短期負荷預測分為以歷史相似日選取為主的數(shù)據(jù)預處理和日負荷預測兩個基本過程[2]。雖然配電網(wǎng)負荷的變化具有一定的周期性,但是隨著時間的推移,配電網(wǎng)負荷結(jié)構(gòu)也會發(fā)生相應改變。對數(shù)據(jù)進行日分類可以減小訓練數(shù)據(jù)與預測日負荷數(shù)據(jù)特性的差異,提高數(shù)據(jù)的使用精度。此外,合理的歷史相似日數(shù)據(jù)選取能夠增強預測模型的可解釋性,降低計算的復雜度[2]。文獻[3]采用組合權(quán)重法求取相似誤差確定相似日,但是當相似日與預測日的相似程度較低時,會產(chǎn)生較大的預測誤差;文獻[4]采用遺傳算法優(yōu)化參數(shù)提高了模型預測精度,但待優(yōu)化參數(shù)過多且計算較為復雜。因此,如何在簡化操作步驟的基礎(chǔ)上,保證相似日選擇結(jié)果的可靠性,成為相似日選取過程中的一個難題。
另外,在配電網(wǎng)短期日負荷預測方面,傳統(tǒng)負荷預測模型,如線性回歸(linear regression,LR)、自回歸(auto regression,AR)等,雖然運算速度快,但對數(shù)據(jù)的要求較高、缺乏自適應能力且預測魯棒性較差,難以滿足負荷預測要求[5]。近年來,人工智能技術(shù)的發(fā)展為解決這些問題提供了思路,但是仍然衍生出一些新問題。文獻[6]采用深度置信網(wǎng)絡對復雜影響因素進行快速分析,提高了預測精度,但其只針對地區(qū)負荷,缺乏自適應性。文獻[7]采用并行化多核支持向量機(support vector machine,SVM)進行負荷預測,預測誤差與單核SVM 相比有一定程度的減少,但是缺少對時序數(shù)據(jù)時間相關(guān)性的考慮。文獻[8]考慮了不同算法的數(shù)據(jù)觀測及訓練差異,提出了多種機器學習算法嵌入的Stacking 負荷預測模型,該模型在預測中保證了良好的精度,但是模型集成需要的成本過高且時間較長。因此,如何在保證負荷預測精度的同時,提高算法的運行效率成為日負荷預測過程的另一個難題。
針對上述兩個難題,本文構(gòu)建了一種基于孿生網(wǎng)絡(siamese network,SN)分類法和長短時記憶(long short-term memory,LSTM)網(wǎng)絡相結(jié)合的配電網(wǎng)短時負荷預測模型。SN 的兩個輸入權(quán)值共享,在處理小樣本數(shù)據(jù)方面有較好的效果,可以保證后續(xù)輸入的相似日數(shù)據(jù)質(zhì)量;LSTM 網(wǎng)絡對時間序列問題較為敏感,保證了負荷預測的效率;灰狼優(yōu)化算法(grey wolf optimizer,GWO)全局搜索能力強、效率高,用以優(yōu)化LSTM 網(wǎng)絡參數(shù)繼而提高預測模型的運行精度。最后,通過仿真計算與對比分析,驗證了文中所提預測模型的高效性與精確性。
負荷預測歷史相似日選取的核心是希望所選擇的歷史數(shù)據(jù)盡可能多地包含預測負荷的特征,然而配電網(wǎng)負荷受到經(jīng)濟、天氣、節(jié)假日等諸多不確定性時變因素的影響,完全的連續(xù)時序選取方法較難保持精準預測,合理的分類選取方法是趨勢。
另外,傳統(tǒng)方法在對小樣本數(shù)據(jù)進行分類時,隨著分類類型的增加,各類型樣本數(shù)量和表征該類型的可提取特征會變少,進而使分類器的訓練效果不佳,準確率降低。為有效解決小樣本數(shù)據(jù)集的分類問題,文獻[9]中采用SN 方法從小樣本數(shù)據(jù)中學習一個相似性量度,然后去匹配未知類別樣本,并將此方法成功應用于在線簽名驗證領(lǐng)域。
SN 是一種特殊的神經(jīng)網(wǎng)絡架構(gòu),與輸入單一樣本學習并進行分類的網(wǎng)絡不同,該網(wǎng)絡可以同時學習兩個樣本特征,實現(xiàn)權(quán)值共享,接著匹配未知類別的樣本,完成分類[10]。一般在短期負荷預測中,SN首先將歷史負荷數(shù)據(jù)及其類別輸入,不斷學習得到其權(quán)重,然后去匹配未知負荷,得到相應類別。這種自適應分類的方式能夠大大提高短期負荷預測相似日選擇的效率。文獻[11]設計了一個SN 雙通道網(wǎng)絡模型,將數(shù)據(jù)共同輸入一個網(wǎng)絡進行相同處理并聯(lián)合訓練,在不影響分類精度的同時,提高了運行效率?;诖?本文采用的SN 結(jié)構(gòu)見圖1。
圖1 中,孿生網(wǎng)絡的輸入數(shù)據(jù)為n組負荷數(shù)據(jù)樣本對(Y1,Yn,Yˉn),其中,Yn為以天為單位的負荷數(shù)據(jù)集,Y1表示該數(shù)據(jù)集中的第1 組,Yˉn表示Y1和Yn之間的相似程度;Gw(Yn)表示能夠?qū)⑤斎霐?shù)據(jù)Y1,Y2,…,Yn轉(zhuǎn)化為低維特征向量的映射函數(shù);W表示模型參數(shù);Ew(Y1,Yn)為樣本間的距離量度,表達式如下。
圖1 孿生網(wǎng)絡結(jié)構(gòu)Fig.1 Structure of siamese network
式中:y1i和yni分 別為Y1和Yn中的 元素;Ew(Y1,Yn)為兩個輸入樣本之間的歐氏距離。當樣本Y1和Yn屬于相同類別時,距離量度較小,較為相似;反之則距離量度變大。
損失函數(shù)通常采用對比損失函數(shù),如下所示。
式中:w為對比函數(shù)的參數(shù);m=1,用于在Ew上定義一個邊界,使得只有在該范圍內(nèi)的負樣本才對損失函數(shù)造成影響。當樣本Yˉn的值越趨近于1,代表兩樣本越相似,此時損失函數(shù)趨近于0.5Yˉn E2w,即兩個原本相似程度較高的樣本,如果在特征空間的歐氏距離較大,則說明模型性能不高,需加大損失。
本文應用SN 進行配電網(wǎng)短期負荷預測歷史相似日數(shù)據(jù)選取,主要步驟如下:首先,對原始負荷數(shù)據(jù)進行提取,剔除其中存在無效、缺失負荷數(shù)據(jù)的負荷日;將負荷數(shù)據(jù)以天為單位分組,選取其中一組作為基準組Y1,此組負荷數(shù)據(jù)可隨機選取且選取后不會改變;然后,作為對照組的各組負荷數(shù)據(jù)Yn與基準組構(gòu)成樣本對(Y1,Yn,Yˉn),將樣本對代入模型訓練。選取未知類別的對照組負荷,與基準組構(gòu)成新樣本對代入訓練完成的模型,最終得到對應標簽即與基準負荷的相似程度,至此,完成未知負荷組的對應相似程度即類別判定。
本文基于相似日負荷數(shù)據(jù)選取結(jié)果,進一步構(gòu)建GWO 和LSTM 網(wǎng)絡混合(用GWO-LSTM 表示)的配電網(wǎng)短期負荷預測模型,以實現(xiàn)快速有效的短期負荷預測。
LSTM 網(wǎng)絡通過加入自適應遺忘門使其在學習過程中不斷地更新并釋放內(nèi)部資源,解決了遞歸神經(jīng)網(wǎng)絡梯度爆炸與梯度消失的問題[12-13]。通過其獨特的記憶結(jié)構(gòu)可以有效提取負荷時間序列的結(jié)構(gòu)性特征并準確把握預測負荷與大量輸入特征之間的非線性關(guān)系,進一步保證負荷預測的精確性[14]。
結(jié)合文獻[14]所述,堆疊LSTM 網(wǎng)絡層雖然可以提升模型性能,但為避免預測模型出現(xiàn)過擬合,影響與其他模型的后續(xù)比較,應使模型在相同參數(shù)下盡可能的小。因此,本文的LSTM 網(wǎng)絡由一個LSTM 層和一個全連接層搭建而成,LSTM 層實現(xiàn)輸入負荷數(shù)據(jù)的特征提取,全連接層保證LSTM 層輸出想要的維度。其中,LSTM 層的輸入數(shù)據(jù)Xt=[x1,x2,…,xn](t=1,2,…,m)為通過孿生網(wǎng)絡分類后得到的t組對應類別負荷數(shù)據(jù),輸入數(shù)據(jù)Yt=[y1,y2,…,yn]為對應類別、對應時刻實際負荷數(shù)據(jù),通過構(gòu)成訓練樣本(Xt,Yt)的方式對模型進行訓練。 然后,輸入預測日對應類別負荷Xt′ =[x′1,x2′,…,xn′],即 可 得 到 預 測 日 負 荷Yt′ =[y1′,y2′,…,yn′]以完成預測。
GWO 是一種新型智能群體優(yōu)化算法,該算法模擬了狼群的狩獵模式,且狼群之間并行搜捕互不影響,可最大限度去尋找最優(yōu)解。GWO 在處理高維、多峰的復雜函數(shù)求解方面效果顯著,具有較好的全局收斂性和魯棒性[15-16]。該算法提高了運行效率,較粒子群優(yōu)化(particle swarm optimization,PSO)算法、差分進化(differential evolution,DE)算法在收斂速度和精度方面更具競爭力。其原理見文獻[15-16],本文不做進一步闡述。
在LSTM 短期負荷預測模型中,超參數(shù)的選取對于負荷預測的準確度具有重要的作用[17-18]。預測模型超參數(shù)的選取有一定的經(jīng)驗性與規(guī)律性,但是隱層神經(jīng)元的個數(shù)在選取范圍內(nèi)較易出現(xiàn)多個預測誤差的局部最優(yōu)點,僅僅依靠經(jīng)驗選取往往無法得到理想的預測效果。傳統(tǒng)尋優(yōu)算法的反復驗證選取會影響計算效率,難以應用到實際的負荷預測中。此外,在參數(shù)選取過程中,如果神經(jīng)元個數(shù)過多會影響網(wǎng)絡學習速度與收斂速度,甚至會出現(xiàn)過擬合的現(xiàn)象;若神經(jīng)元個數(shù)過少則會導致訓練結(jié)果誤差偏大,模型不具有泛化性。因此,合理的參數(shù)對于模型精準預測有著極其重要的作用。
GWO 具有參數(shù)少、結(jié)構(gòu)簡單、收斂能力強、全局搜索能力強等優(yōu)點,結(jié)合其優(yōu)點可較好地避免因隱層神經(jīng)元個數(shù)選取不當陷入局部最優(yōu)的問題。因此,本文選用GWO 對隱層神經(jīng)元個數(shù)進行尋優(yōu),以預測誤差作為適應度,盡可能提高模型的效率。
本文所提配電網(wǎng)短期負荷預測方法的大致計算步驟如下。
1)數(shù)據(jù)的采集與預處理
首先,提取負荷Yt及其對應相關(guān)負荷數(shù)據(jù)Xt=[x1,x2,…,xn] 并進行歸一化處理,映射到區(qū)間[0,1]之內(nèi),
式中:X″t為歸一化后的值;Xtmax和Xtmin分別為樣本數(shù)據(jù)的最大值與最小值。
2)相似日的選取
進一步,將數(shù)據(jù)代入建立好的孿生網(wǎng)絡模型中,以歐氏距離作為孿生網(wǎng)絡分類法的判據(jù)進行學習,然后去匹配未知類別的預測日負荷數(shù)據(jù),得到該預測日的類別。最后,根據(jù)預測日的負荷類別,對相似日進行數(shù)據(jù)提取。
3)GWO 參數(shù)尋優(yōu)
將提取好的相似日數(shù)據(jù)集作為GWO-LSTM模型的訓練集,把LSTM 負荷預測模型的預測誤差作為GWO 的適應度,反復迭代得到最小預測誤差對應的LSTM 網(wǎng)絡最優(yōu)參數(shù)設置。其中,GWO 參數(shù)設置為:灰狼數(shù)為10,維度為1,迭代次數(shù)為5。
4)訓練與結(jié)果
在GWO-LSTM 模型確定最優(yōu)參數(shù)后,將訓練集的負荷數(shù)據(jù)代入最優(yōu)參數(shù)LSTM 網(wǎng)絡中進行離線訓練。然后,把預測日組成的測試集樣本代入最優(yōu)模型預測,得到各個時刻的負荷預測結(jié)果。
本文采用的原始數(shù)據(jù)集為中國北方某商業(yè)和居民混合的區(qū)域配電網(wǎng)2017 年1 月1 日至11 月30 日的負荷數(shù)據(jù),數(shù)據(jù)的時間分辨率為1 h。首先,按季節(jié)對歷史負荷數(shù)據(jù)進行劃分并確定預測日,用SN分類法對預測日進行匹配和分類,選取與預測日相同類別的相似日作為GWO-LSTM 模型的輸入。然后,對預測結(jié)果作進一步驗證分析,其中,本文分析了未來1 d 及未來5 d 的負荷預測情況。
文中涉及的預測模型均在Python 下搭建,其中,SN 和LSTM 模型基于Keras 深度學習庫搭建。LSTM 模型具體參數(shù)見附錄A 表A1;由于SVM 超參數(shù)較多,采用GWO 并不能實現(xiàn)同步優(yōu)化,為保證該對比算法的精度,本文選擇網(wǎng)格遍歷式尋優(yōu)法對SVM 尋 優(yōu),并 通 過Sklearn 包 中 的GridSearchCV 模塊實現(xiàn)參數(shù)自動調(diào)節(jié)。相似日類別的選取導致春、夏、秋、冬4 個季節(jié)對應預測日的數(shù)據(jù)集規(guī)模不同,為進一步保證模型運算效率,分別設置LSTM 模型迭代次數(shù)為500、100、200、320。其中,SN 的神經(jīng)網(wǎng)絡層采用卷積神經(jīng)網(wǎng)絡,卷積神經(jīng)網(wǎng)絡強大的特征提取能力使其在圖像和文字識別領(lǐng)域被廣泛應用,主要包括卷積層、池化層和全連接層。全連接層激活函數(shù)采用線性整流函數(shù)Relu,并在池化層后面加入平坦層Flatten,將輸出的多維數(shù)據(jù)轉(zhuǎn)化為一維向量。
為了驗證本文提出預測模型的精確度和魯棒性,本文采用平均絕對百分比誤差(mean absolute percentage error,MAPE)和均方根誤差(root mean squared error,RMSE)作為評判標準[19],如下所示。
式中:yi和y′i分別為負荷實際值和預測值。
本文應用SN 對未知預測日負荷進行匹配與類別劃分。首先,歷史負荷的數(shù)據(jù)提取是以天為單位,每24 個時段為一組,以本年度首天的負荷數(shù)據(jù)作為基準值,對全年的歷史負荷數(shù)據(jù)進行分類。采用Pearson 相關(guān)系數(shù)法把相關(guān)性強度分為(0.98,1]、(0.96,0.98]、(0.94,0.96]、(0.92,0.94]、(0.90,0.92]、(0.88,0.90]、(0.86,0.88]、(0,0.86]共8 組。短期商居區(qū)域負荷波動性較小,負荷之間相關(guān)性較強,強度為(0,0.86]時,區(qū)域負荷已經(jīng)和基準負荷相差巨大,這與電力系統(tǒng)的負荷穩(wěn)定性相矛盾。另外,當基準值選取出現(xiàn)問題時,在相關(guān)系數(shù)的分類占比中就會出現(xiàn)(0,0.86]組及其鄰近各組占比巨大的情況。負荷類別占比及分類情況如附錄A 表A2 和圖A1 所示。
隨后,按照季節(jié)的不同對歷史負荷數(shù)據(jù)作進一步劃分,選取各季節(jié)第1 天的負荷作為基準值,然后在SN 中對基準值和不同的日負荷數(shù)據(jù)進行對比,不斷進行學習,更新權(quán)重。然后,輸入未知類別的預測日得到各自的類別。每個季節(jié)對應的預測日負荷類別如表1 所示。
表1 預測日負荷的孿生網(wǎng)絡分類Table 1 Classification of siamese network for daily load forecasting
由附錄A 圖A1 可知,在不同的類別下負荷日變化曲線走勢大致相同,反映出負荷數(shù)據(jù)具有一定的規(guī)律性和周期性。在系統(tǒng)穩(wěn)定運行時,日負荷之間的相關(guān)性較強,但是在不同類別下,對應時段的負荷數(shù)值以及到達日負荷峰值的時段是不同的,這表明日負荷變化有一定的差異。不同類別的日負荷變化對后續(xù)訓練集選取、模型訓練的影響是不同的,這對于減小負荷預測的誤差起到重要的作用。
3.4.1 特征變量選擇方法對比分析
為了看出SN 方法得到的相似日輸入在后續(xù)預測中表現(xiàn)的優(yōu)劣,本文將SN 方法與常用特征選擇方法中的最大信息系數(shù)(maximal information coefficient,MIC)方法[15]進行比較,即采用不同方法得到各自的相似日數(shù)據(jù)集,并把模型預測誤差作為比較結(jié)果。
首先,將未經(jīng)SN 方法處理(采用MIC 方法得到相似日輸入)的數(shù)據(jù)作為輸入1。然后,通過GWOLSTM 模型進行負荷預測得到模型1;將采用SN 方法處理的數(shù)據(jù)作為輸入2,并通過GWO-LSTM 模型進行負荷預測得到模型2。隨機選取表1 中的夏、秋兩個季節(jié)進行比較,其中,兩模型對應季節(jié)選取的預測日和輸入數(shù)據(jù)規(guī)模都是相同的。負荷預測值與實際值的絕對誤差對比結(jié)果如圖2 所示,誤差指標結(jié)果如表2 所示。
圖2 夏秋兩季各模型預測誤差對比Fig.2 Comparison of forecasting errors for different models in summer and autumn
表2 兩模型誤差對比Table 2 Comparison of errors of two models
1)由圖2(a)和(b)可以看到,兩模型的預測效果較為良好,但是模型1 的預測誤差在某些時段較模型2 來說更大,兩模型之間的誤差相差甚至能夠達到6%,如圖2(a)中的前半段時段與圖2(b)中的后半段時段。相比于模型1,模型2 有著較高的精確性與魯棒性,驗證了SN 方法對于數(shù)據(jù)特征選取的有效性。
2)通過表2 可以看到,在相同預測日下,模型1在夏、秋兩季中的RMSE 和MAPE 都比模型2 要高,甚至在秋季兩模型之間的RMSE 能夠相差52.425 kW;模型2 春秋兩季的MAPE 較模型1 小了2.34%與1.28%。以上兩個誤差指標都可以表明,SN 方法處理后得到的數(shù)據(jù)集更有利于后續(xù)的負荷預測,得到的預測結(jié)果也更加精準。
3.4.2 參數(shù)尋優(yōu)算法對比分析
不同的尋優(yōu)算法對于不同的測試標準往往有著不同的優(yōu)劣表現(xiàn),為了驗證所述GWO 出色的全局搜索能力和尋優(yōu)精度,借鑒文獻[20],本文選取了Rastrigrin 多峰函數(shù)作為測試函數(shù)。
Rastrigrin 函數(shù)為線性多模態(tài)函數(shù),峰形起伏不定,且在尋優(yōu)范圍內(nèi)有較多局部極小值點,較難尋得最優(yōu)值。同樣,LSTM 模型的待優(yōu)化參數(shù)為隱層神經(jīng)元的個數(shù),在選取范圍內(nèi),通過對該參數(shù)的選取得到的誤差指標也具有較多的局部最小值,兩者情況相近,Rastrigrin 函數(shù)公式如下,結(jié)果見圖3(a)和(b)。
式中:x和y為函數(shù)狀態(tài)量;dim為待優(yōu)化參數(shù)個數(shù)。
同時,本文選取了群智能優(yōu)化算法中較為常用的 粒 子 群 優(yōu) 化算法[19]、蝙蝠算法(bat algorithm,BA)[21]對Rastrigrin 多峰測試 函 數(shù)進行尋 優(yōu) 和對比分析,各優(yōu)化算法迭代過程如圖3(c)所示,迭代所需時間見表3。另外,在附錄A 中闡述了將3 種算法與LSTM 網(wǎng)絡相結(jié)合的實驗結(jié)果與對比分析。
表3 各優(yōu)化算法運行時間Table 3 Operation time of each optimization algorithm
圖3 算法測試結(jié)果Fig.3 Testing results of algorithms
本文3 種算法的種群總個數(shù)相同,迭代次數(shù)設為50,其中,GWO 參數(shù)設置:灰狼個數(shù)為10,維度為1。PSO 算法參數(shù)設置:粒子數(shù)為10,兩個學習因子都為2,慣性權(quán)重為0.8,維度為1。BA 參數(shù)設置:蝙蝠數(shù)量為10,脈沖頻率為0.5,響度為0.5,維度為1。
從圖3(c)來看,3 種優(yōu)化算法都能夠在規(guī)定迭代次數(shù)內(nèi)逼近函數(shù)最小值。但PSO 算法因缺乏速度的動態(tài)調(diào)節(jié),收斂精度只達到了10?7,而且較其余兩模型來說更不易收斂。縱向觀察,GWO 與BA 最先尋得的結(jié)果都很小,但GWO 的下降梯度更快,在第4 次迭代時就已尋得函數(shù)最小值0,而BA 以10?11的收斂精度逼近0。從表3 中來看,GWO 較PSO 算法和BA 所用時間減少了很多。因此,本文選用尋優(yōu)速度快、精度高的GWO 優(yōu)化LSTM 模型的參數(shù),以提高模型預測速度及精度。
3.4.3 負荷預測模型對比分析
為了驗證采用LSTM 負荷預測模型進行預測的精確性,本文選取傳統(tǒng)LSTM[22]、PSO-LSTM、SVM[23]這3 種預測模型進行對比分析,結(jié)果如表4所示。其中,各模型參數(shù)設置如附錄A 表A1所示。
進一步,按季節(jié)對各模型負荷預測結(jié)果進行對比,其中,對比依據(jù)為該預測日實際負荷與預測負荷的均方根誤差和平均絕對百分比誤差。春秋兩季預測值與實際值絕對誤差結(jié)果如圖4 所示,各模型預測值及夏冬兩季對比結(jié)果見附錄B 圖B1 和圖B2。各模型的季節(jié)負荷預測值見表B1。文中各季節(jié)預測日采用隨機方式進行選取。
圖4 春秋兩季各模型絕對誤差對比Fig.4 Comparison of absolute errors for different models in spring and autumn
結(jié)合上述圖表中對3 種模型各季節(jié)的仿真結(jié)果對比可以較為直觀地驗證本文所提模型的精確性,具體分析如下。
1)首先,在表4 的各模型負荷預測結(jié)果中,GWO-LSTM 模型的RMSE 和MAPE 較其余模型均有了不同程度的減少,幾種模型對比中,預測精度和魯棒性較好的是LSTM 和GWO-LSTM 模型。LSTM 和SVM 模型的結(jié)果對比,表明了LSTM 模型在處理時間序列問題優(yōu)勢明顯。
2)其 次,由 表4 可 以 看 到,PSO-LSTM 和GWO-LSTM 模型相較于傳統(tǒng)LSTM 模型來說RMSE 和MAPE 都有了較為明顯的減少,其中GWO-LSTM 模型的預測誤差減少得最多,例如,在秋季的結(jié)果分析中,GWO-LSTM 模型的預測誤差比傳統(tǒng)LSTM 模型在RMSE 和MAPE 上減少了20%的誤差,而PSO-LSTM 模型分別只有11%和5%。這說明在負荷預測上,采用GWO 對LSTM 網(wǎng)絡進行參數(shù)優(yōu)化可以提高模型預測的準確性。
表4 各季節(jié)模型預測誤差對比Table 4 Comparison of forecasting errors of models in each season
3)圖4(a)和(b)展示了春秋兩季節(jié)預測日對應負荷的絕對誤差結(jié)果。圖中,雖然PSO-LSTM 模型在少數(shù)時段預測誤差較傳統(tǒng)LSTM 模型高,但是整體上來看,PSO-LSTM 模型的預測情況得到了改善,這說明采用優(yōu)化算法來訓練LSTM 網(wǎng)絡參數(shù)能夠減小預測誤差。GWO-LSTM 模型較傳統(tǒng)LSTM和PSO-LSTM 模型在預測誤差上有了不同程度的減小,基本在2%~4%之間,但是在部分時段誤差并沒有發(fā)生突變,表現(xiàn)出極強的精確性和魯棒性,更加符合電力系統(tǒng)實際應用。
3.4.4 多預測日下的負荷預測分析
為了驗證GWO-LSTM 模型在連續(xù)日的負荷預測中同樣具有較強的預測精度和魯棒性,本文將4 種預測模型的預測情況作了對比,共5 個預測日(120 h),如圖5 所示,部分時段誤差比較情況如表5所示,LSTM 模型、GWO-LSTM 模型、PSO-LSTM模型、SVM 模型的運行時間分別為34.354、20.466、25.683、12.537 s。
結(jié)合圖5 可知,商業(yè)和居民混合負荷具有一定的周期性和隨機性,預測較為困難,其負荷特性如下。時段0 至8 的負荷波動較為平穩(wěn),時段8 至9 的負荷開始急劇增加,時段18 至20 的負荷開始急劇減少,時段9 和18 各有一個負荷用電的極值點,在時段18 至20 的負荷呈現(xiàn)小范圍波動,且波動負荷趨勢隨機。本文將結(jié)合其負荷特性對所提模型的精確性作進一步分析。
圖5 連續(xù)天數(shù)下負荷預測模型預測結(jié)果對比Fig.5 Comparison of forecasting results of load models in continuous days
1)由圖5 可知,負荷值具有一定的周期性,4 種預測模型的預測值在時段0 至8 之間區(qū)別不大。其中,SVM 模型對于實際負荷極值點的預測能力較強,能夠較為準確地把握負荷變化趨勢,但是誤差偏大,較其余兩模型來說,精確性較差。GWO-LSTM和LSTM 模型在負荷波動點處預測性能良好。若波動范圍較小,GWO-LSTM 和LSTM 模型都能夠較為精準地預測,前者誤差更小,擬合能力更強。若波動范圍較大,在一些突變點處,GWO-LSTM 模型較傳統(tǒng)LSTM 模型的表現(xiàn)更穩(wěn)定。相比于傳統(tǒng)方法,本文所研究的模型具有更好的準確度與魯棒性。
2)由表5 可以看到,相較于SVM 模型,LSTM模型在處理時間序列問題上具有極強的優(yōu)勢,預測誤差普遍較小。PSO-LSTM 模型在連續(xù)天數(shù)的負荷預測中,會出現(xiàn)部分時段的誤差突然變大的情況,預測魯棒性較GWO-LSTM 模型差。這說明采用GWO 來優(yōu)化LSTM 網(wǎng)絡要比采用PSO 算法更穩(wěn)定可靠,對電力負荷的穩(wěn)定預測具有重要意義。
表5 連續(xù)天數(shù)下負荷預測模型部分時段誤差對比Table 5 Error comparison of load forecasting model in partial time for continuous days
數(shù)據(jù)驅(qū)動型配電網(wǎng)短期負荷預測精準的關(guān)鍵是如何選擇合適的相似日輸入數(shù)據(jù)集和構(gòu)建合理的預測模型。為此,本文提出了基于SN 和LSTM 網(wǎng)絡相結(jié)合的配電網(wǎng)短期負荷預測方法,并通過實際算例驗證了該方法的有效性,得出以下結(jié)論。
1)本文采用SN 對輸入數(shù)據(jù)進行分類,分析輸入特征之間的相關(guān)性,優(yōu)化了數(shù)據(jù)集,同時提高了預測模型中權(quán)重調(diào)節(jié)效率,降低了錯誤率,測試結(jié)果驗證了所提方法的有效性。
2)針對負荷周期性的特點,結(jié)合LSTM 網(wǎng)絡在處理時間序列回歸問題的優(yōu)勢,可以更好地擬合輸入與輸出特征之間的復雜關(guān)系。由于GWO 收斂能力強、速度快,因此用該方法優(yōu)化LSTM 網(wǎng)絡參數(shù),可以保證高計算效率下提高預測模型的性能,進一步改善擬合回歸的能力。
3)在智能電網(wǎng)的背景下,負荷預測朝著精細化的方向發(fā)展,本文提出的模型能夠高效選出相似日數(shù)據(jù)集,同時完成模型訓練及預測。相較于傳統(tǒng)的LSTM 模型、PSO-LSTM 模型、最優(yōu)SVM 模型,所提出的模型具有較高的效率和準確性,對于短時區(qū)域負荷預測有一定的使用價值。
需要指出的是,數(shù)據(jù)驅(qū)動的預測模型易受訓練數(shù)據(jù)影響,目前SN 的分類只針對總負荷,未來將進一步提高該方法的普適性,研究基于多目標的自適應分類方法。此外,本文基于Pearson 相關(guān)性分析對負荷序列進行相似性量度,由于該分析為線性相關(guān)性理論,難以保證高量度精度,需要進一步研究先進的非線性分析理論,提高數(shù)據(jù)預處理的精度。
隨著大數(shù)據(jù)技術(shù)、人工智能技術(shù)等快速發(fā)展,數(shù)據(jù)驅(qū)動的負荷預測方法在精度、速度等方面將會進一步提升,然而智能配電網(wǎng)負荷組成也會多樣化,其特性變化將具有強隨機性。后續(xù)工作將研究數(shù)據(jù)驅(qū)動和機理分析的結(jié)合策略,基于先進的數(shù)據(jù)預處理技術(shù),提出高性能的短期負荷預測模型。
附錄見本刊網(wǎng)絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡全文。