王思萌,曲曉東,謝 剛,崔 磊
(太原科技大學 電子信息工程學院,太原 030024)
電力負荷預測是電力系統(tǒng)中的一項重要任務,能夠為電力部門運作與規(guī)劃提供關鍵支撐,對電網(wǎng)的安全、經(jīng)濟和發(fā)展具有重要的意義[1-2]。
傳統(tǒng)的電力負荷預測方法主要有統(tǒng)計學和機器學習方法。統(tǒng)計學方法包括求和自回歸移動平均[3]、卡爾曼濾波法[4]和自回歸條件異方差[5]等,這些模型具有簡單、訓練速度快的特點,但是對非線性的電力負荷預測精度較低,擬合能力不足;機器學習包括神經(jīng)網(wǎng)絡[6]、支持向量機(support vector machine,SVM)[7]和隨機森林(random forest,RF)[8]等,然而機器學習模型參數(shù)尋優(yōu)困難,難以挖掘特征輸入與電力負荷之間的時序相關性,預測效果并不理想。
若能學習到特征與電力負荷之間隱藏的時序規(guī)律,將大幅提升電力負荷預測精度。當前,不少學者開始使用深度學習模型對時間序列進行預測。
文獻[9]和文獻[10]分別使用長短期記憶網(wǎng)絡(long short-term memory,LSTM)和門控循環(huán)單元(gated recurrent unit,GRU)模型對電力負荷進行預測,一定程度上提升了預測精度。文獻[11]提出使用時間卷積網(wǎng)絡(temporal convolutional network,TCN)預測模型對時間序列進行預測,預測效果要好于LSTM、GRU模型,但TCN預測模型訓練結束后,全連接層之間的閾值與偏置容易陷入局部最優(yōu)值[12-14],如何克服這一缺陷成為一大難題。
針對以上問題,本文在鼠群優(yōu)化算法(rat swarm optimization algorithm,RSO)[15]中引入了交叉算子,提出了一種基于改進鼠群優(yōu)化算法(improved rat swarm optimization algorithm,IRSO)和時間卷積神經(jīng)網(wǎng)絡的短期電力負荷預測模型。首先,使用TCN模型學習輸入特征和電力負荷的時序相關性,對電力負荷進行預測;然后使用IRSO算法對TCN全連接層之間閾值與偏置進行優(yōu)化,解決了這些參數(shù)陷入局部最優(yōu)的問題。實驗結果表明,本文所提IRSO-TCN的預測精度高于其余模型的預測精度。
TCN是由卷積神經(jīng)網(wǎng)絡搭建的深度學習模型,含有因果卷積、擴張卷積和殘差模塊,能有效的處理時間序列問題[16],這對于提升電力負荷預測精度有一定的幫助。
因果卷積使得當前時刻的輸出只與更早元素進行卷積,當輸入長的歷史信息到網(wǎng)絡中,模型的深度隨之增加,TCN模型擴張卷積解決了這個問題。擴張因果卷積對上一層的輸入進行間隔采樣,擴張率以2的指數(shù)級增長,擴張因果示意圖如圖1所示。
圖1 擴張因果卷積Fig.1 Expanded causal convolution
擴張因果卷積對應的公式如下:
(1)
式中:F(s)表示第s個神經(jīng)元擴張卷積后的輸出;k為卷積核的大?。籪為過濾器;x是輸入序列;d是擴張系數(shù);s-d·i表示只能對過去的輸入做卷積操作。
為了防止網(wǎng)絡深度加深使得網(wǎng)絡退化,TCN中加入了殘差模塊,該模塊含有兩次卷積操作和非線性映射連接,TCN網(wǎng)絡和殘差模塊示意圖如圖2所示。
圖2 TCN網(wǎng)絡和殘差模塊示意圖Fig.2 Schematic diagram of TCN network and residual module
TCN網(wǎng)絡由輸入層、殘差塊和輸出層構成,殘差模塊含有2個卷積單元和1個非線性映射。擴張因果卷積后接ReLU激活函數(shù),再對權值進行歸一化處理,最后接入Dropout層,以防止TCN網(wǎng)絡發(fā)生過擬合,殘差模塊的堆疊使得網(wǎng)絡變得更容易訓練。
鼠群優(yōu)化算法是一種模仿鼠群競爭行為的新型仿生群體啟發(fā)式優(yōu)化算法,包含追逐獵物和攻擊獵物兩個過程[17]:
(1)追逐獵物
老鼠通過群居競爭行為追逐獵物。假設最好老鼠搜索個體知道獵物的最佳位置,其他老鼠體可以據(jù)此更新當前位置來獲得最佳搜索位置,數(shù)學可以描述為:
(2)
A=R-x·(R/T)
(3)
(2)攻擊獵物,數(shù)學描述為:
(4)
本文創(chuàng)新地在RSO優(yōu)化過程中交叉算子,在交叉過程中,鼠群個體的不同維度信息進行了交換,這將使得個體能夠在一定條件下擺脫局部最優(yōu),加速收斂,數(shù)學描述如下:
P(i,b1)=aQ(i,b1)+(1-a)Q(i,b2)
(5)
式中:a∈Rand[0,1];i∈N[0,M],M是鼠群個體總數(shù);Q(i,b1)、Q(i,b2)表示個體i的第b1、b2維,兩者交叉產(chǎn)生下一代P(i,b1),b1、b2∈N[0,D],D為個體代表的變量維度。
電力負荷預測是時間序列預測問題,當前時刻的電力負荷與早期時刻的電力負荷存在著一定的關聯(lián),同時也和溫度、濕度和電價等因素保持著緊密聯(lián)系,特征輸入的選取一定程度上影響著預測精度的高低。本文搭建了TCN模型用于學習電力負荷和多特征因素之間的時序規(guī)律,對電力負荷進行預測。
針對初次訓練好的TCN模型全連接層閾值與偏置參數(shù)容易陷入局部最優(yōu)的缺陷,本文提出使用加入交叉算子的IRSO對這些參數(shù)進行再次調(diào)整,這將進一步提升預測模型的預測準確率,其具體流程如圖3所示。
圖3 IRSO-TCN流程圖Fig.3 Flow chart of IRSO-TCN
圖3中,適應度函數(shù)選擇均方誤差(mean square error,MSE)函數(shù),定義如下:
(6)
本文建模仿真在Windows10系統(tǒng)、R7-5800H CPU和PyCharm軟件中進行,由深度學習TensorFlow和Keras框架搭建神經(jīng)網(wǎng)絡模型。
本文選取澳大利亞2010年第12月實測歷史電力負荷數(shù)據(jù)集進行建模仿真,12月29、30、31日數(shù)據(jù)為測試集,其余為訓練集。該數(shù)據(jù)集每隔0.5小時采樣一次,每日48個采樣點,考慮到電力負荷與溫度、濕度和電價等因素的聯(lián)系較為緊密,特征因素選取了干球溫度、露點溫度、濕球溫度、濕度和實時電價,共計5項,采用皮爾遜相關系數(shù)法分析各因素與電力負荷之間的聯(lián)系,對于維度為n的x和y的變量,相關系數(shù)r的計算式如下:
(7)
相關系數(shù)r的大小在-1和1之間,絕對值越大代表相關聯(lián)程度越大,值的正負代表是正相關還是負相關,由上式,各特征因素和電力負荷之間的r值如表1所示。
表1 電力負荷與各特征因素間的相關系數(shù)
通過表1可以看出,電力負荷與干球溫度和實時電價保持著強相關關系,電力負荷與濕度呈現(xiàn)負相關關系。
在使用該數(shù)據(jù)對模型進行訓練時,因為特征因素和電力負荷的量綱不相同,同時為了加速模型的收斂,預先需要對數(shù)據(jù)進行歸一化處理,使得歸一化后的數(shù)據(jù)值均處于[0,1]之間,歸一化計算公式如下:
(8)
式中:X*表示歸一化值;X為原始值;Xmax和Xmin分別代表原始數(shù)據(jù)中的最大值和最小值。
TCN網(wǎng)絡的每個樣本輸入為前6個時刻的干球溫度、露點溫度、濕球溫度、濕度和電價,輸出為當前時刻的電力負荷。TCN網(wǎng)絡含1個殘差模塊,之后接入全連接層,其中殘差模塊含有2個卷積單元和1個非線性映射。卷積單元的卷積核大小為2,經(jīng)過權值歸一化操作后,選擇ReLU激活函數(shù),并在其后接入系數(shù)為0.4的Dropout層,以防止網(wǎng)絡過擬合;非線性映射部分為在殘差模塊的輸入和輸出之間接入1×1的卷積層;設置擴張系數(shù)以2的指數(shù)級增加,濾波器數(shù)量為64;全連接層的神經(jīng)元個數(shù)分別是32、1,最終的輸出為1個時間點的電力負荷;選擇TCN網(wǎng)絡的優(yōu)化器為Adam,學習率為0.000 1,bacth_size為32,epochs為150,損失函數(shù)為MSE函數(shù)。并設置RSO、IRSO的最大迭代次數(shù)為150.
仿真實驗選取平均絕對百分比誤差(mean absolute percentage error,MAPE)、平均絕對誤差(mean absolute error,MAE)和均方根誤差(root mean square error,RMSE)作為電力負荷預測結果評價指標。其中,平均絕對百分比誤差、平均絕對誤差和均方根誤差的值越小,代表模型預測精度越高,各指標的計算公式分別為:
(9)
(10)
(11)
為了驗證IRSO的有效性,分別采用:(1)未優(yōu)化的TCN模型;(2)RSO優(yōu)化的TCN模型;(3)IRSO優(yōu)化的TCN模型進行預測對比,實驗結果如圖4和表2所示。
表2 不同優(yōu)化算法下的評價指標
由圖4可以看出,所提IRSO-TCN模型預測曲線和電力負荷真實值曲線更加貼近,尤其體現(xiàn)在高低峰谷的電力負荷尖端位置。
圖4 不同優(yōu)化算法下的預測曲線圖Fig.4 Prediction curves under different optimization algorithms
對比各模型評價指標,由表2可以得出:
1)RSO-TCN和IRSO-TCN相對于TCN模型EMAPE、EMAE和ERMSE分別下降了7.08%、6.19%、5.75%和23.55%、15.91%、16.39%,兩者均通過優(yōu)化TCN的閾值參數(shù),使得閾值參數(shù)擺脫局部最優(yōu),這對于提升預測精度是有效的。
2)IRSO-TCN相對于RSO-TCN,EMAPE、EMAE和ERMSE指標分別下降了17.72%、14.47%和12.29%,表明加入交叉算子的IRSO尋優(yōu)能力要強于RSO,提升電力負荷預測精度的能力更強,驗證了IRSO的有效性。
為了驗證IRSO-TCN模型的有效性,引入了(1)SVM模型;(2)RF模型;(3)長短期記憶網(wǎng)絡(LSTM)模型;(4)門控循環(huán)單元(GRU);對電力負荷進行預測,最后與本文所提IRSO-TCN預測結果進行了對比,實驗結果如圖5和表3所示。
表3 各預測模型的評價指標
由圖5可以看出,本文所提IRSO-TCN模型相對于其余機器學習、深度學習模型,預測曲線更為接近電力負荷真實值曲線,這表明本文所提IRSO-TCN模型的預測效果優(yōu)于其余預測模型。
圖5 各預測模型的預測曲線圖Fig.5 Prediction curve of each prediction model
對比表3中各模型的評價指標,可以得出:
1)IRSO-TCN模型的各項評價指標均為最小,通過觀察EMAPE綜合評價指標,SVM和RF機器學習模型對于電力負荷時序預測能力顯然不如時序模型LSTM、GRU和IRSO-TCN,選擇合適的時序模型對提升電力負荷預測精度的提升至關重要;
2)SVM的預測效果略好于RF,LSTM預測效果好于GRU.IRSO-TCN模型相對于SVM和LSTM模型,EMAPE、EMAE和ERMSE分別下降了34.69%、30.70%、28.27%和25.54%、28.72%、42.21%,驗證了本文所提IRSO-TCN模型的有效性。
本文提出了一種基于改進鼠群優(yōu)化算法和時間卷積網(wǎng)絡的短期電力負荷預測方法,通過實驗仿真,驗證了所提IRSO-TCN模型的有效性。TCN模型可以充分的學習電力負荷和輸入特征之間的時序關系,一定程度上提升了電力負荷預測精度;同時使用IRSO對TCN全連接層閾值與偏置參數(shù)進行優(yōu)化,從模型參數(shù)的角度去有效提升電力負荷的預測精度;所提的IRSO優(yōu)化算法,在RSO的基礎上加入了交叉算子,尋優(yōu)能力更強。所提模型相對于其余機器學習、深度學習模型具有更高的預測精度,準確地預測出電力負荷需求量,能夠為電力部門運作與規(guī)劃提供更加可靠的參考依據(jù)。