洪小林
(河海大學(xué) 理學(xué)院,江蘇 南京 210098)
電力需求預(yù)測(cè)是智能電網(wǎng)的重要組成部分。通過(guò)應(yīng)用智能電網(wǎng)系統(tǒng)可以有效地管理電能并提高經(jīng)濟(jì)效益,智能電網(wǎng)中的電能調(diào)度管理要求預(yù)測(cè)不同設(shè)施的電力需求。電力需求波動(dòng)性評(píng)估與智能需求響應(yīng)相互作用,實(shí)時(shí)監(jiān)測(cè)電能并管理電能需求[1]。預(yù)測(cè)電能使用量以確保充足的電能供應(yīng)與提高電能效率密切相關(guān),準(zhǔn)確預(yù)測(cè)電能需求可以減少能源浪費(fèi),提高能源利用的可持續(xù)性。
文獻(xiàn)[2]使用支持向量機(jī)(SVM)和用電數(shù)據(jù)對(duì)電力需求進(jìn)行了預(yù)測(cè)。然而,僅使用機(jī)器學(xué)習(xí)算法無(wú)法識(shí)別特定時(shí)區(qū)的變化,因此僅從歷史用電數(shù)據(jù)很難準(zhǔn)確預(yù)測(cè)電力需求。文獻(xiàn)[3]通過(guò)預(yù)測(cè)每個(gè)時(shí)區(qū)電力需求波動(dòng)來(lái)提高準(zhǔn)確性。同時(shí),電力需求預(yù)測(cè)系統(tǒng)還需進(jìn)行數(shù)據(jù)采集、預(yù)處理、特征提取等各個(gè)環(huán)節(jié),因此電力需求預(yù)測(cè)系統(tǒng)需要耗費(fèi)大量的時(shí)間和計(jì)算[4]。由于每個(gè)用電設(shè)施都有各自的使用模式,而且用電量、詳細(xì)用電量和額定容量各不相同[5],因此,還需通過(guò)深度學(xué)習(xí)對(duì)電力需求波動(dòng)性進(jìn)行分析。文獻(xiàn)[6]按季節(jié)、日、月和小時(shí)對(duì)數(shù)據(jù)進(jìn)行分析后發(fā)現(xiàn)電力需求的波動(dòng)模式。
本文基于深度學(xué)習(xí)對(duì)每個(gè)用電設(shè)施進(jìn)行了電力需求預(yù)測(cè),以長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)深度學(xué)習(xí)方法為基礎(chǔ),利用混合數(shù)據(jù)抽樣(MIDAS)方法對(duì)自回歸分布滯后(ARDL)進(jìn)行改進(jìn),提出了LSTM+MIDAS模型的電力需求預(yù)測(cè)方法。通過(guò)收集住宅、工廠(chǎng)、醫(yī)院和市政廳等4個(gè)設(shè)施的電力需求來(lái)計(jì)算每種電力需求使用模式的預(yù)測(cè)精度。該模型能夠與實(shí)際使用情況相比較以此確定不合格的波動(dòng)性,并提供高精度的預(yù)測(cè)結(jié)果,通過(guò)數(shù)值計(jì)算估計(jì)影響電力需求的不同數(shù)據(jù)形式。
ARDL利用分析時(shí)間序列數(shù)據(jù)的動(dòng)態(tài)回歸分析,可實(shí)現(xiàn)預(yù)測(cè)電力需求誤差修正和協(xié)整。在電力需求預(yù)測(cè)中,ARDL方法假設(shè)月電力需求影響幾年前的電力需求并包含自回歸階數(shù),采暖度日和降溫度日包含在上月的自變量中。統(tǒng)計(jì)顯著性水平可以根據(jù)使用情況采用不同的模型來(lái)確定。因此,從周數(shù)據(jù)(xt)可以預(yù)測(cè)第t月第j周的月數(shù)據(jù)(yt),則因變量Ay和自變量Ax的自回歸度ARDL(Ay,Ax)模型為:
(1)
式中,μ為固定參數(shù);αi和βj分別為月數(shù)據(jù)和周數(shù)據(jù)的系數(shù);ut為滯后項(xiàng)。
假設(shè)月份固定為4周:j=1,2,3,4。由于用電需求的特點(diǎn),電力需求預(yù)測(cè)對(duì)溫度和季節(jié)因素非常敏感,歷史數(shù)據(jù)越早,對(duì)預(yù)測(cè)數(shù)據(jù)的影響就越小[7]。因此,應(yīng)為每個(gè)歷史數(shù)據(jù)分配不同的權(quán)重,進(jìn)而更準(zhǔn)確地預(yù)測(cè)電力需求[8]。如果為式(1)中的周數(shù)據(jù)賦予不同的權(quán)重,則可以導(dǎo)出:
(2)
式中,a為固定參數(shù);w為1周;bt為滯后項(xiàng);βw,t-j為權(quán)重為w的周數(shù)據(jù)xw,t-j的系數(shù)。
利用式(2)計(jì)算ARDL(1,2)時(shí),x的估計(jì)系數(shù)數(shù)量為8(2×4)。本文中使用的數(shù)據(jù)是日數(shù)據(jù),因此假設(shè)每月30 d,則估計(jì)系數(shù)數(shù)量為60(2×30)。在這種情況下,由于自由度損失,模型本身的估計(jì)變得困難,結(jié)果的可靠性也很低。
與ARDL方法類(lèi)似,使用MIDAS方法的電力需求預(yù)測(cè)系統(tǒng)通過(guò)回歸模型對(duì)用電需求進(jìn)行預(yù)測(cè)。MIDAS最大的優(yōu)點(diǎn)是權(quán)重函數(shù)自動(dòng)分配:
(3)
式中,θ為權(quán)重函數(shù)的參數(shù)向量;Nw為周數(shù);Dy和Dx分別為每月和每周的天數(shù)。
式(3)中的MIDAS與式(1)中的ARDL相似,但包含函數(shù)φ(j;θ),該函數(shù)對(duì)高頻(滯后)施加不同的權(quán)重[9]。因此,當(dāng)通過(guò)MIDAS逼近法預(yù)測(cè)電力需求時(shí),可以通過(guò)考慮電力需求數(shù)據(jù)之外的各種外部因素來(lái)進(jìn)行預(yù)測(cè),而無(wú)需調(diào)整權(quán)重函數(shù)的參數(shù)。
為了根據(jù)頻率分配不同的權(quán)重,采用MIDAS方法中的權(quán)重函數(shù),通過(guò)將溫度、工作日數(shù)設(shè)置為自變量,可以提高短期電力需求預(yù)測(cè)的準(zhǔn)確性[10]。周六設(shè)置為半天,不包括節(jié)假日和周日,并將工作日數(shù)相加[11]。另外,由于可以通過(guò)分離工作日和周末電力需求數(shù)據(jù)來(lái)分析電力需求的波動(dòng)模式。因此,可以在工作日和周末之間電力需求差異較大的設(shè)施進(jìn)行預(yù)測(cè)。
本文的數(shù)據(jù)集和LSTM電力需求預(yù)測(cè)模型框架結(jié)構(gòu),如圖1所示。
圖1 預(yù)測(cè)方法的框架結(jié)構(gòu)
為了識(shí)別預(yù)測(cè)模式,本文將數(shù)據(jù)分為短期數(shù)據(jù)和長(zhǎng)期數(shù)據(jù)。根據(jù)電力需求,通過(guò)收集每個(gè)設(shè)施的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。通過(guò)測(cè)量3種實(shí)驗(yàn)方法的預(yù)測(cè)誤差率,對(duì)不同時(shí)期(短期和長(zhǎng)期)的數(shù)據(jù)來(lái)評(píng)估預(yù)測(cè)模型:①現(xiàn)有的電力需求預(yù)測(cè)MIDAS算法;②現(xiàn)有的LSTM模型;③本文提出的LSTM+MIDAS模型。利用這3種方法對(duì)短期數(shù)據(jù)和長(zhǎng)期數(shù)據(jù)進(jìn)行實(shí)驗(yàn),從而比較預(yù)測(cè)精度的差異。對(duì)于具有較大變化電力需求模式的住宅設(shè)施,還需從季節(jié)、天氣和假日等方面進(jìn)行分析。最后,本文將LSTM+MIDAS模型的性能與其他現(xiàn)有研究進(jìn)行比較。
不同設(shè)施的平均最大電力需求數(shù)據(jù)集如圖2所示。
圖2 不同設(shè)施的平均最大電力需求
在圖2中,以住宅和市政廳為例,夏季(6月—8月)平均最大電力需求呈上升趨勢(shì),但市政廳平均最大電力需求較高,并且冬季(11月至次年1月)與夏季無(wú)差異。雖然各設(shè)施的電力需求差異較大,但工廠(chǎng)的平均最大電力需求最為相似,每年的用電量在600~700 kWh。醫(yī)院的最大用電需求在4個(gè)設(shè)施中最高,在5月—9月氣溫上升期間,表現(xiàn)出最高的電力需求。然而,住宅在夏季和冬季的最大電力需求差異最大,在除夏季以外的其他季節(jié)中,最大電力需求表現(xiàn)出相似的模式。因此,本文對(duì)住宅的季節(jié)性電力需求預(yù)測(cè)進(jìn)行進(jìn)一步的實(shí)驗(yàn)。
2019年11月至2020年10月,通過(guò)安裝在各類(lèi)設(shè)施(住宅、醫(yī)院、市政廳、工廠(chǎng))的電力計(jì)量傳感器收集電力需求。利用住宅、工廠(chǎng)、醫(yī)院和市政廳等4個(gè)設(shè)施的電力需求來(lái)計(jì)算每種電力需求使用模式的預(yù)測(cè)精度。收集用電數(shù)據(jù)以每天5 min的頻率共收集288個(gè)數(shù)據(jù)組成。數(shù)據(jù)集的輸入和輸出見(jiàn)表1。
表1 數(shù)據(jù)集的輸入和輸出
使用表1中的不同數(shù)據(jù)成分進(jìn)行短期、長(zhǎng)期和季節(jié)性預(yù)測(cè)。根據(jù)季節(jié)特征,將冬季劃分為2019年11月至2020年1月,夏季為2020年6月—8月。
利用表1給出了輸入和輸出數(shù)據(jù)集的結(jié)構(gòu),在LSTM模塊中,輸入的訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)的比例為2∶1。由于一周中每天的電力需求模式相似,輸入數(shù)據(jù)(訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù))和輸出數(shù)據(jù)由同一天(7 d滯后)數(shù)據(jù)組成。在短期預(yù)測(cè)中,利用前3周的3個(gè)7 d滯后數(shù)據(jù)來(lái)預(yù)測(cè)下一周同一天的數(shù)據(jù)。在長(zhǎng)期預(yù)測(cè)中,利用前12周的12個(gè)7 d滯后數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)4周內(nèi)同一天的數(shù)據(jù)。例如,在預(yù)測(cè)未來(lái)4周內(nèi)每周一的電力需求數(shù)據(jù)時(shí),將前12周的數(shù)據(jù)用作訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。同樣,在季節(jié)性數(shù)據(jù)預(yù)測(cè)中,用前9周的7 d滯后數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)3周。根據(jù)3個(gè)模型的輸入和輸出數(shù)據(jù)提出的LSTM結(jié)構(gòu)流程如圖3所示。
圖3 各LSTM模型流程
在LSTM+MIDAS電力需求預(yù)測(cè)模型中,輸入電力需求作為輸入數(shù)據(jù)之前,通過(guò)對(duì)影響預(yù)測(cè)數(shù)據(jù)波動(dòng)性的輸入數(shù)據(jù)賦予不同的權(quán)重進(jìn)行預(yù)處理。因此,使用MIDAS逼近法的權(quán)重函數(shù)對(duì)每天輸入的數(shù)據(jù)進(jìn)行加權(quán),類(lèi)似于預(yù)測(cè)的波動(dòng)性。
(4)
利用式(4)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:
(5)
式(4)為ALMOD指數(shù)函數(shù),主要用作MIDAS回歸方法的加權(quán)函數(shù)[12]。其中,θ為權(quán)重函數(shù)的參數(shù)向量。權(quán)重函數(shù)的形狀和速度取決于θ值,為了實(shí)現(xiàn)權(quán)重的指數(shù)增加,將θ值設(shè)置在-0.002~0.010。W為W(n;θ)的向量矩陣;b為偏差系數(shù)。如果加權(quán)計(jì)算后的值與原始數(shù)據(jù)相差太大,則通過(guò)調(diào)整偏差值進(jìn)行調(diào)整,偏差在-0.03~4.25。
考慮到電力需求的波動(dòng)性,本文采用能夠反映現(xiàn)有MIDAS中使用的權(quán)重函數(shù)值來(lái)建立適合于時(shí)間序列預(yù)測(cè)的LSTM模型。使用的LSTM+MIDAS電力需求模型的結(jié)構(gòu)如圖4所示。
圖4 LSTM+MIDAS模型的結(jié)構(gòu)
在LSTM+MIDAS模型中,輸入層的輸入數(shù)據(jù)作為參數(shù)輸入到輸入門(mén)、遺忘門(mén)和輸出門(mén)中。輸入?yún)?shù)值通過(guò)計(jì)算權(quán)重和偏差值輸入。在每個(gè)門(mén)處,根據(jù)時(shí)間計(jì)算不同的值。圖4的LSTM結(jié)構(gòu)如下:
(6)
(7)
(8)
(9)
(10)
(11)
為了評(píng)估LSTM模型的預(yù)測(cè)性能,本文使用平均絕對(duì)百分比誤差(MAPE)、均方根誤差(RMSE)和R2來(lái)測(cè)量統(tǒng)計(jì)分析。每個(gè)模型的評(píng)估公式如下:
(12)
(13)
(14)
R2的正常范圍為[0,1],并且越接近1,模型的預(yù)測(cè)能力越強(qiáng)[13]。由于本文中使用的電力需求數(shù)據(jù)在規(guī)模上因設(shè)施而異,因此計(jì)算R2來(lái)比較根據(jù)設(shè)施預(yù)測(cè)的結(jié)果。
由于深度學(xué)習(xí)4J(DL4J)適合基于深度學(xué)習(xí)的時(shí)間序列數(shù)據(jù)預(yù)測(cè),因此,本文使用DL4J構(gòu)建基于LSTM的電力需求預(yù)測(cè)模型。DL4J的特點(diǎn)是易于構(gòu)建可以使用圖形處理單元(GPU)的環(huán)境。本文提出了一種基于DL4J方法和MIDAS相結(jié)合的LSTM模型,并用于電力需求預(yù)測(cè)的優(yōu)化。
通過(guò)設(shè)置合適的參數(shù)可以獲得良好的深度學(xué)習(xí)性能。根據(jù)數(shù)據(jù)的數(shù)量或目的來(lái)尋找最優(yōu)的參數(shù)設(shè)置,如,最佳層數(shù)、節(jié)點(diǎn)數(shù)、迭代次數(shù)、激活函數(shù)等參數(shù)設(shè)置,在參數(shù)設(shè)置中總共進(jìn)行了40次設(shè)置,得到了最優(yōu)的結(jié)果。本文將隱藏層數(shù)設(shè)置為3,節(jié)點(diǎn)數(shù)設(shè)置為10,學(xué)習(xí)速率設(shè)置為0.01,并將迭代次數(shù)設(shè)置為180。采用雙曲正切(tanh)和隨機(jī)梯度下降分別作為L(zhǎng)STM層的激活函數(shù)和優(yōu)化算法。在分類(lèi)LSTM模型中,交叉熵(CE)和誤差平方和(SSE)作為多類(lèi)別分類(lèi)進(jìn)行預(yù)測(cè)的成本函數(shù),但均方誤差(MSE)主要用于對(duì)回歸進(jìn)行預(yù)測(cè)[14]。因此,本文使用MSE作為代價(jià)函數(shù)來(lái)降低預(yù)測(cè)誤差。LSTM+MIDAS模型的參數(shù)設(shè)置值見(jiàn)表2。
表2 LSTM+MIDAS模型的參數(shù)設(shè)置值
由表2可見(jiàn),尋找優(yōu)化參數(shù)實(shí)驗(yàn)中獲得最高準(zhǔn)確率的3個(gè)結(jié)果。根據(jù)不同的設(shè)置顯示出不同的預(yù)測(cè)結(jié)果,本文使用具有最高精度的設(shè)置3。
短期預(yù)測(cè)結(jié)果見(jiàn)表3,長(zhǎng)期預(yù)測(cè)結(jié)果見(jiàn)表4。在短期預(yù)測(cè)情況中,住宅、市政廳、工廠(chǎng)、醫(yī)院用電需求預(yù)測(cè)的MAPE分別從21.04%下降到10.44%,從15.6%下降到2.73%,從7.21%下降到1.63%,從7.1%下降到1.96%。在長(zhǎng)期預(yù)測(cè)情況中,不同預(yù)測(cè)方法的誤差率無(wú)顯著性差異。
表3 短期預(yù)測(cè)結(jié)果的誤差率
表4 長(zhǎng)期預(yù)測(cè)結(jié)果的誤差率
住宅的季節(jié)性用電需求預(yù)測(cè)結(jié)果見(jiàn)表5。
表5 住宅季節(jié)性用電需求預(yù)測(cè)結(jié)果的誤差率
由表5可見(jiàn),與表3和表4中的短期和長(zhǎng)期預(yù)測(cè)結(jié)果不同,在季節(jié)性用電需求預(yù)測(cè)實(shí)驗(yàn)中,不同預(yù)測(cè)方法表現(xiàn)出的誤差率差異較大。在冬季實(shí)驗(yàn)中,預(yù)測(cè)的數(shù)據(jù)包括假期,這大大減少了電力需求。因此,在MIDAS方法中,本文給假日數(shù)據(jù)賦予更大的權(quán)重。但是,在LSTM方法中,未分配權(quán)重值,因此LSTM的性能最低。
本文使用Friedman檢驗(yàn)作為非參數(shù)統(tǒng)計(jì)檢驗(yàn),將LSTM+MIDAS模型與其他2種方法(LSTM、MIDAS)的短期、長(zhǎng)期和季節(jié)性試驗(yàn)結(jié)果進(jìn)行比較[15]。Friedman檢驗(yàn)通常形式是使用秩而不是原始值,其中秩是通過(guò)分別對(duì)行進(jìn)行彼此獨(dú)立的排序而獲得。所有預(yù)測(cè)MAPE結(jié)果的Friedman檢驗(yàn)結(jié)果如下:總體MAPE結(jié)果(短期、長(zhǎng)期和季節(jié)性)數(shù)量N為10;卡方為8.6;自由度(DF)為2;p值為0.018。Friedman的臨界值設(shè)置為0.05的顯著性水平。
本文提出了LSTM+MIDAS混合模型只需使用歷史電力需求數(shù)據(jù)的短期數(shù)據(jù)優(yōu)化電力需求預(yù)測(cè)模型。電力需求預(yù)測(cè)的準(zhǔn)確性取決于數(shù)據(jù)預(yù)處理和權(quán)重函數(shù)。此外,建立一個(gè)能夠密切跟蹤電力需求隨時(shí)間變化的波動(dòng)模式。在表4中,證實(shí)了LSTM+MIDAS模型比其他2種方法能夠更好地反映電力需求波動(dòng)。
綜上所述,本文確定了住宅設(shè)施的預(yù)測(cè)性能最低,而工廠(chǎng)和醫(yī)院設(shè)施的預(yù)測(cè)精度較高,且誤差率相對(duì)較低。短期數(shù)據(jù)的LSTM+MIDAS模型的預(yù)測(cè)水平高于其他2種方法。同時(shí),短期數(shù)據(jù)的結(jié)果也相對(duì)好于長(zhǎng)期數(shù)據(jù)。與短期預(yù)測(cè)的最大MAPE相比,LSTM+MIDAS模型在住宅設(shè)施減少10.44%,市政廳下降12.87%,工廠(chǎng)下降5.58%,醫(yī)院下降5.14%;在長(zhǎng)期預(yù)測(cè)的情況下,住宅設(shè)施只下降了2.11%,市政廳下降了2.8%。長(zhǎng)期預(yù)測(cè)并沒(méi)有改善工廠(chǎng)和醫(yī)院設(shè)施電力需求預(yù)測(cè)的錯(cuò)誤率。利用短期數(shù)據(jù)進(jìn)行電力需求預(yù)測(cè)更準(zhǔn)確地反映電力需求的波動(dòng)性,從而提高短期預(yù)測(cè)的準(zhǔn)確性。然而,長(zhǎng)期數(shù)據(jù)的預(yù)測(cè)受天氣和外部因素的影響較大。因此,盡管由于數(shù)據(jù)集數(shù)量較多,總體精度較高,但該方法的精度沒(méi)有太大差異。在長(zhǎng)期電力需求預(yù)測(cè)中,預(yù)測(cè)的準(zhǔn)確度并沒(méi)有提高。由于電力需求數(shù)據(jù)與波動(dòng)性相關(guān),在波動(dòng)趨勢(shì)出現(xiàn)時(shí),長(zhǎng)期電力需求數(shù)據(jù)不能很好地預(yù)測(cè)。對(duì)受天氣、季節(jié)和假日影響的住宅設(shè)施的電力需求預(yù)測(cè),通過(guò)考慮特殊情況的權(quán)重對(duì)數(shù)據(jù)進(jìn)行季節(jié)分類(lèi)和預(yù)測(cè),從而獲得更高的精度。以6 h為間隔的3 d內(nèi)住宅季節(jié)性電力需求預(yù)測(cè)如圖5所示。
圖5 以6 h為間隔的3 d內(nèi)住宅季節(jié)性電力需求預(yù)測(cè)
該文將7月份的數(shù)據(jù)用于夏季預(yù)測(cè),將夏季的住宅用電需求預(yù)測(cè)結(jié)果與文獻(xiàn)[16]的LSTM預(yù)測(cè)結(jié)果進(jìn)行了比較。本文提出的LSTM+MIDAS模型的MAPE為5.400%,LSTM模型的MAPE為8.935%。與LSTM相比,LSTM+MIDAS的誤差率(MAPE)降低了39.564%。此外,通過(guò)Friedman檢驗(yàn),LSTM+MIDAS模型小于a(p<0.05)。因此,通過(guò)Friedman檢驗(yàn),LSTM+MIDAS模型的結(jié)果具有統(tǒng)計(jì)學(xué)顯著性。
本文提出了LSTM+MIDAS電力需求預(yù)測(cè)模型,只需利用歷史電力需求的短期數(shù)據(jù)即可對(duì)電力需求進(jìn)行預(yù)測(cè)模型。通過(guò)收集住宅、工廠(chǎng)、醫(yī)院和市政廳等4個(gè)設(shè)施的電力需求來(lái)計(jì)算每種電力需求使用模式的預(yù)測(cè)精度,以較低的錯(cuò)誤率預(yù)測(cè)電力需求。住宅受季節(jié)因素的影響較大。由于只考慮電力需求數(shù)據(jù)作為輸入數(shù)據(jù),住宅設(shè)施受天氣影響的預(yù)測(cè)誤差率比其他設(shè)施有所增加。同時(shí),該模型能夠確定不合格的波動(dòng)性,并提供高精度的預(yù)測(cè)結(jié)果。