洪居華,林 毅,劉友波,余 希,鄭 歡,蔡期塬
(1.國網(wǎng)福建經(jīng)研院,福州 350109;2.四川大學(xué)電氣工程學(xué)院,成都 610065)
負(fù)荷預(yù)測有助于電網(wǎng)規(guī)劃人員制定發(fā)電計劃和需求響應(yīng)計劃,將電力生產(chǎn)成本降至最低[1]。負(fù)荷預(yù)測的精度能夠影響規(guī)劃成效,文獻(xiàn)[2]中指出負(fù)荷預(yù)測誤差降低1%,電力運(yùn)營商的成本能節(jié)省9 000 萬元。電網(wǎng)規(guī)劃、投資和市場交易都是基于準(zhǔn)確的電力負(fù)荷預(yù)測完成的,準(zhǔn)確的電力負(fù)荷預(yù)測是保證電力系統(tǒng)安全、可靠、經(jīng)濟(jì)運(yùn)行的前提[3]。
近年來,研究人員提出了許多模型來預(yù)測不同時段的電力負(fù)荷。根據(jù)預(yù)測時段的不同,這些模型可分為短期、中期和長期負(fù)荷預(yù)測模型[4]。短期負(fù)荷預(yù)測(Short-term Load Forecasting,STLF)模型能夠預(yù)測未來幾周的負(fù)荷,預(yù)測結(jié)果用于電力系統(tǒng)的短期運(yùn)行計劃,如發(fā)電計劃。若要預(yù)測未來幾個月到未來幾年的負(fù)荷,則需要中長期負(fù)荷預(yù)測模型?;谀P腕w系結(jié)構(gòu),負(fù)荷預(yù)測模型主要分為兩類:統(tǒng)計模型和數(shù)據(jù)驅(qū)動模型。傳統(tǒng)的統(tǒng)計模型是使用線性回歸函數(shù)建立的,其中STLF問題被視為時間序列預(yù)測問題[5];回歸模型是預(yù)測平穩(wěn)時間序列的有效方法。然而,負(fù)荷需求具有非平穩(wěn)性和非線性特征,因此近年來提出了數(shù)據(jù)驅(qū)動模型,主要在模糊邏輯[6]、人工神經(jīng)網(wǎng)絡(luò)[7]和支持向量機(jī)[8]的基礎(chǔ)上完成。此外,準(zhǔn)確地進(jìn)行負(fù)荷預(yù)測還需要考慮氣候(即溫度、濕度等)、時間和社會經(jīng)濟(jì)約束[9]。為了提高預(yù)測精度,各種混合模型相繼出現(xiàn)[10-11]。為了緩解傳統(tǒng)經(jīng)驗?zāi)P头纸猓‥mpirical Mode Decomposition,EMD)的端部效應(yīng)和包絡(luò)限制,文獻(xiàn)[12]中提出了改進(jìn)的經(jīng)驗?zāi)P头纸夥椒ǎ↖mproved Empirical Mode Decomposition,IEMD)。
本文提出了一種新的混合型負(fù)荷預(yù)測模型[9-12]。為了補(bǔ)償信號分解過程中的信息損失,引入T-Copula分析技術(shù),將天氣因素(即外生變量)的影響納入到信號分解中。盡管IEMD能夠克服傳統(tǒng)EMD的局限性,但是只要將極值映射到邊緣附近就可以得到很好的結(jié)果??紤]到峰值負(fù)荷預(yù)測精度的重要性,從擬合的Copula模型計算風(fēng)險值VaR,以確定峰值負(fù)荷指示變量。此外,為外生變量確定了4 個峰值負(fù)荷指示變量,將這些變量作為負(fù)荷預(yù)測模型的輸入,提高了高峰時段的負(fù)荷預(yù)測精度此外,深度置信網(wǎng)絡(luò)(Deep Belief Network,DBN)克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的不足,采用DBN對信號分解得到的數(shù)據(jù)進(jìn)行處理。算例結(jié)果顯示,本文提出的由IEMD、T-Copula和DBN組成的混合模型在考慮外部變量的情況下,能提供更高的負(fù)荷預(yù)測精度。
若將第m 天的負(fù)荷曲線表示為:Em(t) =[Em(1),Em(2),…,Em(n)]T,t =1,2,…,n。STLF模型能夠得到Em(t)或者Em+1(t)。
目前,混合模型由于具有較高的預(yù)測精度被廣泛討論?;旌夏P头譃閮纱箢悾活愑貌煌哪P头謩e預(yù)測電力負(fù)荷[13],根據(jù)權(quán)重值獲得最終預(yù)測結(jié)果。文獻(xiàn)[13]中分別采用BP神經(jīng)網(wǎng)絡(luò)、基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)、小波神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)、廣義回歸神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等不同的模型對電力負(fù)荷需求進(jìn)行預(yù)測,基于此,應(yīng)用花授粉算法對多目標(biāo)模型的權(quán)重進(jìn)行優(yōu)化,通過加權(quán)平均確定預(yù)測值。另一類將電力負(fù)荷分解成若干分量,然后用恰當(dāng)?shù)哪P停?4]預(yù)測每個分量,最終預(yù)測結(jié)果為各分量預(yù)測結(jié)果之和。小波變換分解效率并不高,因此,近年來,EMD被廣泛使用[10]。文獻(xiàn)[10]中使用EMD將電力負(fù)荷分解為幾個固定函數(shù)和一個殘差函數(shù),較好地預(yù)測了未來的負(fù)荷需求。其中,與EMD相關(guān)的端點(diǎn)效應(yīng)和包絡(luò)極限降低了信號分解的效率,降低了負(fù)荷預(yù)測的準(zhǔn)確性,并且沒有考慮外部變量的影響。基于此,本文提出一種綜合IEMD、T-Copula和DBN的混合預(yù)測模型。
本文提出的STLF 混合模型框架如圖1 所示,主要由負(fù)荷需求時間序列分解和外部輸入變量的相關(guān)處理組成。IEMD能提高信號分解效率。根據(jù)T-Copula相關(guān)性分析計算出的風(fēng)險值VaR,確定峰值負(fù)荷指示變量,將峰值負(fù)荷指示變量作為輸入?yún)?shù)將提高峰值負(fù)荷預(yù)測的精度。
圖1 STLF混合模型的框架
使用IEMD 產(chǎn)生固定函數(shù)的低頻分量(IMF1、IMF2、IMF3等)和殘差函數(shù),相關(guān)步驟如下:
(1)利用IEMD將電力負(fù)荷需求時間序列分解為不同頻率的多個子序列,即(IMF1、IMF2、IMF3等)和殘差。
(2)將各IMF和殘差作為DBN輸入,得到各IMF和殘差的預(yù)測結(jié)果。
(3)對輸出結(jié)果進(jìn)行加權(quán)平均,得到輸出OP1。
采用T-Copula處理外部輸入變量,計算能源負(fù)荷需求與4 個外部輸入變量(如干球溫度、濕球溫度、露點(diǎn)溫度和濕度)之間的上尾依賴關(guān)系。
(1)計算上尾相關(guān)參數(shù)λu=[λ1,λ2,λ3,λ4]和對應(yīng)的VaR。然后根據(jù)VaR1、VaR2、VaR3、VaR4確定每個外部變量的峰值負(fù)荷指示變量。
(2)使用負(fù)荷需求、相關(guān)參數(shù)和峰值負(fù)荷指示變量對每個DBN模型進(jìn)行預(yù)訓(xùn)練。
(3)將每個DBN 獲得的輸出加權(quán)相加,得到輸出OP2。
3.1.1 傳統(tǒng)EMD方法
EMD通過不斷迭代將信號分解成具有不同幅值的規(guī)則低頻分量,包括固有函數(shù)IMF 和殘差函數(shù)。IMF性質(zhì)如下:對于每一個IMF,在整個長度上的極值和過零點(diǎn)的個數(shù)應(yīng)相等或最多相差1 個;在任何區(qū)域,由局部極值定義的包絡(luò)線平均值為零。為更清晰描述這兩個特性,給出從E(t)中提取IMF的迭代過程:
(1)確定負(fù)荷需求時間序列E(t)的局部極大值(Emax(t))和局部極小值(Emin(t)),并利用三次樣條曲線將它們連接起來構(gòu)造上、下包絡(luò)線。
(2)確定兩個包絡(luò)線的平均值與原始負(fù)荷需求時間序列之間的差異。如果上下包絡(luò)線的平均值表示為g1(t),且E(t)&與g1(t)之間的差定義為d1(t),則:
當(dāng)d1(t)滿足IMF的條件時,將它標(biāo)記為I1(t),否則,重復(fù)上述步驟。
(3)確定殘差
(4)重復(fù)上述過程,直到殘差時間序列r1(t)是單調(diào)函數(shù),即殘差足夠小,沒有轉(zhuǎn)折點(diǎn)。
(5)使用EMD分解,原始負(fù)荷可表示如下:
則數(shù)據(jù)由IMF和一個殘差函數(shù)來表示。
EMD比小波變換、離散小波變換在分解復(fù)雜時間序列上更有優(yōu)勢,但存在以下問題[15]:傳統(tǒng)EMD的端部效應(yīng)會導(dǎo)致數(shù)據(jù)兩端出現(xiàn)發(fā)散現(xiàn)象,末端極值無法確定為最大值或最小值,使包絡(luò)線發(fā)生畸變,影響分解。例如,第1 個分解步驟出現(xiàn)誤差,后一個分解動作將顯示相同的結(jié)果失真。此外,三次樣條插值會導(dǎo)致過調(diào)、負(fù)調(diào)現(xiàn)象,導(dǎo)致包絡(luò)線不完整,從而影響結(jié)果。
3.1.2 IEMD方法
IEMD方法能夠抑制末端效應(yīng)和包絡(luò)限制。為了抑制端部效應(yīng),采用線性外推法來確定包含給定數(shù)據(jù)集的最終數(shù)據(jù)。確定上包絡(luò)線端點(diǎn)的過程如圖2 所示。A、B為兩個極大值,直線AB延伸到點(diǎn)C。如果交點(diǎn)C小于端點(diǎn)E的值,E 點(diǎn)被認(rèn)為是上包絡(luò)線的最大值,如圖2 右端所示;如果C 大于端點(diǎn)E 的值,則點(diǎn)E被認(rèn)為是上包絡(luò)線的最大值,如圖2 左端所示。同樣地可以確定下包絡(luò)線的端點(diǎn)。
圖2 確定包絡(luò)線最大值
傳統(tǒng)EMD算法會使用三次樣條函數(shù)計算信號的上下包絡(luò),然后計算平均值。三次樣條曲線擬合的功率低,計算簡單,但會產(chǎn)生超、負(fù)調(diào)現(xiàn)象,使包絡(luò)偏離實(shí)際信號,形成不完全包絡(luò)。為了解決三次樣條曲線擬合的超、負(fù)調(diào)問題,許多學(xué)者提出了改進(jìn)方法,如高階樣條函數(shù)法、多項式擬合法和分段冪函數(shù)插值法。本文對同一模擬信號采用非均勻有理B 樣條插值與三次樣條函數(shù)插值法相比較,發(fā)現(xiàn)前者得到了較好的結(jié)果。采用IEMD 后,信號分解結(jié)果如圖3 所示。結(jié)果表明,IEMD算法可以將信號分解為不同的頻率分量,不存在模式混合。
圖3 采用IEMD進(jìn)行信號分解的結(jié)果
初步研究表明,電力負(fù)荷與外部輸入變量之間存在上尾依賴關(guān)系。Gumbel Copula 模型計算了電力負(fù)荷與4 個外部輸入變量之間的上尾依賴關(guān)系。二元Gumbel Copula模型可以定義為:
式中:fx1(x1(t))和fE(E(t))表示邊緣分布函數(shù);x1表示一個外部輸入變量;E表示系統(tǒng)負(fù)荷需求;f(x1(t),E(t))是二維聯(lián)合分布函數(shù);CP(x1,E)是Copula 函數(shù)。那么,確定每個外部變量的上尾相關(guān)參數(shù):
最大似然估計可用于確定Copula 模型的參數(shù)α。由于系統(tǒng)負(fù)荷需求與外部輸入變量存在非線性關(guān)系,采用基于樣本的典型最大似然估計法進(jìn)行處理。最大似然估計法的目標(biāo)表示為
式中:N表示外部輸入變量的數(shù)量。
Gumbel Copula的上尾相關(guān)參數(shù)λ1為
基于此,為所有外部輸入變量確定所需的Copula 參數(shù)。由于電力負(fù)荷數(shù)據(jù)的波動和峰值的多樣性,對峰值負(fù)荷進(jìn)行有效的統(tǒng)計估計至關(guān)重要。本文引入閾值參數(shù)來確定各變量的峰值負(fù)荷指示變量,
基于VaR 計算峰值負(fù)荷指示變量有助于提高高峰時段的負(fù)荷預(yù)測精度。
峰值負(fù)荷指示變量的二進(jìn)制值由以下公式確定:
式中:M(x1)表示變量x1的峰值負(fù)荷指示性變量;p的值設(shè)置為0.95。對4 個外部輸入變量進(jìn)行計算。
Gumbel Copula模型確定了系統(tǒng)負(fù)荷與外部天氣變量之間的上尾依賴關(guān)系。將信號的默認(rèn)值設(shè)為0.05,通過最大似然估計對模型參數(shù)進(jìn)行估計。圖4給出了算例1 中系統(tǒng)負(fù)荷和外部氣象變量之間的相關(guān)性,為便于分析,圖中干球溫度、露點(diǎn)溫度、濕球溫度、濕度、系統(tǒng)負(fù)荷已進(jìn)行標(biāo)準(zhǔn)化處理,表示當(dāng)前值與最大值的比值,無量綱,取值在[0,1]區(qū)間,如系統(tǒng)負(fù)荷0.5表示當(dāng)系統(tǒng)負(fù)荷為最大可能系統(tǒng)負(fù)荷的0.5 倍的情況。
干球溫度的尾部分布與尾部(0,0)點(diǎn)和(1,1)點(diǎn)有很強(qiáng)的相關(guān)性,干球溫度對系統(tǒng)負(fù)載影響很大。為了考慮系統(tǒng)負(fù)荷與外部變量的正相關(guān)或負(fù)相關(guān),本文給出了皮爾遜相關(guān)矩陣,如表1 所示。表1 說明系統(tǒng)負(fù)荷與干球溫度、濕度正相關(guān),與濕球溫度、濕度負(fù)相關(guān)。在95%置信水平下進(jìn)行VaR計算,上尾依賴參數(shù)和變量值如表2 所示。
圖4 外部變量相關(guān)性分析
表1 系統(tǒng)負(fù)荷與外部變量相關(guān)性分析
表2 具有外部變量的系統(tǒng)負(fù)荷的上尾相關(guān)參數(shù)和VaR
該方法通過IEMD 將負(fù)荷需求數(shù)據(jù)分解為多個IMF和一個殘差。在相關(guān)性分析中,能夠得到上尾相關(guān)參數(shù),峰值負(fù)荷指示變量。將IMF、殘差、上尾相關(guān)參數(shù)、峰值負(fù)荷指示變量和系統(tǒng)負(fù)荷數(shù)據(jù)應(yīng)用于DBN。圖5 給出了DBN的體系結(jié)構(gòu),每層單元之間沒有相互連接。受限玻爾茲曼機(jī)(Restricted Boltzmann Machine,RBM)是一種能夠?qū)W習(xí)輸入數(shù)據(jù)集上概率分布的神經(jīng)網(wǎng)絡(luò)[16]。DBN 預(yù)訓(xùn)練過程將神經(jīng)網(wǎng)絡(luò)中的每個連續(xù)組視為RBM,其聯(lián)合概率為:
式中:h 表示隱藏層的輸入;v表示從可見層獲得的輸出;W表示隱藏神經(jīng)元的權(quán)重;a表示激活函數(shù)。對于每個RBM,都有一組隱藏層和可見層。
對于連續(xù)變量v的高斯-伯努利RBM為:
圖5 深度置信網(wǎng)絡(luò)結(jié)構(gòu)示意圖
RBM的目標(biāo)函數(shù)為:
分層預(yù)訓(xùn)練要求DBN 在目標(biāo)函數(shù)上遵循隨機(jī)梯度下降法進(jìn)行訓(xùn)練,參數(shù)(例如a、b、W)根據(jù)目標(biāo)函數(shù)的梯度更新,如下所示:
式中:〈hi〉Ph|v(h |v)是關(guān)于輸入數(shù)據(jù)的條件分布的期望;〈hi〉recon是第i 次重構(gòu)分布的期望。那么,參數(shù)更新如下:
訓(xùn)練多個層時,使用上層輸出的條件期望作為下一層的輸入,然后繼續(xù)訓(xùn)練下一層?;诜謱宇A(yù)訓(xùn)練方法,初始化DBN算法的所有參數(shù)。以監(jiān)督學(xué)習(xí)的方式對參數(shù)進(jìn)行調(diào)整,直到DBN 的損耗函數(shù)達(dá)到最小值。最后,將反向傳播算法應(yīng)用于調(diào)整過程。所有參數(shù)都從上到下更新,從而減少了預(yù)測誤差。
為了識別負(fù)荷需求時序數(shù)據(jù)中的周期和模式,可以應(yīng)用自相關(guān)函數(shù)選擇具有相同信息特征的子集。假設(shè)時序數(shù)據(jù)集為E =Et,t∈T,滯后時間k 時的自相關(guān)系數(shù)rk計算如下:
所提混合負(fù)荷預(yù)測模型在澳大利亞某地區(qū)數(shù)據(jù)集[17]和美國德克薩斯州某城市數(shù)據(jù)集[18]上進(jìn)行測試。數(shù)據(jù)集主要包括:天氣數(shù)據(jù)(即干球溫度、濕球溫度、露點(diǎn)溫度和濕度)、時間分類數(shù)據(jù)(即小時、月、日)、社會數(shù)據(jù)(即工作日、周末、假日)和特定采樣時間的負(fù)荷需求。
平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)用于評估不同模型的性能。
對于基于信號分解的DBN,日前負(fù)荷預(yù)測與外部變量的相關(guān)性分析,取前1 天Et-48~Et-96負(fù)荷數(shù)據(jù),以及前1 周所對同1 天Et-336~Et-348的負(fù)荷需求,作為DBN的輸入。DBN 輸入數(shù)量為100。上尾相關(guān)參數(shù)和峰值負(fù)荷指示變量也用于DBN 輸入。通過交叉驗證確定隱藏層的數(shù)目為3,每層隱神經(jīng)元的數(shù)目為30,
DBN的結(jié)構(gòu)為100-30-30-30-1。隨機(jī)選擇10%的原始數(shù)據(jù)進(jìn)行交叉驗證,根據(jù)結(jié)果將學(xué)習(xí)率設(shè)為0.1,迭代次數(shù)設(shè)為500 次。通過T-Copula 進(jìn)行相關(guān)性分析時,默認(rèn)閾值設(shè)為0.05。
采用Matlab R2017b 進(jìn)行了仿真,并對兩個數(shù)據(jù)集進(jìn)行了測試。對于這兩個算例,使用下式將數(shù)據(jù)集線性縮放至[0,1]:
算例1收集了澳大利亞某地區(qū)2013-01-01~2013-12-31 日的數(shù)據(jù)[17],采樣時間為0.5 h。后文將全年數(shù)據(jù)分為4 個季節(jié):1~3 月,4~6 月,7~9 月,10~12 月。周前負(fù)荷預(yù)測是將1 個月的3 周數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,剩余1 周作為測試數(shù)據(jù)集。假設(shè)每日信息可用,信號分解得到的輸入數(shù)據(jù)集為8 個IMF 和殘差。利用自滯后相關(guān),將這些分解后的信號應(yīng)用于配電網(wǎng)負(fù)荷預(yù)測。相關(guān)性分析得到的輸入數(shù)據(jù)集包括上尾相關(guān)參數(shù)、二元峰值指示變量和根據(jù)學(xué)習(xí)環(huán)境設(shè)置得到的負(fù)荷需求數(shù)據(jù)集,基于DBN進(jìn)行考慮外部變量的周負(fù)荷預(yù)測。對每個季節(jié),采用2 個月的數(shù)據(jù)集來評估所提方法的負(fù)荷預(yù)測性能。
圖6 提前兩周的負(fù)荷預(yù)測結(jié)果
負(fù)荷需求預(yù)測結(jié)果如圖6 所示,將該模型的預(yù)測結(jié)果與文獻(xiàn)[10]進(jìn)行比較,每小時的平均誤差分布如圖7 所示。從平均誤差分布結(jié)果可以看出,高峰時段的負(fù)荷預(yù)測精度有所提高,這將有助于電力運(yùn)營商制定正確的發(fā)電計劃和運(yùn)維計劃。
圖7 誤差分布
為了便于比較,對澳大利亞多個地區(qū)進(jìn)行了模擬,如表3 所示。由表3 可知,所提模型與文獻(xiàn)[10]中的方法相比,MAPE 值下降了21.19%,RMSE 值下降了16.93%,所提模型預(yù)測精度更高,說明IEMD 信號分解和T-Copula相關(guān)性分析能夠提高預(yù)測精度。
表3 算例1 的負(fù)荷預(yù)測性能比較
算例2基于美國德克薩斯州某城市2016-01-01~2016-12-31 的數(shù)據(jù)[18],采樣時間為1 h。如表4 所示,由于IEMD 和T-Copula 的聯(lián)合作用,MAPE 和RMSE 值顯著降低,該模型的MAPE 值下降了15.27%,RMSE值下降了13.86%。實(shí)際上,IEMD 通過計算VaR中的峰值負(fù)荷指示性變量,提高了信號分解效率,而T-Copula有助于提高高峰時段的負(fù)荷預(yù)測精度。
表4 算例2 的負(fù)荷預(yù)測性能比較
本文提出了一種基于IEMD和T-Copula的混合短期負(fù)荷預(yù)測模型。首先,利用IEMD 對負(fù)荷需求時間序列進(jìn)行分解;其次,采用T-Copula 進(jìn)行系統(tǒng)負(fù)荷與外部輸入變量的相關(guān)性分析,提高高峰時段負(fù)荷預(yù)測的準(zhǔn)確性;然后,分別對兩個分量進(jìn)行預(yù)測;最后將各部分的結(jié)果相加,得到最終的預(yù)測結(jié)果。利用澳大利亞和美國電力負(fù)荷統(tǒng)計數(shù)據(jù)驗證了該模型的有效性。結(jié)果表明:①IEMD 能更準(zhǔn)確有效地提取電力負(fù)荷的線性和非線性分量;②通過T-Copula提高了高峰時段負(fù)荷預(yù)測的準(zhǔn)確性;③DBN具有很好的處理電力負(fù)荷非線性分量的能力。結(jié)合每種模型的優(yōu)勢,混合模型可以捕捉到負(fù)荷多種特性,能夠獲得更準(zhǔn)確的預(yù)測結(jié)果。此外,在混合模型中還可以加入一些未來可能的影響因素,如與需求響應(yīng)相關(guān)的用戶信息,以及分布式可再生能源集成帶來的不確定性等。本文所提負(fù)荷預(yù)測模型對電網(wǎng)的短期發(fā)電、調(diào)度和運(yùn)行提供一定的參考價值。