黃國權(quán),嚴玉婷,李暉,張勇軍
(1.華南理工大學(xué)電力學(xué)院,廣州 510641;2.深圳供電局有限公司,廣東 深圳 518001;3.廣東電網(wǎng)有限責任公司電力科學(xué)研究院,廣州 510080)
隨著電力市場化改革[1-2]不斷推進,電力現(xiàn)貨交易市場建設(shè)已初具雛形,在此模式下,超短期負荷功率預(yù)測無法支撐電量交易計劃[3]。同時,《電力中長期交易基本規(guī)則》[4]指出,電力中長期交易包括“年、季、月、多日”等不同時間尺度的電量交易,相較于早期的暫定版補充了月內(nèi)(多日)交易,說明市場交易周期的逐漸縮短是趨勢所向。對此,獲悉用戶日電量需求可以更加靈活指導(dǎo)精細時間尺度下的交易行為。
另一方面,為響應(yīng)建設(shè)現(xiàn)代供電服務(wù)體系的新要求,近年來部分地區(qū)供電局專門設(shè)立了高端客戶經(jīng)理服務(wù)于高用能需求的工商業(yè)等行業(yè)大用戶[5]。因而預(yù)知大用戶短期電量為供電局提前向其主動服務(wù)提供支持,提升大用戶的用電體驗感;同時也能作為增值服務(wù)項目豐富供電局的創(chuàng)收手段。
此外,電量是企業(yè)生產(chǎn)經(jīng)營狀態(tài)的間接反映,能夠輔助掌握企業(yè)短期內(nèi)的生產(chǎn)動態(tài)。相比于居民等用電隨機性較強的小用戶,工商業(yè)企業(yè)等行業(yè)大用戶等對電能的依賴性更加顯著,具有用能需求大、用電規(guī)律明顯、用電趨勢平穩(wěn)等特點,也是未來電力現(xiàn)貨市場需求側(cè)的主體用戶。
綜上所述,針對供電局重點關(guān)注的行業(yè)大用戶,預(yù)測其短期電量尤為關(guān)鍵,且其用電特征更易于捕捉,有利于實現(xiàn)精準預(yù)測。
目前針對短期電力負荷預(yù)測的研究按思路區(qū)別主要分為時間序列預(yù)測[6-10]和多因素預(yù)測[11-17]。
時間序列預(yù)測模型從自身歷史數(shù)據(jù)出發(fā),結(jié)合傳統(tǒng)時序建模法[6]或時頻域分解[7-8]及周期分解[9-10]等時序分解法進行預(yù)測。文獻[6]采用ARIMA模型對中國一次能源消費進行擬合分析,但精度不高。文獻[7]將經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)直接應(yīng)用于原始負荷上,解決預(yù)測面臨的負荷數(shù)據(jù)隨機性問題。文獻[8]提出結(jié)合集合經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)、多元回歸和長短期記憶網(wǎng)絡(luò)(long short-term memory networks,LSTM)對短期負荷進行預(yù)測,降低負荷復(fù)雜度后再分析處理。文獻[9]采用整合移動平均自回歸模型對時間序列數(shù)據(jù)進行周期分解,并基于灰色預(yù)測模型預(yù)測電量趨勢。文獻[10]基于局部加權(quán)回歸對配網(wǎng)短期負荷進行周期趨勢分解,并利用LSTM對各分量精準預(yù)測,提高模型的魯棒性和泛化能力。
多因素預(yù)測模型探討的是電力數(shù)據(jù)與其各種影響因素間的關(guān)聯(lián)特性,并以此借由關(guān)聯(lián)因素來對電力負荷進行回歸預(yù)測。常納入考慮的因素包括溫濕度等氣象因素[11-13]、GDP等經(jīng)濟因素[14-15]和日類型等時間因素[16-17]等等,其中在短期負荷預(yù)測更多考慮氣象因素和時間因素。
針對行業(yè)用戶短期電量預(yù)測問題,一方面,行業(yè)屬性、生產(chǎn)經(jīng)營行為模式、發(fā)展計劃等等差異使得用戶的用能特性的差異也因此日益明顯,而不同于地區(qū)負荷預(yù)測能夠?qū)Σ町惢挠媚芴匦宰鳛檎w性看待,對單個行業(yè)用戶的電量預(yù)測需要有針對性地區(qū)別處理;另一方面,其主要用能設(shè)備可能包含空調(diào)、生產(chǎn)設(shè)備、辦公照明設(shè)備等等,因此行業(yè)用戶的用電特性與氣溫、工作特性等息息相關(guān),但現(xiàn)有分解預(yù)測模型均是采用時頻域分解或是周期分解的單一分解模型,通過經(jīng)驗?zāi)B(tài)分解或小波分解等時頻域分解可能會造成對原始特征的拆解,掩蓋了原有規(guī)律,且所得分量并沒有物理指代意義,而常用的周期分解僅能得到固定的周期分量,無法反映長時間的工作安排變化,也無法更多地考慮其余因素如氣溫的影響。
為此,本文提出一種基于特征辨識的行業(yè)用戶短期日電量二重分解預(yù)測方法,針對行業(yè)用戶這一細化對象,首先通過特征辨識省去定制分解框架時的人工干預(yù)判斷過程;其次結(jié)合其用電特征對用戶電量進行二重分解,得到與用電特征相關(guān)的分量;接著依據(jù)分量特點選用LSTM/加權(quán)最小二乘支持向量機(weighted least squares support vector machine,WLSSVM)/卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)進行組合預(yù)測;最后對節(jié)假日電量進行調(diào)整得到最終預(yù)測值。
不同行業(yè)用戶的工作安排、放假調(diào)休、用能設(shè)備等等差異會表現(xiàn)出不同的用電特征,準確辨識用戶所具特征有利于精準預(yù)測。本節(jié)利用統(tǒng)計學(xué)知識辨識行業(yè)用戶的用電特征,為后續(xù)定制分解框架時省去人工干預(yù)判斷過程做準備工作。
與一般負荷不同,多數(shù)行業(yè)用戶由于存在工作特性會表現(xiàn)出明顯的工作日效應(yīng),即工作日與周末明顯的電量區(qū)別,鑒別負荷是否具有此種規(guī)律有利于在分解框架中將其納入考慮。本文采用卡諾瓦-漢森檢驗[18]來判斷時間序列是否含確定性周期性。
假設(shè)時間序列不含確定性的周期性,利用卡方分布在90%的顯著性水平下檢驗上述統(tǒng)計量,即假設(shè)成立的可能值P≤0.1則拒絕原假設(shè),時間序列含確定性的周期性。
行業(yè)用戶用電量水平較高,而其中空調(diào)等降溫負荷已成為炎熱地區(qū)夏季負荷創(chuàng)新高的主要影響因素之一。由于電量受一周工作日效應(yīng)影響存在著短期周期性波動,而氣溫不具有短期內(nèi)的規(guī)律波動,因此為避免短期日電量周期變化的影響,計算行業(yè)負荷日電量與日均氣溫間的相鄰7 d均值序列相關(guān)性如下。
式中:、分別為日均氣溫和日電量的相鄰7 d均值序列;cov(·)為協(xié)方差;σ(?)為標準差。
取經(jīng)驗值r(aˉ,yˉ)>0.6時則認為行業(yè)負荷日電量受日均氣溫影響程度較大。
部分行業(yè)用戶的日電量在法定節(jié)假日等相比于平日具有較大差異。不同節(jié)假日假期受重視程度也不盡相同,因此對日電量的影響程度也不一樣。
假設(shè)正常情況下行業(yè)用戶工作日和休息日等兩種日類型的電量分別服從正態(tài)分布N(μ1,)和N(μ2,),即認為在一段時間內(nèi)電量在某一期望值附近隨機波動。以節(jié)假日所在前后各四周的非假期工作日或休息日的電量樣本分別對μ1、σ1和μ2、σ2進行估計。
判斷該用戶受節(jié)假日影響程度可通過基于第i個節(jié)假日所處日類型在正態(tài)分布N(μ,σ2)求取正常工作情況下降到該節(jié)假日電量的概率P為:
當P<0.1時,表明行業(yè)用戶受節(jié)假日影響程度較大。
針對不同特征耦合下的電量序列,在可參考數(shù)據(jù)量較少的情況下,對其直接預(yù)測難以達到較高精度。為此,本文提出一種二重分解模型,先利用基于回歸的季節(jié)趨勢分解方法(seasonal-trend decomposition procedure based on regression,STR)對行業(yè)用戶電量進行一次周期性分解,在此基礎(chǔ)上,對其余項再進行二次EEMD分解。結(jié)合周期分解和時頻域分解的二重分解能夠更加細致地對行業(yè)用戶用電特征的相關(guān)分量進行解耦預(yù)測。
傳統(tǒng)周期分解算法僅能將序列分解為趨勢項、固定的周期項和余項3部分分量,不能靈活處理行業(yè)用戶的差異化用電特征。而STR[19]是目前通用的周期性數(shù)據(jù)分解框架,能夠應(yīng)用于含復(fù)雜季節(jié)性的實際問題。它能在周期分解過程中引入數(shù)據(jù)的復(fù)雜周期性,適應(yīng)不同工作強度導(dǎo)致周期分量幅度存在差異的問題,同時還可以將協(xié)變量納入分解模型中,便于考慮氣溫等相關(guān)因素。
利用STR算法將行業(yè)客戶日電量時間序列y t分解為如下幾個可選的加法分量。
式中:L t為平滑趨勢項;S k(t),t為帶有星期索引的一個二維的季節(jié)項;vec(·)表示矩陣拉直運算;A t為反映氣溫影響分量;R t為余項。
由于STR分解框架的分量選擇過程需要人工干預(yù)判斷,而行業(yè)用戶數(shù)較多,若對每位用戶特征進行一一辨識則需要大量的人工干預(yù)過程,不利于在工程中應(yīng)用。因此,如表1所示,本文根據(jù)第1節(jié)的特征辨識結(jié)果決定式(3)中STR分解框架的分量數(shù)量,即周期性強則在分解框架中加入周期分量、氣溫相關(guān)性強則加入氣溫協(xié)變量,由此省去定制分解框架時的人工干預(yù)過程,實現(xiàn)用戶特征辨識和STR分解框架定制的批量處理,據(jù)此進行短期電量二重分解預(yù)測,有助于在工程上應(yīng)用。
表1 STR分解框架Tab.1 STR decomposition framework
STR基于如下約束假設(shè)。
1)R t∈N(0,);
2)L t平滑,Δ2L t∈N(0,),其中,Δ2為雙差分算子,Δ2L t=L t-2L t-1+L t-2;
3)每個周期內(nèi)的周期項總和為0;
4)每個周期項Sκ(t),t也隨時間平滑變化,因此每個周期內(nèi)的周期項有其中:
式中:m為周期長度;I m為m×m維的單位矩陣;1 m為m×m維的全一矩陣。
5)At具有時變但非周期性,A t=τt a t,其中τt為氣溫協(xié)變量a t的變系數(shù);
6)L t、Sκ(t),t、A t和R t間彼此獨立。
結(jié)合約束條件計算L t、Sκ(t),t、A t、y t的最大后驗估計可以得到:
式中:s、l、a、y分別為Sκ(t),t、L t、A t、y t的觀測值;Dtt、Dss和Dss分別為二維季節(jié)項分別沿時間、時間-季節(jié)和季節(jié)維度二階差分的矩陣;λtt、λst、λss、λl為與σR、σS、σL相關(guān)的待選系數(shù)參數(shù);D l為趨勢項二階差分矩陣。
進而將式(1)轉(zhuǎn)化為式(6)所示線性回歸模型。
其中
式中:為矩陣Sκ(t),t缺少最后一行的矩陣,并存在矩陣Q使得
在上述約束下基于余項最小目標利用最小二乘法優(yōu)化求解各分量值。
余項受其余諸多的不可知因素共同作用,表現(xiàn)出復(fù)雜的非線性隨機波動。EEMD能自適應(yīng)地將數(shù)據(jù)序列分解為有限個頻率下的本征模態(tài)分量(intrinsic mode fuctions,IMF),可以處理余項分量的復(fù)雜隨機性情況,且不容易出現(xiàn)模態(tài)混疊現(xiàn)象[20],利用EEMD對余項分量進行二次分解。EEMD分解步驟如下:
1)在余項原始序列上添加滿足正態(tài)分布的白噪聲n i(t)滿足:
2)對所得含噪聲的信號x i(t)分別進行常規(guī)經(jīng)驗?zāi)B(tài)分解,得到各自IMF和滿足:
3)重復(fù)上述步驟I次,每次加入不同幅值的白噪聲,將上述對應(yīng)的IMF進行集合平均運算,得到EEMD分解后最終的IMF滿足:
上述分解所得各分量特點各異,以單一模型預(yù)測各分量具有局限性,無法應(yīng)對不同分量的特點進行準確預(yù)測,應(yīng)采用不同預(yù)測方法與之相適應(yīng)。因此本文結(jié)合各分量特點選用LSTM、WLSSVM和CNN搭建組合預(yù)測模型來配合二重分解實現(xiàn)短期日電量的精準預(yù)測。
行業(yè)用戶日電量的趨勢分量描述了用戶長期的用電水平走勢,具有很強的歷史延續(xù)性,采用LSTM能夠處理長時間序列的長期依賴問題,對趨勢分量的歷史變化信息捕捉學(xué)習,進而預(yù)測未來動向[21]。
LSTM主要由記憶存儲單元狀態(tài)、遺忘門、輸入門以及輸出門構(gòu)成,該方法應(yīng)用較廣,具體過程本文不再贅述。
相比于其他分量,周期分量具有極強的規(guī)律性,且在一段時間內(nèi),周期分量具有相對穩(wěn)定性。圖1所示為某用戶2020年12月份周期分量示例。
圖1 周期分量預(yù)測示意Fig.1 Diagram of seasonalcomponent prediction
圖1顯示,用戶周期分量近4周波形較為相似,且幅值變化具有一定的趨勢性。因此,可結(jié)合周期分量長期的幅度走勢和短期內(nèi)的波形相似性對其進行預(yù)測。由此具體說明預(yù)測過程如下。
1)計算周期分量歷史值的上下包絡(luò)線;
2)結(jié)合LSTM預(yù)測包絡(luò)線未來兩周走勢;
3)對近4周周期分量曲線作K-Means聚類[22],提取近期典型周期分量,即藍虛線;
4)將聚類結(jié)果縮放至上下包絡(luò)線范圍內(nèi)作為下一周預(yù)測結(jié)果,如圖1藍虛線為聚類結(jié)果,將其縮放至與上下包絡(luò)線相切,即黃實線結(jié)果;
5)最后重復(fù)3)—4)滾動預(yù)測下下周的周期分量結(jié)果。
氣溫協(xié)變量A t與日均氣溫具有較強的協(xié)變性。對此,結(jié)合前一天值A(chǔ) i-1與日均氣溫a i的標準化數(shù)值,并基于WLSSVM[23]對A t進行預(yù)測,WLSSVM具體過程本文不再贅述。
對于余項各部分IMF的預(yù)測,低頻分量同樣具有較強的歷史延續(xù)性,采用LSTM進行預(yù)測;而其中的高頻分量,雖然仍具有較強的隨機波動性,但相較于原來的余項分量,其波動幅度大大減小,采用捕捉短期局部依賴關(guān)系的CNN算法結(jié)合近期數(shù)據(jù)進行預(yù)測[24],CNN具體過程本文不再贅述。
綜上,上述各分量的疊加值即為總?cè)针娏康念A(yù)測值。此外,預(yù)測節(jié)假日影響強相關(guān)的用戶的假期電量,將預(yù)測值作為正常情況下的期望值,然后計算節(jié)假日當天用戶電量在非假期出現(xiàn)的概率,結(jié)合兩者可在疊加值基礎(chǔ)上對節(jié)假日期間的預(yù)測值進行調(diào)整,具體為:
1)將節(jié)假日電量預(yù)測疊加值為歸一化μe,結(jié)合1.3節(jié)σ1或σ2構(gòu)成正態(tài)分布N(μe,);
2)計算在標準正態(tài)分布條件下滿足P(y′≤)=P的值;
3)對節(jié)假日電量預(yù)測疊加值調(diào)整,即
式中:ysol為節(jié)假日電量預(yù)測調(diào)整值;y′sol為節(jié)假日電量預(yù)測值;Iun(·)為反歸一化函數(shù)。
本文采用某市10位行業(yè)用戶2019年12月1日—2021年2月1日的日電量數(shù)據(jù)集作為算例驗證本文方法的實用性。
4.1.1 七日周期性
七日周期性檢驗結(jié)果如表2所示。
表2 七日周期性檢驗結(jié)果Tab.2 Result of seasonaltest with a seven-day-cycle
由表2可知,在90%的顯著性水平下(即P<0.1),用戶1、3、5、7、8、9具有平穩(wěn)的周期性。4.1.2 氣溫相關(guān)性
表3顯示,用戶1、5、6、9、10的相關(guān)系數(shù)大于0.6,其日電量與氣溫具有較強的相關(guān)性。
表3 氣溫相關(guān)性檢驗結(jié)果Tab.3 Temperature correlation test result
4.1.3 節(jié)假日影響
各用戶節(jié)假日影響檢驗結(jié)果如表4所示。
表4 節(jié)假日影響檢驗結(jié)果Tab.4 Impact of festivalfactors result
表4可見,不同用戶在不同節(jié)假日的工作調(diào)休安排差異較大,部分用戶在節(jié)假日仍正常生產(chǎn)經(jīng)營。當預(yù)測受該節(jié)假日影響較大(P<0.1)的用戶電量時,在節(jié)假日電量上需對其進行3.5節(jié)所述的概率調(diào)整,降低節(jié)假日電量預(yù)測誤差。
綜上,10位用戶的特征辨識結(jié)果如表5所示。
表5 特征辨識結(jié)果Tab.5 Characteristics identification result
依據(jù)上述用戶特征辨識結(jié)果,在STR分解框架中選擇對應(yīng)的分量。其中,以用戶1為例,由于其具有周期性、氣溫相關(guān)性,故對其2020年1月1日—2021年1月18日的電量分解得到4個分量,繪制結(jié)果如圖2(a)所示,再對余項進行EEMD分解如圖2(b)所示。預(yù)測2021年1月19日至2月1日共計兩周電量,各分量預(yù)測及其疊加結(jié)果如圖2所示。圖2(a)顯示,用戶趨勢分量呈“先降后升”狀,實際上2020年受疫情影響,前半年企業(yè)經(jīng)營狀態(tài)不佳,分解所得趨勢分量能夠反映用戶的實際生產(chǎn)狀況;周期分量幅度與一般周期分解結(jié)果不同,呈現(xiàn)“中間大兩頭小”狀,能夠反映一般企業(yè)年中生產(chǎn)較為活躍的情況;而氣溫協(xié)變量大致為“鐘形”曲線,反映氣溫變化對用戶空調(diào)等負荷的長期影響走勢。綜上,STR分解所得分量均具有現(xiàn)實物理意義,能夠真實地反映用戶在短時周期性、氣溫相關(guān)性等方面的實際用電行為變化。
圖2 用戶1電量分解及預(yù)測結(jié)果Fig.2 Electricity demand decomposition and prediction results of User 1
進一步地,為體現(xiàn)STR對不同特征用戶的處理差異,繪制用戶7在2020年1月1日—2021年1月18日的電量分解及預(yù)測結(jié)果如圖3所示。
根據(jù)表5可知,用戶7的日電量與用戶1相比不具有氣溫相關(guān)性,因而在STR分解框架中去除氣溫協(xié)變量,僅分解得到其余3個分量,如圖3所示,體現(xiàn)了STR對不同行業(yè)用戶電量分解的差異化處理。
圖3 用戶7電量STR分解結(jié)果Fig.3 Electricity demand decomposition and prediction resultsof User 7
由于不同行業(yè)用戶電量數(shù)量級有所差異,因此若采用有量綱評價指標難以直接反映預(yù)測精度。為評價本文方法預(yù)測結(jié)果的精度,采用標準化絕對平均誤差(normalized mean absolute error,NMAE)和標準化相對平均誤差(normalized mean absolute percentage error,NMAPE)兩項指標[25]對預(yù)測結(jié)果與實際數(shù)據(jù)值進行誤差估計。
式中:ytrue為真實電量值;ypred為預(yù)測電量值;ymax為電量序列最大值;n為統(tǒng)計天數(shù)。
計算本文所提方法預(yù)測誤差結(jié)果如表6所示。
表6 本文方法預(yù)測誤差Tab.6 Prediction error of the method of this paper
表6可見,除用戶2預(yù)測誤差較大外(實際上用戶2日電量不具有周期性和氣溫相關(guān)性,因而STR分解過程僅有趨勢項和余項,并不能體現(xiàn)STR的優(yōu)勢),本文方法的NMAE在0.6%~3%之間,平均為2.06%,NMAPE在0.8%~4%之間,平均為2.75%,說明具有較高的預(yù)測精度和普適性。
為突出本文方法的優(yōu)越性,將其與LSTM預(yù)測、經(jīng)典季節(jié)分解法與LSTM組合預(yù)測、EEMD與LSTM組合預(yù)測、STR與LSTM組合預(yù)測等方法對比,以用戶1為例展示上述各方法預(yù)測結(jié)果如圖4所示,可見本文方法預(yù)測值更為貼近真實值。進一步地,計算各方法對10位用戶的預(yù)測結(jié)果平均誤差如表7所示。
圖4 不同方法預(yù)測結(jié)果Fig.4 Prediction results of different methods
表7 不同方法預(yù)測誤差Tab.7 Prediction errors of different methods
表7可見,相比于LSTM及其與經(jīng)典季節(jié)分解或EEMD的組合,采用STR根據(jù)用戶特征構(gòu)造分解框架的預(yù)測準確度更高,同時對比STR+LSTM與本文方法預(yù)測誤差可得,基于所得分量的特性選擇LSTM/WLSSVM/CNN進行組合預(yù)測效果更優(yōu)。
進一步地,在節(jié)假日如元旦電量預(yù)測上,對受元旦影響程度較大的用戶預(yù)測其元旦后兩周(含元旦)電量時,以用戶1為例,元旦3 d的原預(yù)測結(jié)果與基于表3所對應(yīng)的概率P(y≤y i)調(diào)整后的預(yù)測結(jié)果對比如圖5所示。
圖5 元旦假期預(yù)測結(jié)果Fig.5 Prediction results of New Year's Day
進一步地,整理受元旦影響程度較大的用戶預(yù)測結(jié)果誤差如表8所示。對比表8調(diào)整前后的誤差可見,本文的調(diào)整方法大幅降低了預(yù)測誤差,明顯提高了預(yù)測精度。由于部分用戶節(jié)假日電量的規(guī)律并不明顯,甚至與往年情況相去甚遠,對于此類用戶本文方法表現(xiàn)出不適應(yīng)之處。但是,對于規(guī)律性較強的用戶(如用戶1、7),本文預(yù)測精度能達到較為理想的效果。
表8 元旦期間電量預(yù)測誤差Tab.8 Prediction error of power consumption in New Year's Day
針對不同行業(yè)用戶具有不同用電特征的問題,本文通過辨識用戶特征省去定制STR分解框架時的人工干預(yù)判斷過程,并依據(jù)其用電特征對用戶電量進行二重分解,得到與用電特征相關(guān)的分量,結(jié)合分量特征選用適當智能算法進行組合預(yù)測。
本文方法所采用的STR相比于傳統(tǒng)的周期分解法分解得到的分量數(shù)量是不定的,能夠依據(jù)用戶實際的用電特征選擇加入與之相關(guān)的分量,靈活性更強;能夠批量根據(jù)用戶特征定制STR周期分解框架,省去人工干預(yù)過程,便于工程應(yīng)用;采用EEMD對STR分解余項進行二次分解,大大減小余項的波動幅度且特征更為明顯,綜合發(fā)揮了周期分解和時頻域分解的優(yōu)點,有助于提升預(yù)測精度;所用組合預(yù)測方法結(jié)合了各分量的特性,預(yù)測精度較單一預(yù)測模型更加理想。
在后續(xù)研究中,一方面將考慮對預(yù)測算法進行改進不斷提升預(yù)測精度;另一方面在對節(jié)假日預(yù)測量的調(diào)整精度仍一定程度上受用戶歷史相似性的影響,未來將對節(jié)假日電量預(yù)測深入建模。