張喬榆,蔡秋娜,劉思捷,閆斌杰,蘇炳洪,易江文,楊杉
(1.廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心,廣東 廣州510600;2.北京清能互聯(lián)科技有限公司,北京100080)
近年來,隨著我國電力市場的不斷發(fā)展和完善,短期負(fù)荷預(yù)測面臨著前所未有的挑戰(zhàn)[1-2]。節(jié)假日負(fù)荷由于受到外界氣象、自身特性和國家調(diào)休政策等諸多因素的影響,呈現(xiàn)出固有的不確定性和波動性[3],如何通過可行的策略和預(yù)測方法,挖掘各種相關(guān)因素與節(jié)假日負(fù)荷之間的內(nèi)在聯(lián)系,有效提高其預(yù)測精度,是當(dāng)前短期負(fù)荷預(yù)測的一個研究熱點(diǎn)。
負(fù)荷預(yù)測是通過大量的歷史樣本數(shù)據(jù)挖掘其內(nèi)在的變化規(guī)律,從而對其未來態(tài)進(jìn)行估計[4-5]。研究結(jié)果表明,節(jié)假日與工作日之間的負(fù)荷特性存在較大的差異性[6-8],因此在節(jié)假日負(fù)荷預(yù)測中,考慮工作日的樣本策略,未必對預(yù)測結(jié)果的精度起到積極的作用。在已有的節(jié)假日負(fù)荷預(yù)測研究中,往往只考慮節(jié)假日的歷史負(fù)荷數(shù)據(jù),但同類型節(jié)假日一年內(nèi)往往僅出現(xiàn)一次,即使是同一假期,其負(fù)荷特性也會隨著各年負(fù)荷水平的變化而變化[9],因此當(dāng)前節(jié)假日負(fù)荷預(yù)測樣本策略中容易出現(xiàn)有效樣本匱乏的情況。
已有的短期負(fù)荷預(yù)測研究成果主要集中在算法研究方面,傳統(tǒng)方法主要有回歸分析法、時間序列法、相似日法、指數(shù)平滑法、灰色預(yù)測法等[10-14]。針對傳統(tǒng)方法中預(yù)測精度不高的問題,國內(nèi)外相關(guān)專家和學(xué)者做了大量的研究工作,相繼提出了一系列新型方法,主要有卡爾曼濾波法[15]、維納濾波法[16]、BP網(wǎng)絡(luò)法[17-18]以及支持向量機(jī)(support vector machine,SVM)算法[19-21]。各種新型方法的提出不斷豐富了負(fù)荷預(yù)測研究工作;其中濾波算法只考慮負(fù)荷自身規(guī)律的變化趨勢,忽略了外界氣象等因素偏差對負(fù)荷的影響;BP網(wǎng)絡(luò)法雖然考慮氣象等因素,但也存在泛化能力不強(qiáng)、隱層數(shù)目難以確定等缺點(diǎn);因此這些方法的預(yù)測精度和實(shí)用性有待考證。相比而言,SVM是一種有監(jiān)督的學(xué)習(xí)模型,被廣泛用于模式識別、分類及回歸分析;且研究表明,應(yīng)用SVM進(jìn)行電力系統(tǒng)負(fù)荷預(yù)測,具有精度高、速度快等優(yōu)點(diǎn),對預(yù)測效果有較好的改善作用[19-21]。本文基于SVM算法,深入探討節(jié)假日負(fù)荷預(yù)測問題;然而SVM對樣本數(shù)據(jù)量的要求較高,需要大量的歷史樣本數(shù)據(jù)進(jìn)行訓(xùn)練,才能獲得較好的預(yù)測結(jié)果,而現(xiàn)有的節(jié)假日負(fù)荷預(yù)測樣本策略難以滿足要求。另外,已有的節(jié)假日負(fù)荷預(yù)測研究中一般只考慮氣象等敏感因素,極少涉及到負(fù)荷特性,因此如何有效挖掘節(jié)假日負(fù)荷自身的特征屬性也是提高其預(yù)測精度亟需解決的一個重要難點(diǎn)。
針對上述問題,本文重點(diǎn)研究非假期的休息日與節(jié)假日負(fù)荷特性的相似性,提出一種適用于節(jié)假日負(fù)荷預(yù)測的擴(kuò)展樣本策略,并深入探討所選樣本假期類型等特性的標(biāo)記方式,最后采用SVM方法對其進(jìn)行預(yù)測,以提高預(yù)測的準(zhǔn)確性。
我國法定節(jié)假日主要有元旦、春節(jié)、清明節(jié)、勞動節(jié)、端午節(jié)、中秋節(jié)和國慶節(jié),其中春節(jié)和國慶節(jié)假期一般有7天,其余假期為3天。節(jié)假日期間,由于社會生產(chǎn)和人們生活習(xí)慣極大不同,與正常的工作日和周休日相比,其負(fù)荷特性會表現(xiàn)出明顯不同。為了挖掘節(jié)假日負(fù)荷特性的一般性規(guī)律,本文抽取某省份2015—2018年的歷史節(jié)假日負(fù)荷數(shù)據(jù),進(jìn)行分析研究。以2016年歷史節(jié)假日負(fù)荷數(shù)據(jù)為例繪制負(fù)荷曲線,如圖1和2所示。
通過分析海量歷史數(shù)據(jù),發(fā)現(xiàn):
a)在法定節(jié)假日,負(fù)荷水平顯著降低;其中7天長假類型影響范圍較廣,尤其是春節(jié),波及范圍從臘月下旬開始至正月中旬之后;3天小長假類型影響范圍相對較小。
b)對于3天小長假來說,負(fù)荷往往在法定節(jié)假日當(dāng)天最低;對于國慶7天長假來說,負(fù)荷一般在前2天達(dá)到最低,而后5天則逐漸開始回升;對于春節(jié)7天長假來說,由于假期本身的特殊性,負(fù)荷持續(xù)較低,且比較平穩(wěn)。
圖1 3天小長假類型Fig.1 3-day small holiday types
圖2 7天長假類型Fig.2 7-day long holiday types
c)3天小長假期間,負(fù)荷變化趨勢與節(jié)日當(dāng)天在假期中所處的位置有極大關(guān)聯(lián)。若第1天為節(jié)日當(dāng)天,則當(dāng)日負(fù)荷最低,其后2天負(fù)荷逐步升高,節(jié)假日負(fù)荷呈現(xiàn)“/”型變化趨勢;若第2天為節(jié)日當(dāng)天,則第2天負(fù)荷最低,第1天、第3天相對較高,節(jié)假日負(fù)荷呈現(xiàn)“V”型變化趨勢;若第3天為節(jié)日當(dāng)天,則3天的負(fù)荷逐步降低,到第3天時負(fù)荷最低,節(jié)假日負(fù)荷呈現(xiàn)“”型變化趨勢。
通過對海量歷史負(fù)荷數(shù)據(jù)的分析可以發(fā)現(xiàn),由于在法定休息日大部分企業(yè)會停工、停產(chǎn)或降低生產(chǎn)強(qiáng)度,若不考慮節(jié)假日的影響,法定休息日的負(fù)荷水平較周一至周五的工作日要低,而且往往在周日達(dá)到最低。因此,非節(jié)假日的周六、周日、周一這3天的負(fù)荷往往也呈現(xiàn)出“V”型變化趨勢,與某類3天小長假的負(fù)荷特性有一定的相似性。
為了進(jìn)一步驗(yàn)證休息日與節(jié)假日負(fù)荷特性的相似性,以某省份2016年勞動節(jié)為例進(jìn)行分析。該節(jié)假日期間,法定假日剛好處于第2天,屬于典型的“V”型負(fù)荷變化趨勢,抽取該假期前后近1個月的休息日負(fù)荷數(shù)據(jù)進(jìn)行對比(如圖3—4所示)。
圖3 “V”型節(jié)假日與休息日的負(fù)荷曲線對比Fig.3 Comparison of load curves of “V” typed holidalies and weekends
圖4 “V”型節(jié)假日與休息日的日最高負(fù)荷值對比Fig.4 Comparison of the daily maximum load values of “V” typed holidaies and weekends
由圖3—4可以看出,與平常的休息日相比,除了法定節(jié)假日當(dāng)天,負(fù)荷減小幅度比較大之外,3天小長假和平常的休息日的負(fù)荷特性具有較大的相似度,表現(xiàn)如下:
a)3天內(nèi)負(fù)荷曲線的整體變化趨勢比較相似,均呈現(xiàn)為“V”型走向(如圖4);單獨(dú)對比第1天和第3天,負(fù)荷曲線的形狀也比較相似。
b)3天內(nèi)負(fù)荷最高峰基本都出現(xiàn)在第3天早晨時段,最低峰則出現(xiàn)在第2天與第3天的交界時段。
c)單獨(dú)分析每一天,基本都會出現(xiàn)1個早高峰,而低谷則發(fā)生在凌晨時段。
已有的節(jié)假日負(fù)荷預(yù)測方法中,預(yù)測樣本主要是參考往年的節(jié)假日負(fù)荷曲線,樣本數(shù)據(jù)缺乏嚴(yán)重影響了預(yù)測結(jié)果的精度;此外,智能算法在進(jìn)行模型訓(xùn)練時,需要大量樣本來對模型進(jìn)行訓(xùn)練,才能獲得較好的預(yù)測結(jié)果;因此現(xiàn)有的樣本策略難以滿足智能算法的需求。
基于節(jié)假日與平常休息日的負(fù)荷特性較高的相似性,本文提出一種適用于節(jié)假日負(fù)荷預(yù)測的擴(kuò)展樣本策略,在進(jìn)行樣本選擇時,不僅考慮了往年歷史節(jié)假日的負(fù)荷數(shù)據(jù),還參考了待預(yù)測節(jié)假日近幾年非節(jié)假日的周六、周日以及周一的歷史數(shù)據(jù),可有效提高基礎(chǔ)樣本的數(shù)據(jù)量,以滿足基于智能算法的預(yù)測方法的樣本需求。
由第1.1小節(jié)的分析結(jié)果可知,與正常工作日和周休日相比,節(jié)假日會呈現(xiàn)出特有的特征屬性,開展節(jié)假日特征屬性研究,有利于提高其負(fù)荷預(yù)測的可行性和準(zhǔn)確性。對此,針對負(fù)荷樣本的節(jié)假日特征屬性(包括節(jié)假日種類和負(fù)荷變化趨勢),探討其標(biāo)記方式,具體如下。
a) 元旦、春節(jié)、清明節(jié)、勞動節(jié)、端午節(jié)、中秋節(jié)、國慶節(jié)的節(jié)假日種類特征分別標(biāo)記為“1”“2”“3”“4”“5”“6”“7”,而非節(jié)假日的周六、周日、周一的節(jié)假日種類標(biāo)記為“0”。
b) 對于3天小長假類型,“/”型負(fù)荷變化趨勢特征分別標(biāo)記為“1”“2”“3”;“V”型負(fù)荷變化趨勢特征分別標(biāo)記為“3”“1”“2”; “”型負(fù)荷變化趨勢特征分別標(biāo)記為“3”“2”“1”。
c) 對于7天長假類型,分別標(biāo)記假期的負(fù)荷變化趨勢特征為“1”“2”“3”“4”“5”“6”“7”。
d) 對于非節(jié)假日的周六、周日、周一樣本數(shù)據(jù),其負(fù)荷變化趨勢特征則分別標(biāo)記為“3”“1”“2”。
2.2.1 相關(guān)因素矢量建立
研究表明,氣象信息和季節(jié)變化是影響節(jié)假日負(fù)荷波動的重要因素,綜合考慮氣象信息和季節(jié)變化等因素信息才能進(jìn)一步提高預(yù)測的精度。為此,本文基于上述所提的樣本特征標(biāo)記方式,并結(jié)合氣象信息和季節(jié)變化因素,提出一種基于節(jié)假日樣本特征標(biāo)記的相關(guān)因素矢量集合,如下:
X={x1,x2,x3,x4,x5,x6,x7}.
(1)
所構(gòu)建的相關(guān)因素矢量重點(diǎn)考慮了7個關(guān)鍵因素,分別對應(yīng)日最高溫度、日降水量、月份、前1天對應(yīng)時刻負(fù)荷、前2天對應(yīng)時刻負(fù)荷、節(jié)假日種類以及變化趨勢特征,涵蓋了氣象信息、季節(jié)變化、歷史負(fù)荷數(shù)據(jù)以及節(jié)假日特征等重要因素信息。
2.2.2 歸一化處理
在本文所提方法中,以上述所建的相關(guān)因素矢量為輸入變量,以待預(yù)測日的負(fù)荷為輸出變量。在預(yù)測過程中,為了方便處理不同數(shù)量級和不同量綱的輸入和輸出變量,進(jìn)行歸一化處理。本文采用max-min方法進(jìn)行歸一化處理,具體方法如下。
(2)
式中:xi和xi′分別為歸一化前后的變量(下標(biāo)i表示第i個相關(guān)矢量);X為歸一化前的輸入變量,表示由xi組成的集合;max(X)和min(X)分別為待歸一化變量的最大值和最小值。
SVM是基于統(tǒng)計學(xué)習(xí)理論中的Vapnik-Chervonekis(VC)維理論和結(jié)構(gòu)風(fēng)險最小化原理而發(fā)展起來的,其核心思想是通過內(nèi)積核函數(shù)定義的非線性變換,將輸入空間變換到1個高維空間,然后再在該高維空間內(nèi)建立輸入和輸出變量之間的線性關(guān)系函數(shù),以描述原空間里輸入和輸出的非線性關(guān)系?;驹頂⑹鋈缦拢?/p>
設(shè)訓(xùn)練樣本集S={(xi,yi),xi∈Rn,yi∈R,i=1,2,…,l},其中xi為n維的訓(xùn)練樣本輸入,yi為訓(xùn)練樣本輸出,l為樣本數(shù)。對于一般的非線性函數(shù)回歸問題,SVM常用式(3)來擬合估計:
f(x)=ωφ(x)+b.
(3)
式中:φ(x)為從輸入空間到高維特征空間的非線性映射;ω為權(quán)值矢量;b為偏置。根據(jù)Vapnik的結(jié)構(gòu)風(fēng)險最小化原理,函數(shù)估計問題就是尋找使風(fēng)險函數(shù)式(3)最小的f(x),即
(4)
式中:C為正規(guī)化參數(shù);R為經(jīng)驗(yàn)風(fēng)險。
標(biāo)準(zhǔn)SVM一般選用不敏感損失函數(shù)ε作為風(fēng)險函數(shù),即假設(shè)所有訓(xùn)練數(shù)據(jù)在精度ε下用線性函數(shù)擬合,這樣函數(shù)估計問題則可轉(zhuǎn)化為求最小化的優(yōu)化問題,即
(5)
式中:ξ、ξ*為松弛因子。第1項(xiàng)可使擬合函數(shù)更為平坦,從而提高泛化能力;第2項(xiàng)為減小誤差;常數(shù)C>0表示對超出誤差ε的樣本的懲罰程度。由此可見這是一個凸二次優(yōu)化問題,對此可通過引入Lagrange函數(shù)對ω和b進(jìn)行求解,即可求得線性擬合函數(shù)
(6)
進(jìn)一步利用核函數(shù)的方法,令
K(x,xi)=ωTω.
(7)
要求解的非線性擬合函數(shù)可進(jìn)一步表示為
(8)
(9)
式中σ2為高斯函數(shù)的方差。
綜上所述,所對應(yīng)的SVM優(yōu)化模型如下:
(10)
以上述介紹的SVM為主要工具,并基于樣本擴(kuò)展和特征標(biāo)記的研究成果,提出一種適用于節(jié)假日負(fù)荷的預(yù)測方法,整體計算流程如圖5所示。所提方法的樣本策略在傳統(tǒng)方法的基礎(chǔ)上加入了與節(jié)假日負(fù)荷特性有相似性的休息日作為樣本,以滿足SVM對訓(xùn)練樣本數(shù)量的要求;此外,通過分析節(jié)假日負(fù)荷特性,提取節(jié)假日屬性作為樣本特征,并建立基于特征標(biāo)記的相關(guān)因素矢量;最后以所建立的相關(guān)因素矢量為輸入矢量,以待預(yù)測日的負(fù)荷為輸出,并應(yīng)用智能算法SVM進(jìn)行訓(xùn)練和預(yù)測,從而實(shí)現(xiàn)對節(jié)假日負(fù)荷的準(zhǔn)確預(yù)測。
在本文所提方法中,分別對待預(yù)測日每一時刻的負(fù)荷單獨(dú)進(jìn)行預(yù)測,即在預(yù)測待預(yù)測日t時刻的負(fù)荷時,只采用該時刻點(diǎn)的負(fù)荷和氣象數(shù)據(jù)。本文方法的計算過程具體如下。
a)收集研究對象負(fù)荷以及氣象等歷史數(shù)據(jù)。設(shè)定基準(zhǔn)日為待預(yù)測日的前2天,則收集的歷史樣本集合為基準(zhǔn)日(包含)前2年的樣本數(shù)據(jù)。
b)組建樣本擴(kuò)展集合。從歷史樣本集合中挑選節(jié)假日及休息日對應(yīng)的樣本,組成樣本擴(kuò)展集合以進(jìn)行模型訓(xùn)練。
c)構(gòu)建樣本擴(kuò)展集合的相關(guān)因素矢量集合X和標(biāo)簽。首先對樣本擴(kuò)展集合中每個樣本進(jìn)行特征提取和標(biāo)記,并構(gòu)建其對應(yīng)的相關(guān)因素矢量和標(biāo)簽,其中相關(guān)因素矢量涵蓋了7個關(guān)鍵因素特征,標(biāo)簽則為待預(yù)測時刻負(fù)荷;然后對其進(jìn)行預(yù)處理,歸一化至[0,1]區(qū)間內(nèi),以構(gòu)建樣本擴(kuò)展集合相關(guān)因素矢量和標(biāo)簽的歸一化形式。
e)預(yù)測待預(yù)測時刻的負(fù)荷。首先,構(gòu)建并歸一化待預(yù)測時刻對應(yīng)的X,并輸入到已訓(xùn)練好的SVM模型中,從而得到對應(yīng)時刻負(fù)荷的預(yù)測結(jié)果;然后對預(yù)測結(jié)果進(jìn)行反歸一化處理,得到最終的負(fù)荷預(yù)測結(jié)果。
f)對預(yù)測結(jié)果進(jìn)行評價分析。針對最終的負(fù)荷預(yù)測曲線,比對實(shí)際負(fù)荷數(shù)據(jù),采用平均絕對百分誤差(mean absolute percentage error,MAPE)指標(biāo)評價本文所提方法的預(yù)測效果。
圖5 所提方法的整體計算流程Fig.5 Overall calculation flow chart of the proposed method
以某省份的全網(wǎng)負(fù)荷為研究對象,分別對其2018年元旦、春節(jié)、清明節(jié)、勞動節(jié)及端午節(jié)5個節(jié)假日負(fù)荷進(jìn)行模擬預(yù)測。當(dāng)對每一個節(jié)假日負(fù)荷進(jìn)行預(yù)測時,訓(xùn)練的樣本擴(kuò)展集合包括待預(yù)測日前2年的休息日及節(jié)假日的歷史數(shù)據(jù),因此本算例中收集了該省份2016年元旦至2018年端午節(jié)的負(fù)荷及氣象數(shù)據(jù),形成歷史數(shù)據(jù)庫,其中每天數(shù)據(jù)采集時間間隔為15 min(即每天96個點(diǎn))。
為了驗(yàn)證本文所提方法的有效性,選取一種傳統(tǒng)的節(jié)假日負(fù)荷預(yù)測方法—倍比平滑法,進(jìn)行預(yù)測效果對比。同時,為了便于進(jìn)行對比分析,選取一種常用的評價指標(biāo)MAPE,其計算公式如下:
(11)
式中:Yt為待預(yù)測日t時刻的預(yù)測負(fù)荷;yt為t時刻的實(shí)際負(fù)荷值;T=96,為每天預(yù)測的時刻點(diǎn)數(shù)。
分別應(yīng)用本文方法和倍比平滑法對2018年元旦、春節(jié)、清明節(jié)、勞動節(jié)、端午節(jié)的日負(fù)荷曲線進(jìn)行模擬預(yù)測,預(yù)測結(jié)果如圖6至圖11以及表1所示(本文只展示清明和端午假期的預(yù)測效果)。
圖6 清明假期第1天(2018-04-05)Fig.6 The first day of Qingming Festival(2018-04-05)
圖7 清明假期第2天(2018-04-06)Fig.7 The second day of Qingming Festival(2018-04-06)
圖8 清明假期第3天(2018-04-07)Fig.8 The third day of Qingming Festival(2018-04-06)
由圖6至圖8可以看出,與實(shí)際負(fù)荷曲線相比,倍比平滑法的預(yù)測結(jié)果偏差很大,而本文方法則相對較小。這主要是因?yàn)閭鹘y(tǒng)負(fù)荷預(yù)測方法中,忽略了負(fù)荷樣本的節(jié)假日屬性特征中的變化趨勢特征。2017年中清明節(jié)處于假期的第3天,而2018年時卻為假期的第1天,倍比平滑法在進(jìn)行負(fù)荷預(yù)測時,采取了假期順序?qū)?yīng)方式,即預(yù)測第1天負(fù)荷時僅以往年同類假期第1天作為同類型日,因節(jié)假日變化趨勢的不同必然導(dǎo)致較差的預(yù)測效果。相反地,本文所提方法通過標(biāo)記節(jié)假日的變化趨勢特征,并將其作為訓(xùn)練特征輸入到SVM模型中,因而具有較高的預(yù)測精度。
圖9 端午假期第1天(2018-06-16)Fig.9 The first day of Dragon Boat Festival(2018-06-16)
圖10 端午假期第2天(2018-06-17)Fig.10 The second day of Dragon Boat Festival(2018-06-17)
圖11 端午假期第3天(2018-06-18)Fig.11 The third day of Dragon Boat Festival(2018-06-18)
對比分析圖9至圖11可以看出,端午假期第1天,2種方法的預(yù)測準(zhǔn)確率都較高;對于假期其余2天,倍比平滑法預(yù)測效果較差,特別是每一天的凌晨和晚上時段,本文方法具有更好的預(yù)測效果。
表1為2種方法的預(yù)測誤差結(jié)果對比,其中每個假期的預(yù)測誤差為整個假期的平均誤差,如元旦的預(yù)測誤差為元旦3天假期的預(yù)測誤差平均值。由表1可以看出,對于2018年5個假期,倍比平滑法的預(yù)測誤差平均值高達(dá)10.790%,而本文所提方法僅為4.798%;從精度數(shù)量級別來看,本文方法提升了1倍多,效果顯著;單獨(dú)對比同一節(jié)假日,本文方法的預(yù)測誤差均遠(yuǎn)小于倍比平滑法。此外,縱向?qū)Ρ雀鞴?jié)假日預(yù)測誤差,可以發(fā)現(xiàn)倍比平滑法在元旦和清明假期的預(yù)測誤差較大,均超過15%;相比而言,本文所提方法的預(yù)測誤差較為平均,沒有較大波動,具有更好的穩(wěn)定性。由此可知,本文所提方法更為合理有效。
表1 預(yù)測誤差對比Tab.1 Comparison of forecasting errors %
本文針對現(xiàn)有的節(jié)假日負(fù)荷預(yù)測精度不高的問題,提出一種基于樣本擴(kuò)展和特征標(biāo)記的預(yù)測方法。首先基于對休息日與節(jié)假日負(fù)荷特性的相似性分析,在傳統(tǒng)樣本策略的基礎(chǔ)上擴(kuò)展考慮了休息日,以解決傳統(tǒng)方法中樣本匱乏問題;其次,基于對節(jié)假日負(fù)荷特性的分析,提煉其特征屬性(節(jié)假日種類和負(fù)荷變化趨勢),并結(jié)合氣象等敏感因素建立相關(guān)因素矢量;最后,以某省份全網(wǎng)負(fù)荷為研究對象進(jìn)行模擬預(yù)測,結(jié)果驗(yàn)證了所提方法的準(zhǔn)確性和有效性。