孫旺青,劉曉峰,何沁蔓
(南京師范大學(xué) 南瑞電氣與自動(dòng)化學(xué)院,南京 210023)
近年來,我國(guó)電力事業(yè)快速發(fā)展,對(duì)電力系統(tǒng)的決策與規(guī)劃的要求不斷提高。作為電力系統(tǒng)的基礎(chǔ)環(huán)節(jié),提高售電量預(yù)測(cè)精度對(duì)電力系統(tǒng)平穩(wěn)運(yùn)行有著重要意義[1]:一方面,準(zhǔn)確的售電量預(yù)測(cè)可以幫助電力企業(yè)合理規(guī)劃發(fā)展計(jì)劃、優(yōu)化網(wǎng)絡(luò)布局并提高電力系統(tǒng)運(yùn)行的安全性;另一方面,售電量直接反映了地區(qū)經(jīng)濟(jì)發(fā)展水平,準(zhǔn)確的預(yù)測(cè)結(jié)果可以為當(dāng)?shù)卣峁﹨⒖迹M(jìn)而制定相應(yīng)的政策適應(yīng)地區(qū)發(fā)展。
為了深層挖掘用電量的變化規(guī)律,提高電力預(yù)測(cè)精度,精細(xì)化區(qū)分用電負(fù)荷是一個(gè)研究重點(diǎn)。文獻(xiàn)[2]從電力市場(chǎng)的角度出發(fā),分析了紡織業(yè)的容量變化特征及業(yè)擴(kuò)報(bào)裝容量特征,根據(jù)影響紡織業(yè)變化的各項(xiàng)指標(biāo)完成了對(duì)紡織業(yè)用電量的預(yù)測(cè),但是該預(yù)測(cè)方法對(duì)預(yù)測(cè)對(duì)象的概率信息的準(zhǔn)確度有較高要求,難以大面積推廣。而文獻(xiàn)[3]在預(yù)測(cè)過程中,使用的歷史數(shù)據(jù)跨度為24 年,對(duì)于早期歷史數(shù)據(jù)的有效性未作分析。文獻(xiàn)[4]對(duì)陜西售電公司的海量數(shù)據(jù)進(jìn)行分析,建立了一套統(tǒng)計(jì)各行業(yè)同期售電量數(shù)據(jù)的方法,對(duì)各行業(yè)的同期售電量進(jìn)行預(yù)測(cè),但是該方法對(duì)行業(yè)劃分過于細(xì)致,不同行業(yè)之間存在交集,因此分類方法的針對(duì)性較低。文獻(xiàn)[5]結(jié)合不同行業(yè)的用電特性,對(duì)日負(fù)荷曲線進(jìn)行建模,提出了分級(jí)預(yù)測(cè)的方法,可以對(duì)居民、商業(yè)、市政、文娛等行業(yè)完成精準(zhǔn)預(yù)測(cè)。
對(duì)大量歷史數(shù)據(jù)進(jìn)行分析處理,合理確定預(yù)測(cè)對(duì)象的影響因素可以顯著提高預(yù)測(cè)精度[6—7]。文獻(xiàn)[8]提出一種基于相似日的新型熱氣候指數(shù)矩陣與涵蓋多特征因素的最大信息系數(shù)熱環(huán)境評(píng)估方法,其中特征因素包括氣象、地理區(qū)位等,有效提高了負(fù)荷預(yù)測(cè)的精度。文獻(xiàn)[9]以海量數(shù)據(jù)為基礎(chǔ),提出一種并行局部加權(quán)線性回歸模型,對(duì)大量數(shù)據(jù)進(jìn)行處理,以15 min 為周期,考慮了各周期內(nèi)最高溫度與最低溫度,該模型運(yùn)算時(shí)間短,精度符合預(yù)測(cè)要求。文獻(xiàn)[10]采用動(dòng)態(tài)權(quán)值優(yōu)化,增強(qiáng)了相似日選取算法的適應(yīng)性和有效性,在選取相似日時(shí),充分考慮了環(huán)境因素,如溫度、濕度、降雨量,最后結(jié)合灰色模型完成了短期預(yù)測(cè)。文獻(xiàn)[11]結(jié)合經(jīng)驗(yàn)?zāi)B(tài)分解與特征相關(guān)分析,量化分解后的負(fù)荷分量和特征信息之間的相關(guān)性時(shí),考慮了天氣因素及電價(jià)變動(dòng)對(duì)負(fù)荷量的影響,最后運(yùn)用最小二乘支持向量機(jī)模型完成預(yù)測(cè)。文獻(xiàn)[12]重點(diǎn)分析了重大事件因素對(duì)售電量預(yù)測(cè)的影響,包括異常高溫、政治事件和超強(qiáng)臺(tái)風(fēng),這些因素使實(shí)際售電量嚴(yán)重偏離預(yù)測(cè)曲線,但文中所提解決方法較為繁瑣,需要根據(jù)不同事件逐個(gè)完成修正。
現(xiàn)有研究主要有如下一些不足:①由于售電對(duì)象包含各類用戶,不同類別用戶的用電規(guī)律都有所不同[13],因此有必要對(duì)各類用戶合理分類后單獨(dú)完成預(yù)測(cè),上述關(guān)于行業(yè)預(yù)測(cè)電量的文獻(xiàn)[2]—文獻(xiàn)[6]大多采用回歸分析法,無法詳細(xì)描述各種影響電量的因素,且模型初始化難度大;②售電量容易受GDP、地區(qū)經(jīng)濟(jì)發(fā)展?fàn)顩r、人口和氣候等多種因素的影響[14],有必要對(duì)影響售電量的眾多因素做分析,上述分析電量影響因素的文獻(xiàn)[8]—文獻(xiàn)[12]以天氣因素為主,較為單一。
針對(duì)上述問題,本文提出歷史相似月和Elman神經(jīng)網(wǎng)絡(luò)相結(jié)合的月度售電量組合預(yù)測(cè)算法,并通過灰色關(guān)聯(lián)度分析法[15]量化每個(gè)影響因素對(duì)預(yù)測(cè)結(jié)果的影響,對(duì)各類用戶的售電量進(jìn)行分類預(yù)測(cè),挖掘不同用戶的售電規(guī)律,最后利用MATLAB軟件對(duì)某公司的歷史售電數(shù)據(jù)進(jìn)行分析并完成預(yù)測(cè),驗(yàn)證本文所提出的組合預(yù)測(cè)方法的有效性。預(yù)測(cè)流程如圖1所示。
圖1 預(yù)測(cè)流程Fig.1 Prediction flow
歷史樣本和待預(yù)測(cè)月份之間各類信息的相關(guān)程度直接影響了預(yù)測(cè)結(jié)果的準(zhǔn)確度,因此本文在相似日的基礎(chǔ)上提出了相似月的概念。選取相似日時(shí),由于時(shí)間跨度短,影響因素一般為氣溫、星期類型和節(jié)假日因素[16],用戶數(shù)量視為不變。但在選取相似月時(shí),隨著時(shí)間跨度的增加,用戶數(shù)量的變化對(duì)售電量的影響也無法忽略。此外,由于不同月份之間時(shí)間跨度較大,氣溫的變化程度也更大,且不同類別的用戶對(duì)氣溫的敏感程度不同,因此各類用戶受氣溫變化的影響需要分類討論。綜上,本文將相似月影響因素定為氣溫-季節(jié)因素、日期差距因素、節(jié)假日因素、重大事件因素、售電對(duì)象數(shù)量5 個(gè)因素。依據(jù)這些因素得到月度售電量預(yù)測(cè)的相似度特征矩陣,用來表征歷史月與待預(yù)測(cè)月的相似程度,本文將相似度特征矩陣Η表示如下
式中:α為氣溫-季節(jié)因子;β為日期差因子;δ為節(jié)假日因子;θ為重大事件因子;ε為售電對(duì)象數(shù)量因子。
1.1.1 氣溫-季節(jié)因子
為了分析氣溫-季節(jié)類型對(duì)售電量造成的影響,需要通過氣溫-季節(jié)因子α來衡量歷史月和待預(yù)測(cè)月的相似程度。由于氣溫、季節(jié)因素對(duì)售電量的影響難以直接衡量,不同月份的氣溫、季節(jié)因素均有所不同,因此本文借助聚類的思想將月份分類。以農(nóng)業(yè)售電量為例,首先將每年各月份的農(nóng)業(yè)售電量完成歸一化處理,再求出每個(gè)月份的均值,最后通過K-means算法將各月份分為低售電量、中售電量、高售電量月份3組后,用0.3、0.5、0.7依次標(biāo)記作為氣溫-季節(jié)參數(shù)。該方法的具體流程如圖2所示。
圖2 氣溫-季節(jié)參數(shù)計(jì)算流程(以農(nóng)業(yè)售電量為例)Fig.2 Calculation process of temperature-seasonal parameters(take agriculture for example)
氣溫-季節(jié)因子α表示如下
1.1.2 日期差因子
隨著時(shí)間的推移,月度售電量會(huì)因?yàn)榻?jīng)濟(jì)的發(fā)展而呈上升趨勢(shì)。因此,如果樣本數(shù)據(jù)的日期與待預(yù)測(cè)月的日期差距過遠(yuǎn),那么樣本數(shù)據(jù)的參考價(jià)值將會(huì)大大減弱,所以本文引入了日期差因子β來衡量歷史月和待預(yù)測(cè)月之間日期的相似程度,日期差因子β表示如下
式中:fh和fp分別為歷史月和待預(yù)測(cè)月節(jié)假日信息。當(dāng)歷史月和待預(yù)測(cè)月包含同一個(gè)節(jié)假日時(shí),fh=fp,此時(shí)節(jié)假日因子δ=1,否則δ=0。
1.1.4 重大事件因子
各類用戶的購(gòu)電行為會(huì)因?yàn)橹卮笫录霈F(xiàn)波動(dòng),如持續(xù)高溫、持續(xù)低寒、各類持續(xù)性突發(fā)事件等都會(huì)讓該月的售電量高于或低于同期,因此需要通過重大事件因子θ來判斷歷史月與待預(yù)測(cè)月是否具有類似的重大事件,重大事件因子θ表示如下
式中:ch和cp分別為歷史月和待預(yù)測(cè)月的重大事件信息。當(dāng)歷史月和待預(yù)測(cè)月有相同的重大事件時(shí),cp=ch,此時(shí)重大事件因子θ=1,否則θ=0。
1.1.5 售電對(duì)象數(shù)量因子
售電總量與用戶的數(shù)量有著密切的關(guān)系。對(duì)于每一類用戶,采用售電對(duì)象數(shù)量因子ε來衡量這一相似性,售電對(duì)象數(shù)量因子ε表示如下
式中:μh和μp分別為歷史月和待預(yù)測(cè)月該類售電對(duì)象的數(shù)量。
由于相似度向量5 個(gè)因子存在數(shù)量級(jí)上的差距,為了平衡各因子之間的權(quán)重,有必要對(duì)各影響因子進(jìn)行歸一化處理,本文采用極值歸一化方法對(duì)各相似度因子進(jìn)行處理,即
由于相似度特征矩陣中的5個(gè)影響因子對(duì)月售電總量的影響程度各不相同,本文利用灰色關(guān)聯(lián)度分析法,計(jì)算各影響因子與售電量的關(guān)聯(lián)度,并將結(jié)果作為該影響因素的權(quán)重,關(guān)聯(lián)度越大則權(quán)重越大。此外,考慮到售電量在長(zhǎng)時(shí)間尺度上處于長(zhǎng)升的趨勢(shì),而影響因子中氣溫-季節(jié)因子、節(jié)假日因子和重大事件因子是處于以12 個(gè)月為周期的變化狀態(tài),本文在分析這3 個(gè)因子的關(guān)聯(lián)度時(shí),以12 個(gè)月為周期,分多次計(jì)算上述因子與售電量的關(guān)聯(lián)度后取均值作為最終的結(jié)果,灰色關(guān)聯(lián)度分析法具體過程如下:
式中:ρ為分辨系數(shù),ρ越小,分辨能力越大,此處取ρ=0.5。
根據(jù)式(16),可獲得相似度因子集合S=[s1,s2,…,sN],從集合S中選取出若干與待預(yù)測(cè)月份相似度最高的歷史月,即可作為待預(yù)測(cè)月的歷史相似月。
Elman 神經(jīng)網(wǎng)絡(luò)屬于動(dòng)態(tài)遞歸神經(jīng)網(wǎng)絡(luò),相比于BP神經(jīng)網(wǎng)絡(luò),Elman神經(jīng)網(wǎng)絡(luò)在隱含層增加一個(gè)承接層,通過存儲(chǔ)內(nèi)部狀態(tài)使其具備映射動(dòng)態(tài)特征功能,系統(tǒng)因此具有時(shí)變特性,增強(qiáng)了網(wǎng)絡(luò)的全局穩(wěn)定性,在計(jì)算能力及網(wǎng)絡(luò)穩(wěn)定性方面都比BP神經(jīng)網(wǎng)絡(luò)更勝一籌。Elman神經(jīng)網(wǎng)絡(luò)為4層結(jié)構(gòu),包括輸入層、隱含層、承接層和輸出層,其中承接層可以存儲(chǔ)隱含層的狀態(tài)信息,因此網(wǎng)絡(luò)處理動(dòng)態(tài)信息能力較優(yōu)。Elman 神經(jīng)網(wǎng)絡(luò)的輸入層、隱含層和輸出層表示形式分別如下
建立Elman神經(jīng)網(wǎng)絡(luò),其中網(wǎng)絡(luò)的輸入層共有5個(gè)節(jié)點(diǎn),輸入量為篩選出的目標(biāo)類別用戶歷史相似月的各參數(shù),包括氣溫-季節(jié)因子、日期差因子、節(jié)假日因子、重大事件因子和售電對(duì)象數(shù)量因子;輸出層有一個(gè)節(jié)點(diǎn),輸出的目標(biāo)值為目標(biāo)類別用戶當(dāng)月的預(yù)測(cè)電量;隱含層的節(jié)點(diǎn)數(shù)量難以直接獲得,因此本文針對(duì)不同種類的售電對(duì)象,用多組隱含層節(jié)點(diǎn)數(shù)量來測(cè)試網(wǎng)絡(luò)的精確性,對(duì)比測(cè)試結(jié)果,選取精度最高的隱含層節(jié)點(diǎn)數(shù)量,見3.1節(jié)。在Elman神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)過程中,歷史月的售電量數(shù)據(jù)作為目標(biāo)輸出值,網(wǎng)絡(luò)內(nèi)部完成權(quán)值的修正來提高訓(xùn)練精度。
為了驗(yàn)證本文提出的組合預(yù)測(cè)方法的準(zhǔn)確性和有效性,根據(jù)某省公司2016 年1 月至2019 年10月的數(shù)據(jù)作為樣本數(shù)據(jù),預(yù)測(cè)2019 年11 月和12 月的售電量數(shù)據(jù)。模型參數(shù)取值如下:衰減系數(shù)λ1=λ2=0.95,Y=12,N=46,分辨系數(shù)ρ=0.5。本算例采用的是Inteli5-8265U1.6GHz CPU 和8GB RAM的PC平臺(tái)進(jìn)行分析。
為了尋找合適的歷史數(shù)據(jù)作為Elman神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,以2019 年11 月的居民售電量的相似月為例。該類別的歷史相似月選取結(jié)果如表1所示。
表1 2019年11月的居民售電的相似月選取Table 1 Similar month choose of residential electricity sales of November 2019
Elman神經(jīng)網(wǎng)絡(luò)中隱含層節(jié)點(diǎn)數(shù)量沒有準(zhǔn)確的計(jì)算公式,依賴于經(jīng)驗(yàn),因此本文在預(yù)測(cè)時(shí),選取多組節(jié)點(diǎn)數(shù)量對(duì)比預(yù)測(cè)結(jié)果。以2019 年11 月居民售電量預(yù)測(cè)為例,圖3 給出了不同隱含層節(jié)點(diǎn)數(shù)時(shí)得到的不同的預(yù)測(cè)結(jié)果。從圖4 可以看出,當(dāng)隱含層節(jié)點(diǎn)數(shù)量為7時(shí),預(yù)測(cè)精度最高。所以2019年11月居民售電量預(yù)測(cè)時(shí)隱含層節(jié)點(diǎn)數(shù)取值為7,全部取值結(jié)果如表2所示。
表2 隱含層節(jié)點(diǎn)數(shù)Table 2 Number of hidden layer node個(gè)
圖3 隱含層節(jié)點(diǎn)數(shù)對(duì)預(yù)測(cè)結(jié)果的影響Fig.3 Effects of hidden layer node number on prediction results
圖4 兩種模型的誤差對(duì)比Fig.4 Error comparison between two models
將尋找到的相似度較高的月份信息作為訓(xùn)練樣本,選取各自的隱含層節(jié)點(diǎn)數(shù)后,分別完成對(duì)2019 年11 月和12 月各類用戶的售電量預(yù)測(cè),預(yù)測(cè)結(jié)果如表3 所示。從表3 可以看出,各類預(yù)測(cè)結(jié)果都有較高精確度,最大誤不超過3%,滿足工程應(yīng)用要求。
表3 預(yù)測(cè)結(jié)果Table 3 The predicted results MWh
為了驗(yàn)證本文提出的組合預(yù)測(cè)模型的實(shí)用性,圖4給出了不考慮相似月信息的單一Elman 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)誤差對(duì)比。從圖4 可以看出,組合預(yù)測(cè)模型在選取合適的訓(xùn)練集后,預(yù)測(cè)精度相比于單一的Elman神經(jīng)網(wǎng)絡(luò)有著顯著的提高。
對(duì)兩種模型的性能分析采用均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)來衡量,指標(biāo)表示如下
表4 模型誤差分析Table 4 Model error analysis
本文提出歷史相似月和Elman神經(jīng)網(wǎng)絡(luò)相結(jié)合的月度售電量組合預(yù)測(cè)算法,并通過灰色關(guān)聯(lián)度分析法量化每一個(gè)影響因素對(duì)預(yù)測(cè)結(jié)果的影響。歷史相似月模型可以在海量數(shù)據(jù)中快速提取出與預(yù)測(cè)對(duì)象具有相似條件的歷史數(shù)據(jù),大大提高預(yù)測(cè)精度。Elman 神經(jīng)網(wǎng)絡(luò)可以任意精度逼近任意函數(shù),降低了模型復(fù)雜程度。相比于BP 神經(jīng)網(wǎng)絡(luò),Elman神經(jīng)網(wǎng)絡(luò)具有動(dòng)態(tài)特性好、逼近速度快、精度高的優(yōu)點(diǎn)。結(jié)合這兩種方法得到組合預(yù)測(cè)模型具有以下優(yōu)點(diǎn):
(1)充分考慮地區(qū)經(jīng)濟(jì)狀況、人口和氣候等因素的影響,可以對(duì)影響月度售電量的眾多因素分析。
(2)對(duì)不同種類的用戶分類進(jìn)行了月度售電量預(yù)測(cè),充分考慮了不同用戶的售電規(guī)律。
本文提出的組合預(yù)測(cè)模型在收斂速度、預(yù)測(cè)精度等方面比單一預(yù)測(cè)模型都有較大提高,具有較強(qiáng)的實(shí)用價(jià)值。D