李知藝,丁劍鷹,吳 迪,文福拴
(1.浙江大學(xué) 電氣工程學(xué)院,浙江 杭州 310027;2.廣東省粵電集團有限公司,廣東 廣州 510630)
電力負荷預(yù)測,尤其是短期和超短期預(yù)測,是現(xiàn)代電力系統(tǒng)運行的基礎(chǔ),其預(yù)測精度對系統(tǒng)的安全經(jīng)濟運行具有重要影響[1]。其中,短期預(yù)測是對未來一日或幾日每個采樣點(每日等時間隔采樣24,48或96次)用電負荷的預(yù)測,因此也稱為日度預(yù)測[2]。超短期負荷預(yù)測是對當前時段往后一個或幾個時間點(每個時間點間隔5,10,15或30 min)用電負荷的預(yù)測,因此也稱為時分預(yù)測[2]。
為準確預(yù)測短期和超短期負荷,國內(nèi)外很多學(xué)者做了大量研究工作,提出了回歸分析法[3]、人工神經(jīng)元網(wǎng)絡(luò)法[4]、支持向量機法[5]、灰色模型法[6]等諸多方法。然而,這些方法都只能得到確定性的點預(yù)測結(jié)果,由于預(yù)測過程中存在的不確定因素,得到的預(yù)測結(jié)果一般都有不同程度的誤差。
隨著電力系統(tǒng)負荷特性趨于復(fù)雜,負荷預(yù)測難度隨之增加,而另一方面電力系統(tǒng)運行對負荷預(yù)測結(jié)果的準確性的要求不斷提高,傳統(tǒng)的點預(yù)測方法越來越難以滿足電力系統(tǒng)運行的實際需求。在此背景下,區(qū)間預(yù)測方法逐步受到重視。區(qū)間預(yù)測方法可以對由不確定性因素引起的預(yù)測結(jié)果變動范圍進行量化,實際負荷觀測值以一定期望概率落在區(qū)間上、下界確定的預(yù)測區(qū)間內(nèi),可用于電力系統(tǒng)短期和超短期負荷預(yù)測,得到合理的預(yù)測區(qū)間[7]。
現(xiàn)有的區(qū)間預(yù)測方法普遍存在計算復(fù)雜、假設(shè)性強、預(yù)測時間長等問題[8,9],因此有必要尋求更加簡單高效的方法來構(gòu)建預(yù)測區(qū)間。以電力系統(tǒng)短期和超短期負荷預(yù)測為應(yīng)用背景,本文對區(qū)間預(yù)測技術(shù)進行了新的探索,以極限學(xué)習(xí)機點預(yù)測模型為基礎(chǔ),提出了比例系數(shù)法,并用實際數(shù)據(jù)說明了該方法的預(yù)測性能。
極限學(xué)習(xí)機(Extreme Learning Machine)是單隱含層前向神經(jīng)網(wǎng)絡(luò)的一種學(xué)習(xí)算法,網(wǎng)絡(luò)結(jié)構(gòu)如附錄圖1所示(略)。該算法只需設(shè)定隱含層節(jié)點數(shù)以確定網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)的輸出權(quán)值能由隨機產(chǎn)生的隱含層節(jié)點學(xué)習(xí)參數(shù)直接解析確定而無需迭代調(diào)整,網(wǎng)絡(luò)訓(xùn)練速度極快。同時,該算法能保證在已有條件下網(wǎng)絡(luò)訓(xùn)練誤差最小且由解析獲得的輸出權(quán)值范數(shù)最小,因此具備比常規(guī)單隱含層神經(jīng)網(wǎng)絡(luò)更好的泛化能力[10]。
極限學(xué)習(xí)機算法的主要思想如下所述:
可以證明[12],如果隱含層節(jié)點個數(shù)l與訓(xùn)練樣本個數(shù)N相等,則任取隱含層節(jié)點的學(xué)習(xí)參數(shù)(下文簡稱學(xué)習(xí)參數(shù))aj∈ ?n,bj∈ ? (j=1,2,…,l),該網(wǎng)絡(luò)都能夠以零誤差逼近訓(xùn)練樣本,即此時有:
上述N個等式可以表示為如下矩陣形式:
式中:
當訓(xùn)練集樣本個數(shù)很大時,為了減少計算量,l通常取比N小的數(shù),在這種情況下,極限學(xué)習(xí)機算法在訓(xùn)練前隨機選擇學(xué)習(xí)參數(shù)aj∈?n,bj∈? (j=1,2,…,l)且在訓(xùn)練過程中保持不變。訓(xùn)練這個網(wǎng)絡(luò)等同于求解以β為變量的線性系統(tǒng)Hβ =T 的最小二乘解[13],即
其解為
式中:H+為隱含層輸出矩陣H的摩爾-彭洛斯(Moore-Penrose)廣義逆矩陣,可以通過正交投影法或奇異值分解法等方法[14]解析獲取。
和聲搜索(Harmony Search)算法是一種新興的具備全局搜索能力的智能優(yōu)化算法[15]。這種算法模擬了樂隊演奏時樂師們尋求美妙和聲狀態(tài)的過程,具有程序?qū)崿F(xiàn)簡單、求解速度快、尋優(yōu)能力強等優(yōu)點。對于一些工程優(yōu)化問題,其算法性能比一些常規(guī)智能優(yōu)化算法(如遺傳算法和模擬退火方法法)更加有效[16,17]。
和聲搜索算法包括下述特征參數(shù):a.和聲記憶庫規(guī)模(Harmony Memory Size),SHM,即和聲記憶庫(Harmony Memory)能存放的解向量數(shù)目,和聲記憶庫在迭代過程中保持與外部信息交換更新,保證庫內(nèi)存放解向量的多樣性和較優(yōu)性;b.和聲記憶庫內(nèi)取值率(Harmony Memory Considering Rate),RHM,其值決定迭代過程中和聲記憶庫內(nèi)搜索解向量的概率,較高的RHM值將保證待搜索的解向量能充分繼承庫內(nèi)較優(yōu)解的相應(yīng)信息;c.音調(diào)調(diào)節(jié)率(Pitch Adjusting Rate),PHM,和音調(diào)調(diào)節(jié)帶寬bHM,通過適當設(shè)置PHM和bHM可使解向量跳出局部最優(yōu)值,提高全局搜索能力;(4)創(chuàng)作次數(shù) (Number of Improvisations),NHM,即算法的最大迭代次數(shù),通常作為判定算法是否需要終止的條件參數(shù)。具體實現(xiàn)過程如下所述[18,19]:
STEP 1設(shè)置算法參數(shù)與初始化和聲記憶庫定義優(yōu)化問題的目標函數(shù)f(·)、解向量維數(shù)DHM及變量取值范圍,并設(shè)置算法的特征參數(shù),即SHM,RHM,PHM,bHM和 NHM。之后,在和聲記憶庫里隨機產(chǎn)生SHM個初始解z1,z2,…,zSHM并計算相應(yīng)目標函數(shù)值f(z1),f(z2),…,f(zSHM)。
STEP 2生成新的解向量
STEP 3評估新生成的解向量
對STEP 2生成的解向量進行評估,即將zNEW對應(yīng)的目標函數(shù)值f(zNew)與和聲記憶庫內(nèi)已有解向量的最劣目標函數(shù)值f(zWorst)進行比較,如果優(yōu)于f(zWorst),則將新生成的解向量存入記憶庫并替換出f(zWorst)對應(yīng)的解向量。
STEP 4判定是否滿足終止條件
重復(fù)STEP 2和STEP 3,直至迭代次數(shù)i達到NHM。同時,為提高該算法的全局尋優(yōu)能力和魯棒性,在迭代過程中對RHM和PHM進行自適應(yīng)取值,使得算法在迭代初期以較高概率搜索到相對較優(yōu)解,并能在迭代后期擴大搜索范圍,避免陷入局部最優(yōu)解。自適應(yīng)取值的數(shù)學(xué)表達式為[20]
區(qū)間覆蓋率 (Coverage Probability),χCP,是衡量預(yù)測區(qū)間質(zhì)量的最關(guān)鍵指標,其定義了實際觀測值(下文簡稱觀測值)落在由上下界包絡(luò)的預(yù)測區(qū)間內(nèi)的概率。χCP值越大表示有越多的觀測值被構(gòu)建的預(yù)測區(qū)間所覆蓋,反之亦然。在理想情況下,χCP=100%,此時所有的觀測值都位于預(yù)測區(qū)間內(nèi)。
通常,期望觀測值以不低于額定置信水平的一定概率p落在所構(gòu)建的預(yù)測區(qū)間內(nèi),即
式中:P(·)表示概率;L(xi)和U(xi)分別是由xi預(yù)測得到的預(yù)測區(qū)間下界和上界;ti為與xi對應(yīng)的觀測值;μ為額定置信水平,其與顯著性水平γ的關(guān)系為
根據(jù)伯努利大數(shù)定律,可以直接用預(yù)測區(qū)間覆蓋觀測值的頻率來表示χCP,其將依概率收斂于p,即
式中:N為預(yù)測樣本的個數(shù),ci為布爾量
為構(gòu)建有效的預(yù)測區(qū)間,χCP應(yīng)高于額定置信水平μ;如果χCP遠小于μ,則該預(yù)測區(qū)間視作無效區(qū)間,需重新構(gòu)建。
預(yù)測區(qū)間寬度是評估預(yù)測區(qū)間質(zhì)量的重要參考依據(jù)。如果區(qū)間足夠?qū)?,則很容易滿足χCP=100%的理想?yún)^(qū)間覆蓋率,然而這樣的區(qū)間過于保守,并不能給出關(guān)于待預(yù)測值不確定性的有效信息,使得區(qū)間預(yù)測的結(jié)果沒有實用價值[21]。為了更合理地評價預(yù)測區(qū)間,還需要度量區(qū)間寬度。定義平均寬度百分比 (Mean Width Percentage)指標χMWP如式(14):
該指標度量了每個待預(yù)測點的預(yù)測區(qū)間寬度占觀測值的平均百分比。需要指出,以相對寬度來度量預(yù)測區(qū)間往往比絕對寬度更具實用價值。在負荷預(yù)測問題中,用電高峰時的負荷往往難以準確預(yù)測,預(yù)測區(qū)間理應(yīng)較寬,而用電低谷時的預(yù)測準確度相對較高,預(yù)測區(qū)間相對較窄,因此以絕對寬度評估高峰和低谷負荷預(yù)測區(qū)間并不能準確反映預(yù)測區(qū)間的優(yōu)劣。預(yù)測區(qū)間寬度一般與觀測值大小呈正相關(guān),借助χMWP能對區(qū)間寬度做出更準確評價。在極端條件下,N個待預(yù)測點的預(yù)測區(qū)間上下界都相同,則預(yù)測區(qū)間寬度全都為零,此時區(qū)間預(yù)測退化為點預(yù)測,關(guān)于預(yù)測區(qū)間的評估指標就失去實際意義。本文嚴格區(qū)分點預(yù)測和區(qū)間預(yù)測,定義預(yù)測區(qū)間均需滿足xMWP≠0。
已有關(guān)于區(qū)間預(yù)測的研究普遍采用了χCP和類似 χMWP的指標[9,21~27],但僅靠這兩個指標并不能完全評估所構(gòu)建預(yù)測區(qū)間的優(yōu)劣。以圖1為例對此進行說明。子圖(a)和(b)為對同一待測數(shù)據(jù)集構(gòu)建預(yù)測區(qū)間的兩種不同情況,可以看出兩個區(qū)間的χCP和χMWP的值均相同,但未被預(yù)測區(qū)間覆蓋的兩個真實數(shù)據(jù)偏離預(yù)測區(qū)間上界(或下界)的程度不同,子圖(a)中兩點的偏離程度明顯大于圖(b)中兩點,故一般認為子圖(b)的預(yù)測區(qū)間要優(yōu)于子圖(a)。然而,現(xiàn)有的評估指標體系并不能將這兩個區(qū)間的優(yōu)劣做出評判,往往將兩個區(qū)間視為等效區(qū)間。這里引入一個新指標,即累積偏差(Accumulated Deviation),χAD,計算式為
式中:εi表示觀測值偏離預(yù)測區(qū)間上界(或下界)的程度,表示為
與χMWP類似,也采用相對偏離程度來確定χAD。在相同χCP和χMWP的條件下,χAD越小則預(yù)測區(qū)間質(zhì)量一般越高。
圖1 兩類預(yù)測區(qū)間比較示意圖Fig.1 Comparison between two kinds of prediction intervals
χCP,χMWP和χAD3個指標相互獨立,都只考慮了預(yù)測區(qū)間的某一性質(zhì),依據(jù)任何一個或兩個指標都不能對預(yù)測區(qū)間做出完全而準確的評估。理想的預(yù)測區(qū)間需要在滿足置信水平符合要求(χCP盡量大)的同時,區(qū)間寬度和未覆蓋點偏離程度盡量小(即 χMWP和 χAD盡量小)。然而,由 χCP,χMWP和χAD的定義可知,這3個指標實際上是相互沖突的:χCP越大,往往 χMWP越大;χMWP越小,往往χCP越小而χAD越大;χAD越小,往往χMWP越大。因此,需要綜合考慮這3個指標。這里提出能對預(yù)測區(qū)間進行量化評估的綜合指標,即預(yù)測區(qū)間滿意度指標 (Prediction Interval Satisfaction Index),χPISI,計算公式為
式中:λ,η和μ為χPISI的3個控制參數(shù),可以根據(jù)實際需要設(shè)定;λ和η分別為對χAD和χCP的懲罰系數(shù),μ為給定的置信水平。
如前所述,χCP是評判預(yù)測區(qū)間優(yōu)劣的最關(guān)鍵指標,一般而言在χCP不低于μ的情況下評估預(yù)測區(qū)間才有意義。實際上,χCP由有限樣本統(tǒng)計得到,其值可能會稍小于μ,此時同樣可以對相應(yīng)預(yù)測區(qū)間進行評估[25]。附錄圖2(略)描繪了χPISI關(guān)于 χCP的函數(shù) (1+e-η·(χCP-μ)) 隨 χCP不同取值的變化規(guī)律(圖中 η =50,μ =90%)。當 χCP高于 μ時,該函數(shù)走勢平緩并漸近趨于1,此時χPISI主要受χMWP和χAD影響;而當χCP低于μ時,函數(shù)值隨著χCP偏離μ而陡增,此時χCP對χPISI的計算起主導(dǎo)作用。
χPISI綜合考慮并有效結(jié)合了 χCP,χMWP和 χAD這3個指標,可以作為評判預(yù)測區(qū)間優(yōu)劣的指標。為使χPISI更具實際意義,這里定義:當χPISI的計算結(jié)果小于0時,χPISI值取0。因此,χPISI始終在[0,100%)范圍內(nèi)取值,χPISI值越大,可認為預(yù)測區(qū)間質(zhì)量越高。當χCP等于100%,χAD等于0%;當χMWP值趨近0%時,χPISI值趨近100%。對于χPISI值只能無限趨近而不能達到100%這一現(xiàn)象,可以解釋為在實際預(yù)測過程中更希望得到的預(yù)測結(jié)果是確定的準確值,而非可能出現(xiàn)的某個變動區(qū)間,用“不確定”的區(qū)間預(yù)測代替“確定”的點預(yù)測只是對某些不確定因素的“妥協(xié)”,因此區(qū)間預(yù)測的結(jié)果永遠不是最滿意(對應(yīng)χPISI=100%)的。
基于神經(jīng)網(wǎng)絡(luò)的 Bootstrap法[28]是目前應(yīng)用最廣泛的區(qū)間預(yù)測方法[21],其假設(shè)對預(yù)測模型集成后得到的點預(yù)測值(下文簡稱預(yù)測值)能以很小偏差(甚至無偏)估計真實回歸值(下文簡稱真實值),即觀測值的期望值,繼而以預(yù)測值為中心構(gòu)建對稱的預(yù)測區(qū)間,保證觀測值以不低于額定置信水平的概率落在此區(qū)間內(nèi)。此種假設(shè)下,預(yù)測值和預(yù)測區(qū)間如圖2(a)所示,預(yù)測值能以很小的偏差逼近真實值(甚至與真實值重合),構(gòu)建的預(yù)測區(qū)間近似于以真實值為中心對稱分布。
圖2 點預(yù)測值與預(yù)測區(qū)間示意圖Fig.2 Prediction point and prediction interval
理論上可以證明[29],以真實值為中心對稱的預(yù)測區(qū)間要較不對稱的預(yù)測區(qū)間更優(yōu)。實際上,真實值難以獲取,而由于數(shù)據(jù)噪聲及預(yù)測模型本身不確定性的影響,預(yù)測值很多情況下并不能作為真實值的無偏估計值。以極限學(xué)習(xí)機對短期(或超短期)負荷進行點預(yù)測為例,對此進行說明。一方面,在預(yù)測過程中選用的歷史負荷數(shù)據(jù)從SCADA系統(tǒng)獲取,而由于SCADA系統(tǒng)采集過程中的一些偏差會使所采集的負荷觀測值偏離真實值[1],因此極限學(xué)習(xí)機的輸入量和期望輸出量都能視為被數(shù)據(jù)噪聲污染的隨機變量,使得預(yù)測結(jié)果可信度降低。另一方面,極限學(xué)習(xí)機模型本身會對預(yù)測精度造成影響。預(yù)測過程中,往往難以確定最優(yōu)的特征輸入量、學(xué)習(xí)參數(shù)和網(wǎng)絡(luò)結(jié)構(gòu),而根據(jù)經(jīng)驗選取的特征輸入量和隱含層節(jié)點數(shù)及隨機選取的學(xué)習(xí)參數(shù)使得模型預(yù)測性能達不到要求。即使極限學(xué)習(xí)機能零偏差學(xué)習(xí)訓(xùn)練樣本,然而由于樣本數(shù)據(jù)有限,難以保證模型對所有待預(yù)測樣本均能適用,而且訓(xùn)練樣本中往往存在“尖峰”數(shù)據(jù),為平緩這些“尖峰”,極限學(xué)習(xí)機的輸出值都會有偏離真實值趨向,導(dǎo)致預(yù)測精度達不到要求。如果由預(yù)測值估計真實值有較大偏差,此時以預(yù)測值為對稱中心構(gòu)建的預(yù)測區(qū)間很難滿足要求,如圖2(b)。
通過對數(shù)據(jù)進行預(yù)處理(如替換異常值、非線性去噪等[30])和提高模型的預(yù)測精度和泛化能力[31],能使得預(yù)測值以更小的誤差估計真實值。然而,這些處理手段都需要靠經(jīng)驗選取或經(jīng)過反復(fù)試錯后找到,實際預(yù)測過程中往往難以將其全部實現(xiàn)。當預(yù)測值估計真實值的偏差不能忽略時,但是依然可以通過構(gòu)建如圖2(c)中的預(yù)測區(qū)間來抵消此偏差,此時區(qū)間并不再以預(yù)測值為中心對稱。
本文提出的方法將極限學(xué)習(xí)機(網(wǎng)絡(luò)模型如附錄圖3(略))對預(yù)測樣本(或稱預(yù)測集)的輸出值分別放大和縮小比例系數(shù)α和β得到的結(jié)果作為預(yù)測區(qū)間的上界和下界,故稱其為比例系數(shù)法。數(shù)學(xué)表達式為
式中:yi是極限學(xué)習(xí)機輸入量為xi的輸出值;U(xi)和L(xi)為對應(yīng)xi構(gòu)建的預(yù)測區(qū)間上界和下界;α和β為需要確定的兩個比例系數(shù)。
為獲得α和β并保證其能確定最優(yōu)的預(yù)測區(qū)間,假設(shè)比例系數(shù)在連續(xù)時間段內(nèi)的變化態(tài)勢是平滑的,α和β則近似于對近期歷史數(shù)據(jù)進行事后預(yù)測并評估后確定的最優(yōu)比例系數(shù)和(對應(yīng)的事后預(yù)測區(qū)間最優(yōu))。因此,α和β可以由式(19)確定:
基于以上思想,比例系數(shù)法將近期歷史數(shù)據(jù)構(gòu)成的另一個預(yù)測樣本(稱為驗證集),根據(jù)同一極限學(xué)習(xí)機的對應(yīng)輸出值類似式(18)構(gòu)建驗證集預(yù)測區(qū)間,并用驗證集觀測值對預(yù)測區(qū)間進行評估,比例系數(shù)αValid和βValid在指定范圍內(nèi)不斷調(diào)整,直至獲得χPISI值最高的預(yù)測區(qū)間,即求解如下優(yōu)化問題:
式中: χPISI,Valid為驗證集的 χPISI值,和分別為驗證集比例系數(shù)αValid和βValid的指定最小值、最大值。
考慮到價值函數(shù)即“100% - χPISI,Valid”的函數(shù)形態(tài)復(fù)雜性,本文采用和聲搜索算法對αValid和βValid進行尋優(yōu),最小價值函數(shù)對應(yīng)的和即為需要確定的比例系數(shù),根據(jù)式(18)對預(yù)測集構(gòu)建預(yù)測區(qū)間。
由于通過集成可以增加預(yù)測模型的穩(wěn)定性并且提高預(yù)測精度,比例系數(shù)法也引入了集成技術(shù)。這里首先給出兩個不同思路:
(1)將M個極限學(xué)習(xí)機對應(yīng)驗證集和預(yù)測集的輸出值取中位值,以期望獲得更精確的預(yù)測值y*(xi),即
式中:median{·}表示取中位數(shù)。
(2)驗證集根據(jù)要集成的第k個極限學(xué)習(xí)機對應(yīng)輸出值確定一組比例系數(shù)和,隨后預(yù)測集根據(jù)同個極限學(xué)習(xí)機對應(yīng)輸出值yk(xi)構(gòu)建一組區(qū)間上下界Uk(xi)和Lk(xi),即
最后對所得的M個區(qū)間進行集成,分別取區(qū)間上、下界的中位值作為最終預(yù)測區(qū)間上、下界U*(xi)和L*(xi),即
以上兩種思路均能反映比例系數(shù)法的主要思想,由于比例系數(shù)法本質(zhì)上不嚴格區(qū)分預(yù)測值偏離真實值的程度,而每組預(yù)測值均能對應(yīng)一個高質(zhì)量的預(yù)測區(qū)間(如圖2(a)和圖2(c)),從統(tǒng)計角度而言,思路(2)能以更高概率找到最優(yōu)區(qū)間,因此本文采用的是思路(2)的方案。
此外,由于極限學(xué)習(xí)機網(wǎng)絡(luò)結(jié)構(gòu)取決于隱含層節(jié)點個數(shù),如果節(jié)點過少,則會導(dǎo)致模型學(xué)習(xí)能力有限,影響預(yù)測結(jié)果的精度,如果節(jié)點過多,則容易導(dǎo)致“過擬合”,影響模型的泛化能力。同時,由于極限學(xué)習(xí)機隨機選取隱含層節(jié)點學(xué)習(xí)參數(shù),不同的參數(shù)將對應(yīng)不同的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),即其最優(yōu)隱含層節(jié)點數(shù)不是一個固定值,而是在某個區(qū)間變動。因此,比例系數(shù)法集成的極限學(xué)習(xí)機,在指定區(qū)間內(nèi)選取隱含層節(jié)點數(shù),以增加網(wǎng)絡(luò)結(jié)構(gòu)的多樣性使集成的結(jié)果更穩(wěn)定[32]。
附錄圖4(略)給出了使用比例系數(shù)法對負荷進行區(qū)間預(yù)測的實現(xiàn)流程,具體步驟如下所述:
STEP 1選取特征輸入量,構(gòu)造訓(xùn)練集和驗證集
選取歷史負荷數(shù)據(jù)劃分訓(xùn)練集和驗證集,并根據(jù)訓(xùn)練集負荷數(shù)據(jù)特性確定極限學(xué)習(xí)機特征輸入量 xi=[xi1,xi2,…,xin]T∈ ?n。
STEP 2確定隱含層節(jié)點數(shù)最優(yōu)選取區(qū)間
選取不同隱含層節(jié)點數(shù)的極限學(xué)習(xí)機學(xué)習(xí)訓(xùn)練集數(shù)據(jù),隨后對驗證集進行區(qū)間預(yù)測,根據(jù)χPISI對所得預(yù)測區(qū)間進行評估,確定隱含層節(jié)點最優(yōu)選擇區(qū)間(下文簡稱選擇區(qū)間)。
STEP 3訓(xùn)練極限學(xué)習(xí)機,對驗證集和預(yù)測集進行點預(yù)測
從選擇區(qū)間隨機選取隱含層節(jié)點數(shù)并從指定范圍內(nèi)選取相應(yīng)網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí)參數(shù),使用訓(xùn)練集數(shù)據(jù)對極限學(xué)習(xí)機進行訓(xùn)練。使用訓(xùn)練過的極限學(xué)習(xí)機對驗證集和預(yù)測集分別進行點預(yù)測。
STEP 4確定比例系數(shù)
使用和聲搜索算法在給定范圍內(nèi)尋找能使驗證集χPISI最大的α和β,根據(jù)尋優(yōu)得到的最優(yōu)比例系數(shù)計算預(yù)測集的預(yù)測區(qū)間上下界,并將此結(jié)果保存。
STEP 5判定是否完成集成
判定集成的極限學(xué)習(xí)機個數(shù)是否已達到給定集成數(shù)M,如果沒有達到M,則重復(fù)STEP 3和STEP 4。
STEP 6確定預(yù)測集預(yù)測區(qū)間
取預(yù)測集在集成過程中得到的M個上、下界結(jié)果的中位值,分別作為所要構(gòu)建預(yù)測區(qū)間的上、下界。
為驗證比例系數(shù)法應(yīng)用于負荷預(yù)測的正確性和有效性,本文選取2007年度浙江某城市冬季和夏季的兩個典型月(即1月和7月)實際用電負荷數(shù)據(jù)為樣本,分別進行短期預(yù)測和超短期預(yù)測研究。其中,短期預(yù)測的對象是次日全天96點負荷觀測值(從0:00至23:45每隔15 min進行一次采樣,共計96個采樣點),超短期預(yù)測則對下一采樣點(時間間隔為15 min)的負荷觀測值進行在線預(yù)測。由于高比重的取暖(或空調(diào))負荷以及節(jié)假日的影響,這兩個月的用電負荷并無明顯的變化規(guī)律(如日類型)可遵循,常規(guī)的點預(yù)測方法很難滿足實際需求,因此對其進行區(qū)間預(yù)測更為合理。
將1月和7月由日96點負荷數(shù)據(jù)組成的樣本集根據(jù)時間先后順序分別以70% ~20% ~10%的比例劃分為3個互不重疊的樣本子集:訓(xùn)練集、驗證集和預(yù)測集,劃分結(jié)果見附錄表1(略)。此外,本文研究過程中以日為窗口單元對訓(xùn)練集和驗證集進行滾動更新,如附錄圖5(略)。
由于選取合適的特征輸入量能提高極限學(xué)習(xí)機的預(yù)測精度,而這2個月負荷特性較為復(fù)雜,很難根據(jù)經(jīng)驗選取合適的特征輸入量,因此借助于ARIMA(Autoregressive Integrated Moving Average model)中的偏自相關(guān)函數(shù)來幫助選取特征輸入量。對訓(xùn)練集歷史負荷數(shù)據(jù)構(gòu)成的時間序列進行偏自相關(guān)分析,選取偏自相關(guān)系數(shù)最大的5個“已知”負荷數(shù)據(jù)作為特征輸入量 xi1,xi2,xi3,xi4和xi5。選取結(jié)果見附錄表2(略)。由于負荷數(shù)值落在神經(jīng)元的有效區(qū)間外將引起神經(jīng)元的飽和,需要將所有負荷數(shù)據(jù)歸一化到區(qū)間[-1,1],并對最終預(yù)測結(jié)果進行相應(yīng)的反歸一化。
為增強極限學(xué)習(xí)機的學(xué)習(xí)能力,使之辨識不同時刻的負荷值,增加與各采樣點時標相關(guān)的特征輸入量xi6,xi7,并按如下規(guī)則進行編碼:
式中:k為與各采樣點對應(yīng)的時標(k=1,2,…,96)。
在此編碼規(guī)則下,各采樣點的時標能由xi6和xi7聯(lián)合確定,且由于xi6和xi7均在區(qū)間[-1,1]內(nèi)取值,所以無需再對其進行歸一化。
極限學(xué)習(xí)機隱含層節(jié)點選為加法型節(jié)點,激活函數(shù)為Sigmoid函數(shù),輸入權(quán)值和閾值均從[-1,1]范圍內(nèi)隨機選取。附錄表3(略)和附錄表4(略)分別給出了和聲搜索算法和χPISI的特征參數(shù)值以及隱含層節(jié)點數(shù)和比例系數(shù)的選擇區(qū)間。附錄圖6(略)描繪了對1月負荷進行超短期預(yù)測時,驗證集價值函數(shù)值在和聲搜索過程中的典型演變情況。
將比例系數(shù)法與文獻[33]總結(jié)的配對自助法(Pairs Bootstrap)進行比較,其中配對自助法實驗過程中不區(qū)分訓(xùn)練集和驗證集,集成數(shù)均取100。為消除算法的隨機性,重復(fù)實驗10次,預(yù)測區(qū)間按日進行劃分并用實際觀測值對當日預(yù)測區(qū)間進行評估,將所得χPISI的中位值對應(yīng)的預(yù)測區(qū)間取為最終結(jié)果。表1和表2分別比較了比例系數(shù)法和配對自助法的超短期和短期區(qū)間預(yù)測結(jié)果。圖3和圖4給出了比例系數(shù)法對1月負荷進行超短期和短期區(qū)間預(yù)測的結(jié)果,7月的相應(yīng)結(jié)果請見附錄圖7(略)和附錄圖8(略)。配對自助法的短期區(qū)間預(yù)測結(jié)果如附錄圖9(略)和附錄圖10(略)所示。
(1)超短期預(yù)測結(jié)果及分析
從表1中容易看出,比例系數(shù)法確定的預(yù)測區(qū)間的χPISI基本都要高于配對自助法,且χPISI能基本穩(wěn)定在一個較高水平(1月為94%,7月為96%),而后者的χPISI波動較大(1月波動幅度約10%,7月波動幅度約3%)。比例系數(shù)法構(gòu)建預(yù)測區(qū)間過程中,和聲搜索算法尋優(yōu)得到的比例系數(shù)結(jié)果典型值為:1月=0.0224,=0.0265,7 月=0.0183,=0.0175,可以推知,預(yù)測值可以作為真實值的近似無偏估計值,使得預(yù)測區(qū)間近似以預(yù)測值為中心對稱。此時,使用配對自助法同樣可以獲得較為滿意的結(jié)果。
(2)短期預(yù)測結(jié)果及分析
從表2中數(shù)據(jù)容易得知,比例系數(shù)法確定的預(yù)測區(qū)間的χPISI要遠比配對自助法穩(wěn)定,后者甚至出現(xiàn)了χPISI=0的情況。比例系數(shù)法構(gòu)建預(yù)測區(qū)間過程中,和聲搜索算法尋優(yōu)得到的比例系數(shù)結(jié)果典型值為:1月= 0.0433,=0.0825,7月=0.1108,=0.0595,此時預(yù)測區(qū)間不再以預(yù)測值為中心對稱,由預(yù)測值估計真實值將導(dǎo)致較大偏差。因此,基于預(yù)測值能夠無偏估計真實值的假設(shè)的配對自助法并不能給出可信的預(yù)測區(qū)間。此時,配對自助法確定的1月和7月的預(yù)測區(qū)間由于預(yù)測值估計真實值時分別上偏和下偏,導(dǎo)致獲得的預(yù)測區(qū)間也相應(yīng)上偏和下偏,均不能很好的覆蓋全部觀測值,而比例系數(shù)法通過控制αValid和βValid的取值,通過構(gòu)建不對稱的預(yù)測區(qū)間,對預(yù)測值估計真實值的偏差進行了修正,依然可以獲得較為滿意的結(jié)果。
與超短期預(yù)測結(jié)果類似,短期預(yù)測時雖然比例系數(shù)法確定的區(qū)間χMWP要高于配對自助法,但前者往往能夠獲得更高的χCP和χAD,使得χPISI也更高,因此前者構(gòu)建的預(yù)測區(qū)間質(zhì)量也往往更高。此外,短期預(yù)測時,預(yù)測區(qū)間χMWP明顯大于超短期預(yù)測時的對應(yīng)值,這一現(xiàn)象符合區(qū)間預(yù)測的特征,即不確定性越大,預(yù)測區(qū)間結(jié)果將越保守,此時預(yù)測區(qū)間也就越寬。本文研究中為更好地反映負荷預(yù)測的不確定性,在短期預(yù)測時,并未計入氣象因素的影響。在條件允許的情況下,增加相關(guān)的氣象因素(主要是溫度)為特征輸入量將有助于提高預(yù)測準確度,進而降低預(yù)測區(qū)間的χMWP。
如果實際生產(chǎn)運行過程中需要待預(yù)測日的確定性點預(yù)測值,則可以將由預(yù)測區(qū)間上下界確定的區(qū)間中值作為點預(yù)測值,即
式中:yi和xi分別為待預(yù)測日第i個時刻的點預(yù)測值和極限學(xué)習(xí)機輸入量;L(xi)和U(xi)為與xi對應(yīng)的預(yù)測區(qū)間下界和上界。
對由比例系數(shù)法和配對自助法得到的預(yù)測區(qū)間分別由式(26)確定點預(yù)測值,并根據(jù)文獻[34]提供的評價點預(yù)測結(jié)果的日負荷預(yù)測準確率A的計算公式進行評估:
表3對兩個方法確定的點預(yù)測結(jié)果進行了比較。比例系數(shù)法確定的點預(yù)測值在多數(shù)情況下比配對自助法的結(jié)果準確率更高,而后者得到的點預(yù)測值本質(zhì)上是對集成的多個極限學(xué)習(xí)機輸出值取平均值后的結(jié)果??梢酝浦?,負荷預(yù)測的不確定性較大時,依然可以通過由比例系數(shù)法構(gòu)造的預(yù)測區(qū)間中值來獲得較高準確率的點預(yù)測值。
表1 超短期負荷區(qū)間預(yù)測結(jié)果Tab.1 Results of ultra-short-term load interval prediction
表2 短期負荷區(qū)間預(yù)測結(jié)果對比Tab.2 Results of short-term load interval prediction
圖3 超短期負荷區(qū)間預(yù)測結(jié)果(1月)Fig.3 Results of ultra-short-term load interval prediction in January
圖4 短期負荷區(qū)間預(yù)測結(jié)果(1月)Fig.4 Results of short-term load interval prediction in January
表3 日負荷預(yù)測準確率Tab.3 Daily load forecasting accuracy
負荷區(qū)間預(yù)測的結(jié)果,可以使電力系統(tǒng)決策人員更好地認識到未來負荷的不確定性及相關(guān)的風險信息,使其及時做出更加合理的決策[35]。本文提出的比例系數(shù)法簡單高效,適用范圍廣,能夠構(gòu)建高質(zhì)量的預(yù)測區(qū)間。當預(yù)測值能近似無偏估計真實值時,構(gòu)建的預(yù)測區(qū)間近似以預(yù)測值為中心對稱且區(qū)間寬度小。當由預(yù)測值估計真實值存在較大偏差時,預(yù)測區(qū)間則不再對稱且區(qū)間寬度大。最后需要指出,比例系數(shù)法的主要思想并不局限于超短期和短期負荷預(yù)測,在其他領(lǐng)域(如風電和水文預(yù)測)同樣具有很好的應(yīng)用前景。
(因篇幅所限附錄略,如讀者需要可與作者聯(lián)系)
[1]何洋,鄒波,李文啟,等.基于混沌理論的電力系統(tǒng)短期負荷預(yù)測的局域模型[J].華北電力大學(xué)學(xué)報 (自然科學(xué)版),2013,40(4):43-50.
[2]鄭金.短期電力負荷預(yù)測方法研究[D].鄭州:鄭州大學(xué),2012.
[3]汪峰,于爾鏗,閻承山,等.基于因素影響的電力系統(tǒng)短期負荷預(yù)報方法的研究[J].中國電機工程學(xué)報,1999,19(8):54-58.
[4]周佃民,管曉宏,孫 婕,等.基于神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)短期負荷預(yù)測研究[J].電網(wǎng)技術(shù),2002,26(2):10-13.
[5]李元誠,方廷健,于爾鏗.短期負荷預(yù)測的支持向量機方法研究[J].中國電機工程學(xué)報,2003,23(6):55-59.
[6]焦?jié)櫤?,蘇辰雋,林碧英,等.基于氣象信息因素修正的灰色短期負荷預(yù)測模型[J].電網(wǎng)技術(shù),2013,37(3):720-725.
[7]林曉華,馮毅雄,譚建榮.基于免疫優(yōu)化的產(chǎn)品系統(tǒng)可靠性參數(shù)區(qū)間預(yù)測方法[J].浙江大學(xué)學(xué)報(工學(xué)版),2013,(6):1013-1021.
[8]杜雅楠.基于核學(xué)習(xí)的冶金煤氣流量在線區(qū)間預(yù)測方法[D].大連:大連理工大學(xué),2013.
[9]Quan H,Srinivasan D,Khosravi A.Short-term load and wind power forecasting using neural network-based prediction intervals[J].IEEE Transactions on Neural Networks and Learning Systems,2013,25(2):303-315.
[10]Huang G,Zhu Q,Siew C.Extreme learning machine:theory and applications[J].Neurocomputing,2006,70(1):489-501.
[11]Lan Y,Soh Y C,Huang G.Ensemble of online sequential extreme learning machine[J].Neurocomputing,2009,72(13):3391-3395.
[12]Liang N,Huang G,Saratchandran P,et al.A fast and accurate online sequential learning algorithm for feedforward networks[J].IEEE Transactions on Neural Networks,2006,17(6):1411 -1423.
[13]高光勇,蔣國平.采用優(yōu)化極限學(xué)習(xí)機的多變量混沌時間序列預(yù)測[J].物理學(xué)報,2012,61(4):37-45.
[14]Zhao J,Wang Z,Park D S.Online sequential extreme learning machine with forgetting mechanism[J].Neurocomputing,2012,87(11):79-89.
[15]Geem Z W,Kim J H,Loganathan G V.A new heuristic optimization algorithm:harmony search[J].Simulation,2001,76(2):60-68.
[16]Lee K S,Geem Z W.A new meta-heuristic algorithm for continuous engineering optimization:harmony search theory and practice[J].Computer Methods in Applied Mechanics and Engineering,2005,194(36 - 38):3902-3933.
[17]Geem Z W.Optimal cost design of water distribution networks using harmony search[J].Engineering Optimization,2006,38(3):259-280.
[18]雍龍泉.和聲搜索算法研究進展[J].計算機系統(tǒng)應(yīng)用,2011,20(7):244-248.
[19]劉蓓,汪沨,陳春,等.和聲算法在含DG配電網(wǎng)故障定位中的應(yīng)用[J].電工技術(shù)學(xué)報,2013,28(5):280-284.
[20]劉思遠,柳景青.一種新的多目標改進和聲搜索優(yōu)化算法[J].計算機工程與應(yīng)用,2010,46(34):27-30.
[21]Khosravi A,Nahavandi S,Creighton D,et al.Comprehensive review of neural network-based prediction intervals and new advances[J].IEEE Transactions on Neural Networks,2011,22(9):1341-1356.
[22]Quan H,Srinivasan D,Khosravi A.Construction of neural network-based prediction intervals using particle swarm optimization[C].The 2012 International Joint Conference on Neural Networks(IJCNN),New York:IEEE,2012.
[23]Khosravi A,Nahavandi S.Combined nonparametric prediction intervals for wind power generation[J].IEEE Transactions on Sustainable Energy,2013,4(4):849-856.
[24]Khosravi A,Nahavandi S,Creighton D.A neural net-work-GARCH-based method for construction of prediction intervals[J].Electric Power Systems Research,2013,96(3):185-193.
[25]Khosravi A,Nahavandi S,Creighton D.Construction of optimal prediction intervals for load forecasting problems[J].IEEE Transactions on Power Systems,2010,25(3):1496-1503.
[26]Khosravi A,Nahavandi S,Creighton D.Prediction intervals for short-term wind farm power generation forecasts[J].IEEE Transactions on Sustainable Energy,2013,4(3):602-610.
[27]Khosravi A,Nahavandi S,Creighton D,et al.Lower upper bound estimation method for construction of neural network-based prediction intervals[J].IEEE Transactions on Neural Networks,2011,22(3):337-346.
[28]Efron B.1977 Rietz lecture-bootstrap methods:another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.
[29]魏宗舒.概率論與數(shù)理統(tǒng)計教程[M].高等教育出版社,2008.
[30]Harrison R G,Yu D J,Oxley L,et al.Non-linear noise reduction and detecting chaos:some evidence from the S&P composite price index[J].Mathematics and Computers in Simulation,1999,48(4):497 -502.
[31]毛力,王運濤,劉興陽,等.基于改進極限學(xué)習(xí)機的短期電力負荷預(yù)測方法[J].電力系統(tǒng)保護與控制,2012,40(20):140-144.
[32]Zhang R,Dong Z Y,Xu Y,et al.Short-term load forecasting of Australian national electricity market by an ensemble model of extreme learning machine[J].IET Generation,Transmission & Distribution,2013,7(4):391-397.
[33]Wan C,Xu Z,Pinson P,et al.Probabilistic forecasting of wind power generation using extreme learning machine[J].IEEE Transactions on Power Systems,2013,PP(99):1-12.
[34]陳亞紅,馬麗,穆鋼,等.兩種短期負荷預(yù)測精度考核標準的比較[J].電力系統(tǒng)自動化.2003,27(17):73-77.
[35]方仍存.電力系統(tǒng)負荷區(qū)間預(yù)測[D].武漢:華中科技大學(xué),2008.