黃元生,張利君
(華北電力大學(xué),河北 保定 071003)
在電力市場(chǎng)上,準(zhǔn)確預(yù)測(cè)短期電價(jià)直接影響市場(chǎng)競(jìng)爭(zhēng)主體的競(jìng)價(jià)決策和經(jīng)濟(jì)效益,因此對(duì)于短期電價(jià)的預(yù)測(cè)越來(lái)越受重視。現(xiàn)有的短期預(yù)測(cè)模型大多來(lái)自金融債券的預(yù)測(cè)方法,因此把金融預(yù)測(cè)模型應(yīng)用于電力價(jià)格的分析預(yù)測(cè)時(shí),不能一味的照搬。傳統(tǒng)的電價(jià)預(yù)測(cè)方法,主要是基于時(shí)間序列分析和統(tǒng)計(jì)模型,包括線性回歸模型[1,2]、自回歸滑動(dòng)平均模型[3]等。隨著人工智能算法的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[4]、遺傳算法(Genetic Algorithm,GA)[5]等具有自學(xué)能力的算法,在電價(jià)預(yù)測(cè)領(lǐng)域廣泛應(yīng)用。文獻(xiàn)[6]針對(duì)短期電價(jià)的隨機(jī)性、波動(dòng)性等特點(diǎn),利用小波變換將歷史數(shù)據(jù)進(jìn)行分解,建立了多元時(shí)間序列模型,在一定程度上提高了預(yù)測(cè)的精度。為了解決傳統(tǒng)統(tǒng)計(jì)模型在“維度災(zāi)難”上的問題,文獻(xiàn)[7]提出了采用小波變換,利用PSO尋找LSSVM的最優(yōu)決策參數(shù)的方法,對(duì)目前電價(jià)進(jìn)行預(yù)測(cè),結(jié)果表明對(duì)模型的學(xué)習(xí)能力和泛化能力有較大的提高,得到了更加準(zhǔn)確有效的預(yù)測(cè)結(jié)果。文獻(xiàn)[8]對(duì)電價(jià)進(jìn)行分時(shí)段處理,將相關(guān)系數(shù)作為選取電價(jià)影響因素的標(biāo)準(zhǔn),考慮了歷史電價(jià)、負(fù)荷、負(fù)荷率等影響電價(jià)的因素。以小波分析和神經(jīng)網(wǎng)絡(luò)作為工具,對(duì)不同輸入因素和不同預(yù)測(cè)方法下的電價(jià)預(yù)測(cè)精度進(jìn)行了研究,并重點(diǎn)比較了基于分時(shí)段電價(jià)序列的預(yù)測(cè)方法和基于順序電價(jià)序列的預(yù)測(cè)方法。分時(shí)段短期電價(jià)預(yù)測(cè)方法相比基于順序電價(jià)序列能夠使平均相對(duì)百分比誤差下降約3個(gè)百分點(diǎn)。
在電力市場(chǎng)上,目前電價(jià)的形成受到眾多不確定因素的影響,包括自然環(huán)境變化、電力需求、電網(wǎng)運(yùn)行約束以及電力市場(chǎng)中買賣雙方競(jìng)價(jià)策略等,有時(shí)會(huì)導(dǎo)致價(jià)格尖峰的產(chǎn)生,即價(jià)格出現(xiàn)強(qiáng)烈的波動(dòng)性,而傳統(tǒng)的預(yù)測(cè)方法進(jìn)行的前提通常需要時(shí)間序列不存在異方差、同分布等苛刻的條件,這在實(shí)際預(yù)測(cè)中較難達(dá)到;人工智能算法雖然有自學(xué)能力,但是往往預(yù)測(cè)的方法單一,不能得到預(yù)期的預(yù)測(cè)效果。本文結(jié)合以上問題,提出了基于遺傳算法權(quán)重優(yōu)化的BP_LSSVM組合變權(quán)短期電價(jià)預(yù)測(cè)模型。在建立該模型之前,本文先對(duì)電價(jià)數(shù)據(jù)進(jìn)行水平處理,以“消平”有規(guī)律的電價(jià)水平走勢(shì)中出現(xiàn)的一些異常的偏離點(diǎn)。在處理完數(shù)據(jù)之后,分別建立BP神經(jīng)網(wǎng)絡(luò)(BPNN)和最小二乘支持向量機(jī)(LSSVM)對(duì)電價(jià)進(jìn)行訓(xùn)練預(yù)測(cè),同時(shí)提出采用遺傳算法(GA)對(duì)該組合變權(quán)模型的權(quán)重進(jìn)行優(yōu)化,最后將權(quán)重優(yōu)化之后的GA_BP_LSSVM模型應(yīng)用于美國(guó)PJM電力市場(chǎng)的邊際電價(jià)預(yù)測(cè),并與傳統(tǒng)的LSSVM與BPNN的預(yù)測(cè)結(jié)果進(jìn)行比較,結(jié)果表明該組合變權(quán)模型能夠提供更加精確的預(yù)測(cè)電價(jià)。
遺傳算法的優(yōu)化過程一般步驟如下:
1)隨機(jī)產(chǎn)生初始種群,并對(duì)解向量進(jìn)行編碼。確定種群規(guī)模N、交叉概率Pc、變異概率Pm和置終止進(jìn)化準(zhǔn)則;隨機(jī)產(chǎn)生N個(gè)個(gè)體作為初始種群X(0)。
2)個(gè)體評(píng)價(jià)。計(jì)算或估價(jià)X(t)中各個(gè)體的適應(yīng)度。
3)種群進(jìn)化。①選擇(母體),從X(t)中運(yùn)用選擇算子選擇出B/2對(duì)母體;②交叉,對(duì)所選擇的B/2對(duì)母體,依概率Pc執(zhí)行交叉形成B個(gè)中間個(gè)體;③變異,對(duì)B個(gè)中間個(gè)體分別獨(dú)立依概率Pm執(zhí)行變異,形成B個(gè)候選個(gè)體;④選擇(子代),從上述所形成的B個(gè)候選個(gè)體中依適應(yīng)度選擇出N個(gè)個(gè)體組成新一代種群X(t+1)。
4)終止檢驗(yàn)。如已滿足終止準(zhǔn)則,則輸出X(t+1)中具有最大適應(yīng)度個(gè)體為最優(yōu)解,終止計(jì)算;否則置步驟三。
BP神經(jīng)網(wǎng)絡(luò)是多層前反饋神經(jīng)網(wǎng)絡(luò),其特點(diǎn)是信號(hào)向前傳送,誤差往回反饋。在正向傳送中,輸入信號(hào)通過輸入層、隱藏層、輸出層的過程進(jìn)行處理。具體的公式如下:
式中,xi為輸入信號(hào);yh,f分別為隱藏層的輸出和傳遞函數(shù);y,f2分別為輸出層的輸出和傳遞函數(shù);ωih為輸入層與隱藏層之間的權(quán)重;ωhj為隱藏層和輸出層之間的權(quán)值。
當(dāng)輸出層的輸出沒有到達(dá)要求時(shí),通過傳遞函數(shù)返回,根據(jù)預(yù)測(cè)誤差,調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)的權(quán)值和閾值,使得預(yù)測(cè)結(jié)果達(dá)到要求。權(quán)重修正公式如下:
ωhj(n+1)=ωhj(n)+ηδjyh
ωih(n)+ηδh
式中,ωhj(n+1),ωih(n+1)為n+1次迭代之后的權(quán)重系數(shù);tj為輸出層第j個(gè)節(jié)點(diǎn)處的目標(biāo)值;η為訓(xùn)練速度隨機(jī)系數(shù),0≤η≤1。
最小二乘向量機(jī)是在支持向量機(jī)的基礎(chǔ)上提出一種改進(jìn)的算法,其訓(xùn)練通過式(1)完成:
約束條件:
yi(WTg(xi)+b)=1-ξi,(i=1,…,M)(2)
引入拉格朗日乘子αi,將上式轉(zhuǎn)化為無(wú)約束目標(biāo)函數(shù):
式中,W是l維權(quán)重矢量;g(x)是將x從輸入空間映射到特征空間的函數(shù);ξi是xi的松弛系數(shù);C是邊際系數(shù)。
式中,α=(α1,…,αM),ξ=(ξ1,…,ξM)。
令上式對(duì)W,b,ξ的偏導(dǎo)為0,由KKT條件可以得到:
由式(4)的優(yōu)化條件可以整理為矩陣形式:
為了將變量映射到高維特征空間中,避免處理高維復(fù)雜的困難,因此引入了核函數(shù)H(x,x′)=gT(x)g(x′),本文采用徑向基核函數(shù):
k(xi,x)=exp[-‖x-xi‖2/(2σ2)](6)
其中,σ為核參數(shù)。
由式(5)可以求得α和b,
α=Ω-1(1-yb)(7)
b=(YTΩ-1I)-1YTΩ-1I(8)
由此可以得到?jīng)Q策函數(shù)f(x)。
2.1 數(shù)據(jù)的水平處理
從水平的角度觀測(cè)歷史數(shù)據(jù)可以發(fā)現(xiàn),在一些情況下,在有規(guī)律的電價(jià)水平走勢(shì)中會(huì)突然出現(xiàn)一些異常的偏離點(diǎn)的情況。這些情況是由于一些偶然的隨機(jī)因素所造成的,并不代表電價(jià)序列發(fā)展的普遍現(xiàn)象,如果不加處理則很有可能會(huì)影響到預(yù)測(cè)的效果。
從對(duì)正常的數(shù)據(jù)觀測(cè)中不難看出,每一時(shí)點(diǎn)的歷史數(shù)據(jù)與相鄰各點(diǎn)的存在著一定的關(guān)聯(lián),這種關(guān)聯(lián)即是它們之間保持著一定的相鄰范圍。如果相互波動(dòng)在此范圍內(nèi),就認(rèn)為該點(diǎn)是正常值,如果超過了這一范圍,則認(rèn)為這一點(diǎn)是異常值,應(yīng)當(dāng)予以“消平”??梢园堰@種消平異常點(diǎn)的技術(shù)稱之為數(shù)據(jù)平滑化,本文采用如下方法進(jìn)行:根據(jù)統(tǒng)計(jì)分析,確定了可以接受的波動(dòng)范圍值為θ(t),該值為波動(dòng)范圍的上限,超過改制的波動(dòng)均視為異常點(diǎn),本文對(duì)于異常點(diǎn)的處理如下:
式中,x(d,t)為d天t時(shí)刻的電價(jià)值,θ(t)為閾值。
設(shè)某一預(yù)測(cè)問題在某一時(shí)刻的實(shí)際值為y(t)(t=1,2,…,N),對(duì)此預(yù)測(cè)問題有n種可行的預(yù)測(cè)方法,其預(yù)測(cè)值或模型擬合值分別為yi(t),其中,(t=1,2,…,N;i=1,2,…,n)。又設(shè)n種預(yù)測(cè)方法的加權(quán)向量為W=(W1,W2,…,Wn)T,于是組合預(yù)測(cè)模型可以表示為:
在本文中,分別采用LSSVM和BPNN對(duì)電價(jià)數(shù)據(jù)進(jìn)行訓(xùn)練預(yù)測(cè),其中,LSSVM的預(yù)測(cè)結(jié)果為yLSSVM,BPNN的預(yù)測(cè)結(jié)果為yBPNN,則該組合變權(quán)模型為:
在W1、W2的確定中,本文采用GA優(yōu)化算法進(jìn)行,GA優(yōu)化算法的核心是確定適應(yīng)值函數(shù),本文取變權(quán)組合模型預(yù)測(cè)值與期望值的絕對(duì)差的倒數(shù)作為個(gè)體的適應(yīng)值。
=|W1yLSSVM(t)+W2yBPNN(t)-y(t)|
fj=1/εj(t)
式中,εj(t)為第j個(gè)個(gè)體對(duì)應(yīng)的變權(quán)組合模型預(yù)測(cè)值與期望值的絕對(duì)差;y(t)為電價(jià)期望值;fj為第j個(gè)個(gè)體的適應(yīng)值。
在遺傳算法選擇操作中有輪盤賭法、錦標(biāo)賽法等多種方法,本文中選擇輪盤賭法,積極與適應(yīng)值比例的選擇策略,每個(gè)個(gè)體j的選擇概率pj為:
式中,m為初始種群的大小。
圖1 GA-BP-LSSVM組合變權(quán)模型建模流程圖
本文將收集到美國(guó)PJM電力市場(chǎng)2014年9月10日至13日的電價(jià)數(shù)據(jù)為原始數(shù)據(jù),其中2014年9月10日至12日的電價(jià)數(shù)據(jù)為訓(xùn)練數(shù)據(jù),將該時(shí)段的電價(jià)的變化進(jìn)行逐個(gè)小時(shí)的統(tǒng)計(jì),并將被預(yù)測(cè)點(diǎn)前三個(gè)預(yù)測(cè)的電價(jià)數(shù)據(jù)當(dāng)作預(yù)測(cè)模型的輸入變量。為驗(yàn)證本文所提出的預(yù)測(cè)模型的有效性,本文將2014年9月13日的電價(jià)數(shù)據(jù)作為測(cè)試數(shù)據(jù),分別采用LSSVM和BPNN對(duì)2014年9月13日電價(jià)數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖2、3所示。
圖2 日實(shí)際電價(jià)與LSSVM預(yù)測(cè)電價(jià)
圖3 日實(shí)際電價(jià)與BPNN預(yù)測(cè)電價(jià)
將LSSVM的預(yù)測(cè)結(jié)果yLSSVM和BPNN的預(yù)測(cè)結(jié)果yBPNN作為遺傳優(yōu)化算法的訓(xùn)練數(shù)據(jù),設(shè)置的初始種群數(shù)為n=10;迭代次數(shù)D=1000;交叉概率Pc=0.6,變異概率Pm=0.1,通過Matlab進(jìn)行適應(yīng)度計(jì)算,適應(yīng)度曲線如圖4所示。結(jié)果表明,在迭代到289次時(shí),平均適應(yīng)值為28.07,在之后的迭代中沒有出現(xiàn)變化,因此該個(gè)體為最優(yōu)個(gè)體。
W=(W1,W2)=(0.8485,0.1062)
圖4 適應(yīng)度曲線
則該組合變權(quán)模型為:
=0.8485yLSSVM(t)+0.1062yBPNN(t)
根據(jù)該模型對(duì)2014年9月13日電價(jià)數(shù)據(jù)重新進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖5所示。
圖5 預(yù)測(cè)結(jié)果對(duì)比
結(jié)合圖5及表1可以看出,通過樣本數(shù)據(jù)對(duì)三種不同模型的訓(xùn)練,在電價(jià)預(yù)測(cè)結(jié)果中,GA_BP_LSSVM的絕對(duì)平均誤差為4.64%,而LSSVM的絕對(duì)平均誤差為6.83%,BPNN的絕對(duì)平均誤差為8.24%,可見,BPNN誤差最大,預(yù)測(cè)效果最不理想。同時(shí),GA_BP_LSSVM預(yù)測(cè)結(jié)果中絕對(duì)誤差小于5%的有17項(xiàng);LSSVM次之,有12項(xiàng)小于5%;BPNN預(yù)測(cè)結(jié)果中絕對(duì)誤差小于5%的只有9項(xiàng)。因此證明了GA_BP_LSSVM具有良好的預(yù)測(cè)效果,預(yù)測(cè)能力強(qiáng)。
表1 預(yù)測(cè)結(jié)果數(shù)據(jù)對(duì)比
注:Av為實(shí)際值;Fv為預(yù)測(cè)值;ER為誤差;RMAPE為絕對(duì)平均誤差。
1)通過GA權(quán)重優(yōu)化所求得的權(quán)重參數(shù)在理論上能達(dá)到全局最優(yōu),因此采用GA權(quán)重優(yōu)化能大大提高預(yù)測(cè)模型的預(yù)測(cè)精度。
2)GA_BP_LSSVM優(yōu)化模型克服了BPNN、LSSVM這些傳統(tǒng)人工智能算法結(jié)構(gòu)單一的缺點(diǎn),其預(yù)測(cè)精度大大提高。因此該組合權(quán)重模型對(duì)于短期電價(jià)的預(yù)測(cè)效果更好。