蔣艾町,李小雨,夏 雪,李嘉逸
(中國電力工程顧問集團(tuán)西南電力設(shè)計(jì)院有限公司,四川 成都 610021)
隨著化石能源等不可再生能源的不斷消耗,資源緊張、環(huán)境污染和氣候變化等問題日益加劇。風(fēng)力發(fā)電以其清潔安全、可持續(xù)、技術(shù)成熟、開發(fā)價(jià)值高等優(yōu)勢(shì),迅速在各國的能源戰(zhàn)略中占據(jù)重要位置[1-3]。但由于風(fēng)力資源固有的隨機(jī)和波動(dòng)特性,不論采用何種風(fēng)電功率預(yù)測(cè)方法,風(fēng)功率預(yù)測(cè)都具有一定的不確定性,對(duì)風(fēng)電系統(tǒng)的電網(wǎng)調(diào)度、棄風(fēng)限電、備用容量配置以及安全運(yùn)行都會(huì)產(chǎn)生影響[4-5],因此,中國各省陸續(xù)推出風(fēng)電功率預(yù)測(cè)誤差考核政策。儲(chǔ)能作為改善風(fēng)電功率預(yù)測(cè)誤差的一種有效手段在工程中被廣泛應(yīng)用,有效估計(jì)風(fēng)電功率預(yù)測(cè)誤差,不僅能為風(fēng)電并網(wǎng)系統(tǒng)的調(diào)度和運(yùn)行提供參考,還能對(duì)風(fēng)電場儲(chǔ)能系統(tǒng)容量的合理配置進(jìn)行指導(dǎo),因此有必要對(duì)風(fēng)電功率預(yù)測(cè)誤差估計(jì)方法進(jìn)行研究。
目前國內(nèi)研究最為廣泛的是采用概率分布擬合的方法對(duì)風(fēng)電功率預(yù)測(cè)誤差進(jìn)行估計(jì)計(jì)算。該方法通過統(tǒng)計(jì)風(fēng)電功率預(yù)測(cè)誤差歷史數(shù)據(jù),對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行擬合,建立其概率密度分布模型,進(jìn)而求取預(yù)測(cè)誤差的估計(jì)區(qū)間[6-13]。文獻(xiàn)[6]利用混合高斯分布對(duì)風(fēng)電功率預(yù)測(cè)誤差進(jìn)行擬合研究分析,結(jié)果表明不同預(yù)測(cè)方法下產(chǎn)生的功率預(yù)測(cè)誤差的分布特性不同,但混合高斯分布對(duì)于應(yīng)用不同預(yù)測(cè)方法的風(fēng)電功率預(yù)測(cè)誤差均具有高精度的適應(yīng)性。文獻(xiàn)[7-8]基于貝塔分布對(duì)風(fēng)電場實(shí)際風(fēng)電功率進(jìn)行分析,得到其貝塔分布的概率密度函數(shù),然后建立相應(yīng)的最優(yōu)解模型,求取風(fēng)功率預(yù)測(cè)誤差的最小概率區(qū)間。文獻(xiàn)[9-12]采用非參數(shù)概率區(qū)間估計(jì)方法,不對(duì)總體分布進(jìn)行先驗(yàn)假設(shè),通過滑動(dòng)分塊百分位數(shù)Bootstrap法、核密度估計(jì)等方法直接求取預(yù)測(cè)誤差的置信區(qū)間。文獻(xiàn)[13]首先采用聚類算法將預(yù)測(cè)誤差采樣數(shù)據(jù)進(jìn)行分類,然后針對(duì)每類數(shù)據(jù)計(jì)算其概率密度函數(shù),求取分布模型,進(jìn)而得到風(fēng)電預(yù)測(cè)誤差估計(jì)區(qū)間。
此外,特征值提取法也經(jīng)常被用于風(fēng)功率預(yù)測(cè)誤差估計(jì)模型的建立[14-18]。文獻(xiàn)[14-16]根據(jù)風(fēng)電場的歷史運(yùn)行數(shù)據(jù)和日前預(yù)測(cè)數(shù)據(jù)提取數(shù)據(jù)中的有效特征值,如當(dāng)日功率波動(dòng)、近期功率波動(dòng)及預(yù)測(cè)方法精度等,通過多元線性回歸法建立回歸方程,進(jìn)而求取預(yù)測(cè)誤差的估計(jì)區(qū)間。文獻(xiàn)[17-18]在直接提取數(shù)據(jù)特征值的基礎(chǔ)上,加入小波分析、粗糙集理論及字典學(xué)習(xí)等算法,對(duì)風(fēng)電功率預(yù)測(cè)數(shù)據(jù)進(jìn)行處理后采用多元線性回歸方程,建立風(fēng)電功率預(yù)測(cè)誤差的估計(jì)模型。然而,這些方法雖然能夠改善預(yù)測(cè)誤差估計(jì)效果,但增加了算法的復(fù)雜程度,工程實(shí)用性較低。
綜上所述,下面選取適用范圍較廣的基于混合高斯分布擬合法和特征值提取法的風(fēng)電功率預(yù)測(cè)誤差估計(jì)算法,針對(duì)這兩種方法進(jìn)行了詳細(xì)的對(duì)比研究。同時(shí)提出了一種結(jié)合高斯混合模型(Gaussian mixture model,GMM)和馬爾可夫模型(Markov model,MM)的MM-GMM優(yōu)化預(yù)測(cè)誤差區(qū)間估計(jì)算法并驗(yàn)證其有效性。
基于混合高斯分布擬合法的風(fēng)電功率預(yù)測(cè)誤差估計(jì)方法首先假設(shè)誤差數(shù)據(jù)的概率密度函數(shù)符合混合高斯分布,然后通過對(duì)歷史風(fēng)電功率預(yù)測(cè)誤差數(shù)據(jù)的統(tǒng)計(jì)分析,進(jìn)行數(shù)據(jù)擬合,得到樣本數(shù)據(jù)的混合高斯模型,進(jìn)而設(shè)置合理的置信水平求得預(yù)測(cè)誤差的估計(jì)區(qū)間。該方法適用范圍廣、精度高[6]。
一維混合高斯分布模型由多個(gè)正態(tài)分布線性組成,其概率密度函數(shù)表達(dá)式為
f(x;μ1,…,μN(yùn),σ1,…,σk)=
(1)
式中:k為正態(tài)分布的個(gè)數(shù);ai(1≤i≤k)為各正態(tài)分布的權(quán)值;μi為各正態(tài)分布的均值;σi為各正態(tài)分布的標(biāo)準(zhǔn)差。
根據(jù)風(fēng)電場歷史誤差數(shù)據(jù),利用期望最大化(expectation maximization,EM)算法對(duì)混合高斯模型進(jìn)行參數(shù)估計(jì),求解式(1)中的ai、μi和σi[6, 19]。
設(shè)θj=(aj,μj,σj),j=1,2,…,k為GMM中各正態(tài)分布模型的參數(shù),Θ=(θ1,θ2,…,θk)為GMM中的所有參數(shù)。EM算法主要包含以下兩個(gè)步驟:
1)計(jì)算樣本數(shù)據(jù)X的對(duì)數(shù)似然函數(shù)的最大似然估計(jì)值,其對(duì)數(shù)似然函數(shù)如式(2)。
(2)
式中:T為樣本總數(shù);k為正態(tài)分布的個(gè)數(shù);Θ(q)為第q次迭代時(shí)計(jì)算得到的參數(shù)的最大似然估計(jì)值。
2)最大化上一步得到的最大似然估計(jì)值,求解參數(shù)。
(3)
重復(fù)迭代上述步驟至Θ(q+1)和Θ(q)之間的差值無窮小,即收斂時(shí),則為最優(yōu)的模型參數(shù)。
根據(jù)上述步驟建立基于混合高斯分布擬合法的風(fēng)電功率預(yù)測(cè)誤差估計(jì)模型,然后設(shè)置合理的置信水平,即可求得風(fēng)電功率預(yù)測(cè)誤差估計(jì)區(qū)間。
基于特征值提取法的風(fēng)電功率預(yù)測(cè)誤差估計(jì)是通過分析與預(yù)測(cè)誤差相關(guān)的特征值,將這些特征值與風(fēng)電功率預(yù)測(cè)誤差聯(lián)合建立多元線性回歸方程,進(jìn)而求取預(yù)測(cè)誤差的估計(jì)區(qū)間。
獲得風(fēng)電場的歷史運(yùn)行數(shù)據(jù),包括歷史預(yù)測(cè)功率和實(shí)際功率以及風(fēng)電場日前預(yù)測(cè)功率,從統(tǒng)計(jì)學(xué)角度出發(fā),利用各種統(tǒng)計(jì)學(xué)參數(shù)提煉出與預(yù)測(cè)誤差相關(guān)的特征值,如日前預(yù)測(cè)功率波動(dòng)性、近期風(fēng)電功率波動(dòng)性、風(fēng)功率幅值及預(yù)測(cè)方法的預(yù)測(cè)精度等,進(jìn)行相關(guān)性分析[14-15]。選取相關(guān)性較強(qiáng)的特征值,利用多元線性回歸方程建立預(yù)測(cè)誤差估計(jì)模型。其中,相關(guān)性計(jì)算使用卡爾·皮爾遜對(duì)相關(guān)系數(shù)r的表述如式(4)所示[14,17]。
(4)
風(fēng)電功率預(yù)測(cè)誤差估計(jì)模型為
E=b0+b1·x1+b2·x2+...+bn·xn
(5)
式中:E為當(dāng)日風(fēng)電功率的平均絕對(duì)誤差;x1,…,xn為與E強(qiáng)相關(guān)的各個(gè)特征值;b0,…,bn為估計(jì)模型的回歸系數(shù)。
通常來講,與風(fēng)電預(yù)測(cè)功率的平均絕對(duì)誤差相關(guān)性較強(qiáng)的因素有當(dāng)日風(fēng)電功率波動(dòng)、當(dāng)日風(fēng)電功率水平和預(yù)測(cè)方法的預(yù)測(cè)精度等[14-16]。其中,當(dāng)日風(fēng)電功率波動(dòng)和當(dāng)日風(fēng)電功率水平對(duì)預(yù)測(cè)誤差的影響較大[13]。
用當(dāng)日的日前預(yù)測(cè)風(fēng)電功率的標(biāo)準(zhǔn)方差ST表示當(dāng)日風(fēng)電功率波動(dòng),ST越大,表明當(dāng)日風(fēng)電功率波動(dòng)越大,風(fēng)電功率預(yù)測(cè)難度增加,預(yù)測(cè)精度下降,風(fēng)電功率預(yù)測(cè)誤差則會(huì)增大[14-16]。ST的具體表達(dá)式為[14-16]
(6)
用當(dāng)日預(yù)測(cè)功率平均值表示當(dāng)日風(fēng)電功率水平Pave,若當(dāng)日風(fēng)電功率水平較大,則風(fēng)電功率容易變化,增大風(fēng)電功率預(yù)測(cè)誤差[14-16]。當(dāng)日風(fēng)電功率水平Pave如式(7)所示[14-16]。
(7)
同樣地,若風(fēng)電功率預(yù)測(cè)系統(tǒng)的預(yù)測(cè)精度較低,風(fēng)電功率預(yù)測(cè)誤差也會(huì)較大[14-16]。風(fēng)電功率近期預(yù)測(cè)精度Pre如式(8)所示[14]。
(8)
式中:Pmt為每一時(shí)刻的實(shí)際功率;N2表示近幾日預(yù)測(cè)時(shí)刻數(shù),取96的正整數(shù)倍。
根據(jù)風(fēng)電場歷史運(yùn)行數(shù)據(jù)計(jì)算得到ST、Pave和Pre,并利用式(4)計(jì)算各特征值與平均絕對(duì)誤差的相關(guān)性,選取相關(guān)性強(qiáng)的因素和平均絕對(duì)誤差帶入式(5),利用Matlab進(jìn)行求解,即可得到風(fēng)電功率預(yù)測(cè)誤差估計(jì)模型并求解誤差估計(jì)區(qū)間。
為了驗(yàn)證評(píng)估上述兩種方法的有效性,利用西北地區(qū)某風(fēng)電場2018年6月1日至2018年7月30日的風(fēng)電預(yù)測(cè)功率數(shù)據(jù)和實(shí)際功率數(shù)據(jù),根據(jù)前50日的數(shù)據(jù)樣本,分別采用兩種方法對(duì)2018年7月21日至2018年7月30日進(jìn)行風(fēng)電功率預(yù)測(cè)誤差估計(jì)。
基于得到的風(fēng)電場功率數(shù)據(jù),對(duì)風(fēng)電場的功率預(yù)測(cè)誤差數(shù)據(jù)進(jìn)行歸一化,利用Matlab軟件,根據(jù)第1節(jié)的誤差估計(jì)模型建立步驟,對(duì)預(yù)測(cè)誤差進(jìn)行混合高斯分布擬合,分別建立二權(quán)值和三權(quán)值的混合高斯模型,得到的結(jié)果如表1所示。
表1 二權(quán)值和三權(quán)值的混合高斯模型參數(shù)值
根據(jù)表1分別繪制二權(quán)值和三權(quán)值的混合高斯模型曲線,對(duì)比其概率密度分布圖(如圖1所示)。可以看出,對(duì)于該風(fēng)電場的功率預(yù)測(cè)誤差分布,較二權(quán)值混合高斯模型而言,三權(quán)值混合高斯模型擬合的概率分布曲線更加準(zhǔn)確。
因此,風(fēng)電功率預(yù)測(cè)誤差模型采用三權(quán)值的混合高斯模型,設(shè)置95%的置信水平,得到風(fēng)電功率預(yù)測(cè)誤差估計(jì)區(qū)間為[-25.235 1,24.507 5],其與實(shí)際風(fēng)電運(yùn)行數(shù)據(jù)的對(duì)比如圖2所示。
圖1 不同權(quán)值混合高斯模型分布擬合圖
圖2 基于混合高斯分布擬合法的風(fēng)電功率預(yù)測(cè)誤差區(qū)間估計(jì)結(jié)果
同樣地,基于得到的風(fēng)電場功率數(shù)據(jù),根據(jù)式(6)、式(7)、式(8)分別計(jì)算得到特征值ST、Pave和Pre,通過式(4)計(jì)算得到3個(gè)特征值與日平均絕對(duì)誤差E的相關(guān)性有:rST_E=0.516 9、rPave_E=0.785 0、rPre_ E=0.126 4。
可以看出,對(duì)于該風(fēng)電場,當(dāng)日風(fēng)電功率波動(dòng)ST和當(dāng)日風(fēng)功率幅值Pave與誤差的相關(guān)性較高。因此,以當(dāng)日風(fēng)電功率波動(dòng)和當(dāng)日風(fēng)功率幅值兩個(gè)特征值作為線性回歸方程的自變量來建立如式(5)所示的風(fēng)電功率預(yù)測(cè)誤差估計(jì)模型。
基于以上分析,利用Matlab軟件,計(jì)算得到風(fēng)電功率預(yù)測(cè)誤差估計(jì)模型的線性回歸系數(shù)及其95%的置信區(qū)間,如表2所示。
表2 基于特征值提取的風(fēng)電功率預(yù)測(cè)
根據(jù)表2和式(5),求得風(fēng)電場2018年7月21日至2018年7月30日這10天的風(fēng)電功率預(yù)測(cè)誤差估計(jì)區(qū)間,結(jié)果如圖3所示。
圖3 基于特征值提取的風(fēng)電功率預(yù)測(cè)誤差區(qū)間估計(jì)結(jié)果
風(fēng)電功率預(yù)測(cè)誤差估計(jì)區(qū)間是決定風(fēng)電場儲(chǔ)能容量配置的關(guān)鍵。利用兩個(gè)指標(biāo)對(duì)得到的誤差估計(jì)區(qū)間進(jìn)行評(píng)估:區(qū)間覆蓋率RPICP和區(qū)間平均帶寬RPINAW,這兩個(gè)指標(biāo)的數(shù)學(xué)表達(dá)式如式(9)[9,12]所示。
(9)
式中:N為樣本總數(shù);kt為布爾量,當(dāng)t時(shí)刻的誤差值位于誤差估計(jì)區(qū)間內(nèi),kt為1,否則為0;R為實(shí)際值的變化范圍;Ut(xt)為t時(shí)刻誤差估計(jì)區(qū)間的上限;Lt(xt)為t時(shí)刻誤差估計(jì)區(qū)間的下限。
可以看出,對(duì)于風(fēng)電場儲(chǔ)能的容量配置,RPICP決定了容量配置的有效性,RPINAW決定了容量配置的經(jīng)濟(jì)性。對(duì)于一個(gè)理想的誤差估計(jì)區(qū)間,RPICP越大,覆蓋率越高,儲(chǔ)能容量配置則越有效;RPINAW越小,區(qū)間精度越高,儲(chǔ)能容量配置則越經(jīng)濟(jì)。根據(jù)前兩個(gè)小節(jié)的分析計(jì)算,兩種方法的誤差估計(jì)區(qū)間的RPICP和RPINAW如表3所示。
表3 兩種方法的誤差估計(jì)區(qū)間的指標(biāo)結(jié)果
由表3可知,基于特征值提取法的風(fēng)電功率預(yù)測(cè)區(qū)間估計(jì)的區(qū)間覆蓋率和基于混合高斯分布擬合方法的風(fēng)電功率預(yù)測(cè)區(qū)間估計(jì)的區(qū)間覆蓋率分別為58.85%和92.08%,后者的區(qū)間覆蓋率遠(yuǎn)高于前者。但是基于混合高斯分布擬合方法得到的估計(jì)區(qū)間的帶寬較大,為80.37%,因此根據(jù)該區(qū)間配置儲(chǔ)能容量的經(jīng)濟(jì)性較差,而基于特征值提取法得到的估計(jì)區(qū)間的RPINAW則較小,為25.43%。
根據(jù)前面的分析可以看出,若根據(jù)混合高斯分布擬合得到的誤差估計(jì)區(qū)間進(jìn)行風(fēng)電場儲(chǔ)能容量配置,其有效性較高但經(jīng)濟(jì)性較差;若根據(jù)特征值提取法得到的誤差估計(jì)區(qū)間進(jìn)行儲(chǔ)能容量配置,其經(jīng)濟(jì)性較好但有效性較低。為了解決上述問題,兼顧儲(chǔ)能容量配置時(shí)的有效性和經(jīng)濟(jì)性,基于混合高斯模型,結(jié)合馬爾可夫模型,提出了一種MM-GMM優(yōu)化預(yù)測(cè)誤差區(qū)間估計(jì)算法。
由于風(fēng)本身固有的隨機(jī)性和波動(dòng)性,風(fēng)電功率預(yù)測(cè)誤差也具有較強(qiáng)的不確定性,風(fēng)電功率預(yù)測(cè)通常只與相鄰時(shí)段有關(guān),而與過去所處的狀態(tài)無關(guān),因此,考慮在風(fēng)電預(yù)測(cè)誤差區(qū)間估計(jì)中引入馬爾可夫模型。
若隨機(jī)過程具有“無后效性”,即在已知現(xiàn)在狀態(tài)的前提下,其未來的狀態(tài)與過去的狀態(tài)無關(guān),則稱其為馬爾可夫過程[20-21]。
定義P為馬爾可夫過程的一步狀態(tài)轉(zhuǎn)移概率矩陣,Pij為狀態(tài)轉(zhuǎn)移矩陣P中由狀態(tài)Si一步轉(zhuǎn)移到狀態(tài)Sj的概率,根據(jù)其無后效性有[20-21]:
Pij(t)=P{S(t+1)=j|S(t)=i}
(10)
式中:S(t)=i表示t時(shí)刻的狀態(tài)為i;S(t+1)=j表示t+1時(shí)刻的狀態(tài)為j。
根據(jù)上述分析,結(jié)合第1節(jié)的混合高斯模型的求解過程,MM-GMM優(yōu)化預(yù)測(cè)誤差區(qū)間估計(jì)算法的具體步驟如下:
1)利用EM算法求出樣本數(shù)據(jù)中每個(gè)時(shí)刻的功率預(yù)測(cè)誤差處于混合高斯分布中的具體分布及其均值和標(biāo)準(zhǔn)差;
2)根據(jù)計(jì)算得到的每個(gè)時(shí)刻誤差所處的分布狀態(tài),計(jì)算馬爾可夫過程的一階狀態(tài)轉(zhuǎn)移矩陣PE;
3)根據(jù)最近時(shí)刻所處的狀態(tài),利用計(jì)算得到的一階狀態(tài)轉(zhuǎn)移矩陣PE,預(yù)測(cè)未來一天各時(shí)刻誤差所處的分布狀態(tài);
4)設(shè)置置信水平,計(jì)算預(yù)測(cè)狀態(tài)所處分布的對(duì)應(yīng)置信區(qū)間即為該時(shí)刻的預(yù)測(cè)誤差估計(jì)區(qū)間。
對(duì)所提的優(yōu)化算法進(jìn)行算例驗(yàn)證,同樣地,利用西北地區(qū)某風(fēng)電場的數(shù)據(jù)樣本,采用所提的優(yōu)化算法對(duì)2018年7月21日至2018年7月30日進(jìn)行風(fēng)電功率預(yù)測(cè)誤差估計(jì)。每個(gè)狀態(tài)采用95%的置信區(qū)間,得到的結(jié)果如圖4所示。
圖4 MM-GMM優(yōu)化預(yù)測(cè)誤差區(qū)間估計(jì)算法的區(qū)間估計(jì)結(jié)果
根據(jù)如圖4所示的估計(jì)區(qū)間,計(jì)算該區(qū)間RPICP為71.56%,RPINAW為26.01%。3種方法的誤差估計(jì)區(qū)間指標(biāo)結(jié)果的對(duì)比如表4所示??梢钥闯觯c前兩種方法相比,所提的優(yōu)化算法不僅有效性較高,且區(qū)間較窄,能夠?yàn)轱L(fēng)電場的儲(chǔ)能容量配置提供有效的指導(dǎo)信息,經(jīng)濟(jì)性較好。
表4 3種方法的誤差估計(jì)區(qū)間的指標(biāo)結(jié)果
對(duì)混合高斯分布擬合法和特征值提取法這兩種典型的風(fēng)電功率預(yù)測(cè)誤差估計(jì)算法進(jìn)行的詳細(xì)研究表明:基于混合高斯分布擬合的誤差估計(jì)方法得到的誤差估計(jì)區(qū)間進(jìn)行儲(chǔ)能容量配置的有效性高但經(jīng)濟(jì)性較差;基于特征值提取的誤差估計(jì)方法得到的誤差估計(jì)區(qū)間進(jìn)行儲(chǔ)能容量配置的經(jīng)濟(jì)性好但有效性較低。
為了有效估計(jì)風(fēng)電功率預(yù)測(cè)誤差,上面給出對(duì)于風(fēng)電場儲(chǔ)能配置具有指導(dǎo)意義的預(yù)測(cè)誤差估計(jì)區(qū)間,在混合高斯模型的基礎(chǔ)上,對(duì)風(fēng)電功率預(yù)測(cè)誤差進(jìn)行狀態(tài)劃分,結(jié)合馬爾可夫模型,提出了一種MM-GMM優(yōu)化誤差區(qū)間估計(jì)算法并進(jìn)行了算例驗(yàn)證。結(jié)果表明,基于所提的優(yōu)化算法得到的估計(jì)區(qū)間不僅覆蓋率較高,而且?guī)捿^小,兼顧了風(fēng)電場儲(chǔ)能容量配置時(shí)的有效性和經(jīng)濟(jì)性,具有較好的綜合性能,能夠?yàn)楦纳骑L(fēng)電功率預(yù)測(cè)誤差的儲(chǔ)能系統(tǒng)容量配置提供理論依據(jù)。