劉念璋,楊 健,柳 玉,姜尚光,柯德平,孫元章
(1. 武漢大學(xué) 電氣與自動化學(xué)院,湖北 武漢 430072;2. 國家電網(wǎng)有限公司華北分部,北京 100000)
隨著風(fēng)電滲透率的不斷提高,風(fēng)電的隨機(jī)波動性給電力系統(tǒng)的安全、穩(wěn)定和經(jīng)濟(jì)運(yùn)行帶來了巨大的挑戰(zhàn)。高精度的風(fēng)電功率預(yù)測對于電力系統(tǒng)的調(diào)度控制、安全防御等具有重要的意義與價值[1]。然而,現(xiàn)有的風(fēng)電功率預(yù)測方法不可避免地存在預(yù)測誤差[2],較大的預(yù)測誤差會導(dǎo)致電力系統(tǒng)出現(xiàn)棄風(fēng)、切負(fù)荷等現(xiàn)象。
近年來,國內(nèi)外對風(fēng)電功率預(yù)測誤差的常用處理方法是對其進(jìn)行統(tǒng)計(jì)特性建模,將所得模型的結(jié)果疊加到風(fēng)電功率預(yù)測值上,從而獲得風(fēng)電功率概率分布信息,并將其應(yīng)用于考慮風(fēng)電不確定性的隨機(jī)經(jīng)濟(jì)調(diào)度計(jì)算中[3?4]。建模過程通常為條件概率分布建模:文獻(xiàn)[5]利用經(jīng)驗(yàn)累積分布函數(shù)和非參數(shù)回歸方法建立各風(fēng)電功率預(yù)測區(qū)間的預(yù)測誤差概率分布模型;文獻(xiàn)[6]通過對各功率預(yù)測區(qū)間的預(yù)測誤差進(jìn)行統(tǒng)計(jì)分析,利用通用分布模型對其進(jìn)行建模;文獻(xiàn)[7]利用蒙特卡羅雙層抽樣技術(shù)和最大似然估計(jì)法建立各風(fēng)速區(qū)間的風(fēng)速-風(fēng)電功率聯(lián)合條件概率分布模型;文獻(xiàn)[8]按照風(fēng)速對歷史誤差進(jìn)行聚類,并利用經(jīng)驗(yàn)分布建立不同風(fēng)況下的誤差概率分布模型。然而,從統(tǒng)計(jì)原理角度看,上述文獻(xiàn)均未說明預(yù)測誤差的條件概率模型相較于簡單的預(yù)測誤差頻次模型的優(yōu)勢。
事實(shí)上,風(fēng)電的隨機(jī)波動性是各種復(fù)雜天氣因素共同作用的結(jié)果,預(yù)測方法的預(yù)測誤差與各氣象因素密切相關(guān)[9?10],因此,可以建立以氣象信息為依據(jù)的風(fēng)電功率預(yù)測誤差條件概率分布[11],即對氣象數(shù)據(jù)進(jìn)行分類并建立各類氣象數(shù)據(jù)對應(yīng)的風(fēng)電功率預(yù)測誤差數(shù)據(jù)的概率模型。值得一提的是,上述風(fēng)電功率預(yù)測誤差先驗(yàn)概率知識(即不同氣象數(shù)據(jù)類別對應(yīng)不同的預(yù)測誤差概率分布)要能從統(tǒng)計(jì)學(xué)角度保障其應(yīng)用價值。
針對風(fēng)電功率短期預(yù)測誤差,本文提出一種分布函數(shù)差異化導(dǎo)向的氣象條件概率建模方法。將歷史氣象數(shù)據(jù)聚合成多個類別(氣象模式),并建立對應(yīng)的風(fēng)電功率預(yù)測誤差的條件概率模型,該模型可應(yīng)用于日前隨機(jī)經(jīng)濟(jì)調(diào)度中。與現(xiàn)有氣象模式分類方法相比,本文方法的主要創(chuàng)新點(diǎn)在于,在氣象數(shù)據(jù)的聚類過程中考慮對應(yīng)預(yù)測誤差分布函數(shù)的差異性,保證得到的預(yù)測誤差條件概率模型在應(yīng)用于隨機(jī)經(jīng)濟(jì)調(diào)度時可以取得比簡單的預(yù)測誤差頻次模型更好的決策結(jié)果,即從統(tǒng)計(jì)學(xué)角度提升電網(wǎng)的風(fēng)電消納水平。
從概率論角度而言,應(yīng)用了更多經(jīng)驗(yàn)的貝葉斯推理一般要優(yōu)于簡單的頻次推理,即相較于風(fēng)電功率預(yù)測誤差頻次模型,以氣象信息為推理依據(jù)的風(fēng)電功率預(yù)測誤差條件概率模型通常更加有利于解決隨機(jī)調(diào)度決策問題。本文建立風(fēng)電功率預(yù)測誤差(氣象)條件概率模型的基本思路如下。
1)基于某風(fēng)電場同一采樣時刻的多維歷史氣象數(shù)據(jù)(風(fēng)速、氣溫、氣壓等)和歷史風(fēng)電功率預(yù)測誤差數(shù)據(jù)(最長提前預(yù)測時間為24 h),將歷史氣象數(shù)據(jù)進(jìn)行分類,將每類相似氣象樣本構(gòu)成的氣象數(shù)據(jù)集稱為一個氣象模式,擬合每類氣象數(shù)據(jù)對應(yīng)的歷史風(fēng)電功率預(yù)測誤差數(shù)據(jù)的分布函數(shù),并將其稱為風(fēng)電場這類氣象數(shù)據(jù)或這個氣象模式對應(yīng)的風(fēng)電功率預(yù)測誤差條件概率模型。
2)對于數(shù)值天氣預(yù)報NWP(Numerical Weather Prediction)在日前給出的未來某時刻的氣象預(yù)測結(jié)果,通過模式識別將其歸屬于某個氣象模式,并將該氣象模式對應(yīng)的風(fēng)電功率預(yù)測誤差概率密度函數(shù)PDF(Probability Density Function)作為該時刻的風(fēng)電功率預(yù)測誤差條件概率模型。同時,將該條件概率模型的結(jié)果與該時刻風(fēng)電功率預(yù)測值相疊加,從而得到該時刻風(fēng)電場的風(fēng)電功率分布函數(shù)模型。
具體建模流程圖如附錄A 圖A1 所示。不難看出,以氣象信息為依據(jù)的預(yù)測誤差條件概率模型在應(yīng)用于解決隨機(jī)調(diào)度決策問題時的一個關(guān)鍵之處在于氣象模式分類提供了有效的先驗(yàn)統(tǒng)計(jì)信息。若不考慮氣象先驗(yàn)統(tǒng)計(jì)信息的有效性,則可能導(dǎo)致所得的不同氣象條件對應(yīng)的預(yù)測誤差氣象條件概率模型間無明顯區(qū)別,這會使得預(yù)測誤差氣象條件概率建模的思路不會為解決隨機(jī)調(diào)度決策問題提供實(shí)質(zhì)性幫助。舉例說明如附錄B所示。
基于上述分析,本文提出風(fēng)電功率預(yù)測誤差分布函數(shù)差異化導(dǎo)向的氣象數(shù)據(jù)模式分類方法,以使得分類后各氣象模式對應(yīng)的預(yù)測誤差概率密度函數(shù)存在明顯的差異性,即保證先驗(yàn)的氣象模式分類信息對于解決隨機(jī)調(diào)度決策問題是有效的。此外,如同一般的分類問題,分類后的氣象數(shù)據(jù)需要具有良好的聚合特性(即分類邊界明顯)。圖1 為上述分類方法的效果圖,圖中灰度反映氣象樣本密集程度。由圖可見,在保證分類后氣象數(shù)據(jù)良好的聚合效果下,各模式的風(fēng)電功率預(yù)測誤差分布具有明顯的差異性,如模式Ⅰ下多數(shù)為具有較小預(yù)測誤差的點(diǎn),而模式Ⅲ下則相反。
圖1 分布函數(shù)差異化導(dǎo)向的氣象數(shù)據(jù)模式分類Fig.1 Classification of weather data modes based on differentiation orientation of distribution function
本文選擇風(fēng)電場風(fēng)機(jī)輪轂處的風(fēng)速、風(fēng)向、氣溫和氣壓構(gòu)成多維氣象向量,利用改進(jìn)的K-means 算法對該氣象向量的歷史數(shù)據(jù)進(jìn)行聚類,同時,對于NWP 給出的未來某時刻該氣象向量的預(yù)測值,采用支持向量機(jī)SVM(Support Vector Machine)算法對其進(jìn)行分類識別??紤]到不同季節(jié)間氣象的差異,對歷史數(shù)據(jù)按季節(jié)分箱后得到各季度歷史數(shù)據(jù)子集,再采用該算法進(jìn)行分類識別,以提高建模精度。
2.1.1 分布函數(shù)差異化導(dǎo)向
傳統(tǒng)聚類算法(如K-means 算法)多是以樣本自身間的距離作為相似性度量[12],若將其應(yīng)用于本文中的氣象數(shù)據(jù)聚類分析,則聚類過程僅涉及氣象數(shù)據(jù),而不能考慮聚類后各氣象模式下的預(yù)測誤差概率分布特性。如前所述,若各氣象模式間的預(yù)測誤差概率分布差異不大,則氣象模式-誤差分布的先驗(yàn)信息對解決隨機(jī)調(diào)度決策問題沒有實(shí)質(zhì)性幫助。為此,本文以預(yù)測誤差分布函數(shù)差異化為導(dǎo)向,在聚類時引入均方根誤差RMSE(Root Mean Squared Error)作為兩概率分布間的相似度指標(biāo),如式(1)所示。
式中:eRMSE為RMSE;L1、L2為2 個氣象模式對應(yīng)的預(yù)測誤差概率密度函數(shù)曲線,可以分別由這2 個氣象模式對應(yīng)的歷史預(yù)測誤差數(shù)據(jù)集ΔP1、ΔP2擬合計(jì)算得到(如采用MATLAB中的核密度估計(jì)函數(shù)ksdensi?ty);L1,i、L2,i為兩曲線上對應(yīng)的第i個相同預(yù)測誤差值的概率密度值;s為采樣點(diǎn)數(shù)。eRMSE越小,則兩概率密度曲線間的相似度越高。
為表征某一聚類結(jié)果下各氣象模式之間風(fēng)電功率預(yù)測誤差概率分布的總體差異程度,本文提出指標(biāo)累積均方根誤差SRMSE(Sum of Root Mean Squared Error),如式(2)所示。
式中:eSRMSE為SRMSE;K為氣象模式數(shù);FPD(?)為概率密度函數(shù)。eSRMSE表征了各氣象模式下預(yù)測誤差概率密度函數(shù)曲線間的總體差異程度。本文將SRMSE 最大化作為聚類目標(biāo)函數(shù),以保證最終聚類結(jié)果下各氣象模式間的預(yù)測誤差概率分布有明顯區(qū)別。
從基本的應(yīng)用邏輯上而言,一種成熟的商用預(yù)測軟件(方法)應(yīng)在多數(shù)天氣條件下能給出較好的預(yù)測結(jié)果。過多地聚焦于分布函數(shù)間差異的最大化將可能導(dǎo)致分布函數(shù)先驗(yàn)信息有效性與合理性之間的失衡,因此,聚類過程還應(yīng)對聚類結(jié)果的合理性進(jìn)行判斷。由圖2 中的預(yù)測誤差概率密度函數(shù)曲線可見:高精度的預(yù)測誤差概率密度函數(shù)曲線呈現(xiàn)高窄的形狀且函數(shù)值集中在0 附近,而低精度的預(yù)測誤差概率密度函數(shù)曲線則較扁平。因此,本文利用反映概率密度函數(shù)曲線陡峭程度的峰度系數(shù)Kurtosis來衡量各氣象模式下預(yù)測誤差概率密度函數(shù)曲線對應(yīng)的精度水平,如式(3)所示。
圖2 預(yù)測誤差概率密度函數(shù)曲線及其峰度系數(shù)Fig.2 PDF curves of forecasting error and corresponding Kurtosis
式中:Ikur為計(jì)算出的峰度系數(shù)Kurtosis;Δpi為某氣象模式下預(yù)測誤差數(shù)據(jù)集中的第i個樣本;Δpˉ為該模式下所有預(yù)測誤差的均值;h為該模式下預(yù)測誤差的樣本數(shù)。本文以3 作為峰度系數(shù)Kurtosis 的基準(zhǔn)值,定義指標(biāo)Nkur,表示預(yù)測誤差概率密度函數(shù)曲線的Ikur>3 的氣象模式對應(yīng)樣本數(shù)之和與總樣本數(shù)之比,如式(4)所示。
式中:“#”表示對集合中樣本進(jìn)行計(jì)數(shù);ΔP為總預(yù)測誤差數(shù)據(jù)集;n為ΔP中的樣本數(shù);ΔP'為預(yù)測誤差概率密度函數(shù)曲線的Ikur>3 的氣象模式對應(yīng)的預(yù)測誤差數(shù)據(jù)集。如果預(yù)測誤差概率密度函數(shù)曲線呈明顯的多峰或厚尾分布[13],則僅以Ikur>3 進(jìn)行判斷可能不夠充分,此時可基于標(biāo)準(zhǔn)GB/T 40607—2021《調(diào)度側(cè)風(fēng)電或光伏功率預(yù)測系統(tǒng)技術(shù)要求》[14]中對風(fēng)電場短期預(yù)測的準(zhǔn)確率大于83%的要求進(jìn)行二次判斷來獲取指標(biāo)Nkur。本文中,當(dāng)Nkur>60%時,認(rèn)為聚類結(jié)果滿足預(yù)測精度水平較高的氣象模式對應(yīng)的樣本占多數(shù)的統(tǒng)計(jì)特性要求。
2.1.2 聚類參數(shù)的選取
在K-means 算法中,聚類數(shù)與初始聚類中心的選取會對聚類效果產(chǎn)生直接影響。本文采用肘部法來確定聚類數(shù)K,并基于數(shù)據(jù)密度形成初始聚類中心候選集Wo。
肘部法的原理[15]是在K取不同值時對樣本進(jìn)行K-means 算法計(jì)算,隨著K的不斷增大,樣本的誤差平方和SSE(Sum of Squared Error)會不斷減小,而其減小速率會在理想聚類數(shù)處驟減,如附錄A 圖A2所示,因此,根據(jù)SSE-K關(guān)系曲線的肘部即可確定理想聚類數(shù)。
對于氣象數(shù)據(jù)集W={w1,w2,…,wi,…,wn},其元素wi為某采樣時刻的多維氣象向量,則wi的數(shù)據(jù)密度Ndens(wi)可用以wi為中心、r為半徑的球體內(nèi)所包含的其余樣本數(shù)來表示,如式(5)所示。
式中:D(w',wi)為樣本w'與wi之間的距離,w'表示W(wǎng)中與wi的距離小于r的樣本。
通過設(shè)置合理的半徑r,選取數(shù)據(jù)密度大于密度閾值μ的樣本點(diǎn)形成初始聚類中心候選集Wo,即可排除異常點(diǎn)、離群點(diǎn)的影響。r一般取為樣本平均距離Davg[16],Davg的表達(dá)式如式(6)所示。
為進(jìn)一步體現(xiàn)氣象數(shù)據(jù)的局部密度特征,本文取r=Davg/2。由于隨著W中樣本數(shù)的增多,樣本數(shù)據(jù)密度會提高,同時Wo中的樣本數(shù)應(yīng)隨著K的增大而增加,因此,μ應(yīng)正比于n/K??紤]到各季度間氣候差異較大,氣象數(shù)據(jù)聚合程度不同,若取μ=n/K,則可能導(dǎo)致某季度的Wo為空集,因此,本文在n/K的基礎(chǔ)上對各季度的μ采取不同的經(jīng)驗(yàn)系數(shù)進(jìn)行修正。
2.1.3 算法流程
本文所提改進(jìn)K-means 算法的基本思想是,通過提供可靠的初始聚類中心,以各氣象模式間的風(fēng)電功率預(yù)測誤差分布函數(shù)差異最大化為導(dǎo)向,以預(yù)測精度水平高的氣象模式對應(yīng)的歷史樣本占多數(shù)的統(tǒng)計(jì)特性為約束條件,迭代進(jìn)行經(jīng)典K-means 算法計(jì)算,直到得到有效且合理的氣象模式劃分結(jié)果,具體流程如下。
1)根據(jù)某季度下的歷史氣象數(shù)據(jù)集W與歷史風(fēng)電功率預(yù)測誤差數(shù)據(jù)集ΔP,利用肘部法確定該季度氣象模式數(shù)K。
2)計(jì)算W中各樣本點(diǎn)的數(shù)據(jù)密度,將其與密度閾值μ進(jìn)行比較得到初始聚類中心候選集Wo,并從中隨機(jī)選取zmax個點(diǎn)作為第1 個初始聚類中心的候選點(diǎn)集Wo,1(迭代次數(shù)z=1)。
3)取Wo,1中的第z個點(diǎn)作為第1 個初始聚類中心O'1,計(jì)算Wo中各點(diǎn)與該初始聚類中心的距離,取距離最遠(yuǎn)的點(diǎn)作為第2 個初始聚類中心O'2,計(jì)算Wo中其余各點(diǎn)與初始聚類中心O'1和O'2的最近距離,取距離最遠(yuǎn)的點(diǎn)作為第3 個初始聚類中心O'3,以此類推,直至求出K個初始聚類中心。
4)基于步驟1)與步驟3)所得聚類數(shù)與初始聚類中心,進(jìn)行經(jīng)典K-means 算法計(jì)算,得到相應(yīng)聚類結(jié)果。
5)基于聚類結(jié)果對相應(yīng)風(fēng)電功率預(yù)測誤差數(shù)據(jù)進(jìn)行分箱,并分別對各箱誤差數(shù)據(jù)擬合其概率密度函數(shù)。
6)校驗(yàn)聚類結(jié)果對應(yīng)的指標(biāo)Nkur是否大于60%:若是,則轉(zhuǎn)至下一步;否則,返回步驟3),并取Wo,1中下一個點(diǎn)進(jìn)行計(jì)算(z=z+1)。
7)計(jì)算聚類結(jié)果對應(yīng)的目標(biāo)函數(shù)SRMSE,比較相鄰2 次聚類的SRMSE 大小,保存其值較大者對應(yīng)的聚類結(jié)果。
8)重復(fù)步驟3)—7),直到SRMSE 大于閾值λ,即各氣象模式間風(fēng)電功率預(yù)測誤差概率分布的差異足夠大或滿足最大迭代次數(shù)(z=zmax)。
基于聚類分析所得的氣象分類-誤差分布的先驗(yàn)信息,在實(shí)際應(yīng)用時需對NWP 給出的未來某時刻氣象向量預(yù)測值進(jìn)行準(zhǔn)確分類判斷,以提供相應(yīng)的風(fēng)電功率預(yù)測誤差條件概率模型。考慮到SVM 算法在處理氣象數(shù)據(jù)等高維輸入空間的非線性分類問題時的高效性[17?18],本文利用該算法對未來預(yù)測的氣象向量數(shù)據(jù)進(jìn)行模式識別。
由于SVM 只能解決二分類問題,當(dāng)氣象模式數(shù)大于2 時,采用一對一法[17]。為提高SVM 分類器的分類準(zhǔn)確率,對主要影響參數(shù)懲罰因子C和核函數(shù)寬度θ采用網(wǎng)格搜索與三折交叉驗(yàn)證進(jìn)行尋優(yōu)[19]。定義分類準(zhǔn)確率Iacc為:
式中:n1為SVM準(zhǔn)確分類的氣象數(shù)據(jù)樣本數(shù);n2為識別的總氣象數(shù)據(jù)樣本數(shù)。
本文在上述氣象數(shù)據(jù)聚類過程中使用了核密度估計(jì)法來得到預(yù)測誤差的概率密度函數(shù)曲線,該方法能真實(shí)地反映數(shù)據(jù)的概率分布情況,具有很高的精度且抗干擾數(shù)據(jù)能力強(qiáng)。然而,該方法得到的高擬合精度的概率密度函數(shù)沒有解析表達(dá)式,在應(yīng)用于隨機(jī)調(diào)度決策問題時一般只能采用蒙特卡羅模擬對其進(jìn)行處理,影響隨機(jī)調(diào)度決策的效率。因此,本文進(jìn)一步采用通用分布對各氣象模式下的風(fēng)電功率預(yù)測誤差進(jìn)行概率分布擬合。相比于正態(tài)分布與貝塔分布,通用分布能夠?qū)Ω鞣N概率分布進(jìn)行解析及準(zhǔn)確表征,并且其累積分布函數(shù)CDF(Cumulative Distribution Function)可逆,有利于隨機(jī)調(diào)度問題計(jì)算效率的提高[6]。
通用分布的概率密度函數(shù)表達(dá)式為:
式中:FPD(x)為通用分布的概率密度函數(shù),x為隨機(jī)變量;α、β、γ為形狀參數(shù)。基于式(8),可采用非線性最小二乘擬合法求出相應(yīng)風(fēng)電功率預(yù)測誤差概率分布對應(yīng)的通用分布的形狀參數(shù)。擬合結(jié)果采用決定系數(shù)R2以及RMSE進(jìn)行評估,R2表達(dá)式如式(9)所示。R2越接近1,RMSE越接近0,則表明擬合效果越好,模型準(zhǔn)確度越高。
式中:yi為第i個待擬合值為yi的擬合值;yˉ為所有待擬合值的均值。
本文利用中國華北地區(qū)某風(fēng)電場2018 年全年每15 min 的實(shí)測歷史氣象數(shù)據(jù)及風(fēng)電功率預(yù)測誤差數(shù)據(jù)進(jìn)行算例分析,所用數(shù)據(jù)均已采用刪除法與0-1標(biāo)準(zhǔn)化進(jìn)行預(yù)處理。此外,將所有數(shù)據(jù)按均勻隨機(jī)采樣的方式分成訓(xùn)練集和測試集,數(shù)據(jù)量之比為4∶1。
將歷史氣象數(shù)據(jù)(訓(xùn)練集)劃分為4 個季度下的子集,分別采用肘部法得到各季度的SSE-K關(guān)系曲線,如附錄A 圖A3所示,第1—4季度氣象模式數(shù)分別取為3、4、3、3。
利用改進(jìn)的K-means 算法對各季度氣象數(shù)據(jù)分別進(jìn)行聚類,其中第1—4 季度μ的經(jīng)驗(yàn)值分別取為n/( 10K)、n/( 6K)、n/( 10K)、n/( 6K),SRMSE 的閾值λ取為0.02,可得到各季度的聚類效果如附錄A 圖A4所示,可見,各氣象模式下的氣象向量樣本均有較明顯的分群聚集現(xiàn)象,如以第1 季度為例,氣象模式1呈現(xiàn)出低風(fēng)速、東風(fēng)的特性,氣象模式2 為高溫、西風(fēng),氣象模式3 為低溫、西風(fēng)。對各氣象模式下歷史風(fēng)電功率預(yù)測誤差數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,得到對應(yīng)的預(yù)測誤差概率密度函數(shù)曲線,如附錄A 圖A5 所示,可見,各氣象模式對應(yīng)的風(fēng)電功率預(yù)測誤差概率分布間有較明顯的區(qū)別。
為進(jìn)一步驗(yàn)證各氣象模式下預(yù)測誤差概率分布間的差異性,采用經(jīng)典K-means算法對第3季度的氣象數(shù)據(jù)樣本進(jìn)行聚類,得到多種聚類結(jié)果,計(jì)算各聚類結(jié)果對應(yīng)的SRMSE,取其中最優(yōu)的聚類結(jié)果與改進(jìn)K-means 算法的聚類結(jié)果進(jìn)行對比,如圖3 所示。在經(jīng)典K-means 算法產(chǎn)生的多種聚類結(jié)果中,其SRMSE 最大為0.019 4,而本文所提改進(jìn)的K-means算法所得結(jié)果的SRMSE 為0.022 7,可見,以分布函數(shù)差異化為導(dǎo)向的改進(jìn)的K-means 算法能得到預(yù)測誤差概率分布間差異最大的氣象數(shù)據(jù)聚類劃分。同時,第1—4 季度聚類結(jié)果對應(yīng)的Nkur分別為60.63%、74.63%、61.77%、60.06%,均在60%以上,這表明滿足預(yù)測精度水平較高的氣象模式對應(yīng)的歷史樣本占多數(shù)的統(tǒng)計(jì)特性要求。
圖3 改進(jìn)的K-means算法與經(jīng)典K-means算法所得概率密度函數(shù)曲線Fig.3 PDF curves obtained by modified K-means algorithm and classic K-means algorithm
基于前述聚類分析結(jié)果,對訓(xùn)練集氣象數(shù)據(jù)進(jìn)行SVM 氣象模式識別訓(xùn)練。采用網(wǎng)格搜索與三折交叉驗(yàn)證進(jìn)行參數(shù)尋優(yōu),再基于訓(xùn)練結(jié)果利用測試集對SVM 的分類準(zhǔn)確率進(jìn)行校驗(yàn)。為避免過擬合帶來的訓(xùn)練結(jié)果泛化性較差或者欠擬合帶來的識別準(zhǔn)確率較低,設(shè)置C與θ的變化范圍均為[2-3,27],變化步長均為20.5。此外,如果將基于所有數(shù)據(jù)(包括訓(xùn)練集和測試集)的氣象數(shù)據(jù)分類結(jié)果作為標(biāo)準(zhǔn),則可在測試集上校驗(yàn)訓(xùn)練集得到的SVM 的氣象模式識別正確率。表1 給出了利用訓(xùn)練集數(shù)據(jù)得到的各季度SVM參數(shù)尋優(yōu)及校驗(yàn)結(jié)果。
表1 各季度SVM參數(shù)尋優(yōu)及校驗(yàn)結(jié)果Table 1 SVM parameter optimization and verification results in each season
由表1 可見,各季度SVM 的最優(yōu)分類準(zhǔn)確率均在99%以上,能滿足在實(shí)際調(diào)度計(jì)算時根據(jù)NWP信息匹配出相應(yīng)氣象模式的需求。經(jīng)過SVM 識別后,對測試集下各氣象模式對應(yīng)的預(yù)測誤差數(shù)據(jù)進(jìn)行概率統(tǒng)計(jì),得到的概率密度函數(shù)曲線(第1 季度)如附錄A 圖A6所示??梢钥闯?,同一氣象模式下訓(xùn)練集誤差數(shù)據(jù)和測試集誤差數(shù)據(jù)的概率分布較為接近,這也在一定程度上說明了將氣象模式作為風(fēng)電功率預(yù)測誤差條件概率中的先驗(yàn)條件的正確性。
基于4.1 節(jié)得到的各氣象模式下風(fēng)電功率預(yù)測誤差概率密度函數(shù)曲線,利用通用分布和非線性最小二乘法進(jìn)行擬合,得到各季度各氣象模式下預(yù)測誤差的通用分布模型參數(shù)及對應(yīng)的評價指標(biāo),如表2 所示。取第1 季度各氣象模式下預(yù)測誤差的通用分布概率密度函數(shù)曲線與原始概率密度函數(shù)曲線進(jìn)行對比,如附錄A 圖A7所示。上述結(jié)果均表明通用分布可以比較準(zhǔn)確地表征風(fēng)電功率預(yù)測誤差的概率分布。同時,通用分布良好的解析特性也有利于高效解決考慮風(fēng)電功率預(yù)測誤差的隨機(jī)調(diào)度決策問題。
表2 風(fēng)電功率預(yù)測誤差通用分布建模結(jié)果Table 2 Modeling results of versatile distribution for wind power forecasting error
本節(jié)將進(jìn)一步通過一個簡單的考慮風(fēng)電功率預(yù)測誤差不確定性的隨機(jī)調(diào)度決策問題來說明風(fēng)電功率預(yù)測誤差分布函數(shù)差異化導(dǎo)向的氣象模式分類的有效性。為與本文所提的基于氣象模式分類的風(fēng)電功率預(yù)測誤差條件概率模型進(jìn)行對比,設(shè)置不考慮氣象信息的簡單統(tǒng)計(jì)頻次模型(簡稱對比模型),即各調(diào)度時刻的預(yù)測誤差服從相同的概率分布(由歷史預(yù)測誤差數(shù)據(jù)擬合得到)。
本節(jié)所使用的隨機(jī)調(diào)度決策問題是一個理想化的單時間斷面隨機(jī)最優(yōu)潮流問題,數(shù)學(xué)描述如下:
式中:N1為火電機(jī)組數(shù);ak、bk、ck為第k臺火電機(jī)組的燃料成本系數(shù);PM,k為第k臺火電機(jī)組的出力;PM,k,min、PM,k,max分別為第k臺火電機(jī)組的最小、最大出力;RM,k為第k臺火電機(jī)組的上備用;PF,i為第i座風(fēng)電場的出力;為第i座風(fēng)電場的風(fēng)電功率預(yù)測值;N2為風(fēng)電場數(shù);為置信度v下第i座風(fēng)電場的出力分布范圍下界(零出力對應(yīng)的置信度為100%);PL為系統(tǒng)總負(fù)荷。該決策問題可描述為:給定某一置信度下風(fēng)電場出力的下限,在滿足發(fā)電-負(fù)荷平衡的要求下,調(diào)整火電機(jī)組的出力來實(shí)現(xiàn)盡可能小的燃料費(fèi)用(即盡可能多地利用風(fēng)能)?;痣姍C(jī)組出力越低,則認(rèn)為風(fēng)電出力越高,風(fēng)電調(diào)度出力與出力下限的差距越大,將有可能無法滿足火電機(jī)組最大備用要高于該差距的約束條件,此時系統(tǒng)可能會損失負(fù)荷??梢钥闯?,該決策問題的解決依賴于對某一高置信度下風(fēng)電出力下限的準(zhǔn)確估計(jì)。
根據(jù)上述模型,本文以包含1座風(fēng)電場和6臺火電機(jī)組的7 機(jī)系統(tǒng)為仿真對象,火電機(jī)組參數(shù)如附錄A 表A1 所示。風(fēng)電場的數(shù)據(jù)來自于前述中國華北某實(shí)際風(fēng)電場的實(shí)際數(shù)據(jù)并進(jìn)行適當(dāng)?shù)娜萘空鬯恪;谠擄L(fēng)電場2018 年3 月24 日至3 月31 日的歷史氣象數(shù)據(jù)及風(fēng)電功率預(yù)測實(shí)際值,在8 d 中,每15 min進(jìn)行1次總共進(jìn)行768次隨機(jī)最優(yōu)潮流計(jì)算。分別采用2 種模型估計(jì)風(fēng)電場出力下限(置信度取為0.95),結(jié)果如圖4 所示。引入歷史風(fēng)電功率實(shí)際值作為對比,實(shí)際值位于2 種模型所估計(jì)下限以上的概率(下限覆蓋率)如表3 所示。下限覆蓋率越高說明所估計(jì)下限的可信度越高??梢?,對比模型由于未進(jìn)行分布函數(shù)差異化導(dǎo)向的條件化建模,所估計(jì)的下限更低,從而覆蓋率更高,但2 種模型對應(yīng)的下限覆蓋率相差較小且均在97%以上,即均具有較高的可信度。同時,排除由預(yù)測值較低而導(dǎo)致的基于2 種模型所估計(jì)的下限均為0 的情況,8 d 內(nèi)基于本文模型所確定的風(fēng)電功率下限更優(yōu)的比例達(dá)到88.44%。這表明本文模型在保證結(jié)果可信的同時也能滿足準(zhǔn)確性的要求,即預(yù)測誤差的建模精度更高。
圖4 2種預(yù)測誤差概率模型得到的風(fēng)電功率下限Fig.4 Lower limits of wind power obtained by two probability models of forecasting error
表3 隨機(jī)調(diào)度決策問題的計(jì)算結(jié)果Table 3 Calculation results of stochastic dispatch and decision making problem
圖5 與表3 給出了2 種模型的調(diào)度結(jié)果??梢姡瑢Ρ饶P驮陲L(fēng)電功率預(yù)測值較高時所確定的風(fēng)電功率調(diào)度值均明顯低于風(fēng)電功率預(yù)測值(由于基于預(yù)測誤差概率分布給出的風(fēng)電出力下限均較低),而本文模型在多數(shù)情況下給出的可信的風(fēng)電出力下限均接近風(fēng)電功率預(yù)測值(即不需要過大的火電備用容量),從而決策的風(fēng)電調(diào)度值均為預(yù)測值。采用本文模型進(jìn)行隨機(jī)調(diào)度決策計(jì)算時,系統(tǒng)風(fēng)電消納量相比對比模型增加了495.67 MW·h。
圖5 2種預(yù)測誤差概率模型得到的風(fēng)電調(diào)度曲線Fig.5 Wind power dispatch curves obtained by two probability models of forecasting error
綜上所述,基于分布函數(shù)差異化導(dǎo)向的風(fēng)電功率預(yù)測誤差氣象條件概率建模方法,能保證用于隨機(jī)調(diào)度決策的氣象模式-誤差分布先驗(yàn)信息的有效性,因此,能從統(tǒng)計(jì)學(xué)角度提升系統(tǒng)消納隨機(jī)性風(fēng)電的水平。
本文考慮氣象對預(yù)測精度的影響,提出一種分布函數(shù)差異化導(dǎo)向的風(fēng)電功率預(yù)測誤差氣象條件概率建模方法,得到的主要結(jié)論如下。
1)先驗(yàn)信息對于隨機(jī)調(diào)度決策問題的價值在于條件概率分布本身的差異性。算例表明,相較于不區(qū)分預(yù)測誤差區(qū)別的統(tǒng)計(jì)頻次建模方法,以分布函數(shù)差異化為導(dǎo)向的風(fēng)電功率預(yù)測誤差條件概率建模方法在應(yīng)用于隨機(jī)調(diào)度決策時可以獲得統(tǒng)計(jì)意義上更優(yōu)的調(diào)度結(jié)果,提升風(fēng)電消納水平。
2)氣象條件與風(fēng)電功率預(yù)測精度緊密相關(guān),可以基于氣象和風(fēng)電功率預(yù)測誤差數(shù)據(jù)挖掘二者的對應(yīng)關(guān)系?;趯?shí)際數(shù)據(jù)的仿真分析表明,以風(fēng)電功率預(yù)測誤差概率分布函數(shù)差異性最大化為目標(biāo),多維氣象數(shù)據(jù)具有良好的聚類特性,驗(yàn)證了氣象數(shù)據(jù)作為預(yù)測誤差水平先驗(yàn)條件的有效性。
附錄見本刊網(wǎng)絡(luò)版(http://www.epae.cn)。