楊 茂,董 昊
(現(xiàn)代電力系統(tǒng)仿真控制與綠色電能新技術教育部重點實驗室(東北電力大學),吉林省吉林市132012)
風電功率區(qū)間預測是指在既定的置信度下,對待預測時刻風電出力的上下邊界進行預測,是提高電力系統(tǒng)經濟運行效率,降低電網安全風險系數(shù)的重要方法[1-2]。根據是否考慮氣象環(huán)境等因素,可以將風電功率區(qū)間預測大體分為統(tǒng)計模型和物理模型[3-4]。
統(tǒng)計模型利用歷史預測結果,對所得誤差進行分類和擬合,結合待預測時刻的點預測結果進而得到功率的上、下邊界[5]。文獻[6]利用混合Gaussian分布近似得到目標隨機變量的條件分布,可以對模型的不確定性定量地描述。文獻[7]利用混合偏態(tài)分布模型估計短期風電預測誤差分布,并通過概率密度曲線非線性擬合進行參數(shù)估計。以上文獻所提方法均為參數(shù)型,即假設誤差滿足某一種特定的分布形式,具體還包括Beta分布[8]、Logistic分布[9]、翹曲高斯分布[10]等。但由于風電出力具有強波動性和高隨機性的特征,實際的預測誤差可能并不符合某一具體的分布,并且同一模型對于不同數(shù)據擬合效果的差異性較大。文獻[11]利用Bootstrap重采樣得到多個風電功率誤差訓練樣本,并結合待預測時刻功率數(shù)據得到區(qū)間預測結果。文獻[12]建立基于徑向基神經網絡的分位數(shù)回歸模型,實現(xiàn)了氣象信息和功率數(shù)據的非線性映射,得到了分位數(shù)形式的短期功率上下邊界值。以上文獻所提方法均為非參數(shù)型,即事先不對誤差概率分布進行假設,更有利于提高誤差概率分布的擬合精度,常用方法還有核密度估計[13]、相關向量機[14]等。
物理模型一般結合地勢、天氣等空氣動力學因素建立物理預測模型,通過數(shù)值天氣預報(numerical weather prediction,NWP)信息來計算風電機組輪轂高度處的風速變化區(qū)間,然后通過尋找風速與功率的非線性關系得到功率概率預測區(qū)間。這類方法能夠快速地捕捉風速的變化,因涉及氣象等信息,數(shù)據量十分龐大,所以計算速度慢、效率低[15-16]。
綜上所述,眾多學者已經在區(qū)間預測領域做了大量深入的研究,但所建立的預測模型大多只選用單一的統(tǒng)計方法或者物理方法,導致了所建立的預測模型無法全面反映歷史數(shù)據和NWP氣象信息對待預測時刻功率的影響。由此,本文提出了一種基于NWP風速分類和蒙特卡洛法的短期風電功率區(qū)間預測模型。首先,按照NWP風速大小對歷史時段的點預測誤差進行分類,并對不同風況下的誤差通過經驗分布模型進行概率分布擬合。其次,對待預測時刻的NWP風速所對應的累計經驗分布概率值進行蒙特卡洛抽樣。最后,在給定的置信水平下求取各待預測時點的功率波動區(qū)間。將統(tǒng)計方法得到的信息與NWP氣象所提供的物理信息綜合起來,經過對比分析,驗證了所提方法的可靠性有所提升。
層次聚類(hierarchical clustering)是數(shù)據特征提取的一種常用聚類算法,通過分析不同類別樣本間的差異,得到一棵具有分層結構的嵌套聚類樹[17]。
層次聚類算法可以分為自下向上的凝聚型和自上向下的分裂型,這2種方法沒有孰優(yōu)孰劣之分,只是在實際應用時要根據數(shù)據特點來考慮分解順序。層次聚類算法的優(yōu)勢在于能夠直接得到一棵完整的聚類樹,無須重新計算各類別間距就可以增加或減少分類數(shù)目。
本文采用層次聚類法對樣本數(shù)據進行聚類,具體步驟如下。
步驟1:以NWP信息中100 m層高風速和風向為特征構造樣本特征矩陣Q。
步驟2:計算各類初始樣本之間的馬氏距離DM,得到距離矩陣D,計算公式如下。
式中:x和y為2個不同的數(shù)據類別;Σ為多維隨機變量的協(xié)方差矩陣,如果協(xié)方差矩陣是單位向量,即各維度獨立同分布,馬氏距離就變成了歐氏距離。
步驟3:計算各類間距,將DM最小的2類凝聚為一個新的類別。
步驟4:重復步驟1至步驟3,直至得到完整的聚類樹,即類別個數(shù)為1。
風電功率區(qū)間預測建模主要分為3個階段:點預測建模、預測誤差概率密度分布建模和區(qū)間預測建模。
極限學習機(extreme learning machine,ELM)屬于單隱含層前饋神經網絡(SLFN)算法。同傳統(tǒng)的智能算法相比,該算法的特點表現(xiàn)為隱含層的節(jié)點參數(shù)均為隨機給定,整個學習過程只需求解輸出權值,是一種學習速度較快的智能算法[18],ELM的結構示意圖如圖1所示,圖中o={oj}。
單隱含層神經網絡可以表示為:
式中:g(?)為激活函數(shù);Wi=[ωi1,ωi2,???,ωiN]T為輸入權重;Xj為第j個輸入特征序列,總數(shù)為N;βi為輸出權重;bi為第i個隱含層單元的偏置;oj為第j個輸出序列;Wi°Xj表示Wi和Xj的內積。
圖1 ELM模型結構示意圖Fig.1 Schematic diagram of ELM model structure
單隱含層神經網絡學習的目標是使得輸出序列oj盡可能接近目標序列tj,即
那么存在βi,Wi和bi使得:
式中:L為隱含層神經元數(shù)目。
式(4)可以用矩陣表示為:
式中:H為隱含層節(jié)點的輸出;β為輸出權重;T為期望輸出。
式中:H+為隱含層輸出矩陣H的Moore-Penrose廣義逆??梢酝ㄟ^正交投影法或奇異值分解(SVD)等方法解析獲取。
傳統(tǒng)風電功率區(qū)間預測一般只考慮預測誤差在不同功率水平下的分布情況,忽略了氣象因素對預測誤差的影響。結合不同風況下風電功率預測誤差的分布特點,改善模型的預測性能,采用經驗分布估計方法建立各類別在不同NWP風速條件下風速-風電功率預測誤差聯(lián)合概率密度分布模型。
經驗分布函數(shù)是對樣本中生成點的累積分布函數(shù)的估計。根據Glivenko-Cantelli定理,它以概率1收斂到該基礎分布,同時也存在一些結果來量化經驗分布函數(shù)與潛在的累積分布函數(shù)的收斂速度。
假設總體變量X存在一組容量為m的樣本觀測值x1,x2,…,xp…,xm,將其按照從小到大的順序重新排列后得到次序統(tǒng)計量x1m,x2m,…,xpm,…,xmm,對于任意實數(shù)x,其經驗分布表達式為:
圖2為對NWP風速進行分類所得到的風速-功率預測誤差聯(lián)合概率密度分布。聯(lián)合概率密度分布圖在待預測時刻NWP風速下的橫截面即為該風速下誤差的概率分布,從而為下一步的區(qū)間預測提供理論依據。
圖2 風速-功率預測誤差聯(lián)合概率密度分布Fig.2 Joint probability density distribution of wind speed-power prediction error
2.3.1 蒙特卡洛法的原理
蒙特卡洛法是一種對一系列數(shù)據進行隨機抽樣的統(tǒng)計試驗法。若要計算某一隨機事件發(fā)生的概率,可進行大量試驗,通過計算其發(fā)生的頻率來估計該事件的概率分布[19]。對于蒙特卡洛法來說,最重要、最基本的試驗是對一個概率分布在(0,1)上的分布進行抽樣統(tǒng)計,而通過誤差統(tǒng)計分析得到的累計概率密度分布恰好為一個(0,1)上的分布,從而印證了采用蒙特卡洛法的可行性。
蒙特卡洛法作為廣泛使用的一種隨機抽樣方法,其優(yōu)勢在于靈活性高、普適性強。但是在實驗中需要對樣本進行重復采樣,因此對計算機的性能提出了更高的要求。
2.3.2 基于蒙特卡洛法的短期風電功率區(qū)間預測
由于經驗分布擬合得到的是非連續(xù)的概率密度分布函數(shù),因此難以采用傳統(tǒng)的基于連續(xù)分布函數(shù)的分位數(shù)回歸方法,但是對于累計密度函數(shù)在(0,1)上的均勻分布,則可以采用蒙特卡洛法進行采樣,之后根據給定的置信水平求取功率不確定波動區(qū)間,具體步驟如下。
1)根據歷史的確定性預測誤差建立基于NWP風速信息的風速-功率聯(lián)合概率密度分布模型。
2)對待預測時刻功率進行點預測,根據待預測時刻的NWP風速信息匹配該風況下的誤差累計概率密度分布函數(shù)。
3)采用蒙特卡洛法對累計概率密度進行1 000次的抽樣,之后根據抽樣累計概率密度得到所對應的誤差序列,最后按照采樣累計概率密度的大小對采樣誤差序列進行重新排序。
4)給定置信區(qū)間,例如90%,根據所得誤差序列分布得到第50個和第950個采樣誤差結果,從而結合點預測結果得到該時刻的功率預測區(qū)間。
基于蒙特卡洛法的風電功率短期區(qū)間預測流程如圖3所示。
圖3 基于蒙特卡洛法的風電功率短期區(qū)間預測流程Fig.3 Flow chart of short-term interval prediction of wind power based on Monte Carlo method
本文選取區(qū)間覆蓋率、區(qū)間平均帶寬[20]和可靠性指數(shù)[21]3個指標對短期風電功率區(qū)間預測結果進行分析評估。
1)預測區(qū)間覆蓋率
預測區(qū)間覆蓋率(PICP)指標反映了實際功率落在預測波動區(qū)間內的概率,可以評估預測模型的可靠性,其表達式為:
式中:RPICP為PICP值;W為待預測點的數(shù)目,本文取96;kwa為布爾量,kwa=1時說明在給定的置信度a下待測點w的實際功率值落入預測區(qū)間內,kwa=0時說明實際功率值落入預測區(qū)間外。
在實際中,預測所得的區(qū)間覆蓋率應盡可能地超過給定的置信度。若PICP小于置信度a,說明預測無效;反之,預測有效。PICP越大說明實際功率落入預測上下限之間的概率越大,預測效果越好。
2)預測區(qū)間平均帶寬
預測區(qū)間平均帶寬(PINAW)指標可以評估預測模型的清晰度。用來反映預測上下限間寬度的平均值,可表示為:
式中:RPINAW為PINAW值;Z為預測功率的變化區(qū)間,作為歸一化的基準值;U(?)和L(?)分別為功率預測的上、下限。當預測結果的PICP相同時,較小的PINAW對應更好的預測效果。
3)可靠性指標
可靠性指標ra是指區(qū)間覆蓋率與預設的置信水平之間的差值,如式(10)所示。若實際風電功率曲線落于預測區(qū)間內,表示預測結果有效,可靠性高。
通過可靠性指標的正負來判斷模型的可靠水平,當可靠性指標ra大于零時,說明模型產生有利偏差,可靠性高于給定置信水平;當可靠性指標ra小于零時,說明模型產生有害偏差,可靠性低于給定置信水平。
以中國吉林省某風電場功率變化特點進行聚類分析。將NWP中100 m層高風速和風向信息作為聚類特征參量,用來分析聚集類別的特征。將風電場歷史的功率預測誤差作為聚類時的功率特征數(shù)據,用來計算類別間的距離。聚類樹見附錄A圖A1,聚類后的各樣本特征見表A1。
神經網絡輸入變量的選取對于預測精度的提高至關重要,計算NWP中各類別信息與誤差之間的相關系數(shù)。將關聯(lián)度最大的歷史NWP中100 m層高風速和歷史實測功率作為ELM模型測試集的外部輸入;將待預測日NWP中100 m層高風速作為測試集的輸入;將實際功率作為網絡期望輸出。模型的原始訓練集數(shù)據范圍為吉林省某風電場2017年和2018年各季度前2個月的數(shù)據,測試集分別為各訓練集范圍之后的一天。為了觀察較長時間范圍內的預測效果,對2017年和2018年各季度數(shù)據進行了為期1個月的短期滾動預測,預測時間窗為24 h,即提前一天預測未來24 h的點。按照文獻[22]所提誤差公式對預測結果進行評估,預測效果見附錄A表A2。對比分析表A2的預測結果可以看到,在較長時間范圍內,ELM模型所得確定性預測結果相對穩(wěn)定。對于不同季節(jié)下各類的風況,確定性預測準確率均達到了85%,預測效果準確可靠。應用上述模型,得到2018年各個季度最后1個月的風電功率預測值,為后續(xù)提供建模數(shù)據。
以2017年春季2月份為例,對通過ELM模型預測得到的確定性誤差進行概率密度統(tǒng)計分析。0~4 m層高風速段誤差概率分布直方圖見附錄A圖A2。分別通過Gaussian分布、Logistic分布、t-Location分布和經驗分布對統(tǒng)計誤差進行概率分布擬合。對比不同方法的擬合效果,可以發(fā)現(xiàn)該風速段的誤差分布呈現(xiàn)明顯的非對稱性,因此適用于對稱分布的Gaussian分布、Logistic分布、t-Location分布的擬合效果要差一些。而經驗分布得到的是一條近似于各類誤差對應概率的包絡線,其擬合效果最佳。
為了更加準確地比較不同分布模型的優(yōu)劣,采用文獻[23]中的擬合平均絕對誤差eMAE、均方根誤差eRMSE和相關系數(shù)R這3個指標來定量地刻畫模型的擬合效果。結果見附錄A表A3。通過對表A3中各種分布方法擬合效果的對比分析可以發(fā)現(xiàn):經驗分布具有最小的縱向誤差(eMAE和eRMSE),說明該模型擬合誤差均值最小、分散程度最低;從橫向誤差(R)來看,經驗分布和實際分布之間的相關系數(shù)很大,達到了0.997 3。說明經驗分布對于0~4 m層高風速段誤差的概率分布擬合效果最好。
選擇中國吉林省整場裝機容量為400.5 MW的某風電場數(shù)據進行算例分析,2017年各個季度最后1個月的預測誤差數(shù)據用于誤差的概率密度統(tǒng)計,2018年各個季度最后1個月的數(shù)據用于風電功率短期區(qū)間預測。
圖4為2018年春季最后1個月某2天的預測效果圖,圖中以每15 min為1個時段。附錄A圖A3為2018年夏、秋、冬季最后1個月某2天的預測效果圖??梢钥闯?在同一置信水平下,基于NWP風速和蒙特卡洛法的區(qū)間預測模型,能夠緊密地跟隨風電功率序列的變化趨勢,并得到更窄的平均帶寬和更高的區(qū)間覆蓋率,能夠為決策者提供更加精準的預報信息。
圖4 2018年春季某2天的預測效果Fig.4 Prediction effect of two days in spring,2018
為了進一步研究本文模型的性能,分別計算蒙特卡洛法、分位數(shù)回歸法、Bootstrap重采樣法和核密度估計法的預測評估指標,結果如表1和附錄A表A4所示。
表1 風速分段下各方法預測結果對比Table 1 C omparison of prediction results of different methods with wind speed segmentation
由附錄A表A4可以看出,相比于只考慮歷史功率水平來對誤差進行分類的分析方法,考慮NWP風速信息來對誤差進行分類的分析方法的預測效果更好,區(qū)間覆蓋率平均提高了1.93%,平均帶寬縮小了2.45%,說明考慮NWP風速的物理動態(tài)過程能夠有效地提高區(qū)間預測的預測精度。同時,本文所提出的基于NWP風速分類和蒙特卡洛法的短期區(qū)間預測方法效果最佳,在不同的置信水平下,均能得到大于預設置信水平的區(qū)間覆蓋率。通過和其他非參數(shù)方法相比,區(qū)間覆蓋率平均提高了1.62%,平均帶寬縮小了2.76%。
為了進一步對比分析不同預測方法的預測效果,通過可靠性指數(shù)對不同預測方法的可靠性進行分析。由附錄A圖A4可以看出,僅考慮歷史功率水平來對誤差進行分類分析的非參數(shù)方法進行預測的方法預測效果普遍較差、可靠性水平較低,其中分位數(shù)回歸法和核密度估計法在各個置信水平下均產生有害偏差。而根據NWP風速信息對誤差進行分類分析并結合蒙特卡洛法的區(qū)間預測方法不僅在各個置信水平均產生有利偏差,還有較高的可靠性。
風電的保證出力對于機組發(fā)電計劃至關重要,其預報的準確性直接影響電力系統(tǒng)運行的安全性。因此,通過超下限比例這一指標對不確定性預測的下限進行定量評估。附錄A圖A5為不同方法超上限比例直方圖,對比分析可得,本文所提的考慮NWP風速信息的蒙特卡洛區(qū)間預測方法能夠有效地預測風電功率的保證出力,從而為電力系統(tǒng)的運行調度提供更可靠的指導。圖A6為不同方法超下限比例直方圖,通過和圖A5對比可以看出:各置信度下,超下限比例的均值明顯低于超上限比例的均值,說明下限預測的可靠性更高。這樣更有利于實現(xiàn)電力系統(tǒng)的優(yōu)化調度。
本文建立了一種基于歷史誤差數(shù)據和NWP風速分類的誤差聯(lián)合概率密度經驗分布模型,并據此提出了基于NWP風速和蒙特卡洛法的短期風電功率區(qū)間預測方法,結論如下。
1)與基于功率水平進行誤差分析和建模的傳統(tǒng)方法相比,基于NWP的風速信息對誤差進行統(tǒng)計分析能夠更好地反映模型在不同風況下的適應性,并有效提高了區(qū)間預測的預測精度。
2)相對于Gaussian分布、Logistic分布、t-Location分布,經驗分布對于預測誤差的分布具有更好的擬合效果。
3)與分位數(shù)回歸法、核密度估計法等其他不確定性預測方法相比,蒙特卡洛法在不同置信度下均有較高的可靠性,區(qū)間覆蓋率平均提高了1.62%。
本文在預測模型構建時充分考慮了氣象因素和誤差的統(tǒng)計特性,但是地形地貌等環(huán)境因素也會通過改變風況來間接地改變風電的出力大小,這是本文沒有涉及的方面。后續(xù)研究工作中,風電功率預測不確定性分析將聚焦于綜合考慮預測誤差的統(tǒng)計特性、物理天氣過程的動態(tài)變化和地形地貌等環(huán)境特征。