徐姣新 楊 召
1(商丘學院 河南 商丘 476000)2(商丘工學院 河南 商丘 476000)
在向綠色和可持續(xù)發(fā)展社會過渡的過程中,風電在世界范圍內得到了快速發(fā)展。然而,由于天氣條件的原因,風力發(fā)電本質上是隨機的。由于電力系統必須在瞬間平衡負荷,短期內電力輸出的大幅度變化(稱為風電斜坡事件[1])將給電力系統運行帶來巨大挑戰(zhàn)。根據方向,風電斜坡事件可以分為兩類:向上斜坡和向下斜坡。向上斜坡事件通常由強低壓空氣系統、陣風、低空急流和雷暴引起。相反情形下,上述現象的逆轉,便會發(fā)生向下的斜坡事件[2]。在向上斜坡事件中,系統調度員必須減少常規(guī)發(fā)電機的功率輸出或減少一些風力發(fā)電;在向下斜坡事件中,調度員則需要備用容量的支持,或在備用容量不足時減少一些負荷[3]。所有這些斜坡事件都會增加系統運營成本和風險,因此,更好地檢測和預測風電斜坡事件可以警告調度員,并幫助他們部署預防風險故障的主動策略。
風力發(fā)電斜坡事件的檢測作為一項重要的技術,一直是眾多學者研究的熱點。文獻[4]提出了一種基于澳大利亞風力發(fā)電預測工具(Wind power prediction tool,WPPT)風電場數據的兩階段方法來檢測和分類大型風坡道。文獻[5]提出了一種基于支持向量機(Support vector machine,SVM)的風力發(fā)電斜坡事件一步分類和多步分類模型。文獻[6]提出了一種用于識別大時間序列風坡的最優(yōu)檢測技術,給出了一類帶有斜坡定義的評分函數,并應用動態(tài)規(guī)劃遞歸方法檢測斜坡事件。文獻[7]采用一種擺動門算法(Swinging door algorithm,SDA)從歷史數據中識別斜坡事件,該方法只需定義一個參數,在計算效率和抗噪聲方面具有顯著優(yōu)勢。
基于斜坡檢測技術的斜坡預測技術可以在幾分鐘或幾小時之前提供警告信息,并幫助調度員提前安排系統操作。通常,風電斜坡事件的預測可分為兩類:確定性預測和概率性預測。對于前者,文獻[8]提出了一個基于數據挖掘算法的多變量時間序列模型來預測風電爬坡率。文獻[9]提出了一種基于多數值天氣預報(Numerical weather prediction,NWP)輸入、統計處理和自適應算法的時間斜坡預測模型。
值得注意的是,上述研究依賴于確定性范式,而忽略了風坡事件的不確定性問題。采用概率方法提供風坡道的統計信息,可以幫助系統運營商做出更好的調度決策,以應對這些風險事件。部分研究提出利用大時間尺度信息建立概率風坡預測模型,或采用自回歸對數模型,以基于多項式對數結構和分類分布同時估計不同閾值的斜坡事件概率。在應對斜坡坡度和相位預測誤差問題時,可以使用短期斜坡預測模型,對風電功率進行概率密度估計,然后利用概率密度函數提供遇到斜坡事件的概率信息。
上述概率方法基于風電的經驗分布進行統計分析。然而,一方面,校準一個精確的概率分布需要足夠的歷史數據,而這些數據可能不是可用的;另一方面,任何參數分布可能都不完全適合真實數據,導致統計分析對不確定數據分布的變化很敏感??朔鲜隼щy的一種方法是采用分布魯棒優(yōu)化方法,該方法考慮了經驗分布周圍的一系列分布,其結果提供了對目標事件概率的保守估計,并且對概率分布中的擾動具有魯棒性。
在分布魯棒優(yōu)化模型中,采用概率密度函數(Pro-bability density function,PDF)描述事件的不確定性,但PDF是不精確的,考慮將一系列候選PDF構成所謂的模糊集。根據已知信息,可以用兩種方法構造模糊集。一種是使用力矩信息,另一種是采用經驗分布和散度度量。本文從不確定性量化的角度研究了風電斜坡事件的概率預測[10],提出具有兩個模糊集的魯棒概率不等式來估計斜坡事件的概率。其中,第一個模糊集只需要點預測和預測誤差的平均絕對偏差,并考慮預測誤差分布的單峰性;第二個模糊集需要任意數量的風電歷史數據。兩種模型都是數據驅動的,得到可解的凸優(yōu)化問題,通過離線求解器進行求解。
風力發(fā)電斜坡事件發(fā)生在與輸電網相連的大型風電場中。現有文獻以幾種方式定義斜坡事件,在文獻[1,12]中,是指風電場在多個時期內的巨大變化(如30分鐘或1小時內達到20%的容量),或在短時期內的快速變化率。文獻[1]中,多個時段的最大和最小風力之間的差異也被視為斜坡事件。
本文研究了文獻[1]中定義的單周期爬坡的超短期預測問題:連續(xù)兩個調度周期(通常為1小時)的風電變化超過一個閾值。假設未來兩個連續(xù)時段的點風電預測可用,應用文獻[10]中的方法,很容易識別風電輸出的增量變化,從而以確定的方式檢測斜坡事件。然而,點預測存在不精確性,可以為系統調度員提供保守或樂觀的結果。具有置信水平信息的概率斜坡預測是理想的,如文獻[11]中的條件區(qū)間預測方法。然而,由于一個斜坡事件包含兩個不同時段的輸出,這兩個時段都是不確定的,因此很難從條件區(qū)間預測方法中提取風電動態(tài)。
圖1 風電斜坡事件描述
設w=┌w2,w2┐T為隨機變量的向量,f(w)為其概率密度函數(PDF),向上斜坡事件的概率可以表示為:
Pr{w∈W}
(1)
式中:Pr┌·┐代表事件發(fā)生的概率,且:
(2)
式中:C表示風電場的容量;RU表示向上斜坡閾值。將最后一個約束替換為w1-w2≥RD即可以類似的方式設置向下斜坡事件的概率,其中RD表示向下斜坡閾值。
評估式(1)中的概率需要用到w的PDF,一般假設w服從高斯分布,并通過曲線擬合方法估計均值和方差。然而,這樣的參數分布可能無法反映風電的真實分布情況。為了克服PDF獲取困難的問題,本文提出考慮一類不確定的PDF,并將其限制在一個模糊集S內,目的是找出最不利的結果,從而得到以下分布的魯棒不確定性量化問題:
(3)
這一問題對應一個概率不等式,可以轉化為函數優(yōu)化問題求解。Pr[·]定義了從PDFf(w)到實數的映射,決策變量是f(w),是實值函數。換句話說,對于每一個w∈W,f(w)是一個決策變量,決策變量的數目是無限的,可行域是S。如果w服從S中包含的任何分布,則斜坡事件的實際概率應不大于式(3)的最優(yōu)值。這種保守的估計可以在PDF擾動的情況下保持足夠的安全裕度,因此在電力系統運行中是可以接受的。
如果所有Borel集B∈B(Rk)的tkf(B-m/t)在t>0時不遞減,則w∈Rk的概率分布f(w)∈S是中心為m的單峰分布。
(4)
基于矩的模糊集S1考慮了所有具有相同平均值m和平均絕對偏差σ的偏微分方程,此外,要求PDFf(w)單峰。
將S1代入式(3),得到的不確定度量化問題可以重新表述為以下形式[12]:
inf 1-λ+σTη
(5)
式中:s=[-1,1]T,λ、θ、η和π為輔助變量。
然而,可以發(fā)現約束條件式(9)實際上是凸的。通過引入幾個輔助變量y、t1、t2,可以將它重新定義為線性不等式和二階錐:
(10)
最后,將基于矩模糊集S1的概率不等式(3)轉化為二階錐規(guī)劃,即可以進行有效的求解。
然而,f0通常是不準確的,所以本文使用一個模糊集,其中包含所有與經驗分布f0足夠接近的偏微分方程。為了量化兩個偏微分方程之間的距離,本文采用Wasserstein度量,定義為:
對于兩個離散分布,Wasserstein度量表示為:
使用Wasserstein距離度量,模糊集可以構造為:
S2={f(w)|DW(f,f0)≤dw}
(11)
式中:dw是確定模糊集大小的常數。當dw>0時,模糊集中存在無窮多個偏微分方程;當dw接近0時,模糊集收斂到經驗分布f0。根據文獻[13],dw表達式為:
dw=-log(α*)/N
(12)
f∈S2的置信水平至少為1-α*。顯然,當N增大時,dw減小,這意味著數據越多,經驗分布f0越準確。
Kullback-Leibler(KL)散度是另一個著名的概率分布距離度量。對于這兩種度量方法,模糊集中的距離閾值在實際應用中都是一個關鍵參數。對于Wassertein度量,dw可以通過式(12)選擇,而對于KL散度,這樣的參數選擇有點困難。此外,基于Wassertein度量的模糊集可以提供令人滿意的樣本外性能保證。所以本文選擇Wasserstein度量進行研究。
將S2代入式(3),得到的概率不等式可以重新表示為以下形式:
(13)
除了范數約束式(17),目標函數式(13)和約束式(14)-式(16)都是線性的。然而,可以發(fā)現當p=1或p=∞時,式(17)為線性約束,當p=2時,式(17)為二階錐約束。本文選擇p=∞,q=1,且式(17)表示為以下線性形式:
2τn≤γ,?n=1,…,N
(18)
這里將本文模型與高斯混合模型(Gaussian mixture model,GMM)進行比較,并用華北地區(qū)風電場的實際數據進行檢驗,所用數據集為2006年1月1日至2015年12月31日的小時點預測和觀測輸出。為了檢驗200 MW斜坡事件的可能性,選擇兩個連續(xù)的小時,其中風電預測分別在[495 MW,505 MW]和[695 MW,705 MW]之間。從數據集中恢復1 083個數據對,在算例分析時,只估計了向上斜坡事件的概率,向下斜坡可以用同樣的方法處理。在MATLAB R2018a中用YALMIP編制了線性程序和二階圓錐程序,并用CPLEX 12.8進行了求解。
為了便于比較,采用GMM進行斜坡概率估計。GMM是多種高斯分布的混合體,可以描述服從任意分布的不確定性。本文GMM分布中包含了三種高斯分布,其中,基于GMM的模型、基于矩的模型和基于散度的模型計算得到的風電斜坡概率分別稱為GMM-WRP、Moment-WRP和Div-WRP,根據歷史數據觀測到的風力發(fā)電斜坡概率表示為O-WRP。表1和圖2比較了不同斜坡閾值RU的結果??梢杂^察到GMM-WRP和Div-WRP與O-WRP非常接近,而Moment-WRP總是大于它們。這是因為基于GMM的模型和基于散度的模型充分利用了歷史數據的離散性,而基于矩的模型只考慮了兩個分布參數,忽略了更多有用的信息。然而,考慮到預測誤差的單峰性,當RU>280 MW時,Moment-WRP隨斜坡閾值RU的增大而迅速減小,與GMM-WRP和Div-WRP相當。表1中,當RU=300 MW和400 MW時,GMM-WRP小于O-WRP,而Div-WRP總是大于O-WRP。這表明,與基于GMM的模型相比,本文提出的基于散度的模型可以提供更保守、更可靠的估計,以保證電力系統的安全運行。此外,表1列出了用給定閾值估計斜坡概率的平均計算時間,可以發(fā)現,基于GMM的模型比所提出的數據驅動模型花費的時間要長得多,這是因為其計算包括兩個步驟:參數估計和基于蒙特卡羅的概率計算。
表1 不同模型估計的斜坡概率
圖2 不同模型計算的斜坡概率
在數據驅動方法中,歷史樣本數是影響估計結果的一個關鍵因素。為了研究其影響,本文首先使用文獻[14]中的場景生成方法,基于上述1 083個數據對生成10 000個風電場景。隨后,從10 000個場景中隨機選取一組具有給定元素數的樣本,測試三個模型的性能,此過程重復100次。RU=300 MW的結果如圖3所示。隨著抽樣數據的增加,三種模型的波動率均減小,說明樣本數對概率估計的穩(wěn)定性有顯著影響,而且矩模型的波動率明顯小于GMM模型和散度模型的波動率,因為其使用的歷史數據信息最少,所以幾乎不受樣本數變化的影響。
(a) 基于GMM的模型
表2給出了不同RU值和采樣數據NS情況下估計斜坡概率的統計信息。采樣數據越多時,斜坡概率的標準差和其限值之間的差異會顯著減小。當NS≤200時,GMM-WRP和Div-WRP比Moment-WRP更敏感,因為這兩個模型中使用的色散信息必須基于一定數量的樣本,而矩模型對中等數據的敏感度較低。當NS≥400時,GMM-WRP和Div-WRP在估計精度上要明顯優(yōu)于Moment-WRP。然而,GMM-WRP估計可以是樂觀的,也可以是悲觀的,而Div-WRP總是保守的,這可以從RU=300 MW和400 MW時的平均值觀察到。
表2 不同NS和RU值下斜坡概率的統計信息
續(xù)表2
續(xù)表2
綜上所述,對于系統調度員來講,當只有有限的歷史數據時,建議使用基于矩的模型。即使在完全沒有數據的情況下,如果對平均值和平均絕對偏差提供適當的猜測,也可以應用該模型。相反,在數據量較大的情況下,由于散度模型可以有更精確的估計結果,且具有分布魯棒性保證,因此可以使用散度模型來限制斜坡事件的概率上限。
本文提出了一種基于數據驅動概率的不等式模型,在給定斜坡閾值下,用于估計發(fā)生風電斜坡事件的概率上限。利用風電時間信息和風電出力的單峰性構造了模糊集,在構造基于散度的模糊集時,使用了Wasserstein標準度量兩種概率分布之間的差異。在此基礎上建立了不確定量化模型,其優(yōu)勢在于不需依賴不確定因素的精確分布,并且使用了計算上可處理的凸優(yōu)化。最后,表3中給出了本文討論模型的性能比較和總體評價,作為應用選擇的參考。
表3 不同模型的性能