王士興,陳樹恒,劉群英,韓 楊,CHEN Zhe,胡維昊
(1. 電子科技大學 機械與電氣工程學院,四川 成都 611731;2. 電子科技大學 自動化工程學院,四川 成都 611731;3. 奧爾堡大學 能源技術系,丹麥 奧爾堡9220)
2021 年,我國政府將實現碳達峰和碳中和目標的時間表寫入政府工作報告中,大力發(fā)展清潔能源是實現該目標的重要途徑之一,但風電等清潔能源規(guī)模的不斷擴大將會給電網帶來更多的不確定性,這些不確定性會極大地影響電力系統(tǒng)運行的穩(wěn)定性、安全性和經濟性,計及多風電場間的相關性,建立風電功率的隨機性模型對進一步研究電力系統(tǒng)概率潮流和概率優(yōu)化問題具有重要意義[1]。
近年來,國內外學者對風電功率的隨機性與相關性建模問題進行了大量研究[2]。文獻[3]借助線性相關因子和秩相關系數構建相依性模型,實現了對多風電場相關關系的描述,但該模型的計算精度較低。針對該問題,文獻[4]在風電功率建模時引入混合Copula 模型,文獻[5-6]對混合滕結構的Copula模型進行改進,文獻[7]將核密度估計法與Copula函數相結合以實現數據采樣,這些改進均在一定程度上提高了風電功率隨機性模型的性能,然而,受地理、氣候等因素的影響,不同區(qū)域多風電場間的相依程度是不同的,Copula 函數在描述不同隨機性模型時的精度差別較大。針對該問題,文獻[8]提出利用高斯混合模型GMM(Gaussian Mixture Model)對多風電場相關性進行描述,理論上該模型可以描述任意隨機性分布,文獻[9]進一步對GMM 的定義域進行修正并設計歸一化的基于截斷的分布模型,雖然這些改進在一定程度上提高了聯合分布模型的精度,但模型的精度仍受到樣本數據分布因素的影響。
概率潮流計算是分析隨機風電功率接入后電力系統(tǒng)潮流分布的有效方法。蒙特卡羅抽樣方法是一種經典的概率潮流計算方法,但在面對較大規(guī)模的電網時,該方法的計算效率較低[10]。相比較而言,基于隨機變量平均值、標準差、偏度和峰度等數據特征的2m+1 點估計法[11]利用較少的采樣數據點即可求得滿足精確度要求的計算結果。
針對現有研究的不足,本文進一步改進GMM 并提出一種相對完整、精準的基于GMM 的多風電場相關性建模方法,并將該方法應用于電力系統(tǒng)概率潮流計算。與傳統(tǒng)的風電功率隨機性建模方法和基本高斯混合建模方法相比,本文方法的創(chuàng)新點如下:通過引入補償系數建立截斷式GMM,該模型在描述多風電場相關性時具有明顯的擬合精度優(yōu)勢;基于數據篩選過程提出一種改進的參數計算方法,該方法有效地提高了模型的精度和求解速度;在點估計法框架下,設計一種基于計算機數值求解的改進Nataf變換求解算法,該算法解決了傳統(tǒng)Nataf變換的積分求解難題。
決定風電場特性的是風速或風電功率數據,受地理、氣候等因素影響,不同地區(qū)風電場風速的概率分布模型不同。風電功率Pw與風速v直接相關,兩者之間的關系如附錄A式(A1)所示。
附錄B圖B1(a)、(b)分別為某年內每隔5 min記錄的某風電場100 m 高處的風速數據和歸一化風電功率數據,共計105 120 個數據點。受切入風速、額定風速和切出風速的影響,風電功率在0 和1 p.u.的聚集性較高。然而,式(A1)沒有考慮風速時序、恢復風速條件和風機狀態(tài)等因素影響,實際上,基于式(A1)將風速轉換形成的功率數據與實際功率數據之間存在一定的差距。本文將使用風電功率數據對多風電場的相關關系進行建模,以直接降低在將風速轉換為風電功率的過程中產生的誤差。
1.2.1 GMM基本原理
GMM 是多個高斯分布函數的疊加組合,即總體的概率分布模型由多個子高斯模型構成,高斯分布良好的數學品質使得GMM具有較高的應用潛能[12]。附錄A式(A2)—(A4)給出了高斯函數的概率模型。
1.2.2 GMM求解方法
通常利用極大似然估計MLE(Maximum Likelihood Estimation)近似求解GMM,如式(1)所示。
本節(jié)將結合多風電場出力聯合分布特性對基于GMM 的建模方法進行改進,包括篩選模型訓練數據、改進模型概率函數和簡化參數判斷準則。
圖1 為兩風電場功率的聯合分布直方圖(圖中風電場1 功率和風電場2 功率均為標幺值,后同)。由圖可見,模型在等邊際點0 處的分布密度過高,由于GMM 由多個子高斯模型疊加構成,密度過高的邊際點會影響子高斯模型的參數求解過程,進而影響GMM 的擬合精度,為了提高參數求解精度,需要提前篩選GMM的訓練數據。
圖1 歸一化的風電功率聯合分布直方圖Fig.1 Histogram of joint distribution of normalized wind power
篩選邊際點首先要利用核密度估計法,其是一種用于估計未知密度函數的非參數檢驗方法。附錄B圖B2為GMM訓練數據的篩選流程,利用核密度估計法計算各點的概率密度,篩選出聯合分布中概率密度過高點,對剩余點重復該篩選過程,直至篩選后的數據滿足式(2)。
式中:ppoint為篩選后點的概率密度;pmax為模型概率密度的最大值;pedge為篩選出的概率密度過高點的概率密度。圖2 為篩選后歸一化的風電功率聯合分布直方圖。由圖可見,篩選后的聯合分布直方圖中聚集區(qū)分布清晰且無過高密度點,篩選出的邊際點數量少且分布集中,其概率模型通過直接統(tǒng)計獲得。
圖2 篩選后歸一化的風電功率聯合分布直方圖Fig.2 Histogram of joint distribution of normalized wind power after screening
引入數據篩選過程后,用于GMM 建模的數據量與實際聯合分布的數據量是不同的,需要按照式(3)在GMM中添加補償系數以修正模型概率。
式中:pfact為修正概率模型的概率密度函數;kscr為篩選過程形成的概率模型修正系數;pGMM為對應低密度數據區(qū)的GMM 概率密度函數;Nall為原始聯合分布訓練數據點數;Nmid為篩選后的訓練數據點數。
數據篩選過程極大地減少了數據聚集分布特性對GMM精度的影響,提高了模型精確度和適用性。
GMM 通過迭代過程進行求解,在處理大量樣本數據時,求解該模型的計算復雜度極高。在GMM中,概率密度受單一子高斯模型的影響較大,求解GMM 的關鍵是確定子高斯模型的數量,即聚集區(qū)數量。對于大量樣本數據,k-means算法可以快速求解聚集區(qū)數量,因此,本文利用該算法判斷聚集區(qū)數量,從而確定子高斯模型的數量以降低參數求解過程的復雜度。
在k-means算法中,評價聚集程度的核心指標是誤差平方和SSE(Sum of Squared Errors)[13]:
式中:vSSE為SSE 指標;k為聚集區(qū)數量;Ci為第i個簇;xp為Ci中樣本點的位置;mi為第i個簇的質心。
判斷樣本數據聚類數的一種常見方法是手肘法。隨著k的增大,樣本簇的數量增加,每個簇的聚合程度提高,vSSE降低。當k小于真實聚類數時,k增大可以明顯提高每個簇的聚合程度,vSSE迅速降低;當k達到真實聚類數時,隨著k的繼續(xù)增大,vSSE的變化趨于平緩。圖3為vSSE、MLE 負值與k的函數關系。MLE 是判斷GMM 擬合程度的重要指標,其值越大,擬合效果越好。由圖可見:vSSE與k的關系呈現一個手肘形狀,肘部拐點可以在一定程度上反映真實聚類數;隨著k的增大,vSSE與MLE 負值的變化趨勢相同,通過vSSE的變化可以確定子高斯模型數量。由于k-means 算法的計算復雜度遠低于求解GMM 的EM算法,因此,借助k-means算法可以縮短計算時間。
圖3 vSSE、MLE負值與k的關系Fig.3 Relationship between vSSE,negative value of MLE and k
GMM 的定義域與歸一化的風電功率聯合分布模型的定義域不同,本文通過式(5)對GMM 的概率密度函數進行改進,設計截斷式GMM 來描述聯合分布模型。
式中:pimp為改進后的GMM 函數概率密度;X為多維隨機變量;sgn(·)為階躍函數,一維的sgn(·)定義如式(6)所示;ptrun( )X|θ為截斷前的GMM 概率密度函數,θ為未知參數向量。
式中:x為一維隨機變量。
利用基于迭代的EM 算法求解改進的GMM 參數,并利用式(7)增加的補償系數,得到最終的參數。
式中:ktrun為截斷引入的概率補償系數;Ptrun為原始概率函數。引入補償系數的截斷式GMM 可以較好地適應歸一化的風電場功率數據的分布,其定義域準確,描述效果好。
改進的多風電場歸一化功率描述模型為:
點估計法計算過程簡單,描述準確,適用于獨立的隨機變量。結合Nataf變換的點估計法,可對多個相關隨機變量進行采樣。本文提出一種基于Nataf變換的求解方法,使點估計法可應用于更復雜的模型。
對于一維隨機變量函數Z=Z(x),可以在標準正態(tài)變量空間中取適量點描述數據特征,2m+1 點估計法應用廣泛,計算精度高[14]。附錄C 表C1 為基于Gauss-Hermite 積分方法計算得到的三點估計法、五點估計法和七點估計法的獨立正態(tài)隨機變量的采樣點與相應權重。在滿足計算要求的情況下,本文選取三點估計法來降低計算量。
Nataf 變換可實現相關隨機變量組與獨立正態(tài)變量組的轉換[15],Nataf 變換過程如附錄B 圖B3 所示。在Nataf正變換中,通過式(9)將n維原始隨機變量X=[x1,x2,…,xn]轉換為n維相關正態(tài)隨機變量Y=[y1,y2,…,yn],再通過式(10)利用Nataf變換矩陣B將相關正態(tài)隨機變量轉換為n維獨立正態(tài)隨機變量Z=[z1,z2,…,zn]。其中,xi(i=1,2,…,n)為第i維隨機變量,yi(i=1,2,…,n)為第i維相關正態(tài)隨機變量,zi(i=1,2,…,n)為第i維不相關正態(tài)隨機變量。
式中:Φ( )· 為標準正態(tài)分布的累計函數;Fi(xi)為第i維隨機變量的原始分布函數。式(10)中矩陣B是通過Cholesky 分解對稱正定矩陣ρ0得到的下三角矩陣,如式(11)所示。
式中:ρij表示xi和xj間的相關性;ui、uj分別為xi、xj的期望;σi、σj分別為xi、xj的標準差;ρ0ij表示zi和zj間的相關性;φij(zi,zj,ρ0ij)為具有相關系數的聯合分布函數。
Nataf 變換是一種求解多變量相關關系的成熟算法。常見的變量相關關系可以利用式(12)的積分求解函數進行求解。對于復雜模型,可以利用半經驗公式對其進行簡化再利用式(12)進行求解。半經驗公式僅能對Copula函數、多次函數、冪函數等進行變換求解,其應用范圍限制了Nataf 變換的求解效果,當待求解函數不能表示為上述函數之和時,基于半經驗函數的Nataf 變換中的相關關系系數往往不可解或者求解過程過于復雜。當隨機變量使用帶有離散變量的改進截斷式GMM 描述時,半經驗公式的缺陷導致Nataf 變換矩陣B無法求解,針對該問題,本文設計一種Nataf估算變換來替代半經驗公式,形成一種具有較低計算復雜度和較高精確度的求解算法。
確定性潮流的約束方程可以表示為:
式中:R為輸出變量,包括發(fā)電機機端電壓、線路傳輸有功功率Pij、線路傳輸無功功率Qij;G(·)為基于節(jié)點導納矩陣的函數[16];Xin為輸入變量,包括各節(jié)點的有功功率Pi和無功功率Qi、補償無功功率Qin等?;诟倪M點估計法的概率潮流計算流程如附錄B 圖B4所示。
仿真實驗平臺是搭載64位Windows操作系統(tǒng)的計算機,CPU 為Intel Core i5-8265U,1.60 GHz,RAM為8 GB,程序開發(fā)語言為MATLAB 2018b。
本文使用美國東海岸2 座風電場的風電功率數據,數據來自WIND Toolkit。分別使用高斯Copula函數、t分布Copula函數[10]、傳統(tǒng)GMM分布函數[17]和改進的GMM 分布函數對歸一化功率相關關系進行建模,并對各模型進行比較。
1)改進的GMM擬合精度。
圖4 為不同模型對2 座風電場相關功率的擬合圖。由圖可知,在描述模型時,3 種常規(guī)模型均存在較大的誤差。為定量分析模型的精度,本文選用二階歐氏距離d作為評價指標,如式(15)所示。
表1為4種模型的二階歐氏距離。由表可知,改進的GMM精度相較于其他模型具有明顯優(yōu)勢。
表1 4種模型的二階歐氏距離比較Table 1 Comparison of second-order Euclideandistance among four models
2)篩選過程在提高模型精度中的效果。
為提高擬合精度,本文設計了基于核密度估計法的篩選過程。圖5 為數據篩選后改進的GMM 擬合圖,篩選點主要為(0,0)、(1,1) p.u.。由圖可知,篩選過程解決了GMM 受訓練數據制約的問題,篩選后的數據擬合圖完整反映了2 座風電場功率數據分布的相關關系。對比表1 的傳統(tǒng)GMM 和改進的GMM精度可知,引入篩選過程的GMM誤差僅為傳統(tǒng)GMM誤差的15%。表2 為數據篩選前后改進的GMM 的MLE,由表可知,篩選過程顯著提高了模型的精度。改進的GMM模型參數如附錄C表C2所示。
圖5 數據篩選后改進的GMM擬合圖Fig.5 Fitting diagram of improved GMM after data selection
表2 MLE比較Table 2 Comparison of MLE
3)改進參數計算方法的優(yōu)勢。
求解參數須先選擇合適的k值,假設k的取值范圍為1~9,表3 為基于2 種計算方法求解k值的計算時間。由表可知,基于k-means 算法通過vSSE判斷k值的計算時間相較于直接求解明顯縮短。
表3 2種計算方法的計算時間對比Table 3 Comparison of calculation time between two calculation methods
利用Nataf 估算變換得到三點估計法的采樣結果,如附錄C 表C3 所示。基于概率潮流數字仿真實驗驗證本文所提概率潮流計算方法的準確性和計算效率優(yōu)勢。實驗基于IEEE 18 節(jié)點系統(tǒng),節(jié)點2、17、18 各接入1 座功率為40 kW 的風電場。基于三點估計法與蒙特卡羅抽樣方法得到的計算時間如表4 所示,基于2 種方法得到的節(jié)點15 電壓的概率分布圖如圖6 所示。其中,蒙特卡羅抽樣方法的樣本點規(guī)模為10000。由表4可知,在保證實際精度要求的條件下,三點估計法大幅縮短了計算時間,提高了計算效率。圖6 中,受到采樣點較少的影響,2 種方法得到的分布圖僅能大致擬合,但三點估計法基本滿足實際分析需求。
表4 基于三點估計法和蒙特卡羅抽樣方法得到的計算時間Table 4 Calculation time obtained by three-point estimation method and Monte Carlo sampling method單位:s
圖6 基于三點估計法和蒙特卡羅抽樣方法得到的節(jié)點15電壓的概率分布Fig.6 Probabilistic distribution of voltage at Bus 15 obtained by three-point estimation method and Monte Carlo sampling method
附錄C 表C4給出了IEEE 18節(jié)點系統(tǒng)中部分關鍵節(jié)點的電壓和線路總損耗的均值和標準差。表中,三點估計法潮流計算結果的電壓均值與實際值的相對誤差均小于0.05%,電壓標準差與實際值的相對誤差均小于5%,線路總損耗的均值、方差與實際值之間的相對誤差均較小,可滿足實際應用需求。
本文在建立GMM 的基礎上,改進多風電場聯合概率分布模型的計算過程,通過數字仿真實驗得到如下結論:
1)本文基于補償系數的截斷式GMM 在函數圖像數據擬合和歐氏距離精度指標擬合方面具有明顯優(yōu)勢,歐氏距離誤差指標僅為傳統(tǒng)Copula 函數模型的2%左右;
2)本文設計的數據篩選過程解決了GMM 受訓練數據聚集特性影響的問題,使改進的GMM 歐氏距離誤差指標降低至傳統(tǒng)GMM的20%以下;
3)采用本文設計的參數計算方法求解GMM 中的k值時,計算時間明顯縮短,相較于直接求解的計算時間約縮短了50%;
4)本文所提出的基于Nataf 估算變換的三點估計法的潮流計算方法進一步提高了計算結果的精度,與實際值相比,采用本文所提方法得到的關鍵節(jié)點電壓以及線路總損耗誤差小于5%,滿足實際應用需求。
附錄見本刊網絡版(http://www.epae.cn)。