趙鐵軍,孫玲玲,牛益國(guó),謝小英,賈清泉,*
(1.國(guó)網(wǎng)冀北電力有限公司秦皇島供電公司,河北 秦皇島 066004;2.燕山大學(xué) 電力電子節(jié)能與傳動(dòng)控制河北省重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004)
根據(jù)國(guó)家能源局的數(shù)據(jù)統(tǒng)計(jì),截至2019年9月底,中國(guó)光伏發(fā)電累計(jì)裝機(jī)容量達(dá)到1.9億kW,正向電能增量的主力供應(yīng)者過(guò)渡[1-2]。預(yù)計(jì)“十四五”期間光伏發(fā)電裝機(jī)容量和發(fā)電量仍將持續(xù)提高,光伏發(fā)電即將步入替代能源和平價(jià)上網(wǎng)時(shí)代,面臨規(guī)?;尤?、高占比供能、主導(dǎo)電網(wǎng)行為的態(tài)勢(shì),其出力的隨機(jī)性和不確定性極大地增加了電網(wǎng)復(fù)雜性和風(fēng)險(xiǎn)程度,對(duì)電網(wǎng)的安全、可靠、經(jīng)濟(jì)運(yùn)行產(chǎn)生重大影響[3-4]。因此,探索建立精準(zhǔn)的光伏出力概率模型,對(duì)含光伏電網(wǎng)的不確定潮流分析、規(guī)劃與消納能力分析、安全分析等具有重要意義。
與光伏功率預(yù)測(cè)建模不同,光伏出力的概率建模,是在統(tǒng)計(jì)平均意義上用概率密度描述不同天氣、不同條件下光伏出力的概率分布。光伏出力的概率建??刹捎脜?shù)模型和非參數(shù)模型。β分布是一種典型的參數(shù)模型,但不同地區(qū)、不同條件下β分布模型的參數(shù)不易確定,因而模型準(zhǔn)確度差、分析精度低。核密度估計(jì)模型是一種數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)模型,是基于歷史數(shù)據(jù)的統(tǒng)計(jì)學(xué)方法,從而掌握特定地區(qū)或特定光伏出力的隨機(jī)分布特征[5-6]。文獻(xiàn)[7]創(chuàng)建了一種基于正交級(jí)數(shù)密度估計(jì)的光伏出力概率建模方法,能夠準(zhǔn)確模擬在不同地區(qū)不同時(shí)段下光伏出力的分布規(guī)律,并且在應(yīng)用中表現(xiàn)出高適用性、計(jì)算簡(jiǎn)便等性能優(yōu)勢(shì)。文獻(xiàn)[8]基于解集與條件核密度估計(jì)理論構(gòu)建了光伏出力的時(shí)序概率模型,能夠計(jì)及太陽(yáng)輻射度的小時(shí)輻射和日總輻射之間的加和特性,適用于多種現(xiàn)實(shí)場(chǎng)景。文獻(xiàn)[9]提出將數(shù)據(jù)按氣象條件分類(lèi),采用非參數(shù)核密度估計(jì)法建立晴天、多云、陰天、雨雪4種氣象條件下光伏出力的隨機(jī)分布模型。文獻(xiàn)[10]采用核密度估計(jì)函數(shù),將光伏出力的歷史數(shù)據(jù)作為樣本創(chuàng)建了一種非參數(shù)的建模方法;該方法能夠準(zhǔn)確模擬不同氣象條件下的光伏出力特性,但核密度估計(jì)的準(zhǔn)確性取決于所選帶寬,且不同的帶寬計(jì)算方法適用于不同的數(shù)據(jù)樣本。文獻(xiàn)[11]利用非參數(shù)核密度估計(jì)法(Nonparametric Kernel Density Estimation,NKDE)建立光伏發(fā)電出力誤差的概率分布模型。文獻(xiàn)[12]為避免因光伏模型設(shè)定和參數(shù)估計(jì)誤差帶來(lái)的影響,提出一種基于非參數(shù)核密度估計(jì)法的光伏功率短期預(yù)測(cè)誤差分布模型,對(duì)分布模式的多樣性進(jìn)行建模。文獻(xiàn)[13]提出綜合使用神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸、k近鄰算法、通徑分析和核密度估計(jì)的光伏出力概率分布估計(jì)方法,構(gòu)造了光伏出力概率密度函數(shù)。由上述研究結(jié)果分析可知,NKDE建模方法僅需根據(jù)歷史數(shù)據(jù)既能生成概率分布,不需預(yù)先假定任何分布,在應(yīng)用中表現(xiàn)出準(zhǔn)確性高、適用性強(qiáng)等特點(diǎn),非常適合具有隨機(jī)性分布的特征空間。然而,對(duì)于像光伏發(fā)電出力這種具有上下界限的樣本數(shù)據(jù),NKDE在建模過(guò)程中仍存在一定不足,表現(xiàn)為:無(wú)法在邊界點(diǎn)附近給出良好的估計(jì)結(jié)果,易出現(xiàn)邊界偏差;概率密度函數(shù)曲線(xiàn)在高密度樣本區(qū)間過(guò)于平滑,缺乏局部適應(yīng)性。因此,有必要探尋有效的方法改進(jìn)以克服NKDE在光伏出力建模中的問(wèn)題,得到更加精準(zhǔn)的光伏出力隨機(jī)模型。
本文針對(duì)非參數(shù)核密度估計(jì)方法應(yīng)用于光伏出力概率建模中存在邊界偏差和局部適應(yīng)性不足問(wèn)題,提出一種改進(jìn)的非參數(shù)核密度估計(jì)光伏出力概率建模方法。首先,闡述了采用參數(shù)法和非參數(shù)法建立的光伏出力概率分布模型;將自適應(yīng)核密度估計(jì)方法與基于偽數(shù)據(jù)的核密度估計(jì)相結(jié)合,在估計(jì)區(qū)間外生成偽數(shù)據(jù),將偽數(shù)據(jù)添加到邊界附近以修正偏差,構(gòu)建更加準(zhǔn)確的光伏出力概率模型;在此基礎(chǔ)上,采用χ2檢驗(yàn)作為擬合優(yōu)度指標(biāo)對(duì)模型進(jìn)行校驗(yàn)。最后,結(jié)合不同天氣條件下的光伏發(fā)電出力的實(shí)測(cè)數(shù)據(jù),對(duì)模型有效性進(jìn)行驗(yàn)證。
1) 光伏出力的核密度估計(jì)模型
首先建立光伏出力的單變量核密度估計(jì)模型[14]。設(shè)光伏輸出功率樣本值為PPV,1,PPV,2,…,PPV,n,其經(jīng)驗(yàn)分布函數(shù)為
(1)
其中,k=1,2,…,r-1。
光伏出力的概率密度函數(shù)f(PPV)是通過(guò)累積概率分布函數(shù)F(PPV)求導(dǎo)得到的,根據(jù)導(dǎo)數(shù)的定義有
(2)
由式(1)和式(2)可得到f(PPV)的密度估計(jì)為
(3)
由上述推導(dǎo)過(guò)程得出光伏出力概率密度函數(shù)估計(jì)后,需聯(lián)合常用的核函數(shù)從而構(gòu)建光伏出力核密度估計(jì)函數(shù)。常用的核函數(shù)類(lèi)型及具體計(jì)算公式如表1所示。
表1 常用的核函數(shù)Tab.1 Commonly used kernel functions
從表1中選擇均勻核函數(shù)公式并聯(lián)合式(3),從而計(jì)算得出基于非參數(shù)核密度估計(jì)的光伏出力概率分布模型為
(4)
式中:K(*)為核函數(shù);h為帶寬。
2) 基于自適應(yīng)核密度估計(jì)的光伏出力模型
自適應(yīng)核密度估計(jì)(Adaptive Kernel Density Estimation, AKDE)是一種使帶寬適應(yīng)樣本數(shù)據(jù)的密度估計(jì)方法,通過(guò)改變帶寬從而減少數(shù)據(jù)異常值對(duì)整體估計(jì)的影響。AKDE本質(zhì)上與NKDE相同,區(qū)別在于AKDE使用可變帶寬替換NKDE中的固定帶寬。首先通過(guò)交叉驗(yàn)證法計(jì)算出一個(gè)適當(dāng)?shù)娜止潭◣抙0,然后計(jì)算f(PPV)的先導(dǎo)估計(jì)函數(shù)
(5)
定義帶寬因子λi為
(6)
(7)
盡管NKDE有很多優(yōu)點(diǎn),但在光伏出力建模的實(shí)際使用過(guò)程中,仍存在如下不足或局限性,具體包括:
1) 邊界偏差
光伏出力的實(shí)際樣本數(shù)據(jù)具有上下界限,而NKDE對(duì)于樣本數(shù)據(jù)邊界以外的估計(jì)值大于零,這就意味著NKDE無(wú)法在邊界點(diǎn)附近給出良好的估計(jì)結(jié)果,導(dǎo)致估計(jì)結(jié)果出現(xiàn)邊界偏差。
(8)
由式(8)可得邊界偏差為
(9)
若f(x)是以零為邊界的概率密度函數(shù),則邊界偏差為
(10)
2) 缺乏局部適應(yīng)性
表2 常用評(píng)判指標(biāo)Tab.2 Common evaluation index
核密度估計(jì)的MSE為其方差與偏差平方之和,具體表達(dá)式為
(11)
(12)
由式(12)可知,MSE由h-1f(x)和h4[f″(x)]2決定,因此可以通過(guò)改變帶寬來(lái)降低MSE,進(jìn)而改善核密度估計(jì)的局部適應(yīng)性。
修正核密度估計(jì)邊界偏差的方法有很多,如數(shù)據(jù)反射法[16]、邊界核函數(shù)法[17]以及轉(zhuǎn)換法[18]等,但這些方法均不適用于二階及以上的核函數(shù)。而偽數(shù)據(jù)法沒(méi)有這些限制,可以與任意階的核函數(shù)一起使用,并且比普通數(shù)據(jù)反射方法的自適應(yīng)能力更強(qiáng)[19]。本文將自適應(yīng)核密度估計(jì)與基于偽數(shù)據(jù)法的核密度估計(jì)相結(jié)合,修正核密度估計(jì)邊界偏差。
(13)
將樣本從小到大排列,得到隨機(jī)變量X的順序統(tǒng)計(jì)量X(1),X(2),…,X(n)。設(shè)G=F-1為樣本Xi的分位函數(shù),其中F為隨機(jī)變量X的累計(jì)分布函數(shù),則在區(qū)間(-∞,0)上生成的偽數(shù)據(jù)為
(14)
(15)
由式(15)可得偽數(shù)據(jù)X(-i)為
(16)
則基于偽數(shù)據(jù)法的核密度估計(jì)為
(17)
式中,x>0,m為比nh大但比n小的整數(shù)。
基于偽數(shù)據(jù)法的核密度估計(jì)(Kernel Density Estimation with Pseudo-data,KDEP)雖然在一定條件下可以消除邊界偏差,但在樣本數(shù)值變化較大的局部區(qū)域,對(duì)受諸多因素影響的隨機(jī)變量使用固定帶寬的KDEP可能效果較差。為此,本文通過(guò)引入AKDE來(lái)改善局部適應(yīng)性問(wèn)題。
設(shè)光伏出力樣本為PPV,1,PPV,2,…,PPV,n,其概率密度函數(shù)為f(PPV),將KDEP與AKDE相結(jié)合,用式(7)中的自適應(yīng)帶寬h(PPV,i)代替式(17)中的固定帶寬,進(jìn)而得到基于偽數(shù)據(jù)法自適應(yīng)核密度估計(jì)(Adaptive Kernel Density Estimation with Pseudo-data,AKDEP)的光伏出力概率分布模型為
(18)
式(18)建立的基于AKDEP的光伏出力概率分布模型將偽數(shù)據(jù)添加到邊界附近以修正偏差,通過(guò)引入AKDE的自適應(yīng)帶寬來(lái)改善核密度估計(jì)的局部適應(yīng)性,從而克服了傳統(tǒng)非參數(shù)核密度估計(jì)模型的局限性。
(19)
(20)
核密度估計(jì)曲線(xiàn)反映觀測(cè)數(shù)據(jù)在曲線(xiàn)生成中的占比,其平滑程度是通過(guò)帶寬來(lái)體現(xiàn)的,帶寬選擇的不同會(huì)直接導(dǎo)致估計(jì)結(jié)果存在差異。一般而言,帶寬選擇越大,觀測(cè)數(shù)據(jù)點(diǎn)在曲線(xiàn)中的占比越小,核密度估計(jì)曲線(xiàn)越平滑;反之,帶寬選擇越小,核密度估計(jì)曲線(xiàn)波動(dòng)越顯著。
目前,最優(yōu)帶寬的選取主要有經(jīng)驗(yàn)法和交叉驗(yàn)證法。經(jīng)驗(yàn)法通過(guò)使MISE或AMISE最小來(lái)求得最優(yōu)帶寬,計(jì)算出的最優(yōu)帶寬比較適合于樣本數(shù)據(jù)整體分布與正態(tài)分布差距不大的函數(shù),對(duì)于隨機(jī)性強(qiáng)、整體分布與正態(tài)分布相差較大的樣本數(shù)據(jù)不適用。本文采用交叉驗(yàn)證法計(jì)算最優(yōu)帶寬,具體計(jì)算過(guò)程為
(21)
令
(22)
則有
(23)
最終得出最優(yōu)帶寬h為
(24)
擬合優(yōu)度檢驗(yàn)是判斷光伏出力理論分布是否符合樣本實(shí)際分布。如果理論分布與樣本實(shí)際分布有較大差距,那么依據(jù)理論分布建立的模型結(jié)果就可能與實(shí)際數(shù)據(jù)存在較大的誤差[20]。本文采用χ2檢驗(yàn)作為擬合優(yōu)度的指標(biāo)對(duì)基于AKDEP的光伏出力概率分布模型進(jìn)行檢驗(yàn),判斷其結(jié)果分布是否可以反映光伏隨機(jī)出力特性,以及其概率分布曲線(xiàn)是否與歷史實(shí)測(cè)數(shù)據(jù)有較高的擬合程度。
χ2檢驗(yàn)是根據(jù)理論頻數(shù)與觀察頻數(shù)的差值來(lái)衡量擬合優(yōu)度優(yōu)劣的一種方法。設(shè)光伏出力的樣本為PPV,1,PPV,2,…,PPVn,并將其劃分為m組不重復(fù)的數(shù)據(jù),則χ2檢驗(yàn)統(tǒng)計(jì)量為
(25)
式中:Ai為光伏出力樣本在第i個(gè)區(qū)間的觀測(cè)頻數(shù);Ei為光伏出力樣本在第i個(gè)區(qū)間的期望頻數(shù),其計(jì)算式為
Ei=F(PPV,max)-F(PPV,min)=npPV,i,
(26)
式中:PPV,max、PPV,min為第i組光伏出力樣本數(shù)據(jù)的最大值和最小值;pPV,i為光伏出力樣本在第i個(gè)區(qū)間的概率值;F為累積概率密度函數(shù)。
根據(jù)K.Pearson定理,當(dāng)樣本n足夠大時(shí),χ2統(tǒng)計(jì)量近似服從自由度為m-1的χ2分布,即
(27)
(28)
為分析光伏出力概率模型的輸出結(jié)果與實(shí)測(cè)數(shù)據(jù)之間的差異,本文采用均方根誤差判定,其表達(dá)式為
(29)
式中:m為劃分的區(qū)間總數(shù);xi為光伏出力的估計(jì)值;yi為第i個(gè)區(qū)間實(shí)測(cè)數(shù)據(jù)的概率。
本文數(shù)據(jù)來(lái)源于澳大利亞某大學(xué)新能源實(shí)驗(yàn)室光伏出力實(shí)測(cè)數(shù)據(jù),對(duì)基于AKDEP建立的光伏出力模型進(jìn)行檢驗(yàn)。將理論模型結(jié)果與歷史實(shí)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,以便直觀地體現(xiàn)理論分布與實(shí)際數(shù)據(jù)的差異。該光伏電站的規(guī)模是255 kW,電池板建于校園內(nèi)部分屋頂和地面。該光伏系統(tǒng)單片組件的功率為255 W,共1 000片,采用集中逆變器并網(wǎng)方式,直流側(cè)用匯流箱接入逆變器并網(wǎng)。
實(shí)驗(yàn)室提供的全年13:00時(shí)光伏出力實(shí)測(cè)數(shù)據(jù)如圖1所示。
將上述實(shí)測(cè)光伏出力數(shù)據(jù)為輸入樣本,計(jì)算得出基于NKDE的光伏模型和基于AKDEP的光伏模型出力概率密度曲線(xiàn)邊界對(duì)比結(jié)果如圖2所示。
圖1 全年13:00時(shí)光伏出力實(shí)測(cè)數(shù)據(jù)直方圖Fig. 1 Histogram of measured photovoltaic output datas at13:00 of the year
圖2 不同光伏模型的出力概率密度曲線(xiàn)邊界對(duì)比Fig. 2 The output probability density curve boundary comparison of different photovoltaic models
由圖2分析可知,NKDE光伏模型在小于0的區(qū)域仍有概率分布,存在邊界偏差;而AKDEP光伏模型在小于0的區(qū)域無(wú)概率分布,很好地修正了邊界偏差,與實(shí)際樣本數(shù)據(jù)分布基本相符。而且從整體來(lái)看,NKDE光伏模型雖然能反映光伏出力的變化趨勢(shì),但由于采用固定帶寬,局部適應(yīng)性較差,分布曲線(xiàn)比較平滑;AKDEP光伏模型采用可變帶寬,具有較強(qiáng)的局部適應(yīng)性,能更加精確地模擬光伏出力的隨機(jī)特性。
本文使用的數(shù)據(jù)范圍為該光伏電站2016至2018年的歷史數(shù)據(jù),其中包括每天各小時(shí)級(jí)光伏出力數(shù)據(jù),以及該數(shù)據(jù)對(duì)應(yīng)的日期、時(shí)段和天氣數(shù)據(jù)等。將全年各天分為晴天和陰天。天氣預(yù)報(bào)為晴,則該日的光伏出力數(shù)據(jù)劃為晴天數(shù)據(jù);天氣預(yù)報(bào)為多云和陰雨雪,則該日光伏出力數(shù)據(jù)作為陰天數(shù)據(jù)。分別以晴天和陰雨天的光伏出力實(shí)測(cè)數(shù)據(jù)作為輸入樣本,基于NKDE光伏模型和AKDEP光伏模型擬合光伏出力概率密度分布,與隨機(jī)抽取的單日相應(yīng)天氣條件下光伏出力實(shí)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,以檢驗(yàn)不同光伏模型對(duì)于光伏出力隨機(jī)性模擬的優(yōu)劣。
其中,晴天情況下兩種模型得出的光伏出力概率密度曲線(xiàn)如圖3所示。對(duì)比分析結(jié)果可知,基于AKDEP模型得出的光伏出力概率密度曲線(xiàn)與全年實(shí)測(cè)數(shù)據(jù)分布的擬合程度優(yōu)于NKDE光伏出力模型,能夠更好地反映光伏出力的隨機(jī)特性。利用生成的光伏出力概率分布模型與隨機(jī)抽取單日晴天各時(shí)段光伏出力分布的對(duì)比結(jié)果如圖4所示??梢?jiàn)兩種模型整體變化趨勢(shì)與單日實(shí)測(cè)光伏出力分布基本相符,但NKDE概率密度曲線(xiàn)過(guò)于平滑,在波動(dòng)和峰值區(qū)域誤差更大,對(duì)波動(dòng)的適應(yīng)性較差。
圖3 不同模型生成的晴天光伏出力概率密度曲線(xiàn)Fig.3 Probability density curves of photovoltaic output generated by different photovoltaic models under sunny weather
圖4 晴天光伏出力概率密度曲線(xiàn)與實(shí)測(cè)數(shù)據(jù)對(duì)比
陰雨天情況下兩種模型得出的光伏出力概率密度曲線(xiàn)如圖5所示。利用生成的光伏出力概率分布模型與隨機(jī)抽取的單日陰雨天各時(shí)段光伏出力分布的對(duì)比結(jié)果如圖6所示??梢?jiàn)在陰雨天情況下NKDE與AKDEP的光伏模型都能夠較好反映光伏出力的整體變化趨勢(shì)。原因是陰雨天光伏出力波動(dòng)較小,AKDEP和NKDE方法均能較好地適應(yīng)。對(duì)比單日光伏出力實(shí)測(cè)數(shù)據(jù),兩種方法的準(zhǔn)確度都較高。
圖5 陰雨天不同光伏模型生成的光伏出力概率密度曲線(xiàn)Fig.5 Probability density curves of photovoltaic output generated by different photovoltaic models in rainy days
圖6 陰雨天下光伏出力概率密度曲線(xiàn)與實(shí)測(cè)數(shù)據(jù)對(duì)比Fig.6 Comparison of probability density curve of PV output and histogram of measured data under cloudy and rainy days
由圖4和圖6也可以看出,本文建立的光伏出力模型與光伏單日出力分布有一定差異,這是由于本文模型是對(duì)光伏出力的全年統(tǒng)計(jì)平均分布,反映了全年的平均水平。
本文χ2檢驗(yàn)的門(mén)檻值設(shè)為31.54,不同光伏模型的χ2檢驗(yàn)結(jié)果和誤差分析結(jié)果見(jiàn)表3。
表3 光伏出力模型的χ2檢驗(yàn)和誤差分析Tab.3 Chi-square test and error analysis of photovoltaic output model
由表3檢驗(yàn)結(jié)果分析可知,基于參數(shù)分布建立的光伏模型未通過(guò)檢驗(yàn);雖然NKDE光伏模型與AKDEP光伏模型檢驗(yàn)統(tǒng)計(jì)量都小于臨界值,但后者的檢驗(yàn)統(tǒng)計(jì)量更小。由誤差分析結(jié)果可知,相較于其他兩種光伏模型,AKDEP光伏模型RMSE最小,說(shuō)明基于AKDEP的光伏模型出力概率分布與實(shí)測(cè)數(shù)據(jù)分布最接近。
本文針對(duì)非參數(shù)核密度估計(jì)在光伏出力概率建模中存在邊界偏差以及缺乏適應(yīng)性的問(wèn)題,將自適應(yīng)核密度估計(jì)和基于偽數(shù)據(jù)法的核密度估計(jì)相結(jié)合,提出一種改進(jìn)的非參數(shù)核密度估計(jì)建模方法,并基于此方法建立了光伏出力概率模型,結(jié)合算例分析,得出如下結(jié)論:
1) 基于偽數(shù)據(jù)法的自適應(yīng)核密度估計(jì)光伏出力概率模型可以很好地模擬不同天氣條件下光伏出力的隨機(jī)特性,更加精確地表征光伏出力隨機(jī)分布的整體趨勢(shì)。
2) 基于偽數(shù)據(jù)法的自適應(yīng)核密度估計(jì)所建光伏出力概率模型克服了傳統(tǒng)非參數(shù)核密度估計(jì)所建光伏出力模型的局限性,在避免邊界偏差的同時(shí)改善了局部適應(yīng)性。