楊 柳,李 明
(國網(wǎng)通化供電公司,吉林 通化 134001)
隨著我國大規(guī)模的風(fēng)電并網(wǎng),給電網(wǎng)的運(yùn)行也帶來了一定的沖擊,風(fēng)電與熱、電負(fù)荷在時(shí)間和空間上均可能存在較強(qiáng)的相關(guān)性,如果不考慮這種關(guān)系將會(huì)影響風(fēng)電的合理消納及風(fēng)能的利用效率[1-2]。因此,在電網(wǎng)經(jīng)濟(jì)調(diào)度中有必要對(duì)風(fēng)電與熱、電負(fù)荷間的相關(guān)性進(jìn)行精確建模,以量化變量的隨機(jī)性給電力系統(tǒng)帶來的影響,實(shí)現(xiàn)電網(wǎng)安全經(jīng)濟(jì)運(yùn)行。
研究變量間的相關(guān)性問題的關(guān)鍵在于正確處理非正態(tài)隨機(jī)變量之間的相關(guān)性[3]。 科普拉(Copula)理論作為多元分析方法中的一種方法,能較準(zhǔn)確描述多元變量的相關(guān)結(jié)構(gòu),被廣泛應(yīng)用于兩個(gè)(或多個(gè))隨機(jī)變量的依賴結(jié)構(gòu)建模。該方法被用于許多領(lǐng)域的研究,包括金融[4]、風(fēng)電場相關(guān)性分析[5]、洪水風(fēng)險(xiǎn)分析[6]、頻率分析等[7]。文獻(xiàn)[8]提出構(gòu)造混合Copula函數(shù)來模擬兩個(gè)風(fēng)場之間的風(fēng)速相關(guān)性,但沒有關(guān)于模型結(jié)構(gòu)和驗(yàn)證的細(xì)節(jié)。文獻(xiàn)[9]基于動(dòng)態(tài)Copula理論構(gòu)建風(fēng)光聯(lián)合出力模型,用動(dòng)態(tài)相關(guān)系數(shù)來描述相關(guān)性,并將其運(yùn)用于數(shù)據(jù)驅(qū)動(dòng)的風(fēng)光聯(lián)合系統(tǒng)中。文獻(xiàn)[10]采用的是線性相關(guān)性建模,這對(duì)于非線性的變量無法準(zhǔn)確地描述。鑒于此,本文提出采用Copula函數(shù)來推斷Copula參數(shù)及構(gòu)建風(fēng)-電-熱相關(guān)性模型。以某地區(qū)的熱負(fù)荷、電負(fù)荷和風(fēng)電出力作為數(shù)據(jù)樣本,驗(yàn)證Copula建模的有效性,結(jié)果表明所提方法的準(zhǔn)確性和合理性。
Copula是一個(gè)無論其單變量分布如何,“連接”或“耦合”兩個(gè)或多個(gè)與時(shí)間無關(guān)的變量的數(shù)學(xué)函數(shù)。設(shè)H是具有邊際單變量分布F和G的聯(lián)合累積分布函數(shù),X和Y是連續(xù)的二維隨機(jī)變量。斯科拉(Sklar)定理指出當(dāng)F和G連續(xù)時(shí),存在唯一一個(gè)確定的Copula函數(shù)C(·)滿足:
H(x,y)=C[F(x),G(y)]
(1)
Sklar定理也可以推廣到多元分布的聯(lián)合分布函數(shù)。
在非正態(tài)分布情況下,需要引入能夠很好測量隨機(jī)變量相關(guān)性的指標(biāo),通常通過參數(shù)和經(jīng)驗(yàn)依賴性度量之間的理論關(guān)系來估計(jì),如肯德爾(Kendall)秩相關(guān)系數(shù)τ和斯皮爾曼(Spearman)相關(guān)系數(shù)ρ,若τ>0,表示變量間呈正相關(guān);τ<0,表示變量間呈負(fù)相關(guān)[11]。ρ相關(guān)系數(shù)也呈同樣的變化關(guān)系。設(shè)兩隨機(jī)變量X,Y的分布函數(shù)分別為F(x),G(y),若u=F(x),v=G(y),則兩變量之間的相關(guān)性可由τ和ρ相關(guān)系數(shù)得到,即:
(2)
(3)
Copula模型的一個(gè)顯著優(yōu)點(diǎn)就是變量的邊緣分布不受限制,它可以將邊緣分布和變量間相關(guān)性分開研究,所以由Sklar定理將Copula函數(shù)模型的建立分步來完成:第一步,確定變量的邊緣分布,由變量的歷史數(shù)據(jù)可確定邊緣分布;第二步,選取適當(dāng)?shù)腃opula函數(shù),只有選取合適的Copula函數(shù)才能準(zhǔn)確的反應(yīng)變量之間的相關(guān)結(jié)構(gòu);第三步,參數(shù)估計(jì),得出Copula函數(shù)模型中的未知參數(shù)估計(jì)值。
一般情況下,邊緣分布的確定有兩種方式,一種是參數(shù)方式,另一種是非參數(shù)方式。參數(shù)方式是指假設(shè)隨機(jī)變量服從某一確定的分布,比如一些常用的分布,然后根據(jù)極大似然估計(jì)法估計(jì)分布中的參數(shù),最后進(jìn)行檢驗(yàn);非參數(shù)方式是指不需要事先假設(shè)隨機(jī)變量服從哪種具體形式,而是以經(jīng)驗(yàn)分布與核密度估計(jì)為基礎(chǔ),將經(jīng)驗(yàn)分布代替整體隨機(jī)變量分布,最后采用極大似然估計(jì)方法對(duì)模型的參數(shù)進(jìn)行估計(jì)。在實(shí)際中,邊緣分布的確定對(duì)變量間的相關(guān)性分析是十分重要的,如果選取不當(dāng),將會(huì)影響最終數(shù)據(jù)的擬合效果。所以本文采用非參數(shù)方式,基于核密度的估計(jì)方法來確立隨機(jī)變量的邊緣分布,對(duì)于已知的數(shù)據(jù)樣本,核密度估計(jì)的結(jié)果主要取決于窗寬h的選擇。設(shè)隨機(jī)變量X的樣品點(diǎn)為(x1,x2,…,xn),n為樣本個(gè)數(shù),在任意點(diǎn)x處的概率密度函數(shù)f(x)的核密度估計(jì)為:
(4)
其中h為窗寬或帶寬,K(·)為核函數(shù),起到一種加權(quán)作用,任一點(diǎn)x處的密度函數(shù)估計(jì)值的大小與該點(diǎn)附近所包含的樣本點(diǎn)的個(gè)數(shù)有關(guān),若樣本點(diǎn)較稀疏,則估計(jì)值較小,反之則較大。對(duì)f(x)積分可以得到變量的邊緣分布函數(shù)F(x),再將邊緣分布函數(shù)轉(zhuǎn)換為均勻分布U,對(duì)于r∈(0,1)存在:
P[F(x)≤r]=P[X≤F-1(r)]=
F[F-1(r)]=r?F(x)=U
(5)
最優(yōu)Copula函數(shù)的選取包括兩個(gè)方面,一是Copula函數(shù)參數(shù)的確定,二是Copula函數(shù)類型的確定。選取合適的備選Copula函數(shù)的方法有很多種,根據(jù)分析數(shù)據(jù)的特點(diǎn)來選擇合適的備選Copula函數(shù)。本文采用圖形法,通過二元頻率直方圖來選擇合適的備選Copula函數(shù)。如果兩變量的二元頻率直方圖是非對(duì)稱的,則可以選擇岡貝爾(Gumbel) Copula函數(shù)和克萊頓(Clyton) Copula函數(shù),如果是對(duì)稱的,則選擇法蘭克(Frank) Copula函數(shù)、Norm Copula函數(shù)和t-Copula函數(shù);如果二元頻率直方圖反應(yīng)尾部的相關(guān)性,則可以選擇Gumbel Copula函數(shù)、Clyton Copula函數(shù)和t-Copula函數(shù),如果不反應(yīng)尾部相關(guān)性,則選擇Frank Copula函數(shù)和Norm Copula函數(shù)。在得到的各Copula函數(shù)所對(duì)應(yīng)的最優(yōu)參數(shù)的基礎(chǔ)上,通過平方歐式距離檢驗(yàn)?zāi)P偷臄M合度,將平方歐式距離最小的備選Copula函數(shù)作為最優(yōu)Copula函數(shù)。
在確定了邊緣分布和最優(yōu)Copula函數(shù)后,通過原始數(shù)據(jù)和選取的Copula函數(shù)進(jìn)行模型的參數(shù)估計(jì),采用分步極大似然估計(jì)法對(duì)變量間的Copula未知參數(shù)進(jìn)行估計(jì)。根據(jù)式(6)可知,采用分步極大似然估計(jì)法進(jìn)行估計(jì),步驟為:
(6)
a.求參數(shù)θ1和θ2的極大似然值:
b.把θ1和θ2帶入下式,求出Copula函數(shù)中的參數(shù)α:
本文選某地一年的風(fēng)力發(fā)電和電、熱負(fù)荷的數(shù)據(jù)進(jìn)行分析,它代表了在某地區(qū)一年中熱負(fù)荷和電負(fù)荷的基本趨勢(shì)和風(fēng)電場輸出功率的波動(dòng)情況,算法流程見圖1。目前變量間的相關(guān)性分析僅考慮在二元變量間進(jìn)行分析,所以風(fēng)-電-熱三變量需要分成兩兩一組進(jìn)行分析。
圖1 算法流程
采取基于核密度的估計(jì)方法來確立隨機(jī)變量的邊緣分布,其不需要事先假設(shè)隨機(jī)變量服從哪種具體形式,只從數(shù)據(jù)本身出發(fā),通過與經(jīng)驗(yàn)分布對(duì)比檢驗(yàn)核密度估計(jì)的準(zhǔn)確性。圖2分別為電負(fù)荷、風(fēng)力發(fā)電和熱負(fù)荷的經(jīng)驗(yàn)分布函數(shù)和核分布估計(jì)圖,由圖2可知該方法可以很好地?cái)M合樣本數(shù)據(jù),所以核密度估計(jì)是準(zhǔn)確的。
圖2 邊緣分布函數(shù)
在確定了電負(fù)荷、風(fēng)力發(fā)電和熱負(fù)荷的邊緣分布后,繪制電負(fù)荷和風(fēng)力發(fā)電、電負(fù)荷和熱負(fù)荷、風(fēng)力發(fā)電和熱負(fù)荷的二元頻率和頻數(shù)直方圖,由于篇幅有限,僅對(duì)電負(fù)荷和風(fēng)力發(fā)電進(jìn)行分析,其余兩組分析方法相似。電負(fù)荷和風(fēng)力發(fā)電的頻率直方圖見圖3,從圖3中可以看出電負(fù)荷和風(fēng)電出力的二元頻率直方圖具有基本對(duì)稱的尾部,所以初選Norm Copula函數(shù)和t-Copula函數(shù)來描述變量之間的相關(guān)結(jié)構(gòu)。
圖3 電負(fù)荷和風(fēng)電出力的頻率直方圖
確定了變量的邊緣分布和選取合適的Copula函數(shù)后,通過各變量的原始數(shù)據(jù),采用分布極大似然估計(jì)法對(duì)所選取的Copula函數(shù)進(jìn)行參數(shù)估計(jì),表1為電負(fù)荷和風(fēng)電出力模型估計(jì)所得到的參數(shù),其中皮爾森(Pearson)系數(shù)用來描述變量間的線性相關(guān)程度,Kendall秩相關(guān)系數(shù)表示隨機(jī)變量間變化趨勢(shì)一致相關(guān)性,Spearman秩相關(guān)系數(shù)表示隨機(jī)變量間變化趨勢(shì)一致與不一致的概率之差倍數(shù),自由度為t-Copula模型中的參數(shù),平方歐氏距離反映了Copula函數(shù)模型擬合的情況,數(shù)值越小,代表模型擬合的越好,圖4和圖5為得到的模型。
圖4 電負(fù)荷和風(fēng)電出力Norm Copula密度函數(shù)和分布函數(shù)
圖5 電負(fù)荷和風(fēng)電出力t- Copula密度函數(shù)和分布函數(shù)
表1 電負(fù)荷和風(fēng)電出力的參數(shù)估計(jì)
(7)
從圖4和圖5可以看出,電負(fù)荷和風(fēng)電出力中的二元t-Copula函數(shù)的密度函數(shù)比二元Norm Copula函數(shù)的密度函數(shù)具有更厚的尾部特征,說明t-Copula函數(shù)可以更好地?cái)M合電負(fù)荷和風(fēng)電出力之間的相關(guān)關(guān)系。
熱負(fù)荷、電負(fù)荷和風(fēng)電出力三者之間的相關(guān)性對(duì)于風(fēng)電合理消納、提高風(fēng)能利用效率具有重要的意義。本文以Copula理論為基礎(chǔ),首先確定變量間的邊緣分布,然后采用分布極大似然法對(duì)模型進(jìn)行估計(jì),最后通過平方歐式距離對(duì)所選取的Copula函數(shù)模型進(jìn)行擬合優(yōu)度檢驗(yàn)。實(shí)例分析表明,t-Copula函數(shù)可以更好地描述電負(fù)荷與風(fēng)電出力之間的相關(guān)性,并且可以準(zhǔn)確地描述變量間的尾部相關(guān)性,避免了只關(guān)注秩相關(guān)系數(shù)的缺點(diǎn)。