虞瑄,劉高維
(中國電力工程顧問集團華東電力設(shè)計院有限公司,上海 200001)
光伏發(fā)電的波動和間歇行為都具有強烈的不確定性,對電力可靠性、電能質(zhì)量、經(jīng)濟性及社會福利的影響隨著滲透率的增加而越發(fā)突出[1]。光伏發(fā)電的不確定性增加了對各級備用容量,特別是調(diào)頻及旋轉(zhuǎn)備用的需求。因此,描述光伏發(fā)電的間歇性出力是含光伏發(fā)電的電源規(guī)劃階段亟待解決的問題。
目前已有一些對場景縮減方法的研究。文獻[2]以Fortet-Mourier類型概率度量為指標,通過場景縮減對電力負荷進行管理。文獻[3]提出了一種替代程序,有效減少了與電力市場有關(guān)的貿(mào)易問題中的不確定情景數(shù)量。文獻[4]基于改進的k-medoids并行聚類算法進行場景融合,得到經(jīng)典場景集。傳統(tǒng)的k-means算法由于初始聚類中心的隨機選擇,可能會陷入局部最優(yōu),無法實現(xiàn)全局上的最優(yōu)解,使最終的聚類效果受到影響。
本文提出基于布谷鳥-灰狼 (cuckoo search-gray wolf optimize,CS-GWO) 優(yōu)化算法改進的k-means聚類算法,總體思想是利用灰狼算法的全局尋優(yōu)過程來篩選最優(yōu)的初始聚類中心,同時結(jié)合布谷鳥算法對灰狼算法進行優(yōu)化,提高灰狼算法的全局搜索能力,避免陷入維數(shù)成災(zāi)和局部最優(yōu)。
本文首先介紹了基于CS-GWO改進的k-means聚類算法基本原理;然后利用灰狼算法和布谷鳥算法的全局搜索能力對傳統(tǒng)k-means聚類算法進行改進,優(yōu)化了初始聚類中心的選擇,提高了聚類結(jié)果表征初始隨機變量特性的準確性;最后將改進的k-means聚類算法應(yīng)用于場景縮減,實現(xiàn)了光伏發(fā)電出力場景分析,并通過算例驗證了該方法的有效性。
灰狼優(yōu)化(GWO)算法是依據(jù)生物界中灰狼的捕食行為,模擬提出的一種群搜索智能算法。GWO算法將狼群劃分成不同階層,在整個過程中,α狼、β狼和δ狼主導(dǎo)狩獵(優(yōu)化),ω狼根據(jù)領(lǐng)導(dǎo)者的指令移動。數(shù)學(xué)模型如下:
(1)
(2)
(3)
(4)
式中:Ai,Ci為模型的系數(shù)向量,i=1,2,3;X,Xα,Xβ,Xδ以及Xp分別為灰狼和獵物的位置向量;t為當前迭代的次數(shù);α的取值從2至0線性下降;;l1,l2∈random[0,1];Dα、Dβ、Dδ分別為下一個待更新的灰狼與三種優(yōu)勢狼之間的距離。
布谷鳥算法同樣屬于仿生的啟發(fā)式尋優(yōu)算法,它根據(jù)布谷鳥尋巢寄生的特點,結(jié)合在飛行尋巢過程中的萊維飛行特性,具有較強的全局優(yōu)化能力。布谷鳥尋找最適合寄生巢的飛行路徑符合萊維飛行,其公式可用式(5)來表示[5]。
Xt+1=X+α?Levy(β)
(5)
式中:X為灰狼的位置;α為隨機因子;Levy(β)描述萊維飛行,用Mantegna方法進行模擬。Mantegna方法公式如式(6)所示。
(6)
式中:s為服從萊維飛行的隨機步長;u~N(0,δ2);v~N(0,1);β通常為1.5。
當宿主鳥以P0的幾率發(fā)現(xiàn)了布谷鳥寄生的蛋后,布谷鳥重新尋找寄生巢的位置,這一過程可以采用隨機方式進行描述,如式(7)所示。
Xt+1=Xt+r?Heaviside(P0-δ)?(Xi-Xj)
(7)
式中:X為灰狼的位置;r、δ為隨機數(shù); Heaviside(·)為跳躍函數(shù);Xi、Xj為其他位置的鳥巢。
灰狼算法在多次迭代之后,決定其位置的參數(shù)容易陷入局部最優(yōu),導(dǎo)致算法無法實現(xiàn)全局最優(yōu);而布谷鳥算法依靠萊維飛行與布谷鳥搜索能夠有效地實現(xiàn)全局范圍的搜索,避免由于單一參數(shù)導(dǎo)致的局部最優(yōu)。因此,可以將兩者融合起來,利用灰狼算法優(yōu)化初始聚類中心的選擇,再利用布谷鳥算法優(yōu)化灰狼算法,解決GWO陷入局部最優(yōu)的短板。
結(jié)合布谷鳥算法,在初始化狼群位置之后,可以利用萊維飛行來更新優(yōu)勢狼α、β和δ的位置,保證其更新的位置是當前迭代步內(nèi)的最優(yōu),即確定初始的宿主巢。之后考慮在狩獵過程中獵物發(fā)現(xiàn)狼群,即宿主發(fā)現(xiàn)了布谷鳥的寄生蛋的情況,重新隨機更新灰狼的位置,避免陷入局部最優(yōu)。經(jīng)過以上思路,CS-GWO算法的流程如下。
步驟1:設(shè)置最大迭代次數(shù)T及其他參數(shù),選擇適應(yīng)度函數(shù),初始化α狼、β狼和δ狼的位置。
步驟2:計算狼群適應(yīng)度函數(shù)值,進行分層,更新α狼、β狼和δ狼位置。
步驟3:利用萊維飛行更新α狼、β狼和δ狼位置,并利用GWO算法更新狼群位置。
步驟4:判斷獵物是否發(fā)現(xiàn)狼群。若是,則隨機更新灰狼位置;若否,則轉(zhuǎn)入step5。
步驟5:重復(fù)迭代step2~step4至達到最大迭代次數(shù)T,則輸出最終的最優(yōu)α狼位置。
因此可以利用CS-GWO算法為k-means算法尋找最優(yōu)的初始聚類中心,從而獲得最佳的聚類效果。
光伏的出力曲線在年時間尺度上存在季節(jié)性的差異與波動,同時在日內(nèi)時間尺度上存在晝夜之間的差異,可以采用周期內(nèi)聚類縮減的方法進行典型場景的選取。在進行場景縮減的過程中,往往根據(jù)季節(jié),以1 d為單位對場景集進行初始的劃分。假設(shè)初始場景集為U={U1,U2,…,UN},單個的場景Un(n=1,2,…,N)為一天的出力數(shù)據(jù)。若一天有m個采樣點,那么U1,U2,…,UN就是N個m維向量,故場景集U可以用N×m的矩陣表示。根據(jù)季節(jié)對U初步劃分后得到相應(yīng)的初始場景集,針對不同季節(jié)的初始場景集利用改進的k-means方法進行場景縮減,得到k類場景,經(jīng)過合并各類聚類中心C1,C2,…,Ck后得到典型場景集C={C1,C2,…,Ck}。由于在縮減合并過程中保持了場景數(shù)據(jù)的時序性與概率分布特性。因此C能夠以小樣本數(shù)量來體現(xiàn)原始場景集的時序特性與概率密度分布特性。
在通過聚類進行典型場景選取時場景類別k的取值至關(guān)重要,可以引入輪廓系數(shù)作為評價聚類效果的指標。最優(yōu)情況下,簇內(nèi)距離最小,簇間距離最大,即聚類之后的每一簇足夠緊密,簇與簇之間足夠分散。單個樣點的輪廓系數(shù)計算公式如式(8)所示。
(8)
式中:pi為某簇簇內(nèi)一點到簇內(nèi)其他點的平均距離;qi為該點到簇外其他所有簇內(nèi)點的平均距離;SCi∈[-1,1]。
所有樣點的輪廓系數(shù)SC的均值稱為平均聚類輪廓系數(shù)SCk,可利用SCk對聚類效果進行評價。計算公式如式(9)所示。
(9)
式中:k為對應(yīng)的聚類中心個數(shù);n為數(shù)據(jù)集中的樣點個數(shù)。
利用CS-GWO算法為k-means算法尋找最優(yōu)的初始聚類中心時,將GWO算法的適應(yīng)度函數(shù)設(shè)置為與評價k-means聚類效果相關(guān)的函數(shù),這樣經(jīng)過多次迭代之后獲得的最優(yōu)的α狼位置可以作為k-means最優(yōu)的初始聚類中心,從而獲得最佳的聚類效果。
綜合以上分析,光伏出力場景分析流程如圖1所示。
以某地區(qū)太陽光輻照度數(shù)據(jù)為例進行場景縮減與典型場景選取。該地區(qū)地處熱帶,每隔一小時為一個采樣點記錄一次太陽輻照度數(shù)據(jù)。全年白天太陽輻照度在0~850 W/m2之間波動,夜間太陽輻照度為0。根據(jù)美國能源部發(fā)布的SAM軟件中查詢得到某地區(qū)全年太陽光輻照度如圖2所示。
選取6-8月即夏季的太陽輻照度進行場景縮減與典型場景選取。已知該地區(qū)太陽輻照度數(shù)據(jù)采樣步長為1 h,共8 760個采樣點,夏季6-8月合計92 d,共2 208個采樣點。將圖2數(shù)據(jù)以最大值為基準進行歸一化處理后,該地區(qū)夏季太陽輻照度數(shù)據(jù)如圖3所示。
圖1 場景分析流程
圖2 某地區(qū)全年太陽輻照度曲線
圖3 某地區(qū)夏季太陽光輻照度曲線(歸一化后)
通過比較輪廓系數(shù)指標進行多次聚類計算,輪廓系數(shù)SC與聚類數(shù)k之間的關(guān)系如圖4所示。因此,本節(jié)選取最佳聚類數(shù)為k=8。通過第2節(jié)所提算法選取到的最終典型場景如圖5所示。
根據(jù)文獻[6]采用累積分布函數(shù)來評價場景縮減后選取的典型場景是否有效表示初始場景的概率性分布。累積分布函數(shù)是概率密度函數(shù)的積分,表征隨機變量的概率分布定義為:
fCDF(a)=P(x≤a)
(10)
若典型場景的累積分布函數(shù)曲線與初始場景的累積分布函數(shù)曲線走勢相同且兩者之間圍成的面積越小,則表明兩者差異度越小。差異度越小典型場景越能準確描述初始場景的概率分布特性,從而實現(xiàn)小樣本描述大場景集的目的。根據(jù)本算例選取出的典型場景集與初始場景集,繪制兩者的累積分布曲線如圖6所示。
圖4 聚類中心個數(shù)k與輪廓系數(shù)SC之間的關(guān)系
圖5 某地區(qū)夏季太陽光輻照度典型場景
圖6 典型場景與初始場景的累積分布曲線
如圖6所示,典型場景的累積分布曲線與初始場景的累積分布曲線走勢相同,且兩者之間的差距很小,差異度即典型場景的累積分布曲線與初始場景的累積分布曲線圍成的面積接近于0。說明通過第2節(jié)算法選取的典型場景能夠很好地擬合初始場景的概率分布特性,同時保留了初始場景的時序特性,有效地實現(xiàn)場景縮減。
本文將場景分析理論應(yīng)用于描述風(fēng)電和光伏的波動性出力。首先,針對k-means算法初始聚類中心不確定導(dǎo)致聚類結(jié)果較差的問題,提出了基于布谷鳥-灰狼算法改進的k-means聚類算法,并將改進后的灰狼算法應(yīng)用于k-means算法的初始聚類中心選擇以及場景縮減中。最后,通過算例分析,驗證了本文所提出算法的有效性。主要研究結(jié)論如下:
(1) 提出了基于布谷鳥-灰狼算法改進的k-means聚類算法。針對灰狼算法線性收斂因子收斂速度不變的問題提出了非線性收斂函數(shù)進行改進。針對灰狼算法更新位置容易陷入局部最優(yōu)的問題,利用布谷鳥算法的萊維飛行更新策略以及概率性排除“壞解”記性改進。
(2) 通過對某地區(qū)光伏場景的仿真分析,驗證了本文所提基于CS-GWO改進的k-means聚類算法得到的場景縮減結(jié)果滿足關(guān)于運算效率和準確性的要求。