苗璐,樊瑋,肖紅燕,劉宇,陳德?lián)P,張勇軍
(1. 廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心,廣東 廣州 510220;2. 智慧能源工程技術(shù)研究中心,華南理工大學(xué) 電力學(xué)院,廣東 廣州 510640)
“雙碳”目標(biāo)的提出,加快了我國(guó)新能源發(fā)電建設(shè)和能源轉(zhuǎn)型的步伐。2023年我國(guó)光伏電站裝機(jī)容量已經(jīng)突破5億kW,其波動(dòng)性和間歇性給電網(wǎng)安全可靠性帶來(lái)了巨大挑戰(zhàn)[1-3],為此,研究光伏發(fā)電的出力特性受到廣泛關(guān)注[4-6]。文獻(xiàn)[4]對(duì)光伏出力的季/日特性及概率分布曲線進(jìn)行分析,得出不同區(qū)域間的出力相關(guān)性;文獻(xiàn)[5]從時(shí)間和頻率角度分析光伏出力的波動(dòng)性,得出在不同天氣下光伏出力的特性;文獻(xiàn)[6]利用運(yùn)行監(jiān)測(cè)數(shù)據(jù)總結(jié)了光伏電站的運(yùn)行特性。
由于光伏發(fā)電出力的不確定性和波動(dòng)性大,在研究光伏并網(wǎng)的機(jī)理和對(duì)策時(shí)面臨場(chǎng)景多、數(shù)據(jù)多、計(jì)算復(fù)雜度高的難題。因此,簡(jiǎn)化光伏出力場(chǎng)景、優(yōu)化分析方法十分必要[7-11]。對(duì)場(chǎng)景優(yōu)化的方法常見(jiàn)場(chǎng)景縮減法[7,9]和時(shí)序模擬法[12]等,其中場(chǎng)景縮減法應(yīng)用較為廣泛。場(chǎng)景縮減法多與聚類(lèi)算法相結(jié)合[7],通過(guò)將數(shù)據(jù)中的相似數(shù)據(jù)歸為一類(lèi)、相異數(shù)據(jù)劃分開(kāi),來(lái)生成多個(gè)類(lèi)別的場(chǎng)景集。目前聚類(lèi)算法主要有K-means聚類(lèi)、學(xué)習(xí)向量化聚類(lèi)和K-近鄰算法等。其中K-means算法是目前應(yīng)用最廣泛的聚類(lèi)算法,但初始聚類(lèi)中心和聚類(lèi)數(shù)目是隨機(jī)確定的,易導(dǎo)致聚類(lèi)結(jié)果收斂性不足,陷入局部最優(yōu)解。
為此,文獻(xiàn)[7]采用K-means聚類(lèi)并基于密度思想和距離最大、最小原則來(lái)確定聚類(lèi)中心,文獻(xiàn)[13]提出聚類(lèi)有效性指標(biāo)來(lái)提高收斂性。與K-means類(lèi)似的模糊C均值(fuzzy C-means,F(xiàn)CM)聚類(lèi)算法,引入隸屬度函數(shù)來(lái)分析不同樣本間的相似程度,得出樣本屬于不同類(lèi)別的權(quán)重,提高了聚類(lèi)靈活性[6-7],但也存在初始聚類(lèi)中心與最優(yōu)聚類(lèi)數(shù)目不確定的問(wèn)題。針對(duì)此:文獻(xiàn)[8]提出用皮爾遜相關(guān)系數(shù)代替?zhèn)鹘y(tǒng)歐氏距離,來(lái)確定聚類(lèi)中心;文獻(xiàn)[14]采用聚類(lèi)有效性指標(biāo)CH來(lái)確定最優(yōu)聚類(lèi)數(shù)目,改進(jìn)傳統(tǒng)FCM算法;文獻(xiàn)[15]將粒子群優(yōu)化算法與FCM聚類(lèi)算法相結(jié)合,確定初始聚類(lèi)中心與最優(yōu)聚類(lèi)數(shù)目。面對(duì)波動(dòng)性大、場(chǎng)景多的新能源發(fā)電,如何優(yōu)化聚類(lèi)后的場(chǎng)景縮減成為關(guān)鍵問(wèn)題。針對(duì)該問(wèn)題:文獻(xiàn)[7]結(jié)合K-means算法與同步回代消除算法(simultaneous backward reduction,SBR)進(jìn)行場(chǎng)景縮減;文獻(xiàn)[8]用后向場(chǎng)景削減方法確定典型場(chǎng)景;文獻(xiàn)[9]提出粒子群和遺傳優(yōu)化算法與聚類(lèi)相結(jié)合的場(chǎng)景縮減法;文獻(xiàn)[16]采用Wasserstein概率距離來(lái)處理光伏和風(fēng)電數(shù)據(jù),并基于改進(jìn)K-medoids算法生成場(chǎng)景。
總的來(lái)看,現(xiàn)有文獻(xiàn)采用FCM算法分析光伏出力時(shí),沒(méi)有同時(shí)考慮初始聚類(lèi)中心選取、聚類(lèi)數(shù)目確定和最終典型場(chǎng)景形成與縮減等情況,導(dǎo)致最終聚類(lèi)結(jié)果收斂性不足,以及某類(lèi)中存在較多場(chǎng)景,增加了分析難度。據(jù)此,本文首先建立光伏出力特性的評(píng)價(jià)指標(biāo),進(jìn)而提出一種改進(jìn)FCM聚類(lèi)算法,確定初始聚類(lèi)中心與聚類(lèi)數(shù)目,再基于概率距離采用場(chǎng)景縮減法對(duì)聚類(lèi)后的場(chǎng)景進(jìn)行縮減,得到具有典型特征的光伏出力場(chǎng)景,降低傳統(tǒng)分析出力數(shù)據(jù)的復(fù)雜性,為后續(xù)研究光伏出力特性奠定基礎(chǔ)。最后以廣東省某200 MW光伏電站為例進(jìn)行仿真驗(yàn)證。
光伏出力的波動(dòng)性和不確定性,使得對(duì)大量光伏數(shù)據(jù)進(jìn)行分析存在困難,而采用聚類(lèi)算法劃分出力特性時(shí),數(shù)據(jù)較多也會(huì)增加復(fù)雜度,并降低運(yùn)算速度;因此須先采用評(píng)價(jià)指標(biāo)量化表征出力特性,對(duì)數(shù)據(jù)進(jìn)行降維處理。為此本文考慮2個(gè)一級(jí)指標(biāo)(波動(dòng)性和出力效率),并針對(duì)2個(gè)一級(jí)指標(biāo),設(shè)定多個(gè)二級(jí)指標(biāo)用以更具體地分析不同屬性。用這些指標(biāo)表示1日內(nèi)的出力特性,可降低聚類(lèi)分析維度。
光伏發(fā)電作為一種新能源發(fā)電,受自然環(huán)境的影響較大,其中主要受到光照影響。光照具有不確定性,會(huì)在不同時(shí)刻形成出力波動(dòng),很有必要分析這些波動(dòng)情況,以更進(jìn)一步掌握光伏電站的并網(wǎng)對(duì)系統(tǒng)是否造成影響以及影響程度大小。利用波動(dòng)性指標(biāo)評(píng)估系統(tǒng)的波動(dòng)情況,可得出光伏出力對(duì)系統(tǒng)的影響程度。此外,光伏發(fā)電效率也一直是備受關(guān)心的問(wèn)題,對(duì)光伏出力效率進(jìn)行研究,也可以更好地評(píng)估光伏電站的出力特性。
為此,將波動(dòng)性和效率作為一級(jí)指標(biāo),從整體上衡量光伏出力特性,波動(dòng)性越小,效率越高,表示該時(shí)刻的出力水平越高。其中針對(duì)波動(dòng)性又設(shè)定3個(gè)二級(jí)指標(biāo),分別為變異系數(shù)α[16]、極端波動(dòng)率Kpfr[10]和平均波動(dòng)系數(shù)Kfluc[10]。出力效率設(shè)定有效出力率η、平均出力水平Paver和發(fā)電時(shí)間比β這3個(gè)二級(jí)指標(biāo)。
光伏發(fā)電本身是一個(gè)多變量的非線性問(wèn)題,其受到光照、溫度、光伏板面積等多種因素影響,且出力數(shù)據(jù)存在一定的波動(dòng)性,這種波動(dòng)造成發(fā)出的有功功率增減,危害系統(tǒng)穩(wěn)定,所以需要對(duì)波動(dòng)性進(jìn)行分析。
1.2.1 變異系數(shù)
分析某段時(shí)間的光伏出力,用標(biāo)準(zhǔn)差σ來(lái)表示該時(shí)段整體出力偏離平均出力的情況,用平均值u表示該時(shí)段內(nèi)整體出力水平。但僅用這2個(gè)評(píng)估指標(biāo)還不能較精確地體現(xiàn)出力波動(dòng)情況,將兩者結(jié)合,則可以得到變異系數(shù)
α=σ/u.
(1)
變異系數(shù)越大,表示數(shù)據(jù)偏離平均值越大,波動(dòng)性越大,這是用來(lái)衡量數(shù)據(jù)波動(dòng)程度的一個(gè)典型指標(biāo),將其作為波動(dòng)性的二級(jí)指標(biāo)具有較好的適應(yīng)性。
1.2.2 極端波動(dòng)率
該指標(biāo)表示光伏整體出力中超過(guò)或低于極限波動(dòng)變化率的時(shí)刻數(shù)占1日內(nèi)總時(shí)刻的比例,其中波動(dòng)變化率是指在一小段時(shí)間內(nèi)對(duì)光伏出力求差分,表示該小段時(shí)間內(nèi)光伏出力的變化量。極端波動(dòng)率
(2)
(3)
式中:v為波動(dòng)變化率,vmax和vmin分別表示最大和最小波動(dòng)變化率;t為周期內(nèi)的時(shí)刻,T為周期內(nèi)總時(shí)刻數(shù)。Kpfr可以衡量一段時(shí)間內(nèi)波動(dòng)的越限次數(shù),從而分析該時(shí)段是否存在較劇烈的波動(dòng)情況。
1.2.3 平均波動(dòng)系數(shù)
該指標(biāo)用來(lái)衡量研究周期內(nèi)的波動(dòng)反轉(zhuǎn)次數(shù),其計(jì)算式如下:
(4)
(5)
式中Pt、Pt-1和Pt+1分別為時(shí)刻t、t-1和t+1的有功出力值。(Pt-Pt-1)(Pt-Pt+1)>0時(shí)表示出力反向1次,即存在波動(dòng),但具體波動(dòng)大小,則需參考指標(biāo)極端波動(dòng)率和變異系數(shù)。
出力效率即衡量光伏電站在一定時(shí)間內(nèi)的出力效果,本文采用3個(gè)二級(jí)指標(biāo)來(lái)衡量光伏發(fā)電效率。
1.3.1 有效出力率
有效出力率指在研究周期內(nèi)光伏出力大于0的各時(shí)刻功率平均值與電站裝機(jī)容量之比,利用該指標(biāo)可以評(píng)估不同季節(jié)光伏電站發(fā)電效率和運(yùn)行狀況,其定義為
(6)
式中:TL為周期內(nèi)有效出力(光伏出力大于0)時(shí)間長(zhǎng)度對(duì)應(yīng)的時(shí)刻數(shù);S為電站裝機(jī)容量。通常,η越大表示光伏電站發(fā)電狀況越好,光伏發(fā)電效率越高。
1.3.2 平均出力水平
平均出力水平Paver為在研究周期內(nèi)各時(shí)刻光伏發(fā)電出力的平均值,代表在此周期內(nèi)的出力整體水平,Paver越大,表示該時(shí)段內(nèi)的出力效率越高,表示為
(7)
1.3.3 發(fā)電時(shí)間比
發(fā)電時(shí)間比β定義為周期內(nèi)有效出力時(shí)刻數(shù)度占周期總時(shí)刻數(shù)的比例,β越大,表示研究周期內(nèi)的出力效率越高。
β=TL/T.
(8)
本文結(jié)合上述6個(gè)光伏出力特性指標(biāo)來(lái)評(píng)估某日的出力特性,即用指標(biāo)表征1日內(nèi)的出力特征,將1個(gè)時(shí)間多維度問(wèn)題轉(zhuǎn)化為六維問(wèn)題,構(gòu)成以下特征數(shù)組:
X=(α,Kpfr,Kfluc,η,Paver,β).
(9)
由此,大大降低了數(shù)據(jù)分析的維度,有利于后續(xù)聚類(lèi)分析。
K-means算法用于聚類(lèi)時(shí),直接將樣本劃分到歐式距離最近的類(lèi)簇中去,得到的聚類(lèi)結(jié)果缺乏靈活性,且沒(méi)有考慮與其他類(lèi)的關(guān)系。鑒于此,本文采用改進(jìn)的FCM聚類(lèi)算法對(duì)樣本數(shù)據(jù)進(jìn)行聚類(lèi),彌補(bǔ)初始聚類(lèi)中心隨機(jī)選取和最優(yōu)聚類(lèi)數(shù)目不確定的缺陷。同時(shí),考慮到聚類(lèi)后場(chǎng)景較多的情況,分析數(shù)據(jù)特性較復(fù)雜,提出基于概率距離的思想對(duì)場(chǎng)景進(jìn)行縮減,得到具有典型特征的場(chǎng)景用以表示該類(lèi)情況,簡(jiǎn)化了分析過(guò)程。
傳統(tǒng)FCM算法與傳統(tǒng)K-means算法的不同在于FCM算法引入了隸屬度函數(shù)(即表示樣本屬于不同類(lèi)的權(quán)重),避免了K-means算法直接將樣本劃分為類(lèi)別的硬性,即樣本只屬于某一類(lèi),不具有權(quán)重代表。
利用第1章形成的六維指標(biāo)數(shù)組,給定N個(gè)樣本,形成N×6的特征矩陣x。假設(shè)將樣本數(shù)據(jù)劃分為c類(lèi),那么將得到c個(gè)聚類(lèi)中心,其中第j個(gè)樣本屬于第l類(lèi)的概率即為隸屬度ulj,每個(gè)樣本的隸屬度總和為1。FCM算法的目標(biāo)為各類(lèi)樣本到聚類(lèi)中心的距離之和最小,因此得到目標(biāo)函數(shù)J和隸屬度函數(shù)約束[7]如下:
(10)
(11)
式(10)中:m為隸屬度因子;Xj為第j個(gè)樣本根據(jù)第1章的指標(biāo)形成的特征數(shù)組,它是矩陣x中某一行的數(shù)據(jù);Cl為第l個(gè)聚類(lèi)中心的特征數(shù)組。通過(guò)求解目標(biāo)函數(shù)可得隸屬度函數(shù)和聚類(lèi)中心,即:
(12)
(13)
式(12)中Ck為第k個(gè)聚類(lèi)中心的特征數(shù)組。
本文對(duì)聚類(lèi)中心選取進(jìn)行改進(jìn),基于密度思想和距離最大、最小原則得到初始聚類(lèi)中心,進(jìn)而得到全局最優(yōu)解。改進(jìn)后的目標(biāo)函數(shù)
(14)
(15)
得到聚類(lèi)中心
(16)
式(14)、(16)中Xg為第g個(gè)樣本的特征數(shù)組。
求取初始聚類(lèi)中心的步驟如下。
步驟1:計(jì)算各樣本數(shù)據(jù)間的歐式距離并進(jìn)行排序,選擇距離最近的2個(gè)樣本作為初始樣本,并將2個(gè)樣本的均值作為第1個(gè)初始聚類(lèi)中心。
(17)
式中dgj為任意樣本g與樣本j之間的歐氏距離。
步驟2:剔除步驟1中2個(gè)初始樣本g和j,保留距離這2個(gè)初始樣本較大距離的樣本,剩余樣本集形成新的樣本集,同樣求取歐式距離并進(jìn)行排序,選擇距離最近的作為第2個(gè)初始樣本對(duì),并求均值得到1個(gè)特征數(shù)組,取其為聚類(lèi)中心,不斷迭代,得到各聚類(lèi)中心。
M=sort ‖Xw-Xe‖,w,e≠g,j;w,e∈N.
(18)
式中:M為新樣本集構(gòu)成的距離排序矩陣;Xw和Xe分別為第w和e個(gè)樣本的特征數(shù)組。其中sort表示將樣本集的歐式距離進(jìn)行從小到大排序。
步驟3:若剩余樣本集只含有2個(gè)樣本,則取其平均值為最后1個(gè)聚類(lèi)中心,2個(gè)樣本數(shù)據(jù)構(gòu)成樣本集,最終形成初始聚類(lèi)中心集。
密度思想和最大、最小初始中心選取原則綜合考慮了各樣本數(shù)據(jù)間的距離,通過(guò)不斷迭代計(jì)算,得到具有代表性的聚類(lèi)中心,后一聚類(lèi)中心的形成不僅只依賴(lài)于前一聚類(lèi)中心,避免了K-means算法中只計(jì)算樣本與各聚類(lèi)中心距離從而形成新的樣本集的局限性。
適當(dāng)?shù)木垲?lèi)數(shù)目是得到最優(yōu)聚類(lèi)結(jié)果的關(guān)鍵。聚類(lèi)數(shù)目較多時(shí),聚類(lèi)結(jié)果較精確,類(lèi)內(nèi)關(guān)系更緊致,但結(jié)果較復(fù)雜;聚類(lèi)數(shù)目較少時(shí),得到的聚類(lèi)結(jié)果存在一定誤差。因此合理選擇聚類(lèi)中心十分重要。
根據(jù)聚類(lèi)算法的有效指標(biāo),確定最優(yōu)聚類(lèi)數(shù)目。采用手肘法中的聚類(lèi)誤差平方和(sum of squares of error in cluster,SSE)指標(biāo)和CH指標(biāo)相結(jié)合的方式[8-10]計(jì)算各樣本離該類(lèi)聚類(lèi)中心的誤差平方和。SSE指標(biāo)(SSSE)的表達(dá)式為
(19)
式中:cl為聚類(lèi)中心下所有的樣本;Xjl為屬于第l類(lèi)的第j個(gè)樣本的特征數(shù)組。SSSE隨著聚類(lèi)數(shù)目的增多而逐漸減小,當(dāng)每個(gè)樣本構(gòu)成1類(lèi)時(shí),聚類(lèi)結(jié)果最精確,但結(jié)果較復(fù)雜,而聚類(lèi)數(shù)目過(guò)少,則聚類(lèi)結(jié)果不精確;因此選擇SSSE下降最快的點(diǎn)對(duì)應(yīng)的聚類(lèi)數(shù)來(lái)表示最優(yōu)聚類(lèi)數(shù)目。
CH指標(biāo)(SCH)用于計(jì)算類(lèi)間距離與類(lèi)內(nèi)距離的比值,其計(jì)算如下:
(20)
式(20)中分母表示類(lèi)內(nèi)距離差方和,其越小越好;分子表示類(lèi)間距離差方和,SCH越大越好。因此,應(yīng)選擇較大的SCH對(duì)應(yīng)的聚類(lèi)數(shù)目。
本文結(jié)合SSSE和SCH,得到最佳聚類(lèi)數(shù)目,避免了單一指標(biāo)的局限性,尋找最優(yōu)聚類(lèi)數(shù)目可以轉(zhuǎn)化為求取SSSE下降最快的點(diǎn)與SCH較大的點(diǎn)相結(jié)合的點(diǎn),從而綜合分析得到最優(yōu)值。
樣本聚類(lèi)得到多個(gè)類(lèi)別的場(chǎng)景集,若樣本數(shù)N足夠多,將導(dǎo)致類(lèi)中的數(shù)據(jù)集較多而無(wú)法顯現(xiàn)該周期內(nèi)光伏出力的典型特征。因此利用概率距離[7]比較方法對(duì)聚類(lèi)后的場(chǎng)景進(jìn)行縮減,保留每類(lèi)中具有代表性的樣本。
首先計(jì)算每類(lèi)中樣本間的歐式距離,得到距離矩陣
Dgj=‖Xg-Xj‖,g≠j;
(21)
式(21)表示求取各個(gè)樣本間的歐式距離公式,對(duì)矩陣D賦予下標(biāo)表示某2個(gè)樣本間的距離。
計(jì)算各樣本的概率距離,并選擇與剩余樣本概率距離最近的樣本s1,在距離矩陣D中找到與s1距離最小的樣本s2代替s1,其余樣本構(gòu)成剩余樣本集,并求取新的距離矩陣。不斷迭代,直到保留到所需場(chǎng)景數(shù),即得到典型場(chǎng)景,由此完成場(chǎng)景縮減。其中概率距離
δg=pgl‖Xg-Xj‖.
(22)
式中pgl為第g個(gè)樣本屬于第l類(lèi)的概率,用樣本的等概率分布表示。
綜上分析,改進(jìn)后的FCM算法具有較好的全局搜索性和精確性,結(jié)果較精簡(jiǎn),相比于傳統(tǒng)FCM算法,其多了3個(gè)步驟。具體改進(jìn)后的步驟如下:
步驟1:對(duì)1年的光伏出力數(shù)據(jù)進(jìn)行預(yù)處理,求出每日的特性指標(biāo)代替原始實(shí)際出力值,表征出力的波動(dòng)和周期性等。
步驟2:求取樣本集中各樣本的歐式距離,構(gòu)成初始距離矩陣,并根據(jù)密度思想和距離最大、最小原則得到初始聚類(lèi)中心。
步驟3:依據(jù)步驟1得到的初始聚類(lèi)中心,根據(jù)樣本間的歐式距離矩陣不斷迭代,更新隸屬度矩陣和聚類(lèi)中心,直到目標(biāo)函數(shù)達(dá)到精度或聚類(lèi)中心不變化,則停止迭代,得到最終聚類(lèi)結(jié)果。
步驟4:根據(jù)不同聚類(lèi)數(shù)目,以SSE指標(biāo)和CH指標(biāo)衡量最終結(jié)果,得到最優(yōu)聚類(lèi)數(shù)目。
步驟5:根據(jù)最后的聚類(lèi)結(jié)果削減不同類(lèi)的場(chǎng)景數(shù),得到具有代表性的典型場(chǎng)景。
整個(gè)聚類(lèi)分析過(guò)程(包含場(chǎng)景縮減流程)如圖1所示。圖1中,k為聚類(lèi)數(shù)目,p為迭代次數(shù),季度+1表示對(duì)1年中4個(gè)季度的光伏特性輪流分析。
圖1 聚類(lèi)流程Fig.1 Clustering flowchart
本文基于MATLAB 2016b運(yùn)行環(huán)境,利用南方某200 MW裝機(jī)的光伏電站2022年7月—2023年6月的數(shù)據(jù)進(jìn)行仿真,采樣間隔為10 min。用上文所述的方法對(duì)原始數(shù)據(jù)進(jìn)行處理,并將1年的數(shù)據(jù)劃分為4個(gè)季度進(jìn)行分析,最終聚類(lèi)完成后得到4個(gè)具有代表性的典型季出力場(chǎng)景。
1年中的出力數(shù)據(jù)以10 min為間隔進(jìn)行處理,1日的數(shù)據(jù)處理量為144個(gè)。若將144組數(shù)據(jù)做聚類(lèi)處理,當(dāng)天數(shù)較少時(shí)過(guò)程簡(jiǎn)便,而天數(shù)增多時(shí),聚類(lèi)過(guò)程較復(fù)雜。本文將光伏實(shí)際處理曲線轉(zhuǎn)化為第1章節(jié)所述6個(gè)代表性指標(biāo),用以表征1日內(nèi)的出力特性。以1年4個(gè)季度為區(qū)間,得到各季度的指標(biāo)特性。表1—表4為各季度部分日歸一化后的指標(biāo)特征。
表1 春季特征指標(biāo)Tab.1 Spring characteristic indicators
表2 夏季特征指標(biāo)Tab.2 Summer characteristic indicators
表3 秋季特征指標(biāo)Tab.3 Autumn characteristic indicators
表4 冬季特征指標(biāo)Tab.4 Winter characteristic indicators
由表1—表4可知不同季度在波動(dòng)性和出力效率方面存在差異性,但數(shù)據(jù)繁多,對(duì)每日的數(shù)據(jù)進(jìn)行分析較為復(fù)雜,因此采用聚類(lèi)對(duì)數(shù)據(jù)進(jìn)行劃分,進(jìn)而縮減場(chǎng)景得到典型場(chǎng)景集,該方法優(yōu)化了分析過(guò)程,并得到了較為準(zhǔn)確的結(jié)果。
將各個(gè)季度的六維數(shù)據(jù)分別進(jìn)行聚類(lèi)分析,求取初始聚類(lèi)中心,得到不同聚類(lèi)數(shù)目下的聚類(lèi)結(jié)果。本文結(jié)合SSE指標(biāo)和CH指標(biāo)進(jìn)行評(píng)估,當(dāng)聚類(lèi)數(shù)目達(dá)到某一值時(shí),2個(gè)指標(biāo)的綜合取值最優(yōu),則這個(gè)點(diǎn)為最優(yōu)聚類(lèi)數(shù)目點(diǎn)。圖2所示為不同季節(jié)的聚類(lèi)有效性指標(biāo)。
圖2 不同季節(jié)聚類(lèi)有效性指標(biāo)Fig.2 Clustering efficiency indicators in different seasons
由圖2可知:春季SSSE在k=4時(shí)下降最快,而在k=5后下降速度逐漸緩慢,此時(shí)SCH達(dá)到最大值,綜合得最優(yōu)聚類(lèi)數(shù)為5;夏季k=3時(shí),SSSE下降速度最快,同時(shí)SCH達(dá)到較大值,該季節(jié)的最優(yōu)聚類(lèi)數(shù)目為3;秋季k=4時(shí),SCH達(dá)到最大值,而SSSE在聚類(lèi)數(shù)目超過(guò)4后緩慢減少,因此選取最優(yōu)聚類(lèi)數(shù)目為4;冬季k=3時(shí),2個(gè)指標(biāo)取值最優(yōu),因此該季節(jié)的最優(yōu)聚類(lèi)數(shù)目為3。
根據(jù)以上得出的各季度的最優(yōu)聚類(lèi)數(shù)目,分別進(jìn)行聚類(lèi)分析得到聚類(lèi)結(jié)果。最終的聚類(lèi)中心和聚類(lèi)集見(jiàn)表5。
表5 聚類(lèi)后各聚類(lèi)中心Tab.5 Cluster centers after clustering
春季第1類(lèi)包含22日的數(shù)據(jù),第2類(lèi)包含21日的數(shù)據(jù),第3類(lèi)包含24日的數(shù)據(jù),第4類(lèi)包含9日的數(shù)據(jù),第5類(lèi)包含14日的數(shù)據(jù)。
夏季第1類(lèi)包含31日的數(shù)據(jù),第2類(lèi)包含30日的數(shù)據(jù),第3類(lèi)包含31日的數(shù)據(jù),每類(lèi)出力數(shù)據(jù)存在差異,代表1個(gè)季度的3種出力特征。
秋季第1類(lèi)包含27日的數(shù)據(jù),第2類(lèi)包含23日的數(shù)據(jù),第3類(lèi)包含19日的數(shù)據(jù),第4類(lèi)包含23日的數(shù)據(jù)。
冬季第1類(lèi)包含27日的數(shù)據(jù),第2類(lèi)包含35日的數(shù)據(jù),第3類(lèi)包含25日的數(shù)據(jù)。
聚類(lèi)完成后,每個(gè)季度都具有幾個(gè)代表性特征的類(lèi),但每類(lèi)中的樣本數(shù)據(jù)太多,對(duì)于分析光伏出力特性不利,因此本文提出場(chǎng)景削減方法。以概率距離為基礎(chǔ)不斷刪除原類(lèi)別中的場(chǎng)景,保留最終具有代表性的某個(gè)場(chǎng)景,得到最終四季典型出力場(chǎng)景特征值的數(shù)據(jù)結(jié)果,見(jiàn)表6。
表6 典型出力場(chǎng)景特征值Tab.6 Characteristic values of typical output scenarios
根據(jù)聚類(lèi)得出典型場(chǎng)景的指標(biāo)值,以及求出的實(shí)際出力值,繪制出場(chǎng)景如圖3所示。
圖3 典型場(chǎng)景Fig.3 Typical scenarios
根據(jù)圖3得到不同季節(jié)的典型出力場(chǎng)景,其中每個(gè)場(chǎng)景用具有代表性的1組出力數(shù)據(jù)表示。與傳統(tǒng)聚類(lèi)結(jié)果用多組數(shù)據(jù)表示相比,本文場(chǎng)景縮減后分析更明確簡(jiǎn)潔。分析該光伏電站冬季場(chǎng)景1與其他2個(gè)場(chǎng)景的出力曲線可知該季節(jié)出力較不均勻,偏差較大,出力波動(dòng)性較春季更平緩。
采用傳統(tǒng)K-means算法、原始FCM算法對(duì)同一組數(shù)據(jù)進(jìn)行聚類(lèi)分析,驗(yàn)證本文改進(jìn)FCM聚類(lèi)算法的優(yōu)越性。以聚類(lèi)有效性指標(biāo)SSSE和SCH相結(jié)合為評(píng)估參數(shù),得到聚類(lèi)結(jié)果見(jiàn)表7。
表7 不同聚類(lèi)算法對(duì)比結(jié)果Tab.7 Comparisons of different clustering algorithms
由表7可見(jiàn),改進(jìn)FCM算法在各個(gè)季節(jié)聚類(lèi)結(jié)果均優(yōu)于其他2種算法,尤其是在秋季,聚類(lèi)優(yōu)越性較為顯著。
對(duì)比傳統(tǒng)FCM算法與本文算法的SSSE,確定初始聚類(lèi)中心與聚類(lèi)數(shù)目在一定程度上提高了聚類(lèi)的精度與收斂性。對(duì)比傳統(tǒng)K-means算法,由于FCM算法引入了隸屬度函數(shù),使樣本不局限于只屬于某一類(lèi),而是屬于每類(lèi),只是權(quán)重不一樣,這也提高了算法的精確性。
驗(yàn)證本文聚類(lèi)完成后場(chǎng)景縮減的優(yōu)越性,將其他2種算法的聚類(lèi)結(jié)果繪制成圖4、5。
圖4 傳統(tǒng)FCM算法聚類(lèi)結(jié)果Fig.4 Clustering results of traditional FCM algorithm
由圖4、圖5可見(jiàn),傳統(tǒng)FCM和K-means算法的聚類(lèi)結(jié)果較為復(fù)雜,數(shù)據(jù)未經(jīng)處理,且出力特性分析也增加了工作量,由此更進(jìn)一步證明了采用本文算法縮減場(chǎng)景的必要性。對(duì)比圖3、圖4和圖5,本文采用場(chǎng)景縮減最終得到的典型場(chǎng)景清晰顯示了該時(shí)段的光伏出力情況,簡(jiǎn)化了聚類(lèi)結(jié)果。
圖5 傳統(tǒng)K-means聚類(lèi)結(jié)果Fig.5 Clustering results of traditional K-means
針對(duì)傳統(tǒng)FCM算法的不足,本文結(jié)合密度思想和距離最大、最小原則優(yōu)化初始聚類(lèi)中心選取,并采用聚類(lèi)有效性指標(biāo)評(píng)估得到的最優(yōu)聚類(lèi)數(shù)目,提高了聚類(lèi)的精確性和簡(jiǎn)潔性,并加快了運(yùn)算速度??紤]到分析光伏出力數(shù)據(jù)的繁瑣,采用基于概率距離的場(chǎng)景縮減法得到典型場(chǎng)景,進(jìn)而更好地分析不同季度的出力特性。得出以下結(jié)論:
a)采用出力特性指標(biāo)代替實(shí)際出力值,可以簡(jiǎn)化分析過(guò)程,降低聚類(lèi)維度,提高運(yùn)算速度。
b)本文對(duì)初始聚類(lèi)中心的選取和最優(yōu)聚類(lèi)數(shù)目的確定,在一定程度上避免了達(dá)到聚類(lèi)局部最優(yōu),優(yōu)化了聚類(lèi)結(jié)果。
采用場(chǎng)景縮減法得到具有典型特征的場(chǎng)景,并通過(guò)廣東省某一光伏電站的實(shí)際數(shù)據(jù)驗(yàn)證,得到該電站不同季度的典型出力場(chǎng)景,優(yōu)化了光伏出力特性分析過(guò)程,證明了該方法的實(shí)用性。