張揚(yáng)科,李 剛,李秀峰
(1. 大連理工大學(xué) 水電與水信息研究所,遼寧 大連 116024;2. 云南電力調(diào)度控制中心,云南 昆明 650000)
近年來,我國新能源代表之一的光伏產(chǎn)業(yè)發(fā)展迅猛,2019 年年底光伏電源裝機(jī)容量達(dá)到2.04×108kW,同比增長17.3%。隨著光伏滲透率的逐年提高,單站功率預(yù)測已無法滿足調(diào)度部門協(xié)調(diào)調(diào)度以及國家對新能源消納的迫切需求,亟需展開對區(qū)域光伏功率預(yù)測的研究。主要體現(xiàn)在以下幾個(gè)方面:電網(wǎng)調(diào)度與電源規(guī)劃方面,精確的區(qū)域功率預(yù)測有利于調(diào)度部門實(shí)現(xiàn)對大規(guī)模光伏電站的掌控以及減弱光伏并網(wǎng)對電網(wǎng)的沖擊[1],同時(shí)將光伏電源納入多能源互補(bǔ)協(xié)調(diào)調(diào)度體系可提高多種能源之間的協(xié)同運(yùn)作能力[2];運(yùn)行風(fēng)險(xiǎn)方面,單一光伏電站因發(fā)電隨機(jī)性、波動性[3]無法順利參與整體協(xié)同優(yōu)化,而區(qū)域出力因匯聚效應(yīng)可減少系統(tǒng)運(yùn)行帶來的風(fēng)險(xiǎn),進(jìn)而增強(qiáng)電網(wǎng)運(yùn)行安全性;電力市場方面,2015 年國務(wù)院發(fā)布的《關(guān)于進(jìn)一步深化電力體制改革的若干意見》[4]提出,允許擁有分布式電源的用戶或微電網(wǎng)參與電力交易,而分布式電源因“就近建設(shè)”的特點(diǎn)更容易形成光伏匯聚區(qū),因此區(qū)域預(yù)測對日內(nèi)現(xiàn)貨市場和電力交易具有重要意義[5];模型適應(yīng)性方面,單站預(yù)測模型需根據(jù)不同電站資料重新構(gòu)建,這導(dǎo)致不同電站之間的模型無法共用,而由于相關(guān)性愈強(qiáng)的匯聚區(qū)彼此出力相互抵消的能力愈強(qiáng),對區(qū)域出力波動起到“削峰填谷”的作用[6],從而使總體出力趨勢更加明顯,降低了預(yù)測難度。
光伏功率預(yù)測一直是國內(nèi)外研究的熱點(diǎn),按預(yù)測模型組成可分為3 類:物理成因法,根據(jù)光伏電站的組件參數(shù)和地理信息,如光電轉(zhuǎn)換效率、光伏陣列的安裝角度等,結(jié)合當(dāng)?shù)氐臍庀笮畔?,按光伏物理成因建立預(yù)測模型[7];統(tǒng)計(jì)學(xué)法,對光伏出力數(shù)據(jù)、誤差數(shù)據(jù)等歷史數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和曲線擬合,尋找適合該類數(shù)據(jù)的函數(shù)或概率模型構(gòu)建輸入、輸出映射關(guān)系,達(dá)到預(yù)測的目標(biāo)[8];人工智能算法,利用人工智能算法對歷史資料進(jìn)行處理,使輸入、輸出間形成非線性關(guān)系,進(jìn)而得到預(yù)測結(jié)果[9]。由于匯聚區(qū)與單一電站功率預(yù)測在預(yù)測原理、數(shù)據(jù)資料的使用及建模方式方面的不同,區(qū)域功率預(yù)測無法“照搬”單站預(yù)測的形式。同時(shí),由于多座單一電站的預(yù)測誤差積累和數(shù)據(jù)量級的影響,區(qū)域功率的預(yù)測值無法直接采用多座單一電站預(yù)測值進(jìn)行簡單疊加。文獻(xiàn)[1]使用系數(shù)矩陣將個(gè)別電站預(yù)測功率推算到區(qū)域功率,但該方法計(jì)算過程較為繁瑣;文獻(xiàn)[10]利用Pearson相關(guān)系數(shù)選擇各匯聚區(qū)代表電站,但單一數(shù)學(xué)指標(biāo)無法全方位分析該電站對匯聚區(qū)的代表性;文獻(xiàn)[11]使用類似滾動預(yù)報(bào)方法進(jìn)行功率預(yù)測,但傳統(tǒng)滾動預(yù)報(bào)的誤差隨時(shí)間迅速增加,不是最優(yōu)的預(yù)測方法。
為此,本文提出一種基于典型代表電站和改進(jìn)支持向量機(jī)(SVM)的區(qū)域光伏功率短期預(yù)測方法。首先結(jié)合多種數(shù)據(jù)通過聚類分析形成不同的光伏匯聚區(qū);然后引入3種相關(guān)系數(shù)選取各匯聚區(qū)中的典型代表電站,并通過4 類評價(jià)指標(biāo)對匯聚區(qū)中各電站進(jìn)行相關(guān)性分析;最后利用改進(jìn)SVM 構(gòu)建典型代表電站與匯聚區(qū)間的短期功率預(yù)測模型,通過典型代表電站功率預(yù)測得到匯聚區(qū)總的光伏功率。算例結(jié)果表明,該方法可提高區(qū)域光伏功率短期預(yù)測精度。
光伏匯聚區(qū)的劃分不僅與出力有直接關(guān)系,同時(shí)與特性數(shù)據(jù)和氣象數(shù)據(jù)等內(nèi)在因素密不可分。文獻(xiàn)[12]注重考慮氣象因素和發(fā)電功率的聚類分析,但是沒有考慮光伏出力的特性因素。
為使匯聚區(qū)中各電站在數(shù)據(jù)上更加體現(xiàn)集群內(nèi)部電站特征趨同性,在單站出力數(shù)據(jù)的基礎(chǔ)上,添加光伏出力的相關(guān)特性數(shù)據(jù),即最大值、最小值、平均值、峰谷差、變異系數(shù)[13-14]和氣象因素,進(jìn)一步提高數(shù)據(jù)系列的獨(dú)立性。光伏匯聚區(qū)劃分示意圖見圖1。
圖1 匯聚區(qū)劃分示意圖Fig.1 Schematic diagram of convergence area division
利用K-means 聚類方法首先需要確定匯聚區(qū)的數(shù)量K,采用誤差平方和最小作為評價(jià)函數(shù):
式中:J為各簇中個(gè)體與質(zhì)心差的平方和;Ci為第i個(gè)簇;p為Ci中的樣本;mi為Ci的質(zhì)心,其為Ci中所有樣本的均值。
如前文所述,將數(shù)據(jù)系列作為樣本集合,通過迭代計(jì)算得出樣本集合的K簇,主要計(jì)算步驟為:
1)輸入樣本集合M,隨機(jī)選定K個(gè)點(diǎn)設(shè)為初始聚類中心,分別將其作為K個(gè)簇的中心,形成初始聚類結(jié)果,如圖1中①—③所示;
2)更新各個(gè)簇的中心,計(jì)算任一簇中包含的所有樣本數(shù)據(jù)對應(yīng)的均值,將其設(shè)置為該簇的新中心,如圖1中④所示;
3)計(jì)算每個(gè)樣本與各簇中心的歐氏距離,將其分配到離其最近的簇,如圖1中⑤所示;
4)判斷是否滿足迭代停止條件(達(dá)到循環(huán)次數(shù)或者誤差平方和達(dá)到最小值等),若滿足,則聚類完成,輸出最終匯聚區(qū)劃分結(jié)果,如圖1 中⑥所示,否則,返回步驟2)。
利用上述步驟可以得到不同類別的劃分結(jié)果以及對應(yīng)評價(jià)函數(shù)的數(shù)值,將數(shù)值從大到小排列,找到下降速度最大的點(diǎn),則該點(diǎn)數(shù)值對應(yīng)的劃分類別和聚類結(jié)果即為最終結(jié)果。
根據(jù)上述方法將區(qū)域相關(guān)性較強(qiáng)的光伏電站劃分到同一匯聚區(qū),即區(qū)域中光伏電站的歷史出力與質(zhì)心(各電站出力均值)的距離越小,區(qū)域相關(guān)性越強(qiáng),越易形成匯聚區(qū)。本文的關(guān)鍵點(diǎn)在于匯聚區(qū)典型代表電站的選取,但常用方法[10]僅關(guān)注Pearson 相關(guān)系數(shù),單一指標(biāo)無法全面反映某座電站與匯聚區(qū)的代表關(guān)系和一致性,為此,引入Spearman 相關(guān)系數(shù)和Kendall相關(guān)系數(shù),結(jié)合多種數(shù)學(xué)相關(guān)系數(shù)從多個(gè)角度進(jìn)行綜合對比。因此本文中電站典型性與相關(guān)性類似,即為光伏電站與匯聚區(qū)的歷史功率在較長時(shí)間范圍內(nèi)的一致性,相關(guān)系數(shù)越大,典型性越強(qiáng)。
2.1.1 Pearson相關(guān)系數(shù)
Pearson相關(guān)系數(shù)是考察2個(gè)事物(經(jīng)常為變量)之間的相關(guān)程度,定義為:
式中:ρX,Y為Pearson 相關(guān)系數(shù);X、Y分別為不同的變量集合;cov(X,Y)為X和Y的協(xié)方差;σX和σY分別為X和Y的標(biāo)準(zhǔn)差;E(·)為數(shù)學(xué)期望。
2.1.2 Spearman相關(guān)系數(shù)
將變量集合X={x1,x2,…,xn}(n為數(shù)據(jù)的數(shù)量)中元素按降序或升序重新排列得到A={a1,a2,…,an}。將集合X中每個(gè)元素xi在序列A中的次序記為rg(xi)。同理按上述方法得到集合Y={y1,y2,…,yn}中元素次序?yàn)閞g(yi)。Spearman相關(guān)系數(shù)定義為:
式中:rs為Spearman 相關(guān)系數(shù);di為2 個(gè)次序rg(xi)與rg(yi)的差值。
2.1.3 Kendall相關(guān)系數(shù)
當(dāng)集合X和Y中變量對(xi,yi)、(xj,yj)同時(shí)增減時(shí),認(rèn)為這2個(gè)變量一致;當(dāng)其增減相反時(shí),認(rèn)為這2個(gè)變量不一致;當(dāng)二者相等時(shí),認(rèn)為這2 個(gè)變量既不是一致也不是不一致。
Kendall相關(guān)系數(shù)定義為:
式中:R為Kendall 相關(guān)系數(shù);C、D分別為有一致性、有不一致性的變量對數(shù);s為變量集合X中由相同變量組成的子集合數(shù),Ui為其第i個(gè)子集合所包含的變量數(shù);w為變量集合Y中由相同變量所組成的子集合數(shù),Vi為其第i個(gè)子集合所包含的變量數(shù)。
參考文獻(xiàn)[15]將匯聚區(qū)中各電站的3 種相關(guān)系數(shù)結(jié)果按1∶1∶1 的權(quán)值進(jìn)行組合計(jì)算,將相關(guān)關(guān)系表現(xiàn)最好、相關(guān)系數(shù)最大的電站作為該匯聚區(qū)中的典型代表電站。
為進(jìn)一步證實(shí)通過3 種相關(guān)系數(shù)選擇出的典型代表電站與匯聚區(qū)出力的一致性,選擇以下4 類評價(jià)指標(biāo)對匯聚區(qū)中的各電站分別進(jìn)行分析。
1)季節(jié)性。根據(jù)歷史出力數(shù)據(jù),對比不同季節(jié)的典型日出力曲線,觀察出力曲線呈現(xiàn)的特性。
2)氣象典型日。根據(jù)已有的氣象信息分別找出不同季節(jié)典型日(晴天、陰天)的出力曲線,觀察不同曲線呈現(xiàn)的特點(diǎn)。
3)裝機(jī)利用小時(shí)數(shù)。裝機(jī)利用小時(shí)數(shù)可理解為電站在日內(nèi)的使用時(shí)間,如式(9)所示。
式中:H為裝機(jī)利用小時(shí)數(shù);T為時(shí)間段總數(shù);Pt、ht分別為第t個(gè)時(shí)間段的功率和時(shí)長;PE為裝機(jī)容量。
4)日內(nèi)峰谷差及日內(nèi)峰谷差占裝機(jī)比重。峰谷差為日內(nèi)功率最大值與最小值之差,即:
式中:Pdf為日內(nèi)峰谷差;Ppeak為日內(nèi)功率最大值,即頂峰功率;Pvalley為日內(nèi)功率最小值,即低谷功率。
SVM 是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論和萬普尼克-澤范蘭杰斯維VC(Vapnik-Chervonenkis dimension)理論的一種小樣本學(xué)習(xí)理論,使用領(lǐng)域較為廣泛[16]。傳統(tǒng)的SVM 無法滿足預(yù)測多個(gè)變量的要求,借鑒滾動預(yù)測思想可實(shí)現(xiàn)多步驟滾動預(yù)測,雖然滾動預(yù)測原理簡單,易于操作,但隨著預(yù)測次數(shù)的增多,誤差會迅速積累,導(dǎo)致最終結(jié)果失真,無法保持預(yù)測結(jié)果的準(zhǔn)確性,因此舍棄該方法。結(jié)合SVM 本身輸入、輸出結(jié)構(gòu),參考文獻(xiàn)[17]對其進(jìn)行簡化,在不改變訓(xùn)練數(shù)據(jù)輸入值的基礎(chǔ)上,依次對輸出值對應(yīng)的各個(gè)特征點(diǎn)進(jìn)行預(yù)測,該方法可在保持SVM 優(yōu)點(diǎn)的情況下不從底層對SVM 進(jìn)行修改,其構(gòu)造圖如附錄A 圖A1所示。
本文基于外推法和統(tǒng)計(jì)升尺度法[10,18],結(jié)合多種數(shù)學(xué)相關(guān)系數(shù),優(yōu)化典型代表電站及原網(wǎng)絡(luò)結(jié)構(gòu),建立24 h內(nèi)的短期預(yù)測模型,模型建立步驟如下。
1)利用匯聚區(qū)中各電站的歷史出力數(shù)據(jù),結(jié)合3種相關(guān)系數(shù)計(jì)算得到典型代表電站。
2)將匯聚區(qū)中各電站的歷史出力數(shù)據(jù)進(jìn)行疊加形成基礎(chǔ)資料,結(jié)合典型代表電站的歷史出力數(shù)據(jù)及SVM 形成區(qū)域功率預(yù)測模型。模型輸入為典型代表電站的歷史出力數(shù)據(jù),輸出為對應(yīng)日匯聚區(qū)歷史出力數(shù)據(jù)。
3)在模型建立、訓(xùn)練之后,輸入預(yù)測日典型代表電站預(yù)測值即可得到匯聚區(qū)功率預(yù)測值。
區(qū)域功率預(yù)測示意圖如圖2所示。
圖2 區(qū)域功率預(yù)測示意圖Fig.2 Schematic diagram of regional power forecasting
該方法主要利用歷史出力數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,建模無需氣象數(shù)據(jù),且避免了常規(guī)疊加法導(dǎo)致的誤差累積問題,已有研究[19]證實(shí)了本文思路的正確性。由于光伏曲線的固有特性,因此更易找到單站功率與匯聚區(qū)功率間的非線性聯(lián)系,從而建立較準(zhǔn)確的預(yù)測模型,同時(shí)減少預(yù)測誤差。為驗(yàn)證本文方法的有效性,后文利用單機(jī)等值法[20]和疊加法進(jìn)行對比。
基于上述原理,本文通過以下步驟得到區(qū)域光伏功率短期預(yù)測結(jié)果。
1)劃分匯聚區(qū)?;贙-means 聚類方法的工作原理和計(jì)算方法,利用歷史出力數(shù)據(jù)、氣象數(shù)據(jù)和特性數(shù)據(jù)進(jìn)行聚類劃分,并判斷匯聚區(qū)是否只有一座電站,如果是,則直接轉(zhuǎn)至步驟3),組成單站預(yù)測模型并輸出結(jié)果,否則,繼續(xù)執(zhí)行步驟2)。
2)選擇典型代表電站和指標(biāo)評價(jià)?;谕馔品ê徒y(tǒng)計(jì)升尺度法,計(jì)算各匯聚區(qū)中各電站3 種相關(guān)系數(shù),選擇對應(yīng)匯聚區(qū)典型代表電站;用4 類出力指標(biāo)對匯聚區(qū)中各電站在多個(gè)時(shí)間節(jié)點(diǎn)進(jìn)行相關(guān)性分析,驗(yàn)證典型代表電站的最優(yōu)性及代表性。
3)建立區(qū)域功率短期預(yù)測模型。將計(jì)算得到的典型代表電站與匯聚區(qū)歷史數(shù)據(jù)構(gòu)成區(qū)域功率預(yù)測模型(具體見3.2節(jié))。
預(yù)測流程圖如附錄A圖A2所示。
本文所采用的算例為云南省大理州與楚雄州2017 年5 月至9 月有記錄的光伏電站,電站具體名稱如附錄A表A1所示。
利用已有的數(shù)據(jù)資料,采用K-means聚類方法進(jìn)行循環(huán)計(jì)算,表1為大理州類別數(shù)與距離和的關(guān)系。
由表1 可知,類別數(shù)為4 時(shí)距離和下降速度最快,故選擇劃分類別為4 類,具體劃分結(jié)果為:匯聚區(qū)Ⅰ,電站1-1、1-3、1-6;匯聚區(qū)Ⅱ,電站1-2、1-5、1-7、1-8;匯聚區(qū)Ⅲ,電站4;匯聚區(qū)Ⅳ,電站1-9。
表1 大理州類別數(shù)與距離和的關(guān)系Table 1 Relationship between category number and distance sum of Dali prefecture
根據(jù)計(jì)算結(jié)果,對匯聚區(qū)I中的3 座電站和匯聚區(qū)Ⅱ中的4 座電站進(jìn)行區(qū)域短期功率預(yù)測。同理,對楚雄州的匯聚區(qū)進(jìn)行類似劃分,劃分結(jié)果為:匯聚區(qū)Ⅴ,電站2-1、2-5、2-6、2-9;匯聚區(qū)Ⅵ,電站2-2、2-3、2-4、2-7、2-8。
利用3 種相關(guān)系數(shù)選擇典型代表電站并利用4類指標(biāo)進(jìn)行相關(guān)性分析,以大理州匯聚區(qū)Ⅰ為例。
表2為大理州“大佛山+干塘子+西村”匯聚區(qū)Ⅰ典型代表電站選取情況。
表2 匯聚區(qū)I各電站相關(guān)系數(shù)Table 2 Correlation coefficient of each station in Convergence Area Ⅰ
由表2 可知,西村展示出較強(qiáng)的代表性及與匯聚區(qū)的相關(guān)關(guān)系,其3 種單一相關(guān)系數(shù)均高于匯聚區(qū)中的其余電站。為進(jìn)一步說明典型代表電站選取的正確性,利用各指標(biāo)對電站進(jìn)行評價(jià),如圖3—6所示,同時(shí)利用各指標(biāo)分別計(jì)算匯聚區(qū)中各電站與匯聚區(qū)的相關(guān)系數(shù),結(jié)果如表3 所示。由于自身出力的特殊性,光伏電站在夜晚以及清晨等時(shí)間出力幾乎為0,綜合考慮后取96點(diǎn)出力數(shù)據(jù)(以15 min為間隔)中08:00—18:00共41點(diǎn)的出力序列。
圖3 單站與匯聚區(qū)季節(jié)性對比Fig.3 Seasonal comparison between single station and convergence area
圖4 單站與匯聚區(qū)氣象典型日對比Fig.4 Typical meteorological day comparison between single station and convergence area
圖5 單站與匯聚區(qū)裝機(jī)利用小時(shí)數(shù)對比Fig.5 Installed utilization hour comparison between single station and convergence area
圖6 單站與匯聚區(qū)日內(nèi)峰谷差對比Fig.6 Intraday peak valley difference comparison between single station and convergence area
表3 相關(guān)性綜合對比Table 3 Comprehensive comparison of correlation
最終發(fā)現(xiàn)西村的3 種指標(biāo)均優(yōu)于其他電站,證明利用3 種相關(guān)系數(shù)選擇匯聚區(qū)中典型代表電站的方法較為準(zhǔn)確。
采用本文方法分別計(jì)算各電站預(yù)測精度,同時(shí)將本文方法和其他方法進(jìn)行對比,計(jì)算結(jié)果分別如表4、表5 和圖7 所示。可知本文方法的預(yù)測精度優(yōu)于疊加法和單機(jī)等值法。
圖7 匯聚區(qū)Ⅰ光伏功率預(yù)測值與實(shí)際值對比Fig.7 Photovoltaic power comparison between forecasting and actual values in Convergence Area Ⅰ
表4 匯聚區(qū)Ⅰ各電站預(yù)測精度Table 4 Forecasting accuracy of each power station in Convergence Area Ⅰ單位:MW
表5 匯聚區(qū)Ⅰ預(yù)測精度對比Table 5 Forecasting accuracy comparison of Convergence Area Ⅰ單位:MW
大理州和楚雄州部分匯聚區(qū)3 種方法的結(jié)果對比如附錄A 表A2—A4 所示。由表A2、表A3 可知:相關(guān)系數(shù)較大的典型代表電站在相關(guān)性分析的表現(xiàn)上也優(yōu)于匯聚區(qū)中的其他電站,這說明典型代表電站與匯聚區(qū)在歷史功率方面的高度一致性;本文方法的RMSE、MAE 均優(yōu)于其他2 種方法,其中多個(gè)匯聚區(qū)的RMSE小于10 MW;雖然典型代表電站的單站預(yù)測誤差較小,均在10 MW以下,但將預(yù)測數(shù)據(jù)疊加后卻沒有展現(xiàn)出較好的預(yù)測效果,因此雖然疊加法的計(jì)算過程較簡單,但在精度要求較高時(shí)推薦使用其他方法。由表A4知:除10月7日的匯聚區(qū)Ⅰ外,各匯聚區(qū)在不同日期采用本文方法得到的誤差最小;10月7日所有匯聚區(qū)采用3 種方法得到的預(yù)測誤差均較大,這是由于假期或突發(fā)事件導(dǎo)致預(yù)測值誤差增大,但綜合而言本文方法較準(zhǔn)確;單機(jī)等值法的預(yù)測精度也較高,但是該方法在建模過程中需要的資料遠(yuǎn)多于本文方法,這將會在整體預(yù)測流程中消耗過多時(shí)間,此外,單機(jī)等值法精度提升較困難,而本文方法由于預(yù)測模型的特點(diǎn),可通過典型代表電站單站預(yù)測技術(shù)的提高進(jìn)一步提升區(qū)域功率預(yù)測的精度。
為應(yīng)對新能源的快速發(fā)展,本文針對匯聚區(qū)出力預(yù)測進(jìn)行優(yōu)化,根據(jù)預(yù)測結(jié)果主要得到如下結(jié)論:
1)采用3 種相關(guān)系數(shù)計(jì)算各匯聚區(qū)典型代表電站可減少單一指標(biāo)對選擇結(jié)果產(chǎn)生的擾動,尤其當(dāng)匯聚區(qū)各電站的單一相關(guān)系數(shù)(Pearson 相關(guān)系數(shù))較為接近時(shí),使用本文方法可從多方面分析得出最優(yōu)結(jié)果;
2)使用4 類評價(jià)指標(biāo)在較特殊的時(shí)間節(jié)點(diǎn)對各電站進(jìn)行相關(guān)性分析,可從側(cè)面驗(yàn)證典型代表電站選取的正確性;
3)本文方法不僅可以利用典型代表電站與匯聚區(qū)的一致性得到較好的預(yù)測效果,還可將單站預(yù)測方法用于典型代表電站,從而組成新的區(qū)域功率預(yù)測模型,因此本文方法有較好的魯棒性與靈活性。
附錄見本刊網(wǎng)絡(luò)版(http://www.epae.cn)。