陳云龍,殷豪,孟安波,周亞武
(廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院,廣州 510006)
目前,人們對(duì)光伏出力預(yù)測(cè)的研究主要集中在點(diǎn)預(yù)測(cè)上,常用方法有馬爾科夫鏈法[1]、時(shí)間序列預(yù)測(cè)法[2]、支持向量機(jī)法[3-4]、人工神經(jīng)網(wǎng)絡(luò)法[5-6]等。所謂點(diǎn)預(yù)測(cè)即是依據(jù)一定規(guī)則直接推測(cè)出光伏系統(tǒng)未來某時(shí)刻的確定輸出值。由于光伏輸出具有波動(dòng)性和不確定性,從而導(dǎo)致點(diǎn)預(yù)測(cè)往往達(dá)不到理想精度。此外,點(diǎn)預(yù)測(cè)所提供的信息非常有限,無(wú)法反映光伏輸出的潛在不確定性,電網(wǎng)調(diào)度人員無(wú)法從中得知預(yù)測(cè)值的可靠性,更無(wú)法對(duì)系統(tǒng)的預(yù)留備用作出有效決策。相比之下,區(qū)間預(yù)測(cè)除了能夠呈現(xiàn)未來時(shí)刻光伏系統(tǒng)的預(yù)測(cè)值,還提供了該預(yù)測(cè)值的置信區(qū)間、對(duì)輸出功率的波動(dòng)范圍進(jìn)行估計(jì)。顯然,在調(diào)度部門制定發(fā)電計(jì)劃和安全經(jīng)濟(jì)運(yùn)行調(diào)控方面,區(qū)間預(yù)測(cè)更具實(shí)用價(jià)值。
至今,國(guó)內(nèi)外有關(guān)光伏輸出功率區(qū)間預(yù)測(cè)的研究還處于初步階段,文獻(xiàn)[7]將光伏點(diǎn)預(yù)測(cè)的誤差視為正態(tài)分布和拉普拉斯分布進(jìn)行研究,從而求出一定置信度下的光伏輸出預(yù)測(cè)區(qū)間;文獻(xiàn)[8]綜合考慮影響光伏發(fā)電量的多種因素,用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)理論構(gòu)建光伏短期概率預(yù)測(cè)模型,在已知當(dāng)前時(shí)刻各影響因素水平條件下,預(yù)測(cè)光伏發(fā)電量的概率分布;文獻(xiàn)[9]采用集對(duì)分析理論,提出了太陽(yáng)輻照度區(qū)間的預(yù)測(cè)方法。以上方法在假定預(yù)測(cè)誤差符合某種分布規(guī)律的前提下展開研究,其可靠性受到質(zhì)疑。
針對(duì)光伏功率的非穩(wěn)定性,本文采用集成經(jīng)驗(yàn)?zāi)B(tài)分解方法(ensemble empirical model decomposi- tion, EEMD)[10],將原始光伏功率分解為若干個(gè)相對(duì)較為平穩(wěn)的子序列,并依據(jù)樣本熵理論[11]把復(fù)雜度較高的子序列重組為隨機(jī)分量L,再運(yùn)用模糊信息?;椒╗12]將L進(jìn)行模糊粒化,從而得到光伏輸出的“波動(dòng)帶”。最后基于BP人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)未來一天的輸出功率及其置信區(qū)間??紤]到傳統(tǒng)BP人工神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu)、收斂緩慢等缺陷,本文采用縱橫交叉算法(CSO)[13]進(jìn)行改進(jìn)。最后以美國(guó)俄勒岡州本德一處光伏發(fā)電場(chǎng)作為研究對(duì)象,驗(yàn)證所提方法的可靠性。
集合經(jīng)驗(yàn)?zāi)B(tài)分解能夠從原信號(hào)中將不同頻率特性的波形逐級(jí)分離出來。EEMD是一種噪聲輔助數(shù)據(jù)分析法。通過將白噪聲加入到待分解的信號(hào)中,消除原始數(shù)據(jù)序列的間歇現(xiàn)象,抑制分解結(jié)果中噪聲所產(chǎn)生的影響。EEMD將非平穩(wěn)信號(hào)分解成若干個(gè)符合一定條件的內(nèi)稟模態(tài)函數(shù)(IMF)和剩余分量(RES)。分解過程如下:
(a)原始數(shù)據(jù)序列中加入高斯白噪聲;
(b)將步驟(a)所得的序列按照EMD分解法分解成一系列IMF分量和一個(gè)RES分量;
(c)重復(fù)步驟(a)和(b)M(本文取M=100)次,將所得的IMF和RES分量取平均值,即得EEMD分解的最終IMF分量與RES分量。
樣本熵是一種能夠度量信號(hào)復(fù)雜度的工具[14],由Richman于2000年提出。若序列的自相關(guān)性越大,則樣本熵值越??;反之,若序列越復(fù)雜,則其樣本熵值越大。樣本熵是條件概率的嚴(yán)格自然對(duì)數(shù),其估計(jì)值可以用以下公式表示:
SampEn(Num,m,r)=-ln[Bm+1(r)/Bm(r)]
(1)
式中Num為數(shù)據(jù)長(zhǎng)度;m為維數(shù);r為相似容限;由于樣本熵具有很好的一致性,SampEn值的變化趨勢(shì)并不受m和r影響,一般情況下m的值取為2,r取0.1~0.25SD,本文中m=2,r=0.2SD,其中,SD為時(shí)間序列標(biāo)準(zhǔn)差。式(1)中Bm+1(r)與Bm(r)的具體含義可參閱文獻(xiàn)[11]。
所謂的信息?;褪歉鶕?jù)一定的劃分規(guī)則,將一個(gè)信息整體分解為多個(gè)部分進(jìn)行研究,每個(gè)部分即為一個(gè)信息粒。信息?;P椭饕心:P汀⒋植诩P秃蜕炭臻g理論模型3種。本文采用模糊粒子化方法,基于模糊集理論對(duì)光伏數(shù)據(jù)進(jìn)行模糊信息?;幚?。模糊信息?;饕譃榇翱趧澐趾托畔⒛:瘍蓚€(gè)環(huán)節(jié):窗口劃分就是將整個(gè)時(shí)間序列劃分為若干個(gè)子序列,每個(gè)子序列作為一個(gè)操作窗口;而信息模糊化則是根據(jù)一定模糊規(guī)則將每個(gè)窗口數(shù)據(jù)轉(zhuǎn)換成一個(gè)個(gè)模糊信息粒。其中,信息模糊化是?;^程的重點(diǎn),要使新構(gòu)建的模糊集能夠取代原來窗口中的信息。
考慮單窗口問題,即是把整個(gè)數(shù)據(jù)序列X看作一個(gè)窗口進(jìn)行模糊化,X上建立模糊粒子g是模糊化的任務(wù)。模糊概念G與模糊粒子g的關(guān)系如下:
(2)
式中x是論域X的變量;模糊概念G是以X為論域的模糊集合;常用的模糊粒子形式有三角型、梯形、高斯型、拋物型等。由于本文主要依據(jù)光伏隨機(jī)分量的波動(dòng)范圍進(jìn)行區(qū)間預(yù)測(cè),即需要求得窗口數(shù)據(jù)的最大值和最小值,故在此采用三角形模型粒子,其隸屬函數(shù)可表示為:
(3)
式中x是論域中的變量;a、m、b為參數(shù),分別對(duì)應(yīng)原始數(shù)據(jù)變化的最小值(LOW)、平均值(R)和最大值(UP)。對(duì)于單窗口光伏數(shù)據(jù),UP表示該窗口數(shù)據(jù)波動(dòng)的上界;R參數(shù)表示該窗口數(shù)據(jù)變化的平均水平;LOW參數(shù)表示該窗口數(shù)據(jù)波動(dòng)的下界。
BP神經(jīng)網(wǎng)絡(luò)是基于信號(hào)前向傳播、誤差反向傳播的多層前饋神經(jīng)網(wǎng)絡(luò),在樣本數(shù)據(jù)的訓(xùn)練過程中自動(dòng)學(xué)習(xí)輸入變量與輸出變量之間的映射關(guān)系。BP神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu)模式是包含輸入層、隱含層和輸出層的三層結(jié)構(gòu)。訓(xùn)練過程中,若輸出層的實(shí)際輸出值與期待輸出值(教師數(shù)據(jù))不符,則其誤差通過反向傳遞方式,不斷修正神經(jīng)網(wǎng)絡(luò)的連接權(quán)值。
輸入、輸出層神經(jīng)元數(shù)目由實(shí)際預(yù)測(cè)模型的輸入、輸出節(jié)點(diǎn)確定,隱含層神經(jīng)元個(gè)數(shù)則由以下公式計(jì)算而得:
(4)
式中n為輸入節(jié)點(diǎn)數(shù);m為隱含層節(jié)點(diǎn)數(shù);l為輸出層節(jié)點(diǎn)數(shù);a為1~5的常數(shù)。
傳統(tǒng)BP人工神經(jīng)網(wǎng)絡(luò)算法采用梯度下降法調(diào)整權(quán)值和閾值,梯度下降法的最大缺點(diǎn)是容易陷入局部最優(yōu),并且收斂速度緩慢。針對(duì)于此,本文采用縱橫交叉算法對(duì)權(quán)值和閾值進(jìn)行優(yōu)化,從而得到CSO-BP模型??v橫交叉算法(CSO)是孟安波等人在中國(guó)儒家中庸思想和遺傳算法中交叉操作啟發(fā)下提出來的一種全新群智能算法,該算法已經(jīng)在電力系統(tǒng)參數(shù)優(yōu)化等方面取得成功運(yùn)用[13-14]。橫向交叉與縱向交叉是CSO算法兩個(gè)最關(guān)鍵的操作算子,下面分別介紹這兩種交叉操作算子。
1.5.1 橫向交叉算子
橫向交叉之前,先將種群的所有粒子進(jìn)行兩兩互異隨機(jī)配對(duì),把搜索空間分為一半種群大小的兩個(gè)超立方體,然后將配對(duì)好的兩個(gè)父代粒子X(i)和X(j)所有維進(jìn)行算術(shù)交叉,產(chǎn)生子代。橫向交叉公式如下:
Mhc(i,d)=r1X(i,d)+(1-r1)X(j,d)+
c1(X(i,d)-X(j,d))
(5)
Mhc(j,d)=r2X(j,d)+(1-r2)X(i,d)+
c2(X(j,d)-X(i,d))
(6)
式中c1、c2為[-1,1]上的隨機(jī)數(shù);r1、r2為[-1,1]上的隨機(jī)數(shù);X(i,d),X(j,d)分別是父代粒子X(i)和X(j)的第d維;Mhc(i,d)和Mhc(j,d)分別是X(i,d),X(j,d)橫向交叉后產(chǎn)生的d維子代。從社會(huì)學(xué)角度來看,上面式子右端第一項(xiàng)為粒子的記憶項(xiàng),代表粒子本身的當(dāng)前最優(yōu)值,第二項(xiàng)為群體認(rèn)知項(xiàng),代表粒子間的相互學(xué)習(xí)行為,這兩項(xiàng)通過慣性權(quán)重因子r有機(jī)結(jié)合在一起;第三項(xiàng)采用邊緣搜索方式,極大程度地減少搜索盲點(diǎn),提高算法全局尋優(yōu)能力。橫向交叉過程,配對(duì)的粒子在以它們?yōu)閷?duì)角頂點(diǎn)的超立方體內(nèi)及其外緣產(chǎn)生子代。
交叉結(jié)束后,得到的中庸解Mhc(i,d)和Mhc(j,d)通過競(jìng)爭(zhēng)算子分別與父代粒子X(i)、X(j)進(jìn)行適應(yīng)度比較,保留獲勝粒子,從而得到占優(yōu)解DShc,參與下次迭代。
1.5.2 縱向交叉算子
實(shí)驗(yàn)表明,絕大多數(shù)群智能優(yōu)化算法的早熟問題往往是因?yàn)榉N群的部分維陷入了停滯不前,稱之為維局部最優(yōu),而縱向交叉操作可以巧妙地解決這個(gè)問題??v向交叉是粒子的兩個(gè)不同維之間進(jìn)行的一種算術(shù)交叉,為了使已經(jīng)陷入停滯不前的那一維跳出局部最優(yōu),而同時(shí)不破壞另外一維的信息,每次縱向交叉操作只對(duì)其中一維進(jìn)行更新,產(chǎn)生一個(gè)子代粒子。縱向交叉公式如下:
MSvc(i,d1)=rX(i,d1)+(1-r)X(i,d2)
(7)
式中r∈[0,1];MSvc(i,d1)是個(gè)體粒子X(i)的第d1維和第d2維通過縱向交叉產(chǎn)生后代的第d1維。式(7)的第一項(xiàng)是粒子X(i)第d1維的記憶項(xiàng),第二項(xiàng)體現(xiàn)了粒子X(i)的d1、d2維間的相互學(xué)習(xí)??v向交叉完后,中庸解MSvc(i)通過競(jìng)爭(zhēng)算子與父代粒子X(i)進(jìn)行適應(yīng)度比較,得到占優(yōu)解DSvc,進(jìn)行下次迭代。
光伏功率輸出與氣候條件密切相關(guān)[15],數(shù)據(jù)表明,相同氣候類型的光伏輸出曲線具有較大的相似性。通過分析不同天氣因素對(duì)光伏陣列輸出的影響,本文選擇對(duì)光伏輸出影響最明顯的輻照強(qiáng)度和溫度作為選取相似日的依據(jù),所以取日特征向量為:
X=(t,I,Imax,t1,T,ΔT,t2,t3)
(8)
式中t為日照時(shí)長(zhǎng);I與Imax分別為平均太陽(yáng)輻照強(qiáng)度和日最大輻照強(qiáng)度;t1分別為最大太陽(yáng)輻照值出現(xiàn)的時(shí)刻;T為平均氣溫,ΔT為日最大溫差;t2與t3分別為日最高氣溫和最低氣溫出現(xiàn)的時(shí)刻。本文選用基于自組織競(jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)(SOM)[16]法對(duì)進(jìn)行樣本日聚類和相似日識(shí)別。
為了降低光伏數(shù)據(jù)的非平穩(wěn)性,本文用EEMD方法將其分解為若干個(gè)子序列IMFn。然后,依據(jù)樣本熵方法識(shí)別出波動(dòng)較為激烈的序列,重組為隨機(jī)分量L,并將該分量進(jìn)行模糊信息?;?,從而得到新粒子信息UP、R和LOW。
(9)
預(yù)測(cè)區(qū)間的上界為:
h=P′+(|UP′|-|R′|)
(10)
預(yù)測(cè)區(qū)間的下界為:
l=P′+(|R′|-|LOW′|)
(11)
CSO-BP預(yù)測(cè)模型的輸入量為相似度最高的歷史日光伏功率的對(duì)應(yīng)分量數(shù)據(jù)(取該分量6:30~17:30每30 min的平均值)和預(yù)測(cè)日的最高溫低、最低溫度、平均溫度以及平均太陽(yáng)輻照強(qiáng)度,輸出為待預(yù)測(cè)日光伏功率的對(duì)應(yīng)分量數(shù)據(jù)。預(yù)測(cè)流程見圖1。
圖1 短期光伏出力區(qū)間預(yù)測(cè)流程框圖
采用如下三個(gè)指標(biāo)來評(píng)價(jià)預(yù)測(cè)結(jié)果:
(1)區(qū)間覆蓋率FICP(Forecasting Interval Coverage Percentage)[18]
(12)
式中FICP為區(qū)間覆蓋率;N為測(cè)試樣本總個(gè)數(shù);ξ為實(shí)際值落入預(yù)測(cè)區(qū)間的個(gè)數(shù)。
(2)平均區(qū)間寬度(Interval Average Width)[18]
(13)
式中W為平均區(qū)間寬度;θi為第i個(gè)測(cè)試樣本的置信區(qū)間寬度。W越小,表明預(yù)測(cè)效果越理想。
(3)平均絕對(duì)百分比誤差[19]
(14)
以2012年8月11日為研究對(duì)象,從2011年8月10日至2012年8月10日的一年歷史樣本中選取其訓(xùn)練樣本,并進(jìn)行EEMD分解,如圖2所示。
圖2 EEMD分解結(jié)果
圖3為以上各IMF分量和原始光伏數(shù)據(jù)的樣本熵值統(tǒng)計(jì)圖。
圖3 原始光伏數(shù)據(jù)及其EEMD子序列的樣本熵值
不難看出,序列IMF1、IMF2和IMF3的樣本熵值明顯大于其他分量,即序列復(fù)雜度較高。因此,將這三個(gè)序列重組為隨機(jī)分量L,代表著光伏數(shù)據(jù)的波動(dòng)性。重組結(jié)果如圖4所示。
圖4 隨機(jī)分量重構(gòu)結(jié)果圖
將隨機(jī)分量L進(jìn)行模糊信息粒化為UP、R和LOW三個(gè)信息粒子,從而得其波動(dòng)范圍。模糊粒化過程中,每6個(gè)采樣數(shù)據(jù)劃為一個(gè)窗口進(jìn)行操作,即每個(gè)窗口時(shí)間跨度為30 min。結(jié)果如圖5所示。
圖5 隨機(jī)分量L的模糊信息?;Y(jié)果
為了有效驗(yàn)證本文所提模型的性能,以2012年8月11日~14日為待預(yù)測(cè)日(6:30~17:30,分辨率30min),并與以下兩個(gè)預(yù)測(cè)模型對(duì)比:
模型一:采用未經(jīng)CSO優(yōu)化的BP人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)各模糊分量以及相對(duì)穩(wěn)定的EEMD分量。
模型二:原始光伏數(shù)據(jù)未經(jīng)EEMD分解及隨機(jī)分量重組,而直接采用模糊信息?;椒▽⒐夥鼣?shù)據(jù)進(jìn)行模糊處理,并運(yùn)用CSO-PB對(duì)粒子UP,R和LOW進(jìn)行預(yù)測(cè),得UP′,R′和LOW′,分別對(duì)應(yīng)區(qū)間上界、確定預(yù)測(cè)值和區(qū)間下界。三種模型的光伏區(qū)間預(yù)測(cè)結(jié)果如表1所示。
表1 3種模型預(yù)測(cè)性能評(píng)估
隨著光伏并網(wǎng)規(guī)模的日益增大,傳統(tǒng)的確定性點(diǎn)預(yù)測(cè)越來越不能夠滿足電網(wǎng)安全經(jīng)濟(jì)運(yùn)行的需求。針對(duì)于此,本文提出一種基于模糊信息粒化和改進(jìn)人工神經(jīng)網(wǎng)絡(luò)模型的短期光伏出力區(qū)間預(yù)測(cè)方法。針對(duì)光伏功率數(shù)據(jù)不穩(wěn)定的這個(gè)實(shí)際情況,本文采用集成經(jīng)驗(yàn)?zāi)B(tài)分解方法進(jìn)行處理,并重組出代表光伏波動(dòng)性的隨機(jī)分量,再進(jìn)一步采用模糊信息?;椒▽?duì)其做處理,得出一個(gè)“波動(dòng)帶”,最后對(duì)各分量預(yù)測(cè)、疊加,得出最終光伏區(qū)間預(yù)測(cè)結(jié)果,并通過實(shí)例驗(yàn)證了該方法具有較好的可行性和工程實(shí)用性。