摘 要:針對傳統(tǒng)光伏功率預測方法的精度和魯棒性難以兼顧的不足,提出一種結合相似日理論、改進麻雀算法(ISSA)與SE通道注意力機制的卷積(CNN)雙向長短期記憶(BiLSTM)神經(jīng)網(wǎng)絡模型(簡寫為ISC-BiLSTM),能實現(xiàn)短期光伏功率的準確預測。該方法首先通過相關性計算,篩選出影響光伏功率的主要氣象因子;再使用模糊C均值聚類(FCM)方法對存在相似天氣特征的相似日進行聚類;然后通過加入SE的CNN對主要氣象參數(shù)與歷史功率的時空特征進行充分提取;接著利用BiLSTM對數(shù)據(jù)序列間的依賴關系進行捕捉;最后通過ISSA對模型的超參數(shù)進行尋優(yōu),并選擇超參數(shù)最優(yōu)的模型進行功率預測。對比實驗與仿真結果表明,該方法預測誤差較低,能實現(xiàn)日前分鐘級短期光伏功率的準確預測。
關鍵詞:光伏發(fā)電;預測;神經(jīng)網(wǎng)絡;注意力機制;改進麻雀算法;模糊聚類
中圖分類號:TM615 """""文獻標志碼:A
0 引 言
光伏發(fā)電憑借安全、高效、經(jīng)濟、環(huán)保的優(yōu)勢已成為能源清潔轉型的主力,其并網(wǎng)滲透率不斷提高。但光伏發(fā)電具有較大的隨機性、波動性和間歇性,這些特性影響著電網(wǎng)運行的穩(wěn)定性和安全性。因此,精確預測光伏輸出功率對于輸電調配、機組調度和日前市場交易具有重要意義[1]。
按照方法的不同,光伏功率預測方式通常分為物理法、統(tǒng)計法和機器學習法。物理法[2-3]是基于發(fā)電原理構建相應數(shù)學模型的方法,不依賴大量的歷史數(shù)據(jù),但建模和求解過程復雜,預測穩(wěn)定性和可靠性較弱。統(tǒng)計法[4]通過參數(shù)估計和曲線擬合等方式利用歷史數(shù)據(jù)來建立預測模型,其通用性強、建模方便,但其預測質量與歷史數(shù)據(jù)的質量強相關,數(shù)據(jù)的誤差或缺失都對預測效果有顯著影響。目前,機器學習法多數(shù)是利用神經(jīng)網(wǎng)絡自主學習輸入特征與輸出結果的對應關系來進行預測,其使用方便、抗干擾能力強,預測準確率高。其中長短期記憶神經(jīng)網(wǎng)絡(long short-term memory,LSTM)在時間序列預測任務中表現(xiàn)優(yōu)越,在光伏發(fā)電功率預測領域中的應用日漸廣泛。文獻[5]結合天氣信息和LSTM提出一種光伏功率預測方法,實現(xiàn)了在天氣信息較模糊的情況下對分布式光伏發(fā)電功率進行短期預測,但單一神經(jīng)網(wǎng)絡模型精度較低;文獻[6]結合極端梯度提升模型(extreme Gradient Boosting,XGBoost)與LSTM對短期光伏發(fā)電功率進行預測;文獻[7]提出一種結合VMD-LSTM模型與誤差補償技術的光伏功率預測方法,采用變分模態(tài)分解(variational mode decom position,VMD)算法將原始功率序列分解為若干不同模態(tài),并建立對應的LSTM模型進行超短期預測;文獻[8]提出一種EMD-PCA-LSTM光伏功率預測模型,采用經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)將環(huán)境因素序列進行分解,再通過主成分分析法(principal component analysis,PCA)提取關鍵影響因素,并使用LSTM進行建模預測,消除了原始序列的冗余性;文獻[9]比較了卷積神經(jīng)網(wǎng)絡模型(convolutional neural network,CNN)、LSTM模型和CNN-LSTM模型在光伏功率預測中的效果,結果表明CNN-LSTM組合模型的預測精度相對較高;文獻[10]提出一種基于W-BiLSTM的風電、光伏功率預測方法,該方法將LSTM拆分為兩個方向,充分學習了數(shù)據(jù)的正反向特征,結果表明雙向長短期記憶神經(jīng)網(wǎng)絡(Bidrirectional long short-term memory, BiLSTM)模型預測精度高于LSTM;文獻[11]提出一種基于相似日聚類和QR-CNN-BiLSTM模型的光伏功率區(qū)間預測模型,結果表明將歷史數(shù)據(jù)按照一定規(guī)律進行聚類可有效提高模型的預測精度。上述方法雖相對于單一神經(jīng)網(wǎng)絡模型預測精度有所提高,但在復雜天氣情況下的精度與魯棒性仍需進一步提升。
綜合近來的研究成果,光伏功率預測的準確度與效率相較于早期方法均有較大提升,但多數(shù)方法在面對多變的氣候條件時仍存在預測性能與魯棒性難以兼顧的不足。對此,本文充分考慮了信息流的正反向傳播特點以及神經(jīng)網(wǎng)絡的訓練數(shù)據(jù)集、特征提取效果以及神經(jīng)網(wǎng)絡中超參數(shù)設置對預測精度的影響,結合相信日理論,提出一種由改進麻雀算法優(yōu)化的帶通道注意力機制的卷積雙向長短期記憶神經(jīng)網(wǎng)絡模型(ISC-BiLSTM),用于短期光伏功率預測。該方法在不同天氣環(huán)境下均可保持良好的表現(xiàn),且預測時間間隔較短,時間粒度精細,預測信息更詳細。
1 基于FCM的相似日聚類
針對氣象因子對光伏功率的顯著影響,本文運用模糊C均值聚類算法(fuzzy C-means clustering,F(xiàn)CM)對天氣類型相似的日期進行聚類,并根據(jù)聚類結果對不同天氣類型的日期建立相應的訓練集,為后續(xù)神經(jīng)網(wǎng)絡的訓練提供更具針對性的天氣數(shù)據(jù),進而提高整體的預測效率和精度。
1.1 光伏發(fā)電影響因素分析
影響光伏功率的因素通常可分為內在因素和外在因素。內在因素主要有電站的設計差別、光伏組件的轉換效率、逆變器的差異等;外在因素主要包括輻照度、溫度、濕度、壓強、風速等氣象因素。對于固定光伏場來說,歷史功率數(shù)據(jù)中通常已經(jīng)包含內在因素的影響,因此在研究中只考慮外在因素(氣象因素)即可[12]。
為了量化氣象因素與光伏發(fā)電功率之間的相關程度,本文采用皮爾遜(Pearson)相關系數(shù)來衡量各氣象因子與光伏功率之間的線性相關程度[13],其計算公式為:
[r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)212] (1)
式中:[x]、[y]——氣象因子和光伏功率;[x]、[y]——[x]、[y]的平均值;[r]——Pearson相關系數(shù)值,其值域為[-"1],正負值的意義為正相關和負相關,[r]越大,說明變量相關性程度越高。
本文采用澳大利亞DKASC中光伏站點Alice Springs的2018年的實測數(shù)據(jù)與當?shù)貧庀蟛块T記錄的同年天氣數(shù)據(jù)進行相關性計算與分析??紤]的氣象因素包括總水平輻照度、散射輻照度、氣溫、濕度、風速、風向、降雨量。光伏功率與上述氣象因素的相關系數(shù)與相關程度如表1所示。
從表1可看出,光伏發(fā)電功率與總水平輻照度存在極強的相關性;與散射輻照度、氣溫和濕度的相關性次之;與風速相關性較弱;與風向、降雨量相關性極弱。因此,本文認為總水平輻照度、散射輻照度、氣溫和濕度為影響光伏發(fā)電功率的主要因素。
1.2 基于FCM的相似日聚類
FCM是基于傳統(tǒng)K-means聚類算法的一種改進算法,可根據(jù)樣本與聚類中心的相似度關系實現(xiàn)柔性模糊聚類,提供更加優(yōu)越、靈活的聚類結果[14]。
由表1可知,光伏發(fā)電功率與總水平輻照度的Pearson相關系數(shù)值接近"說明兩者之間存在極強的線性相關性,總水平輻照度能全面反映光伏功率數(shù)據(jù)的波動規(guī)律和特點,本文選取每日總水平輻照度的最大值、平均值、標準差、標準差率、峰度、偏度作為相似日聚類的特征,將具有相似特征的日期定義為相似日。
FCM聚類本質上是通過反復迭代計算,使各特征關于同一聚類中心的歐式距離和隸屬度函數(shù)取得最小值,并滿足相似日特征的類內距離最小,且類間距離最大。根據(jù)聚類水平選取相似日能集中數(shù)據(jù)的有效信息,提升選取效率和效果。
FCM的目標函數(shù)本質上是各特征樣本到各聚類中心的歐氏距離之和,可表示為:
[J(U,V)=i=1nj=1cumijd2ij] (2)
式中:[U]——隸屬度矩陣;[V]——聚類中心;[m]——隸屬度因子;[n]——樣本數(shù)量;[c]——聚類數(shù)量;[umij]——第[i]個樣本屬于第[j]類的隸屬度;[d2ij]——樣本到聚類中心的歐氏距離。
為使目標函數(shù)取得最小值,在迭代過程中使用拉格朗日乘數(shù)法計算第l步的聚類中心[ν(l)j]和隸屬度矩陣[u(l)ij],分別表示為:
[ν(l)j=i=1n(u(l-1)ij)mxii=1n(u(l-1)ij)m] (3)
[u(l)ij=1k=1cd(l)ijd(l)ik2m-1] (4)
式中:[xi]——樣本點;[d(l)ik]——第[i]個樣本到第[k]個聚類中心的歐氏距離。迭代的終止條件為:
[maxiju(t+1)ij-u(t)ijlt;ε] (5)
式中:[t]——迭代步數(shù);[ε]——中止閾值。當滿足中止條件后,認為樣本隸屬度不再發(fā)生變化,目標函數(shù)收斂于局部最小值點或鞍點,此時完成聚類任務。
2 ISC-BiLSTM模型
針對目前多數(shù)模型在光伏功率預測中精度和魯棒性難以兼得的不足,本文提出一種基于改進麻雀算法(improved sparrow search algorithm, ISSA)與(squeeze-and-excitation,SE)通道注意力機制的卷積(CNN)雙向長短期記憶(BiLSTM)神經(jīng)網(wǎng)絡模型(簡寫為ISC-BiLSTM)。
2.1 結合SE注意力機制的CNN
融合SE模塊后的CNN對各通道的特征有更強的辨別能力,進而能有效提升模型的預測精度,SE-CNN的結構與主要工作過程如圖1所示。
CNN具有高效的特征提取能力,其基本結構主要包括輸入層、卷積層、池化層、全連接層和輸出層。卷積層是CNN的核心,能通過卷積核捕捉影響光伏功率的各氣象數(shù)據(jù)序列中的不同特征。池化層位于卷積層之后,對特征進行降維和二次提取能有效提高模型泛化能力。CNN的卷積和池化過程分別如圖1a、圖1b所示。
考慮到在光伏功率預測中會對多種不同的氣象因素進行特征提取,這往往會導致CNN在處理大量冗雜的數(shù)據(jù)時提取到一些特征不明顯的信息[15],影響預測精度。神經(jīng)網(wǎng)絡中的注意力機制模擬了人腦注意力的運作情況,能從大量信息中篩選出少量且重要的信息,并加以重點關注[16],能有效降低冗余特征對預測精度的影響,因此本文在CNN的池化層后嵌入SE模塊來優(yōu)化模型的特征提取效果。
SE并非是一個完整的網(wǎng)絡結構,而是一個端到端的子結構。SE的核心是建立卷積或池化得到的特征圖之間的依賴關系模型,并通過全連接網(wǎng)絡根據(jù)損失函數(shù)自動學習每個特征通道的重要程度并賦予相應的權重值,使神經(jīng)網(wǎng)絡集中關注高權重值的特征通道,從而使模型達到更優(yōu)效果。具體實現(xiàn)過程如圖1c所示,可描述為:
1)擠壓(squeeze),即圖1c中的[Fsq]操作,通過全局平均池化將特征圖的大小壓縮為1×"進而可將[c]個特征圖映射為1×1×c的一維特征數(shù)組,可表示為:
[Zc=Fsq(Uc)=1h×wi=1hj=1wUc(i,j)] (6)
式中:[Zc]——擠壓操作的輸出權重;[Uc]——每個通道的特征圖;[h]和[w]——特征圖的高度和寬度;[Uc(i,j)]——特征通道[c]中第[i]行第[j]列的值。
2)激勵(excitation),即圖1c中的[Fex]操作,通過參數(shù)學習計算出每個通道對應的權重值,可表示為:
[S=Fex(Z,W)=σ(W2δ(W1Z))] (7)
式中:S——特征圖的權重,[σ]和[δ]——激活函數(shù);[W1]和[W2]——維度[c/r×c]和[c×c/r]的權重矩陣;[r]——降維系數(shù)。模型包含兩個全連接層,先通過[W1]降維,再通過[W2]升維,能有效降低復雜度并發(fā)揮輔助泛化作用。
3)點積(scale),即圖1c中的[Fscale]操作,將得出的權重值加權到對應通道的特征上,可表示為:
[X=Fscale(Uc, Sc)=Sc?Uc] (8)
式中:[Sc]——通道權重值;[?]表示逐元素相乘。
2.2 BiLSTM神經(jīng)網(wǎng)絡
光伏功率預測任務中伴隨著對長時間序列數(shù)據(jù)的處理,傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)在處理較長的時間序列時很容易發(fā)生梯度消失問題,導致無法準確預測。而LSTM神經(jīng)網(wǎng)絡通過遺忘門、輸入門和輸出門這3個獨特的“門”結構來控制細胞內信息的存儲和丟棄,從而實現(xiàn)時序信息的保留和長期記憶,避免了梯度消失問題 [17],更加適合用于光伏功率預測。LSTM的基本神經(jīng)元結構如圖2a所示。
在光伏功率預測中,若能充分考慮氣象序列數(shù)據(jù)的正反向信息傳播規(guī)律可進一步提高預測的準確度。BiLSTM是對單LSTM的優(yōu)化改進,由前向LSTM和后向LSTM構成[18],其結構如圖2b所示。BiLSTM能同時捕捉氣象序列信息的正反向流動的變化規(guī)律,綜合考慮雙向的歷史氣象序列信息有利于進一步提高模型預測精度。
在本文建立的光伏功率預測模型中,歷史氣象序列數(shù)據(jù)經(jīng)過SE-CNN進行特征提取后,輸入到BiLSTM中,由前向LSTM層和后向LSTM層分別進行正反向計算,最終結合兩者的計算結果得到最終輸出。其中,LSTM單元內的計算過程為:
[ft=σWf·[ht-1, xt]+bfit=σWi·[ht-1, xt]+bict=tanh(Wc·[ht-1, xt]+bc)ct=ft·ct-1+it·ctot=σWo·[ht-1, xt]+boht=ot·tanhct] (9)
式中:[ft]、[it]、[ot]——遺忘門、輸入門、輸出門的狀態(tài);[ct]——記憶單元的輸入狀態(tài);[ct]——細胞狀態(tài);[ht]——隱藏層輸出;[Wf],[Wi],[Wo],[Wc]——遺忘門、輸入門、輸出門和細胞狀態(tài)的權重;[bf],[bi],[bo],[bc]——遺忘門、輸入門、輸出門和細胞狀態(tài)的偏置量;[σ]——激活函數(shù)。
2.3 改進的麻雀搜索算法
在深度學習中,神經(jīng)網(wǎng)絡模型的超參數(shù)的選取顯著影響模型預測效果。其中初始學習率過大會導致模型難以收斂,過小則導致模型收斂過慢甚至無法學習;隱藏層節(jié)點數(shù)量過多會使模型易陷入局部最優(yōu),過少則會導致模型泛化能力低;正則化能通過降低模型復雜度防止過擬合。為降低人工尋找較優(yōu)超參數(shù)的時間成本,且使模型的超參數(shù)選擇相對最優(yōu),本文采用混合改進的麻雀算法(ISSA)對BiLSTM的初始學習率、隱藏層節(jié)點數(shù)量、正則化系數(shù)3種超參數(shù)進行尋優(yōu)。
麻雀搜索算法(SSA)模擬了麻雀的覓食與反捕食行為 [19],傳統(tǒng)SSA中的麻雀分為發(fā)現(xiàn)者和加入者,并從中隨機產(chǎn)生占種群數(shù)量10%~20%的警戒者。其中,發(fā)現(xiàn)者負責尋找適應度值高的位置并領導種群移動,加入者跟隨適應度最高的發(fā)現(xiàn)者來更新位置,警戒者能意識到危險并發(fā)出警報。傳統(tǒng)SSA收斂速度快、收斂精度高,但其種群豐富度低、全局搜索能力差、易陷入局部最優(yōu)。為降低以上缺陷帶來的誤差,提出一種基于Chebyshev混沌映射與精英反向策略混合改進的麻雀搜索算法。
Chebyshev映射是混沌映射的典型代表,其初值敏感性較低,魯棒性強。相比于原算法的隨機初始化,通過Chebyshev映射來優(yōu)化麻雀的初始種群,有助于使種群更加均勻地分布在空間中,進而提高初始種群的多樣性。Chebyshev混沌映射的數(shù)學表達式為:
[xt+1=cos(tcos-1(xt))] (10)
式中:[x]的范圍為[0,1];[x1]——屬于(0,1)均勻分布的隨機數(shù)。
反向策略基本思想是以當前解為基礎,通過反向學習尋找對應的反向解,并進行比較,保留更好的解。反向策略可擴大算法搜索區(qū)域,但此過程也具有一定盲目性,易造成搜索時間的浪費。因此,進一步引入精英策略,通過精英個體的反向學習來引導搜索過程逐步逼近最優(yōu)解[20]。精英反向策略的機制為:設[xi(t)]為第[t]次迭代的解,其反向解為[x′i(t)],目標函數(shù)為[f(x)]。當[xi(t)≥x′i(t)]時,則稱[xi(t)]為第[t]次迭代的精英個體,反之,精英個體則為[x′i(t)]。故設[xij]為個體[xi]在[j]維上的值,其反向解為:
[x′ij(t)=mlij(t)+uij(t)-xij(t)] (11)
式中:[m]——介于0~1的隨機數(shù);[lij(t)]、[uij(t)]——[x′ij(t)]在第[j]維的最小值和最大值;[[lij, uij]]——精英群體所構造的區(qū)間。精英反向策略在SSA中的體現(xiàn)為:選擇適應度排名前10%的個體作為精英,并在區(qū)間內利用反向策略求取反向解,并對比更新前后個體,保留較優(yōu)者。
經(jīng)過Chebyshev混沌映射與精英反向策略混合改進的ISSA相比于傳統(tǒng)SSA有更強的全局搜索能力、更快的收斂速度,有效降低了模型陷入局部最優(yōu)的可能性,能更準確地對模型超參數(shù)進行尋優(yōu),提升模型的預測效率與效果。
2.4 基于ISC-BiLSTM的預測模型
本文所提基于ISC-BiLSTM的模型用以預測光伏發(fā)電功率,模型框架如圖3所示。
模型主要步驟如下:
1)進行相關性分析,通過式(1)計算出每個氣象因子與光伏功率之間的Pearson系數(shù)值,篩選出與光伏功率相關程度較高的氣象因素,接著通過式(2)~式(5)進行相似日聚類,根據(jù)待測日的天氣類型建立相應的訓練集,確定輸入序列。
2)對輸入的數(shù)據(jù)進行歸一化處理,防止不同量綱氣象數(shù)據(jù)的輸入對預測結果造成不良影響,并加快模型訓練的收斂速度,如式(12)表示。
[Xnom=X-XminXmax-Xmin] (12)
式中:[Xnom]——歸一化后的值;[X]——數(shù)據(jù)原始值;[Xmax]、[Xmin]——序列中最大與最小值。
3)通過SE-CNN提取氣象數(shù)據(jù)的特征,首先通過卷積層通過卷積運算進行初步提取,接著通過池化層進行特征降維和二次提取,然后通過式(6)~式(8)建立SE注意力機制,通過分配特征通道的注意力權重來提升模型效果。
4)將提取出的特征數(shù)據(jù)輸入到BiLSTM層中,通過式(9)實現(xiàn)每個LSTM單元的計算,最終結合正反向計算結果實現(xiàn)對模型特征數(shù)據(jù)的訓練。
5)通過式(10)優(yōu)化ISSA的初始種群,再通過式(11)優(yōu)化ISSA的學習策略,以模型的均方誤差([eMSE])作為適應度函數(shù),通過反復迭代,對模型的隱藏層節(jié)點數(shù)、初始學習率、正則化系數(shù)3種超參數(shù)進行尋優(yōu),最后以超參數(shù)最優(yōu)的模型完成預測任務并輸出預測結果。
6)將預測數(shù)據(jù)進行反歸一化處理后輸出,并采用[eMSE]、平均絕對誤差([eMAE])、均方根誤差([eRMSE])和決定系數(shù)([R2])作為模型的誤差評價指標對模型效果進行評估,計算式如式(13)~式(16)所示。[eMSE、eMAE、eRMSE]的值越小代表模型預測精度越高,[R2]的值越接近1表明模型效果越好。
[eMSE=1ni=1n(y′i-yi)2] (13)
[eMAE=1ni=1nyi-y′i] (14)
[eRMSE=1ni=1n(y′i-yi)2] (15)
[R2=1-i=1n(y′i-yi)2i=1n(y-yi)2] (16)
式中:[yi]——實際功率值;[y′i]——功率預測值;[y]——功率平均值值;[n]——樣本總數(shù)。
3 算例分析
本文采用澳大利亞DKASC的光伏發(fā)電站Alice Springs中某站點在2018年的光伏發(fā)電數(shù)據(jù)與本文篩選出的4個氣象因素(總水平輻照度、散射輻照度、氣溫、濕度)作為算例分析數(shù)據(jù)。光伏發(fā)電功率數(shù)據(jù)與各氣象數(shù)據(jù)的采樣間隔都為5 min,即每天采集288組數(shù)據(jù)。
3.1 相似日聚類結果
根據(jù)總水平輻照度的特點,并結合實際情況,采用FCM算法將天氣類型劃分為晴天、多云、陰天、雨天4種類型。由于夜晚光伏發(fā)電功率為0,故只取每天白天(06:00—20:00)的發(fā)電功率數(shù)據(jù)進行相似日聚類示意圖的繪制,如圖4所示。
由圖4可看出,在相同的天氣類型中,光伏發(fā)電功率曲線具有相似的波動情況。晴天時功率曲線最穩(wěn)定,很少出現(xiàn)波動;多云時功率曲線波動頻率增高,且劇烈波動發(fā)生的時間多數(shù)位于午后,但整體輸出功率依然可觀;陰天時功率曲線波動更加頻繁、劇烈,整體輸出功率有所降低,但大致滿足中午時間段發(fā)電功率較高的特點;雨天時功率曲線波動頻繁、無序,整體輸出功率最低?;谝陨戏治?,判斷出基于FCM的相似日聚類結果符合實際天氣特點。
3.2 相似日聚類效果與單一模型性能分析
為驗證相似日聚類對預測效果的提升和BiLSTM模型的優(yōu)越性,選取4個天氣類型不同的日期(晴天(10月9日)、多云(10月19日)、陰天(11月18日)、雨天(11月21日))進行對比實驗。
除了BiLSTM模型外,本文另外選取了常用于預測任務的反向傳播神經(jīng)網(wǎng)絡(back propagation neural network,BP)與極限學習機(extreme learning machines,ELM)作為對照組進行對比實驗。此外,按照是否進行相似日聚類,把方法分為未聚類組(BP、ELM、BiLSTM)與聚類組(FCM-BP、FCM-ELM、FCM-BiLSTM)。其中,未聚類組的訓練集采用待測日前4天的數(shù)據(jù)作為訓練集;聚類組采用待測日前一天和距離待測日最近(30天內)的3個相似日的數(shù)據(jù)作為訓練集。兩組模型在4個不同天氣下的預測效果如表2所示。
由表2可知,進行相似日聚類后,4種天氣下的BP、ELM、BiLSTM模型的[eMSE、eMAE、eRMSE]相比聚類前都有不同程度的降低,[R2]都有不同程度的提高,表明進行相似日聚類能有效提升模型的預測效果。此外,相比于BP與ELM模型,BiLSTM模型的預測效果在多數(shù)情況下更加優(yōu)越,尤其是在光伏功率波動相對劇烈的陰雨天更能保持良好的性能,表明BiLSTM作為光伏功率預測的基礎模型能取得較好效果。
3.3 ISC-BiLSTM模型預測結果分析
為進一步驗證CNN、SE、ISSA對于模型的改進效果,將本文所提ISC-BiLSTM模型與BiLSTM模型、CNN-BiLSTM模型、SE-CNN-BiLSTM模型分別在3.2節(jié)中4個待測日的預測結果進行對比。為確保對比的公平性,所有模型的訓練數(shù)據(jù)集都采用相似日聚類后的數(shù)據(jù),此外,除了本文方法中有3種超參數(shù)由ISSA尋優(yōu)外,其余超參數(shù)的設置均相同。4種方法在4個待測日的預測結果如圖5所示。
由圖5可看出,在4個不同天氣的待測日中,ISC-BiLSTM的預測曲線總是最接近實際功率曲線,尤其在拐點處也能保持較好的吻合度。相對地,單一BiLSTM模型的預測值與實際值偏差相對最大。為定量地分析各模型的效果,表3展示了各方法在不同天氣的預測誤差情況。
由表3中數(shù)據(jù)可直觀看出,在不同的天氣中預測結果的誤差都滿足:ISC-BiLSTM模型lt;SE-CNN-BiLSTM模型lt;CNN-BiLSTM模型lt;BiLSTM模型。其中,CNN-BiLSTM模型相較于BiLSTM模型,[eRMSE]平均降低11.66%,[eMAE]平均降低20.52%,[eMSE]平均降低19.89%,[R2]平均提高0.00131。說明比起單一BiLSTM模型,加入CNN模塊對數(shù)據(jù)信息進行特征提取能優(yōu)化模型性能,有效提升模型預測精度。SE-CNN-BiLSTM模型相較于CNN-BiLSTM模型,[eRMSE]平均降低8.03%,[eMAE]平均降低4.52%,[eMSE]平均降低15.18%, [R2]平均提高0.00063。說明加入SE注意力機制的CNN模塊具有更優(yōu)秀的特征捕捉能力,可再次提高模型的預測準確度。ISC-BiLSTM模型相較于SE-CNN-BiLSTM模型,[eRMSE]平均降低12.68%,[eMAE]平均降低17.2%,[eMSE]平均降低23.19%,[R2]平均提高0.0006。說明利用ISSA對模型的超參數(shù)進行尋優(yōu)能進一步提高模型預測準確度。
綜上所述,本文提出的基于相似日與ISC-BiLSTM的光伏發(fā)電功率預測模型有效降低了單一模型的預測誤差,能在各種天氣環(huán)境下對功率進行準確預測,且在4種不同天氣下模型的[R2]都保持在0.993以上,證明模型還具有較強的魯棒性,能較準確地反映預測日的光伏發(fā)電功率特征。
3.4 模型區(qū)間預測結果分析
光伏發(fā)電功率常常表現(xiàn)出顯著的隨機性,因此對光伏出力一定置信區(qū)間的上下限進行準確預測有助于確定光伏發(fā)電功率的波動范圍、評估光伏電站功率極限,進而保障電力系統(tǒng)運行的安全與穩(wěn)定性、降低系統(tǒng)運行成本。
本文采用Bootstrap法[21]進行ISC-BiLSTM模型的預測誤差分布分析。圖6給出了4種不同天氣下模型在85%、90%、95%置信水平下的置信區(qū)間帶。
從圖6可看出,隨著置信度的增大,預測區(qū)間寬度變寬,實際功率曲線可較好地包絡到置信區(qū)間帶中。
為準確分析區(qū)間預測效果,采用區(qū)間覆蓋率(PICP)指標進行定量分析。PICP具體公式可參考文獻[22],區(qū)間預測效果如表4所示。
由表4中數(shù)據(jù)可直觀看出,隨著置信水平的提高,PICP同步增大,與圖7表現(xiàn)一致。此外,在不同的置信水平下各天氣中的PICP值都接近其對應的置信水平值,表明本文模型可配合Bootstrap方法對光伏發(fā)電功率區(qū)間的上下限進行精準預測,以準確地計算光伏發(fā)電功率的波動范圍;且在一定的置信水平下不同天氣的PICP值相差較小,進一步表明本文模型有較強的魯棒性,在不同的天氣環(huán)境下均能保持較好的預測效果。
4 結 論
精細化的光伏出力預測可使電力調度部門提前制定更詳細的調度計劃,增強電網(wǎng)的穩(wěn)定性與安全性。本文提出一種基于相似日與ISC-BiLSTM的光伏功率預測模型,對光伏功率進行了日前分鐘級精細化預測,通過實驗驗證分析得出以下結論:
1)通過FCM按照不同的天氣特征將天氣分為晴天、多云、陰天、雨天4種典型天氣的相似日后,在預測過程中提取與預測日同天氣類型的相似日數(shù)據(jù)作為模型的訓練數(shù)據(jù),使BiLSTM模型在晴天、多云、陰天、雨天的[R2]由0.9834、0.99852、0.99056和0.96664提升至0.9977、0.99906、0.99509和0.98715,顯著提升了模型的預測效果。
2)在BiLSTM模型中加入SE-CNN模塊,充分發(fā)揮了CNN高效的空間特征提取的優(yōu)勢、BiLSTM對數(shù)據(jù)雙向時序特征提取的優(yōu)越性能以及SE注意力機制的突出關鍵歷史時間點的信息,以減少冗余或無用特征對預測效果影響的能力,從而使SE-CNN-BiLSTM相對于BiLSTM在4種天氣下的[R2]提升至0.99859、0.99923、0.99666和0.99228,進一步提升了模型的預測精度。
3)本文提出的混合改進的ISSA與傳統(tǒng)SSA相比,搜索能力更優(yōu)、收斂速度更快、陷入局部最優(yōu)的概率更小。實驗結果說明,經(jīng)過ISSA進行超參數(shù)尋優(yōu)的ISC-BiLSTM模型相較于其他對比模型,在4種不同天氣下的eMAE、eMAE、eRMSE的值均為最低,且在天氣波動較劇烈的多云、陰天和雨天環(huán)境下,誤差也能維持在較低水平,R2進一步提升至0.9987、0.99953、0.99792和0.993。至此,模型在4種天氣下的R2均大于0.99,充分凸顯了本文模型良好的預測精度、優(yōu)秀的自適應性與魯棒性。
[參考文獻]
[1] 王曉霞, 俞敏, 冀明, 等. 基于氣候相似性與SSA-CNN-LSTM的光伏功率組合預測[J]. 太陽能學報, 2023, 44(6): 275-283.
WANG X X, YU M, JI M, et al. Photovoltaic power combination forecasting based on climate similarity and ssa-cnn-lstm[J]. Acta energiae solaris sinica, 2023, 44(6): 275-283.
[2] LI Y T, SU Y, SHU L J. An ARMAX model for forecasting the power output of a grid connected photovoltaic system[J]. Renewable energy, 2014, 66: 78-89.
[3] OGLIARI E, DOLARA A, MANZOLINI G, et al. Physical and hybrid methods comparison for the day ahead PV output power forecast[J]. Renewable energy, 2017, 113: 11-21.
[4] MASSERAN N, RAZALI A M, IBRAHIM K, et al. Fitting a mixture of von Mises distributions in order to model data on wind direction in Peninsular Malaysia[J]. Energy conversion and management, 2013, 72: 94-102.
[5] 李豐君, 王磊, 趙健, 等. 基于天氣融合和LSTM網(wǎng)絡的分布式光伏短期功率預測方法[J]. 中國電力, 202""55(11): 149-154.
LI F J, WANG L, ZHAO J, et al. Research on distributed photovoltaic short-term power prediction method based on weather fusion and LSTM-Net[J]. Electric power, 202""55(11): 149-154.
[6] 譚海旺, 楊啟亮, 邢建春, 等. 基于XGBoost-LSTM組合模型的光伏發(fā)電功率預測[J]. 太陽能學報, 202""43(8): 75-81.
TAN H W, YANG Q L, XING J C, et al. Photovoltaic power prediction based on combined XGBoost-LSTM model[J]. Acta energiae solaris sinica, 202""43(8): 75-81.
[7] 王福忠, 王帥峰, 張麗. 基于VMD-LSTM與誤差補償?shù)墓夥l(fā)電超短期功率預測[J]. 太陽能學報, 202""43(8): 96-103.
WANG F Z, WANG S F, ZHANG L. Ultra short term power prediction of photovoltaic power generation based on VMD-LSTM and error compensation[J]. Acta energiae solaris sinica, 202""43(8): 96-103.
[8] 張雲(yún)欽, 程起澤, 蔣文杰, 等. 基于EMD-PCA-LSTM的光伏功率預測模型[J]. 太陽能學報, 202""42(9): 62-69.
ZHANG Y Q, CHENG Q Z, JIANG W J, et al. Photovoltaic power prediction model based on EMD-PCA-LSTM [J]. Acta energiae solaris sinica, 202""42(9): 62-69.
[9] WANG K J, QI X X, LIU H D. A comparison of day-ahead photovoltaic power forecasting models based on deep learning neural network[J]. Applied energy, 2019, 251: 113315.
[10] 謝小瑜, 周俊煌, 張勇軍, 等. 基于W-BiLSTM的可再生能源超短期發(fā)電功率預測方法[J]. 電力系統(tǒng)自動化, 202""45(8): 175-184.
XIE X Y, ZHOU J H, ZHANG Y J, et al. W-BiLSTM based ultra-short-term generation power prediction method of renewable energy[J]. Automation of electric power systems, 202""45(8): 175-184.
[11] 王開艷, 杜浩東, 賈嶸, 等. 基于相似日聚類和QR-CNN-BiLSTM模型的光伏功率短期區(qū)間概率預測[J]. 高電壓技術, 202""48(11): 4372-4388.
WANG K Y, DU H D, JIA R, et al. Short-term interval probability prediction of photovoltaic power based on similar daily clustering and QR-CNN-BiLSTM model[J]. High voltage engineering, 202""48(11): 4372-4388.
[12] 戚曉俠. 基于深度學習的光伏/風電功率預測研究[D]. 哈爾濱: 哈爾濱工程大學, 2020.
QI X X. Research on photovoltaic/wind power prediction based on deep learning[D]. Harbin: Harbin Engineering University, 2020.
[13] 張姍, 冬雷, 紀德洋, 等. 基于NWP相似性分析的超短期光伏發(fā)電功率預測[J]. 太陽能學報, 202""43(4): 142-147.
ZHANG S, DONG L, JI D Y, et al. Power forecasting of ultra-short-term photovoltaic station based on nwp similarity analysis[J]. Acta energiae solaris sinica, 202""43(4): 142-147.
[14] 呂偉杰, 方一帆, 程澤. 基于模糊C均值聚類和樣本加權卷積神經(jīng)網(wǎng)絡的日前光伏出力預測研究[J]. 電網(wǎng)技術, 202""46(1): 231-238.
LYU W J, FANG Y F, CHENG Z. Prediction of day-ahead photovoltaic output based on FCM-WS-CNN[J]. Power system technology, 202""46(1): 231-238.
[15] 夏睿, 高云鵬, 朱彥卿, 等. 基于SE-CNN模型的竊電檢測方法研究[J]. 電力系統(tǒng)保護與控制, 202""50(20): 117-126.
XIA R, GAO Y P, ZHU Y Q, et al. A detection method of electricity theft behavior based on an SE-CNN model[J]. Power system protection and control, 202""50(20): 117-126.
[16] 吉興全, 曾若梅, 張玉敏, 等. 基于注意力機制的CNN-LSTM短期電價預測[J]. 電力系統(tǒng)保護與控制, 202""50(17): 125-132.
JI X Q, ZENG R M, ZHANG Y M, et al. CNN-LSTM short-term electricity price prediction based on an attention mechanism[J]. Power system protection and control, 202""50(17): 125-132.
[17] 畢貴紅, 趙鑫, 陳臣鵬, 等. 基于多通道輸入和PCNN-BiLSTM的光伏發(fā)電功率超短期預測[J]. 電網(wǎng)技術, 202""46(9): 3463-3476.
BI G H, ZHAO X, CHEN C P, et al. Ultra-short-term prediction of photovoltaic power generation based on multi-channel input and PCNN-BiLSTM[J]. Power system technology, 202""46(9): 3463-3476.
[18] SONG D L, YU M, WANG Z F, et al. Wind and wave energy prediction using an AT-BiLSTM model[J]. Ocean engineering, 2023, 281: 115008.
[19] 李爭, 羅曉瑞, 張杰, 等. 基于改進麻雀搜索算法的光伏功率短期預測[J]. 太陽能學報, 2023, 44(6): 284-289.
LI Z, LUO X R, ZHANG J, et al. Short term prediction of photovoltaic power based on improved sparrow search algorithm[J]. Acta energiae solaris sinica, 2023, 44(6): 284-289.
[20] 馮增喜, 李詩妍, 趙錦彤, 等. 基于精英反向學習策略的麻雀搜索算法[J]. 計算機仿真, 2023, 40(1): 378-38""393.
FENG Z X, LI S Y, ZHAO J T, et al. Sparrow search algorithm based on elite reverse learning strategy[J]. Computer simulation, 2023, 40(1): 378-38""393.
[21] 宋紹劍, 羅世堅, 李國進, 等. 基于MPA-LSTM模型和Bootstrap方法的短期光伏功率區(qū)間預測[J]. 廣西大學學報(自然科學版), 202""47(4): 986-997.
SONG S J, LUO S J, LI G J, et al. A short-term PV power interval forecasting based on MPA-LSTM network model and Bootstrap method[J]. Journal of Guangxi University (natural science edition), 202""47(4): 986-997.
[22] 楊錫運, 張璜, 關文淵, 等. 基于滑動分塊百分位數(shù)Bootstrap法的風電功率概率區(qū)間預測[J]. 太陽能學報, 2019, 40(2): 430-437.
YANG X Y, ZHANG H, GUAN W Y, et al. Probabilistic intervals forecasting of wind power based on moving block percentile bootstrap method[J]. Acta energiae solaris sinica, 2019, 40(2): 430-437.
SHORT-TERM PHOTOVOLTAIC POWER FORECAST METHOD BASED ON SIMILAR DAYS AND ISC-BiLSTM
Yang Yihang"Han Lu"Shi Huabo"Deng Xinlong "Chen Zitong "Sun Rutian 3
(1. College of Electrical"Engineering"and"Automation, Southwest Petroleum University, Chengdu 610500, China;
2. State"Grid"Sichuan"Electric"Power"Research"Institute, Chengdu 61004""China;
3. Karamay Vocational amp; Technical College, Karamay 834000, China)
Abstract:Aiming at the problem that the accuracy and robustness of traditional photovoltaic power prediction methods are difficult to balance, an improved convolutional (CNN) bidirectional long-term and short-term memory(BiLSTM) neural network model (ISC-BiLSTM) is proposed by combining similar days theory, improved sparrow algorithm (ISSA) and(SE) channel attention mechanism, which can achieve accurate prediction of short-term photovoltaic power. Firstly, the main meteorological factors affecting photovoltaic power are screened out by correlation calculation. Then the fuzzy C-means clustering (FCM) method is used to cluster similar days with similar weather characteristics. Then, the spatial and temporal characteristics of the main meteorological parameters and historical power are fully extracted by SE-CNN; then, BiLSTM is used to capture the dependencies between data sequences. Finally, the hyper-parameters of the model are optimized by ISSA, and the model with the optimal hyper-parameters is selected for power prediction. The comparative experiment and simulation results show that the prediction error of this method is low, and the accurate prediction of short-term photovoltaic power at the minute level before the day can be realized.
Keywords:photovoltaic power; forecasting; neural network; attention mechanism; improved sparrow search algorithm; fuzzy clustering