周 楠,徐瀟源,嚴 正,陸建宇,李亞平
(1. 電力傳輸與功率變換控制教育部重點實驗室(上海交通大學),上海市200240;2. 國家電網公司華東分部,上海市200120;3. 中國電力科學研究院有限公司(南京),江蘇省南京市210003)
近年來,以光伏為代表的可再生能源發(fā)電迅速發(fā)展,在有效緩解能源危機問題的同時,其出力的隨機性和波動性也給電網的安全穩(wěn)定運行帶來了挑戰(zhàn)[1]。因此,準確預測光伏發(fā)電功率的變化趨勢有助于調度部門及時調整調度計劃,從而降低光伏并網對系統(tǒng)的負面影響。
光伏發(fā)電功率預測按照時間尺度可以分為中長期預測(1 月到1 年)、短期預測(4 h 到3 d)和超短期預測(數分鐘到4 h)[2-3],其中超短期預測能夠提供光伏出力的實時變化信息,是本文的研究對象。光伏發(fā)電預測方法可分為物理方法[4-5]和統(tǒng)計方法[6-11]。統(tǒng)計方法基于光伏的歷史數據建立出力波動特征的數學模型,預測精度較高且不需要光伏的詳細物理參數,因而在光伏發(fā)電預測中得到了廣泛應用。文獻[6-7]以輻照度等氣象數據作為輸入變量,分別采用徑向基函數(radial basis function,RBF)和反向傳播神經網絡(back propagation neural network,BPNN)預測光伏發(fā)電功率;文獻[8]采用極限學習機(extreme learning machine,ELM)進行光伏發(fā)電預測,顯著縮短了預測模型的訓練時間。相比于傳統(tǒng)的時間序列模型,上述基于單層前饋神經網絡的方法提升了光伏發(fā)電預測精度,但在訓練時存在欠擬合、易陷入局部最優(yōu)等問題。
近年來,各類深度學習算法被應用于光伏發(fā)電功率預測,以克服單層神經網絡的不足。文獻[9]基于小波變換和卷積神經網絡(convolutional neural network,CNN),提高了光伏發(fā)電功率的預測精度;文 獻[10]將CNN、長 短 期 記 憶(long short-term memory,LSTM)神經網絡及兩者的混合模型應用于光伏出力短期預測;文獻[11]提出了基于深度信念網絡(deep belief network,DBN)的光伏出力日前預測模型。相比于單層網絡,深度神經網絡表現出更高的預測精度,但其復雜的網絡結構也帶來了訓練耗時、調參困難等問題。對此,文獻[12-13]提出了寬度學習系統(tǒng)(broad learning system,BLS),并有學者將其應用于風光容量配置[14]和無刷發(fā)電機旋轉整流器故障分類[15],在保證計算效率的同時取得了精度較高的計算結果。但是,目前尚未有文獻涉及BLS 在光伏發(fā)電功率預測中的應用。
文獻[6-11]主要探討光伏發(fā)電功率的預測算法,但在不同天氣類型和出力水平下均采用單一預測模型,導致陰雨天氣下的預測誤差相對較大??紤]到光伏發(fā)電與氣象因素密切相關,有文獻首先按天氣類型對歷史數據進行分類,然后針對不同類別分別建立預測模型。文獻[16-18]采用自組織映射(self-organizing map,SOM)、K 均值聚類等聚類算法對天氣類型進行劃分,進一步采用BPNN 等算法預測光伏出力;文獻[19]首先采用Adaboost 改進的K 近鄰算法實現歷史數據聚類,然后建立多階加權馬爾可夫鏈預測輻照度和光伏出力。按天氣類型進行聚類能有效提升光伏發(fā)電預測精度,但是現有方法一般以日為單位進行聚類,沒有考慮小時乃至分鐘級別的光伏出力波動特征,故對于光伏發(fā)電功率超短期預測的參考價值有限。
本文提出了一種基于SOM 與BLS 的光伏發(fā)電功率超短期預測模型,旨在解決現有研究中光伏數據聚類較為粗糙、深度神經網絡訓練耗時的問題。首先,以單個時刻的數據樣本為單位,綜合考慮時間、歷史出力、氣象條件等因素,采用SOM 實現光伏數據分類;然后,針對不同類別構建基于BLS 的光伏發(fā)電功率超短期多步長預測模型,通過網絡寬度上的擴展提高網絡性能,使得預測模型同時具有強擬合能力與高訓練效率;最后,采用實際光伏數據進行算例分析,驗證本文所提方法的有效性。
光伏發(fā)電具有間歇性與隨機性的特征:一方面,在不同時刻和天氣類型下,光伏出力曲線具有不同特點;另一方面,輻照度等氣象因素的快速變化會導致光伏出力的瞬時波動。如果僅采用單一預測模型,而沒有考慮不同天氣條件下光伏出力的特性,會導致陰雨天氣等情況下的預測誤差較大。因此,本文在建立光伏發(fā)電功率預測模型前,首先采用SOM神經網絡對光伏數據進行聚類分析。
SOM 的神經網絡結構如附錄A 圖A1 所示[20]。它由輸入層和輸出層(也稱為競爭層)組成,其中輸入層對應一個N 維的輸入向量,競爭層由M=RC 個神經元組成,排列成R 行C 列,構成一個二維平面陣列。競爭層的各神經元之間相互競爭以求被激活,最終在每個時刻僅有一個神經元被激活,稱為獲勝神經元,該神經元就表示了對輸入向量的分類結果。
為了更精準地捕捉光伏發(fā)電功率在超短期時間尺度內的波動特性,本文以每個時刻為單位生成光伏數據樣本,設時刻t 對應的樣本為x(t)∈RN,并利用SOM 對其進行聚類分析??紤]實際應用中可獲取的量測數據,本文選取的x(t)包括時刻t 對應的時間戳、鄰近時刻的歷史氣象數據和歷史出力、未來輻照度預測值等。因此,如果同一天的不同時刻對應的歷史出力波動情況及未來輻照度變動趨勢差異較大,也會被SOM 劃分到不同的類別,進而采用不同的預測模型獲得其未來出力。
在此背景下,SOM 的具體訓練步驟如下。
步驟1:算法初始化。對競爭層每個神經元相關的權重向量wi∈RN(i=1,2,…,M)隨機賦初值,令迭代次數k=1,并指定最大迭代次數K。
步驟2:向量歸一化。給出一個新的輸入樣本x∈RN,并將wi和x 全部進行歸一化處理。
步驟3:尋找獲勝神經元。將競爭層中所有神經元的權重向量與輸入向量進行比較,將其中距離最小者判定為獲勝神經元,相應的權重向量記作wc。對于連續(xù)型變量而言,通常采用歐氏距離,即
式中:||·||2為L2范數。
步驟4:網絡權重調整。對于獲勝神經元鄰近區(qū)域內的神經元,按照下式更新權重,使其向x靠攏:
式 中:x(k)和分 別 為 第k 次 迭 代 時x 和wi的值;hci(k)為權函數,與迭代次數及神經元與獲勝神經元的距離有關,有
式中:α(k)為學習率;σ(k)為神經元影響半徑。這2 個參數均隨迭代次數k 的增加而遞減。
步驟5:更新輸入樣本。提供新的輸入樣本x 給SOM 網絡的輸入層,返回步驟3,直到將所有樣本全部提供給網絡。
步驟6:判斷算法是否收斂。令k=k+1,返回步驟2,直至相鄰2 次迭代的權值誤差小于允許值,或者達到預先指定的迭代次數K。
SOM 的競爭層神經元和鄰域內的神經元相連,互相激勵進行學習,故訓練后鄰近神經元具有相似的權重。因此,具有相似特征的輸入樣本映射在鄰近 的SOM 輸 出 節(jié) 點 上[21]。在 利 用SOM 對 光 伏 數據進行精細化聚類后,針對不同的類別形成各自的數據集并分別訓練預測模型,可以更好地擬合不同情況下光伏發(fā)電功率和相關因素的關系,以提高預測精度。
人工神經網絡具有較強的非線性擬合能力,是當前光伏發(fā)電功率預測研究中最常用的方法之一。但是傳統(tǒng)的單層前饋神經網絡在訓練時容易收斂到局部最優(yōu),導致預測誤差較大。因此,近年來各類深度學習算法在光伏出力預測問題中獲得了廣泛應用[9-11]。盡管深度網絡性能強大,但其結構復雜,具有大量的參數和超參數,訓練過程極為耗時。針對這一問題,文獻[12-13]提出了BLS,在保證神經網絡擬合精度的同時,顯著提高了算法的訓練速度。
BLS 是基于隨機向量函數連接神經網絡(random vector functional-link neural network,RVFLNN)[22]構建的。與直接接受輸入數據并建立增強節(jié)點的傳統(tǒng)RVFLNN 不同,BLS 首先對輸入進行特征提取以得到一組特征節(jié)點。由于稀疏特征學習計算效率高且能有效地表達數據集的特征[23],故本文采用基于最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)的稀疏學習實現BLS 特征節(jié)點的構造。
為了從給定的輸入數據中提取稀疏特征,考慮求解式(4)所示的優(yōu)化問題:
式中:X 為要進行特征提取的輸入數據;Wf為特征選擇的系數矩陣;Z 為隨機生成的特征矩陣。式(4)的第1 項用于求解線性方程XWf=Z 的最小二乘估計;第2 項為L1范數,用于對Wf施加稀疏性限制;λ為正則化參數,用于控制2 項之間的相對大小。該優(yōu)化問題即為LASSO 回歸,可以采用交替方向乘子 法(alternating direction method of multipliers,ADMM)求解[24]。
通過引入輔助變量V,式(4)等價表示為:
該優(yōu)化問題的增廣拉格朗日函數為:
式中:Λ 為該優(yōu)化問題的拉格朗日乘子?;贏DMM,可以交替更新Wf,V 和Λ 的值來求解式(5)。迭代過程如下:
式中:I 為單位矩陣;S 為軟閾值函數,其表達式見式(8)。
綜上所述,輸入因素的特征提取只需根據式(7)進行迭代計算即可。
BLS 的神經網絡結構如圖1 所示。由輸入數據進行特征提取得到的特征映射構成了特征節(jié)點(feature node),之后特征節(jié)點通過非線性變換生成了增強節(jié)點(enhancement node),特征節(jié)點和增強節(jié)點均與輸出層直接連接。BLS 是全連接神經網絡,為了簡潔表示BLS 結構,圖1 省略了每個神經元間的連接。不同于深度學習通過增加神經網絡的層數來提高擬合能力,BLS 通過特征節(jié)點和增強節(jié)點在寬度上的擴展來增強網絡性能,這種扁平化的網絡結構使其保留了RVFLNN 訓練快速的特點。
圖1 BLS 網絡結構Fig.1 Network structure of broad learning system
設圖1 中的BLS 包括Ng組特征映射(每組包含Nf個特征節(jié)點)和Ne個增強節(jié)點。輸入矩陣X 由各時刻光伏發(fā)電功率預測所需的輸入因素向量構成,設共有L 個時刻(記作t1,t2,…,tL)的樣本數據,則X=[x(t1),x(t2),…,x(tL)]T。X 首先通過特征提取得到一系列特征節(jié)點,其中第i 組特征映射由下式得到:
式中:與特征節(jié)點相關的權重矩陣Wf,i和偏置項βf,i均隨機生成,各元素的取值范圍為[-1,1];映射函數φ 由式(7)間接給出。
將這些特征映射的組合記作矩陣F=[F1,F2,…,FNg],這NgNf個特征節(jié)點根據式(10)生成BLS 的增強節(jié)點:
式中:與增強節(jié)點相關的權重矩陣We和偏置項βe也是隨機生成,各元素的取值范圍為[-1,1];ζ 為激活函數,這里選取雙曲正切函數,其表達式見式(11)。
綜上所述,BLS 的數學模型可表示為:
式中:W 表示從特征節(jié)點和增強節(jié)點連接到輸出層的權重;Y 為神經網絡的輸出,在光伏預測模型中即為預測值。由于超短期預測需要對未來4 h 內的出力進行多步長預測,因此各時刻對應的輸出數據為一向量,即Y=[y(t1),y(t2),…,y(tL)]T,其中
式中:y(t)為t 時刻的光伏發(fā)電功率;Nhor為超短期預測的步長數。為了簡化表達式,將BLS 中間層(包括特征節(jié)點和增強節(jié)點)對應的矩陣記作H=[F,E]。
在訓練過程中,隨機生成的權重Wf,i與We、偏置βf,i與βe均不再改變,故只需要求解輸出權重W即可。因此,BLS 的訓練相當于求解線性系統(tǒng)Y=HW 的最小二乘解:
式中:H?為矩陣H 的Moore-Penrose 廣義逆矩陣,也稱為偽逆(pseudoinverse)矩陣。
可見,BLS 訓練不需要基于梯度下降的學習算法,并且訓練速度較快、不易陷入局部最優(yōu)。對于光伏發(fā)電功率超短期預測而言,數據采樣間隔較小,故訓練集規(guī)模較大。此外,每個時刻對應著多種氣象條件和多點歷史出力等相關因素,且進行多步長預測還需要輸出多個數值,因此網絡輸入層和輸出層的維度都很高。在此背景下,采用單隱藏層結構、在寬度上擴展節(jié)點數目的BLS 作為預測工具,能夠較好地擬合歷史數據并保證模型計算效率。
對于光伏發(fā)電功率超短期預測,數據采樣間隔一般為1 min 或5 min,并預測未來若干小時的發(fā)電功率,因此需要進行多步長預測[25]。本文利用BLS扁平化的結構特點,構造多輸出的神經網絡。以5 min 間隔為例,預測未來4 h 內的光伏發(fā)電功率,因此構建輸出層維度為48 的BLS。
在預測模型輸入因素的選取上,本文的具體思路如下:文獻[26]提出的Hottel 模型能夠預測任意地區(qū)全年的晴天太陽輻照度,而非晴天輻照度可由天氣類型系數計算得到,預測誤差可達到5% 以內[19,27],因此本文將輻照度實測值疊加±5%的隨機誤差,假設該數值為輻照度預測值并作為模型的輸入因素之一;由于數值天氣預報的時間間隔較長且存在一定的滯后,故本文沒有將天氣預報數據作為預測模型的輸入,僅將相鄰時刻光伏站點的本地測量氣象數據作為參考。此外,光伏發(fā)電功率超短期預測通常采用若干個鄰近時刻的歷史出力作為輸入因素[28],這些歷史數據和當前時刻出力之間具有較強的相關性,可以顯著提高預測精度。綜上所述,首先,應基于氣象數據、歷史出力等構建特征向量,對各時刻進行精細化聚類;然后,將這些因素進行組合,作為光伏發(fā)電功率預測的輸入因素。
基于上述思路,本文提出基于SOM-BLS 的光伏發(fā)電功率超短期預測模型,如圖2 所示。
圖2 基于SOM-BLS 的光伏發(fā)電功率預測系統(tǒng)框架Fig.2 System framework of photovoltaic power generation forecasting based on SOM-BLS
設待預測光伏電站所能提供的氣象數據包括水平面總輻射強度(global horizontal irradiance,GHI)、水平面散射輻射強度(diffuse horizontal irradiance,DHI)、法向直射輻射強度(direct normal irradiance,DNI)、風速、氣溫,且上述氣象數據和光伏發(fā)電功率數據的采樣間隔均為τ,則光伏發(fā)電功率預測的具體流程如下。
1)利用SOM 對歷史數據進行聚類分析。對于每個時刻t,將對應的時間、鄰近Nlag個時刻的歷史出力、上一個時間點的歷史氣象數據(包括輻照度)、未來Nlead+1 個時刻的輻照度預測值作為特征向量x(t),即
式 中:nts為 時 刻t 在 當 天 的 時 間 戳;T 為 氣 溫;v 為 風速;IGH,IDH和IDN分別為GHI,DHI 和DNI 的實測值;和分 別 為GHI,DHI 和DNI 的 預 測 值;Nlag和Nlead采用交叉驗證法確定。利用歷史數據對應的x(t)對SOM 進行訓練,并輸出每個時刻所屬的類別。
2)分類訓練BLS。將數據集按SOM 給出的聚類結果進行劃分,并分別訓練BLS,利用網格搜索法確定其參數Ng,Nf和Ne的最優(yōu)取值。設訓練集中共有L 個時刻(記作t1,t2,…,tL)的樣本數據,則BLS的輸入矩陣為Xtrain=[x(t1),x(t2),…,x(tL)]T,輸出矩陣為Ytrain=[y(t1),y(t2),…,y(tL)]T。將Xtrain代入式(9)與式(10)中,可得到相應的中間層矩陣Htrain,之后通過式(14)即訓練得到BLS 輸出權重W。
3)光伏發(fā)電功率的在線預測。對于要進行預測的時間斷面,按照式(15)的格式建立相應的特征向量,并輸入SOM 以判斷其類別。之后,將該時刻的特征向量作為對應類別下BLS 的輸入,得到預測結果。設測試集中共有R 個時刻(記作tL+1,tL+2,…,tL+R)的樣本數據,則BLS 的輸入矩陣為Xtest=[x(tL+1),x(tL+2),…,x(tL+R)]T,輸出矩陣為Y?test=[ y?(tL+1),y?(tL+2),…,y?(tL+R)]T,其 中y?(t)為 在t 時刻對未來Nhor個步長的發(fā)電功率的預測值所構成的向量,即
式中:y?(t)為t 時刻的光伏發(fā)電功率預測值。
BLS 的訓練流程如圖3 所示,本文采用標準化均方根誤差(normalized root-mean-square error,nRMSE)對預測誤差進行評價分析,其表達式為:
式中:Ns為樣本總數;Pcap為光伏發(fā)電系統(tǒng)裝機容量;yi為實測值為預測值。為體現預測步長對預測誤差的影響,本文對不同的預測時間尺度分別計算nRMSE。
圖3 BLS 訓練流程圖Fig.3 Flow chart of training for broad learning system
為了驗證本文提出的基于SOM-BLS 的光伏發(fā)電功率超短期預測模型的性能,采用美國俄勒岡州阿 什 蘭(Ashland)[29]和 澳 大 利 亞 艾 利 斯 斯 普 林 斯(Alice Springs)[30]的2 處光伏電站數據進行算例分析,并將這2 組數據集分別簡稱為算例1 和算例2。2 組算例的光伏信息、數據格式與預測模型輸入輸出選取如附錄A 表A1 所示,其中輸入因素的輻照度預測值點數與歷史發(fā)電功率點數均采用5 折交叉驗證確定。對于數據集中的異常值和缺失值,利用該采樣點前3 個時刻的平均值替代[31]。考慮到光伏出力的間歇性,截取白天時段后算例1 保留05:20—19:15 的數據,即每日有168 個數據點,時間戳取值范圍為0~167;算例2 保留07:15—18:25 的數據,即每日有135 個數據點,時間戳取值范圍為0~134。收集算例1 在2017—2019 年每年6—8 月的氣象數據和光伏出力數據作為數據集,其中2019 年8 月的數據作為測試集(共5 208 個樣本),其余8 個月數據作為訓練集和驗證集(共41 160 個樣本);收集算例2 在2016—2018 年每年6—8 月的氣象數據和光伏出力數據作為數據集,其中2018 年8 月的數據作為測試集(共4 185 個樣本),其余8 個月數據作為訓練集和驗證集(共33 075 個樣本)。進行預測前,對預測模型輸入因素和輸出變量均進行歸一化處理。
本文采用MATLAB R2018a 編程實現基于SOM-BLS 的光伏發(fā)電功率超短期預測模型,計算環(huán)境為2.21 GHz 主頻英特爾酷睿i7-8750H 處理器、8.00 GB 內存的計算機。
對于算例1,根據式(15)生成特征向量,并將其作為SOM 的輸入,對數據集進行聚類分析。經過交叉驗證,式中Nlag=18,Nlead=47,即SOM 輸入層節(jié)點個數為N=168,即與每個時刻相關聯(lián)的輸入因素(時間戳、歷史出力、歷史氣象數據和輻照度預測值)共168 個。同理可以列出算例2 的特征向量表達式,相應的Nlag=15,Nlead=47,即SOM 輸入層節(jié)點個數為N=117。
當SOM 競爭層節(jié)點個數選取為M=4×3 時,可對數據集充分進行分類且保證每一類都有足夠樣本。SOM 的聚類結果可由競爭層的拓撲結構直接得到,聚類后的樣本分布如附錄B 圖B1 所示。為反映聚類結果的物理意義,在二維坐標系中繪制各時刻的發(fā)電功率-時間散點圖,以算例1 在2018 年7 月的數據為例,結果如附錄B 圖B2 所示??梢?SOM聚類能夠將時刻、出力水平相近的樣本劃分在同一類中,進而提升BLS 的擬合效果、減小預測誤差。
為了定量驗證SOM 聚類對于預測精度的影響,將未進行聚類的數據作為BLS 的輸入,對未來4 h 內以5 min 為步長的48 個時刻進行發(fā)電功率預測,并與SOM-BLS 預測模型進行對比。不論是否進行聚類,均采用交叉驗證方法確定BLS 的參數。未聚類時,算例1 中BLS 的最優(yōu)參數為:Ng=44,Nf=11,Ne=174;算例2 中BLS 的最優(yōu)參數為:Ng=12,Nf=10,Ne=264。進行聚類后,2 組算例各自的12 組BLS 最優(yōu)參數如附錄A 表A2、表A3 所示。算例1 聚類前后各時間尺度下的預測誤差nRMSE 見表1(預測結果為48 個點,這里只列出了具有代表性的幾個時間尺度),算例2 相應的實驗結果如附錄A 表A4 所示。
表1 算例1 聚類前后預測誤差nRMSE 比較Table 1 Comparison of nRMSE in case 1 before and after clustering
此外,還可以將預測值和實際值繪制在同一坐標圖中,以更直觀地對比聚類前后的預測效果。本文針對單個時間斷面,對未來4 h 的出力進行多步長預測。以每日的08:00 和12:00 為例,聚類前后的預測結果見附錄B 圖B3 至圖B6。此外,現有文獻在進行光伏發(fā)電功率超短期預測時,一般以日為單位,對每個時刻進行相同時間尺度的預測,滾動預測后得到該日的出力曲線。為方便與現有工作進行對比,聚類后的滾動預測結果(選取1 h,2 h,3 h 和4 h這4 種時間尺度)分別如附錄C 圖C1 至圖C4 所示。從上述實驗結果可以看出,利用SOM 對數據集進行聚類、分類訓練模型,可在一定程度上提升各時間尺度下光伏發(fā)電功率的預測精度。
為了驗證BLS 在光伏發(fā)電功率超短期預測上的優(yōu)越性,選擇BPNN,ELM 和LSTM 神經網絡3 種方法進行對比。各模型均在SOM 聚類的基礎上進行預測,其中BPNN 和ELM 的參數設置分別如附錄A 表A5 和表A6 所示。LSTM 的超參數數目較多,故對于不同類別均設置相同的參數,其中算例1:LSTM 層具有260 個隱藏節(jié)點,全連接層具有160 個節(jié)點;算例2:LSTM 層具有200 個隱藏節(jié)點,全連接層具有135 個節(jié)點。訓練LSTM 時設置學習率為0.01,批尺寸為20。
上述3 種方法和本文提出的SOM-BLS 模型的預測誤差對比如表2 和表3 所示,訓練時長(包括SOM 神經網絡的訓練耗時)對比如表4 所示。此外,選 取 算 例1 中8 月2 日 和8 月9 日、算 例2 中8 月7日和8 月30 日繪制預測出力曲線,預測結果與實際值對比如圖4、圖5 及附錄C 圖C5、圖C6 所示。
表2 算例1 各模型預測誤差nRMSE 比較Table 2 Comparison of nRMSE in case 1 among different models
表3 算例2 各模型預測誤差nRMSE 比較Table 3 Comparison of nRMSE in case 2 among different models
表4 各模型訓練時間比較Table 4 Comparison of training time among different models
圖4 算例1 各模型預測結果對比(8 月2 日)Fig.4 Comparison of forecasting results in case 1 among different models on August 2
由表2 與表3 可見,在不同時間尺度下BLS 的預測誤差均最小。4 種方法中,BPNN 的誤差最大,且預測精度隨步長的增加顯著降低,說明當輸入、輸出維度較高時,該神經網絡的擬合性能不足。LSTM 作為深度神經網絡,其預測誤差較BPNN 顯著改善,但仍存在著步長較大時預測精度不足的問題。ELM 與BLS 的結構類似,故兩者預測誤差隨步長的變化趨勢相似;BLS 對輸入數據進行了特征提取,能夠更準確地擬合高維變量間的關系,故其預測誤差在各時間尺度下均小于ELM。
圖5 算例1 各模型預測結果對比(8 月9 日)Fig.5 Comparison of forecasting results in case 1 among different models on August 9
從圖4、圖5 及附錄C 圖C5、圖C6 可以看出,針對不同的光伏電站和天氣類型進行預測時,BLS 的預測結果均能較好地跟蹤未來4 h 內光伏發(fā)電功率的波動趨勢。具體來說,4 種對比方法在預測晴天時誤差較小,但在預測12:00—14:00 的出力時,BPNN 和ELM 在 算 例1 上、BPNN 和LSTM 在 算 例2 上的誤差隨著步長的增加顯著增大;在預測陰雨天時,BPNN 的誤差很大,不具有參考價值,而LSTM 與ELM 雖能在一定程度上跟蹤光伏的出力波動,但是大部分時間尺度下的預測誤差均大于BLS。
在訓練時長上,ELM 和BLS 的訓練均是基于偽逆運算、不需要迭代求解,故計算效率很高,可以適應超短期預測在線更新模型參數的要求。而BPNN 在處理高維度、大規(guī)模的數據時會面臨“維數災”問題[32],導致神經網絡的擬合精度和訓練速度顯著下降;而LSTM 作為深度學習算法,在訓練時要確定大量的網絡參數[33],因此這2 種方法的訓練過程極為耗時,當數據集更新時難以及時對模型進行重新訓練。
基于上述討論,本文提出的SOM-BLS 模型在光伏發(fā)電功率超短期預測中體現出較高的預測精度與計算效率。
本文提出了一種基于BLS 的光伏發(fā)電功率超短期預測模型。首先,基于各時刻的氣象條件、歷史出力等數據構成特征向量,采用SOM 神經網絡進行聚類分析;然后,按照聚類結果劃分數據集并分別訓練BLS,對發(fā)電功率進行多步長預測;最后,采用光伏電站的實際運行數據進行測試,得出以下結論。
1)基于SOM 神經網絡的精細化聚類能夠捕捉光伏發(fā)電在不同時刻的出力水平和波動特征,在相同條件下較未進行聚類分析的方法能夠有效提升預測精度。
2)在進行多步長預測時,BLS 具有較高的預測精度,能夠在不同時段和天氣類型下較好地跟蹤光伏發(fā)電功率的變化趨勢。
3)BLS 具有較高的計算效率,在超短期預測這一應用場景下,相比于LSTM 等深度學習算法,具有能夠在線更新參數的優(yōu)勢。
下一步工作將考慮光伏發(fā)電的時空相關性以進一步提高預測精度,并利用BLS 的結構特點開展概率預測,更準確地刻畫光伏發(fā)電的不確定性。
本文得到華東電網科技項目“大電網源網荷儲泛在調度的市場機制及商業(yè)模式研究”的資助,特此感謝!
附錄見本刊網絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網絡全文。