李智, 丁津津, 陳凡, 伍駿杰, 樊磊
(1.國網(wǎng)安徽省電力有限公司, 合肥 230601; 2.國網(wǎng)安徽省電力有限公司電力科學(xué)研究院, 合肥 230601;3.安徽大學(xué)電氣工程及自動化學(xué)院, 合肥 230601)
在碳中和的目標(biāo)背景下,中國能源結(jié)構(gòu)需加快轉(zhuǎn)型速度。隨著碳中和的目標(biāo)提出,新能源發(fā)電逐步替代一部分火力發(fā)電[1]。中國的光伏發(fā)電產(chǎn)業(yè)處于高速發(fā)展階段,截至2022年底,并網(wǎng)太陽能發(fā)電裝機容量305.98 GW。隨著光伏裝機比例不斷增高,棄光現(xiàn)象也不斷發(fā)生,光伏發(fā)電消納顯得尤為重要[2]。精確地光伏功率預(yù)測在電力系統(tǒng)調(diào)度發(fā)揮著至關(guān)重要的作用,如何提高預(yù)測功率精度,是光伏發(fā)電預(yù)測的一大難題。
目前,工程中的光伏功率預(yù)測方法分為物理方法、統(tǒng)計方法和基于數(shù)據(jù)驅(qū)動算法[3-5]。其中,基于數(shù)據(jù)驅(qū)動算法的光伏功率預(yù)測是主要方法。這類方法具有建模簡單、算法成熟、計算速度快等優(yōu)點[6]。隨著人工智能的快速發(fā)展,數(shù)據(jù)驅(qū)動方法在光伏發(fā)電預(yù)測中得到普遍應(yīng)用。文獻[7]針對各天氣分型下的波動過程和類晴空過程,建立卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)的組合預(yù)測模型,兼顧了CNN和LSTM網(wǎng)絡(luò)模型優(yōu)點,預(yù)測效果較好。文獻[8]采用變分模態(tài)分解將歷史光伏發(fā)電功率分解成多個子模態(tài),用LSTM分別預(yù)測光伏發(fā)電功率和誤差。然而,數(shù)據(jù)驅(qū)動的預(yù)測技術(shù)完全脫離了光伏發(fā)電的內(nèi)部機理,忽略了輸入與輸出之間的自然聯(lián)系,其預(yù)測結(jié)果的可靠性受到質(zhì)疑。
氣象條件是影響光伏發(fā)電量必不可少的因素。由于光伏電站的發(fā)電依賴于不確定的、間歇性的太陽輻射,因此太陽能的獲取和分配十分困難[9]。文獻[10]以溫度、輻照度等氣象數(shù)據(jù)和相似日功率數(shù)據(jù)為輸入變量,采用動量法優(yōu)化反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)預(yù)測光伏功率。通常,光伏發(fā)電機理模型是時間、地點、光伏技術(shù)和當(dāng)?shù)貧庀髼l件的函數(shù)。文獻[11]為探索太陽能與氣象條件之間的物理關(guān)系,提出解析建模方法。文獻[12]提出了一種能夠適應(yīng)天氣變化的光伏組件溫度預(yù)測模型。光伏組件的工作溫度對光伏出力影響較大,環(huán)境溫度、輻照度、風(fēng)速作為模型的輸入變量。
數(shù)據(jù)驅(qū)動模型一般依靠增加訓(xùn)練樣本的數(shù)量來降低泛化的風(fēng)險。在訓(xùn)練樣本方面,獲取全面、合格的新能源發(fā)電系統(tǒng)數(shù)據(jù)往往成本高昂,這缺乏適用性。在有限的樣本下,要求數(shù)據(jù)驅(qū)動模型能在一定泛化誤差下保證全局最優(yōu)性,這對當(dāng)前數(shù)據(jù)驅(qū)動模型提出了挑戰(zhàn)[13]?;跈C理模型和數(shù)據(jù)驅(qū)動聯(lián)合的預(yù)測方法可以有效降低對樣本數(shù)據(jù)的依賴。在數(shù)據(jù)質(zhì)量和數(shù)量不理想的情況下,兼顧預(yù)測的準(zhǔn)確性、速度和可靠性,具有較強的實用價值和廣闊的應(yīng)用前景。因此,通過引入基于領(lǐng)域知識經(jīng)驗,形成機理和數(shù)據(jù)聯(lián)合的預(yù)測模型,可以降低機器學(xué)習(xí)的泛化風(fēng)險[14]。目前,在溫度預(yù)測[15]和意圖識別[16]等領(lǐng)域已有機制和數(shù)據(jù)融合學(xué)習(xí)的探索性研究,并取得了一定的成果。光伏發(fā)電領(lǐng)域內(nèi),文獻[17]在機理模型中對氣象數(shù)據(jù)進行偏移修正,數(shù)據(jù)驅(qū)動模型中引入注意力機制削弱氣象數(shù)據(jù)偏移的影響,再通過Stacking框架進行融合,實現(xiàn)了預(yù)測精度的提升。
基于以上條件,現(xiàn)提出一種Stacking模型框架下的機理模型與數(shù)據(jù)驅(qū)動模型的組合預(yù)測方法。Stacking框架可以將這兩類模型結(jié)合起來使其可以并行計算預(yù)測。通過Stacking框架融合機理驅(qū)動模型和數(shù)據(jù)驅(qū)動模型的優(yōu)點,進一步提高模型的泛化性能和預(yù)測精度。
光伏發(fā)電的機理模型是根據(jù)太陽輻射和光電轉(zhuǎn)換特性來預(yù)測發(fā)電量。光伏發(fā)電的機理特性模型[18]為
(1)
式(1)中:Pc為計算的光伏功率值;c∈[0,1]為光伏板的污垢系數(shù),光伏板表明越潔凈,c值越趨近1;T0、P0和E0分別為標(biāo)準(zhǔn)天氣條件下的基準(zhǔn)溫度(25 ℃)、基準(zhǔn)功率和基準(zhǔn)輻照度(1 000 W/m2);γ為光伏系統(tǒng)的溫度系數(shù);直射輻照度Ei和光伏電池溫度Ti為兩種主要天氣輸入。
光伏電池溫度可以根據(jù)周圍環(huán)境溫度的熱傳遞[19]得到,公式為
(2)
式(2)中:cTE為光伏系統(tǒng)吸收效率的常數(shù)因子;cW0=25 W/(m2·K)和cW1=6.84 (W/m3·s·K)分別為恒定的傳熱因子和對流換熱因子;TA為環(huán)境溫度;VW為風(fēng)速。
本文中集成了LSTM、XGBoost和光伏機理模型來構(gòu)建Stacking框架[20]來預(yù)測光伏功率。Stacking模型適合于數(shù)據(jù)量大且特征維度多的數(shù)據(jù)集,是優(yōu)異的光伏預(yù)測模型,其中第一層對多個模型的輸出結(jié)果進行泛化,提高整體預(yù)測精度。Stacking結(jié)構(gòu)如圖1所示。
圖1 Stacking集成框架Fig.1 The Stacking integration framework
圖2 一層學(xué)習(xí)器訓(xùn)練過程Fig.2 Training process of first-layer
Stacking一層基模型之間要求各個模型體現(xiàn)出差異化,且基模型效果越好,集成后的模型預(yù)測效果越精準(zhǔn)。綜合以上,考慮了3種不同類型的模型,分別為LSTM神經(jīng)網(wǎng)絡(luò)、XGBoost和光伏機理模型。LSTM適用于較長的時間序列,可以較好地分析時許數(shù)據(jù)間的規(guī)律,XGBoost適用于表格數(shù)據(jù),滿足光伏數(shù)據(jù)特征多的特點,同時具備LSTM沒有的并行學(xué)習(xí)的能力,機理模型考慮光伏發(fā)電內(nèi)部機理,降低對數(shù)據(jù)樣本的過分依賴,并對數(shù)據(jù)結(jié)果進行合理約束。
由于二層學(xué)習(xí)器包含一層學(xué)習(xí)器抽取的新特征,為避免發(fā)生過擬合,二層學(xué)習(xí)器選擇簡單的線性回歸模型(linear regression, LR)。
本項研究的實現(xiàn)流程包括天氣歸類、數(shù)據(jù)劃分和預(yù)測,短期光伏功率預(yù)測流程圖如圖3所示。
圖3 光伏功率預(yù)測流程圖Fig.3 The flowchart of photovoltaic power prediction
(1)讀取初始數(shù)據(jù)集,選取與光伏功率強相關(guān)特征值,剔除其中的異常值點集。隨后將數(shù)據(jù)歸一化處理,構(gòu)成目標(biāo)數(shù)據(jù)集。
(2)基于表1中的數(shù)值天氣預(yù)報(numerical weather prediction,NWP)數(shù)值,將天氣類型歸為晴天、多云和雨天。
表1 天氣分類規(guī)則
(3)依據(jù)待測天氣類型,將對應(yīng)氣象下的數(shù)據(jù)集輸入Stacking集成框架進行預(yù)測。
通過數(shù)據(jù)能夠直觀反映模型的性能。采用平均絕對百分比誤差(mean absolute percentage error,MAPE),均方根誤差(root mean squared error,RMSE)和模型擬合系數(shù)(R2)來評價。其中,MAE值,MAPE
越小和RMSE值越小,表示模型越完美,得到的預(yù)測值更趨近真實值;R2越趨近1,表示預(yù)測結(jié)果的擬合度越趨近真實值。公式定義為
(3)
(4)
(5)
式中:yi為光伏實際發(fā)電量;y′i為光伏發(fā)電預(yù)測量;n為測試樣本點。
本項實驗中利用安徽省某市光伏系統(tǒng)的氣象和光伏發(fā)電量數(shù)據(jù)進行驗證。實驗樣本集截取自2021整年,以天為單位,采集時間段為6:30—18:00,采集周期為15 min,其中包括輻照度、風(fēng)速和溫度等特征。
挑選3種典型天氣條件下的光伏發(fā)電功率曲線對比如圖4所示。曲線整體呈現(xiàn)峰狀,表明光伏發(fā)電功率與當(dāng)日太陽輻射量相關(guān)。晴天條件下,光伏功率曲線平滑,同時由于太陽輻射最強,發(fā)電量最多。多云天氣下,由于云層遮蔽,影響光伏場站吸收太陽輻射,光伏發(fā)電量有所下降且具有一定波動,但由于光伏場站所在地理位置太陽輻射強,仍有較好的發(fā)電量。雨天條件下,光伏發(fā)電量較低,且波動性較強。
圖4 典型天氣下的光伏功率曲線Fig.4 Photovoltaic power curve in typical weather
將分類后的樣本集輸入Stacking集成框架進行預(yù)測,同時將LSTM、XGBoost和機理模型作為對比,3種天氣下的預(yù)測結(jié)果對比如圖5~圖7所示。表2為預(yù)測指標(biāo)對比。
表2 不同模型的預(yù)測評價指標(biāo)
圖5 晴天條件預(yù)測效果對比Fig.5 Comparison of prediction of sunny conditions
圖5為晴天條件下的預(yù)測結(jié)果,其曲線波動平穩(wěn),各模型均有良好的預(yù)測效果,其中Stacking的預(yù)測曲線偏差值最小。其RMSE相對于LSTM、XGBoost和機理模型降低了2.0、4.3和4.8,MAPE值分別減小了1.1、2.1和2.3。
圖6為多云條件下的預(yù)測結(jié)果,光伏曲線整體仍呈現(xiàn)峰狀,部分時段呈現(xiàn)鋸齒狀,幅值相比晴天條件下有所降低。結(jié)合表,Stacking算法仍有最好的預(yù)測表現(xiàn)。其RMSE值相對于LSTM、XGBoost和機理模型降低了9.0、12.1和21.9,MAPE分別減小了5.6、8.2和14.4。
圖6 多云條件預(yù)測效果對比Fig.6 Comparison of prediction of cloudy conditions
圖7為雨天條件下的預(yù)測結(jié)果,其曲線波動較強,發(fā)電功率與輻射相對較少?;赟tacking的預(yù)測結(jié)果更趨近于真實值,而其余3種方法的預(yù)測結(jié)果偏差較大。其RMSE值相對于LSTM、XGBoost和機理模型降低了14.6、16.6和63.4,MAPE分別減小了9.34、18.7和70.1。證明了機理模型與數(shù)據(jù)驅(qū)動算法能有效提升雨天模型的預(yù)測精度。
圖7 雨天條件預(yù)測效果對比Fig.7 Comparison of prediction of rainy conditions
為獲取理想且可靠的光伏發(fā)電預(yù)測結(jié)果,考慮到光伏系統(tǒng)輸入與輸出間的自然聯(lián)系,將機理模型與數(shù)據(jù)驅(qū)動模型進行結(jié)合。通過將機理模型嵌入Stacking框架,實現(xiàn)規(guī)則與經(jīng)驗的有機融合,可以更好地綜合兩種模型的優(yōu)點。
通過安徽省某地區(qū)光伏數(shù)據(jù)作為實際案例進行計算,仿真結(jié)果證明,本文中設(shè)計模型有較好的預(yù)測效果。后續(xù)工作將采用更少的數(shù)據(jù)樣本和更簡化的機理模型,減小對數(shù)據(jù)樣本質(zhì)量和數(shù)量的依賴度以及建模復(fù)雜度,保證良好的預(yù)測精度和效率,并有效提升預(yù)測結(jié)果的可靠性。