許可,王玨,姚鐵錘,李凱
1.中國科學院計算機網(wǎng)絡(luò)信息中心,北京 100190
2.中國科學院大學,北京 100049
近年來,隨著科學技術(shù)的不斷發(fā)展,太陽能發(fā)電的綜合利用已經(jīng)成為新興產(chǎn)業(yè)[1]。隨著光伏電站裝機容量的增長,光伏發(fā)電的不確定性為電網(wǎng)新能源消納帶來了挑戰(zhàn)[2]。準確的預測光伏發(fā)電功率可以降低電力系統(tǒng)的運行成本,保證電網(wǎng)的電能質(zhì)量,促進大規(guī)模的光伏并網(wǎng)發(fā)展[3]。
光伏發(fā)電是一個連續(xù)不斷的過程,光伏發(fā)電數(shù)據(jù)作為一個典型的時間序列,不僅是非線性的,而且具有時間相關(guān)性[4-5],光伏發(fā)電功率每時刻的變化取決于當前時刻和過去時刻的氣象特征[6]。針對時間相關(guān)性的研究,黃磊等人[7]利用支持向量回歸對不同時間尺度的光伏功率序列進行分析,基于多維時間序列特征建立了光伏功率預測模型。模型在一定程度上提升了預測精度,但在功率變化強烈的情況下模型表現(xiàn)不佳。趙濱濱等[8]建立了基于差分整合移動平均自回歸模型對功率序列進行時間相關(guān)性分析,采用二階差分對輸出功率的樣本值進行預處理,計算輸出功率樣本值的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)。研究結(jié)果表明每時刻的功率與前六個時刻的特征均相關(guān),與前一時刻的特征具有高度相關(guān)性。江雪辰等人[9]研究出了一種基于時間管理序列的光伏發(fā)電功率模擬方法,文章所述方法極大地保留了時序特征的自相關(guān)性,并且在概率和數(shù)據(jù)統(tǒng)計特性上預測效果更優(yōu)。
本文提出了基于分時長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)的光伏發(fā)電功率預測模型。首先利用Pearson 相關(guān)系數(shù)計算總輻照度、環(huán)境溫度、環(huán)境濕度、風速等氣象特征與光伏發(fā)電功率之間的相關(guān)性,選擇與光伏發(fā)電功率相關(guān)度較高的歷史氣象特征輸入到光伏發(fā)電功率預測模型中。接著從時間維度研究各個氣象特征歷史時刻與當前時刻功率之間的時間相關(guān)性。然后構(gòu)建分時LSTM光伏發(fā)電功率預測模型。當使用傳統(tǒng)LSTM 模型輸入全部歷史特征時往往會影響模型的復雜度而出現(xiàn)較大的誤差[10],且光伏數(shù)據(jù)本身存在時間不對齊等特點,因此從時間維度對氣象特征進行分析有助于提升光伏發(fā)電功率預測精度。針對真實光伏電站進行案例分析驗證所述方法的有效性。
本文利用Pearson 相關(guān)系數(shù)對光伏發(fā)電功率的時序特征以及氣象特征進行研究,量化氣象特征對光伏發(fā)電功率的影響權(quán)重,選擇與光伏發(fā)電功率相關(guān)度較高的歷史氣象特征作為光伏發(fā)電功率預測模型的輸入。Pearson 相關(guān)系數(shù)[11]的公式如下所示。
以某真實光伏電站為案例,提取光伏電站的場站實測氣象數(shù)據(jù)、數(shù)值天氣預報數(shù)據(jù)以及歷史光伏發(fā)電功率構(gòu)建數(shù)據(jù)集。數(shù)據(jù)集中包含2018年7月1日至2019年6月13日共348 天逐15 分鐘數(shù)據(jù),其中每個時刻點數(shù)據(jù)包含場站實測氣象數(shù)據(jù)中的實測總輻照度、實測直射輻照度、實測散射輻照度、實測環(huán)境溫度、實測氣壓、實測風向、實測風速,數(shù)值天氣預報中的預測時間、預測總輻照度、預測直射輻照度、預測散射輻照度、預測總云量、預測低云量、預測地面百葉箱氣溫、預測地面百葉箱相對濕度、預測地面10 米風速、預測地面10 米風向、預測空氣質(zhì)量、預測地面氣壓、預測逐15 分鐘降水以及光伏電站功率值。
將數(shù)據(jù)集中氣象特征與歷史光伏發(fā)電功率輸入到公式(1)中,計算得到每個氣象特征與光伏發(fā)電的相關(guān)性,結(jié)果如表1 所示。
表1 氣象特征與光伏發(fā)電功率的相關(guān)性Table 1 Correlation between meteorological factors and photovoltaic power
由表1 可知,光伏電站數(shù)據(jù)集中的預測總輻照度、預測直射輻照度、預測散射輻照度和實測總輻照度、實測直射輻照度、實測散射輻照度與功率呈正相關(guān),具有強相關(guān)性。預測地面百葉箱氣溫、預測地面10 米風速、實測環(huán)境溫度、實測風速與功率呈正相關(guān),具有中等相關(guān)性。預測地面百葉箱相對濕度與功率呈負相關(guān),具有中等相關(guān)性。預測總云量、預測低云量、預測地面10 米風向、預測地面氣壓、預測逐15 分鐘降水、實測風向與功率呈負相關(guān),具有弱相關(guān)性。預測氣壓與功率呈正相關(guān),具有弱相關(guān)性。將中等相關(guān)程度以上的氣象特征輸入到光伏發(fā)電功率預測模型。
時間相關(guān)性是指同一時序特征在不同時刻的相關(guān)程度[12], 光伏發(fā)電功率不僅與歷史時刻自身功率序列密切相關(guān),還與不同時刻的總輻照度、散射輻照度、環(huán)境溫度等氣象特征密切相關(guān)。利用如下公式計算不同時刻氣象特征與功率之間的相關(guān)系數(shù),研究氣象特征與光伏功率的時間相關(guān)性。
將不同時刻氣象特征如預測總輻照度等代入到公式(2)中,計算不同時刻氣象特征與當前時刻發(fā)電功率之間的時間相關(guān)性。選擇與光伏發(fā)電功率相關(guān)度較高的歷史氣象特征輸入到光伏發(fā)電功率預測模型中,其相關(guān)性熱力圖結(jié)果如下圖1 所示。
圖1 功率與氣象特征時間相關(guān)性熱力圖Fig.1 Time correlation thermal map between power and meteorological factors
如圖所示,不同氣象特征在每時刻對功率的影響程度不同,實測氣象特征與功率間的時間相關(guān)性大于預測氣象特征的相關(guān)性,其中功率與歷史時刻功率的相關(guān)性最強,輻照度等與功率間相關(guān)性次之,環(huán)境溫度等與功率間相關(guān)性最低,這與表1 結(jié)果相符。
此外,不同時刻的光伏發(fā)電功率與歷史時刻的氣象特征時間相關(guān)性不同,每時刻的功率至少與前兩個時刻的氣象特征具有強關(guān)聯(lián)。隨著時間尺度的增加,氣象特征與功率間的時間相關(guān)性降低。因此針對不同時刻的預測功率,光伏發(fā)電功率預測模型根據(jù)時間相關(guān)性強度確定歷史時長的輸入。
LSTM 主要用于處理時序數(shù)據(jù)[13]。當前時刻信息輸入到LSTM 網(wǎng)絡(luò)中時,記憶單元中的輸入門用于控制信息輸入,遺忘門用于更新單元歷史狀態(tài),輸出門用于控制信息的輸出。圖2 展示了LSTM 單元結(jié)構(gòu)。
圖2 LSTM 單元結(jié)構(gòu)Fig.2 LSTM cell construction
在此基礎(chǔ)上,本文建立了基于分時LSTM 的光伏發(fā)電功率預測模型,其步驟如下:
(1)讀入光伏電站數(shù)據(jù)集,選擇每天5:15-19:30逐15 分鐘有光伏發(fā)電功率的時刻構(gòu)成時間序列數(shù)據(jù)。
(2)將氣象特征與光伏發(fā)電功率輸入到公式(1)中計算相關(guān)系數(shù),選取中等相關(guān)程度以上的氣象特征作為強相關(guān)的氣象特征。
(3)利用公式(2)計算每個強相關(guān)的氣象特征與光伏發(fā)電功率間的時間相關(guān)性,選擇強相關(guān)時刻的氣象特征作為每時刻功率預測模型的輸入。
(4)將選取的氣象特征及功率序列按照如下公式進行歸一化。
(5)利用LSTM 提取訓練集中的輸入時間序列與輸出功率之間的非線性關(guān)系,建立光伏功率預測模型。
(6)將模型輸出的預測功率進行反歸一化。
(7)利用訓練好的基于分時LSTM 的光伏發(fā)電功率預測模型對未來時刻的光伏發(fā)電功率進行預測。
圖3 基于分時LSTM 的光伏發(fā)電預測功率Fig.3 Photovoltaic power forecasting model based on timedivision LSTM
基于分時LSTM 的光伏功率預測模型采用雙層LSTM 模型逐點預測光伏功率。模型隱含層抽象為特征提取部分和特征回歸部分,其中特征提取部分由LSTM 深度學習方法完成,特征回歸部分由全連接層完成[17]。模型輸入數(shù)據(jù)首先經(jīng)過雙層LSTM 網(wǎng)絡(luò),動態(tài)捕捉輸入數(shù)據(jù)的時序特征,然后送入帶有RuLU激活函數(shù)的全連接層,動態(tài)輸出光伏發(fā)電預測功率。
本文所有數(shù)據(jù)均來源于某地區(qū)真實光伏電站,已在1.1 節(jié)中詳細介紹?;赥ensorflow[16]實現(xiàn)本文提出的光伏發(fā)電功率預測模型。利用均方根誤差(RMSE)和平均絕對誤差(MAE)[14]評估模型輸出預測功率與真實功率之間的誤差。RMSE 可以衡量預測值與期望值之間的離散程度,MAE 用來反映預測誤差的絕對值。式中為測試集中的樣本數(shù),和分別為功率的實際值和預測值。
分別采用本文提出的分時LSTM 模型和傳統(tǒng)LSTM 模型[18]對光伏發(fā)電功率進行預測,驗證本文所述方法的可行性。分時LSTM 模型的輸入為高度相關(guān)的特征及歷史時刻,傳統(tǒng)LSTM 模型的輸入為歷史一天的全部氣象特征。光伏發(fā)電在不同的天氣類型下具有不同的曲線特征,因此分別選取晴天和陰雨天兩種天氣類型對分時LSTM 模型和LSTM 模型進行對比實驗。圖4 為預測功率與實際發(fā)電功率在不同天氣類型下的對比圖。
圖4 光伏發(fā)電功率預測曲線Fig.4 Photovoltaic power forecasting curve
由圖4 和表2 可知,在晴天和陰雨天兩種天氣類型下,分時LSTM 模型的預測結(jié)果均優(yōu)于傳統(tǒng)LSTM 模型,預測功率與真實功率之間的RMSE 和MAE 誤差更小。晴天時,分時LSTM和傳統(tǒng)LSTM 模型的預測精度較高,兩模型間的誤差較小。陰雨天的預測精度低于晴天的預測精度,這是因為晴天時光伏發(fā)電功率曲線較平滑,更易于準確預測。陰雨天時功率波動性較大,模型很難動態(tài)感知功率曲線的變化。
表2 光伏發(fā)電功率預測結(jié)果對比Table 2 Comparison of photovoltaic power forecasting results
從預測曲線來看,傳統(tǒng)LSTM 模型對光伏功率的起止點預測效果有待提升,陰雨天時傳統(tǒng)LSTM 模型可以預測出光伏功率的大致趨勢,預測曲線較平滑且波動性不強,而在實際光伏發(fā)電中,光伏發(fā)電功率受到各種自然因素的影響而呈現(xiàn)較強的波動性。分時LSTM 模型針對高度相關(guān)的氣象特征及歷史時刻進行建模,減少了模型的復雜度。與傳統(tǒng)LSTM 模型相比,分時LSTM模型預測誤差RMSE 降低36.2%,MAE 降低39.4%,說明分時LSTM 模型應用于光伏發(fā)電功率預測的可行性和高效性。
本文結(jié)合實際問題從時間維度研究氣象特征對光伏發(fā)電的影響,提出了一種基于分時LSTM 的光伏發(fā)電功率預測模型。針對不同時刻的預測功率,光伏發(fā)電功率預測模型根據(jù)時間相關(guān)性強度確定輸入的歷史時長,減少了模型的復雜度,解決了光伏數(shù)據(jù)時間不對齊和預測精度低的問題。算例分析結(jié)果表明,本文所述模型較傳統(tǒng)LSTM 模型相比具有更高的精度,說明基于分時LSTM 的光伏發(fā)電功率預測模型可以滿足光伏發(fā)電實時調(diào)度需求。研究光伏發(fā)電的時間相關(guān)特性對準確預測光伏發(fā)電功率具有重要的意義。
利益沖突聲明
所有作者聲明不存在利益沖突關(guān)系。