收稿日期:2022-08-26
基金項目:2020年度南寧市創(chuàng)新創(chuàng)業(yè)領軍人才(團隊)“邕江計劃”項目(2020006);廣西重點研發(fā)計劃(AB23026037)
通信作者:覃團發(fā)(1966—),男,博士、教授、博士生導師,主要從事智能電網(wǎng)信息工程方面的研究。tfqin@gxu.edu.cn
DOI:10.19912/j.0254-0096.tynxb.2022-1294 文章編號:0254-0096(2023)12-0170-05
摘 要:針對地表太陽輻射的不確定性和隨機波動性,進而對大型光伏發(fā)電并網(wǎng)對電力系統(tǒng)的穩(wěn)定性造成沖擊,提出一種新的太陽輻照度超短期預測方案。該方案通過使用皮爾遜相關性分析和無監(jiān)督學習中的Kmeans++算法,對多種氣象數(shù)據(jù)進行篩選,找出關鍵氣象數(shù)據(jù)并進行劃分以及添加標簽,接著將帶有標簽的關鍵氣象數(shù)據(jù)輸入雙向長短期記憶網(wǎng)絡預測模型中,以達到10 min時間間隔的太陽輻照度超短期預測。結果表明所提預測模型相較于目前常用的模型提高了預測精度。
關鍵詞:太陽輻射;預測;聚類分析;超短期;雙向長短期記憶網(wǎng)絡
中圖分類號:TM615"""""""""""""""" " """""""文獻標志碼:A
0 引 言
近年來,在強勁的清潔能源市場增長的推動下,光伏發(fā)電得到了迅速發(fā)展,但電網(wǎng)面臨的光伏發(fā)電風險也越來越高。為提高電網(wǎng)的穩(wěn)定性,需準確的太陽能預測光伏發(fā)電的波動情況[1]。而光伏發(fā)電的輸出可根據(jù)光伏模塊平面上的太陽輻照度計算得出,因此預測太陽輻照度對于電網(wǎng)的穩(wěn)定具有很重要的作用[2]。
為了提高太陽輻照度預測的準確性,近年來已提出多種不同方法,用于預測不同時間和空間分辨率的太陽輻照度[3]。例如通過衛(wèi)星遙感方法(satellite remote sensing,RS)每5~10 分鐘進行數(shù)據(jù)采樣并進行1~24小時太陽輻照度預測[4];通過數(shù)值天氣預報(numerical weather prediction models,NWP)模型進行超短期太陽輻照度預測[5];同時,近年來興起的深度學習也因為其在預測時間序列的優(yōu)異性能而被應用到太陽輻照度預測中,例如使用深度學習模型(artificial neural network,ANN)[6]、多層感知器(multi-layer perceptron,MLP)[7]、遺傳算法(genetic algorithm,GA)優(yōu)化后的MLP[8]、非線性自回歸神經(jīng)網(wǎng)絡(nonlinear autoregressive neural network,NARNN)[9]、長短期記憶網(wǎng)絡(long short-term memory,LSTM)[10],以及融合了雙向長短期記憶網(wǎng)絡(bidirectional long short-term memory,Bi-LSTM)和一維卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)的深度學習模型[11]。這些模型在目前的太陽能輻照度預測中比較熱門。
為了在保證預測精度的同時減少訓練模型的時長,本文提出通過皮爾遜相關系數(shù)分析,Kmeans++聚類和雙向長短期記憶網(wǎng)絡的預測模型。第一步,先使用皮爾遜相關系數(shù)分析篩選出和太陽輻照度相關程度較高的輸入氣象數(shù)據(jù);第二步,通過Kmeans++進行天氣類型的聚類并給各天氣類型加上標簽;第三步,將之前所得數(shù)據(jù)輸入雙向長短期記憶網(wǎng)絡,預測未來10分鐘內的太陽總輻照度;最后一步,通過ANN、LSTM、Bi-LSTM和CNN-LSTM對比模型的準確性,并選擇多個地區(qū)的數(shù)據(jù)驗證其普遍適用性。
1 模 型
1.1 預測模型輸入變量確定
本文采用美國可再生能源實驗室中的國家太陽輻射數(shù)據(jù)庫(National Solar Radiation Database,NSRDB)的地區(qū)觀測數(shù)據(jù),其數(shù)據(jù)包括全年的太陽總輻照度(global horizontal irridiance,GHI),在晴空條件下的地表太陽輻射、云層類型、太陽高度角、溫度、相對濕度、壓力、風速、風向、雪深等18個相關數(shù)據(jù),所有數(shù)據(jù)的時間間隔均為10 min。通過皮爾遜相關性系數(shù)分析結合NRSDB所提供的數(shù)據(jù),從中篩選相關系數(shù)較高的輸入的數(shù)據(jù)類型,實現(xiàn)對輸入的降維,降低后續(xù)運算的時間成本。皮爾遜相關系數(shù)計算為:
[P(x,y)=i=1n(xi-x)(yi-y)i=1nxi-x2i=1nyi-y2]""""" (1)
式中:[xi]——自變量[x]的樣本值;[yi]——自變量[y]的樣本值;[x]——自變量[x]的平均值;[y]——自變量[y]的平均值。
1.2 輸入變量的聚類與劃分
Kmeans作為目前最常用的十大聚類算法之一,其屬于無監(jiān)督分類算法,在對樣本進行聚類分析時,主要依靠樣本到聚類中心的歐氏距離進行劃分,樣本選擇最近的聚類中心形成簇而無需對樣本進行初始化標記。Kmeans++是針對Kmeans的一種改進型方法,其主要的改進點是對Kmeans隨機初始化聚類中心的方法的優(yōu)化。Kmeans是完全隨機的選取聚類中心,而Kmeans++則是基于初始的聚類中心之間的相互距離應盡可能遠的原則,通過樣本點與首個隨機選擇的的聚類中心進行計算,若是與當前聚類中心的距離越大,則其成為下一個聚類中心的概率就越大,依次完成所有聚類中心的選擇。Kmeans++相較于Kmeans的優(yōu)點在于其能提高聚類效果的同時無需隨機選取聚類中心,提高了計算精度。流程如圖1所示。
1.3 雙向長短期記憶網(wǎng)絡
對于循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN),一種對其優(yōu)化方式為長短期神經(jīng)網(wǎng)絡,循環(huán)神經(jīng)網(wǎng)絡本身是一種比較優(yōu)秀的神經(jīng)網(wǎng)絡,其神經(jīng)網(wǎng)絡結構可讓其實現(xiàn)對時間序列的信息提取以及有能力對歷史的狀態(tài)以及特征信息進行儲存,最后綜合所有數(shù)據(jù)進行連續(xù)數(shù)據(jù)預測。但其存在梯度爆炸以及梯度消失的問題,在長序列的學習中被最新的數(shù)據(jù)所主導,而對遠端的數(shù)據(jù)逐漸忽略。而長短期記憶網(wǎng)絡解決了在RNN長序列學習中所存在的這些問題,因此相較而言更適用于對地表太陽輻射這類需依靠較長歷史數(shù)據(jù)進行學習的數(shù)據(jù)預測。
LSTM一共由3種類型的門結構構成,分別是遺忘門、輸入門以及輸出門,其細胞[t-1]時刻和[t]時刻狀態(tài)由兩個狀態(tài)量表示,分別是[Ct-1]和[Ct],其隱含層[t-1]時刻和[t]時刻狀態(tài)也由兩個狀態(tài)量表示,分別是[ht-1]和[ht]。[t]時刻的輸入向量表示為[xt]、[xt]、[Ct-1]以及[ht-1]共同構成輸入,[Ct]和[ht]共同構成輸出,[σ]為Sigmoid激活函數(shù),作用為將變量推至0~1之間。[tanh]為雙曲函數(shù),作用為將變量推至[-1~1]之間,其主要公式為:
[ft=σWfht-1,xt+bf]""""" (2)
[it=σWiht-1,xt+bi]"""""" (3)
[Ct=tanhWcht-1,xt+bc]" (4)
[Ct="ftCt-1+"itCt]"" (5)
[ot=σWoht-1,xt+bo]"""" (6)
[ht=ottanhCt]" (7)
式中:[Wf]、[Wi]、[Wc]、[Wo]——權重參數(shù);[bf]、[bi]、[bc]、[bo]——偏置參數(shù)。
雙向長短期記憶網(wǎng)絡相較于原本的長短期記憶網(wǎng)絡的優(yōu)化在于其添加了一個可反向傳遞信息的隱藏層,將單向的LSTM層轉變?yōu)殡p層LSTM。正向層為從開頭到末尾時刻計算并記錄各時刻正序的輸出;反向層則是從末尾到開頭計算并記錄各時刻的倒序輸出。最終兩層分別獲得一個激活函數(shù)并綜合兩層結果為最終的輸出結果。雙向長短期記憶網(wǎng)絡使其當前時刻的輸出不僅與過去時間序列的輸入有關,也與未來時間序列的輸入有關,有利于改善對地表太陽輻射的預測誤差。
1.4 模型構建
下一步開始構建Kmeans++-Bi-LSTM模型,首先對從皮爾遜相關性系數(shù)分析得到的5個變量轉化為向量組,由于輸入?yún)?shù)之間的量綱存在差異,因此需在輸入Kmeans++前進行歸一化處理。然后將其輸入Kmeans++的程序中進行聚類,簇的數(shù)量k的選擇由聚類所得的輪廓系數(shù)以及實際情況所決定。聚類結束之后各時間段所得到的天氣變量的聚類標簽以及GHI在該地區(qū)的真實值將添加到向量組中變?yōu)轭~外的兩列向量作為輸入到Bi-LSTM的因變量中。模型輸入步長為7,可表述為:
[Y=x1,t]" (8)
[X=x1,t-7…x5,t-7kt-7????x1,t-1…x5,t-1kt-1]"""""" (9)
式中:[x1,t]——[t]時刻GHI的預測值,W/m2;[x1,t-1]——[t-1]時刻GHI的真實值(以10 min為時間間隔);[xi]——5項收集到的氣象變量的數(shù)據(jù);[kt-1]——[t-1]時刻氣候分類的標簽。
Bi-LSTM模型包含1個輸出層、1個ReLu全連接層以加快網(wǎng)絡的訓練速度、2個Bi-LSTM層以增強學習效果、1個dropout失活層以避免模型發(fā)生過擬合問題。學習時設定最大迭代值為50,學習率為0.001的adam算法進行優(yōu)化。模型運行環(huán)境為python3.9,使用的函數(shù)包為sklearn。
2 實驗結果及分析
2.1 模型性能評價指標
本文數(shù)據(jù)集按時間順序將數(shù)據(jù)集按2∶1的比例劃分為訓練集和預測集,數(shù)據(jù)集采用中國多個不同站點的數(shù)據(jù),以驗證模型的準確性以及普遍適用性。本文所采用的評價指標有均方根誤差(root mean square error,RMSE),平均絕對誤差(mean absolute error,MAE),其計算公式分別為:
[γRMSE=1nt=1nyt-dt2]""""" (10)
[γMAE=1nt=1nyt-dt]"" (11)
式中:[n]——測試集樣本總數(shù)量;[dt]——真實值;[yt]——模型預測值。
2.2 變量的選擇以及數(shù)據(jù)預處理
本文設計的準確性驗證實驗采用三亞2019—2020年的數(shù)據(jù)集。對NSRDB中的18個變量進行篩選,剔除出與預測GHI無關的變量后,將剩下的10個變量進行皮爾遜相關性系數(shù)分析,將相關性系數(shù)的絕對值大于0.1的變量進行篩選,最終篩選結果為5個變量,分別是相對濕度、氣溫、太陽高度角、云層類型和晴空條件下的地表太陽輻射。然后通過K-means++聚類,將標簽添加到每10分鐘的天氣情況中。Kmeans++聚類效果如圖2所示。圖2中3種類別分別為:無光照時期、光照陡升期/陡降期、光照平穩(wěn)期。
2.3 Kmeans++-Bi-LSTM模型性能評估
實驗部分采用LSTM、Bi-LSTM、CNN-LSTM進行對比,為了能公平地對4種算法進行對比,實驗部分采用與Kmeans++-Bi-LSTM相同的輸入變量。實驗發(fā)現(xiàn)5次實驗誤差差別均不超過平均值的±10%,因此選擇以平均值作為最終的展示結果以減小誤差。LSTM的最大迭代值與學習率也為相同設置。實驗采用的各模型的GHI預測結果、GHI真實值和RMSE、MAE的結果如圖3和表2所示。
由表2可看出,在相同輸入的情況下,Kmeans++-Bi-LSTM模型的RMSE相較于LSTM、Bi-LSTM、CNN-Bi-LSTM分別提升了7.36%、6.24%、2.9%;MAE相較于LSTM、Bi-LSTM、CNN-Bi-LSTM分別提升了13.77%、12.6%、5.5%。同時由3圖可看出,Kmeans++-Bi-LSTM的GHI預測值在前60時段數(shù)中,和GHI真實值非常的接近。在60~100的GHI真實值波動較為劇烈的情況下,仍能有較好的預測效果。
綜合表2和圖3,可觀察到相較于其他3種類型的模型,本文所提模型在相同輸入的情況下其預測性能更優(yōu),且相比于LSTM模型其誤差RMSE、MAE下降幅度最大。同時,考慮到不同地區(qū)存在不同天氣情況,進而導致GHI的波動情況也存在差別,最后可能導致各地區(qū)各類模型的GHI預測精度不同。本文通過對比中國不同城市的結果誤差來驗證Kmeans++-Bi-LSTM的普遍適用性。實驗所選擇的數(shù)據(jù)集為NSRDB數(shù)據(jù)庫中南寧、成都、包頭2019—2020年數(shù)據(jù)。實驗的RMSE、MAE結果如表3所示。
綜合表3可知,雖然各地區(qū)的不同模型預測結果各不相同,但從整體上看本文所提Kmeans++-Bi-LSTM模型預測效果從整體上仍最好,其中在包頭地區(qū)預測精度最高;在成都地區(qū)預測精度最低,但都優(yōu)于其他3種對比模型,證明本文所提Kmeans++-Bi-LSTM模型具有普遍適用性。
3 結 論
本文提出一種與太陽總輻照度超短期預測有關的基于Kmeans++-Bi-LSTM的模型,該模型使用皮爾遜相關系數(shù)分析進行天氣變量的篩選,然后將篩選出的天氣變量輸入到Kmeans++中進行聚類分析,并將每10分鐘的天氣變量的類別添加標簽,從而提高雙向長短期記憶網(wǎng)絡學習的準確性,最后通過雙向長短期記憶網(wǎng)絡在學習時間序列中的優(yōu)勢,實現(xiàn)對提前10 min的GHI超短期預測。通過對照同一地區(qū)不同模型以及不同地區(qū)不同模型的預測性能,驗證了本文模型在精確度方面相較于其他模型的優(yōu)勢,可用來進一步提高電力系統(tǒng)的穩(wěn)定性。根據(jù)實驗結果,獲得如下主要結論:
1)在預測10 min的GHI上,本文所提模型在驗證實驗中預測精度相較于其他3種模型更高,其中對LSTM模型的提升幅度最大,對CNN-Bi-LSTM模型的提升幅度最小。
2)在不同地區(qū)的不同模型對比中,本文所提模型在各個模型的預測中精度最高,驗證了本文所提模型在各地區(qū)的普遍適用性。
3)本文雖然對本文所提模型進行了很多實驗以驗證其性能,但仍有幾個值得研究的方面來改善其性能:①選擇聚類效果更好的聚類模型,并對簇的數(shù)量進行更深入的研究以更科學的劃分聚類類型;②選擇目前適合于時間序列且精度更高的LSTM模型,例如基于注意力機制的LSTM模型等;③結合衛(wèi)星云圖,通過預測云層厚度以及運動方向同時結合其他氣象變量進行綜合分析以提高預測精度。
[參考文獻]
[1]"""" ZHU T T, ZHOU H, WEI H K, et al. Inter-hour direct normal irradiance forecast with multiple data types and time-series[J]. Journal of modern power systems and clean energy, 2019, 7(5): 1319-1327.
[2]"""" LORENZ E, SCHEIDSTEGER T, HURKA J, et al. Regional PV power prediction for improved grid integration[J]. Progress in photovoltaics: research and applications, 2011, 19(7): 757-771.
[3]"""" CHU Y H, LI M Y, COIMBRA C F M, et al. Intra-hour irradiance forecasting techniques for solar power integration:"" a"" review[J]."" Iscience," 2021,"" 24(10): 103136.
[4]"""" PEDRO H T C, LARSON D P, COIMBRA C F M. A comprehensive dataset for the accelerated development and benchmarking of solar forecasting methods[J]. Journal of renewable and sustainable energy, 2019, 11(3): 036102.
[5]"""" LARSON D P, NONNENMACHER L, COIMBRA C F M. Day-ahead"" forecasting""" of"" solar"" power"" output"" from photovoltaic"" plants"" in"" the"" American"" Southwest[J]. Renewable energy, 2016, 91: 11-20.
[6]"""" 米增強, 王飛, 楊光, 等. 光伏電站輻照度ANN預測及其兩維變尺度修正方法[J]. 太陽能學報, 2013, 34(2): 251-259.
Mi Z Q, WANG F, YANG G, et al. ANN based irradiance forecast of photovoltaic power plant and two dimensions variable scale modification method for the forecast value[J]. Acta energiae solaris sinica, 2013, 34(2): 251-259.
[7]"""" INMAN R H, PEDRO H T C, COIMBRA C F M. Solar forecasting methods for renewable energy integration[J]. Progress in energy and combustion science, 2013, 39(6): 535-576.
[8]"""" CHU Y H, URQUHART B, GOHARI S M I, et al. Short-term reforecasting of power output from a 48 MWe solar PV plant[J]. Solar energy, 2015, 112: 68-77.
[9]"""" 馬燕峰, 蔣云濤, 郝毅, 等. 基于非線性自回歸神經(jīng)網(wǎng)絡的GHI預測[J]. 太陽能學報, 2019, 40(3): 733-740.
MA Y F, JIANG Y T, HAO Y, et al. GHI forecast based on nonlinear autoregressive neural network[J]. Acta energiae solaris sinica, 2019, 40(3): 733-740.
[10]""" 趙書強, 尚煜東, 楊燕燕, 等. 基于長短期記憶神經(jīng)網(wǎng)絡的地表太陽輻照度預測[J]. 太陽能學報, 2021, 42(3): 383-388.
ZHAO S Q, SHANG Y D, YANG Y Y, et al. Short-term solar irradiation forecast based on lstm neural network[J]. Acta energiae solaris sinica, 2021, 42(3): 383-388.
[11]""" 倪超, 王聰, 朱婷婷, 等. 基于CNN-Bi-LSTM的太陽輻照度超短期預測[J]. 太陽能學報, 2022, 43(3): 197-202.
NI C, WANG C, ZHU T T, et al. Super-short-term forecast of solar irradiance based on CNN-BI-LSTM[J]. Acta energiae solaris sinica, 2022, 43(3): 197-202.
ULTRA-SHORT-TERM FORECAST OF SOLAR IRRADIANCE BASED ON KMEANS++-BI-LSTM
Guan Songze1,Tang Yuben2,Cai Zheng3,Wu Lingtao3,Zheng Hanbo2,Qin Tuanfa3,4
(1. College of Optical Science and Engineering, University of Electronic Science and Technology of China,
Chengdu 611731, China; 2. College of Electrical Engineering, Guangxi University, Nanning 530004, China;
3. College of Computing and Electronic Information, Guangxi University, Nanning 530004, China; 4. Guangxi Key Laboratory of
Multimedia Communication and Network Technology, Guangxi University, Nanning 530004, China)
Abstract:A new ultra-short-term prediction scheme for solar irradiance is proposed to address the uncertainty and stochastic fluctuations of surface solar radiation, which in turn has an impact on the stability of large-scale photovoltaic power grid connection to the power system. The scheme uses Pearson correlation analysis and the Kmeans++ algorithm in unsupervised learning to filter multiple meteorological data, identify and classify key meteorological data and add labels to them, and then feed the labelled key meteorological data into a bi-directional long-short term memory network prediction model to achieve a 10-minute ultra-short-term forecast of solar irradiance. The results show that the proposed prediction model has lower root mean square error and lower mean absolute error than the currently used models.
Keywords:solar radiation; forecasting; cluster analysis; ultra-short-term; bi-directional long short-term memory network