金尚柱 薛 潤
(重慶科技學院 智能技術(shù)與工程學院, 重慶 401331)
能源系統(tǒng)的碳減排對實現(xiàn)“碳達峰、碳中和”起著決定性作用[1]。電力作為當今城市生產(chǎn)生活的主要能源,因此通過技術(shù)手段實現(xiàn)電力節(jié)能減排是我們目前探索的主要方向。國外相關(guān)研究起步較早,美國與歐洲國家已形成強大的研究群體,研究內(nèi)容覆蓋了發(fā)電、輸電、配電和售電等環(huán)節(jié)。我國目前正在深化電力體制改革,大力發(fā)展清潔能源,推進智慧電網(wǎng)建設(shè)。
太陽能是一種新興的清潔能源。截至2020年底,我國風電裝機、光伏發(fā)電裝機規(guī)模皆已“雙雙”突破2億千瓦,光伏發(fā)電系統(tǒng)主要由太陽能電池組件、控制器和逆變器等3部分組成[2]。首先,利用光伏效應(yīng)將太陽能轉(zhuǎn)化為直流電能;然后,太陽能發(fā)電廠采用光伏逆變器將直流電轉(zhuǎn)化為交流電,以供消費者使用,太陽能發(fā)電原理如圖1所示。
圖1 太陽能發(fā)電原理
光伏發(fā)電功率預(yù)測技術(shù)對控制光伏發(fā)電、保障光伏發(fā)電站平穩(wěn)運行起著重要作用,能有效地幫助電網(wǎng)調(diào)度部門做好電源調(diào)度計劃,減少光伏限電,提高電網(wǎng)消納能力,增加光伏電站的投資回報率。經(jīng)過研究,國內(nèi)外學者提出了一系列光伏發(fā)電功率預(yù)測方法。Malvoni等人基于天氣變化因素,提出了基于數(shù)據(jù)降維計算的SVM預(yù)測模型,降低了計算復(fù)雜度,提高了預(yù)測精度[3]。徐一倫等人提出了基于改進狼群算法的IWPA-LSSVM模型,從考慮天氣類型和相似日的角度對光伏發(fā)電功率進行預(yù)測[4]。馬曉玲等人提出了一種模糊聚類理論與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的FCM-BP模型,將發(fā)電行為分為發(fā)電高峰期、上升期、下降期和低谷期等階段,根據(jù)不同時間段的發(fā)電特征進行分段預(yù)測,提高了短期發(fā)電功率的預(yù)測速度和精度,降低了其對天氣因素的依賴性[5]。卿會等人提出 SVM-LSTM-DBN模型,并對短期光伏發(fā)電功率進行了預(yù)測[6]。上述方法都是孤立地對數(shù)據(jù)本身進行預(yù)測,未考慮各種數(shù)據(jù)之間的關(guān)聯(lián)性。本次研究利用時間序列模型來預(yù)測光伏發(fā)電功率,提高了模型的有效性和準確性。
時間序列模型主要包括自回歸滑動平均模型(auto regression moving average,ARMA)和自回歸積分滑動平均模型(auto regressive integrated moving average,ARIMA)等。其中,ARIMA模型可用于非平穩(wěn)時間序列的分析,而現(xiàn)實生活中的數(shù)據(jù)往往是非平穩(wěn)的。與傳統(tǒng)時間序列模型相比,2017年Facebook發(fā)布的時間序列預(yù)測框架Prophet靈活且測量數(shù)據(jù)不需等間距分布,不用對缺失值進行插值處理,擬合速度較快?;跁r間序列模型的預(yù)測方法已廣泛應(yīng)用于電力預(yù)測、疫情預(yù)測[7-8]和交通客流量預(yù)測[9]等方面。
ARIMA模型由Box等人提出,又稱為Box-Jenkins模型[10]。該模型將預(yù)測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列,用數(shù)學模型進行近似描述,模型擬定后可通過現(xiàn)有數(shù)據(jù)來預(yù)測未來數(shù)據(jù)。
ARIMA(p,d,q)模型如式(1)所示:
d∈N*
(1)
式中:L表示滯后算子;p表示預(yù)測模型中時序數(shù)據(jù)的時間間隔;d表示保持時序數(shù)據(jù)穩(wěn)定而進行差分處理的次數(shù),差分的作用是使序列的均值和方差不發(fā)生明顯變化;ψi表示預(yù)測值與第i天數(shù)據(jù)的自相關(guān)系數(shù);Xt表示未來t時刻的預(yù)測值;q表示預(yù)測誤差的滯后數(shù);εt表示誤差項;θi表示第i天誤差項的自相關(guān)系數(shù)。
如果時間序列平穩(wěn),則d為0,p和q采用自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)來確定。ARIMA模型預(yù)測流程如圖2所示。首先,根據(jù)時間序列的散點圖、ACF圖和PACF圖,通過ADF單位根檢驗其方差、趨勢和季節(jié)變化性規(guī)律,識別序列的平穩(wěn)性,對非平穩(wěn)序列進行差分處理;然后,建立模型進行參數(shù)估計和白噪聲檢驗,利用已通過白噪聲檢驗的模型進行預(yù)測分析。
圖2 ARIMA模型預(yù)測流程
Prophet模型幾乎能全自動地預(yù)測時間序列未來走勢[11],對數(shù)據(jù)要求較低,只需提取時間戳和時間序列就可以完成模型的構(gòu)建。通過Prophet模型可以計算出時間序列的預(yù)測值,以及預(yù)測值的上界和下界。時間序列的分解是時間序列分析領(lǐng)域中的一種常見方法,它將時間序列分為季節(jié)項s(t)、趨勢項g(t)、假日項h(t)和誤差項εt等4個部分。
Prophet模型如式(2)所示:
y(t)=g(t)+s(t)+h(t)+εt
(2)
g(t)包含2個重要函數(shù),一個是邏輯回歸函數(shù),另一個是分段線性函數(shù)。
因為時間序列往往呈周期性變化,因此需要選擇變點,并根據(jù)變點所對應(yīng)的增長率變化量來實現(xiàn)預(yù)測。本次研究主要基于季節(jié)性趨勢和節(jié)假日效應(yīng)進行模擬擬合。
本次實驗使用某太陽能電廠2020年5月15 日 — 6月17日的工作數(shù)據(jù),數(shù)據(jù)分為發(fā)電數(shù)據(jù)集和傳感器數(shù)據(jù)集。發(fā)電數(shù)據(jù)集記錄每15 min產(chǎn)生的電量,每天可產(chǎn)生96條記錄;傳感器數(shù)據(jù)集記錄相同時刻的環(huán)境參數(shù),包括環(huán)境溫度、傳感器溫度和每15 min的照射量。由相關(guān)性矩陣圖(見圖3)可知,環(huán)境溫度是產(chǎn)能的主要影響因素,這與初步預(yù)測結(jié)果相符。
圖3 相關(guān)性矩陣圖
圖4 不同光伏模塊平均單日產(chǎn)生的直流電能
圖5 光伏模塊每日產(chǎn)生的電能變化規(guī)律
本次研究選用回歸模型,評價指標包括可決系數(shù)(R2)、平均絕對誤差(AME)、均方根誤差(SRME)。
R2取值為0~1,R2越大,模型擬合效果越好。對于AME,是先計算每個樣本預(yù)測值和實際值間的絕對誤差,然后求和再取平均值。對于SRME,是先計算每個樣本實際值與預(yù)測值差的平方,然后求和取均值再開根號。各指標公式如式(3) — 式(5)所示:
(3)
(4)
(5)
本次實驗采用ARIMA[12]和Prophet[13]模型。傳統(tǒng)ARIMA模型的建立需要通過觀察ACF和PACF圖來定階;而從pmdarima庫中直接調(diào)用ARIMA模型,只需要提供訓(xùn)練數(shù)據(jù),即可通過自動化調(diào)整參數(shù)設(shè)置使模型性能達到最佳狀態(tài)。在訓(xùn)練中,將stepwise參數(shù)設(shè)置為True,訓(xùn)練后的最佳模型為ARIMA(4,1,0)(0,1,1)[96]。由ARIMA模型預(yù)測曲線(見圖6)可知,預(yù)測值和實際值的曲線近似重合,模型效果良好。
圖6 ARIMA模型預(yù)測曲線
Prophet模型可以處理時間序列中的異常值和缺失值,全自動預(yù)測未來趨勢。Prophet模型短期預(yù)測結(jié)果如圖7所示。由Prophet模型長期預(yù)測結(jié)果(見圖8)可知,產(chǎn)能整體呈減少趨勢,這可能與模塊隨時間老化有關(guān)。
圖7 Prophet模型短期預(yù)測結(jié)果
圖8 Prophet模型長期預(yù)測結(jié)果
從模型效果來看,ARIMA和Prophet模型都能達到較好的預(yù)測效果。通過回歸模型對ARIMA和Prophet模型進行評價(見表1),認為ARIMA模型的預(yù)測效果優(yōu)于Prophet模型,但ARIMA模型的訓(xùn)練時間遠超Prophet模型。
表1 模型評價結(jié)果
時間序列模型能夠很好地用于預(yù)測太陽能發(fā)電量,為能源供給側(cè)提供預(yù)期信息,統(tǒng)籌能源發(fā)展,對“雙碳”行動有著重要意義[14]。對光伏模塊產(chǎn)生的電能進行分析,可以檢測其是否出現(xiàn)故障;對發(fā)電量進行預(yù)測,可以合理安排能源調(diào)度,切實踐行“雙碳”行動。