王宇馳, 趙延陽, 張樹軍
(1.遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院, 遼寧 葫蘆島 125105;2.葫蘆島八家礦業(yè)股份有限公司, 遼寧 葫蘆島 125105)
目前,太陽能已成為發(fā)展速度最快的新型清潔能源之一,光伏功率預(yù)測顯得尤為重要,但由于光伏電站中存在多種復(fù)合場對其影響,并且發(fā)電過程突出的隨機性,給電力系統(tǒng)的平穩(wěn)運行帶來隱患。更換一種貼合目前電力系統(tǒng)的新型預(yù)測模型,如使用人工魚群算法以及長短期記憶(long short term memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型對電力負荷預(yù)測進行智能尋優(yōu)[1-2],能夠有效遏制存在的多種問題。有學(xué)者已經(jīng)開展了有關(guān)光伏功率預(yù)測模型的系統(tǒng)性研究,但是,基于LSTM的光伏發(fā)電功率預(yù)測領(lǐng)域的研究論文相對于其他核心算法論文較少。
因此,本文將以LSTM 算法為核心,輔以EMD、KPCA 算法進行混合,該方法相較其他算法具有明顯的優(yōu)勢,可以提高預(yù)測的準度和精密度。
本文采用EMD 及KPCA 的算法來利用環(huán)境序列信息,主成分分析法在不失去具體數(shù)據(jù)的情況下既能降低特征維度,又能提升神經(jīng)網(wǎng)絡(luò)的精確程度和計算能力,采用LSTM來處理時間序列數(shù)據(jù)中的長期依賴關(guān)系,以上三種算法可以更為精密地進行光伏功率預(yù)測的實驗。
經(jīng)驗?zāi)B(tài)分解(EmpiricalModeDecomposition,EMD)是依據(jù)數(shù)據(jù)自身的時間尺度特征來進行信號分解,進而獲得數(shù)量不同的本征模函數(shù)。EMD 在處理非線性數(shù)據(jù)上具有明顯的優(yōu)勢,具有較高的信噪比。
EMD 算法的基本步驟如下:
1)初始化[3]:確定一個原始數(shù)據(jù)序列y(t),找到它所有極大值點作為其上包絡(luò)線,所有極小值點作為其下包絡(luò)線。
2)計算上包絡(luò)線和下包絡(luò)線的均值s(t),將原始數(shù)據(jù)序列y(t)與上包絡(luò)線和下包絡(luò)線均值s(t)做差,得到第1 個分量h1(t)=y(t)-s(t)。
3)第二次篩選:h1(t)作為原始數(shù)據(jù)序列,s1(t)是h1(t)上下包絡(luò)線的均值,與步驟(2)類似求出第二個分量h2(t)。以此類推,得到:hk+1=hk-sk。
4)判斷是否不大于給定的門限,門限在0.2~0.3 之間取值。若n 不大于門限,則令ci=hk(t)。否則,令k=k+1 后,重復(fù)步驟(1),判斷余量是否為單調(diào)函數(shù)。若是,則終止分解。否則,繼續(xù)執(zhí)行。第一個特征的EMD 分解如圖1 所示。
圖1 第一個特征的EMD 分解
經(jīng)驗?zāi)B(tài)分解后得到的數(shù)據(jù)往往是高維度的,本文采用主成分分析(PrincipalComponentsAnalysis,PCA)將原有的數(shù)據(jù)轉(zhuǎn)換到新的特征空間內(nèi),進一步參與核函數(shù)運算,從而得到具體的測試集。
PCA 算法的基本步驟如下:
1)利用線性函數(shù)歸一化來標準化連續(xù)初始變量的范圍,得到標準化矩陣樣本集X,低維空間維數(shù)為m。
3)計算樣本集中樣本的協(xié)方差矩陣,記作XXT。
4)進行協(xié)方差矩陣XXT的特征值分解。
5)得到m個最大的單位特征向量ω1,ω2,ω3,…,ωm。
6)最后得到投影矩陣,獲得降維后的數(shù)據(jù)W=(ω1,ω2,ω3,…,ωm)。
KPCA 算法在此基礎(chǔ)上進一步與核函數(shù)進行擬合,設(shè)
利用矩陣K 得出相關(guān)參數(shù),如圖2 所示。
圖2 KPCA 后各特征貢獻率
長短期記憶神經(jīng)網(wǎng)絡(luò)是在基于RNN 的基礎(chǔ)上,將RNN 的內(nèi)部復(fù)雜化,引入了更多的結(jié)構(gòu)單元,如:輸入門i、遺忘門f、輸出門o和內(nèi)部記憶單元c等,其結(jié)構(gòu)如圖3 所示,包含了四個交互層。
圖3 LSTM 隱藏層細胞結(jié)構(gòu)
LSTM的具體算法如下:
1)根據(jù)遺忘門f的公式,得到遺忘門的值ft=σ(Wfxt+Ufht-1+bf)。其中:Wf為權(quán)重矩陣;σ 為sigmoid 函數(shù);ht-1為上一時刻的隱藏狀態(tài);xt為當(dāng)前輸入;bf為偏置項。
2)通過輸入門i與雙曲正切函數(shù)tanh來決定哪些信息存儲到記憶細胞中。
3)通過對it和的匯總,可以得出內(nèi)部記憶單元表達式Ct=ft·Ct-1+it·。其中:ft為遺忘門輸出;為當(dāng)前輸入的單元狀態(tài);Ct為此刻單元狀態(tài)。
本文通過三種算法互惠的關(guān)系,完成準確的預(yù)測。經(jīng)過EMD 分解后,得到多個IMF,利用KPCA 對其進行降維處理,將KPCA 提取出的特征輸入進LSTM中,進行數(shù)據(jù)建模。
1)輸入:a為輻射度、b為氣溫、c為氣壓、d為濕度和e為光伏功率。輸出:誤差指標RMSE、MAE、MAPE和R2。數(shù)據(jù)清理:北半球光伏功率數(shù)據(jù)e和其余環(huán)境數(shù)據(jù)a、b、c和d進行數(shù)據(jù)清理[4]。
2)EMD 算法處理數(shù)據(jù):將收集到的環(huán)境數(shù)據(jù)序列進行EMD 分解,得到不同頻率的本征模態(tài)函數(shù)IMF和剩余分量r,把需要的數(shù)據(jù)整理為特征波動序列[5]。
3)得到特征波動序列后,利用KPCA 降維得到所需要的訓(xùn)練集和測試集。
4)選取合適的LSTM 函數(shù),把訓(xùn)練集數(shù)據(jù)輸入,進一步篩選后得到目標準確率。
5)步驟4)結(jié)束后,其結(jié)果輸入進測試集數(shù)據(jù),得到數(shù)據(jù)結(jié)果,輸出誤差指標。
本文以均方根誤差(RMSE)、平均絕對誤差(MAE)、絕對百分比誤差中位數(shù)(MAPE)和擬合優(yōu)度(R2)作為評估誤差指標,得到基于EMD-KPCA-LSTM的光伏功率預(yù)測模型,如圖4 所示。
圖4 基于EMD-KPCA-LSTM 的光伏功率預(yù)測模型
式中:yi為光伏功率真實值;為光伏功率預(yù)測值;nsamples為測試樣本集的數(shù)量。
為驗證本文構(gòu)建的EMD-KPCA-LSTM光伏輸出功率預(yù)測模型具有更穩(wěn)定且明顯的優(yōu)勢,可以提高預(yù)測的準度和精密度,本文分別采用EMD 算法、EMD-LSTM 算法和EMD-KPCA-LSTM 聯(lián)合算法對光伏功率進行預(yù)測。對比三種模型的預(yù)測結(jié)果及誤差后可知,EMD-LSTM-LSTM具有較明顯的優(yōu)勢,能很好地減弱環(huán)境因素的消極影響,EMD-KPCA-LSTM預(yù)測模型的RMSE、MAE 和MAPE 相對更小,R2的結(jié)果更接近于1。三種算法的訓(xùn)練集、測試集誤差指標對比如表1 所示,三種模型預(yù)測結(jié)果、誤差對比圖如圖5 所示。
表1 三種算法的訓(xùn)練集、測試集誤差指標對比
圖5 三種模型預(yù)測結(jié)果及誤差對比
本文提出的光伏功率預(yù)測模型與傳統(tǒng)的單一LSTM模型和EMD-LSTM算法進行了多元對比實驗,實驗結(jié)果表明:基于EMD-KPCA-LSTM的光伏功率預(yù)測模型的波動性和標準差均小于其他算法,泛化能力更強。EMD 與KPCA 聯(lián)合使用,可以對經(jīng)驗?zāi)B(tài)分解后得到的難以分析的高維數(shù)據(jù)通過主成分分析法進行降維處理,更好地消除實驗數(shù)據(jù)的復(fù)雜性,LSTM成功讓該復(fù)合模型的RMSE、MAE 和MAPE 相對更小,R2的結(jié)果更接近于1。本文在可實現(xiàn)的范疇內(nèi),提出的新型算法可以為探究光伏功率預(yù)測提供一種全新視角,其相關(guān)研究還在進一步開展。