劉志超,袁三男,唐萬成
(1.上海電力大學(xué)電子與信息工程學(xué)院,上海 200120;2.寧夏廣播電視監(jiān)測中心,寧夏銀川 750003)
隨著化石燃料的過度使用,化石能源的短缺以及環(huán)境污染問題愈發(fā)嚴(yán)重,大力開發(fā)推廣清潔的可再生能源是實(shí)現(xiàn)可持續(xù)發(fā)展的重要方式[1]。光伏發(fā)電在我國一系列政策扶持下穩(wěn)步發(fā)展,其裝機(jī)容量不斷上升,截至2018 年底,我國的光伏裝機(jī)容量達(dá)到了1.74 億千瓦,比上一年同比增長34%。精確的光伏發(fā)電輸出功率預(yù)測可以有效減少不穩(wěn)定的光伏發(fā)電并網(wǎng)對電網(wǎng)電壓造成的波動(dòng),是保障電網(wǎng)經(jīng)濟(jì)平穩(wěn)運(yùn)行的重要措施[2]。
目前光伏輸出功率預(yù)測方法主要包括時(shí)間序列法,隨機(jī)森林模型,支持向量機(jī)模型以及神經(jīng)網(wǎng)絡(luò)模型等[3-5]。文獻(xiàn)[6]針對不同氣象條件分別構(gòu)建基于差分整合移動(dòng)平均自回歸模型(ARIMA)時(shí)序序列的分布式光伏發(fā)電功率預(yù)測模型,取得較好的預(yù)測效果,但缺點(diǎn)是氣象條件分類不明確以及對各氣象因素缺乏相關(guān)性分析。文獻(xiàn)[7]利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)并使用平滑控制策略減少預(yù)測的光伏功率波動(dòng),提高預(yù)測的穩(wěn)定性。文獻(xiàn)[8]利用深度學(xué)習(xí)算法中的深度置信網(wǎng)絡(luò)以及長短期記憶網(wǎng)絡(luò)構(gòu)建組合預(yù)測模型,比經(jīng)典的預(yù)測模型精度有了較大的提升,然而搭建的神經(jīng)層過多導(dǎo)致訓(xùn)練難度提高,容易使預(yù)測模型陷入過擬合。因此有必要對光伏輸出功率預(yù)測模型進(jìn)行神經(jīng)網(wǎng)絡(luò)和其他模型的組合研究。
在此基礎(chǔ)上,本文采用軟閾值的小波降噪算法平滑曲線,降低噪聲數(shù)據(jù)在訓(xùn)練模型時(shí)對模型預(yù)測精度的影響。使用灰色關(guān)聯(lián)分析討論各氣象因素與輸出功率的相關(guān)性,并設(shè)置閾值篩選出強(qiáng)相關(guān)氣象因素??紤]到輸出功率為非穩(wěn)定時(shí)序序列,搭建雙向長短期記憶網(wǎng)絡(luò)(BLSTM)-隨機(jī)森林的組合模型,將處理好的氣象因素及歷史功率構(gòu)建訓(xùn)練集訓(xùn)練組合模型,最后輸入待預(yù)測日的相關(guān)數(shù)據(jù),得到當(dāng)日的光伏發(fā)電功率預(yù)測值。
光伏發(fā)電的輸出功率曲線在時(shí)域范圍呈現(xiàn)不穩(wěn)定性和波動(dòng)性,外界的干擾極易造成輸出功率的突變。以江蘇省高郵振興光伏發(fā)電站的實(shí)際數(shù)據(jù)為研究對象,該電站某3 日(共計(jì)146 個(gè)采樣點(diǎn))的輸出功率曲線如圖1 所示。發(fā)電站的輸出功率具有間歇性,結(jié)合實(shí)際電站的地理位置設(shè)置觀測的時(shí)間段為6:00 至17:45。由圖1 可知光伏功率存在周期性,每日的輸出功率變化趨勢都是先升高再降低,并在中午前后達(dá)到當(dāng)天輸出功率的峰值。另外光伏輸出功率曲線具有明顯的波動(dòng)性,功率的變化并不是平滑穩(wěn)定的,信號(hào)存在噪聲干擾,不利于預(yù)測模型對于輸出功率曲線的擬合。為了消除輸出功率中的噪聲和干擾成分,本文采用小波降噪處理歷史輸出功率。
圖1 光伏發(fā)電站3日的輸出功率曲線
小波降噪是利用小波分解算法將帶有噪聲的信號(hào)分解為低頻和高頻的分量,通過閾值函數(shù)處理小波系數(shù),再將小波系數(shù)重構(gòu)為去噪后的信號(hào)。常見的小波閾值函數(shù)有軟閾值和硬閾值,其中軟閾值函數(shù)可以在保留大部分的有效信息的前提下,使數(shù)據(jù)曲線相對平滑,有效地消除噪聲和信號(hào)突變。軟閾值函數(shù)的公式如式(1)所示。
利用小波降噪處理輸出功率的步驟為:(1)輸入含噪聲的輸出功率數(shù)據(jù),選取小波基和分解層數(shù),將功率數(shù)據(jù)分解為高頻和低頻的小波系數(shù),考慮到光伏數(shù)據(jù)的特性和維度,本文選取平滑性高的db4 小波基進(jìn)行2 層的小波分解;(2)選取合適的閾值和閾值函數(shù)處理小波系數(shù),消除高頻的噪聲信息;(3)利用閾值處理后的小波系數(shù)重構(gòu)輸出功率曲線,達(dá)到數(shù)據(jù)平滑的目的。
考慮到光伏輸出功率變化受多種復(fù)雜因素同時(shí)影響,本文首次提出使用灰色關(guān)聯(lián)分析對各影響因素與功率的相關(guān)性進(jìn)行分析研究,篩選強(qiáng)相關(guān)特征構(gòu)建訓(xùn)練集?;疑P(guān)聯(lián)分析具體步驟包括四步。
(1)分別使用m點(diǎn)的輸出功率和n個(gè)影響因素的數(shù)據(jù)構(gòu)建參考數(shù)列和比較數(shù)列:
式中:a0m為第m點(diǎn)的輸出功率;aim為第m點(diǎn)的第i個(gè)影響因素,i=1,2,…,n。
(2)由于影響因素與輸出功率之間的量綱不同,利用式(3)進(jìn)行去量綱處理。
式中:A0(j)為第j點(diǎn)的功率;Ai(j)為第j點(diǎn)的第i個(gè)影響因素的數(shù)據(jù);ρ 為分辨系數(shù),取值范圍一般在[0,1],本文中ρ 取0.5。
(4)計(jì)算第i個(gè)影響因素的灰色關(guān)聯(lián)度:
BLSTM 模型作為深度學(xué)習(xí)模型具有很強(qiáng)的非線性曲線擬合能力,且獨(dú)有的結(jié)構(gòu)使得模型處理時(shí)序序列數(shù)據(jù)能力大幅提升,但該模型的訓(xùn)練成本較高,且容易陷入過擬合。隨機(jī)森林模型利用多個(gè)分類回歸樹(CART)對結(jié)果進(jìn)行投票輸出,具有收斂快、調(diào)參少、不易陷入過擬合等優(yōu)勢,然而在處理時(shí)序序列時(shí)無法充分學(xué)習(xí)訓(xùn)練數(shù)據(jù)與預(yù)測值的復(fù)雜關(guān)系。本文搭建BLSTM 與隨機(jī)森林構(gòu)建組合模型,有效地利用了BLSTM 對于時(shí)序序列的雙向處理能力以及隨機(jī)森林的高精度預(yù)測能力,提高短期光伏輸出功率的預(yù)測精度。
圖2 基于BLSTM-隨機(jī)森林的短期光伏功率預(yù)測流程
BLSTM-隨機(jī)森林短期光伏功率預(yù)測模型流程圖如圖2所示。首先對歷史光伏發(fā)電功率進(jìn)行小波降噪,選取db4 小波作為小波基,將輸出功率分解為高頻和低頻的小波系數(shù),采用固定閾值和軟閾值函數(shù)的方式處理小波系數(shù),剔除高頻部分的噪聲信號(hào),再將小波系數(shù)重構(gòu)為平滑的功率曲線。利用灰色關(guān)聯(lián)分析求得影響因素與輸出功率之間的灰色關(guān)聯(lián)度,設(shè)立閾值篩選強(qiáng)相關(guān)特性。小波降噪后的歷史輸出功率與灰色關(guān)聯(lián)分析處理的影響因素構(gòu)建訓(xùn)練集。再對訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理操作,連續(xù)型變量歸一化處理。
建立BLSTM-隨機(jī)森林模型,考慮到過多的深度學(xué)習(xí)網(wǎng)絡(luò)層會(huì)導(dǎo)致訓(xùn)練時(shí)間長,模型難以收斂,搭建淺層的BLSTM神經(jīng)層,該層由前向LSTM 層、后向LSTM 層以及兩層全連接層組成。上述的模型收斂后將經(jīng)過BLSTM 層處理生成的序列以及全連接層處理得到的結(jié)果作為訓(xùn)練數(shù)據(jù)輸入隨機(jī)森林模型進(jìn)行最終的輸出功率預(yù)測。
算例數(shù)據(jù)來自江蘇省高郵振興光伏發(fā)電站2017 年真實(shí)輸出功率數(shù)據(jù),時(shí)間為5 月1 日至6 月30 日,每日的數(shù)據(jù)采樣時(shí)間為6:00 至17:45,間隔為15 min,共計(jì)48 個(gè)采樣點(diǎn)。用上述時(shí)間的歷史功率及影響因素構(gòu)建訓(xùn)練數(shù)據(jù),預(yù)測7 月1日至7 月3 日光伏輸出功率。
使用平均絕對百分比誤差(MAPE)以及均方根誤差(RMSE)作為評判模型光伏功率預(yù)測精度的標(biāo)準(zhǔn)。MAPE與RMSE的公式如下:
式中:yireal為第i個(gè)采樣點(diǎn)輸出功率的真實(shí)值;yipre為第i個(gè)采樣點(diǎn)輸出功率的預(yù)測值;n為采樣點(diǎn)個(gè)數(shù),本文為48。
首先使用小波降噪處理歷史輸出功率數(shù)據(jù),消除數(shù)據(jù)中的高頻噪聲。發(fā)電站某日(48 個(gè)采樣點(diǎn))小波降噪前后的輸出功率曲線對比如圖3 所示,降噪前曲線波動(dòng)較大且存在多處突變的尖峰點(diǎn),經(jīng)過小波降噪處理后,功率曲線既保留了有效信息,又去除了噪聲點(diǎn),使得曲線更加平滑。
圖3 小波降噪效果對比圖
因光伏發(fā)電受多種氣象因素影響,本文采用灰色關(guān)聯(lián)度篩選強(qiáng)相關(guān)因素。選取2 個(gè)月的光照輻射、組件溫度、環(huán)境溫度、海拔、濕度作為候選氣象因素,并選取不同跨度的歷史輸出功率計(jì)算訓(xùn)練樣本的灰色關(guān)聯(lián)度結(jié)果如表1 所示。由表1 可知,光照輻射與環(huán)境溫度的相關(guān)度較高;組件溫度隨環(huán)境溫度的變化有一定的延遲導(dǎo)致其相關(guān)度較低;海拔和相對濕度受當(dāng)?shù)氐乩憝h(huán)境影響變化相對穩(wěn)定,故兩者相關(guān)性最低。此外歷史輸出功率的相關(guān)性隨著時(shí)間間隔的增加而不斷減小?;疑嚓P(guān)度高于0.5 的影響因素為強(qiáng)相關(guān)影響因素,選取光照幅射,環(huán)境溫度以及預(yù)測點(diǎn)前3 小時(shí)內(nèi)的歷史數(shù)據(jù)作為模型的輸入。
表1 各影響因素的灰色關(guān)聯(lián)度
在數(shù)據(jù)輸入模型訓(xùn)練之前需要對數(shù)據(jù)進(jìn)行歸一化,加快模型訓(xùn)練速度,如式(8)所示。
式中:P、P'分別為歸一化前與歸一化后的數(shù)據(jù);Pmax、Pmin分別為當(dāng)前數(shù)列中的最大值與最小值。
經(jīng)過預(yù)處理后的訓(xùn)練數(shù)據(jù)以9∶1 的比例劃分訓(xùn)練集和測試集。BLSTM 模型學(xué)習(xí)率取0.000 1,損失函數(shù)選用均方誤差(MSE),訓(xùn)練中的梯度下降算法使用Adam 算法,提高誤差函數(shù)梯度的收斂速度。BLSTM 層的神經(jīng)元個(gè)數(shù)是影響模型的重要參數(shù),適當(dāng)增加神經(jīng)元個(gè)數(shù)可以有效提升模型的非線性擬合能力,但過多的神經(jīng)元不僅會(huì)影響訓(xùn)練模型速度,還容易陷入過擬合,降低預(yù)測精度。對BLSTM 層的神經(jīng)個(gè)數(shù)進(jìn)行對照實(shí)驗(yàn),結(jié)果如表2 所示,BLSTM 層的神經(jīng)元個(gè)數(shù)為128 時(shí),模型的準(zhǔn)確率最高。隨機(jī)森林模型使用網(wǎng)格搜索確定樹的個(gè)數(shù)為150。
表2 BLSTM 層神經(jīng)元個(gè)數(shù)對預(yù)測精度的影響
為了驗(yàn)證本文所提方法的有效性,設(shè)置了以下兩種方案進(jìn)行對比。選取了BLSTM、隨機(jī)森林兩組單一模型進(jìn)行輸出功率預(yù)測,并與BLSTM-隨機(jī)森林模型比較。BLSTM 模型包含兩層神經(jīng)元為128 的LSTM 層,隨機(jī)森林模型樹的個(gè)數(shù)為150。預(yù)測出的7 月1 日-7 月3 日(共計(jì)146 個(gè)采樣點(diǎn))的輸出功率曲線與實(shí)際輸出功率曲線如圖4 所示,BLSTM 模型的預(yù)測值與真實(shí)值存在一定的延時(shí),隨機(jī)森林模型在功率變化較大的時(shí)段表現(xiàn)較差,BLSTM-隨機(jī)森林模型對于不同發(fā)電情況下的輸出功率都能準(zhǔn)確預(yù)測。
針對不同的算法模型,本文也進(jìn)行了比較實(shí)驗(yàn)。支持向量回歸機(jī)模型(SVR)使用高斯徑向基函數(shù)(RBF)作為核函數(shù),懲罰系數(shù)c=1.0。同時(shí)為了驗(yàn)證本文搭建的BLSTM 層處理時(shí)序序列的能力,構(gòu)建BLSTM-SVR 的組合模型預(yù)測光伏發(fā)電輸出功率,模型參數(shù)與單一的模型相同。不同模型預(yù)測結(jié)果如表3 所示。
圖4 不同模型預(yù)測的結(jié)果對比
表3 不同模型的測試結(jié)果
由表3 可知,BLSTM-隨機(jī)森林模型相比于BLSTM 模型和隨機(jī)森林模型預(yù)測精度有較大的提高,尤其與BLSTM 模型相比,預(yù)測誤差下降了3.17%,組合模型在一定程度上彌補(bǔ)了各自的缺點(diǎn),綜合提升了預(yù)測模型的性能。此外,BLSTMSVR 模型預(yù)測誤差也小于單一的SVR 模型,證實(shí)了BLSTM提取輸入數(shù)據(jù)的深層特征可以有效提高模型的預(yù)測精度。BLSTM-隨機(jī)森林模型具有最小的MAPE和RMSE,分別為3.42%和0.78 MW,體現(xiàn)了組合模型的優(yōu)越性。
針對實(shí)際光伏發(fā)電站的光伏輸出功率預(yù)測,本文利用小波降噪去除歷史輸出功率中的噪聲,采用灰色關(guān)聯(lián)分析篩選強(qiáng)相關(guān)影響因素并與降噪處理后的歷史功率作為訓(xùn)練數(shù)據(jù),建立BLSTM-隨機(jī)森林模型預(yù)測光伏輸出功率。仿真實(shí)驗(yàn)結(jié)果表明:該模型在短期光伏功率預(yù)測任務(wù)中具有較高的預(yù)測精度和泛化能力,實(shí)用性良好。