遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院 焦家俊 河北工業(yè)大學(xué)國際教育學(xué)院 劉田園
現(xiàn)有的負(fù)荷預(yù)測方法可分為兩大類:一類為物理方法,其通過對光伏發(fā)電設(shè)備進(jìn)行數(shù)學(xué)建模預(yù)測,因其無法獲取時(shí)間相關(guān)性,不適用于短期發(fā)電預(yù)測;一類為統(tǒng)計(jì)及人工智能方法,其利用神經(jīng)網(wǎng)絡(luò)的非線性擬合能力,結(jié)合天氣、氣象因素對光伏處理進(jìn)行建模與預(yù)測[1]。文獻(xiàn)[2]提出基于長短期記憶網(wǎng)絡(luò)算法(Long and Short Memory Network,LSTM)的光伏發(fā)電功率短期預(yù)測方法,對廣西某額定裝機(jī)容量為20MW的光伏電站的歷史數(shù)據(jù)進(jìn)行預(yù)處理分析,結(jié)果發(fā)現(xiàn)采用LSTM方法較BP方法預(yù)測結(jié)果更加準(zhǔn)確。文獻(xiàn)[3]提出一種卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)-LSTM的混合預(yù)測模型對澳洲某光伏系統(tǒng)進(jìn)行了仿真分析,結(jié)果表明該方法較單一模型相比,對于不同天氣類型具有更高的預(yù)測精度。
CNN用于數(shù)據(jù)特征提取,在卷積層中,采用濾波器對輸入進(jìn)行卷積操作,得到相應(yīng)的特征圖;后經(jīng)過池化層進(jìn)行最大值降維,進(jìn)而降低數(shù)據(jù)特征的尺寸,減少網(wǎng)絡(luò)參數(shù),降低運(yùn)算過程中CPU資源耗費(fèi)。結(jié)構(gòu)圖如圖1所示。
圖1 CNN結(jié)構(gòu)圖
LSTM神經(jīng)網(wǎng)絡(luò)由時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)改進(jìn)得來,在RNN結(jié)構(gòu)的基礎(chǔ)上增加了三種門控單元用以控制信息,其結(jié)構(gòu)圖如圖2所示。遺忘門將t-1輸出的無用信息遺忘,由t時(shí)刻的遺忘門狀態(tài)Ft和t-1時(shí)刻的單元狀態(tài)ct-1共同決定保留有用信息。輸入門負(fù)責(zé)讀取t時(shí)刻的輸入xt及t-1時(shí)刻的中間狀態(tài)ht-1,在輸出門中經(jīng)sigmoid函數(shù)、tanh函數(shù)作用后產(chǎn)生it、gt,其共同決定單元狀態(tài)中應(yīng)該保留的信息。輸出門將數(shù)據(jù)處理后,向下一個(gè)時(shí)刻傳遞信息。由ht經(jīng)tanh函數(shù)處理后的ct及ot共同決定。
圖2 LSTM原理結(jié)構(gòu)圖
LSTM的核心表達(dá)式如下式所示:
式中:WF,Wi,Wg,Wo分別為遺忘門、輸入門、輸入節(jié)點(diǎn)、輸出門的權(quán)重矩陣,其與xt、ht-1相乘;bF,bi,bg,bo分別為遺忘門、輸入門、輸入節(jié)點(diǎn)、輸出門的偏置;ht-1為t-1時(shí)刻的中間狀態(tài)輸出,xt為t時(shí)刻的輸入,ct為輸入節(jié)點(diǎn)的狀態(tài);Ft為遺忘門狀態(tài);it、gt為t時(shí)刻輸入門及輸入節(jié)點(diǎn)狀態(tài);σ為sigmoid激活函數(shù)tanh代表雙曲正切激活函數(shù)。
貝葉斯優(yōu)化是在函數(shù)方程未知的情況下根據(jù)已有的采樣點(diǎn)預(yù)估函數(shù)最大值的一種算法,在本文中利用貝葉斯算法對CNN-LSTM的多個(gè)超參數(shù)進(jìn)行尋優(yōu),從而提高光伏發(fā)電預(yù)測的有效性及準(zhǔn)確性,其流程圖如圖3所示。
圖3 貝葉斯優(yōu)化流程圖
本文提出了一種基于貝葉斯優(yōu)化的CNNLSTM混合神經(jīng)模型的短期光伏出力預(yù)測。首先運(yùn)用CNN進(jìn)行特征提取。而后采用尋優(yōu)算法對預(yù)測模型CNN-LSTM尋優(yōu),最后對基于貝葉斯優(yōu)化的CNN-LSTM混合神經(jīng)模型的短期光伏出力預(yù)測信息進(jìn)行非線性擬合,進(jìn)而實(shí)現(xiàn)光伏出力的精準(zhǔn)預(yù)測,得到預(yù)測結(jié)果。其算法模型結(jié)構(gòu)如圖4所示。
圖4 Bayes-CNN-LSTM模型結(jié)構(gòu)圖
本文選取新疆某光伏電站數(shù)據(jù)集作為研究對象,數(shù)據(jù)集包括光伏發(fā)電功率、氣象條件,時(shí)間跨度為2019年1月1日至2019年6月30日,采樣間隔為15min,共17376組樣本,個(gè)別缺失數(shù)據(jù)已采用線性插值填補(bǔ)??紤]到光伏出力的間歇性,截取每天6:00~21:45共64個(gè)采樣點(diǎn)數(shù)據(jù)作為試驗(yàn)數(shù)據(jù),總樣本量為11584組,將其按照8∶2的比例劃分為訓(xùn)練集與測試集,由于光伏出力影響因素較多,如若特征選擇不合理易導(dǎo)致信息丟失,故本文采用mRMR方法來進(jìn)行分析。
使用mRMR方法計(jì)算所得各特征與光伏出力的互信息值如下:組件溫度0.1923、環(huán)境溫度0.0579、氣壓0.2399、濕度0.1030、總輻射0.3222、直射輻射0.1016、散射輻射0.1908。由此可見,光伏出力與總輻射之相關(guān)性最大,達(dá)到0.3222;氣壓、組件溫度、散射幅度次之;再次是另外三個(gè)氣象因素,其中環(huán)境溫度對光伏出力之影響很小,互信息值僅為0.0579,為減輕數(shù)據(jù)冗余程度和預(yù)測模型擬合負(fù)擔(dān),本文將其剔除,不再納入后續(xù)工作考慮的范疇。
傳統(tǒng)的尋優(yōu)方法多為試湊法,考慮到手動(dòng)調(diào)參主觀性強(qiáng),隨機(jī)性大,在歸一化數(shù)據(jù)后,基于貝葉斯優(yōu)化算法對CNN的一、二層卷積層卷積核大小k1、k2,一、二層卷積層通道數(shù)n1、n2、第二層卷積層后所接的池化層大小p以及LSTM的學(xué)習(xí)率lr、第一和第二隱藏層神經(jīng)元個(gè)數(shù)L1和L2、最大迭代次數(shù)N共9個(gè)超參數(shù)進(jìn)行尋優(yōu)。尋優(yōu)過程中采用提前終止策略,如若20輪迭代擬合效果仍無改善則提前終止訓(xùn)練過程。LSTM的批樣本大小設(shè)置為256,采用Adam優(yōu)化器進(jìn)行訓(xùn)練。尋優(yōu)范圍設(shè)置及最終尋優(yōu)結(jié)果見表2。
表1 CNN-LSTM超參數(shù)尋優(yōu)范圍及結(jié)果
表2 不同模型的預(yù)測效果
為了準(zhǔn)確評估本文模型的精度,選取平均絕對誤差(MAE)、均方根誤差(RMSE)這2個(gè)指標(biāo)對預(yù)測結(jié)果進(jìn)行評估。各評估指標(biāo)的計(jì)算式如下所示:、,式中:RMSE和MAE的單位均為MW,n代表測試集數(shù)據(jù)的個(gè)數(shù);yi為第i個(gè)預(yù)測樣本的預(yù)測值;yi為第i個(gè)測試樣本的真實(shí)值。
為了驗(yàn)證本文所提方法的有效性與準(zhǔn)確性,參考相關(guān)文獻(xiàn)分別構(gòu)建了Bayes-GRU、Bayes-LSTM、Bayes-CNN、CNN-LSTM和LSTM5組對照算法模型,針對相同的預(yù)測數(shù)據(jù)集與本文所提算法模型Bayes-CNN-LSTM(BCL)進(jìn)行對比分析。本文采用時(shí)間窗口滑動(dòng)的策略進(jìn)行預(yù)測,滑動(dòng)窗口預(yù)測時(shí)間步長設(shè)為32h,即將前128組樣本作為輸入特征,對第129個(gè)數(shù)據(jù)點(diǎn)進(jìn)行預(yù)測,然后滑動(dòng)窗口,將第129個(gè)預(yù)測點(diǎn)預(yù)測值作為新的特征,實(shí)現(xiàn)滾動(dòng)預(yù)測。由于數(shù)據(jù)眾多,為體現(xiàn)預(yù)測效果,本文隨機(jī)選取6月27、28兩日共128個(gè)數(shù)據(jù)點(diǎn)的預(yù)測值進(jìn)行展示,各個(gè)預(yù)測模型的預(yù)測結(jié)果評價(jià)指標(biāo)值見表2,預(yù)測結(jié)果如圖5所示。
圖5 不同模型的預(yù)測結(jié)果對比
由表2可見,本文所提方法各項(xiàng)評價(jià)指標(biāo)均為最優(yōu)。直接利用LSTM進(jìn)行預(yù)測效果最差。僅利用CNN對多個(gè)輸入特征進(jìn)行局部特征提取而未采用尋優(yōu)算法對預(yù)測模型LSTM尋優(yōu),致使預(yù)測模型LSTM的性能難以得到充分體現(xiàn),其預(yù)測效果僅優(yōu)于LSTM,這說明了本文所用尋優(yōu)算法的有效性;而單純利用CNN、LSTM、GRU等基準(zhǔn)模型對負(fù)荷進(jìn)行預(yù)測,并輔以尋優(yōu)算法進(jìn)行超參數(shù)優(yōu)化,其預(yù)測效果雖優(yōu)于CNNLSTM與LSTM,但仍然劣于本文所提方法,這說明了本文使用CNN模型用以特征提取的必要性;結(jié)合圖5來看,本文所提方法與原始負(fù)荷曲線最為貼合,能夠很好地?cái)M合出光伏出力與各種氣象dier因素之間的非線性關(guān)系,尤其在氣象條件突變所致光伏出力強(qiáng)烈波動(dòng)時(shí)間段,仍然能夠捕捉到光伏出力特性。
圖6還給出了6種方法預(yù)測結(jié)果誤差的小提琴圖,從圖中可以明顯看出,不同于Bayes-GRU的極端異常值較多,Bayes-LSTM的左偏分布,Bayes-CNN、CNN-LSTM、LSTM的右偏分布,本文所提方法的預(yù)測誤差基本上呈對稱分布,且極端誤差值小。綜上所述,本文所提Bayes-CNN-LSTM模型的有效性得以驗(yàn)證。
圖6 不同模型預(yù)測誤差對比分析