韓 坤
(中國大唐集團(tuán)科學(xué)技術(shù)研究總院有限公司,北京 100040)
隨著全球?qū)Νh(huán)境問題的關(guān)注,開發(fā)諸如風(fēng)能[1]、水能[2]、燃料電池[3]、光伏[4]等可再生能源已成為普遍共識。國際能源署(International Energy Agency,IEA)評估,到2040 年,新能源的比例將達(dá)到60%,其中光伏和風(fēng)能將占50%以上。光伏,即太陽能光伏,自1992 年以來,已從小規(guī)模應(yīng)用的利基市場發(fā)展成為主流電源。2017 年,全球累計(jì)光伏發(fā)電量達(dá)到近460TWh,約占全球總能源的2%,其中60%用于公用事業(yè)的應(yīng)用,其余40%用于分布式應(yīng)用[5]。到2018 年底,全球累計(jì)光伏總?cè)萘窟_(dá)到512 千瓦,滿足了全球2.55%的電力需求[6]。
但是,由于環(huán)境溫度、相對濕度、風(fēng)速和晴空指數(shù)等氣象因素[7],光伏發(fā)電具備間歇性的特性,會有相當(dāng)大的波動性。在文獻(xiàn)[8]中使用了神經(jīng)網(wǎng)絡(luò)來驗(yàn)證光伏功率輸出與溫度、風(fēng)速和相對濕度密切相關(guān)性,文獻(xiàn)[9]則證明了晴空指數(shù)和溫度對光伏功率輸出的性能有很大的影響。由于光伏發(fā)電輸出受氣象因素影響很大,強(qiáng)波動和間歇性會對電力系統(tǒng)運(yùn)行和并網(wǎng)造成很大影響。當(dāng)光伏大規(guī)模并網(wǎng)時,可能會引起電網(wǎng)振蕩[10]。因此,準(zhǔn)確預(yù)測光伏出力可以顯著改善電力系統(tǒng)的運(yùn)行,增加光伏系統(tǒng)的滲透率。
光伏功率預(yù)測的方法可概括為物理方法、直接預(yù)測方法和間接預(yù)測方法。物理方法主要依賴于從太陽能到電能的能量轉(zhuǎn)換的理論分析獲得的物理模型,物理模型通常基于數(shù)值天氣預(yù)報、衛(wèi)星圖像和云運(yùn)動模型[11],這些模型可以高精度地預(yù)測光伏功率輸出[12]。但是,這種預(yù)測方法需要衛(wèi)星云圖上的額外信息,導(dǎo)致更高的運(yùn)行成本和計(jì)算成本。為解決此問題,直接預(yù)測方法,即時間序列方法被廣泛應(yīng)用于光伏預(yù)測。這些方法根據(jù)光伏功率序列的周期性、趨勢性和其他特性,在歷史功率序列和未來光伏功率之間建立數(shù)學(xué)關(guān)系。但是,這種方法缺少輻射、溫度、濕度、風(fēng)速和風(fēng)向等氣象信息,不完整的天氣信息難以保證預(yù)測的準(zhǔn)確性。為了提高預(yù)測精度,提出了間接預(yù)測方法,即回歸方法??紤]氣象因素后,某一時段光伏發(fā)電量的預(yù)測性能有了顯著提高。間接預(yù)測方法包括人工神經(jīng)網(wǎng)絡(luò)[13,14]、支持向量機(jī)[15]和馬爾可夫鏈[16]等。
本文通過深度學(xué)習(xí)方法,在基于MIE 構(gòu)建的光伏特征輸入基礎(chǔ)上,利用ALSTM 的預(yù)測優(yōu)勢,采用回歸方法對光伏出力進(jìn)行了較為準(zhǔn)確的短期預(yù)測。
LSTM 是目前機(jī)器學(xué)習(xí)領(lǐng)域中廣泛使用的深度學(xué)習(xí)方 法,由Hochreiter 和Schmidhuber 在1997 年 提出[17]。LSTM 是專門用于處理時間序列數(shù)據(jù)的深度學(xué)習(xí)模型,其在網(wǎng)絡(luò)模型中加入門控制器,可以解決RNN 中的長期依賴問題(梯度爆炸或消失),結(jié)構(gòu)如圖1 所示。
圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 LSTM Network structure
LSTM 模型在原有的短期記憶單元ht的基礎(chǔ)上,增加一個記憶單元ct來保持長期記憶,同時增加3 個門控機(jī)制來控制整個學(xué)習(xí)過程中的信息流。LSTM 單元在每個時間步長t的狀態(tài)被定義為一組5 個向量Rd:輸入門it、遺忘門ft、輸出門ot、隱藏狀態(tài)ht和存儲單元ct,d是LSTM 單位的數(shù)量。LSTM 傳遞函數(shù)為:
其中,xt是當(dāng)前輸入;σ表示sigmoid 函數(shù);W和b是權(quán)重和偏置參數(shù)。遺忘門控制從存儲單元刪除不需要的信息,而輸入門控制向存儲單元添加新信息,輸出門控制內(nèi)部存儲狀態(tài)的暴露。通過3 個門,存儲單元ct可以選擇性地更新、刪除和遺忘內(nèi)部信息,從而更好地理解序列中的長期依賴性,提取時序數(shù)據(jù)中隱藏的特征。
當(dāng)神經(jīng)網(wǎng)絡(luò)接收到大量的輸入信息輸入時,不同的輸入對輸出值的影響是不同的。為提高神經(jīng)網(wǎng)絡(luò)的計(jì)算效率,對于相同的輸出,更多的計(jì)算能力被分配給重要的輸入信息,這種措施被稱為注意力機(jī)制。
注意力機(jī)制分兩步計(jì)算,第一步是計(jì)算所有輸入值上的注意力分布值αi;第二步是計(jì)算單個輸出值下的輸入信息加權(quán)平均值。注意力機(jī)制如圖2 所示。
圖2 注意力機(jī)制結(jié)構(gòu)圖Fig.2 Structure diagram of attention mechanism
其中,xi是輸入值;q是神經(jīng)網(wǎng)絡(luò)的查詢向量;s是注意力的得分函數(shù);αi是查詢向量q在所有輸入值上的注意力分布值。
得分函數(shù)為:
其中,W是可以自主學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)參數(shù)。計(jì)算式(4)的softmax 值,可以得到注意力分布αi,如式(5)所示:
a是注意力分布值α和輸入值xi的加權(quán)平均值,表示為:
互信息為信息論中用來度量變量間信息共享程度的方式,它可以表征一個隨機(jī)變量與另一個隨機(jī)變量信息的相關(guān)性情況[18,19]。
定義向量X=[x1,x2,,,xn],n為X的長度。如式(7)所示對X進(jìn)行歸一化計(jì)算:
式(7)中,X0是X歸一化處理后的結(jié)果。
設(shè)B為X0的組距,Ei為X0的波動區(qū)間上下限,其計(jì)算公式分別如式(8)和式(9)所示:
依據(jù)一維直方圖分析法,按式(9)將X0分為n個波動區(qū)間,設(shè)Xi表示第i個波動區(qū)間,如式(10)所示:
設(shè)p(·)表示上下限概率密度函數(shù),則各波動區(qū)間Xi的上下限概率密度p(Xi)為:
式(11)中,ni為X0中元素在波動區(qū)間Xi的數(shù)據(jù)樣本數(shù)。
通過自信息熵H(Xi)來表征X自身隨機(jī)波動的不確定度大小,即:
依據(jù)香農(nóng)信息論[15],一維向量的自信息熵H(Xi)擴(kuò)展到二維向量的互信息I(X;Y),即為:
式(13)中,Y為與X不同的向量;p(Yj)為波動區(qū)間Yj的上下限概率密度;p(XiYj)表示X0和Y0在波動區(qū)間Xi和Yj的聯(lián)合概率密度。
I(X;Y)表征了X和Y信息的共享程度,可用于衡量兩個變量中一個同另一個相關(guān)性的大小情況。若向量X和向量Y彼此獨(dú)立無關(guān),那么向量X將不會給向量Y提供任何信息,它們彼此間的互信息為零;反之,若向量X和向量Y互相相關(guān),則X和Y之間所傳遞的全部信息都會共享,那么二者間的互信息I(X;Y)=1。
為消除量綱的影響,廣義互信息I(X;Y)經(jīng)過歸一化計(jì)算后,最終得MIE 相關(guān)系數(shù)IXY為:
式(14)中,H(Y)表示向量Y的自信息熵。
MIE 表征了變量之間概率分布的統(tǒng)計(jì)特性,其始終是非負(fù)的,即IXY≥0,與廣義的線性相關(guān)系數(shù)相關(guān),可應(yīng)用的范圍更廣,能更好地挖掘氣象因素與光伏功率間的非線性相關(guān)性,有利于關(guān)鍵氣象特征的篩選。
通過維度較大的數(shù)值天氣預(yù)報(uNmerical Weather Forecast,NWP)氣象數(shù)據(jù)進(jìn)行光伏功率預(yù)測之前,要先對復(fù)雜氣象輸入數(shù)據(jù)與光伏功率輸出數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析。要將與光伏功率相關(guān)性低的變量進(jìn)行剔除,也即減少預(yù)測模型的噪聲輸入,對輸入氣象數(shù)據(jù)降維,提高預(yù)測模型精度的同時,也提升預(yù)測模型的運(yùn)行效率。
若各氣象變量Xi(i=1,2,…,5)分別為輻照度、溫度、云量、風(fēng)速和濕度,光伏功率則以變量Y表示。通過利用2.1 小節(jié)公式分別計(jì)算各輸入氣象因素與輸出光伏功率的互信息熵(MIE)相關(guān)系數(shù)IXY=[IFP,ITP,ICP,IWP,IHP],其計(jì)算結(jié)果見表1。
表1 氣象因素和光伏功率的MIE相關(guān)系數(shù)Table 1 MIE correlation coefficients between meteorological factors and photovoltaic power
從表1 可知,各氣象因素與光伏功率的MIE 相關(guān)系數(shù)由大到小分別是照度、溫度、濕度、風(fēng)速和云量,即輻照度和溫度與光伏功率相關(guān)性最高,均大于0.9。為了最大程度地平衡訓(xùn)練精度和訓(xùn)練效率的關(guān)系,本文最終將MIE相關(guān)系數(shù)較高的前3 種氣象因素,輻照度、溫度及濕度作為光伏功率ALSTM 預(yù)測模型最終的輸入變量,同時前一時刻光伏功率與當(dāng)前時刻功率亦是強(qiáng)相關(guān)的,因此本文也將前一時刻的光伏功率送入預(yù)測模型。
好的預(yù)測誤差指標(biāo)有助于預(yù)測模型更好的迭代尋優(yōu),也可方便進(jìn)行不同算法之間的對比,本文選取常見的均方根誤差和平均絕對誤差作為預(yù)測誤差指標(biāo),具體定義如下:
1)均方根誤差
2)平均絕對誤差
式中:T為的采樣時間點(diǎn)數(shù);Pi和分別代表i時刻實(shí)際值和預(yù)測功率值。
本文數(shù)據(jù)集取自澳大利亞布里斯班昆士蘭大學(xué)露西亞校區(qū)的平板光伏系統(tǒng)的昆士蘭大學(xué)中心(UQ Centre),該樓布置在建筑物屋頂?shù)?806 塊多晶硅太陽能電池構(gòu)成,裝機(jī)容量為433.44 kW[20],如圖3 所示。原始數(shù)據(jù)集是2012 年~2013 年完整的2a一 每天24h 和1min 采樣周期的數(shù)據(jù)一因?yàn)楣夥β示哂虚g歇性的特性,所以本文數(shù)據(jù)集實(shí)際只提取每天07:00~18:00 時間段的功率數(shù)據(jù),從而原始的功率數(shù)據(jù)集包括481800 個采樣點(diǎn)的數(shù)據(jù)(2a×365d×11h×60min),其中缺失了5034 個數(shù)據(jù),占總數(shù)據(jù)的百分之一左右,本文通過向前平均法進(jìn)行缺失數(shù)據(jù)的填充處理。
圖3 昆士蘭大學(xué)中心(UQ Centre)光伏系統(tǒng)Fig.3 University of Queensland Center (UQ Centre) photovoltaic system
為了平衡數(shù)據(jù)量和數(shù)據(jù)自身特征的保留情況,本文對原1min 采樣周期的原始數(shù)據(jù)進(jìn)行了重采樣,每15min 提取一個數(shù)據(jù),遇到缺失數(shù)據(jù),則通過向前15 個數(shù)據(jù)平均替代,使預(yù)測時間尺度由1min 調(diào)整為15min,最終的光伏功率數(shù)據(jù)點(diǎn)總數(shù)為32320(15min)。
為了驗(yàn)證本文所提ALSTM 預(yù)測模型的有效性和優(yōu)越性,本文在昆士蘭大學(xué)中心光伏數(shù)據(jù)集上,分別進(jìn)行了晴天功率預(yù)測、陰雨功率預(yù)測以及天氣劇烈波動日預(yù)測,同時還將雙向LSTM(BiLSTM)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行對比驗(yàn)證。
◇晴天數(shù)據(jù)預(yù)測
以2013 年6 月某天晴為預(yù)測數(shù)據(jù)樣本,通過ALSTM預(yù)測模型進(jìn)行預(yù)測。預(yù)測曲線如圖4 所示。從圖4 可知,晴天天氣條件下,總體的光伏功率波動均較小,由表2 的RMSE 和MAE 預(yù)測誤差指標(biāo)值可知,ALSLTM 比BiLSTM和CNN 的預(yù)測誤差更小。
圖4 天晴日光伏功率確定性預(yù)測Fig.4 Deterministic prediction of photovoltaic power on sunny days
表2 光伏功率預(yù)測對比Table 2 Comparison of photovoltaic power predictions
◇陰雨天數(shù)據(jù)預(yù)測
為驗(yàn)證本文提出的ALSTM 預(yù)測模型在其他氣象條件下的預(yù)測精度情況,選取6 月某一陰雨天作為光伏功率預(yù)測數(shù)據(jù)樣本進(jìn)行預(yù)測。預(yù)測結(jié)果如圖5 所示。從圖5 可知,陰雨天氣下,光伏功率相比晴天整體波動要大。從表2 的兩個誤差指標(biāo)可知,與另外兩種深度學(xué)習(xí)算法預(yù)測結(jié)果相比,本文方法預(yù)測精度更高。
圖5 陰雨天光伏功率確定性預(yù)測Fig.5 Deterministic prediction of photovoltaic power in cloudy and rainy days
◇復(fù)雜強(qiáng)波動天氣數(shù)據(jù)預(yù)測
一個預(yù)測模型的好壞取決于其可否很好地在惡劣天氣情況下,進(jìn)行光伏功率預(yù)測。為驗(yàn)證本文提出ALSTM 在復(fù)雜強(qiáng)波動天氣下的光伏功率預(yù)測情況,選取6 月某一強(qiáng)波動數(shù)據(jù)樣本進(jìn)行功率預(yù)測,預(yù)測結(jié)果如圖6 所示。結(jié)合圖6 以及表2 兩個預(yù)測誤差指標(biāo)可知,復(fù)雜強(qiáng)波動天氣下的光伏功率波動比陰雨天更大,但ALSTM 預(yù)測誤差相對較小。與另外兩種方法相比,精度更高,能更好地進(jìn)行光伏功率預(yù)測,體現(xiàn)了本文ALSTM 預(yù)測模型的優(yōu)越性和強(qiáng)魯棒性。
圖6 天氣劇烈變化日光伏功率確定性預(yù)測Fig.6 Deterministic prediction of photovoltaic power on days with severe weather changes
準(zhǔn)確可靠的光伏出力預(yù)測對改善電力系統(tǒng)運(yùn)行能起到很大作用。本文基于LSTM 提取時序數(shù)據(jù)關(guān)聯(lián)特征的優(yōu)勢,以注意力機(jī)制進(jìn)一步改善LSTM 網(wǎng)絡(luò),構(gòu)建了ALSTM 預(yù)測模型,通過MIE 方法衍生光伏特征輸入,對影響光伏功率預(yù)測的復(fù)雜氣象因素進(jìn)行降維處理,進(jìn)一步減少輸入噪聲和提示預(yù)測精度。在昆士蘭大學(xué)中心光伏出力數(shù)據(jù)上,通過天晴、陰雨天以及天氣劇烈波動日的光伏功率預(yù)測情況,并與BiLSTM 和CNN 的對比驗(yàn)證可知,ALSTM 能更準(zhǔn)確地在晴天、陰雨天以及天氣劇烈波動日等情況下進(jìn)行光伏出力預(yù)測,具有更好的魯棒性和適用性。