丁施尹, 譚錫林, 葉 萌, 李 晶, 薛書倩, 劉 陽
(1. 廣東電網(wǎng)有限責(zé)任公司廣州供電局電力調(diào)度控制中心, 廣東 廣州 510000; 2. 北京清軟創(chuàng)新科技股份有限公司, 北京 100085; 3.華北電力大學(xué), 北京 102206)
在某種程度上, 分布式光伏的規(guī)模化接入已部分解決了可再生能源的消納問題。但是,當(dāng)配電網(wǎng)中接入的分布式電源滲透率比較高時(shí)會(huì)導(dǎo)致其母線轄區(qū)內(nèi)的潮流分布情況與負(fù)荷形態(tài)發(fā)生巨大的轉(zhuǎn)變。通常情況下,母線屬于電網(wǎng)中的能量中轉(zhuǎn)場所,主要起到接受并分配能量的作用。 其中,位于配電網(wǎng)用戶側(cè)的母線屬于降壓型母線, 主要將傳輸?shù)皆撎幍碾娔芙祲汉蠓峙涞较鄳?yīng)的配電網(wǎng)中以便用戶使用。 若母線轄區(qū)內(nèi)負(fù)荷用電量超出額定容量,對(duì)應(yīng)母線主設(shè)備將過負(fù)荷運(yùn)行,這將導(dǎo)致母線設(shè)備及相連的線路遭受巨大的沖擊。因此,精準(zhǔn)預(yù)測降壓母線轄區(qū)內(nèi)的負(fù)荷,對(duì)配電網(wǎng)的經(jīng)濟(jì)、可靠運(yùn)行來說至關(guān)重要, 能夠幫助提前進(jìn)行負(fù)荷裕度調(diào)整,確保在用電高峰時(shí)仍正常供電[1]。 相比于電力系統(tǒng)級(jí)別的負(fù)荷, 降壓型母線轄區(qū)內(nèi)用戶容量十分有限, 不能通過用戶間的負(fù)荷來調(diào)整負(fù)荷曲線使其更加平滑, 這就導(dǎo)致聚合后的總體負(fù)荷曲線波動(dòng)仍然十分明顯[2],[3]。
目前, 已有較多文獻(xiàn)針對(duì)傳統(tǒng)的電力系統(tǒng)負(fù)荷預(yù)測問題展開了大量的分析與研究, 其中常見的幾種分析方法包括神經(jīng)網(wǎng)絡(luò)法[4]、隨機(jī)森林法[5]、深度學(xué)習(xí)法[6]等。 文獻(xiàn)[7]采用了流形正則化方式對(duì)模型參數(shù)與超參數(shù)進(jìn)行優(yōu)化, 有效提升了極限學(xué)習(xí)機(jī)的性能。 文獻(xiàn)[8]采用修正指數(shù)Logistic 模型進(jìn)行求解,能夠有效預(yù)測飽和負(fù)荷情況,充分考慮了區(qū)域內(nèi)光伏與風(fēng)電的增長率, 合理估計(jì)了光伏與風(fēng)電的飽和時(shí)間。 文獻(xiàn)[9]對(duì)不同氣象日下的歷史數(shù)據(jù)進(jìn)行了分析,采用條件互信息分析法,計(jì)及了母線峰荷數(shù)據(jù)與高維氣象、 社會(huì)條件之間的關(guān)系,通過改進(jìn)粒子群法對(duì)極限學(xué)習(xí)機(jī)進(jìn)行優(yōu)化,提高預(yù)測精度, 針對(duì)不同氣象日條件建立了不同的母線峰值負(fù)荷最優(yōu)預(yù)測模型。 文獻(xiàn)[10]考慮到各區(qū)域母線負(fù)荷差異性較大的情況, 使用隨機(jī)森林法針對(duì)預(yù)測目標(biāo)的影響因素進(jìn)行排序, 選出其中特征貢獻(xiàn)度較高的特征屬性, 在模型訓(xùn)練階段使用深度置信網(wǎng)絡(luò), 能夠有效學(xué)習(xí)并跟蹤母線負(fù)荷的變化趨勢(shì)。 文獻(xiàn)[11]深入考慮了母線負(fù)荷與天氣特征間的聯(lián)系, 在母線負(fù)荷預(yù)測中計(jì)及了數(shù)值天氣預(yù)報(bào)與負(fù)荷分類情況。 上述文獻(xiàn)中都沒有在負(fù)荷預(yù)測中計(jì)及母線的相關(guān)特點(diǎn), 提出適用于母線轄區(qū)負(fù)荷的預(yù)測方法。
本文在對(duì)母線轄區(qū)內(nèi)負(fù)荷數(shù)據(jù)信息進(jìn)行清洗的基礎(chǔ)上, 提出了計(jì)及分布式光伏規(guī)?;尤氲哪妇€轄區(qū)負(fù)荷預(yù)測方法。 首先指出了母線級(jí)別負(fù)荷預(yù)測與傳統(tǒng)預(yù)測之間的區(qū)別, 提出基于互信息與組合學(xué)習(xí)的負(fù)荷預(yù)測模型; 然后重點(diǎn)介紹了XGBoost 模型與極限學(xué)習(xí)機(jī)模型; 最后以河北省某地母線轄區(qū)負(fù)荷的相關(guān)數(shù)據(jù)為例進(jìn)行驗(yàn)證。 本文算法對(duì)于分布式規(guī)?;尤氲哪妇€轄區(qū)負(fù)荷預(yù)測的應(yīng)用場景有較好的應(yīng)用效果。
互信息屬于信息論中的一種基礎(chǔ)理論, 它通過兩個(gè)隨機(jī)變量序列相關(guān)信息熵的大小來衡量它們之間的依賴情況。 假設(shè)用I(X;Y)表示互信息值,則可將其定義為
式中:H(X)為序列X 的信息熵值;H(X/Y)為序列X 對(duì)序列Y 的條件信息熵。
式中:p(x),p(y)分別為x,y 單獨(dú)發(fā)生的邊緣概率分布情況;p(x,y)為x,y 同時(shí)發(fā)生的聯(lián)合概率分布情況。
式(1)可以改寫為
由式(4)可知:若X 與Y 完全相關(guān),則對(duì)應(yīng)的互信息值最大,其值為1;若X 與Y 完全不相關(guān),則互信息值最小,其值為0。
Extreme Gradient Boosting(XGBoost)是 學(xué) 術(shù)界和工業(yè)界中常用的計(jì)算模型,其計(jì)算速度快、模型表現(xiàn)好,在應(yīng)用實(shí)踐中能夠達(dá)到很好的效果。
XGBoost 一般對(duì)學(xué)習(xí)情況進(jìn)行監(jiān)督, 即利用訓(xùn)練數(shù)據(jù)對(duì)目標(biāo)變量進(jìn)行預(yù)測。 XGBoost 中以決策樹為弱學(xué)習(xí)器, 每當(dāng)對(duì)單個(gè)弱學(xué)習(xí)器進(jìn)行訓(xùn)練時(shí),先略提高上一次計(jì)算失誤的數(shù)據(jù)權(quán)重,再推動(dòng)當(dāng)前單個(gè)弱學(xué)習(xí)器進(jìn)行學(xué)習(xí); 然后加入新的弱學(xué)習(xí)器,幫助糾正之前所有弱學(xué)習(xí)器的殘差情況;最后針對(duì)多個(gè)學(xué)習(xí)器進(jìn)行加權(quán)求和用于最終預(yù)測。
XGBoost 算法可視為由K 棵決策樹相加組成,計(jì)算過程為
式中:fk為決策樹;F 為全部決策樹所構(gòu)成的函數(shù)空間。
進(jìn)行回歸計(jì)算時(shí),參數(shù)Θ={f1,f2,…,fK},則目標(biāo)函數(shù)可表示為
針對(duì)決策樹正則化項(xiàng), 以向量映射的手段對(duì)每棵決策樹進(jìn)行改進(jìn), 可得到XGBoost 的正則化項(xiàng)Ω(f)為
式中:T 為葉節(jié)點(diǎn)的數(shù)量;ω 為樹葉的分?jǐn)?shù)向量;γ,λ 為基于樹模型的內(nèi)置參數(shù)。
2006 年,Huang 提出了極限學(xué)習(xí)機(jī)理論,其中核函數(shù)極限學(xué)習(xí)機(jī)屬于單層前饋神經(jīng)網(wǎng)絡(luò)算法中的一種。 基本極限學(xué)習(xí)機(jī)可表示為
式中:h(x)為隱藏層輸出情況;β=[β1,…,βL]T為第i 個(gè)隱藏層和輸出層間的權(quán)重系數(shù)。
極限學(xué)習(xí)機(jī)輸出的誤差值為
式中:L 為隱藏層中神經(jīng)元hi(x)的數(shù)量;fO(x)為待預(yù)測的變量。
核函數(shù)極限學(xué)習(xí)機(jī)具體情況如圖1 所示。
其中輸出函數(shù)fL(x)計(jì)算式為
式中:gi(x)與G(ai,bi,x)為隱藏節(jié)點(diǎn)i 的輸出函數(shù);ai,bi為隱藏層參數(shù);βi為輸出權(quán)重向量。
在訓(xùn)練前饋神經(jīng)網(wǎng)絡(luò)時(shí), 需要求解權(quán)重的最優(yōu)二乘解:
式中:T 為預(yù)測目標(biāo)的值。
則本系統(tǒng)輸出權(quán)重的最小標(biāo)準(zhǔn)二乘解可以表示為
式中:H?為矩陣H 的廣義逆矩陣;矩陣H 為神經(jīng)網(wǎng)絡(luò)的隱藏層; 引入常數(shù)1/C 將提高求解結(jié)果的泛化能力。
在對(duì)輸出權(quán)重β 進(jìn)行計(jì)算的過程中, 可以將1/λ 添加到矩陣HTH 或HHT的對(duì)角線上,能夠有效提升結(jié)果的穩(wěn)定性及泛化能力。 具體計(jì)算過程為
引入核函數(shù):
式中:ΩELM為高斯核函數(shù);N 為輸入層的維數(shù)。
假設(shè)h(x)為已知條件,則核函數(shù)可以定義為
目前已有的負(fù)荷預(yù)測方法中一般忽略了高比例分布式光伏接入對(duì)其造成的影響, 只考慮了負(fù)荷變化的影響因素。 近年來隨著大規(guī)模分布式光伏并網(wǎng), 分布式光伏產(chǎn)生的能量在配電網(wǎng)中進(jìn)行局部消納, 這種能量消耗形勢(shì)對(duì)負(fù)荷變化趨勢(shì)產(chǎn)生了很大的影響。如圖2 所示,圖中分別展示了真實(shí)母線負(fù)荷情況與分布式光伏的出力情況, 聚合分布式光伏后的母線負(fù)荷曲線產(chǎn)生了變化。 為了更加深入地分析母線轄區(qū)內(nèi)負(fù)荷曲線的形態(tài),應(yīng)該充分計(jì)及分布式光伏因素對(duì)負(fù)荷側(cè)造成的影響。 本文采用互信息處理輸入特征與輸出信息之間的聯(lián)系, 分析分布式光伏的接入對(duì)負(fù)荷預(yù)測精度的影響。
圖2 母線轄區(qū)內(nèi)的負(fù)荷曲線形態(tài)Fig.2 Load curve in bus area
此外,在預(yù)測模型中,本文選取了混合學(xué)習(xí)方式來聚合XGBoost 算法與極限學(xué)習(xí)機(jī)算法。 這兩種算法分別具有各自的特點(diǎn),其中:極限學(xué)習(xí)機(jī)的輸入信息需提前進(jìn)行歸一化處理, 處理過程中可能存在部分信息損失, 另外極限學(xué)習(xí)機(jī)易受到極限最小值的影響, 導(dǎo)致模型訓(xùn)練失?。?相比較而言,XGBoost 算法的輸入信息不需要進(jìn)行歸一化處理, 能夠最大程度地保留數(shù)據(jù)原始特征, 但是XGBoost 算法過分依賴于輸入數(shù)據(jù)中的主導(dǎo)信息。兩種算法側(cè)重點(diǎn)不同,將兩種算法進(jìn)行線性結(jié)合能夠兼顧二者的優(yōu)點(diǎn), 使得混合學(xué)習(xí)模型能夠有效提升母線轄區(qū)負(fù)荷預(yù)測精度。
總體而言, 模型整體訓(xùn)練流程可概括為以下幾步:
①采用互信息系數(shù)進(jìn)行分布式光伏出力與母線轄區(qū)負(fù)荷的相關(guān)性分析;
②將數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集、測試數(shù)據(jù)集;
③將劃分好的數(shù)據(jù)集輸入到混合預(yù)測學(xué)習(xí)模型中,得出最終母線轄區(qū)負(fù)荷預(yù)測結(jié)果。
本文所提出的母線轄區(qū)負(fù)荷預(yù)測模型框圖如圖3 所示。
圖3 基于互信息與混合模型的母線轄區(qū)負(fù)荷預(yù)測方法Fig.3 Bus load forecasting based on hybrid model and mutual information
算例選取某地區(qū)負(fù)荷實(shí)際數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,為了證明模型對(duì)多種場景具有普適性,本文選擇了多種應(yīng)用場景進(jìn)行實(shí)際分析, 其中各場景中分布式光伏的接入容量均較高。 場景一:10 kV 母線轄區(qū)內(nèi)為居民負(fù)荷; 場景二:110 kV 母線轄區(qū)內(nèi)為工業(yè)負(fù)荷;場景三:10 kV 母線轄區(qū)內(nèi)為商業(yè)負(fù)荷。在上述3 個(gè)場景中,采用的預(yù)測目標(biāo)均為下1 h 母線負(fù)荷情況。 本算例選取平均相對(duì)誤差(MAPE)、均方根誤差(RMSE)作為誤差指標(biāo)。
式中:n 為樣本數(shù)目;ai,bi分別為i 時(shí)刻的實(shí)際負(fù)荷值、預(yù)測負(fù)荷值。
由于本算例中所選區(qū)域的分布式光伏滲透率較高, 因此不能忽略光伏出力對(duì)母線轄區(qū)內(nèi)的負(fù)荷形態(tài)的影響。 本文分析了分布式光伏出力與負(fù)荷真實(shí)值之間的關(guān)系, 模型的輸入數(shù)據(jù)中計(jì)及了轄區(qū)內(nèi)上一時(shí)刻光伏數(shù)據(jù)信息。 表1 給出了不同類型的負(fù)荷與光伏出力之間的互信息系數(shù)。 深入分析可得,在各場景所選轄區(qū)內(nèi)分布式光伏接入容量均較高的情況下, 影響分布式光伏出力情況的相關(guān)因素會(huì)對(duì)該母線轄區(qū)內(nèi)負(fù)荷變化產(chǎn)生較大的影響,母線轄區(qū)的分布式光伏滲透率越高,光伏出力相關(guān)因素對(duì)負(fù)荷預(yù)測結(jié)果的影響越大。此外,輸入數(shù)據(jù)中除包括分布式光伏出力情況以外,還計(jì)及了天氣與歷史負(fù)荷數(shù)據(jù)等, 進(jìn)一步提高了預(yù)測結(jié)果的準(zhǔn)確性。
表1 高比例光伏對(duì)母線負(fù)荷預(yù)測結(jié)果影響Table 1 Power bus load forecasting result affected by PV
為進(jìn)一步分析比較分布式光伏出力對(duì)母線負(fù)荷預(yù)測結(jié)果的影響,本文針對(duì)3 種場景進(jìn)行分析,圖4~6 分別為母線轄區(qū)內(nèi)居民負(fù)荷、 工業(yè)負(fù)荷、商業(yè)負(fù)荷的預(yù)測結(jié)果。
圖5 110 kV 母線轄區(qū)內(nèi)工業(yè)負(fù)荷預(yù)測結(jié)果Fig.5 110 kV power bus load forecasting results based on industrial type
圖6 10 kV 母線轄區(qū)內(nèi)商業(yè)負(fù)荷預(yù)測結(jié)果Fig.6 10 kV power bus load forecasting results based on commerical type
通過對(duì)上述預(yù)測結(jié)果進(jìn)行分析, 在分布式光伏滲透率較高的母線轄區(qū)內(nèi), 考慮分布式光伏出力數(shù)據(jù)的母線轄區(qū)負(fù)荷預(yù)測方法能夠更好地滿足多種應(yīng)用場景的要求。 與未考慮分布式光伏出力情況的模型相比較, 本文所采用的模型能夠有效提高預(yù)測精度, 這也反映出高比例可再生能源接入會(huì)影響負(fù)荷的形態(tài)。 由于居民類負(fù)荷中分布式光伏滲透率更高, 因此當(dāng)模型中不計(jì)及光伏信息時(shí)預(yù)測結(jié)果偏離實(shí)際值更多。
將本文模型與采用神經(jīng)網(wǎng)絡(luò)(Neural Network,NN) 和時(shí)間序列算法 (Autoregressive Integrated Moving Average Model,ARIMA) 所得的預(yù)測結(jié)果進(jìn)行對(duì)比, 能夠進(jìn)一步反映出本文模型的優(yōu)勢(shì)所在。為了公平比較各算法的優(yōu)劣,計(jì)算過程中均使用本文3.2 給出的數(shù)據(jù)信息進(jìn)行預(yù)測, 預(yù)測結(jié)果見表2。
表2 3 種方法的誤差統(tǒng)計(jì)結(jié)果Table 2 Error statistics results of the three methods
通過對(duì)表2 中數(shù)據(jù)進(jìn)行分析可知: 居民負(fù)荷預(yù)測精度MAPE 一般會(huì)高于工業(yè)負(fù)荷,這是由于影響居民用電情況的因素較多、隨機(jī)性也較強(qiáng),大大增加了預(yù)測的難度,導(dǎo)致預(yù)測精度偏低,而母線轄區(qū)電壓等級(jí)越高,負(fù)荷預(yù)測的精度也越高;采用本文所提出的混合模型進(jìn)行計(jì)算時(shí), 誤差指標(biāo)MAPE 和RMSE 均低于采用NN 與ARIMA 進(jìn)行計(jì)算時(shí)所得結(jié)果,預(yù)測精度更高,表明該模型能夠適用于高比例分布式光伏接入的母線負(fù)荷預(yù)測情況。
本文針對(duì)分布式光伏滲透率較高的母線轄區(qū)進(jìn)行分析, 在輸入數(shù)據(jù)中計(jì)及了光伏自然資源的相關(guān)特性, 提出了基于互信息與混合學(xué)習(xí)機(jī)的母線轄區(qū)內(nèi)電力負(fù)荷預(yù)測方法, 分析了母線級(jí)別負(fù)荷預(yù)測與傳統(tǒng)負(fù)荷預(yù)測之間的區(qū)別。在此基礎(chǔ)上,提出了基于XGBoost 與極限學(xué)習(xí)機(jī)結(jié)合的預(yù)測模型。 最后通過實(shí)際算例驗(yàn)證了互信息與混合模型對(duì)預(yù)測結(jié)果的影響, 證明了在各個(gè)電壓等級(jí)下對(duì)工業(yè)負(fù)荷、 商業(yè)負(fù)荷與居民負(fù)荷進(jìn)行預(yù)測時(shí)均能獲得良好的預(yù)測精度。