陳 朔, 王 尉, 章 柯, 王艷龍, 張 照, 陳雪圓
(1.國(guó)網(wǎng)合肥供電公司, 安徽 合肥 230022;2.國(guó)網(wǎng)肥西縣供電公司, 安徽 合肥 231200)
負(fù)荷預(yù)測(cè)是保障電力系統(tǒng)安全、穩(wěn)定與經(jīng)濟(jì)運(yùn)行的一項(xiàng)重要的基礎(chǔ)性工作,其以電網(wǎng)運(yùn)行歷史數(shù)據(jù)為基礎(chǔ),通過(guò)挖掘負(fù)荷序列變化規(guī)律,關(guān)聯(lián)分析負(fù)荷影響因素,實(shí)現(xiàn)對(duì)電網(wǎng)負(fù)荷提前感知[1]。
因?yàn)樨?fù)荷變化受到天氣溫度、節(jié)假日、區(qū)域分布等多因素影響,會(huì)表現(xiàn)出不同的變化規(guī)律,所以本文綜合天氣、節(jié)假日、區(qū)域差異等多影響因素,基于相似日[2]數(shù)據(jù)簇構(gòu)建了配變負(fù)荷曲線預(yù)測(cè)模型[3]。相比單一極值短期負(fù)荷預(yù)測(cè),該模型能夠預(yù)測(cè)未來(lái)2日內(nèi)每間隔15分鐘一個(gè)數(shù)據(jù)顆粒度的負(fù)荷曲線,準(zhǔn)確刻畫各配變?nèi)珪r(shí)段負(fù)荷變化,全景展示各配變不同區(qū)間負(fù)載率時(shí)長(zhǎng)占比,為電網(wǎng)調(diào)度管理、運(yùn)行檢查工作提供依據(jù)[4]。
配變負(fù)荷變化影響因素有很多,其中由于用戶用電需求受氣象條件、節(jié)假日信息等因素影響,從而不同氣象條件、周末與非周末之間的負(fù)荷變化呈現(xiàn)不同規(guī)律,因此基于氣象因素、節(jié)假日信息實(shí)現(xiàn)的相似日判斷,針對(duì)不同相似日單獨(dú)開(kāi)展負(fù)荷變化分析,有助于更好挖掘負(fù)荷變化規(guī)律[5,6],提高模型預(yù)測(cè)準(zhǔn)確度。本文選取待預(yù)測(cè)日前30日的多因素?cái)?shù)據(jù),使用kmeans與輪廓系數(shù)組合的方法生成多個(gè)相似日簇。
表1 多因素?cái)?shù)據(jù)示例
依據(jù)多因素?cái)?shù)據(jù),相似日判斷方法如下:
步驟1:初始化相似日簇?cái)?shù)范圍,并按照選擇得聚類數(shù)K1,隨機(jī)選取一個(gè)樣本作為第一個(gè)聚類中心C1。計(jì)算每個(gè)樣本與當(dāng)前已有類聚中心最短距離(即與最近一個(gè)聚類中心的距離),其中距離D(X)計(jì)算原理如下,這個(gè)值越大,表示被選取作為聚類中心的概率較大。并計(jì)算每個(gè)樣本被選為下一個(gè)聚類中心的概率P(Xi),用輪盤法選出下一個(gè)聚類中心,最終獲得K個(gè)聚類中心點(diǎn)。
(1)
(2)
步驟2:對(duì)數(shù)據(jù)集中每一個(gè)點(diǎn),計(jì)算其與每一個(gè)質(zhì)心的距離D(X),離哪個(gè)質(zhì)心近,就劃分到那個(gè)質(zhì)心所屬的集合。把所有數(shù)據(jù)歸好集合后,一共有k個(gè)集合。然后重新計(jì)算每個(gè)集合的質(zhì)心。如果新計(jì)算出來(lái)的質(zhì)心和原來(lái)的質(zhì)心之間的距離小于某一個(gè)設(shè)置的閾值(表示重新計(jì)算的質(zhì)心的位置變化不大,趨于穩(wěn)定,或者說(shuō)收斂),可以認(rèn)為聚類已經(jīng)達(dá)到期望的結(jié)果,算法終止。如果新質(zhì)心和原質(zhì)心距離變化很大,則重復(fù)步驟二,待質(zhì)心變化收斂后停止。
步驟3:使用輪廓系數(shù)評(píng)估聚類簇?cái)?shù)為Ki條件下的聚類效果,其中dismeanin為該點(diǎn)與本類其他點(diǎn)的平均距離,dismeanout為該點(diǎn)與非本類點(diǎn)的平均距離。該值取值范圍為[-1,1],越接近1則說(shuō)明分類越優(yōu)秀。輪廓系數(shù)計(jì)算原理如下:
(3)
(4)
循環(huán)步驟一、步驟二、步驟三,選擇輪廓系數(shù)最大的聚類結(jié)果,獲得各相似日簇。基于相似日簇開(kāi)展不同類型日負(fù)荷曲線分析,可更加有效的挖掘負(fù)荷曲線變化規(guī)律,為模型構(gòu)建過(guò)程中的流程優(yōu)化、特征選擇和權(quán)重優(yōu)化提供支撐。
負(fù)荷日曲線變化受多種因素影響,除不同氣象、日期條件下日負(fù)荷曲線呈不同變化規(guī)律外,日負(fù)荷曲線還存在很強(qiáng)的周期性和連續(xù)性,日負(fù)荷曲線各點(diǎn)變化受其臨近的各個(gè)時(shí)間節(jié)點(diǎn)負(fù)荷值影響。故本文選擇2020年待預(yù)測(cè)日前10天同一時(shí)刻點(diǎn)值、相似日曲線同一時(shí)刻點(diǎn)前6點(diǎn)(1.5 h)數(shù)據(jù),以及節(jié)假日信息、天氣信息作為模型輸入,日負(fù)荷曲線預(yù)測(cè)模型特征輸入字段如表2所示。
表2 模型輸入特征
針對(duì)配變?nèi)肇?fù)荷曲線存在的周期性和連續(xù)序列變化規(guī)律,本文選擇強(qiáng)化集成學(xué)習(xí)梯度提升決策樹(shù)回歸(Gradient Boosting Regressor)方法構(gòu)建日負(fù)荷曲線預(yù)測(cè)模型,其相比傳統(tǒng)機(jī)器學(xué)習(xí)方法,獨(dú)有的強(qiáng)化集成學(xué)習(xí)機(jī)制可有效抑制日負(fù)荷曲線部分點(diǎn)值異常所帶來(lái)特征干擾,提高模型準(zhǔn)確度。Gradient Boosting Regressor方法每輪訓(xùn)練會(huì)迭代生成一個(gè)弱學(xué)習(xí)器,這個(gè)弱學(xué)習(xí)器擬合損失函數(shù)關(guān)于之前累積模型的梯度,然后將這個(gè)弱學(xué)習(xí)器加入累積模型中,逐漸降低累積模型的損失。即參數(shù)空間的梯度下降利用梯度信息調(diào)整參數(shù)降低損失,函數(shù)空間的梯度下降利用梯度擬合一個(gè)新的函數(shù)持續(xù)降低損失,當(dāng)模型訓(xùn)練收斂后會(huì)獲得一個(gè)由多個(gè)弱分類器組成的集成強(qiáng)分類器。
F0(x)=argminLoss(yi,h(xi))
(5)
(6)
(7)
Fm(x)=Fm-1(x)+vh(x)
(8)
上式中Fm(x)為累積模型,h(x)為迭代生成弱學(xué)習(xí)器,yi為函數(shù)目標(biāo)值,Loss函數(shù)為評(píng)估弱學(xué)習(xí)器在給定輸入yi條件下輸出結(jié)果與真實(shí)值的差距,gm為第m輪弱學(xué)習(xí)器訓(xùn)練損失函數(shù)的負(fù)梯度,v為最佳模型迭代學(xué)習(xí)率。構(gòu)建完成的配變?nèi)肇?fù)荷曲線模型對(duì)預(yù)測(cè)日曲線各點(diǎn)依次進(jìn)行預(yù)測(cè),輸出未來(lái)2日負(fù)荷曲線,模型預(yù)測(cè)流程如圖1所示。
圖1 模型預(yù)測(cè)流程
負(fù)荷過(guò)低易導(dǎo)致配變?cè)O(shè)備輕載運(yùn)行,降低電網(wǎng)運(yùn)營(yíng)效率。負(fù)荷過(guò)高易導(dǎo)致配變?cè)O(shè)備重過(guò)載運(yùn)行,增加設(shè)備故障風(fēng)險(xiǎn)。因此使電網(wǎng)運(yùn)行在合理的負(fù)荷區(qū)間,是維持電網(wǎng)安全經(jīng)濟(jì)運(yùn)行的有效保障。通過(guò)開(kāi)展負(fù)荷曲線預(yù)測(cè),提前感知配變運(yùn)行狀態(tài),是使配變運(yùn)行在合理負(fù)荷區(qū)間的重要途徑之一。模型在2020年7~8月期間,針對(duì)合肥地區(qū)25 000個(gè)配變進(jìn)行了應(yīng)用驗(yàn)證,如圖2所示,其為隨機(jī)選取的15天200個(gè)配變間,對(duì)應(yīng)點(diǎn)平均實(shí)際日負(fù)荷曲線與模型預(yù)測(cè)各對(duì)應(yīng)點(diǎn)平均日負(fù)荷曲線擬合效果。依據(jù)配變?nèi)肇?fù)荷曲線值預(yù)測(cè)結(jié)果可計(jì)算配變每日不同負(fù)載率區(qū)間時(shí)長(zhǎng)占比,全息預(yù)感知配變?nèi)者\(yùn)行負(fù)荷狀態(tài)。
圖2 預(yù)測(cè)效果擬合效果
在驗(yàn)證過(guò)程中模型選擇數(shù)據(jù)總量(150萬(wàn)條)的70%作為訓(xùn)練樣本,30%作為測(cè)試樣本,過(guò)程中數(shù)據(jù)樣本量和模型效果如表3所示,模型曲線預(yù)測(cè)準(zhǔn)確度計(jì)算原理如式(9)所示。式中tvi為單點(diǎn)預(yù)測(cè)準(zhǔn)確度,avgt為日曲線預(yù)測(cè)準(zhǔn)確度。對(duì)所有日曲線預(yù)測(cè)準(zhǔn)確度求平均可得日曲線預(yù)測(cè)平均準(zhǔn)確度,經(jīng)計(jì)算本文模型平均準(zhǔn)確度為91.33%,如表3所示。
(9)
表3 模型驗(yàn)證參數(shù)
本文首先基于氣象、節(jié)假日等信息利用特征工程和相似聚類實(shí)現(xiàn)相似日判斷,在此基礎(chǔ)上使用強(qiáng)化集成學(xué)習(xí)方法建立了一個(gè)配變?nèi)肇?fù)荷曲線預(yù)測(cè)模型,相比傳統(tǒng)回歸類算法,使用強(qiáng)化集成學(xué)習(xí)方法訓(xùn)練構(gòu)建模型,能夠基于強(qiáng)化集成學(xué)習(xí)方法獨(dú)有的強(qiáng)化集成投票融合學(xué)習(xí)機(jī)制,使模型對(duì)于數(shù)據(jù)波動(dòng)具有更好的擬合預(yù)測(cè)效果。同時(shí)通過(guò)開(kāi)展配變負(fù)荷曲線預(yù)測(cè)可數(shù)據(jù)量化配變負(fù)荷不同區(qū)間占比,實(shí)現(xiàn)配變?nèi)肇?fù)荷全景感知,更好地助力電網(wǎng)精益化管理。經(jīng)驗(yàn)證該模型可以有效預(yù)測(cè)未來(lái)2日配變負(fù)荷曲線,有效支撐電網(wǎng)調(diào)度運(yùn)行方式安排和設(shè)備運(yùn)維檢修工作。
安徽電氣工程職業(yè)技術(shù)學(xué)院學(xué)報(bào)2020年4期