許青,張齡之,梁琛,李亞昕
(1.國(guó)網(wǎng)甘肅省電力公司,甘肅 蘭州 730030;2.國(guó)網(wǎng)甘肅省電力公司電力科學(xué)研究院,甘肅 蘭州 730070)
隨著我國(guó)“雙碳”目標(biāo)的提出,以高比例新能源接入為典型特征的新型電力系統(tǒng)建設(shè)不斷發(fā)展[1]。截至2023年4月底,全國(guó)非化石能源發(fā)電裝機(jī)容量13.5億kW,占總裝機(jī)容量的50.8%,其中風(fēng)電裝機(jī)3.8億kW,太陽(yáng)能發(fā)電裝機(jī)4.4億kW[2]。風(fēng)光等新能源發(fā)電具有的隨機(jī)性和波動(dòng)性特征,使得高比例新能源滲透率電網(wǎng)的短期負(fù)荷預(yù)測(cè)不僅受到天氣、日期、經(jīng)濟(jì)等條件的影響,也需要考慮新能源的發(fā)電情況[3-5]。
精準(zhǔn)的負(fù)荷預(yù)測(cè)對(duì)電力系統(tǒng)的安全、穩(wěn)定、經(jīng)濟(jì)運(yùn)行具有重要意義。當(dāng)前,常見(jiàn)的預(yù)測(cè)方法主要有傳統(tǒng)統(tǒng)計(jì)學(xué)方法和人工智能方法2類(lèi)。前者包括回歸分析法、馬爾科夫鏈、時(shí)間序列法等,優(yōu)點(diǎn)在于原理簡(jiǎn)單易懂,計(jì)算快捷,但非線性擬合能力不強(qiáng),預(yù)測(cè)效果較差。后者包括支持向量機(jī)(support vector regression,SVR)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)及其相關(guān)改進(jìn)網(wǎng)絡(luò)如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、時(shí)間卷積網(wǎng)絡(luò)(temporal convolutional network,TCN)、長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)等[6-11]。這類(lèi)算法一般將影響預(yù)測(cè)項(xiàng)的各種特征量和預(yù)測(cè)項(xiàng)分別作為輸入項(xiàng)和輸出項(xiàng),通過(guò)大量訓(xùn)練求解,非線性擬合能力較強(qiáng),但預(yù)測(cè)結(jié)果受輸入項(xiàng)選擇影響較大。此外,SVR和CNN對(duì)數(shù)據(jù)的時(shí)序特性考慮不多,而TCN針對(duì)時(shí)序問(wèn)題對(duì)CNN進(jìn)行了改進(jìn),有效降低了預(yù)測(cè)誤差,被廣泛應(yīng)用在機(jī)組出力預(yù)測(cè)、負(fù)荷預(yù)測(cè)等場(chǎng)景中。
文獻(xiàn)[12]提出一種CNN-SVR聯(lián)合負(fù)荷預(yù)測(cè)模型,指出其預(yù)測(cè)結(jié)果準(zhǔn)確率比SVR、CNN等方法更高;文獻(xiàn)[13]提出基于雙向LSTM的超短期負(fù)荷預(yù)測(cè)模型,指出通過(guò)篩選網(wǎng)絡(luò)輸入項(xiàng)有利于提高預(yù)測(cè)精度;文獻(xiàn)[14]同樣指出提取關(guān)鍵特征值能夠提高預(yù)測(cè)模型的準(zhǔn)確性。但上述研究都缺乏對(duì)預(yù)測(cè)結(jié)果的修正環(huán)節(jié)。文獻(xiàn)[15]將歷史光伏出力數(shù)據(jù)與天氣預(yù)報(bào)相關(guān)聯(lián),提出一種考慮時(shí)序動(dòng)態(tài)回歸的短期光伏出力預(yù)測(cè)方法;文獻(xiàn)[16]對(duì)風(fēng)電出力預(yù)測(cè)展開(kāi)研究,指出針對(duì)不同天氣類(lèi)型,分別建立預(yù)測(cè)模型能夠改進(jìn)預(yù)測(cè)結(jié)果??梢钥闯觯F(xiàn)有預(yù)測(cè)研究往往集中在風(fēng)、光出力和負(fù)荷等單一場(chǎng)景預(yù)測(cè),很少將風(fēng)光出力因素納入負(fù)荷預(yù)測(cè)的研究范圍。而在高比例新能源電力系統(tǒng)中,風(fēng)光等新能源的隨機(jī)性與間歇性大大增加了電網(wǎng)調(diào)度的難度,在該場(chǎng)景下,有必要將新能源出力納入負(fù)荷預(yù)測(cè)研究范圍。文獻(xiàn)[17-19]對(duì)風(fēng)光聯(lián)合場(chǎng)景下的分布式電源規(guī)劃等進(jìn)行研究,為本文提供了參考。
綜上,本文提出基于聯(lián)合時(shí)序場(chǎng)景的改進(jìn)型TCN高比例新能源電網(wǎng)短期負(fù)荷預(yù)測(cè)方法。首先通過(guò)相關(guān)性距離刻畫(huà)風(fēng)光出力和負(fù)荷的聯(lián)合場(chǎng)景特性,將負(fù)荷預(yù)測(cè)場(chǎng)景進(jìn)行分類(lèi);然后建立隨機(jī)森林(random forest)-時(shí)間卷積網(wǎng)絡(luò)(RF-TCN)預(yù)測(cè)模型,并通過(guò)Bootstrap對(duì)預(yù)測(cè)結(jié)果進(jìn)行修正;最后,以甘肅某地實(shí)際電網(wǎng)為例進(jìn)行仿真驗(yàn)證,驗(yàn)證本文所提方法的有效性。
隨著新型電力系統(tǒng)建設(shè)的不斷推進(jìn),我國(guó)電力系統(tǒng)新能源滲透率將不斷提高。本文所提負(fù)荷預(yù)測(cè)方法的核心在于考慮了風(fēng)光等新能源出力因素,并基于風(fēng)光出力與負(fù)荷關(guān)聯(lián)度劃分成不同預(yù)測(cè)場(chǎng)景。具體過(guò)程包括負(fù)荷與新能源出力相關(guān)性分析、RF-TCN短期負(fù)荷預(yù)測(cè)模型建立、未來(lái)負(fù)荷預(yù)測(cè)3個(gè)步驟,整體模型框架如圖1所示。
圖1 模型結(jié)構(gòu)框圖Fig.1 Model framework
整體模型簡(jiǎn)述如下:
步驟1:利用3σ準(zhǔn)則剔除異常數(shù)據(jù)后,對(duì)負(fù)荷與新能源出力進(jìn)行聯(lián)合時(shí)序場(chǎng)景分析,并劃分成不同的預(yù)測(cè)場(chǎng)景,方便后續(xù)對(duì)不同負(fù)荷預(yù)測(cè)場(chǎng)景進(jìn)行精細(xì)化建模。
步驟2:建立改進(jìn)型RF-TCN負(fù)荷預(yù)測(cè)模型,通過(guò)RF算法對(duì)負(fù)荷預(yù)測(cè)特征量進(jìn)行篩選,訓(xùn)練模型參數(shù),并加入預(yù)測(cè)結(jié)果修正環(huán)節(jié)。
步驟3:利用常規(guī)預(yù)測(cè)方法對(duì)預(yù)測(cè)日風(fēng)光負(fù)荷進(jìn)行預(yù)測(cè),判別預(yù)測(cè)日所屬天氣類(lèi)型,選取對(duì)應(yīng)預(yù)測(cè)模型。
3σ準(zhǔn)則是異常數(shù)據(jù)識(shí)別的常見(jiàn)方法,其內(nèi)涵在于將數(shù)值分布在均值3個(gè)標(biāo)準(zhǔn)差之外的數(shù)據(jù)看作異常數(shù)據(jù)并剔除。本文首先分析處理風(fēng)光負(fù)荷歷史數(shù)據(jù),接著考慮各場(chǎng)景下新能源出力曲線和負(fù)荷曲線之間的相關(guān)性,構(gòu)建聯(lián)合時(shí)序場(chǎng)景曲線如下:
(1)
式中:α、β、χ、Q分別為光伏出力、風(fēng)電出力、負(fù)荷和風(fēng)光負(fù)荷聯(lián)合時(shí)序場(chǎng)景曲線;T為數(shù)據(jù)序列中的時(shí)段數(shù)。
引入指標(biāo)δ刻畫(huà)聯(lián)合時(shí)序場(chǎng)景下風(fēng)光負(fù)荷相關(guān)性:
(2)
式中:αi,t、βi,t和χi,t分別為i日t時(shí)段的光伏出力、風(fēng)電出力和電網(wǎng)負(fù)荷;δi為i日風(fēng)光負(fù)荷相關(guān)性距離向量,其數(shù)值含義為負(fù)荷中風(fēng)光新能源發(fā)電以外的發(fā)電量;Ji為i日風(fēng)光負(fù)荷相關(guān)性距離向量。
假定A、B這2日的風(fēng)光負(fù)荷相關(guān)性距離分別是δA、δB,該2日相似性用式(3)衡量,該值越大,則相似性越低:
(3)
式中λAB為A、B 2日的日間相似度指標(biāo)。
綜上,可通過(guò)風(fēng)光負(fù)荷相關(guān)性距離劃分出不同天氣類(lèi)型,并通過(guò)日間相似度指標(biāo)評(píng)價(jià)聚類(lèi)結(jié)果。
對(duì)影響負(fù)荷預(yù)測(cè)的各種因素進(jìn)行篩選有利于提高TCN負(fù)荷預(yù)測(cè)的準(zhǔn)確性。本章首先通過(guò)RF算法篩選影響負(fù)荷預(yù)測(cè)的關(guān)鍵特征量,然后利用TCN進(jìn)行負(fù)荷預(yù)測(cè)。
RF算法常用于對(duì)非線性數(shù)據(jù)進(jìn)行回歸和分類(lèi),核心結(jié)構(gòu)為決策樹(shù),每顆決策樹(shù)都進(jìn)行預(yù)測(cè),然后通過(guò)加權(quán)或取最大值等方法得到預(yù)測(cè)結(jié)果。圖2所示為RF算法結(jié)構(gòu)。
圖2 隨機(jī)森林算法示意圖Fig.2 Diagrammatic sketch of RF algorithm
RF算法基于重要性程度進(jìn)行特征量提取時(shí),通常通過(guò)基尼指數(shù)(Gini index,GI)或袋外數(shù)據(jù)錯(cuò)誤率2種指標(biāo)來(lái)衡量?;贕I的方式介紹如下。
設(shè)定原始數(shù)據(jù)具有K個(gè)特征量,X1,X2,X3,…,XK,以及H個(gè)種類(lèi),則在決策樹(shù)節(jié)點(diǎn)m的GI為
(4)
式中3σ為節(jié)點(diǎn)m的樣本屬于第h類(lèi)的概率估計(jì)值。
特征量Xk在節(jié)點(diǎn)m的重要性程度VGI,km通過(guò)其分枝前后ηGI的變化量表示為
VGI,km=ηGI,m-ηGI,q-ηGI,r.
(5)
式中ηGI,q和ηGI,r為節(jié)點(diǎn)m分枝后2個(gè)新節(jié)點(diǎn)q和r的GI。
假定一共有Z棵決策樹(shù),則特征量Xk在第z棵樹(shù)的重要性
(6)
式中M為特征量Xk在第z棵決策樹(shù)中的節(jié)點(diǎn)集合。VGI,km通過(guò)式(4)、(5)求取。特征量Xk的重要性
(7)
綜上,通過(guò)式(4)—式(7),實(shí)現(xiàn)數(shù)據(jù)原始特征量的排序和篩選。
TCN是在CNN基礎(chǔ)上的改進(jìn)網(wǎng)絡(luò),適用于處理時(shí)序問(wèn)題。TCN具有一種擴(kuò)張因果卷積結(jié)構(gòu),能夠?qū)ι弦粚拥妮斎霐?shù)據(jù)進(jìn)行擴(kuò)張采樣,提取各種時(shí)序數(shù)據(jù)的特征。因果卷積能夠保證提取特征信息的因果性,t時(shí)刻的輸出yt依賴t及t時(shí)刻之前的輸入x0,x1,xt-2,…,xt-1。對(duì)于卷積核為2,擴(kuò)張系數(shù)為別為1、2、4的TCN,擴(kuò)張因果卷積結(jié)構(gòu)如圖3所示。
圖3 TCN擴(kuò)張因果卷積結(jié)構(gòu)Fig.3 Dilated causal convolution structure of TCN
TCN擴(kuò)張因果卷積通過(guò)跳過(guò)部分輸入,將卷積核拓展到更大的區(qū)域,通過(guò)改變膨脹系數(shù)d調(diào)整輸出數(shù)據(jù)所接收到的信息量。對(duì)于一維時(shí)序數(shù)據(jù)的輸入x∈Rn(Rn為n維實(shí)數(shù)空間)和濾波器f能夠通過(guò)濾波器系數(shù)u和膨脹系數(shù)d擴(kuò)張視野,卷積運(yùn)算如下[11]:
(8)
式中xs-d·i為輸入序列。
考慮高比例新能源電網(wǎng)中風(fēng)光出力對(duì)負(fù)荷預(yù)測(cè)的影響,聯(lián)合時(shí)序場(chǎng)景法將歷史日期數(shù)據(jù)歸類(lèi)。各個(gè)預(yù)測(cè)模型以相似日為基礎(chǔ)進(jìn)行訓(xùn)練。將待預(yù)測(cè)日前2日的負(fù)荷、風(fēng)光出力數(shù)據(jù)和經(jīng)RF提取的關(guān)鍵特征量作為模型輸入,而模型輸出為預(yù)測(cè)日的負(fù)荷預(yù)測(cè)結(jié)果。
此外,在進(jìn)行網(wǎng)絡(luò)訓(xùn)練時(shí),需要對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)處理,本文采用歸一化方法,將輸入量中的負(fù)荷、氣溫、風(fēng)速等數(shù)值歸一化,而對(duì)于日期、星期、節(jié)假日等輸入量則另做處理[20-21]。
(9)
本文的負(fù)荷預(yù)測(cè)結(jié)果是1日96個(gè)時(shí)段的負(fù)荷預(yù)測(cè)值,是一個(gè)有關(guān)時(shí)間的序列,各預(yù)測(cè)點(diǎn)對(duì)應(yīng)的負(fù)荷預(yù)測(cè)誤差也構(gòu)成一個(gè)時(shí)間序列。為了提升模型預(yù)測(cè)的準(zhǔn)確性,本文引入Bootstrap算法構(gòu)建預(yù)測(cè)誤差修正模型。
Bootstrap是用于估計(jì)統(tǒng)計(jì)量的采樣方法,它通過(guò)從樣本中有放回地抽取(即每次抽取都從全部樣本中抽取)多個(gè)子樣本,得到該統(tǒng)計(jì)量的抽樣分布,并由此計(jì)算置信區(qū)間。在Bootstrap中,通過(guò)計(jì)算每個(gè)子樣本與全樣本均值的差異來(lái)估計(jì)偏差。因此,利用Bootstrap對(duì)負(fù)荷預(yù)測(cè)誤差的分布特性進(jìn)行統(tǒng)計(jì)推斷,并設(shè)置對(duì)應(yīng)的置信度區(qū)間劃分不同預(yù)測(cè)誤差范圍。當(dāng)負(fù)荷預(yù)測(cè)誤差在區(qū)間內(nèi),則不修正預(yù)測(cè)數(shù)據(jù),當(dāng)負(fù)荷預(yù)測(cè)誤差在區(qū)間外,則需要修正。具體計(jì)算原理見(jiàn)文獻(xiàn)[22]。
此外,常見(jiàn)的負(fù)荷預(yù)測(cè)評(píng)價(jià)指標(biāo)有均方根誤差(mean square error,MSE)和平均百分比誤差(mean absolute percentage error,MAPE)2項(xiàng)[1,23-25],本文創(chuàng)新性地引入最大絕對(duì)誤差(maximum absolute error,MAE)來(lái)評(píng)價(jià)負(fù)荷預(yù)測(cè)的準(zhǔn)確度,衡量負(fù)荷預(yù)測(cè)方法的局部最大誤差。
(10)
(11)
(12)
式中:ρMSE、ρMAE、ρMAPE分別為負(fù)荷預(yù)測(cè)的均方誤差、最大絕對(duì)誤差和平均百分比誤差;3σ、3σ為負(fù)荷預(yù)測(cè)真實(shí)值和預(yù)測(cè)值。
本文使用甘肅省某地區(qū)2022年1月1日至2022年12月31日的數(shù)據(jù)對(duì)所提出的負(fù)荷預(yù)測(cè)模型進(jìn)行仿真驗(yàn)證。截至2022年底,甘肅全省電力裝機(jī)容量6 803萬(wàn)kW,包括風(fēng)電2 076萬(wàn)kW、光伏1 445萬(wàn)kW,新能源裝機(jī)占比52%??梢?jiàn),利用甘肅省相關(guān)數(shù)據(jù)對(duì)高比例新能源電網(wǎng)的負(fù)荷預(yù)測(cè)問(wèn)題進(jìn)行研究具有高度適用性。
通過(guò)第2章述方法,在利用3σ準(zhǔn)則剔除異常數(shù)據(jù)后,針對(duì)365個(gè)風(fēng)光負(fù)荷的相關(guān)性開(kāi)展聯(lián)合分析。受制于當(dāng)前數(shù)據(jù)樣本數(shù)目不足,本文認(rèn)為采用更多的分類(lèi)意味著每類(lèi)情況下樣本量降低,不利于TCN網(wǎng)絡(luò)的訓(xùn)練效果。因此,以1月1日為對(duì)比日,求取各日與該日的相似性距離,并據(jù)此將天氣共分為5種類(lèi)別,如圖4所示(日期序號(hào)1對(duì)應(yīng)1月2日,364對(duì)應(yīng)12月31日,其他以此類(lèi)推),各類(lèi)別數(shù)目見(jiàn)表1。
表1 各日與1月1日相似性距離聚類(lèi)類(lèi)別數(shù)Tab.1 Clustering classification numbers of similarity distance between each day and January 1st
圖4 各日與1月1日相似性距離聚類(lèi)結(jié)果Fig.4 Clustering results of similarity distance between each day and January 1st
由圖4可見(jiàn),各個(gè)類(lèi)型的天氣僅有第1種和第5種相對(duì)日期而言比較集中,其余3種分布較為分散。具體而言,第1種類(lèi)型主要對(duì)應(yīng)冬季,第5種對(duì)應(yīng)的季節(jié)主要為夏季。這是因?yàn)楸疚牡娜掌谙嗨贫戎笜?biāo)〔式(2)和式(3)〕,本質(zhì)上是衡量該日期負(fù)荷中除風(fēng)光出力外其余負(fù)荷曲線的相似度,在冬季/夏季時(shí),風(fēng)電和光伏發(fā)電對(duì)負(fù)荷曲線的影響更集中。
以氣象、日期因素等構(gòu)建影響負(fù)荷預(yù)測(cè)的特征集,見(jiàn)表2所示。然后通過(guò)RF對(duì)特征量重要性進(jìn)行排序,圖5所示為重要性分析結(jié)果。
表2 影響負(fù)荷預(yù)測(cè)的特征量Tab.2 Characteristic quantities affecting load prediction
圖5 隨機(jī)森林特征變量重要性分析結(jié)果Fig.5 Importance analysis results of RF algorithm
由圖5可知在選定的11個(gè)特征量中,前6個(gè)重要性得分較高,因此選取小時(shí)、最低氣溫、節(jié)假日、分時(shí)電價(jià)、平均氣溫、月份和待預(yù)測(cè)日前2日的負(fù)荷、風(fēng)光出力數(shù)據(jù)作為輸入項(xiàng)。
分別用本文模型和傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)、SVM和不含預(yù)測(cè)修正的TCN方法對(duì)2022年12月31日數(shù)據(jù)進(jìn)行負(fù)荷預(yù)測(cè)。其中BP神經(jīng)網(wǎng)絡(luò)、SVM這2種方法不劃分天氣類(lèi)型,且不修正預(yù)測(cè)結(jié)果。不經(jīng)分類(lèi)和不經(jīng)修正方法與本文方法的區(qū)別僅在于不經(jīng)天氣類(lèi)型劃分且不經(jīng)預(yù)測(cè)誤差修正,其余部分相同。各種方法的預(yù)測(cè)結(jié)果、預(yù)測(cè)結(jié)果MAE和預(yù)測(cè)結(jié)果評(píng)價(jià)依次如圖6、圖7和表3所示。需要說(shuō)明的是,在本文的RF提取部分,已經(jīng)考慮預(yù)測(cè)日是否為工作日等因素,并得到影響負(fù)荷預(yù)測(cè)的關(guān)鍵特征量作為T(mén)CN的輸入項(xiàng),因此預(yù)測(cè)日是否為工作日等因素對(duì)預(yù)測(cè)模型沒(méi)有影響。
表3 不同預(yù)測(cè)方法結(jié)果評(píng)價(jià)Tab.3 Evaluation of the results of different prediction methods
圖6 不同預(yù)測(cè)方法預(yù)測(cè)結(jié)果Fig.6 Prediction results of different prediction methods
圖7 不同預(yù)測(cè)方法預(yù)測(cè)結(jié)果MAE Fig.7 Absolute errors of prediction results of different prediction methods
分析圖6、圖7和表3,得出如下結(jié)論:
a)本文預(yù)測(cè)方法的預(yù)測(cè)精度明顯優(yōu)于其他方法,MAE為2.62%,MSE為16.55 MW,而MAPE為1.65%,就MAE和MAPE這2個(gè)指標(biāo)而言,相較其他方法分別提高了36%、43%、19%、11%和46%、48%、19%、10%,預(yù)測(cè)效果好。
b)BP神經(jīng)網(wǎng)絡(luò)和SVM預(yù)測(cè)精度明顯劣于其他3種方法,原因在于模型較為簡(jiǎn)單,沒(méi)有深層挖掘數(shù)據(jù)信息。
c)通過(guò)對(duì)比本文方法、不經(jīng)天氣類(lèi)型分類(lèi)方法和不經(jīng)預(yù)測(cè)誤差修正方法發(fā)現(xiàn),不經(jīng)預(yù)測(cè)誤差修正方法的預(yù)測(cè)精度略優(yōu)于不經(jīng)天氣類(lèi)型分類(lèi)方法,這說(shuō)明,有必要對(duì)含大規(guī)模新能源電網(wǎng)進(jìn)行天氣類(lèi)型劃分,以及對(duì)負(fù)荷預(yù)測(cè)結(jié)果進(jìn)行誤差修正。
針對(duì)高比例新能源并網(wǎng)電網(wǎng),提出一種基于聯(lián)合時(shí)序場(chǎng)景的改進(jìn)型TCN短期負(fù)荷預(yù)測(cè)方法。通過(guò)算例仿真,得出結(jié)論:
a)為充分考慮新能源出力對(duì)負(fù)荷預(yù)測(cè)的影響,通過(guò)聯(lián)合時(shí)序場(chǎng)景法劃分不同負(fù)荷預(yù)測(cè)場(chǎng)景,分別建立預(yù)測(cè)模型,能提升預(yù)測(cè)精度。
b)利用TCN充分考慮負(fù)荷的時(shí)序特征,并通過(guò)RF算法提取影響負(fù)荷預(yù)測(cè)的關(guān)鍵特征量,能提高預(yù)測(cè)精度。
c)通過(guò)Bootstrap算法對(duì)預(yù)測(cè)結(jié)果進(jìn)行修正能夠提升預(yù)測(cè)準(zhǔn)確性。
仿真結(jié)果表明,本文方法能夠有效提高預(yù)測(cè)精度,并較好地解決高比例新能源電網(wǎng)的短期負(fù)荷預(yù)測(cè)問(wèn)題。