徐 江,馮 雪,付兆慶,馬寶明,苗耀庭
(1.內(nèi)蒙古電力(集團(tuán))有限責(zé)任公司,呼和浩特 010010;2.巴彥淖爾電業(yè)局,內(nèi)蒙古 巴彥淖爾 015000;3.內(nèi)蒙古華電卓資發(fā)電有限公司,內(nèi)蒙古 烏蘭察布 012000)
隨著我國電力改革的深化,售電側(cè)市場逐步放開,售電公司已逐漸參與電力市場交易。截至2019年,內(nèi)蒙古電網(wǎng)電力市場交易電量超過了1400億kWh,占全社會用電量的49.8%,超過全國平均水平17個百分點。傳統(tǒng)的售電公司靠賺取差價盈利,這在供大于需的時期或地區(qū)比較合適,但2019年以來蒙西地區(qū)電力供需形勢已發(fā)生轉(zhuǎn)變,呈現(xiàn)出整體緊平衡、局部供需緊張的狀態(tài)。
電力負(fù)荷預(yù)測是能量管理系統(tǒng)(EMS)的一個重要組成部分,是電力現(xiàn)代化管理不可或缺的技術(shù)手段。用電企業(yè)用電行為受行業(yè)性質(zhì)、環(huán)境變化、交易電價等因素影響,售電公司增強(qiáng)其代理用戶用電行為的分析和負(fù)荷預(yù)測,對制訂合理的交易計劃和規(guī)避違約考核風(fēng)險具有重要意義[1]。
近年來,關(guān)于負(fù)荷預(yù)測的研究成果眾多,各種預(yù)測方法(包括神經(jīng)網(wǎng)絡(luò)法、時間序列法、回歸分析法、支持向量機(jī)法、模糊預(yù)測法等)各具特點,但由于影響負(fù)荷變化的因素較多,且各因素之間存在較強(qiáng)的相關(guān)性,造成傳統(tǒng)預(yù)測方法的準(zhǔn)確性和普適性較差[2-5]。本文提出一種基于主成分分析(PCA)和正則化人工神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測模型,能夠適應(yīng)售電公司中短期電力負(fù)荷預(yù)測的最新需求[2]。
海量的變量樣本數(shù)據(jù)中蘊(yùn)含了豐富的信息,但各變量之間存在信息重疊情況,增加了數(shù)據(jù)挖掘的工作量和分析研究的復(fù)雜性。為了在減少變量樣本的同時,盡量保留原變量包含的信息,需對樣本數(shù)據(jù)進(jìn)行降維處理。數(shù)據(jù)降維算法有很多,比如獨立成分分析、因子分析、自組織特征映射、主成分分析(PCA)等。其中主成分分析是統(tǒng)計學(xué)中一種常見的降維算法,通過正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)變量,可以很好地解決因變量太多造成計算復(fù)雜、計算量增大的弊端。
PCA的基本思想是將n維的特征變量映射到k維上(k 假設(shè)一個樣本庫X觀測n個樣品,m個變量X1,X2,…,Xm的數(shù)據(jù)矩陣為: PCA首先將m個觀測變量通過線性組合獲得m個新的綜合變量,即 其中,F(xiàn)1的Var( F1)最大,為第一主成分,F(xiàn)2的Var( F2)次之,為第二主成分,依此類推。A稱為主成分系數(shù)矩陣,a ij(i=1,2,3,…,m;j=1,2,3,…,m)為主成分系數(shù)。求解主成分系數(shù)就是提取主成分所要解決的問題[4]。 PCA的基本流程如圖1所示,主要過程如下。 圖1 PCA流程圖 (1)數(shù)據(jù)標(biāo)準(zhǔn)化處理:主要包括數(shù)據(jù)中心化和數(shù)據(jù)歸一化處理,目的是消除量綱、數(shù)據(jù)自身變異及數(shù)據(jù)量級差異對變量分析的影響。 (2)計算協(xié)方差矩陣,將各個特征的方差和不同特征之間的協(xié)方差表示出來。 (3)求解協(xié)方差矩陣的特征值及對應(yīng)的特征向量。 (4)將特征向量按照對應(yīng)特征值由大到小排序,組成變換矩陣,計算主成分矩陣。 (5)用特征值計算方差累計貢獻(xiàn)率,取累計貢獻(xiàn)率超過80%的前i個主成分,作為新的主成分變量。 人工神經(jīng)網(wǎng)絡(luò)是一種信息響應(yīng)網(wǎng)狀拓?fù)浣Y(jié)構(gòu),具有較快的處理速度和較強(qiáng)的容錯能力[6-8]。BP神經(jīng)網(wǎng)絡(luò)是通過計算輸出層與期望值之間的誤差來調(diào)整網(wǎng)絡(luò)參數(shù),從而使誤差變小。BP神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層和輸出層。相鄰各層神經(jīng)元之間由權(quán)重系數(shù)相互連接,輸入信號經(jīng)過傳遞函數(shù)的作用由輸入層傳播到隱含層,再由隱含層傳播到輸出層,最后得到輸出結(jié)果,完成一次訓(xùn)練。以3層BP神經(jīng)網(wǎng)絡(luò)為例,結(jié)構(gòu)如圖2所示[5]。 在訓(xùn)練過程中,定義第n次迭代后所有輸入數(shù)據(jù)的期望輸出和實際輸出之間誤差的平方和為目標(biāo)函數(shù)E(n): 式中:ti為第i個神經(jīng)元的期望輸出;Zi為第i個神經(jīng)元的實際輸出;p為輸出層神經(jīng)元個數(shù)。當(dāng)E(n)滿足目標(biāo)值時,實際輸出和期望輸出達(dá)到一致,網(wǎng)絡(luò)訓(xùn)練結(jié)束,BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程如圖3所示[6]。 圖3 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練流程圖 在傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,受網(wǎng)絡(luò)結(jié)構(gòu)、節(jié)點數(shù)目以及訓(xùn)練數(shù)據(jù)質(zhì)量的影響,有可能出現(xiàn)過擬合情況,導(dǎo)致訓(xùn)練好的網(wǎng)絡(luò)泛化能力差。一般的神經(jīng)網(wǎng)絡(luò)工具箱會將樣本數(shù)據(jù)集分成訓(xùn)練樣本、驗證樣本及測試樣本3個部分,使用訓(xùn)練樣本得到多個模型,利用驗證樣本計算各模型的誤差,選取誤差最小的模型計算測試樣本的泛化誤差,評價模型的泛化能力。為進(jìn)一步解決過擬合問題,利用神經(jīng)網(wǎng)絡(luò)正則化,在原目標(biāo)函數(shù)E(n)的基礎(chǔ)上加入約束項,避免網(wǎng)絡(luò)模型一味追求誤差最小而導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)過于復(fù)雜,過度擬合訓(xùn)練樣本中的噪聲特征而影響模型訓(xùn)練結(jié)果,以達(dá)到更好的推廣能力,目標(biāo)函數(shù)變?yōu)椋?/p> 通過增加約束項E(ω)和調(diào)整α,β的大小,在保證網(wǎng)絡(luò)訓(xùn)練誤差減小的同時使網(wǎng)絡(luò)連接權(quán)重盡可能少,相當(dāng)于減小網(wǎng)絡(luò)規(guī)模,提高泛化能力。 以某售電公司所代理用戶典型年度3月13日至4月20日的每日負(fù)荷值及當(dāng)天最高溫度、最低溫度、平均溫度、日期類型作為數(shù)據(jù)樣本,以前7天的負(fù)荷值及預(yù)測當(dāng)天的最高溫度、最低溫度、平均溫度為協(xié)變量,日期類型為分類變量(工作日定為1,節(jié)假日定為0)作為BP網(wǎng)絡(luò)的輸入,預(yù)測當(dāng)天的負(fù)荷值作為輸出,創(chuàng)建32個樣本集進(jìn)行訓(xùn)練[7]。 首先將樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,消除不同數(shù)據(jù)類型對結(jié)果的影響。由標(biāo)準(zhǔn)化處理后的樣本數(shù)據(jù)可得到特征值和方差貢獻(xiàn)率(見表1)。由于前4個分量的累計貢獻(xiàn)率已超過80%,包含了絕大部分的數(shù)據(jù)信息量,因此選擇前4個主成分,主成分系數(shù)見表2。 表1 特征值和方差貢獻(xiàn)率 表2 主成分系數(shù) BP神經(jīng)網(wǎng)絡(luò)具有尋優(yōu)能力強(qiáng)的特點,但容易陷入局部最優(yōu)的陷阱,造成網(wǎng)絡(luò)模型過擬合,算法魯棒性差[9-11]。利用貝葉斯正則化方法自適應(yīng)調(diào)整α,β的大小,優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,既可壓縮網(wǎng)絡(luò)模型,又能避免網(wǎng)絡(luò)陷入局部最小的問題,提高模型泛化能力。具體步驟如下: (1)選取前4個主成分進(jìn)行建模,預(yù)測輸出為當(dāng)日負(fù)荷值,所以確定BP神經(jīng)網(wǎng)絡(luò)輸入層為4,輸出層為1,通過經(jīng)驗及試湊法,選擇1個隱含層,傳遞函數(shù)選用log-sigmoid型函數(shù)。 (2)將32個樣本中的20個作為訓(xùn)練集,6個作為驗證集,6個作為測試集,用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)并驗證測試網(wǎng)絡(luò)模型的性能。 (3)確定網(wǎng)絡(luò)結(jié)構(gòu)及樣本集后,利用神經(jīng)網(wǎng)絡(luò)工具箱對樣本進(jìn)行訓(xùn)練,訓(xùn)練結(jié)果如圖4所示。 圖4 神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果散點圖 圖4給出樣本集訓(xùn)練后的數(shù)據(jù)擬合情況,可以看出樣本訓(xùn)練情況較好,實際輸出和期望輸出之間誤差在允許范圍內(nèi),達(dá)到了網(wǎng)絡(luò)訓(xùn)練的要求。利用神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到的網(wǎng)絡(luò)模型對樣本集的電力負(fù)荷進(jìn)行預(yù)測,結(jié)果如圖5所示,預(yù)測值與實際值的相對誤差如圖6所示,誤差范圍為[-0.03,0.01]。 圖5 PCA-BP神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測結(jié)果 圖6 PCA-BP神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測相對誤差 利用時間序列預(yù)測法以及不含主成分提取的原始數(shù)據(jù)及正則化約束的BP網(wǎng)絡(luò)模型對樣本數(shù)據(jù)進(jìn)行訓(xùn)練預(yù)測,與本文訓(xùn)練方法的結(jié)果進(jìn)行對比分析,結(jié)果見表3。 表3 時間序列、BP神經(jīng)網(wǎng)絡(luò)以及PCA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果對比 由表3可見,時間序列預(yù)測法得到的結(jié)果與實際值偏差較大,主要原因為時間序列預(yù)測法只利用歷史負(fù)荷數(shù)據(jù)的趨勢進(jìn)行統(tǒng)計分析,未考慮溫度以及日期類型對用電負(fù)荷的影響[12]。而基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測值與實際值較為接近,但因為樣本集之間關(guān)聯(lián)性較強(qiáng)且輸入樣本較多,造成網(wǎng)絡(luò)模型復(fù)雜,存在過擬合現(xiàn)象[13-16],導(dǎo)致有些時間的預(yù)測值偏離實際值較大;基于主成分分析和正則化約束的BP神經(jīng)網(wǎng)絡(luò)模型簡捷有效,對訓(xùn)練集外的樣本預(yù)測準(zhǔn)確率較高。 本文利用主成分分析法對影響負(fù)荷變化的變量進(jìn)行降維,消除各變量間重疊的信息,同時簡化了網(wǎng)絡(luò)模型,然后利用增加正則化約束項的BP神經(jīng)網(wǎng)絡(luò)對樣本集進(jìn)行訓(xùn)練,避免模型過擬合,得到負(fù)荷預(yù)測網(wǎng)絡(luò)模型。通過與未采用主成分分析及添加正則化項的BP神經(jīng)網(wǎng)絡(luò)模型和時間序列法預(yù)測的結(jié)果進(jìn)行對比,驗證了該方法的正確性和優(yōu)勢,研究方法可供電力用戶、售電公司以及其他電力市場參與者參考。1.2 PCA數(shù)學(xué)模型
1.3 PCA步驟
2 正則化神經(jīng)網(wǎng)絡(luò)模型
2.1 BP神經(jīng)網(wǎng)絡(luò)
2.2 神經(jīng)網(wǎng)絡(luò)正則化
3 基于PCA與BP神經(jīng)網(wǎng)絡(luò)的負(fù)荷預(yù)測模型
3.1 主成分提取
3.2 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練
3.3 結(jié)果對比分析
4 結(jié)語