王欣,謝文華,張利君
(東北電力大學(xué)經(jīng)濟(jì)管理學(xué)院,吉林 吉林 132000)
隨著我國(guó)經(jīng)濟(jì)快速增長(zhǎng),地區(qū)電力需求也呈現(xiàn)新的波動(dòng)特征。傳統(tǒng)的預(yù)測(cè)模型不能將用電量數(shù)據(jù)與電力需求的宏觀影響因素有效融合,難以對(duì)新形勢(shì)下地區(qū)電力需求進(jìn)行合理判斷。因此,深入研究電力需求預(yù)測(cè)模型對(duì)電網(wǎng)的科學(xué)規(guī)劃與合理投資具有重要意義。已有學(xué)者對(duì)電力需求的預(yù)測(cè)進(jìn)行了研究。一些學(xué)者應(yīng)用歷史用電量數(shù)據(jù)的時(shí)間序列變化規(guī)律對(duì)地區(qū)電力需求進(jìn)行預(yù)測(cè)。例如田星等基于適應(yīng)“S”形增長(zhǎng)的動(dòng)態(tài)灰色Verhulst模型對(duì)寧夏回族自治區(qū)的電力需求進(jìn)行預(yù)測(cè)[1];史靜等通過(guò)對(duì)江蘇省各區(qū)域用電量增速及電力消費(fèi)彈性系數(shù)的探討,對(duì)“十三五”期間江蘇省電力需求進(jìn)行分析[2];陳寶平構(gòu)建優(yōu)化的灰色馬爾科夫模型對(duì)內(nèi)蒙古自治區(qū)的電力需求展開(kāi)預(yù)測(cè)[3]。還有一些學(xué)者基于對(duì)電力需求影響因素的分析對(duì)其進(jìn)行預(yù)測(cè)。例如夏翔等基于經(jīng)濟(jì)發(fā)展、人口與社會(huì)發(fā)展、電網(wǎng)結(jié)構(gòu)與管理水平等指標(biāo),利用灰色模型疊加小波分解結(jié)果對(duì)電力需求進(jìn)行預(yù)測(cè)[4];黃元生等采用PSO算法對(duì)協(xié)方差函數(shù)中的參數(shù)進(jìn)行優(yōu)化,將修正后的參數(shù)作為初始值構(gòu)建GPR電力需求預(yù)測(cè)模型[5];田書(shū)欣等從經(jīng)濟(jì)、產(chǎn)業(yè)、用電環(huán)境等方面對(duì)電力需求的影響因素進(jìn)行分析,并基于PIO-SVM模型對(duì)區(qū)域電網(wǎng)的電力需求展開(kāi)預(yù)測(cè)[6]。
雖然有關(guān)電力需求的預(yù)測(cè)方法較多,但未能將原始用電量數(shù)據(jù)與其影響因素在電力需求預(yù)測(cè)中的重要程度進(jìn)行綜合考慮。基于此,本文提出了一種基于Shapley值的組合預(yù)測(cè)模型,將兩類(lèi)預(yù)測(cè)方法有效結(jié)合,通過(guò)對(duì)基于原始用電量數(shù)據(jù)的GM預(yù)測(cè)模型和基于電力需求關(guān)鍵影響因素的PSO-ELM預(yù)測(cè)模型賦予不同的權(quán)重,得到集結(jié)更多有用信息的電力需求組合預(yù)測(cè)模型。
為了對(duì)電力需求進(jìn)行更為合理、準(zhǔn)確的預(yù)測(cè),首先需要對(duì)其主要影響因素進(jìn)行分析。為此,梳理了包含GDP、城鎮(zhèn)化率、全社會(huì)固定資產(chǎn)投資、居民消費(fèi)水平以及能耗強(qiáng)度在內(nèi)的關(guān)鍵影響指標(biāo)。
電力需求水平的提升是地區(qū)經(jīng)濟(jì)增長(zhǎng)所必需的生產(chǎn)要素,一般以GDP衡量地區(qū)經(jīng)濟(jì)的發(fā)展水平,而經(jīng)濟(jì)增長(zhǎng)又是電力需求水平提升的必要條件。只有在經(jīng)濟(jì)發(fā)展向好的前提下,才能為電力設(shè)施投資規(guī)模的進(jìn)一步擴(kuò)大、電力供應(yīng)質(zhì)量的提高提供資金保障,推動(dòng)地區(qū)用電量的穩(wěn)步增長(zhǎng)。
隨著社會(huì)的不斷發(fā)展,城市化進(jìn)程的加快將創(chuàng)造出巨大的電力工業(yè)基礎(chǔ)設(shè)施建設(shè)與投資需求,對(duì)地區(qū)電力需求空間的分布產(chǎn)生一定的影響。相關(guān)研究表明,我國(guó)城鎮(zhèn)化率從50%提升到75%的進(jìn)程中,每提高1%,全社會(huì)用電量增加4.6%左右;當(dāng)城鎮(zhèn)化率超過(guò)75%后,電力需求的增長(zhǎng)會(huì)相對(duì)放緩[7]。
地區(qū)固定資產(chǎn)的建設(shè)要以能源消耗為基礎(chǔ),而電力作為近年來(lái)能源消費(fèi)的主力軍,其消費(fèi)水平與固定資產(chǎn)的投資力度基本保持著正相關(guān)關(guān)系。
在經(jīng)濟(jì)社會(huì)穩(wěn)步發(fā)展的同時(shí),居民對(duì)生活質(zhì)量改善的期望也呈增長(zhǎng)趨勢(shì)。不僅提高了其在能源消費(fèi)領(lǐng)域?qū)η鍧嶋娏Φ恼J(rèn)可度,也拓寬了在電動(dòng)汽車(chē)、家用電器等領(lǐng)域的新興用電方式[8]。
近年來(lái)為兌現(xiàn)節(jié)能減排承諾,以單位GDP能源消耗(即能耗強(qiáng)度)為核心指標(biāo)建立的低碳經(jīng)濟(jì)發(fā)展目標(biāo)體系,將以推動(dòng)綠色電力消費(fèi)為首要舉措,營(yíng)造出更為健康的能源消費(fèi)及經(jīng)濟(jì)增長(zhǎng)環(huán)境。
灰色關(guān)聯(lián)度模型是通過(guò)系統(tǒng)中各指標(biāo)的已知信息得出演化規(guī)律,其主要步驟如下[9]。
(1)確定反映系統(tǒng)總體行為的參考序列X0,X0={X(01),X(02),…,X(0k),…,X(0n)},以及影響系統(tǒng)行為的m個(gè)比較序列Xi,Xi={X(i1),X(i2),…,X(ik),…,X(in)},其中,i=1,2,…,m;k表示不同時(shí)刻,k=1,2,…,n。
(2)對(duì)各指標(biāo)進(jìn)行無(wú)量綱處理后,計(jì)算每個(gè)比較序列與參考序列對(duì)應(yīng)分量的絕對(duì)差值,即|X0(k)-Xi(k)|,k=1,2,…,n;i=1,2,…,m。進(jìn)而得到兩級(jí)差值為、|。
(3)由式(1)和式(2)分別計(jì)算得到第s個(gè)樣本與正理想樣本關(guān)于第t個(gè)指標(biāo)的灰色關(guān)聯(lián)系數(shù)ξi和關(guān)聯(lián)度γi。
式中:ρ為分辨系數(shù),一般為0.5。
2.2.1 GM(Grey Model)預(yù)測(cè)模型
由最小二乘法得到GM(1,1)模型參數(shù):
式中:Y為數(shù)據(jù)向量;B為數(shù)據(jù)矩陣;BT為矩陣B的轉(zhuǎn)置矩陣;u為參數(shù),u?為u的估計(jì)值;a為發(fā)展系數(shù),a?為a的估計(jì)值。
進(jìn)而得到時(shí)間響應(yīng)序列為:
將方程累減還原后得到原始序列的預(yù)測(cè)模型為[10]:
2.2.2 PSO-ELM模型
2.2.2.1 極限學(xué)習(xí)機(jī)
極限學(xué)習(xí)機(jī)(Extrem Learning Machine,ELM)是一種單隱含層前饋型神經(jīng)網(wǎng)絡(luò)算法[11]。設(shè)隱含層的激活函數(shù)為g(x),輸入層有n個(gè)神經(jīng)元,隱含層有l(wèi)個(gè)神經(jīng)元,輸出層有m個(gè)神經(jīng)元,輸入層與隱含層間的連接權(quán)值為ω,Q為訓(xùn)練集的樣本數(shù),則ELM網(wǎng)絡(luò)模型表示為:
將式(6)簡(jiǎn)化為Hβ=TT,TT為矩陣T的轉(zhuǎn)置,H為神經(jīng)網(wǎng)絡(luò)的隱含層輸出矩陣,其具體表達(dá)式為:
則隱含層與輸出層間的連接權(quán)值為:
2.2.2.2 粒子群優(yōu)化算法
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)利用粒子的尋優(yōu)優(yōu)化能力,在一定范圍內(nèi)對(duì)ELM網(wǎng)絡(luò)的最優(yōu)連接參數(shù)進(jìn)行搜索,避免了ELM隨機(jī)產(chǎn)生輸入層權(quán)值和隱含層閾值所造成的不穩(wěn)定性,從而改善模型的預(yù)測(cè)精度。在每一次的迭代更新過(guò)程中,粒子通過(guò)個(gè)體極值和全局極值更新自身的速度和位置,其更新表達(dá)式為[13]:
式中:w為慣性權(quán)重;k為當(dāng)前迭代次數(shù);Vid為粒子的速度;c1、c2為加速度因子;r1、r2為分布于[0,1]間的隨機(jī)數(shù);為第i個(gè)粒子在D維搜索空間的位置;為種群的全局極值,d=1,2,…,D;i=1,2,…,n。
PSO-ELM的算法流程見(jiàn)圖1。
圖1 PSO-ELM算法流程圖
Shapley值多用于合作博弈中利益分配問(wèn)題的探討,它最大的優(yōu)點(diǎn)是其原理和分配結(jié)果易于被各利益相關(guān)主體視為公平并選擇接受。根據(jù)Shapley值在收益分配中的應(yīng)用,可將各單一預(yù)測(cè)方法共同作用所產(chǎn)生的組合預(yù)測(cè)總誤差視為收益,根據(jù)各方法的“合作關(guān)系”,將該收益值在不同預(yù)測(cè)方法中進(jìn)行分配,即確定每種預(yù)測(cè)方式在組合預(yù)測(cè)模型中所占的權(quán)重[14]。
假設(shè)N={1,2,…,n}為n種方法的集合,S、T為N的任意子集,E(S)、E(T)為各自組合的誤差,并且有E(S)+E(T)≥E(S∪T)。令yi為第i種方法的分配誤差,且yi≤E(i),則n種方法組合預(yù)測(cè)后的總誤差將在n中完全分?jǐn)俒14],即。
若i種方法的絕對(duì)誤差平均值為Ei,組合預(yù)測(cè)的總誤差為E,則:
式中:m為樣本數(shù);|eij|為第i種方法對(duì)樣本j的絕對(duì)誤差值。
則Shapley值賦權(quán)公式為:
式中:ω(|S|)為單個(gè)預(yù)測(cè)方法i的邊際貢獻(xiàn);|S|為S子集的個(gè)數(shù);E(S/i)為子集S除去i后的絕對(duì)誤差值[15]。則第i種方法的權(quán)重計(jì)算表達(dá)式為:
針對(duì)上述對(duì)電力需求影響因素的分析和預(yù)測(cè)模型的探討,以吉林省為例,選取2005—2015年的數(shù)據(jù)為訓(xùn)練集,2016—2020年的數(shù)據(jù)為測(cè)試集,利用MATLAB R2018a對(duì)該地區(qū)“十四五”期間的電力需求進(jìn)行預(yù)測(cè)。
基于灰色關(guān)聯(lián)度理論對(duì)該地區(qū)電力需求的關(guān)鍵影響因素進(jìn)行篩選。收集吉林省2005—2020年GDP、全社會(huì)固定資產(chǎn)投資、居民消費(fèi)水平、城鎮(zhèn)化率及能耗強(qiáng)度的相關(guān)數(shù)據(jù)(見(jiàn)表1),將用電量作為參考數(shù)列,各項(xiàng)指標(biāo)作為比較數(shù)列,以初值化法對(duì)其進(jìn)行無(wú)量綱化處理后,根據(jù)式(1)和式(2)分別計(jì)算關(guān)聯(lián)系數(shù)矩陣及灰色關(guān)聯(lián)度,計(jì)算結(jié)果見(jiàn)表2。
表1 電力需求的關(guān)鍵影響因素
表2 用電量關(guān)聯(lián)系數(shù)矩陣及灰色關(guān)聯(lián)度
各比較數(shù)列的灰色關(guān)聯(lián)度均大于0.5,說(shuō)明所選取的指標(biāo)科學(xué)合理,對(duì)吉林省電力需求均具有一定的影響。從關(guān)聯(lián)度的大小來(lái)看,其關(guān)聯(lián)序?yàn)槌擎?zhèn)化率>居民消費(fèi)水平>能耗強(qiáng)度>GDP>全社會(huì)固定資產(chǎn)投資,前四項(xiàng)指標(biāo)的關(guān)聯(lián)度均大于0.7,明顯高于全社會(huì)固定資產(chǎn)投資對(duì)吉林省電力需求的影響。因此,為提高預(yù)測(cè)的精度及可靠性,以城鎮(zhèn)化率、居民消費(fèi)水平、能耗強(qiáng)度和GDP作為吉林省電力需求的強(qiáng)關(guān)聯(lián)影響要素對(duì)其進(jìn)行預(yù)測(cè)。
為對(duì)比模型的性能,引入平均絕對(duì)百分比誤差(MAPE)對(duì)模型的仿真效果進(jìn)行評(píng)價(jià),即:
利用GM預(yù)測(cè)模型進(jìn)行預(yù)測(cè),根據(jù)式(3)—式(5),得出模型參數(shù)和時(shí)間響應(yīng)序列分別為:
根據(jù)累減還原后的原始預(yù)測(cè)模型得到測(cè)試集中每個(gè)年份MAPE值,其計(jì)算結(jié)果見(jiàn)表3。
表3 GM、PSO-ELM及Shapley值組合預(yù)測(cè)模型MAPE對(duì)比
同時(shí),對(duì)構(gòu)建的PSO-ELM模型進(jìn)行參數(shù)設(shè)定,初始化粒子種群規(guī)模M=20,學(xué)習(xí)因子C1=C2=2,慣性權(quán)重系數(shù)ωmax=0.9、ωmin=0.2,[Vmin,Vmax]=[-1,1],最大迭代次數(shù)T=100。將各指標(biāo)的原始數(shù)據(jù)作為輸入變量對(duì)模型進(jìn)行訓(xùn)練,得到PSO-ELM的尋優(yōu)曲線(見(jiàn)圖2)。從圖中可以看出,粒子的平均適應(yīng)度總體處于下降趨勢(shì),最佳適應(yīng)度在前55次迭代中呈階梯狀下降,而后基本保持不變,在第90次迭代時(shí)又出現(xiàn)新的下降拐點(diǎn),至迭代結(jié)束,其最優(yōu)適應(yīng)度值已接近于所設(shè)定的0.01精度,表現(xiàn)出PSO算法強(qiáng)大的尋優(yōu)能力。為對(duì)比經(jīng)PSO優(yōu)化后的ELM模型在最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)下是否具有更好的預(yù)測(cè)性能,分別對(duì)PSO-ELM和ELM模型進(jìn)行仿真,得到的測(cè)試結(jié)果見(jiàn)圖3。從圖中可以看出,PSO-ELM模型預(yù)測(cè)值與實(shí)際值的擬合優(yōu)度明顯優(yōu)于ELM模型,即PSO算法有效改善了ELM模型的可靠性,提升了預(yù)測(cè)精度。
圖2 PSO-ELM尋優(yōu)曲線
圖3 PSO-ELM和ELM模型仿真圖
基于對(duì)Shapley值理論的探討,進(jìn)一步對(duì)GM、PSO-ELM所構(gòu)建的組合預(yù)測(cè)模型進(jìn)行分析。參與組合預(yù)測(cè)模型總誤差分配的成員為N={1,2},1、2分別代表GM和PSO-ELM模型,E(1),E(2),E{1,2}的數(shù)值代表絕對(duì)誤差均值。根據(jù)式(13)和(14)求得各成員的Shapley值為E1=12.765、E2=8.525;進(jìn)而由式(15)確定其權(quán)重分別為w1=0.400 4、w2=0.599 6。由此,得到的組合預(yù)測(cè)模型為:
式中:y1t為GM模型的預(yù)測(cè)值;y2t為PSO-ELM模型的預(yù)測(cè)值;t為年份。
由式(17)計(jì)算Shapley組合預(yù)測(cè)模型的MAPE值(見(jiàn)表3)。由表3可知,在單一預(yù)測(cè)模型中,PSO-ELM模型的預(yù)測(cè)精度優(yōu)于GM模型,其測(cè)試樣本的相對(duì)誤差均低于GM模型;而經(jīng)Shapley值重新分配權(quán)重后的組合預(yù)測(cè)模型MAPE值僅為0.68,明顯低于各單一預(yù)測(cè)模型。可見(jiàn),相較于GM、PSO-ELM兩種單一預(yù)測(cè)模型,組合預(yù)測(cè)方法具有更高的精度,在電力需求預(yù)測(cè)的應(yīng)用中更為有效。因此,利用該模型對(duì)吉林省“十四五”期間的電力需求進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表4。
表4 吉林省“十四五”期間電力需求預(yù)測(cè) TWh
本文在兩種單一預(yù)測(cè)方法的基礎(chǔ)上,構(gòu)建了基于Shapley值的組合預(yù)測(cè)模型。通過(guò)誤差對(duì)比可知,該模型充分考慮單一預(yù)測(cè)模型的優(yōu)勢(shì),有效提高整體預(yù)測(cè)精度,為地區(qū)電力需求預(yù)測(cè)提供了新思路。因此,由該組合賦權(quán)預(yù)測(cè)模型得到的吉林省“十四五”期間電力需求的預(yù)測(cè)結(jié)果,可在一定精度上為當(dāng)?shù)仉娏Σ块T(mén)的相關(guān)規(guī)劃提供參考。