姜山,周秋鵬,董弘川,馬旭,趙振宇
(1.國(guó)網(wǎng)湖北省電力有限公司經(jīng)濟(jì)技術(shù)研究院,武漢 430077;2.華北電力大學(xué)工程建設(shè)管理研究所,北京 102206)
長(zhǎng)期電力負(fù)荷的準(zhǔn)確預(yù)測(cè)對(duì)電網(wǎng)規(guī)劃及電力基礎(chǔ)設(shè)施建設(shè)具有重要戰(zhàn)略意義。近年來(lái),長(zhǎng)期電力負(fù)荷預(yù)測(cè)多以年度負(fù)荷值的總體趨勢(shì)預(yù)測(cè)為主[1],較少考慮預(yù)測(cè)中數(shù)據(jù)慣性增長(zhǎng)、周期性變化以及數(shù)值的累積效應(yīng),進(jìn)而影響了負(fù)荷預(yù)測(cè)的準(zhǔn)確性。因此,模型建模需要考慮年度負(fù)荷增長(zhǎng)應(yīng)基于月度負(fù)荷累積的情況,以提高模型區(qū)間預(yù)測(cè)的分段精度,確保預(yù)測(cè)的準(zhǔn)確性,將基于此項(xiàng)工作開展數(shù)據(jù)趨勢(shì)性和周期性預(yù)測(cè)的組合方法研究。
電力負(fù)荷預(yù)測(cè)方法包括參數(shù)化預(yù)測(cè)方法及非參數(shù)化預(yù)測(cè)方法?;跀?shù)據(jù)參數(shù)化特性的分析算法主要有機(jī)械學(xué)習(xí)算法及時(shí)間序列算法,機(jī)械學(xué)習(xí)如神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)[2]、SVM支持向量機(jī)[3]、決策樹等. 該類方法采用迭代思維進(jìn)行數(shù)據(jù)尋優(yōu)從而求得數(shù)據(jù)最優(yōu)解;時(shí)間序列ARIMA等方法通過(guò)人工參數(shù)設(shè)置實(shí)現(xiàn)數(shù)據(jù)自身發(fā)展趨勢(shì)規(guī)律的分析預(yù)測(cè)。為提高時(shí)間序列數(shù)據(jù)的預(yù)測(cè)精度,可將多種機(jī)械學(xué)習(xí)算法與ARIMA方法復(fù)合,實(shí)現(xiàn)數(shù)據(jù)的耦合修正[4]。非參數(shù)方法是一類直接或間接地從實(shí)際系統(tǒng)的實(shí)驗(yàn)分析中得到的響應(yīng)分析方法. 如通過(guò)實(shí)驗(yàn)記錄得到的系統(tǒng)脈沖響應(yīng)或階躍響應(yīng)[5],該類算法可充分挖掘數(shù)據(jù)自身規(guī)律的周期特性,基于數(shù)據(jù)的周期性通過(guò)數(shù)據(jù)的降維處理以預(yù)測(cè)區(qū)間單元內(nèi)數(shù)據(jù)走勢(shì)。為進(jìn)一步提高長(zhǎng)期電力負(fù)荷趨勢(shì)預(yù)測(cè)的準(zhǔn)確度,將電力負(fù)荷數(shù)據(jù)進(jìn)行年度及月度分解,把用以研究數(shù)據(jù)自身發(fā)展規(guī)律的ARIMA[6]方法融入BP神經(jīng)網(wǎng)絡(luò)算法內(nèi),提出改進(jìn)的BP-ARIMA負(fù)荷趨勢(shì)預(yù)測(cè)模型,實(shí)現(xiàn)在多因素綜合影響下的年度電力負(fù)荷預(yù)測(cè)功能;引入函數(shù)型非參數(shù)方法對(duì)歷年月度數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,通過(guò)函數(shù)型時(shí)間序列預(yù)測(cè)模型對(duì)未來(lái)數(shù)據(jù)進(jìn)行周期性預(yù)測(cè),將趨勢(shì)性預(yù)測(cè)及周期性預(yù)測(cè)進(jìn)行分量融合以得到新型組合預(yù)測(cè)模型,從而提升長(zhǎng)期電力負(fù)荷預(yù)測(cè)的精確性。
為研究負(fù)荷數(shù)據(jù)發(fā)展特性,提出的新型組合預(yù)測(cè)模型是基于BP-ARIMA趨勢(shì)性預(yù)測(cè)及函數(shù)型非參數(shù)化周期性預(yù)測(cè)的綜合預(yù)測(cè)模型。BP-ARIMA模型是基于BP神經(jīng)網(wǎng)絡(luò)及ARIMA模型進(jìn)行影響因素耦合獲取趨勢(shì)線而形成的改良方法,函數(shù)型非參數(shù)化方法通過(guò)引入適宜核函數(shù)對(duì)月度負(fù)荷開展周期性預(yù)測(cè)工作。
BP人工神經(jīng)網(wǎng)絡(luò)可實(shí)現(xiàn)輸入端與輸出端非線性函數(shù)的函數(shù)映射問(wèn)題[7],具體算法可通過(guò)如下步驟實(shí)現(xiàn)。確定輸入向量X=[x1,x2,…,xn]T,輸出向量Y=[y1.y2. ….yn]T。設(shè)置初始化輸入層至隱含層連接權(quán)值ωij,隱含層至輸出層連接權(quán)值ωjk;具體過(guò)程函數(shù)為:
(1)
式中f1()、f2()分別為輸入層至隱含層、隱含層至輸出層神經(jīng)網(wǎng)絡(luò)激活函數(shù),以上為輸入模式的順向傳導(dǎo)過(guò)程,利用順向傳導(dǎo)過(guò)程所得輸出值求得輸出層校正誤差,再將輸出層誤差經(jīng)由隱含層逆向傳導(dǎo)至輸入層,循環(huán)往復(fù)直至訓(xùn)練穩(wěn)定。
ARIMA(p,d,q)模型[8],是一種根據(jù)數(shù)據(jù)自身規(guī)律揭示系統(tǒng)動(dòng)態(tài)結(jié)構(gòu)及發(fā)展規(guī)律的時(shí)間序列模型。文中該模型應(yīng)用于影響因素趨勢(shì)預(yù)測(cè)及趨勢(shì)線提取校核,ARIMA模型須將序列數(shù)據(jù)進(jìn)行一次或多次差分以得到平穩(wěn)時(shí)間序列,基于數(shù)據(jù)的復(fù)雜程度對(duì)數(shù)據(jù)進(jìn)行分析建模,模型表達(dá)式為:
(2)
式中?d=(1-A)d為數(shù)據(jù)的d階差分項(xiàng);Φ(A)=1-φ1A-φ2A2-…-φpAp為模型的自回歸相關(guān)系數(shù)多項(xiàng)式;Θ(A)=1-θ1A-θ2A2-…-θqAq為滑動(dòng)平均系數(shù)多項(xiàng)式。
函數(shù)型非參數(shù)回歸模型[9]可對(duì)周期性數(shù)據(jù)進(jìn)行函數(shù)性質(zhì)的數(shù)據(jù)統(tǒng)計(jì)及預(yù)測(cè),將觀測(cè)區(qū)間內(nèi)一次觀測(cè)到的數(shù)據(jù)視為整體,利用函數(shù)型數(shù)據(jù)分析方法對(duì)無(wú)限維中具有函數(shù)性質(zhì)的數(shù)據(jù)進(jìn)行結(jié)構(gòu)分析,降低數(shù)據(jù)整體維度,提高數(shù)據(jù)推斷的準(zhǔn)確度。函數(shù)模型表達(dá)式為:
(3)
式中Xi為函數(shù)型變量;響應(yīng)變量Yi為實(shí)值變量;εi為誤差項(xiàng),構(gòu)成(Xi,Yi)數(shù)據(jù)對(duì)。通過(guò)Nadaraya-Watson(N-W)核估計(jì)方法對(duì)函數(shù)型非參數(shù)模型進(jìn)行回歸函數(shù)估計(jì). 具體估計(jì)模型表達(dá)式為:
(4)
式中K為對(duì)稱核函數(shù);窗寬h=hn為正實(shí)數(shù)序列;φ(h)為小球概率。
相關(guān)系數(shù)大小決定自變量與因變量間的相關(guān)性強(qiáng)弱. 檢查自變量與因變量間的共線性程度。通過(guò)分析數(shù)據(jù)之間的相互依存關(guān)系,為數(shù)據(jù)的遠(yuǎn)期預(yù)測(cè)提供趨勢(shì)框架. 防止預(yù)測(cè)效果失真。采用皮爾森相關(guān)性系數(shù)對(duì)影響因素與年度負(fù)荷數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),相關(guān)性系數(shù)表達(dá)式為:
(5)
式中Cov(X,Y)為X、Y序列數(shù)據(jù)協(xié)方差;σx,σy為X、Y序列數(shù)據(jù)標(biāo)準(zhǔn)差。
所研究的基于函數(shù)型非參數(shù)方法的BP-ARIMA預(yù)測(cè)模型將時(shí)間序列數(shù)據(jù)進(jìn)行分解,在采用相關(guān)性檢驗(yàn)對(duì)影響因素進(jìn)行初步篩選的情況下,利用BP-ARIMA模型對(duì)時(shí)序性數(shù)據(jù)的年度負(fù)荷數(shù)據(jù)進(jìn)行趨勢(shì)預(yù)測(cè),利用函數(shù)型非參數(shù)方法對(duì)周期性月度負(fù)荷數(shù)據(jù)進(jìn)行回歸估計(jì)。通過(guò)兩類數(shù)據(jù)的分量組合,提高模型長(zhǎng)期預(yù)測(cè)的穩(wěn)定性及準(zhǔn)確性,流程見圖1。
圖1 負(fù)荷預(yù)測(cè)流程圖
模型將區(qū)域電力負(fù)荷與區(qū)域生產(chǎn)總值、工業(yè)增加值、可支配收入等經(jīng)濟(jì)性、社會(huì)性指標(biāo)相關(guān)聯(lián)[10]。提取各項(xiàng)因素?cái)?shù)據(jù)的預(yù)測(cè)值,基于各影響因素耦合特點(diǎn),對(duì)數(shù)據(jù)采取擬合分析,明確影響因素?cái)?shù)據(jù)的精確走勢(shì),并依據(jù)各個(gè)影響因素走勢(shì)及年度負(fù)荷數(shù)據(jù)進(jìn)行BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)訓(xùn)練,獲得年度電力負(fù)荷趨勢(shì)預(yù)測(cè)值。
采用MATLAB數(shù)據(jù)分析軟件[11],編制BP-ARIMA年度負(fù)荷預(yù)測(cè)模型,建模步驟如下:
(1)通過(guò)相關(guān)性檢驗(yàn)方法初步檢驗(yàn)影響因素與年度負(fù)荷值的相關(guān)性程度;
(2)電力負(fù)荷通過(guò)BP神經(jīng)網(wǎng)絡(luò)對(duì)各影響因素?cái)?shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練?;谛:撕蟮囊蛩仡A(yù)測(cè)數(shù)據(jù). 提取影響因素趨勢(shì)數(shù)據(jù),趨勢(shì)線可精確判斷數(shù)據(jù)走勢(shì)及數(shù)值范圍;
(3)ARIMA模型進(jìn)行各個(gè)影響因素的趨勢(shì)預(yù)測(cè),采用已校核的趨勢(shì)線置換影響因素原始趨勢(shì)線。該過(guò)程可通過(guò)趨勢(shì)線預(yù)測(cè)進(jìn)行進(jìn)一步相關(guān)性檢驗(yàn),剔除呈弱相關(guān)性影響因素,利用多項(xiàng)式擬合方法輸出因素預(yù)測(cè)值;
(4)將各校核之后的影響因素?cái)?shù)據(jù)與年度負(fù)荷數(shù)據(jù)耦合,開展年度負(fù)荷趨勢(shì)預(yù)測(cè)。
從已有研究看,學(xué)者普遍采用經(jīng)濟(jì)與社會(huì)指標(biāo)分析對(duì)電力負(fù)荷的影響。由于區(qū)域GDP、區(qū)域財(cái)政投資、區(qū)域人口增長(zhǎng)等對(duì)區(qū)域電力負(fù)荷增長(zhǎng)起到正向促進(jìn)作用,因此區(qū)域電力負(fù)荷增長(zhǎng)及電力基礎(chǔ)設(shè)施建設(shè)與區(qū)域經(jīng)濟(jì)、社會(huì)指標(biāo)增長(zhǎng)存在必然聯(lián)系[12]。綜合現(xiàn)有研究,從經(jīng)濟(jì)發(fā)展、社會(huì)發(fā)展和工業(yè)生產(chǎn)角度進(jìn)行相關(guān)數(shù)據(jù)的收集、整理與分析,相關(guān)影響因素如表1所示。
表1 1995年~2018年度用電量及相關(guān)因素統(tǒng)計(jì)數(shù)據(jù)
區(qū)域月度負(fù)荷數(shù)據(jù)存在周期性遞增特性,針對(duì)該類時(shí)間序列數(shù)據(jù),以整年(周期T=12)為單位生成函數(shù)型數(shù)據(jù),設(shè)生成隨機(jī)變量F,F(xiàn)在t=a到時(shí)間t=a+nT上的觀測(cè)值構(gòu)成一個(gè)連續(xù)的時(shí)間序列F(t)。月度負(fù)荷數(shù)據(jù)可看成是按周期T重復(fù)統(tǒng)計(jì)得到的。函數(shù)型數(shù)據(jù)[13]表達(dá)式為:
(6)
式中fi為第i年負(fù)荷函數(shù)型數(shù)據(jù),依據(jù)式(6)第三項(xiàng)可將觀測(cè)區(qū)間的[a,a+nT]上的連續(xù)時(shí)間序列F(t)轉(zhuǎn)化為{f1,f2,…fn},依據(jù){f1,f2,…fn}即可預(yù)測(cè)fn+1等遠(yuǎn)期月度負(fù)荷數(shù)據(jù)。本預(yù)測(cè)模型通過(guò){f1,f2,…fn}構(gòu)建函數(shù)型數(shù)據(jù)對(duì)。選取的核函數(shù)及半度量參數(shù)公式如下:
(7)
半度量參數(shù)的選取基于周期曲線導(dǎo)數(shù),d(xi,yi)中q值影響曲線的擬合程度。函數(shù)型非參數(shù)法還通過(guò)核函數(shù)中的窗寬(h)影響曲線擬合程度,通過(guò)交叉驗(yàn)證的形式自動(dòng)獲取窗寬。即:
(8)
從觀測(cè)到的(Xi,Yi)數(shù)據(jù)對(duì)中剔除最后第n項(xiàng),基于前n-1項(xiàng)對(duì)數(shù)據(jù)進(jìn)行函數(shù)型回歸分析。通過(guò)CV(h)取最小值時(shí)確定h的取值。將預(yù)測(cè)的第n項(xiàng)數(shù)據(jù)與負(fù)荷真實(shí)值進(jìn)行比較,確定周期性函數(shù)預(yù)測(cè)的準(zhǔn)確性。
綜合預(yù)測(cè)模型將年度趨勢(shì)性負(fù)荷預(yù)測(cè)與月度周期性負(fù)荷預(yù)測(cè)進(jìn)行分量組合,可通過(guò)平均絕對(duì)百分誤差(MAPE)權(quán)重法[14]對(duì)月度負(fù)荷及年度負(fù)荷分配權(quán)重. 提高模型預(yù)測(cè)可靠性、準(zhǔn)確性。負(fù)荷預(yù)測(cè)權(quán)重分配函數(shù)為:
(9)
式中Pload為負(fù)荷分量組合預(yù)測(cè)值;pm,py分別為月度負(fù)荷值、年度負(fù)荷值;ωm,ωy為月度、年度負(fù)荷值權(quán)重。
引入我國(guó)中部某省區(qū)域生產(chǎn)總值、固定資產(chǎn)投資額、年度區(qū)域用電量等指標(biāo),數(shù)據(jù)見表1,為提高負(fù)荷預(yù)測(cè)準(zhǔn)確率,引入2006年~2018年間月度負(fù)荷指標(biāo),如表2所示。
表2 2006年~2018年間月度用電量統(tǒng)計(jì)數(shù)據(jù)
注:月度負(fù)荷單位為:億千瓦時(shí)
研究采用BP-ARIMA模型的相關(guān)通用參數(shù)及改進(jìn)的ARIMA算法差異性參數(shù)見表3。其中n值為采用多項(xiàng)式擬合方法中多項(xiàng)式的最高次冪[15]。
表3 BP-ARIMA模型通用及差異性參數(shù)
將各影響因素分別與年度負(fù)荷值進(jìn)行相關(guān)性檢驗(yàn),區(qū)域常住人口數(shù)量相關(guān)性系數(shù)較低,呈弱相關(guān)性. 各影響因素相關(guān)系數(shù)如表4所示。
表4 相關(guān)性檢驗(yàn)
采用年度電力負(fù)荷值對(duì)各影響因素值進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,校核各影響因素趨勢(shì)線。以城鎮(zhèn)居民人均可支配收入因素為例,如圖2所示,“菱形”標(biāo)趨勢(shì)線從“圓形”標(biāo)校核值序列中被提取出,并且將該校核的趨勢(shì)線植入原始數(shù)據(jù)中,形成“星形”標(biāo)改良值,該法可對(duì)影響因素趨勢(shì)線進(jìn)行一定程度的修正。依據(jù)ADF及AIC準(zhǔn)則對(duì)各影響因素進(jìn)行p、q、d判斷,采取最優(yōu)數(shù)組組合模擬,數(shù)據(jù)如表3所示。
圖2 城鎮(zhèn)居民人均可支配收入趨勢(shì)線分解及優(yōu)化圖
通過(guò)模型校核過(guò)程中的影響因素趨勢(shì)預(yù)測(cè)發(fā)現(xiàn),區(qū)域常住人口數(shù)量的模型走勢(shì)吻合程度較差,再次驗(yàn)證了該因素與年度負(fù)荷值的弱相關(guān)性,數(shù)據(jù)模擬失真,效果如圖3所示。
圖3 常住人口數(shù)模擬結(jié)果
經(jīng)校核的ARIMA模型可基于數(shù)據(jù)結(jié)構(gòu)特性對(duì)其余強(qiáng)相關(guān)性的影響因素開展目標(biāo)年預(yù)測(cè),研究將1995年~2015年數(shù)據(jù)作為模擬樣本數(shù)據(jù),對(duì)2016年~2018年三年進(jìn)行預(yù)測(cè),部分影響因素預(yù)測(cè)效果對(duì)比見圖4和圖5。
圖4 固定資產(chǎn)投資額模擬結(jié)果
圖5 工業(yè)增加值額模擬結(jié)果
將經(jīng)過(guò)篩選及校核的影響因素與年度電力負(fù)荷通過(guò)BP-ARIMA預(yù)測(cè)模型進(jìn)行多因素耦合預(yù)測(cè),該模型為基于影響因素及負(fù)荷序列數(shù)據(jù)趨勢(shì)性發(fā)展的一類預(yù)測(cè),年度區(qū)域用電量預(yù)測(cè)數(shù)據(jù)如圖6,圖中2019年~2021年為電力負(fù)荷模型預(yù)測(cè)值,未來(lái)三年電力負(fù)荷仍為增長(zhǎng)趨勢(shì),但增長(zhǎng)速度有所放緩。
圖6 BP-ARIMA預(yù)測(cè)模型年度電力負(fù)荷預(yù)測(cè)值
研究基于函數(shù)型非參數(shù)化方法對(duì)月度電力負(fù)荷數(shù)據(jù)開展周期性預(yù)測(cè),算法模型采用2006年~2015年間月度負(fù)荷數(shù)據(jù)進(jìn)行非參數(shù)化算法學(xué)習(xí),預(yù)測(cè)2016年~2021年間月度負(fù)荷數(shù)據(jù),比對(duì)2016年~2018年間月度真實(shí)數(shù)據(jù),真實(shí)值與預(yù)測(cè)值吻合程度較好,預(yù)測(cè)及對(duì)比結(jié)果如圖7所示。
圖7 函數(shù)型非參數(shù)方法月度電力負(fù)荷預(yù)測(cè)值
將BP-ARIMA模型與函數(shù)型非參數(shù)方法進(jìn)行組合預(yù)測(cè),2016年~2018年趨勢(shì)性預(yù)測(cè)值與周期性預(yù)測(cè)值進(jìn)行MAPE權(quán)重方法組合。函數(shù)型非參數(shù)預(yù)測(cè)方法MAPE值1.17%小于BP-ARIMA的1.93%,經(jīng)兩種方法的分量融合,新型組合模型的MAPE值為1.59%,誤差結(jié)果相對(duì)理想,負(fù)荷預(yù)測(cè)數(shù)據(jù)如表5所示。
表5 研究模型預(yù)測(cè)結(jié)果
為體現(xiàn)該新型組合模型的預(yù)測(cè)優(yōu)勢(shì),研究分別采用灰色預(yù)測(cè)模型GM(1,1)、GM(1,N)、BP神經(jīng)網(wǎng)絡(luò)模型、ARIMA模型等與該組合模型進(jìn)行比較,誤差結(jié)果見表6,新型組合預(yù)測(cè)模型預(yù)測(cè)精度最高,MAPE值僅為1.59%,具有明顯的預(yù)測(cè)優(yōu)勢(shì)。
表6 模型誤差對(duì)比分析
同時(shí),為驗(yàn)證文中函數(shù)型非參數(shù)方法對(duì)周期性月度負(fù)荷的預(yù)測(cè)優(yōu)勢(shì),研究采用隨機(jī)森林預(yù)測(cè)方法進(jìn)行周期性預(yù)測(cè)比對(duì),2016年~2018年間兩種方法的月度負(fù)荷預(yù)測(cè)對(duì)比結(jié)果見圖8,隨機(jī)森林預(yù)測(cè)方法MAPE誤差值為1.78%,誤差累計(jì)比非參數(shù)方法增加11.95%。從結(jié)果看,所采用的函數(shù)型非參數(shù)方法預(yù)測(cè)精度較高,適合于周期性數(shù)據(jù)預(yù)測(cè)。
圖8 非參數(shù)法與隨機(jī)森林方法的預(yù)測(cè)值比較
提出了一種新型的組合預(yù)測(cè)模型,該模型將年度負(fù)荷的趨勢(shì)性與月度負(fù)荷的周期性進(jìn)行分量融合,模型既考慮了數(shù)據(jù)自身結(jié)構(gòu)的趨勢(shì)性、周期性特點(diǎn),又通過(guò)影響因素耦合的特點(diǎn)增加了數(shù)據(jù)趨勢(shì)預(yù)測(cè)的合理性,數(shù)據(jù)的預(yù)測(cè)精度得到大幅提升。BP-ARIMA負(fù)荷預(yù)測(cè)模型將BP的非線性處理能力與ARIMA的線性預(yù)測(cè)能力相結(jié)合,通過(guò)趨勢(shì)線校核提高影響因素的預(yù)測(cè)精度及數(shù)據(jù)穩(wěn)定性,模型還可篩除相關(guān)性較差影響因素,利用因素之間的耦合特性提高年度電力負(fù)荷趨勢(shì)性預(yù)測(cè)的穩(wěn)定性。函數(shù)型非參數(shù)方法通過(guò)降維的處理手段實(shí)現(xiàn)數(shù)據(jù)的周期性預(yù)測(cè),該法可通過(guò)選用合適的核函數(shù)達(dá)到良好的月度負(fù)荷預(yù)測(cè)精度。該組合預(yù)測(cè)模型可為長(zhǎng)期電力負(fù)荷預(yù)測(cè)提供更為符合客觀事實(shí)依據(jù)的負(fù)荷預(yù)測(cè)方法。