高迪
摘 要:隨著產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、國(guó)企深化改革等政策措施的逐步深入,我國(guó)經(jīng)濟(jì)進(jìn)入新常態(tài)。2015年,我國(guó)經(jīng)濟(jì)下行壓力持續(xù)加大,售電市場(chǎng)形勢(shì)較為嚴(yán)峻,因此售電量預(yù)測(cè)具有重要意義。本文應(yīng)用數(shù)據(jù)挖掘分析方法,充分收集內(nèi)部、外部數(shù)據(jù)信息,挖掘分析影響售電量的主要因素。同時(shí),在售電量相關(guān)性分析基礎(chǔ)上,嘗試應(yīng)用時(shí)間序列和神經(jīng)網(wǎng)絡(luò)多種分析工具,構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)年度售電量情況,并綜合評(píng)估各方法優(yōu)劣。
關(guān)鍵詞:電力;售電量;數(shù)據(jù)挖掘;預(yù)測(cè)
0 引言
隨著產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、國(guó)企深化改革等政策措施的逐步深入,我國(guó)經(jīng)濟(jì)進(jìn)入新常態(tài)。2015年,我國(guó)經(jīng)濟(jì)下行壓力持續(xù)加大,售電市場(chǎng)形勢(shì)較為嚴(yán)峻,因此售電量預(yù)測(cè)具有重要意義。
長(zhǎng)期以來(lái),諸多學(xué)者對(duì)月售電量預(yù)測(cè)的理論和方法做了大量研究,提出了多種各具特點(diǎn)的預(yù)測(cè)方法。其中,以基于神經(jīng)網(wǎng)絡(luò)模型和基于時(shí)間序列的回歸模型的預(yù)測(cè)研究最為常見。
神經(jīng)網(wǎng)絡(luò)模型通過尋找電量與各影響因素(如經(jīng)濟(jì)、人口等)之間的非線性回歸關(guān)系來(lái)進(jìn)行分析預(yù)測(cè),其優(yōu)點(diǎn)是在不構(gòu)建確定函數(shù)的情況下便可實(shí)現(xiàn)回歸過程,具有一定的推廣能力且預(yù)測(cè)精度較高。時(shí)間序列回歸模型是根據(jù)電量過去的變化規(guī)律建模,預(yù)測(cè)未來(lái)變化的可能性及變化趨勢(shì),其優(yōu)點(diǎn)是簡(jiǎn)單易行、便于掌握、樣本需求量不大且預(yù)測(cè)精度較高。
本文應(yīng)用數(shù)據(jù)挖掘分析方法,充分收集內(nèi)部、外部數(shù)據(jù)信息,挖掘分析影響售電量的主要因素。同時(shí),在售電量相關(guān)性分析基礎(chǔ)上,嘗試應(yīng)用時(shí)間序列和神經(jīng)網(wǎng)絡(luò)多種分析工具,構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)年度售電量情況,并綜合評(píng)估各方法優(yōu)劣。
1 方法
1.1 分析思路
綜合宏觀經(jīng)濟(jì)政策、產(chǎn)業(yè)行業(yè)發(fā)展、氣象等外部數(shù)據(jù),以及分類別、分產(chǎn)業(yè)用電量、業(yè)擴(kuò)報(bào)裝等內(nèi)部數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘分析方法,找出影響售電量的內(nèi)外部因素以及趨勢(shì)規(guī)律特征,采用多種方法構(gòu)建售電量預(yù)測(cè)模型,預(yù)測(cè)2015年售電量完成情況,為運(yùn)營(yíng)決策提供參考。
1.2 方法及評(píng)估
影響售電量的因素很多且部分因素存在共線性,售電量自身也存在一定的發(fā)展波動(dòng)規(guī)律,因此本次研究分別采用時(shí)間序列方法、RBF神經(jīng)網(wǎng)絡(luò)方法建立售電量模型,并從模型擬合優(yōu)度、顯著性檢驗(yàn)、共線性、異方差、相對(duì)誤差等多個(gè)角度出發(fā)對(duì)模型進(jìn)行綜合評(píng)估。
(1)方法一:時(shí)間序列
售電量呈現(xiàn)出明顯的季節(jié)波動(dòng)性,因此可以選用傳統(tǒng)的時(shí)間序列模型預(yù)測(cè)售電量。
(2)方法二:RBF神經(jīng)網(wǎng)絡(luò)
RBF網(wǎng)絡(luò)是以函數(shù)逼近理論為基礎(chǔ)而構(gòu)造的一類前向網(wǎng)絡(luò),分析速度快,擬合效果優(yōu),尤其適合擬合因變量及自變量之間復(fù)雜的非線性問題,采用RBF神經(jīng)網(wǎng)絡(luò)對(duì)售電量與其影響因素的非線性復(fù)雜關(guān)系進(jìn)行擬合,以期實(shí)現(xiàn)更小的預(yù)測(cè)誤差。
2 數(shù)據(jù)挖掘分析
2.1 指標(biāo)選取
本文研究外部數(shù)據(jù)涵蓋宏觀經(jīng)濟(jì)、景氣指數(shù)、對(duì)外貿(mào)易、金融、財(cái)政、氣溫等方面,內(nèi)部數(shù)據(jù)涵蓋售電量、業(yè)擴(kuò)報(bào)裝、重點(diǎn)企業(yè)用電量等方面,數(shù)據(jù)時(shí)間跨度為2003年12月至2015年6月,共16,532條數(shù)據(jù)項(xiàng)。
其中,宏觀經(jīng)濟(jì)數(shù)據(jù)包括:國(guó)內(nèi)生產(chǎn)總值(GDP)、分行業(yè)總產(chǎn)值、分產(chǎn)業(yè)增加值、社會(huì)消費(fèi)品零售總額、城鎮(zhèn)居民人均可支配收入、固定資產(chǎn)投資額、城鎮(zhèn)化率等。
景氣指數(shù)數(shù)據(jù)包括:居民消費(fèi)價(jià)格指數(shù)(CPI)、采購(gòu)經(jīng)理指數(shù)(PMI)、工業(yè)品出廠價(jià)格指數(shù)(PPI)、商品零售價(jià)格指數(shù)、分行業(yè)出廠價(jià)格、重要生產(chǎn)資料價(jià)格(含煤炭、螺紋鋼、鋁、銅、燃料油、鉛、線材、鋅)等。
對(duì)外貿(mào)易數(shù)據(jù)包括:進(jìn)出口總額、出口總值等。
金融數(shù)據(jù)包括:貨幣供應(yīng)量(含M2、M1)、國(guó)內(nèi)信貸、金融存款(含存款金額、新增金額、存款余額)、境內(nèi)上市總市值及總資本、股票成交金額及數(shù)量、上證所及深交所開戶交易信息(含上市、上市證券、股票股本、股票市值、投資開戶、市盈率、成交金額信息等)、保險(xiǎn)收入、賠付金額、保險(xiǎn)資金運(yùn)用余額、保險(xiǎn)營(yíng)業(yè)費(fèi)用等。
財(cái)政數(shù)據(jù)包括:財(cái)政收支差額、公共財(cái)政支出、中央本級(jí)財(cái)政支出、地方財(cái)政支出、分類別公共財(cái)政支出、公共財(cái)政收入、稅收收入等。
氣候數(shù)據(jù)包括:經(jīng)營(yíng)區(qū)各省會(huì)城市平均溫度等。
2.2 指標(biāo)與售電量相關(guān)系數(shù)
通過分類的Pearson相關(guān)性分析,根據(jù)相關(guān)性判斷原則,可以發(fā)現(xiàn): GDP、城鎮(zhèn)化率與售電量及各分類售電量均強(qiáng)相關(guān),相關(guān)系數(shù)均高于0.9;除共性影響因素外,工業(yè)售電量與可支配收入、第二產(chǎn)業(yè)增加值、進(jìn)出口總值強(qiáng)相關(guān);非居民售電量及居民售電量與可支配收入強(qiáng)相關(guān);農(nóng)業(yè)售電量與固定資產(chǎn)投資、新裝增容農(nóng)業(yè)戶數(shù)相關(guān)程度較高;商業(yè)售電量與可支配收入強(qiáng)相關(guān),與新裝增容戶數(shù)容量相關(guān)程度較高。
3 模型構(gòu)建及評(píng)估
基于相關(guān)性分析結(jié)果,確定因變量及自變量的時(shí)間維度、指標(biāo)維度如下:
(1)數(shù)據(jù)時(shí)間跨度
本次建模數(shù)據(jù)包括月度、季度和年度三個(gè)時(shí)間維度。其中,月度數(shù)據(jù)包括2005年1月至2015年6月共126個(gè)月;季度數(shù)據(jù)包括2005年1季度至2015年2季度共42個(gè)季度;年度數(shù)據(jù)包括2003年至2014年共12年。
(2)數(shù)據(jù)指標(biāo)選取
月度、季度數(shù)據(jù)包括:售電量及分類別售電量、高耗能行業(yè)用電量及占工業(yè)用電量比重、化學(xué)原料及化學(xué)制品制造業(yè)用電量、非金屬礦物制品業(yè)用電量、黑色金屬冶煉及壓延加工業(yè)用電量、有色金屬冶煉及壓延加工業(yè)用電量、國(guó)內(nèi)生產(chǎn)總值、社會(huì)消費(fèi)品零售總額、商品零售價(jià)格指數(shù)、全國(guó)居民消費(fèi)價(jià)格指數(shù)、工業(yè)出產(chǎn)者出廠價(jià)格指數(shù)、城鎮(zhèn)居民可支配收入、平均溫度等。
年度數(shù)據(jù)包括:售電量、四大高耗能用電量、四大高耗能用電量占工業(yè)用電量比重、GDP、分產(chǎn)業(yè)增加值占比、城鎮(zhèn)化率、城鎮(zhèn)人口數(shù)、固定資產(chǎn)投資、平均溫度等。
3.1 時(shí)間序列法
首先對(duì)售電量進(jìn)行平穩(wěn)性處理,通過自相關(guān)和偏自相關(guān)圖來(lái)決定ARIMA模型的參數(shù),最終模型為ARIMA(1,1,2)(1,1,2)。
模型R方為0.988,說(shuō)明擬合模型可以解釋原序列98.8%的信息量;標(biāo)準(zhǔn)化BIC值為8.613,較小。按照時(shí)間序列法預(yù)測(cè)模型預(yù)測(cè),預(yù)計(jì)2015年售電量完成34,899億千瓦時(shí),同比增長(zhǎng)0.75%。
從2005年1月至2015年7月各月售電量實(shí)際值與估值對(duì)比情況看,模型較好的擬合了售電量的波動(dòng)趨勢(shì),實(shí)際值與預(yù)測(cè)值之間的誤差基本控制在3%以內(nèi),2005年以來(lái)的誤差控制在1%左右,平均相對(duì)誤差僅為1.31%,最高相對(duì)誤差為3.81%,最低相對(duì)誤差為0.16%。模型擬合效果圖詳見圖1。
3.2 RBF神經(jīng)網(wǎng)絡(luò)法
(1)自變量選取
RBF神經(jīng)網(wǎng)絡(luò)需要設(shè)置隱含中心層數(shù),歷史數(shù)據(jù)只有12條記錄,因此自變量不宜選擇過多,根據(jù)前文分析,經(jīng)過反復(fù)訓(xùn)練模型,最終選取自變量GDP、高耗能用電量、氣溫、城鎮(zhèn)化率。
按照RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型預(yù)測(cè),2015年售電量預(yù)計(jì)完成35,279億千瓦時(shí),同比增長(zhǎng)1.6%。
(2)擬合效果
從歷史上12年售電量實(shí)際完成值與模型估值對(duì)比情況看,預(yù)測(cè)平均誤差僅為0.78%,模型較好的擬合了售電量的波動(dòng)趨勢(shì),實(shí)際值與預(yù)測(cè)值之間的誤差基本控制在1%左右,2015年以來(lái)的誤差控制在1%以內(nèi)。平均相對(duì)誤差為0.77%,最高相對(duì)誤差為1.38%,最低相對(duì)誤差為0.03%,預(yù)測(cè)準(zhǔn)確度高(擬合效果詳見圖2)。
3.3 模型評(píng)估
按照時(shí)間序列法、RBF神經(jīng)網(wǎng)絡(luò)法預(yù)測(cè)模型,預(yù)測(cè)2015年售電量分別為34,899億千瓦時(shí)和35,279億千瓦時(shí),同比增速分別為0.75%、1.6%,兩類預(yù)測(cè)方法預(yù)測(cè)結(jié)果差異較大。
為了對(duì)2015年售電量?jī)煞N方法的預(yù)測(cè)結(jié)果進(jìn)行客觀評(píng)估,首先對(duì)售電量、經(jīng)營(yíng)區(qū)用電量、全國(guó)用電量、GDP進(jìn)行對(duì)比分析:
(1)售電量、經(jīng)營(yíng)區(qū)用電量、全國(guó)用電量、GDP發(fā)展趨勢(shì)一致,呈現(xiàn)正向強(qiáng)相關(guān)關(guān)系;
(2)2004—2014年,售電量、經(jīng)營(yíng)區(qū)用電量、全國(guó)用電量三者歷年同比增速波動(dòng)規(guī)律非常相似,且與GDP增速波動(dòng)一致;但近3年全國(guó)用電量增速明顯放緩,由高速轉(zhuǎn)為中速發(fā)展,電力消費(fèi)彈性系數(shù)由2004年的1.1降為2014年的0.4;
(3)經(jīng)營(yíng)區(qū)全社會(huì)用電量與全國(guó)全社會(huì)用電量發(fā)展趨勢(shì)一致,但占比呈現(xiàn)下降趨勢(shì),已由2004年的0.798降為2014年的0.790。
綜合分析,我國(guó)2015年GDP增長(zhǎng)目標(biāo)設(shè)為7%,較2014年下調(diào)0.5個(gè)百分點(diǎn),2014年電力消費(fèi)彈性系數(shù)為0.4,全社會(huì)用電量增速將在3%左右,由于經(jīng)營(yíng)區(qū)用電占比下降,2015年經(jīng)營(yíng)區(qū)全社會(huì)用電量增速將低于3%。
同時(shí),由于售電量與經(jīng)營(yíng)區(qū)用電量強(qiáng)相關(guān),且售電量增速下滑速度較快,因此售電量增速將遠(yuǎn)低于3%。
4 結(jié)論
4.1 售電量與GDP、城鎮(zhèn)化率呈強(qiáng)相關(guān)關(guān)系
經(jīng)分析發(fā)現(xiàn),GDP、城鎮(zhèn)化率與售電量呈強(qiáng)相關(guān)關(guān)系,相關(guān)系數(shù)高于0.94。除GDP、城鎮(zhèn)化率等共性影響因素外,工業(yè)售電量與可支配收入、第二產(chǎn)業(yè)增加值、進(jìn)出口總值強(qiáng)相關(guān),相關(guān)系數(shù)分別為0.94、0.94、0.91;非居民售電量及居民售電量與可支配收入強(qiáng)相關(guān),相關(guān)系數(shù)分別為0.95、0.96;農(nóng)業(yè)售電量與固定資產(chǎn)投資、新裝增容農(nóng)業(yè)戶數(shù)相關(guān)程度較高。其中,與固定資產(chǎn)投資相關(guān)系數(shù)為0.81,與滯后1個(gè)月的新裝增容農(nóng)業(yè)戶數(shù)變化趨勢(shì)基本一致,相關(guān)系數(shù)為0.8;商業(yè)售電量與可支配收入強(qiáng)相關(guān),相關(guān)系數(shù)為0.9;與滯后8個(gè)月的新裝增容戶數(shù)變化趨勢(shì)基本一致,相關(guān)系數(shù)為0.82。
4.2 RBF神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)售電量效果更佳
相較于已有預(yù)測(cè)方式,本次售電量預(yù)測(cè)充分收集售電量?jī)?nèi)外部影響因素?cái)?shù)據(jù)信息,應(yīng)用數(shù)據(jù)挖掘分析方法,通過售電量相關(guān)性分析,選取與售電量相關(guān)性高的因素作為預(yù)測(cè)模型的輸入變量;基于相關(guān)性分析結(jié)果,在模型中納入GDP、可支配收入、高耗能用電占比、城鎮(zhèn)化率、溫度、第二產(chǎn)業(yè)增加值占比等自變量,考慮了經(jīng)濟(jì)增速放緩、人民生活水平提高、產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、高耗能轉(zhuǎn)移、溫度等多方面影響因素;引入季節(jié)虛擬變量,剔除了季節(jié)因素影響,分析因變量與自變量發(fā)展的長(zhǎng)期趨勢(shì);分別采用時(shí)間序列、回歸預(yù)測(cè)、神經(jīng)網(wǎng)絡(luò)等多種方法構(gòu)建預(yù)測(cè)模型,密切結(jié)合經(jīng)濟(jì)現(xiàn)狀和業(yè)務(wù)現(xiàn)狀,以電力彈性系數(shù)等指標(biāo)進(jìn)行校核,綜合評(píng)估不同預(yù)測(cè)方法的預(yù)測(cè)結(jié)果。
經(jīng)模型評(píng)估發(fā)現(xiàn),采用偏最小二乘回歸法和時(shí)間序列法,預(yù)測(cè)結(jié)果偏差較大,平均相對(duì)誤差為2.32%和1.31%;采用RBF神經(jīng)網(wǎng)絡(luò)法,預(yù)測(cè)值與實(shí)際值平均相對(duì)誤差僅為0.77%,預(yù)測(cè)結(jié)果偏差較小。RBF神經(jīng)網(wǎng)絡(luò)法能有效避免售電量中季節(jié)周期分量和隨機(jī)分量對(duì)趨勢(shì)分量預(yù)測(cè)的干擾,相對(duì)于時(shí)間序列法和偏最小二乘回歸法對(duì)售電量序列直接建模預(yù)測(cè)的方法,RBF神經(jīng)網(wǎng)絡(luò)法具有更高的預(yù)測(cè)精度。