王濤
摘 要:現(xiàn)代社會中,家家戶戶都離不開電力的供應,穩(wěn)定可靠的電力供應對于經濟、社會的發(fā)展以及人民生活水平的提高起著重要作用。上海市作為中國重要的經濟和貿易中心,電力需求一直保持著高速增長,對于電力供應單位而言,需要對用戶的電力需求進行科學預測,以滿足用戶的用電需求,穩(wěn)定電力供應,助力經濟社會發(fā)展。本文采用ARIMA模型、BP神經網絡模型和Holt指數(shù)平滑模型分別對1995~2017年上海市電力需求數(shù)據進行建模分析,并運用合作對策理論中的Shapley組合模型方法進行組合建模,求解了上述三種單一預測方法的權重,構建了組合模型,并依據組合模型預測了未來五年的上海市電力需求量趨勢。根據實例結果,Shapley組合模型具備更高的預測精度,預測平均相對誤差僅為2.33%,擬合效果較好,有利于電力供應單位穩(wěn)定電力供應,促進經濟社會發(fā)展。
關鍵詞:ARIMA模型;BP神經網絡;Holt指數(shù)平滑法;Shapley組合模型;電力需求預測
文章編號:2095-2163(2019)04-0033-07 中圖分類號:TM715;F426.61;F224 文獻標志碼:A
0 引 言
隨著現(xiàn)代社會的高速發(fā)展,電力資源作為必備的重要能源,對于促進社會發(fā)展、提高人民物質生活水平起著至關重要的作用。現(xiàn)代社會中,家家戶戶都離不開電力的供應,穩(wěn)定可靠、價格合適的電力供應成為了人們關注的焦點。因此,電力供應單位需要準確地制定供電計劃,確保對用電量的準確預測以及電力的穩(wěn)定供應。上海市作為中國重要的經濟和貿易中心,自改革開放以來經濟一直保持著良好增長態(tài)勢,人民生活水平顯著提高,物質生活獲得了極大的豐富,由此也帶來了用電量的激增,這對供電單位而言同樣也是極大的考驗。因而選擇科學、有效的預測模型,準確地對市場中的用電需求進行預測,有助于供電單位制定供電計劃,穩(wěn)定電力供應,助力社會經濟的高速平穩(wěn)運行,不斷提高人民生活質量。
近年來,國內外學者對于預測方法的研究有很多,也取得了可觀成果[1-17]。目前,常用的預測方法主要包括系統(tǒng)動力學方法[1]、隨機森林法[2-3]、支持向量機法[4-5]、神經網絡法[6-9]、灰色預測法[10-13]、回歸分析法[14-17]等。文獻[1]從系統(tǒng)動力學的角度研究了城市長期電力需求的預測方法,在經濟新常態(tài)的背景下,城市支柱產業(yè)面臨著由要素驅動向創(chuàng)新驅動的轉變,因而傳統(tǒng)的電力需求預測模型逐漸不再適用,文章結合新的影響因素進行了定量分析,提出了一種適用于經濟新常態(tài)的長期電力需求預測模型的動力學方法,并取得了較好的效果。文獻[9]基于BP神經網絡算法,研究了北京市夏季日最大電力負荷的預測方法。文獻[16]基于2009~2013年北京市電力負荷和氣象資料,通過多元回歸的思想構建了北京市日最大電力負荷的預測模型,并取得了較好的預測準確率,展現(xiàn)了良好的預報能力。文獻[17]將自回歸積分滑動平均模型(ARIMA模型)和支持向量機法(SVM)相結合,基于ARIMA和SVM混合模型對短期電力負荷進行了預測。然而目前大多數(shù)的預測文獻中采用了單一的預測方法,往往偏重于數(shù)據的某一類特征,無法充分利用數(shù)據的各種有效信息,從而導致預測的誤差較大,未能得到令人滿意的預測精度和效果。但是研究可知組合預測模型可以克服單一模型的局限性,最大程度地利用數(shù)據的各種有效信息,因而組合預測模型方法更加有利于實現(xiàn)科學的預測,廣泛適用于信息量不完備的復雜經濟系統(tǒng)。一般而言,電力需求量數(shù)據序列為非平穩(wěn)時間序列,可以通過差分的方法轉換為平穩(wěn)時間序列, 進而采用ARIMA模型進行建模預測分析。同時,BP神經網絡也是一種常用的預測方法,具有高度的信息處理能力,在處理數(shù)據的過程中表現(xiàn)出良好的自學習、自適應能力,因而也尤為突顯出該方法獨特的優(yōu)越性;指數(shù)平滑法則是一種較簡單的預測方法,常適用于光滑、且顯出一定趨勢的數(shù)據,在計算的復雜程度和適應性上占據著優(yōu)勢。
在上述分析基礎上,本文擬將采用組合ARIMA模型、BP神經網絡模型和指數(shù)平滑模型,基于Shapley組合預測模型對上海市電力需求趨勢展開預測分析,并給出未來五年上海市電力需求的預測結果。對此可得研究論述如下。
1 ARIMA模型建模
ARIMA模型,又稱自回歸積分滑動平均模型,是一種經典的時間序列計量模型,主要用于對時間序列的宏觀趨勢預測研究[18]。ARIMA模型通過把非平穩(wěn)時間序列轉化為平穩(wěn)時間序列,將因變量對其滯后和隨機誤差項的當前值與滯后進行回歸所建立的模型,可以有效地描述時間序列數(shù)據的動態(tài)連續(xù)特性,適用于解決非平穩(wěn)時間序列趨勢預測問題。在ARIMA(p, d, q)模型中,AR稱為自回歸,p表示自回歸的階數(shù),MA表示移動平均,q為移動平均的階數(shù),d為將非平穩(wěn)時間序列轉化為平穩(wěn)時間序列的差分階數(shù)。ARIMA模型的基本結構如下:
對于任意非平穩(wěn)時間序列,均可以通過差分運算,轉化為平穩(wěn)時間序列,繼而進行ARMA模型的擬合。對于時間序列建立ARIMA模型的步驟可分述如下。
(1)時間序列的平穩(wěn)性檢驗。根據獲得的時間序列,進行ADF單位根檢驗,依據結果判斷是否為平穩(wěn)時間序列。
(2)將非平穩(wěn)時間序列轉化為平穩(wěn)序列。對于非平穩(wěn)時間序列,運用差分運算的方法,轉化為平穩(wěn)時間序列。
(3)識別模型并判斷模型階數(shù)。對于平穩(wěn)時間序列,依據自相關與偏自相關圖初步分析模型的階數(shù)p,q,并依據AIC或BIC準則最終確定其數(shù)值。
(4)模型參數(shù)檢驗。對模型殘差進行白噪聲檢驗。
(5)模型擬合預測。依據模型,對時間序列進行預測。
根據上述步驟,對上海市電力需求量時間序列進行ARIMA模型建模。對此,可推得研發(fā)闡述如下。
1.1 時間序列的平穩(wěn)性檢驗
根據1995~2017年上海市電力需求量歷史數(shù)據(文中所用數(shù)據來自國家統(tǒng)計局官方數(shù)據庫),繪制1995~2017年上海市電力需求量時序圖如圖1所示。
觀察圖1時序可知,上海市電力需求量呈現(xiàn)明顯的上升趨勢,分析可知這不是一個平穩(wěn)序列。為了進一步確定上海市電力需求序列的平穩(wěn)性, 運用ADF單位根檢驗的方法進行判斷,運算結果見表1。
根據ADF單位根檢驗結果,P值為0.995 900,不能拒絕原假設,上海市電力需求量序列不是一個平穩(wěn)的時間序列。因此需要將數(shù)據進行差分平穩(wěn)性處理。
1.2 差分運算處理
對上海市電力需求量時間序列進行一階差分處理。為了判斷一階差分后該序列是否平穩(wěn),繪制一階差分后序列的自相關圖和偏自相關圖如圖2所示。
由圖2可知,初步判斷一階差分后序列為平穩(wěn)序列。為了保證判斷的正確性,同理,可以通過ADF單位根檢驗的方法對差分后的時間序列進行判斷。預算結果見表2。
由ADF單位根檢驗結果,P值0.032 900<0.05,拒絕原假設,可以認為一階差分之后為平穩(wěn)序列。因此,可以考慮采用ARIMA(p,1,q)模型。
基于準確性原則和數(shù)據最優(yōu)化考慮,對一階差分后的時間序列再做一次差分運算。為了判斷二階差分后該序列是否平穩(wěn),繪制二階差分后序列的自相關圖和偏自相關圖如圖3所示。
根據圖3可初步判斷二階差分后序列為平穩(wěn)序列。為了保證判斷的正確性,同理通過ADF單位根檢驗的方法對差分后的時間序列進行判斷。結果見表3。
由表3分析可知,二階差分之后序列即為平穩(wěn)序列。因此,可以考慮ARIMA(p,2,q)模型。
1.3 識別模型,判斷模型階數(shù)
根據上述ADF單位根檢驗的結果,可以看出上海市電力需求數(shù)據在一階差分和二階差分下ADF檢驗P值均小于0.05,即差分后的時間序列均為平穩(wěn)序列,參數(shù)d的選取需要考慮1與2兩個值。
在ARIMA模型中除了考慮差分階數(shù)d的選擇,還需要考慮參數(shù)p與q的選擇,時間序列的自相關系數(shù)(ACF)與偏自相關系數(shù)(PACF)可以提供對于參數(shù)p,q的判斷方法。若自相關函數(shù)在q階截尾和偏自相關系數(shù)在p階截尾,則可初步判定模型為ARIMA(p,d,q)。
通過觀察自相關函數(shù)與偏自相關函數(shù)圖,p值可以選取0,1,2,q值可以選取1,2。根據上述結論,初步設定的模型為ARIMA(0,1,1)、ARIMA(0,2,1)、ARIMA(1,2,1)、ARIMA(2,2,1)、ARIMA(0,2,2)、ARIMA(1,2,2)、ARIMA(2,2,2)。由于上述模型的確定主要是根據自相關圖和偏自相關圖定性判斷得出,為了精準確定最優(yōu)模型參數(shù),可以使用AIC和BIC準則進行判斷。一般認為,AIC和BIC函數(shù)值較小的模型參數(shù)有著較高的準確性,更加接近真實模型的階數(shù)。使用R語言對上述七種模型進行比較,各模型的AIC和BIC準則值見表4。
根據AIC和BIC準則對上述模型進行比較,發(fā)現(xiàn)模型ARIMA(2,2,1)結果較好。選取ARIMA(2,2,1)模型為最優(yōu)模型,序列x1,x2,...,xn的擬合結果為:
1.4 模型參數(shù)檢驗
對ARIMA(2,2,1)模型殘差序列進行白噪聲檢驗,得到p值為0.959 6>0.05,表明殘差序列是純隨機的,為白噪聲序列,說明模型顯著,擬合效果較好,ARIMA(2,2,1)模型對該時間序列擬合成功。
1.5 模型預測
應用ARIMA(2,2,1)模型對上海市2018~2022年電力需求量進行短期預測,結果見表5。
2 BP神經網絡
根據1995~2017年上海市電力需求量的歷史數(shù)據,選擇每前三年的數(shù)據來預測第四年的數(shù)據。即在BP神經網絡中,輸入層選擇3個神經元,輸出層選擇1個神經元,根據文獻[9],在隱含層的節(jié)點應為輸入層節(jié)點的2~3倍左右搜索,經過多次實驗模擬,測試發(fā)現(xiàn)在輸入層節(jié)點為3,輸出層節(jié)點為1的情況下,隱含層節(jié)點數(shù)為10時,BP神經網絡的擬合效果較好。因此可按照如下參數(shù)來訓練BP神經網絡建模,即:輸入層節(jié)點數(shù)為3,隱含層節(jié)點數(shù)為10,輸出層節(jié)點數(shù)為1,訓練次數(shù)為3 000次,神經網絡訓練誤差設為0.000 1,網絡的初始權值/學習速度和閾值等由Matlab軟件自動選取。
研究中,在保證訓練次數(shù)和訓練誤差的前提下,應用BP神經網絡模型對上海市2018~2022年電力需求量進行短期預測,結果見表6。
3 Holt指數(shù)平滑法
指數(shù)平滑法,是一種基于預測對象歷史數(shù)據利用加權平均的方法進行數(shù)據的擬合與預測的方法[19]。根據上述關于1995~2017年上海市電力需求量的變化趨勢圖可以看出,上海市電力需求呈現(xiàn)出一定程度的線性變化趨勢,具有水平截距和線性趨勢斜率,無季節(jié)因素影響?;谥笖?shù)平滑理論,Holt指數(shù)平滑法可以對有水平項和趨勢項的時間序列實現(xiàn)擬合預測,本文采取Holt指數(shù)平滑的方法對上海市電力需求量變化趨勢進行預測。這里,研究推得Holt指數(shù)平滑法的計算模型的數(shù)學公式可順次表述如下。
研究可知,R語言的forecast包主要用于時間序列的擬合預測。其中,函數(shù)ets()主要用于關于指數(shù)預測模型的數(shù)據擬合,而且還會依據平均相對誤差最小準則,自動選取對原始數(shù)據擬合優(yōu)度最高的模型,以上海市電力需求量歷史數(shù)據的指數(shù)模型擬合為例,可得擬合優(yōu)度最高的Holt指數(shù)平滑模型。對應模型參數(shù)有:
應用Holt指數(shù)平滑模型對上海市2018~2022年電力需求量進行短期預測,運算結果見表7。
4.1 Shapley方法基本思路
Shapley組合法是由Shapley在1953年提出的用于解決多參與者合作對策問題的一種方法。該方法針對各個參與者在合作中的不同貢獻,著眼于每個參與者對合作的平均貢獻,突出了合作中每個參與者的重要性,因而易于為合作的各個參與者所接受,并獲得了較好的應用[20-21]。
在Shapley組合法中,假設存在s種預測方法,集合為I=1,2,...,s,對其中任意子集p,q,E(p),E(q)分別為該預測子集的誤差。則有:
4.2 基于Shapley方法的上海市電力需求量預測
使用均方誤差(MAPE)準則對上述三種單一預測方法,即:ARIMA模型、BP神經網絡模型和Holt指數(shù)平滑模型的預測誤差進行計算分析。 根據上述三種單一預測方法的預測誤差,可求得組合預測的總誤差值為(2.49+2.99+2.79)/3=2.76。由Shapley方法,參與組合預測模型總誤差分配的“合作關系”成員為:I=1,2,3 ,I所有子集的組合誤差分別為:E1、E2、E3、E1,2、E1,3、E2,3、E1,2,3,其數(shù)值的大小為該子集所包括的向量的誤差平均值,計算結果見表8。
根據Shapley組合法給出的計算公式,可以計算出組合中對應的成員1的Shapley值為:
由權重公式(10),可以計算出各個預測方法的權重為ω=0.370 0 0.301 6 0.328 4,則Shapley組合預測模型為:
由上述對于各個預測模型的權重公式,可以對ARIMA模型、BP神經網絡模型和Holt指數(shù)平滑模型進行組合。利用組合預測模型對1995~2017年上海市電力需求量進行預測,該組合模型的預測值與誤差詳見表9。
根據表9中數(shù)據的分析比較后可知,采用Shapley組合模型預測法運算得到的1998~2017年上海市電力需求量的預測結果的平均相對誤差(MAPE)為2.33%,屬于最小。所以,可以認為基于Shapley組合模型預測法得到的預測結果具有較高的預測精度,擬合效果較好,相對單一的預測方法較為有效。
在此基礎上,擬對2018~2022年五年內上海市電力需求量進行預測。首先采用上述單一模型進行預測,然后根據Shapley組合模型預測法,基于各單一預測方法的權重值進行組合加權,最終算出組合預測值。預測結果見表10。
5 結束語
本文首先采用ARIMA模型、BP神經網絡模型和Holt指數(shù)平滑模型三種單一預測模型分別對1995~2017年上海市電力需求數(shù)據進行建模分析,接著運用合作對策理論中的Shapley組合模型方法進行組合建模,求解了上述三種單一預測方法的權重,構建了組合模型,并依據組合模型預測了未來五年的上海市電力需求量趨勢。根據實例結果,相比于三種單一的預測方法的擬合效果,Shapley組合模型具備更高的預測精度,預測平均相對誤差僅為2.33%,擬合效果較好。
在實際應用中,根據Shapley組合模型的預測結果,未來5年內上海市的電力需求仍將呈現(xiàn)較大的增長態(tài)勢,預計到2022年上海市的電力需求量為1 812.28億千瓦時,該預測運算的擬合結果較好,因此可為上海市的供電單位決策提供參考。對于上海市的供電單位而言,需要制定科學合理的供電量增長規(guī)劃以及供電基礎設施的建設工作,穩(wěn)定上海市電力供應,服務于高速發(fā)展的經濟社會活動,促進人民生活水平的提高。
此外,本文主要選取了3種預測領域應用較多、效果較好的單一預測方法用于Shapley組合模型,如何更加全面有效地選擇預測方法進行Shapley組合預測,提高應用的一般性,獲得更高的擬合精度,仍然是一個亟待深入探究和討論的研究課題。
參考文獻
[1]HE Yongxiu, JIAO Jie, CHEN Qian, et al. Urban long term electricity demand forecast method based on system dynamics of the new economic normal:The case of Tianjin[J]. Energy, 2017, 133(19):9-22.
[2] LAHOUAR A, BEN HADJ SLAMA J. Hour-ahead wind power forecast based on random forests[J]. Renewable Energy, 2017, 109(5):529 - 541.
[3] LAHOUAR A, BEN HADJ SLAMA J. Day-ahead load forecast using random forest and expert input selection[J]. Energy Conversion and Management, 2015, 103(4):1040 -1051.
[4] WANG Xibin, WEN Junhao, ZHANG Yihao, et al. Real estate price forecasting based on SVM optimized by PSO[J]. Optik, 2014, 125(3):1439-1443 .
[5] MALVONI M, DE GIORGI M G, CONGEDO P M. Data on support vector machines (SVM) model to forecast photovoltaic power[J]. Data in Brief, 2016, 9(9):13-16.
[6] DIMOULKAS I, MAZIDI P, HERRE L. Neural networks for GEFCom2017 probabilistic load forecasting[J]. International Journal of Forecasting, 2018(21):20-24.
[7] TEALAB A. Time series forecasting using artificial neural networks methodologies:A systematic review[J]. Future Computing and Informatics Journal, 2018, 3(2):334-340.
[8] WANG Lin, WANG Zhigang, QU Hui, et al. Optimal forecast combination based on neural networks for time series forecasting[J]. Applied Soft Computing, 2018, 66(6):1-17.
[9] 李琛,郭文利,吳進,等. 基于BP神經網絡的北京夏季日最大電力負荷預測方法[J]. 氣候與環(huán)境研究,2019,24(1):135-142.
[10]XIE Naiming, YUAN Chaoqing, YANG Yingjie. Forecasting China's energy demand and self-sufficiency rate by grey forecasting model and Markov model[J]. International Journal of Electrical Power & Energy Systems, 2015, 66(5):1-8.
[11]XU Ning, DANG Yaoguo, GONG Yande. Novel grey prediction model with nonlinear optimized time response method for forecasting of electricity consumption in China[J]. Energy, 2017, 118(9):473-480.
[12]LI D C, CHANG C J, CHEN C C, et al. Forecasting short-term electricity consumption using the adaptive grey-based approach—An Asian case[J]. Omega, 2012, 40(6):767-773.
[13]JIN Min, ZHOU Xiang, ZHANG Z M, et al. Short-term power load forecasting using grey correlation contest modeling[J]. Expert Systems With Applications, 2012, 39(1):773-779.
[14]YUAN Chaoqing, LIU Sifeng, FANG Zhigeng. Comparison of China's primary energy consumption forecasting by using ARIMA (the autoregressive integrated moving average) model and GM(1,1) model[J]. Energy, 2016, 100(11):384-390.
[15]BARAK S, SADEGH S S. Forecasting energy consumption using ensemble ARIMA-ANFIS hybrid algorithm[J]. International Journal of Electrical Power & Energy Systems, 2016, 82(8):92-104.
[16]石玉恒,趙娜,王凌,等. 北京地區(qū)日最大電力負荷預測模型初探[J/OL]. 中國電力:1-5[2019-01-30].http://kns.cnki.net/kcms/detail/11.3265.TM.20190129.2238.004.html.
[17]NIE Hongzhan, LIU Guohui, LIU Xiaoman, et al. Hybrid of ARIMA and SVMS for Short-Term load forecasting[J]. Energy Procedia, 2012, 16(15):1455-1460.
[18]王燕. 應用時間序列分析[M]. 4版. 北京:中國人民大學出版社,2015.
[19]滑瑤,張輝,劉悅悅,等. 基于Holt-Winters無季節(jié)指數(shù)平滑模型的國內電影票房預測[J]. 中國傳媒大學學報(自然科學版),2017,24(4):1-7.
[20]王翀. 基于模型組合法的我國能源消費需求趨勢預測[J]. 統(tǒng)計與決策,2018(20):86-89.
[21]崔楊,曲鈺,仲悟之,等. 基于改進shapley值的風電匯聚趨勢性分狀態(tài)量化方法[J/OL]. 電網技術:1-10[2018-11-26]. https://doi.org/10.13335/j.1000-3673.pst.2018.1451.