張士強(qiáng),王 雯,王 健
(1.山東科技大學(xué),山東 青島 266510;2.泰山集團(tuán),山東 泰安 271000)
ARIMA模型在城市年用電量預(yù)測(cè)中的應(yīng)用
張士強(qiáng)1,王 雯1,王 健2
(1.山東科技大學(xué),山東 青島 266510;2.泰山集團(tuán),山東 泰安 271000)
介紹了單整自回歸移動(dòng)平均模型(antoregressive integrated moving average model,ARIMA)及其建模思路,并結(jié)合Eviews軟件將ARIMA模型應(yīng)用于成都市年用電量的分析與預(yù)測(cè)。經(jīng)檢驗(yàn)此模型預(yù)測(cè)精度較高,擬合效果理想,體現(xiàn)了應(yīng)用ARIMA模型進(jìn)行用電量預(yù)測(cè)的可行性,可以為電力系統(tǒng)工作人員進(jìn)行年用電量預(yù)測(cè)提供參考。
ARIMA;用電量預(yù)測(cè);偏相關(guān)函數(shù);自相關(guān)函數(shù)
用電量預(yù)測(cè)是電力系統(tǒng)調(diào)度與運(yùn)營(yíng)的重要任務(wù),預(yù)測(cè)的準(zhǔn)確程度,關(guān)系到國(guó)民經(jīng)濟(jì)、社會(huì)安定、居民生活及電力公司本身的發(fā)展。本文介紹了單整自回歸移動(dòng)平均模型,并給出了使用這一模型進(jìn)行建模和預(yù)測(cè)的一般過(guò)程,而后進(jìn)行了實(shí)證分析,通過(guò)建立相應(yīng)的ARIMA模型,分析預(yù)測(cè)年用電量。
近年來(lái),利用ARIMA模型對(duì)各行業(yè)時(shí)間序列進(jìn)行預(yù)測(cè)的研究越來(lái)越多。文獻(xiàn)[1]根據(jù)中國(guó)農(nóng)產(chǎn)品貿(mào)易數(shù)據(jù)特點(diǎn),構(gòu)建了中國(guó)農(nóng)產(chǎn)品進(jìn)出口的ARIMA模型,對(duì)中國(guó)農(nóng)產(chǎn)品進(jìn)出口進(jìn)行預(yù)測(cè),得到的平均預(yù)測(cè)誤差僅為3.291%和3.248%,達(dá)到了最小方差意義下的最優(yōu)預(yù)測(cè)效果;文獻(xiàn)[2]對(duì)中國(guó)能源消費(fèi)總值數(shù)據(jù)序列進(jìn)行分析,建立了中國(guó)能源消費(fèi)的ARIMA模型,檢驗(yàn)結(jié)果表明,ARIMA模型對(duì)原始數(shù)據(jù)序列有著較好的擬合效果;文獻(xiàn)[3]利用ARIMA模型對(duì)土耳其主要燃料能源消費(fèi)進(jìn)行了預(yù)測(cè),結(jié)果顯示模型擬合效果理想;文獻(xiàn)[4]建立ARIMA模型對(duì)售電價(jià)格進(jìn)行預(yù)測(cè),得出的短期預(yù)測(cè)效果優(yōu)于長(zhǎng)期預(yù)測(cè)效果。近年來(lái),關(guān)于用電量預(yù)測(cè)的研究越來(lái)越多;文獻(xiàn)[5]將一種新的灰色模型應(yīng)用于城市年用電量預(yù)測(cè)中,在工程實(shí)踐中具有一定的應(yīng)用價(jià)值;文獻(xiàn)[6]以華北電網(wǎng)月度售電量為基礎(chǔ),運(yùn)用季節(jié)ARIMA模型進(jìn)行分析,結(jié)果表明,該方法對(duì)售電量的短期預(yù)測(cè)有較高的預(yù)測(cè)精度。本文對(duì)成都市1950—2007年的年用電量的時(shí)間序列進(jìn)行統(tǒng)計(jì)規(guī)律分析,結(jié)合統(tǒng)計(jì)軟件Eviews,建立成都市用電量的ARIMA模型,以此來(lái)預(yù)測(cè)用電量的發(fā)展變化,具有一定的參考價(jià)值。
時(shí)間序列模型是由博克斯·詹金斯1976年提出的。這種建模方法的特點(diǎn)是不考慮其他解釋變量的作用,僅依據(jù)變量自身的變化規(guī)律,利用外推機(jī)制描述時(shí)間序列的變化。時(shí)間序列模型一般分為4種類型,分別是自回歸過(guò)程、移動(dòng)平均過(guò)程、自回歸移動(dòng)平均過(guò)程和單整自回歸移動(dòng)平均過(guò)程。
如果一個(gè)線性隨機(jī)過(guò)程可表示為
式中:φi,i=1,…,p,為回歸參數(shù);ut為白噪聲過(guò)程。則該過(guò)程為p階自回歸過(guò)程,記為AR(p)。
如果一個(gè)線性隨機(jī)過(guò)程可表示為
自回歸移動(dòng)平均過(guò)程,是由自回歸和移動(dòng)平均2部分共同構(gòu)造的隨機(jī)過(guò)程,記為ARMA(p,q)。其中p、q分別表示自回歸分量和移動(dòng)平均分量的最大滯后階數(shù)。它的表達(dá)式為
以上介紹了3種平穩(wěn)的隨機(jī)過(guò)程。當(dāng)時(shí)間序列非平穩(wěn)時(shí),首先要通過(guò)差分使序列平穩(wěn)后再建立時(shí)間序列模型。隨機(jī)過(guò)程yt若經(jīng)過(guò)d次差分后可變換為一個(gè)平穩(wěn)可逆的ARMA(p,q),則稱yt為(p,d,q)階單整自回歸移動(dòng)平均過(guò)程,記為ARIMA(p,d,q)。ARIMA過(guò)程用Φ(L)Ddyt=θ0+Θ(L)ut表示,式中:Φ(L)和Θ(L)分別為p階自回歸算子和q階移動(dòng)平均算子;θ0為漂移項(xiàng);Ddyt表示對(duì)yt進(jìn)行d次差分后的平穩(wěn)過(guò)程。它包括了單整的AR、MA和ARMA過(guò)程。
根據(jù)博克斯·詹金斯的建模思想[8],建立時(shí)間序列模型通常需要以下步驟:
在建模之前首先進(jìn)行平穩(wěn)化檢驗(yàn),判斷是否為平穩(wěn)序列,可以通過(guò)相關(guān)圖判斷。如果一個(gè)隨機(jī)過(guò)程是平穩(wěn)的,則其自相關(guān)函數(shù)呈指數(shù)衰減或正弦衰減,而且衰減得快;相反,如果是非平穩(wěn)過(guò)程,則衰減得很慢。也可以用單位根檢驗(yàn)(Dickey?Fuller test,DF檢驗(yàn))以及擴(kuò)展DF檢驗(yàn)(augmented Dickey?Fuller test,ADF檢驗(yàn)),判斷隨機(jī)過(guò)程的平穩(wěn)性。單位根檢驗(yàn)是檢驗(yàn)時(shí)序穩(wěn)定性的一種正式的方法。若為非平穩(wěn)序列,則通過(guò)差分變換、對(duì)數(shù)變換、季節(jié)差分對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)化、均值化處理[9]。
模型的識(shí)別主要依賴于對(duì)時(shí)間序列的相關(guān)函數(shù)(autocorrelation function,ACF)圖與偏相關(guān)函數(shù)(partial autocorrelation function,PACF)圖的分析:ACF圖表現(xiàn)為拖尾衰減特征,而PACF圖在p期后出現(xiàn)截止特征,則該過(guò)程適合AR(p);ACF圖在q期后出現(xiàn)截止特征,而PACF圖表現(xiàn)為拖尾衰減特征,則該過(guò)程適合MA(q);ACF圖與PACF圖都呈拖尾衰減特征,則該過(guò)程是ARMA。
通過(guò)圖形分析選擇模型的形式并初步確定p、q的值。同時(shí)利用赤池信息量準(zhǔn)則(Akaike information criterion,AIC)和施瓦茲準(zhǔn)則(Schwarz criterion,SC)對(duì)多種ARMA(p,q)模型進(jìn)行對(duì)比與篩選,選出最優(yōu)的ARMA(p,q)。
對(duì)AR(p)模型的參數(shù)進(jìn)行普通最小二乘法(or?dinary least squares,OLS)估計(jì),而MA(q)和 ARMA(p,q)采用迭代式的非線性最小二乘法進(jìn)行估計(jì)。
模型的診斷與檢驗(yàn)包括被估參數(shù)的顯著性檢驗(yàn)和殘差的隨機(jī)性檢驗(yàn)。如果估計(jì)的模型中的某些參數(shù)不能通過(guò)顯著性檢驗(yàn),或者殘差序列不能近似為一個(gè)白噪聲序列,則需再次對(duì)模型進(jìn)行識(shí)別。
以成都市1950—2007年的歷年用電量[10]為樣本,利用統(tǒng)計(jì)軟件Eviews對(duì)成都市1950—2005年的年用電量數(shù)據(jù)建立ARIMA模型,預(yù)測(cè)2006—2010年的用電量。2006—2007年的數(shù)據(jù)留作模型檢驗(yàn)數(shù)據(jù),用于同預(yù)測(cè)值比較,評(píng)價(jià)預(yù)測(cè)精度。
將原始數(shù)據(jù)記為x,作出其線形圖,如圖1所示。
智能變電站裝配式建筑造價(jià)評(píng)價(jià)模型的合理構(gòu)建重點(diǎn)在于探索科學(xué)的方法解決多個(gè)造價(jià)影響因子的群決策問(wèn)題,本文在基于造價(jià)因子的識(shí)別基礎(chǔ)上,提出的直覺梯形模糊數(shù)多因子群決策方法,能夠更加細(xì)膩準(zhǔn)確的刻畫專家對(duì)影響因子的確定、不確定、猶豫度三種狀態(tài),同時(shí),能夠通過(guò)測(cè)度專家個(gè)體偏好與專家群體平均偏好的距離科學(xué)解決專家權(quán)重完全未知的問(wèn)題。
圖1 序列x折線圖
從圖1中可以看出,成都市的年用電量逐年上漲,曲線向右上方陡直傾斜,前后增長(zhǎng)幅度不一致,呈指數(shù)增長(zhǎng)趨勢(shì),很顯然該數(shù)據(jù)不平穩(wěn)并且存在異方差,所以先對(duì)數(shù)據(jù)取對(duì)數(shù),以消除異方差,生成新序列LNX=lnx,并對(duì)LNX進(jìn)行1階差分,得DLNX序列如圖2所示。
圖2 序列DLNX折線圖
從圖中可看出,通過(guò)對(duì)序列進(jìn)行差分處理,數(shù)據(jù)的趨勢(shì)性已被消除,時(shí)間序列已基本平穩(wěn)。再次通過(guò)Eviews對(duì)序列DLNX進(jìn)行ADF檢驗(yàn)。ADF檢驗(yàn)的一般模型結(jié)構(gòu)為式中:ut為白噪聲[2]。零假設(shè)為H0∶γ=0;備擇假設(shè)為H1∶γ<0。接受零假設(shè)意味著該序列含有單位根,即該序列為非平穩(wěn)序列[2]。檢驗(yàn)結(jié)果如表1所示。
表1 DLNX單位根檢驗(yàn)結(jié)果
由表1知1階差分序列在1%、5%或10%的顯著水平下,均拒絕原假設(shè),接受不存在單位根的結(jié)論,因此該時(shí)間序列是平穩(wěn)的時(shí)間序列,取d=1。
DLNX序列滯后12期的ACF圖和PACF圖如表2所示。
表2 DLNX序列滯后12期的ACF圖和PACF圖
由表2可以看出,該序列的ACF圖和PACF圖都是拖尾的,所以判斷出此序列適合ARMA模型。圖中虛線之間的區(qū)域?yàn)樽韵嚓P(guān)或偏相關(guān)中正負(fù)2倍與估計(jì)標(biāo)準(zhǔn)差所夾成的。如果相關(guān)值在這個(gè)區(qū)域內(nèi),則在顯著水平為5%的情況下顯著不為0。其自相關(guān)函數(shù)在1階處出現(xiàn)峰值并迅速衰減,偏相關(guān)函數(shù)在1、2階顯著不為0。所以初步選定模型為ARMA(2,1)。但這只是粗略估計(jì),有較大主觀性。
運(yùn)用非線性最小二乘法中的迭代算法,借助Eviews對(duì)ARIMA(2,1,1)進(jìn)行參數(shù)估計(jì)。具體結(jié)果見表3。
表3 模型估計(jì)結(jié)果
估計(jì)結(jié)果顯示:模型ARIMA(2,1,1)中C、AR(1)、AR(2)、MA(1)的系數(shù)都顯著異于0,模型是比較顯著的。模型的復(fù)相關(guān)系數(shù)為0.291 993,修正復(fù)相關(guān)系數(shù)為0.248 646,回歸標(biāo)準(zhǔn)為0.214 419,殘差平方和為2.252 799,對(duì)數(shù)似然估計(jì)量為8.486 398,DW統(tǒng)計(jì)量為1.981 934,被解釋變量均值為0.135 062,被解釋變量標(biāo)準(zhǔn)為0.247 367,AIC信息量為-0.169 298。AR特征根的倒數(shù)為0.15+0.48i,0.15+0.48i;MA特征根的倒數(shù)為-0.31。特征根的絕對(duì)值都大于1,所以該序列為平穩(wěn)序列。AIC=-0.169 298,較小的AIC值代表較高的擬合優(yōu)度??梢猿醪酱_定ARIMA(2,1,1)是較為合理的。從而得到接下來(lái)對(duì)殘差序列進(jìn)行白噪聲檢驗(yàn)。根據(jù)初步確定的模型對(duì)序列進(jìn)行回歸擬合,如圖3所示。圖中實(shí)際值與擬合值基本一致。模型的殘差圖如圖4所示。從圖4中可以看出,殘差序列類似白噪聲序列,非常平穩(wěn),沒有明顯的趨勢(shì)性,模型擬合效果比較好[2]。
圖3 模型擬合折線圖
圖4 殘差折線圖
表4 模型殘差序列滯后12期的ACF圖和PACF圖
對(duì)殘差序列進(jìn)行ADF檢驗(yàn),如表5所示。ADF值為-5.327 009,而在1%顯著水平下,ADF的臨界值為-3.562 669,因此序列在1%顯著水平下被看作白噪聲序列,模型的擬合值是實(shí)際值的無(wú)偏估計(jì),模型擬合效果比較好。
表5 模型殘差序列ADF檢驗(yàn)結(jié)果
由ARIMA(2,1,1)模型,可得lnXt的預(yù)測(cè)公式為:
用ARIMA(2,1,1)對(duì)2006—2010年成都市用電量進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果見表6。其中2006—2007年的相對(duì)誤差分別為1.5%和6.0%。這說(shuō)明預(yù)測(cè)值與實(shí)際結(jié)果是比較接近的,預(yù)測(cè)精度比較高。模型對(duì)2008—2010年用電量進(jìn)行預(yù)測(cè),從預(yù)測(cè)結(jié)果看出,用電量仍然保持持續(xù)上漲趨勢(shì)。
通過(guò)對(duì)1950—2005年成都市年用電量序列進(jìn)行分析和所建立的模型檢驗(yàn)結(jié)果表明,本文建立的ARIMA(2,1,1)模型對(duì)原始數(shù)據(jù)序列有著較好的擬合效果,模型的預(yù)測(cè)效果比較理想。但從2006—2007預(yù)測(cè)結(jié)果的相對(duì)誤差隨時(shí)間越來(lái)越大可以看出,該模型對(duì)于短期預(yù)測(cè)較合理,但對(duì)于長(zhǎng)期預(yù)測(cè),模型有一定的缺陷[11]。說(shuō)明了ARIMA模型用于用電量預(yù)測(cè)的可行性,可以為電力系統(tǒng)工作人員進(jìn)行年用電量預(yù)測(cè)提供參考。但是不同地區(qū)電力需求量的變化規(guī)律不甚相同,需要對(duì)原始數(shù)據(jù)進(jìn)行深入分析后確定合適的模型參數(shù)才能使預(yù)測(cè)結(jié)果更符合實(shí)際。
表6 2006—2010年成都市用電量實(shí)際值與預(yù)測(cè)值
:
[1]汪艷濤,王記志.中國(guó)農(nóng)產(chǎn)品貿(mào)易ARIMA模型的建立及預(yù)測(cè)[J].經(jīng)濟(jì)與管理,2009(7):11-15.
[2]楊偉傳.中國(guó)能源消費(fèi)的ARIMA模型預(yù)測(cè)分析[J].統(tǒng)計(jì)與決策,2009(11):71-72.
[3]Ediger V,Akar S.ARIMA forecasting of primary energy demand by fuel in Turkey[J].Energy Policy,2007,35(3):1701-1708.
[4]Contreras J.ARIMA models to predict next?day electrici?ty prices[J].IEEE Transactions on Power Systems,2003,18(3):1014-1020.
[5]李詠凱,張建華,王國(guó)棟,等.一種新的灰色模型在城市年用電量預(yù)測(cè)中的應(yīng)用[J].現(xiàn)代電力,2010(4):13-16.
[6]崔和瑞,王娣.基于季節(jié)ARIMA模型的華北電網(wǎng)售電量預(yù)測(cè)研究[J].華東電力,2009(1):70-72.
[7]張曉峒.計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)[M].天津:南開大學(xué)出版社,2004.
[8]Pankratz A.Forecasting with univariate Box?Jenkins mod?els:concepts and cases[M].Greencastle:Depauw Uni?versity Press,1984.
[9]何書元.應(yīng)用時(shí)間序列分析[M].北京:北京大學(xué)出版社,2004:86-121.
[10]成都市統(tǒng)計(jì)局.成都市統(tǒng)計(jì)年鑒2008[M].北京:中國(guó)統(tǒng)計(jì)出版社,2008.
[11]吳懷宇.時(shí)間序列分析與綜合[M].武漢:武漢大學(xué)出版社,2004:58-79.
[12]Greene W H.Econometric Analysis[M].5th ed.New Jersey:Prentice Hall,2002:11-15
[13]張曉峒.Eviews使用指南與案例[M].北京:機(jī)械工業(yè)出版社,2006.
Application of ARIMA model in forecasting annual city electricity consumptions
ZHANG Shi?qiang1,WANG Wen1,WANG Jian2
(1.Shandong University of Science and Technology,Qingdao 266510,China;2.Taishan Group,Taian 271000,China)
This paper briefly presented the principles and methods of ARIMA(auto regression moving average)model and applied the model to the analysis and forcasting of electricity de?mand of Chendu city.Upon examination it is further proved that ARIMA has high prediction accuracy and provides ideal forecast effect.It’s feasible to use ARIMA model to forecast electricity de?mand.The model provides reference for power system staff to fore?cast.
ARIMA;electricity demand forcast;partial au?tocorrelation function;autocorrelation function
TM715;F407.61
A
1009-1831(2010)06-0031-04
2010-08-02;修回日期:2010-09-03
張士強(qiáng)(1962—),男,山東梁山人,教授,博士生導(dǎo)師,研究方向?yàn)槠髽I(yè)成本管理;王雯(1987—),女,山東泰安人,碩士研究生,研究方向?yàn)樾畔⒐芾砼c信息系統(tǒng);王健(1987—),男,山東泰安人,本科,研究方向?yàn)殡姎夤こ碳白詣?dòng)化。