郭淑妹 郭杰
(解放軍信息工程大學理學院,河南鄭州 450001)
ARIMA模型及其實證
郭淑妹 郭杰
(解放軍信息工程大學理學院,河南鄭州 450001)
河南省生豬價格序列是一組依賴于時間變化的隨機變量,可用ARIMA模型予以近似描述?;诖?,運用2005-2015年河南省每月生豬價格數(shù)據(jù),得到ARIMA(1,1,1)模型,經(jīng)診斷檢驗與實證檢驗發(fā)現(xiàn),模型預測精度較高,可用于河南省生豬價格預測。
ARIMA模型;價格;平穩(wěn)序列;預測
如果平穩(wěn)序列{yt}不僅與其過去時刻的自身值有關,而且還與其過去時刻的擾動項存在一定依存關系,那么這個序列{yt}就可以建立p階自回歸,q階移動平均模型ARMA(p,q):
式(1)中,εt-1,εt-2,……,εt-q是yt的隨機誤差項,{εt}是相互獨立的白噪聲過程。
ARMA(p,q)模型只適用于處理平穩(wěn)時間序列的預測,對于非平穩(wěn)時間序列,不能直接用ARMA(p,q)模型描述,對于含有一定變化趨勢的非平穩(wěn)時間序列進行d階差分后可應用ARMA(p,q),即建立ARIMA(p,d,q)模型。ARIMA模型全稱為差分自回歸移動平均模型[1],其具體過程如下。
①根據(jù)時間序列的散點圖、自相關函數(shù)和偏自相關函數(shù)圖以ADF單位根檢驗其方差、趨勢及其季節(jié)性變化規(guī)律,對序列的平穩(wěn)性進行識別[2],一般經(jīng)濟運行的時間序列都不是平穩(wěn)序列。②對非平穩(wěn)序列進行平穩(wěn)化處理。如果數(shù)據(jù)序列是非平穩(wěn)的,并存在一定的增長或下降趨勢,則需要對數(shù)據(jù)進行差分處理;如果數(shù)據(jù)存在異方差,則需對數(shù)據(jù)進行技術處理,直到處理后的數(shù)據(jù)的自相關函數(shù)值和偏相關函數(shù)值無顯著地異于0。③根據(jù)時間序列模型的識別規(guī)則,建立相應的模型。若平穩(wěn)序列的偏相關函數(shù)是截尾的,而自相關函數(shù)是拖尾的,可斷定序列適合AR模型;若平穩(wěn)序列的偏相關函數(shù)是拖尾的,而自相關函數(shù)是截尾的,則可斷定序列適合MA模型;若平穩(wěn)序列的偏相關函數(shù)和自相關函數(shù)均是拖尾的,則序列適合ARMA模型。④進行參數(shù)估計,檢驗是否具有統(tǒng)計意義。⑤進行假設檢驗,診斷殘差序列是否為白噪聲。⑥利用已通過檢驗的模型進行預測分析[3]。
2.1 數(shù)據(jù)來源
采用的數(shù)據(jù)來自2015年河南統(tǒng)計年鑒[4],樣本區(qū)間是2005-2015年河南省每月生豬價格,記為時間序列{xt},使用分析軟件Eviews8.0做出趨勢圖,如圖1所示,可以看出河南生豬價格每月平均價格波動具有不穩(wěn)定性,而長期趨勢和循環(huán)變動趨勢不是明顯。
圖1 河南省2005-2015每月生豬價格趨勢圖
2.2 平穩(wěn)性檢驗
由圖1可以看出,時間序列{xt}為非平穩(wěn)時間序列,為了減小波動,對其對數(shù)化,由其序列圖2可以看出,對數(shù)化之后序列仍然不平穩(wěn)。對序列{xt}做ADF檢驗,檢驗統(tǒng)計量為-2.016 459,大于1%、5%、10%顯著水平下的臨界值如表1所示,表明該序列是非平穩(wěn)的。對序列進行wt= lnxt對數(shù)化之后,對序列{wt}做ADF檢驗仍顯示是序列非平穩(wěn)的。
圖2 河南省2005-2015每月生豬價格取對數(shù)趨勢圖
表1 {xt}ADF檢驗統(tǒng)計量
對{wt}進行一階差分,令yt=wt-wt-1,對序列{yt}進行平穩(wěn)性檢驗,檢驗結(jié)果顯示,序列{yt}的ADF檢驗統(tǒng)計量為-7.973 106,小于1%、5%、10%顯著水平下的臨界值如表2所示,因而序列{yt}為平穩(wěn)時間序列,確定d=1。
2.3 參數(shù)估計與模型選擇
為了確定ARIMA(p,d,q)中的p,q,計算一階差分后的序列{yt}的自相關圖和偏自相關數(shù)據(jù)如圖3所示。從圖3中可以看出,序列1、2階偏自相關系數(shù)超出±2倍估計標準差,2階以后偏自相關系數(shù)在±2倍估計標準差以內(nèi),即偏自相關函數(shù)2階以后截尾;同理,序列1階自相關系數(shù)超出2倍估計標準差,2階以后偏自相關系數(shù)在±2倍估計標準差以內(nèi),即自相關函數(shù)1階以后截尾,結(jié)合自相關圖和偏自相關圖可初步確定p=1,q=1或q=2。
圖3 {yt}的自相關圖和偏相關圖
模型確定為ARIMA(1,1,1),ARIMA(1,1,2)。計算不同p,q組合所對應的AIC值,當p=1,q=1時,AIC值為2.485 025;當p=1,q=2時,AIC值為2.748 736,前者值較小,所以確定模型為ARIMA(1,1,1)。
2.4 模型的檢驗
為檢驗模型對序列{yt}的擬合效果,檢驗模型對信息的提取是否充分,分別對序列的擬合值與殘差進行了計算。通過對模型的殘差序列進行單位根檢驗,發(fā)現(xiàn)ADF檢驗統(tǒng)計量為-11.200 22,明顯小于1%、5%與10%顯著性水平的臨界值,這表明模型殘差序列為白噪聲序列(見表2)。由此可確定ARIMA(1,1,1)為平穩(wěn)序列較為理想的預測模型。
表2 殘差的ADF檢驗統(tǒng)計量
2.5 模型預測
對模型進行估計,得到表3。
因此,時間序列{yt}的模型為:
可推導出{wt}的預測公式為:
由此:
表3 模型估計
圖4 預測值擬合圖
根據(jù){xt}的預測公式對2005年1月-2015年12月河南省生豬價格進行事后預測,預測結(jié)果見圖4。從圖4可看出,預測值在±2倍標準差之內(nèi),誤差均方根與平均絕對誤差很小,Theil不等系數(shù)接近于0,偏差比率,方差比率較小,協(xié)方差比率較大說明ARIMA(1,1,1)模型對河南省生豬價格預測效果較好。因此,ARIMA(1,1,1)模型可對河南省生豬價格進行預測。應用ARIMA(1,1,1)模型對2016年1-12月河南省生豬價格進行預測,預測結(jié)果表明,河南省生豬價格在2016年6月達到峰值,6月之后價格回落明顯。
河南省生豬每月價格序列為非平穩(wěn)時間序列,是一組依賴于時間變化的隨機變量,可用ARIMA模型予以近似描述。本文運用2005年1月-2015年12月河南省生豬價格建立了ARIMA(1,1,1)模型,經(jīng)模型參數(shù)估計與診斷檢驗以及實證檢驗發(fā)現(xiàn),預測相對誤差較小,預測擬合度較好,可用于河南生豬每月價格預測。
[1]Adak S.Time-dependent spectral analysis of nonstation?ary time series[J].Journal of American Statistical Association,1998(444):1488-1499.
[2]Box G,Jenkins G.Time series analysis forecasting and con-trol[M].San Francisco:Holden Day Press,1970.
[3]俞天貴,鄧文憑.基于ARIMA模型的中國煤炭消費量增長預測[J].統(tǒng)計與決策,2008(24):89-91.
[4]河南省統(tǒng)計局.河南年鑒2015[Z].北京:中國統(tǒng)計出版社,2016.
ARIMA Model and Empirical Analysis
Guo ShumeiGuo Jie
(Institute of Science,PLA Information Engineering University,Zhengzhou Henan 450001)
The pig price series of Henan province is a set of random variables depending on the variation of time,it can use the ARIMA model to approximate description.Based on this,this paper used the dates of Henan province in 2005-2015 monthly pig price,to get ARIMA(1,1,1)model.The diagnostic tests and empirical tests show that the model has high prediction accuracy and can be used to forecast the hog price in Henan province.
ARIMA model;price;smooth series;forecast
P207
A
1003-5168(2016)12-0078-03
2016-11-21
國家自然科學基金項目(41174005)。
郭淑妹(1981-),女,碩士,講師,研究方向:應用統(tǒng)計。