李少雄,李本光
(1.中國(guó)工商銀行北京分行,北京100031;2.貴州大學(xué) 經(jīng)濟(jì)學(xué)院,貴陽(yáng)550025)
SARIMA模型源于自回歸移動(dòng)平均模型(ARIMA模型)。ARIMA模型適用于非季節(jié)時(shí)間序列短期預(yù)測(cè)。對(duì)于季節(jié)時(shí)間序列,則需要進(jìn)行正規(guī)差分、季節(jié)差分和自回歸自動(dòng)平均調(diào)整,才能轉(zhuǎn)化為ARIMA模型。由這種方法最終所確認(rèn)的ARIMA模型,由于通常包含季節(jié)差分的有關(guān)參數(shù),同時(shí)由幾部分的乘積形式構(gòu)成,因此被稱為季節(jié)乘積模型,即SARIMA模型。SARIMA模型的一般表達(dá)式為:
其中,d、D分別表示正規(guī)差分、季節(jié)差分,s為季節(jié)差分階數(shù),p是自回歸階數(shù),q是移動(dòng)平均階數(shù),ΦP(Ls)和ΘQ(Ls)分別為季節(jié)P階自回歸算子、季節(jié)Q階移動(dòng)平均算子,μt為白噪聲過(guò)程。該模型可以簡(jiǎn)化為SARIMA(p,d,q)(P,D,Q)。
航空模型是季節(jié)乘積模型的具體表現(xiàn)形式,此模型廣泛用于季度時(shí)間序列建模[1]。航空模型的表達(dá)式:
其中s是序列的周期,μt是白噪聲序列,|θ|<1,|Θ|<1。航空模型的AR部分由正規(guī)差分和季節(jié)差分兩部分組成,而MA部分包括兩個(gè)參數(shù)。該模型具有一些顯著的性質(zhì)。假設(shè)Yt=(1 -L)(1 -Ls)Xt,ρ為Yt的樣本自相關(guān)函數(shù)函數(shù),則:
對(duì)于l>0且l≠1,s-1,s+1,有ρl=0。因此,如果Yt是季節(jié)時(shí)間序列,Yt經(jīng)過(guò)正規(guī)差分和季節(jié)差分后的序列的樣本自相關(guān)函數(shù)只在滯后階數(shù)為1、s-1、s、s+1時(shí)非零,那么可以考慮對(duì)季節(jié)時(shí)間序列Yt建立航空模型。
一個(gè)經(jīng)濟(jì)時(shí)間序列(Yt)受多種因素影響。通??梢园堰@些因素分解為趨勢(shì)成分(Tt)、循環(huán)成分(Ct)、季節(jié)成分(St)和不規(guī)則成分(It)。季節(jié)調(diào)整就是對(duì)原始數(shù)據(jù)中隱含的由季節(jié)因素引起的影響加以糾正的過(guò)程。在季節(jié)調(diào)整模型方面,經(jīng)典的時(shí)間序列模型有兩種:
(1)加法模型Yt=Tt+Ct+St+It
(2)乘法模型Yt=Tt×Ct×St×It
按照加法模型,季節(jié)調(diào)整后的時(shí)間序列At=Tt+Ct+It;按照乘法模型,季節(jié)調(diào)整后的時(shí)間序列At=Tt×Ct×It。對(duì)于一個(gè)時(shí)間序列,采用哪種模型進(jìn)行季節(jié)分解取決于各成分之間的關(guān)系。一般來(lái)說(shuō),若4種成分相互獨(dú)立則采用加法模型,相互關(guān)聯(lián)采用乘法模型;若季節(jié)因素的規(guī)?;颈3植蛔?,不隨原始序列水平的增減而變化,就使用加法模型;若季節(jié)因素的規(guī)模與原始序列水平成比例變化,使用乘法模型[2]。
在季節(jié)調(diào)整方法方面,X-11是國(guó)際上通用的季節(jié)調(diào)整方法。1980年,加拿大統(tǒng)計(jì)局在X-11季節(jié)調(diào)整方法的基礎(chǔ)上引入ARIMA模型開(kāi)發(fā)X-11-ARIMA程序,實(shí)現(xiàn)了序列向前、向后預(yù)測(cè)和補(bǔ)充數(shù)據(jù),以保證移動(dòng)平均季節(jié)調(diào)整過(guò)程中數(shù)據(jù)的完整性。20世紀(jì)90年代,美國(guó)普查局在X-11-ARIMA的基礎(chǔ)上開(kāi)發(fā)X-12-ARIMA程序。X-12-ARIMA能夠?qū)?shù)據(jù)進(jìn)行更加豐富的預(yù)處理,檢測(cè)和修正不同類型的離群值,估計(jì)并消除日歷因素的影響,對(duì)季節(jié)調(diào)整的效果進(jìn)行更為嚴(yán)格的診斷檢驗(yàn)。由于趨勢(shì)成分和循環(huán)成分不容易分離,以上季節(jié)調(diào)整方法將趨勢(shì)成分和循環(huán)成分視為一種成分進(jìn)行分解和調(diào)整。通過(guò)對(duì)季節(jié)調(diào)整各分解因素的預(yù)測(cè),可以實(shí)現(xiàn)對(duì)原始序列的預(yù)測(cè)。
本文以貴州省1998—2015年固定資產(chǎn)投資季度數(shù)據(jù)為樣本,分別建立SARIMA模型和使用X-12-ARIMA季節(jié)調(diào)整方法,對(duì)2016年固定資產(chǎn)投資季度數(shù)據(jù)進(jìn)行預(yù)測(cè),將預(yù)測(cè)值與實(shí)際值作比較,通過(guò)相對(duì)誤差比較兩種模型的精確程度。所有數(shù)據(jù)根據(jù)國(guó)家統(tǒng)計(jì)局網(wǎng)站貴州省固定資產(chǎn)投資月度數(shù)據(jù)整理而得,見(jiàn)表1。本文使用的操作軟件為R語(yǔ)言,使用seasonal擴(kuò)展包進(jìn)行X-12-ARIMA季節(jié)調(diào)整,使用car擴(kuò)展包進(jìn)行DW自相關(guān)檢驗(yàn)。
表1 貴州省固定資產(chǎn)投資季度數(shù)據(jù)
2.2.1 季節(jié)差分
首先對(duì)貴州省固定資產(chǎn)投資季度數(shù)據(jù)取對(duì)數(shù),見(jiàn)圖1。這里進(jìn)行對(duì)數(shù)變換有兩個(gè)原因:一是處理序列是指數(shù)增長(zhǎng)。事實(shí)上,該時(shí)序圖證實(shí)了取對(duì)數(shù)后的序列的確是線性增長(zhǎng)的。二是穩(wěn)定序列的波動(dòng)。從圖1中也能看出序列總體呈現(xiàn)直線上升的趨勢(shì),上下起伏震蕩,序列不僅存在自相關(guān)還存在明顯的的季節(jié)波動(dòng)。因此可以采用季節(jié)乘積模型建模。
圖1 貴州省1998—2016年固定投資季度數(shù)據(jù)時(shí)序圖
圖2 (a)表示對(duì)貴州省固定資產(chǎn)投資季度數(shù)據(jù)取對(duì)數(shù)后序列的自相關(guān)函數(shù),從中可以看出取對(duì)數(shù)后貴州省固定資產(chǎn)投資季度數(shù)據(jù)序列具有明顯的自相關(guān)性,是非平穩(wěn)的。圖2(b)表示的是對(duì)貴州省固定資產(chǎn)投資季度數(shù)據(jù)取對(duì)數(shù)后進(jìn)行正規(guī)差分后的自相關(guān)函數(shù),從中可以看出序列在季節(jié)滯后上的自相關(guān)系數(shù)不同于0值。圖2(c)表示的是對(duì)貴州省固定資產(chǎn)投資季度數(shù)據(jù)取對(duì)數(shù)后進(jìn)行季節(jié)差分后的自相關(guān)函數(shù)。圖2(d)表示的是對(duì)貴州省固定資產(chǎn)投資季度數(shù)據(jù)取對(duì)數(shù)后進(jìn)行正規(guī)差分后再進(jìn)行季節(jié)差分后的自相關(guān)函數(shù)。
圖2 樣本自相關(guān)圖
這里表at示殘差序列。對(duì)于貴州省固定資產(chǎn)投資季度數(shù)據(jù)對(duì)數(shù)序列,該模型不充分,一個(gè)顯著的原因是季節(jié)移動(dòng)平均部分的系數(shù)在5%顯著性水平下不顯著。第二步,根據(jù)5%顯著性檢驗(yàn),季節(jié)移動(dòng)平均部分系數(shù)不顯著,重新改進(jìn)模型如下:
2.2.2 模型識(shí)別、建立和診斷
時(shí)間序列數(shù)據(jù)建模,數(shù)據(jù)僅僅是可利用信息的一部分。對(duì)所研究的問(wèn)題,可能積累一些先驗(yàn)知識(shí)。在這種情況下,這些先驗(yàn)知識(shí)對(duì)于模型選擇非常重要,可以把先驗(yàn)知識(shí)和數(shù)據(jù)結(jié)合起來(lái)進(jìn)行交叉驗(yàn)證,不斷改進(jìn)模型。
對(duì)于貴州省固定資產(chǎn)投資對(duì)數(shù)序列,這里通過(guò)一個(gè)兩步過(guò)程實(shí)現(xiàn)模型設(shè)定。第一步,建立初始模型。圖2給出了貴州省固定資產(chǎn)投資對(duì)數(shù)序列的樣本自相關(guān)函數(shù)圖,雖然不完全滿足航空模型樣本自相關(guān)函數(shù)的表現(xiàn),但是可以采用航空模型作為建模的初始模型,擬合結(jié)果為:
這里系數(shù)標(biāo)準(zhǔn)誤差為0.0946,5%置信區(qū)間(-0.9568,為-0.5860)。雖然模型殘差平方和略有增加,但參數(shù)通過(guò)了顯著性檢驗(yàn),AIC值有所降低。圖3給出了模型殘差的一些檢驗(yàn)圖,殘差在開(kāi)始部分有個(gè)別異常值,但整體來(lái)講,該模型是充分的。
圖3 殘差檢驗(yàn)
2.2.3 預(yù)測(cè)
對(duì)未來(lái)4季度貴州省固定資產(chǎn)投資季度數(shù)據(jù)進(jìn)行預(yù)測(cè)。為了得到2016年貴州省固定資產(chǎn)投資季度數(shù)據(jù)的預(yù)測(cè)值,而不是取對(duì)數(shù)后的值,這里需要利用正態(tài)分布與對(duì)數(shù)正態(tài)分布之間的關(guān)系,對(duì)預(yù)測(cè)值進(jìn)行反對(duì)數(shù)變換,具體結(jié)果見(jiàn)表2。與實(shí)際值比較,可以看出,預(yù)測(cè)相對(duì)誤差均很小,不超過(guò)4,說(shuō)明模型預(yù)測(cè)具有一定準(zhǔn)確性。但是相對(duì)誤差均為正數(shù),說(shuō)明預(yù)測(cè)值具有偏大的傾向,容易過(guò)高估計(jì)未來(lái)固定資產(chǎn)投資季度數(shù)據(jù)。
表2 SARIMA模型預(yù)測(cè)
2.3.1 季節(jié)調(diào)整及原始數(shù)據(jù)的分解
為提取貴州省固定資產(chǎn)投資季度數(shù)據(jù)中的趨勢(shì)成分、循環(huán)因素、季節(jié)成分和不規(guī)則成分,現(xiàn)通過(guò)seasonal擴(kuò)展包直接對(duì)貴州省固定資產(chǎn)投資1998年第1季度至2015年第4季度當(dāng)期季度數(shù)據(jù)進(jìn)行季節(jié)調(diào)整。由于分解因素相互關(guān)聯(lián),且季節(jié)成分隨原始數(shù)據(jù)規(guī)模增長(zhǎng)而增加,因此在X-11季節(jié)調(diào)整過(guò)程中采用乘法模型。由于X-11體系的季節(jié)調(diào)整程序?qū)②厔?shì)成分和循環(huán)成分視為一種成分,因此這里按照加法分解模型將貴州省固定資產(chǎn)投資季度數(shù)據(jù)分解為趨勢(shì)-循環(huán)因素(TCt)、季節(jié)因素(St)和不規(guī)則因素(It)三種成分??紤]到原始數(shù)據(jù)的指數(shù)增長(zhǎng)特性和較大的季節(jié)波動(dòng)性,在季節(jié)調(diào)整過(guò)程中取對(duì)數(shù)變換。在季節(jié)調(diào)整過(guò)程中,自動(dòng)識(shí)別1999年第3季度、2000年第2季度、2008年第1季度3個(gè)離群點(diǎn),如圖4所示。通過(guò)季節(jié)調(diào)整,分別得到分解成分,如圖5。
圖4 原始序列和季節(jié)調(diào)整后序列
2.3.2 趨勢(shì)-循環(huán)成分的預(yù)測(cè)
原始數(shù)據(jù)經(jīng)過(guò)季節(jié)調(diào)整之后,依然保留有趨勢(shì)-循環(huán)成分。這時(shí)可利用回歸分析的方法對(duì)其進(jìn)行擬合和預(yù)測(cè)。觀察圖5可知,隨著時(shí)間的變化,季節(jié)調(diào)整后固定資產(chǎn)投資呈現(xiàn)上升的趨勢(shì),總體數(shù)據(jù)同樣呈現(xiàn)曲線增長(zhǎng)的趨勢(shì)。由于曲線難以完全用拋物線和對(duì)數(shù)曲線擬合,在這里截取2010年第2季度至2015年第4季度共22個(gè)樣本點(diǎn)采用拋物線重新擬合,以時(shí)間t為自變量,以季節(jié)調(diào)整后的FAI數(shù)據(jù)為因變量,擬合結(jié)果為:
圖5 季節(jié)調(diào)整分解圖
采用car擴(kuò)展包進(jìn)行DW自相關(guān)性檢驗(yàn),DW統(tǒng)計(jì)量為1.7369,p值等于0.422,不能拒絕原假設(shè),因此不存在顯著的自相關(guān)性??梢灶A(yù)測(cè)2016年4個(gè)季度固定資產(chǎn)投資趨勢(shì)-循環(huán)成分,結(jié)果見(jiàn)表3。
表3 FAI的預(yù)測(cè)過(guò)程和預(yù)測(cè)值
2.3.3 季節(jié)成分的預(yù)測(cè)
從圖5中看出,季節(jié)因子具有不穩(wěn)定的特性。羅中德(2016)[3]采用規(guī)范化的方法計(jì)算季節(jié)指數(shù),將其作為下一年度季節(jié)因子的預(yù)測(cè)值。本文假設(shè)季節(jié)因子不變,直接截取2015年4個(gè)季度的季節(jié)因子作為2016年4個(gè)季度的季節(jié)因子進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表3。
2.3.4 對(duì)季度數(shù)據(jù)的預(yù)測(cè)
由于不規(guī)則成分樣本自相關(guān)函數(shù)、偏自相關(guān)函數(shù)不具有截尾特征,在滯后10階通過(guò)了Q檢驗(yàn),因此可以不考慮不規(guī)則成分變動(dòng)的影響,直接采用公式Y(jié)t=TCt×St預(yù)測(cè)2016年貴州省固定資產(chǎn)投資季度數(shù)據(jù)。2016年貴州省固定資產(chǎn)投資季度數(shù)據(jù)的預(yù)測(cè)值等于2016年固定資產(chǎn)投資趨勢(shì)-循環(huán)預(yù)測(cè)項(xiàng)與季節(jié)因子預(yù)測(cè)項(xiàng)兩項(xiàng)的乘積。具體結(jié)果見(jiàn)表3。
兩種方法對(duì)原始數(shù)據(jù)都有比較好的預(yù)測(cè)效果。SARIMA模型采用ARIMA乘積的形式對(duì)季度數(shù)據(jù)進(jìn)行擬合和預(yù)測(cè);X-12-ARIMA將原始時(shí)間序列分解,分別對(duì)分解成分進(jìn)行預(yù)測(cè),對(duì)數(shù)據(jù)的處理更加完善。從預(yù)測(cè)精度上看,SARIMA模型預(yù)測(cè)的相對(duì)誤差在2%~4%之間;而X-12-ARIMA季節(jié)調(diào)整方法的相對(duì)小于2%。值得注意的是,SARIMA模型預(yù)測(cè)的相對(duì)誤差都大于零,預(yù)測(cè)值具有大于實(shí)際值的趨勢(shì),而X-12-ARIMA季節(jié)調(diào)整模型的預(yù)測(cè)值的相對(duì)誤差在零附近波動(dòng),有正有負(fù),相對(duì)誤差率更小且合理。表4(見(jiàn)下頁(yè))為兩種預(yù)測(cè)的比較。
表4 模型比較
固定資產(chǎn)投資時(shí)間序列主要是受到趨勢(shì)性和季節(jié)性的影響,目前主要采用ARIMA或者SARIMA模型進(jìn)行預(yù)測(cè)。SARIMA模型具有較高的預(yù)測(cè)精度,但是隨著時(shí)間序列數(shù)據(jù)跨期增多,長(zhǎng)期預(yù)測(cè)結(jié)果不理想;且從預(yù)測(cè)結(jié)果來(lái)看,其預(yù)測(cè)值具有被高估的傾向。故可以采用X-12-ARIMA季節(jié)調(diào)整方法進(jìn)行預(yù)測(cè),其預(yù)測(cè)值更加精確合理。