屈曉陽(yáng)
摘要:在分析過程中,首先利用SAS軟件繪制時(shí)序圖,從整體上把握數(shù)據(jù)信息。再進(jìn)行數(shù)據(jù)的預(yù)處理,發(fā)現(xiàn)該化工原料價(jià)格序列具有非平穩(wěn)非白噪聲的屬性,說(shuō)明該序列有值得提取的相關(guān)信息,同時(shí)考慮差分方法使序列平穩(wěn)。
然后分別采取1階差分和2階差分并將得到的結(jié)果進(jìn)行對(duì)比,從中選出相對(duì)最優(yōu)模型為ARIMA(2,1,0)。接著對(duì)所選取的模型進(jìn)行參數(shù)估計(jì)以及模型檢驗(yàn),發(fā)現(xiàn)ARIMA(2,1,0)模型對(duì)該化工原料價(jià)格序列建模成功。
最后根據(jù)建立的模型對(duì)該化工原料的價(jià)格進(jìn)行未來(lái)五個(gè)月的預(yù)測(cè)以期得到有價(jià)值的信息。
關(guān)鍵詞:ARIMA模型;SAS軟件;差分平穩(wěn);序列預(yù)測(cè)
一、描繪時(shí)序圖
針對(duì)某種重要化工原料1990年至2004年的月度價(jià)格作出時(shí)序圖,從圖中可以發(fā)現(xiàn),該序列波動(dòng)范圍較大,并不在某一個(gè)常數(shù)值附近波動(dòng),同時(shí)顯示出一定的趨勢(shì)性。
二、時(shí)序特征分析
(一)描述性統(tǒng)計(jì)
由SAS編程可得到化工原料月度價(jià)格序列描述性統(tǒng)計(jì)的值,其中均值為215.3616,標(biāo)準(zhǔn)差為60.29508,該序列共有177個(gè)觀察值。
(二)自相關(guān)圖檢驗(yàn)
作出化工原料月度價(jià)格序列的自相關(guān)圖,其中橫軸表示自相關(guān)系數(shù),縱軸表示延遲時(shí)期數(shù),用水平方向的垂線表示自相關(guān)系數(shù)的大小。可以發(fā)現(xiàn),序列的自相關(guān)系數(shù)遞的速度相當(dāng)緩慢,直至延遲24期自相關(guān)系數(shù)也未衰減到零。同時(shí),自相關(guān)圖顯示序列自相關(guān)系數(shù)長(zhǎng)期位于零軸的一邊,說(shuō)明序列具有單調(diào)趨勢(shì)。由以上的分析可知該序列為非平穩(wěn)序列。
(三)純隨機(jī)性檢驗(yàn)
由SAS可得到序列的純隨機(jī)性檢驗(yàn)結(jié)果:
延遲階數(shù)LB統(tǒng)計(jì)量的值 P值
6554.08<.0001
12731.53<.0001
18783.1<.0001
24801.66<.0001
檢驗(yàn)結(jié)果顯示,在各階延遲下LB檢驗(yàn)統(tǒng)計(jì)量的P值都非常?。?0.0001),所以我們可以以很大的把握(置信水平>99.999%)認(rèn)為該序列屬于非白噪聲序列。結(jié)合前面的平穩(wěn)性檢驗(yàn)結(jié)果,說(shuō)明該序列為非平穩(wěn)序列,同時(shí)還蘊(yùn)含著值得提取的相關(guān)信息。
三、差分平穩(wěn)及模型確定
由于該化工原料月度數(shù)據(jù)表現(xiàn)出非平穩(wěn)性,為了進(jìn)一步的分析,下面對(duì)序列進(jìn)行差分處理。
(一)1階差分平穩(wěn)
1、1階差分平穩(wěn)序列分析
作圖可以看出,1階差分已經(jīng)達(dá)到了很好的效果。從時(shí)序圖可以發(fā)現(xiàn),序列不存在明顯的趨勢(shì)性或周期性,沒有顯著的非平穩(wěn)特征。
白噪聲檢驗(yàn)結(jié)果顯示,在各階延遲下LB檢驗(yàn)統(tǒng)計(jì)量的P值都很?。?0.02),所以我們可以以很大的把握(置信水平>98%)認(rèn)為該序列屬于非白噪聲序列。再做出樣本自相關(guān)圖和樣本偏自相關(guān)圖,進(jìn)一步確定模型平穩(wěn)性并給擬合模型定階。
從自相關(guān)圖也可以看出自相關(guān)系數(shù)很快地衰減到零,延遲1階后,自相關(guān)系數(shù)基本都在2倍標(biāo)準(zhǔn)差范圍之內(nèi),故進(jìn)一步確定該序列具有短期相關(guān)性,1階差分序列平穩(wěn)。再進(jìn)一步考察自相關(guān)系數(shù)衰減到零的過程,可以看到自相關(guān)系數(shù)衰減到零并不是一個(gè)突然的過程,而是有一個(gè)連續(xù)漸變的過程,故認(rèn)為自相關(guān)系數(shù)拖尾。
最后考察偏自相關(guān)系數(shù)衰減到零的過程,除了1~2階偏自相關(guān)系數(shù)在2倍標(biāo)準(zhǔn)差范圍之外,其他階數(shù)的偏自相關(guān)系數(shù)都在2倍標(biāo)準(zhǔn)差范圍內(nèi),這是偏自相關(guān)系數(shù)2階截尾的典型特征。根據(jù)自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)2階截尾的屬性,初步確定擬合模型為AR(2)模型。
2、1階差分序列定階
(1)相對(duì)最優(yōu)定階??紤]人為定階的主觀性過強(qiáng),利用SAS進(jìn)行相對(duì)最優(yōu)定階,得到結(jié)果。最后一條信息顯示,在自相關(guān)延遲階數(shù)小于等于5,移動(dòng)平均延遲階數(shù)也小于等于5的所有ARIMA(p,1,q)模型中,BIC信息量最小的是ARIMA(3,1,0)。
(2)參數(shù)檢驗(yàn)。由檢驗(yàn)結(jié)果可知,常數(shù)項(xiàng)和φ3項(xiàng)無(wú)法通過顯著性檢驗(yàn),去除常數(shù)項(xiàng)得到新的檢驗(yàn)結(jié)果。
結(jié)果發(fā)現(xiàn),去除常數(shù)項(xiàng)后φ3項(xiàng)仍無(wú)法通過顯著性檢驗(yàn),而去除φ3后參數(shù)均通過顯著性檢驗(yàn),故認(rèn)為此模型為ARIMA(2,1,0)。
(二)2階差分平穩(wěn)
未避免差分方法選擇不當(dāng)對(duì)模型建立造成的影響,下面對(duì)序列進(jìn)行2階差分,并將得到的結(jié)果與1階差分的結(jié)果進(jìn)行對(duì)比,從而篩選出較優(yōu)模型。
1、2階差分平穩(wěn)序列分析
對(duì)比1階差分時(shí)序圖,可以看到2階差分與1階差分得到的結(jié)果并沒有顯著的區(qū)別。從時(shí)序圖可以發(fā)現(xiàn),序列不存在明顯的趨勢(shì)性或周期性,沒有顯著的非平穩(wěn)特征。
白噪聲檢驗(yàn)顯示,在各階延遲下LB檢驗(yàn)統(tǒng)計(jì)量的P值都很?。?0.0001),所以我們可以以很大的把握(置信水平>99.999%)認(rèn)為該序列屬于非白噪聲序列。再做出樣本自相關(guān)圖和樣本偏自相關(guān)圖,進(jìn)一步確定模型平穩(wěn)性并給擬合模型定階。從自相關(guān)圖也可以看到,延遲3階后,自相關(guān)系數(shù)基本都在2倍標(biāo)準(zhǔn)差范圍之內(nèi),故進(jìn)一步確定該序列具有短期相關(guān)性,2階差分序列平穩(wěn)。
再進(jìn)一步考察自相關(guān)系數(shù)衰減到零的過程,可以看到自相關(guān)系數(shù)衰減到零并不是一個(gè)突然的過程,而是有一個(gè)連續(xù)漸變的過程,故認(rèn)為自相關(guān)系數(shù)不截尾。
最后考察偏自相關(guān)系數(shù)衰減到零的過程,可以看到有明顯的正弦波動(dòng)軌跡,這說(shuō)明偏自相關(guān)系數(shù)衰減到零的過程也是一個(gè)連續(xù)漸變的過程,故認(rèn)為偏自相關(guān)系數(shù)不截尾。根據(jù)自相關(guān)系數(shù)不截尾,偏自相關(guān)系數(shù)也不截尾的屬性,以及樣本自相關(guān)系數(shù)與偏自相關(guān)系數(shù)的特征,初步確定擬合模型為ARMA(1,2)模型。
2、2階差分序列定階
(1)相對(duì)最優(yōu)定階。相對(duì)最優(yōu)定階得到結(jié)果的最后一條信息顯示,在自相關(guān)延遲階數(shù)小于等于5,移動(dòng)平均延遲階數(shù)也小于等于5的所有ARIMA(p,1,q)模型中,BIC信息量最小的是ARIMA(2,1,3)。
(2)參數(shù)檢驗(yàn)。由檢驗(yàn)結(jié)果可知,常數(shù)項(xiàng)、φ2以及θ3項(xiàng)無(wú)法通過顯著性檢驗(yàn),去除常數(shù)項(xiàng)得到新的檢驗(yàn)結(jié)果。結(jié)果發(fā)現(xiàn),去除常數(shù)項(xiàng)后φ2和θ3項(xiàng)仍無(wú)法通過顯著性檢驗(yàn),下面進(jìn)一步檢驗(yàn)。在置信水平α=0.1下,參數(shù)全部通過顯著性檢驗(yàn),故認(rèn)為此模型為ARIMA(1,2,2)。
(三)1階差分與2階差分模型比較
下面將1階差分和2階差分得到的結(jié)果進(jìn)行對(duì)比,利用SAS得到結(jié)果。從得到的結(jié)果可以發(fā)現(xiàn),ARIMA(2,1,0)模型延遲各階的LB統(tǒng)計(jì)量的P值均顯著大于置信水平α=0.05,故該擬合模型顯著成立。而ARIMA(1,2,2)無(wú)法通過殘差白噪聲檢驗(yàn)。同時(shí),最小信息量檢驗(yàn)顯示無(wú)論是使用AIC準(zhǔn)則還是使用SBC準(zhǔn)則,ARIMA(2,1,0)都要優(yōu)于ARIMA(1,2,2)模型,故對(duì)于該價(jià)格序列來(lái)說(shuō),ARIMA(2,1,0)模型是相對(duì)最優(yōu)模型。
綜合以上的分析,確定該序列的擬合模型為ARIMA(2,1,0)。
四、參數(shù)估計(jì)
使用條件最小二乘估計(jì),確定該模型口徑為:
xt=εt1-0.34727B+0.23294B2Var(εt)=335.0896
或等價(jià)寫為:xt=1.34727xt-1-0.58021xt-2+0.23294xt-3+εt
Var(εt)=335.0896
五、模型檢驗(yàn)
殘差白噪聲檢驗(yàn)參數(shù)顯著性檢驗(yàn)
延遲階數(shù)LB統(tǒng)計(jì)量P值待估參數(shù)t統(tǒng)計(jì)量P值
63.970.410514.69<.0001
127.780.65042-3.090.0023
1814.450.5654
2419.50.6142
3024.750.6413
顯然看出,擬合檢驗(yàn)統(tǒng)計(jì)量的P值都顯著大于顯著性檢驗(yàn)水平0.05,可以認(rèn)為該殘差序列為白噪聲序列,即擬合模型顯著有效。系數(shù)顯著性檢驗(yàn)顯示兩參數(shù)均顯著。這說(shuō)明ARIMA(2,1,0)模型對(duì)該序列建模成功。
六、序列預(yù)測(cè)
由上面的分析確定最終的模型為:
xt=1.34727xt-1-0.58021xt-2+0.23294xt-3+εtVar(εt)=335.0896
其中φ1=1.34727,φ2=-0.58021,φ3=0.23294
序列預(yù)測(cè)的計(jì)算過程如下:
(一)預(yù)測(cè)值的計(jì)算
已知x177=411,x176=420,x175=374,故178=1.34727x177-0.58021x176+0.23294x175=397.1594
179=1.34727178-0.58021x177+0.23294x176=394.4493
180=1.34727179-0.58021178+0.23294x177=396.7322
181=1.34727180-0.58021179+0.23294178=398.1563
182=1.34727181-0.58021180+0.23294179=398.119
(二)預(yù)測(cè)方差的計(jì)算
首先,根據(jù)Green函數(shù)的遞推公式,算得
G0=1,G1=φ1G0=1.34727,G2=φ1G1+φ2G0=1.23493G3=φ1G2+φ2G1+φ3G0=1.11502,G4=φ1G3+φ2G2+φ3G1=1.09955
則
Var[e178]=G20σ2ε,Var[e179]=(G20+G21)σ2ε,Var[e180]=(G20+G21+G22)σ2εVar[e181]=(G20+G21+G22+G23)σ2εVar[e182]=(G20+G21+G22+G23+G24)σ2ε=2276.8551
(3)未來(lái)l步預(yù)測(cè)價(jià)格預(yù)測(cè)的95%置信區(qū)間為:
(177+l-1.96Var[e177+l],177+l+1.96Var[e177+l])
代入數(shù)值可得到計(jì)算結(jié)果如下:
序號(hào) 預(yù)測(cè)值標(biāo)準(zhǔn)差 95% 置信區(qū)間
178397.159418.3055361.2813433.0374
179394.449330.7136334.2517454.6469
180396.732238.1361321.9869471.4775
181398.156343.2548313.3785482.934
182398.11947.7086304.612491.6261
由SAS得到該序列擬合與預(yù)測(cè)圖可以較為直觀的看到模型擬合的結(jié)果,同時(shí)可以看到,隨著預(yù)測(cè)期數(shù)的增加,預(yù)測(cè)方差出現(xiàn)增大的趨勢(shì)。
七、模型評(píng)價(jià)
本文基于某種重要化工原料1990年至2004年的月度價(jià)格數(shù)據(jù),充分利用應(yīng)用時(shí)間序列分析的知識(shí),成功建立ARIMA模型,并給出未來(lái)五個(gè)月價(jià)格的預(yù)測(cè),希望能提取到盡可能準(zhǔn)確的信息并對(duì)該方面的研究提供一定的幫助。
經(jīng)過對(duì)比分析、各參數(shù)的顯著性檢驗(yàn)及模型的顯著性檢驗(yàn),最后確定該化工原料1990年至2004年的月度價(jià)格序列為ARIMA(2,1,0)模型。該模型簡(jiǎn)單,可操作性強(qiáng),并且與實(shí)際的結(jié)果符合的很好,可以幫助我們研究該化工原料價(jià)格走向,對(duì)未來(lái)的預(yù)測(cè)有一定的實(shí)際意義。(作者單位:遼寧大學(xué))
參考文獻(xiàn):
[1]王燕. 應(yīng)用時(shí)間序列分析[M]. 第三版. 北京:中國(guó)人民大學(xué)出版社, 2012.