李 娜,薛俊強(qiáng)
(1.浙江萬里學(xué)院 商學(xué)院,浙江 寧波 315100;2.寧波廣播電視大學(xué) 經(jīng)管系,浙江 寧波 315016)
如何科學(xué)、準(zhǔn)確地預(yù)測(cè)未來幾年的GDP走勢(shì),成為政府科學(xué)制定經(jīng)濟(jì)政策進(jìn)而進(jìn)行有效宏觀調(diào)控的前提條件。關(guān)于GDP的預(yù)測(cè),國(guó)內(nèi)外學(xué)者進(jìn)行了大量的研究。大致可以分為兩類:一類是用簡(jiǎn)單線性模型進(jìn)行分析預(yù)測(cè);一類是用復(fù)雜矢量模型進(jìn)行預(yù)測(cè)。筆者認(rèn)為,如果能找到一種簡(jiǎn)單線性模型進(jìn)行精度高的有效預(yù)測(cè),那么用復(fù)雜矢量模型就顯得沒有必要了。GDP是時(shí)間序列變量,很多學(xué)者運(yùn)用經(jīng)典時(shí)間序列分析模型ARIMA(p,d,q)模型進(jìn)行了研究和預(yù)測(cè)。在研究了近年來各類學(xué)術(shù)刊物上運(yùn)用ARIMA模型進(jìn)行GDP預(yù)測(cè)的文章后,筆者發(fā)現(xiàn)這些研究中,如王正宇(2011)、趙婷(2011)、韓衛(wèi)國(guó)(2007)、華鵬(2010)等絕大多數(shù)學(xué)者采用了統(tǒng)計(jì)局公布的名義GDP數(shù)值,而不是剔除了物價(jià)指數(shù)的實(shí)際GDP。這樣帶來的嚴(yán)重問題就是將走勢(shì)復(fù)雜的物價(jià)指數(shù)因素耦合進(jìn)來,這就增添了復(fù)雜擾動(dòng)項(xiàng),從而可能會(huì)提高研究的復(fù)雜性,降低預(yù)測(cè)的科學(xué)性。其次,學(xué)者們對(duì)于ARIMA(p,d,q)模型的滯后階數(shù)p和q的確定方法也是各不相同。郭曉峰(2012)、占健智(2009)通過對(duì)自相關(guān)和偏相關(guān)函數(shù)圖的直觀觀察來確定p和q的值,而沒有考慮AIC和SC準(zhǔn)則及多重假設(shè)檢驗(yàn)對(duì)模型的決定性影響,這樣確定的p和q并不一定是最優(yōu)的;余后強(qiáng)(2012)直接依據(jù)AIC和SC準(zhǔn)則確定了p和q的值,建立ARIMA模型,但沒有對(duì)模型進(jìn)行后續(xù)必要的假設(shè)檢驗(yàn),從而其所建模型的有效性值得商榷。再者,如王龍兵(2012)和武文婕(2007)等學(xué)者對(duì)GDP進(jìn)行預(yù)測(cè)的研究部分要么言辭模糊,要么預(yù)測(cè)精度不高。
本文中,筆者將以1952~2011年的不變價(jià)格GDP(剔除了物價(jià)指數(shù)因素)作為研究樣本,通過多次嘗試和檢驗(yàn),確定最優(yōu)p和q,從而建立最優(yōu)ARIMA(p,d,q)模型,進(jìn)而對(duì)未來幾年的GDP進(jìn)行預(yù)測(cè)。
ARIMA模型全稱為差分自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model,簡(jiǎn)記 ARIMA),是由美國(guó)統(tǒng)計(jì)學(xué)家Box和英國(guó)統(tǒng)計(jì)學(xué)家Jenkins于20世紀(jì)70年代初提出的一個(gè)著名的時(shí)間序列預(yù)測(cè)方法,所以又稱為Box-Jenkins模型。ARIMA(p,d,q)模型是ARMA(p,q)模型的一般形式,ARMA(p,q)模型要求變量必須平穩(wěn),當(dāng)變量中不僅包含白噪聲因素,還包含隨機(jī)游走因素時(shí),ARMA(p,q)模型不再適用,這時(shí)就要用到ARIMA(p,d,q)模型。ARIMA(p,d,q)模型將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將因變量?jī)H對(duì)它的滯后值以及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型。
設(shè)Yt是d階單整序列,即Yt~I(xiàn)(d)。
其中,C為常數(shù),εt是個(gè)白噪聲過程,α為自回歸模型的系數(shù),是待估參數(shù),β為移動(dòng)平均模型的系數(shù),也是待估參數(shù)。p和q分別是自回歸模型和移動(dòng)回歸模型的最大階數(shù)。
(1)檢驗(yàn)GDP序列的平穩(wěn)性。根據(jù)自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖以及ADF單位根檢驗(yàn)其方差、趨勢(shì)和其變化規(guī)律,對(duì)序列的平穩(wěn)性進(jìn)行識(shí)別。
(2)對(duì)非平穩(wěn)序列進(jìn)行平穩(wěn)化處理。如果數(shù)據(jù)序列是非平穩(wěn)的,并存在一定的增長(zhǎng)或下降趨勢(shì),則需要對(duì)數(shù)據(jù)進(jìn)行差分處理,直到序列平穩(wěn)。
表1 1952~2011年中國(guó)國(guó)內(nèi)生產(chǎn)總值GDP統(tǒng)計(jì)表(單位:億元,以不變價(jià)格測(cè)算)
(3)建立模型,進(jìn)行參數(shù)估計(jì),檢驗(yàn)是否具有統(tǒng)計(jì)意義。
(4)進(jìn)行假設(shè)檢驗(yàn),診斷殘差序列是否為白噪聲。
(5)利用已通過檢驗(yàn)的模型進(jìn)行預(yù)測(cè)分析。
本文數(shù)據(jù)來自《中國(guó)統(tǒng)計(jì)年鑒》,筆者剔除了歷年物價(jià)指數(shù)的影響,以不變價(jià)格測(cè)算得到1952~2011年中國(guó)國(guó)內(nèi)生產(chǎn)總值GDP,詳見表1,GDP的時(shí)間走勢(shì)圖見圖1。之所以剔除物價(jià)指數(shù)的影響,主要是考慮到物價(jià)指數(shù)的較大波動(dòng)會(huì)帶來GDP數(shù)值出現(xiàn)“聚類效應(yīng)”和“慣性”,從而導(dǎo)致擾動(dòng)項(xiàng)可能出現(xiàn)異方差和序列自相關(guān),進(jìn)而可能導(dǎo)致最后的模型雖然可能仍然是線性和無偏的,但卻不是有效的,也就無法運(yùn)用所建模型有效預(yù)測(cè)未來GDP。
圖1 GDP的時(shí)間走勢(shì)圖
本文運(yùn)用EVIEWS 6.0軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。
2.4.1 GDP序列平穩(wěn)性檢驗(yàn)
將GDP序列取對(duì)數(shù),得到新的序列LNGDP,對(duì)LNGDP序列進(jìn)行單位根檢驗(yàn),具體是選用ADF平穩(wěn)性檢驗(yàn)(檢驗(yàn)結(jié)果如表2),得知LNGDP是非平穩(wěn)的;對(duì)LNGDP進(jìn)行一次差分處理,得到DLNGDP序列,對(duì)該序列進(jìn)行ADF平穩(wěn)性檢驗(yàn)(檢驗(yàn)結(jié)果見表3),檢驗(yàn)結(jié)果表明DLNGDP是平穩(wěn)的,也就是說LNGDP是一階單整的,即LNGDP~I(xiàn)(1),因此建立ARIMA(p,1,q)模型。
表2 LNGDP序列平穩(wěn)性檢驗(yàn)結(jié)果
表3 DLNGDP序列平穩(wěn)性檢驗(yàn)結(jié)果
接下來確定滯后階數(shù)p和q。對(duì)DLNGDP序列進(jìn)行自相關(guān)函數(shù)檢驗(yàn),檢驗(yàn)結(jié)果見表4:
表4 DLNGDP的自相關(guān)函數(shù)檢驗(yàn)結(jié)果
2.4.2 建立最優(yōu)ARIMA模型
從表4可以看出,自相關(guān)系數(shù)(AC)和偏相關(guān)系數(shù)(PAC)的變化沒有一個(gè)穩(wěn)定的規(guī)律,但能初步判斷兩者從第8階后都開始快速減小。所以依據(jù)Akaike info和Scharz準(zhǔn)則的篩選,根據(jù)p和q的取值組合,進(jìn)行 36組 ARIMA(p,1,q)[p=3,4,5,6,7,8;q=3,4,5,6,7,8]建模嘗試,并經(jīng)過方程殘差自相關(guān)檢驗(yàn)(LM檢驗(yàn)法)、殘差正態(tài)性檢驗(yàn)(JB統(tǒng)計(jì)量檢驗(yàn)法)、擬合優(yōu)度檢驗(yàn),最后找到最優(yōu)p、q值分別為p=6,q=3。因此建立最優(yōu)模型為:ARIMA(6,1,3)模型。模型方程的輸出結(jié)果見表5,殘差擬合見圖2。
圖2 ARIMA(6,1,3)模型的殘差擬合圖
表5 ARIMA(6,1,3)模型的輸出結(jié)果
2.4.3 變量顯著性檢驗(yàn)
從表5分析:在5%的置信水平下,只有常數(shù)項(xiàng)C、AR(1)、AR(3)、MA(3)通過了系數(shù)顯著性t檢驗(yàn);其他系數(shù)和常數(shù)項(xiàng)都沒有通過,應(yīng)該從模型方程中剔除。
2.4.4 擬合優(yōu)度檢驗(yàn)
從表5分析,Adjusted R-squared為0.757907,殘差擬合圖見圖2。從圖中可以看到,模型擬合效果較好,尤其是從1995年以來,擬合精度很高。
2.4.5 殘差正態(tài)性檢驗(yàn)
對(duì)方程殘差進(jìn)行正態(tài)性檢驗(yàn),得到輸出結(jié)果如圖3,JB統(tǒng)計(jì)量對(duì)應(yīng)概率大于10%的置信水平,因而回歸方程殘差服從正態(tài)分布。
圖3 模型正態(tài)性檢驗(yàn)結(jié)果
2.4.6 方程顯著性檢驗(yàn)(F檢驗(yàn))
從表5分析,F(xiàn)-statistic的值為19.08812,對(duì)應(yīng)的概率值為0,說明所建模型方程通過了F檢驗(yàn),該模型線性關(guān)系成立。
2.4.7 模型CHOW穩(wěn)定性檢驗(yàn)
將本文中所用的60個(gè)數(shù)據(jù)樣本從中間分成2個(gè)部分,中間分界點(diǎn)是1991年。因此CHOW分割點(diǎn)就是1991年。CHOW檢驗(yàn)輸出結(jié)果見表6:
表6 CHOW分割點(diǎn)穩(wěn)定性檢驗(yàn)結(jié)果
從表6中可以看出,模型方程的F統(tǒng)計(jì)量和LR統(tǒng)計(jì)量對(duì)應(yīng)的概率值都很大(接近1),因此接受CHOW檢驗(yàn)的原假設(shè):模型無顯著結(jié)構(gòu)變化,即本模型具有高度的穩(wěn)定性。
2.4.8 對(duì)ARIMA(6,1,3)模型進(jìn)行殘差序列自相關(guān)檢驗(yàn)
針對(duì)該模型為時(shí)間序列模型的特點(diǎn),筆者采用Lagrange Multiplier檢驗(yàn)法,對(duì)模型的殘差序列進(jìn)行自相關(guān)檢驗(yàn)。檢驗(yàn)結(jié)果見表7:
表7 ARIMA(6,1,3)模型的殘差序列自相關(guān)檢驗(yàn)
由表7可知,得到的F-statistic和Obs*R-squared兩個(gè)值對(duì)應(yīng)的概率值(Probability)分別是0.272232、0.206047,均大于10%的顯著性水平,因此表明殘差不存在序列相關(guān)。從殘差線圖Residual Graph(見圖4),也可以判斷出殘差序列不相關(guān),為白噪聲。
因此,最后得到ARIMA(6,1,3)模型的回歸方程式:
圖4 殘差線圖Residual Graph
利用建立的模型對(duì)歷年GDP進(jìn)行預(yù)測(cè),得到輸出結(jié)果如圖5:
圖5 ARIMA(6,1,3)模型預(yù)測(cè)輸出結(jié)果
從圖上可以看到,Theil不相等系數(shù)為0.159732,表明模型的預(yù)測(cè)能力較好,而對(duì)它的分解表明偏誤比例接近于0,方差比例也較小,說明模型的預(yù)測(cè)效果較好。
利用該模型,預(yù)測(cè)得到2009~2015年的DLNGDP,又根據(jù)差分反推計(jì)算,得到GDPt=GDPt-1×eDLNGDPt,進(jìn)而計(jì)算出2009~2015年GDP預(yù)測(cè)值。其中2009~2011年的GDP實(shí)際值是已知的,因此可以將預(yù)測(cè)值跟實(shí)際值進(jìn)行比對(duì),得到預(yù)測(cè)誤差率(見表8)。
表8 利用ARIMA(6,1,3)模型預(yù)測(cè)2009-2015年的不變價(jià)格GDP (單位:億元)
⑴從表8可知,通過模型對(duì)2009~2011年GDP進(jìn)行預(yù)測(cè),誤差率分別為0.29%、1.46%、0.37%,預(yù)測(cè)精度較高。因此筆者有理由相信模型對(duì)未知的2012~2015年的GDP進(jìn)行預(yù)測(cè),也會(huì)有較好的預(yù)測(cè)精度。
⑵本文的模型之所以預(yù)測(cè)精度較高,源于四個(gè)方面:第一,本文剔除了價(jià)格變動(dòng),采用不變價(jià)格GDP作為研究數(shù)據(jù),更真實(shí)而直接地反映GDP的變化規(guī)律;第二,本文采用數(shù)據(jù)樣本為1952~2011年的中國(guó)不變價(jià)格GDP,樣本容量是60個(gè),完全滿足建立ARIMA模型所需的樣本數(shù)量要求;第三,建模過程中,筆者建立了36組模型,依據(jù)AIC和SC準(zhǔn)則、正態(tài)性檢驗(yàn)要求、模型穩(wěn)定性CHOW檢驗(yàn)等多重篩選原則,找到最優(yōu)p、q值,從而建立最優(yōu)ARIMA(6,1,3)模型;第四,模型成功通過了多種檢驗(yàn),估計(jì)參數(shù)和方程線性顯著,穩(wěn)定性優(yōu)越,擬合優(yōu)度良好,同時(shí)模型殘差高度符合正態(tài)分布,且為白噪聲。
⑶模型預(yù)測(cè)到2012年GDP增長(zhǎng)率為7.87%。從筆者撰文時(shí)統(tǒng)計(jì)局已經(jīng)發(fā)布的季度和月度數(shù)據(jù)來看,國(guó)內(nèi)經(jīng)濟(jì)各項(xiàng)指標(biāo)繼續(xù)保持下滑態(tài)勢(shì),今年GDP“破8”是大概率事件,這也大致相合了本文模型的預(yù)測(cè)。2013年國(guó)內(nèi)調(diào)整產(chǎn)業(yè)結(jié)構(gòu)的挑戰(zhàn)依然嚴(yán)峻,加之歐盟、日本等主要經(jīng)濟(jì)體的需求預(yù)計(jì)依舊疲軟,所以預(yù)計(jì)2013年中國(guó)經(jīng)濟(jì)將進(jìn)入一個(gè)低谷,GDP增長(zhǎng)率達(dá)到30年來最低值7.15%。但壞日子總會(huì)過去,從2014年開始中國(guó)經(jīng)濟(jì)將會(huì)探底回升。當(dāng)然,本文模型的預(yù)測(cè)結(jié)果還要接受即將到來的事實(shí)的檢驗(yàn)。
[1]王正宇.基于ARIMA模型的我國(guó)GDP分析預(yù)測(cè)[J].對(duì)外經(jīng)貿(mào),2011,(12).
[2]趙婷.ARMA模型的我國(guó)GDP預(yù)測(cè)中的應(yīng)用[J].中國(guó)市場(chǎng),2011,(1).
[3]韓衛(wèi)國(guó).ARIMA模型在GDP預(yù)測(cè)中的應(yīng)用[J].內(nèi)蒙古科技與經(jīng)濟(jì),2007,(8).
[4]華鵬.ARIMA模型在廣東省GDP預(yù)測(cè)中的應(yīng)用[J].統(tǒng)計(jì)與決策,2010,(12).
[5]郭曉峰.基于ARIMA模型的中國(guó)CPI走勢(shì)預(yù)測(cè)分析[J].統(tǒng)計(jì)與決策,2012,(11).
[6]占健智等.X11-ARIMA模型在我國(guó)第三產(chǎn)業(yè)季度GDP預(yù)測(cè)中的應(yīng)用[J].統(tǒng)計(jì)與決策,2009,(17).
[7]余后強(qiáng).我國(guó)人均國(guó)內(nèi)生產(chǎn)總值的預(yù)測(cè)分析[J].統(tǒng)計(jì)與決策,2012,(4).
[8]王龍兵等.基于ARIMA模型的我國(guó)GDP短期預(yù)測(cè)[J].科學(xué)技術(shù)與工程,2012,(8).
[9]武文婕.ARIMA模型在GDP預(yù)測(cè)中的應(yīng)用[J].中國(guó)水運(yùn),2007,(9).
[10]G.P.E.Box,G.M.Jenkis.Time Series Analy?sis:Forecastingand Control[M].San Fran?cisco:San Francisco Press,1970.
[11]1952~2011年中國(guó)統(tǒng)計(jì)年鑒[M].北京:中國(guó)統(tǒng)計(jì)出版社,2012.
[12]李敏.EVIEWS統(tǒng)計(jì)分析與應(yīng)用[M].北京:電子工業(yè)出版社,2011.
[13][美]達(dá)莫達(dá)爾N·古扎拉蒂.經(jīng)濟(jì)計(jì)量學(xué)精要[M].北京:機(jī)械工業(yè)出版社,2010.
[14]高鐵梅.計(jì)量經(jīng)濟(jì)分析方法與建模[M].北京:清華大學(xué)出版社,2009.