崔志濤, 方清鑫
(東莞理工學院城市學院 計算機與信息學院, 廣東 東莞 523419)
國內(nèi)生產(chǎn)總值(GDP,Gross Domestic Product)是對一個國家或地區(qū)在一定時期內(nèi)國民經(jīng)濟生產(chǎn)活動總成果的一種計量,是按市場價格計算的一個國家或地區(qū)所有常住單位在一定時期內(nèi)生產(chǎn)活動的最終成果[1],是衡量一個國家(或地區(qū))經(jīng)濟狀況的指標。一組GDP數(shù)據(jù)是一個時間序列(按照時間次序排列的一組觀測值),使用時間序列分析方法中的ARMA模型對GDP數(shù)據(jù)進行分析建模,可以反映市場運行的規(guī)律,預測未來的經(jīng)濟發(fā)展。本文使用Eviews 軟件分別對東莞1978—2015年GDP數(shù)據(jù)和1992—2015年GDP數(shù)據(jù)建立了ARMA模型(數(shù)據(jù)選自《2018年東莞統(tǒng)計年鑒》),并進行了預測。
英國統(tǒng)計學家G.u.Yule在1927年提出了AR模型,被認為是現(xiàn)代時間序列分析的起源。1931年英國統(tǒng)計學家G.T.Walker提出了MA模型與ARMA模型,三者一起構(gòu)成了時間序列分析的基礎(chǔ)[2]。模型數(shù)據(jù)具有寬平穩(wěn)與方差齊性的特征。美國統(tǒng)計學家GE.P.Box和英國統(tǒng)計學家G.M.Jenkins在1970年出版的《Time Series Analysis:Forecasting and Control》為實際工作者提供了對時間序列進行分析、建模、預測、診斷的系統(tǒng)性方法,被認為是時間序列分析發(fā)展的里程碑。模型對于差分之后具有平穩(wěn)性的數(shù)據(jù)可以建立ARMA模型。
AR模型(Autoregressive Model )將序列當前值表示為滯后值和當前隨機干擾的線性組合,稱為自回歸模型,AR(p)模型的數(shù)學表達式為:
(1)
φ0,φ1,…,φp是自回歸系數(shù),εt是白噪聲序列(隨機序列)[3]。令L為一階延遲算子,Lyt=yt-1,則AR(p)模型可以寫為:
(1-φ1L-φ2L2-…-φpLp)yt=Φ(L)yt=εt
(2)
如果特征方程:
Φ(L)=1-φ1L-φ2L2-…-φpLp=0
(3)
的根都在單位圓外,則模型是穩(wěn)定的。
MA模型(Moving Average Model)將序列的當前值表示為當期和前期隨機誤差的線性組合,稱為滑動平均模型,MA(q)模型的數(shù)學表達式為:
(4)
φ1,φ2,…,φq是滑動平均系數(shù),記為yt=Ψ(L)εt。模型可逆的條件是滑動平均系數(shù)的特征多項式:
Ψ(L)=1-φ1L-φ2L2-…-φqLq=0
(5)
的根都在單位圓外。
ARMA模型(Auto-Regressive and Moving Average Model)將序列當期值表示為當期及前期的隨機誤差與前期值的線性組合,ARMA(p,q)模型的數(shù)學表達式為:
(6)
記為Φ(L)yt=Ψ(L)εt,特征方程:
Φ(L)=1-φ1L-φ2L2-…-φpLp=0
(7)
與
Ψ(L)=1-φ1L-φ2L2-…-φqLq=0
(8)
的根都在單位圓外保證模型的平穩(wěn)與可逆。q=0時,ARMA(p,q)為AR(p)模型;q=0時,ARMA(p,q)為MA(q)模型。
時間序列分析由觀測數(shù)據(jù)的鄰近依賴性構(gòu)造一個預測函數(shù),使得觀測值與預測值之間的均方誤差盡可能的小。使用矩估計、最小二乘估計、極大似然估計等[4]方法估計自回歸系數(shù)與滑動平均系數(shù)。
1)模型數(shù)據(jù)的平穩(wěn)性。一個時間序列{Xt,t∈T}如果滿足:
(9)
則稱{Xt}是寬平穩(wěn)時間序列(二階矩平穩(wěn)序列,協(xié)方差平穩(wěn))[2,4],{γt}是{Xt}的自協(xié)方差函數(shù)。
可以用時序圖方法與單位根檢驗的方法進行識別。
圖1 對數(shù)二階差分時序圖
從時序圖中可以看出,在對原數(shù)據(jù)取對數(shù)之后的二階差分數(shù)據(jù)是平穩(wěn)序列[5]。
2)模型數(shù)據(jù)的純隨機性。模型的數(shù)據(jù)為非白噪聲序列,鄰近觀測值之間要具有相關(guān)性,也可以對源數(shù)據(jù)的差分序列進行檢驗。在Eeviews的命令窗口點擊View/Correlogram,同時可以完成模型的定階。
表1 自相關(guān)系數(shù)與偏自相關(guān)系數(shù)的性質(zhì)
圖2 對數(shù)二階差分數(shù)據(jù)的自相關(guān)與偏自相關(guān)系數(shù)圖
自相關(guān)與偏自相關(guān)系數(shù)均為拖尾,依據(jù)兩倍標準差準則[2]模型定階為AR(2)MA(1)。
3)模型的顯著性檢驗。
由圖3可以看出模型、系數(shù)均通過顯著性檢驗,特征方程的根都位于單位圓內(nèi)。
圖3 ARMA(2,1)模型顯著性檢驗
4)殘差的白噪聲檢驗。
圖4 1978—2015年數(shù)據(jù)模型殘差的白噪聲檢驗
在5%的顯著性水平下,殘差全部為白噪聲,可以說明數(shù)據(jù)的信息已經(jīng)被充分提取。
5)預測數(shù)據(jù)。
表2 1978—2015年數(shù)據(jù)模型的預測數(shù)據(jù)
使用Eviews軟件對未來數(shù)據(jù)進行預測,預測值與實際值的誤差隨著預測步長的增加而增大,驗證了ARMA模型適合短期預測[6]。
分析東莞市2018年統(tǒng)計年鑒中的1978—2015年GDP數(shù)據(jù)并計算年增長率。
圖5 1978—2015年東莞GDP數(shù)據(jù)年增長率
1978—2015年東莞GDP數(shù)據(jù)整體呈現(xiàn)指數(shù)增長趨勢,1992年東莞市的GDP首次實現(xiàn)百億級別的突破,2002年實現(xiàn)千億級別的突破。數(shù)據(jù)的年增長率呈現(xiàn)不規(guī)則趨勢,極大值為1993年的41.6%,極小值為2009年的2.2%。結(jié)合我國改革開放的進程[7]以1978年為開始,1992年之后為一個新的時期。特別是在后一個時期內(nèi),社會主義市場經(jīng)濟得到了長足的發(fā)展,數(shù)據(jù)量可以體現(xiàn)出政策的效果。鑒于經(jīng)濟政策對時間數(shù)據(jù)產(chǎn)生了影響[8],下文的模型選取了1992—2015的GDP數(shù)據(jù)進行了建模分析,數(shù)據(jù)二階差分之后檢驗結(jié)果見圖6。
圖6 MA(1)模型的顯著性檢驗
使用MA(1)模型得到預測數(shù)據(jù)如表3所示:
表3 1992—2015年數(shù)據(jù)模型的預測數(shù)據(jù)
對比1978—2015年數(shù)據(jù)模型的相對誤差[9]減小,預測精度相對于1978—2015數(shù)據(jù)模型有所提高,模型參數(shù)簡約[8]。
時間序列數(shù)據(jù)的自相關(guān)系數(shù)ρj反映了樣本數(shù)據(jù)間的關(guān)聯(lián)程度,定義為[4]:
(10)
矩估計為[4]:
(11)
使用樣本數(shù)據(jù)計算得到自相關(guān)系數(shù)的估計,見表4。
表4 1978—2015年與1992—2015年兩階段GDP數(shù)據(jù)的1~5階自相關(guān)系數(shù)
對比兩段數(shù)據(jù)的自相關(guān)系數(shù),1978—2015年GDP數(shù)據(jù)的1-5階自相關(guān)系數(shù)要大于1992—2015年數(shù)據(jù)對應(yīng)階的自相關(guān)系數(shù)。
本文分別建立了東莞市1978—2015年GDP數(shù)據(jù)與1992—2015年GDP數(shù)據(jù)的ARMA模型,并進行了數(shù)據(jù)的預測。對比1978—2015數(shù)據(jù)模型,1992—2015數(shù)據(jù)模型參數(shù)簡約,預測精度高。計算兩階段GDP數(shù)據(jù)的1-5階自相關(guān)系數(shù)進行對比,結(jié)果顯示1978—2015年GDP數(shù)據(jù)的各階自相關(guān)系數(shù)大于1992—2015年GDP數(shù)據(jù)的同階自相關(guān)系數(shù)。