余后強(qiáng),李 玲
(咸寧學(xué)院a.數(shù)學(xué)與統(tǒng)計(jì)學(xué)院;b.生物醫(yī)學(xué)工程學(xué)院,湖北 咸寧 437100)
人均國(guó)內(nèi)生產(chǎn)總值(人均GDP)的經(jīng)濟(jì)數(shù)據(jù)能較好的反映一個(gè)國(guó)家的經(jīng)濟(jì)這一復(fù)雜系統(tǒng)的宏觀整體特征即動(dòng)力學(xué)特征,但其經(jīng)濟(jì)數(shù)據(jù)在其主要的一些影響因素作用的同時(shí)常常還受到許多外生因素的影響,從而導(dǎo)致數(shù)據(jù)會(huì)產(chǎn)生突變,這就需要能夠有較多的數(shù)據(jù)來(lái)研究其趨勢(shì)和波動(dòng),并且希望在一定的趨勢(shì)下,較少的數(shù)據(jù)就已經(jīng)能體現(xiàn)出其趨勢(shì),大量的以往數(shù)據(jù)反而會(huì)影響對(duì)其數(shù)據(jù)的預(yù)測(cè)。那么該經(jīng)濟(jì)數(shù)據(jù)的預(yù)測(cè)模型如何建立就成為預(yù)測(cè)精度的關(guān)鍵所在【1】。
人均國(guó)內(nèi)生產(chǎn)總值的時(shí)間序列為既含有確定性的動(dòng)態(tài)趨勢(shì)又含有隨機(jī)性波動(dòng)的非平穩(wěn)時(shí)間序列,關(guān)于人均國(guó)內(nèi)生產(chǎn)總值的一系列的模型的建立,時(shí)間序列分析法和灰色系統(tǒng)理論都可以做得到,并且時(shí)間序列分析法和灰色系統(tǒng)理論都各有各自的優(yōu)點(diǎn),時(shí)間序列分析法一般是建立在大量的歷史數(shù)據(jù)的基礎(chǔ)上進(jìn)行模型的建立,進(jìn)而對(duì)序列進(jìn)行短期的預(yù)測(cè)。其預(yù)測(cè)方法的基本思想是:預(yù)測(cè)一個(gè)現(xiàn)象的未來(lái)變化時(shí),用該現(xiàn)象的過(guò)去行為來(lái)預(yù)測(cè)未來(lái)。即通過(guò)時(shí)間序列的歷史數(shù)據(jù)揭示現(xiàn)象隨時(shí)間變化的規(guī)律,將這種規(guī)律延伸到未來(lái),從而對(duì)該現(xiàn)象的未來(lái)作出預(yù)測(cè)【2】;而灰色系統(tǒng)理論則是一種動(dòng)態(tài)趨勢(shì)預(yù)測(cè)理論,它適用于在原始觀測(cè)數(shù)據(jù)較少且數(shù)據(jù)已具有較為明顯的趨勢(shì)的預(yù)測(cè)問(wèn)題,它能夠較好地反映數(shù)據(jù)的趨勢(shì)性變化【3】。
時(shí)間序列預(yù)測(cè)中的自回歸移動(dòng)平均模型(ARMA模型)是一種比較成熟的模型,因此可以通過(guò)對(duì)人均國(guó)內(nèi)生產(chǎn)總值的時(shí)間序列的分析來(lái)研究我國(guó)經(jīng)濟(jì)發(fā)展的內(nèi)在規(guī)律和演變機(jī)制[4][5]?;疑到y(tǒng)理論在控制、預(yù)測(cè)、決策等領(lǐng)域有著廣泛的應(yīng)用,但就其精華而言還在于GM(1,1)模型。GM(1,1)模型被廣泛應(yīng)用于預(yù)測(cè),并且預(yù)測(cè)效果很好[6][7][8]。由于GM(1,1)算法簡(jiǎn)單易行,預(yù)測(cè)精度相對(duì)較高,所以在很多問(wèn)題中,GM(1,1)模型仍是較好的預(yù)測(cè)模型。
本文將ARMA模型與GM(1,1)模型相結(jié)合用于人均國(guó)內(nèi)生產(chǎn)總值的預(yù)測(cè)[9],首先采用ARMA模型方法在長(zhǎng)期的數(shù)據(jù)的基礎(chǔ)上研究其發(fā)展趨勢(shì),在已明確其發(fā)展趨勢(shì)后利用最近的較少的數(shù)據(jù)建立GM(1,1)模型,進(jìn)而繼續(xù)對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),這樣既能延長(zhǎng)被預(yù)測(cè)的序列,又能夠避免某些突變的數(shù)據(jù)對(duì)預(yù)測(cè)序列的影響。實(shí)例表明,將以上兩個(gè)模型結(jié)合起來(lái)構(gòu)成的組合模型用于預(yù)測(cè)人均國(guó)內(nèi)生產(chǎn)總值有較高的預(yù)測(cè)精度。
本文從國(guó)家統(tǒng)計(jì)局網(wǎng)站選取1978~2005年度的人均GDP(表1)作為我國(guó)經(jīng)濟(jì)發(fā)展的衡量標(biāo)準(zhǔn)。
為了驗(yàn)證模型的合理性,我們利用1978~1997年的20個(gè)數(shù)據(jù)進(jìn)行模型的建立,1998~2005年的數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù)來(lái)驗(yàn)證。由表1可知我國(guó)的人均GDP的序列明顯不平穩(wěn),對(duì)原序列先后進(jìn)行對(duì)數(shù)化,一階差分化后得到圖1。
由圖1可知此時(shí)的序列趨于平穩(wěn),然后對(duì)此序列進(jìn)行零均值化,從而得到用來(lái)建模的序列。
圖1 1978~1997年度的人均GDP
我們得到的平穩(wěn)的零均值化的序列是一個(gè)ARMA(p,q)過(guò)程,則可用ARMA(p,q)模型來(lái)描述:
式中p和q分別是自回歸部分和滑動(dòng)平均部分的階數(shù);?i(i=1,2,…,p),θj(i=1,2,…,q)分別是自回歸系數(shù)和滑動(dòng)平均系數(shù);at~N(0,σ2),t=1,2,…,n白噪聲序列。故ARMA(p,q)模型有p+q+1個(gè)未知參數(shù)。要確定這些未知參數(shù)首先要確定模型的階次,即p和q值。對(duì)于階數(shù)(p,q)的確定是建模中比較重要的步驟,也是比較困難的步驟。一般地,我們可以運(yùn)用基于自相關(guān)函數(shù)和偏相關(guān)函數(shù)的定階方法、基于F檢驗(yàn)、利用信息準(zhǔn)則法確定階數(shù)。這幾種方法都各有各自的優(yōu)缺點(diǎn),往往可以把以上幾種方法交叉結(jié)合運(yùn)用。本文中,我們主要通過(guò)利用信息準(zhǔn)則的方法中的最小信息準(zhǔn)則(Akaike's Information Criterion,AIC)來(lái)定階。其基本思想是根據(jù)模型的預(yù)報(bào)誤差來(lái)判斷自回歸模型的階數(shù)是否合適。如果某個(gè)適用的自回歸模型是由某一序列擬合得來(lái)的,則利用該模型對(duì)序列進(jìn)行一步預(yù)測(cè),所得的預(yù)測(cè)誤差必定是最小的。因此,預(yù)報(bào)效果的好壞,反過(guò)來(lái)也可作為模型擬合優(yōu)劣的檢驗(yàn)準(zhǔn)則。
AIC函數(shù)為
其中:M,N為ARMA模型階數(shù)的上限值,一般取為
用該模型參數(shù)進(jìn)行預(yù)測(cè),然后轉(zhuǎn)化到處理前最初的數(shù)據(jù),詳見(jiàn)表3。
表2 ARMA(1,3)模型參數(shù)
表3 預(yù)測(cè)數(shù)據(jù)與實(shí)驗(yàn)數(shù)據(jù)
由表3我們可以看出,用該模型預(yù)測(cè)出的數(shù)據(jù)與實(shí)際數(shù)據(jù)還是比較吻合的,具有一定的合理性。此時(shí),得到的ARMA(1,3)模型為
利用得到的ARMA(1,3)模型預(yù)測(cè)1998~2005年的數(shù)據(jù),結(jié)果如表4所示:
表4 預(yù)測(cè)數(shù)據(jù)與實(shí)驗(yàn)數(shù)據(jù)
由表4我們可知,隨著預(yù)測(cè)序列的增加,準(zhǔn)確性也隨著降低。為了提高模型的精度,我們需要對(duì)模型進(jìn)行改進(jìn)。
GM是一個(gè)擬微分方程的動(dòng)態(tài)模型,它可以較好地描述系統(tǒng)內(nèi)部特征和發(fā)展趨勢(shì),外推預(yù)測(cè)性能優(yōu)于統(tǒng)計(jì)回歸方程,且不要求樣本數(shù)據(jù)有較大容量和滿(mǎn)足一定統(tǒng)計(jì)分布。其建模過(guò)程為:
設(shè)原始非負(fù)數(shù)據(jù)序列為:
x(0)=[x(0)(1),x(0)(2),…x(0)(n)],其中
x(0)(i)>0,i=1,2,...,n。
對(duì)原始非負(fù)數(shù)據(jù)序列作一次累加:
得出的x(1)=[x(1)(1),x(1)(2),…,x(1)(n)]為一次累加序列,根據(jù)灰色系統(tǒng)理論,對(duì)于一次列加生成序列
又令x(0)的GM(1,1)定義型為
則其一級(jí)參數(shù)包PΙ在最小二乘準(zhǔn)則下有矩陣算式如下
則此微分方程的解即可得模型為
針對(duì)ARMA(p,q)模型預(yù)測(cè)稍長(zhǎng)時(shí)誤差過(guò)大的缺點(diǎn),本文用GM(1,1)模型來(lái)對(duì)其進(jìn)行改進(jìn),由于原序列的數(shù)據(jù)較為充分,這時(shí)我們就要確定數(shù)據(jù)的序列長(zhǎng)度,我們?nèi)绻_定的數(shù)據(jù)長(zhǎng)度過(guò)短,經(jīng)濟(jì)數(shù)據(jù)的信息就不能夠得到充分體現(xiàn),并且預(yù)測(cè)的精度隨著序列長(zhǎng)度的增加也將明顯下降;如果確定的數(shù)據(jù)長(zhǎng)度過(guò)長(zhǎng),不但不方便計(jì)算,而且數(shù)據(jù)更有可能存在奇異數(shù)據(jù),所以確定好數(shù)據(jù)的序列長(zhǎng)度是十分重要的一步,在本文中選取序列的長(zhǎng)度為6。
在確定了序列的長(zhǎng)度以后,就需要確定這個(gè)GM模型長(zhǎng)度為6的序列的數(shù)據(jù),為了增加預(yù)測(cè)序列的精度以及序列的長(zhǎng)度,我們需要在ARMA(p,q)模型的基礎(chǔ)上用GM(1,1)模型來(lái)加以改進(jìn),在選取實(shí)驗(yàn)數(shù)據(jù)時(shí),在建立GM(1,1)模型時(shí)如何確定序列的數(shù)據(jù)以提高預(yù)測(cè)的精度是改進(jìn)的關(guān)鍵。在選取序列數(shù)據(jù)時(shí)原始數(shù)據(jù)和用ARMA(p,q)模型得到的理論數(shù)據(jù)的長(zhǎng)度的選取就顯得尤為重要,為此我們用不同的數(shù)據(jù)長(zhǎng)度組合方式進(jìn)行對(duì)比,截取的序列數(shù)據(jù)考慮到既需要有充足的ARMA(p,q)模型所預(yù)測(cè)的數(shù)據(jù)又需要有足夠的對(duì)比數(shù)據(jù),考慮到以上因素,我們選取1997~2002年的數(shù)據(jù)作為實(shí)驗(yàn)序列,經(jīng)過(guò)比較,我們可知我們采用的ARMA(1,3)模型在預(yù)測(cè)兩步內(nèi)的精度較高,并且也能夠很好地體現(xiàn)出經(jīng)濟(jì)數(shù)據(jù)的趨勢(shì)。故此,我們采用4個(gè)原始數(shù)據(jù)與2個(gè)ARMA(1,3)模型預(yù)測(cè)出的數(shù)據(jù)結(jié)合的序列方式作為GM(1,1)模型建模的序列選取方式。
按此方式進(jìn)行預(yù)測(cè),我們得到模型的的參數(shù)a=-0.095682,b=4563.478922。則得到的模型為
x?(1)(t)=51737.98e-0.095682t-47693.98 ,利 用 改 進(jìn) 的ARMA-GM組合模型進(jìn)行預(yù)測(cè),另外為了對(duì)比我們直接用GM(1,1)模型進(jìn)行預(yù)測(cè)得到的結(jié)果如表5所示。
表5 各模型預(yù)測(cè)數(shù)據(jù)對(duì)比
在評(píng)價(jià)對(duì)同一問(wèn)題的不同模型的優(yōu)劣時(shí),我們可以用許多方法對(duì)其進(jìn)行評(píng)價(jià),在本文中我們采用灰關(guān)聯(lián)度分析法[10]。
將實(shí)際值x0(k),k=1,…,5作為參考序列,ARMA模型預(yù)測(cè)值x1(k)、ARMA-GM模型預(yù)測(cè)值x2(k)以及GM模型預(yù)測(cè)值x3(k)作為比較序列。
根據(jù)表5求出差
顯然
由此計(jì)算出關(guān)聯(lián)系數(shù)如下:
令ρ=0.5,則有
從上述關(guān)聯(lián)度分析來(lái)看,r02明顯大于r01和r03,所以我們可知改進(jìn)的模型明顯優(yōu)于原ARMA模型以及GM模型,ARMA-GM模型能夠更精確地進(jìn)行預(yù)測(cè)。
通過(guò)以上對(duì)改進(jìn)模型的探討,我們可知采用4個(gè)原始數(shù)據(jù)與2個(gè)ARMA(1,3)模型預(yù)測(cè)出的數(shù)據(jù)結(jié)合的序列方式的GM(1,1)模型比其它模型在該建模中有更好的優(yōu)越性。
ARMA模型在建模時(shí)能夠在長(zhǎng)期的數(shù)據(jù)的基礎(chǔ)上研究其發(fā)展趨勢(shì),在進(jìn)行短期預(yù)測(cè)時(shí)有很好的精確性,但是當(dāng)預(yù)測(cè)稍長(zhǎng)時(shí)預(yù)測(cè)的精度將明顯的降低。采用本文提出的ARMA-GM組合模型能夠很好的解決該問(wèn)題,它不但能夠在數(shù)據(jù)序列較少時(shí)比較準(zhǔn)確地進(jìn)行預(yù)測(cè),而且隨著預(yù)測(cè)序列的長(zhǎng)度的增加精度降低的也較慢。
另外由于經(jīng)濟(jì)發(fā)展在不同歷史階段下發(fā)展規(guī)律有很大的差異等,并非建立的預(yù)測(cè)ARMA-GM組合模型中原始數(shù)據(jù)序列越長(zhǎng),采用的ARMA模型序列越長(zhǎng)預(yù)測(cè)結(jié)果越好。
在本文中我們采用4個(gè)原始數(shù)據(jù)與2個(gè)ARMA(1,3)模型預(yù)測(cè)出的數(shù)據(jù)結(jié)合的序列方式作為GM(1,1)模型建模的序列選取方式。該改進(jìn)的ARMA-GM組合模型與傳統(tǒng)GM(1,1)模型以及ARMA模型相比,預(yù)測(cè)精度大大提高。因此,改進(jìn)的GM(1,1)模型用于對(duì)其他經(jīng)濟(jì)方面的預(yù)測(cè)是可行的,效果比較理想。該方法具有一定的理論和實(shí)踐意義。
[1]徐國(guó)祥.統(tǒng)計(jì)預(yù)測(cè)和決策[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2005.
[2]吳懷宇.時(shí)間序列分析與綜合[M].武漢:武漢大學(xué)出版社,2004.
[3]肖新平,宋中民.灰技術(shù)基礎(chǔ)及其應(yīng)用[M].北京:科學(xué)出版社,2005.
[4]張恒茂,喬建國(guó),史建紅.國(guó)內(nèi)生產(chǎn)總值的預(yù)測(cè)模型[J].山西師范大學(xué)學(xué)報(bào)(自然版),2008,(1).
[5]趙婷.ARMA在我國(guó)GDP預(yù)測(cè)中的應(yīng)用[J].中國(guó)市場(chǎng),2011,(1).
[6]李俊峰,戴文戰(zhàn).GM(1,1)改進(jìn)模型的研究及在上海市發(fā)電量建模中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2005,(3).
[7]陳美英,楊金光.基于灰色GM(1,1)的邯鄲市城鎮(zhèn)化水平預(yù)測(cè)[J].湛江師范學(xué)院學(xué)報(bào),2007,(3).
[8]王道林.灰色預(yù)測(cè)模型GM(1,1)及其在山東省GDP預(yù)測(cè)中的應(yīng)用[J].泰山學(xué)報(bào)學(xué)報(bào),2008,28(6).
[9]胡效雷,何祖威.基于GM-ARMA組合模型的年電力需求預(yù)測(cè)[J].廣東電力,2007,(2).
[10]馬紅燕.區(qū)域創(chuàng)新研發(fā)投入要素與GDP的關(guān)聯(lián)度測(cè)算研究[J].統(tǒng)計(jì)與決策,2009,(16).