李欣祎
摘 要:國內(nèi)生產(chǎn)總值(GDP)是衡量一個(gè)國家經(jīng)濟(jì)發(fā)展的重要指標(biāo),將宏觀經(jīng)濟(jì)發(fā)展現(xiàn)狀量化,研究近幾十年來國家經(jīng)濟(jì)變動(dòng)趨勢和發(fā)展規(guī)律。本文主要借助ARIMA模型、BP神經(jīng)網(wǎng)絡(luò)兩個(gè)模型,選取2000-2019年我國GDP季度數(shù)據(jù)進(jìn)行擬合,分別將GDP季度數(shù)據(jù)劃分為訓(xùn)練集和測試集,將兩個(gè)模型擬合效果進(jìn)行比較,研究發(fā)現(xiàn),ARIMA模型的擬合效果較好。最后借助ARIMA對我國2020-2021年GDP進(jìn)行預(yù)測。
關(guān)鍵詞:ARIMA;BP神經(jīng)網(wǎng)絡(luò);GDP
隨著全球化進(jìn)程的加快,我國綜合國力得到大幅提升。經(jīng)濟(jì)快速發(fā)展的同時(shí),暴露出一系列的弊端,貧富差距分化嚴(yán)重,社會(huì)矛盾問題凸顯。此時(shí),研究衡量我國經(jīng)濟(jì)發(fā)展的數(shù)據(jù)指標(biāo),對我國GDP的動(dòng)態(tài)分析和預(yù)測對于及時(shí)調(diào)控國家的政策具有一定的重要意義。當(dāng)前對GDP的研究主要借助時(shí)間序列模型,通過歷史數(shù)據(jù)模擬未來數(shù)據(jù)變動(dòng)趨勢。此外還有借助機(jī)器學(xué)習(xí)算法等,模型操作簡單,易于理解。近些年來,許多學(xué)者對GDP進(jìn)行多方位研究,孫文淵(2015)借助1992-2011年吉林省GDP數(shù)據(jù),通過比較傳統(tǒng)回歸模型主成分回歸和機(jī)器學(xué)習(xí)模型神經(jīng)網(wǎng)絡(luò)擬合效果,研究發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)算法模型的預(yù)測效果要優(yōu)于傳統(tǒng)主成分回歸模型;李超楠(2018)分別選取用ARIMA和BP神經(jīng)網(wǎng)絡(luò)兩個(gè)模型進(jìn)行分析,研究發(fā)現(xiàn),兩個(gè)模型組合的擬合效果最好,模型準(zhǔn)確度較高,可以解決GDP數(shù)據(jù)中當(dāng)期和滯后期的隱含的復(fù)雜關(guān)系。因此,本文選取時(shí)間序列ARIMA和神經(jīng)網(wǎng)絡(luò)兩種方法對我國GDP進(jìn)行分析預(yù)測。
一、理論基礎(chǔ)
時(shí)間序列通過借助過去存在的歷史數(shù)據(jù)對未來數(shù)據(jù)進(jìn)行預(yù)測,研究數(shù)據(jù)指標(biāo)的變化趨勢。時(shí)間序列ARIMA模型是目前最常用的非平穩(wěn)序列的時(shí)間序列模型。在日常生活中遇到的經(jīng)濟(jì)數(shù)據(jù),大多都是非平穩(wěn)數(shù)據(jù),存在一定的趨勢性和季節(jié)周期性,此時(shí)通過差分可以將數(shù)據(jù)平穩(wěn),防止出現(xiàn)數(shù)據(jù)的偽回歸。
ARIMA(p,d,q)模型如下:
其中,p、q表示階數(shù),u是常數(shù),ε代表誤差。
一個(gè)完整的神經(jīng)網(wǎng)絡(luò)包括2個(gè)過程,首先是輸入層輸入數(shù)據(jù),通過計(jì)算獲得輸出,如果輸出層輸出和正確數(shù)據(jù)不一致出現(xiàn)誤差,且誤差超出我們之前規(guī)定的誤差,首先最后一層神經(jīng)元參數(shù)調(diào)整,層層向第一層開始調(diào)整,直到輸出結(jié)果誤差達(dá)到最小。本文通過r語言進(jìn)行實(shí)證分析。神經(jīng)網(wǎng)絡(luò)目前主要應(yīng)用于經(jīng)濟(jì)預(yù)測,研究數(shù)據(jù)之間的非線性關(guān)系,操作簡單。
二、實(shí)證分析
本文以我國2000-2019年每季度的GDP為研究對象,數(shù)據(jù)通過中經(jīng)網(wǎng)統(tǒng)計(jì)數(shù)據(jù)集網(wǎng)站收集和整理得到。
(一)ARIMA模型
1.序列白噪聲檢驗(yàn)
在對序列進(jìn)行分析前首先對序列進(jìn)行白噪聲檢驗(yàn),序列通過檢驗(yàn)后才可以用時(shí)間序列分析,從結(jié)果來看,序列延遲6階、12階和18階P都小于0.05,根據(jù)檢驗(yàn)原理拒絕原假設(shè),數(shù)據(jù)不屬于純隨機(jī)波動(dòng),說明數(shù)據(jù)存在一定規(guī)律性可以用來分析。接下來利用SAS軟件擬合模型。
2.數(shù)據(jù)的預(yù)處理
首先用SAS軟件畫出2000-2019年全國GDP時(shí)間序列圖,發(fā)現(xiàn)2000-2008年GDP增長速度較為平緩,而從2009年以后每年增長速度迅猛。從總的趨勢來看GDP增長呈現(xiàn)指數(shù)增長的趨勢,說明這個(gè)序列具有非平穩(wěn)性。由于序列具有指數(shù)趨勢的序列特征,在時(shí)間序列中為了消除這種指數(shù)趨勢通常把數(shù)據(jù)進(jìn)行對數(shù)處理。把原序列進(jìn)行對數(shù)處理后記為lnGDP。
經(jīng)過對數(shù)處理后的序列呈線性增長,序列仍為非平穩(wěn)序列l(wèi)nGDP序列進(jìn)行差分處理來轉(zhuǎn)化成平穩(wěn)序列。把2000-2016年的GDP數(shù)據(jù)作為訓(xùn)練樣本,2017-2019年的GDP數(shù)據(jù)作為測試樣本對模型測試結(jié)果進(jìn)行評價(jià)。記序列l(wèi)nGDP進(jìn)行一階差分后的序列記為dlnGDP畫出時(shí)序圖如圖1所示。
從圖1可以看出dlnGDP序列在某一值附近波動(dòng)可以認(rèn)為此時(shí)序列平穩(wěn)。通過時(shí)序圖判斷具有一定主觀性,為了更進(jìn)一步檢驗(yàn)序列平穩(wěn)性,利用SAS軟件對序列進(jìn)行自相關(guān)偏自相關(guān)檢驗(yàn)。經(jīng)檢驗(yàn)發(fā)現(xiàn)此時(shí)p值均小于0.01,表明此時(shí)dlnGDP序列是平穩(wěn)序列。
3.模型建立
為了找到模型的最佳階數(shù),通過對自相關(guān)圖和偏自相關(guān)圖進(jìn)行判斷。序列經(jīng)過一階差分后達(dá)到平穩(wěn)狀態(tài),然后分別做出序列dlnGDP的ACF圖和PACF圖。
從ACF圖可以看出1階之后全部沒有超過標(biāo)準(zhǔn)差,且衰減程度慢可以判斷自相關(guān)系數(shù)拖尾。從偏自相關(guān)圖中能夠看出,除了延遲1階和7階的偏自相關(guān)系數(shù)顯著大于2倍標(biāo)準(zhǔn)差之外,其他偏自相關(guān)系數(shù)都比較小,所以考慮構(gòu)建疏系數(shù)模型,綜合考慮前面的差分運(yùn)算,擬合疏系數(shù)模型ARIMA((1,7),1,0)。使用條件最小二乘估計(jì),確定模型為:
4.模型檢驗(yàn)
模型顯著性主要檢驗(yàn)?zāi)P蜌埐钚蛄惺欠癜自肼曅蛄?,可以得到誤差序列延遲6、12、18和24階都大于0.05不能拒絕原假設(shè),認(rèn)為殘差序列屬于白噪聲序列即模型顯著有效。
5.模型預(yù)測
把預(yù)測值和實(shí)際值進(jìn)行對比表1:
2017-2019年每季度GDP的相對誤差都在3%以內(nèi),三年的平均絕對百分比誤差為0.90%,模型擬合效果較好,模型可作為全國GDP短期預(yù)測模型。
(三)BP神經(jīng)網(wǎng)絡(luò)
將所需的數(shù)據(jù)和相應(yīng)的程序編寫完成之后,運(yùn)用R軟件進(jìn)行分析,得到相應(yīng)的預(yù)測結(jié)果,由于神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果每次均不相同,所以取5次結(jié)果的平均值,如表2所示。
觀察得到預(yù)測效果理想,BP神經(jīng)網(wǎng)絡(luò)預(yù)測值和實(shí)際值誤差在10.5%以內(nèi),且預(yù)測誤差均值為6.7%,但是由表中同樣可以看出,隨著時(shí)間增加,誤差逐漸增大,BP神經(jīng)網(wǎng)絡(luò)模型可以很好的預(yù)測短期內(nèi)的GDP,但是長期而言,誤差逐漸增大。BP神經(jīng)網(wǎng)絡(luò)通過調(diào)整不同的參數(shù),輸出不同的擬合值,且同一個(gè)參數(shù),多次重復(fù)也會(huì)輸出不同的擬合值。因此,選取不同的參數(shù)對實(shí)驗(yàn)結(jié)果影響較大。
(四)ARIMA模型與BP神經(jīng)網(wǎng)絡(luò)模型擬合結(jié)果對比分析
為了更好的檢驗(yàn)組合模型預(yù)測效果,分別計(jì)算ARIMA模型與BP神經(jīng)網(wǎng)絡(luò)模型擬合結(jié)果的相對誤差百分比。比較ARIMA模型與BP神經(jīng)網(wǎng)絡(luò)模型兩個(gè)模型的相對誤差,可以發(fā)現(xiàn)ARIMA相對誤差比BP神經(jīng)網(wǎng)絡(luò)模型相對誤差小,并且在穩(wěn)定性方面表現(xiàn)最好。
(五)預(yù)測
利用ARIMA模型對2020年-2021年8個(gè)季度的對數(shù)GDP進(jìn)行預(yù)測。圖為lnGDP預(yù)測值,紅色線表示預(yù)測值,綠色中間部分表示95%的置信區(qū)間,具體lnGDP數(shù)值如圖2,隨著時(shí)間推移,預(yù)測結(jié)果波動(dòng)范圍逐漸擴(kuò)大,誤差逐漸增大。總體可以看出GDP呈現(xiàn)規(guī)律上升態(tài)勢,但預(yù)測誤差越來越大。
三、結(jié)論
ARIMA 模型和 BP 神經(jīng)網(wǎng)絡(luò)模型都可以用來預(yù)測GDP,并且被廣泛使用,本文采用通過誤差百分比方式來比較模型的預(yù)測精度。首先通過結(jié)合我國GDP數(shù)據(jù)特點(diǎn)首先基于傳統(tǒng)的時(shí)間序列 ARIMA 模型對我國GDP進(jìn)行擬合預(yù)測,提取當(dāng)前期與滯后期的線性關(guān)系。根據(jù)自相關(guān)和偏自相關(guān)圖結(jié)合疏系數(shù)選取最優(yōu)的ARIMA((1,7) , 1 , 0)模型來擬合2000年到2016年我國 GDP,根據(jù)該模型預(yù)測出2017年到2019年我國GDP數(shù)據(jù),計(jì)算其平均絕對誤差為0.90%。其次利用神經(jīng)網(wǎng)絡(luò)預(yù)測特點(diǎn)用 R 軟件構(gòu)建起 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),結(jié)果ARIMA模型預(yù)測精度明顯高于BP神經(jīng)網(wǎng)絡(luò)模型,說明ARIMA模型預(yù)測效果較好。借由最終選取的模型,對2020-2021年每季度GDP數(shù)值進(jìn)行預(yù)測,并得到結(jié)果。
參考文獻(xiàn):
[1]孫文淵.基于BP神經(jīng)網(wǎng)絡(luò)模型下預(yù)測吉林省GDP[D].延邊大學(xué),2015
[2]李超楠.幾種山東省 GDP 的預(yù)測方法及其比較[D].山東大學(xué),2018
[3]蔡淅韻.基于ARIMA模型的國內(nèi)生產(chǎn)總值預(yù)測[J].科技傳播.2020(5上): 40~41
[4]羅森,張孟璇.基于ARIMA和VAR模型的我國季度GDP預(yù)測比較[J].現(xiàn)代商業(yè).2019(35):50~52