牛?!≈袊嗣翊髮W(xué)經(jīng)濟(jì)學(xué)院
?
美國進(jìn)出口貿(mào)易總額預(yù)測方法簡化研究
——基于包含突變點(diǎn)的單位根檢驗(yàn)及ARIMA模型
牛睿中國人民大學(xué)經(jīng)濟(jì)學(xué)院
摘要:ARIMA模型是經(jīng)濟(jì)學(xué)研究中一個(gè)重要的預(yù)測模型,并有多年的使用歷史。而單位根是否存在是該模型一個(gè)重要前提基礎(chǔ)。同時(shí)多數(shù)經(jīng)濟(jì)數(shù)據(jù)由于結(jié)構(gòu)性的原因,無法通過單位根檢驗(yàn),常常需要差分處理,這無疑增加了ARIMA模型的復(fù)雜程度?;诮陙淼慕y(tǒng)計(jì)分析理論,特別是包含突變點(diǎn)的單位根檢驗(yàn)理論,簡化ARIMA模型復(fù)雜度。最后以美國1992年-2015年進(jìn)出口貿(mào)易總額數(shù)據(jù)做了實(shí)證分析,結(jié)果比較滿意。
關(guān)鍵詞:ARIMA 突變點(diǎn) 單位根 進(jìn)出口總額 預(yù)測
ARIMA模型是經(jīng)濟(jì)學(xué)研究中一個(gè)重要的預(yù)測模型,并有多年的使用歷史。而單位根是否存在是該模型一個(gè)重要前提基礎(chǔ)。同時(shí)多數(shù)經(jīng)濟(jì)數(shù)據(jù)由于結(jié)構(gòu)性的原因,無法通過單位根檢驗(yàn),常常需要差分處理,這無疑增加了ARIMA模型的復(fù)雜程度。然而是否能通過一定的統(tǒng)計(jì)原理降低ARIMA模型復(fù)雜程度,進(jìn)而進(jìn)一步推廣ARIMA模型的使用范圍,有著一定的研究意義。
(一)ARIMA模型
ARIMA(Autoregressive Integrated Moving Average Model),由Box和Jenkins(1970)提出,用于時(shí)間序列的分析及預(yù)測。ARIMA模型通常表示為ARIMA(P,D,Q),其中參數(shù)P,D及q要求為非負(fù)整數(shù),p為自回歸模型階數(shù),d為差分階數(shù),q為模型移動項(xiàng)數(shù)。ARIMA模型是Box-Jenkins方法中時(shí)間序列模型的重要組成部分。三個(gè)參數(shù)中兩個(gè)參數(shù)為零時(shí)該模型可縮寫為“AR”,“I”或“MA”。例如:ARIMA (1,0,0)是AR(1),ARIMA(0,1,0)是I(1),ARIMA(0,0,1)是MA(1)。ARIMA模型的基本思想是:將預(yù)測對象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,用一定的數(shù)學(xué)模型來近似描述這個(gè)序列。這個(gè)模型一旦被識別后就可以從時(shí)間序列的過去值及現(xiàn)在值來預(yù)測未來值。ARIMA模型在經(jīng)濟(jì)預(yù)測過程中既考慮了經(jīng)濟(jì)現(xiàn)象在時(shí)間序列上的依存性,又考慮了隨機(jī)波動的干擾性,對于經(jīng)濟(jì)運(yùn)行短期趨勢的預(yù)測準(zhǔn)確率較高,是近年應(yīng)用比較廣泛的方法之一。
(二)BP檢驗(yàn)
突變點(diǎn)(Outlier 或 Breakpoint ),其檢驗(yàn)早期研究見于Chow(1960)基于F-statistic檢驗(yàn)已知突變點(diǎn)及Andrews(1993)和Andrews and Ploberger(1994)推導(dǎo)出的Quandt極限分布及相關(guān)統(tǒng)計(jì)量檢驗(yàn)。BP檢驗(yàn)是近年來發(fā)展起來的用于檢驗(yàn)多結(jié)構(gòu)突變點(diǎn)的完備估計(jì)方法,包括突變點(diǎn)估計(jì)值的連續(xù)性、突變點(diǎn)次數(shù)檢驗(yàn)以及對突變點(diǎn)置信區(qū)間的估計(jì)。Bai 和 Perron (1998)研究了在最小二乘數(shù)回歸模型中突變點(diǎn)的估算模型,其模型很好的估計(jì)了未知突變點(diǎn)及突變點(diǎn)數(shù)量。隨后Bai 和 Perron(2003)進(jìn)一步討論了突變估算模型的實(shí)際應(yīng)用,并完善了模型,模型在全局及局部突變顯示了著良好的估算能力。并且根據(jù)多種理論研究了置信區(qū)間斷裂日期問題以及整體數(shù)據(jù)中誤差估算問題。
(三)包含突變點(diǎn)的單位根檢驗(yàn)(Unit root test with breakpoint)
ARIMA模型所依賴的的一個(gè)重要的前提就是數(shù)據(jù)能通過單位根檢驗(yàn),即是平穩(wěn)的(stationary)。如果存在單位根,則需要考慮差分穩(wěn)定(difference stationary)。單位根的存在表明經(jīng)濟(jì)環(huán)境中的沖擊將帶來永久性影響,如果這樣在引入模型后其解釋能力會變得不理想。同時(shí)以往學(xué)者研究中發(fā)現(xiàn)多數(shù)宏觀數(shù)據(jù)是無法通過單位根檢驗(yàn)。
最早有學(xué)者Nelson 和 Plosser (1982)對美國 14 個(gè)主要經(jīng)濟(jì)數(shù)據(jù)做了單位根檢驗(yàn),其中13個(gè)數(shù)據(jù)都是非平穩(wěn)的。而后Perron 首先對這一結(jié)論提出質(zhì)疑:由于單一時(shí)間序列單位根檢驗(yàn)的檢驗(yàn)勢(power)較低,若時(shí)間序列數(shù)據(jù)是由一次結(jié)構(gòu)變動的趨勢平穩(wěn)過程產(chǎn)生的,則單位根檢驗(yàn)可能會錯(cuò)誤地接受存在單位根的原假設(shè)。Perron (1989)提出未考慮結(jié)構(gòu)變化的單位根檢驗(yàn)功效較低, 通過先驗(yàn)信息選擇外生結(jié)構(gòu)變化的單位根檢驗(yàn)給出了完全不同的結(jié)論:絕大多數(shù) (11/14)總量是分段趨勢平穩(wěn) (segmented -trend-stationary) 的 。但 Perron 的檢驗(yàn)的一個(gè)缺陷是假定發(fā)生結(jié)構(gòu)突變的時(shí)間已知,即將結(jié)構(gòu)突變的估計(jì)外生化,Christiano 指出這很可能會導(dǎo)致單位根檢驗(yàn)對原假設(shè)的過度拒絕。Zivot 和 Andrew (1992) 將結(jié)構(gòu)斷點(diǎn)選擇過程內(nèi)生化, 對Nelson 和 Plosser (1982)所選取的樣本重新進(jìn)行了無條件單位根檢驗(yàn), 在漸近分布和有限樣本情況下, 近半數(shù)總量無法拒絕非平穩(wěn)原假設(shè)。鑒于我們無法確定所考慮的區(qū)間只有一個(gè)結(jié)構(gòu)變化 , Lumsdaine 和 Papell (1997) 將Zivot 和Andrew (1992)的方法擴(kuò)展到兩個(gè)結(jié)構(gòu)斷點(diǎn)的情形, 結(jié)果得出更多的總量是分段趨勢平穩(wěn)的結(jié)論。
王琨等(2007)對中國9項(xiàng)宏觀數(shù)據(jù)進(jìn)行了分析,其中7項(xiàng)(含中國進(jìn)出口總額)在數(shù)據(jù)考慮突變點(diǎn)結(jié)構(gòu)后顯示了非線性平穩(wěn)性。
這里選取了美國商務(wù)部經(jīng)濟(jì)分析局1992年-2014年進(jìn)出口貿(mào)易總額數(shù)據(jù)(IDS0182 Census-based NSA)。美國進(jìn)出口貿(mào)易數(shù)據(jù)來源有很多,選取BEA數(shù)據(jù)來源主要原因有二:一是該數(shù)據(jù)是目前知道少有以月為單位的,這樣能增加樣本總量,提高ARIMA模型預(yù)測準(zhǔn)確度;二是該數(shù)據(jù)直接從商務(wù)部的普查數(shù)據(jù)匯總而成,沒有多余的二次調(diào)整,降低不可知數(shù)據(jù)調(diào)整對模型分析帶來的影響。數(shù)據(jù)匯總見圖(1):
圖(1)美國進(jìn)出口總額1992年-2014年數(shù)據(jù)
數(shù)據(jù)取對數(shù),然后引入單位根檢驗(yàn)。在這里選擇使用ADF和KPSS檢驗(yàn)。檢驗(yàn)結(jié)果見表(2):
表(1)ADF及KPSS檢驗(yàn)結(jié)果
根據(jù)上表所示,原始數(shù)據(jù)明顯具有單位根,無法通過平穩(wěn)性檢驗(yàn),而數(shù)據(jù)一階差分結(jié)果通過平穩(wěn)性檢驗(yàn)。按照原有理論需對數(shù)據(jù)進(jìn)行一階差分處理,然后再引入ARIMA模型。這里我們采用與以往不同的數(shù)據(jù)處理方法?;趫D(1),發(fā)現(xiàn)數(shù)據(jù)具有明顯的上升趨勢,以及多處劇烈波動(例如2001年2月、2009年3月附近。)于是假設(shè)數(shù)據(jù)含有突變點(diǎn),使用BP breakpoint model進(jìn)行檢驗(yàn)。通過BP breakpoint model對數(shù)據(jù)進(jìn)行突變點(diǎn)檢驗(yàn),表明存在突變。有學(xué)者基于Perron (1989),總結(jié)出斷點(diǎn)數(shù)據(jù)四種基本模型:
1 無趨勢的偏移的突變結(jié)構(gòu):
2 有趨勢的偏移突變結(jié)構(gòu):
3 有趨勢的偏移及趨勢突變結(jié)構(gòu):
4 有趨勢的趨勢突變結(jié)構(gòu):
借用Eviews9,基于以上四個(gè)基本模型對數(shù)據(jù)進(jìn)行包含突變的單位根檢驗(yàn),其結(jié)果如圖(2)。檢驗(yàn)假設(shè)為數(shù)據(jù)存在單位根,而P值表明數(shù)據(jù)拒絕原假設(shè),R表明解釋程度較好。
圖(2)
將數(shù)據(jù)導(dǎo)入ARIMA模型,由于數(shù)據(jù)通過單位根檢驗(yàn),可以將ARIMA模型退化成ARMA模型考慮。進(jìn)行自相關(guān)檢驗(yàn)(ACF)及偏自相關(guān)檢驗(yàn)(PACF)。圖(3)為檢驗(yàn)結(jié)果。
圖(3)
根據(jù)圖形所示,結(jié)合一般性經(jīng)驗(yàn),估計(jì)ARMA模型的(p,q)值為(1,0),從而ARMA模型退化為AR(1)模型。將數(shù)據(jù)引入并計(jì)算。
最后進(jìn)行傳統(tǒng)ARIMA模型預(yù)測,由于數(shù)據(jù)無法通過ADF檢驗(yàn),ARIMA最后取值為(3,1,3)。圖(4)為兩次檢驗(yàn)結(jié)果。從結(jié)果可以看出整體預(yù)測差異不大。
圖(4)
在美國進(jìn)出口總額實(shí)例分析中,由于考慮包含突變的單位根檢驗(yàn),簡化了原有ARIMA模型,將原有ARIMA(3,1,3)模型退化為AR(1)。同時(shí)將結(jié)果對比也較滿意。在此方法推廣時(shí)也應(yīng)該注意到,目前研究對同時(shí)處理多個(gè)突變點(diǎn)結(jié)果不是非常理想,可以考慮分段式處理方法。但是分段式本身也加大了模型的處理復(fù)雜程度與本文初衷相反。所以本文涉及的處理方法尚有不足之處,有一定的局限性。
參考文獻(xiàn):
[1 ]Box, George; Jenkins, Gwilym (1970). Time Series Analysis: Forecasting and Control.
[2] Pierre Perron(2006).Dealing with Structural Breaks.
[3] Jushan Bai and Pierre Perron(1998).Estimating and Testing Linear Models with Multiple Structural Changes.
[4] Jushan Bai and Pierre Perron(2003).COMPUTATION AND ANALYSIS OF MULTIPLE STRUCTURAL-CHANGE MODELS
[5] 王琨,滕建州,石凱,(2012) 中國宏觀經(jīng)濟(jì)和金融總量的非線性研究
[6] 李子奈,周建,(2005) 宏觀經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)結(jié)構(gòu)變化分析及其對中國的實(shí)證
作者簡介:牛睿,中國人大學(xué)經(jīng)濟(jì)學(xué)院實(shí)驗(yàn)室,實(shí)驗(yàn)室(中級)。