[摘 要] 本文通過研究一個具體的經(jīng)濟(jì)時間序列數(shù)據(jù),首先運(yùn)用Box-Jenkins方法進(jìn)行建模并給出結(jié)論,但通過模擬發(fā)現(xiàn)系數(shù)并不滿足通常的大樣本理論下的漸進(jìn)正態(tài)的結(jié)論,從而得出相應(yīng)結(jié)果不可信的結(jié)論,然后采用bootstrap方法進(jìn)行估計,得出可信的結(jié)論,并對于廣大科技工作者給出建議。本文的計算均由R軟件編程實(shí)現(xiàn)。
[關(guān)鍵詞] 時間序列 MA過程 R軟件 Bootstrap
數(shù)據(jù)為1952年~2005年我們歷年第三產(chǎn)業(yè)從業(yè)人數(shù)(百分比)數(shù)據(jù)。(數(shù)據(jù)來自國家統(tǒng)計局網(wǎng)站)
一、時間序列建模、估計和診斷
首先繪制原始的散點(diǎn)圖,顯然原數(shù)據(jù)不平穩(wěn),我們再繪制其增長率的時序圖:
可以看到,不平穩(wěn)的情況得到了很大的改善,因此,下面我們對我國第三產(chǎn)業(yè)從業(yè)人數(shù)的增長率進(jìn)行研究。我們考察其自相關(guān)和偏自相關(guān)圖:
我們可以看到,這個序列是一個MA(1)過程。進(jìn)行參數(shù)估計,我們用兩種估計方法,條件似然法CSS和精確似然法ML。結(jié)果見表1。
我們再對這兩個模型作殘差的自相關(guān)圖診斷。
我們可以看到,CSS和ML方法建立的模型的殘差均未顯示序列相關(guān),說明這兩個模型擬合的很好經(jīng)受住了檢驗(yàn)。因此得到最終擬合的模型:Xt為第三產(chǎn)業(yè)從業(yè)人數(shù)增長率:Xt=εt+0.4465εt-1,t=1,2,…,(CSS);Xt=ε+0.4645εt-1,t=1,2,…,(ML)。但是我們看到,兩個估計方法估計系數(shù)的置信區(qū)間均含0,這意味系數(shù)似乎應(yīng)顯著為0。那么這個結(jié)果可信嗎?需注意,時間序列的理論只是論證大樣本情形下,ARMA類模系數(shù)會漸進(jìn)正態(tài),但樣本量要大到何種程度時,才會漸進(jìn)正態(tài),這是不得而知的,也正因?yàn)槿绱?,我們通常估計的系?shù)的標(biāo)準(zhǔn)誤未必是可信的,況且,我們的樣本量不大(僅32個),因此,上面的結(jié)果是值得懷疑的。其實(shí),bootstrap方法的另一個吸引人之處是可幫助我們不必糾纏理論上的困惑而用大量的模擬得到我們的所需。
二、對時序數(shù)據(jù)模型標(biāo)準(zhǔn)誤的Bootstrap估計
對時序進(jìn)行bootstrap模擬前我們應(yīng)先檢驗(yàn)殘差的序列相關(guān)性。上面通過殘差的自相關(guān)圖已得知無序列相關(guān)存在。下面再對兩個模型殘差作Ljung-Box檢驗(yàn),以診斷是否殘差為白噪聲即是否存在序列相關(guān)。
可看到,模型擬合的很好,未拒絕殘差序列是白噪聲的原假設(shè),同自相關(guān)圖得出的結(jié)論一致。因此可以對這組數(shù)據(jù)進(jìn)行bootstrap。
下面采用采用參數(shù)bootstrap方法。首先有以下結(jié)論:定理:對于序列MA(1):Xt=εt+bεt-1,t=1,2,…,其中,當(dāng)N→∞時,時依分布收斂于正態(tài)分布。據(jù)此,構(gòu)造下述bootstrap算法:
1.從原始樣本中有放回抽樣若干次,這些樣本稱為bootstrap樣本;
2.用這些bootstrap樣本建立時序模型,并每次算出的標(biāo)準(zhǔn)誤;
3.計算所有的標(biāo)準(zhǔn)誤作為bootstrap估計的的標(biāo)準(zhǔn)誤
分別模擬1000,5000,10000次的結(jié)果列于下表并與理論值相比較:
注:筆者的電腦配置為Intel CPU1.73GHz,1G內(nèi)存,bootstrap10000次記錄的系統(tǒng)所需時間為31.86秒。
最后,再畫出基于CSS方法bootstrap10000次系數(shù)估計的QQ圖,此圖能準(zhǔn)確揭示系數(shù)分布的真實(shí)情形??梢钥吹剑诂F(xiàn)有的樣本量下系數(shù)并不漸進(jìn)服從正態(tài)分布,因此基于大樣本正態(tài)的推斷顯然不可信,而基于bootstrap方法估計的系數(shù)的標(biāo)準(zhǔn)誤和其置信區(qū)間才是我們的所選。