萬 潔
(濟(jì)南鐵路局 日照站,山東 日照 276826)
通過鐵路旅客周轉(zhuǎn)量預(yù)測(cè)客運(yùn)量是鐵路旅客運(yùn)輸組織工作的重要基礎(chǔ)和主要依據(jù)之一。客運(yùn)量短期預(yù)測(cè)主要是以一段時(shí)間內(nèi)月度甚至日客運(yùn)量的變化為出發(fā)點(diǎn),研究短期內(nèi)的客運(yùn)量變化情況。短期客運(yùn)量是一個(gè)存在季節(jié)和周期變化趨勢(shì)、并存在一定增長(zhǎng) (或降低) 趨勢(shì)的非平穩(wěn)時(shí)間序列,為此分別運(yùn)用ARIMA和Holt-Winters這兩種典型時(shí)間序列預(yù)測(cè)模型,對(duì)我國(guó)2004—2008年鐵路旅客周轉(zhuǎn)量的月度數(shù)據(jù)進(jìn)行擬合,在此基礎(chǔ)上對(duì)2009年的月度數(shù)據(jù)進(jìn)行預(yù)測(cè),并與2009年各月份的旅客周轉(zhuǎn)量實(shí)際值進(jìn)行比較,分析兩種模型預(yù)測(cè)的優(yōu)劣。
ARIMA (Autoregressive Moving Average) 模型即自回歸移動(dòng)平均模型,適用于各種領(lǐng)域的時(shí)間序列分析,由博克斯—詹金斯 (Box-Jenkins) 于1976年提出,其建模思想是將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,構(gòu)成該時(shí)序的單個(gè)序列雖然具有不確定性,但整個(gè)序列的變化卻有一定的規(guī)律性。
ARIMA( p,q) 模型包含一個(gè)自回歸模型和一個(gè)移動(dòng)平均模型。如果該時(shí)間序列 ut只有通過d 階差分后才能夠達(dá)到平穩(wěn),則模型成為ARIMA ( p,d,q) 模型;若同時(shí)還具有周期性變化的特點(diǎn),那么該時(shí)間序列就為帶有季節(jié)性的自回歸移動(dòng)平均序列。
p 階自回歸模型記作AR(p),滿足下面的方程:
式中:ut為時(shí)間序列,t =1,2,…,T;參數(shù)c為常數(shù);φ1,φ2,…,φp為自回歸模型系數(shù);p為自回歸模型階數(shù);εt是均值為0,方差為σ2的白噪聲序列。
q階移動(dòng)平均模型記作MA(q) ,滿足下面的方程:
式中:ut為時(shí)間序列,t =1,2,…,T;參數(shù) μ 為常數(shù);θ1, θ2,…, θq為 q 階移動(dòng)平均模型的系數(shù);εt是均值為0,方差為 σ2的白噪聲序列。
ARIMA (p,q) 模型包括了一個(gè)自回歸模型AR( p)和一個(gè)移動(dòng)平均模型MA(q) ,方程為:
式中的參數(shù)同式⑴和式⑵。博克斯—詹金斯提出了具有廣泛影響的建模思想,可分為4個(gè)步驟:平穩(wěn)化處理;模型的識(shí)別;參數(shù)估計(jì)檢驗(yàn);預(yù)測(cè)應(yīng)用。
下面利用ARIMA模型,對(duì)我國(guó)鐵路2004—2008年月度旅客周轉(zhuǎn)量數(shù)據(jù)進(jìn)行建模、擬合,并對(duì)2009年的數(shù)據(jù)進(jìn)行預(yù)測(cè)。
1.3.1 平穩(wěn)化處理
應(yīng)用ARIMA模型對(duì)時(shí)間序列建模進(jìn)行預(yù)測(cè),是建立在原始序列是平穩(wěn)隨機(jī)序列的基礎(chǔ)上的。平穩(wěn)時(shí)間序列的直觀含義是序列不存在周期性和趨勢(shì)性變動(dòng),而實(shí)際工作中的時(shí)間序列往往具有周期性和趨勢(shì)性變動(dòng),需要將其轉(zhuǎn)變?yōu)槠椒€(wěn)時(shí)間序列,即序列平穩(wěn)化處理。差分是序列平穩(wěn)化最常用的方法,而檢驗(yàn)序列平穩(wěn)與否的最常用和有效的方法為ADF (Augmented Dickey-Fuller) 單位根檢驗(yàn)。
表1 2004—2008年我國(guó)鐵路旅客周轉(zhuǎn)量 億人.km
從表1可以看出,隨時(shí)間的變化,我國(guó)鐵路旅客周轉(zhuǎn)量的月度數(shù)據(jù)[1]序列 ( pt) 呈現(xiàn)緩慢上升趨勢(shì)和季節(jié)周期波動(dòng) (周期為12個(gè)月,每年1—2月份和7—9月份旅客周轉(zhuǎn)量達(dá)到高峰)。為了消除趨勢(shì)同時(shí)減少序列的波動(dòng),首先對(duì)原始序列pt做一階差分,生成序列dpt(其中:dpt=pt?pt?1)。
通過作dpt序列圖可以看出,dpt序列的趨勢(shì)基本消除,但季節(jié)性存在,因此對(duì)dpt序列再做一次周期間隔為12的季節(jié)差分,得到序列sdpt(其中:sdpt=dpt-dpt-12) 。sdpt的序列已經(jīng)看不出季節(jié)性的痕跡。
對(duì)sdpt作ADF單位根檢驗(yàn),如表2所示。
檢驗(yàn)結(jié)果說明,sdpt序列已經(jīng)平穩(wěn),因而可以用于建模。
表2 對(duì) sdpt 序列進(jìn)行ADF單位根檢驗(yàn)的結(jié)果
1.3.2 模型的識(shí)別
在建模時(shí),需要利用自相關(guān)系數(shù)和偏自相關(guān)系數(shù)去識(shí)別ARIMA ( p,q) 模型。MA (q) 模型的自相關(guān)函數(shù)是 q 階截尾的,而AR ( p) 模型的偏自相關(guān)系數(shù)是 p 階截尾的。根據(jù)sdpt序列的相關(guān)圖可以得出sdpt偏自相關(guān)系數(shù)2階后截尾,因此取p =2,而自相關(guān)系數(shù)1階后截尾,因此取q =1,由于進(jìn)行了一次一階差分,所以可以建立ARIMA (2,1,1) 模型,另外還要考慮季節(jié)差分的因素。
1.3.3 參數(shù)估計(jì)及檢驗(yàn)
利用Eviews6.0軟件對(duì)模型進(jìn)行擬合,可以得到表3中各系數(shù)的估計(jì)值和整個(gè)模型的檢驗(yàn)結(jié)果。從表3可以看出,模型各參數(shù)的估計(jì)值都通過了t 檢驗(yàn),而且整個(gè)模型調(diào)整的R2統(tǒng)計(jì)量為0.723,F(xiàn)統(tǒng)計(jì)量為37.554,D.W.值為2.33,也較為滿意,模型殘差的自相關(guān)圖和偏自相關(guān)圖也顯示殘差為平穩(wěn)序列,說明模型很好地?cái)M合了2004—2008年我國(guó)鐵路旅客周轉(zhuǎn)量的月度數(shù)據(jù)。
1.3.4 預(yù)測(cè)
經(jīng)過模型識(shí)別、參數(shù)估計(jì)、模型檢驗(yàn)以后,得到一個(gè)較好的模型,即可進(jìn)行預(yù)測(cè)。在利用模型進(jìn)行預(yù)測(cè)時(shí),當(dāng)然希望預(yù)測(cè)誤差盡可能的小,最優(yōu)的預(yù)測(cè)是具有最小均方預(yù)測(cè)誤差的預(yù)測(cè)。利用ARIMA模型預(yù)測(cè)的2009年1—12月鐵路旅客周轉(zhuǎn)量的預(yù)測(cè)結(jié)果及誤差見表4。
表3 ARIMA(2,1,1)模型的參數(shù)估計(jì)結(jié)果
表4 我國(guó)2009年鐵路旅客周轉(zhuǎn)量預(yù)測(cè)值及誤差
Holt-Winters模型[2]為指數(shù)平滑方法的一種,包括無季節(jié)模型和基于加法的季節(jié)模型,以及基于乘法的季節(jié)模型。由于鐵路客運(yùn)的月度數(shù)據(jù)均具有季節(jié)性,在此利用基于加法的季節(jié)模型和基于乘法的季節(jié)模型進(jìn)行預(yù)測(cè)。
基于加法的Holt-Winters季節(jié)模型適用于具有線性時(shí)間趨勢(shì)和加法模型的序列。時(shí)間序列 yt平滑后的序列 y't由下式給出:
式中:a表示截距;b表示趨勢(shì);c為加法模型的季節(jié)因子;t = 1,2,…,T;k 為向后平滑期數(shù),k > 0。
a,b,c的計(jì)算公式如下。
式中:α,β,γ為阻尼因子,在0~1之間;s 表示季節(jié)周期的長(zhǎng)度,對(duì)于月度數(shù)據(jù) s =12。
預(yù)測(cè)值由下式計(jì)算:
基于乘法的Holt-Winters季節(jié)模型適用于具有線性時(shí)間趨勢(shì)及乘法模型的序列。時(shí)間序列 yt平滑后的序列 y't由下式給出:
式中:a表示截距;b表示趨勢(shì);c為乘法模型的季節(jié)因子;t =1,2,…,T;k 為向后平滑期數(shù),k >0。
a,b,c的計(jì)算公式如下。
式中:α,β,γ 為阻尼因子,在0~1之間;s 表示季節(jié)周期的長(zhǎng)度,對(duì)于月度數(shù)據(jù) s =12。
預(yù)測(cè)值由下式計(jì)算:
利用Eviews6軟件,分別選擇基于乘法和加法的Holt-Winters季節(jié)模型,利用2004—2008年的鐵路月度旅客周轉(zhuǎn)量數(shù)據(jù)對(duì)2009年1—12月的數(shù)據(jù)進(jìn)行預(yù)測(cè)。在預(yù)測(cè)時(shí),Holt-Winters季節(jié)模型的 3 個(gè)平滑系數(shù) a,β 和 γ 采用系統(tǒng)自定方式產(chǎn)生。利用基于加法和基于乘法的Holt-Winters季節(jié)模型預(yù)測(cè)的2009年1—12月鐵路旅客周轉(zhuǎn)量的預(yù)測(cè)結(jié)果及誤差見表4,其中:預(yù)測(cè)誤差=︱預(yù)測(cè)值-實(shí)際值︱/實(shí)際值×100%。
ARIMA模型和Holt-Winters模型都屬于短期預(yù)測(cè)模型,隨著時(shí)間的推移,它們的預(yù)測(cè)效果也會(huì)逐漸變差。針對(duì)以上案例的鐵路旅客周轉(zhuǎn)量的短期預(yù)測(cè),Holt-Winters 模型較ARIMA模型具有一定的優(yōu)勢(shì),其原因可能在于Holt-Winters 模型所給出平滑參數(shù)可以采用系統(tǒng)自定的方法,系統(tǒng)通過多次比較給出的參數(shù)值往往是最優(yōu)的。從實(shí)際操作過程發(fā)現(xiàn),Holt-Winters 模型簡(jiǎn)便,而ARIMA模型的建模過程較為繁瑣,而且在 p 和 q 的選擇上存在著多種評(píng)判標(biāo)準(zhǔn)。
由于以上所采用的數(shù)據(jù)是全國(guó)范圍的旅客周轉(zhuǎn)量數(shù)據(jù),而且受經(jīng)濟(jì)危機(jī)的影響,近期旅客運(yùn)輸量出現(xiàn)了較大的波動(dòng),而這兩種預(yù)測(cè)方法都只是從序列本身出發(fā),不考慮其他經(jīng)濟(jì)社會(huì)因素的影響,因此預(yù)測(cè)的誤差較大。所以,各級(jí)旅客運(yùn)輸組織在對(duì)客運(yùn)量做短期預(yù)測(cè)時(shí),應(yīng)適當(dāng)?shù)乜紤]影響客運(yùn)量波動(dòng)的因素,以提高預(yù)測(cè)的準(zhǔn)確性。
[1] 鐵道部統(tǒng)計(jì)中心. 全國(guó)鐵路主要指標(biāo)完成情況[EB/OL].[2009-11-02]http://www.china-mor.gov.cn/zwgk/zwgk_tjxx.html.
[2] 高鐵梅. 計(jì)量經(jīng)濟(jì)分析方法與建模[M]. 北京:清華大學(xué)出版社,2006.