吳 婷 蔣陽(yáng)升 丁 笑 鄭世琦
(1.貴陽(yáng)職業(yè)技術(shù)學(xué)院軌道交通分院,550081,貴陽(yáng); 2.西南交通大學(xué)交通運(yùn)輸與物流學(xué)院,610031,成都;3.西南交通大學(xué)綜合運(yùn)輸四川省重點(diǎn)實(shí)驗(yàn)室,610031,成都; 4.西南交通大學(xué)交通運(yùn)輸智能化國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室,610031,成都∥第一作者,助教)
?
城市軌道交通斷面客流不確定性分析的廣義自回歸條件異方差改進(jìn)模型*
吳 婷1,2,3,4蔣陽(yáng)升2,3,4丁 笑2,3,4鄭世琦2,3,4
(1.貴陽(yáng)職業(yè)技術(shù)學(xué)院軌道交通分院,550081,貴陽(yáng); 2.西南交通大學(xué)交通運(yùn)輸與物流學(xué)院,610031,成都;3.西南交通大學(xué)綜合運(yùn)輸四川省重點(diǎn)實(shí)驗(yàn)室,610031,成都; 4.西南交通大學(xué)交通運(yùn)輸智能化國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室,610031,成都∥第一作者,助教)
對(duì)比分析指出,城市軌道交通線(xiàn)路斷面客流量變化與道路交通斷面客流量變化具有相似性,但城市軌道交通線(xiàn)路斷面客流時(shí)間序列具備特有的尖峰厚尾特性,其變化的敏感程度依賴(lài)時(shí)空條件,常用于道路領(lǐng)域的廣義自回歸條件異方差(GARCH)模型無(wú)法直接用于城市軌道交通領(lǐng)域?;诖?引入廣義誤差分布(GED)虛變量,構(gòu)建改進(jìn)的GARCH模型,并基于成都地鐵1號(hào)線(xiàn)下行斷面客流時(shí)間序列數(shù)據(jù),借助EViews和Matlab軟件對(duì)改進(jìn)前后的模型效果進(jìn)行實(shí)證對(duì)比分析。結(jié)果表明,改進(jìn)后的虛變量GARCH模型比原始的GARCH模型具有更好的適用性。
城市軌道交通; 斷面客流; 不確定性; 虛變量; GARCH模型
First-author′s address Rail Transportation Branch,Guiyang Vocational and Technical College,550081,Guiyang,China
城市軌道交通線(xiàn)路斷面客流的預(yù)測(cè)是軌道交通編制行車(chē)工作計(jì)劃等運(yùn)營(yíng)決策的基礎(chǔ),但其預(yù)測(cè)精度常常難以保證。造成預(yù)測(cè)偏差的主要原因在于斷面客流具有時(shí)變性,且不同斷面對(duì)外部因素影響具有不同的敏感性,即客流變化的敏感程度具有強(qiáng)時(shí)空條件的依賴(lài)性[1]。因此,為提高線(xiàn)路斷面客流的預(yù)測(cè)精度,不僅需要掌握城市軌道交通線(xiàn)路斷面客流的平穩(wěn)狀態(tài),即其一階數(shù)字特征,而且更需要掌握斷面客流的不確定性狀態(tài),即其二階數(shù)字特征。它反映了斷面客流時(shí)間序列中不可預(yù)見(jiàn)的組成成分對(duì)客流產(chǎn)生的影響,用來(lái)衡量統(tǒng)計(jì)時(shí)段內(nèi)斷面客流平均狀態(tài)的波動(dòng)性。對(duì)于一階數(shù)字特征分析,文獻(xiàn)[2-6]的工作已經(jīng)比較完善;對(duì)于二階數(shù)字特征的分析主要是定性研究[7]。經(jīng)檢索,國(guó)內(nèi)外還沒(méi)有專(zhuān)門(mén)針對(duì)城市軌道線(xiàn)路斷面客流不確定性狀態(tài)的量化建模分析。
城市軌道交通線(xiàn)路斷面客流和道路交通流具有相似性,軌道交通各斷面的客流運(yùn)行情況類(lèi)似于道路各個(gè)路段行駛的車(chē)流,因此探討道路交通領(lǐng)域斷面客流的不確定性分析的研究現(xiàn)狀與趨勢(shì),以發(fā)現(xiàn)具有借鑒意義的分析方法,是一種有效的解決思路。
在道路交通領(lǐng)域,文獻(xiàn)[1]使用一階馬爾科夫鏈闡述交通流不確定性變化規(guī)律,基于隨機(jī)波動(dòng)理論(SV)建立速度的不確定性模型。文獻(xiàn)[8]將自回歸滑動(dòng)平均(ARMA)模型和廣義自回歸條件異方差(GARCH)模型結(jié)合,預(yù)測(cè)道路車(chē)輛行程時(shí)間及其不確定性,發(fā)現(xiàn)此模型對(duì)于嚴(yán)重?fù)頂D路段,預(yù)測(cè)性能較優(yōu)。文獻(xiàn)[9]發(fā)現(xiàn)運(yùn)用ARIMA(自回歸積分滑動(dòng)平均)模型與ARCH(自回歸條件異方差)模型組合預(yù)測(cè)交通流不確定性性能,要優(yōu)于標(biāo)準(zhǔn)的GARCH模型,其中,ARIMA模型預(yù)測(cè)高速公路斷面交通流的平均狀態(tài),ARCH模型預(yù)測(cè)交通流的方差。文獻(xiàn)[10]通過(guò)使用卡爾曼濾波方法實(shí)時(shí)處理GARCH模型,得到預(yù)測(cè)交通流量不確定性的置信區(qū)間,用同樣方法實(shí)時(shí)處理SARIMA(季節(jié)性差分自回歸移動(dòng)平均)模型得到交通流量和速度的平均預(yù)測(cè)值。此外,文獻(xiàn)[11]通過(guò)運(yùn)用似不相關(guān)回歸(SURE)模型,分別對(duì)出行者行程時(shí)間和出行者行程時(shí)間分布的標(biāo)準(zhǔn)差進(jìn)行預(yù)測(cè)后,指出需對(duì)不確定性性能作進(jìn)一步研究。
上述研究都是基于GARCH模型構(gòu)建斷面交通流狀態(tài)不確定性模型,并在此基礎(chǔ)上進(jìn)行流量預(yù)測(cè)。這是因?yàn)镚ARCH模型能把序列方差隨時(shí)間的變化情況呈現(xiàn)出來(lái)。但GARCH模型在城市軌道交通線(xiàn)路斷面客流不確定性分析中不能直接應(yīng)用,因?yàn)槌鞘熊壍澜煌〝嗝婵土髋c道路交通斷面客流存在著差異,具體表現(xiàn)為:①城市軌道交通更關(guān)注早晚高峰和平峰時(shí)段的客流波動(dòng)情況,以制定不同時(shí)段和線(xiàn)路區(qū)間的列車(chē)發(fā)車(chē)間隔等運(yùn)營(yíng)管理策略,城市軌道交通領(lǐng)域的模型需要能夠刻畫(huà)斷面客流在時(shí)間(所有數(shù)據(jù)集合下的不同子集)和空間(不同斷面)方面的敏感度;②城市軌道交通線(xiàn)路斷面客流具有區(qū)別于道路斷面客流的“尖峰厚尾”特征,文獻(xiàn)[12]也指出采用廣義誤差分布(GED)比正態(tài)分布更符合實(shí)際情況,更能提高該模型的擬合效果和預(yù)測(cè)能力。
基于上述分析,本文擬建立基于GED分布的虛變量GARCH模型,以描述軌道交通線(xiàn)路斷面客流的不確定性波動(dòng)特征。
[12],GARCH模型形式如下:
yt=xtβ+εt
(1)
(2)
式(1)、(2)中:
yt——一個(gè)帶有誤差項(xiàng)的外生變量函數(shù)的均值方程;
xt——外生變量;
α、β——參數(shù)值;
εt——普通最小二乘法殘差;
ht——εt的條件方差;
ω——常數(shù)項(xiàng)(均值);
p,q——模型的階數(shù)。
參考文獻(xiàn)[13],利用廣義誤差分布對(duì)GARCH模型進(jìn)行建模,其概率密度為:
(3)
式中:
x——隨機(jī)變量;
v——自由度,也是GED分布參數(shù);
Γ(?)——Gama函數(shù);
λ——尾部厚度參數(shù),且
(4)
該峰度計(jì)算公式為:
(5)
式中:
E(X)——樣本均值。
由式(5)可以看出,GED分布的形狀(即峰度)由尾部厚度參數(shù)λ決定,其值的大小直接影響GED分布的尾部厚度。所以,廣義誤差分布是一種綜合的、復(fù)雜的分布,能較好地描述時(shí)間序列具有非正態(tài)分布的“尖峰厚尾”特征[13]。
2.1 虛變量的定義
本文將模型中能夠被賦予具體數(shù)值的變量稱(chēng)為定量變量;不能賦予具體數(shù)值的變量稱(chēng)為定性變量。直接研究定性變量的影響具有一定的難度,因此本文通過(guò)設(shè)置虛變量將定性變量量化處理,使其和定量變量一樣在模型中得以應(yīng)用。
2.2 虛變量的設(shè)置
通常將虛變量取值為0和1,用D表示。D取值為1(0)時(shí),表示該變量具有(不具有)某種屬性。
2.3 虛變量GARCH模型
(6)
(7)
式中:
ai——q階移動(dòng)平均模型的系數(shù);
bj——p階自回歸模型的系數(shù);
ωi——反映序列波動(dòng)的平均水平;
αi——回報(bào)系數(shù),通過(guò)均值方程中誤差項(xiàng)平方的滯后來(lái)反映前期得到的波動(dòng)性信息;
βi——滯后系數(shù),反映方差對(duì)外部沖擊的記憶性。
2.4 基于GED分布的虛變量GARCH模型的運(yùn)用流程
運(yùn)用基于GED分布的虛變量GARCH模型進(jìn)行城市軌道交通線(xiàn)路斷面客流不確定性分析的步驟如下:
(1) 運(yùn)用EViews軟件計(jì)算各斷面對(duì)數(shù)差分化的相對(duì)客流增長(zhǎng)序列的基本統(tǒng)計(jì)量,驗(yàn)證該序列的“尖峰厚尾”特性,明確選取GED分布作為研究基礎(chǔ)的合理性。
(2) 識(shí)別時(shí)間序列的平穩(wěn)性和自相關(guān)性。如果序列的隨機(jī)過(guò)程是非平穩(wěn)的,則無(wú)法準(zhǔn)確地反映該序列的過(guò)去和未來(lái)。自相關(guān)性檢驗(yàn)主要是用來(lái)衡量不同序列隨時(shí)間變化時(shí)的相互關(guān)系,通過(guò)觀(guān)察序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)進(jìn)行判斷。
(3) 模型類(lèi)型和階數(shù)的識(shí)別,即確認(rèn)相應(yīng)ARMA模型中階數(shù)p和q的取值。
(4) 運(yùn)用對(duì)數(shù)極大似然估計(jì)得到模型中所有參數(shù)的估計(jì)值,并采用對(duì)數(shù)似然準(zhǔn)則(Log Likelihood準(zhǔn)則)、赤池信息準(zhǔn)則(AIC準(zhǔn)則)和施瓦茨準(zhǔn)則(SC準(zhǔn)則)進(jìn)行判斷,當(dāng)模型的對(duì)數(shù)似然值越大,同時(shí)AIC值和SC值越小時(shí),說(shuō)明模型估計(jì)越精確。具體技術(shù)流程如圖1所示。
圖1 技術(shù)流程圖
3.1 線(xiàn)路斷面客流增長(zhǎng)率基本特征分析
本文隨機(jī)選取2013年3月整月平穩(wěn)工作日(周二至周四)全日數(shù)據(jù)對(duì)成都市地鐵1號(hào)線(xiàn)下行斷面客流進(jìn)行分析。從地鐵開(kāi)始運(yùn)營(yíng)6:30起,每1 h提取1次數(shù)據(jù),直到當(dāng)晚23:30停止運(yùn)營(yíng)時(shí)止。為了對(duì)早晚高峰時(shí)段進(jìn)行分析,選取7:00—9:00為早高峰時(shí)段,17:00—19:00為晚高峰時(shí)段,其余為平峰。本文所指的斷面客流為成都市地鐵1號(hào)線(xiàn)16個(gè)站間的15個(gè)斷面客流。為便于分析說(shuō)明,1號(hào)線(xiàn)第一個(gè)斷面升仙湖—火車(chē)北站簡(jiǎn)寫(xiě)為S1,第二個(gè)斷面簡(jiǎn)寫(xiě)為S2,以此類(lèi)推。
因?yàn)镚ARCH模型只能運(yùn)用于平穩(wěn)數(shù)據(jù),而客流具有明顯的高低谷之分,所以本文使用對(duì)數(shù)差分化的相對(duì)客流增長(zhǎng)作為研究對(duì)象[1]。采取對(duì)數(shù)差分法的對(duì)數(shù)變換不僅能將增長(zhǎng)曲線(xiàn)轉(zhuǎn)化為線(xiàn)性趨勢(shì),而且進(jìn)一步消除了序列的非平穩(wěn)性。令Ri,t表示第i斷面第t時(shí)間段的客流量,則第i斷面第t時(shí)間段的客流對(duì)數(shù)增長(zhǎng)率Yi,t為Yi,t=lnRi,t-lnRi,t-1。
運(yùn)用軟件計(jì)算斷面客流增長(zhǎng)率的基本統(tǒng)計(jì)量,結(jié)果見(jiàn)表1。表中Jarque-Bera表示一種正態(tài)性檢驗(yàn),Prob表示伴隨概率。
由表1可知:從偏度看,所有客流的偏度系數(shù)均不為零,與正態(tài)分布相比具有明顯的厚尾性;峰度方面,客流的峰度最小值為9.053 7(S15),大于3,相較于正態(tài)分布均具有偏尖峰性,說(shuō)明所有斷面客流較正態(tài)分布偏離程度更大,出現(xiàn)大起大落的情況比較嚴(yán)重。此外,Jarque-Bera統(tǒng)計(jì)量的伴隨概率均為0,在95%的置信水平下,拒絕該時(shí)間序列為正態(tài)分布的假設(shè)。
表1 斷面客流增長(zhǎng)率基本統(tǒng)計(jì)量
3.2 斷面客流增長(zhǎng)率序列的基礎(chǔ)性檢驗(yàn)
3.2.1 平穩(wěn)性檢驗(yàn)
單位根(ADF)檢驗(yàn)結(jié)果如圖2和圖3所示。表中縱坐標(biāo)表示在不同顯著水平下的臨界值,橫坐標(biāo)為各斷面的檢驗(yàn)值。
圖2 各站斷面客流原序列ADF檢驗(yàn)
圖3 各站斷面客流差分序列ADF檢驗(yàn)
從圖2和圖3可以看出:各站斷面客流差分序列的ADF檢驗(yàn)統(tǒng)計(jì)量均小于對(duì)應(yīng)1%、5%、10%的臨界值,說(shuō)明其為平穩(wěn)序列。為便于后續(xù)分析,將所有斷面客流均轉(zhuǎn)化為其對(duì)數(shù)差分序列來(lái)進(jìn)行研究。
3.2.2 自相關(guān)檢驗(yàn)
表2為各斷面客流增長(zhǎng)率在不同滯后階數(shù)的自相關(guān)性檢驗(yàn)結(jié)果表。由表2可知,15個(gè)斷面客流的增長(zhǎng)率序列在自由度為10、15、20時(shí)的Q統(tǒng)計(jì)量均大于相應(yīng)的臨界值18.307、24.996、31.410。說(shuō)明在95%顯著水平下,拒絕該客流序列沒(méi)有自相關(guān)性的原假設(shè),存在顯著的序列自相關(guān)性。
表2 斷面客流增長(zhǎng)率自相關(guān)性檢驗(yàn)結(jié)果
3.3 虛變量GARCH模型實(shí)證結(jié)果分析
通過(guò)自相關(guān)檢驗(yàn)中觀(guān)察各斷面客流的自相關(guān)(ACF)可知,各斷面滿(mǎn)足低階模型,并經(jīng)反復(fù)試算和對(duì)比所得參數(shù),最終確定均值模型如表3所列。
表3 各斷面客流和換乘客流對(duì)數(shù)增長(zhǎng)率均值模型
續(xù)表3
運(yùn)用軟件Matlab編程實(shí)現(xiàn)參數(shù)估計(jì)和模型有效性檢驗(yàn),結(jié)果如表4、5、6所示。
表4 基于GED分布的虛變量GARCH(1,1)均值方程模型估計(jì)結(jié)果
表5 基于GED分布的虛變量GARCH(1,1)方差方程模型估計(jì)結(jié)果
表6 虛變量GARCH(1,1)擬合結(jié)果Ljung-Box Q檢驗(yàn)結(jié)果
由表6可知,所有斷面在不同階數(shù)的統(tǒng)計(jì)值均小于對(duì)應(yīng)的臨界值,且相應(yīng)伴隨概率均大于0.05,表明經(jīng)擬合后的殘差序列不具有相關(guān)性,另外方差方程中ωi、αi和βi值大于0,αi+βi<1,滿(mǎn)足模型的平穩(wěn)性要求,說(shuō)明該模型正確。
為了說(shuō)明該模型的優(yōu)越性,本文將原始GARCH模型與虛變量GARCH模型進(jìn)行對(duì)比,鑒于論文篇幅的限制,在此只列出模型評(píng)價(jià)參數(shù)AIC、SC和對(duì)數(shù)似然值,而原始GARCH模型的擬合結(jié)果可參考文獻(xiàn)[14],結(jié)果見(jiàn)表7。
一般對(duì)數(shù)似然值越大,模型越精確,而AIC值和SC值則越小越好。從表7可知:所有斷面客流基本是虛變量GARCH模型Log Likelihood值最大,AIC值和SC值最小(僅斷面4的原始GARCH模型的AIC值和SC較小)。雖然在斷面4中,其指標(biāo)不是最優(yōu),但是其值大小和其他模型相差不大,而該斷面的對(duì)數(shù)似然值卻遠(yuǎn)大于另兩個(gè)模型。所以,可以認(rèn)定虛變量GARCH模型具有更好的適用性。
表7 GARCH模型和虛變量GARCH模型指標(biāo)對(duì)比
本文建立了基于GED分布的虛變量GARCH模型用于描述城市軌道交通線(xiàn)路早晚高峰和平峰時(shí)段不同斷面的客流不確定性波動(dòng)?;诔啥嫉罔F1號(hào)線(xiàn)下行斷面客流數(shù)據(jù)的實(shí)證分析表明:改進(jìn)后的模型能夠更加適應(yīng)描述城市軌道交通線(xiàn)路斷面客流的尖峰厚尾特性和依賴(lài)時(shí)空條件的客流波動(dòng)敏感性。本文研究為今后繼續(xù)討論不同因素對(duì)不同斷面的影響程度奠定了基礎(chǔ)。
參考文獻(xiàn)
[1] TSEKERIS T,STATHOPOULOS A.Short-term prediction of urban traffic variability:Stochastic volatility modeling approach [J].Journal of Transportation Engineering,2010(7):606-613.
[2] 羅佳.城市軌道交通換乘站點(diǎn)客流敏感性分析[D].成都:西南交通大學(xué),2014.
[3] 孫松偉.城市軌道交通客流預(yù)測(cè)模型及方法研究[D].成都:西南交通大學(xué),2008.
[4] 楊冉.城市軌道交通客流預(yù)測(cè)及運(yùn)營(yíng)調(diào)度方法研究[D].北京:北京交通大學(xué),2010.
[5] 袁坤.城際軌道交通客流預(yù)測(cè)方法研究[D].西安:長(zhǎng)安大學(xué),2009.
[6] 吳倩.城市軌道交通客流預(yù)測(cè)模型研究[D].成都:西南交通大學(xué),2007.
[7] 郭平.城市軌道交通客流特征及預(yù)測(cè)相關(guān)問(wèn)題[J].城市軌道交通研究,2010(1):58-62.
[8] SOHN K,KIM D.Statistical model for forecasting link travel time variability [J].Journal of Transportation Engineering,2009,135(7):440-453.
[9] TSEKERIS T,STATHOPOULOS A.Real-time traffic recasting in urban arterial networks [J].Transportation Research Record:Journal of the Transportation Research Board,2006(1964):146-156.
[10] GUO J,WILLIAM B M.Real-time short-term traffic speed level forecasting and uncertainty quantification using layered kalman filters[J].Transportation Research Record,2010(2175):28-37.
[11] MARTCHOUK M,MANNERING F,BULLOCK D.Analysis of freeway travel time variability using Bluetooth detection [J].Journal of Transportation Engineering,2010,137(10):697-704.
[12] 高鐵梅.計(jì)量經(jīng)濟(jì)分析方法與建模[M].北京:清華大學(xué)出版社,2009.
[13] 丁祖琴.基于GED分布GARCH模型的Bayes統(tǒng)計(jì)分析[D].上海:華東師范大學(xué),2008.
[14] 吳婷.城市軌道交通斷面客流不確定性研究[D].成都:西南交通大學(xué),2015.
歡迎訂閱《城市軌道交通研究》 服務(wù)熱線(xiàn) 021—51030704
Improved GARCH Model in Urban Rail Transit Based on Uncertainty Analysis of Section Passenger Flow
WU Ting, JIANG Yangsheng, DING Xiao, ZHENG Shiqi
The variation of section passenger flow in urban rail transit is similar to that in road traffic through a comparative analysis. But the time series data of the former has peculiar characteristics of high kurtosis and fat tail, its sensitivity of variation depends on space-time condition.therefore,the GARCH model which is usually used in road traffic cannot be implemented directly in urban rail transit.For this reason,dummy variables are introduced to construct an improved GARCH model in this paper.Furthermore,based on the time series data of the downstream section passenger flow on Chengdu metro Line 1,the effects of models before and after improvement are comparative analyzed by using EViews and Matlab.The results show that the improved GARCH model with dummy variables has better applicability than that of the original GARCH model.
urban rail transit; section passenger flow; uncertainty; dummy variable; GARCH (generalized autoregressive conditional heteroskedasticity) model
*國(guó)家自然科學(xué)基金項(xiàng)目(51108391,71402149)
U 293.13
10.16037/j.1007-869x.2017.05.007
2016-06-24)