冷 彪,曾加貝
(1.北京航空航天大學(xué) 計(jì)算機(jī)學(xué)院,北京 100191;2.北京航空航天大學(xué)深圳研究院,廣東 深圳 518057)
2011年,北京市地鐵路網(wǎng)日均客運(yùn)量為 598萬(wàn)人次,占全市公交運(yùn)輸?shù)?35%。預(yù)計(jì)到 2015年日均客運(yùn)量將增至 1 000萬(wàn)人次。因此,分析、預(yù)測(cè)和掌握北京地鐵客流實(shí)時(shí)數(shù)據(jù),為線路和車站的客流組織與優(yōu)化提供數(shù)據(jù)支撐,提高地鐵規(guī)劃、設(shè)計(jì)和建設(shè)的科學(xué)決策水平,提高運(yùn)營(yíng)管理決策的實(shí)時(shí)性和高效性,進(jìn)而提高北京地鐵的運(yùn)營(yíng)服務(wù)水平和運(yùn)營(yíng)效率具有重要意義。
目前,北京地鐵采用全網(wǎng)一票通和一卡通無(wú)障礙換乘機(jī)制,自動(dòng)售檢票系統(tǒng)僅能獲取乘客的 OD(Origin-destination) 數(shù)據(jù),即進(jìn)出站數(shù)據(jù),無(wú)法獲取乘客的換乘信息。由于相同進(jìn)站和出站之間有多種出行線路,僅根據(jù)乘客的 OD 數(shù)據(jù)無(wú)法確定其具體出行方案,因此必須采用北京市軌道交通清分管理中心清分方法[1]才能詳細(xì)分析北京軌道交通路網(wǎng)中的詳細(xì)客流數(shù)據(jù),包括換乘站的換乘客流和車站的站內(nèi)客流等。由于大部分客流預(yù)測(cè)方法不具備北京地鐵票卡清分的特點(diǎn),而只能利用乘客的 OD 數(shù)據(jù)對(duì)車站的進(jìn)站和出站客流量進(jìn)行預(yù)測(cè),此類算法稱做面向車站的客流預(yù)測(cè)模型。這類預(yù)測(cè)模型主要包括基于線性系統(tǒng)理論的預(yù)測(cè)方法、基于非線性系統(tǒng)理論的預(yù)測(cè)方法和基于組合模型的預(yù)測(cè)方法。其中,基于線性系統(tǒng)理論的預(yù)測(cè)方法計(jì)算較簡(jiǎn)單,但對(duì)于較復(fù)雜的交通系統(tǒng),其預(yù)測(cè)效果不甚理想?;诜蔷€性系統(tǒng)理論的預(yù)測(cè)方法體現(xiàn)了交通系統(tǒng)的非線性特點(diǎn),準(zhǔn)確性相對(duì)較高,但計(jì)算復(fù)雜度高,理論基礎(chǔ)尚不成熟。面向路網(wǎng)的客流預(yù)測(cè)模型因具備地鐵票卡清分的特點(diǎn),利用實(shí)時(shí) OD 數(shù)據(jù)不僅能對(duì)車站的出站客流進(jìn)行預(yù)測(cè),而且還能對(duì)換乘車站的換乘客流和站內(nèi)客流進(jìn)行預(yù)測(cè)。
主要有3種面向車站的客流預(yù)測(cè)方法:歷史平均預(yù)測(cè)法、基于最小二乘支持向量機(jī)時(shí)間序列預(yù)測(cè)法和分峰段混合預(yù)測(cè)法。這3類方法僅能利用 OD數(shù)據(jù)對(duì)車站進(jìn)站客流和出站客流進(jìn)行預(yù)測(cè)。
1.1.1 歷史平均預(yù)測(cè)法
歷史平均預(yù)測(cè)法屬于基于線性系統(tǒng)理論的預(yù)測(cè)方法,其主要是利用歷史 OD 數(shù)據(jù)計(jì)算平均值,計(jì)算的復(fù)雜度較低。
設(shè)時(shí)間序列為{Xt}={Xt-p,Xt-p+1,…,Xt-1},其觀測(cè)序列為{xt}={xt-p,xt-p+1,…,xt-1},并且 p=mn,其中:p 表示歷史時(shí)間序列里共有 p個(gè)點(diǎn),周期為 n,歷史時(shí)間序列中共有 m個(gè)周期。則 xi的預(yù)測(cè)值 yt為:
1.1.2 基于最小二乘支持向量機(jī)時(shí)間序列預(yù)測(cè)法
基于最小二乘支持向量機(jī)時(shí)間序列預(yù)測(cè)法屬于基于非線性系統(tǒng)理論的預(yù)測(cè)方法,其通過(guò)訓(xùn)練學(xué)習(xí)歷史 OD 數(shù)據(jù),調(diào)整模型中的核心參數(shù),但計(jì)算復(fù)雜度較高。
非線性自回歸模型為:
式中:yt?R;xt?Rn是回歸向量[yt-1,yt-2,…,yt-p];貝葉斯項(xiàng) b?R;ω?Rnh是未知高維系數(shù)向量。函數(shù)映射φ:Rn→Rnh將原始的輸入向量 xt映射成一個(gè)高維向量 φ(xt)?Rnh。
約束優(yōu)化問(wèn)題使用的成本函數(shù)[2]為:
式中:γ 為規(guī)范化常數(shù)。約束優(yōu)化問(wèn)題可應(yīng)用拉格朗日算子計(jì)算,最終解可表述為:
最小二乘法支持向量機(jī)[2]的訓(xùn)練過(guò)程,主要包括選擇核參數(shù)、規(guī)范化常數(shù) γ 和回歸量。在研究中用 10 倍交叉驗(yàn)證核參數(shù)和規(guī)范化常數(shù)。回歸量的選擇需大量樣本信息,在交叉驗(yàn)證的基礎(chǔ)上,用貪心算法剔除無(wú)用的延遲信息。在每次貪心算法的剔除信息階段,如果回歸的交叉驗(yàn)證均方誤差增加,則剔除該回歸量。
1.1.3 分峰段混合預(yù)測(cè)法
分峰段混合預(yù)測(cè)法主要根據(jù)地鐵客流出行峰段的特點(diǎn),將歷史平均預(yù)測(cè)法和基于最小二乘支持向量機(jī)時(shí)間序列預(yù)測(cè)法相結(jié)合,屬于組合模型預(yù)測(cè)方法。通過(guò)對(duì)歷史OD數(shù)據(jù)進(jìn)行分析,歷史平均預(yù)測(cè)法在客流量較小時(shí)準(zhǔn)確度較高,而最小二乘支持向量機(jī)方法對(duì)客流量大時(shí)具有較高的準(zhǔn)確度。因此,可以根據(jù)北京地鐵客流出行峰段將兩種方法結(jié)合進(jìn)行混合預(yù)測(cè)。設(shè)某項(xiàng)客流信息歷史 t 天的時(shí)間序列為:
其中,每天有 n 項(xiàng),即周期為 n。則第 t+1天的全天預(yù)測(cè)值為{ ytn+p},p=1,2,…,n。
式中:Pe1為早低峰和晚低峰;Pe2為早高峰、平峰和晚高峰為最小二乘支持向量機(jī)的預(yù)測(cè)函數(shù)。
基于概率樹(shù)全路網(wǎng)預(yù)測(cè)方法的核心是以北京地鐵票卡清分方法為基礎(chǔ),根據(jù)乘客 OD 數(shù)據(jù)中進(jìn)站位置和時(shí)間信息,預(yù)測(cè)其出站位置和時(shí)間。全路網(wǎng)的客流預(yù)測(cè)模型利用古典概率方法,統(tǒng)計(jì)分析學(xué)習(xí)歷史 OD 數(shù)據(jù)的進(jìn)出站位置特點(diǎn),為指定時(shí)間段每一車站建立出站概率樹(shù),用于預(yù)測(cè)查詢。下面介紹概率樹(shù)的生成方法及預(yù)測(cè)出站位置的查詢方法,詳細(xì)內(nèi)容參考文獻(xiàn)[3]。
1.2.1 概率樹(shù)
概率樹(shù)的每個(gè)節(jié)點(diǎn) n 都有一個(gè)屬性值,可稱之為節(jié)點(diǎn)概率 pn,即節(jié)點(diǎn) n 以概率 pn被選中。二叉樹(shù)中的每個(gè)非葉節(jié)點(diǎn) n 含有一個(gè)屬性,為分叉概率qn,qn決定下一步是查詢節(jié)點(diǎn) n 的左子樹(shù)還是右子樹(shù)。葉節(jié)點(diǎn)指向一個(gè)位置站,并且沒(méi)有分叉概率。
對(duì)于一個(gè)給定的位置站 sO,乘客從sO進(jìn)站,可能的出站位置為集合 SD:
抵達(dá)每個(gè)出站位置的概率集合為 PD:
生成概率樹(shù)的原則是被選擇的概率越大,則該出站位置所在的深度越小。
1.2.2 預(yù)測(cè)算法
已知概率樹(shù)T(t,sO),可預(yù)測(cè)出站位置SD。出站時(shí)間則需要根據(jù)進(jìn)站位置、進(jìn)站時(shí)間、出站位置及選擇的有效路徑 path0,模擬乘客進(jìn)站、等車、上車、下車、換乘、出站等,從而算出其出站時(shí)間,可描述為tD=M (sO,tO,sD,path0)。
以 2009年11月25日—2010年1月20日的9個(gè)星期三的北京地鐵歷史客流 OD 數(shù)據(jù)和票卡清分?jǐn)?shù)據(jù)為基礎(chǔ),利用歷史平均預(yù)測(cè)法、基于最小二乘支持向量機(jī)時(shí)間序列預(yù)測(cè)法、分峰段混合預(yù)測(cè)法,以及基于概率樹(shù)全路網(wǎng)預(yù)測(cè)模型等方法對(duì)西單和國(guó)貿(mào)兩個(gè)典型車站在 2010年1月27日的進(jìn)站客流、出站客流、換乘客流和站內(nèi)客流進(jìn)行預(yù)測(cè)。
采用國(guó)際通用的預(yù)測(cè)評(píng)判標(biāo)準(zhǔn)相對(duì)平均誤差(RME) 和均方誤差 (MSE) 對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析:
式中:xi為實(shí)際值;?ix為預(yù)測(cè)值;N 為預(yù)測(cè)時(shí)間點(diǎn)個(gè)數(shù)。
首先,利用4種預(yù)測(cè)方法對(duì)西單和國(guó)貿(mào)站進(jìn)站客流和出站客流進(jìn)行預(yù)測(cè)。對(duì)整體預(yù)測(cè)結(jié)果的分析如表1所示,表2詳細(xì)描述了多種預(yù)測(cè)方法對(duì)國(guó)貿(mào)站 8:00—9:00 早高峰出站客流的預(yù)測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明,在面向車站的客流預(yù)測(cè)模型中,分峰段混合預(yù)測(cè)法能較好地根據(jù)歷史OD 數(shù)據(jù)對(duì)車站的進(jìn)出站客流進(jìn)行預(yù)測(cè),并優(yōu)于面向全路網(wǎng)的客流預(yù)測(cè)方法。
由于面向車站的客流預(yù)測(cè)模型無(wú)法利用 OD 客流數(shù)據(jù)對(duì)換乘車站的換乘客流進(jìn)行預(yù)測(cè),故僅利用面向全路網(wǎng)的客流預(yù)測(cè)模型對(duì)西單和國(guó)貿(mào)站的換乘客流進(jìn)行客流預(yù)測(cè),其整體預(yù)測(cè)結(jié)果如表3所示,表4描述了平峰時(shí)段對(duì)西單站換乘客流的預(yù)測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明,由于早高峰、平峰和晚高峰3個(gè)時(shí)間段的換乘客流比較集中,此3個(gè)峰段的預(yù)測(cè)結(jié)果優(yōu)于其他峰段。
表1 西單和國(guó)貿(mào)站進(jìn)站和出站客流預(yù)測(cè)結(jié)果
表2 國(guó)貿(mào)站早高峰出站客流的預(yù)測(cè)結(jié)果
利用基于概率樹(shù)全路網(wǎng)預(yù)測(cè)方法對(duì)西單和國(guó)貿(mào)站的站內(nèi)客流量進(jìn)行預(yù)測(cè),由于國(guó)貿(mào)站的客流量比西單站大,因此該方法對(duì)國(guó)貿(mào)站的站內(nèi)客流量的預(yù)測(cè)結(jié)果比西單站精準(zhǔn),RME 為12.66%,如圖1所示,西單站的預(yù)測(cè)結(jié)果 RME 為 25.81%。
通過(guò)對(duì)西單和國(guó)貿(mào)站客流預(yù)測(cè)結(jié)果的研究,可以看出針對(duì)車站的進(jìn)出站客流預(yù)測(cè),分峰段混合預(yù)測(cè)法具有較好的預(yù)測(cè)結(jié)果。針對(duì)車站的換乘客流和站內(nèi)客流,面向車站的預(yù)測(cè)模型因不具備北京地鐵票卡清分的特點(diǎn),故無(wú)法進(jìn)行相關(guān)的客流預(yù)測(cè),而只有面向全路網(wǎng)的預(yù)測(cè)模型能解決相應(yīng)的客流預(yù)測(cè)問(wèn)題,且基于概率樹(shù)全路網(wǎng)預(yù)測(cè)方法能利用實(shí)時(shí)OD 數(shù)據(jù)進(jìn)行準(zhǔn)確的換乘客流和站內(nèi)客流預(yù)測(cè)。由此可見(jiàn),分峰段混合預(yù)測(cè)法和基于概率樹(shù)全路網(wǎng)預(yù)測(cè)方法能根據(jù)北京地鐵的特點(diǎn),對(duì)車站內(nèi)各種客流量進(jìn)行預(yù)測(cè),針對(duì)性強(qiáng)。
表3 基于概率樹(shù)全路網(wǎng)預(yù)測(cè)方法的西單和國(guó)貿(mào)站換乘客流預(yù)測(cè)結(jié)果 %
表4 基于概率樹(shù)全路網(wǎng)預(yù)測(cè)方法的西單站平峰換乘客流預(yù)測(cè)結(jié)果
圖1 基于概率樹(shù)全路網(wǎng)預(yù)測(cè)方法國(guó)貿(mào)站的站內(nèi)客流預(yù)測(cè)曲線圖
[1]北京市軌道交通指揮中心. 北京市軌道交通清分管理中心清分方法研究[R]. 北京:北京市軌道交通指揮中心,2007.
[2]M. Espinoza,T. Falck,Johan A. K. Suykens,et al. Time Series Prediction Using LS-SVMs [C]// Proceedings of the European Symposium on Time Series Prediction. Espoo:Multiprint Oy/ Otamedia, 2008:187-196.
[3]曾加貝. 軌道交通客流預(yù)測(cè)與疏散建模研究[D]. 北京:北京航空航天大學(xué),2011.