鮑 楓,汪 波,3,黃建玲,何志瑩
(1.北京市交通信息中心,北京市 1 00161;2.綜合交通運行監(jiān)測與服務(wù)北京市重點實驗室,北京市 1 00161;3.北京市交通委員會,北京市 1 00161)
軌道交通線網(wǎng)常乘客比例分析
鮑 楓1,2,汪 波1,2,3,黃建玲1,2,何志瑩1,2
(1.北京市交通信息中心,北京市 1 00161;2.綜合交通運行監(jiān)測與服務(wù)北京市重點實驗室,北京市 1 00161;3.北京市交通委員會,北京市 1 00161)
根據(jù)城市軌道交通常乘客比例數(shù)據(jù)的節(jié)假日特點,在消除常乘客比例數(shù)據(jù)的趨勢項的時候,引入表示節(jié)假日特征的虛擬變量,量化節(jié)假日因素對常乘客比例的影響,建立常乘客比例數(shù)據(jù)與時間、具有節(jié)假日特征的虛擬變量之間的回歸模型,達到同時消除趨勢項和節(jié)假日特征的影響的目的,掌握節(jié)假日對常乘客比例的影響規(guī)律。通過自相關(guān)和偏自相關(guān)函數(shù)對消除趨勢項和節(jié)假日因素的數(shù)據(jù)序列進行平穩(wěn)性和周期性分析,消除周期性特征影響。最后,構(gòu)建基于虛擬變量線性回歸和季節(jié)ARIMA的組合預(yù)測模型,修正了原有的季節(jié)ARIMA。以2015年3月2日到2016年3月27日之間56周的北京軌道交通日常乘客比例數(shù)據(jù)進行實例驗證,表明本文構(gòu)建的組合預(yù)測模型的精度高于原有的季節(jié)ARIMA模型。
軌道交通;常乘客比例;虛擬變量;回歸模型;修正季節(jié)ARIMA模型
城市軌道交通具有大容量、快速準點、安全高效等優(yōu)點,近年來客流量增長迅猛,使得軌道交通面臨著嚴重的擁擠問題,這給有關(guān)部門的運營組織管理工作提出了新的課題。魯放等[1]提出軌道交通常乘客的概念,定義為“經(jīng)常乘坐城市軌道交通出行,并熟練使用城市軌道交通,而且具備一定出行習(xí)慣的乘客”。常乘客的比例會受到假期、季節(jié)等因素的影響。本文以城市軌道交通一卡通使用量比例表征軌道交通線網(wǎng)常乘客比例,建立軌道交通線網(wǎng)常乘客比例預(yù)測模型,研究常乘客的比例變化趨勢,為軌道交通運營組織提供參考,提升軌道交通運輸服務(wù)水平。
統(tǒng)計期內(nèi)的軌道交通常乘客比例是按照時間順序取得的一系列軌道交通常乘客比例觀測值。這些觀測值形成時間序列。基于時間序列的預(yù)測理論的基本思想是時間序列的任一時刻的值與其前期數(shù)據(jù)相關(guān)。通過建立這種相關(guān)關(guān)系的模型在歷史數(shù)據(jù)的基礎(chǔ)上預(yù)測將來的未知數(shù)據(jù)[2-4]?,F(xiàn)實中的數(shù)據(jù)很多是非平穩(wěn)的時間序列,如股價序列、氣候變化等,George E.P.Box和 Gwilym M.Jenkins提出自回歸整合滑動平均模型(ARIMA)能解決非平穩(wěn)時間序列的處理問題。
在這種非平穩(wěn)的時間序列中,有些序列存在明顯的周期性變化。這種周期是由于季節(jié)性變化(包括季度、月度、周度等變化)或其他一些固有因素引起的。這類序列稱為季節(jié)性序列,如季度時間序列、月度時間序列、周度時間序列等。處理季節(jié)性時間序列只用以上介紹的方法是不夠的。描述這類序列的模型之一是季節(jié)時間序列模型(seasonal ARIMA model)用SARIMA表示,較早文獻也稱其為乘積季節(jié)模型(multiplicative seasonal model)。居民季度用煤消耗量、某地區(qū)的月降水量、居民日用水量、軌道交通日客運量、軌道交通日常乘客比例等屬于季節(jié)性時間序列。國內(nèi)已經(jīng)有很多文獻探討了季節(jié)ARIMA模型在各行業(yè)的應(yīng)用[5-8]。蔡昌俊等[9]基于城市軌道交通自動售檢票系統(tǒng)采集的進出站客流的歷史數(shù)據(jù),構(gòu)建了乘積ARIMA模型,實現(xiàn)對進出站客流量的精確預(yù)測;何九冉[10]構(gòu)建了城市軌道交通某運營線路平常日客流預(yù)測ARIMA-RBF組合模型。
除了利用ARIMA模型及組合模型研究軌道交通客流規(guī)律,李春曉等[11]提出一種基于廣義動態(tài)模糊神經(jīng)網(wǎng)絡(luò)(GD-FNN)的短時進站客流量預(yù)測方法,預(yù)測軌道交通車站每日分時進站量;王玉萍等[12]提出了包含可信度分析、客流特性分析、風(fēng)險性分析和敏感性分析在內(nèi)的城市軌道交通客流預(yù)測結(jié)果分析的結(jié)構(gòu)體系;郝勇[13]構(gòu)建了周客流日均量的回歸模型,測算上海地鐵周客流日均量趨勢值;徐瑞華等[14]研究了城市軌道交通線路客流分布的實時預(yù)測方法。但是在目前的研究中,時間序列的取值會受到節(jié)假日,例如元旦、春節(jié)、五一等的影響,如果只是使用差分方法,去除不了節(jié)假日的影響。
基于以上現(xiàn)狀,本文通過分析2015年3月2日到2016年3月27日之間56周的北京軌道交通日常乘客比例數(shù)據(jù),引入表示節(jié)假日特征的虛擬變量,通過建立回歸方程的形式,去除趨勢項和節(jié)假日影響因素,建立城市軌道交通常乘客比例修正季節(jié)ARIMA模型,掌握常乘客比例隨日期及節(jié)假日變化的規(guī)律,預(yù)測短期內(nèi)常乘客比例。
一般季節(jié)ARIMA模型通過逐步消除趨勢項、季節(jié)項,然后對得到的平穩(wěn)序列建立ARMA預(yù)測模型。但是在日時間序列數(shù)據(jù)中,數(shù)據(jù)值還會受到節(jié)假日的影響,例如元旦、春節(jié)、五一等,通過傳統(tǒng)的差分方法消除不了節(jié)假日的影響。本文提出引入表示節(jié)假日特征的虛擬變量,建立基于虛擬變量的線性回歸模型來消除趨勢項和節(jié)假日的影響,對來消除趨勢項和節(jié)假日的影響之后的序列再構(gòu)建季節(jié)ARIMA模型,最后得到基于虛擬變量線性回歸和季節(jié)ARIMA的組合預(yù)測模型,對原有的季節(jié)ARIMA模型進行修正。這種方法不需要人為的事先去除節(jié)假日的數(shù)據(jù),避免了缺失信息的產(chǎn)生,保證了數(shù)據(jù)信息的連續(xù)性,同時有利于掌握節(jié)假日對常乘客比例的影響規(guī)律。具體步驟:
第一步:建立城市軌道交通常乘客比例數(shù)據(jù)與連續(xù)變量和具有節(jié)假日特征的虛擬變量的回歸模型,見式(1):
式中:y為城市軌道交通常乘客比例數(shù)據(jù);a0為常數(shù)項;αi為第i個連續(xù)變量;ai為第i個連續(xù)變量的系數(shù);n為連續(xù)變量的個數(shù);βj為第j個節(jié)假日特征有序虛擬變量;bj為第j個節(jié)假日特征有序虛擬變量的系數(shù);m為節(jié)假日特征有序虛擬變量的個數(shù);γkh為第k個節(jié)假日特征無序虛擬變量的第h個啞元變量,如果某一節(jié)假日特征取值有Q(k)種情況,并且是無序的,應(yīng)引入Q(k)-1個表示這一特征的啞元變量;ckh為第k個節(jié)假日特征無序虛擬變量的第h個啞元變量的系數(shù);Q(k)為第k個節(jié)假日特征無序虛擬變量的取值個數(shù);P為節(jié)假日特征無序虛擬變量的個數(shù)。
第二步:進行m個節(jié)假日特征有序虛擬變量與p個節(jié)假日無序特征變量(γ11,γ12,…,γ1,Q(1)-1),(γ21,γ22,…,γ2,Q(2)-1)…,(γp1,γp2,…,γp,Q(p)-1)相互之間相關(guān)關(guān)系的檢驗,得到分別獨立的節(jié)假日特征虛擬變量的組合。
第三步:y分別與第二步得到的獨立的節(jié)假日特征虛擬變量的組合建立回歸方程,應(yīng)用最小二乘法得到參數(shù)組合,根據(jù)t檢驗、修正的R2、AIC、SC等檢驗規(guī)則,確定最優(yōu)回歸方程,從而確定a0、ai、bj、ckh等系數(shù)的估計值、、、,并對y進行預(yù)測,得到y(tǒng)的預(yù)測值,見式(2):
式中:P為季節(jié)自回歸階數(shù);Q為季節(jié)移動平均階數(shù);ΦP(BS)為季節(jié)P階自回歸算子;ΘQ(BS)為Q階移動平均算子。
第五步:結(jié)合式(2)和式(3),建立城市軌道交通常乘客比例數(shù)據(jù)組合預(yù)測模型,見式(4):
本節(jié)中,使用季節(jié)ARIMA方法(方法一)及修正后的基于虛擬變量線性回歸和季節(jié)ARIMA的組合預(yù)測模型(方法二,式(4))對城市軌道交通常乘客比例數(shù)據(jù)進行建模,并對比兩種方法的精確度,數(shù)據(jù)時間段為2015年3月2日到2016年3月27日之間56周的北京城市軌道交通常乘客比例數(shù)據(jù),共392個數(shù)據(jù)。
2.1 季節(jié)ARIMA方法(方法一)
根據(jù)北京城市軌道交通常乘客比例數(shù)據(jù)的特征,建立ARIMA(2,1,3)(1,1,1)7的模型。模型展開式見式(5):
利用式(5)預(yù)測2016年3月28日至4月4日(4月2日至4月4日為清明節(jié)假期)的日常乘客比例,結(jié)果見表1。
表1 方法一預(yù)測結(jié)果及誤差
2.2 基于虛擬變量線性回歸和季節(jié)ARIMA的組合預(yù)測模型(方法二,修正季節(jié)ARIMA模型)
2.2.1 模型建立
按照第1節(jié)描述的方法進行建模,引入表征節(jié)假日特征的有序和無序虛擬變量:
(1)表征節(jié)假日長短的虛擬變量β1:此虛擬變量為有序分類變量,所以取值用0,1,2來表示。0表示非節(jié)假日;1表示長度為3天的節(jié)假日,例如元旦、清明、五一、端午、元宵節(jié);2表示長度為7天的節(jié)假日,例如春節(jié)、十一。
(2)表征節(jié)假日的回家、旅游特征變量γ11,γ12:此變量為無序變量,特征取值為回家、旅游及非節(jié)假日,所以需生成兩個啞變量γ11,γ12。在我國節(jié)假日中,春節(jié)、清明一般外地人回老家比較多,賦值為γ11=1,γ12=0;其他節(jié)假日旅游特征賦值為γ11=0,γ12=1;非節(jié)假日賦值為γ11=0,γ12=0。
(3)表征不同節(jié)假日的虛擬變量:每年節(jié)假日有7種,分別為元旦、春節(jié)、清明、五一、端午、元宵節(jié)、十一,但是有時會因為一些原因增加放假日期,例如2015年9月3日至5日調(diào)休放假,形成3天小長假,所以認為節(jié)假日有8種,分別為元旦、春節(jié)、清明、五一、端午、中秋節(jié)、十一、其他,再加上還需賦值非節(jié)假日,所以節(jié)假日種類有9種。節(jié)假日為無序變量,量化時需派生出8個啞變量,取值見表2。
根據(jù)修正的決定系數(shù)(Adjusted R2)、AIC、SC等檢驗規(guī)則,表征節(jié)假日長短虛擬變量β1與城市軌道交通常乘客比例時間序列數(shù)據(jù)建立回歸方程為最優(yōu)方案。回歸方程為式(6):
從式(6)可得出:節(jié)假日的長短對軌道交通日常乘客比例數(shù)據(jù)有明顯的影響,長度為7天的節(jié)假日常乘客比例值平均比長度為3天的節(jié)假日常乘客比例值低0.069左右。
記利用式(6)消除趨勢項和節(jié)假日影響后的數(shù)據(jù)序列為yy,對yy建立ARIMA(2,0,3)(1,1,1)7的模型。
表2 節(jié)假日變量賦值
所以修正后的軌道交通常乘客比例數(shù)據(jù)y的組合預(yù)測模型為式(7):
2.2.2預(yù)測
利用式(7)預(yù)測2016年3月28日至4月4日(4月2日至4月4日為清明節(jié)假期)的日常乘客比例,結(jié)果見表3。
表3 方法二預(yù)測結(jié)果及誤差
2.2.3對比分析
對比表2和表3兩種方法的誤差,表2(方法一)的平均誤差為2.68%,表3(方法二)的平均誤差為1.26%,可見方法二的精度高于方法一,并且在節(jié)假日(4月2日至4月4日為清明節(jié)假期)的預(yù)測上,精度明顯高于方法一。所以本文構(gòu)建的基于虛擬變量線性回歸和季節(jié)ARIMA的組合預(yù)測模型(式7),達到了對原有的季節(jié)ARIMA的修正效果。
本文依據(jù)2015年3月2日至2016年3月27日常乘客比例數(shù)據(jù)分別建立了常乘客比例ARIMA季節(jié)模型以及基于虛擬變量線性回歸和季節(jié)ARIMA的組合預(yù)測模型,對比了兩種方法的預(yù)測精度,得出以下結(jié)論:
(1)基于虛擬變量線性回歸和季節(jié)ARIMA的組合預(yù)測模型的精度高于原有的季節(jié)ARIMA的預(yù)測模型;
(2)常乘客比例數(shù)據(jù)具有緩慢遞增的趨勢和周期為7天的季節(jié)性趨勢,且遞增趨勢明顯弱于季節(jié)性趨勢;
(3)節(jié)假日的長短對軌道交通日常乘客比例數(shù)據(jù)有明顯的影響,長度為7天的節(jié)假日常乘客比例值平均比長度為3天的節(jié)假日常乘客比例值低0.069左右;
(4)模型的參數(shù)并不是越多越好,在滿足殘差序列具有較高的白噪聲檢驗的相伴概率(p-Q)情況下,可進行多個模型的比較,綜合考慮Adjusted R2、AIC、SC等檢驗方法,選擇最優(yōu)模型。
基于本文建立的組合預(yù)測模型,可以預(yù)測近期城市軌道交通路網(wǎng)常乘客比例,掌握??碗S時間變化的趨勢,為軌道交通運營管理部門提前做好運營組織、運營計劃提供量化的參考依據(jù)。
[1]魯放,韓寶明,蔡曉春.城市軌道交通常乘客行為研究[J].城市軌道交通研究,2012(2):39-42.
[2]G.E.P.Box,G.M.Jenkins,G.C.Reinsel.時間序列分析:預(yù)測與控制[M].北京:中國統(tǒng)計出版社,1999.
[3]安鴻志,陳兆國,杜金觀,等.時間序列的分析與應(yīng)用[M].北京:科學(xué)出版社,1983.
[4]楊叔子,吳雅,軒建平,等.時間序列分析的工程應(yīng)用[M].武漢:華中科技大學(xué)出版社,2007.
[5]孫彩云,楊曉靜.乘積ARIMA模型的建立與應(yīng)用[J].華北科技學(xué)院學(xué)報,2008,5(2):85-89.
[6]李勇,吳寶亮,楊秀苔,等.基于乘積ARIMA模型的產(chǎn)品不確定性需求預(yù)測[J].系統(tǒng)工程與電子技術(shù),2005,27(1):60-62.
[7]湯巖,王福林,王吉權(quán).基于季節(jié)ARIMA模型的電力系統(tǒng)負荷短期預(yù)測[J].數(shù)學(xué)的實踐與認識,2012,42(10):74-80.
[8]童明榮,薛恒新,林琳.基于季節(jié)ARIMA模型的公路交通量預(yù)測[J].公路交通科技,2008,25(1):124-128.
[9]蔡昌俊,姚恩建,王梅英,等.基于乘積ARIMA模型的城市軌道交通進出站客流量預(yù)測 [J].北京交通大學(xué)學(xué)報,2014,38(2):135-140.
[10]何九冉.城市軌道交通客流統(tǒng)計特征分析及組合預(yù)測方法實證研究[D].北京:北京交通大學(xué),2013.
[11]李春曉,李海鷹,蔣熙,等.基于廣義動態(tài)模糊神經(jīng)網(wǎng)絡(luò)的短時車站進站客流量預(yù)測[J].都市快軌交通,2015,28(4):57-61.
[12]王玉萍,陳寬民,楊富社,等.城市軌道交通客流預(yù)測結(jié)果的技術(shù)分析體系 [J].長安大學(xué)學(xué)報:自然科學(xué)版,2011,31(3):72-79.
[13]郝勇.上海地鐵周客流量的數(shù)值分析與預(yù)測 [J].上海工程技術(shù)大學(xué)學(xué)報,2010,24(1):60-65.
[14]徐瑞華,徐永實.城市軌道交通線路客流分布的實時預(yù)測方法[J].同濟大學(xué)學(xué)報:自然科學(xué)版,2011,39(6):857-861.
U121
A
1009-7716(2017)01-0129-04
10.16799/j.cnki.csdqyfh.2017.01.038
2016-10-31
鮑楓(1976-),女,河南安陽人,副研究員,從事交通信息化研究.