王夏秋 張 寧 王 健
(1. 東南大學(xué)智能運(yùn)輸系統(tǒng)研究中心軌道交通研究所, 210096, 南京;2. 南京地下鐵道有限責(zé)任公司, 210024, 南京//第一作者,碩士研究生)
短期客流預(yù)測(cè)指預(yù)測(cè)1年內(nèi)(主要以小時(shí)、日、月、季度等時(shí)間單位作為時(shí)間粒度)的軌道交通網(wǎng)絡(luò)或者線路的客流特征、服務(wù)水平以及出行效率等[1-3],是城市軌道交通運(yùn)營(yíng)部門(mén)展開(kāi)各項(xiàng)管理工作的基礎(chǔ)與依據(jù)。在以往的短期客流預(yù)測(cè)研究中,主要集中于短期客流的日/小時(shí)預(yù)測(cè)[4-5],而對(duì)于月度或季度等更長(zhǎng)時(shí)間跨度的短期客流預(yù)測(cè)還少有研究。但在城市軌道交通的實(shí)際運(yùn)營(yíng)中,車(chē)輛月度檢修計(jì)劃、運(yùn)用車(chē)配備計(jì)劃以及日常運(yùn)輸計(jì)劃的調(diào)整等大型生產(chǎn)計(jì)劃需要參考月度、季度客流預(yù)測(cè)的結(jié)果,同時(shí),運(yùn)營(yíng)企業(yè)可根據(jù)該預(yù)測(cè)結(jié)果合理制定年度/季度生產(chǎn)運(yùn)營(yíng)計(jì)劃。有鑒于此,本文針對(duì)月度客流預(yù)測(cè)展開(kāi)研究。
與小時(shí)/日客流不同的是,城市軌道交通月度客流受偶然因素影響的隨機(jī)波動(dòng)性不大,但因預(yù)測(cè)的時(shí)間跨度較大,其受季節(jié)氣候變化、法定節(jié)假日分布、學(xué)校寒暑假等較穩(wěn)定因素影響呈現(xiàn)出季節(jié)性波動(dòng)的周期性特征[5]。因此,針對(duì)月度客流量呈現(xiàn)的明顯季節(jié)性特點(diǎn),引入季節(jié)指數(shù)對(duì)原始月度客流數(shù)據(jù)進(jìn)行季節(jié)處理,以季節(jié)調(diào)整原始數(shù)據(jù)并利用自回歸積分滑動(dòng)平均(ARIMA)模型對(duì)城市軌道交通月度客流進(jìn)行預(yù)測(cè),從而使構(gòu)建的預(yù)測(cè)模型具有更好的預(yù)測(cè)精度,提高預(yù)測(cè)結(jié)果的準(zhǔn)確度。
現(xiàn)代城市軌道交通系統(tǒng)采用自動(dòng)售檢票(AFC)系統(tǒng)記錄乘客的交易數(shù)據(jù),是獲取軌道交通客流數(shù)據(jù)的良好平臺(tái),為月度客流特性分析和城市軌道交通短期客流預(yù)測(cè)工作提供了數(shù)據(jù)支撐。本文采用的城市軌道交通運(yùn)營(yíng)客流數(shù)據(jù)來(lái)自于南京地鐵自動(dòng)售檢票系統(tǒng),以月份為統(tǒng)計(jì)時(shí)間間隔,南京地鐵2號(hào)線月度進(jìn)站客流的時(shí)間演變?nèi)鐖D1所示。
a) 年度時(shí)間序列
b) 月度時(shí)間序列圖1 網(wǎng)絡(luò)化運(yùn)營(yíng)后的南京地鐵2號(hào)線月進(jìn)站客流演變圖
由圖1可見(jiàn),月度客流量有以下變化特征:
(1) 趨勢(shì)增長(zhǎng)性。圖1 a)年度時(shí)間序列反映的是月度客流量在同一月份不同年份的變化情況,體現(xiàn)了客流量隨著沿線土地開(kāi)發(fā)利用逐漸實(shí)施與完善以及網(wǎng)絡(luò)化運(yùn)營(yíng)效應(yīng)的影響所呈現(xiàn)出的增長(zhǎng)趨勢(shì)。具體表現(xiàn)為在相鄰的兩個(gè)年份之間,其客流量具有相同的分布特性,且隨著城市經(jīng)濟(jì)的發(fā)展,客流總體隨著各月份呈現(xiàn)出增長(zhǎng)趨勢(shì)。
(2) 季節(jié)波動(dòng)性。圖1 b)月度時(shí)間序列反映的是月度客流量隨著時(shí)間的逐漸推移呈現(xiàn)出不同的變化情況,體現(xiàn)了該月度客流量由于季節(jié)變化的不同而引起波動(dòng)的發(fā)展趨勢(shì)。具體表現(xiàn)為:由于春節(jié)假期原因,客流量在每年1、2月份出現(xiàn)低谷;7、8月份受到炎熱天氣以及學(xué)生放假的影響,其客流量略少于其他月份。因此,月度客流量每年重復(fù)出現(xiàn)循環(huán)變動(dòng),即以12個(gè)月為周期的季節(jié)波動(dòng)性。
從圖1可以發(fā)現(xiàn),城市軌道交通月度客流受偶然因素影響的隨機(jī)波動(dòng)性不大,但因預(yù)測(cè)的時(shí)間跨度較大,一方面,受季節(jié)氣候變化、法定節(jié)假日分布、學(xué)校寒暑假等較穩(wěn)定因素影響,呈現(xiàn)出季節(jié)性波動(dòng)的周期性特征;另一方面,在無(wú)新線接入的條件下,主要受線路周邊土地開(kāi)發(fā)利用程度和網(wǎng)絡(luò)化運(yùn)營(yíng)效應(yīng)影響而呈現(xiàn)趨向于線性但不夠平穩(wěn)的趨勢(shì)增長(zhǎng)性特征。考慮到季節(jié)指數(shù)法能夠有效地消除季節(jié)性因素影響,且ARIMA模型是線性估計(jì)模型,其對(duì)線性且非平穩(wěn)性時(shí)間序列數(shù)據(jù)能進(jìn)行較好的處理,因此,結(jié)合兩種模型的優(yōu)勢(shì),引入季節(jié)指數(shù)法和ARIMA模型共同對(duì)城市軌道交通月度客流量進(jìn)行預(yù)測(cè),從而使構(gòu)建的預(yù)測(cè)模型具有更好的預(yù)測(cè)精度,提高預(yù)測(cè)結(jié)果的準(zhǔn)確度。
形成以12個(gè)月為循環(huán)周期的這種季節(jié)性波動(dòng)最主要的因素是自然季節(jié)性和制度季節(jié)性的綜合影響。其中,自然季節(jié)性是一年中氣候、光照時(shí)長(zhǎng)、溫度等因素變化的結(jié)果;而制度季節(jié)性則是由于法定節(jié)假日及一些特殊時(shí)期的活動(dòng)引起的,尤其是法定節(jié)假日是制度季節(jié)性的最一般性的表現(xiàn)。正是由于這兩種因素的疊加,形成了我國(guó)城市軌道交通月度客流季節(jié)性波動(dòng)的獨(dú)特性。因此,需要從該時(shí)間序列中剔除季節(jié)因素,在建模預(yù)測(cè)前引入季節(jié)指數(shù)調(diào)整[6],建模預(yù)測(cè)過(guò)程中對(duì)預(yù)測(cè)值用季節(jié)指數(shù)逆向季節(jié)調(diào)整,使預(yù)測(cè)結(jié)果更符合客觀規(guī)律[7]。
季節(jié)指數(shù)是基于統(tǒng)計(jì)學(xué)的一種簡(jiǎn)化時(shí)間序列數(shù)據(jù)的方法,通過(guò)該方法對(duì)季節(jié)時(shí)間序列的季節(jié)性進(jìn)行處理,同時(shí)使得原始數(shù)據(jù)中的一些重要信息不被丟失。本文采用的是直接平均季節(jié)指數(shù)法對(duì)原始客流數(shù)據(jù)進(jìn)行建模前的季節(jié)指數(shù)調(diào)整。直接平均季節(jié)指數(shù)法用算數(shù)平均值直接計(jì)算各月或各季度的季節(jié)指數(shù)[6],其計(jì)算公式為:
(1)
式中:
cj——第j個(gè)月的季節(jié)指數(shù);
xij——第i年第j個(gè)月份的客流量。
然后利用該指數(shù)對(duì)歷史各月份的月度流量xij進(jìn)行季節(jié)調(diào)整:
(2)
經(jīng)過(guò)對(duì)歷史數(shù)據(jù)的處理之后,通過(guò)預(yù)測(cè)得到未來(lái)時(shí)期某個(gè)月份的客流總量為yj,那么逆向季節(jié)調(diào)整后的該月客流總量為:
(3)
ARIMA模型是將非平穩(wěn)時(shí)間序列通過(guò)差分計(jì)算轉(zhuǎn)化為平穩(wěn)序列后,將因變量?jī)H對(duì)其滯后值及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸建模[8]。由此可知,ARIMA模型是對(duì)時(shí)間序列進(jìn)行差分轉(zhuǎn)化、自回歸、移動(dòng)平均的一種預(yù)測(cè)方法,故ARIMA(p,d,q) 稱(chēng)為差分自回歸移動(dòng)平均模型。其表達(dá)式為:
xt=φ0xt-d+φ1xt-d-1+…+φpxt-d-p+εt-
θ1εt-1-θ2εt-2-…-θqεt-q
(4)
式中:
xt,xt-1,…,xt-p——觀測(cè)序列值;
B——延遲算子;
{εt}——零均值白噪聲;
φ0,φ1,φ2,…,φp,θ1,θ2,…,θq,εt——均為待估參數(shù);
p——自回歸項(xiàng);
q——移動(dòng)平均項(xiàng)數(shù);
d——時(shí)間序列成為平穩(wěn)時(shí)所做的差分次數(shù)。
基于季節(jié)指數(shù)的ARIMA模型的短期客流預(yù)測(cè)是先通過(guò)季節(jié)指數(shù)調(diào)整原始客流序列后,再通過(guò)差分處理將序列平穩(wěn)化,最終將其轉(zhuǎn)化為ARIMA模型來(lái)解決。主要預(yù)測(cè)步驟如下:① 計(jì)算季節(jié)指數(shù)并調(diào)整月度客流序列。根據(jù)數(shù)據(jù)優(yōu)化處理方法,利用原始客流數(shù)據(jù)計(jì)算各月份的季節(jié)指數(shù),并用計(jì)算得到的季節(jié)指數(shù)按照式(2)對(duì)樣本中的各月份客流量進(jìn)行季節(jié)調(diào)整,以獲得變換后的月度客流序列。② 利用經(jīng)過(guò)變換后的客流序列建立ARIMA模型。將經(jīng)過(guò)變換后的客流數(shù)據(jù)按照數(shù)據(jù)平穩(wěn)化處理、模型識(shí)別、參數(shù)估計(jì)和檢驗(yàn)這三步構(gòu)建出合適的ARIMA模型。③ 利用季節(jié)指數(shù)逆向季節(jié)調(diào)整預(yù)測(cè)值。利用上一步得到的模型預(yù)測(cè)未來(lái)時(shí)期某個(gè)月份的客流量,并按照式(3)對(duì)預(yù)測(cè)值進(jìn)行逆向季節(jié)調(diào)整,得到的結(jié)果即為最終的月度客流預(yù)測(cè)值。
本文選取網(wǎng)絡(luò)化運(yùn)營(yíng)穩(wěn)定后南京地鐵2號(hào)線2011—2013年共36個(gè)月的進(jìn)站客流量為基礎(chǔ)數(shù)據(jù),通過(guò)本文計(jì)算方法對(duì)36個(gè)月的原始月度客流時(shí)間序列數(shù)據(jù)進(jìn)行計(jì)算,得到季節(jié)指數(shù)(如表1)。
表1 月度客流時(shí)間序列的季節(jié)指數(shù)
根據(jù)表 1的季節(jié)指數(shù),對(duì)原始客流序列進(jìn)行季節(jié)調(diào)整,經(jīng)過(guò)變換后的月度客流序列如圖 2所示。
利用變換后的月度客流序列構(gòu)建ARIMA(1,1,1)(0,1,0)12模型,對(duì)月度客流量進(jìn)行預(yù)測(cè),得到的預(yù)測(cè)結(jié)果如表 2所示。同時(shí),為驗(yàn)證本文提出的預(yù)測(cè)方法的有效性,將原始數(shù)據(jù)直接建模預(yù)測(cè)得到的結(jié)果與之對(duì)比分析,有無(wú)季節(jié)指數(shù)調(diào)整的ARIMA模型預(yù)測(cè)結(jié)果如表 2所示。
表2 有無(wú)季節(jié)指數(shù)調(diào)整的預(yù)測(cè)結(jié)果
通過(guò)相對(duì)誤差(PE)和平均絕對(duì)百分比誤差(MAPE)兩個(gè)指標(biāo)來(lái)檢驗(yàn)兩個(gè)模型的預(yù)測(cè)精度,其性能評(píng)價(jià)指標(biāo)結(jié)果如表3所示。
表3 有無(wú)季節(jié)指數(shù)調(diào)整的ARIMA模型誤差對(duì)比分析 %
進(jìn)一步地,得到有無(wú)季節(jié)指數(shù)調(diào)整的預(yù)測(cè)客流趨勢(shì)曲線與實(shí)際客流曲線對(duì)比,如圖3所示。
圖3 2014年1—6月有無(wú)季節(jié)指數(shù)調(diào)整的預(yù)測(cè)客流趨勢(shì)曲線與實(shí)際客流曲線對(duì)比圖
通過(guò)兩個(gè)指標(biāo)對(duì)比分析可見(jiàn),基于季節(jié)指數(shù)的ARIMA模型預(yù)測(cè)各月度客流量的相對(duì)誤差較無(wú)季節(jié)指數(shù)調(diào)整的ARIMA模型的相對(duì)誤差好,均在10%以?xún)?nèi),有些月份的相對(duì)誤差更達(dá)到了2%以?xún)?nèi),相對(duì)誤差主要在5%范圍上下波動(dòng),平均絕對(duì)誤差也在5%以?xún)?nèi)。 對(duì)于個(gè)別月份的相對(duì)誤差比無(wú)季節(jié)指數(shù)調(diào)整的ARIMA模型預(yù)測(cè)結(jié)果的誤差值大(如2月份和5月份),是因?yàn)?014年的春節(jié)處于2月份,期間客流出行受走訪探親、購(gòu)物、旅游等多種隨機(jī)因素的綜合影響,且歷史年的春節(jié)并非都處于2月份,僅通過(guò)季節(jié)調(diào)整而不考慮日歷因素影響得到的預(yù)測(cè)結(jié)果,反而比單純利用ARIMA模型預(yù)測(cè)的結(jié)果誤差更大,未來(lái)可考慮加入日歷因素影響因子以提高預(yù)測(cè)結(jié)果的準(zhǔn)確度。而2014年5月31日南京為迎接青奧會(huì)的到來(lái)在南京玄武湖舉辦環(huán)湖大型徒步活動(dòng),致使當(dāng)日客流量較歷史同期的客流量大幅度增加,進(jìn)而影響5月份的客流總量。與此同時(shí),圖3的趨勢(shì)曲線表明,相對(duì)于無(wú)季節(jié)指數(shù)調(diào)整的預(yù)測(cè)客流趨勢(shì)曲線而言,基于季節(jié)指數(shù)調(diào)整的預(yù)測(cè)客流趨勢(shì)曲線與實(shí)際客流曲線更加吻合。綜上所述,基于季節(jié)指數(shù)的ARIMA模型預(yù)測(cè)效果更佳。
本文提出的基于季節(jié)指數(shù)的預(yù)測(cè)方法是在采用ARIMA 模型建模預(yù)測(cè)前引入季節(jié)指數(shù)對(duì)原始客流數(shù)據(jù)進(jìn)行季節(jié)調(diào)整,以消除季節(jié)因素對(duì)建模的影響,并在預(yù)測(cè)結(jié)束后用季節(jié)指數(shù)對(duì)預(yù)測(cè)值進(jìn)行逆向季節(jié)調(diào)整,使預(yù)測(cè)結(jié)果更加符合客觀規(guī)律。通過(guò)與未經(jīng)過(guò)季節(jié)指數(shù)調(diào)整的ARIMA模型預(yù)測(cè)結(jié)果對(duì)比分析,說(shuō)明了本文提出的方法在月度客流預(yù)測(cè)中精度較高,基本滿(mǎn)足對(duì)客流量的預(yù)測(cè)需求。運(yùn)營(yíng)單位可根據(jù)該方法得到的預(yù)測(cè)量及時(shí)調(diào)整相關(guān)運(yùn)能運(yùn)力,制定更加經(jīng)濟(jì)合理的季度或年度運(yùn)營(yíng)計(jì)劃。需要指出的是,基于季節(jié)指數(shù)的ARIMA模型適用于具有周期性變化規(guī)律的客流量預(yù)測(cè),而以小時(shí)、天等更小的預(yù)測(cè)時(shí)間跨度也具有一定的周期波動(dòng)性,未來(lái)可嘗試采用該模型進(jìn)行預(yù)測(cè)。