光志瑞, 牛燕斌, 石 旭, 吳雁軍, 陳 冉
(1.北京市地鐵運營有限公司技術(shù)創(chuàng)新研究院, 北京 100044; 2.地鐵運營安全保障技術(shù)北京市重點實驗室, 北京 100044; 3.北京市基礎(chǔ)設(shè)施投資有限公司, 北京 100101)
新冠肺炎疫情爆發(fā)后,我國各級政府采取了一系列措施,通過有效隔離病患、增加物理距離、阻斷病毒傳播,對控制新冠肺炎疫情的蔓延起到了明顯的作用[1]. 城市軌道交通作為城市交通的骨干,具有速度快、容量大、客流密集、空間密閉的特點,北京城市軌道交通采取了一系列積極防控措施,在防止城市軌道交通成為疫情傳播場所的同時,維持著城市的基本運轉(zhuǎn). 為應(yīng)對復(fù)工復(fù)產(chǎn)客流,北京地鐵按照最大運輸能力編制列車運行圖,實時監(jiān)測客流情況,針對客流量較大、斷面滿載率較高的線路,在按照最小間隔運行的基礎(chǔ)上,采取適時增發(fā)臨客、區(qū)間車等措施,降低列車滿載率[2],最大限度保障人們的出行需求.
為了解重大公共衛(wèi)生事件對城市軌道交通運輸需求的影響,本文采用大數(shù)據(jù)可視化的方法,嘗試從不同層面挖掘2020年上半年北京城市軌道交通數(shù)據(jù),分析客流受疫情影響的程度及時空分布特征. 在此基礎(chǔ)上,對疫情影響下的客流恢復(fù)情況建立了基于ARIMA的客流預(yù)測模型,為靈活調(diào)整客運組織和行車組織方案提供理論支撐.
本文通過大數(shù)據(jù)可視化方法分析疫情影響下的客流時空特征. 其中,空間維度包括路網(wǎng)、線路、車站(含組團)各層級,時間維度包括年、月、日和0.5 h,研究指標主要為客運量和進出站量.
1.1.1 路網(wǎng)月客運量趨勢
為了直觀把握疫情對客流的影響,對2020年與2019年上半年各月日均客運量進行對比分析(如圖1). 2019年各月日均客運量主要受天氣、溫度、節(jié)假日等因素影響,2月份路網(wǎng)日均客運量最低,4月份最高. 受疫情影響,2020年1月日均客運量較去年有所下降,同比減少26.85%. 2月下降幅度最大,同比減少89.08%,之后以136%、81%、48%的環(huán)比增長速度逐步回升,5月份恢復(fù)程度最高,6月份受新發(fā)地疫情影響,恢復(fù)程度略低于5月份,見圖1.
圖1 2020年上半年路網(wǎng)月均客運量同比圖
1.1.2 路網(wǎng)日客運量趨勢
受新冠疫情影響,北京城市軌道交通客流呈現(xiàn)先突降后緩慢上升的趨勢,如圖2所示. 2020年1月20日,鐘南山在接受央視采訪時表示,新冠肺炎有人傳人的現(xiàn)象,隨后北京城市軌道交通客流突降,下降幅度約16.7%. 1月24日(除夕),北京市啟動突發(fā)公共衛(wèi)生事件一級響應(yīng)機制,與往年春運“V”字客流恢復(fù)趨勢[3]不同的是,客流在之后較長時間內(nèi)維持在低谷水平. 2月2日(正月初九),客流只有2019年同期的7.23%. 由于各級政府采取嚴格的防控措施,疫情得到有效緩解,隨著企業(yè)復(fù)工復(fù)產(chǎn),城市軌道交通客流緩慢上升. 4月30日,北京市將響應(yīng)機制調(diào)至二級,客流達往年同期的42.63%. 6月6日,北京市將響應(yīng)機制由調(diào)至三級,客流達往年同期的67.06%. 按此趨勢推算,預(yù)計2~3個月內(nèi)客流可達去年均值水平. 然而6月11日,北京新發(fā)地疫情爆發(fā),6月13日、14日客流下降幅度達18.71%、31.95%,見圖2.
疫情前,2019年12月工作日日均客運量為1 223萬人次. 2020年的春運因新冠疫情而呈現(xiàn)出與以往不同的特點,城市軌道交通作為城市內(nèi)部大運量骨干交通工具,兼負疫情防控與滿足人們基本生活出行、保障城市基本運作的雙重職責[4]. 圖3通過對比2020年與2019年春節(jié)后客流恢復(fù)率(與前一年12月客運量均值的比例),量化分析春節(jié)后客流恢復(fù)情況. 2019年節(jié)后第1日(正月初七)路網(wǎng)客運量恢復(fù)率為71.33%,節(jié)后第1周工作日平均恢復(fù)率達84.62%;正月十四客運量恢復(fù)率超過100%,第2周工作日平均恢復(fù)率達104.52%,人們已經(jīng)恢復(fù)正常的工作、生活秩序. 受疫情影響,2020年節(jié)后2周恢復(fù)率始終低于10%,第1周工作日平均恢復(fù)率僅為5.84%,第2周工作日平均恢復(fù)率僅為5.89%. 由此可得,疫情大幅抑制了城市軌道交通出行需求,嚴重影響了人們的工作、生活節(jié)奏,見圖5.
圖2 2020年上半年路網(wǎng)日均客運量趨勢
圖3 2020年與2019年春運期間客運量對比分析/%
1.1.3 路網(wǎng)分時進站量變化
圖4 2020年與2019年非工作日分時進站量對比折線圖/%
圖5 2020年與2019年工作日分時進站量對比折線圖/%
2020年與2019年非工作日相比(如圖4),全天各時段減少程度相當,平均減少量為3.6萬人次,平均減少率為66%. 2020年與2019年工作日相比(如圖5),日均分時進站量整體走勢基本一致,都在07:30—08:30達到上午進站高峰,在17:30—18:30達到下午進站高峰. 2020年上半年05:00—23:00期間每0.5 h平均同比減少58%,其中,早高峰07:00—09:00期間每0.5 h平均同比減少20萬人次,平均減少率為51%;午平峰平均同比減少7萬人次,平均減少率為61%;晚高峰17:00—19:00同比減少18萬人次,減少率為54%. 由此可看出,與2019年相比,2020年工作日早晚高峰路網(wǎng)進站減少量更大,平峰路網(wǎng)進站減少率更大,即疫情對工作日全天各時段均有較大影響見圖4、圖5.
1.2.1 線路日客運量變化
在路網(wǎng)宏觀分析的基礎(chǔ)上,從線路層面分析疫情對城市軌道交通客流的影響(見圖6). 2020年線路日均客運量排名與2019年基本一致,日均客運量由高到低排名第1位的是10號線達34.07萬人次,
同比下降58.78%. 24條線路中僅4條線上半年日均客運量下降幅度低于50%. 首都機場線下降幅度最大達74.74%,大興機場線為今年新開通線路,客運量為所有線路最低. 由此可看出疫情對航空業(yè)的嚴重沖擊.
圖6 2020年線路日均客運量同比圖
1.2.2 線路早晚高峰最大進出站時間分布
圖7為2020年上半年線路早高峰最大小時進站發(fā)生時間分布圖晚高峰最大小時出站發(fā)生時間分布圖,從圖中可看出:線路早高峰小時進站量發(fā)生時間比較集中,基本分布在07:00—08:45不到2 h內(nèi),其中,發(fā)生時間最早的是燕房線、大興機場線、房山線、昌平線等郊區(qū)線;大部分骨干線早高峰小時進站量發(fā)生在07:30—08:30;首都機場線最晚,為08:55—09:55. 晚高峰小時出站量發(fā)生時間差異略大,從17:00一直持續(xù)到19:45,接近3 h,其中,晚上出站最大值發(fā)生最晚的線路是昌平線、S1線、8號線、八通線等線路. 由此可見,遠郊區(qū)線通勤乘客出行距離和時間均最長,見圖7.
圖7 2020年上半年線路早晚高峰最大進出站時間分布
1.3.1 車站月進站量變化
從車站層級看,通過對車站進站減少量進行時空維度分析(見圖8),可看出:與2019年同期相比,1月份大部分車站月日均進站量減少程度在20%~30%,占全部車站數(shù)量的53%;2、3月份超90%的車站影響程度高達70%以上;隨著北京疫情的緩解,4月份大部分車站影響程度在50%~70%;5、6月份一半以上車站影響程度在30%~50%. 綜上,各站進站量正隨著疫情的有效控制向恢復(fù)態(tài)勢發(fā)展.
圖8 2020年上半年月進站量變化注:顏色表示減少程度,條形長短表示車站數(shù)量.
1.3.2 車站日進站量變化
從圖9車站日均進站量減少程度分布圖可看出:受疫情影響,2020年幾乎所有車站上半年日均進站量低于2019年,超過80%的車站進站量下降幅度過半. 其中,減少程度最大的主要是對外樞紐類車站(T2航站樓-76.04%、北京站-73.28%等)和地標性景點類車站(天安門東-82.61%、前門-77.88%、什剎海-77.66%等),同比減少70%以上.
圖9
疫情期間提倡居家辦公[5],通勤客流減少[6],通過分析北京五大商務(wù)區(qū)同比減少程度(如圖10),研究疫情對辦公類車站的影響. 從進站量來看,北京五大商務(wù)區(qū)工作日進站量減少程度大于全路網(wǎng)車站均值,其中,金融街商務(wù)區(qū)減少程度最大,其次是中關(guān)村商務(wù)區(qū)和第三使館區(qū),可能是由于金融與計算機行業(yè)更便于遠程辦公;從出站量來看,中關(guān)村商務(wù)區(qū)和望京商務(wù)區(qū)出站量減少程度大于全路網(wǎng)均值,CBD商務(wù)區(qū)低于全路網(wǎng)均值,金融街與第三使館區(qū)與全路網(wǎng)均值持平. 總體來看,上半年從居家隔離到逐漸復(fù)工復(fù)產(chǎn),疫情對辦公類車站影響較大.
圖10 2020年首都商務(wù)區(qū)工作日進出站量同比減少百分比注:金融街商務(wù)區(qū)(復(fù)興門、阜成門等)、中關(guān)村商務(wù)區(qū)(中關(guān)村、海淀黃莊等)、第三使館區(qū)(將臺、棗營等)、CBD商務(wù)區(qū)(國貿(mào)、大望路等)、望京商務(wù)區(qū)(望京、將臺等)
時間序列分析根據(jù)時間序列數(shù)據(jù)及序列之間的互相依賴關(guān)系,通過曲線擬合和參數(shù)估計建立數(shù)學模型的統(tǒng)計分析方法. 對于疫情下客流恢復(fù)情況的預(yù)測,可充分考慮季節(jié)效應(yīng)、長期趨勢效應(yīng)和隨機波動之間的復(fù)雜影響關(guān)系,建立乘積差分自回歸移動平均(Auto Regressive Integrated Moving Average ARIMA)模型進行預(yù)測. 乘積季節(jié)ARIMA模型公式及分析預(yù)測過程[7]如下:
ARIMA(p,d,q)×(P,D,Q)S
(1)
(2)
Θ(B)=1-θ1B-…-θqBq
Φ(B)=1-φ1B-…-φpBp
ΘS(B)=1-θ1BS-…-θQBQS
ΦS(B)=1-φ1BS-…-φPBPS
y=-3×10-6x2+0.003 6x+0.765 3(R2=0.88)
(3)
圖11 ARIMA流程圖
本文通過構(gòu)建ARIMA模型,對北京市2020年上半年的路網(wǎng)客運量恢復(fù)情況進行預(yù)測. 采用2020-02-05—2020-05-30數(shù)據(jù)作為訓練集,預(yù)測2020-06-01—2020-06-12客運量,通過計算預(yù)測結(jié)果和實際值的平均誤差百分比對模型進行精度檢驗.
模型構(gòu)建過程如下:
1)繪制2020年上半年北京軌道交通路網(wǎng)客運量的時序圖(如圖12),其中清明節(jié)、五一勞動節(jié)的客流做了插值替代處理. 整個客運量呈現(xiàn)明顯的趨勢變化、周期變化和隨機變動.
圖12 2020上半年路網(wǎng)客運量時序圖
2)通過自相關(guān)函數(shù)圖和偏自相關(guān)函數(shù)圖對北京市2020年上半年路網(wǎng)客運量的周期性和平穩(wěn)性進行檢驗. 由圖13可知,自相關(guān)系數(shù)(ACF)不截尾,說明客運量時間序列不穩(wěn)定,表現(xiàn)出明顯的周期性,以7 d為1個周期. 同時,偏自相關(guān)系數(shù)(PACF)不截尾.
圖13 自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖
3)對客運量時間序列數(shù)據(jù)進行1階7步差分以消除周期性和長期趨勢性. 從圖14中可看出,1階7步差分后的客運量已經(jīng)沒有明顯的周期性和趨勢性. 圖15的自相關(guān)函數(shù)圖和偏自相關(guān)函數(shù)圖中可看出差分后的序列還具有短期相關(guān)性.
4)根據(jù)以上分析,本文建立ARIMA(p,d,q)模型,提取時間序列中的周期性、趨勢性和季節(jié)性. 由于進行了1階7步差分,經(jīng)反復(fù)嘗試驗證,ARIMA(1,1,1)擬合效果較好,擬合參數(shù)結(jié)果見圖16.
圖14 1階7步差分后時序圖
圖15 1階7步差分自相關(guān)函數(shù)圖和偏相關(guān)函數(shù)圖
圖16 ARIMA(1,1,1)模型參數(shù)
圖17 新冠肺炎疫情影響下客流預(yù)測
以疫情影響下的客流預(yù)測為例,通過分析2020-02-05—2020-05-31路網(wǎng)客運量時間序列,對ARIMA模型參數(shù)進行標定,并采用標定后的模型ARIMA(1,1,1)對2020-06-01—2020-06-12客運量進行動態(tài)預(yù)測. 通過計算預(yù)測結(jié)果和實際值的平均百分誤差(MAPE)對模型進行精度檢驗[8],結(jié)果表明:北京城市軌道交通路網(wǎng)客運量的平均誤差百分比為2.9%,預(yù)測效果良好(如圖17). 從結(jié)果可看出,6月7日路網(wǎng)客運量預(yù)測誤差較大,平均誤差百分比達到13.5%. 通過分析,6月7日為周日,最高溫由前一天20 ℃驟升到35 ℃,極有可能受突發(fā)高溫天氣的影響,造成客流預(yù)測誤差較大. 除6月7日外,客流預(yù)測平均誤差百分比為1.98%,預(yù)測效果較好.
本文采用北京市軌道指揮中心2020年上半年地鐵運營數(shù)據(jù),通過可視化方法,直觀展現(xiàn)了新冠肺炎疫情影響下的客流時空分布特征,并構(gòu)建了疫情影響下的客流恢復(fù)預(yù)測模型,得到以下結(jié)論:
1) 受疫情影響,以1月23日為界分為2個階段,1月23日之前客流特征與往年類似,1月23日之后,城市軌道交通客流大幅下降,節(jié)后返程恢復(fù)緩慢,上半年最高恢復(fù)到去年同期的67%;
2) 從線路層級可看出疫情對航空業(yè)的嚴重沖擊;
3) 從車站層級可看出2月份疫情最為嚴重,之后持續(xù)向好,疫情極大抑制了出行需求,對交通行業(yè)、旅游業(yè)影響巨大;
4) 隨著疫情的有效控制,客流恢復(fù)向好,通過建立時間序列ARIMA(1,1,1)模型對客流恢復(fù)情況進行預(yù)測,預(yù)測誤差率為3.1%.
受時間和精力所限,本文疫情影響的城市軌道交通分析的維度和深度有待進一步提高,下一步工作中將在分析時增加研究指標(OD分布、斷面客流等)以及其他影響因素(如惡劣天氣). 大數(shù)據(jù)技術(shù)在城市軌道交通運營中仍有很大應(yīng)用空間,應(yīng)以疫情防控為契機,建立科學、穩(wěn)定、規(guī)范的大數(shù)據(jù)分析挖掘平臺,推動城市軌道交通管理體系和能力的現(xiàn)代化,為智慧城市、智慧地鐵的建立奠定基礎(chǔ).