劉芩瑜 康力 張凱
摘 要:數(shù)據(jù)正在深刻的改變我們的工作方式和思維模式,地鐵作為高質(zhì)量數(shù)據(jù)的產(chǎn)生點,通過對地鐵客運數(shù)據(jù)加以分析,能夠挖掘不同時期、時段的客流特征。本文介紹了客運數(shù)據(jù)分析的一般方法,并簡要介紹了成都地鐵運營信息分析系統(tǒng)。
關(guān)鍵詞:地鐵客運組織;數(shù)據(jù)分析;數(shù)據(jù)可視化
中圖分類號:U293.13 文獻(xiàn)標(biāo)識碼:A
1 概述
數(shù)據(jù)正在以前所未有的速度改變著這個世界以及我們的生活和工作方式。今天,我們只需要兩天時間即可創(chuàng)造出人類在2003年之前積累起來的全部數(shù)據(jù)。數(shù)據(jù)已經(jīng)開始徹底改變公司、企業(yè)的運營模式,例如通過對刷卡數(shù)據(jù)的分析,結(jié)合進(jìn)出站高峰小時系數(shù)及車站位置,可挖掘出不同日期、時段的客流特征,再運用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法,可進(jìn)一步實現(xiàn)更具可信度和準(zhǔn)確性的客流預(yù)測,為線網(wǎng)客運組織、行車組織提供調(diào)整參考。
2 客運數(shù)據(jù)的分析方法
乘客出入車站借助列車完成距離遷移,上述過程均體現(xiàn)在刷卡上,因此AFC的刷卡交易數(shù)據(jù)是客運數(shù)據(jù)分析的主要來源。在分析之前首先需要將地鐵交通網(wǎng)絡(luò)通過數(shù)學(xué)手段復(fù)現(xiàn),一般選用圖論的相關(guān)理論構(gòu)造地鐵線網(wǎng)有向圖,車站是圖上的點,區(qū)間為圖上兩點間的連接線,線的權(quán)重為車站的站間距或時長。
2.1 地鐵網(wǎng)絡(luò)有向圖的建立
每個普通車站對應(yīng)一個唯一的車站編號,換乘站拆分為多個單線普通站,車站與車站間根據(jù)實際可達(dá)關(guān)系通過鄰接關(guān)系表表示,兩站間線的長度通過區(qū)間運行時間表達(dá),換乘站拆分出的兩個獨立車站也按上述方式相連。
2.2 綜合出行阻抗的計算
以旅行時間為基準(zhǔn)的出行阻抗一般由路段阻抗和節(jié)點阻抗組成,路段阻抗等于列車在區(qū)間的運行時間,節(jié)點阻抗等于乘客在車站所花費的時間。不同的線路選擇有不同的阻抗值,乘客出行時總是力求選擇阻抗最小的方式出行。但由于阻抗值的大小無法直觀判斷,因此出行方式的選擇又具有隨機(jī)性,傳統(tǒng)的最短路徑分配法的缺點就是在于該方法忽略了實際出行過程中的這種隨機(jī)性。
2.3 有效可達(dá)路徑的篩選
一般一對OD之間存在多條可達(dá)的路徑,但是乘客只會沿著一部分的合理路徑出行,減少乘客自身的出行成本。有效可達(dá)路徑搜索是在城市軌道交通網(wǎng)絡(luò)中,為真實、有效的OD對尋找合理的出行路徑集,一般不超過5條,為下一步分配客流做準(zhǔn)備。
2.4 路徑客流分配
2.4.1 基于時間阻抗的多路徑概率確定
(4)當(dāng)近似等于即最小綜合阻抗值時,也近似等于即在綜合阻抗值在最小綜合阻抗值附近時,乘客受阻抗值的影響非常小,選擇的幾率相差不大。隨著路徑的阻抗值的增大,的遞減速率將迅速增加,乘客不予選擇的幾率越大,其客流分配的比例也越小。
(5)若始發(fā)站和終到站在同一線路,且第一條路徑正常、可用,則第一條路徑被選擇概率為1,其他均為0;若始發(fā)站和終到站在同一線路,但第一條線路中斷不可用,則計算正常、可行路徑被選擇概率。
通過以上分析明顯看出,有效路徑i的效益值是的函數(shù),且成反比關(guān)系。根據(jù)的五個特性,可通過正態(tài)分布函數(shù)表示上述特性。當(dāng)始發(fā)站和終到站不在一條線,計算正??尚新窂奖贿x擇概率。正??尚新窂奖贿x擇的概率計算方法:分別計算可達(dá)路徑中每一條徑路的廣義費用,得到各路徑的分配比例,再將OD量按此比例分配到各路徑上。
2.4.2 擁擠程度對路徑的客流分擔(dān)比例進(jìn)行修正
在乘客實際的出行過程中,不同線路擁擠程度會有差異,這與線路所經(jīng)過地區(qū)的站點客流量有關(guān),與是否經(jīng)過換乘站也有關(guān)。乘客在進(jìn)行路徑選擇時,考慮兩條路徑擁擠程度一般會以乘坐的舒適程度作為衡量標(biāo)準(zhǔn),當(dāng)乘客的數(shù)量小于一列車的定員,不存在擁擠:當(dāng)乘客流量大于列車的定員量時,且兩者的差值不斷增大時,乘客的不舒適感將不斷增強,故列車擁擠度用列車滿載率來表示,如下式所列:
其中表示第i條線路第j個區(qū)間斷面客流量;表示列車定員;
一般情況下,當(dāng)擁擠程度在一定范圍內(nèi)時,乘客選擇路徑時考慮擁擠程度的比例較小,只有擁擠程度達(dá)到一定的范圍,乘客才會考慮擁擠程度。因此,擁擠程度對乘客出行路徑的選擇的影響可以設(shè)置一個擁擠修正系數(shù),對各有效路徑的客流分配比例進(jìn)行修正。
全部有效路徑的客流分擔(dān)比例的總和也應(yīng)該為。因此公式如下:
2.5 客流清分
通過對這些數(shù)據(jù)的挖掘和分析,結(jié)合機(jī)器學(xué)習(xí)、深度學(xué)習(xí)相關(guān)算法,可進(jìn)一步實現(xiàn)各種不同場景下的客流預(yù)測。例如,通過分形插值算法與聚類分析,結(jié)合天氣、日期等信息可對當(dāng)天短時客流進(jìn)行預(yù)測;通過SARIMA模型,研究地鐵客流在時間序列的周期性特征,從而實現(xiàn)對短期客流的預(yù)測。
3 客運數(shù)據(jù)的可視化呈現(xiàn)及輔助決策
3.1 實時斷面擁擠度
NOIS系統(tǒng)頁面的頂部展示了當(dāng)前線網(wǎng)的重要客流指標(biāo),中部是線網(wǎng)圖并通過漸變色展示線網(wǎng)所有斷面的擁擠度情況,通過這兩個頁面的主體板塊可快速掌握線網(wǎng)整體情況,具有縱覽全局的作用。運營管理人員可通過實時客流指標(biāo)及斷面擁擠度變化趨勢,及時掌握各區(qū)段斷面擁擠情況,為行車調(diào)整及客運組織提供及時、有效、全面的信息化決策依據(jù)。
3.2 線網(wǎng)運力運量對比
通過對歷史客流進(jìn)行回顧,結(jié)合列車運行圖提供的斷面運力,可在一個圖表內(nèi)將斷面客流、運力、擁擠度等多個數(shù)據(jù)集中呈現(xiàn),可直觀看出同一條線路不同區(qū)段的運力運量對比情況。該功能可應(yīng)用于大站空車開行時機(jī)、運行圖轉(zhuǎn)峰期安排、車站常態(tài)化客流控制時間段等輔助決策,進(jìn)一步提升地鐵運營組織水平。
參考文獻(xiàn):
[1]張和杰,馬維華.基于時空特征的地鐵客流預(yù)測[J].計算機(jī)科學(xué),2019,46(07):292-299.
[2]張素潔,謝小園.杭州地鐵客流特征分析與客流預(yù)測[J].價值工程,2019,38(19):65-67.
[3]盧佳,任剛,徐凌慧.基于南京地鐵AFC數(shù)據(jù)的大客流識別方法(英文)[J].Journal of Southeast University(English Edition),2019,35(02):236-241.