戚陽 黃信程 張錦旺 董火勝 于海洋
摘要:出行客流分析對于制定公交的運(yùn)營策略具有重要的指導(dǎo)意義,本文提出了一種GPS數(shù)據(jù)和公交IC卡的出行客流OD提取方法,實(shí)現(xiàn)了基于多元數(shù)據(jù)的客流OD獲取,并在深圳e巴士平臺(tái)得到了應(yīng)用的驗(yàn)證。
關(guān)鍵詞:出行分析;客流OD提取
1. 引言
國家交通數(shù)據(jù)顯示,北上廣深等一線城市,每天有過千萬的通勤人次出行。一方面,現(xiàn)有的公交和地鐵運(yùn)營系統(tǒng)無法滿足高峰期的出行需求,上下班高峰期運(yùn)量不足,人員擁擠,聚合效應(yīng)加長了數(shù)據(jù)的長尾,這些個(gè)體的需求數(shù)據(jù)會(huì)在數(shù)據(jù)的長尾下形成龐大的需求市場,已無法滿足人群的需求以及個(gè)性化需求;另一方面,城市旅游包車、企業(yè)或事業(yè)單位通勤車等車輛使用效率低下,造成社會(huì)資源浪費(fèi);同時(shí),小汽車出行占用道路資源,造成交通堵塞,而且也對城市空氣污染造成很大壓力。
在此背景下,順應(yīng)互聯(lián)網(wǎng)+的趨勢,定制公交服務(wù)應(yīng)運(yùn)而生。定制公交利用信息化手段組織客源,以混載搭乘的形式為處于相同區(qū)域,具有相同出行需求的人群定制一種介于常規(guī)公交與出租車之間的高品質(zhì)公共交通服務(wù)。定制公交既能提供接近常規(guī)公交(遠(yuǎn)高于出租車)的通勤效率,最大限度地滿足用戶早晚高峰的出行需求,也能保持出租車的“一人一座”、“一站直達(dá)”要求,保證乘客的舒適性,因此具有很大的應(yīng)用價(jià)值。
然而,目前實(shí)際運(yùn)營的定制公交仍然存在著一些問題,很多定制公交公司不能很好地把握用戶的出行需求,大部分的出行需求模型均采取出行調(diào)查或者利用單一數(shù)據(jù)來源的大數(shù)據(jù)挖掘方法,滿足不了精確定制的需要。因此,基于多種數(shù)據(jù)對用戶出行需求進(jìn)行更為深入的挖掘顯得極為迫切。
公交出行的需求分析的一個(gè)主要途徑是OD提取,即從數(shù)據(jù)(例如公交用戶的IC卡刷卡數(shù)據(jù))中提取出城市居民出行的OD特征,以此反映出行需求的空間分布。本文將制定一種有效的客流OD提取策略,基于公交IC卡和GPS數(shù)據(jù),實(shí)現(xiàn)可靠的OD特征提取,并在實(shí)際應(yīng)用中驗(yàn)證算法的有效性。
2. 出行客流OD特征提取
對于出行客流OD特征的提取問題,一般通過將城市劃分為若干區(qū)域,通過某種方式統(tǒng)計(jì)乘客在各個(gè)區(qū)域之間位置轉(zhuǎn)換的次數(shù),進(jìn)而根據(jù)該條目出行數(shù)據(jù)的起始和終止位置填充OD矩陣。出行OD矩陣是反映出行特征的重要依據(jù),不僅對于交通線路規(guī)劃,對于城市道路布設(shè)等也極其重要,因此如何準(zhǔn)確地獲取OD數(shù)據(jù)得到了很多人的關(guān)注和研究。
傳統(tǒng)的公交OD數(shù)據(jù)來源于人工調(diào)查,這種調(diào)查得到的結(jié)果往往很粗糙。近年來,很多研究者通過公交IC卡數(shù)據(jù)(或結(jié)合GPS數(shù)據(jù)或AVL數(shù)據(jù))推算客流OD。高永等運(yùn)用公交IC卡數(shù)據(jù)對公交換乘判斷方法進(jìn)行了研究,將乘客前后兩次刷卡的時(shí)間差與確定的時(shí)間閾值進(jìn)行比較,用以識別乘客本次乘車是否為換乘行為[1]。李海波將IC卡信息和AVL數(shù)據(jù)相融合,用于出行OD推算[2]。尹安藤提出了基于公交GPS和IC卡數(shù)據(jù)的公交OD推算,對公交IC數(shù)據(jù)和GPS數(shù)據(jù)進(jìn)行分析,以推算出居民出行OD矩陣[3]。
本文基于公交GPS與公交IC卡交易數(shù)據(jù)對客流OD進(jìn)行推斷和獲取,主要分為以下三個(gè)步驟:1)GPS定位數(shù)據(jù)的站點(diǎn)匹配:結(jié)合公交線路路徑、站點(diǎn)信息、車輛GPS監(jiān)控定位等數(shù)據(jù),分析得出公交車輛準(zhǔn)確的到站時(shí)刻;2)上車站點(diǎn)匹配:結(jié)合公交IC卡交易時(shí)刻、車輛編號及上述車輛到站時(shí)刻信息,分析乘客的上車地點(diǎn);3)下車站點(diǎn)推導(dǎo):基于乘客公交出行興趣點(diǎn)(含常規(guī)公交上車地點(diǎn)、地鐵進(jìn)出站點(diǎn))是乘客下車地點(diǎn)的規(guī)律,結(jié)合上車站點(diǎn)的下游停站信息、連續(xù)出行的換乘行為等推導(dǎo)乘客的下車站點(diǎn)。
1)GPS定位數(shù)據(jù)站點(diǎn)匹配
GPS定位數(shù)據(jù)站點(diǎn)匹配是為了將離散的公交車輛定位數(shù)據(jù)轉(zhuǎn)換為到離站記錄和班次記錄等信息,這是公交運(yùn)營分析和公交客流推導(dǎo)的首要步驟。為此需要設(shè)計(jì)一個(gè)將定位數(shù)據(jù)轉(zhuǎn)換到離站記錄的方法。
圖1描述了GPS數(shù)據(jù)與站點(diǎn)匹配的流程。首先需要剔除無用的數(shù)據(jù)(經(jīng)緯度全天不變和經(jīng)緯度超出線路閾值的數(shù)據(jù))。隨后對GPS數(shù)據(jù)與站點(diǎn)記錄做預(yù)匹配,挑選出可用的記錄。接著將這些數(shù)據(jù)與站點(diǎn)做精確匹配,確定車輛的到離站時(shí)間。最后挑出這些記錄進(jìn)行適當(dāng)?shù)牟迓┭a(bǔ)缺,確定出方向并標(biāo)注單程編號。至此我們完成了站點(diǎn)的匹配步驟。
2)上車站點(diǎn)匹配
對于上車站點(diǎn)的匹配問題,由于有公交IC卡刷卡時(shí)間這一強(qiáng)信息,只需根據(jù)公交IC卡交易記錄中的車牌號與交易時(shí)刻找到相應(yīng)車次及站點(diǎn)即可,匹配流程如下圖所示:
而對于實(shí)際情況,由于乘客的刷卡時(shí)公交車可能已經(jīng)啟動(dòng)了,因此不能簡單的認(rèn)為刷卡時(shí)間對應(yīng)的位置等同于車站位置。假設(shè)某車次共有n個(gè)公交站點(diǎn),刷卡交易時(shí)間介于公交車輛的第i站與第i+1站到站時(shí)刻,則認(rèn)為該刷卡記錄的上車站點(diǎn)為第i站。
在實(shí)際操作過程當(dāng)中,由于公交IC卡交易系統(tǒng)所記錄的車牌號、線路號與公交企業(yè)的車輛監(jiān)控系統(tǒng)所記錄的線路號、車牌號并不完全一致,需建立基礎(chǔ)信息匹配專家?guī)欤o助完成兩項(xiàng)關(guān)鍵信息的數(shù)據(jù)清洗與數(shù)據(jù)轉(zhuǎn)換工作。
3)下車站點(diǎn)推斷
由于對于很多公交車,乘客在下車的時(shí)候不會(huì)刷卡,因此無法得知乘客下車的具體時(shí)間和位置,因此只能對下車站點(diǎn)進(jìn)行推斷。我們一般結(jié)合上車站點(diǎn)的下游停站信息、以及乘客連續(xù)出行的換乘行為等推導(dǎo)乘客的下車站點(diǎn)。
為了實(shí)現(xiàn)下車地點(diǎn)的推斷,我們將乘車一天的出行鏈視為彼此相互鏈接的環(huán)狀結(jié)構(gòu),如圖3。據(jù)此在已知上車站點(diǎn)的基礎(chǔ)上,推導(dǎo)乘客公交出行的下車站點(diǎn)。即乘客前一次出行的終點(diǎn)是其進(jìn)行下一次出行的起點(diǎn);乘客當(dāng)日最后一次出行的終點(diǎn)是其第一次出行的起點(diǎn)。
然而,乘客實(shí)際的公交出行鏈并不會(huì)嚴(yán)格地首位相接。事實(shí)上,對于連續(xù)的兩次乘車行為,前一次乘車的下車點(diǎn)應(yīng)位于以后一次乘車上車點(diǎn)為中心,某個(gè)閾值為班級的圓形中。這個(gè)閾值應(yīng)當(dāng)與兩車乘車行為的間隔時(shí)間相關(guān),直觀地理解是,當(dāng)兩次乘車的間隔時(shí)間變大,乘客更有機(jī)會(huì)到達(dá)更遠(yuǎn)的上車點(diǎn)。
我們可以對前一次乘車的下車點(diǎn)進(jìn)行概率推導(dǎo),首先需要構(gòu)建下車點(diǎn)的二維分布,這個(gè)分布的σ為間隔時(shí)間的函數(shù),作為選擇各乘車點(diǎn)的先驗(yàn)概率。隨后可基于歷史出行興趣點(diǎn),對概率進(jìn)行更新,從而得到最可能的下車地點(diǎn)。
3. 客流OD提取算法的驗(yàn)證
本文將所提出的OD特征算法應(yīng)用于深圳市東部公交e巴士項(xiàng)目中,具體而言,集成在了后臺(tái)數(shù)據(jù)分析系統(tǒng)中。本文所提出的算法在e巴士的運(yùn)營中得到了算法的驗(yàn)證。
OD提取算法在e巴士項(xiàng)目后臺(tái)的客流數(shù)據(jù)分析中得到了充分的應(yīng)用。在客流數(shù)據(jù)分析過程中,可以以各行政區(qū)或自定義區(qū)域?yàn)閷ο?,分析區(qū)域內(nèi)部或之間客流數(shù)據(jù)信息。可查看全部下轄線路的客流OD數(shù)據(jù)、行政區(qū)域或者自定義區(qū)域內(nèi)外部客流情況,可基于時(shí)間、時(shí)段查詢條件對區(qū)域客流OD信息進(jìn)行篩選查看,可查看各區(qū)域客流時(shí)間分布及營收區(qū)域分布特點(diǎn),如圖4和圖5所示。
4. 結(jié)束語
本文提出了一種基于GPS和公交IC卡的出行客流OD提取方法。通過GPS數(shù)據(jù)實(shí)現(xiàn)定位與站點(diǎn)的匹配,通過IC卡的刷卡記錄確定出行客流OD的起始點(diǎn),通過基于環(huán)狀出行鏈的概率推斷確定出行客流OD的結(jié)束點(diǎn)。本文提出的方法在深圳市e巴士平臺(tái)上得到了實(shí)際應(yīng)用的驗(yàn)證,證明了本文提出的算法的有效性。
參考文獻(xiàn)
[1]高永. 基于IC卡數(shù)據(jù)的公交換乘識別方法[A]. 科學(xué)技術(shù)部全國智能運(yùn)輸系統(tǒng)協(xié)調(diào)指導(dǎo)小組辦公室.2007第三屆中國智能交通年會(huì)論文集[C].科學(xué)技術(shù)部全國智能運(yùn)輸系統(tǒng)協(xié)調(diào)指導(dǎo)小組辦公室:科學(xué)技術(shù)部全國智能運(yùn)輸系統(tǒng)協(xié)調(diào)指導(dǎo)小組辦公室,2007:6.
[2]李海波,陳學(xué)武.基于公交IC卡和AVL數(shù)據(jù)的換乘行為識別方法[J].交通運(yùn)輸系統(tǒng)工程與信息,2013,13(06):73-79.
[3]尹安藤. 基于公交GPS和IC卡數(shù)據(jù)的公交OD推算[D].哈爾濱工業(yè)大學(xué),2017.
基金項(xiàng)目:深圳市科技計(jì)劃項(xiàng)目(KJYY20160331162313860)
(作者單位:1.深圳市東部公共交通有限公司)