張欣環(huán), 吳一昊, 吳金洪, 許明明, 毛程遠(yuǎn)
(1.浙江師范大學(xué) 道路與交通工程研究中心,浙江 金華 321004;2.金華市公安局 交通警察支隊(duì),浙江 金華 321000;3.寧波市公共交通客運(yùn)管理局,浙江 寧波 315040)
公交客流分析是公交出行需求辨識(shí)、線網(wǎng)評(píng)估與優(yōu)化,以及公交優(yōu)先發(fā)展政策制定和實(shí)施的基礎(chǔ).乘客出行、公交線網(wǎng)客流數(shù)據(jù)的傳統(tǒng)調(diào)查方法成本較高,受限于調(diào)查技術(shù)和調(diào)查誤差,精度難以保證,已有的單源數(shù)據(jù)(IC卡等)都不同程度地存在一定的局限性.現(xiàn)階段,公交IC卡、GPS系統(tǒng)的推廣使用,使得低成本的自動(dòng)化采集海量多源數(shù)據(jù)成為可能,并為公交客流特征的提取奠定了良好的數(shù)據(jù)基礎(chǔ).
目前,對(duì)公交客流特征的研究過于單一和理論化,且大多應(yīng)用于廣義公交領(lǐng)域:蔡文學(xué)等[1]提出基于公交線網(wǎng)、GPS數(shù)據(jù)等多源數(shù)據(jù)構(gòu)建公交旅行時(shí)間計(jì)算模型;呂玉坤[2]挖掘多源海量數(shù)據(jù),推導(dǎo)出公交乘客的出行鏈模型;田源[3]以公交車GPS、IC卡數(shù)據(jù)為主,構(gòu)建了以站點(diǎn)、路段和線路為準(zhǔn)則層面的公交評(píng)價(jià)指標(biāo)體系;余慶等[4]以深圳市為案例,基于公交IC卡、微博簽到數(shù)據(jù)等多源數(shù)據(jù),構(gòu)建了公交客流規(guī)模模型;王俊兵等[5-8]以IC卡、AFC等數(shù)據(jù)為主,關(guān)聯(lián)匹配各項(xiàng)數(shù)據(jù)后提取公共交通出行鏈,進(jìn)而對(duì)公交客流進(jìn)行分析.可以看出,目前還沒有一套完整的常規(guī)公交多源數(shù)據(jù)處理方法,難以獲取完整的客流信息;缺乏對(duì)常規(guī)公交數(shù)據(jù)整體深度挖掘和應(yīng)用的研究,不適用于實(shí)際應(yīng)用.
本文通過對(duì)多源異構(gòu)數(shù)據(jù)的匹配與處理,構(gòu)建客流特征分析的數(shù)據(jù)基礎(chǔ);在客流特征信息提取過程中,提出了在判別過程中的合理匹配閾值、識(shí)別刷卡站點(diǎn)及匹配出行起訖點(diǎn)的方法與流程,建立基于多源數(shù)據(jù)的常規(guī)公交客流識(shí)別模型,充分考慮提取方法實(shí)際應(yīng)用的可行性,所得成果有利于提高常規(guī)公交服務(wù)的可靠性,可實(shí)現(xiàn)乘客個(gè)體出行過程的再現(xiàn)并完成常規(guī)公交客流特征提取分析,對(duì)于后期公交運(yùn)營(yíng)計(jì)劃的調(diào)整、城市出行結(jié)構(gòu)的優(yōu)化具有重要的理論意義和應(yīng)用價(jià)值.
通常,常規(guī)公交IC卡數(shù)據(jù)共有多個(gè)字段,包含了車輛編號(hào)、刷卡時(shí)間、刷卡時(shí)的經(jīng)緯度等信息.根據(jù)不同的統(tǒng)計(jì)分析目的,從原始數(shù)據(jù)庫(kù)中抽取部分字段進(jìn)行后續(xù)的融合、推斷.公交IC卡刷卡數(shù)據(jù)記錄了每位乘客單次乘車刷卡的詳細(xì)信息,本次研究提取金華市2018年3月1日全天的出行記錄,全天共有6.3萬余條記錄,數(shù)據(jù)結(jié)構(gòu)如表1所示.
表1 公交IC卡部分?jǐn)?shù)據(jù)
車載GPS終端實(shí)時(shí)采集公交定位數(shù)據(jù),原始數(shù)據(jù)中每條記錄包含了車輛編號(hào)、經(jīng)緯度、行程編號(hào)等多個(gè)信息.根據(jù)分析要求,從數(shù)據(jù)倉(cāng)庫(kù)中選擇不同字段數(shù)據(jù)進(jìn)行預(yù)處理.結(jié)合GPS、IC卡、線路站點(diǎn)等數(shù)據(jù)可以推斷上下站點(diǎn)、公交OD等信息.從原始數(shù)據(jù)中提取的公交車GPS數(shù)據(jù),包含6個(gè)字段(車輛編號(hào)、車牌號(hào)、經(jīng)度、緯度、時(shí)刻及所屬線路等),可以實(shí)時(shí)跟蹤車輛所處位置.
為進(jìn)一步進(jìn)行后續(xù)分析,本文將公交GPS數(shù)據(jù)(共計(jì)304萬條記錄)作進(jìn)一步處理,獲得車輛到離站信息表(約14.5萬條記錄,數(shù)據(jù)結(jié)構(gòu)如表2所示),這些記錄包括車輛編號(hào)、對(duì)應(yīng)線路、上下行、站點(diǎn)編號(hào)、站點(diǎn)名稱、到離站時(shí)間等信息.
表2 公交車輛到離站數(shù)據(jù)
本次調(diào)查總共覆蓋了732臺(tái)公交車輛全天到離站數(shù)據(jù),涵蓋140條線路(市區(qū)70條,城鄉(xiāng)70條),線路抽樣率80%(市區(qū)100%,城鄉(xiāng)67%),未覆蓋線路客流占全天客流的比例僅為4.3%,基本實(shí)現(xiàn)全市公交線路全覆蓋.
2.1.1 數(shù)據(jù)處理流程
數(shù)據(jù)處理流程如下:
1)基于ArcGIS的公交網(wǎng)絡(luò)的拓?fù)浔磉_(dá);
2)結(jié)合GPS數(shù)據(jù)獲得每一個(gè)IC刷卡點(diǎn)對(duì)應(yīng)的公交線路行車路徑(Pattern)、在公交網(wǎng)絡(luò)上的位置(偏移量);
3)針對(duì)每一個(gè)公交線路行車路徑估算出車輛的進(jìn)、出站時(shí)間,從而得到每個(gè)路段(transit link)上的旅行時(shí)間和站點(diǎn)停留時(shí)間;
4)將所有的路段旅行時(shí)間、站點(diǎn)停留時(shí)間一一對(duì)應(yīng)到(分配到)公交網(wǎng)絡(luò)上.
2.1.2 基本時(shí)間特征
根據(jù)公交車輛運(yùn)行特點(diǎn),將公交車在相鄰站點(diǎn)間運(yùn)行的時(shí)間進(jìn)行分解,刷卡間隔分布如圖1所示,且具有以下特征:
圖1 刷卡間隔分布
1)站內(nèi)最短刷卡間隔時(shí)間的平均值:根據(jù)每個(gè)站點(diǎn)站內(nèi)最短刷卡間隔時(shí)間tmin(i,i),求得它們的平均值tmean(i,i).數(shù)據(jù)分析中,“IC卡刷卡數(shù)據(jù)是否發(fā)生在同一站點(diǎn)”為關(guān)鍵點(diǎn),通常用刷卡間隔作為判斷依據(jù).本調(diào)查中,抽取部分線路共4 265例刷卡間隔有效數(shù)據(jù),得tmean(i,i)為22.5 s.
2)相鄰站點(diǎn)間最短刷卡間隔時(shí)間的平均值:根據(jù)相鄰站點(diǎn)間最短刷卡間隔時(shí)間tmin(i,i+1),求得它們的平均值tmean(i,i+1).如圖1虛線所示,數(shù)據(jù)基本呈正態(tài)分布,得tmean(i,i+1)為163.7 s.
3)判斷依據(jù):可在兩曲線重疊部分選取一個(gè)特定值,作為判斷“IC卡刷卡數(shù)據(jù)是否發(fā)生在同一站點(diǎn)”的依據(jù),因此刷卡間隔取72.0 s作為判斷閾值較為合適.
2.2.1 上車站點(diǎn)判斷
上車站點(diǎn)的判斷是完成進(jìn)一步的乘客出行特征分析的前提和數(shù)據(jù)準(zhǔn)備,是公交IC數(shù)據(jù)處理的關(guān)鍵環(huán)節(jié).本文在對(duì)IC卡數(shù)據(jù)特點(diǎn)進(jìn)行分析的基礎(chǔ)上,應(yīng)用Oracle軟件編程解決了上車站點(diǎn)判斷問題.
1)數(shù)據(jù)準(zhǔn)備.本文以其中一日刷卡數(shù)據(jù)作為基本分析數(shù)據(jù)段.在數(shù)據(jù)分析之前,需要從數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的各類數(shù)據(jù)表中進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行提取和篩選,只需提取需要用到的字段數(shù)據(jù).
2)判斷流程.
①判斷思路.為匹配出公交乘客出行OD,需要推算出刷卡乘客的上車站點(diǎn)及下車站點(diǎn).其中上車站點(diǎn)的推算較為簡(jiǎn)單,先對(duì)IC卡數(shù)據(jù)進(jìn)行時(shí)間聚類,將所有刷卡數(shù)據(jù)歸類到各個(gè)站點(diǎn);通過IC卡、GPS數(shù)據(jù)表中的“刷卡時(shí)間”進(jìn)行匹配,查找時(shí)間上最近的刷卡點(diǎn);再結(jié)合公交線網(wǎng)GIS站點(diǎn)坐標(biāo),進(jìn)行空間匹配.最終確定刷卡乘客的上車站點(diǎn),如圖2所示.
圖2 數(shù)據(jù)處理流程
②判斷步驟.
步驟1:聚類分析.提取數(shù)據(jù)、排序后進(jìn)行聚類處理,以刷卡間隔作為聚類依據(jù),間隔較短的刷卡數(shù)據(jù)作為一組.
步驟2:最短刷卡間隔.設(shè)t(m,n)為任意兩組數(shù)據(jù)刷卡間隔,min[t(m,n)]為最短間隔,當(dāng)min[t(m,n)]大于“相鄰站點(diǎn)間最短刷卡間隔min[t(i,i+1)]”時(shí)聚類停止[9].根據(jù)金華市常規(guī)公交基礎(chǔ)設(shè)施、刷卡數(shù)據(jù)等信息,本文取min[t(i,i+1)]為72.0 s.
步驟3:??繒r(shí)刻推算.公交車停靠時(shí)刻取公交車到達(dá)站點(diǎn)時(shí)刻與離開站點(diǎn)時(shí)刻的中間時(shí)刻,可用下式表示:
(1)
式(1)中:tS(n,i)表示公交車n在i站點(diǎn)的停靠時(shí)刻;tA(n,i)表示公交車n到達(dá)i站點(diǎn)的時(shí)刻;tD(n,i)表示公交車n離開i站點(diǎn)的時(shí)刻;tDW(n,i)表示公交車n在i站點(diǎn)的停留時(shí)間.
步驟4:時(shí)空匹配.計(jì)算站點(diǎn)??繒r(shí)刻后,搜索與該停靠時(shí)刻最接近的IC卡,進(jìn)而獲取該卡刷卡點(diǎn)的空間位置SW(i)(由刷卡時(shí)的經(jīng)緯度坐標(biāo)表示);進(jìn)一步搜索與該刷卡點(diǎn)SW(i)在空間上最接近的站點(diǎn)ST(i)(站點(diǎn)經(jīng)緯度數(shù)據(jù)在線網(wǎng)數(shù)據(jù)庫(kù)中獲取),當(dāng)min(|SW(i)-ST(i)|)≤D時(shí)(|SW(i)-ST(i)|和D為空間距離,D可根據(jù)不同站臺(tái)設(shè)計(jì)尺寸確定,本案例取15 m),所取ST(i)對(duì)應(yīng)的公交站點(diǎn)就被認(rèn)為是刷卡站點(diǎn),即上車站點(diǎn).
2.2.2 數(shù)據(jù)剔除與歸并
當(dāng)公交車在紅燈前或遇到交通事件時(shí)停止,且同時(shí)有乘客刷卡時(shí),其數(shù)據(jù)表現(xiàn)形式就會(huì)與在公交站點(diǎn)發(fā)生的刷卡事件相同,在處理數(shù)據(jù)的過程中,極易將其認(rèn)為是站點(diǎn)的停留時(shí)間.因此,在數(shù)據(jù)分析前需要將該部分?jǐn)?shù)據(jù)剔除.
其判斷方法及步驟同確定上車站點(diǎn)時(shí)的類似.不同的是最后一步的判斷標(biāo)準(zhǔn),即
D=min(|SW(i)-ST(i)|)>D0.
(2)
式(2)中,D0為一固定值,可取線路上公交站臺(tái)最大長(zhǎng)度(本文取15 m).當(dāng)D>D0時(shí),即認(rèn)為該部分?jǐn)?shù)據(jù)不是站點(diǎn)停留時(shí)間,應(yīng)當(dāng)將其作為旅行時(shí)間的一部分,并將其從停留時(shí)間內(nèi)剔除,歸并到路段旅行時(shí)間內(nèi).
為匹配出公交乘客出行OD,需要推算出刷卡乘客的上車站點(diǎn)及下車站點(diǎn).原則上,城市居民一日內(nèi)公交出行具有規(guī)律性,本文采用“基于出行鏈下車站點(diǎn)推導(dǎo)”方法進(jìn)行下車站點(diǎn)推算[10].結(jié)合上、下車站點(diǎn)的信息,最終獲取公交OD數(shù)據(jù),如表3所示.根據(jù)上下車站點(diǎn)算法,結(jié)合VBA編程,實(shí)現(xiàn)對(duì)于多次刷卡乘客的公交出行OD的分析.本文最終共獲得1.74萬人次一日內(nèi)4.09萬次的公交出行OD記錄,占全日公交出行總次數(shù)的23.1%.經(jīng)擴(kuò)算后,得到常規(guī)公交出行OD.數(shù)據(jù)顯示:江南與江北之間的出行比例大于江北、江南各自東西向的出行,也說明公交方式在長(zhǎng)距離出行中具有一定的優(yōu)勢(shì).
表3 公交OD部分?jǐn)?shù)據(jù)
截止2018年6月,金華市公交集團(tuán)共有營(yíng)運(yùn)車輛1 061臺(tái),全部運(yùn)營(yíng)車輛均配備GPS監(jiān)控設(shè)備及IC卡刷卡裝置,并可實(shí)時(shí)存儲(chǔ)GPS數(shù)據(jù)及刷卡數(shù)據(jù);營(yíng)運(yùn)線路共計(jì)175條,2017年市區(qū)公交分擔(dān)率為20.2%,與國(guó)內(nèi)其他城市相比稍顯滯后[11].
本文以金華市普通工作日(2018年3月1日)的常規(guī)公交多源數(shù)據(jù)為算例:一張IC卡對(duì)應(yīng)一位乘客,結(jié)合IC、GPS、線路站點(diǎn)、調(diào)度數(shù)據(jù)等多源數(shù)據(jù),獲取乘客公交出行特征、線網(wǎng)客流特征,統(tǒng)計(jì)分析常規(guī)公交客流特征.
3.2.1 總體出行特征
對(duì)分析時(shí)段內(nèi)所有IC卡(含BRT、市區(qū)公交、
郊區(qū)公交)數(shù)據(jù)進(jìn)行統(tǒng)計(jì):
1)乘客組成:50%以上的公交乘客為本市居民,郊區(qū)線路中暫住人員、外來人員占比較高.
2)支付方式:IC卡使用率偏低,近6成乘客仍使用投幣方式,公交客源不穩(wěn)定.
3)出行目的:公交乘客出行以上下班、生活購(gòu)物為主.
3.2.2 出行時(shí)間分布
1)日出行時(shí)耗:公交日出行時(shí)間為39 min,平均乘車時(shí)間為26 min.金東區(qū)與婺城新區(qū)之間的平均出行時(shí)間為55~65 min,出行時(shí)間較長(zhǎng).
2)客流時(shí)間分布:根據(jù)當(dāng)日分時(shí)段IC卡的數(shù)據(jù)統(tǒng)計(jì),早晚高峰系數(shù)分別為14.1%和13.2%(7:15—8:15為早高峰,16:45—17:45為晚高峰);平峰時(shí)段的客流量為高峰時(shí)段的45.0%左右,客流時(shí)間分布如圖3所示.
圖3 客流出行時(shí)間分布
3.2.3 出行空間分布
公交乘客出行主要集中在東關(guān)、西關(guān)、江南、湖海塘等區(qū)域,一環(huán)內(nèi)公交出行量占比82.4%.金東區(qū)塊公交出行量約6 500人次;婺城區(qū)等新區(qū)公交出行總量偏低,占全市公交出行量的比重較少.東西兩翼公交出行總量?jī)H維持在1 800人次左右.
在全市范圍內(nèi)選擇72條線路,乘距統(tǒng)計(jì)信息顯示,公交乘客平均乘次站點(diǎn)個(gè)數(shù)為12站,平均乘次起終點(diǎn)站間距為7.32 km,居民公交乘車距離較大.城區(qū)線路中有超過16.1%的公交線路乘客“平均站距/線路單程”的值高于0.5.這部分線路未來可以采用大站快車的形式提高運(yùn)行效率.
3.3.1 集散點(diǎn)客流特征
通過IC卡數(shù)據(jù)選取公交客流較大的11個(gè)站點(diǎn),統(tǒng)計(jì)各站點(diǎn)高峰乘降情況(早高峰時(shí)段7:15—9:15,晚高峰時(shí)段16:45—18:45).從公交客流集散點(diǎn)上下客人數(shù)匯總可以看出,金華站公交站點(diǎn)客流量最大,其次為人民廣場(chǎng)和金華商城.
集散點(diǎn)客流數(shù)據(jù)顯示:在早高峰時(shí)段(7:15—8:15),江北的上車乘客人數(shù)多于下車乘客人數(shù),在晚高峰時(shí)段(17:00—18:00),江南呈現(xiàn)出上車乘客人數(shù)多于下車人數(shù)的特征,而江北的樞紐站——金華站和汽車東站,則呈現(xiàn)出上車人數(shù)多于下車人數(shù)的現(xiàn)象.
3.3.2 線網(wǎng)客流特征
目前,市區(qū)公交主流向及其斷面流量如圖4所示,八一南街、八一北街為南北向主干道,集中了39.2%的全日公交客流;與其他橋梁相比,通濟(jì)橋斷面公交客流量最大(占43.2%的全日公交客流),雙龍大橋的交通量和公交車流量排名第二,這2座橋?yàn)檫B接江南江北的主要交通走廊.通濟(jì)橋公交車占總交通量的比例低于7.0%,卻承載了30.0%的公交客流,雙龍大橋公交車交通量占總交通量的2.45%,分擔(dān)了10.18%的載客量.雙溪西路、人民路為東西走向次一級(jí)的公交走廊,全天雙向運(yùn)量約19 500人次.
圖4 斷面客流分布圖
公交服務(wù)水平對(duì)吸引乘客出行具有重要作用.結(jié)合乘客問詢調(diào)查統(tǒng)計(jì)有以下特點(diǎn):
1)公交換乘:結(jié)合IC卡分析顯示,公交出行的換乘系數(shù)為1.15,很好地滿足了大城市中城市換乘系數(shù)不大于1.5的規(guī)范要求.
2)服務(wù)半徑:公交出行時(shí)間長(zhǎng)短對(duì)吸引乘客出行具有重要作用,金華市公交站點(diǎn)分布情況較好,居民步行10 min的距離內(nèi)就有公交服務(wù)(10 min以內(nèi)占比84%),并且下車后也只需10 min就可到達(dá)目的地(10 min以內(nèi)占比87%).但是,各項(xiàng)數(shù)據(jù)表明,站點(diǎn)500 m服務(wù)半徑未達(dá)到90%,覆蓋率有進(jìn)一步提高的空間.
3)運(yùn)行速度:公交線路高峰時(shí)段的平均行程速度是20.1 km/h,平峰時(shí)段的平均行程速度為23.4 km/h,最低運(yùn)行車速為13.2 km/h(K27路);K9路、K15路、K20路、K24路、K35路、K53路、Y6路等公交線路,由于運(yùn)營(yíng)線路主要集中在中心區(qū),因此,平均車速均低于15 km/h;郊區(qū)的線路,如游7路、K1路、318路等,運(yùn)營(yíng)速度較高.
4)滿載率:選取各跨江斷面進(jìn)行公交高峰滿載率調(diào)查,共獲得34條城區(qū)線路的高峰時(shí)段滿載率數(shù)據(jù),如表4所示.高峰時(shí)段金華城區(qū)公交線路的負(fù)荷度平均值為0.51,還未達(dá)到飽和,高峰時(shí)段滿載率為0.6~0.7,較為適中.高峰時(shí)段滿載率過高會(huì)降低乘客的乘坐舒適性,導(dǎo)致乘客向其他出行方式轉(zhuǎn)移,惡化出行結(jié)構(gòu).
表4 高峰時(shí)段滿載率
5)乘客滿意度:公交意愿調(diào)查結(jié)果顯示,61%的乘客認(rèn)為金華常規(guī)公交的總體情況良好,只有2%的乘客對(duì)公交系統(tǒng)表示不滿.乘客認(rèn)為,金華公交系統(tǒng)主要存在以下問題:等車時(shí)間太長(zhǎng)、線路繞行過多、沒有直達(dá)車、末班車收車過早、車速較慢等.
將多源信息融合技術(shù)應(yīng)用于城市常規(guī)公交領(lǐng)域,實(shí)現(xiàn)對(duì)乘客的出行特征精準(zhǔn)描述,探求城市常規(guī)公交系統(tǒng)的規(guī)律性,有利于找出常規(guī)公交存在的問題并進(jìn)行改善,以提高乘客的出行體驗(yàn).
利用公交IC卡、GPS等多源數(shù)據(jù)獲取金華市常規(guī)公交客流數(shù)據(jù),有利于后期公交運(yùn)營(yíng)計(jì)劃的改善、公交線網(wǎng)的調(diào)整、城市出行結(jié)構(gòu)的優(yōu)化.案例表明:基于多源數(shù)據(jù)的常規(guī)公交客流特征分析方法可行,其分析結(jié)果較傳統(tǒng)方法成本低,且實(shí)時(shí)性好,可以有效提高后續(xù)常規(guī)公交系統(tǒng)的分析評(píng)估精度.