唐詩韻 李博威 戶佐安
(廣西交通規(guī)劃勘察設(shè)計(jì)研究院有限公司1) 南寧 530029) (西南交通大學(xué)交通運(yùn)輸與物流學(xué)院2) 成都 611756) (西南交通大學(xué)綜合交通運(yùn)輸智能化國家地方聯(lián)合工程實(shí)驗(yàn)室3) 成都 611756)
近年來,隨著大數(shù)據(jù)技術(shù)的提升,諸多專家學(xué)者運(yùn)用車載GPS數(shù)據(jù)對(duì)出租汽車進(jìn)行研究,并取得了一些進(jìn)展[1-2].胡小文等[3]以深圳市出租汽車GPS數(shù)據(jù)為基礎(chǔ),從交通出行需求分布、出行距離分布、出行市場(chǎng)分布等方面對(duì)出租汽車運(yùn)營特性進(jìn)行研究,但對(duì)運(yùn)營指標(biāo)的分析較為欠缺;翁劍成等[4-5]以北京市為例,運(yùn)用GPS數(shù)據(jù)分析了路網(wǎng)內(nèi)出租汽車的行駛里程、虛擬里程數(shù)比、路網(wǎng)時(shí)空分布,以及駕駛員疲勞程度等參數(shù),對(duì)交通管理計(jì)劃和交通控制設(shè)施的性能評(píng)價(jià)提供定量參考,便于直觀快速地判斷城市交通狀況;莊立堅(jiān)等[6]提出面向出租汽車運(yùn)營管理的大規(guī)模GPS數(shù)據(jù)處理框架,建立出租汽車運(yùn)營需求指標(biāo)、里程指標(biāo)、時(shí)間指標(biāo)和速度指標(biāo),并結(jié)合廣州市數(shù)據(jù)進(jìn)行分析研究,但沒有深入分析出租汽車運(yùn)營的空間分布特性;曹祎等[7-8]考慮了現(xiàn)階段打車軟件背景下,空駛出租汽車的出行分布預(yù)測(cè)問題,但未對(duì)部分未使用打車軟件的空駛出租汽車,其運(yùn)營時(shí)空特性問題納入整體研究范圍,因此,在對(duì)出租汽車群體的刻畫描述上有所缺失.
本文將提出實(shí)現(xiàn)出租車GPS數(shù)據(jù)可視化的方法,并主要從時(shí)間和空間兩方面分析出租汽車的運(yùn)營特性,提出相關(guān)運(yùn)營指標(biāo)的模型和計(jì)算方法.最后,結(jié)合成都市1周的出租汽車GPS數(shù)據(jù)進(jìn)行具體分析.
本研究的數(shù)據(jù)源自成都市交通運(yùn)輸委員會(huì)提供的成都市2014年11月17—24日1周內(nèi)的出租汽車GPS數(shù)據(jù).每天的數(shù)據(jù)記錄超過7 000萬條,涵蓋了成都市12 000多輛出租汽車.出租汽車在運(yùn)營過程中以一定的周期向數(shù)據(jù)中心上傳當(dāng)前時(shí)刻的狀態(tài)信息,主要包括:車輛標(biāo)識(shí)信息、位置狀態(tài)信息、運(yùn)行狀態(tài)信息、運(yùn)營狀態(tài)信息、時(shí)間信息等.考慮到數(shù)據(jù)體量龐大,本文采用SQL Sever數(shù)據(jù)庫對(duì)出租汽車GPS數(shù)據(jù)進(jìn)行操作與管理.因設(shè)備故障、天氣狀況,以及建筑物遮擋等因素,在上傳GPS數(shù)據(jù)時(shí)會(huì)產(chǎn)生部分異常數(shù)據(jù),無法參與研究應(yīng)用,需將其剔除.由于異常數(shù)據(jù)所占比例較小,出租汽車GPS數(shù)據(jù)整體質(zhì)量較好,為本研究奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ).
基于大規(guī)模出租汽車GPS數(shù)據(jù),設(shè)計(jì)了提取出租汽車運(yùn)營時(shí)空特性的技術(shù)流程,見圖1.
圖1 大規(guī)模出租汽車GPS數(shù)據(jù)處理技術(shù)流程圖
選取部分成都市道路網(wǎng)絡(luò),通過路網(wǎng)拓?fù)潢P(guān)系將路網(wǎng)模型化,即轉(zhuǎn)變?yōu)槭噶柯肪W(wǎng)地圖導(dǎo)入至地理信息系統(tǒng)平臺(tái)ArcGIS中.其中,路網(wǎng)數(shù)據(jù)包含:路段編號(hào)、路段名稱、路段起始點(diǎn)經(jīng)緯度坐標(biāo)、路段長(zhǎng)度.
由于出租汽車始終是在道路上行駛,GPS定位點(diǎn)在除交叉口之外的區(qū)域基本都較為規(guī)律地貼合道路分布.當(dāng)出租車GPS定位點(diǎn)非常緊密的貼合某1條道路,或位于2條近似平行的道路間時(shí),可以很直觀地判斷出GPS定位點(diǎn)的匹配路段,即可采用最短投影距離匹配算法,能夠簡(jiǎn)化匹配計(jì)算的過程.
最短投影距離匹配原理以當(dāng)前投影點(diǎn)為圓心,考慮出租車GPS定位誤差,選擇以50 m為半徑作圓,將所有與所作圓相交的道路作為候選匹配道路集,依次將GPS定位點(diǎn)投影到候選道路上,并計(jì)算距各候選道路的投影距離,選擇投影距離最短的道路作為最終匹配道路,投影點(diǎn)即為最終匹配點(diǎn).
若僅采用最短投影距離匹配算法,會(huì)出現(xiàn)出租汽車軌跡中斷的情況,錯(cuò)誤匹配情況見圖2,在道路交叉口處,匹配點(diǎn)5,6匹配在道路b上,而前后匹配點(diǎn)1,2,3,4,7,8,9都匹配在路段a上,顯然,出租汽車的運(yùn)行軌跡位于道路a上,因此,單純采用最短距離投影法會(huì)在道路交叉口處產(chǎn)生大量的匹配錯(cuò)誤.
多項(xiàng)式擬合匹配算法能夠有效地避免該種錯(cuò)誤的發(fā)生,即將由當(dāng)前待匹配點(diǎn)與該時(shí)刻相鄰的4個(gè)GPS原始點(diǎn)組成的擬合曲線(由于時(shí)間間隔較短,這里可以將曲線看作為直線來處理)的斜率K,與候選路徑集中各路段的斜率Ki相比較,斜率最相近的路段作為最終的匹配路段,見圖3.
[(xi,yi),i=1,2,…,5]為包含當(dāng)前點(diǎn)的相鄰5個(gè)定位點(diǎn)的平面坐標(biāo).另外,由多項(xiàng)式匹配原理可知擬合直線斜率K的計(jì)算公式為
圖2 錯(cuò)誤匹配
圖3 多項(xiàng)式擬合匹配
(1)
道路斜率:
(2)
但是,多項(xiàng)式擬合匹配算法仍有一個(gè)缺陷,該算法規(guī)定與軌跡點(diǎn)的擬合曲線間的夾角在30°以內(nèi)的道路才能作為匹配道路,即0 在地圖匹配過程中采用最短投影距離和多項(xiàng)式擬合的混合匹配算法,算法流程見圖4. 圖4 混合地圖匹配算法流程圖 通過計(jì)算分析得出,選取相鄰點(diǎn)個(gè)數(shù)的多少對(duì)擬合直線的斜率影響非常小,因此,考慮到2個(gè)GPS點(diǎn)間的距離、交叉口轉(zhuǎn)彎半徑及計(jì)算工作量,在保證準(zhǔn)確匹配的條件下,確定選取5個(gè)GPS點(diǎn)來進(jìn)行直線擬合.另外,由于現(xiàn)實(shí)生活中,城市道路網(wǎng)絡(luò)密集復(fù)雜,當(dāng)匹配路網(wǎng)密度較大,即除了主、次干路外,還包含支路時(shí),見圖5,按照上述算法進(jìn)行匹配時(shí),由于支路1與次干路1平行,將會(huì)產(chǎn)生2條與擬合直線夾角最小的道路,從而無法確定最終匹配道路.這種情況下,仍需要進(jìn)一步采用最短投影距離算法進(jìn)行確定. 圖5 密集路網(wǎng)匹配問題 因此,在使用混合匹配算法確定某GPS定位點(diǎn)時(shí),路網(wǎng)過于復(fù)雜不但要增加算法的復(fù)雜度,也會(huì)影響算法的運(yùn)行效率,要考慮出租汽車運(yùn)行特性合理的選取匹配路網(wǎng).同時(shí),在匹配過程中要考慮平行道路間的距離,合理地選取搜索圓的半徑,保證候選道路集中只存在一條道路與擬合直線的夾角最小. 將本文提到的混合匹配算法與最短投影距離匹配算法進(jìn)行比較,見圖6.由圖6b)可知,有7個(gè)GPS定位點(diǎn)(見標(biāo)號(hào))出現(xiàn)匹配錯(cuò)誤,而圖6c)中未出現(xiàn)匹配錯(cuò)誤,僅有3個(gè)GPS定位點(diǎn)(見標(biāo)號(hào))因其投影點(diǎn)在待匹配路段的延長(zhǎng)線上,或其擬合曲線與所有候選道路夾角都大于30°而被匹配在交叉口處.對(duì)比分析可以得出,混合匹配算法能夠更精準(zhǔn)的實(shí)現(xiàn)出租車實(shí)際運(yùn)行軌跡的還原,但其匹配效率較低. 為了較好地實(shí)現(xiàn)該匹配算法,需要將GPS數(shù)據(jù)中的經(jīng)緯度坐標(biāo)轉(zhuǎn)換為以米為單位的平面坐標(biāo),最終將匹配結(jié)果導(dǎo)出成表格,見表3. 圖6 不同匹配算法的效果比較 車輛ID匹配后X匹配后Y1.001 01×101134 697973.413 398072.064時(shí)間載客狀態(tài)速度路段編號(hào)10:38:51021.512 出租汽車上下客次數(shù)在全天24 h內(nèi)的分布反映出城市居民出行活動(dòng)的時(shí)間特征,可用于掌握居民出行活動(dòng)的高峰時(shí)段和平峰時(shí)段,對(duì)分析居民出行行為有很好的指導(dǎo)作用.運(yùn)營指標(biāo)及計(jì)算公式為 工作日全天上下客比例: (3) 出租車OD數(shù)據(jù)依據(jù)出租車原始數(shù)據(jù)中的Incomeflag屬性值提取,當(dāng)值由1變?yōu)?,則表示出租車載客狀態(tài)由載客變?yōu)榭蛰d,即單次載客行程的終點(diǎn);反之,則為起點(diǎn).在SQL數(shù)據(jù)庫中運(yùn)用T-SQL語言進(jìn)行操作實(shí)現(xiàn). 通過數(shù)據(jù)分析得到成都市工作日與休息日全天上下客比例分布圖見圖7. 圖7 成都市工作日與休息日各小時(shí)上下客次數(shù)分布圖 由圖7可知,出租車的出行特征與常規(guī)公交有所差異,常規(guī)公交存在顯著的早晚高峰通勤出行特征,而出租車出行的通勤特征不明顯,同時(shí)出租車在21:00—24:00迎來全天需求最高峰,可以說明出租車乘客的出行目的較之常規(guī)公交更為多元化,同時(shí)也彌補(bǔ)了其他公共交通系統(tǒng)在夜間產(chǎn)生的運(yùn)力真空情況.工作日17:00—19:00時(shí)段乘客上下客次數(shù)有所回落,由于該時(shí)段為多數(shù)出租車駕駛員的交接班時(shí)間,發(fā)生拒載的情況較多,且此時(shí)恰好是下班晚高峰時(shí)期,打車需求急劇上升,供給與需求的極度不平衡造成“打車難”的情況時(shí)有發(fā)生,進(jìn)而導(dǎo)致上下客次數(shù)出現(xiàn)回落特征.休息日09:00—23:00期間各小時(shí)的上下客次數(shù)無明顯波動(dòng)起伏,均處于高位需求水平,主要成因由于休息日居民出行需求主要以休閑娛樂為主,出行時(shí)間的隨機(jī)性較大,因此在時(shí)間分布上無明顯特征. 載客時(shí)長(zhǎng)分布能較好地反映乘客選擇出租汽車作為出行方式的期望行程時(shí)間范圍,同時(shí)也能明顯地表征出租汽車服務(wù)的乘客類型.候客時(shí)長(zhǎng)分布反映出租汽車駕駛員空駛狀態(tài)尋客的時(shí)間特性.各運(yùn)營指標(biāo)計(jì)算公式為 (4) (5) (6) 由OD數(shù)據(jù)表可計(jì)算同一條記錄中起終點(diǎn)的時(shí)間差即單次載客時(shí)長(zhǎng)T1;而計(jì)算相鄰兩條行程間的時(shí)間間隔即為單次空載時(shí)間T0. 分析數(shù)據(jù)得到車輛載客時(shí)長(zhǎng)分布、平均候客時(shí)長(zhǎng)分布見圖8.由圖8可知,30 min以上的載客行程只占10.26%,這些行程一般以公務(wù)出行為主,或市區(qū)往返機(jī)場(chǎng)等出行需求;其次,57.17%的乘客在行程時(shí)間為15 min以內(nèi)時(shí)會(huì)選擇搭乘出租汽車,因此,屬于出租汽車的重點(diǎn)服務(wù)時(shí)域.分析平均候客時(shí)長(zhǎng)分布發(fā)現(xiàn),只有29.32%的出租汽車能在10 min以內(nèi)完成尋客工作,大部分出租汽車駕駛員的空駛時(shí)間較長(zhǎng),運(yùn)營質(zhì)量較差. 圖8 載客時(shí)長(zhǎng)與候客時(shí)長(zhǎng)分布 時(shí)間空駛率為出租汽車全天總空駛時(shí)間與全天總運(yùn)營時(shí)間之比,其反映出租汽車駕駛員全天的運(yùn)營效率,可用Roff表示,其計(jì)算公式為 (7) 式中:T空,T全天分別為出租汽車全天總空駛時(shí)間與全天總運(yùn)營時(shí)間. 載客距離表示居民選擇出租汽車出行的平均距離,反映出租汽車的平均服務(wù)距離.由于車載GPS設(shè)備平均每10 s上傳一次數(shù)據(jù),并且在城市道路中的行駛速度在30~40 km/h,因此在SQL數(shù)據(jù)庫中對(duì)匹配后的出租汽車GPS軌跡中的每?jī)牲c(diǎn)之間求地球球面距離,并求和,用來近似的表示一條載客軌跡的距離.運(yùn)營指標(biāo)及計(jì)算公式為 單次載客距離: (8) 地球球面距離: d(A,B)=R·arccos(sin(x1)·sin(x2)+ cos(x1)·cos(x2)·cos(y1-y2)) (9) 式中:zi,zi+1為單次載客記錄中相鄰的2條記錄的位置點(diǎn);R為地球半徑. 通過統(tǒng)計(jì)分析得到成都市出租汽車所有單次載客距離分布見圖9,由圖9可知,平均出行距離在5~9 km范圍的行程數(shù)量占84.03%,為主要服務(wù)半徑.按成都市出租汽車價(jià)格(起步價(jià)8元/2 km,超過2 km的每公里1.9元)計(jì)算,5~9 km的價(jià)格范圍在13.7~21.3元,即為出租汽車駕駛員單程的主要收益范圍. 圖9 單程載客距離分布 里程空駛率為出租汽車全天空駛總里程與全天運(yùn)營總里程的比值,反映出租汽車駕駛員全天的無效能源耗費(fèi)程度.里程空駛率可用Koff表示,計(jì)算公式為 (10) 式中:S空,S全天分別為出租汽車全天空駛總里程與全天運(yùn)營總里程. 時(shí)間空駛率與里程空駛率的車輛分布情況見圖10,由圖10可知,成都市出租汽車的時(shí)間空駛率主要集中在30%~40%,而里程空駛率主要集中在20%~30%.出租汽車的時(shí)間空駛率要略高于里程空駛率,出現(xiàn)這種現(xiàn)象的原因是大多數(shù)出租汽車在空駛狀態(tài)時(shí)都選擇停車等待或減速慢行來尋找乘客. 圖10 各時(shí)間空駛率與里程空駛率范圍的車輛分布 (11) 以成都市一環(huán)內(nèi)、地鐵二號(hào)線與府河所圍區(qū)域的路網(wǎng)為例,通過分析數(shù)據(jù)得到路段各指標(biāo)及載客概率的分布見圖11. 圖11 9:00—10:00時(shí)段路段各指標(biāo)及載客概率的分布圖 參照百度地圖與圖11可知,載客概率最高的路段(顏色較深路段)基本都為與居民小區(qū)、醫(yī)院、大型活動(dòng)中心、旅游景區(qū)等場(chǎng)所出入口直接相連的支路.但這些支路并不是出行需求旺盛的路段,這是因?yàn)樵擃愔飞系某鲂行枨笫请S機(jī)的,而出租汽車在支路上行駛數(shù)量較少且也是隨機(jī)的,二者若能保持基本平衡,則載客概率才會(huì)呈現(xiàn)出較高水平.由于本文對(duì)出行需求的分析是采用的出租車歷史數(shù)據(jù),對(duì)潛在的乘客無法預(yù)計(jì),因此,對(duì)路網(wǎng)中的供需關(guān)系評(píng)估也較為模糊.對(duì)比圖11中3幅圖發(fā)現(xiàn),載客概率次高的路段分布基本與出行需求旺盛的路段分布一致,表明出行需求越旺盛的路段,載客概率也相對(duì)較高. 由圖11a)可知,產(chǎn)生上客次數(shù)較多的路段附近的土地利用性質(zhì)主要有3種:居民小區(qū)、大型商圈、體育中心、醫(yī)院及學(xué)校等.這些路段周圍的人流量相對(duì)較多,對(duì)出租汽車的潛在需求較大.而在圖11b)中,由于09:00—10:00時(shí)段緊接上班高峰期尾聲,因此短時(shí)間內(nèi)在寫字樓及商場(chǎng)附近會(huì)發(fā)生空駛出租汽車較多的現(xiàn)象.對(duì)比圖11a)~b)可知,大部分空駛車數(shù)較多的路段,在該時(shí)段對(duì)應(yīng)的出行需求并不大,這反映出許多出租汽車駕駛員對(duì)路網(wǎng)中出行需求的時(shí)空分布關(guān)系并不熟悉,盲目巡游等現(xiàn)象嚴(yán)重,駕駛員缺乏一定的載客引導(dǎo). 本文在研究出租汽車GPS數(shù)據(jù)地圖匹配方面提出了一種混合匹配算法,并驗(yàn)證了該算法的匹配結(jié)果相較于單一匹配算法更為精準(zhǔn),能夠更好地還原出租汽車實(shí)際運(yùn)行軌跡.同時(shí),本文分別從時(shí)間和空間兩方面建立運(yùn)營指標(biāo)、計(jì)算模型及提取方法,以成都市出租汽車1周的GPS數(shù)據(jù)為例做具體分析,得出成都市出租汽車的主要服務(wù)時(shí)域?yàn)?~10 min,服務(wù)半徑為6~7 km,出行通勤特征不明顯,時(shí)間空駛率較高,且大多數(shù)駕駛員對(duì)路網(wǎng)動(dòng)態(tài)客流分布關(guān)系并不十分熟悉,缺乏針對(duì)性的載客引導(dǎo).最后,若對(duì)出租汽車空載時(shí)的空間運(yùn)行規(guī)律進(jìn)行深入研究,能更好地了解出租汽車駕駛員空載時(shí)的路徑選擇偏好,對(duì)探索降低出租汽車空載率的方法將起到一定幫助,可作為下一步的研究方向. 參考文獻(xiàn) [1] LIU L, ANDRIS C, BIDERMAN A, et al. Revealing taxi driver’s mobility intelligence through his trace[J]. IEEE Pervasive Computing, 2009(1):1-17. [2] LIU X, LIU S, CHEN Z, et al. Urban traffic condition analysis based on GPS floating car data[C] International Conference on Computer Science & Service System,Nanjing,2012. [3] 胡小文,馮均佳.基于GPS數(shù)據(jù)采集的出租汽車交通運(yùn)行特點(diǎn)研究[J].城市交通,2007,5(2):91-95. [4] 翁劍成,劉文韜,陳智宏,等.基于浮動(dòng)車數(shù)據(jù)的出租車運(yùn)營管理研究[J].北京工業(yè)大學(xué)學(xué)報(bào),2010,36(6):779-784. [5] WENG J C,ZHAI Y Q,ZHAO X, et al. Floating car data based taxi operation characteristics analysis in Beijing[C]. Computer Science and Information Engineering, 2009 WRI World Congress on, IEEE, Los Angeles, 2009. [6] 莊立堅(jiān),韋清波,何兆成,等.基于浮動(dòng)車數(shù)據(jù)的出租車運(yùn)營管理特性建模與分析[J].重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,33(4):122-127. [7] 曹祎,羅霞.打車軟件背景下空駛出租車出行分布預(yù)測(cè)模型[J].武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版),2015,39(1):51-54. [8] 唐詩韻.基于GPS數(shù)據(jù)的空駛出租車尋客路線推薦研究[D].成都:西南交通大學(xué),2017.2 出租汽車運(yùn)營時(shí)間特性分析
2.1 上下客時(shí)間分布
2.2 載客、候客時(shí)長(zhǎng)分布
2.3 時(shí)間空駛率分布
3 出租汽車運(yùn)營空間特性研究
3.1 載客距離
3.2 里程空駛率
3.3 路段載客概率分布
4 結(jié) 束 語