代 位
[上海市政工程設(shè)計研究總院(集團)有限公司城鄉(xiāng)規(guī)劃院,上海市 200092]
城市綜合交通調(diào)查是為明確城市交通需求和運行特征而進行的調(diào)查,為城市綜合交通體系規(guī)劃編制、交通模型標定與校驗等工作提供基礎(chǔ)數(shù)據(jù),包含居民出行調(diào)查等9項內(nèi)容[1-2]。具備條件的城市可采用信息化數(shù)據(jù)對調(diào)查項目和內(nèi)容進行適當調(diào)整,信息化數(shù)據(jù)包括視頻或檢測數(shù)據(jù)、車輛定位數(shù)據(jù)、移動通信數(shù)據(jù)等。
出租車軌跡數(shù)據(jù)是信息化數(shù)據(jù)的一種,屬于車輛定位數(shù)據(jù),具有以下幾個特點:一是分布廣泛,出租車在城市各處流動;二是采集連續(xù),出租車在運營期間不間斷返回定位數(shù)據(jù);三是應(yīng)用面廣,其數(shù)據(jù)挖掘結(jié)構(gòu)既能反映出租車運營特征,也可反映道路交通運行情況。因此,出租車軌跡數(shù)據(jù)在交通調(diào)查中應(yīng)用價值價高。
當前對出租車軌跡數(shù)據(jù)的研究主要集中在地圖匹配方面,大量文獻研究了車輛軌跡點與路段匹配的精確算法[3],包括幾何方法[4]、隱馬爾可夫模型[5]以及其他方法[6-7],為出租車軌跡數(shù)據(jù)的處理方法積累了大量的經(jīng)驗。近年一些研究傾向于挖掘出租車軌跡數(shù)據(jù)所包含的居民出行[8-10]、通勤活動[11]、路網(wǎng)狀態(tài)[12]等信息。但缺乏對出租車軌跡數(shù)據(jù)在交通調(diào)查中應(yīng)用的梳理。
本文從綜合交通調(diào)查的應(yīng)用角度出發(fā),梳理出租車軌跡數(shù)據(jù)在交通調(diào)查中的應(yīng)用場景及要求,分析數(shù)據(jù)處理框架,并涉及適宜交通規(guī)劃項目的數(shù)據(jù)處理方法,最后以實際項目為例介紹應(yīng)用情況。
根據(jù)《城市綜合交通調(diào)查技術(shù)標準》(GB/T 51334—2018)[1](下稱《標準》)和《城市綜合交通體系規(guī)劃交通調(diào)查導(dǎo)則》[2](下稱《導(dǎo)則》),可應(yīng)用到出租車軌跡數(shù)據(jù)的交通調(diào)查主要有:出租車調(diào)查(《導(dǎo)則》中為“商用車調(diào)查”出租部分)、居民出行調(diào)查、道路交通調(diào)查、出行生成源調(diào)查。各項調(diào)查內(nèi)容見表1。
表1 出租車軌跡數(shù)據(jù)在交通調(diào)查中的應(yīng)用場景及要求
1.2.1 數(shù)據(jù)結(jié)構(gòu)及處理框架
出租車軌跡數(shù)據(jù)至少應(yīng)包含定位時間、經(jīng)緯度、載客狀態(tài)等字段,典型的軌跡數(shù)據(jù)字段及對應(yīng)的數(shù)據(jù)類型如表2所示。其中定位時間、經(jīng)緯度確定出租車輛的時空位置,載客狀態(tài)的變化判斷出租車輛訂單轉(zhuǎn)換,行駛速度或距離確定車輛速度。
表2 出租車軌跡數(shù)據(jù)在交通調(diào)查中的應(yīng)用場景及要求
出租車軌跡數(shù)據(jù)在交通調(diào)查應(yīng)用中的處理流程包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)處理、數(shù)據(jù)分析三個步驟,分析框架見圖1。
圖1 出租車軌跡數(shù)據(jù)處理框架
1.2.2 數(shù)據(jù)預(yù)處理方法
出租車軌跡的原始數(shù)據(jù)會存在幾個問題:
一是未定位的數(shù)據(jù):往往產(chǎn)生于一輛出租車啟動或關(guān)閉定位功能的短時間內(nèi),這段時間出租車信號很弱,無法獲得準確坐標,定位狀態(tài)字段[LOCATION]顯示FALSE。需刪除該部分數(shù)據(jù)。
二是坐標系問題:不同出租車服務(wù)商采用的定位數(shù)據(jù)坐標系可能不同,需要與交通調(diào)查所選用的坐標系統(tǒng)一。
三是有無客狀態(tài)標記錯誤數(shù)據(jù):在實踐過程中,發(fā)現(xiàn)有部分出租車輛的載客狀態(tài)字段[STATUS]的“搖擺”現(xiàn)象。例如t時刻顯示“載客”,在t+Δt時刻(Δt為軌跡數(shù)據(jù)的記錄時間步長,本文中為15 s)顯示“空駛”,在t+2Δt時刻又顯示“載客”。該部分數(shù)據(jù)需要通過完整的載客行駛鏈判斷修正。
因而數(shù)據(jù)預(yù)處理包括:
一是刪除未定位的數(shù)據(jù);
二是坐標轉(zhuǎn)換,將全部軌跡點經(jīng)緯度坐標,轉(zhuǎn)換為交通調(diào)查的統(tǒng)一坐標;
三是根據(jù)載客狀態(tài)的變化提取初步訂單行駛鏈,當載客狀態(tài)在t時刻從“空駛”變?yōu)椤拜d客”,在t+NΔt時刻(N為時間步長個數(shù))從“載客”變?yōu)椤翱振偂?,則t至t+NΔt時間內(nèi)的記錄構(gòu)成一條初步訂單行駛鏈Li(i為初步載客出行鏈編號);
四是完整訂單行駛鏈處理,由于可能存在載客狀態(tài)字段的“搖擺”現(xiàn)象,需要判斷前后初步訂單行駛鏈的時間間隔,記相鄰兩條初步訂單行駛鏈Li和Li+1的終點和起點時間分別為tsLi,teLi+1,設(shè)定訂單間距時間閾值θ,若teLi+1-tsLi≤θ,則將Li和Li+1合并,繼續(xù)與下一條鏈進行判斷,若teLi+1-tsLi>θ,則Li標記為完整訂單行駛鏈,Li+1進行下一步判斷。
1.2.3 數(shù)據(jù)處理方法
根據(jù)數(shù)據(jù)分析需求不同,出租車數(shù)據(jù)處理分為訂單行駛鏈的起終點處理和中間點處理。
(1)訂單行駛鏈的起終點處理
起終點處理目的是得到各車輛在每次訂單的起點位置、起點時間、終點位置和終點時間,主要方法是對預(yù)處理后的完整訂單行駛鏈起終點進行統(tǒng)計聚合處理,方法比較簡單,本文不展開介紹。
(2)訂單行駛鏈的中間點處理
中間點處理的目的是根據(jù)出租車的實時速度判斷路段車速。本文采用一種較為簡單的“相鄰定位點最短路徑匹配法”實現(xiàn)地圖匹配計算過程。過程介紹如下:
a.路網(wǎng)數(shù)字化處理。為和交通調(diào)查中其他交通系統(tǒng)匹配,采用統(tǒng)一的路網(wǎng),一般為CAD路網(wǎng)文件。在ArcGIS軟件中導(dǎo)入CAD路網(wǎng),轉(zhuǎn)換坐標后,采用“要素轉(zhuǎn)線”功能將路網(wǎng)打斷,生成較為細致的路網(wǎng)圖層。在該圖層中,利用字段計算器中“shape.wkt”函數(shù),生成線要素文本[wkt]字段。將[wkt]字段中的數(shù)據(jù)提取出來,獲得路段點(交點或端點)的坐標、路段與路段點的關(guān)聯(lián)關(guān)系。此處記路網(wǎng)G:
式中:P為路段點集合P={p1,p2,···,pi,···,pn};E為路段集合E={e1,e2,···,ei,···,em};對于路段集合中任意路段ei,又由點集合中的兩元素pj(起點)、pk(終點)對應(yīng),即ei=(pj,pk)。
b.相鄰軌跡點匹配路段點。按距離最短原則,對于出租車載客行駛鏈Li中的任意相鄰兩軌跡點lq和lq+1,匹配路段點集P中最近的兩個路段點pq和pq+1。為減少匹配計算量,可劃定每個軌跡點的匹配范圍:記軌跡點lq坐標分別為xq、yq,設(shè)定匹配坐標計算閾值Δx和Δy,則生成路段點集P的子集Ppq滿足Ppq={p(ixi,y)i|xq-Δx≤xi≤xq+Δx,yq-Δy≤yi≤yq+Δy},進而在Ppq中進行路段點的匹配。
c.生成匹配路段點的最短路徑并賦速度值。對于路網(wǎng)G,尋找路段點pq和pq+1間的最短路徑Eq=對最短路徑集E中的每一條路段q記錄定位點此時的時刻和速度。若車輛在某時段速度很低(例如發(fā)生了擁堵情況),導(dǎo)致匹配的路段點相同,即pq=pq+1,則將速度值賦給上一時段。同樣,為減少計算量,可劃定最短路徑計算范圍:合并計算路段點pq和pq+1時的點集Ppq和Ppq+1,得到點集PΣq,并得到其關(guān)聯(lián)的路段集EΣq,構(gòu)成路網(wǎng)子集GΣq={PΣq,EΣq},進而在GΣq中計算最短路徑Eq。
d.聚合出結(jié)果。所有車輛的軌跡點匹配完成后,計算各時段每條路段的平均運行速度值。由于不同等級路段直接比較運行速度意義不大,還可以計算路段運行指數(shù)。本文定于路段運行指數(shù)=該段道路上最高運行速度/統(tǒng)計時段內(nèi)平均運行速度。
以某市連續(xù)一周工作日的1 816輛巡游出租車數(shù)據(jù)進行相關(guān)交通調(diào)查工作。該市中心城區(qū)出租車輛總規(guī)模為5 150臺,其中巡游車2 750臺,網(wǎng)約車2 400余臺,出租車萬人擁有率為18.7臺/萬人。樣本比例為35%,滿足抽樣率要求。
經(jīng)過計算,該市出租車平均日載客19單,行駛里程163.2 km。平均每單載客時間14.3分鐘,出行距離為6.7 km(見圖2)。平均里程利用率為78%,空駛率較低,出租經(jīng)營狀態(tài)良好。從早8時至晚21時,出租車訂單比例均在5%以上,波動較?。怀鲎廛嚦鲂懈叻灏l(fā)生在17~18時,比例達7.2%,案例城市出租車訂單時變特征見圖3。
圖2 案例城市出租車出行距離分布
圖3 案例城市出租車訂單時變特征
從出租車訂單的起點和終點分布(圖4、圖5)來看,出發(fā)、到達地空間分布大體趨同,主要分布在高鐵北站、機場、火車站等重要交通樞紐區(qū)域,以及大學(xué)城、解放路商業(yè)中心、北京路商務(wù)中心等商貿(mào)活動片區(qū),反映出租車出行主要服務(wù)進出城旅客和商貿(mào)活動乘客的特點。出租車訂單起終點空間分布也可為運營公司科學(xué)調(diào)配車輛資源提供決策依據(jù)。
圖4 案例城市出租車訂單起點空間分布
圖5 案例城市出租車訂單終點空間分布
通過地圖匹配和各條道路聚合計算,結(jié)合不同道路等級對應(yīng)的設(shè)計速度,得到各時段各條路段平均行駛速度和擁堵指數(shù)分布。計算結(jié)果表明:
一是速度空間分布,高峰小時路段擁堵指數(shù)分布(如圖6)表明,通達路橋、沂蒙路橋擁堵嚴重,北京路橋、解放路橋行駛緩慢,城區(qū)過河交通壓力較大;橫向蘭山路、金雀山路、陶然路、鳳凰大街,縱向蒙山大道、通達路、沂州路等路段較為擁堵。
圖6 工作日晚高峰小時路段擁堵指數(shù)分布
二是速度時間分布,從全市出租車車速變化特征(圖7)可看出,存在兩個明顯“低谷”時段,分別為7~8時和17~18時,且晚高峰運行車速更低,路網(wǎng)更擁堵。
圖7 案例城市出租車車速時變特征
以高鐵北站為出行生成源,可研究其區(qū)域內(nèi)出租車到發(fā)時空分布。以到達地分布為例(見圖8),可看出,從高鐵北站出發(fā)的出租車,終點集中分布在大學(xué)城區(qū)域,此外北京路商務(wù)區(qū)、解放路商業(yè)區(qū)分布較多,機場、河?xùn)|區(qū)域、羅莊區(qū)域分布較少。
圖8 以高鐵北站為終點的出租車起點分布
將每筆出租車訂單的起終點分別對應(yīng)到交通小區(qū)(或中區(qū)、大區(qū))中,按區(qū)域聚合,便可得到區(qū)域間的出租車出行OD矩陣和期望線分布。圖9是該城市交通大區(qū)的出租車出行期望線圖,可看出,蘭山老城區(qū)與北城新區(qū)間聯(lián)系最為緊密,出租車出行量最大;與河?xùn)|區(qū)北部、羅莊區(qū)聯(lián)系較緊密;其他區(qū)域間出租車出行量不大。該數(shù)據(jù)結(jié)果,可為居民出行調(diào)查中的出租車出行分布提供校正依據(jù),亦可為完善交通模型提供支持。
圖9 交通大區(qū)出租車出行期望線圖
本文系統(tǒng)梳理了出租車軌跡數(shù)據(jù)在交通調(diào)查中的應(yīng)用場景及應(yīng)用方法,重點介紹了數(shù)據(jù)處理流程、關(guān)鍵算法,及其在某城市出租車調(diào)查、車速調(diào)查、出行生成源調(diào)查和居民出行調(diào)查中的應(yīng)用結(jié)論。本文中的應(yīng)用方法適用于綜合交通規(guī)劃、相關(guān)交通專項規(guī)劃中的交通調(diào)查,為信息化手段進行交通調(diào)查提供了有效手段。今后將持續(xù)深入挖掘出租車軌跡數(shù)據(jù)的開發(fā)應(yīng)用。