李 軍 解 超 王 林▲ 高中靈
(1.中國(guó)交通通信信息中心 北京100011;2.北京交通大學(xué)交通運(yùn)輸學(xué)院 北京100044)
道路客運(yùn)班車(chē)在運(yùn)行中的停留場(chǎng)所主要包括客運(yùn)站、??空?、配客點(diǎn)、加油站、服務(wù)區(qū)、交通擁堵點(diǎn)、信號(hào)控制交叉口等。除此之外,還包括道路客運(yùn)非規(guī)定的旅客乘降場(chǎng)所,如市區(qū)內(nèi)的常規(guī)公交站點(diǎn)、旅游景點(diǎn)、賓館等。筆者將除交通擁堵點(diǎn)、信號(hào)控制交叉口之外的道路客運(yùn)班車(chē)停留場(chǎng)所稱(chēng)班車(chē)停留站點(diǎn)。識(shí)別并有效提取班車(chē)停留站點(diǎn)位置,可為道路客運(yùn)的客運(yùn)站站址選擇、定制出行乘降站點(diǎn)設(shè)置、出行信息服務(wù)等提供依據(jù)和支持。目前,獲取班車(chē)停留站點(diǎn)位置主要利用大量的人工調(diào)繪[1]或?qū)iT(mén)的測(cè)量設(shè)備采集[2-3]的傳統(tǒng)方法。在當(dāng)前城市化快速發(fā)展進(jìn)程中,班車(chē)停留站點(diǎn)位置變化快,尤其是客運(yùn)服務(wù)經(jīng)營(yíng)者可以靈活設(shè)置旅客乘降站點(diǎn)后,班車(chē)停留站點(diǎn)將隨旅客預(yù)約出行需求動(dòng)態(tài)調(diào)整,其位置變動(dòng)更為頻繁,而依靠傳統(tǒng)方法獲取班車(chē)停留站點(diǎn)成本高、周期長(zhǎng),遠(yuǎn)遠(yuǎn)無(wú)法滿足實(shí)際需求。
當(dāng)前,出租車(chē)、公交車(chē)、道路客運(yùn)班車(chē)等營(yíng)運(yùn)車(chē)輛通過(guò)車(chē)載GNSS(global navigation satellite system)設(shè)備采樣得到車(chē)輛的移動(dòng)軌跡數(shù)據(jù)。軌跡數(shù)據(jù)是交通狀態(tài)、路網(wǎng)結(jié)構(gòu)以及司乘行為的數(shù)據(jù)映射,蘊(yùn)含了較為豐富的信息[4-5]?;诔鲎廛?chē)軌跡數(shù)據(jù)挖掘的交通領(lǐng)域應(yīng)用已較為廣泛,主要包括交通狀態(tài)分析[6]、出租車(chē)運(yùn)營(yíng)管理和支持[7]、出行規(guī)律與特性分析[8]等。其中,出租車(chē)運(yùn)營(yíng)管理和支持是應(yīng)用最為廣泛和深入的1個(gè)方面,如從出租車(chē)軌跡數(shù)據(jù)中提取乘客上下客地點(diǎn)時(shí)空分布[9]、乘客出行熱點(diǎn)區(qū)域[10]等信息,作為出租車(chē)??空具x址[11]、打車(chē)需求預(yù)測(cè)[12]的依據(jù),從而為出租車(chē)的尋客策略和調(diào)度提供指導(dǎo)。
相對(duì)而言,道路客運(yùn)班車(chē)軌跡數(shù)據(jù)的挖掘研究相對(duì)較少,但也逐步開(kāi)始應(yīng)用。除在交通狀態(tài)分析[13]和班車(chē)安全監(jiān)管[14]等領(lǐng)域應(yīng)用外,一些學(xué)者還研究了班車(chē)軌跡數(shù)據(jù)的深層次挖掘應(yīng)用,包括提取停車(chē)場(chǎng)位置[15]、計(jì)算車(chē)輛尾氣排放量[16]等。由于班車(chē)在停留場(chǎng)所處的軌跡數(shù)據(jù)特征與出租車(chē)因乘客乘降生成的軌跡數(shù)據(jù)特征類(lèi)似[17-18],因此,可以借鑒出租車(chē)軌跡數(shù)據(jù)挖掘的既有研究,將道路客運(yùn)班車(chē)軌跡數(shù)據(jù)作為提取班車(chē)停留站點(diǎn)位置的數(shù)據(jù)源。
通過(guò)分析道路客運(yùn)班車(chē)停留軌跡數(shù)據(jù)的典型特征,在軌跡數(shù)據(jù)預(yù)處理基礎(chǔ)上,提出基于改進(jìn)DBSCAN算法的道路客運(yùn)班車(chē)停留站點(diǎn)提取流程和方法,基于京津冀區(qū)域的道路客運(yùn)班車(chē)軌跡數(shù)據(jù)進(jìn)行實(shí)證分析,對(duì)提出方法的可行性、效率和準(zhǔn)確度進(jìn)行驗(yàn)證,為道路客運(yùn)班車(chē)停留站點(diǎn)位置的高效、精準(zhǔn)、低成本的提取提供方法和技術(shù)支撐。
班車(chē)在道路上以相對(duì)穩(wěn)定的速度正常行駛時(shí),軌跡點(diǎn)一般沿道路呈均勻、線性分布,且比較連續(xù)、平滑。如果出現(xiàn)停留的情形,車(chē)輛會(huì)有一定時(shí)間的停駛或小范圍不規(guī)則運(yùn)動(dòng),軌跡點(diǎn)在該區(qū)域的數(shù)量通常較多,且往往呈聚集分布,見(jiàn)圖1中區(qū)域A~D,區(qū)域A為在出發(fā)城市客流聚集點(diǎn)設(shè)置的供班車(chē)配客的配客點(diǎn),區(qū)域D為出發(fā)城市的客運(yùn)站。
圖1 班車(chē)軌跡點(diǎn)的空間分布Fig.1 Spatial distribution of regular bus trajectories
雖然如此,在交通擁堵點(diǎn)(區(qū)域C)和信號(hào)控制交叉口(區(qū)域B)的軌跡點(diǎn)分布與其他停留場(chǎng)所仍有所差異。交通擁堵點(diǎn)的軌跡點(diǎn)分布通常呈現(xiàn)帶狀形態(tài),信號(hào)控制交叉口的軌跡點(diǎn)距離道路交叉口較近且呈對(duì)稱(chēng)分布,而且2處的車(chē)輛停留時(shí)間往往沒(méi)有在班車(chē)停留站點(diǎn)停留的時(shí)間長(zhǎng)[1]。
通過(guò)對(duì)比,可以總結(jié)出非交通擁堵點(diǎn)和信號(hào)控制交叉口的班車(chē)停留站點(diǎn)的軌跡數(shù)據(jù)所具備的典型特征:①軌跡點(diǎn)分布密度大,形成明顯的點(diǎn)簇;②大部分軌跡點(diǎn)的速度屬性為零;③停留時(shí)間較長(zhǎng);④距離道路中心線有一定的距離;⑤與信號(hào)控制交叉口有1個(gè)相對(duì)固定的距離。
由于車(chē)載GNSS設(shè)備的多樣性、班車(chē)行駛環(huán)境的復(fù)雜性等因素的影響,班車(chē)軌跡數(shù)據(jù)易出現(xiàn)諸如位置偏移、漂移、屬性值異常等問(wèn)題,甚至?xí)鲂绣e(cuò)誤數(shù)據(jù)或冗余數(shù)據(jù),影響班車(chē)停留站點(diǎn)的提取,因此,需要對(duì)班車(chē)軌跡數(shù)據(jù)進(jìn)行預(yù)處理。
1.2.1 基于兩級(jí)緩沖區(qū)的偏移數(shù)據(jù)預(yù)處理
過(guò)濾遠(yuǎn)離道路偏移數(shù)據(jù)較為有效的方法是在道路中線的基礎(chǔ)上構(gòu)建緩沖區(qū),之后將緩沖區(qū)以外的數(shù)據(jù)刪除。為提高計(jì)算效率,引入大小兩級(jí)緩沖區(qū)進(jìn)行異常軌跡點(diǎn)過(guò)濾的方法,即首先通過(guò)大緩沖區(qū)高速粗略篩選,剔除遠(yuǎn)離目標(biāo)道路的軌跡數(shù)據(jù),之后通過(guò)小緩沖區(qū)精細(xì)篩選,剔除與道路距離較近但不在道路上的軌跡數(shù)據(jù)[19]。
根據(jù)誤差理論,假設(shè)道路網(wǎng)的定位誤差為σ,車(chē)輛定位誤差最大為τ,道路單向路寬為w,車(chē)寬為d,將班車(chē)軌跡點(diǎn)距離道路網(wǎng)的最大距離設(shè)置為緩沖區(qū)的半徑ρ,見(jiàn)圖2。計(jì)算見(jiàn)式(1)。
圖2 車(chē)輛定位誤差Fig.2 Position error of vehicles
通常道路網(wǎng)的定位精度取為σ=5 m,車(chē)輛定位誤差τ=5 m,高速公路和城市快速路的大部分單向路寬w為10~16 m,大型車(chē)輛車(chē)寬d為2.55 m,則緩沖區(qū)半徑ρ取值為13~16 m。
1.2.2 漂移數(shù)據(jù)的修正和預(yù)處理
在班車(chē)行駛過(guò)程中,當(dāng)衛(wèi)星信號(hào)遇建筑物產(chǎn)生折射、因樹(shù)木等半透明物體被嚴(yán)重削弱或受大型電力設(shè)備影響等類(lèi)似強(qiáng)因素干擾時(shí),軌跡數(shù)據(jù)會(huì)發(fā)生比較明顯的波動(dòng),即出現(xiàn)數(shù)據(jù)漂移,見(jiàn)圖3。
圖3 軌跡數(shù)據(jù)漂移特征Fig.3 Drift characteristic of trajectory data
由圖3可知,車(chē)輛軌跡數(shù)據(jù)漂移值的主要特征是速度或者經(jīng)緯度信息出現(xiàn)異常。在數(shù)據(jù)預(yù)處理時(shí),筆者采用道格拉斯-普克(Douglas-Peucker,DP)算法進(jìn)行漂移值的預(yù)處理。提取3個(gè)位置相鄰的軌跡點(diǎn),分別為點(diǎn)A、點(diǎn)B、點(diǎn)C,三角形ABC頂點(diǎn)B至AC邊的垂直距離為h,見(jiàn)圖4。首先,根據(jù)三角形面積公式,計(jì)算三角形ABC的面積。
圖4 漂移數(shù)據(jù)處理方法Fig.4 Processing method of drift data
式中:lmax為允許偏移的最大值,一般由地圖精度、車(chē)載GNSS設(shè)備精度與道路寬度之和計(jì)算得出。比較h與lmax的大小,如果h<lmax,則直線AC段作為曲線AC的近似;如果h>lmax,則將曲線AC近似為直線AB和BC這2段。
根據(jù)班車(chē)停留軌跡數(shù)據(jù)的特征分析可知,班車(chē)停留軌跡點(diǎn)通常聚集成1個(gè)高密度的點(diǎn)簇。因此,識(shí)別班車(chē)停留站點(diǎn)位置的1個(gè)關(guān)鍵步驟是檢測(cè)出軌跡數(shù)據(jù)中的高密度點(diǎn)簇,最常用的方法是使用數(shù)據(jù)挖掘中的空間聚類(lèi)技術(shù)。選擇DBSCAN算法對(duì)班車(chē)停留場(chǎng)所的軌跡點(diǎn)進(jìn)行識(shí)別,并結(jié)合軌跡點(diǎn)簇的空間尺寸限制條件對(duì)DBSCAN算法進(jìn)行改進(jìn)。
2.1.1 相關(guān)定義
DBSCAN是基于密度聚類(lèi)算法中的1種比較典型且簡(jiǎn)單有效的算法。該算法將簇定義為密度相連的點(diǎn)的最大集合,能夠?qū)⒕哂凶銐蚋呙芏鹊膮^(qū)域劃分為類(lèi),并可在有“噪聲”的空間數(shù)據(jù)庫(kù)中發(fā)現(xiàn)任意形狀的類(lèi)。對(duì)于1個(gè)具有n個(gè)點(diǎn)的集合D,DBSCAN算法涉及的相關(guān)定義如下。
定義1。點(diǎn)的Eps鄰域??臻g中任意1個(gè)點(diǎn)p的Eps鄰域是指以p為圓心,以Eps為半徑的區(qū)域內(nèi)包含的點(diǎn)的集合,即NEps(p)。數(shù)學(xué)公式表達(dá)為NEps(p)={q∈D|dist(p,q)≤Eps}。
定義2。核心對(duì)象。如果1個(gè)點(diǎn)的Eps鄰域內(nèi)至少包含Min Pts個(gè)點(diǎn),則將其稱(chēng)為核心點(diǎn),否則稱(chēng)為邊界點(diǎn)或噪聲點(diǎn)。
定義3。直接密度可達(dá)。如果點(diǎn)p在點(diǎn)q的Eps鄰域內(nèi)且q是核心點(diǎn),稱(chēng)從q到p是直接密度可達(dá)的。
定義4。密度可達(dá)。如果存在1個(gè)點(diǎn)鏈p1,p2,…,pn,其 中p1=q,pn=p,對(duì) 于pi∈D(1≤i≤n),pi+1是從pi關(guān)于Eps和Min Pts直接密度可達(dá)的,則點(diǎn)p是從點(diǎn)q關(guān)于Eps和Min Pts密度可達(dá)的。
定義5。密度相連。如果點(diǎn)集D中存在1個(gè)點(diǎn)o,使得從點(diǎn)o到點(diǎn)p和q均關(guān)于Eps和Min Pts為密度可達(dá)的,那么點(diǎn)p和q則關(guān)于Eps和Min Pts是密度相連的。
定義6。簇。如果存在點(diǎn)集D,則簇C是D的1個(gè)滿足以下條件的非空集合:①?p,q,如果p∈C,且從p到q是密度可達(dá)的,則q∈C;②?p,q∈C,則p和q是密度相連的。
定義7。噪聲點(diǎn)。點(diǎn)集D中不屬于任何簇的點(diǎn)為噪聲點(diǎn)。
2.1.2 計(jì)算步驟
DBSCAN算法主要通過(guò)調(diào)整Eps和Min Pts這2個(gè)參數(shù)進(jìn)行聚類(lèi)中心的提取。算法的主要步驟如下。
步驟1。搜索數(shù)據(jù)集D中未被處理的對(duì)象。如果q尚未被處理,則查詢(xún)q的Eps鄰域NEps(q),如果包含的對(duì)象數(shù)不小于Min Pts,則建立新簇C,將NEps(q)中的全部點(diǎn)添加到C中。
步驟2。依次搜索C中未被處理的對(duì)象p,查詢(xún)p的Eps鄰域NEps(p),如果NEps(p)包含至少M(fèi)in Pts個(gè)對(duì)象,則將NEps(p)中未被劃分到任何簇的對(duì)象添加到C中。
步驟3。重復(fù)執(zhí)行步驟2,繼續(xù)搜索C中未被處理的對(duì)象,直到C中所有對(duì)象均被處理完成。
步驟4。重復(fù)執(zhí)行步驟1~3,直到所有對(duì)象均被劃分到某個(gè)簇或被標(biāo)記為噪聲。
由DBSCAN算法的計(jì)算流程可知,該算法的每1次計(jì)算均包含了1次鄰域查詢(xún),而鄰域查詢(xún)等效于對(duì)整個(gè)數(shù)據(jù)集的1次遍歷,當(dāng)處理的數(shù)據(jù)量特別大時(shí),鄰域查詢(xún)需要耗費(fèi)較長(zhǎng)時(shí)間。因此,提高DBSCAN算法效率的關(guān)鍵是減少鄰域查詢(xún)的范圍。
筆者所提出研究問(wèn)題的應(yīng)用場(chǎng)景為利用DBSCAN算法提取班車(chē)停留場(chǎng)所,即班車(chē)停留站點(diǎn)。根據(jù)班車(chē)停留軌跡數(shù)據(jù)的特征分析,班車(chē)停留站點(diǎn)包括客運(yùn)站、??空?、配客點(diǎn)、加油站、服務(wù)區(qū)以及非規(guī)定的站外旅客乘降場(chǎng)所,聚類(lèi)后所得的任意1個(gè)點(diǎn)簇事實(shí)上代表1個(gè)地理實(shí)體。在實(shí)際中地理實(shí)體的空間尺寸是有限的,因此,其所對(duì)應(yīng)停留場(chǎng)所的點(diǎn)簇也具有有限的空間尺寸。因此,筆者以既有研究為基礎(chǔ)[15],針對(duì)班車(chē)停留站點(diǎn)提取應(yīng)用的特殊性,設(shè)定1個(gè)距離閾值限制鄰域搜索空間,對(duì)DBSCAN算法做如下改進(jìn)。
將點(diǎn)簇的空間尺寸進(jìn)行限制,設(shè)置點(diǎn)簇中的任意2點(diǎn)間的距離不大于dmax。在執(zhí)行DBSCAN算法前,首先,計(jì)算包含所有對(duì)象的最小外包矩形,并在該地理范圍上構(gòu)建空間格網(wǎng),其中格網(wǎng)單元的邊長(zhǎng)為dmax;然后,確立每個(gè)對(duì)象與格網(wǎng)單元的對(duì)應(yīng)關(guān)系,建立格網(wǎng)索引。見(jiàn)圖5,標(biāo)注圓圈的格網(wǎng)為當(dāng)前格網(wǎng),灰色格網(wǎng)為鄰域搜索格。根據(jù)格網(wǎng)的最小點(diǎn)密度閾值ρmin,篩選出待處理的格網(wǎng)集合{Gst|Denst≥ρmin},將位于待處理格網(wǎng)集合中的對(duì)象組成搜索數(shù)據(jù)集合D。
圖5 空間格網(wǎng)索引Fig.5 Spatial grid index
依據(jù)預(yù)處理后的班車(chē)軌跡數(shù)據(jù)篩選停留軌跡點(diǎn),通過(guò)改進(jìn)DBSCAN算法并結(jié)合班車(chē)停留軌跡特征提取共性位置,進(jìn)而生成班車(chē)停留站點(diǎn)位置。具體流程如下。
2.3.1 坐標(biāo)系的轉(zhuǎn)換
原始班車(chē)軌跡數(shù)據(jù)的坐標(biāo)基于WGS-84坐標(biāo)系,為便于后續(xù)步驟中的距離計(jì)算,將班車(chē)軌跡數(shù)據(jù)由地理坐標(biāo)系轉(zhuǎn)換至UTM投影坐標(biāo)系。
2.3.2 班車(chē)停留軌跡點(diǎn)的篩選
在原始軌跡數(shù)據(jù)中篩選出速度零值點(diǎn),為了剔除一些偶發(fā)因素(車(chē)載GNSS設(shè)備誤差)導(dǎo)致的速度零值點(diǎn),通過(guò)距離、方向等指標(biāo)進(jìn)行篩選。
對(duì)于班車(chē)的2個(gè)連續(xù)軌跡點(diǎn)Oi和Oi+1,如果VOi=VOi+1=0,dis(Oi,Oi+1)≤ds,并且angledif(Oi,Oi+1)≤angs,則將Oi判斷為班車(chē)停留軌跡點(diǎn)。對(duì)于信號(hào)控制交叉口點(diǎn)Olc,如果dis(Oi,Olc)≤dlc,則將Oi判斷為在交叉口的班車(chē)停留軌跡點(diǎn),在后續(xù)的計(jì)算中將其剔除。
2.3.3 班車(chē)停留軌跡點(diǎn)聚類(lèi)及中心提取
2.3.4 班車(chē)停留站點(diǎn)位置提取
班車(chē)的軌跡數(shù)據(jù)通過(guò)車(chē)載GNSS設(shè)備采樣得到。原始的班車(chē)軌跡數(shù)據(jù)集本質(zhì)上均為班車(chē)軌跡點(diǎn)集,由多行采樣記錄構(gòu)成,每條記錄代表1個(gè)軌跡點(diǎn),包括車(chē)牌號(hào)碼、時(shí)間戳、經(jīng)緯度坐標(biāo)、速度、方向等車(chē)輛基本行駛數(shù)據(jù),數(shù)據(jù)示例見(jiàn)表1。
表1 班車(chē)軌跡數(shù)據(jù)示例Tab.1 Samples of regular bus trajectories
以京津冀地區(qū)作為研究區(qū)域,實(shí)證數(shù)據(jù)來(lái)源于2018年5月1日—31日從北京始發(fā)至河北、天津的136條客運(yùn)班線的班車(chē)軌跡數(shù)據(jù),共計(jì)258萬(wàn)個(gè)軌跡點(diǎn)。根據(jù)全國(guó)道路運(yùn)輸車(chē)輛動(dòng)態(tài)信息公共服務(wù)平臺(tái)的統(tǒng)計(jì),京津冀區(qū)域平均每小時(shí)在線班車(chē)數(shù)量為4 300輛,1 h可產(chǎn)生約40萬(wàn)條班車(chē)軌跡記錄。京津冀區(qū)域在線班車(chē)1 h的軌跡數(shù)據(jù)空間分布見(jiàn)圖6。
圖6可以直觀地反映車(chē)輛軌跡在該區(qū)域內(nèi)的分布情況,大部分的車(chē)輛軌跡集中于市區(qū)內(nèi),且越靠近城區(qū)軌跡點(diǎn)越密集。從北京市區(qū)域內(nèi)的車(chē)輛軌跡來(lái)看,由于北京市的路網(wǎng)呈環(huán)形放射狀,進(jìn)出北京主要放射道路有較多的軌跡點(diǎn)位分布,這些軌跡隨道路的走向呈條形分布。車(chē)輛軌跡在郊區(qū)縣的分布較為分散,與市區(qū)內(nèi)的車(chē)輛軌跡分布相比間隔較大。
圖6 京津冀區(qū)域在線班車(chē)1 h的軌跡數(shù)據(jù)分布Fig.6 Distribution of one-hour online regular bus trajectories in the Beijing-Tianjin-Hebei region
在對(duì)軌跡數(shù)據(jù)預(yù)處理的基礎(chǔ)上,基于改進(jìn)DBSCAN算法生成班車(chē)停留站點(diǎn)。考慮到營(yíng)運(yùn)車(chē)輛上安裝的車(chē)載GNSS設(shè)備不可避免地會(huì)存在定位誤差,結(jié)合車(chē)輛行駛特點(diǎn),將距離參數(shù)ds設(shè)置為15 m,角度angs設(shè)置為65°。綜合考慮生成班車(chē)停留站點(diǎn)的應(yīng)用場(chǎng)景并結(jié)合統(tǒng)計(jì)經(jīng)驗(yàn),將Eps和Min Pts分別設(shè)定為20 m和5。在構(gòu)建空間網(wǎng)格索引時(shí),dmax和ρmin分別設(shè)定為100 m和10。
在停留軌跡點(diǎn)的聚類(lèi)中心坐標(biāo)計(jì)算完成后,dc設(shè)置為50 m,Smin設(shè)定為2,dm設(shè)定為3 m,剔除因交通擁堵因素產(chǎn)生的簇心,融合距離較近的聚類(lèi)中心并篩選出可能為班車(chē)停留站點(diǎn)的簇心,利用緩沖區(qū)法剔除信號(hào)控制交叉口因素產(chǎn)生的簇心。最終從軌跡數(shù)據(jù)提取出了282個(gè)班車(chē)停留站點(diǎn)。
圖7為班車(chē)停留站點(diǎn)的提取過(guò)程:圖7(a)表明了站點(diǎn)附近的軌跡點(diǎn),圖7(b)表明了由改進(jìn)DBSCAN算法生成的5個(gè)聚類(lèi)中心點(diǎn),圖7(c)表明了由停留點(diǎn)聚類(lèi)中心生成班車(chē)停留站點(diǎn)。
圖7 班車(chē)停留站點(diǎn)提取過(guò)程Fig.7 Extraction process of regular bus-parking stops
為驗(yàn)證改進(jìn)DBSCAN算法提取班車(chē)停留站點(diǎn)的效率,從研究數(shù)據(jù)中選取了包含不同數(shù)量軌跡數(shù)據(jù)的子集,分別使用傳統(tǒng)DBSCAN算法和改進(jìn)DBSCAN算法對(duì)各子集進(jìn)行聚類(lèi)處理,記錄并統(tǒng)計(jì)2類(lèi)算法的執(zhí)行時(shí)間以及生成班車(chē)停留站點(diǎn)的數(shù)量,見(jiàn)圖8。由圖8可見(jiàn):改進(jìn)DBSCAN算法平均執(zhí)行時(shí)間減少了59.72%,提高了算法執(zhí)行效率,而且所生成的班車(chē)停留站點(diǎn)數(shù)量與傳統(tǒng)算法基本一致。因此,該方法可以在實(shí)際工作中用于班車(chē)停留站點(diǎn)的提取。
圖8 改進(jìn)算法的效率分析Fig.8 Efficiency analysis of the improved algorithm
為驗(yàn)證所提取的班車(chē)停留站點(diǎn)位置的準(zhǔn)確度,將生成的282個(gè)班車(chē)停留站點(diǎn)疊加到衛(wèi)星影像圖上,驗(yàn)證其與衛(wèi)星影像圖的匹配程度。經(jīng)過(guò)比較,有256個(gè)站點(diǎn)為真實(shí)的班車(chē)停留站點(diǎn),26個(gè)站點(diǎn)是交通擁堵點(diǎn)、信號(hào)控制交叉口等,班車(chē)停留站點(diǎn)提取的正確率為90.78%。雖然算法中對(duì)交通擁堵點(diǎn)和信號(hào)控制交叉口這2類(lèi)班車(chē)停留場(chǎng)所進(jìn)行了剔除,但由于二者與其他班車(chē)停留站點(diǎn)軌跡數(shù)據(jù)的相似性較高,仍存在將其誤提取為班車(chē)停留站點(diǎn)的情況。
根據(jù)對(duì)提取的282個(gè)班車(chē)停留站點(diǎn)的統(tǒng)計(jì)分析,客運(yùn)站和停靠站2類(lèi)停留站點(diǎn)數(shù)量最多,占比為59%,其次為客運(yùn)樞紐、旅游景點(diǎn)、常規(guī)公交站等站外乘降場(chǎng)所。圖9為所提取的4類(lèi)典型班車(chē)停留站點(diǎn)與衛(wèi)星影像圖的匹配效果。圖9(a)是1個(gè)客運(yùn)站。圖9(b)是1個(gè)旅游景點(diǎn)的停車(chē)場(chǎng),圖9(c)是1個(gè)城鎮(zhèn)的道路交叉口,經(jīng)調(diào)研發(fā)現(xiàn),2處場(chǎng)所存在經(jīng)常性旅客乘降的情形,且具備作為乘降站點(diǎn)的道路條件。圖9(d)是1處高速公路的常發(fā)交通擁堵點(diǎn),由于交通擁堵點(diǎn)與班車(chē)停留站點(diǎn)的軌跡特征非常相似,導(dǎo)致此處被誤提取為班車(chē)停留站點(diǎn)。
圖9 班車(chē)停留站點(diǎn)與衛(wèi)星影像圖的匹配效果Fig.9 Superimposed effect of regular bus parking stops in satellite images
分析了道路客運(yùn)班車(chē)停留軌跡數(shù)據(jù)的典型特征,在軌跡數(shù)據(jù)預(yù)處理基礎(chǔ)上,建立了基于改進(jìn)DBSCAN算法的班車(chē)停留站點(diǎn)提取方法,提出了班車(chē)停留站點(diǎn)提取流程,基于京津冀區(qū)域的136條道路客運(yùn)班線的班車(chē)軌跡數(shù)據(jù)進(jìn)行了實(shí)證分析。實(shí)證結(jié)果表明:①基于軌跡數(shù)據(jù)共提取了282個(gè)班車(chē)停留站點(diǎn),其空間分布與車(chē)輛軌跡數(shù)據(jù)分布以及實(shí)際狀況較為吻合;②改進(jìn)DBSCAN算法提高了算法執(zhí)行效率,平均執(zhí)行時(shí)間減少了59.72%,且所生成的班車(chē)停留站點(diǎn)數(shù)量與傳統(tǒng)算法基本一致;③將生成的282個(gè)班車(chē)停留站點(diǎn)疊加到衛(wèi)星影像圖上,經(jīng)過(guò)比較,有256個(gè)站點(diǎn)為真實(shí)的班車(chē)停留站點(diǎn),26個(gè)站點(diǎn)是交通擁堵點(diǎn)、信號(hào)控制交叉口等,班車(chē)停留站點(diǎn)提取的正確率為90.78%。
DBSCAN算法需要提前確定Eps和Min Pts這2個(gè)參數(shù)的值,而參數(shù)的確定將對(duì)聚類(lèi)效果有一定程度的影響,下一步將根據(jù)不同停留軌跡數(shù)據(jù)的特征,研究相應(yīng)的參數(shù)選取優(yōu)化方法,以更準(zhǔn)確地剔除交通擁堵點(diǎn)和信號(hào)控制交叉口。此外,隨著定制客運(yùn)的發(fā)展,將旅客預(yù)約出行需求數(shù)據(jù)與班車(chē)軌跡數(shù)據(jù)相結(jié)合,探索定制客運(yùn)乘降站點(diǎn)的設(shè)置方法,也是1個(gè)值得研究的方向。