張譯文 張斌 周欣
(陜西省城鄉(xiāng)規(guī)劃設(shè)計(jì)研究院,陜西 西安 710064)
出租車浮動(dòng)車大數(shù)據(jù)地圖匹配與分析
張譯文張斌周欣
(陜西省城鄉(xiāng)規(guī)劃設(shè)計(jì)研究院,陜西西安710064)
機(jī)動(dòng)車行駛數(shù)據(jù)采集系統(tǒng)是ITS技術(shù)在交通領(lǐng)域的最新應(yīng)用,機(jī)動(dòng)車在安裝GPS、UPS等車載設(shè)備后,均可實(shí)現(xiàn)將車輛的行駛浮動(dòng)數(shù)據(jù)通過無線通信方式進(jìn)行上傳,實(shí)時(shí)地傳送到浮動(dòng)車信息中心。浮動(dòng)車輸出的動(dòng)態(tài)實(shí)時(shí)交通信息可廣泛服務(wù)于各交通部門,如可作為交警部門掌握道路實(shí)時(shí)交通情況、制定緩解擁堵措施的憑證,也可為城市交通規(guī)劃、市政道路建設(shè)提供數(shù)據(jù)基礎(chǔ)支撐。
交通運(yùn)輸;城市交通;大數(shù)據(jù);地圖匹配
機(jī)動(dòng)車行駛數(shù)據(jù)采集系統(tǒng)是ITS技術(shù)在交通領(lǐng)域的最新應(yīng)用,機(jī)動(dòng)車在安裝GPS、UPS等車載設(shè)備后,均可實(shí)現(xiàn)將車輛的行駛浮動(dòng)數(shù)據(jù)通過無線通信方式進(jìn)行上傳,實(shí)時(shí)地傳送到浮動(dòng)車信息中心。浮動(dòng)車輸出的動(dòng)態(tài)實(shí)時(shí)交通信息可廣泛服務(wù)于各交通部門,如可作為交警部門掌握道路實(shí)時(shí)交通情況、制定緩解擁堵措施的憑證,也可為城市交通規(guī)劃、市政道路建設(shè)提供數(shù)據(jù)基礎(chǔ)支撐。
地圖匹配技術(shù)是浮動(dòng)車大數(shù)據(jù)處理的關(guān)鍵技術(shù)之一,浮動(dòng)車系統(tǒng)對(duì)數(shù)據(jù)時(shí)效性、數(shù)據(jù)樣點(diǎn)間隔、數(shù)據(jù)樣本容量均有較高要求。機(jī)動(dòng)車行駛數(shù)據(jù)在采集后與城市路網(wǎng)的匹配過程中,往往面臨3大關(guān)鍵技術(shù)難題:①由于數(shù)據(jù)是實(shí)時(shí)上傳的,數(shù)據(jù)容量大,上傳時(shí)間快,對(duì)系統(tǒng)的計(jì)算度也因此提出了較高的要求;②上傳數(shù)據(jù)要連續(xù)才能保證數(shù)據(jù)的有效性和真實(shí)性,若數(shù)據(jù)間隔過大會(huì)導(dǎo)致數(shù)據(jù)失真;③城市市政道路路網(wǎng)密集、線形復(fù)雜,數(shù)據(jù)與地圖的匹配也會(huì)受到影響,因此對(duì)系統(tǒng)的容錯(cuò)率有較高要求[1-3]。
浮動(dòng)車實(shí)時(shí)路況處理技術(shù)在我國各大城市還處于示范階段,隨著浮動(dòng)車數(shù)量的日益增多,浮動(dòng)車地圖匹配算法已難以滿足當(dāng)前應(yīng)用環(huán)境下準(zhǔn)確性與實(shí)時(shí)性的要求??梢?,提高浮動(dòng)車地圖匹配的準(zhǔn)確性與實(shí)時(shí)性,是需要進(jìn)一步研究的課題。
從地圖匹配中的影響因素判斷,對(duì)地圖與數(shù)據(jù)匹配造成影響的因素主要包括以下幾點(diǎn)。
1.1GPS的定位誤差
1.1.1系統(tǒng)內(nèi)部誤差。一是衛(wèi)星測量誤差。隨著時(shí)間、位置的變化,GPS會(huì)產(chǎn)生一定的誤差,如車輛振動(dòng)產(chǎn)生的誤差、衛(wèi)星誤差、接收機(jī)本身誤差等。二是衛(wèi)星的幾何位置造成的誤差。系統(tǒng)內(nèi)部誤差一般通過GPS差分和動(dòng)態(tài)濾波等方法來進(jìn)行校正。
1.1.2外部突變誤差。部分路段線路形勢復(fù)雜多變,由于建筑、立交橋、城市隧道等設(shè)施的影響,導(dǎo)致衛(wèi)星與車載設(shè)備之間的聯(lián)系時(shí)斷時(shí)續(xù),上傳數(shù)據(jù)間隔過大導(dǎo)致有效性失真,引起的誤差也比較明顯。在車輛導(dǎo)航定位系統(tǒng)中,必須通過地圖匹配、容差率處理等手段對(duì)車載系統(tǒng)造成的GPS外部突變誤差進(jìn)行處理。
1.2地圖數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量
地圖匹配中使用的地圖來自于GIS中相同路段的道路數(shù)據(jù),因此GIS中的道路地圖質(zhì)量會(huì)決定最終的匹配結(jié)果。GIS中會(huì)對(duì)地圖質(zhì)量產(chǎn)生影響的因素主要包括數(shù)據(jù)的準(zhǔn)確性、數(shù)據(jù)的時(shí)效性、地圖投影等,對(duì)基于拓?fù)潢P(guān)系的地圖匹配方法,空間數(shù)據(jù)拓?fù)潢P(guān)系質(zhì)量好壞也是影響匹配效果的因素之一。
1.3坐標(biāo)投影的變換誤差
GPS采用的是WG184地心坐標(biāo)系系統(tǒng),而我國目前的GIS數(shù)據(jù)采用基于北京54坐標(biāo)系和西安80坐標(biāo)系,兩套系統(tǒng)的地球橢球參數(shù)不同,因此必須對(duì)GPS數(shù)據(jù)進(jìn)行空間坐標(biāo)系的轉(zhuǎn)換。
2.1算法的步驟及流程
GPS數(shù)據(jù)的可靠性是判斷車輛運(yùn)行情況的基礎(chǔ),也是算法要解決的核心問題,而GPS數(shù)據(jù)的精確度與不同地區(qū)的地形特征往往是不同的,因此兩者之間的匹配關(guān)系不能一概而論,需要根據(jù)具體情況分別對(duì)待即實(shí)現(xiàn)車輛導(dǎo)航的智能化。
數(shù)據(jù)與地圖的匹配要求較高的有效性和準(zhǔn)確性,這樣才能真實(shí)、詳實(shí)地反映道路交通,采集的數(shù)據(jù)必須來自于行駛中的車輛。地圖匹配綜合算法的實(shí)現(xiàn)步驟是依照地圖匹配過程的先后順序來進(jìn)行的,首先對(duì)GPS的數(shù)據(jù)進(jìn)行接受與判讀,隨后對(duì)相應(yīng)路段的道路情況進(jìn)行相關(guān)研判。地圖匹配綜合算法的流程圖如圖1所示。
2.2數(shù)據(jù)處理
首先提取一個(gè)出租車浮動(dòng)車大數(shù)據(jù)的數(shù)據(jù)庫文件,通過MicrosoftSQLServer2008ManagementStudio Complete數(shù)據(jù)庫軟件將其打開,共有2個(gè)數(shù)據(jù)庫,分別存放了2010年9月1、2日南京市部分出租車GPS數(shù)據(jù),共33 042 226條數(shù)據(jù)(其中1日18 668 073條、2日14 374 153條)。
2.2.1浮動(dòng)車大數(shù)據(jù)內(nèi)容。數(shù)據(jù)主要存在以下兩方面的問題,一是無測量誤差信息。GPS中上傳的數(shù)據(jù)坐標(biāo)與車輛實(shí)際座標(biāo)相比存在一定誤差,造成誤差的原因包括人為加入的GPS信號(hào)隨機(jī)誤差,信號(hào)在傳輸過程中經(jīng)過障礙物、大氣時(shí)會(huì)發(fā)生折射和反射會(huì)造成時(shí)鐘誤差,因此為了保證上傳數(shù)據(jù)的有效性,必須對(duì)數(shù)據(jù)的誤差進(jìn)行控制。通常GPS設(shè)備根據(jù)所接收的GPS信號(hào)在計(jì)算后除出定位坐標(biāo)外,還將輸出水平定位精度(HDOP,Horizontal Dilution of Precision)和垂直定位精度(VDOP,Vertical Dilution of Precision)等信息,而這些測量誤差信息都沒有被有效地存儲(chǔ)。二是無出租車營運(yùn)相關(guān)信息。出租車的運(yùn)營狀態(tài)是本文研究的對(duì)象之一,同時(shí)出租車作為一種特殊的公共交通工具,其與公交車和其他社會(huì)車輛的差別也可通過運(yùn)營狀態(tài)進(jìn)行研究,也是后續(xù)數(shù)據(jù)處理的重要輸入。當(dāng)出租車處于停運(yùn)、停車待客等特殊運(yùn)營狀態(tài)時(shí),其采集的數(shù)據(jù)并不能反映當(dāng)前道路交通的運(yùn)行情況。因此,需要依據(jù)出租車的運(yùn)營狀態(tài)剔除不可用的定位信息。
圖1 地圖匹配算法流程
2.2.2浮動(dòng)車大數(shù)據(jù)初步處理。為了更好地對(duì)已有的數(shù)據(jù)展開處理,從數(shù)據(jù)庫中提取車輛編號(hào)為“806584008859”,從單輛車的出行行為進(jìn)行分析。從2個(gè)數(shù)據(jù)庫中抽取1 740條、954條相關(guān)數(shù)據(jù)并復(fù)制到Excel中進(jìn)行進(jìn)一步處理。將抽取的浮動(dòng)車大數(shù)據(jù)樣本按照GPSTime升序排列,得出該車按照時(shí)間推移運(yùn)行的狀況。通過觀察抽取的浮動(dòng)車大數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)表中存在一些無效的數(shù)據(jù)和無效的數(shù)據(jù)屬性。為了能夠更好地分析數(shù)據(jù),故將ID、Company ID、ReadFlag、CreateDate四列數(shù)據(jù)對(duì)于浮動(dòng)車大數(shù)據(jù)的地圖匹配并沒有起到作用,因此將這個(gè)屬性刪去(見圖2)。
圖2 數(shù)據(jù)表中無效數(shù)據(jù)的處理
隨機(jī)抽取的數(shù)據(jù)中,存在大部分時(shí)段GPS的定位信息缺失的情況,對(duì)于此類數(shù)據(jù),將其定義為無效數(shù)據(jù)并刪除(見圖3中紅色框)。
圖3 數(shù)據(jù)表中無效數(shù)據(jù)的處理
數(shù)據(jù)的初步處理結(jié)束后,在之后的地圖匹配中,將著重分析如何將有效數(shù)據(jù)段分批次地在地圖上進(jìn)行匹配。
2.3地圖匹配技術(shù)
地圖匹配的實(shí)現(xiàn)主要依靠專業(yè)軟件,對(duì)數(shù)據(jù)和地圖匹配過程中的誤差進(jìn)行修正。該技術(shù)以模式識(shí)別理論為依據(jù),依靠行駛中的機(jī)動(dòng)車輛上傳的數(shù)據(jù),收集機(jī)動(dòng)車GPS測定的行駛路線、車輛位置等地理信息,與導(dǎo)航系統(tǒng)的電子地圖數(shù)據(jù)相比較、匹配,確定車輛所處的地區(qū)或路段方位,并進(jìn)一步判斷車輛具體的位置,并最終進(jìn)行所在位置的定位誤差修正。地圖匹配方法與定位技術(shù)配合使用,能夠極大地提高車輛定位精度,減小定位誤差??梢哉f,地圖匹配算法的效果直接關(guān)系到車輛定位的精度?;谏鲜鎏攸c(diǎn),目前廣泛采用的定位機(jī)制多為無線導(dǎo)航配合地圖匹配算法的綜合定位方法。
2.3.1軟件選用。目前用于地圖匹配的軟件主要有ArcGIS、MapInfo、MapObject、Google Earth等國外知名的地理信息系統(tǒng)處理軟件。但采用相關(guān)軟件進(jìn)行地圖匹配的前提是獲取相關(guān)匹配城市的電子地圖。本項(xiàng)目采用Google Earth進(jìn)行初步地圖匹配。
Google Earth上的全球地貌影像的有效分辨率至少為100m,通常為30m,視角海拔高度為15km左右,但針對(duì)大城市、著名風(fēng)景區(qū)、建筑物區(qū)域會(huì)提供分辨率為1.0m和0.5m左右的高精度影像,視角高度(Eye alt)分別約為500m和350m。
2.3.2地圖匹配算法
①匹配算法的基本原理。地圖匹配可視作由2個(gè)相互獨(dú)立的工作組成:一是確定車輛行駛路段所在位置;二是將車輛行駛路段和定位點(diǎn)的匹配結(jié)合。
確定車輛行駛路段是整個(gè)匹配工作的關(guān)鍵,其基本理論是搜索車輛GPS顯示的車輛行駛路段所在地區(qū)的所有道路,其次將這些道路與GPS反應(yīng)的信息進(jìn)行匹配并計(jì)算出最為相似的路段,隨后即認(rèn)為尋找出的路線為當(dāng)前車輛所在的行駛路線??梢娝阉鬈囕vGPS顯示的車輛行駛路段所在地區(qū)的所有道路是整個(gè)算法的核心內(nèi)容,算法期望達(dá)到的結(jié)果是確定出一個(gè)盡可能小的區(qū)域達(dá)到提高判斷準(zhǔn)確性的效果。反之,相反若算法計(jì)算出的范圍過大,會(huì)對(duì)尋找車輛路徑造成極大的干擾增加不必要的計(jì)算量。
從匹配樣本的分類角度來分析,算法主要包括位置點(diǎn)匹配和軌跡曲線匹配。其中,位置點(diǎn)匹配算法的優(yōu)點(diǎn)是具備較高的時(shí)效性,算法本身也并不復(fù)雜,但相應(yīng)的由于算法簡單所以造成對(duì)復(fù)雜、密集路網(wǎng)的適應(yīng)性較差,若立交橋、隧道等設(shè)施較多,會(huì)降低匹配準(zhǔn)確性。與軌跡點(diǎn)算法相反,軌跡曲線由于算法復(fù)雜所以對(duì)復(fù)雜、密集路網(wǎng)的適應(yīng)性較好,可以更好地應(yīng)對(duì)市政設(shè)施帶來的影響,提高匹配準(zhǔn)確性,但是這種算法的問題是計(jì)算量大,對(duì)數(shù)據(jù)時(shí)效性要求較高,匹配過程較為緩慢。
②直接投影算法。投影法的基本思想就是:搜索距離車輛GPS顯示的車輛當(dāng)前行駛坐標(biāo)最近的道路,隨后將車輛GPS數(shù)據(jù)與該道路進(jìn)行匹配,GPS數(shù)據(jù)所在的那一點(diǎn)坐標(biāo)即是算法默認(rèn)的車輛位置,通過多個(gè)點(diǎn)的測算匹配確定車輛的行駛路線(見圖4)。
圖4 直接投影算法原理
圖4形象地表達(dá)了投影算法的基本思想。P是GPS測定的車輛所在位置,L1和LZ是車輛所在位置附近的路段,把GPS測定的車輛所在位置向附近所有路段做投影,根據(jù)GPS定位點(diǎn)與各路段間的投影距離ri,以及車輛行駛方向與道路間的夾角θi,選出小于給定閥值的所有道路。根據(jù)公式計(jì)算所有道路的距離度量值:
其中,wr和wθ分別是距離和方向夾角的權(quán)值。在所有候選路段中,選擇距離度量值最小的作為匹配路段,即認(rèn)為車輛在該道路上行駛,并將車輛在匹配路段上的投影點(diǎn)作為車輛當(dāng)前的位置。
③經(jīng)緯度導(dǎo)入操作方法。使用MakeKml軟件,將Excel表格中處理過的需要導(dǎo)入的經(jīng)緯度數(shù)據(jù)輸入,并生成<點(diǎn)>KML文件和<線>KML文件。在保存后此時(shí)會(huì)自動(dòng)打開Google Earth軟件,選中其標(biāo)題,即可在Google Earth上顯示導(dǎo)入的經(jīng)緯度點(diǎn),并根據(jù)點(diǎn)初步做出車輛的行駛路徑,如圖5所示。
圖5 在Google Earth中生成的線路及標(biāo)簽
④路徑修正操作。從地圖匹配線路的效果上看,經(jīng)緯度與道路的匹配度還是比較理想的。大多數(shù)標(biāo)簽均定位在路網(wǎng)道路上,且偏移情況不明顯。但從圖6可以看出,Google Earth內(nèi)生成的線路是由兩個(gè)坐標(biāo)點(diǎn)間連線直接生成的。由于提供的定位點(diǎn)數(shù)據(jù)采集間隔為35s,因此若僅靠兩點(diǎn)一線確定走形路線難免會(huì)產(chǎn)生一定的誤差。因此,需要對(duì)其進(jìn)行必要的修正,即在兩個(gè)數(shù)據(jù)點(diǎn)間添加適當(dāng)?shù)臉?biāo)注點(diǎn)以使走形線路更加準(zhǔn)確。
圖6 線路偏移現(xiàn)象
按照上述的線路修正方法,在標(biāo)記點(diǎn)5與標(biāo)記點(diǎn)6之間添加一個(gè)新的坐標(biāo)點(diǎn),使得出租車的走行線路能沿著道路的方向。修正后的走行線路如圖7中橘黃色虛線所示。
圖7 線路偏移修正2
2.4城市出租汽車運(yùn)營基礎(chǔ)指標(biāo)
本次分析先從數(shù)據(jù)庫中選取一輛出租車,研究2個(gè)工作日內(nèi)的高峰時(shí)段(17:30-18:30)與平峰時(shí)段(13:00-14:00)數(shù)據(jù)制成樣本出租汽車運(yùn)營信息表,并進(jìn)行地圖匹配,根據(jù)匹配的結(jié)果結(jié)合出租車信息進(jìn)行分析,得出出租汽車運(yùn)營基礎(chǔ)指標(biāo),對(duì)這些數(shù)據(jù)的分析和統(tǒng)計(jì)可以作為出租汽車運(yùn)營公司的基礎(chǔ)數(shù)據(jù),為進(jìn)行更深層次的數(shù)據(jù)挖掘提供支持。
結(jié)果分析表明,地圖匹配的結(jié)果還是比較符合預(yù)期的,GPS數(shù)據(jù)定位的精確性也較為理想,通過地圖匹配出的對(duì)應(yīng)車輛所行駛過的路線也較為準(zhǔn)確。這對(duì)于后期的浮動(dòng)車大數(shù)據(jù)分析打下了良好的基礎(chǔ)。
在本文所闡述的地圖匹配方法較為簡單,大部分采用人工校正的方法。若今后進(jìn)行深入的研究分析,可考慮選擇MapObject與VB編程軟件結(jié)合,以實(shí)現(xiàn)對(duì)偏移浮動(dòng)點(diǎn)的自動(dòng)修正。在后續(xù)的研究中能解決浮動(dòng)點(diǎn)數(shù)據(jù)自動(dòng)修正的技術(shù)瓶頸,那么在大數(shù)據(jù)處理方面將邁出很大一步,這對(duì)于分析結(jié)果的準(zhǔn)確性有很大幫助。
[1]張周強(qiáng).浮動(dòng)車交通數(shù)據(jù)采集技術(shù)研究[D].上海:同濟(jì)大學(xué),2008.
[2]姜桂艷,張瑋,常安德.基于GPS浮動(dòng)車的交通信息采集系統(tǒng)的數(shù)據(jù)組織方法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2010(2):397-401.
[3]孫曉峰,吳建平.基于浮動(dòng)車數(shù)據(jù)采集技術(shù)的城市交通網(wǎng)絡(luò)功能評(píng)價(jià)方法研究[J].現(xiàn)代交通技術(shù),2005(6):55-58.
The Taxi Large Floating Car Data Map Matching and Analysis
Zhang YiwenZhang BinZhou Xin
(Urban and Rural Planning and Design Institute of Shaanxi Province,Xi'an Shaanxi 710064)
Motor vehicle driving data acquisition system is the latest application of ITS technology in the field of transportation vehicles after the on-board equipment such as GPS,UPS,it can realize the vehicle driving floating data upload real-time transmitted by wireless communication mode to floating car information center.Floating car output dynamic real-time traffic information can be widely services in the transport sector,such as real-time traffic conditions of road can be used as the traffic police department,making the credentials of easing congestion measures can also be used for urban traffic planning,can also provide data base support for urban transportation planning and municipal road construction.
transportation;urban traffic;big data;map matching
U491
A
1003-5168(2016)06-0059-04
2016-05-09
張譯文(1991-),男,碩士,助理工程師,研究方向:城市道路交通規(guī)劃。