呂江波,張永忠
(1.蘭州交通大學(xué),甘肅 蘭州 730070; 2.蘭州市勘察測(cè)繪研究院,甘肅 蘭州 730030)
?
Hadoop支持下海量出租車軌跡數(shù)據(jù)預(yù)處理技術(shù)研究
呂江波1,2,張永忠1,2
(1.蘭州交通大學(xué),甘肅 蘭州730070;2.蘭州市勘察測(cè)繪研究院,甘肅 蘭州730030)
摘要:海量出租車軌跡數(shù)據(jù)預(yù)處理是軌跡數(shù)據(jù)挖掘和應(yīng)用的前提。出租車軌跡數(shù)據(jù)是典型的大數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理技術(shù)無(wú)法解決大規(guī)模出租車軌跡數(shù)據(jù)誤差分析和處理問(wèn)題,文章在分析軌跡數(shù)據(jù)誤差來(lái)源和誤差類型的基礎(chǔ)上,提出基于Hadoop的海量出租車軌跡數(shù)據(jù)預(yù)處理模型,使用Hive實(shí)現(xiàn)軌跡數(shù)據(jù)誤差統(tǒng)計(jì)分析,設(shè)計(jì)MapReduce并行處理程序?qū)崿F(xiàn)軌跡數(shù)據(jù)預(yù)處理。實(shí)驗(yàn)結(jié)果表明,該模型可以有效解決大規(guī)模出租車軌跡數(shù)據(jù)預(yù)處理問(wèn)題,處理方式可靠性較高,大大提高了軌跡數(shù)據(jù)預(yù)處理效率,為后期軌跡數(shù)據(jù)深入挖掘和分析奠定了基礎(chǔ)。
關(guān)鍵詞:軌跡數(shù)據(jù);Hadoop;大數(shù)據(jù);數(shù)據(jù)預(yù)處理;并行計(jì)算
1引言
隨著衛(wèi)星定位技術(shù)、無(wú)線通信技術(shù)和地理信息技術(shù)的迅速發(fā)展,定位設(shè)備在車載以及移動(dòng)終端上得到廣泛使用。許多城市的出租車都裝載了定位設(shè)備,這些設(shè)備會(huì)定時(shí)將其位置信息傳至服務(wù)中心,由此匯聚而成大規(guī)模的出租車軌跡數(shù)據(jù)。這些軌跡數(shù)據(jù)包含大量信息,已經(jīng)開(kāi)始應(yīng)用于很多重要領(lǐng)域,如城市規(guī)劃、智能交通、人類行為模式研究以及能源消耗等。近年來(lái),由鄭宇主導(dǎo)的“城市計(jì)算”,掀起了對(duì)GPS軌跡數(shù)據(jù)處理和分析的熱潮。他們通過(guò)出租車在某區(qū)域的連通性評(píng)判區(qū)域規(guī)劃的好壞;利用出租車軌跡數(shù)據(jù)感知交通流量,為用戶提供最快駕車路線和最佳拼車方案;利用出租車軌跡數(shù)據(jù)為出租車司機(jī)提供最短時(shí)間拉到乘客的方案以及為乘客推薦最可能打到車的地點(diǎn)[1]。童曉君利用出租車軌跡數(shù)據(jù)分析居民出行熱點(diǎn)區(qū)域和出行行為[2]。張富崢利用出租車在加油站等待時(shí)間估計(jì)加油站的排隊(duì)長(zhǎng)度,從而估計(jì)出此時(shí)加油站內(nèi)車輛數(shù)量以及加油量。將全城加油站數(shù)據(jù)匯總,便可以計(jì)算出任意時(shí)刻有多少燃油被消耗掉[3]。與此同時(shí),軌跡數(shù)據(jù)應(yīng)用也面臨著諸多挑戰(zhàn),首先,GPS定位誤差和人為因素導(dǎo)致軌跡數(shù)據(jù)存在許多不合理數(shù)據(jù),這些數(shù)據(jù)嚴(yán)重影響數(shù)據(jù)分析結(jié)果,因此,數(shù)據(jù)預(yù)處理成為軌跡數(shù)據(jù)應(yīng)用首先要解決的問(wèn)題;其次,軌跡數(shù)據(jù)是典型的大數(shù)據(jù),以一個(gè)城市為單元,一天的出租車軌跡數(shù)據(jù)量大小從幾GB到幾十GB不等,多日的數(shù)據(jù)更可達(dá)TB、PB量級(jí),常規(guī)的數(shù)據(jù)處理方式要處理如此大規(guī)模的數(shù)據(jù)幾乎是不可能的,即使勉強(qiáng)可以處理,也需要花費(fèi)很高的時(shí)間成本。大數(shù)據(jù)時(shí)代的到來(lái),為海量軌跡數(shù)據(jù)處理提供了解決方案,Hadoop作為目前主流的開(kāi)源大數(shù)據(jù)分析平臺(tái)之一,為海量數(shù)據(jù)分布式并行處理提供強(qiáng)大的平臺(tái)支撐。Hadoop可以運(yùn)行在廉價(jià)硬件構(gòu)建的計(jì)算機(jī)集群上,能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行可靠的、高效的、可擴(kuò)展的分布式處理。
針對(duì)上述出租車軌跡應(yīng)用中存在的數(shù)據(jù)誤差和數(shù)據(jù)量大難處理兩大問(wèn)題,本文以Hadoop平臺(tái)為基礎(chǔ),通過(guò)分析軌跡數(shù)據(jù)誤差來(lái)源,總結(jié)誤差類型,研究誤差統(tǒng)計(jì)分析方法和處理方法,在此基礎(chǔ)上提出基于Hadoop的軌跡數(shù)據(jù)預(yù)處理模型,實(shí)驗(yàn)證明該模型可以有效分析和處理海量軌跡數(shù)據(jù)誤差,解決軌跡數(shù)據(jù)量大的處理瓶頸,處理方式更加可靠、高效。
2基于Hadoop的出租車軌跡數(shù)據(jù)預(yù)處理模型研究
2.1軌跡數(shù)據(jù)誤差來(lái)源
由于GPS定位本身存在誤差,加之出租車在實(shí)時(shí)動(dòng)態(tài)獲取數(shù)據(jù),道路交通狀態(tài)復(fù)雜性等原因,在海量的出租車軌跡數(shù)據(jù)中存在許多不合理數(shù)據(jù),雖然大數(shù)據(jù)分析中有少許錯(cuò)誤數(shù)據(jù)不會(huì)對(duì)分析結(jié)果產(chǎn)生影響,但也要具體問(wèn)題具體分析,少許的錯(cuò)誤數(shù)據(jù)也會(huì)使結(jié)果相差很多。例如:在計(jì)算出租車行駛距離時(shí),因?yàn)槲恢闷x使用錯(cuò)誤的GPS定位坐標(biāo)計(jì)算的距離肯定相差很多,嚴(yán)重影響計(jì)算結(jié)果。我們將這些導(dǎo)致不合理數(shù)據(jù)的原因大致分為兩類:一類是與GPS設(shè)備有關(guān)的誤差,一類是與人為因素有關(guān)的誤差。
(1)與GPS設(shè)備有關(guān)的誤差。主要有多路徑效應(yīng)誤差、GPS信號(hào)遮擋誤差和GPS設(shè)備故障。多路徑效應(yīng)誤差產(chǎn)生的原因是當(dāng)出租車行駛到有高大建筑物或水面附近時(shí),建筑物和水面對(duì)于電磁波具有強(qiáng)反射作用,產(chǎn)生的反射波進(jìn)入接收天線時(shí)與直接來(lái)自衛(wèi)星的信號(hào)產(chǎn)生干涉,從而使觀測(cè)值偏離真值產(chǎn)生的誤差。GPS設(shè)備因建筑遮擋或外界有較強(qiáng)的電磁干擾等因素導(dǎo)致接收裝置無(wú)法獲取衛(wèi)星信號(hào),隨機(jī)產(chǎn)生與真值相差較大的位置數(shù)據(jù),產(chǎn)生“偏離現(xiàn)象”,這種現(xiàn)象在隧道行駛時(shí)特別嚴(yán)重。GPS設(shè)備出現(xiàn)故障后未及時(shí)排除,設(shè)備采集的位置、時(shí)間和出租車狀態(tài)等信息都會(huì)出現(xiàn)錯(cuò)誤[4]。
(2)與人為因素有關(guān)的誤差,由于司機(jī)關(guān)閉車載設(shè)備,導(dǎo)致GPS數(shù)據(jù)間斷傳輸,這樣數(shù)據(jù)就會(huì)不連續(xù),在關(guān)閉車載設(shè)備的時(shí)間段GPS數(shù)據(jù)空白,在連續(xù)計(jì)算行駛距離或時(shí)間時(shí)出現(xiàn)錯(cuò)誤。司機(jī)未規(guī)范使用計(jì)價(jià)器,導(dǎo)致數(shù)據(jù)中出租車行駛狀態(tài)與實(shí)際不符,分析軌跡數(shù)據(jù)發(fā)現(xiàn)個(gè)別出租車全天的車輛行駛狀態(tài)都是空車或載客,這明顯與實(shí)際不符。
2.2軌跡數(shù)據(jù)誤差分類
通過(guò)對(duì)軌跡樣本數(shù)據(jù)分析,對(duì)計(jì)算結(jié)果產(chǎn)生較大影響的誤差類型有以下幾類:
(1)經(jīng)緯度出界。用經(jīng)緯度描述軌跡點(diǎn)的位置,由于GPS設(shè)備誤差導(dǎo)致軌跡點(diǎn)嚴(yán)重偏離超出研究區(qū)域范圍的數(shù)據(jù)均為不合理數(shù)據(jù)[2]。
(2)采集時(shí)間錯(cuò)誤。主要有時(shí)間格式錯(cuò)誤和時(shí)間無(wú)效。
(3)車輛狀態(tài)錯(cuò)誤。車輛狀態(tài)0表示空駛,1表示載客。如果出租車全天空駛、全天載客或車輛狀態(tài)存在非0或非1的值,則這些都是不合理數(shù)據(jù)[2]。
(4)數(shù)據(jù)丟失。出租車軌跡是由許多在時(shí)間上相對(duì)連續(xù)的軌跡點(diǎn)構(gòu)成,超出 15 min不連續(xù)的軌跡點(diǎn)數(shù)據(jù)應(yīng)該作為兩條軌跡的分割點(diǎn)。
(5)其他軌跡數(shù)據(jù)錯(cuò)誤,主要有瞬時(shí)速度和行駛方向數(shù)值異常等。
2.3Hadoop技術(shù)體系
Hadoop是一個(gè)分布式計(jì)算框架,它能在大量廉價(jià)的硬件設(shè)備組成的集群上運(yùn)行海量數(shù)據(jù)并進(jìn)行分布式計(jì)算。他處理的海量數(shù)據(jù)能達(dá)到PB級(jí)別,并且可以讓應(yīng)用程序在上千個(gè)節(jié)點(diǎn)中進(jìn)行分布式處理。Hadoop優(yōu)點(diǎn)主要有:Hadoop是低成本的,Hadoop是開(kāi)源軟件,這樣就可以降低成本,此外,不必購(gòu)買服務(wù)器級(jí)別的硬件,便可以搭建一個(gè)強(qiáng)大的Hadoop集群;Hadoop是可靠的,它假設(shè)計(jì)算過(guò)程和存儲(chǔ)會(huì)失敗,因此它維護(hù)多個(gè)工作數(shù)據(jù)副本,對(duì)失敗的節(jié)點(diǎn)重新處理;Hadoop是高效的,通過(guò)并行處理加快處理速度;Hadoop還是可伸縮的,如果數(shù)據(jù)量增大或要求提高數(shù)據(jù)處理效率,Hadoop集群可以通過(guò)提升硬件性能或增加節(jié)點(diǎn)數(shù)量實(shí)現(xiàn)擴(kuò)展。Hadoop主要由分布式存儲(chǔ)HDFS和分布式計(jì)算MapReduce兩部分構(gòu)成。HDFS是一個(gè)類似于Google GFS的開(kāi)源分布式文件系統(tǒng),它提供一個(gè)可擴(kuò)展、高可靠、高可用的大規(guī)模數(shù)據(jù)分布式存儲(chǔ)管理系統(tǒng),基于物理上分布在各個(gè)數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)的本地Linux系統(tǒng)的文件系統(tǒng),為上層應(yīng)用程序提供一個(gè)邏輯上成為整體的大規(guī)模數(shù)據(jù)存儲(chǔ)文件系統(tǒng)。MapReduce并行計(jì)算框架是一個(gè)并行化程序執(zhí)行系統(tǒng)。它提供了一個(gè)包含Map和Reduce兩個(gè)階段的并行化處理模型和過(guò)程,提供一個(gè)并行化編程模型和接口,讓程序員可以方便快速地編寫大數(shù)據(jù)并行處理程序。此外,隨著Apache Hadoop系統(tǒng)開(kāi)源化發(fā)展,Hadoop平臺(tái)已經(jīng)演進(jìn)為一個(gè)包含許多相關(guān)子系統(tǒng)的完整的大數(shù)據(jù)處理系統(tǒng),這些子系統(tǒng)有:HBase、Hive、Pig、Zookeeper、Avro等[5~7]。
2.4數(shù)據(jù)預(yù)處理模型
軌跡數(shù)據(jù)誤差不可避免,而且在海量軌跡數(shù)據(jù)中誤差數(shù)據(jù)的總量不容小覷,嚴(yán)重影響計(jì)算結(jié)果。為了剔除海量軌跡數(shù)據(jù)中不合理數(shù)據(jù),提高處理效率,保證分析結(jié)果的正確性,本文提出了基于Hadoop的出租車軌跡數(shù)據(jù)預(yù)處理模型,具體模型如圖1所示:
首先對(duì)原始數(shù)據(jù)進(jìn)行抽樣分析,找出數(shù)據(jù)存在的問(wèn)題,結(jié)合誤差來(lái)源,進(jìn)行誤差分類,誤差分類的結(jié)果是誤差統(tǒng)計(jì)分析和誤差處理的直接依據(jù)。為了處理海量軌跡數(shù)據(jù),該模型運(yùn)行在Hadoop集群上,其中HDFS負(fù)責(zé)數(shù)據(jù)分布式存儲(chǔ),MapReduce負(fù)責(zé)數(shù)據(jù)并行處理。軌跡數(shù)據(jù)源文件通常是由許多小于64 M的小文件組成,為了避免大量小文件引起的Hadoop運(yùn)行效率低問(wèn)題,編寫小文件合并程序,合并后的軌跡文件直接存儲(chǔ)在HDFS上。然后,在Hadoop集群上部署Hive組件,Hive組件管理Hadoop中存儲(chǔ)的數(shù)據(jù),并提供類似SQL的查詢語(yǔ)言,快速實(shí)現(xiàn)數(shù)據(jù)抽取、轉(zhuǎn)換和加載,實(shí)質(zhì)是將用戶定制的類似SQL查詢語(yǔ)言轉(zhuǎn)換為MapReduce程序[6]。根據(jù)誤差分類結(jié)果,使用Hive工具對(duì)軌跡數(shù)據(jù)誤差進(jìn)行統(tǒng)計(jì)分析。最后,針對(duì)各類誤差類型編寫MapReduce數(shù)據(jù)預(yù)處理程序,完成數(shù)據(jù)清洗。MapReduce程序主要有Map函數(shù)和Reduce函數(shù)組成,Map負(fù)責(zé)把任務(wù)分解成多個(gè)任務(wù),Reduce負(fù)責(zé)把分解后多任務(wù)處理的結(jié)果匯總起來(lái),一些簡(jiǎn)單的數(shù)據(jù)預(yù)處理可以交給Map,例如:數(shù)值超界、數(shù)值異常、格式校驗(yàn)等。復(fù)雜一些的數(shù)據(jù)預(yù)處理需要Map和Reduce相互配合。
3應(yīng)用實(shí)例
為了驗(yàn)證本文所提出的基于Hadoop的出租車軌跡數(shù)據(jù)預(yù)處理模型的可行性,以深圳市出租車軌跡數(shù)據(jù)預(yù)處理為應(yīng)用案例進(jìn)行測(cè)試。
3.1數(shù)據(jù)概況
本文采用深圳市13 799輛出租車2011年4月18日~2011年4月26日共9天的軌跡數(shù)據(jù)。軌跡數(shù)據(jù)文件均以車牌號(hào)命名,數(shù)據(jù)文件采用csv格式存儲(chǔ),共 13 799個(gè)文件,約2億條記錄,數(shù)據(jù)量大小約為 11 G。數(shù)據(jù)文件記錄了車牌號(hào)、采集時(shí)間、經(jīng)度、緯度、行駛速度、行駛方向和車輛狀態(tài)。表1為軌跡數(shù)據(jù)文件結(jié)構(gòu),表2為軌跡樣例數(shù)據(jù)。
3.2環(huán)境搭建
本研究使用VMware在一臺(tái)高性能的服務(wù)器上搭建7臺(tái)虛擬機(jī)集群,其中1臺(tái)為主節(jié)點(diǎn),其余6臺(tái)為數(shù)據(jù)節(jié)點(diǎn)。主節(jié)點(diǎn)配置8核中央處理器,8 G內(nèi)存,數(shù)據(jù)節(jié)點(diǎn)配置4核中央處理器,4 G內(nèi)存,操作系統(tǒng)均為64位CentOS7,并行計(jì)算環(huán)境基于Hadoop2.6,在Hadoop上部署hive1.2.1組件[8]。
3.3技術(shù)路線
對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行抽樣查看,發(fā)現(xiàn)存在經(jīng)緯度超界、采集時(shí)間錯(cuò)誤、車輛狀態(tài)錯(cuò)誤和數(shù)據(jù)丟失問(wèn)題,按照上述出租車軌跡數(shù)據(jù)預(yù)處理模型對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理,具體內(nèi)容如下:
(1)由于實(shí)驗(yàn)數(shù)據(jù)是由13 799個(gè)文件組成,單個(gè)文件大小 1 MB左右,為了避免大量小文件引起的Hadoop運(yùn)行效率低問(wèn)題,編寫程序?qū)崿F(xiàn)小文件合并。具體思路是:從本地文件夾中讀取文件,為了保證每行數(shù)據(jù)的完整性按照逐行讀取方式讀取數(shù)據(jù),循環(huán)累計(jì)到單個(gè)文件達(dá)到閾值直接將文件保存到HDFS,新建另一個(gè)文件開(kāi)始輸出,直到所有文件讀取結(jié)束[9,10]。
(2)按照軌跡數(shù)據(jù)誤差類型,分別構(gòu)造經(jīng)緯度超界、采集時(shí)間錯(cuò)誤、車輛狀態(tài)錯(cuò)誤Hive查詢規(guī)則,并在Hadoop集群上運(yùn)行,統(tǒng)計(jì)各類誤差類型總數(shù),抽取錯(cuò)誤數(shù)據(jù)樣例。
(3)針對(duì)各類誤差數(shù)據(jù),編寫MapReduce并行處理程序剔除這些不合理數(shù)據(jù)。軌跡大數(shù)據(jù)分析時(shí)經(jīng)常需要進(jìn)行路徑分析,數(shù)據(jù)丟失問(wèn)題會(huì)導(dǎo)致路徑起始點(diǎn)錯(cuò)誤,需要單獨(dú)編寫程序進(jìn)行處理,本次實(shí)驗(yàn)處理的方法是將超出 15 min不連續(xù)的軌跡點(diǎn)作為兩條軌跡的分割點(diǎn)。
3.4實(shí)驗(yàn)結(jié)果
根據(jù)上述技術(shù)路線,對(duì)深圳市13 799輛出租車9天的軌跡數(shù)據(jù)進(jìn)行預(yù)處理,分析得出,錯(cuò)誤數(shù)據(jù)約占6.68%,其中車輛狀態(tài)錯(cuò)誤約占6.21%,經(jīng)緯度出界約占0.4%,采集時(shí)間錯(cuò)誤約占0.08%。編寫數(shù)據(jù)預(yù)處理程序共剔除1.14千萬(wàn)條錯(cuò)誤數(shù)據(jù),耗時(shí)約 10 min。實(shí)驗(yàn)證明基于Hadoop的出租車軌跡數(shù)據(jù)預(yù)處理模型可以有效處理大規(guī)模軌跡數(shù)據(jù)中的常見(jiàn)的錯(cuò)誤數(shù)據(jù),運(yùn)行可靠性較高,大大提高了軌跡數(shù)據(jù)預(yù)處理效率。實(shí)驗(yàn)數(shù)據(jù)誤差統(tǒng)計(jì)分析結(jié)果如表3所示。
4結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代的到來(lái)給海量出租車軌跡數(shù)據(jù)分析和應(yīng)用提供了可能,而Hadoop作為目前重要的并行計(jì)算平臺(tái),為大數(shù)據(jù)的存儲(chǔ)、管理和處理提供了技術(shù)支撐。本文認(rèn)真分析了軌跡數(shù)據(jù)誤差來(lái)源,對(duì)軌跡數(shù)據(jù)誤差類型進(jìn)行分類,在此基礎(chǔ)上,結(jié)合Hadoop并行計(jì)算平臺(tái),提出基于Hadoop的出租車軌跡數(shù)據(jù)預(yù)處理模型。最后,本文對(duì)所提出的模型進(jìn)行了驗(yàn)證。實(shí)驗(yàn)表明,該模型可以有效解決海量軌跡數(shù)據(jù)預(yù)處理問(wèn)題,為后期軌跡數(shù)據(jù)深入挖掘和分析奠定了基礎(chǔ)。
參考文獻(xiàn)
[1]王詔遠(yuǎn),李天瑞,程堯等. 基于經(jīng)驗(yàn)分布的打車概率和等待時(shí)間預(yù)測(cè)[J]. 計(jì)算機(jī)工程與應(yīng)用,2015(24):254~259.
[2]童曉君. 基于出租車GPS數(shù)據(jù)的居民出行行為分析[D]. 長(zhǎng)沙:中南大學(xué),2012.
[3]Zhang,F(xiàn)uzheng,et al. “Sensing the pulse of urban refueling behavior.”Proceedings of the 2013 ACM international joint conference on Pervasive and ubiquitous computing ACM,2013:13~22.
[4]溫雅靜. 基于熱點(diǎn)載客區(qū)域的出租車應(yīng)急調(diào)度方案研究[D]. 北京:北京交通大學(xué),2014.
[5]黃宜華,苗凱翔. 深入理解大數(shù)據(jù)、大數(shù)據(jù)處理與編程實(shí)踐[M]. 北京:機(jī)械工業(yè)出版社,2014:31~36.
[6]萬(wàn)川梅,謝正蘭. Hadoop應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn)詳解[M]. 北京:中國(guó)鐵道出版社,2013:11~21.
[7]Chuck Lam. Hadoop in Action[M]. 北京:人民郵電出版社,2011:2~5.
[8]張巖,郭松,趙國(guó)海. 基于Hadoop的云計(jì)算試驗(yàn)平臺(tái)搭建研究[J]. 沈陽(yáng)師范大學(xué)學(xué)報(bào)·自然科學(xué)版,2013(1):85~89.
[9]陳光景. Hadoop小文件處理技術(shù)的研究和實(shí)現(xiàn)[D]. 南京:南京郵電大學(xué),2013.
[10]張丹. HDFS中文件存儲(chǔ)優(yōu)化的相關(guān)技術(shù)研究[D]. 南京:南京師范大學(xué),2013.
Based on the Hadoop Massive Taxi Trajectory Data Preprocessing Technology Research
Lv Jiangbo1,2,Zhang Yongzhong1,2
(1.Lanzhou Jiaotong University,Lanzhou 730070,China;2.Lanzhou Surveying and Mapping Research Institute,Lanzhou 730030,China)
Key words:trajectory data;hadoop;big data;data preprocessing;parallel computing
Abstract:Massive taxi trajectory data preprocessing is the precondition of trajectory data mining and the application. Taxi trajectory data is a typical big data,the traditional data processing technology can not solve the problem of large scale taxi track data error analysis and preprocessing,on the basis of analyzing the trajectory data error source and error type,study of mass trajectory error statistical analysis method and data processing method,the taxi trajectory data preprocessing model based on Hadoop is put forward,using the hive for the realization of the trajectory error statistics,design MapReduce parallel processing procedures for the realization of trajectory data preprocessing. Experimental results show that,the model can effectively solve the problem of large scale taxi trajectory data preprocessing,high reliability,greatly improve the efficiency of the trajectory data preprocessing,late for trajectory data digging and analysis laid a foundation.
文章編號(hào):1672-8262(2016)03-46-04
中圖分類號(hào):P208.1
文獻(xiàn)標(biāo)識(shí)碼:B
*收稿日期:2016—03—04
作者簡(jiǎn)介:呂江波(1989—),男,碩士研究生,主要研究方向:GIS應(yīng)用與開(kāi)發(fā)。