亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于分布式3D R-Tree索引的軌跡查詢方法研究

        2022-02-16 12:10:08王麗明
        無線互聯(lián)科技 2022年23期
        關(guān)鍵詞:時延分區(qū)時空

        王麗明,熊 文

        (云南師范大學(xué) 信息學(xué)院,云南 昆明 650000)

        0 引言

        隨著現(xiàn)代城市公共交通系統(tǒng)的發(fā)展,數(shù)以十萬計的出租車、網(wǎng)約車和公共汽車每天為城市居民提供日常出行服務(wù)。這些車輛均部署了GPS終端設(shè)備,時刻采集并上報車輛的GPS軌跡數(shù)據(jù)。如何管理和分析這些軌跡數(shù)據(jù),用來提升運營水平和服務(wù)質(zhì)量是管理部門面臨的首要問題。如何對數(shù)以億計的GPS軌跡進(jìn)行索引和快速響應(yīng)是一個極具挑戰(zhàn)的難題。

        對于GPS軌跡的存儲和查詢,通常采用構(gòu)建索引等方法來提高查詢效率。Ding[1]利用時空索引(ST-Index)和連接索引(Con-Index)減少軌跡數(shù)據(jù)冗余的訪問操作。Hanan[2]使用遞歸分解的四叉樹建立索引,當(dāng)節(jié)點達(dá)到最大容量時,可以進(jìn)行分裂,缺點是如果對象分布不均勻,將會形成不平衡四叉樹,導(dǎo)致查詢效率急劇下降。此外,還有一些R-Tree的改進(jìn)版本,如IR2-Tree[3],利用疊加文本和R-Tree相結(jié)合來處理指定位置和關(guān)鍵字的查詢。

        這些方法都在單節(jié)點實現(xiàn),在數(shù)據(jù)規(guī)模較小時可以較好地解決查詢效率的問題。但是,當(dāng)數(shù)據(jù)規(guī)模上升以后,這些方法性能會持續(xù)下降。因此,本研究嘗試借助大數(shù)據(jù)和分布式索引來解決該問題。本文借助大數(shù)據(jù)計算引擎的Spark的核心組件RDD,對3D R-tree[4]進(jìn)行分布式的實現(xiàn),并使用3個經(jīng)典查詢,包括軌跡點、子串和區(qū)域查詢,分析運行時間并對比了空間網(wǎng)格分區(qū)和時空網(wǎng)格分區(qū)方法下3種查詢類型的性能。

        1 背景與動機(jī)

        以深圳市為例,截至2019年12月,該市擁有公交車1.9萬輛,巡游出租車3萬輛,網(wǎng)約車8萬輛。假設(shè)每輛車每30 s產(chǎn)生一條GPS記錄。這些車輛每天可以產(chǎn)生3.7億條GPS記錄。傳統(tǒng)的索引方式在單機(jī)環(huán)境下顯然沒有能力處理如此規(guī)模的GPS軌跡數(shù)據(jù)。因此,本研究嘗試借助Spark的RDD組件構(gòu)建分布式的時空索引來應(yīng)對大規(guī)模軌跡查詢需求。

        經(jīng)典軌跡查詢有軌跡點、子串和區(qū)域查詢。本文對軌跡點查詢形式化定義如下:給定一個軌跡集合S,一個查詢時間范圍T=,一個查詢點q。點查詢返回所有滿足以下條件的軌跡tri∈S:tri中至少存在一個GPS點pk產(chǎn)生于時間范圍T內(nèi)且等于q。如式(1)所示:

        Point_query(S,T,q)={tri∈S|?pk∈tri^

        pk=q,timemin≤pk.t≤timemax}

        (1)

        本文對子串查詢形式化定義如下:給定一個軌跡集合S,一個查詢時間范圍T=,一條查詢軌跡q。子串查詢返回所有滿足以下條件的軌跡tri∈S:對于每一個pk∈q,均有pk∈tri,且GPS點pk產(chǎn)生于時間范圍T內(nèi)。如式(2)所示:

        Substring_query(S,T,q)={tri∈S|q?tri^

        pk∈q,timemin≤pk.t≤timemax}

        (2)

        本文對區(qū)域查詢形式化定義如下:給定一個軌跡集合S,一個查詢時間范圍T=,一個經(jīng)緯度范圍q=。區(qū)域查詢返回所有滿足以下條件的軌跡tri∈S:tri中至少存在一個GPS點pk產(chǎn)生于時間范圍T和經(jīng)緯度范圍q內(nèi)。如式(3)所示:

        Range_query(S,T,q)={tri∈S|?pk∈tri,

        timemin≤pk.t≤timemax^latmin≤pk.lat≤

        latmax^lngmin≤pk.lng≤lngmax}

        (3)

        2 數(shù)據(jù)預(yù)處理

        車輛所處的位置例如隧道、高樓對信號傳輸影響,以及由GPS設(shè)備自身測量精度導(dǎo)致的局限,導(dǎo)致GPS軌跡數(shù)據(jù)質(zhì)量存在一定的偏差。具體表現(xiàn)是車輛軌跡中部分GPS點不在對應(yīng)的路網(wǎng)上。因此,需要對GPS軌跡進(jìn)行校準(zhǔn),本文使用FMM[5]方法對GPS數(shù)據(jù)進(jìn)行地圖匹配。

        3 索引的建立

        3.1 數(shù)據(jù)分區(qū)

        RDD是一個分布式的數(shù)據(jù)結(jié)構(gòu),以一個分區(qū)規(guī)則將數(shù)據(jù)集合劃分為多個分區(qū)。本研究建立分布式索引,以實現(xiàn)大規(guī)模軌跡數(shù)據(jù)查詢。本研究使用空間網(wǎng)格和時空網(wǎng)格兩種分區(qū)方法。

        3.2 空間索引

        空間索引是指將空間對象按一定的規(guī)則進(jìn)行排列組織,在查詢時可以篩選掉大量與特定對象無關(guān)的空間對象,提高查詢的速度。本文建立全局索引和局部索引,劃分全局索引的依據(jù)是軌跡所在的網(wǎng)格編號,每個RDD分區(qū)存儲軌跡的部分片段。在每個分區(qū)內(nèi)部對軌跡數(shù)據(jù)構(gòu)建3D R-tree為局部索引。查詢時,通過全局索引定位局部索引,在局部索引樹中執(zhí)行具體查詢。

        4 實驗結(jié)果與分析

        4.1 數(shù)據(jù)集

        本次實驗的數(shù)據(jù)集是以深圳市30 747輛出租車?yán)塾嬕恢艿腉PS軌跡數(shù)據(jù),約2.97億條數(shù)據(jù),來建立索引和進(jìn)行查詢。

        4.2 實驗對比

        測試在兩種分區(qū)方法下,位于大鵬區(qū)、坪山區(qū)、龍華區(qū)、龍崗區(qū)和南山區(qū)的軌跡點查詢時延。查詢時延是指從提交查詢請求到返回查詢結(jié)果所消耗的時間。結(jié)果如圖1所示,在不同位置查詢,時延不同。在空間網(wǎng)格分區(qū)方式下,綜合平均時延為2.79 s。在時空網(wǎng)格分區(qū)方式下,綜合平均時延為2.33 s。

        圖1 軌跡點查詢

        測試在兩種分區(qū)方式下,子串查詢長度分別為5,10,15,20,25個軌跡點時,子串查詢所需的查詢時延。結(jié)果如圖2所示,在空間網(wǎng)格方法下,查詢分別需要1.42 s、4.32 s、4.48 s、4.75 s、4.81 s,綜合平均時延為3.96 s。在時空網(wǎng)格分區(qū)方式下,查詢分別需要1.35 s、3.73 s、3.80 s、3.84 s、3.96 s,綜合平均時延為3.33 s。查詢時延都隨著查詢子串長度變長而變長。

        圖2 子串查詢

        測試在兩種分區(qū)方式下,區(qū)域查詢范圍分別為1×1 km2、2×2 km2、3×3 km2、4×4 km2、5×5 km2時,統(tǒng)計查詢所需時間。結(jié)果如圖3所示,空間網(wǎng)格方法查詢,分別需要13.79 s、14.04 s、14.36 s、14.93 s、15.33 s,綜合平均時延為14.49 s。在時空網(wǎng)格分區(qū)方式下,查詢分別需要2.90 s、4.89 s、6.43 s、8.62 s、11.57 s,綜合平均時延為6.88 s。查詢時延都隨著查詢范圍的擴(kuò)大而變長。

        圖3 區(qū)域查詢

        5 結(jié)語

        本文利用Spark平臺實現(xiàn)了基于3D R-Tree的出租車軌跡數(shù)據(jù)查詢,對比了空間網(wǎng)格和時空網(wǎng)格兩種分區(qū)方式。實驗表明,在軌跡點查詢下,不同的位置查詢時延不同;在子串查詢下,查詢軌跡長度越長,查詢時延越長;在區(qū)域查詢下,查詢的范圍越大,查詢時延越長;用時空網(wǎng)格分區(qū)方法比用空間網(wǎng)格分區(qū)方法的查詢時延短。在下一步的工作中,本研究計劃在Spark streaming流式處理框架實現(xiàn)基于3D R-tree的流式軌跡數(shù)據(jù)查詢。

        猜你喜歡
        時延分區(qū)時空
        跨越時空的相遇
        上海實施“分區(qū)封控”
        鏡中的時空穿梭
        基于GCC-nearest時延估計的室內(nèi)聲源定位
        電子制作(2019年23期)2019-02-23 13:21:12
        玩一次時空大“穿越”
        基于改進(jìn)二次相關(guān)算法的TDOA時延估計
        浪莎 分區(qū)而治
        FRFT在水聲信道時延頻移聯(lián)合估計中的應(yīng)用
        時空之門
        基于分段CEEMD降噪的時延估計研究
        亚洲Av午夜精品a区| 医院人妻闷声隔着帘子被中出| 曰本大码熟中文字幕| 在线播放a欧美专区一区| 国产一区二区三区亚洲精品| 一区二区二区三区亚洲| 亚洲国产精品无码中文字 | 日韩狼人精品在线观看| 国产在线91精品观看| 亚洲图片日本视频免费| 亚洲在AV极品无码天堂手机版 | 亚洲免费人成网站在线观看 | 国产性生交xxxxx免费| 久久成人永久免费播放| 中文字幕人妻久久一区二区三区 | 国产乱子伦农村xxxx| 欧美喷潮系列在线观看| 国产精品专区一区二区av免费看| 日本中文一区二区在线| 午夜性无码专区| 亚洲电影一区二区三区| 青青草好吊色在线视频| 日本真人边吃奶边做爽动态图| 日日噜噜噜夜夜爽爽狠狠| 亚洲色拍拍噜噜噜最新网站 | 水蜜桃亚洲一二三四在线| 日本加勒比东京热日韩| 高清国产亚洲精品自在久久| 亚洲香蕉成人av网站在线观看| 丰满多毛少妇做爰视频| 熟女人妻中文字幕一区| 日韩精品第一区二区三区| 国产精品夜间视频香蕉| 国产在线一区二区三区av| 亚洲av永久一区二区三区| 亚洲日韩精品一区二区三区| 一本色道久久99一综合| 精品少妇白浆一二三区| 久久婷婷五月综合色高清| 成人小说亚洲一区二区三区| 亚洲AV日韩AV高潮喷潮无码|