亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于圖數(shù)據(jù)庫的公交出行行為分析

        2019-07-25 02:25:18屈新明丘建棟譚章智董紹軒
        智能城市 2019年13期
        關(guān)鍵詞:公交站點公交線路刷卡

        屈新明 郭 鵬 丘建棟 譚章智 董紹軒

        (1. 深圳市城市交通規(guī)劃設計研究中心有限公司,廣東 深圳 518021;2. 中交第二公路勘察設計研究院有限公司,湖北 武漢 430056)

        關(guān)鍵字:圖數(shù)據(jù)庫;Neo4j;IC卡數(shù)據(jù);公交出行行為

        近年來隨著大數(shù)據(jù)挖掘分析技術(shù)的快速發(fā)展,在各領域處理復雜網(wǎng)狀關(guān)系的挖掘分析需求逐漸增加[1]。在面向復雜場景下數(shù)據(jù)關(guān)聯(lián)挖掘分析中,主流的關(guān)系型數(shù)據(jù)庫并不是都適用于場景分析,尤其是在多維關(guān)聯(lián)查詢分析時,關(guān)系型數(shù)據(jù)庫效率較低[2]。隨著圖數(shù)據(jù)庫的快速發(fā)展[3-5],為數(shù)據(jù)挖掘分析提供了新的解決方案。郝培豪[6]研究分析了圖數(shù)據(jù)庫的警務安保知識圖譜可視化分析;康杰華[7]研究分析了圖形數(shù)據(jù)庫Neo4j的RDF數(shù)據(jù)存儲;柴博[8]等人研究分析了基于圖數(shù)據(jù)庫的電力通信網(wǎng)絡運行方式建模;張蕓蕓[9]等人研究了基于Neo4j圖譜的信用卡欺詐檢測。

        目前圖數(shù)據(jù)庫在交通中的應用較少,在公交出行行為分析方面,游婷[10]等人研究了基于公交IC卡信息的公交客流推算;孫世超[11]研究基于宏微觀數(shù)據(jù)嵌套的公交用戶細分方法;秦政[12]研究基于公交IC卡和GPS數(shù)據(jù)的乘客上下車站點提??;馬曉磊[13]研究了基于公交IC卡數(shù)據(jù)的上車站點推算。

        本文將探索圖數(shù)據(jù)庫在公交出行行為分析中的應用,利用Neo4j圖數(shù)據(jù)庫對深圳市某一工作日的公交刷卡數(shù)據(jù),公交線路數(shù)據(jù)進行建模分析,挖掘識別公交出行行為,并對比分析了相同分析場景下ORACLE數(shù)據(jù)庫與Neo4j圖數(shù)據(jù)庫的查詢效率。

        1 圖數(shù)據(jù)庫簡介

        1.1 圖數(shù)據(jù)庫介紹

        圖數(shù)據(jù)庫是基于圖形理論實現(xiàn)的一種非關(guān)系型數(shù)據(jù)庫,它的底層數(shù)據(jù)存儲和與查詢方式都是以圖論為基礎,其中圖論中的基礎元素為節(jié)點和節(jié)點之間的邊,在圖數(shù)據(jù)庫中對應的就是節(jié)點和關(guān)系。圖形數(shù)據(jù)庫作為一種非關(guān)系型數(shù)據(jù)庫,將結(jié)構(gòu)化數(shù)據(jù)存儲在網(wǎng)絡 (圖) 上而不是關(guān)系型數(shù)據(jù)庫中的表,常見的有Neo4j、FlockDB、AllegroGraph、GraphDB、InfiniteGraph、TigerGraph、騰訊星圖等。Neo4j是由Java實現(xiàn)的開源圖數(shù)據(jù)庫,實現(xiàn)了專業(yè)數(shù)據(jù)庫界別的圖數(shù)據(jù)模型存儲,并提供完整的數(shù)據(jù)庫特性,是目前生產(chǎn)環(huán)境中主流的圖數(shù)據(jù)庫引擎,由于開源特性及其豐富的文檔,本文將使用Neo4j構(gòu)建公交出行圖數(shù)據(jù)庫場景。

        1.2 圖數(shù)據(jù)庫與關(guān)系型數(shù)據(jù)庫的區(qū)別

        關(guān)系型數(shù)據(jù)庫與Neo4j建庫示意如圖1所示。

        圖1 關(guān)系型數(shù)據(jù)庫與Neo4j建庫示意

        關(guān)系型數(shù)據(jù)庫通過外鍵記錄兩個表或者多個表之間的引用關(guān)系,在進行關(guān)聯(lián)查詢時通過外鍵在主表中尋找對應的主鍵記錄進行數(shù)據(jù)搜索與匹配計算操作,關(guān)聯(lián)查詢時將會耗費大量系統(tǒng)計算資源,尤其是在多表關(guān)聯(lián)查詢場景下查詢效率極低。關(guān)系型數(shù)據(jù)庫中多對多關(guān)系需要使用中間表,查詢效率進一步下降。圖數(shù)據(jù)庫使用圖論存儲節(jié)點和節(jié)點之間的關(guān)系,而每個節(jié)點都包含對應的關(guān)系列表,用于存放該節(jié)點與其他節(jié)點的關(guān)系,節(jié)點之間的關(guān)聯(lián)挖掘分析直接基于圖論進行搜索分析,在復雜數(shù)據(jù)挖掘分析效率上遠高于關(guān)系型數(shù)據(jù)庫。

        2 公交出行行為場景建模

        2.1 基礎數(shù)據(jù)

        基礎數(shù)據(jù)為公交線路Busline表和公交刷卡記錄IC_card_record表,其中,Busline表包含了深圳市約1 000條公交線路對應站點數(shù)據(jù),IC_card_record表為深圳市某個工作日約300萬條刷卡記錄,刷卡記錄已經(jīng)匹配下車站點信息。公交線路如表1所示,公交刷卡記錄如表2所示。

        表1 公交線路表

        表2 公交刷卡記錄表

        2.2 建??蚣?/h3>

        將公交出行行為關(guān)聯(lián)數(shù)據(jù)抽象成如圖2所示的建??蚣堋?/p>

        圖2 公交出行行為場景建??蚣?/p>

        其中實體包含:公交車輛、 公交站點、公交線路、IC卡(公交出行者)、刷卡記錄;關(guān)系包含:公交車輛—公交線路(屬于)、公交線路-公交站點(經(jīng)過)、IC卡-刷卡出行(出行)、公交站點-刷卡出行(上車)、公交站點-公交站點(相鄰)、刷卡出行-公交站點(下車),場景建模規(guī)模達到5 00萬節(jié)點,1 000萬條邊。

        2.3 節(jié)點建模

        將原始數(shù)據(jù)兩張表轉(zhuǎn)為圖數(shù)據(jù)庫對應的節(jié)點,其中數(shù)據(jù)表中的一條記錄對應圖數(shù)據(jù)庫中的一個節(jié)點,整個數(shù)據(jù)表對應圖數(shù)據(jù)庫中某一節(jié)點集合(標簽)。

        公交車輛實體:從IC_card_record表中提取vehicle標簽(去重),單個節(jié)點僅包含vehicle_id屬性。

        公交線路實體:從busline表中提取line標簽,單個節(jié)點包含line_id、line_name、dir、line_dir_name等屬性。

        公交站點實體:從busline表中提取station標簽,單個節(jié)點包含:station_id、station_name、lng、lat等屬性。

        刷卡記錄實體: 從ride表中提取ride標簽, 單個節(jié)點包含:ride_id、card_id兩個屬性。

        IC卡標簽實體:從IC_card_record表中提取card標簽(去重),單個節(jié)點僅包含card_id屬性。

        2.4 關(guān)系建模

        根據(jù)基礎數(shù)據(jù)中的兩張表處理節(jié)點之間的對應關(guān)系。

        公交車輛—>公交線路(屬于關(guān)系):從IC_card_record表中提取公交車輛與公交線路的屬于關(guān)系(去重),關(guān)系匹配字段為vehicle_id—>line_id。

        公交線路—>公交站點(經(jīng)過關(guān)系):從busline表中描述了每條公交線路經(jīng)過公交站點的關(guān)系,關(guān)系匹配字段為line_id—>station_id,關(guān)系屬性包含station_index。

        公交站點—>刷卡記錄(上車關(guān)系):從IC_card_record表中提取公交站點與刷卡記錄的上車關(guān)系,匹配字段為station_id—>ride_id, 關(guān) 系 屬 性 包 含line_id,up_station_index,up_day,up_min。

        刷卡記錄—>公交站點(下車關(guān)系):從IC_card_record表中提取刷卡記錄與公交站點的下車關(guān)系,匹配字段為ride_id—> station_id,關(guān)系屬性包含line_id、down_station_index、down_day、down_min。

        IC卡—>刷卡記錄(出行關(guān)系):從IC_card_record表中提取IC卡與刷卡記錄出行關(guān)系,匹配字段為card_id—>card_id。

        公交站點-公交站點(相鄰):從busline表中根據(jù)經(jīng)緯度坐標記錄公交站點之間的相鄰關(guān)系,匹配字段為station_id—station_id。

        3 公交出行行為分析

        3.1 同乘人員識別

        識別提取早高峰遠距離同乘人員,根據(jù)圖數(shù)據(jù)庫挖掘分析早高峰(7:30~9:00)、長距離(大于10個站)的同乘人員(同一站點上車、同一站點下車)情況。同乘人員識別分析結(jié)果如表3所示。

        表3 同乘人員識別分析結(jié)果

        分析結(jié)果表明,早高峰乘坐公交長距離出行到科技園站的人較多,可以進一步優(yōu)化預約巴士地到發(fā)班次。

        3.2 站點最大公交客流提取識別

        提取識別全天點對點最大公交客流情況,支撐公交站點線路優(yōu)化,其中采用ORACLE查詢時間為3.214 s,Neo4j查詢時間為25.637 s,單表之間的查詢中Neo4j性能低于ORACLE數(shù)據(jù)庫。站點最大客流提取識別如表4所示。

        表4 站點最大客流提取識別

        3.3 關(guān)聯(lián)查詢識別

        在Neo4j中進行多表關(guān)聯(lián)查詢,查詢科技園公交站周邊鄰近站點經(jīng)過的各條公交線路擁有的車輛數(shù),用于提取各公交線路運行車輛數(shù)。關(guān)聯(lián)查詢識別如表5所示,關(guān)聯(lián)識別框架如圖3所示。

        表5 關(guān)聯(lián)查詢識別

        圖3 關(guān)聯(lián)識別框架

        其中,采用ORACLE查詢時間為2.403 s,Neo4j查詢時間為0.142 s,多維關(guān)聯(lián)查詢中Neo4j性能遠高于ORACLE數(shù)據(jù)庫。

        3.4 站點群之間的公交出行量識別

        根據(jù)站點之間的鄰近關(guān)系,識別提取公交站點群之間的公交出行量,支撐預約巴士開通與線路優(yōu)化。直接通過ORACLE數(shù)據(jù)庫無法單獨完成查詢檢索,基于Neo4j可直接查詢,得到分析結(jié)果。公交站點群之間的出行量識別結(jié)論如圖4所示。

        圖4 公交站點群之間的出行量識別結(jié)論

        4 結(jié)語

        本文基于圖數(shù)據(jù)庫Neo4j構(gòu)建了公交出行行為分析場景建模,對深圳市1 000條公交線路,一天工作日的公交刷卡數(shù)據(jù)進行建模分析,建模規(guī)模達到500萬節(jié)點,1 000萬條邊。在不同的公交出行行為場景分析中對比分析了ORACLE數(shù)據(jù)庫與Neo4j的查詢性能,多維關(guān)聯(lián)查詢中Neo4j性能遠高于ORACLE數(shù)據(jù)庫,基于圖數(shù)據(jù)庫可以方便高效實現(xiàn)復雜數(shù)據(jù)的關(guān)聯(lián)挖掘分析。

        本文僅對深圳市一天工作日的公交刷卡數(shù)據(jù)進行建模分析,后續(xù)將構(gòu)建更為復雜建模場景,構(gòu)建交通知識圖譜。

        猜你喜歡
        公交站點公交線路刷卡
        合肥市高鐵南站公交線路優(yōu)化研究
        世界家苑(2020年5期)2020-06-15 11:13:34
        基于GIS的哈爾濱市118路公交站點選址優(yōu)化
        刷卡
        成長日記
        對十堰市城區(qū)公交站點命名情況的調(diào)查與思考
        青島至萊西全國首條純電動城際公交線路開通 移動的環(huán)?!跋洹?綠色出行有保障
        城市軌道交通車站聯(lián)合配置短駁道路公交線路的方法
        刷臉就可以購物
        奧秘(2014年8期)2014-08-30 06:32:04
        桂林市公交線路優(yōu)化的調(diào)查研究分析
        公交站點命名規(guī)則分析
        国产亚洲中文字幕一区| 国产成人a在线观看视频免费 | 在线观看国产激情视频| 日韩中文字幕版区一区二区三区| 精品国产精品三级精品av网址| 毛片亚洲av无码精品国产午夜| a在线免费| 久久91精品国产91久久麻豆| 日本久久一区二区三区高清| 亚洲一区二区三区地址| 东北老女人高潮大喊舒服死了| 日韩插啊免费视频在线观看| 巨大欧美黑人xxxxbbbb| 国产在亚洲线视频观看| 亚洲精品综合一区二区| 日韩精品视频在线观看无| 成午夜精品一区二区三区| 在线观看免费午夜大片| 99热成人精品国产免| 日韩亚洲精选一区二区三区| 日韩高清不卡一区二区三区| 午夜理论片yy44880影院| 亚洲国产成人91| 久久婷婷夜色精品国产| 美艳善良的丝袜高跟美腿| 肉体裸交137日本大胆摄影| 国产午夜三级一区二区三| 91精品欧美综合在线观看| 精品黄色一区二区三区| 亚洲av永久无码精品网站| 中文字幕乱码免费视频| 91尤物在线看| 中文字幕一区二区三区综合网| 日本av一区二区三区视频| 午夜理论片yy6080私人影院| 亚洲欧美日韩人成在线播放 | 国产精品国产自线拍免费| 亚洲精品综合久久国产二区| 亚洲高清国产一区二区| 日韩精品久久无码中文字幕 | 国产在线观看入口|