亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于出租車運營數據和POI數據的出行目的識別

        2018-10-29 05:05:30羅孝羚蔣陽升
        關鍵詞:特征方法

        羅孝羚,蔣陽升*

        (西南交通大學a.交通運輸與物流學院;b.綜合交通大數據應用技術國家工程實驗室,成都610031)

        0 引 言

        出租車乘客的出行目的是交通調查中的重要內容,其對城市功能結構規(guī)劃,城市道路網絡規(guī)劃,交通組織設計及優(yōu)化具有重要的意義.傳統(tǒng)出租車乘客出行目的調查方式主要有旅行日記調查、電話調查、小組調查等人工調查方式[1-3].傳統(tǒng)的調查方式要求前期準備、試點調查、實地調查、調查結果整理和錄入,需要耗費大量的人力和物力.

        近年來隨著信息設備在交通領域的廣泛應用,使得一些原始的交通數據得以自動傳輸到數據庫系統(tǒng),并保存下來.在這樣的背景下,利用已有的原始數據,獲取有價值的交通信息成為研究熱點.如公交數據方面有:利用公交車IC卡數據分析票價結構[4-5],利用公交GPS數據分析公交車運營服務可靠性[6],融合IC卡數據和GPS數據獲取乘客出行需求[7-12].出租車數據有:利用出租車運營數據分析路段行程時間和速度[13-15],利用出租車GPS數據分析運營效率[16].地鐵數據有:利用地鐵數據對地鐵運營現狀進行分析[17-18].這些研究都說明通過有效的技術手段對一些已有的數據進行挖掘,能夠快速有效地獲取有價值的交通信息,相比于傳統(tǒng)的人工調查方式,這種方式能夠節(jié)約大量的人力物力.

        通過上述分析可知,傳統(tǒng)的出租車出行目的調查需要耗費大量人力物力的問題.為了解決該問題,結合數據挖掘技術,本文通過融合出租車運營數據及地圖的爬蟲數據,實現出租車乘客出行目的的識別.

        1 數據分析及處理

        1.1 出租車運營數據

        本文中所用到的成都市出租車數據包含的主要字段為:車輛ID編號,每次觸發(fā)GPS設備時的時刻,以及在當前時刻下車輛所處位置的經緯度且是否有乘客在車上.表1為成都市出租車的部分運營信息表.

        表1 成都出租車數據庫系統(tǒng)記錄數據Table 1 Recorded data in database system of Chengdu taxi

        1.2 調查數據

        由于需要訓練識別模型和檢驗所訓練的模型對出行目的識別的準確性,因此我們對成都市區(qū)域的乘客進行了抽樣問卷調查,主要的調查內容是乘客的出行目的和出行特征.

        在調查數據之后,需要對數據進行相應的處理,如將文字表達方式數字化,以及將數據區(qū)間化,方便后續(xù)計算機處理,表2為處理之后的調查數據.

        1.3 POI點信息及其與出行目的的關系

        本文所用到的POI點信息是利用爬蟲技術從高德地圖上獲取的,具體步驟是首先在高德地圖申請密鑰,然后根據獲得的密鑰結合爬蟲技術就可以從高德地圖獲取特定區(qū)域所有的POI點信息,表3為部分獲取的POI點信息.

        表2 部分轉化后的調查數據內容Table 2 Partial transformed data content by survey

        表3 部分爬取的POI點信息Table 3 Partial information of crawled POI

        從上述部分爬取的POI點的信息可知,每個POI點的信息包含其所屬類別,具體類別與該POI點的信息功能相對應.由于乘客從下車點到最終目的地的距離處于一定范圍內(具體范圍為依據調查數據確定),我們將該乘客從下車點到最終目的地所能夠容忍的距離定義為半徑閾值r,因此,從POI點層面,可以對乘客的出行目的做出相應的判斷.如圖1所示,我們認為乘客下車之后,可能前往POI 2點作為其最終目的地,由于POI 1點與下車點的距離大于半徑閾值r,乘客將不會選擇POI 1點作為最終出行目的地.

        圖1 半徑閾值說明示意圖Fig.1 Sketch map of radius of the threshold

        2 出行目的識別模型構建

        本文提出的基于出租車數據和POI點數據的出行目的識別方法是從出行特征和所屬POI點類別兩個層面對出行目的進行識別,然后依據兩個層面的識別結果進行綜合判斷

        2.1 出行特征判別

        依據出行特征判斷出行目的,本質上屬于分類問題,目前該問題已經有多種方法可以解決,如神經網絡、貝葉斯、決策樹、支持向量機、最近鄰等方法.由于不同方法的識別效果不同,因此在實際使用過程中需要通過測試,然后選擇分類方法.雖然這些方法的原理差別很大,但是這些方法總體都可以表示為依據特征推導對象所屬類別,具體到該問題為

        2.2 下車POI點類別歸屬

        由于出租車具有靈活便利,具備門到門的服務能力,因此在調查中,乘客乘坐出租車出行的“下車點離最終目的地的距離”這一內容進行了調查以確定乘客從下車點到達可能的最終目的地的閥值半徑r.因此,依據這個條件,通過POI點層面也可以對其出行目的進行判斷,可以表示為

        2.3 最終出行目的識別規(guī)則

        最終出行目的的識別,需要將依據特征識別的出行目的和依據POI點類別識別的出行目的實現有效融合,才能夠得到最終的出行目的.將兩種不同的方式作為一個集合,則可能出現式(2)~式(5)的情況.

        式(2)由于基于POI點識別方式的結果為空集,最終出行目的只能為依據出行特征識別的出行目的;式(4)由于兩種方式識別的結果完全一致,最終出行目的即為任意一種方式識別的出行目的;式(5)則是由于基于POI點識別方式識別出多種出行目的,且多種出行目的中有一種恰好和使用特征識別的出行目的一致,最終出行目的為兩者識別結果的交集,則以上3種情況的最終識別結果都可以表示為

        式(3)則是基于POI點識別方式的結果不為空且與基于特征識別的結果出現不一致的情況,因此在最終確定識別目的時存在兩種方式,一種為以出行特征為主導的即最終識別目的按照式(6)計算(文獻[19]和文獻[20]的出行目的識別方法),另外一種則是以POI點為主導的,可以表示為

        式(7)表示出現兩種方式識別不同情況時,采用POI點識別結果為準,但基于POI點識別的結果在非空集的情況下可能存在兩種情況,即出現全是同一種出行目的或出現不全為一種出行目的.當全是一種出行目的時,最終出行目的即為該目的;但當出現不同的出行目的時,我們提出了兩種方法,其中第1種為統(tǒng)計各類出行目的的數量,并將數量出現最多的類型作為最早出行目的,第2種為以離下車點距離最短的出行目的地類型作為最終出行目的.

        式(8)表示以目的地類型出現次數最多的作為最終出行目的,式(9)表示以離下車點距離最短的出行目的地類型作為最終出行目的.在后續(xù)實例驗證中,我們將從實際實驗結果對不同方式進行分析和討論.

        3 識別算法及流程

        Step1 通過調查數據對數據特征即目標進行數字化和區(qū)間化處理.

        Step2 通過調查數據對不同的出行目的的識別模型進行訓練和驗證,并依據識別精度選擇最佳的識別模型.

        Step3 依據所提到的出行特征識別方式,通過實際運營的出租車數據對乘客的出行特征進行識別.

        Step4 依據所提出的下車點經緯度,結合設定的半徑閥值r對乘客可能的最終目的地POI點類型進行判斷.

        Step5 融合出行特征和POI點兩種方式獲取的出行特征,得到最終乘客的出行目的.

        4 案例分析

        4.1 數據說明

        本文所用到的調查數據為成都市6:00-24:00隨機調查數據,共獲得有效的調查問卷1 014份,其中調查數據是采用隨機確定調查地點,然后安排調查地點進行全天(6:00-24:00)的調查,因此調查數據具有代表性.運營數據為成都市2016年8月6~12日1周內所有出租車運營數據,其中出租車運營數據每天時段為6:00-24:00,每天該時段出租車自動記錄的數據約4 000 000條.選擇該時間區(qū)間的數據是因為本文旨在探索非節(jié)假日的出租車乘客出行目的,而所選擇的這1周沒有特殊的節(jié)假日,所以所選取的樣本具有代表性.

        4.2 調查數據模型驗證

        4.2.1 分類方法測試

        為了測試不同分類方法對于本問題的適用性,結合調查數據采用不同的分類方法對出行目的識別精度進行驗證,結合Matlab工具包,采用十折交叉驗證方法,最終識別效果如圖2所示

        圖2 不同識別方法的識別準確度Fig.2 Recognition accuracy of different approaches

        通過圖2的識別結果可知,不同的識別模型其識別精度差別較大,從47%到65.7%,識別準確度最高的為決策樹,因此,我們對決策樹的識別結果的混淆矩陣進行了分析,以獲得具體類別識別準確率的情況,具體混淆矩陣如表4所示.

        表4 決策樹識別結果的混淆矩陣Table 4 Confusion matrix of identified results by decision Tree(%)

        從上述決策混淆矩陣的誤識別分析可知,某些不同出行目的由于其出行特征較為類似(上班和上學、休閑娛樂與購物和醫(yī)療等),因此,僅僅依靠出行特征進行識別,容易出現較大的誤識別率.針對這個問題,我們提出基于出租車運營數據和POI點數據的出行目的綜合識別方法.

        4.2.2 本文方法應用及對比分析

        由于在上述6種不同的識別方法中決策樹的識別準確率最高,因此在出行特征層面的出行目的識別方法仍采用決策樹,然后結合乘客下車POI點半徑閾值r內的可能目的地的POI點類型進行綜合決策.為了進行對比,數據集及識別準確度的驗證方法與上述一致,依據本文2.3節(jié)中的最終識別規(guī)則得到的對比識別結果如圖3所示.

        圖3 文獻[19]和[21]及本文方法識別精準度對比Fig.3 The comparison of recognition accuracy between proposed approach and literatures[19,21]

        其中決策樹+POI(I)為式(8)的出行目的的決策方法,決策樹+POI(II)為式(9)的出行目的的決策方法.通過上述不同方法的結果對比分析可知,本文提出的在現有的出行特征識別出行目的基礎上融合下車點所屬POI點信息的出行目的決策方法具有明顯的優(yōu)勢,相比現有的出行特征估計出行目的的方法,所提出的決策樹+POI(I)能夠提高6.31%的識別準確率,決策樹+POI(II)能夠提高15.76%的識別準確率.

        4.3 出租車實際運營數據出行目的識別

        根據調查數據的測試結果,我們對出租車數據采用決策樹+POI(II)的方法進行出行目的的獲取.結合對所有乘客出行特征的識別結果,并依據調查數據設置乘客下車點可能的POI點的半徑閾值r為50 m,對成都市1周出租車乘客的出行目的進行提取,提取的結果如圖4所示.

        依據所提出的方法,計算成都市1周的出租車運營數據的識別結果,共獲得出行人次為219 942人,其中工作日出行人數為160 895人,節(jié)假日出行的人數為59 047人.整體來看,1周中成都出租車乘客出行的主要目的是回家及上班,而購物所占的比重非常小.其中,工作日乘客乘坐出租車的主要目的是餐飲、上班、辦事等,而節(jié)假日時乘客乘坐出租車的主要目的是回家.通過分析數據可知,節(jié)假日時回家乘客數量很高是由于這部分出行主要發(fā)生在22:00以后的深夜,因為在這個時間段公交車輛及軌道交通的服務已經暫停,只能夠選擇出租車回家,造成出租車回家的乘客在節(jié)假日比例很高.

        圖4 本文方法對實際出租車運營數據的乘客出行目的識別結果Fig.4 Identification result of actual taxi operation data based on proposed approach

        5 結論

        本文提出了一種基于出租車運營數據及POI點數據的出租車乘客出行目的識別方法,該方法通過調查數據進行驗證,并最終應用于實際的數據中,可得到如下結論:

        (1)通過數據實驗表明,本文所提出的基于出車組運營數據及POI點數據的出租車乘客出行目的識別方法,與現有的僅僅根據出租車運營數據識別乘客出行目的的方法相比,能夠顯著提高其識別精度.

        (2)在所提出的方法中,針對實際數據量較大的問題,我們改進了判斷預定半徑閥值范圍內出現的POI點的獲取算法,結合地理知識,將距離判斷轉化為經緯度差判斷,能夠非常顯著節(jié)約計算機計算時間,使所提出的方法能夠有效運用于實踐.

        (3)在出租車運營數據與POI點數據進行融合識別時,我們實驗了兩種不同方式的識別判斷方法(決策樹+POI(I)與決策樹+POI(II)).實驗結果表明,雖然半徑范圍內,POI點都有可能成為乘客的目的地,但是乘客更加趨向于距離較短的POI點作為其最終目的地,這也體現了相比于其他公共交通,出租車具有靈活機動性,能夠實現門對門服務.

        猜你喜歡
        特征方法
        抓住特征巧觀察
        新型冠狀病毒及其流行病學特征認識
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        學習方法
        抓住特征巧觀察
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        日本成人一区二区三区| 国产让女高潮的av毛片| 手机看片自拍偷拍福利| 色老板在线免费观看视频日麻批| 日韩少妇人妻精品中文字幕| 4hu四虎永久免费地址ww416| 久久久久久人妻毛片a片| 国产天堂在线观看| 中文岛国精品亚洲一区| 国产偷闻隔壁人妻内裤av| 国产激情视频在线观看首页 | 熟女少妇av免费观看| 国产一区二区三区免费在线播放| 免费一级淫片日本高清| 99在线精品视频在线观看| 日本aⅴ大伊香蕉精品视频| 欧美日韩亚洲成人| 男人深夜影院无码观看| 97激情在线视频五月天视频| 中文字幕国产精品一二三四五区 | 插入日本少妇一区二区三区| 美女张开腿让男人桶爽| 亚洲欧美国产双大乳头| 亚洲色偷偷综合亚洲AVYP| 日本骚色老妇视频网站| 亚洲毛片免费观看视频| 男男啪啪激烈高潮无遮挡网站网址 | 亚洲精品一区二区三区av| 久久九九精品国产不卡一区| 亚洲成av人片在www鸭子| 麻豆影视视频高清在线观看| 久久精品国产亚洲vr| 国产亚洲AV片a区二区| 精品国产a毛片久久久av| 青青草国产在线视频自拍| 精品无人码麻豆乱码1区2区| 欧美极品少妇性运交| 妺妺窝人体色www聚色窝| 日本高清人妻一区二区| 免费在线观看播放黄片视频| 久久99精品国产麻豆宅宅|