亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于OBD數(shù)據(jù)的駕駛?cè)顺鲂心J酵诰?

        2021-06-14 15:50:36馬曉磊姚李亮沈宣良
        交通信息與安全 2021年2期
        關(guān)鍵詞:模型

        馬曉磊 姚李亮 沈宣良

        (北京航空航天大學(xué)交通科學(xué)與工程學(xué)院 北京102206)

        0 引 言

        隨著中國經(jīng)濟(jì)的快速發(fā)展,人民生活水平的提高,汽車產(chǎn)業(yè)高度發(fā)達(dá),購車成本下降,很多家庭將私家車作為日常出行的主要方式。然而,私家車數(shù)量的過度增長也帶來了諸多的問題,例如,交通擁堵加劇,汽車保險(xiǎn)定制,個(gè)性化服務(wù)需求高漲。針對(duì)上述問題,必須尋求更精細(xì)化,更能體現(xiàn)駕駛?cè)藗€(gè)體出行特征的解決方案。

        一直以來,許多學(xué)者致力于準(zhǔn)確識(shí)別駕駛?cè)说某鲂心J健F渲校@取能夠準(zhǔn)確體現(xiàn)駕駛?cè)顺鲂刑卣鞯臄?shù)據(jù),是準(zhǔn)確識(shí)別駕駛?cè)顺鲂心J降年P(guān)鍵所在。早期研究多采用基于問卷調(diào)查的數(shù)據(jù),Bhat[1]使用調(diào)查數(shù)據(jù)分析了通勤出行者在晚間的出行行為。Bowman等[2]基于波士頓地區(qū)的出行調(diào)查數(shù)據(jù),使用交通需求預(yù)測模型將出行者的出行模式劃分成了9類。柴彥威等[3]基于活動(dòng)調(diào)查的數(shù)據(jù),采用時(shí)間地理學(xué)的方法將城市交通出行集成到移動(dòng)活動(dòng)系統(tǒng)中,從而分析城市居民的出行行為特征。

        隨著信息技術(shù)的發(fā)展,移動(dòng)通信數(shù)據(jù)和GPS數(shù)據(jù)等交通大數(shù)據(jù)逐漸被各國學(xué)者用于交通出行行為的分析[4-6]。周素紅等[7]使用手機(jī)數(shù)據(jù)研究了廣州市的通勤出行者的空間規(guī)律,同時(shí)對(duì)出行者的出行行為進(jìn)行了空間上的仿真測試。何山等[8]在GPS數(shù)據(jù)的基礎(chǔ)上,建立了BP神經(jīng)網(wǎng)絡(luò)計(jì)算模型,對(duì)個(gè)體的出行行為進(jìn)行識(shí)別。Ma等[9]基于貨車出行的GPS數(shù)據(jù),分析了不同貨車的出行鏈的特征,最終將貨車種類分為了4個(gè)類別。

        近年來,車聯(lián)網(wǎng)技術(shù)迅速發(fā)展,可實(shí)現(xiàn)大規(guī)模車載診斷系統(tǒng)(on-board diagnostic,OBD)數(shù)據(jù)的采集,許多學(xué)者基于OBD數(shù)據(jù),采用不同方法進(jìn)行建模分析[10-13]。Kumar等[14]從車輛OBD數(shù)據(jù)中提取速度信息,使用時(shí)間狀態(tài)空間模型來對(duì)車輛的出行軌跡進(jìn)行估計(jì)。蕭超武[15]基于OBD數(shù)據(jù),使用隱馬爾可夫模型(HMM)對(duì)駕駛?cè)说某鲂械墓?jié)能行為進(jìn)行了建模。郭繼孚等[16]基于車載OBD采集到的小汽車出行數(shù)據(jù)和軌跡數(shù)據(jù),得到出車率、出行次數(shù)、出行距離等量化指標(biāo),分析不同階段、不同區(qū)域、不同政策下的出行指標(biāo)變化特征。分析結(jié)果表明:車載OBD數(shù)據(jù)能夠較好地反映小汽車出行行為特征,并對(duì)交通需求管理政策的實(shí)施效果做出定量評(píng)價(jià)。張夢歌等[17]結(jié)合車聯(lián)網(wǎng)OBD異常駕駛行為數(shù)據(jù),建立了道路條件與異常駕駛行為關(guān)聯(lián)模型,分析探討利用異常駕駛行為數(shù)據(jù)辨識(shí)道路交通安全風(fēng)險(xiǎn)。

        綜合國內(nèi)外學(xué)者在該領(lǐng)域的研究可以得出,對(duì)于出行模式以及出行目的地預(yù)測的研究,大多都是基于問卷調(diào)查或者GPS終端數(shù)據(jù),這些數(shù)據(jù)無論是在其客觀性上還是豐富性以及準(zhǔn)確性上都存在一定的不足,難以對(duì)出行者的出行模式進(jìn)行準(zhǔn)確的描述。相較于傳統(tǒng)的問卷調(diào)查數(shù)據(jù)以及被廣泛應(yīng)用的手機(jī)和GPS數(shù)據(jù),OBD數(shù)據(jù)可以提供更加詳細(xì)、準(zhǔn)確的車輛數(shù)據(jù),尤其是關(guān)于車輛出行OD點(diǎn)的信息。因此,研究致力于從大量的OBD數(shù)據(jù)中提取相關(guān)信息,識(shí)別不同人群的出行的模式特征,并對(duì)個(gè)體的出行目的地進(jìn)行預(yù)測。這些策略將為交通管理部門提供有價(jià)值的參考,從而提高出行服務(wù)質(zhì)量,改善交通環(huán)境。

        本文開展對(duì)于私家車駕駛?cè)说某鲂心J阶R(shí)別以及出行目的地預(yù)測工作,基于車輛OBD數(shù)據(jù)獲取駕駛?cè)顺鲂械母黜?xiàng)信息,并且根據(jù)大量記錄的歷史數(shù)據(jù),提取出相應(yīng)的特征參數(shù),用以對(duì)駕駛?cè)诉M(jìn)行類別劃分,繼而針對(duì)不同類別進(jìn)行建模,得出不同的能夠描述出行時(shí)空特征的出行模式模型。本研究應(yīng)用北京市域范圍內(nèi)2個(gè)月的共計(jì)3 570輛私家車的OBD數(shù)據(jù),從中提取出5個(gè)特征參數(shù),根據(jù)基于密度峰值的聚類方法(clustering by fast search and find of density peaks,CFSFDP)對(duì)5種特征參數(shù)進(jìn)行聚類,得到不同的駕駛?cè)顺鲂心J健2捎秒x散的隱馬爾可夫模型對(duì)出行模式進(jìn)行建模并進(jìn)行驗(yàn)證。

        1 數(shù)據(jù)介紹

        1.1 數(shù)據(jù)描述

        本文所采用的OBD數(shù)據(jù)包含了車載OBD設(shè)備采集的各項(xiàng)車輛技術(shù)參數(shù)。與傳統(tǒng)GPS數(shù)據(jù)的不同之處在于,OBD數(shù)據(jù)通過CAN總線實(shí)現(xiàn)數(shù)據(jù)交互,在包含速度區(qū)間、每個(gè)行程的起始點(diǎn)和終止點(diǎn)坐標(biāo)等傳統(tǒng)的GPS數(shù)據(jù)信息以外,OBD數(shù)據(jù)還呈現(xiàn)了車輛的運(yùn)行時(shí)間、行駛距離、燃油消耗、發(fā)動(dòng)機(jī)溫度、輪速、發(fā)動(dòng)機(jī)扭矩、油門、制動(dòng)踏板、排檔桿位置、故障等信息,基于這些信息,能夠分析車輛加減速、駕駛行為等傳統(tǒng)GPS數(shù)據(jù)難以獲取的指標(biāo)。數(shù)據(jù)涵蓋了北京市域范圍內(nèi)從2015年6月—7月共計(jì)3 570輛私家車的數(shù)據(jù)。

        1.2 數(shù)據(jù)預(yù)處理及特征參數(shù)提取

        由于對(duì)駕駛?cè)顺鲂心J降姆治霰仨毣谳^長一段時(shí)間的數(shù)據(jù),以得到不同車輛的長期出行特征。因此,首先合并短時(shí)的出行信息,獲得研究范圍內(nèi)3 570輛私家車每輛車在2個(gè)月內(nèi)的長時(shí)出行鏈信息,從而計(jì)算各項(xiàng)參數(shù)。根據(jù)OBD數(shù)據(jù)中行駛距離、出行起終點(diǎn)的經(jīng)緯度信息,獲得車輛的日出行距離。通過油門、制動(dòng)踏板、輪速等車輛狀態(tài)信息,計(jì)算急加速、急減速的次數(shù),推斷駕駛員可能存在的危險(xiǎn)駕駛行為。共選取5個(gè)特征參數(shù)用來描述車輛的出行模式特點(diǎn)。

        1)出行天數(shù)。對(duì)于出行模式的研究,出行的頻次往往作為重要的特征加以采用。出行頻次在很大程度上反映了駕駛?cè)顺鲂袑?duì)于車輛的依賴程度。因此,選用了車輛在2個(gè)月內(nèi)的總的出行天數(shù)作為衡量不同駕駛?cè)顺鲂蓄l次的特征指標(biāo)。

        2)平均出行距離。平均出行距離指的是車輛平均每個(gè)出行日的出行距離,選用該參數(shù)用來表示不同駕駛?cè)顺鲂行袨榈目臻g特征。

        3)最頻首次出行時(shí)段和最頻末次出行時(shí)段。最頻首次及最頻末次出行時(shí)段能夠直觀反映不同出行模式的時(shí)間分布特征。為便于統(tǒng)計(jì)分析,將1 d 24 h劃分為6個(gè)時(shí)段,分別是:早高峰(06:00—09:30),上午平峰(09:30—12:00),下午平峰(12:00—16:30),晚高峰(16:30—19:30),晚間平 峰(19:30—22:00)及午夜凌晨(22:00—06:00)。在此基礎(chǔ)上計(jì)算每個(gè)行程的出行所對(duì)應(yīng)的時(shí)間段,并從中提取出每輛車對(duì)應(yīng)的每天最頻繁的首次和末次出行時(shí)段。

        4)百公里危險(xiǎn)駕駛行為次數(shù)。能夠統(tǒng)計(jì)駕駛過程中危險(xiǎn)駕駛行為的次數(shù)是車輛OBD數(shù)據(jù)區(qū)別于其他數(shù)據(jù)源的特點(diǎn)之一,OBD數(shù)據(jù)中定義的危險(xiǎn)駕駛行為包括3個(gè)方面的參數(shù):急加速次數(shù)、急減速次數(shù)及急轉(zhuǎn)彎次數(shù)。危險(xiǎn)駕駛行為次數(shù)能夠反映駕駛?cè)说鸟{駛習(xí)慣是否良好,也是出行模式的1種體現(xiàn)。本文將采用每百公里的危險(xiǎn)駕駛行為次數(shù)作為分析出行模式的特征參數(shù)之一。

        處理后的數(shù)據(jù)格式見表1。

        表1 處理完成的數(shù)據(jù)格式Tab.1 Format of processed data

        2 CFSFDP算法聚類及結(jié)果分析

        Rodriguez等[18]于2014年在《Science》上提出了1種新的基于密度峰值的聚類算法,該算法不需要提前設(shè)定類別數(shù),而是根據(jù)數(shù)據(jù)特點(diǎn)自適應(yīng)地進(jìn)行聚類。相比于傳統(tǒng)的k-means[19]、CFSFDP等聚類算法,該算法表現(xiàn)出了對(duì)于性狀較高的適應(yīng)性。而與其他的基于密度的聚類算法例如DBSCAN相比,CFSFDP算法所需的參數(shù)更少,且具有更高的計(jì)算效率,在已經(jīng)公布的對(duì)于Olivetti人臉數(shù)據(jù)庫中主體識(shí)別的實(shí)驗(yàn)結(jié)果中,CFSFDP算法展現(xiàn)出了對(duì)于多維數(shù)據(jù)很高的適應(yīng)性。

        2.1 CFSFDP算法參數(shù)及流程

        整個(gè)CFSFDP算法主要包括2個(gè)參數(shù),即局部密度ρ、與更高密度點(diǎn)的距離δ,在模型中,數(shù)據(jù)點(diǎn)的局部密度和距離表示相對(duì)意義的度量,是無量綱的量。

        局部密度ρ是針對(duì)每個(gè)需要聚類的數(shù)據(jù)點(diǎn)而言,指的是在一定距離內(nèi)數(shù)據(jù)點(diǎn)的數(shù)量。所以,對(duì)于任意的數(shù)據(jù)點(diǎn)i來說,其局部密度ρi可以表示為

        式中:當(dāng)x≥0時(shí)當(dāng)2點(diǎn)間的距離小于d c時(shí),任意1點(diǎn)都會(huì)被計(jì)入另1點(diǎn)的局部密度ρ,需要說明的是,截?cái)嗑嚯x需根據(jù)數(shù)據(jù)的具體分布人為提前設(shè)定。根據(jù)數(shù)據(jù)點(diǎn)的實(shí)際分布特征,本研究中設(shè)定截?cái)嗑嚯xd c=0.58最佳。截?cái)嗑嚯x的設(shè)定影響局部密度的實(shí)際計(jì)算,截?cái)嗑嚯x設(shè)置過高,離數(shù)據(jù)點(diǎn)較遠(yuǎn)的點(diǎn)將被覆蓋,局部密度高于理想值;階段距離設(shè)置過低,數(shù)據(jù)點(diǎn)周圍的點(diǎn)覆蓋不足,局部密度低于理想值。

        與更高密度點(diǎn)的距離δ指的是任1個(gè)數(shù)據(jù)點(diǎn)與比它密度高的最近點(diǎn)之間的距離,見式(2)。

        需要特別指出,如果某個(gè)數(shù)據(jù)點(diǎn)在所選取的數(shù)據(jù)集中具有最高的局部密度,那么該點(diǎn)與更高密度點(diǎn)之間的距離取整個(gè)數(shù)據(jù)集中所有δ的最大值。

        整個(gè)聚類算法的實(shí)現(xiàn)分為5個(gè)步驟:①計(jì)算所有數(shù)據(jù)點(diǎn)的距離,構(gòu)建相似度矩陣;②根據(jù)得到的相似度矩陣以及設(shè)定好的截?cái)嗑嚯x計(jì)算局部密度ρ;③根據(jù)局部密度計(jì)算所有數(shù)據(jù)點(diǎn)的與更高密度點(diǎn)的距離δ;④通過聚類決策圖確定聚類中心;⑤按照密度降序?qū)?shù)據(jù)點(diǎn)進(jìn)行聚類。

        2.2 對(duì)OBD數(shù)據(jù)進(jìn)行聚類

        本研究將從共計(jì)3 570輛北京市域范圍內(nèi)時(shí)間跨度為2個(gè)月的私家車OBD數(shù)據(jù)中提取出5個(gè)特征參數(shù),包括:出行天數(shù)、平均出行距離、最頻首次出行時(shí)段、最頻末次出行時(shí)段,以及百公里危險(xiǎn)駕駛行為次數(shù),采用CFSFDP算法對(duì)選取的特征參數(shù)進(jìn)行聚類,以得到不同的出行模式。

        對(duì)數(shù)據(jù)進(jìn)行聚類之前,考慮到不同特征參數(shù)之間的數(shù)量級(jí)與量綱的不同,需要統(tǒng)一對(duì)不同特征參數(shù)進(jìn)行無量綱化處理。本文采用的數(shù)據(jù)歸一化處理方法見式(3)。

        將歸一化處理后的數(shù)據(jù)輸入到基于Matlab編寫的程序中進(jìn)行聚類,得到的聚類決策圖以及聚類結(jié)果分布圖見圖1~2。由圖1可見,在所有的數(shù)據(jù)點(diǎn)中,相比于其他的數(shù)據(jù)點(diǎn),4個(gè)彩色的被標(biāo)記數(shù)據(jù)點(diǎn)明顯具有更高的局部密度ρ和更大的與更高密度點(diǎn)的距離δ。根據(jù)CFSFDP算法的定義,4個(gè)彩色被標(biāo)記點(diǎn)就是算法選取出的4個(gè)聚類中心,也即最終數(shù)據(jù)集被劃分成了4個(gè)類別。圖2展示了4個(gè)類別的數(shù)據(jù)點(diǎn)在二維圖上的分布情況,需要特別說明的是,圖2中的X軸與Y軸為了更加直觀地表現(xiàn)不同類別間數(shù)據(jù)點(diǎn)的分布情況,僅代表1種二維空間中的度量,沒有特定的含義。聚類完成后的每個(gè)類別的數(shù)量情況見表2。

        圖1 聚類決策圖Fig.1 Decision graph

        圖2 數(shù)據(jù)點(diǎn)二維分布圖Fig.2 2D Nonclassical multidimensional scaling

        表2 4個(gè)類別的具體數(shù)量Tab.2 Specific quantity of four categories

        2.3 聚類結(jié)果分析及模式設(shè)定

        由上文聚類結(jié)果可知3 570輛私家車被劃分為4類,代表了4種不同的出行模式和特點(diǎn)。為了更加準(zhǔn)確地定義這4種類型的出行模式,需要根據(jù)選取的5個(gè)特征參數(shù)分析出行模式的不同特征。下文將分析5個(gè)特征參數(shù)在4個(gè)類別中的不同規(guī)律特征,以此來對(duì)4種出行模式進(jìn)行定義。

        2.3.1 平均出行距離分析

        出行距離分析能夠描述出行模式的空間特征。4個(gè)類別平均出行距離的分布情況見圖3。圖3為平均出行距離的箱線圖,黑色橫線表示數(shù)據(jù)的上限值和下限值,紅色橫線表示平均出行距離的中位數(shù),藍(lán)箱的上下限,分別表示數(shù)據(jù)的上四分位數(shù)和下四分位數(shù),因此,藍(lán)箱包含了全樣本一半的數(shù)據(jù)。紅色+號(hào)表示在上下限以外的異常值數(shù)據(jù)。從圖中可以看出類別1和類別2的出行距離具有相似的特征,范圍基本都在20~40 km/d,中位數(shù)大約為30 km/d,說明單依靠平均出行距離這個(gè)特征參數(shù)的分布特點(diǎn),無法區(qū)分出類別1和類別2。對(duì)于類別3來說,其出行距離范圍為35~60 km/d,中位數(shù)接近50 km/d,相對(duì)于類別1與類別2,類別3的平均出行距離較長。對(duì)于類別4,它的出行距離范圍為45~90 km/d,中位數(shù)超過60 km/d,是類別1和類別2的2倍。

        圖3 不同類別出行距離分布情況圖Fig.3 Distribution of different types of travel distance

        2.3.2 出行頻次分析

        出行頻次直接反映了出行者對(duì)于車輛的依賴程度,是衡量不同駕駛?cè)顺鲂心J降闹匾獏?shù)。在本研究中,采用車輛2個(gè)月的總出行天數(shù)代表出行頻次。不同類別的出行天數(shù)分布圖見圖4。圖4為出行頻次的箱線圖,黑色橫線表示數(shù)據(jù)的上限值和下限值,紅色橫線表示出行頻次的中位數(shù),藍(lán)箱的上下限,分別表示數(shù)據(jù)的上四分位數(shù)和下四分位數(shù)。因此,藍(lán)箱包含了全樣本一半的數(shù)據(jù)。紅色“+”號(hào)表示在上下限以外的異常值數(shù)據(jù)。由圖中可知,類別1具有很高的出行頻次,范圍為40~58 d,中位數(shù)超過了50 d,近乎每天都有出行。類別2的出行頻次范圍為20~46 d,平均出行頻次大約為30 d,在幾種類別中處于中間水平。相比于前2個(gè)類別,類別3和類別4則呈現(xiàn)了出行頻次偏低的特點(diǎn),2個(gè)月的出行總天數(shù)均不超過15 d,表明出行者出行時(shí)對(duì)于車輛的依賴性很小。

        圖4 不同類別出行天數(shù)分布情況圖Fig.4 Distribution of different types of travel days

        2.3.3 百公里危險(xiǎn)駕駛行為次數(shù)分析

        判斷出行者出行過程中駕駛行為是否良好,可以從百公里危險(xiǎn)駕駛行為次數(shù)反映。不同類別百公里危險(xiǎn)駕駛行為次數(shù)分布情況圖見圖5。圖5為百公里危險(xiǎn)駕駛行為次數(shù)的箱線圖,黑色橫線表示數(shù)據(jù)的上限值和下限值,紅色橫線表示百公里危險(xiǎn)駕駛行為次數(shù)的中位數(shù),藍(lán)箱的上下限,分別表示數(shù)據(jù)的上四分位數(shù)和下四分位數(shù)。因此,藍(lán)箱包含了全樣本一半的數(shù)據(jù)。紅色“+”號(hào)表示在上下限以外的異常值數(shù)據(jù)。由圖中可知,類別1、類別2、類別3等3種類別的出行模式中,百公里的危險(xiǎn)駕駛行為次數(shù)中位數(shù)都不超過4次,體現(xiàn)出了良好的駕駛習(xí)慣。與此相反,類別4中75%以上的樣本百公里危險(xiǎn)駕駛行為次數(shù)超過了15次,中位數(shù)超過了20次,說明其駕駛習(xí)慣存在安全隱患。類別1~3中均有高出樣本平均水平的異常值,但相較于總體3 570個(gè)全樣本,異常值的數(shù)量不足2%。因此,不會(huì)影響對(duì)類別總體特征和平均水平的判別。

        圖5 不同類別百公里危險(xiǎn)駕駛行為次數(shù)分布情況圖Fig.5 Distribution of dangerous driving behaviors in different categories

        2.3.4 出行時(shí)段分析

        將1 d分為6個(gè)時(shí)間段,選擇了2個(gè)月中每輛車最頻繁的首次出行和末次出行對(duì)應(yīng)的時(shí)間段作為表述日常出行時(shí)間分布的特征參數(shù)。不同類別的首末次出行時(shí)段分布見圖6。

        圖6 最頻首末次出行時(shí)段情況圖Fig.6 Category 4 The most frequent first trip and last trip time

        根據(jù)圖中分析可知,4個(gè)類別的出行時(shí)段中,首末次出行的主要時(shí)段都分布在早高峰、下午平峰2個(gè)時(shí)段,這是因?yàn)樵缤?個(gè)出行高峰正好包含在這2個(gè)時(shí)段之中,與整體趨勢相同,說明了該數(shù)據(jù)集的主體多數(shù)為通勤人群。不同之處在于,類別1與類別2中,只有極少的一部分人群的首末次出行時(shí)段處于非早晚高峰,體現(xiàn)出了極強(qiáng)的通勤特性與目的。而類別3與類別4中,則有相對(duì)較多的人群的首末次出行時(shí)段分布在其他4個(gè)時(shí)間段中。

        基于以上對(duì)于4個(gè)類別在不同特征參數(shù)分析時(shí)表現(xiàn)出的特征,對(duì)4個(gè)類別對(duì)應(yīng)的出行模式進(jìn)行定義。對(duì)于類別1,其最主要的特征體現(xiàn)在超高的出行頻率上,因此我們定義其為高頻出行者。對(duì)于類別2,根據(jù)其出行的頻次以及相對(duì)單一的出行時(shí)段,我們將其定義為傳統(tǒng)的通勤出行者。對(duì)于類別3,其最主要的特征體現(xiàn)在出行距離較長以及很低的出行頻次上,所以,定義其為長距、偶發(fā)出行者。對(duì)于類別4,相對(duì)于其他3個(gè)類別,其最突出的特點(diǎn)是危險(xiǎn)駕駛行為次數(shù)明顯偏高,駕駛習(xí)慣不好,由此我們定義其出行模式為危險(xiǎn)出行者。

        3 基于HMM算法的出行模式模型建立及驗(yàn)證

        隱馬爾可夫模型(HMM)是1種常用的模式識(shí)別建模方式,通過單一或多維的可見序列,準(zhǔn)確地識(shí)別出隱藏的狀態(tài)。對(duì)于本研究來說,4個(gè)駕駛?cè)顺鲂心J绞遣豢梢姷?,可通過一系列的被選取的幾個(gè)特征參數(shù),組成可見序列進(jìn)行識(shí)別。駕駛?cè)顺鲂心J阶R(shí)別的本質(zhì)是使用不同的、能夠反映駕駛?cè)顺鲂行袨榈奶卣鲄?shù),去識(shí)別不同出行者的出行規(guī)律特征。原始的對(duì)于馬爾科夫的定義要求數(shù)據(jù)具有連續(xù)性,隨著方法的不斷創(chuàng)新,隱馬爾可夫模型已經(jīng)能夠分析離散型的數(shù)據(jù)。因此,無論從定義還是數(shù)據(jù)類型的角度都可以說明,隱馬爾可夫模型對(duì)于本研究來說是適用的。

        3.1 HMM模型參數(shù)設(shè)定

        大多數(shù)情況下,1個(gè)隱馬爾可夫模型包含2組狀態(tài)集合和3組概率集合,模型表達(dá)式可以表示為[20]

        式中:N為模型的狀態(tài)數(shù),相應(yīng)的狀態(tài)集合表示為為模型的可觀察值的數(shù)目,相應(yīng)的觀察值集合表示為為狀態(tài)轉(zhuǎn)移矩陣,可寫成其中,aij為從狀態(tài)i到狀態(tài)j概率,且滿足

        B為觀察值概率矩陣,可寫成,其中,b ik為觀察值v k在狀態(tài)si時(shí)出現(xiàn)的概率;π為出行狀態(tài)概率矩陣,滿足

        對(duì)應(yīng)在本研究中,根據(jù)隱馬爾可夫模型的定義,因?yàn)橛?種出行模式需要識(shí)別,N=4。M=5,對(duì)應(yīng)的是被選取的5個(gè)特征參數(shù)。矩陣A和矩陣B分別代表4個(gè)出行模式的狀態(tài)轉(zhuǎn)移矩陣和5個(gè)特征參數(shù)組成的觀察值矩陣。初始狀態(tài)矩陣

        3.2 HMM模型訓(xùn)練

        對(duì)于隱馬爾可夫模型而言,狀態(tài)轉(zhuǎn)移矩陣是最核心的組成部分,也是其預(yù)測功能實(shí)現(xiàn)的基礎(chǔ)。本研究中使用隱馬爾可夫模型中的forward-backward算法對(duì)模型進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)的格式見表3,對(duì)應(yīng)的輸入?yún)?shù)的順序?yàn)椋浩骄鲂芯嚯x、出行天數(shù)、最頻首次出行時(shí)段、最頻末次出行時(shí)段,以及百公里危險(xiǎn)駕駛行為次數(shù)。狀態(tài)1/2/3/4分別代表4個(gè)出行模式,即高頻出行者、通勤出行者、長距偶發(fā)出行者、危險(xiǎn)出行者。采用Matlab中的HMM工具箱構(gòu)建出行模式模型,將總數(shù)據(jù)的70%,即2 499輛車的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。

        表3 訓(xùn)練數(shù)據(jù)格式Tab.3 Format of training data

        完成模型訓(xùn)練以后,得到的狀態(tài)轉(zhuǎn)移矩陣如下。

        3.3 HMM模型驗(yàn)證

        將總數(shù)據(jù)的30%,即剩余的1 071輛車的數(shù)據(jù)作為測試數(shù)據(jù),包括高頻出行者數(shù)據(jù)和通勤出行者數(shù)據(jù)各321組,長距偶發(fā)出行者數(shù)據(jù)374組以及危險(xiǎn)出行者數(shù)據(jù)55組。測試過程采用隱馬爾可夫模型中的Viterbi算法,模型的測試結(jié)果見表4。對(duì)高頻出行者、通勤出行者、長距偶發(fā)出行者、以及危險(xiǎn)出行者的識(shí)別準(zhǔn)確率分別為92.8%,89.7%,89.6%和94.5%,平均準(zhǔn)確率達(dá)到了91.65%。結(jié)果表明:使用OBD數(shù)據(jù)且基于CFSFDP算法聚類以及隱馬爾可夫模型建模的方法是可行的。識(shí)別準(zhǔn)確率的計(jì)算方法為

        表4 模型測試結(jié)果Tab.4 Results of model test

        4 結(jié)束語

        通過選用北京市域范圍內(nèi)3 570輛私家車,時(shí)間跨度為2個(gè)月的OBD數(shù)據(jù),提出了1種能夠有效識(shí)別駕駛?cè)顺鲂心J降姆椒ǎ▽?duì)出行模式進(jìn)行區(qū)分的CFSFDP算法以及對(duì)出行模式進(jìn)行建模及預(yù)測的離散隱馬爾可夫模型。

        在CFSFDP算法的實(shí)施過程中,輸入?yún)?shù)為5類描述車輛運(yùn)行的時(shí)空特點(diǎn)的特征量,包括平均行駛距離、出行天數(shù)、最頻首次出行時(shí)段、最頻末次出行時(shí)段及百公里危險(xiǎn)駕駛行為次數(shù)。通過對(duì)聚類的結(jié)果進(jìn)行特征分析,得出4種出行模式,即高頻出行者、通勤出行者、長距偶發(fā)出行者以及危險(xiǎn)出行者。根據(jù)已知的出行模式,繼而采用離散型的馬爾科夫模型進(jìn)行建模和測試,測試結(jié)果表現(xiàn)出了較高的準(zhǔn)確率。

        本研究在很多方面還存在局限性與不足之處,例如由于特征參數(shù)選取的維度有限,目前只能識(shí)別出4種出行模式,且由于數(shù)據(jù)群體的采集面不夠,造成了幾種出行模式在一些特征參數(shù)上的區(qū)別度不足。最典型的就是最頻首末次的出行時(shí)段,所有出行模式的出行主體時(shí)段都集中在早晚高峰所處的時(shí)段內(nèi)。在下一步的研究中可以:①提取更多的特征參數(shù);②將現(xiàn)有數(shù)據(jù)與其他數(shù)據(jù)源相結(jié)合,比如土地利用類型的數(shù)據(jù)等;③對(duì)當(dāng)前參數(shù)進(jìn)行細(xì)化,例如縮短時(shí)間間隔,以便更深層次地挖掘不同駕駛?cè)说某鲂心J教卣鳌?/p>

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        少妇高潮惨叫喷水在线观看| 国产免费人成视频网站在线18| 97色伦图片97综合影院| 日韩精品无码中文字幕电影| 亚洲中久无码永久在线观看软件| 亚洲国产福利成人一区二区| 久久精品女人天堂av麻| 麻豆精品国产av在线网址| 极品av麻豆国产在线观看| 色吧综合网| 老肥熟女老女人野外免费区| 日韩麻豆视频在线观看| 中国人妻与老外黑人| aaaaa级少妇高潮大片免费看| 国内精品国产三级国产av另类| 邻居少妇张开腿让我爽视频| 亚洲精品中文字幕乱码影院| 亚洲熟女乱色综合亚洲av| 欧美日韩色| 中文字幕日韩一区二区不卡 | 天天躁日日躁狠狠很躁| 热久久亚洲| 亚洲熟女一区二区三区不卡| 久久午夜av一区二区三区| 精品国产人妻一区二区三区| 国产亚洲sss在线观看| 人妻1024手机看片你懂的| 无遮掩无码h成人av动漫| 亚洲美免无码中文字幕在线| 尤物yw午夜国产精品视频| 一区二区高清免费日本| 欧美猛少妇色xxxxx猛交| 国产成人亚洲不卡在线观看 | 日韩av一区在线播放| 日本中文字幕婷婷在线| 国产性生大片免费观看性| 亚洲精品亚洲人成在线下载| 亚洲av色香蕉一区二区三区av| 丰满少妇作爱视频免费观看 | 亚洲综合图色40p| 国产女女精品视频久热视频|