亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        行程時間異常值處理方法研究*

        2012-12-01 03:58:48李曉莉石建軍
        關(guān)鍵詞:方法

        李曉莉 石建軍

        (北京工業(yè)大學(xué)北京市交通工程重點實驗室1) 北京 100124) (天津市市政工程研究院2) 天津 300074)

        行程時間數(shù)據(jù)可以用來進行行程時間的預(yù)測以及行程延誤的計算[1-2]等,但是將行程時間樣本數(shù)據(jù)應(yīng)用于研究之前,需要對行程時間中的異常值進行處理.異常值在數(shù)據(jù)挖掘技術(shù)中被稱為離群點,是指背離了數(shù)據(jù)的一般行為表現(xiàn)或模型的數(shù)據(jù)[3].在行程時間異常值處理方面,Clark總結(jié)了三種異常數(shù)據(jù)處理的統(tǒng)計分析方法,分別是分位值檢驗法、偏移值檢驗法和均值迭代法[4];Shuyan Chen等人將數(shù)據(jù)挖掘技術(shù)中的離群點檢測算法應(yīng)用于行程時間異常值的數(shù)據(jù)處理[5];劉浩等人提出了基于信息提取計算技術(shù)的行程時間異常值處理算法[6],本文在總結(jié)以上行程時間異常數(shù)據(jù)處理方法局限性的基礎(chǔ)上,受其啟發(fā),提出了一種更為簡單、有效,且易于操作的行程時間異常數(shù)據(jù)處理方法,充分應(yīng)用了行程時間異常值的表現(xiàn)形式及行程時間數(shù)據(jù)的分布特性.

        1 基于車牌識別數(shù)據(jù)的行程時間計算方法

        圖1為典型的車牌識別設(shè)備的安裝示意圖.A,B代表兩個檢測點編號.其上小標(biāo)為方向代碼(取車牌識別數(shù)據(jù)庫中的方向代碼,0,1,2,3分別代表東、南、西、北四個運行方向).設(shè)車輛i沿0方向經(jīng)過檢測點A的時間記為t0iA,經(jīng)過檢測點B的時間記為t0iB.則車輛i沿0方向從檢測點A運行到檢測點B的行程時間為=-.同理可得車輛j沿2方向從檢測點A運行到檢測點B的行程時間為=-.

        圖1 典型車牌識別設(shè)備的安裝示意圖

        2 行程時間異常值原因分析

        2.1 較小值的產(chǎn)生原因

        較小值是指行程時間小于有效值的數(shù)據(jù),其產(chǎn)生原因如下:(1)駕駛員不遵守交通規(guī)則或冒險的駕駛習(xí)慣帶來的自身行程時間的節(jié)省;(2)某些特殊車輛,如救護車,為爭取時間無需遵守交通規(guī)則和速度限制,其行程時間較短;(3)車牌識別有誤.在真正的車輛還未到達之前,將車牌號相似的車輛識別成該輛車.

        2.2 較大值的產(chǎn)生原因

        較大值是指行程時間大于有效值的數(shù)據(jù),其產(chǎn)生原因如下:(1)駕駛員繞行.兩檢測點之間存在多個交叉口,駕駛員由于需要,不采用直接路徑,而是繞路行駛,會增大行程時間;(2)駕駛員中途停車.駕駛員因需要停車一段時間后,繼續(xù)前行經(jīng)過下游檢測點時被成功識別,由此得到的行程時間會偏大,該類情況包括私家車駕駛員的中途停車和出租車、公交車因乘客上下車的中途停車;(3)駕駛員并不以最快達到目的地為目的.出租車在空車的情況下,為招攬客人會以低于其正常車速的速度在外側(cè)車道前行,出行者的出行的目的是為了觀光或?qū)ふ夷骋唤ㄖr,也會以低于正常車速的速度行駛;(4)車輛在一段時間內(nèi)連續(xù)多次經(jīng)過同一檢測路段,將該現(xiàn)象稱為車輛在該路段的多次出行,計算行程時間時,將不同次出行的時間信息匹配,計算出的行程時間將大于實際的行程時間;(5)車牌識別有誤造成的.車輛前一次經(jīng)過某檢測路段時,未被下游檢測點檢測到,而另外一輛車由于被錯誤識別成為該輛車的“替身”,由此可能會產(chǎn)生較大的行程時間數(shù)據(jù).

        3 行程時間異常值的處理方法

        本文的行程時間異常值處理方法,主要由以下幾個步驟組成.

        步驟1 行程時間上限值TTu的設(shè)置 同一輛車在一天之中,可能會多次經(jīng)過同一路段,稱為在該路段多次出行.行程時間計算過程中,會將不同次出行的通過時間進行匹配,造成部分行程時間遠遠大于實際值.為了盡可能降低這種情況的發(fā)生,需為行程時間設(shè)置一個上限值.為簡便起見,考慮到道路中檢測點之間的間距不是很長,可將行程時間的上限值設(shè)為1 h(3 600 s).

        步驟2 行程時間下限值TTL的設(shè)置 設(shè)置行程時間的下限值,目的是初步過濾行程時間數(shù)據(jù)中的較小值.正常情況下,車輛的行程時間應(yīng)不低于自由流情況下車輛在該路段的行程時間.由于信號控制設(shè)施的存在以及車輛性能、駕駛員類型的不同,自由流情況下,車輛之間的行程時間也是有差異的.將自由流情況下,第10%位的數(shù)據(jù)作為行程時間的下限值,低于該下限值的行程時間值背離了實際情況或一般車輛的速度行為(表現(xiàn)為超速、闖紅燈等),應(yīng)予以剔除.

        步驟3 多次出行行程時間異常值的剔除行程時間上限值范圍內(nèi),將車輛的出行信息,按車輛的出發(fā)時刻從早到晚、行程時間從小到大進行排序,按車輛牌照分組,將同一車輛在同一時刻出發(fā)的行程時間數(shù)據(jù)的較大值剔除.

        步驟4 行程時間異常值的大幅過濾.經(jīng)過以上三步的粗略過濾,過濾掉了行程時間數(shù)據(jù)中最為明顯的異常數(shù)據(jù),下面的幾步是異常值剔除的關(guān)鍵步驟.

        1)設(shè)定統(tǒng)計時窗Tw交通流在一天之內(nèi)的波動性導(dǎo)致了行程時間隨時間的波動,平峰時段的異常值在高峰時段可能屬于正常值的范圍,因此需設(shè)定一統(tǒng)計時窗,認為同一時窗內(nèi)的行程時間數(shù)據(jù)具有相同的模式.統(tǒng)計時窗的設(shè)定是異常值處理的一個關(guān)鍵環(huán)節(jié),統(tǒng)計時窗不應(yīng)設(shè)置過小,否則不僅計算負擔(dān)重,且樣本量較少時,有效值不能表現(xiàn)出明顯的數(shù)據(jù)規(guī)律,不易區(qū)分異常值和有效值;統(tǒng)計時窗不宜設(shè)置過大,否則一個時間窗內(nèi),交通流狀態(tài)發(fā)生了較大的變化,也不能有效識別出異常值.

        2)以均值和兩倍標(biāo)準(zhǔn)差為條件過濾行程時間 第j時窗內(nèi)的行程時間構(gòu)成行程時間樣本集TDSj1,計算TDSj中行程時間的均值TTmeanTDSj1和標(biāo)準(zhǔn)差σTDSj1,過濾掉距均值2倍標(biāo)準(zhǔn)差以外的行程時間數(shù)據(jù),剩余的行程時間構(gòu)成行程時間樣本集TDSj2,即

        3)定位統(tǒng)計時窗內(nèi)行程時間的中位值 將TDSj2的行程時間按從小到大的順序排列,計算行程時間的中位值TTjmedian,其計算公式如下.TTjmedian=TTjm,且

        其中:i為行程時間的序號;max i為j統(tǒng)計時間窗內(nèi),行程時間的最大序號,也即TDSj2內(nèi)行程時間的樣本個數(shù).

        4)以中位值和平均絕對偏差為條件過濾行程時間 計算每個行程時間樣本與中位值的絕對偏差,即Dji=TTji-TTjmedian,并以中位值為分界分別計算行程時間樣本中前、后各半部分的行程時間與中位值的平均絕對偏差,分別記為Difmean,Djamean,二者的計算公式如下.

        經(jīng)本步驟過濾,剩余的行程時間樣本集為TDSj3,即TDSj3={TTji|TTjmedian+3Djfmedian≤TTji≤TTjmedian+3Djamedian}.

        5)重復(fù)3)和4),直至行程時間樣本數(shù)據(jù)不再發(fā)生變化,則統(tǒng)計時窗j的有效行程時間樣本集為TDSj,經(jīng)大量實踐表明,一般重復(fù)5~6次,數(shù)據(jù)趨于不變.

        4 實例計算

        以北京市2008年5月份的車牌識別數(shù)據(jù)為依托,采用本文的方法對行程時間異常值進行處理.由于一般城市道路與城市快速路交通條件以及交通流特性有一定的差別,分別就兩種道路類型的數(shù)據(jù)驗證方法的適用性.

        4.1 實例1

        以平樂園路口西到勁松西這一段道路自東向西方向的行程時間為例,采用本文方法對行程時間數(shù)據(jù)進行處理.

        1)設(shè)定行程時間上限值,TTu=3 600 s.

        2)計算行程時間 一般情況下,人們在夜間的出行較為暢通,因此本文將研究的時間范圍設(shè)為6:00~22:00.以2008年5月8日為例,車輛在平樂園路口西到勁松西自東向西方向的行程時間原始數(shù)據(jù)見圖2.

        圖2 不同出發(fā)時刻行程時間原始數(shù)據(jù)分布(設(shè)定了上限值)

        由圖2可以看出,行程時間數(shù)據(jù)中含有較多的明顯的異常數(shù)據(jù),且在一天之中行程時間存在早晚高峰.觀察行程時間數(shù)據(jù)的分布可以發(fā)現(xiàn),在平峰時段的某些可能異常值在高峰時段則屬于正常值,這為統(tǒng)計時間窗設(shè)定的必要性提供了依據(jù).

        3)設(shè)定行程時間下限值 計算在該段路凌晨0:00~4:00車輛的行程時間作為自由流條件下的行程時間,取第10%位的數(shù)據(jù)作為行程時間的下限值,TTL=101 s.

        4)設(shè)定統(tǒng)計時窗,Tw=10 min.按文中提到的方法對行程時間進行處理,經(jīng)過步驟2及其之間步驟的過濾,行程時間的分布見圖3.由圖3可以看出,經(jīng)過以上步驟的過濾,大量行程時間異常值被過濾掉,但是數(shù)據(jù)中還存在明顯的異常值.

        圖3 不同出發(fā)時刻行程時間分布(設(shè)定了下限值且過濾掉多次出行異常值)

        5)按步驟3、步驟4繼續(xù)過濾行程時間,并重復(fù)該步驟直至行程時間數(shù)據(jù)趨于不變,過濾后行程時間的分布見圖4.

        由圖4可以看出,經(jīng)過以上幾個步驟的過濾,行程時間在一天之中的分布趨勢保持不變,過濾掉了絕大部分的行程時間異常值,過濾效果很明顯.

        圖4 不同出發(fā)時刻行程時間分布(過濾后)

        4.2 實例2

        由于城市快速路與一般城市道路的道路特征以及交通流運行特性有一定的區(qū)別,本文選擇遠通橋西到國貿(mào)橋東自東向西方向這一段快速路驗證方法的適用性,該段道路屬于京通快速路.

        按照實例1的步驟進行行程時間異常值的處理,其相關(guān)參數(shù)如下:TTu=3 600 s,TTl=226 s,Tw=10 min.過濾前和過濾后行程時間數(shù)據(jù)分布如圖5~圖6所示.

        圖5 不同出發(fā)時刻行程時間行程原始數(shù)據(jù)分布(只設(shè)定了上限值)

        圖6 不同出發(fā)時刻行程時間分布(過濾后)

        由圖6可以看出:快速路行程時間數(shù)據(jù)經(jīng)本文提出的方法過濾后,行程時間在一天之內(nèi)的分布趨勢沒有改變,各出發(fā)時段的行程時間集中在一個小波帶之內(nèi),與一般城市道路相比,快速路在同一統(tǒng)計時窗內(nèi)的行程時間分布較為集中、行程時間波動性較?。?/p>

        5 結(jié)束語

        本文分析了行程時間異常數(shù)據(jù)的分類及其產(chǎn)生原因,在已有行程時間異常值處理方法的啟發(fā)下,提出了基于異常值數(shù)據(jù)特征和行程時間分布特征的異常值處理算法,最后將該方法應(yīng)用于實際車牌數(shù)據(jù)的處理,并考慮到一般城市道路與城市快速路道路條件和交通流特性的差異,分別選擇了一段城市主干道(短路徑)和城市快速路(長路徑)對方法進行了驗證,處理結(jié)果表明該方法能較好地剔除行程時間異常值.

        [1]宋儷婧,陳金川,石建軍,等.應(yīng)用車輛牌照自動識別系統(tǒng)自動檢測行程延誤的算法研究.交通運輸工程與信息學(xué)報,2008,6(2):107-112.

        [2]邵 杰,黃 山.城市道路路段車輛旅行時間檢測系統(tǒng)的研究[J].道路交通與安全,2002(5):2-5.

        [3]Chen Shuyan,Wang Wei,Henk van Zuylen.A comparison of outlier detection algorithms for ITS data[J].Expert Systems with Applications ,2010,37:1 169-1 178.

        [4]Clark S,Grant-Muller S,Chen H.Cleaning of matched license plate data[J].Transportation Research Record,2002,1804:1-7.

        [5]Shuyan Chen,Wang Wei,Henk van Zuylen.A comparison of outlier detection algorithms for ITS data[J].Expert Systems with Applications,2010(37):1 169-1 178.

        [6]劉 浩,張 可,漢克·范少倫.行程時間噪聲數(shù)據(jù)處理技術(shù)研究[J].交通運輸系統(tǒng)工程與信息,2008,9(4):66-71.

        猜你喜歡
        方法
        中醫(yī)特有的急救方法
        中老年保健(2021年9期)2021-08-24 03:52:04
        高中數(shù)學(xué)教學(xué)改革的方法
        河北畫報(2021年2期)2021-05-25 02:07:46
        化學(xué)反應(yīng)多變幻 “虛擬”方法幫大忙
        變快的方法
        兒童繪本(2020年5期)2020-04-07 17:46:30
        學(xué)習(xí)方法
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        最有效的簡單方法
        山東青年(2016年1期)2016-02-28 14:25:23
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        久久露脸国产精品WWW| 337p西西人体大胆瓣开下部| 亚洲日本va午夜在线电影| 视频国产精品| 日本免费三片在线视频| 18禁止进入1000部高潮网站| 国产精品久久久久久婷婷| 国产一级毛片卡| 亚洲成人免费久久av| 国产在线一区二区三区四区| 中文字幕一区二区人妻性色| 久久久久亚洲AV无码专| 日韩熟女精品一区二区三区视频| 美腿丝袜诱惑一区二区| 亚洲色欲色欲www| 欧洲亚洲视频免费| 在线观看免费的黄片小视频| 亚洲精品一品二品av| 国产片在线一区二区三区| 久久不见久久见免费影院| 国产av影片麻豆精品传媒| 九九日本黄色精品视频| 久久久天堂国产精品女人| 色噜噜狠狠狠综合曰曰曰| 成人国产精品一区二区网站| av免费观看在线网站| 第一次处破女18分钟高清| 日韩精品无码免费专区网站| 国产成人精品免费视频大全| 亚洲天堂av黄色在线观看| 不卡av电影在线| 亚洲熟少妇在线播放999| 91超碰在线观看免费| av黄色大片久久免费| 国产老熟女网站| 人妻无码中文人妻有码| 日本在线播放不卡免费一区二区 | 国产色秀视频在线播放| 中文字幕国产精品中文字幕| 高清少妇二区三区视频在线观看| 国产边摸边吃奶叫床视频|