亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于變量分析和粒子群優(yōu)化加權隨機森林的交通事件檢測方法

        2021-07-29 02:09:12羅預欣薛運強
        科學技術與工程 2021年14期
        關鍵詞:占有率檢測器決策樹

        羅預欣,張 兵,薛運強

        (華東交通大學交通運輸與物流學院,南昌 330013)

        高速公路是城市間的主要通道,其特點是流量大,速度快,在高速公路上發(fā)生交通事件會帶來嚴重的人員傷亡和降低道路通行效率,若不及時處理對后續(xù)的車輛還是乘車人員都有發(fā)生二次安全事故的可能性。據(jù)統(tǒng)計,美國快速路總擁堵事件中的55%~75%擁堵事件是由交通事件的發(fā)生引起的[1],在中國上海,1/3的交通擁堵是由交通事件、車輛故障等交通事件造成[2]。因此,為了保障道路通行效率,道路安全水平,研究出準確及時的AID算法具有重要意義。近幾十年,越來越多的交通自動檢測(AID)算法被相繼研究出。早期開發(fā)的AID算法主要有加利福尼亞算法[3]、基于突變理論的McMaster算法[4]等。隨著對交通事故影響下事發(fā)路段交通特性變化分析[5]和機器學習、大數(shù)據(jù)的發(fā)展,越來越多的算法模型被相繼提出,如神經(jīng)網(wǎng)絡模型[6]、支持向量機(SVM)模型[7],隨機森林(RF)模型[8]等。然而,在以往的交通事件自動檢測算法中大多數(shù)的輸入特征變量只是簡單的流量、速度、占有率,并沒有對交通事件初始變量進行全面的分析,導致檢測效果并不理想。為此,從變量分析的角度構建全面的初始變量并進行篩選,在算法層面,將根據(jù)隨機森林算法分類的缺點,提出對決策樹進行權重賦值并利用粒子群(PSO)算法進行優(yōu)化。提出基于變量分析和粒子群優(yōu)化加權隨機森林交通事件檢測算法,實現(xiàn)快速有效地檢測交通事件,提高AID系統(tǒng)的檢測性能,確保高速公路交通事件發(fā)生時能及時有效地處理。

        1 交通事件初始特征變量分析

        高速公路交通流參數(shù)主要包括流量、速度、占有率、車頭時距、車頭間距。但對于交通事件檢測算法來說常用的三種參數(shù)為流量、速度、占有率。其中流量指在某一截面或某一地點單位時間內(nèi)通過的車輛數(shù);速度指車輛在單位時間內(nèi)行駛的距離;占有率也分為時間和空間上的占有率,由于空間占有率難以獲取,一般來說在交通事件檢測中,占有率通常指的是時間占有率,其含義指的是在某一時間內(nèi),車輛占用檢測器時間與檢測時間的比值。在高速公路上目前車輛檢測器是常見的采集設備,它能采集交通流各參數(shù),可運用這些參數(shù)進行AID算法的研究。

        1.1 交通流基本參數(shù)分析

        在發(fā)生交通異常狀態(tài)時,交通流各參數(shù)數(shù)據(jù)將會發(fā)生顯著的波動,與之相反,對于交通狀態(tài)處于正常情況下的交通流各參數(shù)數(shù)據(jù)波動是在一定范圍內(nèi)的,當高速公路發(fā)生交通事件時,往往屬于偶發(fā)性交通事件,如車輛追尾,貨物散落等將造成這一路段在一定時間和范圍內(nèi)的交通擁堵導致道路的通行能力下降,車輛的行駛速度降低,道路占有率增加,如圖1所示。其初始特征變量:檢測器所采集的流量、速度、占有率。

        圖1 事件發(fā)生前后基本參數(shù)的變化Fig.1 Changes in basic parameters before and after the event

        1.2 交通流參數(shù)組合分析

        在發(fā)生交通事件時候,交通流參數(shù)將會發(fā)生一定的變化,對于單一的參數(shù)不能將這種變化放大,將考慮同一檢測器參數(shù)的不同的組合,例如不同參數(shù)之間的差值、乘積、比值,以同一檢測器交通實測量和交通預測量差值為例,如圖2所示,圖2中橢圓區(qū)域代表事件的發(fā)生。其中,本文交通流參數(shù)的預測值將采用移動平均法算出。其初始特征變量:同一檢測器所采集的實測流量與預測流量的差值,同一檢測器所采集的實測速度與預測速度的差值,同一檢測器所采集的實測占有率與預測占有率的差值,同一檢測器所采集的占有率與速度的比值,同一檢測器所采集的流量與速度的比值,同一檢測器所采集的占有率與流量的比值。

        圖2 事件發(fā)生時交通實測量與預測量之差Fig.2 The difference between the measured and predicted traffic at the time of the incident

        1.3 不同區(qū)間交通流參數(shù)分析

        當交通事件發(fā)生時,在事件發(fā)生路段的上下游是處于一個相反的交通狀態(tài),上游擁堵,則下游暢通。從數(shù)據(jù)層面上,其相鄰的兩個檢測器采集到的交通流參數(shù)車輛速度、流量、占有率等數(shù)據(jù)將有明顯的不同的變化,上游車輛速度降低,流量增加,占有率增加;下游則相反。其上下游檢測器交通參數(shù)的組合對交通事件的發(fā)生也有很強的敏感性。其初始特征變量:上下游檢測器流量的比值,上下游檢測器占有率的比值,上下游檢測器速度的比值。

        綜上所述,設計15個特征變量,構成交通事件檢測的初始變量見表1。

        2 基于樹模型的變量選擇

        樹模型一般不僅可以用來作為分類和回歸,還可以對特征變量進行選擇和重要度排序,比如決策樹是一種基本的分類和回歸的方法,但它也可以對特征變量進行選擇,選出對訓練集有較好分類能力的特征,一般采用的準則是基尼系數(shù)、信息增益或者信息增益比來進行特征選擇。通過樹模型:AdaBoost[9]、決策樹的提升方法梯度提升樹(GBDT)[10],還有決策樹的集合隨機森林(RF)作為樹模型對初始變量集進行特征變量篩選和排序,然后再將各特征變量在不同樹模型中的重要度排序,最終得到所有變量的重要度排序對應不同變量個數(shù)的分類正確率。其流程如圖3所示。

        表1 初始特征變量Table 1 Initial characteristic variables

        圖3 變量選擇流程Fig.3 Variable selection process

        3 加權隨機森林

        3.1 隨機森林理論

        隨機森林(RF)[11-14]是一種集成學習的組合分類器,利用Bootstrap重采樣方法從原始數(shù)據(jù)中有放回的抽樣,然后對抽取的樣本進行決策樹建模,將多顆決策樹組合在一起,通過投票得出最終分類和預測的結果。隨機森林算法在生成過程中實質(zhì)上是采用Bagging采樣技術對決策樹進行集成,其目的是防止產(chǎn)生局部最優(yōu)解。隨機森林算法的隨機性主要體現(xiàn)在兩點,第一是訓練集的隨機抽取,第二是特征變量的隨機選擇。其算法流程如下:

        (1)確定訓練集X、隨機變量m、樹的規(guī)模T。

        (2)通過Bagging采樣技術從訓練集中采取樣本。

        (3)在隨機變量m中,隨機的抽取n個變量(n≤m)與采取的樣本構建決策樹。

        (4)通過以上的不斷重復,形成多棵決策樹,生成隨機森林。并通過每棵決策樹的投票確定最終的分類結果。

        其最終的分類結果,可以表達為

        (1)

        式(1)中:H(X)為分類結果;ht(X)=y表示第t棵決策樹得出的結果;I(·)表示括號中的個數(shù);y=1,2,…,c表示類別數(shù);t=1,2,…,T為決策樹的數(shù)量。

        3.2 加權隨機森林算法

        對于傳統(tǒng)的隨機森林,在進行最后投票分類的時候,每棵決策樹的投票權重都是相同的,看似這種投票方式公平,但在隨機森林中每棵決策樹的分類精度都不一樣,有些分類效果可能較好,有些則相對較差,再加上交通事件數(shù)據(jù)樣本是一個不平衡數(shù)據(jù)樣本,將導致隨機森林的分類能力將趨向于大樣本數(shù)據(jù)下決策樹的分類結果。因此,提出加權隨機森林模型[15-16]。其主要思路是在給每棵決策樹設置一個權重,在進行投票時,每棵決策樹都要乘以這個權重值。其中將訓練樣中的一部分樣本用來對傳統(tǒng)隨機森林中的決策樹進行訓練,在訓練完成后,用另一部分訓練樣本作為測試樣本,對決策樹進行測試其分類能力。

        (2)

        (3)

        4 粒子群優(yōu)化加權隨機森林模型

        對于加權隨機森林算法,其中決策樹數(shù)量T、測試樣本X、隨機變量m、剪枝閾值ε等參數(shù)在實際編程時都是通過經(jīng)驗來選取,若取值不當將對模型的輸出有很大的影響,所以這些參數(shù)要進行優(yōu)化?,F(xiàn)在常用的參數(shù)優(yōu)化方法有網(wǎng)格子搜索法、遺傳算法相對于粒子群算法在優(yōu)化上的性能較差。為此,采用粒子群算法[17]對加權隨機森林的參數(shù)進行優(yōu)化,獲取最優(yōu)的參數(shù)。

        基于粒子群算法對加權隨機森林參數(shù)優(yōu)化的步驟如下:

        (1)最開始對決策樹數(shù)量T、測試樣本X、隨機變量m、剪枝閾值ε進行一個隨機的設定。

        (2)對用于分類的數(shù)據(jù)集進行Bootstrap采樣,隨機生成T個訓練數(shù)據(jù)集,并在每個訓練數(shù)據(jù)集中選出X個測試樣本。

        (3)將每個訓練數(shù)據(jù)集中的另一部分數(shù)據(jù)樣本對決策樹進行構建,共T棵,在對決策樹進行構建時,變量的選擇均從全部的變量中選出m個特征變量作為該決策樹結點的決策變量。

        (4)當結點內(nèi)包含的樣本數(shù)少于閾值ε時,將該結點作為葉結點,并返回其目標屬性的眾數(shù)作為該決策樹的分類結果。

        (5)在生成完T棵決策樹后,對每棵樹進行測試,并計算其權重。

        (6)通過式(3)計算出分類結果。

        (7)將分類結果作為準確率,采用粒子群算法對(1)中提到的參數(shù)進行迭代優(yōu)化,確定最終模型的參數(shù)。

        其本文算法流程圖如圖4所示。

        圖4 本文算法流程圖Fig.4 Flow chart of the proposed algorithm

        5 實例驗證

        5.1 數(shù)據(jù)來源

        數(shù)據(jù)來源于某市高速公路環(huán)形線圈檢測器采集的交通事件數(shù)據(jù),選取該高速公路長約為10 km的路段作為研究對象,該路段單向2車道,單車道寬3.5 m,大約平均500 m設置一個檢測截面。檢測器所采集的交通數(shù)據(jù)為流量、速度、占有率(時間占有率),采集時間間隔為1 min,共計發(fā)生5 760個樣本數(shù)據(jù),部分樣本數(shù)據(jù)見表2。

        表2 部分樣本數(shù)據(jù)Table 2 Partial sample data

        5.2 特征變量選擇

        采用基于樹模型的各種算法對交通事件的特征變量進行篩選,利用Python3.7編程實現(xiàn)這三種基于樹模型的算法對初始變量進行排序,圖5~圖7分別是各算法初始變量重要度排序,最終通過各算法得出的變量重要度[18]進行綜合得分排序,選擇出對于交通事件發(fā)生更為敏感的關鍵變量,如圖8所示。當進行初始變量篩選時,在尋找關鍵變量的同時也要保證分類正確率,經(jīng)過三種算法比較分析,選取5個重要度相對較高的關鍵變量,分別為:同一檢測器所采集的實測速度與預測速度的差值;同一檢測器所采集的實測占有率與預測占有率差值。

        圖5 基于Adaboost算法變量篩選Fig.5 Variable selection based on Adaboost algorithm

        圖6 基于GBDT算法變量篩選Fig.6 Variable selection based on GBDT algorithm

        圖7 基于RF變量篩選Fig.7 Screening based on random forest variables

        圖8 最終變量重要度排序Fig.8 Ranking of importance of final variables

        同一檢測器實際占有率與預測占有率比值;上下游檢測器速度的比值;上下游檢測器占有率的比值。

        5.3 參數(shù)優(yōu)化

        在設定決策樹棵數(shù)T和剪枝閾值ε時,對決策樹的數(shù)量在100~1 000取值;對剪枝閾值在10~100取值,分別判斷其取值對建立加權隨機森林模型分類正確率的影響。

        從圖9和圖10可以看出剪枝閾值和決策樹數(shù)量對加權隨機森林模型的分類準確率有一定的影響,其中當剪枝閾值達到50時,準確率達到最優(yōu)值,其后準確率逐漸降低并在此左右波動;準確率與決策樹的數(shù)量的曲線為緩慢上升的趨勢,決策樹到500時準確率達到最高,之后緩慢降低;由此可見,加權隨機森林的參數(shù)對模型的分類效果有一定的影響,所有將采用粒子群算法對模型參數(shù)進行優(yōu)化以取得最優(yōu)值。其中,粒子群優(yōu)化算法的參數(shù)設置如下:學習因子c1=2,c2=2,慣性權重w=0.8,粒子個數(shù)為20,粒子維數(shù)為4,迭代次數(shù)為100。

        5.4 實驗結果分析

        5.4.1 評價指標

        交通事件自動檢測算法(AID)評價指標采用以下指標:檢測率(detection rate,DR)、誤報率(false alarm rate,FAR)、平均檢測時間(mean time to detection,MTTD)。

        圖9 剪枝閾值對加權隨機森林分類性能的影響Fig.9 The influence of pruning threshold on the classification performance of weighted random forest

        圖10 決策樹數(shù)量對加權隨機森林分類性能的影響Fig.10 The influence of the number of decision trees on the classification performance of weighted random forest

        (1)檢測率(DR):是指在同一時間段內(nèi)AID算法檢測到的事件數(shù)與實際發(fā)生的事件總數(shù)的百分比。

        (4)

        式(4)中:DM為檢測到的事件數(shù);AM為實際發(fā)生的事件數(shù)。

        (2)誤報率(FAR):表示在一定時間段內(nèi),誤報事件數(shù)與所有決策次數(shù)之比。

        (5)

        式(5)中:FN為誤報事件數(shù);NR為所有決策次數(shù)。

        (3)平均檢測時間(MTTD):指求實際發(fā)生時間和AID算法檢測出事件的時間相差的算術平均值。

        (6)

        式(6)中:T(i)為被檢測到的第i個事件發(fā)生的時間;A(i)為第i個事件實際發(fā)生的時間。

        5.4.2 性能分析

        為了驗證對初始變量篩選后對事件檢測的有效影響和本文模型(PSO優(yōu)化的加權隨機森林)在交通事件自動檢測上綜合性能的評價,將引入支持向量機(SVM)、隨機森林(RF)算法進行檢測效果整體分析。通過構建初始變量訓練集,重要變量訓練集,并帶入這三種算法中測試其性能,結果見表3。

        由表3可知,從變量角度看出,在進行過變量篩選后,利用重要變量進行檢測,性能比利用初始變量檢測有所改善,其中構建的三種算法檢測率提高,誤報率降低;從算法模型的角度可以看出,本文構建的PSO優(yōu)化加權隨機森林模型對初始變量和重要變量的檢測性能都要比SVM、RF算法的檢測效果要更優(yōu),在檢測率和誤報率上都有更優(yōu)的效果,但在檢測時間上還有進一步提高。綜合實驗結果分析:本文中對特征變量進行篩選并構建PSO優(yōu)化的加權隨機森林模型與SVM、RF算法相比,在檢測性能上更優(yōu)。

        表3 不同算法檢測效果對比Table 3 Comparison of detection effects of different algorithms

        6 結論

        以往傳統(tǒng)的交通事件檢測算法,其輸入的特征變量是簡單的交通流參數(shù)。通過對事件發(fā)生前后基本交通流參數(shù)的分析,不同交通流參數(shù)組合分析,不同區(qū)間交通流參數(shù)的組合,構建了較為完整的初始變量,通過幾種不同基于樹模型的算法綜合分析得出重要變量。并運用PSO算法對加權隨機森林優(yōu)化,構建交通事件檢測的模型,通過與SVM、RF的比較,本文算法在性能上更優(yōu)。

        猜你喜歡
        占有率檢測器決策樹
        數(shù)據(jù)參考
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機森林方法在管理決策中的應用
        電子制作(2018年16期)2018-09-26 03:27:06
        車道微波車輛檢測器的應用
        微軟領跑PC操作系統(tǒng)市場 Win10占有率突破25%
        基于決策樹的出租車乘客出行目的識別
        一種霧霾檢測器的研究與設計
        滁州市中小學田徑場地現(xiàn)狀調(diào)查與分析
        9月服裝銷售疲軟
        中國服飾(2014年11期)2015-04-17 06:48:50
        基于肺癌CT的決策樹模型在肺癌診斷中的應用
        日韩精品一区二区三区在线观看的 | 亚洲人交乣女bbw| 妓院一钑片免看黄大片| 亚洲另在线日韩综合色| 国产成人自拍视频视频| 99久久精品费精品国产一区二| 成人午夜福利视频镇东影视| 91av精品视频| 亚洲妇女av一区二区| 久久久中文字幕日韩精品| 色avav色av爱avav亚洲色拍| 99视频这里有精品| 亚洲精品精品日本日本| 精品少妇一区二区av免费观看| 欧美性猛交xxxx富婆| 欧美在线专区| 蜜桃av福利精品小视频| 人妻少妇偷人精品久久性色av| 国产精品国产三级国av在线观看| 中日韩欧美在线观看| 狼人狠狠干首页综合网| 亚洲av高清一区二区三| 永久免费观看国产裸体美女 | 日韩精品一二三区乱码| 香港三级日本三级a视频| 丝袜AV在线一区二区三区| 国产91九色视频在线播放| 亚洲精品中文字幕免费专区| 欧美日韩色另类综合| 亚洲欧美国产日产综合不卡| 亚洲一区二区三区精品久久av | 欧美日韩在线视频一区| 久久精品国产亚洲av高清色欲| 熟女白浆精品一区二区| 亚洲高清国产一区二区| 欧美精品v国产精品v日韩精品| 无遮挡十八禁在线视频国产制服网站 | 永久免费中文字幕av| 蜜桃视频免费进入观看| 自慰无码一区二区三区| 久久精品国产亚洲AV香蕉吃奶|