胡丹龍,余立建,楊 陽
(西南交通大學 交通信息工程及控制實驗室,四川 成都 610031)
高速公路交通事件自動檢測算法是高速公路交通管理以及控制系統(tǒng)的重要組成部分,準確、快速地檢測事件的發(fā)生,已經(jīng)成為高速公路交通管理控制系統(tǒng)能否成功發(fā)揮作用的關鍵。高速公路事件指的是由于非偶然性因素而破壞正常的交通流并且導致道路通行能力下降的事件。高速公路事件嚴重的影響交通安全,造成交通流混亂及車輛延誤。高速公路事件自動檢測是高速公路交通管理與控制系統(tǒng)的重要組成部分,如何準確、快速地檢測和確定事件發(fā)生的時間、地點以及性質,是高速公路交通管理與控制系統(tǒng)能否成功運行并且發(fā)揮作用的關鍵。
現(xiàn)有的檢測方法主要是通過對檢測線圈檢測到的交通流參數(shù)的分析來判定發(fā)生交通事件的可能性,最早開發(fā)并投入使用的交通事件自動檢測算法(AID算法)是以判別突發(fā)事件為主的加州算法,后來出現(xiàn)如標準偏差算法指數(shù)平滑算法、貝葉斯算法等,近些年隨著電子技術,自動化技術的大力發(fā)展,基于人工智能的AID算法受到更多學者的極大關注。出現(xiàn)利用神經(jīng)網(wǎng)絡、模糊算法,支持向量機等算法進行高速公路交通事件檢測,本文正是利用SVM的全局優(yōu)化,適應性強,泛化能力好的特點,針對I-880數(shù)據(jù)庫采集到的實時交通數(shù)據(jù)參數(shù),將支持向量機應用到高速公路交通事件檢測系統(tǒng)中來。
支持向量機(Support Vector Machine)是Cortes和Vapnik于1995年首先提出來的,它是建立在VC維理論和結構風險最小原理基礎上,根據(jù)對特定訓練樣本的學習精度(Accuracy)和學習能力之間尋求最佳折衷,以期獲得最好的推廣能力(或稱泛化能力)。所謂最優(yōu)分類線,就是要求分類線不但能將分類正確分開,使訓練錯誤率為0,而且還要使分類間隔最大。前者保證經(jīng)驗風險最?。皇狗诸愰g隔最大實際上就是保證其具有一定的推廣性。
支持向量機數(shù)學描述為
1)設已知數(shù)據(jù)樣本集(xi,xj),yi∈{-1,+1}。
2)選取適當?shù)暮撕瘮?shù)K(xi,xj)和適當?shù)膮?shù)C,構造并求解最優(yōu)化問題
求得最優(yōu)解
3)選取α*的一個正分量0<α*j<C,并根據(jù)此計算閥值
采用不同的核函數(shù),SVM算法可以構成不同的學習機,目前常用的核函數(shù)有3類。
1)多項式核函數(shù):
2)徑向基核函數(shù):
3)雙曲線正切核函數(shù):
其中,當核函數(shù)的階數(shù)越高,對應的特征空間維數(shù)越高,運算越復雜,而雙曲線正切核函數(shù)只在某些情況下滿足Mercer條件,并且表現(xiàn)不如徑向基核函數(shù)好,徑向基核函數(shù)是應用最廣的SVM核函數(shù),如果沒有充分獲得樣本集和分類問題的先驗信息,此核函數(shù)表現(xiàn)出色,因此本文選取徑向基核函數(shù)作為支持向量機的核函數(shù)。
PSO的基本思想:每個優(yōu)化問題的潛在解都是搜索空間中的粒子,所有粒子都有一個被優(yōu)化的函數(shù)所決定了的適應值;另外,每一個粒子還有一個速度向量決定他們飛行的方向和距離,然后,粒子們追隨當前的最優(yōu)粒子在解空間中進行搜索。PSO隨機初始化一群粒子,接著通過迭代的方法找出最優(yōu)解。在每一次迭代中,粒子通過跟蹤兩個極值來更新自己,第一個就是粒子本身到當前時刻為止找到的最好解,這個解稱為個體最好值,另一個極值就是整個種群到當前時刻為止找到的最好解具體算法如下:假設在一個D維的目標搜索空間中,有m個粒子組成一個群體,其中第i個粒子的位置表示為向量
其中速度也是一個D維的向量,記vi=(vi1,vi2,…,viD)。第i個粒子迄今為止搜索到的最優(yōu)位置pi=(pi1,pi2,…,piD)。
整個粒子群搜索到的最優(yōu)位置為pg=(pg1,pg2,…,pgD)粒子群更新式為
式中:i=1,2,…,m;d=1,2,…,D;加速常數(shù)c1和c2為非負常數(shù);r1和r2服從[0,1]上的均勻分布隨機數(shù)。xid(t)是第i個粒子的當前位置pid是第i個粒子截止目前搜索到的最優(yōu)位置,pgd是整個粒子群體搜索到的最優(yōu)位置,vid是第i個粒子的當前速度。本式為基本的pso,速度表達式中分為3部分,第1部分為當前速度對下個粒子速度的影響,可以起到平衡全局,提高局部搜索能力;第2部分反映了粒子本身記憶帶來的影響;第3部分反映群體信息的影響,體現(xiàn)粒子之間的信息共享與合作。文中采取改進后的PSO算法,即增加慣性權重w,通過控制w的取值大小可以調節(jié)PSO的全局和局部的尋優(yōu)能力。經(jīng)試驗發(fā)現(xiàn)慣性權重采用動態(tài)時候取得更好的尋優(yōu)結果,其式可以表示為
式中:wmax,wmin分別為w的最大、最小值;n,N為當前迭代次數(shù)和總的迭代次數(shù)。
本文的數(shù)據(jù)來源于高速公路交通數(shù)據(jù)庫I-880,此數(shù)據(jù)庫主要包含每個路段,每個車道的速度、流量和占有率等數(shù)據(jù),還有一個交通事件數(shù)據(jù)庫,本文選取代表擁堵的45個交通事件和3d無事件數(shù)據(jù)來建模,其中,訓練集采用25個有交通事件的2100組數(shù)據(jù)和無交通事件的5000組數(shù)據(jù)組成,測試集由其他23個事件(2036組)和2036個無事件組成,如表1所示。
表1 訓練集和測試集樣本數(shù)據(jù)劃分
一般交通事件檢測算法好壞的評價標準有3個指標,檢測率(DR)、誤警率(FAR)、平均檢測時間(MTTD)。檢測要求檢測率高、誤檢率低,而且還要保證平均檢測時間盡量低。
檢測率(DR):是指一定時間內算法正確檢測出的有效事件數(shù)目與實際發(fā)生事件數(shù)目比值,即,
RN是正確檢測出的事件數(shù),CN實際發(fā)生的事件數(shù);
誤報率(FAR)是指在特定時間段內,算法檢測誤報事件的數(shù)與檢測到的事件總數(shù)的比值,即
式中:FN是在時間T內算法檢測誤報事件的次數(shù),CDN是指檢測到的事件總數(shù)。
平均檢測時間指的是算法檢測出的事件發(fā)生時刻與事件實際發(fā)生時刻差值的算術平均值。即
式中:TI(i)為事件i實際發(fā)生的時刻,TA(i)為事件i被檢測到的時刻,n為算法檢測到的實際發(fā)生的事件數(shù)。
本實驗均采用 MATLAB 7.0編寫程序,在DELL p390型計算機上運行,PSO參數(shù)選擇為最大進化數(shù)為150,種群數(shù)量為20,c1為1.5,c2為1.5,懲罰參數(shù)C和核函數(shù)g的搜索范圍為[0.1100]和[0.01100],適應度函數(shù)采用訓練集分類正確率,仿真如圖1所示。
經(jīng)過150次迭代,訓練集數(shù)據(jù)的分類正確率達到了99.2%,將參數(shù)選定后的模型對測試集合進行測試,計算各種交通檢測評價指標并且與沒用PSO優(yōu)化的SVM做對比,如表2所示。
表2 SVM和PSO_SVM比較
圖1 PSO優(yōu)化SVM適應度變化
實驗發(fā)現(xiàn)通過粒子群搜索驗證支持向量機的參數(shù),在分類正確率以及事件檢測率上面都有提高,分類正確率達到了94.85%,平均檢測時間上采用粒子群優(yōu)化增加了算法,每次在速度與位置更新時,計算適應度函數(shù)的值而增加了復雜度,導致檢測時間有所延長。
本文采用了PSO和SVM相結合算法,為高速公路交通事件檢測提供了一種比較可靠的算法,通過增加動態(tài)慣性權重,更好的調節(jié)PSO的全局與局部尋優(yōu)能力。提高了檢測分類率,進一步的研究將結合交通系統(tǒng)的其他參數(shù),并且在數(shù)據(jù)處理方面做一些改進,爭取達到更好的效果。
[1] 龔炯,余立建,魏文.基于PCA-SVM的交通事件檢測研究[J].物流工程與管理,2010,32(189):87-89.
[2] 陳維榮,關佩,鄒月嫻.基于SVM的交通事件檢測技術[J].西南交通大學學報,2011,46(1):63-64.
[3] 李傳志,胡如夫.公路交通事件檢測技術的研究與展望[J].交通科技與經(jīng)濟,2008(49):68-69.
[4] 武林芝,陳淑燕,鄭小花.基于PCA和SVM的交通事件檢測算法[J].微計算機信息(測控自動化),2010,26(5):220-221.
[5] 劉煌.一種基于遺傳算法的改進PSO優(yōu)化算法[J].計算機應用與軟件,2010,9(3):59-60.
[6] 劉靜.基于PSO結合SVM的肉品新鮮度判別方法[J].江蘇大學學報,2012,33(3):291-292.
[7] 陳祥梅.GA-SVM在高速公路交通事件檢測中的應用研究[D].成都:西南交通大學,2009.
[8] 龔炯.基于SVM的高速公路交通事件檢測算法研究[D].成都:西南交通大學,2010.