邴其春 楊兆升,2,3▲ 周熙陽 田秀娟
(1.吉林大學(xué)交通學(xué)院 長春130025;2.吉林大學(xué)汽車仿真與控制國家重點實驗室 長春130025;3.吉林大學(xué)吉林省道路交通重點實驗室 長春130025)
交通事件不僅會引起交通擁堵,而且極大地影響著人們的生命財產(chǎn)安全。研究表明,在發(fā)達(dá)國家由交通事件引起的交通擁堵已達(dá)到12%~33%。因此,準(zhǔn)確、及時的交通事件自動檢測算法(automated incident detection algorithms,AID)對于提高交通運(yùn)輸系統(tǒng)的效率與安全具有重要意義。自20世紀(jì)70年代以來,發(fā)達(dá)國家對交通事件檢測算法的持續(xù)研究取得了一系列卓有成效的成果。早期開發(fā)的交通事件檢測算法主要有加利福尼亞算法[1]、標(biāo)準(zhǔn)偏差算法[2]、貝葉斯算法[3]、基于突變理論的 McMaster算法[4]、低通濾波算法[5]等,其中加利福尼亞算法和 McMaster算法是被公認(rèn)的2種經(jīng)典算法,通常被用于對比新開發(fā)AID算法的性能。隨著對交通流特性的深入研究以及人工智能等新技術(shù)的發(fā)展,一系列AID新方法相繼產(chǎn)生,如神經(jīng)網(wǎng)絡(luò)算法[6]、支持向量機(jī)算法[7]、小波算法[8]、卡爾曼濾波算法[9]、貝葉斯算法[10]、多智能體算法[11]等等。然而,現(xiàn)有 AID算法的輸入變量大多依靠人工經(jīng)驗確定,且使用的人工智能算法普遍存在學(xué)習(xí)速度慢、容易陷入局部最優(yōu)、易發(fā)生過擬合等方面的不足,從而導(dǎo)致誤警率較高、檢測時間偏長,嚴(yán)重影響著AID算法的泛化能力。筆者在分析交通事件條件下交通流參數(shù)變化趨勢的基礎(chǔ)上,多角度構(gòu)建交通事件檢測初始交通變量,利用因子分析方法(factors analysis,F(xiàn)A)對初始交通變量進(jìn)行特征提取,使其既包含原始數(shù)據(jù)的全部有效信息,又避免輸入變量之間的冗余和重復(fù),并充分利用最小最大概率機(jī)模型全局優(yōu)化、適應(yīng)性強(qiáng)、泛化能力好的特點設(shè)計全新的交通事件自動檢測算法。
最小 最 大 概 率 機(jī)[12](minimax probability machine,MPM)是1種基于最小錯分概率的新型分類器,它的分類思想是通過控制錯分概率以達(dá)到分類最大化的目的[13]。最小最大概率機(jī)模型能夠充分利用數(shù)據(jù)的全局性質(zhì),以樣本的均值和協(xié)方差代替真實的均值和協(xié)方差,從而實現(xiàn)較好的分類效果。
xy差,x,y,∈Rn,∑x,∑y∈Rn×n。在2類樣本的均值和協(xié)方差已知的條件下,通過尋找超平面aTz=b (a,z∈Rn,b∈R) ,按照最大概率分離2類樣本。分類問題可描述為
式中:α為正確分類樣本數(shù)據(jù)的概率。
式中:α*和κ*為α和κ達(dá)到最優(yōu)值時的值。式(2)中約去b后經(jīng)簡單變換可變?yōu)?/p>
設(shè)aT(-)=1,優(yōu)化問題可變?yōu)?/p>
消去變量κ后式(5)變?yōu)?/p>
這是1個凸優(yōu)化問題,可以求出a的最優(yōu)值a*,進(jìn)而求出κ的最優(yōu)值κ*,把a(bǔ)*和κ*代入式(3)求出b的最優(yōu)值b*,此時最優(yōu)分類超平面的判別函數(shù)為sign (znew-b*),如果值為+1,表示znew屬于x類,否則znew屬于y類。對于線性不可分的情況,可以引入核函數(shù)把數(shù)據(jù)從低維空間映射到高維空間中使用最小最大概率機(jī)對數(shù)據(jù)進(jìn)行分類。
當(dāng)路段發(fā)生交通事件時,線圈檢測器所獲取的交通流參數(shù)會有明顯的變化。交通事件發(fā)生位置上游檢測器采集的流量和速度急劇下降,占有率急劇上升;下游檢測器采集的流量下降、速度上升、占有率下降[14]。事件發(fā)生時段交通流參數(shù)的顯著變化是設(shè)計交通事件自動檢測算法的基本依據(jù),通過大量分析事件狀態(tài)下線圈檢測器獲取的交通流數(shù)據(jù)發(fā)現(xiàn),不僅流量、速度、占有率3個基本參數(shù)在交通事件發(fā)生時段會有明顯變化,不同交通參數(shù)之間的組合對交通事件的發(fā)生也表現(xiàn)出很強(qiáng)的敏感性。因此,本文選取了如表1所列的交通事件檢測初始交通變量。
表1 初始交通變量表Tab.1 The table of initial traffic variables
首先利用因子分析法對初始交通變量提取關(guān)鍵特征,然后用最小最大概率機(jī)分類算法對處理后的數(shù)據(jù)進(jìn)行分類,可構(gòu)造如圖1所示的交通事件檢測算法流程。具體步驟如下。
1)獲取事件檢測的初始交通變量數(shù)據(jù)集,并對數(shù)據(jù)集進(jìn)行歸一化處理,形成標(biāo)準(zhǔn)化的事件檢測初始變量數(shù)據(jù)集。
2)對標(biāo)準(zhǔn)化后的交通變量數(shù)據(jù)集進(jìn)行因子分析,提取主因子并計算因子得分,得到訓(xùn)練樣本集和測試樣本集。
3)用訓(xùn)練數(shù)據(jù)集訓(xùn)練最小最大概率機(jī)分類器,用交叉驗證法選取最小最大概率機(jī)的參數(shù),得到最優(yōu)決策超平面znew-b*=0。
圖1 算法流程圖Fig.1 The process of the proposed algorithm
實驗數(shù)據(jù)來源于美國加利福尼亞州I-880數(shù)據(jù)庫,該數(shù)據(jù)庫包含I-880高速公路上35個檢測站所有車道的流量、速度和占有率數(shù)據(jù)。數(shù)據(jù)的采樣間隔為30s。前期采集時間為1993年2月16日~3月19日,后期采集時間為1993年9月27日~10月29日,記錄了每天上午05:00~10:00時,下午14:00~20:00時的交通流數(shù)據(jù)。通過整理數(shù)據(jù),挑選出45個交通事件,其中,向北的事件22個,向南事件23個,將事件開始到事件結(jié)束時段內(nèi)的所有交通流參數(shù)均視為事件數(shù)據(jù)。將1993年2月18日全天無事件的交通流參數(shù)作為正常狀態(tài)數(shù)據(jù)。將交通事件數(shù)據(jù)庫與正常狀態(tài)的交通數(shù)據(jù)庫分為訓(xùn)練集和測試集2個部分,其中約2/3用于訓(xùn)練,剩余部分用于測試。
利用SPSS17.0統(tǒng)計分析軟件對選取初始交通變量進(jìn)行因子分析,首先對初始交通變量數(shù)據(jù)集進(jìn)行歸一化標(biāo)準(zhǔn)處理,并進(jìn)行KMO檢驗和巴特萊特球度檢驗。檢驗結(jié)果見表2。
表2 KMO檢驗和巴特萊特球度檢驗結(jié)果表Tab.2 The results of KMO test and Bartlett test of Sphericity
由檢驗結(jié)果可見,KMO值為0.833大于0.5,且巴特萊特球度檢驗的球度檢驗值為6 738.372,顯著性概率為0.000,小于0.01,說明本文選取的初始交通變量具有較強(qiáng)的相關(guān)性,適合做因子分析。圖2為利用因子分析所得到的因子提取碎石圖,由圖2可見,只需提取前3個主因子即可較好的涵蓋所有初始交通變量的有效信息。因此,本文選取主因子個數(shù)為3。
圖2 因子提取碎石圖Fig.2 The scree plot of factor extraction
表3為交通變量的主因子得分,各個主因子可通過初始交通變量的線性組合表示,并可計算各個交通變量主因子的得分值,進(jìn)而獲取交通事件檢測輸入數(shù)據(jù)集。
表3 交通變量主因子得分表Tab.3 The main factor score table of traffic variables
為了驗證最小最大概率機(jī)算法的分類性能,本文選取線性 MPM和核 MPM 2種形式進(jìn)行分析,其 中 核 函 數(shù) 的 表 達(dá) 式 為 K (zi,zj)=exp(-‖zi-zj‖2/σ)。高斯核函數(shù)參數(shù)σ的選取對分類效果有很大影響,以往的研究大多按照經(jīng)驗選取。為了得到合理準(zhǔn)確的核寬度σ值,本文采用交叉驗證的方法確定σ值,圖3為向南方向測試數(shù)據(jù)庫中高斯核函數(shù)參數(shù)σ對分類正確率的影響。
由實驗結(jié)果可以看出,當(dāng)σ為1.6時,交通事件檢測率最高,達(dá)到98.6%,且當(dāng)σ取0.4~1.6時,分類正確率維持在98.5%上下,具有較好的穩(wěn)定性。因此,MPM算法對于參數(shù)的選取具有較好的魯棒性,能夠增強(qiáng)算法的靈活性,本文選取高斯核函數(shù)的核寬度值σ為1.6。
圖3 不同σ值的事件檢測率Fig.3 Theidentification rate for differentσ
為了驗證因子分析方法對于提高交通事件檢測效果的有效性,筆者分別將初始交通變量和特征提取變量作為輸入變量,以向南方向交通事件數(shù)據(jù)庫為例,利用核函數(shù)MPM算法(kernel minimax probability machines,KMPM)和線性 MPM算 法 (linear minimax probability machines,LMPM)進(jìn)行實驗,采用檢測率(identification rate,IR)、誤檢率(false identification rate,F(xiàn)IR)和 平 均 檢 測 時 間 (mean time to detection,MTTD)作為評價指標(biāo),結(jié)果見表4。
表4 檢測結(jié)果對比Tab.4 The comparison of identification results
由檢測結(jié)果可見,2種不同形式輸入變量的事件檢測效果均較好,相比之下,筆者提出的利用因子分析進(jìn)行特征提取的交通事件檢測方法效果更優(yōu)。由此可見,深入分析交通流的運(yùn)行特性,從多角度設(shè)計初始交通變量,能夠得到較好的交通事件檢測效果,同時對初始交通變量進(jìn)行合理有效的特征提取對提高事件檢測效果也尤為重要。
BP神 經(jīng) 網(wǎng) 絡(luò) 模 型 (back propagation neural network,BPNN)和支持向量機(jī)模型(support vector machine,SVM)是目前應(yīng)用最廣泛的2種人工智能AID算法,其應(yīng)用效果得到了充分證明。為進(jìn)一步對比分析本文所設(shè)計算法的有效性,本文選取以特征交通變量作為輸入變量的BP神經(jīng)網(wǎng)絡(luò)模型和支持向量機(jī)模型作為對比算法進(jìn)行對比分析。為充分驗證本文設(shè)計算法的有效性,將事件數(shù)據(jù)按向南方向、向北方向和混合方向進(jìn)行分類,分別進(jìn)行實驗分析和對比分析。實驗結(jié)果見表5。
表5 檢測結(jié)果對比Tab.5 The comparison of identification results
由檢測結(jié)果可見,對于向南方向、向北方向和混合方向,F(xiàn)A-MPM方法事件檢測效果均優(yōu)于SVM和BP神經(jīng)網(wǎng)絡(luò)方法,且KMPM的檢測效果更優(yōu)于LMPM,說明FA-MPM能夠有效的提高交通事件檢測的效果,且使用核函數(shù)MPM方法的檢測效果更優(yōu)于線性MPM方法。從不同交通事件庫的檢測效果看,向南方向的事件檢測效果最好,這是因為向南方向的交通事件大多導(dǎo)致多條車道發(fā)生堵塞,交通流參數(shù)波動較大;向北方向的事件檢測效果最差,這是因為向北方向多為輕微交通事件,對交通流影響較小,交通流參數(shù)波動不明顯。從混合方向的檢測效果看,筆者所設(shè)計的算法總體取得了較好的檢測效果,明顯優(yōu)于對比算法。
針對現(xiàn)有交通事件檢測算法在輸入變量選取方面的局限性,筆者綜合分析交通流參數(shù)的變化趨勢,構(gòu)建了全面的交通事件檢測初始變量,設(shè)計了1種基于因子分析和最小最大概率機(jī)的交通事件檢測算法,并通過實測數(shù)據(jù)驗證取得了較好的檢測效果。然而,本文方法仍存在一些不足和缺陷,主要有以下幾點。
1)本文方法的實現(xiàn)依賴于道路上地點交通參數(shù)采集設(shè)備布設(shè)的數(shù)量和密度,且僅適用于連續(xù)交通流的高速公路和城市快速路,對于有信號控制的城市道路具有一定局限性。
2)本文方法設(shè)置的初始交通變量較多,且需要進(jìn)行特征變量提取,從而導(dǎo)致事件檢測算法的實時性和計算效率有待進(jìn)一步提高。
[1] PAYNE H J,HELFENBEIN E D,KNOBEL H C.Development and testing of incident detection algorithms[R].Washington D C,USA:Federal Highway Administration,1976.
[2] DUDEK C L,MESSER C J,NUCKLES N B.Incident detection on urban freeways[R]Transportation Research Board.Washington D C:TRB,1974.
[3] ABUELELA M,OLARIU S.Automatic incident detection in VANETs:a Bayesian approach[C].IEEE Vehicular Technology Conference.Barcelona,Spain:IEEE,2009:1-5.
[4] PERSAUD B N,HALL F L.Catastrophe theory and patterns in 30-second freeway traffic data-implication for incident detection[J].Transportation Research Part A,1990,23(2):103-113.
[5] STEPHANEDES Y J,CHASSIAKOS A P.Application of filtering techniques for incident detection[J].Journal of Transportation Engineering,1993,119(1):13-26.
[6] 覃頻頻.事件檢測概率神經(jīng)網(wǎng)絡(luò)模型的建立與驗證[J].交通運(yùn)輸系統(tǒng)工程與信息,2006,6(4):70-74.QIN Pinpin.Establishment and verification of PNN model for incident detection[J].Journal of Transportation Systems Engineering and Information Technology,2006,6(4):70-74.(in Chinese)
[7] 王武功,馬榮國.交通事件檢測的加權(quán)支持向量機(jī)算法[J].長安大學(xué)學(xué)報:自然科學(xué)版,2013,33(6):84-87.WANG Wugong,MA Rongguo.Weighed support vector machine for traffic incident detection[J].Journal of Changan University:Natural Science Edition,2013,33(6):84-87.(in Chinese)
[8] JEONG Y S,CASTRO N M,JEONG M K,et al.A wavelet-based freeway incident detection algorithm with adapting threshold parameters[J].Transportation Research Part C,2009,19(1):1-19.
[9] 唐夕茹,陳艷艷,趙源.基于短時交通預(yù)測的公路交通異常判別方法[J].交通信息與安全,2014,32(2):95-99.TANG Xiru,CHEN Yanyan,ZHAO Yuan.Shortterm traffic prediction theory-based method for discriminating highway abnormal traffic status[J].Journal of Transport Information and Safety,2014,32(2):95-99.(in Chinese)
[10] 張 輪,楊文臣,劉 拓,等.基于樸素貝葉斯分類的高速公路交通事件檢測[J].同濟(jì)大學(xué)學(xué)報:自然科學(xué)版,2014,42(4):558-563.ZHANG Lun,YANG Wenchen,LIU Tuo,et al.A naive Bayesian classifier-based algorithm for freeway traffic incident detection[J].Journal of Tongji University:Natural Science Edition,2014,42(4):558-563.(in Chinese)
[11] 梁 軍,沈偉國,蔣 焱,等.基于車聯(lián)網(wǎng)信息融合多Agent方法的交通事件檢測[J].長安大學(xué)學(xué)報:自然科學(xué)版,2014,34(4):159-166.LIANG Jun,SHEN Weiguo,JIANG Yan,et al.Automatic incident detection based on vehicle networking of multi-agent information fusion method[J].Journal of Changan University:Natural Science Edition,2014,34(4):159-166.(in Chinese)
[12] LANCKRIET G R G,GHAOUI L E,BHATTACHARYYA C,et al.Minimax probability ma-chine[C].Proceedings of Advances in Neural Information Processing Systems,Berkeley:Department of EECS University of California,2002:1-7.
[13] 屠 立,張樹有.基于最小最大概率機(jī)的客戶需求分類技術(shù)[J].農(nóng)業(yè)機(jī)械學(xué)報,2009,40(3):184-188.TU Li,ZHANG Shuyou.Study on VOC classification approach based on MPM[J].Transactions of the Chinese Society for Agricultural Machinery,2009,40(3):184-188.(in Chinese)
[14] 蔡志理.高速公路交通事件檢測及交通疏導(dǎo)技術(shù)研究[D].長春:吉林大學(xué),2007.CAI Zhili.Study on traffic incident detection and traffic evanesce technologies for freeway[D].Changchun:Jilin University,2007.(in Chinese)