錢 超,徐 娜,許宏科,代 亮,李 雪
(1.長安大學(xué) 電子與控制工程學(xué)院,西安710064;2.西安公路研究院,西安710054)
基于蒙特卡羅模擬的交通狀態(tài)辨識
錢 超*1,徐 娜2,許宏科1,代 亮1,李 雪1
(1.長安大學(xué) 電子與控制工程學(xué)院,西安710064;2.西安公路研究院,西安710054)
提出了一種基于蒙特卡羅模擬的利用交通流參數(shù)實現(xiàn)交通狀態(tài)辨識的方法.采用FANNY算法實現(xiàn)了四種交通狀態(tài)的聚類分析;利用蒙特卡羅模擬方法建立了SVC交通狀態(tài)辨識模型;分別構(gòu)建了固定窗口模型和滑動窗口模型對交通狀態(tài)進(jìn)行辨識并綜合評價.分析結(jié)果表明:該方法能夠?qū)崟r交通流參數(shù)進(jìn)行準(zhǔn)確辨識,尤其是構(gòu)建的滑動窗口模型,對交通狀態(tài)辨識平均精度、召回率和F度量分別為97.98%、94.64%和96.21%.本方法可為分析高速公路交通狀態(tài)演化規(guī)律和發(fā)展趨勢,建立預(yù)測預(yù)警、應(yīng)急處置和信息發(fā)布等應(yīng)急運行機(jī)制提供科學(xué)方法和數(shù)據(jù)支撐.
公路運輸;交通狀態(tài)辨識;蒙特卡羅模擬;交通流參數(shù);SVC;數(shù)據(jù)挖掘
交通狀態(tài)是指交通流總體運行狀態(tài),具有多維度、多粒度、隨機(jī)性和時變性等特征.由于我國高速公路交通量調(diào)查體系建設(shè)滯后,同時缺乏對高速公路交通狀態(tài)進(jìn)行科學(xué)和系統(tǒng)的研究,缺少對交通狀態(tài)演變的時空規(guī)律性分析,導(dǎo)致對高速公路交通流量分配控制、限速控制,以及面向管理與決策的區(qū)域路網(wǎng)優(yōu)化等問題不能提供科學(xué)依據(jù).
目前國內(nèi)外尚無統(tǒng)一的交通狀態(tài)或交通擁擠判別定義,比較通用的是美國《道路通行能力手冊》(Highway Capacity Manual,HCM)中提出的量化分層的道路服務(wù)標(biāo)準(zhǔn)—服務(wù)水平(Lever of Service,LOS);此外德國學(xué)者B.S.Kerner在大量高速公路實測數(shù)據(jù)基礎(chǔ)上提出了三相交通流理論(Three-phase Traffic Theory)[1].近年來國內(nèi)也開展了交通狀態(tài)判別研究并初步形成了路網(wǎng)運行狀態(tài)的評價體系,如皮曉亮[2]、董春嬌[3]、陳紅[4]等人均通過不同的方法實現(xiàn)了交通狀態(tài)判別;交通運輸部2012年頒布的《公路網(wǎng)運行監(jiān)測與服務(wù)暫行技術(shù)要求》中使用擁擠度f描述路段上交通流擁擠程度,根據(jù)不同斷面時間平均速度的均值劃分為暢通、基本暢通、輕度擁堵、中度擁堵、嚴(yán)重?fù)矶碌任鍌€等級.
以上研究的重點主要集中在狀態(tài)分類與識別算法實現(xiàn)方面.由于交通狀態(tài)具有時變性和隨機(jī)性,且存儲交通流參數(shù)歷史數(shù)據(jù)的空間是海量的,如何對實時運行的大規(guī)模交通參數(shù)數(shù)據(jù)進(jìn)行分類和辨識是亟待解決的問題.
本文的目標(biāo)是針對高速公路交通狀態(tài)運行特性,研究挖掘交通流海量歷史數(shù)據(jù),實現(xiàn)交通狀態(tài)的合理分類與科學(xué)辨識.本文在相關(guān)研究的基礎(chǔ)上提出一種基于蒙特卡羅模擬的利用交通流參數(shù)實現(xiàn)交通狀態(tài)辨識的方法.該方法首先采用改進(jìn)的模糊聚類算法——FANNY算法實現(xiàn)四種交通狀態(tài)的聚類分析,得到交通狀態(tài)數(shù)據(jù)集;然后利用蒙特卡羅模擬方法對交通狀態(tài)數(shù)據(jù)集隨機(jī)抽樣,對得到的樣本建立以徑向基為核函數(shù)的SVC交通狀態(tài)辨識模型,并分別采用固定窗口模型和滑動窗口模型進(jìn)行訓(xùn)練和測試;最后對交通狀態(tài)辨識結(jié)果進(jìn)行綜合評價.
2.1 交通流參數(shù)的選取
交通流量、速度和密度被稱為交通流三要素,是交通流理論的基本要素.
(1)交通流量是指單位時間內(nèi)通過道路斷面或車道的車輛數(shù),計算公式為
式中 q表示交通流量(veh/h);N表示車輛數(shù)(veh);T表示統(tǒng)計交通流量的時間范圍(h).由于實際交通流中車輛類型各異,為進(jìn)行統(tǒng)一尺度下的度量,通常將車輛數(shù)折算成當(dāng)量交通量pcu.
(2)交通流參數(shù)中的速度通常指平均速度,根據(jù)觀測對象和計算方式的不同,平均速度又分為時間平均速度和區(qū)間平均速度.時間平均速度是在某一觀測時間段內(nèi),所有車輛通過某特定觀測點時瞬時速度的算術(shù)平均值.時間平均速度是評價斷面交通運行狀態(tài)的重要計量參數(shù),計算公式為
式中 uˉt表示t時間段的時間平均速度(km/h);N表示t時間段內(nèi)通過觀測點的車輛數(shù)(pcu);ui表示t時間段內(nèi)第i輛車通過觀測點的瞬時速度(km/h).
(3)交通密度是指在某一瞬時,單位長度道路上存在的車輛數(shù),即
式中 k表示交通密度(veh/km);N表示車輛數(shù)(veh);L表示觀測路段長度(km).
由于受交通檢測設(shè)備測量范圍的限制,交通密度不容易動態(tài)獲取,通常使用交通流檢測器直接測量得到的車道時間占有率來代替.時間占有率是指在一定時間內(nèi),車輛通過某一斷面所需時間的累計值占該觀測時間量的百分比,即
式中 ot表示時間占有率(%);ti表示觀測時間內(nèi)第i輛車通過車道斷面占用的時間(s);T為總觀測時間(s).
本文選取流量、速度和占有率三類參數(shù)反映交通流運行狀態(tài).
2.2 交通狀態(tài)聚類分析方法
根據(jù)選取的流量、速度、占有率等三類交通流基本參數(shù),得到交通狀態(tài)三維空間.交通狀態(tài)聚類分析就是根據(jù)空間中樣本分布,將距離相近的樣本劃歸成一類,其原則是使得類間距離盡可能大,而類內(nèi)樣本間距離盡可能小,從而得到暢通、平穩(wěn)、擁擠和阻塞等四種交通狀態(tài)的劃分方法.
模糊C-均值算法(Fuzzy C-Means,FCM)是一種泛化的分區(qū)聚類方法,最早由Dunn[5]在1974年提出并由Bezdek[6]加以推廣,在大數(shù)據(jù)應(yīng)用方面占有優(yōu)勢.對本文選取的交通狀態(tài)三維空間,該算法假設(shè)第i個三維觀測值為xi=( ) xi1,xi2,xi3,分別表示交通流量、速度和占有率值,N個交通流參數(shù)觀測值的集合記作X,X表示一個N×3的矩陣:
FCM算法基于最小化如下目標(biāo)函數(shù):
式中 k表示預(yù)置的交通狀態(tài)數(shù)量,即k=4;υ表示聚類編號;mυ表示聚類υ的中心表示樣本xi對聚類中心mυ的隸屬程度,其模糊指數(shù)為2;表示樣本xi與mυ間歐氏距離的平方;f表示交通狀態(tài)三維空間的維度編號,mυ1、mυ2和mυ3分別表示聚類中心mυ對應(yīng)的交通流量、速度和占有率,mυf的計算公式為
在FCM算法基礎(chǔ)上,Kaufman等人提出了一種新的模糊聚類算法——FANNY算法.FANNY算法在式(6)基礎(chǔ)上推導(dǎo)出式(8),文獻(xiàn)[7]給出了具體推導(dǎo)過程.
其約束條件為
與一般FCM算法相比,F(xiàn)ANNY算法對錯誤數(shù)據(jù)或異常值敏感度較低,同時對非球形簇有更好的辨識能力[8].
2.3 交通狀態(tài)的SVC辨識模型
定義1交通狀態(tài)分類問題:給定訓(xùn)練集T={(x1,y1),…,(xN,yN)}∈(X3×Y)N,其中xi∈X3表示模型輸入的交通流量、速度和占有率等三類交通流參數(shù)樣本,表示樣本對應(yīng)的暢通(free)、平穩(wěn)(smooth)、擁擠(congestion)和阻塞(jam)等四種交通狀態(tài)的一種,i=1,…,N表示訓(xùn)練樣本編號.據(jù)此尋找交通狀態(tài)空間X3上的一個決策函數(shù),用以推斷任一交通流參數(shù)下對應(yīng)的交通狀態(tài).
由定義1可知,求解交通狀態(tài)分類問題,實質(zhì)上就是找到把n維狀態(tài)空間Xn劃分成多個部分的規(guī)則.
支持向量機(jī)(Support Vector Machine,SVM)是一種基于統(tǒng)計學(xué)習(xí)理論的模式識別算法,由于其在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,成為國內(nèi)外數(shù)據(jù)挖掘領(lǐng)域研究的熱點.應(yīng)用SVM求解上述交通狀態(tài)分類問題的方法稱為支持向量分類機(jī)(Support Vector Classification,SVC),對標(biāo)準(zhǔn)SVC算法流程描述如下:
(1)設(shè)已知訓(xùn)練集T={(x1,y1),…,(xN,yN)}∈(Xn×Y)N,根 據(jù) 定 義 1 可 知 , xi∈X3,yi∈Y={cf,cs,cc,cj},i=1,…,N.
(2)選取適當(dāng)?shù)暮撕瘮?shù)K(x ,x′)及懲罰參數(shù)C>0.
(3)構(gòu)造并求解線性規(guī)劃問題(式(9),就可得到關(guān)于α的最優(yōu)解
式中 α表示對偶變量,Lagrange乘子;αi表示對偶變量的第i個分量;C表示懲罰參數(shù);ξ表示松弛變量;表示松弛變量的第i個分量;b表示閾值.
(4)選取位于開區(qū)間(0 ,C )中的α?的一個分量及其對應(yīng)的y與x,并據(jù)此計算閾值
jj
(5)構(gòu)造決策函數(shù) f(x)=sgn(g (x) ),推斷任一輸入交通流參數(shù)樣本x對應(yīng)的輸出狀態(tài)y.式中的
3.1 蒙特卡羅方法概述
蒙特卡羅(Monte Carlo)模擬方法又稱隨機(jī)抽樣法或隨機(jī)模擬法,是一種采用統(tǒng)計抽樣理論通過模擬仿真實驗進(jìn)行分析推斷,進(jìn)而求解數(shù)學(xué)或物理問題的方法.蒙特卡羅方法的基本思想是:通過對輸入量Xi的概率密度函數(shù)(Probability Density Function,PDF)離散抽樣,由測量模型傳播輸入量的分布,計算獲得輸出量Y的PDF離散抽樣值,進(jìn)而由輸出量的離散分布數(shù)值直接獲取輸出量的最佳估計值、標(biāo)準(zhǔn)不確定度和包含區(qū)間[9].該輸出量的最佳估計值、標(biāo)準(zhǔn)不確定度和包含區(qū)間等特性的可信程度隨PDF抽樣數(shù)增加可得到改善.
3.2 隨機(jī)數(shù)的生成
隨機(jī)數(shù)是實現(xiàn)由已知分布抽樣的基本量,在由已知分布的抽樣過程中,將隨機(jī)數(shù)作為已知量,用適當(dāng)?shù)臄?shù)學(xué)方法可以由它產(chǎn)生具有任意已知分布的簡單子樣.
乘同余法是一種典型的計算機(jī)偽隨機(jī)數(shù)(pseudo-random numbers)生成方法.它的一般形式是:對于任一初始值x1,偽隨機(jī)數(shù)序列ξi由以下公式推導(dǎo):
式中 x0稱為種子(初值);a為乘子;M為模數(shù).
3.3 蒙特卡羅抽樣方法
抽樣可以作為一種數(shù)據(jù)規(guī)約技術(shù)使用,因為它允許用數(shù)據(jù)量較小的隨機(jī)樣本(子集)表示大型數(shù)據(jù)集[10].本文應(yīng)用離散型分布的直接抽樣方法實現(xiàn)交通狀態(tài)樣本數(shù)據(jù)集的抽取.
對于任意給定的分布函數(shù)F(x),對F(x)的簡單子樣XF的直接抽樣方法為
離散型交通狀態(tài)分布函數(shù)為
式中 x1,x2,…為交通狀態(tài)分布函數(shù)的跳躍點;P1,P2,…為相應(yīng)的概率.
F(x)的直接抽樣方法為
蒙特卡羅抽樣過程在連續(xù)一個月的5 min交通參數(shù)與狀態(tài)數(shù)據(jù)集中選擇一個由R個數(shù)據(jù)點構(gòu)成的集合.對于集合中的每一個隨機(jī)選取的時間r,用這個時間點之前的m個數(shù)據(jù)來訓(xùn)練模型并用這個點之后n個數(shù)據(jù)測試模型.在進(jìn)行R次迭代后,得到每個性能評估指標(biāo)的R個估計值,每一個指標(biāo)估計值都是通過隨機(jī)選取的m+n個數(shù)據(jù)窗口得到的.這種設(shè)置確保了時間序列數(shù)據(jù)的時間排序,重復(fù)迭代將保證有充分變化和訓(xùn)練的條件,增加了估計值的可靠性.用圖1描述上述蒙特卡羅抽樣方法.
對于抽樣得到的樣本數(shù)據(jù)集,傳統(tǒng)方法是用訓(xùn)練集建立模型,然后將模型應(yīng)用到測試集獲取預(yù)測值,即訓(xùn)練集和測試集都是固定的.假定交通狀態(tài)在測試集某時間點發(fā)生劇烈變化,那么用訓(xùn)練集得到的模型來預(yù)測測試時間段的交通狀態(tài)的結(jié)果將會產(chǎn)生較大誤差,從而降低模型預(yù)測性能.在這種情況下,采用增量學(xué)習(xí)方式調(diào)整或更新模型,使其適應(yīng)最近的數(shù)據(jù),就能獲取當(dāng)前數(shù)據(jù)的變化.
本文采用流數(shù)據(jù)分析中的滑動窗口模型(Sliding Window Model)對樣本數(shù)據(jù)集進(jìn)行訓(xùn)練和測試.滑動窗口模型如圖2所示,其基本思想是:僅基于最近的數(shù)據(jù)做出決策,而不是對樣本集中所有數(shù)據(jù)進(jìn)行計算.即用長度w作為滑動窗口,每隔w個測試數(shù)據(jù),用更新的數(shù)據(jù)來建立新的模型.3.4 模型評價準(zhǔn)則
圖1 蒙特卡羅抽樣過程Fig.1 Monte Carlo sampling process
圖2 兩類窗口模型Fig.2 Two kinds of window model
對于給定的交通狀態(tài)類別集合Y={cf,cs,cc,,混淆矩陣可以表示為表1中的形式.
在表1中,ni,j表示分類器將狀態(tài)類別ci中的樣本識別為類別cj的數(shù)量.混淆矩陣反映狀態(tài)類別空間Y的分布情況,體現(xiàn)分類器的識別性能,其中第i行反映的是類別ci的召回率(recall),第j列反映的是類別cj的精度(precision).因此對某特定交通狀態(tài)(如阻塞狀態(tài)c)j,其獨立的精度和召回率的計算公式為
表1 交通狀態(tài)混淆矩陣Table1 Traffic status confusion matrix
綜合利用精度和召回率的調(diào)和均值得到新的統(tǒng)計量——F度量(F-measure)[11].
3.5 交通狀態(tài)辨識流程
結(jié)合交通狀態(tài)聚類分析與SVM辨識方法,將基于蒙特卡羅模擬的交通狀態(tài)辨識過程分解為以下幾個階段:
(1)數(shù)據(jù)選取與預(yù)處理.
在存儲原始交通流參數(shù)的海量數(shù)據(jù)中匯總得到某檢測站一個月時間內(nèi)間隔為5 min的交通流參數(shù),建立交通流參數(shù)數(shù)據(jù)集;對數(shù)據(jù)進(jìn)行預(yù)處理與標(biāo)準(zhǔn)化.
(2)交通狀態(tài)的劃分.
使用模糊聚類FANNY算法對交通流參數(shù)數(shù)據(jù)集進(jìn)行分析,得到四種交通狀態(tài)的劃分方法,以及各樣本對應(yīng)的交通狀態(tài).
(3)參數(shù)設(shè)置與窗口模型.
對蒙特卡羅模擬、SVM狀態(tài)辨識、窗口模型進(jìn)行參數(shù)初始化.
(4)辨識與評價.
根據(jù)預(yù)置的參數(shù)進(jìn)行模型訓(xùn)練,然后對測試集交通狀態(tài)進(jìn)行辨識,最后利用建立的指標(biāo)對辨識結(jié)果進(jìn)行綜合評價.當(dāng)模型評價結(jié)果不滿足要求時,對各組參數(shù)進(jìn)行調(diào)整并重復(fù)上述過程,直至得到滿足評價要求的最優(yōu)參數(shù)組合.
基于蒙特卡羅模擬的交通狀態(tài)辨識流程如圖3所示.
圖3 基于蒙特卡羅模擬的交通狀態(tài)辨識流程Fig.3 Traffic status identification process based on Monte Carlo simulation
4.1 數(shù)據(jù)選取與預(yù)處理
本文選取美國加州運輸局運行監(jiān)測系統(tǒng)(Performance Measurement System,PeMS)提供的101號高速公路中編號717490檢測站的2012年12月交通流參數(shù)數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù),數(shù)據(jù)格式如表2所示.
2 交通流參數(shù)表Table2 Traffic flow parameter table
首先對原始數(shù)據(jù)進(jìn)行異常值檢測,主要包含缺失值和噪聲數(shù)據(jù).造成缺失值的主要原因有個別車道檢測器故障,無法正常檢測;流量、占有率均為0時,速度值的缺失等.噪聲數(shù)據(jù)主要包括流量、占有率不同時為零;流量、速度或占有率超過正常范圍等.由于異常值占總樣本比例較小,故對所有異常數(shù)據(jù)進(jìn)行剔除.
其次為避免樣本數(shù)據(jù)存在量綱或某一維數(shù)據(jù)值過大而導(dǎo)致SVC訓(xùn)練錯誤,用式(19)將各維數(shù)據(jù)進(jìn)行歸一化到[-1,1]區(qū)間.
式中 S~i表示第i維歸一化后的值;Si為第i維原始數(shù)據(jù)值;Smin、Smax分別為第i維最小值和最大值.
4.2 交通狀態(tài)的劃分
根據(jù)式(7)、式(8)中FANNY算法,對預(yù)處理后數(shù)據(jù)進(jìn)行多次迭代,得到四種交通狀態(tài)的聚類中心(式20)及各類樣本在狀態(tài)空間中的分布情況(圖4).
式中 m1、m2、m3、m4分別表示暢通、平穩(wěn)、擁擠和阻塞狀態(tài)聚類中心;矩陣中每一行分別對應(yīng)四種交通狀態(tài)聚類中心的交通流量(pcu/h)、速度(km/h)和占有率(%).
圖4 四種交通狀態(tài)數(shù)據(jù)樣本的分布Fig.4 Sample distribution of four kinds of traffic status
4.3 交通狀態(tài)辨識結(jié)果分析
本文采用開源數(shù)據(jù)挖掘平臺——R語言實現(xiàn)蒙特卡羅模擬過程.在進(jìn)行蒙特卡羅模擬前,首先給出參數(shù)的初始設(shè)置:抽樣方法采用離散型直接抽樣;迭代次數(shù)R=20;訓(xùn)練集長度m=864(三天交通流數(shù)據(jù),24×12×3);測試集長度n=288(一天交通流數(shù)據(jù),24×12);對于SVM訓(xùn)練,采用核函數(shù)參數(shù)γ=0.01的徑向基(RBF)核函數(shù)(式(21),懲罰參數(shù)C=10;對于滑動窗口模型,滑動窗口長度w=60.
利用上述初始參數(shù),對抽樣20次的數(shù)據(jù)樣本分別利用固定窗口模型和滑動窗口模型進(jìn)行訓(xùn)練和測試,對5 760組(288×20)交通參數(shù)進(jìn)行交通狀態(tài)辨識并結(jié)合其實際分類狀態(tài)建立混淆矩陣,最后得到兩類窗口模型辨識結(jié)果,如表3、表4所示.
表3 基于固定窗口模型的交通狀態(tài)辨識結(jié)果Table3 Traffic status identification results based on fixed window model
表4 基于滑動窗口模型的交通狀態(tài)辨識結(jié)果Table4 Traffic status identification results based on sliding window model
對比表3與表4可知,對暢通、平穩(wěn)、擁擠和阻塞等四種交通狀態(tài)采用滑動窗口模型的辨識精度、召回率、F度量等指標(biāo)均優(yōu)于固定窗口模型.進(jìn)一步計算可得,采用固定窗口模型平均辨識精度、召回率、F度量分別為93.36%、91.10%和92.18%,而滑動窗口模型下平均辨識精度、召回率、F度量分別為97.98%、94.64%和96.21%.由此可以驗證在蒙特卡羅模擬方法中,采用滑動窗口模型的增量學(xué)習(xí)方式能夠更好地適應(yīng)交通狀態(tài)變化要求,顯著提高辨識精度.
實時交通狀態(tài)信息服務(wù)能夠為高速公路管理部門實現(xiàn)道路動態(tài)管控,為出行者提供信息誘導(dǎo)服務(wù),同時通過對交通狀態(tài)時空變化規(guī)律分析為交通決策部門提供數(shù)據(jù)支撐,以達(dá)到緩解道路擁堵,優(yōu)化路網(wǎng)結(jié)構(gòu)的目的.
本文利用蒙特卡羅模擬方法對海量交通流歷史數(shù)據(jù)進(jìn)行挖掘,實現(xiàn)了交通狀態(tài)的合理分類與準(zhǔn)確辨識,通過實驗驗證,該方法能夠?qū)崟r交通流參數(shù)進(jìn)行準(zhǔn)確辨識,尤其是構(gòu)建的滑動窗口模型,對四種交通狀態(tài)的平均辨識精度、召回率、F度量分別為97.98%、94.64%和96.21%.本文為分析高速公路交通狀態(tài)演化規(guī)律和發(fā)展趨勢,建立預(yù)測預(yù)警、應(yīng)急處置和信息發(fā)布等應(yīng)急運行機(jī)制提供了科學(xué)方法和數(shù)據(jù)支撐.
鑒于目前國內(nèi)高速公路交通量調(diào)查觀測站的建設(shè)剛剛起步,專用交調(diào)設(shè)備尚不完善,可通過采用收費收據(jù)與監(jiān)控數(shù)據(jù)融合轉(zhuǎn)換成交調(diào)數(shù)據(jù)的方式獲取交通狀態(tài)辨識的原始參數(shù).另外本文研究方法中涉及多組參數(shù),如何選取最優(yōu)化參數(shù)組合,進(jìn)一步提高模型辨識精度還有待于繼續(xù)深入研究.
[1]Kerner.Introduction to modern traffic flow theory and control:The long road to three-phase traffic theory[M]. New York:Springer,2009:221-243.
[2]皮曉亮,王正,韓皓,等.基于環(huán)形線圈檢測器采集信息的交通狀態(tài)分類方法應(yīng)用研究[J].公路交通科技,2006,23(4):115-119.[PI X L,WANG Z,HAN H,et al. Application research of traffic state classification meth?od based on collected information from loop detector[J]. Journal of Highway and Transportation Research and Development,2006,23(4):115-119.]
[3]董春嬌,邵春福,熊志華.基于優(yōu)化SVM的城市快速路網(wǎng)交通流狀態(tài)判別[J].北京交通大學(xué)學(xué)報,2011,35 (6):13-16.[DONG C J,SHAO C F,XIONG Z H.Identi?fication of traffic states with optimized SVM method on urban expressway network[J].Journal of Beijing Jiaotong University,2011,35(6):13-16.]
[4]陳紅,章渺,王龍飛,等.高等級公路路段交通狀態(tài)融合識別模型[J].重慶交通大學(xué)學(xué)報(自然科學(xué)版),2010,29(5):772-775.[CHEN H,ZHANG M,WANG L F,et al.Fusion and recognition model of traffic state onhigh-grade highway segment[J].Journal of Chongqing Ji?aotong University(Natural Sciences),2010,29(5):772-775.]
[5]Dunn.Well-separated clusters and optimal fuzzy parti?tions[J].Journal of Cybernetics,1974,4(1):95-104.
[6]Bezdek.Pattern recognition with fuzzy objective function algorithms[M].New York:Springer,1981:256.
[7]Kaufman,Rousseeuw.Finding groups in data:An intro?duction to cluster analysis[M].Hoboken:Wiley,2008: 189-191.
[8]Dodge.Statistical data analysis based on the L1-Norm and related methods[M].Switzerland:Birkh?user Basel,2002.
[9]ISO/IEC Guide 98-3:2008/Suppl 1:2008 Propagation of distributions using a Monte Carlo method[S].Geneva, Switzerland:International Organization for Standardiza?tion,2008.
[10]Han,Kamber,Pei.Data mining:concepts and tech?niques,Third edition[M].New York:Morgan Kaufmann,2011.
[11]Van Rijsbergen.Information retrieval,2nd edition[M]. London:Butterworths,1979.
Traffic Status Identification Based on Monte Carlo Simulation
QIAN Chao1,XU Na2,XU Hong-ke1,DAI Liang1,LI Xue1
(1.School of Electronic and Control Engineering,Chang’an University,Xi’an 710064,China; 2.Xi’an Highway Institute,Xi’an 710054,China)
A method of using traffic flow parameters is proposed for traffic status identification based on Monte Carlo simulation.Clustering analysis of four kinds traffic status is realized by applying FANNY algorithm,and SVC traffic status identification model is established using Monte Carlo simulation method.Fixed window model and sliding window model are built respectively to identify and conduct comprehensive evaluation on traffic status.Results indicate that the method can achieve accurate identification of real-time traffic flow parameters,especially with sliding window model,of which average identification accuracy,recall and F-measure are 97.98%,94.64%and 96.21%respectively.It provides scientific methods and data support for analyzing evolution regularity and development trend of traffic status,as well as establishing emergency operation mechanism such as prediction and forewarning,emergency disposal and information release.
highway transportation;traffic status identification;Monte Carlo simulation;traffic flow parameters;SVC;data mining
1009-6744(2014)03-0043-08
U491
A
2013-09-27
2013-11-12錄用日期:2013-11-18
國家自然科學(xué)基金項目(51308057);陜西省自然科學(xué)基金項目(2013JQ8006);教育部創(chuàng)新團(tuán)隊發(fā)展計劃資助項目(IRT1050);中央高校基本科研業(yè)務(wù)費專項資金項目(2013G3324005).
錢超(1984-),男,江蘇新沂人,講師,工學(xué)博士.*通訊作者:chinaqianchao@163.com