張生瑞,連江南,焦帥陽(yáng),周 備
(1.長(zhǎng)安大學(xué) 運(yùn)輸工程學(xué)院, 西安 710064;2.河南城建學(xué)院 土木與交通工程學(xué)院, 河南 平頂山 467036)
隨著智能交通系統(tǒng)的發(fā)展,交通擁堵預(yù)測(cè)再次成為當(dāng)前的研究熱點(diǎn)。交通擁堵一般可分為常發(fā)性擁堵和偶發(fā)性擁堵。研究表明,常發(fā)性擁堵占城市道路網(wǎng)絡(luò)所有擁堵時(shí)刻的85%左右[1],對(duì)交通系統(tǒng)產(chǎn)生了較為不利的影響。
對(duì)常發(fā)性交通擁堵路段的狀態(tài)預(yù)測(cè)可分為長(zhǎng)時(shí)預(yù)測(cè)與短時(shí)預(yù)測(cè)。短時(shí)交通擁堵?tīng)顟B(tài)預(yù)測(cè)是基于交通流參數(shù)的短時(shí)交通擁堵?tīng)顟B(tài)識(shí)別,具有更高的預(yù)測(cè)精度和實(shí)用性。因此,基于常發(fā)性交通擁堵路段的短時(shí)交通擁堵?tīng)顟B(tài)預(yù)測(cè)具有更高的現(xiàn)實(shí)意義和可操作性。
交通擁堵?tīng)顟B(tài)預(yù)測(cè)分為兩步,一是從歷史數(shù)據(jù)中識(shí)別不同的交通狀態(tài),并劃分不同的狀態(tài)區(qū)間;二是針對(duì)交通流參數(shù)的預(yù)測(cè),并與劃定的擁堵?tīng)顟B(tài)區(qū)間比對(duì),確定該狀態(tài)屬于何種擁堵水平。
交通擁堵?tīng)顟B(tài)的識(shí)別本質(zhì)上屬于分類問(wèn)題,其方法包含傳統(tǒng)的交通流理論方法以及數(shù)據(jù)驅(qū)動(dòng)方法[2]。其中,數(shù)據(jù)驅(qū)動(dòng)方法注重模型的應(yīng)用價(jià)值和算法研究,是近年來(lái)的研究重點(diǎn)。王來(lái)軍等[3]通過(guò)廣義徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法建立城市道路交通擁堵度的計(jì)算模型,該模型可獲得擁堵點(diǎn)的位置和發(fā)生時(shí)刻。羅向龍[4]采用支持向量機(jī)(support vector machine,SVM)算法識(shí)別帶噪聲的交通流狀態(tài)。Fotouhi等[5]提出基于K均值(K-means)聚類的交通狀態(tài)算法,并評(píng)估了不同聚類數(shù)量的聚類結(jié)果。袁立罡等[6]分析了特征參數(shù)與交通流相態(tài)演化規(guī)律,提出基于遺傳期望最大化模糊聚類算法的交通狀態(tài)識(shí)別方法。張心哲等[7]提出基于霍夫變換和模糊C均值(Fuzzy C-means,FCM)聚類算法的交通狀態(tài)識(shí)別方法,其中FCM聚類方法用于非暢通交通流狀態(tài)的分類。Cheng等[8]對(duì)傳統(tǒng)FCM聚類算法進(jìn)行了模糊隸屬函數(shù)改進(jìn)和樣本加權(quán)處理,通過(guò)對(duì)該方法與SVM算法、K近鄰(K-nearest neighbors,KNN)搜索算法、傳統(tǒng)FCM聚類算法等的對(duì)比,該算法在分類準(zhǔn)確度上體現(xiàn)出較大優(yōu)越性。交通流狀態(tài)具有模糊性、不確定性等特點(diǎn),不同交通狀態(tài)之間沒(méi)有明確界限,且不同出行者對(duì)交通擁堵程度的主觀感受不同,因此,采用基于模糊聚類原則的算法對(duì)交通狀態(tài)的判別結(jié)果更符合實(shí)際情況。在現(xiàn)有的模糊聚類算法中,FCM聚類算法最為完善、應(yīng)用最為廣泛,能夠處理大規(guī)模數(shù)據(jù)集,具有良好的數(shù)據(jù)分類效果。
針對(duì)交通流參數(shù)的預(yù)測(cè),陳忠輝等[9]提出了基于FCM聚類和隨機(jī)森林算法的短時(shí)交通狀態(tài)預(yù)測(cè)模型。林浩等[10]提出一種基于SVM和模糊綜合評(píng)價(jià)的交通流預(yù)測(cè)模型。Cai等[11]采用改進(jìn)的KNN算法實(shí)現(xiàn)了對(duì)短時(shí)交通流的多步預(yù)測(cè)。吳玲玲等[12]提出一種改進(jìn)的反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)短時(shí)交通流預(yù)測(cè)模型,該模型有效提高短時(shí)交通流預(yù)測(cè)精度。Ai等[13]將模糊邏輯與徑向基函數(shù)(radical basis function,RBF)神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出預(yù)測(cè)交通速度的混合RBF神經(jīng)網(wǎng)絡(luò)算法。Chen等[14]提出一種基于改進(jìn)的RBF神經(jīng)網(wǎng)絡(luò)的短時(shí)交通流預(yù)測(cè)算法,并與KNN模型、改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型等進(jìn)行對(duì)比,結(jié)果表明該模型預(yù)測(cè)精度較高。短時(shí)交通流具有隨機(jī)性、非線性特性,而RBF神經(jīng)網(wǎng)絡(luò)在逼近任意非線性函數(shù)、并行化處理信息方面具有明顯優(yōu)勢(shì),且收斂速度快,不易陷入局部最優(yōu)值,能夠滿足短時(shí)交通流預(yù)測(cè)對(duì)時(shí)效性、準(zhǔn)確性的要求。
FCM聚類算法引入了模糊的概念,能較好表達(dá)和處理不確定性問(wèn)題。RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,訓(xùn)練速度快,具備較強(qiáng)的非線性逼近能力,預(yù)測(cè)精度較高。但是現(xiàn)有的交通擁堵?tīng)顟B(tài)預(yù)測(cè)模型較少考慮二者的融合預(yù)測(cè)方法?;谏鲜龇治?本文提出一種融合FCM聚類算法與RBF神經(jīng)網(wǎng)絡(luò)的、針對(duì)常發(fā)性擁堵路段的短時(shí)交通擁堵?tīng)顟B(tài)預(yù)測(cè)模型。首先利用FCM聚類算法對(duì)歷史交通流數(shù)據(jù)進(jìn)行聚類劃分,用于實(shí)現(xiàn)已有交通數(shù)據(jù)的分類,并為后續(xù)交通狀態(tài)判別提供分類依據(jù);然后利用RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)短時(shí)交通流參數(shù),保證交通流預(yù)測(cè)的實(shí)時(shí)性和準(zhǔn)確性;最后,根據(jù)已知交通狀態(tài)聚類中心來(lái)分析預(yù)測(cè)得到的短時(shí)交通流數(shù)據(jù)所屬的交通狀態(tài),實(shí)現(xiàn)交通擁堵?tīng)顟B(tài)預(yù)測(cè)的目的。本文通過(guò)對(duì)模型進(jìn)行實(shí)例驗(yàn)證、性能評(píng)價(jià)并與其他模型進(jìn)行對(duì)比分析,表明了所建立模型的有效性,建立的模型能夠?yàn)槌鲂姓咛峁┛煽坑行У亩虝r(shí)交通擁堵?tīng)顩r信息。
本文選取的交通流數(shù)據(jù)源自美國(guó)明尼蘇達(dá)州雙子城交通管理中心[15],該中心沿環(huán)城高速公路全天實(shí)時(shí)采集道路中不同地點(diǎn)的交通流數(shù)據(jù),采集間隔為30 s。本文選取編號(hào)為1007、1006、80的檢測(cè)器記錄的交通流數(shù)據(jù),數(shù)據(jù)累計(jì)時(shí)長(zhǎng)1 080 h,約3 888 000條數(shù)據(jù)。表1為部分原始數(shù)據(jù)。
表1 部分原始交通數(shù)據(jù)
由于原始數(shù)據(jù)存在缺失數(shù)據(jù)和異常數(shù)據(jù),為保證預(yù)測(cè)精度,對(duì)原始數(shù)據(jù)進(jìn)行處理,以滿足模型對(duì)輸入數(shù)據(jù)的要求,從而提高模型預(yù)測(cè)精度。數(shù)據(jù)處理步驟包括:缺失值補(bǔ)全、加和處理、降噪處理和歸一化處理。
首先,選用加權(quán)平均法對(duì)原始數(shù)據(jù)中的錯(cuò)誤及缺失數(shù)據(jù)進(jìn)行補(bǔ)全修復(fù),得到包含各個(gè)時(shí)刻的完整數(shù)據(jù)集。其計(jì)算公式如式(1)所示:
y(t)=a×y(t-1)+
(1-a)×y(t+1)
(1)
式中:y(t)表示t時(shí)刻的數(shù)據(jù)值;a表示加權(quán)系數(shù),本文設(shè)a=0.5。
原始數(shù)據(jù)是按照等間隔時(shí)段記錄的,不能直接用于分析交通擁堵?tīng)顟B(tài)。為準(zhǔn)確提取交通流數(shù)據(jù)特征,以5 min作為數(shù)據(jù)時(shí)段劃分間隔,即將原始數(shù)據(jù)每10個(gè)為一組進(jìn)行數(shù)據(jù)加和,每天合計(jì)得到288組數(shù)據(jù)。
為消除交通流數(shù)據(jù)中產(chǎn)生的噪聲,選用小波變換的數(shù)據(jù)降噪方法。實(shí)際交通流數(shù)據(jù)為非平穩(wěn)低頻信號(hào),噪聲多為高頻信號(hào),通過(guò)對(duì)原始信號(hào)進(jìn)行小波分解,去除高頻帶上噪聲信號(hào)對(duì)應(yīng)的小波系數(shù),保留原始信號(hào)對(duì)應(yīng)的小波系數(shù),然后對(duì)處理后的高頻系數(shù)和低頻系數(shù)進(jìn)行小波重構(gòu),獲得降噪后的交通流信號(hào)數(shù)據(jù)[16]。降噪前后的部分?jǐn)?shù)據(jù)如圖1所示。
圖1 降噪前后的交通量和時(shí)間占有率數(shù)據(jù)
從圖1中可看出,經(jīng)過(guò)小波降噪處理,數(shù)據(jù)變化趨勢(shì)更加平穩(wěn),且降噪前后交通流數(shù)據(jù)的變化趨勢(shì)并沒(méi)有發(fā)生改變,更適用于研究交通擁堵問(wèn)題。
為便于分析不同量綱數(shù)據(jù)在同一標(biāo)準(zhǔn)下的差異,并縮短模型運(yùn)算時(shí)間,將數(shù)據(jù)線性映射到 [0,1]區(qū)間內(nèi),用于模型的訓(xùn)練和預(yù)測(cè)。然后,對(duì)預(yù)測(cè)數(shù)據(jù)進(jìn)行反歸一化處理,轉(zhuǎn)換為具有實(shí)際意義的交通流數(shù)據(jù)。
歸一化處理的計(jì)算公式如式(2)所示:
(2)
反歸一化處理的計(jì)算公式如式(3)所示:
x=x*(xmax-xmin)+xmin
(3)
式中:x*表示歸一化處理后的數(shù)值;x表示反歸一化處理后的數(shù)值;xmax表示原始數(shù)據(jù)中的最大值;xmin表示原始數(shù)據(jù)中的最小值。根據(jù)交通量和時(shí)間占有率的最大值和最小值,對(duì)其分別進(jìn)行歸一化處理。
表2為經(jīng)過(guò)預(yù)處理后的數(shù)據(jù)示例。
表2 原始交通流的示例數(shù)據(jù)
對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后,選取90%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,10%的數(shù)據(jù)作為測(cè)試數(shù)據(jù)集,對(duì)模型所作預(yù)測(cè)結(jié)果進(jìn)行檢驗(yàn)。
本文研究目的是對(duì)未來(lái)短時(shí)交通流參數(shù)進(jìn)行預(yù)測(cè)并判斷其處于何種交通狀態(tài)。本文重點(diǎn)需要解決2個(gè)問(wèn)題:① 實(shí)現(xiàn)對(duì)歷史數(shù)據(jù)的聚類;② 實(shí)現(xiàn)對(duì)未來(lái)交通流數(shù)據(jù)的預(yù)測(cè),并將任意一組預(yù)測(cè)得到的交通流數(shù)據(jù)劃分到相應(yīng)類別中。
本文設(shè)計(jì)的短時(shí)交通擁堵?tīng)顟B(tài)預(yù)測(cè)模型計(jì)算流程如圖2所示。
圖2 短時(shí)交通擁堵?tīng)顟B(tài)預(yù)測(cè)模型計(jì)算流程框圖
短時(shí)交通擁堵?tīng)顟B(tài)預(yù)測(cè)的具體步驟為:
1) 將上一節(jié)中預(yù)處理后的數(shù)據(jù)劃分訓(xùn)練集和測(cè)試集。
2) 利用訓(xùn)練集數(shù)據(jù)建立交通參數(shù)的特征指標(biāo)矩陣。采用FCM聚類算法在二維空間進(jìn)行聚類分析,將歷史交通流數(shù)據(jù)劃分為5種交通擁堵?tīng)顟B(tài),得到各個(gè)時(shí)刻對(duì)應(yīng)的狀態(tài)標(biāo)簽以及不同交通狀態(tài)對(duì)應(yīng)的聚類中心,為后續(xù)交通狀態(tài)判別提供判別依據(jù)。交通擁堵?tīng)顟B(tài)劃分依據(jù)參考《GB/T 33171—2016城市交通運(yùn)行狀況評(píng)價(jià)規(guī)范》[17]。
3) 采用訓(xùn)練集經(jīng)過(guò)相空間重構(gòu)的交通量和時(shí)間占有率數(shù)據(jù)分別訓(xùn)練2個(gè)RBF神經(jīng)網(wǎng)絡(luò)模型,通過(guò)訓(xùn)練建立輸入和輸出的映射關(guān)系。采用測(cè)試集數(shù)據(jù)預(yù)測(cè)短時(shí)交通流參數(shù)。
4) 通過(guò)RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的短時(shí)交通量和時(shí)間占有率數(shù)據(jù),構(gòu)建預(yù)測(cè)樣本集,計(jì)算預(yù)測(cè)樣本集中每個(gè)樣本點(diǎn)和訓(xùn)練得到的5個(gè)聚類中心的歐氏距離,與樣本點(diǎn)歐式距離最短的聚類中心所對(duì)應(yīng)的交通擁堵?tīng)顟B(tài)即為預(yù)測(cè)的該樣本點(diǎn)的交通擁堵?tīng)顟B(tài)。
模糊C均值(fuzzy C-means,FCM)聚類算法是一種無(wú)監(jiān)督模糊聚類算法,其核心思想是把樣本數(shù)據(jù)劃分成多個(gè)模糊簇,同一簇的數(shù)據(jù)相似性較大,不同簇的數(shù)據(jù)相似性較小。
給定樣本集X={x1,x2,…,xn}?Rb,每個(gè)樣本都具有b個(gè)特征指標(biāo);將樣本集X劃分為c個(gè)模糊簇,每個(gè)模糊簇含有1個(gè)聚類中心。FCM的目標(biāo)函數(shù)Jm(U,V)計(jì)算公式如式(4)所示:
(4)
FCM聚類算法的聚類準(zhǔn)則是令目標(biāo)函數(shù)Jm(U,V)最小,聚類中心和隸屬度矩陣的迭代公式如式(5)和式(6)所示:
(5)
(6)
設(shè)置迭代停止條件ε,比較第α次和第α-1次迭代得到的隸屬度矩陣Uα和Uα-1,如果滿足式(7),說(shuō)明目標(biāo)函數(shù)已達(dá)到極小值,迭代終止,否則根據(jù)式(5)和式(6)繼續(xù)迭代,直到滿足式(7)為止。
(7)
基于FCM聚類的交通擁堵?tīng)顟B(tài)識(shí)別算法的思想如下:首先確定聚類類別數(shù)為5,即將交通流數(shù)據(jù)劃分為暢通、基本暢通、輕度擁堵、中度擁堵、嚴(yán)重?fù)矶?個(gè)等級(jí);其次將訓(xùn)練集各個(gè)時(shí)刻的樣本點(diǎn)xi=(xi1,xi2)作為訓(xùn)練樣本,其中xi1和xi2分別表示歷史交通量和時(shí)間占有率數(shù)據(jù),采用FCM聚類算法對(duì)樣本集進(jìn)行聚類劃分,得到5種交通狀態(tài)對(duì)應(yīng)的聚類中心,以及各個(gè)樣本點(diǎn)分別相對(duì)于這5個(gè)聚類中心的隸屬度;根據(jù)式(8)確定各個(gè)時(shí)刻交通流數(shù)據(jù)隸屬度的最大值,最大隸屬度值所對(duì)應(yīng)的類別即為該時(shí)刻最可能的交通狀態(tài)。
(8)
徑向基函數(shù)(radical basis function,RBF)神經(jīng)網(wǎng)絡(luò)是一種局部逼近的三層前反饋神經(jīng)網(wǎng)絡(luò),具有很強(qiáng)的非線性擬合能力。其拓?fù)浣Y(jié)構(gòu)見(jiàn)圖3。
圖3 RBF神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)示意圖
x=(x1,x2,…,xl)T、o=(o1,o2,…,oq)T、y=(y1,y2,…,yp)T分別表示網(wǎng)絡(luò)輸入、隱藏層節(jié)點(diǎn)輸出、網(wǎng)絡(luò)輸出,ωfg表示第f個(gè)隱藏層節(jié)點(diǎn)到第g個(gè)輸出節(jié)點(diǎn)的連接權(quán)值。本文選擇高斯核函數(shù)為徑向基函數(shù),隱藏層節(jié)點(diǎn)輸出of的計(jì)算公式如式(9)所示:
(9)
式中:zf表示第f個(gè)徑向基函數(shù)中心,由輸入樣本中隨機(jī)選取q個(gè)樣本作為徑向基函數(shù)中心,即隱藏層節(jié)點(diǎn);σ表示徑向基函數(shù)的標(biāo)準(zhǔn)差,即函數(shù)產(chǎn)生明顯輸出信號(hào)的區(qū)域范圍,本文選取統(tǒng)一的標(biāo)準(zhǔn)差,計(jì)算公式如式(10)所示:
(10)
式中,dmax表示所選徑向基函數(shù)中心的最大距離。
神經(jīng)網(wǎng)絡(luò)的第t個(gè)輸出yt的計(jì)算公式如式(11)所示:
(11)
目標(biāo)函數(shù)選用均方誤差(mean squared error,MSE),計(jì)算公式如式(12)所示:
(12)
根據(jù)混沌理論提取的交通流多維信息確定神經(jīng)網(wǎng)絡(luò)的輸入層和輸出層節(jié)點(diǎn)數(shù)。首先對(duì)原始序列H={h1,h2,…,hn}進(jìn)行相空間重構(gòu),將其映射到高維空間,得到多維時(shí)間序列G={g1,g2,…,gn-(γ-1)τ},其中g(shù)i的展開(kāi)式如式(13)所示:
gi=(hi,hi+1,…,hi+(γ-1)τ)T
(13)
式中:γ表示相空間重構(gòu)的嵌入維數(shù);τ表示相空間重構(gòu)的時(shí)延。
將最優(yōu)嵌入維數(shù)和時(shí)延分別作為神經(jīng)網(wǎng)絡(luò)輸入層和輸出層數(shù)目可以得到較佳的預(yù)測(cè)性能[18],本文給定時(shí)延τ=1,確定最優(yōu)嵌入維數(shù)γ=3。
得到短時(shí)交通流數(shù)據(jù)預(yù)測(cè)值后,構(gòu)建預(yù)測(cè)樣本集的特征指標(biāo)矩陣,計(jì)算預(yù)測(cè)樣本集中每個(gè)樣本點(diǎn)和已得到的5個(gè)聚類中心的歐氏距離,與樣本點(diǎn)歐式距離最短的聚類中心所對(duì)應(yīng)的交通擁堵?tīng)顟B(tài)即為預(yù)測(cè)的該樣本點(diǎn)的交通擁堵?tīng)顟B(tài),實(shí)現(xiàn)短時(shí)交通擁堵?tīng)顟B(tài)預(yù)測(cè)。
基于FCM聚類算法進(jìn)行交通擁堵?tīng)顟B(tài)識(shí)別。首先對(duì)模型設(shè)定相應(yīng)的初始參數(shù):聚類個(gè)數(shù)c=5,模糊加權(quán)指數(shù)m=2,迭代停止閾值ε=10-6。采用歸一化處理后的訓(xùn)練集數(shù)據(jù)進(jìn)行FCM聚類劃分,并通過(guò)分析交通流參數(shù)特征,為每個(gè)類別賦予特定的擁堵?tīng)顟B(tài)。最終得到訓(xùn)練集數(shù)據(jù)的聚類結(jié)果,如圖4所示。
以1007檢測(cè)器為例,FCM訓(xùn)練得到的聚類中心矩陣為:
(14)
矩陣Q和矩陣O分別代表反歸一化后5 min的交通量(單位:veh/5 min)和時(shí)間占有率(單位:%)。交通量和時(shí)間占有率的數(shù)值越大,交通擁堵程度越高,因此聚類中心矩陣v1、v2、v3、v4、v5分別代表暢通、基本暢通、輕度擁堵、中度擁堵、嚴(yán)重?fù)矶聽(tīng)顟B(tài)所對(duì)應(yīng)的聚類中心。
FCM聚類算法是無(wú)監(jiān)督學(xué)習(xí)算法,沒(méi)有唯一的評(píng)價(jià)標(biāo)準(zhǔn),根據(jù)類內(nèi)高聚合、類間低耦合的原則進(jìn)行算法性能評(píng)價(jià)。從圖4可以看出,同一交通狀態(tài)的樣本點(diǎn)分布較為規(guī)整緊密,不同交通狀態(tài)之間分界線明顯,可以清晰看出各個(gè)時(shí)刻交通數(shù)據(jù)點(diǎn)的分布以及歸屬的交通狀態(tài),訓(xùn)練結(jié)果穩(wěn)定有效。
為了進(jìn)一步說(shuō)明FCM聚類算法得到的聚類結(jié)果的可靠,將本文測(cè)試集數(shù)據(jù)用于K-means聚類算法,以進(jìn)行對(duì)比分析。多次訓(xùn)練發(fā)現(xiàn),K-means聚類算法每次訓(xùn)練得到的聚類結(jié)果不同,大致有4類,以1007檢測(cè)器為例,聚類結(jié)果如圖5所示。
圖4 FCM聚類劃分的結(jié)果
圖5 K-means聚類劃分的不同情況的結(jié)果
圖5(a)(b)表示隨機(jī)選擇的部分初始聚類中心遠(yuǎn)離數(shù)據(jù)集的中心點(diǎn),導(dǎo)致沒(méi)有分配到該聚類中心所在集合的數(shù)據(jù)點(diǎn),聚類數(shù)目少于預(yù)期聚類數(shù)目;圖5(c)表示隨機(jī)選擇的部分初始聚類中心為孤點(diǎn),聚類結(jié)果陷入局部最優(yōu)解;圖5(d)表示理想的聚類結(jié)果。從上述分析可以看出,K-means算法需要反復(fù)多次試驗(yàn)才能得到理想聚類結(jié)果,結(jié)果不穩(wěn)定,且與初始聚類中心的選取密切相關(guān)。相比較而言,FCM算法每次聚類結(jié)果相近,聚類結(jié)果穩(wěn)定可靠。產(chǎn)生這種結(jié)果的原因是K-means算法將樣本點(diǎn)硬性地規(guī)定為某一類,用于修正聚類中心的元素只有上次迭代得到的一部分。而FCM算法將樣本點(diǎn)按照相關(guān)性計(jì)算隸屬度,每一個(gè)聚類中心的修正都由樣本中全部聚類中心參與,結(jié)果也更精確。
基于RBF神經(jīng)網(wǎng)絡(luò)算法對(duì)目標(biāo)路段進(jìn)行短時(shí)交通流參數(shù)預(yù)測(cè),需要單獨(dú)訓(xùn)練2個(gè)模型,即交通量預(yù)測(cè)模型和時(shí)間占有率預(yù)測(cè)模型。首先對(duì)模型設(shè)定相應(yīng)的初始參數(shù)。通過(guò)最優(yōu)嵌入維數(shù)和相應(yīng)的時(shí)延確定2個(gè)RBF神經(jīng)網(wǎng)絡(luò)輸入層和輸出層節(jié)點(diǎn)數(shù)目均分別為3和1,即以目標(biāo)路段在當(dāng)前時(shí)刻之前15 min的實(shí)時(shí)交通流參數(shù)預(yù)測(cè)下一時(shí)段(未來(lái)5 min)的交通流參數(shù),且每次預(yù)測(cè)1個(gè)步長(zhǎng)。
隱藏層節(jié)點(diǎn)數(shù)確定的方法為:從一個(gè)神經(jīng)元開(kāi)始,計(jì)算輸出誤差,不斷自動(dòng)增加隱藏層神經(jīng)元個(gè)數(shù),循環(huán)多次實(shí)驗(yàn),直到達(dá)到誤差要求或預(yù)先設(shè)定的最大隱藏層神經(jīng)元數(shù)目。確定標(biāo)準(zhǔn)差為1,目標(biāo)均方誤差為10-5。
將經(jīng)過(guò)歸一化處理的一維訓(xùn)練數(shù)據(jù)集(交通量和時(shí)間占有率)進(jìn)行相空間重構(gòu),得到多維時(shí)間序列G={g1,g2,…,gn-(γ-1)τ}。將gi和gi+1(γ)分別作為輸入向量和對(duì)應(yīng)的輸出向量,對(duì)RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。采用訓(xùn)練好的RBF神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)試集數(shù)據(jù)進(jìn)行短時(shí)交通流參數(shù)預(yù)測(cè),得到各個(gè)時(shí)段交通量和時(shí)間占有率的短時(shí)預(yù)測(cè)結(jié)果。以1007號(hào)檢測(cè)器為例,反歸一化后的交通量和時(shí)間占有率的短時(shí)預(yù)測(cè)結(jié)果和原始數(shù)據(jù)見(jiàn)圖6。
從圖6可以看出,RBF神經(jīng)網(wǎng)絡(luò)得到的預(yù)測(cè)輸出值和實(shí)際輸出值較為接近。為了分析預(yù)測(cè)性能,更清楚地看出預(yù)測(cè)值和實(shí)際值之間的誤差,計(jì)算出各個(gè)時(shí)刻的預(yù)測(cè)相對(duì)誤差,以1007號(hào)檢測(cè)器為例,各個(gè)時(shí)段的預(yù)測(cè)殘差如圖7所示。
圖6 交通量和時(shí)間占有率預(yù)測(cè)值和實(shí)際值
圖7 交通量和時(shí)間占有率預(yù)測(cè)相對(duì)誤差
交通量和時(shí)間占有率的預(yù)測(cè)結(jié)果和觀測(cè)數(shù)據(jù)的均方誤差的統(tǒng)計(jì)結(jié)果如表3所示。
從表3可以看出,3個(gè)檢測(cè)器的預(yù)測(cè)結(jié)果大致接近,交通量和時(shí)間占有率預(yù)測(cè)相對(duì)誤差值統(tǒng)計(jì)結(jié)果相接近且數(shù)值較小, 75%以上的預(yù)測(cè)值的誤差均在1.2%以下,預(yù)測(cè)精度較高,說(shuō)明采用RBF神經(jīng)網(wǎng)絡(luò)算法對(duì)交通量進(jìn)行短時(shí)交通流預(yù)測(cè)結(jié)果精度較高。
將RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果與在交通流預(yù)測(cè)方面廣泛應(yīng)用的BP神經(jīng)網(wǎng)絡(luò)模型、SVM模型、KNN模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,對(duì)比結(jié)果如表4所示。
從表4可以看出,RBF神經(jīng)網(wǎng)絡(luò)的平均相對(duì)預(yù)測(cè)誤差相對(duì)于其他模型較小,且75%的相對(duì)預(yù)測(cè)誤差也均相對(duì)于其他模型更小,證實(shí)了RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的可靠性,可以用于進(jìn)行常發(fā)性交通擁堵路段的短時(shí)交通流預(yù)測(cè)。
根據(jù)3.1節(jié)得到的不同交通擁堵?tīng)顟B(tài)的聚類中心, 分別計(jì)算3.2節(jié)預(yù)測(cè)得到的短時(shí)交通流參數(shù)數(shù)據(jù)中各個(gè)樣本點(diǎn)與聚類中心的隸屬度,建立各個(gè)時(shí)刻樣本點(diǎn)對(duì)于不同交通狀態(tài)類別的不確定描述。根據(jù)最大隸屬度原則,判斷樣本所處的交通狀態(tài),結(jié)果如表5所示。
表3 交通量和時(shí)間占有率預(yù)測(cè)相對(duì)誤差
表4 不同預(yù)測(cè)模型的交通量和時(shí)間占有率相對(duì)預(yù)測(cè)誤差
表5 部分樣本交通擁堵?tīng)顟B(tài)預(yù)測(cè)結(jié)果
預(yù)測(cè)得到測(cè)試集各個(gè)時(shí)段的短時(shí)交通擁堵?tīng)顟B(tài)后,與識(shí)別的對(duì)應(yīng)時(shí)刻的實(shí)際交通擁堵?tīng)顟B(tài)比較,以1007檢測(cè)器為例,結(jié)果如圖8所示。
圖8 識(shí)別及預(yù)測(cè)的交通狀態(tài)等級(jí)示意圖
圖8顯示交通狀態(tài)等級(jí)的識(shí)別結(jié)果與預(yù)測(cè)結(jié)果基本吻合。3個(gè)檢測(cè)器在00∶15—24∶00時(shí)間內(nèi)285個(gè)時(shí)間間隔中分別有9、6、14次誤判數(shù)據(jù),交通擁堵識(shí)別準(zhǔn)確率為96.8%、97.9%、95.09%,均在95%以上,預(yù)測(cè)精度較高。因此,由上述分析可以看出,在模型識(shí)別正確率方面,本文算法具有較好的優(yōu)越性,可以用來(lái)進(jìn)行短時(shí)交通擁堵?tīng)顟B(tài)預(yù)測(cè)。
1) 提出一種基于FCM聚類算法的交通擁堵?tīng)顟B(tài)識(shí)別方法評(píng)估歷史交通擁堵?tīng)顟B(tài);基于RBF神經(jīng)網(wǎng)絡(luò)提出一種短時(shí)交通流參數(shù)預(yù)測(cè)方法來(lái)預(yù)測(cè)短時(shí)交通流參數(shù);根據(jù)先前訓(xùn)練得到的不同歷史交通狀態(tài)的聚類中心進(jìn)一步分析短時(shí)交通流參數(shù),以此得到最終的短時(shí)交通流擁堵?tīng)顟B(tài)。
2) FCM聚類效果清晰,可以直觀看出各個(gè)時(shí)刻交通數(shù)據(jù)點(diǎn)的分布以及歸屬的交通狀態(tài),訓(xùn)練結(jié)果準(zhǔn)確有效。RBF神經(jīng)網(wǎng)絡(luò)的短時(shí)交通流參數(shù)預(yù)測(cè)結(jié)果與實(shí)際值基本吻合,75%訓(xùn)練結(jié)果的相對(duì)誤差低于1.2%,在可接受的誤差范圍之內(nèi)。
3) 本文提出的融合模型狀態(tài)預(yù)測(cè)的正確率在95%以上,預(yù)測(cè)結(jié)果較為可靠,可以用來(lái)進(jìn)行交通擁堵?tīng)顟B(tài)預(yù)測(cè),且適用于不同交通流量情況下的擁堵預(yù)測(cè)。