溫峻峰,李 鑫,張浪文
(1.中科天網(wǎng)(廣東)科技有限公司,廣東 廣州 510070;2.華南理工大學(xué)自動(dòng)化科學(xué)與工程學(xué)院,廣東 廣州 510640)
近年來(lái),智能交通系統(tǒng)得到迅猛發(fā)展并趨于成熟。智能交通系統(tǒng)的運(yùn)用能很好地調(diào)節(jié)交通運(yùn)行,降低城市交通的擁堵程度和提高路網(wǎng)運(yùn)行的效率[1-2]。智能交通系統(tǒng)是通過(guò)整合各種先進(jìn)的技術(shù),采集實(shí)時(shí)的交通數(shù)據(jù),分析當(dāng)前的交通情況,利用一定的控制方法對(duì)交通系統(tǒng)進(jìn)行科學(xué)合理的控制[3-5]。智能交通系統(tǒng)的實(shí)現(xiàn),需要基于對(duì)道路未來(lái)的擁堵情況的預(yù)測(cè)。
針對(duì)交通流的預(yù)測(cè),已有諸多成果出現(xiàn)。裴玉龍、王曉寧利用神經(jīng)網(wǎng)絡(luò)對(duì)交通流預(yù)測(cè)模型進(jìn)行了研究,分析了各種因素對(duì)交通的影響[6]。苑文江將廣義神經(jīng)網(wǎng)絡(luò)應(yīng)用于交通流的預(yù)測(cè),在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,構(gòu)造了一種新的智能神經(jīng)元模型[7]。Tharam S.Dillon針對(duì)現(xiàn)實(shí)世界中交通流的時(shí)變性、隨機(jī)性等特性,研究了智能粒子群算法[8]。趙建玉、賈磊等提出了基于粒子群優(yōu)化算法的神經(jīng)網(wǎng)絡(luò)模型。該模型以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),提高了模型的預(yù)測(cè)精度[9]。針對(duì)交通飽和度的預(yù)測(cè),一種基于基因遺傳算法的最小支持向量回歸方法被提出[10]。針對(duì)短時(shí)交通流的預(yù)測(cè),唐智慧等提出基于交互式模型的短時(shí)交通流預(yù)測(cè)方法[11],孫靜怡等提出了考慮大型車因素的支持向量機(jī)短時(shí)交通狀態(tài)預(yù)測(cè)模型[12]。
上述研究成果主要集中在對(duì)車流量的預(yù)測(cè),而交通飽和度是對(duì)交通流量等多種交通數(shù)據(jù)的綜合體現(xiàn),能夠很好地表征道路的擁堵?tīng)顩r。因此,本文通過(guò)開(kāi)展車道飽和度預(yù)測(cè)建模方法研究,以期對(duì)道路未來(lái)的擁堵?tīng)顩r進(jìn)行預(yù)測(cè),指導(dǎo)合理選擇出行時(shí)機(jī),為道路間協(xié)調(diào)運(yùn)行做好鋪墊。該研究是實(shí)現(xiàn)智能交通系統(tǒng)的重要一環(huán)。
在城市交通路網(wǎng)中,通過(guò)信號(hào)燈可以合理控制車流,最大化路網(wǎng)運(yùn)行效率。信號(hào)周期對(duì)交通狀況有著很大的影響。周期越長(zhǎng),越多的車輛能夠在一個(gè)周期中通過(guò)路口,路網(wǎng)的運(yùn)行效率也就更高。在一個(gè)控制周期內(nèi),車道運(yùn)行有多種相位。在實(shí)際的交通系統(tǒng)中,通常采取四相位的控制方式,即整個(gè)路口車道在一個(gè)信號(hào)周期內(nèi)共有四種不同的組合運(yùn)行方式。相位數(shù)目的增加會(huì)使得路口交通的靈活性增加,提高路網(wǎng)運(yùn)行效率。但相位數(shù)過(guò)多,會(huì)導(dǎo)致車輛等待時(shí)間過(guò)長(zhǎng),容易引起擁堵。
飽和度由于能夠衡量在一個(gè)綠燈時(shí)間內(nèi)未浪費(fèi)的時(shí)間,即有車輛通過(guò)的時(shí)間與整個(gè)綠燈時(shí)間之比,因此可以表征道路擁堵?tīng)顩r。交通越擁堵,綠燈時(shí)車輛通過(guò)的數(shù)目就越多,相應(yīng)的飽和度值也就越大。由此可見(jiàn),擁堵程度與飽和度成正比關(guān)系。本文選取飽和度作為預(yù)測(cè)對(duì)象,以預(yù)測(cè)未來(lái)的交通狀況。
飽和度S的計(jì)算公式為:
(1)
式中:g為綠燈時(shí)間;T為車道空閑時(shí)間;n為通過(guò)的車輛數(shù);MF為每小時(shí)最大(即道路滿載時(shí))流量;t為車輛通過(guò)檢測(cè)器的平均時(shí)間。
在已有的交通狀況的預(yù)測(cè)研究中,選取折合車流量為預(yù)測(cè)對(duì)象。折合車流量CF在一定程度上能衡量交通的擁堵程度。CF的計(jì)算公式如下:
(2)
飽和度概念考慮了不同車輛型號(hào)對(duì)交通狀況會(huì)產(chǎn)生的影響。車流量衡量的是通過(guò)路口的車輛的數(shù)目,一輛大卡車和一輛小出租車對(duì)車流量的貢獻(xiàn)是相同的,但它們?cè)斐傻慕煌〒矶鲁潭炔煌R虼?,本文開(kāi)展車道飽和度預(yù)測(cè)建模方法的研究。
作為目前先進(jìn)的城市信號(hào)交通控制系統(tǒng),悉尼自適應(yīng)交通控制系統(tǒng)能對(duì)交通系統(tǒng)數(shù)據(jù)進(jìn)行實(shí)時(shí)采集與處理,能采集相應(yīng)車道的相位起始時(shí)間、相位長(zhǎng)度、信號(hào)周期長(zhǎng)度、車流量、綠燈時(shí)長(zhǎng)等交通數(shù)據(jù)?;谶@些原始數(shù)據(jù),能夠計(jì)算出該車道的折算飽和度。悉尼自適應(yīng)交通控制系統(tǒng)的數(shù)據(jù)格式如表1所示。
表1 數(shù)據(jù)格式Tab.1 Formats of data
交通數(shù)據(jù)由安裝在各個(gè)車道的傳感器檢測(cè)、采集得到,并傳給中央的計(jì)算機(jī)控制系統(tǒng)。交通路口各項(xiàng)參數(shù)數(shù)據(jù)如圖1所示。
由圖1可知,在某些時(shí)間點(diǎn),飽和度的變化非常急劇,在高峰期時(shí)段,甚至有些點(diǎn)的飽和度突然變?yōu)?。從實(shí)際考慮,這幾乎是不可能的。這是由于硬件設(shè)施發(fā)生故障,所帶來(lái)數(shù)據(jù)丟失和異常問(wèn)題。本文首先進(jìn)行數(shù)據(jù)進(jìn)行預(yù)處理,用數(shù)據(jù)濾波方法解決數(shù)據(jù)缺失、異常等問(wèn)題。
本文考察某路口前后信號(hào)周期車道飽和度如圖2所示。其最大飽和度之差為50輛,縱坐標(biāo)是該飽和度之差出現(xiàn)的頻率。
圖1 交通路口各項(xiàng)參數(shù)數(shù)據(jù)Fig.1 Parameter data of traffic intersection
圖2 前后信號(hào)周期車道飽和度示意圖Fig.2 Traffic lane saturation of frant and back signal cycle
由圖2可知,飽和度之差為50輛對(duì)應(yīng)的頻率極小。考慮到在相鄰的兩個(gè)信號(hào)周期之間的飽和度不可能發(fā)生很大的變化,需要將出現(xiàn)很大的飽和度之差的點(diǎn)的數(shù)據(jù)剔除掉。本文剔除異常信號(hào)周期數(shù)據(jù),并采用剔除數(shù)據(jù)前后一個(gè)信號(hào)周期飽和度的平均值代替異常點(diǎn)數(shù)據(jù)。數(shù)據(jù)處理結(jié)果如圖3所示。
圖3 數(shù)據(jù)處理結(jié)果Fig.3 Data processing results
由于交通系統(tǒng)采集的數(shù)據(jù)有12種(如表1),如果將這些數(shù)據(jù)都選為模型輸入,將會(huì)使得建模極其復(fù)雜,而且可能會(huì)發(fā)生數(shù)據(jù)冗余問(wèn)題,因此需要對(duì)輸入數(shù)據(jù)進(jìn)行選擇。主成分分析法采用的是一種數(shù)據(jù)降維的思路,在原始的變量中提煉出部分關(guān)聯(lián)性很弱的變量。這部分變量攜帶著原始變量的大部分特征。利用這部分的變量代替原始變量進(jìn)行運(yùn)算,可提升運(yùn)算速度。
對(duì)于一個(gè)樣本,有p個(gè)變量x1,x2,…,xp。則n個(gè)樣品的數(shù)據(jù)矩陣為:
(3)
第一步:標(biāo)準(zhǔn)化處理。其計(jì)算公式為:
(4)
第二步:計(jì)算樣本相關(guān)系數(shù)矩陣R。
(5)
經(jīng)過(guò)標(biāo)準(zhǔn)化的變量的相關(guān)系數(shù)為:
(6)
第三步:用相關(guān)方法求出相關(guān)系數(shù)矩陣R的特征值(λ1,λ2,…,λp),以及相對(duì)應(yīng)的特征向量ai=(ai1,ai2,…,aip),i=1,2,…,p。
第四步:提取出能夠最大程度含括原始變量數(shù)據(jù)信息量的變量。
在主成分分析中,得到的主成分的方差大小不一。這意味著它們所擁有的信息量也不相同。因此,只需要提取出擁有較大信息量的成分,剔除掉其余成分,則提取出的成分在很大程度上能代表原始變量。本文首先計(jì)算出每個(gè)成分的貢獻(xiàn)率,通過(guò)貢獻(xiàn)率的大小來(lái)確定主成分。其中,貢獻(xiàn)率的計(jì)算公式如下:
(7)
貢獻(xiàn)率可以用來(lái)衡量相應(yīng)成分?jǐn)y帶原始變量特征的比例大小。其值越大,說(shuō)明該成分所攜帶的原始變量的特征就越多,在一定程度上更能代表原始數(shù)據(jù)。一般通過(guò)設(shè)定一個(gè)閾值來(lái)確定主成分。本文選取閾值為95%,即提取出來(lái)的變量所包括的信息量為原來(lái)的95%。
第五步:計(jì)算主成分得分。用相關(guān)計(jì)算公式計(jì)算出每個(gè)主成分的得分Fij(i=1,2,…,n;j=1,2,…,p),構(gòu)成主成分得分矩陣Ψ:
(8)
第六步:根據(jù)主成分得分,選擇相關(guān)參數(shù)代替原始的變量。所得到的數(shù)據(jù)保留了原始數(shù)據(jù)大部分的特征,因此可以用于代替原始變量進(jìn)行分析,并且不失準(zhǔn)確性。
支持向量回歸能夠較好地解決小樣本、高維數(shù)、非線性和局部極小點(diǎn)等實(shí)際問(wèn)題。本文將采用支持向量回歸方法,對(duì)交通車道飽和度進(jìn)行預(yù)測(cè)建模。在線性回歸中,對(duì)于一個(gè)給定的樣本數(shù)據(jù),假設(shè)其對(duì)應(yīng)的最優(yōu)超平面方程為:
f(x)=wTx+b
(9)
式中:f(x)為模型輸出;x為模型輸入;w、b為模型系數(shù)。
為了確定w,需要求解如下的優(yōu)化問(wèn)題:
(10)
式中:A為輸入樣本數(shù)據(jù);Y為輸出樣本數(shù)據(jù);ξ和ξ*為松弛變量;e為有n維數(shù)據(jù)的向量;ε和C分別是松弛因子和懲罰系數(shù)。
在實(shí)際中,采用上述線性回歸方法時(shí),精度難以達(dá)到要求。因此,引入非線性回歸求解,其回歸方程為:
f(x)=K(xT,AT)w+b
(11)
式中:K為核矩陣,矩陣各個(gè)元素Kij-k(xi,xj),k(xi,xj)為核函數(shù)。
使用拉格朗日乘子,將上述優(yōu)化問(wèn)題轉(zhuǎn)換成其對(duì)偶問(wèn)題:
(12)
本文先求出對(duì)偶問(wèn)題的解,再利用對(duì)偶解求解出原始規(guī)劃的解,最后求得回歸方程。
在粒子群優(yōu)化算法中,每個(gè)問(wèn)題的潛在解都可以看成搜索空間中的一個(gè)飛行物,將其定義為粒子。每個(gè)粒子都有著其相應(yīng)的適值。該適值可以通過(guò)特定的函數(shù)計(jì)算。同時(shí),每個(gè)粒子的屬性中還擁有一個(gè)速度。該速度決定著粒子在空間里前進(jìn)的速率和方向,以確定粒子的具體位置。本文根據(jù)其適值確定一個(gè)最優(yōu)粒子;其他粒子根據(jù)最優(yōu)粒子來(lái)調(diào)整速度,在整個(gè)空間找尋最佳的解。粒子群優(yōu)化算法流程如圖4所示。
圖4 粒子群優(yōu)化算法流程圖Fig.4 Flowchart of PSO algorithm
通過(guò)主成分分析,本文選擇折合車流量、信號(hào)周期長(zhǎng)度、綠燈時(shí)長(zhǎng)為模型輸入。利用這些交通數(shù)據(jù),能夠直接或間接地影響車道飽和度(即交通擁堵?tīng)顩r),建立飽和度預(yù)測(cè)模型,并利用粒子群優(yōu)化算法對(duì)模型參數(shù)進(jìn)行尋優(yōu)。
選擇一段時(shí)間的訓(xùn)練數(shù)據(jù)(包括700組輸入輸出數(shù)據(jù))。首先,對(duì)該數(shù)據(jù)進(jìn)行濾波。然后,基于最小支持向量機(jī)方法建立預(yù)測(cè)模型。利用該模型預(yù)測(cè)結(jié)果與實(shí)測(cè)數(shù)據(jù)相比較,給出車道流飽和度預(yù)測(cè)的對(duì)比圖,說(shuō)明該模型具有較好的擬合效果。車道飽和度預(yù)測(cè)結(jié)果(訓(xùn)練數(shù)據(jù))如圖5所示。
圖5 車道飽和度預(yù)測(cè)結(jié)果(訓(xùn)練數(shù)據(jù))Fig.5 Prediction results of traffic lane saturation (training data)
進(jìn)而,本文選擇另一段時(shí)間的數(shù)據(jù),以驗(yàn)證所建立預(yù)測(cè)模型的有效性。測(cè)試集預(yù)測(cè)結(jié)果(測(cè)試數(shù)據(jù))如圖6所示。
圖6 測(cè)試集預(yù)測(cè)結(jié)果(測(cè)試數(shù)據(jù))Fig.6 Prediction results of the test set(testing data)
從圖6可以看出,該模型對(duì)于測(cè)試集的預(yù)測(cè)精度較高,與訓(xùn)練集的結(jié)果相近;預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)的差異不大,擬合程度較高。由此說(shuō)明了該預(yù)測(cè)模型的有效性。
本文引入實(shí)測(cè)交通數(shù)據(jù),基于主成分分析方法選擇折合車流量、信號(hào)周期長(zhǎng)度、綠燈時(shí)長(zhǎng)作為模型輸入,對(duì)城市交通車道飽和度建立了預(yù)測(cè)模型。所建立的預(yù)測(cè)模型基于支持向量回歸方法,可利用粒子群優(yōu)化算法對(duì)模型參數(shù)進(jìn)行尋優(yōu),并通過(guò)數(shù)據(jù)仿真驗(yàn)證了所提出方法的有效性。本文結(jié)果對(duì)道路未來(lái)的擁堵?tīng)顩r進(jìn)行預(yù)測(cè),指導(dǎo)合理選擇出行時(shí)機(jī),對(duì)道路間協(xié)調(diào)運(yùn)行具有一定的參考意義。