唐世星
(承德石油高等??茖W(xué)校人事處,河北承德 067000)
改進(jìn)的支持向量機(jī)算法在短時(shí)交通流預(yù)測(cè)中的應(yīng)用
唐世星
(承德石油高等??茖W(xué)校人事處,河北承德 067000)
把交叉驗(yàn)證和網(wǎng)格搜索算法引入支持向量機(jī)預(yù)測(cè)算法,建立了改進(jìn)的支持向量機(jī)預(yù)測(cè)模型,并將其應(yīng)用于短時(shí)交通流預(yù)測(cè)進(jìn)行實(shí)證分析。以某城市道路的實(shí)時(shí)數(shù)據(jù)來(lái)對(duì)模型進(jìn)行驗(yàn)證,預(yù)測(cè)結(jié)果表明了該模型的有效性。
短時(shí)交通流預(yù)測(cè);交叉驗(yàn)證;網(wǎng)格搜索;懲罰因子
支持向量機(jī)是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)之上發(fā)展起來(lái)的一種較好的機(jī)器學(xué)習(xí)方法,它根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳方案,以期獲得最好的泛化能力。同時(shí),支持向量機(jī)將優(yōu)化問題轉(zhuǎn)化為凸規(guī)劃問題,所得局部最優(yōu)解即為全局最優(yōu)解。支持向量機(jī)已成為機(jī)器學(xué)習(xí)的新熱點(diǎn),已被廣泛應(yīng)用于模式識(shí)別、分類、回歸估計(jì)、聚類等領(lǐng)域,但在核函數(shù)參數(shù)、懲罰因子的選擇等問題上沒有統(tǒng)一的認(rèn)識(shí),仍需進(jìn)一步研究。
交通流短時(shí)預(yù)測(cè)是實(shí)現(xiàn)智能交通控制和誘導(dǎo)系統(tǒng)的重要環(huán)節(jié),由于交通流量受諸多因素影響,使其具有非線性和不確定性[1-2]。本文在支持向量機(jī)預(yù)測(cè)模型中引入交叉驗(yàn)證和網(wǎng)格搜索算法,優(yōu)化懲罰因子和核函數(shù)的參數(shù),建立了改進(jìn)的支持向量機(jī)預(yù)測(cè)模型,并將其應(yīng)用于短時(shí)交通流預(yù)測(cè)進(jìn)行實(shí)證分析。通過與經(jīng)典的GM(1,1)模型和改進(jìn)的GM(1,1)模型比較,表明該預(yù)測(cè)模型具有較高的預(yù)測(cè)精度,可用于短時(shí)交通流預(yù)測(cè)。
考慮l個(gè)獨(dú)立同分布的樣本數(shù)據(jù)點(diǎn){xi,yi},其中xi∈Rm為輸入,yi∈R為輸出,i=1,2,…,l。支持向量回歸機(jī)是將樣本數(shù)據(jù){xi,yi}通過非線性函數(shù)φ(x)映射到高維特征空間{φ(xi),yi},然后在特征空間進(jìn)行線性回歸,即構(gòu)造最優(yōu)線性函數(shù):
其中,w為權(quán)重向量,b為偏置項(xiàng),均為待定系數(shù)。
構(gòu)造并求解如下優(yōu)化問題:
由于實(shí)際問題往往是非線性的,所以必須對(duì)線性情況進(jìn)行拓廣,引入核函數(shù)K(w,x),通過求解其對(duì)偶問題來(lái)求解,即
上式(2)、(3)中的C為懲罰因子,是模型泛化能力和精度之間的一個(gè)參數(shù),ε為不敏感損失值(精度參數(shù))。求解可得最優(yōu)解,選擇的正分量,可得:
構(gòu)造估計(jì)函數(shù):
即可對(duì)未知樣本進(jìn)行回歸分析。
支持向量機(jī)常用的核函數(shù)有線性、多項(xiàng)式、徑向基RBF和Sigmoid核函數(shù)。核函數(shù)的選擇及其參數(shù)的確定決定了回歸分析的效果和復(fù)雜程度,由于核函數(shù)目前只有上述幾種,所以比較有效的一種方法是:選定核函數(shù),通過交叉驗(yàn)證[4]搜索算法優(yōu)化懲罰因子和核函數(shù)的參數(shù),進(jìn)而訓(xùn)練支持向量機(jī)進(jìn)行回歸預(yù)測(cè),通過回歸的均方誤差(MSE)和相關(guān)系數(shù)來(lái)評(píng)價(jià)回歸效果,從而選擇最優(yōu)的懲罰因子和核函數(shù)及其參數(shù)。
本文以文獻(xiàn)[5]中的常熟市某無(wú)檢測(cè)器交叉口每5 min測(cè)得的交通流量為研究對(duì)象,利用建立的模型預(yù)測(cè)其短時(shí)交通流。該交通流量數(shù)據(jù)為{11,10,11,13,15,16,16,15},取前7個(gè)數(shù)據(jù)訓(xùn)練模型,用第8個(gè)數(shù)據(jù)做模型交通流量預(yù)測(cè);使用Matlab平臺(tái)和LibSVM做模型的算法實(shí)現(xiàn)。通過選擇不同的核函數(shù),并使用交叉驗(yàn)證獲得優(yōu)化的懲罰因子和核函數(shù)參數(shù),可得到對(duì)應(yīng)的回歸模型均方誤差和相關(guān)系數(shù)。比較可得,當(dāng)核函數(shù)為RBF核函數(shù),核函數(shù)參數(shù)值為0.0625,懲罰因子值為90.509 7時(shí),短時(shí)交通流預(yù)測(cè)效果最優(yōu);把文獻(xiàn)[4]和[5]的預(yù)測(cè)與本模型預(yù)測(cè)結(jié)果相比較,結(jié)果見表1。
由表1可知,改進(jìn)的支持向量機(jī)模型擬合精度非常高,可以用于短期預(yù)測(cè),并且得到第8個(gè)時(shí)間點(diǎn)的預(yù)測(cè)交通流量為15.0313,與實(shí)際交通流量相比其相對(duì)誤差僅為-0.21% <1%,顯然預(yù)測(cè)效果比較理想。短時(shí)交通流量的原始數(shù)據(jù)與本模型及文獻(xiàn)[6]的預(yù)測(cè)值對(duì)比圖見圖1。
表1 預(yù)測(cè)結(jié)果比較
本文結(jié)合交叉驗(yàn)證和網(wǎng)格搜索算法,優(yōu)化懲罰因子和核函數(shù)參數(shù),建立了改進(jìn)的支持向量機(jī)預(yù)測(cè)模型。通過Matlab軟件編程實(shí)現(xiàn)該模型,編寫了通用算法程序,計(jì)算過程簡(jiǎn)單。通過對(duì)某無(wú)檢測(cè)器交叉口測(cè)得的短時(shí)交通流量進(jìn)行實(shí)證分析和比較,證明本文所提出的預(yù)測(cè)模型是合格的,并且擬合精度較高,預(yù)測(cè)效果良好,可用于短時(shí)交通流量預(yù)測(cè)。但是,本模型的預(yù)測(cè)方案是完全數(shù)據(jù)驅(qū)動(dòng)的,是定量的,具有一定的局限性。如何在該方法的基礎(chǔ)上附加一定的定性分析,彌補(bǔ)完全數(shù)據(jù)驅(qū)動(dòng)的不足是需要繼續(xù)研究的課題。
[1] 劉靜,關(guān)偉.交通流預(yù)測(cè)方法綜述[J].公路交通科技,2004(3):82-85.
[2] 張孝利,陸化普.短時(shí)交通流預(yù)測(cè)特性及實(shí)例分析[J].公路交通科技,2009(26):62-68.
[3] 徐啟華,楊瑞.支持向量機(jī)在交通流量實(shí)時(shí)預(yù)測(cè)中的應(yīng)用[J].公路交通科技,2005(22):131-134.
[4] 李鋒.基于舍一交叉驗(yàn)證優(yōu)化最小二乘支持向量機(jī)的故障診斷模型[J].振動(dòng)與沖擊,2010(29):170-174.
[5] 孫燕,陳森發(fā),周振國(guó).灰色系統(tǒng)理論在無(wú)檢測(cè)器交叉口交通量預(yù)測(cè)中的應(yīng)用[J].東南大學(xué)學(xué)報(bào),2002,32(2):256-258.
[6] 柯鳳琴.一種改進(jìn)的GM(1,1)模型在交通量預(yù)測(cè)中的應(yīng)用[J].承德石油高等??茖W(xué)校學(xué)報(bào),2010(12):44-47.
Application of Improved Support Vector Machine Algorithm in Short-term Traffic Flow Forecast
TANG Shi-xing
(Personnel Department,Chengde Petroleum College,Chengde 067000,Hebei,China)
The paper introduces cross-validation and grid-search method to optimize the prediction accuracy of Support Vector Machine models,the establishment of an improved Support Vector Machine prediction model,and applied to short-term traffic flow forecasting empirical analysis.The paper also uses the real time data of certain urban road to test the efficiency of the proposed model and the result is satisfactory.
short-term traffic flow forecasting;cross-validation;grid-search method;penalty factor
U495
A
1008-9446(2012)01-0034-03
河北省高等學(xué)??茖W(xué)技術(shù)研究指導(dǎo)項(xiàng)目:Z2 010210
2011-10-19
唐世星(1981-),男,安徽碭山人,承德石油高等??茖W(xué)校人事處,講師,研究方向:數(shù)據(jù)挖掘和建模。