熊文真,沈雪梅,李紅娟
(1.信陽(yáng)職業(yè)技術(shù)學(xué)院,河南 信陽(yáng) 464000;2.昆明理工大學(xué),云南 昆明 650000)
?
基于相關(guān)向量機(jī)的交通流量預(yù)測(cè)
熊文真1,沈雪梅1,李紅娟2
(1.信陽(yáng)職業(yè)技術(shù)學(xué)院,河南 信陽(yáng) 464000;2.昆明理工大學(xué),云南 昆明 650000)
目的在短時(shí)間內(nèi)實(shí)時(shí)性預(yù)測(cè)交通流量值是構(gòu)建交通管理系統(tǒng)的重要內(nèi)容。交通流量數(shù)據(jù)存在著不確定性、復(fù)雜性和非線性等顯著特點(diǎn),使流量值的實(shí)時(shí)預(yù)測(cè)難度增大,交通流量的精準(zhǔn)預(yù)測(cè)一直是行業(yè)內(nèi)亟待解決的問(wèn)題?;谝延袑W(xué)者研究基礎(chǔ)之上,構(gòu)建基于相關(guān)向量機(jī)方法的交通流量預(yù)測(cè)模型。方法相關(guān)向量機(jī)的預(yù)測(cè)精度優(yōu)于邏輯回歸和支持向量機(jī)方法,且相關(guān)向量機(jī)方法具有產(chǎn)生預(yù)測(cè)誤差范圍的功能,對(duì)于實(shí)際交通流量序列數(shù)據(jù),采用基于相關(guān)RVM的交通流量預(yù)測(cè)模型。結(jié)果預(yù)測(cè)結(jié)果十分理想,預(yù)測(cè)速度比其他2種模型明顯加快,達(dá)到了交通流量預(yù)測(cè)的實(shí)時(shí)性要求,適合于實(shí)時(shí)在線預(yù)測(cè),且所用方法的預(yù)測(cè)精度相對(duì)較高。三方面的對(duì)比分析表明,利用相關(guān)向量機(jī)方法對(duì)交通流量進(jìn)行預(yù)測(cè)可以較為精確地描述出交通流量變化的非線性特點(diǎn),模型性能和實(shí)時(shí)性都較好。結(jié)論實(shí)例分析表明,基于相關(guān)向量機(jī)的交通流量預(yù)測(cè)模型可以提高預(yù)測(cè)的速度和精度,非常適用于有實(shí)時(shí)性要求的交通流量預(yù)測(cè)估計(jì),為實(shí)時(shí)性測(cè)量交通流量值提供了一種科學(xué)的方法。
相關(guān)向量機(jī);交通流量;預(yù)測(cè)
隨著經(jīng)濟(jì)的不斷發(fā)展,城市化進(jìn)程也隨之加快,造成城市交通流量的持續(xù)增加與堵塞,故可以有效解決交通問(wèn)題的智能交通系統(tǒng)應(yīng)運(yùn)而生,并逐漸獲得重視。該系統(tǒng)的核心在于如何精準(zhǔn)預(yù)測(cè)時(shí)刻變化的交通流量值,且預(yù)測(cè)結(jié)果的優(yōu)劣將直接影響交通規(guī)劃和控制問(wèn)題[1]。交通流量預(yù)測(cè)最為明顯的特征為其短時(shí)性,相比于長(zhǎng)期性的預(yù)測(cè),其更易受到隨機(jī)性因素的干擾,故具有更為明顯的不確定性,并呈現(xiàn)非規(guī)律性。
針對(duì)上述問(wèn)題,多位學(xué)者開始研究交通流量的預(yù)測(cè)問(wèn)題。目前主要應(yīng)用的方法有:時(shí)間序列模型、線性回歸模型、卡爾曼濾波模型、神經(jīng)網(wǎng)絡(luò)模型以及學(xué)習(xí)算法支持向量機(jī)模型等[2-4]。時(shí)間序列模型主要利用數(shù)據(jù)的線性特征對(duì)未來(lái)的數(shù)據(jù)進(jìn)行預(yù)測(cè),核心在于利用線性特征,但難以精確描述出有著非線性特征的交通流量數(shù)據(jù),預(yù)測(cè)的準(zhǔn)確度有所偏頗;線性回歸模型主要利用多元線性回歸模型對(duì)交通流量值進(jìn)行分析,在數(shù)據(jù)充足情況下,可以對(duì)較多的流量數(shù)據(jù)值進(jìn)行較快的預(yù)測(cè),但也存在一些缺點(diǎn)。例如若某一時(shí)刻的數(shù)據(jù)缺失,則預(yù)測(cè)精度會(huì)迅速降低;卡爾曼濾波模型也屬于線性回歸方法,其基于對(duì)多元線性回歸方法的進(jìn)一步改進(jìn),可依據(jù)實(shí)際情況選擇預(yù)測(cè)因素,預(yù)測(cè)精度相比于多元線性回歸也有所提高,但由于該方法的運(yùn)算過(guò)程中存在繁雜的向量與矩陣的運(yùn)算,導(dǎo)致其計(jì)算時(shí)間的延長(zhǎng),故對(duì)于實(shí)時(shí)預(yù)測(cè)的實(shí)現(xiàn)存在一定的難度;神經(jīng)網(wǎng)絡(luò)算法主要基于風(fēng)險(xiǎn)的處理,即最小化預(yù)測(cè)中的經(jīng)驗(yàn)風(fēng)險(xiǎn),但并未對(duì)期望風(fēng)險(xiǎn)做最小化處理,故存在著一定的不足,且該方法需要一些網(wǎng)絡(luò)結(jié)構(gòu)、局部極小值點(diǎn)、過(guò)學(xué)習(xí)等的確定,同時(shí)神經(jīng)網(wǎng)絡(luò)需要基于大量的訓(xùn)練樣本進(jìn)行數(shù)據(jù)的預(yù)測(cè)[5]。支持向量機(jī)屬于機(jī)器學(xué)習(xí)方法,并獲得廣泛應(yīng)用,支持向量機(jī)解決了神經(jīng)網(wǎng)絡(luò)算法中易出現(xiàn)的過(guò)擬合、易陷入局部極值、收斂速度較慢等問(wèn)題,主要針對(duì)性解決一些小樣本、非線性數(shù)據(jù)的處理問(wèn)題,是交通流量預(yù)測(cè)中的新預(yù)測(cè)方法[6]。相關(guān)向量機(jī)(relevance vector machine,RVM)是基于支持向量機(jī)基礎(chǔ)所發(fā)展的新方法,同時(shí)具有一些特點(diǎn),例如與支持向量相比,相關(guān)向量數(shù)目較少,且具有高稀疏性的特點(diǎn);只利用核參數(shù),樣本的訓(xùn)練時(shí)間得以壓縮;同時(shí)核函數(shù)非單一,具有多種選擇空間等。因此,為達(dá)到提高交通流量預(yù)測(cè)方法的準(zhǔn)確性和體現(xiàn)實(shí)時(shí)性的目的,本文提出一種基于相關(guān)向量機(jī)方法的交通流量預(yù)測(cè),并利用該方法進(jìn)行實(shí)例分析,驗(yàn)證該方法的預(yù)測(cè)性能。
2.1交通流量的特性分析
交通流量是指在確定的單位時(shí)間內(nèi),某一路段所通過(guò)的車流量的總和。交通流量的數(shù)據(jù)變化有著不確定性、實(shí)時(shí)變化性和高度非線性等特點(diǎn)。考慮到上述特點(diǎn),以及某一路段、某一時(shí)段上的交通流量與前幾個(gè)時(shí)段的交通流量存在著某種關(guān)系,可以利用前幾個(gè)時(shí)段流量數(shù)據(jù)序列對(duì)未來(lái)某一個(gè)短時(shí)間時(shí)段的交通流量進(jìn)行預(yù)測(cè)研究[7],即依據(jù)歷史的交通流量數(shù)據(jù)與現(xiàn)有數(shù)據(jù),應(yīng)用一些數(shù)學(xué)與統(tǒng)計(jì)知識(shí)構(gòu)建預(yù)測(cè)模型,對(duì)未來(lái)某一時(shí)段的交通流量進(jìn)行數(shù)值的預(yù)測(cè)。設(shè)前t時(shí)間段的流量為:X1,X2,…,Xt,則下一時(shí)間單位的交通流量Xt+1可以描述為:Xt+1=f(X1,X2,…,Xt)。
2.2樣本數(shù)據(jù)的預(yù)處理
交通流量值具有較大的差異性,在相關(guān)向量機(jī)模型的數(shù)據(jù)訓(xùn)練中,如果訓(xùn)練過(guò)程中所用數(shù)據(jù)具有較大的差異性,將導(dǎo)致模型學(xué)習(xí)速度變緩,從而影響數(shù)據(jù)預(yù)測(cè)的實(shí)時(shí)性。為了加快樣本的訓(xùn)練速度和收斂速度,需要對(duì)最初采集的交通流量樣本進(jìn)行進(jìn)一步的處理,以提高相關(guān)向量機(jī)模型的預(yù)測(cè)速度與精度。本文利用歸一化方法對(duì)交通流量的數(shù)據(jù)做進(jìn)一步處理:
相關(guān)向量機(jī)是以支持向量機(jī)為根基進(jìn)行構(gòu)建的,是基于貝葉斯學(xué)習(xí)理論提出的新的機(jī)器學(xué)習(xí)方法[8,9]。將同一時(shí)間段內(nèi)同等間隔的交通流量觀測(cè)值表示為一個(gè)時(shí)間序列S,S=[s1,s2,…,si,…,sM],假設(shè)觀測(cè)值si與觀測(cè)值si-1,si-2,…,si-r(si之前的r個(gè)觀測(cè)值)之間存在的高度非線性關(guān)系,該關(guān)系可以表示如下:
si=ξ(si-1,si-2,…,si-r),i=r+1,r+2,…,M
其中,K(X,Xi)是核函數(shù)(radial basis function,RBF),Wi是回歸系數(shù)。其中,核函數(shù)的構(gòu)造主要選擇高斯函數(shù)與二項(xiàng)式函數(shù)進(jìn)行組合得到的多項(xiàng)式函數(shù)。輸出結(jié)果集相互獨(dú)立時(shí),整個(gè)樣本集的似然函數(shù)可以表示為:
其中,α=[α0,α1,…αN]T表示為超參數(shù),αi具有對(duì)應(yīng)的權(quán)值Wi。在獲得先驗(yàn)分布和訓(xùn)練樣本的情況下,定義先驗(yàn)概率分布及似然分布之后,由貝葉斯原理,權(quán)值向量Wi后驗(yàn)分布的數(shù)學(xué)表達(dá)式表示如下:
m=σ-2∑ΦTt∑=(σ-2ΦTΦ+A)-1
其中,A=diag(α1,α2,…,αN)。利用集成權(quán)重的方式獲得最大似然函數(shù)如下:
其中協(xié)方差可表示C=σ2I+ΦA(chǔ)-1ΦT。分別對(duì)α和σ2求偏導(dǎo),并且令偏導(dǎo)等于0,可以得到:
其中mi是第i個(gè)元素,同時(shí)γi=1-αi∑ii,∑ii是矩陣∑的第i個(gè)對(duì)角元。
相關(guān)向量機(jī)在循環(huán)計(jì)算過(guò)程中不斷改變m和∑的值,直至達(dá)到收斂要求或最大迭代次數(shù)。即在模型內(nèi)部的循環(huán)計(jì)算中,大部分權(quán)重趨近于0,故很大程度上核函數(shù)矩陣的項(xiàng)不會(huì)參與到實(shí)際的交通流量預(yù)測(cè)計(jì)算中。
為了驗(yàn)證RVM模型的實(shí)時(shí)性與預(yù)測(cè)精度,本文采用某市某路段一檢測(cè)器的交通流量數(shù)據(jù)來(lái)進(jìn)行對(duì)比驗(yàn)證。流量數(shù)據(jù)的檢測(cè)周期是5 min。采用5個(gè)不同時(shí)間段的數(shù)據(jù)樣本,共360個(gè)檢測(cè)數(shù)據(jù)。對(duì)交通流量數(shù)據(jù)進(jìn)行提前1個(gè)間隔點(diǎn)(5 min)的預(yù)測(cè)。建立模型前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,用MATLAB軟件編制仿真實(shí)驗(yàn)程序,選取合理的參數(shù)。圖1為對(duì)交通流量的采集數(shù)據(jù)歸一化處理之后的結(jié)果;圖2主要將基于相關(guān)向量機(jī)的交通流量預(yù)測(cè)模型的實(shí)際交通流量值與預(yù)測(cè)流量的結(jié)果進(jìn)行比較分析。表1為與其它方法相比的評(píng)價(jià)結(jié)果。
圖1 交通流量原始數(shù)據(jù)的歸一化結(jié)果 圖2 支持向量機(jī)的預(yù)測(cè)結(jié)果
因?yàn)橄嚓P(guān)向量機(jī)為非線性預(yù)測(cè)能力模型,可以基本刻畫交通流量的變化規(guī)律,由圖2可知,RVM預(yù)測(cè)結(jié)果可以較好地描述交通流量的非線性變化規(guī)律,預(yù)測(cè)誤差得以降低,預(yù)測(cè)實(shí)時(shí)性提高,精度得以提高。為驗(yàn)證應(yīng)用RVM方法預(yù)測(cè)交通流量的精度與可靠性,將邏輯回歸、支持向量機(jī)與相關(guān)向量機(jī)3種方法的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,如表1所示。
表1 不同模型計(jì)算量的對(duì)比
從表1中3類方法的比較參數(shù)可知,邏輯回歸和支持向量機(jī)的交通流量預(yù)測(cè)實(shí)時(shí)性明顯高于相關(guān)向量機(jī)所用的預(yù)測(cè)時(shí)間,相關(guān)向量機(jī)的預(yù)測(cè)精度優(yōu)于其它2種方法,且相關(guān)向量機(jī)方法具有產(chǎn)生預(yù)測(cè)誤差范圍的功能。對(duì)于該組實(shí)際的交通流量序列,本文提出的基于RVM的交通流量預(yù)測(cè)模型的綜合預(yù)測(cè)性能優(yōu)于邏輯回歸模型和支持向量機(jī)模型。預(yù)測(cè)結(jié)果十分理想,預(yù)測(cè)速度相比其他兩種模型明顯加快,達(dá)到了交通流量預(yù)測(cè)的實(shí)時(shí)性要求,適合實(shí)時(shí)在線預(yù)測(cè)。同時(shí)從表1的預(yù)測(cè)精度結(jié)果可以得出,本文所用方法的預(yù)測(cè)精度相對(duì)較高。3種方法的對(duì)比分析表明,利用相關(guān)向量機(jī)方法對(duì)交通流量進(jìn)行預(yù)測(cè)可以較為精確地描述出交通流量變化的非線性特點(diǎn),模型性能和實(shí)時(shí)性都較好,是一種較為可靠的交通流量預(yù)測(cè)方法。綜上可知,相關(guān)向量機(jī)提供了一種精度高、實(shí)時(shí)性較好的交通流量預(yù)測(cè)工具。
文中基于交通流量數(shù)據(jù)的特殊性,提出了基于RVM的交通流量預(yù)測(cè)模型。RVM方法解決了神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)時(shí)間較長(zhǎng)、泛化能力較差等問(wèn)題,體現(xiàn)了其強(qiáng)大的小樣本處理能力。實(shí)際數(shù)據(jù)驗(yàn)證結(jié)果表明,通過(guò)運(yùn)用相關(guān)向量機(jī)方法預(yù)測(cè)交通流量,提高了預(yù)測(cè)效率、準(zhǔn)確性和實(shí)時(shí)性。與其它模型進(jìn)行對(duì)比分析表明,基于RVM的交通流量預(yù)測(cè)模型在預(yù)測(cè)精度和時(shí)間方面都具有一定的優(yōu)勢(shì),是一種有效的交通流量預(yù)測(cè)方法。RVM可以同時(shí)輸出預(yù)測(cè)值和預(yù)測(cè)值方差,非常適用于有實(shí)時(shí)性要求的交通流量預(yù)測(cè)估計(jì),為交通流量預(yù)測(cè)這一關(guān)鍵技術(shù)領(lǐng)域的研究開拓了新的研究視角。下一步的工作內(nèi)容,可以考慮將相關(guān)向量機(jī)方法與其他方法進(jìn)一步結(jié)合,即構(gòu)建基于相關(guān)向量機(jī)的組合預(yù)測(cè)模型,使預(yù)測(cè)精度更高、預(yù)測(cè)效度更詳細(xì),在不斷的研究對(duì)比中擴(kuò)展交通流量預(yù)測(cè)研究領(lǐng)域。
[1]傅貴,韓國(guó)強(qiáng),逯峰,等.基于支持向量機(jī)回歸的短時(shí)交通流預(yù)測(cè)模型[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2013,41(09):71-76.
[2]劉子昱.基于流量的交通信號(hào)智能控制算法與仿真[J].計(jì)算機(jī)仿真,2007,24(12):226-229.
[3]叢新宇,虞慧群,范貴生.基于組合模型的交通流量預(yù)測(cè)方法[J].華東理工大學(xué)學(xué)報(bào):自然科學(xué)版,2011,37(03):340-345.
[4]周桐,楊智勇,孫棣華,等.分車型的高速公路短時(shí)交通流量預(yù)測(cè)方法研究[J].計(jì)算機(jī)應(yīng)用研究,2015,37(07):1996-1999.
[5]楊顯立,許倫輝,周勇.基于小波神經(jīng)網(wǎng)絡(luò)的道路交通流量實(shí)時(shí)預(yù)測(cè)模型研究[J].公路交通技術(shù),2013,(05):111-114.
[6]鄭勛燁,黃晶晶.基于支持向量回歸機(jī)的交通狀態(tài)短時(shí)預(yù)測(cè)和北京某區(qū)域?qū)嵗治鯷J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2010,40(10):76-85.
[7]Wu C H,Ho J M,Lee D T.Travel-time prediction with support vector regression[J].Intell Transport Syst,IEEE Transact,2004,5(04):276-281.
[8]Tipping M E.Sparse Bayesian learning and the relevance vector machine[J].J Machine Learning Res,2001,1:211-244.
[9]楊國(guó)鵬,周欣,余旭初.稀疏貝葉斯模型與相關(guān)向量機(jī)學(xué)習(xí)研究[J].計(jì)算機(jī)科學(xué),2010,37(07):225-228.
[責(zé)任編輯:關(guān)金玉英文編輯:劉彥哲]
Traffic Flow Prediction Based on Relevance Vector Machine
XONG Wen-zhen1,SHEN Xue-mei1,LI Hong-juan2
(1.Xinyang Vocational & Technical College,Xinyang,Henan 464000,China;2.Engineering Research Center of Metallurgical Energy Conservation & Emission Reduction,Ministry of Education,Kunming University of Science and Technology,Kunming,Yunnan 650093,China)
ObjectiveThe traffic flow value prediction in short time is an important part of traffic management system.And the traffic flow data is uncertain,complex and nonlinear,and so on.So the difficulty of the real-time prediction of the flow rate is improved and becomes an urgent problem.The traffic flow forecasting model based on correlation vector machine is built upon the existing research.MethodsThe relevant vector machine prediction accuracy was better than logistic regression and support vector machine method and RVM method had the function of prediction error range.For the actual traffic flow data,relevance vector machine model model was used in this paper.ResultsThe prediction results were ideal and the prediction speeded significantly faster when compared with the other two models,which met the requirements of real-time traffic flow forecasting.The results were suitable for real-time online prediction,and the prediction accuracy was relatively high.Comparative analysis of three aspects showed that by using relevance vector machine,the prediction could accurately describe the nonlinear characteristics of the traffic flow changes of traffic flow model and real-time performance was good. ConclusionAnalysis of the example shows that the prediction model based on traffic in the relevance vector machine can improve the speed and accuracy of forecast.It is applicable to the requirements of the real-time traffic flow forecasting,and provides a scientific method for real-time measurement of traffic flow data.
relevance vector machine;traffic flow;prediction
10.3969/j.issn.1673-1492.2016.05.006
國(guó)家自然科學(xué)基金資助項(xiàng)目(51066002/E060701);云南聯(lián)合基金資助項(xiàng)目(U0937604)
熊文真(1983-),女,河南泌陽(yáng)人,講師,碩士研究生,主要研究方向:數(shù)學(xué)建摸、數(shù)字圖象處理。
李紅娟(1984-),女,遼寧彰武人,博士研究生,副教授,主要研究方向:能源預(yù)測(cè)與調(diào)度。
F 721.7
A
來(lái)稿日期:2016-03-03