錢坤 張建 婁歡 任勇 夏婷婷
摘要:目前,城市道路交通擁堵問題是亟待解決的城市管理難題之一,而交通流擁堵的預測對城市的交通管理至關重要。交通流密度是交通流狀態(tài)的重要指標,交通流密度的預測對交通流狀態(tài)的預測具有重要的意義。本文采用模糊信息?;椭С窒蛄繖C的組合模型對交通流的擁堵情況進行預測,通過數(shù)據(jù)降噪、數(shù)據(jù)標準化、數(shù)據(jù)信息粒化等處理,然后利用支持向量機(SVM)分類回歸預測模型對處理后的數(shù)據(jù)進行回歸預測,預測結果較為精確,可以很好地預測交通流飽和度的發(fā)展趨勢和區(qū)間范圍,對交通管理具有很高的參考價值。
關鍵字:模糊信息粒化;支持向量機;小波變換;數(shù)據(jù)標準化;交通流擁堵預測
Abstract:At present, traffic congestion is one of the challenges in urban management, while, prediction of traffic congestion is essential to traffic management. Traffic density is an important indicator of the traffic flow, density prediction of traffic flow is of important significance. This article uses a combined model of fuzzy information granulation and support vector machine to predict the traffic congestion, we carry out denoising, data normalization, data information granulation before using support vector machine to accomplish classification and regression prediction, prediction results is accurate. The model does better in prediction of trend and range of traffic density and has high reference value for traffic management.
Keywords: Fuzzy Information Granulation; Support Vector Machine; Wavelet Transform; Data Normalization; Congestion Prediction.
1 引 言
城市道路擁堵問題是大城市管理中主要的社會難題之一,嚴重影響城市居民的出行效率,特別是近些年來,盡管完成了一大批城市道路基礎設施的建設,但是交通基礎設施的建設很難滿足交通需求的發(fā)展速度,城市交通的供需矛盾依然嚴峻。然而,交通基礎設施的建設不僅嚴重浪費社會資源,同時由于建設周期長,很難及時有效地緩解交通供需矛盾,因此,交通管理和決策勢必成為較為經(jīng)濟合理有效的路徑,進而,有效的交通狀態(tài)預測為交通管理提供科學有效的支撐顯得尤為重要。
城市道路交通流狀態(tài)的預測是智能交通一項重要的研究內容,根據(jù)交通流的平均速度、流量、密度和道路飽和率等評價指標將交通流劃分為不同的狀態(tài),例如Stutz C等利用多元型聚類(FCMP)方法以速度為指標將交通流基本圖分為自由流、密集流、擁擠流、阻塞流4個區(qū)域;廖瑞輝等利用云—支持向量機模型在交通流量、車輛速度、交通密度指標預測基礎上評定交通流的狀態(tài)并建立了交通擁堵預警機制; poriklif等直接在壓縮域提取擁擠特征,利用高斯混合隱馬爾可夫模型來檢測交通狀況。
城市道路交通流密度是交通流狀態(tài)評價的重要指標,為簡單起見,本文僅對交通流密度進行預測分析,而交通流量、車輛速度等指標預測分析和交通流密度預測分析原理相同,在此不做過多分析。
2 交通流擁堵預測建模
本文把交通流擁堵預測模型分為數(shù)據(jù)降噪、數(shù)據(jù)標準化、模糊信息粒化和回歸分析預測四個組成部分,以下針對每一部分進行詳細闡述。
2.1 數(shù)據(jù)降噪處理
城市道路交通系統(tǒng)主要受交通出行、道路條件和交通管理等因素的影響,因此在一定的道路條件和交通管理情況下,城市道路交通隨著出行早晚高峰而呈現(xiàn)相對穩(wěn)定的變化規(guī)律;然而,交通系統(tǒng)是人車路環(huán)境綜合作用的復雜系統(tǒng),因此城市道路交通因人車路環(huán)境隨機因素的影響呈現(xiàn)隨機性波動。對道路交通流的狀態(tài)基本規(guī)律預測需要減弱隨機性波動的影響,因此需要對數(shù)據(jù)進行降噪處理。
數(shù)據(jù)降噪方法主要包括基于時域或空間域的方法和基于頻率域的方法,基于時域或空間域的方法常用的有: N點平均濾波、中值濾波、標準高斯濾波及自適應濾波;基于頻率域的方法常用的有:傅立葉變換和小波變換。
傅立葉變換是在整體上將信號分解為不同頻率分量 ,只能在頻率域范圍內表述,而缺乏局域性信息,小波變換對信號進行多層次分解,在各個層次選擇閾值,對噪聲成分進行抑制,更加靈活。本文采用數(shù)據(jù)小波變換處理來降低隨機性造成的數(shù)據(jù)噪聲。
小波變換分析能夠針對某時間段內的信號的頻率信息,即對時間序列信號采取多層分解策略,每一步分解得到分解信號的低頻部分和高頻部分,逐步分解N層就會得到最終的低頻信息和每層產(chǎn)生的N層高頻信息。
該方法能夠很好地解決Z-Score標準化方法存在的變異程度上的差異相同的不足。標準化的數(shù)據(jù)通過分析運算后,將分析運算得到的結果進行逆向標準化處理即可把結果恢復到標準化之前的量綱。
綜上所述,本文不存在數(shù)據(jù)變量間變異程度上差異的比較,選擇Z-Score標準化方法對數(shù)據(jù)進行標準化處理。
2.3 模糊信息粒化
信息粒是一些相似度、功能性、接近性、一致性以及可識別性元素的集合,信息粒化是將研究數(shù)據(jù)整體分解為離散的信息粒的過程,信息粒化主要模型有基于粗糙集理論的模型、基于模糊集理論的模型和基于商空間理論模型,這三種模型具備不同的特點又在功能上相互補充。
交通流擁堵狀態(tài)的界定存在一定的模糊性,同時由于城市交通系統(tǒng)受出行、道路條件以及交通管理等因素影響,交通流是人車路和環(huán)境的綜合影響,呈現(xiàn)不確定性,然而,相鄰較短時間段內交通流的狀態(tài)又呈現(xiàn)相對的穩(wěn)定性,因此我們對數(shù)據(jù)進行模糊信息?;幚?,每個信息粒代表某個時間段的模糊性和不確定性。
模糊信息?;譃闀r間窗口劃分和時間窗口模糊化兩個步驟,對交通流密度數(shù)據(jù)進行時間窗口劃分時,假定交通流的在5min時間段內保持相對穩(wěn)定,其時間窗口 ;針對?;蟮臅r間窗口模糊化常用的基本形式包括高斯型、拋物線型、三角形和梯形,在此采用較為簡單的三角形模糊粒子,其隸屬函數(shù)形式如式(7):
(7)
數(shù)據(jù)經(jīng)過模糊信息?;罂梢杂梢幌盗械男畔⒘?代表,其中,a表示相應時間窗口原始數(shù)據(jù)的最小值,m代表相應時間窗口原始數(shù)據(jù)的平均水平,b表示相應時間窗口原始數(shù)據(jù)的最大值。
2.4 數(shù)據(jù)回歸預測
數(shù)據(jù)回歸分析模型除了傳統(tǒng)的線性和非線性回歸分析等方法之外,應用較為廣泛的還有人工神經(jīng)網(wǎng)絡模型、決策樹模型、貝葉斯分類器和支持向量機模型。
支持向量機(SVM)用于模式分類和非線性回歸分析,對原始數(shù)據(jù)通過特定的核函數(shù)映射的高維空間,使得在高維空間達到線性可分的目的,其主要思想是建立一個分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣最大化,是結構風險最小化的近似體現(xiàn),在分類和回歸預測問題上支持向量機能夠提供好的泛化性能,然后,將分類問題轉化為二次規(guī)劃問題,因此能夠得出全局最優(yōu)解,進而避免了存在局部極值的弊端。
基于上述支持向量機的優(yōu)勢,本文采用支持向量機進行回歸分析建模,該回歸分析模型分為兩步,第一步利用歷史數(shù)據(jù)對模型進行學習訓練,第二步利用第一步訓練好的模型對未來數(shù)據(jù)進行回歸預測分析。
3 仿真分析
我們基于上述模型在Matlab8.0和LibSVM-3.11工具包環(huán)境中進行編程實現(xiàn),并針對交通流一天內每分鐘密度數(shù)據(jù)進行仿真分析,我們把一天1 440個交通流密度數(shù)據(jù)?;癁?88個信息粒數(shù)據(jù),利用前287個數(shù)據(jù)對回歸預測模型進行訓練學習,利用訓練好的模型對最后一個信息粒進行預測分析。
圖1表示的是對交通流密度原始數(shù)據(jù)進行小波變換降噪處理前后的對比圖,灰色線圖表示未經(jīng)降噪處理的交通流密度的曲線圖,藍色線圖表示交通流密度經(jīng)過小波變換降噪后的曲線圖,對比發(fā)現(xiàn),小波變換能夠對交通流密度數(shù)據(jù)很好地降噪處理。
對降噪處理的數(shù)據(jù)進行數(shù)據(jù)標準化處理以消除量綱的影響,接下來對標準化的數(shù)據(jù)進行模糊信息?;:畔⒘;玫降男畔⒘0總€時間窗口的最大最小值和均值,由此對信息粒的最大最小值以及均值分別做回歸預測分析,核函數(shù)采取徑向基核函數(shù),支持向量機的懲罰函數(shù)參數(shù)和核函數(shù)參數(shù)的尋優(yōu)采取網(wǎng)格搜索的算法。
圖2表示回歸預測模型的訓練效果圖和最大最小值和均值預測值的點線圖,橫縱標表示一天24小時的時間序列,縱坐標是交通流密度的取值。(a)展示的是支持向量機回歸預測模型的訓練效果圖,從圖中可以看出,回歸預測模型訓練后的預測結果能夠跟訓練數(shù)據(jù)貼合得很緊密,由此可以看出支持向量機回歸預測模型能夠對交通流密度做很好的回歸預測;(b)表示交通流密度預測的最大最小值以及均值,發(fā)現(xiàn)預測的均值全部包含在最大最小值組成的取值區(qū)間內,最大最小值和均值的預測值能夠很好地展示原始數(shù)據(jù)的發(fā)展趨勢。
圖3表示交通流密度預測的最大最小值之差,橫坐標表示一天時間序列,縱坐標range是最大最小值之差構成的交通流密度取值區(qū)間的范圍,即 , 分別表示交通流密度預測的最大最小值,其中,誤差 的占80.6%,由此可見模型能夠準確地預測交通流密度的取值區(qū)間。
表1是基于模糊信息粒化和支持向量機組合模型對未來1個時間段內交通流密度的預測值和實際值以及預測相對誤差的信息表,對比最大值最小值以及均值的實際值和預測值可以得出,相對誤差在10%左右,模型的預測結果較為精確,能夠很好地預測交通流密度的發(fā)展趨勢和取值區(qū)間。
4 結 語
本文對城市道路交通流密度的歷史數(shù)據(jù)進行建模分析,從數(shù)據(jù)去噪聲處理到數(shù)據(jù)標準化處理,然后模糊信息?;玫叫畔⒘?,最后利用支持向量機對信息粒進行回歸預測,由仿真分析可知,基于模糊信息?;闹С窒蛄繖C模型在交通流密度預測中的效果較佳,實際值和預測值的誤差基本可以控制在10%左右,從而能夠獲得城市道路交通流密度的發(fā)展趨勢,此外,該模型能夠獲得城市道路交通流密度的變化區(qū)間,對交通管理的決策具有很大的參考意義。
主要參考文獻
[1]Stutz C, Runkler T A. Classification and Prediction of Road Traffic Using Application-Specific Fuzzy Clustering[J]. IEEE Transactions on Fuzzy Systems,2002, 10(3):297 - 308.
[2] Porikli, Li F X. Traffic Congestion Estimation Using Hmm Models Without Vehicle Tracking[J].Intelligent Vehicles Symposium,2004IEEE:188 - 193.
[3]廖瑞輝,周晶.基于云-支持向量機的道路交通擁擠預警模型[J].系統(tǒng)工程,2015, 33(4):149-153.
[4]潘洋宇,李東波,童一飛.基于小波技術的數(shù)據(jù)降噪[J].機械設計, 2006,23(1):31-33.
[5]何韜,梁棟,李瑤.小波變換在電力諧波分析中的應用[J].計算機技術與發(fā)展,2007, 17(1):229-232.
[6]張鈸,張鈴.問題求解理論及應用[M].北京:清華大學出版社,1990.
[7]Zadeh L A.Towards a Theory of Fuzzy Information Granulation and its Centrality in Human Reasoning and Fuzzy Logic[J].Fuzzy Sets and Systems,1997,19(1):111-117.
[8]史峰,王小川,郁磊,李洋.Matlab神經(jīng)網(wǎng)絡30個案例分析[M].北京:北京航空航天大學出版社,2009.