趙文忠,耿立艷,梁毅剛,張占福
(1.河北曲港高速公路開發(fā)有限公司,河北保定071000;2.石家莊鐵道大學經(jīng)濟管理學院,石家莊050043;3.石家莊鐵道大學四方學院,石家莊051132)
高速公路服務水平的準確、實時判別,不僅需要對交通流進行實時預測,而且要根據(jù)實際情況對道路服務水平進行合理劃分及準確判別,這既有利于出行者根據(jù)道路信息合理安排出行路線,也對后期的高速公路交通控制管理有至關重要的作用.高速公路的服務水平判別方法的關鍵是采用合適的服務水平劃分及判別方法.美國利用車流密度對高速公路的服務水平進行劃分[1],德國將平均速度作為干線公路服務水平的評價指標,日本則將流量與通行能力的比值作為服務水平劃分的依據(jù)[2].王華榮等[3]使用灰色系統(tǒng)理論評價道路服務水平;韓斌[4]基于交通量的預測實現(xiàn)了對高速公路服務水平的分析.以上成果僅根據(jù)現(xiàn)有交通流參數(shù)的影響實現(xiàn)對高速公路服務水平的劃分及判別,得到的高速公路服務水平并不具有實時性,且并未實現(xiàn)對多種交通信息的整合,難以保證交通信息發(fā)布的時效性.高速公路服務水平的實時預測主要是預測交通流參數(shù),國內外學者提出的不同交通流短時預測模型,均可用于高速公路交通流預測.Ghosh等[5]利用自回歸移動平均(ARIMA)模型預測公路交通流.Vlahogianni等[6]驗證了神經(jīng)網(wǎng)絡在交通流預測方面的有效性.傅貴等[7]構建了基于支持向量機的短時交通流量預測模型,并證明了其可行性和有效性.熊志華等[8]采用粒子群優(yōu)化的多維混沌時間序列預測道路網(wǎng)多個斷面的交通流,獲得了較好的多斷面短時交通流預測效果.
綜上所述,目前對高速公路服務水平的劃分與判別方法和交通流參數(shù)短時預測方法結合起來的研究較少,此外,現(xiàn)有研究中,大多數(shù)高速公路交通流參數(shù)預測方法僅考慮其隨時間的變化趨勢,而對天氣、出行日期等不定性因素引起的變化欠考慮.本文在考慮多種影響因素的基礎上,構建基于多維數(shù)據(jù)的高速公路服務水平實時判別模型,實現(xiàn)對高速公路服務水平的參數(shù)預測及實時判別,為實時交通信息的融合與處理提供理論基礎,為基于大量數(shù)據(jù)的智能交通管理與控制提出方法依據(jù).
高速公路服務水平劃分模型利用模糊C均值(Fuzzy C-means,FCM)劃分高速公路水平.設有n個樣本的數(shù)據(jù)集X={x1,x2,…,xn},將樣本分為c類,1<c<n,對任意xi∈X,其特征向量xi=(vi,ki),vi,ki分別表示第i個樣本的速度、密度.根據(jù)目標函數(shù)最小化獲得高速公路各類服務水平的聚類中心,以隸屬度函數(shù)定義的目標函數(shù)為
約束條件為
式中:uij為第j個樣本對于第i類的隸屬度函數(shù),為c×n階模糊分類矩陣;為2×c階聚類中心矩陣;ah為第h個高速公路服務水平聚類中心的特征向量且;m為模糊加權指數(shù);,為第j個樣本xj到第i類ai的歐氏距離;J(U,A)為各類樣本到高速公路各類服務水平聚類中心的加權值,根據(jù)聚類準則求得
以上算法的實現(xiàn)步驟如下:
Step 1設定q為迭代運算次數(shù),給出迭代標準ε>0,隸屬度矩陣計算公式如式(8)所示.如果存在,使得,則令
Step 2設聚類中心的迭代運算為
Step 3用1個矩陣范數(shù)||?||比較a(q+1)與a(q),若滿足式(10),則停止迭代,得到高速公路各類服務水平的聚類中心矩陣為A=[a1,…,ah,…,ac];否則,q=q+1,轉Step1.
最小二乘支持向量機(LS-SVM)是一種改進型支持向量機,它將支持向量機的二次規(guī)劃問題轉化為求解線性方程組問題,不僅提高了求解問題的速度與收斂精度,而且獲得了很好的推廣性能[9].本文的高速公路服務水平劃分由交通流速度和密度兩個因素確定,從而高速公路服務水平的預測需確定交通流速度和密度兩個參數(shù).考慮時間、天氣及出行日期等多因素,選用LS-SVM預測交通流速度和密度兩個參數(shù).以速度為例建立預測模型.
式中:φ(xi)為高維特征空間映射函數(shù),實現(xiàn)對輸入變量的變換;ω為權矢量;b為常數(shù).根據(jù)結構風險最小化原則,用于函數(shù)估計的LS-SVM問題可以表示為
定義拉格朗日函數(shù)為
定義核函數(shù)K(x,xi)=φ(x)φ(xi),結合庫恩—卡特條件,將式(12)轉化為1組線性方程為
根據(jù)式(14)可求δ*=[δ1*,δ2*,…,δl*]和b*,則 LSSVM函數(shù)估計模型為
構造LS-SVM模型時,引入RBF核函數(shù),即
根據(jù)上述方法可得到速度的預測結果函數(shù),同理可得密度的預測結果.
利用高速公路服務水平劃分模型獲得各個分類聚類中心,基于高速公路服務水平判別參數(shù)預測模型,預測交通流速度和密度兩個參數(shù),并建立高速公路服務水平判別模型預測其服務水平.高速公路服務水平判別模型為
式中:xp表示第p個高速公路服務水平預測樣本數(shù);vp和kp分別表示第p個高速公路服務水平預測樣本的速度與密度;ag為第g類高速公路服務水平的聚類中心;vag和kag分別表示此類服務水平聚類中心的速度與密度;β1和β2分別表示速度與密度對服務水平分類的影響權重,且0≤β1≤1,0≤β2≤1,β1+β2=1.
河北省初步建立了全省交調數(shù)據(jù)中心,建成交通情況調查站663個.交調站配備了線圈、微波、視頻等具有連續(xù)采集數(shù)據(jù)和數(shù)據(jù)遠程傳輸?shù)淖詣咏徽{儀器,自動實時采集道路交通量、車速等數(shù)據(jù)指標,然后通過網(wǎng)絡將數(shù)據(jù)傳輸?shù)浇y(tǒng)一的數(shù)據(jù)中心,完成調查實時數(shù)據(jù)的接收.本文從“河北省公路交通情況調查系統(tǒng)”下載得到河北省高速公路10個觀測站2016年8~10月,周期為5 min的單方向交通流數(shù)據(jù)264 960組;2016年11月1日、2016年11月6日全天,周期為5 min的單方向數(shù)據(jù)5 760組;以及2016年11月22日某一觀測站的全天,周期為5 min的單方向數(shù)據(jù)288組;共計271 008組樣本,進行實例驗證.設備的采集間隔為5 min,采集的速度及密度數(shù)據(jù)都是瞬時數(shù)據(jù),其中速度定義為車輛在某瞬時行駛的快慢和方向的矢量,單位為km/h;密度定義為某瞬時單位長度1條車道上的車輛數(shù),單位為pcu/km.由于觀測站收集數(shù)據(jù)時會產生少量的錯誤數(shù)據(jù),采用閾值分析和基本的交通流理論對數(shù)據(jù)進行適當?shù)暮Y選與處理,最終獲得的有效樣本的訓練數(shù)據(jù)237 360組,預測數(shù)據(jù)6 048組.如果速度和密度的任何一個值為0時,便認為是錯誤數(shù)據(jù),應進行剔除.
選取2016年10月1日的部分基礎數(shù)據(jù)進行展示,如表1所示.
表1 某高速公路某觀測站樣本原始數(shù)據(jù)Table 1 The sample of raw data of an observation station of a highway
為了計算方便,對交通流速度與密度樣本進行標準化處理,作為高速公路服務水平劃分的基礎樣本數(shù)據(jù).以速度為例,其標準化公式為
式中:i=1,2,…,n;n為樣本數(shù)量;vi為第i個樣本數(shù)據(jù)的速度;vmin為n個樣本中的速度最小值;vmax為n個樣本中的速度最大值.同理,可得密度的標準化樣本數(shù)據(jù).
高速公路服務水平劃分模型中,確定劃分分類數(shù)c和模糊度參數(shù)m.根據(jù)河北省高速公路交通流的歷史數(shù)據(jù)狀態(tài)特征,將高速公路服務水平劃分為4類:{優(yōu)、良、中、差},即c=4.m為模糊度參數(shù),取m=2.
以標準化后的237 360組交通流速度、密度數(shù)據(jù)作為服務水平劃分的樣本數(shù)據(jù)集,由高速公路服務水平劃分模型,得到樣本數(shù)據(jù)的服務水平聚類中心A.圖1為樣本數(shù)據(jù)及各服務水平聚類中心示意圖.矩陣A的4行分別表示優(yōu)、良、中、差4種服務水平的聚類中心,每行的2列分別表示速度與密度.將A進行反歸一化處理,得到高速公路服務水平各分類的聚類中心矩陣A'.
圖1 基礎數(shù)據(jù)及高速公路服務水平聚類中心示意圖Fig.1 Basic data and schematic diagram of the cluster center of the highway service level center
利用高速公路服務水平判別參數(shù)預測模型進行參數(shù)預測時,考慮月、日、小時、分鐘、天氣、出行日期、速度和密度等多維因素.從出行日期特征及天氣角度選取2016年11月1日(工作日)、11月6日(非工作日)全天,周期為5 min的數(shù)據(jù)作為的預測數(shù)據(jù)集.每個觀測站576組數(shù)據(jù),10個觀測站共計5 760組數(shù)據(jù).表2為某高速公路某觀測站的預測數(shù)據(jù).
表2 某高速公路某觀測站預測數(shù)據(jù)Table 2 The forecasted data of an observation station of a highway
根據(jù)高速公路服務水平判別參數(shù)預測模型獲得某觀測站576組高速公路服務水平參數(shù)速度、密度預測值.選用平均絕對偏差(MAD)和平均絕對百分比誤差(MAPE)評價模型的預測性能.表3為工作日與非工作日高速公路服務水平參數(shù)預測誤差.圖2為工作日速度預測結果與實際變化趨勢圖,誤差為MAD=4.95,MAPE=7.18%;圖3為工作日密度預測結果與實際變化趨勢圖,誤差為MAD=2.55,MAPE=18.35%;圖4為非工作日速度預測結果與實際變化趨勢圖,誤差為MAD=4.68,MAPE=5.92%;圖5為非工作日密度預測結果與實際變化趨勢圖,誤差為 MAD=3.85,MAPE=20.92%.速度的平均誤差MAD=6.00,MAPE=8.83%;密度的平均誤差 MAD=1.56,MAPE=11.70%.由此,工作日和非工作日得到的速度與密度預測結果曲線均與實際變化曲線基本吻合,整體變化趨勢與實際值相符,預測效果較好,驗證了所提出預測模型的有效性.
利用高速公路服務水平參數(shù)和高速公路服務水平各個聚類中心,根據(jù)高速公路服務水平判別模型,獲得2 880組工作日和2 880組非工作日的服務水平預測值.表4和表5分別為某高速公路某觀測站工作日和非工作日服務水平判別預測數(shù)據(jù).為了更好地展示結果的多樣性,本文在同一觀測站2016年11月22日(工作日,小雪)的全天,周期為5 min的數(shù)據(jù),共288組,進行高速公路服務水平的預測和判別.因當天為小雪天氣,對人們的出行質量會產生一定的影響,預測的整體服務水平偏低.最終的結果展示在表6中,過程同上.
表3 工作日與非工作日高速公路服務水平參數(shù)預測誤差Table 3 The forecasted errors of service level parameters of highway on working and non-working day
圖2 工作日速度預測值與實際變化趨勢圖Fig.2 Variation tendency diagram of the forecasted and actual velocity on workday
圖3 工作日密度預測值與實際變化趨勢圖Fig.3 Variation tendency diagram of the forecasted and actual density on workday
圖4 非工作日速度預測值與實際變化趨勢圖Fig.4 Variation tendency diagram of the forecasted and actual velocity on non-workday
圖5 非工作日密度預測值與實際變化趨勢圖Fig.5 Variation tendency diagram of the forecasted and actual density on non-workday
表4 某高速公路某觀測站工作日服務水平預測數(shù)據(jù)Table 4 The forecasted data of service level of an observation station of a highway on working day
表5 某高速公路某觀測站非工作日服務水平預測數(shù)據(jù)Table 5 The forecasted data of service level of an observation station of a highway on non-working day
表6 某高速公路某觀測站11月22日服務水平預測數(shù)據(jù)Table 6 The forecasted data of service level of an observation station of a highway on Nov.22nd
基于大量交通流監(jiān)測數(shù)據(jù)的實時高效的高速公路服務水平預測,對提高出行服務質量和高效交通管理控制策略具有重要的理論價值和實踐意義.本研究基于多維交通大數(shù)據(jù),提出了高速公路服務水平劃分模型、判別參數(shù)預測模型,進而構建了高速公路服務水平實時判別模型.以河北省高速公路數(shù)據(jù)為例,驗證了高速公路服務水平實時判別及預測模型的有效性.