邵長橋, 郭 杰, 劉小明
(北京工業(yè)大學交通工程北京市重點實驗室, 北京 100124)
密度- 速度、密度- 流量、速度- 流量關系被稱為交通流基本模型,其在交通流理論研究和應用中具有重要的作用. 一是可以通過建立交通流模型來刻畫交通流運行規(guī)律,為交通預測和控制提供方法;二是可以根據交通流模型對交通流特征參數進行估計,例如應用基本圖模型估計道路設施通行能力、臨界速度等[1],為交通規(guī)劃和運行分析提供基礎參數. 正是鑒于交通流基本模型的重要性,研究人員在交通流模型和模型參數標定方面進行了大量研究,不斷地尋求預測或估計精度更高的建模方法. 最早的交通流模型可以追溯到格林息爾治提出的線性密度- 速度模型[2]. 其后,研究人員提出了眾多交通流模型,并不斷用觀測數據對交通流模型進行驗證,以選擇出更好的模型[3-12]. 一方面,研究人員通過引入更多的參數來提高模型的靈活性和適用性,如Van Aerde等[10]在速度- 車頭間距(密度)模型中引入了4個參數,Wang等[11]在密度- 速度曲線模型中引入了5個參數. 另一方面,研究人員對單結構模型提出了質疑,認為其不能同時刻畫非擁堵和擁堵狀態(tài)下交通流特性,并提出了分段的密度- 速度模型[13],如馬曉龍等[14]基于生長曲線原理建立了Logistic密度- 速度關系模型,并應用實測數據對模型參數進行了標定.
然而,交通流模型對數據擬合不充分的原因不僅僅是模型選擇的問題,還與模型參數估計方法以及觀測數據特征有關[13-16]. Qu等[15]認為用最小二乘方法來估計模型參數會忽視觀測數據“樣本”分布不均衡性對模型參數估計影響,提出了加權最小二乘估計方法,并進一步指出了模型與數據擬合程度不理想不僅僅是模型問題,也與觀測數據分布和估計方法有關. 張輝等[16]和林豪等[17]從提高模型對觀測數據擬合的角度,分別應用k均值聚類最小二乘方法與層次聚類最小二乘法來提高模型估計精度,研究結果說明了模型對數據擬合程度不僅與模型有關,還與參數估計方法有關. Rakha等[18]考慮了流量、速度、密度3個基本變量的觀測誤差,提出了基于全變量偏差平方和最小的估計方法,但沒有給出最優(yōu)解的理論證明,并且該方法需要開發(fā)專用算法,不便于推廣和應用. Shao等[19]綜合考慮了因變量和自變量的觀測誤差,對Van Aerde模型[10]進行了修正,并給出了模型參數的極大似然估計方法,驗證了新模型對觀測數據具有更高的擬合精度. Zhang等[20]在Qu等[15]的工作基礎上,提出了對樣本數據重構的方法來克服觀測數據不均衡性對單段交通流模型參數估計的影響. Zhang等[21]同樣考慮速度、密度觀測數據的不均衡性對密度- 速度關系模型參數估計的影響,提出了應用排序重構樣本的方法對模型參數進行了標定. Neila等[22]考慮了擁堵和非擁堵狀態(tài)下交通數據的散布情況,提出了基于數據特征的交通流基本圖模型參數標定方法.
通過文獻查閱發(fā)現,已有的宏觀交通流模型以及參數估計更多地考慮了單一模型(即密度- 速度、密度- 流量和速度- 流量關系模型中的一個)的估計精度問題[15-20],僅有少數的文獻注意到三者之間的內在關系對模型參數估計的影響[23-24],特別是其衍生模型估計和預測精度下降問題. Duncam[23]注意到了基于經驗的密度- 速度關系模型變換得到的速度- 流量模型存在擬合精度下降現象問題,但沒有給出解決方法. Castillo[24]在對密度- 速度模型參數標定時,考慮了密度- 流量模型擬合優(yōu)度問題,但沒有對模型參數估計效果進行論證;沒有考慮速度、流量的量綱對模型參數估計的影響. 正是鑒于上述問題,本文假定速度、流量、密度中一個變量為自變量,另兩個變量為因變量,提出了聯合模型參數估計方法,構造了優(yōu)化目標函數,并基于Castillo-Benítez、Van Aerde模型和實測數據驗證了聯合模型參數估計方法可提高模型對實測數據的擬合精度.
為了刻畫交通流動態(tài)特性,Lighthill、Whitham和Richards根據流體力學理論和流量守恒定律提出了著名的LWR模型[25-26].
(1)
并且滿足基本關系式
q=k·v
(2)
式中:q為流量,輛/h;k為密度,輛/km;v為區(qū)間平均速度.
研究表明,連續(xù)流設施的交通流存在平衡狀態(tài)[9],其速度- 密度關系可以用連續(xù)函數[2-11]表示
v=f(k,β)
(3)
式中:f(k,β)為密度函數;β為模型參數(或參數向量).由式(2)(3)可以得到密度- 流量關系式
q=f1(k,β)
(4)
式中f1(k,β)=k·f(k,β).在實際應用中,往往會出現這樣的問題:由觀測數據(ki,vi)(i=1,2,…,n)估計理論模型(3)中參數β(其估計用表示),把代入模型(4)可得到的經驗模型q=f1(k,),但q=f1(k,)對實測數據擬合程度較低.其主要原因是是基于速度- 密度(v-k)關系模型估計的,并沒有考慮密度- 流量(q-k)關系.
由式(3)可得到速度- 密度關系模型:k=f-1(v,β)(f-1(·)為f(·)的逆函數),把其代入式(2)則可得到記q=v·f-1(v,β).記f2(v,β)=v·f-1(v,β),則速度- 流量(q-v)模型可表示為
q=f2(v,β)
(5)
傳統的交通流模型參數標定主要是采用最小二乘法(包括非線性最小二乘法),優(yōu)化目標為因變量觀測數值與其估計值的總偏差平方和最小.為了敘述的方便,本文先介紹單一模型優(yōu)化目標函數,然后再給出聯合模型優(yōu)化目標函數的構造方法.
單一模型參數優(yōu)化目標函數法就是選擇式(3)(4)或式(5)中的一個模型對參數標定,然后應用q=k·v求出另外1個或2個關聯模型.根據自變量和因變量的選擇,可分為以下3種情形.
1) 流量總偏差平方和最小
一般用于速度- 流量或密度- 流量宏觀模型參數估計.模型假設速度v或密度k為自變量,交通流量q為因變量,其優(yōu)化目標和約束條件為
(6)
s.t.qi=f1(ki,β),i=1,2,…,n
(7a)
或
s.t.qi=f2(vi,β),i=1,2,…,n
(7b)
式中:qi、i分別為流量的第i觀測值與估計值;ki為密度的第i觀測值;vi為速度的第i觀測值;f1(·)、f2(·)分別為密度- 流量函數、速度- 流量函數;β為模型參數.應用式(6)作為優(yōu)化目標,其假設誤差主要來自于因變量q,而自變量v或k是可精確測量或測量誤差是可忽略的.
2) 速度總偏差平方和最小
一般用于流量- 速度或密度- 速度宏觀模型參數估計.模型假設k或q為自變量,v為因變量,基于最小二乘法的參數估計優(yōu)化目標函數和約束條件為
(8)
s.t.vi=f(ki,β),i=1,2,…,n
(9a)
或者
(9b)
式中:vi、i分別為速度的第i觀測值與估計值;f(·)、f2(·)分別為密度- 速度函數、速度- 流量函數;β為模型參數.
同樣,應用式(8)作為優(yōu)化目標,則只考慮了因變量v的觀測誤差,而忽略了自變量k或q的觀測誤差.
3) 密度(車頭間距)總偏差平方和最小
該方法常用于標定基于跟馳理論導出的速度- 密度關系模型[19],其假設密度(或車頭間距)為因變量,速度為自變量.優(yōu)化目標函數和約束條件為
(10)
s.t.ki=f-1(vi,β),i=1,2,…,n
(11a)
或
(11b)
式中ki、i分別為密度的第i觀測值與估計值.
單一模型參數優(yōu)化方法的特點是模型中只有一個自變量和一個因變量,并假設誤差主要是來自于因變量.其優(yōu)點是模型參數標定方法相對簡單,其不足是參數估計過程忽略了變量之間關聯性,沒有考慮衍生模型或變換模型的估計精度[24].
針對單一模型參數優(yōu)化方法存在的不足,可考慮聯合模型參數優(yōu)化方法.例如,文獻[26]假定速度v、流量q是密度k的函數:v=f(k,β),q=k·f(k,β),建議對k-v模型v=f(k,β)進行參數估計時,同時考慮k-q模型q=k·f(k,β)的估計精度.根據速度、流量、密度三者關系以及模型參數估計需要,構建聯合模型參數優(yōu)化目標函數
(12a)
s.t.vi=f(ki,β),i=1,2,…,n
qi=f1(ki,β)
或
(12b)
s.t.vi=f(ki,β),i=1,2,…,n
qi=f1(ki,β)
或
(12c)
或
(12d)
式(12a)和式(12b)是把密度作為自變量,流量和速度作為因變量,采用了2個因變量總的偏差和作為優(yōu)化目標;式(12c)和式(12d)采用了2個因變量總的偏差和的幾何平均值為優(yōu)化目標,在后文中會發(fā)現,可利用式(2)對式(12a)和式(12b)進一步化簡.式(12a)和式(12c)沒有考慮不同變量量綱的影響,式(12b)和式(12d)考慮了數據量綱的影響.同樣,以速度作為自變量,流量和密度作為因變量來構造聯合模型參數優(yōu)化目標函數.
注意到qi=kivi和i=kii,式(12d)可進一步表示為
(13)
從上面給出的優(yōu)化目標函數可發(fā)現,式(6)~(10)是以單個交通流變量估計精度作為模型參數估計準則,沒有考慮密度、速度、流量3個變量之間的相關性;式(12a)~(12d)以2個交通流變量估計精度作為模型估計準則,考慮了流量、速度、密度三者之間的關聯性.特別地,優(yōu)化目標函數式(12d)可以結合加權最小二乘方法對模型參數進行估計.
同樣的方法可以以速度為自變量,流量和密度為自變量構造優(yōu)化目標函數,其將在案例分析中介紹.
本研究以Castillo-Benítez模型[9]和Van Aerde模型[10]參數標定為例來說明單一模型、聯合模型參數優(yōu)化方法對模型估計精度的影響.Castillo-Benítez模型首次引入了阻塞波波速來刻畫擁堵對交通流的影響而受到關注[9],Van Aerde模型概括了Greenshields模型和Pipes模型的優(yōu)點,并適用于刻畫不同的交通設施的交通特性[27].
Castillo-Benítez密度- 速度模型[9]為
(14)
式中:vf為自由流速度,km/h;kj為阻塞密度,輛/km;wj為阻塞波波速,km/h.根據模型式(14)的特點,采用聯合模型參數優(yōu)化目標函數
(15a)
s.t.qi=kii,i=1,2,…,n
正如前所敘述,式(15a)可進一步表示為
(15b)
(15c)
Van Aerde模型[10]為
(16)
(17a)
s.t.i=ivi,i=1,2,…,n
(17b)
(17c)
根據上邊的論述,模型(14)與模型(16)的優(yōu)化目標函數分別為式(15c)和式(17c),可以采用模型變換的方式,將問題轉化為非線性最小二乘估計問題.
在回歸分析理論中,常用判定系數R2來度量模型對觀測數據的擬合程度,R2值越大,說明模型對觀測數據擬合程度越好.為了說明聯合優(yōu)化函數式(15a)和式(17a)或式(15b)與式(17b)對模型擬合效果的影響,本研究應用加權判定系數度量模型擬合優(yōu)度,定義加權判定系數為
(18)
(19)
(20)
式中:vi、i分別為速度觀測值和估計值,km/h;qi、i分別為流量觀測值和估計值,輛為實測速度均值,為實測流量數據的均值,輛/h.
判定系數度量了模型對觀測數據的擬合程度.為了進一步量化模型估計精度,并考慮到交通流觀測數據的隨機性,本文同時應用平均相對誤差(mean absolute percentage error,MAPE)和平方根誤差(root mean squared error,RMSE)來度量觀測值和估計值差異[28],式(21)、式(22)分別給出了流量估計的平均相對誤差估計和平方根誤差計算公式.
(21)
(22)
同樣,可以給出速度、密度估計的平均絕對百分比誤差和平方根誤差.平均絕對百分比誤差越小,說明模型對變量估計精度越高.
為了比較單一模型和聯合模型參數優(yōu)化方法對交通流宏觀模型參數估計的影響,分別應用實測數據對Castillo-Benítez和Van Aerde模型進行參數估計.所用數據由北京市交通管理局提供,其為北京市西二環(huán)路官員橋附近主路微波檢測數據.數據采集時間為2017年11月13—15日,數據采集間隔為2 min.應用SAS軟件[29]中的非線性回歸分析模塊中的Levenberg-Marquart方法對模型參數進行了估計,為了說明聯合模型估計效果,同時也給出了單一模型參數估計結果.表1、2分別是2個模型采用單一模型、聯合模型參數優(yōu)化方法給出的模型參數估計結果.
表1 Castillo-Benítez模型參數估計結果比較
2) 對于Castillo-Benítez模型而言,單一模型優(yōu)化結果對應的速度估計與流量估計MAPE分別為19.8%和18.7%,速度和流量估計的RMSE分別為6.7 km/h和181.0輛/h;相應的聯合模型優(yōu)化計算的速度和流量估計MAPE為10.0%和10.0%,速度和流量估計的RMSE分別為7.3 km/h和167.3 輛/h.因此,對于Castillo-Benítez模型而言,聯合估計在一定程度上犧牲了原來單一模型給出的速度估計精度,但提高了流量估計精度,速度的RMSE從6.7 km/h提高為7.3 km/h,流量RMSE從181.0 輛/h減少到167.3 輛/h.
表2 Van Aerde模型參數估計結果比較
3) 圖1給出了基于標定的Castillo-Benítez模型估計的交通流參數與實測數值散點圖.其中,圖1(a)和圖1(b)是基于單一優(yōu)化模型估計得到的速度和流量估計值與實測數值散點圖,可以發(fā)現估計值與實測值擬合程度并不理想;圖1(c)和圖1(d)分別是應用聯合模型計算的速度和流量估計值與實測數值散點圖;圖1(e)和圖1(f)分別是應用單一模型與聯合模型計算的密度- 速度、密度- 流量估計值與實測數值對比散點圖.由圖1可以發(fā)現,相對于單一優(yōu)化模型估計而言,聯合模型優(yōu)化方法得到的估計值與實測值擬合程度改善明顯,特別是對于高密度交通狀態(tài)下,聯合估計結果與實測數據更接近.
圖1 基于Castillo-Benítez模型的變量估計值和實測值散點圖Fig.1 Plots of field data and estimated value from Castillo-Benítez model
5) 對于Van Aerde模型而言,單一模型優(yōu)化法計算的密度和流量MAPE分別為16.4%和16.3%,密度和流量估計的RMSE分別為9.0輛/h 和 684.0輛/h;聯合模型優(yōu)化法計算MAPE值為14.2%和14.2%,密度和流量估計的RMSE數值分別為9.7 輛/km和387.5 輛/h.因此,對于Van Aerde模型而言,聯合估計在一定程度上“犧牲”了原來單一模型給出的密度估計精度,密度RMSE從9.0 輛/km提高為9.7 輛/km,但提高了流量估計精度,流量RMSE從684.0 輛/h減少到387.5 輛/h.
6) 圖2給出了基于標定的Van Aerde模型估計的交通流參數與實測數值散點圖.其中,圖2(a)和圖2(b)分別為單一模型優(yōu)化法估計的密度和流量值與實測值散點圖,圖2(c)和圖2(d)分別為聯合模型優(yōu)化法估計的密度和流量值與實測數值散點圖,圖2(e)和圖2(f)分別是應用單一模型與聯合模型計算的速度- 密度、速度- 流量估計值與實測數值對比散點圖.由圖2可知,相對于單一模型而言,聯合模型參數估計值與實測值擬合程度稍有改善,但與Castillo-Benítez模型估計結果不同的是,對于非擁堵狀態(tài)下,聯合模型估計結果與實測數據更接近.
圖2 基于Van Aerde模型的變量估計值和實測值散點圖Fig.2 Plots of field data and estimated value from Van Aerde model
從以上結果可以發(fā)現,對Castillo-Benítez模型而言,聯合模型參數估計方法顯著提高了流量的估計精度;對于Van Aerde模型而言,模型精度有所提高,參數估計誤差有所改善.
1) 從聯合模型估計精度角度,提出了交通流基本模型聯合模型參數估計方法.
2) 研究結果表明,估計聯合模型參數估計方法在一定程度上“犧牲”單一變量估計精度的基礎上,但提高了模型整體的估計精度.
3) 從實測數據驗證結果來看,模型估計精度的提高與模型選擇有關,這也說明了模型選擇和參數估計方法影響了模型對實測數據擬合精度.
4) 聯合模型估計效果評價指標還需要進一步研究.本研究只討論了給定的交通流模型以及目標函數形式下模型估計效果,沒有討論其他交通流模型以及目標函數,以后的研究中可進一步考慮優(yōu)化目標、參數估計方法對交通流模型參數估計精度的影響.