楊 帆,楊曉光,云美萍
(同濟(jì)大學(xué) 道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,上海 201804)
行程時(shí)間是表征路段服務(wù)水平的重要特征之一,城市道路間斷流行程時(shí)間由于受到信號(hào)交叉口延誤等因素的影響,呈現(xiàn)與連續(xù)流行程時(shí)間不同的特征.一般而言,連續(xù)流行程時(shí)間分布呈現(xiàn)單峰、右偏的分布特征,多以對(duì)數(shù)正態(tài)分布或Burr分布作為連續(xù)流的行程時(shí)間擬合分布[1-5].單峰分布模型已經(jīng)被驗(yàn)證能夠很好地描述高速公路及快速路的行程時(shí)間特征.在城市內(nèi)部道路網(wǎng)中,定義上游交叉口出口道至下游交叉口出口道為典型路段,則路段的行程時(shí)間會(huì)受到道路線型設(shè)計(jì),以及交叉口延誤等待而呈現(xiàn)出間斷流的特征,主要體現(xiàn)在:在相似的外界交通環(huán)境條件下,路段行程時(shí)間分布方差較大.從宏觀統(tǒng)計(jì)學(xué)的角度而言,必然有一定概率的出行者由于延誤而以較長(zhǎng)時(shí)間通過(guò)路段,因此,間斷流的行程時(shí)間通常呈現(xiàn)出雙波峰特征.Taylor等[6]進(jìn)一步對(duì)澳大利亞阿德萊德市兩條城市主干道的行程時(shí)間數(shù)據(jù)進(jìn)行分析,得出該行程時(shí)間表征出正偏、長(zhǎng)尾的特征,并存在雙波峰(bimodality)的特性,并在此基礎(chǔ)上用Burr XII型分布來(lái)對(duì)路段形成時(shí)間和路徑行程時(shí)間進(jìn)行了擬合模型研究.同時(shí),通過(guò)用兩個(gè)單波峰(unimodal)分布的加權(quán)模型來(lái)推導(dǎo)出路段行程時(shí)間的雙波峰分布,取得了不錯(cuò)的擬合效果.其研究成果表明,即使在連續(xù)流狀態(tài)下,行程時(shí)間分布也是有一定概率呈現(xiàn)出雙峰分布的特征.Jintanakul等[7]利用貝葉斯混合模型對(duì)高速公路行程時(shí)間分布進(jìn)行了研究.其假設(shè)行程時(shí)間由兩個(gè)正態(tài)分布的混合分布組成,用“快速部分”和“慢速部分”來(lái)歸類快速行程時(shí)間樣本及慢速行程時(shí)間樣本.Ji等[8]利用美國(guó)CABS(the campus area bus service) 的 公 交 AVL(automatic vehicle location)數(shù)據(jù),在Jintanakul等人的研究基礎(chǔ)上,利用分層貝葉斯混合模型對(duì)城市路段行程時(shí)間進(jìn)行估計(jì).結(jié)果表明,該模型可以較好地描述路段行程時(shí)間的雙波峰特性.但總體而言,對(duì)于城市間斷流行程時(shí)間特征分布的研究目前還較少.更重要的是,間斷流的行程時(shí)間受到如路段交通狀況、下游交叉口延誤以及高峰平峰等因素的影響,并非一個(gè)固定的雙波峰聯(lián)合分布的情況.因此,本文將以南京市RFID(radio frequency identification)數(shù)據(jù)為基礎(chǔ),分析城市間斷流路段行程時(shí)間宏觀分布特征,針對(duì)具體的交通流特征選擇合理的聯(lián)合分布模型.本文仍以較為公認(rèn)的正態(tài)分布和對(duì)數(shù)正態(tài)分布對(duì)行程時(shí)間分布進(jìn)行擬合,用最小二乘法擬合分布參數(shù),最后對(duì)路段行程時(shí)間特性進(jìn)行定性定量分析.
本文采用最小二乘法對(duì)城市間斷流行程時(shí)間分布進(jìn)行擬合,建立凸規(guī)劃問(wèn)題,利用Frank-Wolfe算法得到路段雙峰行程時(shí)間分布函數(shù)及各參數(shù).在此基礎(chǔ)上,通過(guò)對(duì)這些參數(shù)的分析研究對(duì)路段交通狀態(tài)進(jìn)行評(píng)估.
RFID數(shù)據(jù)是以無(wú)線射頻技術(shù)為基礎(chǔ),以射頻標(biāo)簽與路側(cè)接收器的通訊來(lái)獲取車(chē)輛的信息數(shù)據(jù).目前在南京主城區(qū)已經(jīng)有超過(guò)55個(gè)主干道路段布設(shè)有RFID檢測(cè)器,全市有超過(guò)70萬(wàn)輛汽車(chē)安裝有RFID標(biāo)簽(南京市汽車(chē)保有量為117萬(wàn)輛),對(duì)于每個(gè)路段的車(chē)輛采樣率均在80%以上.圖1為RFID設(shè)備布設(shè)的示意圖及RFID行程時(shí)間樣本分布圖.RFID設(shè)備可以采集通過(guò)該斷面的所有裝有RFID標(biāo)簽的車(chē)輛的信息,包括加密后的車(chē)牌信息、通過(guò)該斷面的時(shí)間、車(chē)輛信息等.對(duì)于本研究而言,車(chē)輛連續(xù)通過(guò)上下游兩個(gè)斷面的時(shí)間是主要參數(shù),通過(guò)該數(shù)據(jù)可以推出該車(chē)輛通過(guò)該路段所花費(fèi)的行程時(shí)間.行程時(shí)間樣本分布也明顯體現(xiàn)出雙波峰特性,并且呈現(xiàn)出不同的雙峰分布形狀.本文對(duì)不同的分布進(jìn)行參數(shù)擬合,以更好地表述每一個(gè)路段的行程時(shí)間分布函數(shù).
圖1 南京RFID數(shù)據(jù)行程時(shí)間概念圖及概率分布圖Fig.1 Figures of interrupted travel time and possibility distributions based on RFID data in Nanjing
根據(jù)行程時(shí)間分布的不同形狀特征,以及雙峰模型的概念,城市間斷流行程時(shí)間的概率分布通式如式(1)所示.
式中:f1(x)為第一概率密度函數(shù)(簡(jiǎn)稱第一子分布);f2(x)為第二概率密度函數(shù)(簡(jiǎn)稱第二子分布);f(x)為雙峰分布的概率分布函數(shù);F1(x)為第一累積分布函數(shù);F2(x)為第二累積分布函數(shù);F(x)混合分布的累積分布函數(shù);λ為權(quán)重系數(shù).
本文將具體地通過(guò)6種情形的分析,對(duì)行程時(shí)間分布參數(shù)進(jìn)行擬合.6種情形分別為:正態(tài)分布(用N表示)、對(duì)數(shù)正態(tài)分布(用LogN表示)、對(duì)數(shù)正態(tài)分布+對(duì)數(shù)正態(tài)分布(用LogN_LogN表示)、對(duì)數(shù)正態(tài)分布+正態(tài)分布(用LogN_N表示)、正態(tài)分布+對(duì)數(shù)正態(tài)分布(用N_LogN表示)和正態(tài)分布+正態(tài)分布(用N_N表示).參數(shù)擬合的目標(biāo)是為了讓擬合后的函數(shù)與實(shí)測(cè)的樣本之間誤差最小,因此以最小二乘法的概念建立各擬合模型.
用正態(tài)分布或?qū)?shù)正態(tài)分布對(duì)行程時(shí)間分布進(jìn)行擬合較為簡(jiǎn)單.其模型如式(2)和式(3)所示.
式中:Tmax和Tmin分別表示行程時(shí)間樣本中的最大值和最小值;μ和σ2為概率分布的兩個(gè)參數(shù),根據(jù)特定分布具有特定的含義;xi為行程時(shí)間樣本;p(xi)為xi所在的行程時(shí)間區(qū)間值在全樣本中所占的比例.
單一正態(tài)分布和對(duì)數(shù)正態(tài)分布模型是在式(1)中令λ=0(或λ=1)而得的特殊情況.區(qū)別在于,在對(duì)數(shù)正態(tài)分布模型中,為了滿足概率密度函數(shù)為右偏曲線,σ2為0到1之間的數(shù).另外,對(duì)數(shù)正態(tài)分布中的均值μ為行程時(shí)間樣本統(tǒng)一取對(duì)數(shù)以后得到的正態(tài)分布樣本的均值,因此在約束集中需要在上下界處分別取自然對(duì)數(shù)值作為其約束范圍.
LogN_N分布的擬合模型如式(4)所示.
式中:γ為權(quán)重系數(shù);C2為雙峰模型的第二個(gè)波峰值.約束4是由正態(tài)分布的特性所得,如圖2所示.如樣本服從正態(tài)分布,則約68.3%數(shù)值分布在距離平均值有1個(gè)標(biāo)準(zhǔn)差之內(nèi)的范圍,約95.4%數(shù)值分布在距離平均值有2個(gè)標(biāo)準(zhǔn)差之內(nèi)的范圍,以及約99.7%數(shù)值分布在距離平均值有3個(gè)標(biāo)準(zhǔn)差之內(nèi)的范圍.稱為“68-95-99.7法則”或“經(jīng)驗(yàn)法則”.因此,以此約束來(lái)界定方差的范圍.
圖2 正態(tài)分布特性及其在行程時(shí)間分布中的應(yīng)用Fig.2 Normal distribution features and its application to travel time distribution
類似地,其他3類聯(lián)合分布模型,LogN_LogN,N_LogN以及N_N模型也可以以此方式建模,如式(5)~(7)所示.如圖3所示,C1為雙峰分布的第一個(gè)波峰,C2為雙峰分布的第二個(gè)波峰,p1,p2分別是雙峰分布兩個(gè)模數(shù)處對(duì)應(yīng)的概率密度函數(shù)的概率值,M1,M2分別兩個(gè)模數(shù)處對(duì)應(yīng)的累積分布函數(shù)的概率值.可以看出,此6種情形的模型均為凸規(guī)劃問(wèn)題.目標(biāo)函數(shù)為一個(gè)凸函數(shù),而約束集為線性約束集(需適當(dāng)將變量進(jìn)行調(diào)整,如在式(6)中,需令y1=lnμ1,則可以將約束轉(zhuǎn)化為線性約束).因此,可以用凸規(guī)劃求解算法對(duì)其進(jìn)行求解.
圖3 雙峰分布模型及其參數(shù)Fig.3 Bimodal distribution and its parameters
Frank-Wolfe算法是經(jīng)典的凸規(guī)劃問(wèn)題求解算法,其基本思路是從一個(gè)初始解出發(fā),尋找目標(biāo)函數(shù)最優(yōu)下降方向,并沿此最優(yōu)方向?qū)ふ易顑?yōu)步長(zhǎng),進(jìn)行最優(yōu)解的優(yōu)化,直到目標(biāo)函數(shù)達(dá)到最優(yōu).Frank-Wolfe算法多用于交通規(guī)劃中的用戶均衡分配問(wèn)題,而本問(wèn)題為普適性的凸規(guī)劃問(wèn)題,因此求解過(guò)程與交通規(guī)劃中的Frank-Wolfe算法略有不同.以LogN_N模型為例,介紹具體的Frank-Wolfe算法的求解過(guò)程,其他模型求解與其基本相同.
步驟3(尋找最優(yōu)步長(zhǎng)):建立線性模型如式(10)所示,用單純性法求該模型的最優(yōu)解為y(n).該步驟與傳統(tǒng)交通規(guī)劃中的步驟不同.在傳統(tǒng)交通規(guī)劃中,在初始流量加載的基礎(chǔ)上,尋求到的最短路徑即為該線性模型的最優(yōu)解.但更廣泛意義上來(lái)說(shuō),F(xiàn)rank-Wolfe算法需要對(duì)x(n)處進(jìn)行廣義線性規(guī)劃問(wèn)題求解,以得到最優(yōu)解的優(yōu)化方向.
用黃金分割法求最優(yōu)步長(zhǎng)α.求最優(yōu)步長(zhǎng)α使得目標(biāo)函數(shù)Z(x(n)+αy(n))最大.
步驟4(迭代更新).如果|Z(x(n-1)+αy(n-1))-Z(x(n)+αy(n))|<ε(收斂閾值),則停止迭代,得到最優(yōu)解及最優(yōu)目標(biāo)函數(shù);否則更新最優(yōu)解,令x(n)=x(n)+αy(n),返回步驟2,重新更新計(jì)算.
選取南京市若干個(gè)主要路段進(jìn)行數(shù)據(jù)擬合分析,結(jié)果見(jiàn)表1,表2.表1為路段基本信息,其中B_ID是路段上游RFID點(diǎn)位ID,E_ID為路段下游RFID點(diǎn)位ID.表2為最優(yōu)擬合模型及參數(shù),其中用SECTION_ID來(lái)表述某一具體的路段,如“62456243”代表“中山南路南向北(金沙井到府西街)”.圖4是6種組合分布的具體擬合情況.
表1 路段基本信息Tab.1 Section_basic_information
表2 各路段行程時(shí)間最優(yōu)擬合模型及參數(shù)Tab.2 The optimized fitting model and its parameters of each section travel timefitting
圖4 6種不同類型的模型擬合曲線及樣本分布圖Fig.4 Fitting curves and sample distribution of six models
圖5 雙正態(tài)分布及對(duì)應(yīng)的雙峰分布Fig.5 Two normal distributions and bimodal distributions
本文基于對(duì)數(shù)正態(tài)分布和正態(tài)分布,提出了6類不同的行程時(shí)間概率分布的單峰模型和雙峰模型.以南京市RFID數(shù)據(jù)為基礎(chǔ),對(duì)實(shí)際行程時(shí)間分布進(jìn)行了模型和參數(shù)的擬合,并分析了雙峰模型對(duì)于城市行程時(shí)間描述的內(nèi)涵.從廣義的角度而言,本文提出的是一種理念和方法,并使用了正態(tài)分布和對(duì)數(shù)正態(tài)分布作為具體的分布函數(shù)進(jìn)行擬合,目的是利用這兩種合理并且擬合度較高的分布來(lái)印證本文對(duì)于間斷流行程時(shí)間雙峰分布的假設(shè)和研究,但并不表示所有的路段都可以用這兩種分布來(lái)描述.因此,在后續(xù)研究中,可以利用其他分布,如Burr分布等,尋求其他的組合,以提高擬合的精度.
間斷流雙峰分布特性為間斷流行程時(shí)間可靠性分析提供了新的思路.傳統(tǒng)的可靠性指標(biāo),如BI(buffer index)等,均是基于連續(xù)流行程時(shí)間樣本獨(dú)立同分布的特性.在間斷流條件下,則需要區(qū)分快速流和慢速流部分的行程時(shí)間樣本,并重新定義符合間斷流行程時(shí)間可靠性的一些指標(biāo),用以評(píng)估城市間斷流路段通行質(zhì)量.此外,本研究成果也驗(yàn)證了在城市道路路徑選擇、流量分配等環(huán)節(jié)中,不能簡(jiǎn)單地以傳統(tǒng)最短路徑算法來(lái)搜索路徑,而應(yīng)該基于城市間斷流行程時(shí)間概率函數(shù)來(lái)尋找可行路徑集,這將是本文的后續(xù)研究方向之一.
[1]Wardrop J G.Some theoretical aspects of road traffic research[J].Proceedings of the Institution of Civil Engineers,1952,1(2):325.
[2]Herman R,Lam T.Trip time characteristics of journeys to and from work[C]∥Proceedings of the 6th International Symposium on Transportation and Traffic Theory.Sydney:University of New South Wales,1974:57-86.
[3]Richardson A J,Taylor M A P.Travel time variability on commuter journeys [J].High Speed Ground Transportation Journal,1978,12(1):77.
[4]Polus A.A study of travel time and reliability on arterial routes[J].Transportation,1979,8(2):141.
[5]Al-Deek H,Emam E B.New methodology for estimating reliability in transportation networks with degraded link capacities[J].Journal of Intelligent Transportation Systems,2006,10(3):117.
[6]Taylor M A P,Somenahalli S.Travel time reliability and the bimodal travel time distribution for an arterial road[J].Road &Transport Research,2010,19(4):37.
[7]Jintanakul K,Chu L,Jayakrishnan R.Bayesian mixture model for estimating freeway travel time distributions from small probe samples from multiple days[J].Transportation Research Record,2009,2136:37.
[8]Ji Y,Zhang H M.Travel time distributions on urban streets:their estimation with a hierarchical Bayesian mixture model and application to traffic analysis using high-resolution bus probe data[C/CD]∥ 92th Transportation Research Board.Washington D C:TRB,2013.