譚倩,李遠東,李旺
(1. 中南大學(xué) 交通運輸工程學(xué)院,湖南 長沙410075;2. 長沙海信智能系統(tǒng)研究院有限公司,湖南 長沙410208;3. 長沙理工大學(xué) 交通運輸工程學(xué)院,湖南 長沙410004)
公交客流分配,是交通系統(tǒng)規(guī)劃、設(shè)計與運營管理中至關(guān)重要的一環(huán),主要任務(wù)是分析公交乘客在出行中的路徑選擇行為,而出行時間、費用、舒適性等是影響公交乘客選擇路徑的關(guān)鍵因素。隨著公交系統(tǒng)的智能化以及公交信息化技術(shù)的普遍應(yīng)用[1?5]。公交GPS 數(shù)據(jù)、公交站IC 卡刷卡數(shù)據(jù)可更好的記錄公交乘客出行信息,為城市公交阻抗分析提供了一種更可行和科學(xué)的途徑[6?9]。城市公交網(wǎng)絡(luò)復(fù)雜且數(shù)據(jù)繁多,傳統(tǒng)的方法獲取公交阻抗尤為不易,目前已有學(xué)者通過大數(shù)據(jù)推算公交阻抗。LIU 等[10]使用常規(guī)公交車GPS數(shù)據(jù)以及公交發(fā)車時刻表等數(shù)據(jù),提出了基于GPS 數(shù)據(jù)的公交車輛路段行程時間的推算模型;李曉丹等[11]建立了公交車輛在兩個緊鄰公交站點之間的行駛時間的回歸表達式,并對公交車輛行程時間進行短時預(yù)測;胡郁蔥等[12]采用數(shù)據(jù)挖掘技術(shù),結(jié)合IC 卡獲取的信息,推算了公交出行的OD 矩陣;IDRIS 等[13]以多倫多市的公交數(shù)據(jù)為基礎(chǔ),建立了基于卡爾曼濾波算法的公交車輛行程時間的推導(dǎo)模型;湯月華[14]依據(jù)常規(guī)的地圖匹配算法,提出了一種新的投影匹配算法,將其夠用于公交行程時間的計算;在區(qū)間阻抗不確定研究方面,KHOS‐RAVI 等[15]在公交到站時間預(yù)測的研究中考慮了公交運行時間的不確定性,使用區(qū)間數(shù)的方法表示公交到站時間,結(jié)果表明考慮不確定性的預(yù)測模型具有更高的穩(wěn)定性;MAZLOUMI 等[16]提出了一種基于ANN 模型的公交車輛行程時間的不確定性估計方法,并使用墨爾本的實際公交網(wǎng)絡(luò)進行驗證;周和平等[17]等采用區(qū)間不確定性的路網(wǎng)阻抗值,并利用魯棒優(yōu)化模型、情景分析,構(gòu)建了區(qū)間不確定性阻抗下的魯棒最短路確定方法。在公交客流分配方面,ZHAO 等[18]分析了地鐵與地鐵,地鐵與公交這2種出行換乘方式下的公交客流出行路徑推導(dǎo)方法,POON 等[19]構(gòu)建了一種新的基于時間的交通網(wǎng)絡(luò)平衡分配問題的模型,并設(shè)計了算法,SHEFFI 等[20]提出了基于枚舉OD 對的一種改進的概率客流分配模型,曾鸚等[21]針對公交網(wǎng)絡(luò)換乘特性,建立了一種非平衡公交客流分配模型,設(shè)計了該模型的求解方法;基于隨機用戶均衡理論,狄迪等[22]在考慮多個變量的情況下,構(gòu)建了的城市公交走廊動態(tài)客流分配模型。TOQUE等[23]利用長?短期記憶(LSTM)遞歸神經(jīng)網(wǎng)絡(luò)預(yù)測地鐵網(wǎng)絡(luò)動態(tài)OD 矩陣。LI 等[24]提出了一種基于聚類和非線性模擬的基于親合傳播的支持向量回歸(AP-SVR)預(yù)測模型,利用支持向量回歸(SVR)方法對每個聚類的客流進行預(yù)測,并利用粒子群優(yōu)化(PSO)算法得到優(yōu)化參數(shù)??傮w來看,傳統(tǒng)的公交客流分配模型向著隨機、動態(tài)等方向發(fā)展,而以Probit模型和Log‐it模型為主的隨機概率分配模型大多缺乏交通網(wǎng)絡(luò)中不確定性因素的考慮,本文考慮公交阻抗不確性對乘客路徑選擇的影響。近年來對交通網(wǎng)絡(luò)中配流中不確定因素的度量基本上是基于概率論的統(tǒng)計分析方法和區(qū)間數(shù)法[25],本文在歷史研究基礎(chǔ)上,采用區(qū)間數(shù)的不確定性度量,利用交通大數(shù)據(jù)推導(dǎo)公交阻抗并對Logit模型進行改進,建立區(qū)間阻抗不確定的公交客流分配模型,以期為獲得更實際的公交網(wǎng)絡(luò)提供一種思路,并為改善現(xiàn)有的公交網(wǎng)絡(luò)打下基礎(chǔ)。
公交阻抗,即乘客在選擇公交線路時,需要考慮的各種不同路徑下的因素。這些因素包括行程時間、價格、換乘的方便性以及舒適性等綜合指標(biāo)。對于多數(shù)乘客而言,他們會傾向于選擇行程時間最短的公交線路。因此,可以用行程時間來表示公交的路段阻抗。公交運行時間是組成公交阻抗的關(guān)鍵部分之一,受交通擁堵、其他車輛的干擾、交叉口信號控制的影響或者其他突發(fā)事件的影響,造成車輛的運行時間隨時空波動。這導(dǎo)致同一公交線路上運行的不同公交車輛,以及同一公交車輛在不同時間的公交車輛運行時間都是變化的,這導(dǎo)致公交阻抗的許多參數(shù)是隨機的、自適應(yīng)的、時變的。
乘客在某一次的出行總時間,可由幾個方面的時間構(gòu)成,包括公交車輛在途行駛時間、乘客在公交站點候車時間、乘客換乘的懲罰時間。
運用有向圖G(V,L)來表示公交網(wǎng)絡(luò),其中V={vi|1,2,…,n}為G的節(jié)點集,V中的元素vi(i=1,2,…,n)是有向圖的節(jié)點,即公交網(wǎng)絡(luò)中的公交站點;L={lij|i,j= 1,2,…,n,i≠j}為路段的集合,lij表示從站點i到站點j的一個路段。
1) 公交車輛運行時間
公交車輛運行時間,是乘客在車時間,為公交車在公交網(wǎng)絡(luò)上的運行時間(行駛時間)以及車輛在公交站點的??繒r間之和,用式(1)表示:
式中:為公交車輛從站點r到站點s的運行時間;trun,ij為公交車輛東站點i行駛至站點j的行駛時間;tstop,i為公交車輛在站點i的??繒r間。
2) 站點候車時間
候車時間,是指乘客從達到公交站點到登上目的公交車輛中間等待的時間。有研究表明,公交乘客在站點的候車時間,服從均勻分布[26],乘客整體的平均候車時間可以取值為公交車發(fā)車間隔的1/2,即:
式中:為乘客在公交站點的等候時間;d為公交車輛的發(fā)車間隔時間;Nrs為乘客從站點到站點的出行鏈中的總的換乘次數(shù)。
3) 換乘懲罰時間
乘客選擇公交線路時傾向于直達線路,對于需要換乘的線路會降低乘客乘車體驗,故選擇該路徑的概率會降低,因此通過增加換乘懲罰時間來描述乘客這一心理行為。
式中:α和β為換乘懲罰參數(shù)。
則乘客從站點r到站點s的公交路段阻抗為:
公交阻抗受交通流量、天氣情況、或其他不確定因素的影響,即公交阻抗也具有不確定性,在客流分配時忽略公交阻抗的不確定性可能使分配結(jié)果與實際結(jié)果有較大差異。為減少公交阻抗不確定性的影響,定量準確的表述行程時間的不確定性的方法是關(guān)鍵,現(xiàn)有的描述方法較多,如情景分析法、統(tǒng)計分析法、區(qū)間數(shù)法等。
1) 情景分析法
情景分析法認為未來充滿不確定性,并可以將這種不確定性描述成幾種可能的未來情形,然后由此制定出相應(yīng)的決策方法,情景分析法著重于描述事物發(fā)展的某種規(guī)律,分析其發(fā)展的變化特性,考慮其全面性與系統(tǒng)性,但是容易出現(xiàn)過高或過低的估計未來的變化及其影響。
2) 統(tǒng)計分析法
統(tǒng)計分析法是建立在概率論或隨機過程基礎(chǔ)上的一種方法,常用的方法為蒙特卡洛法。該方法通過建立一個隨機過程模型,或概率模型,并通過對模型的抽樣觀察,計算所求參數(shù)的統(tǒng)計特征,最后得到所求解的估計值。該方法通常需要較多的計算步數(shù),計算較為繁瑣。
3) 區(qū)間數(shù)法
區(qū)間數(shù)法,即利用區(qū)間變量而不是一個確定的點變量進行分析的數(shù)學(xué)方法,利用區(qū)間描述數(shù)值的實際波動范圍,不需要額外信息,不需要額外獲得假設(shè),是對多組數(shù)據(jù)進行數(shù)值分析的有效方法。本文使用區(qū)間數(shù)法描述公交阻抗不確定性,使模型更真實更符合實際。
對 任 意 的a-,a+∈R,a-≤a+, 則[]=[a-,a+],a-為標(biāo)準的區(qū)間數(shù),其中,a+即為區(qū)間數(shù)的上限值;a-為區(qū)間數(shù)的下限值。
公交大數(shù)據(jù)主要是指通過公交數(shù)據(jù)大平臺獲取的公交乘客與車輛相關(guān)海量信息,主要包括公交智能卡刷卡數(shù)據(jù)、公交車輛行駛的定位數(shù)據(jù)以及公交站點的靜態(tài)定位數(shù)據(jù)等。
獲取公交阻抗其關(guān)鍵是計算公交車在2個站點之間的行駛時間,即確定公交車在站點的啟動時刻以及達到下一站點的時刻,對公交車GPS 數(shù)據(jù)及站點GIS數(shù)據(jù)進行處理可獲取公交車到站及離站的時刻信息。
2.2.1 數(shù)據(jù)預(yù)處理
公交車輛GPS 在接受信號的時可能會受到干擾,導(dǎo)致獲取的速度與位置數(shù)據(jù)不穩(wěn)定,從而與真實數(shù)據(jù)產(chǎn)生偏差,為減少GPS 數(shù)據(jù)偏差產(chǎn)生的影響,可將公交車輛運行的GPS 數(shù)據(jù)中車輛行駛過程中拍卡數(shù)據(jù)(經(jīng)緯度)與公交站點的所在位置的經(jīng)緯度進行配對,從而獲取公交車輛到達各個站點的時間等信息,其具體步驟如下。
Step 1:確定需匹配的路段,標(biāo)記經(jīng)緯度范圍。使用路段的4 個頂點(認為直線路段為矩形)的經(jīng)緯度值即可確定路段范圍;若路段彎曲,則需將其近似分解為多個小矩形標(biāo)記多個點的經(jīng)緯度值以此確定路段范圍。
Step 2:對車輛GPS 數(shù)據(jù)檢索,若經(jīng)緯度坐標(biāo)Ai(Xi,Yi)滿足
則初步認定該數(shù)據(jù)屬于所選路段。
Step 3:公交車輛運行方向的判定。按照時間順序,對GPS 數(shù)據(jù)進行排序,根據(jù)經(jīng)緯度標(biāo)定的位置,形成車輛運行軌跡,并可判定車輛運行方向。
Step 4:在step 2 初步選定的數(shù)據(jù)中,依次匹配GPS數(shù)據(jù):
式中:為GIS 中該路段的經(jīng)度坐標(biāo)集合;為該路段的緯度坐標(biāo)集合;Δ為進行匹配后的匹配度。
若GPS 數(shù)據(jù)滿足該匹配公式,則認為匹配成功;否則,認為匹配失敗,摒棄該數(shù)據(jù)。
2.2.2 獲取公交區(qū)間阻抗
公交車站點之間的行駛時間可表述如式(7):
式中;tAj是車輛抵達下一個站點j的時刻,tBi是車輛離開上一個站點i的時刻。
公交車GPS數(shù)據(jù)匹配到GIS數(shù)據(jù)之后,通過鎖定固定的公交車編號,對公交車行駛路徑進行推測,對比分析公交車瞬時速度為0的GPS數(shù)據(jù)和公交站點GIS信息,可獲得公交車到達站點和離開站點的時刻,流程圖如圖。
獲得公交車站點間行駛時間后,可進一步得出站點r至站點s的公交阻抗,使用區(qū)間不確定理論來度量公交阻抗不確定性,用四分位數(shù)區(qū)間表示公交阻抗,其具體步驟如下。
Step 1:對于從站點r到站點s的公交阻抗集合Trs={t1,t2,…,tn},將其按照從小到大重新排序,得到T′rs={t′1,t′2,…t′n}。
Step 2:四 分 位 數(shù)Qi的 位 置 為i(n+ 1)/4,i= 1,2,3,n為集合中數(shù)據(jù)個數(shù)。
Step 3:將數(shù)據(jù)排序獲取該數(shù)據(jù)的四分位數(shù)據(jù)(包括上四分位和下四分位)。若(n+ 1)/4 非整數(shù),可采用位置最靠近四分位數(shù)的數(shù)并取整。
Step 4:得到公交阻抗的四分位數(shù)區(qū)間[Q1,Q3]。
魯棒優(yōu)化是為了使得到的最優(yōu)解在任何可能會發(fā)生的情形下,均可符合各約束條件,同時需要保證在最不利的情形下該解仍然是最優(yōu)的。魯棒優(yōu)化的關(guān)鍵是在于通過近似轉(zhuǎn)化的方法,將原問題經(jīng)過一系列的轉(zhuǎn)化,使之成為計算多項式復(fù)雜度的凸優(yōu)化問題。其核心在于構(gòu)建與之對應(yīng)的魯棒對等模型,依據(jù)優(yōu)化基本理論將原問題轉(zhuǎn)化為魯棒對等問題并進行求解,通過計算得到魯棒最優(yōu)解。魯棒成本的概念是學(xué)者在研究區(qū)間阻抗下的網(wǎng)絡(luò)優(yōu)化問題提出的[27]。
圖1 GPS數(shù)據(jù)及GIS數(shù)據(jù)處理流程圖Fig.1 GPS data and GIS data processing flow chart
魯棒成本即最大后悔值,即在最不利情形下的后悔成本??紤]在某種情形下,所選擇的路段阻抗取最大值,即區(qū)間上界值,而未選擇的路段阻抗取最小值,即區(qū)間下界值,在最不利的情形下存在最優(yōu)路徑未被選擇,此時得到最大后悔值。
以簡單小型網(wǎng)絡(luò)說明魯棒成本的定義,該網(wǎng)絡(luò)有6 個節(jié)點,7 條路段組成,各路段阻抗的上界值與下界值均已給出。從節(jié)點1 至節(jié)點6 共有3 條路徑,各路徑的魯棒成本如表1所示。
表1 節(jié)點1至節(jié)點6魯棒成本Table 1 Robust cost of node 1 to node 6
圖2 小型網(wǎng)絡(luò)示意圖Fig.2 A small network diagram
傳統(tǒng)的出行路徑確定方法,是基于最短路的原理。在區(qū)間不確定性阻抗下,考慮到最短路的不可加性以及其區(qū)間阻抗的有效性的比較判定缺少可靠依據(jù),因此本文采用路徑的魯棒成本代替區(qū)間阻抗下的有效路徑[27?29]。
阻抗為區(qū)間值時,當(dāng)所有的路段阻抗取下界值時所得的最短路稱為下界最短路,所有的路段阻抗取上界值時所得的最短路稱為上界最短路。已知路段(i,j)的區(qū)間不確定性阻抗從站點r到站點s共有n條出行路徑,Krs表示r?s間所有路徑的集合,其中k∈Krs,第k條出行路徑的各路段區(qū)間阻抗的上界值為,得從r到s的下界最短路,則路徑k的魯本成本為:
從站點r至站點s經(jīng)過站點m,當(dāng)路段r m滿足以下3 個條件時,路段r m為區(qū)間阻抗下的有效路徑:
式中:Lrm和Lms分別為路段rm和ms的阻抗下界值;Mrm,Mms和Mrs分別為路段rm,ms和rs的阻抗上界值;Rrm為路段rm的魯棒成本。
式中:為r s的最短路的魯棒成本下界值,為rs的最短路的魯棒成本上界值,α為系數(shù),取值為α∈[0,1]。
模型假設(shè):
1)研究區(qū)域內(nèi)公交站點間的OD矩陣已獲得。
2) 公交乘客可通過多次的公交換乘,最終抵達目的地。
3) 忽略節(jié)假日、重大事件的干擾,行車間隔大于發(fā)車間隔。
4)公交OD 已經(jīng)獲取且OD 值為確定值(OD 不考慮為區(qū)間值的情況)。
多路徑Logit 模型假定乘客在選擇各條選擇的時候是彼此獨立的,即路徑選擇是不相互影響的;此外,其各個路徑選擇的概率,采用各個路徑之間的效用來表述。而Logit 認為路徑的選擇概率只由路徑之間的阻抗絕對差來決定,獲取的是不合理的交通網(wǎng)絡(luò)客流的分配結(jié)果[23]。
本文在此基礎(chǔ)上,對多路徑Logit 模型進行修改,改進后的Logit 模型的各個路徑選擇概率采用路段阻抗的相對值來描述。
假設(shè)乘客從起點r到終點s共有n條路徑可以選擇,rs間交通需求為qrs,rs間路徑k的交通流量為,則這n條路徑的區(qū)間阻抗魯棒成本分別為:則乘客選擇第k條路徑的概率可表述為:
式中:θ為參數(shù)。
且滿足:
為驗證所構(gòu)建的改進Logit 模型分配結(jié)果的有效性,可分別計算各線路分配誤差ω,整體平均分配誤差及最大誤差ωmax,通過分析比較驗證模型的優(yōu)劣。
式中:q(lc)為公交線路lc模型分配客流量;Q(lc)為公交線路lc歷史平均分配客流量。
以深圳市石巖街道區(qū)域做模型應(yīng)用區(qū)域進行實例驗算,選取該區(qū)域9條公交線路為客流分配對象,通過對2019 年7 月11 日~27 日的公交車輛GPS 數(shù)據(jù)(某線路車輛的部分GPS 數(shù)據(jù)見表2)、站點GIS 數(shù)據(jù)(某線路部分站點的GIS 數(shù)據(jù)見表3)的相匹配,可獲得每條線路上每個站點間的區(qū)間不確定阻抗值。
表2 332路車輛部分GPS數(shù)據(jù)Table 2 Part set of GPS data of 332 bus vehicles
表3 332線路站點部分GIS數(shù)據(jù)Table 3 Part set of GIS data of 332 line stops
選取分配時段是無特殊情形平峰時段中的3個小時,采用2個不同的多路徑改進Logit模型對這9條公交線路進行客流分配,其中模型A 為將區(qū)間阻抗視為確定值的分配模型,即不考慮公交阻抗的不確定性;模型B 考慮了公交阻抗的不確定性,使用四分位數(shù)區(qū)間表示各站點阻抗的區(qū)間值,采取平均公交阻抗進行計算。
取公交車發(fā)車間隔d=10 min,每個站點平均停車時間tstop=1 min,換乘懲罰參數(shù)α=2,β=2,Logit 模型中參數(shù)θ=3.3,將2 個模型的客流分配結(jié)果與同月份開展的實地調(diào)查所得平均分配客流量進行誤差對比,結(jié)果如圖3所示。
圖3 各線路分配誤差對比Fig.3 Comparison of the errors in the distribution of each line
并 計 算 整 體 平 均 誤 差ωˉA,ωˉB和 最 大 誤 差ωmax,A,ωmax,B,結(jié)果如表4所示。
通過圖3 和表4 的誤差分析結(jié)果可發(fā)現(xiàn),公交客流分配不考慮公交阻抗與實際結(jié)果差異較大,該模型主要忽略了實際交通和路網(wǎng)環(huán)境下公交阻抗普遍是不確定和變化的,同時公交乘客實際選擇行為也會隨著公交阻抗變化而發(fā)生改變,導(dǎo)致了客流也存在不確定性,在一天中存在上下區(qū)間浮動的情況。
表4 各線路整體平均誤差與最大誤差對比Table 4 Comparison of overall average error and maximum error of each line
而考慮了公交阻抗不確定性的客流分配結(jié)果誤差表現(xiàn)較好,較之前有較大改善,9 條線路的平均分配誤差由17.7%降低至6.9%。9 條線路的平均最大誤差也從24.3%降至9.0%,說明本文模型對客流分配結(jié)果基于公交阻抗不確定進行了調(diào)整,一定程度上克服了傳統(tǒng)客流分配模型未表述阻抗為不確定區(qū)間值的問題,故所建模型更加符合實際,且實用性更強。
1) 使用行程時間代表公交阻抗,并將乘客公交行程時間分為公交車輛運行時間、站點候車時間和換乘懲罰時間,結(jié)合區(qū)間不確定理論,使用四分位數(shù)區(qū)間表示阻抗的不確定性。
2) 對公交車輛運行GPS 數(shù)據(jù),站點GIS 數(shù)據(jù)處理后得到公交行程時間,進而導(dǎo)出了公交在站點間的阻抗值。
3)建立阻抗不確定下的客流分配Logit 模型并求解,將其與阻抗確定下客流分配結(jié)果和實際調(diào)查的分配結(jié)果進行對比,結(jié)果表明考慮阻抗不確定下的客流分配誤差,更符合實際。故實際路網(wǎng)區(qū)間阻抗不確定性顯著影響公交客流分配結(jié)果而應(yīng)在模型中充分考慮。
4) 本文簡化了交通需求的不確定性經(jīng)過區(qū)間運算而直接得到區(qū)間阻抗值,在該過程的處理上有待完善,下一步重點工作要將本文所建模型結(jié)合交通需求不確定情形下乘客的實際選擇行為,亦可和交通信息誘導(dǎo)下出行路徑選擇對比,提高客流分配精度和準確性。