段曉凡, 高良鵬,2, 簡文良,3, 陳丹丹
(1.福建理工大學(xué) 智能交通系統(tǒng)研究中心, 福州 350108; 2.東南大學(xué) 交通學(xué)院, 南京 210089;3.同濟(jì)大學(xué) 交通運輸學(xué)院, 上海 201804; 4.福州市交通運輸局, 福州 350100)
由于存在道路擁堵、道路事故等問題,我國城市公共交通在準(zhǔn)點上下行方面仍有較為顯著的不可預(yù)測性,這嚴(yán)重影響了出行者對城市公交服務(wù)系統(tǒng)的體驗. 因此,對于常規(guī)公交線路的行程時間可靠性評估分析成為當(dāng)前公交發(fā)展的核心問題.
對于公交運行可靠性的研究,大多數(shù)學(xué)者考慮到了可靠性的不同評價指標(biāo)、評價方法以及可靠性的影響因素. 比較常見的評估指標(biāo)主要有準(zhǔn)點率[1-2]、間隔時間可靠性[3-4]、行程時間可靠性[4-6]、出發(fā)時間可靠性[4]、乘客等待時間可靠性[7]等. 張玉紅[5]認(rèn)為:提升行程時間可靠性才能更好地保證網(wǎng)絡(luò)運營的準(zhǔn)時性. 周雨陽[6]也提出:通過車輛滿載率、行程時間可靠性來評價多模式公交可綜合體現(xiàn)穩(wěn)定性. 可見,行程時間可靠性是目前評估公交可靠性比較常用的指標(biāo),可較好體現(xiàn)車輛延誤與否. 對于評估方法,杜雨威[8]從靜態(tài)、實時和預(yù)測3個角度出發(fā),并結(jié)合不同時段的交通特征,對貴陽市公交線路可靠性進(jìn)行了評價. Varga[9]提出1種多目標(biāo)控制策略來保障公交車頭時距的穩(wěn)定性和時刻表的可靠性,其中站點停靠優(yōu)化模型則用于準(zhǔn)確測算站點區(qū)間的行駛時間. Borjesson[10]通過對3個時間段和2個中轉(zhuǎn)模式指出行程時間的隨機(jī)性是引起可靠性波動的重要原因. 對于影響行程時間可靠性的因素,羅霞[11]根據(jù)公交定位數(shù)據(jù),得到公交可靠性與線路長度、信號交叉口個數(shù)、站點個數(shù)、時間段等方面均有關(guān)系. 朱家哲[12]結(jié)合經(jīng)驗從路段平均行程速度、交叉口飽和度等擁堵程度評價指標(biāo)出發(fā),探究不同擁堵程度與行程時間可靠性的相關(guān)關(guān)系. 通過邏輯回歸模型分析,王玲[13]得出站點數(shù)目、是否工作日以及公交通過的區(qū)域類型對可靠度有顯著影響.
簡單傳統(tǒng)的評估模型已被廣泛應(yīng)用,但隨著近幾年車輛數(shù)量增加,傳統(tǒng)模型的局限性也逐漸凸顯,主要表現(xiàn)在模型計算效率低、缺乏對數(shù)據(jù)進(jìn)行實時監(jiān)測和調(diào)整的能力,難以應(yīng)對復(fù)雜多變的城市交通環(huán)境. 因此機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等方法開始得到重視. 這些方法的主要優(yōu)點不僅是它們比其他模型更容易實現(xiàn),而且能在應(yīng)用時保持高效性能[14]. 羅建平[15]通過分析行程時間的影響因子,建立粒子群優(yōu)化的輕量級梯度提升機(jī)算法預(yù)測行程時間. Yu[16]通過公交出行時間與空間和時間域中當(dāng)前和歷史數(shù)據(jù)的相關(guān)性來探索. Pan[17]提出了基于歷史數(shù)據(jù)模型的算法,提取公交車位置、速度和行駛時間數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,在公交樣本序列具有高度非線性和不規(guī)則性時表現(xiàn)突出. Agafonov[18]考慮了運輸情況的異構(gòu)信息,利用LSTM對序列數(shù)據(jù)長時依賴關(guān)系的建模能力來預(yù)測行程時間. 故有必要選擇可捕捉公交行駛時間序列中的潛在模式和趨勢的模型評估公交線路可靠性.
總體來說,對于公交可靠性的計算和評估,大部分的專家學(xué)者只考慮起點和終點的狀態(tài)而且只針對某1條或者幾條線路評價,分析的結(jié)果也許并不能反映整體狀況,因此有必要盡可能研究城市范圍內(nèi)的多條線路的所有站點,給出一般性結(jié)論. 本文基于公交進(jìn)出站數(shù)據(jù),充分考慮到線路中每個站點的運營情況,構(gòu)建基于LSTM神經(jīng)網(wǎng)絡(luò)的窄界限評估模型解析城市公交線路可靠性,根據(jù)評估結(jié)果,利用多元線性回歸分析高峰期不同站點的可靠性影響因素.
針對可靠性的判斷,大多研究只考慮了起點與終點的狀態(tài),但是某個站點如果發(fā)生延誤,會對下游的公交站點造成影響[19]. 由于中間公交站點的行駛情況難以判斷,Chen[20]提出可靠性不單單是終點準(zhǔn)點的體現(xiàn),更是中間站點準(zhǔn)點的體現(xiàn). 因此,本文在測度公交線路的整體可靠性時,逐一考慮了各線路各區(qū)間的公交車行駛狀態(tài),若公交車沒有按照規(guī)定時間到達(dá)下游站點,則判定其在該區(qū)間的行駛不可靠. 規(guī)定只要該公交線路上有1個行駛區(qū)間不可靠,則認(rèn)為該條公交線路出現(xiàn)運營不可靠的情況. 引入失效概率作為評估指標(biāo),若某條公交線路的失效概率越大,則表明其可靠性越低. 公交線路的可靠性可從2個層面逐步計算得到:
1)站點間車輛行駛的可靠性
本文結(jié)合北京公交集團(tuán)對于“準(zhǔn)點”的定義,在計算過程中將公交車輛早于時刻表規(guī)定時間1 min或者晚于時刻表規(guī)定時間2 min內(nèi)到達(dá)站點認(rèn)定為行駛是可靠的. 將公交車輛到達(dá)下游站點的計劃行駛時間記為Trij公交車輛到達(dá)下游站點的實際行駛時間記為Arij,若滿足:
Arij∈[Trij-60,Trij+120]
?i∈(i,n-1),j∈(2,n),i≠j
(1)
式中,Ar表示本次行駛是可靠的,反之,則說明該次行駛無法滿足準(zhǔn)點要求;i和j表示同一公交線路中相鄰2個站點對應(yīng)的編號;n為線路站點的最大編號.
由于在實際情況中,公交車輛往往是多次往返穿梭于線路站點之間,因此可將公交線路各個區(qū)間中滿足條件的實際行駛時間視為1個集合,則各個區(qū)間的失效概率應(yīng)表示為:
(2)
式中,i為公交站點對應(yīng)的編號;m為第i個站點實際行駛時間數(shù)據(jù)的數(shù)量.應(yīng)用數(shù)理統(tǒng)計方法擬合出城市公交線路各段的失效狀態(tài)概率分布.
2)公交線路的可靠性
由上述可知,若公交車輛能按照規(guī)定時間從上游站點i到達(dá)相鄰的下游站點j,表明本次行駛處于“可靠”狀態(tài),記為Si;反之,若公交車輛不能準(zhǔn)時到達(dá)下游站點,則說明時刻表在該站點區(qū)間上“失效”,記為Fi.
圖1為公交線路的運營狀態(tài).圖中實線表示站點區(qū)間的行駛是“可靠”的,虛線表示站點區(qū)間的行駛是“失效”的.如圖1(a)中,假設(shè)由于公交車在站點區(qū)間1中失效,導(dǎo)致線路后續(xù)可能發(fā)生失效的情況,見式(3):
圖1 公交線路運營狀態(tài)說明圖
Pf=P(F1)
(3)
在圖1(b)中,公交失效的部分從站點區(qū)間 1 變?yōu)檎军c區(qū)間 2,根據(jù)集合理論可知該情況發(fā)生的概率為:
Pf=P(F2∩S1)
(4)
同理可得,如圖1(c)當(dāng)車輛失效發(fā)生在站點區(qū)間3中時,其對應(yīng)的概率為:
Pf=P(F3∩S2∩S1)
(5)
以此類推,當(dāng)車輛失效發(fā)生在第n個站點,其概率計算公式為:
Pf=P(Fn∩Sn-1∩Sn-2…∩S2∩S1)
(6)
由集合理論可知,某條公交線路發(fā)生失效的概率為:
Pf=P(F1)+P(F2∩S1)+P(F3∩S2∩S1)…+
P(Fn∩Sn-1∩Sn-2…∩S2∩S1)
(7)
若將各區(qū)間的狀態(tài)視為集合,則對應(yīng)地可得到2個子集,分別是可靠子集S和失效子集F.而前述圖1(b)和圖1(c)中描述時刻表晚點發(fā)生在站點區(qū)間1之后的公式即可規(guī)整為:
Pf=P(F2∩S1)=P{F2∩(R-F1)}=
P(F2∩R)-P(F2∩F1)=
P(F2)-P(F2∩F1)
(8)
Pf=P{F3∩(R-F2)∩(R-F1)}=
P{(F3-F2∩F3)∩(R-F1)}=
P(F3)-P(F2∩F3)-P(F3∩F1)+
P(F3∩F2∩F1)
(9)
相應(yīng)的,可推導(dǎo)出公交線路發(fā)生失效的概率計算公式為:
(10)
式中,公交線路上的失效概率計算量將隨著站點區(qū)間數(shù)量的增加而增加,這不利于對線路可靠性的快速評估.因此,本文考慮通過測度失效概率的上下邊界數(shù)值來簡化計算量,提升計算效率.根據(jù)窄界限理論可知,對于公交線路的任意相鄰站點區(qū)間能滿足關(guān)系:
P(Sn-1∩Sn-2…∩S1)≤P(Sn)=P(1-Fn)
(11)
通過整合式(10)(11),可得:
(12)
此外,對于公交線路任意站點區(qū)間亦能滿足關(guān)系:
P(Sn-1∩Sn-2…∩S1)≥
1-{P(F1)+P(F2)+…P(Fn-1)}
(13)
可進(jìn)一步推導(dǎo)出:
(14)
通過整合式(10)(14),可得:
(15)
因此,可得到公交線路的失效概率上下限數(shù)值為:
(16)
(17)
式中,Pupper為失效概率的上限值;Plower為失效概率下限值.
為方便計算,本文將失效率取值為其上下限的均值作為公交線路失效概率見式(18):
(18)
LSTM具有對序列數(shù)據(jù)長時依賴關(guān)系的建模能力. 在公交系統(tǒng)中,1個車輛出現(xiàn)延誤可能會導(dǎo)致后續(xù)車輛也出現(xiàn)延誤,形成延誤傳播現(xiàn)象. LSTM可通過學(xué)習(xí)歷史公交到站時間來獲取潛在的延誤情況,并且考慮到延誤傳播的影響,減少運營風(fēng)險,提高服務(wù)水平.
在LSTM中,早期階段的記憶可通過包含1條記憶線的槽門來完成. 圖2展示了完整的LSTM架構(gòu),由輸入層、1個或多個隱藏層和輸出層組成設(shè)置,輸入層的大小等于輸入變量的數(shù)量,LSTM網(wǎng)絡(luò)的主要特征包含在所謂的存儲單元組成的隱藏層中. 根據(jù)之前的輸入序列(如時間)觀察保持細(xì)胞狀態(tài)ct,但也能消除被認(rèn)為不相關(guān)的信息.為了實現(xiàn)這種機(jī)制,信息的維護(hù)由3個門控制:輸入門、忘記門和輸出門.3個門中的每1個都呈現(xiàn)了在前1個的存儲單元的輸出Pf-1以及本次輸出Pf.設(shè)w表示任意單位的權(quán)重,根據(jù)權(quán)重更新策略不斷優(yōu)化.每個門在t時刻產(chǎn)生1個狀態(tài)變量,分別是Gt、It以及單元輸出Ot.多個LSTM可堆疊,本文選擇2層LSTM堆疊,這樣可學(xué)習(xí)到更復(fù)雜的數(shù)量信息模式.
圖2 完整的LSTM架構(gòu)
圖2中定義Gt是遺忘門輸出,將上一時刻的失效概率Pf-1和當(dāng)前時刻的行駛時間Arij,同時傳遞到sigmoid函數(shù)中去,輸出值介于0和1之間,丟棄接近0的數(shù)據(jù).
Gt=σ(wG[Pf-1,Arij]+bG)
(19)
定義It為輸入門,Ct為當(dāng)前狀態(tài)需要記憶的信息.通過sigmoid函數(shù)調(diào)整值,也要傳遞到tanh函數(shù)中得到候選值,確定訓(xùn)練所需的行駛時間.更新過后的狀態(tài)記為Lt.
It=σ(wI[Pf-1,Arij]+bI)
(20)
Ct=tanh (wC[Pf-1,Arij]+bC)
(21)
Lt=GtLt-1+ItCt
(22)
定義Ot為輸出門,用來確定下1個失效概率的值作為當(dāng)前步長的輸出,將其作為新的隱藏狀態(tài)傳遞到下1個時間步長.Pf代表輸出門的狀態(tài),也是當(dāng)前時刻線路的失效概率.
Ot=σ(wO[Pf-1,Arij]+bO)
(23)
Pt=Ottanh (Ct)
(24)
將數(shù)據(jù)處理過后的行駛時間作為輸入送到LSTM,并使用上文提到的窄界限法來計算公交線路的實際失效概率作為輸出訓(xùn)練LSTM神經(jīng)網(wǎng)絡(luò).
為了使用所提出的模型,需要訓(xùn)練它來優(yōu)化每1層中的學(xué)習(xí)參數(shù),例如權(quán)重w和偏差b. 優(yōu)化后的參數(shù)可映射輸入向量和輸出向量之間的關(guān)系.
按照機(jī)器學(xué)習(xí)中的正常趨勢,訓(xùn)練和測試數(shù)據(jù)集被分離為7/10和3/10,采用了均方誤差(MSE)和平均絕對誤差(MAE)作為損失函數(shù),這兩個損失函數(shù)都是凸函數(shù),相對于其他損失函數(shù)來說比較容易優(yōu)化,而且更具直觀性. MSE可用于檢查得到的失效概率和真實失效概率的偏差程度,而MAE值可用于表示測試結(jié)果與真實失效概率的絕對偏差見式(25)(26).
(25)
(26)
式中,N是預(yù)測/訓(xùn)練樣本的數(shù)量;vprediction是基于評估模型得到的公交線路失效概率;vtruth是從通過公交進(jìn)出站數(shù)據(jù)計算得到的失效概率.
為檢驗本文方法的可行性與有效性,收集公交路線信息和實時數(shù)據(jù),以評估模型性能,研究重點是江蘇宜興的公交車輛,如圖3所示. 宜興市是江蘇省無錫市代管縣級市,位于江蘇省西南端,地處滬寧杭三角中心,下轄5個街區(qū)和13個鄉(xiāng)鎮(zhèn). 目前,宜興市擁有公交線路51條,公交線網(wǎng)運營的總長度約246.4 km,日均發(fā)車班次5 400個,日均運量16.6萬人次. 城市整體的公交線網(wǎng)密度為1.48 km/km2,城市出行結(jié)構(gòu)中公交分擔(dān)率達(dá)到26%. 城市公交已經(jīng)成為宜興市居民日常出行的1種重要方式.
圖3 江蘇宜興公交路線
在這項工作中,選取了江蘇宜興的26條公交路線以及他們在2019年12月公交車輛進(jìn)出車站記錄作為實驗數(shù)據(jù),數(shù)據(jù)主要包括公交線路編號、站點編號、站點名稱、車輛牌號、到達(dá)與駛離各站點的經(jīng)緯度、時間戳、方向等.
公交相鄰站點間的行駛時間可作為1個向量,計算出站間和線路的失效概率,進(jìn)一步應(yīng)用LSTM算法來測試得到矢量. 當(dāng)LSTM模型中的隱藏層的數(shù)量設(shè)置為20時,MSE為1.96,MAE為0.85,實現(xiàn)了該模型的最佳性能.
為證明本文方法的高效準(zhǔn)確性,將其與蒙特卡洛法、BP神經(jīng)網(wǎng)絡(luò)模型比較,結(jié)果如圖4所示. 與相對傳統(tǒng)的蒙特卡洛法比較,雖然計算速度相比較而言較快,但它在相同的迭代次數(shù)下收斂速度較慢,很難得到真實值. 而與現(xiàn)如今比較常用的BP模型相比,LSTM模型期望值與實際值差距更為細(xì)微. 隨著迭代次數(shù)增加,LSTM網(wǎng)絡(luò)模型的誤差逐漸減小并最后趨于穩(wěn)定,它將MSE降低了3.5%、MAE降低了2.9%,減少了較小的誤差差距. BP模型之所以出現(xiàn)較差效果是因為它給定的初始權(quán)值與閾值是隨機(jī)的,導(dǎo)致每一次的運算結(jié)果會有出入,需不斷嘗試得到最優(yōu)的隱含層節(jié)點數(shù)目,得到最優(yōu)解的過程較長. 由此表明LSTM評估模型在得到線路失效概率的效率和準(zhǔn)確率方面表現(xiàn)良好.
圖4 公交線路失效概率
圖4列舉了12月30日公交線路失效概率,根據(jù)失效概率數(shù)值可得到1路、7路、9路、19路、112路車可靠性相較于其余線路略低,而4路、14路、151路、153路車的可靠性較高. 經(jīng)過研究發(fā)現(xiàn),可靠性偏低線路的途經(jīng)站點大多數(shù)位于中心城區(qū)較為繁華的地帶,具有較高的交通擁堵與交通事故發(fā)生率. 道路擁堵狀況、??織l件以及人流量都有可能影響公交線路的可靠性,因此本研究從站點所處地理位置的真實情況入手進(jìn)行分析以達(dá)到提升線路的可靠性的目的.
高峰期交通流量巨大,大部分站點都會出現(xiàn)延誤現(xiàn)象,但是延誤程度卻各有差異. 本文根據(jù)評估結(jié)果,選取早高峰07:00—09:00時段與晚高峰17:00—19:00時段的公交線路中相對具有代表性的50個站點評估其可靠性,并通過調(diào)查它們的車道數(shù)量、交叉路口紅綠燈數(shù)量、站臺設(shè)置位置以及停靠線路數(shù)量來研究影響站點可靠性的原因,部分站點的總體情況如表1所示.
表1 部分站點總體情況
通過多元線性回歸模型分析它們與可靠性之間的關(guān)系,模型的R2為0.93,表明模型擬合程度較好. 多元線性回歸模型在探究多個自變量對因變量的影響時,可消除其他自變量的影響,以便更加準(zhǔn)確地評估每個自變量的影響. 通過表2可看出,車道數(shù)量、路口信號燈數(shù)量與停靠線路數(shù)量的P值均小于0.05,說明這3個方面與可靠性關(guān)系顯著. 從回歸系數(shù)可看出車道數(shù)量與可靠性成正相關(guān),信號燈數(shù)量、??烤€路數(shù)量與可靠性成負(fù)相關(guān). 而且車道數(shù)量與??烤€路數(shù)量對可靠性影響較大,信號燈數(shù)量對可靠性影響較小.
表2 多元線性回歸分析
在所調(diào)查站點中,樹人中學(xué)、人民醫(yī)院、勸業(yè)廣場、蘇南商廈、世紀(jì)大橋、迎賓路、荊溪新村、上海新苑的可靠性較低. 通過結(jié)合高德地圖可看出,這些站點大部分集中在學(xué)校、醫(yī)院、商圈、交通樞紐附近,主要是因為這些地點的內(nèi)在屬性導(dǎo)致了高峰期時段人流量和車流量密集,停靠線路數(shù)量過多而車道數(shù)量過少無法緩解交通堵塞導(dǎo)致車輛不準(zhǔn)點. 也有少部分可靠性低的站點分布在住宅區(qū),可能因為公交車在穿越繁忙的老城區(qū)時,需要面對狹窄的街道和擁堵的交通,從而影響了車輛的行駛速度和準(zhǔn)點率. 如果能針對不同的地點和原因,提出相應(yīng)的應(yīng)對建議,如增加站點、調(diào)整線路、增加備用車輛、提高司機(jī)素質(zhì)等措施,即能有效提高線路的可靠性,提升乘客體驗感.
本文將可靠性的概念引入到公交線路的評估中,通過解析公交車輛在上下游相鄰站點區(qū)間的行駛過程,計算站點和線路的失效概率,構(gòu)建基于LSTM神經(jīng)網(wǎng)絡(luò)的窄界限評估模型,高效準(zhǔn)確地得到公交線路的可靠性. 所提出的評估方法是1種簡單的全局性評估方法,日常評估過程不受網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的影響. 特別地,采用此種方法可減少原始方法所耗費的時間,根據(jù)最終評估結(jié)果反映出其中的薄弱環(huán)節(jié)以便優(yōu)化. 通過案例分析得到,26條公交線路的可靠性存在差異,提取了相對具有代表性的站點,進(jìn)一步利用多元線性回歸分析方法,探究影響高峰期站點可靠性高低的原因與車道數(shù)量、路口信號燈數(shù)量、線路數(shù)量均有關(guān)系. 對于未來的工作,可進(jìn)一步探索精細(xì)化的可靠性評估模型,采集不同城市、不同交通狀況的公交站點、線路以及行程時間數(shù)據(jù),滿足多站點同步評估的功能需求,實現(xiàn)對不同車輛調(diào)度運營方案的可靠性預(yù)警.