祁 昊 劉好德 ▲ 楊宇航 陳國俊
(1.交通運輸部科學研究院城市交通與軌道交通研究中心 北京 100029;2.交通運輸部科學研究院城市公共交通智能化交通運輸行業(yè)重點實驗室 北京 100029;3. 武漢理工大學交通學院 武漢 430070)
公交車輛在站點的??窟^程是實現(xiàn)乘客與車輛交互并進行時空轉(zhuǎn)移的過程,是公交運營中必不可少的重要環(huán)節(jié)。公交??空緯r間是公交行程時間的重要組成部分,研究分析公交??空緯r間與其行程時間之間的特征關(guān)系,對于評價城市公交運行和接駁效率,提升乘客出行效率和公交車輛運營效率具有重要意義。
目前,國內(nèi)外對于公交??空緯r間的相關(guān)研究主要側(cè)重于??空緯r間預測以及??空緯r間影響因素的分析。Jaiswal 等[1]在對大型公交??空具M行研究時發(fā)現(xiàn),公交車輛的??空緯r長與??空军c內(nèi)乘客的數(shù)量呈現(xiàn)正相關(guān)關(guān)系。Bomin Bian[2]通過分析乘客登降量、公交線路數(shù)量,以及公交站臺泊位數(shù)量等因素,建立復合泊松服務(wù)時間模型來估計公交??空緯r間。Stephen Arhin等[3]在分析乘客上下車時間、??空疚恢谩⑼?空緯r間所在時段等因素間關(guān)系的基礎(chǔ)上,建立了公交??空緯r間的多元分析回歸模型。吳葉等[4]在分析公交??空緯r間影響因素的基礎(chǔ)上,通過實地調(diào)查獲取數(shù)據(jù)統(tǒng)計分析不同影響因素對??空緯r間的影響程度和特征,并提出了減少公交??空緯r間的策略。周望東等[5]對公交??空緯r間的機理進行了分析,通過采集公交站點的公交??空敬螖?shù)并進行分類,構(gòu)建了公交站點的公交??空緯r間計算公式。柳伍生等[6]基于車輛運行特性,從時空和微觀的角度,運用概率論、運動學原理和排隊模型,對港灣式公交站車輛的??空狙诱`進行研究。許秀華[7]分析了公交車輛減速進站、站內(nèi)??恳约凹铀匐x站3個過程的公交??空緯r間影響因素,建立了公交車輛站外等待時間模型、減速進站時間模型、站內(nèi)??繒r間模型、加速離站時間模型以及最終的公交??靠倳r間模型。羅鈿[8]以車輛在??空镜闹鲃幼铚蛩睾捅粍幼铚蛩貫榍腥朦c,研究了動態(tài)延誤因素對公交停靠站運行效率間的關(guān)系。楊曉春等[9]選取鹽城BRT-1號線的起始站、中途站、客流離散站等3 類站點為研究對象,構(gòu)建快速公交系統(tǒng)站臺??繒r間模型,并對該模型的合理性進行了檢驗。王鑫[10]通過分析公交車輛??空緯r間的相關(guān)規(guī)律和影響因素,建立了基于時間序列的公交??空緯r間預測模型,并利用實際數(shù)據(jù)對模型的預測精度進行了驗證。胡三根等[11]以廣州快速公交為例,將公交車輛??繒r間劃分為開關(guān)門時間、損失時間、上下車時間和服務(wù)后延誤時間等4個階段,基于實際調(diào)查數(shù)據(jù)對各個階段的時間分別進行了統(tǒng)計,并給出了影響因素的分析。于超等[12]基于道路視頻和微波檢測器數(shù)據(jù),以BP 神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),建立了行程時間預測模型。Mazloumi等[13]基于澳大利亞墨爾本的公共交通流量數(shù)據(jù)構(gòu)建了人工神經(jīng)網(wǎng)絡(luò)模型預測公交車輛行駛時間和行程時間。Yu 等[14]通過采用引入遺忘因子的方法,分析了公交行程時間預測模型的影響因素。祁昊等[15]提出了基于定位數(shù)據(jù)的公交車輛到站時間計算方法,并以北京多條公交線路的數(shù)據(jù)進行了驗證。Padmanaban等[16]建立的公交行程時間預測模型單獨考慮了停靠站延誤的影響,模型預測精度明顯提升。王殿海等[17]采用地圖匹配算法建立了站點區(qū)間行程時間計算方法,并分析了交通條件、道路條件、采樣間隔與行程時間波動指數(shù)、延誤指數(shù)的相關(guān)關(guān)系。Ma等[18]基于所提出的績效評價指標體系,構(gòu)建了公交出行時間分布模型,并以布里斯班2條典型公交路線的6個月歷史數(shù)據(jù)進行了驗證和綜合評估。
綜上所述,現(xiàn)有研究更多的關(guān)注于微觀層面特定公交站點的??空緯r間及其影響因素和相關(guān)機理研究,一般基于小樣本數(shù)據(jù)進行數(shù)理統(tǒng)計和模型解析,缺乏對于宏觀層面的基于全樣本大數(shù)據(jù)的城市公交??空緯r間規(guī)律與特征的研究。因此,本文基于城市公交車輛定位大數(shù)據(jù),研究分析公交??空緯r間與實際行程時間的相關(guān)關(guān)系及特征,從而反映地面公交在實際運營中的??空拘?,為城市公交運行狀況評價提供數(shù)據(jù)基礎(chǔ),為優(yōu)化城市公交運營水平提供科學的指導依據(jù),從而服務(wù)于提升地面公交的競爭力和吸引力。
基于公交車輛行程時間和??空緯r間的原始數(shù)據(jù),將數(shù)據(jù)記錄中“相同線路編號,相同車輛編號,相同運營方向”的記錄作為1個運營班次的判定標準,對原始數(shù)據(jù)進行分割,以獲取完整班次行程時間和??空緯r間的“時間鏈”,數(shù)據(jù)表字段見表1。
通過對“時間鏈”數(shù)據(jù)進行分析,發(fā)現(xiàn)存在如下典型的異常數(shù)據(jù)。
1)單組“時間鏈”數(shù)據(jù)中無站點停靠站時間與區(qū)間行駛時間數(shù)據(jù),或數(shù)據(jù)量極少。
2)存在始發(fā)時間與到達時間完全相同的2 組“時間鏈”數(shù)據(jù),且線路編號與車輛編號一致,即同一班次產(chǎn)生了2條記錄,此時存在如下2種情況:①2組“時間鏈”數(shù)據(jù)之間呈現(xiàn)互補關(guān)系,即1組數(shù)據(jù)存在空缺但在另1組相應位置有數(shù)據(jù);②2組“時間鏈”數(shù)據(jù)之間呈現(xiàn)出重疊關(guān)系,即2組數(shù)據(jù)在相同位置都有數(shù)據(jù)。
表1 “時間鏈”數(shù)據(jù)表字段Tab.1 “Time chain” data fields
3)數(shù)據(jù)值異常問題,包括時間數(shù)據(jù)存在負值以及正常站點??空緯r間與區(qū)間行駛時間難以達到的數(shù)據(jù)值。
基于發(fā)現(xiàn)的典型數(shù)據(jù)問題,研究在進行數(shù)據(jù)分析之前,進行了如下異常數(shù)據(jù)修復處理。
1)刪除站點0與區(qū)間0的數(shù)據(jù)。站點0與區(qū)間0通常為公交車輛運營前在公交場站的狀態(tài),此時車輛定位裝置開啟,但是車輛并未駛離場站,因此會出現(xiàn)站點0 停靠站時間較大和區(qū)間0 行駛時間為0 的現(xiàn)象,對于研究意義較低。
圖1 公交??空緯r間比例系數(shù)頻率分布Fig.1 Frequency distribution of bus stop dwell time proportion coefficient
2)清空所有負值時間數(shù)據(jù)。負值時間數(shù)據(jù)難以判斷其所代表的真實值情況和產(chǎn)生原因。
3)清空所有數(shù)值過高的異常時間數(shù)據(jù)。本研究認為,站點??空緯r間超過300 s,路段行駛時間超過1 200 s,判定屬于異常時間數(shù)據(jù),予以刪除。
4)刪除記錄較少的線路編號的“時間鏈”數(shù)據(jù)。這種情況下站點??空緯r間數(shù)據(jù)與區(qū)間行駛時間數(shù)據(jù)樣本嚴重失衡,難以分析比例特性。
5)合并“時間鏈”數(shù)據(jù)互補的相關(guān)班次。此時將數(shù)據(jù)樣本較少的“時間鏈”數(shù)據(jù)添加到數(shù)量樣本多的“時間鏈”的對應空缺位置當中,如果互補后的“時間鏈”數(shù)據(jù)缺失仍舊高于20%,則認為互補失敗并刪除該“時間鏈”數(shù)據(jù)。
研究選取了2019 年9 月10 日濟南市地面公交的行程時間原始數(shù)據(jù)為例進行分析,按照“相同線路編號,相同車輛編號,相同運營方向”的判定標準進行班次分割,獲取到56 586 條原始“時間鏈”數(shù)據(jù)。在經(jīng)過異常數(shù)據(jù)修復處理流程后,最終剩余39 725條“時間鏈”數(shù)據(jù),即39 725 條公交線路停靠站時間比例數(shù)據(jù)作為后續(xù)研究的樣本。
公交線路停靠站時間比例數(shù)據(jù)總體上近似服從正態(tài)分布,見圖1,均值為0.326 7,標準差為0.063 3,變異系數(shù)CV為0.193 8,總體的數(shù)據(jù)分布集中程度比較高。
研究采用過原點(當公交車輛的行程時間為0時,站點停靠站時間也為0,因此方程過原點)的線性回歸模型對總體樣本數(shù)據(jù)進行擬合,結(jié)果見表2。此時有
式中:Tdwell為站點停靠時間,s;Ttrip為總行程時間,s。
表2 回歸方程Tab.2 Regression equation
式(1)表明公交??空緯r間約占據(jù)總行程時間的32.1%。線性回歸模型的擬合優(yōu)度計算結(jié)果見表3。
表3 回歸模型的擬合優(yōu)度Tab.3 Goodness of fit of regression model
結(jié)果顯示,線性回歸模型的擬合優(yōu)度非常高,調(diào)整R2為0.971,意味著模型能夠基于總的行程時間解釋97.1%的??空緯r間的變化程度。對于城市公交系統(tǒng)而言,公交車輛的站點停靠時間與總行程時間存在特定的比例關(guān)系。
圖2 不同公交線路的??空緯r間比例系數(shù)分布Fig.2 Distribution of bus stop dwell time proportion coefficient of different bus lines
在上述結(jié)論的基礎(chǔ)上,需要論證公交??空緯r間比例系數(shù)的穩(wěn)定性程度,本研究主要考慮如下因素對其的影響。
1)線路差異。不同線路幾何拓撲結(jié)構(gòu)不同,客流需求也不盡相同。
2)駕駛員差異。不同駕駛員駕駛行為存在差異。
3)時段差異。不同時段背景交通條件不同,客流需求也不盡相同。
4)班次行程時間差異。不同班次的行程時間不同,其構(gòu)成要素的站間行駛時間和站點??空緯r間也會存在一定差異。
2.2.1 線路差異對比例系數(shù)的影響分析
如圖2 所示,從不同線路的比例系數(shù)分布情況來看,相比于總體的擬合系數(shù)k=0.321而言,不同線路之間比例系數(shù)的分布存在著一定的差異性。
按照不同線路統(tǒng)計其比例系數(shù)的特征參數(shù)(均值、中位值、最小值、最大值、標準差等),發(fā)現(xiàn)除去少數(shù)部分線路,其余大部分線路均是圍繞著總體擬合系數(shù)k=0.321微弱波動,見圖3。
圖3 不同公交線路的??空緯r間比例系數(shù)特征值分布Fig.3 Eigen value distribution of bus stop dwell time proportion coefficient of different bus lines
考慮到是否由于數(shù)據(jù)質(zhì)量問題(線路班次數(shù)據(jù)的采樣量)導致的波動,基于線路班次樣本量進行分類(低樣本量與高樣本量線路)分析比例系數(shù)隨線路的波動,其中低樣本量線路是指班次樣本量低于50的線路,見圖4,高樣本線路是指班次樣本量高于200的線路,見圖5。
比較而言,高樣本量情況下,比例系數(shù)的波動程度即標準差存在顯著下降,并且相對于總體擬合系數(shù)k=0.321的偏離程度較低。因此,對于發(fā)車頻率越高的線路,站點??繒r間所占總行程時間的比例愈加穩(wěn)定。
2.2.2 駕駛員(車輛)差異對比例系數(shù)的影響分析
圖4 低樣本量(班次樣本量N <50)條件下公交線路??空緯r間比例系數(shù)特征值分布Fig.4 Eigen value distribution of bus stop dwell time proportion coefficient under the condition of low sample size(N <50)
圖5 高樣本量(班次樣本量N >200)條件下公交線路停靠站時間比例系數(shù)特征值分布Fig.5 Eigen value distribution of bus stop dwell time proportion coefficient under the condition of high sample size(N >200)
對比例系數(shù)按照不同的車輛編號進行特征參數(shù)的統(tǒng)計工作,其結(jié)果見圖6。車輛受到駕駛員的影響會導致不同車輛??空緯r間比例系數(shù)均值的上下限變化較大,即表現(xiàn)為部分車輛與總體均值顯著的較大差異。通過對數(shù)據(jù)質(zhì)量進行分析,其主要原因為部分車輛存在數(shù)據(jù)缺失問題,導致部分車輛的運營班次樣本量較少,1 d當中僅有少數(shù)班次(10班次以內(nèi))。但是其均值與不同線路的比例系數(shù)趨勢相同,均為圍繞著k=0.321 附近微弱波動,不同車輛比例系數(shù)均值的統(tǒng)計特征值見表4。
圖6 不同公交車輛的停靠站時間比例系數(shù)分布Fig.6 Distribution of bus stop dwell time proportion coefficient of different buses
表4 不同車輛比例系數(shù)均值的統(tǒng)計特征值Tab.4 Eigen of bus stop dwell time proportion coefficient of different buses
通過分析不同車輛??空緯r間比例系數(shù)均值的總體分布情況來看,均值為0.323 4,標準差為0.047 1,變異系數(shù)CV為0.145 6,統(tǒng)計結(jié)果與全樣本的??空緯r間比例系數(shù)相比分布更為集中,見圖7。通過對不同車輛??空緯r間比例系數(shù)的集中程度進行分析可以發(fā)現(xiàn),上述運營班次樣本量較少的車輛表現(xiàn)出與總體均值分布的顯著差異,其特征為出現(xiàn)極大或極小的現(xiàn)象,與數(shù)據(jù)質(zhì)量分析結(jié)果相符,見圖8。
2.2.3 時段差異對比例系數(shù)的影響分析
如圖9 所示,發(fā)車時刻對比例系數(shù)的影響沒有顯著的趨勢特征(比如,峰值與波谷特征),可能因為高峰客流較多,公交??空緯r間增加,但是公交運行狀況同步惡化,公交車輛的區(qū)間行駛時間增加,所以比例系數(shù)的波動起伏較小。
為了驗證上述猜測,將發(fā)車時刻按照每15 min進行分類,全天劃分成96個時段進行分析。見圖10,比例系數(shù)均值以及分布區(qū)間隨時段變化波動較小。通過對不同運營時段的??空緯r間比例系數(shù)的數(shù)據(jù)質(zhì)量進行分析,出現(xiàn)多數(shù)比例系數(shù)較大值的原因主要是由于06:00以前和23:00以后2個時段的影響:①在這2個時段的發(fā)車班次較少;②在這2個時段存在較多由于車輛啟動和關(guān)閉車輛定位裝置而產(chǎn)生的異常數(shù)據(jù)。
把比例系數(shù)的統(tǒng)計特征參數(shù)按照時段進行統(tǒng)計,排除較早與較晚的時段(一般不屬于正常運營時段),比例系數(shù)均值基本上維持在一個非常穩(wěn)定的程度,由此可以得出發(fā)車時刻對比例系數(shù)的影響沒有顯著的趨勢特征,見圖11,05:00—23:00期間,比例系數(shù)均值為0.326 7,最大值為0.348 1,最小值為0.302 1,波動程度在±8%以內(nèi)。從圖11 中可以看出,??空緯r間比例系數(shù)與公交運行狀況不同,在早晚高峰不存在波峰和波谷等顯著特征,表明停靠站時間比例系數(shù)具有較高穩(wěn)定性。言,這個收斂值大約是0.25,見圖12~13;同時,江陰市K19 路的站點??繒r間占總行程時間的比例均值隨著站點數(shù)的增加(一定程度上等效于行程時間的增加)亦收斂于0.25,見圖14,二者具有一致性。
圖7 不同車輛比例系數(shù)均值頻率分布直方圖Fig.7 Frequency distribution of bus stop dwell time proportion coefficient of different buses
圖8 不同車輛比例系數(shù)均值分布箱型圖Fig.8 Mean value distribution of bus stop dwell time proportion coefficient of different buses
圖9 不同發(fā)車時刻的公交??空緯r間比例系數(shù)分布Fig.9 Distribution of bus stop dwell time proportion coefficient of different bus start time
圖10 不同運營時段的公交??空緯r間比例系數(shù)分布Fig.10 Distribution of bus stop dwell time proportion coefficient of different bus operation time
圖11 不同運營時段的公交??空緯r間比例系數(shù)特征值分布Fig.11 Eigen value distribution of bus stop dwell time proportion coefficient of different bus operation time
圖12 公交停靠站時間所占比例隨班次行程時長的收斂趨勢(濟南市)Fig.12 Convergence trend of bus stop dwell time proportion coefficient with bus shift traffic time(Jinan)
2.2.4 行程時間對比例系數(shù)的影響分析
通過分析??空緯r間比例系數(shù)隨著行程時間的變化趨勢可以發(fā)現(xiàn),隨著班次行程時間(包括路段行程時間和站點??繒r間)的增加,比例系數(shù)會逐漸趨向于1 個穩(wěn)定的收斂值。對于濟南而
公交??空緯r間占總行程時間的比例系數(shù)受到城市、線路、車輛、時段等因素的影響,但是這種影響程度導致的比例系數(shù)大小波動范圍從總體分布來看可以被接受。因此可以采用過原點的線性回歸模型去描述二者之間的相關(guān)關(guān)系。
圖13 公交??空緯r間所占比例隨班次行駛時長的收斂趨勢(濟南市)Fig.13 Convergence trend of bus stop dwell time proportion coefficient with bus shift driving time(Jinan)
圖14 公交??空緯r間所占比例隨站點數(shù)的收斂趨勢(數(shù)據(jù)來源:江陰市K19)Fig.14 Convergence trend of bus stop dwell time proportion coefficient with number of bus stops(Jiangyin K19)
公交停靠站時間與班次行程時間的比例系數(shù)會隨著線路長度(或站點數(shù)、班次行程時間)的增加而逐漸收斂。結(jié)合濟南、江陰公交數(shù)據(jù)分析的結(jié)果,在線路足夠長或者班次行程時間足夠大情況下,站點??繒r間所占比例會收斂到1 個穩(wěn)定的水平值,大約為0.25。實際的濟南市公交全樣本數(shù)據(jù)回歸擬合出來的站點與停靠時間之間的比例系數(shù)(0.32)略高于0.25,可能的原因是其中大量班次存在數(shù)據(jù)缺失問題(表現(xiàn)為總的行程時間比較?。?。對于1個城市公交系統(tǒng)而言,在沒有采集車輛站點??窟^程數(shù)據(jù)情況下,本研究推薦公交??空緯r間所占總班次行程時間比例的估計值為0.25。
研究所提出的??空緯r間與行程時間的比例系數(shù)的推薦取值范圍是在全樣本大數(shù)據(jù)條件下的統(tǒng)計參數(shù),研究對象為公交線路和線路網(wǎng),因此當對任意2 個空間位置之間的公交行程時間進行折減來計算公交??空緯r間時,可能存在一定的誤差,尤其是當2個空間位置之間的距離比較近時誤差可能較大,因此還需進行更加深入的研究。