王 波,周 侃,蔡 明
(深圳市市政設計研究院有限公司,廣東 深圳518029)
高鐵客運樞紐乘客候車時間預測模型研究
王 波,周 侃,蔡 明
(深圳市市政設計研究院有限公司,廣東 深圳518029)
為了對高鐵客運樞紐乘客候車時間分析預測提供理論支撐,從探尋高鐵乘客候車時間的分布特性入手,在對高鐵樞紐內乘客候車時間實地調查的基礎上,進行了乘客候車時間分布擬合?;诜讲罘治龇椒?,對高鐵樞紐內乘客候車時間影響因素進行了顯著性分析,并對乘客候車時間顯著性影響因素與候車時間的關系進行了探討。利用改進的BP神經(jīng)網(wǎng)絡,構建了高鐵樞紐內乘客候車時間預測模型,并利用調查數(shù)據(jù)驗證了模型的有效性。分析結果表明,高鐵樞紐提前購票乘客候車時間服從對數(shù)正態(tài)分布;市內出行時間、對外出行距離、對樞紐的熟悉程度、受教育水平、市內交通方式均對候車時間造成顯著影響;所構建的候車時間預測模型的計算值與調查值的平均相對預測誤差為11.2%,預測誤差基本控制在20min以內。
交通規(guī)劃;高速鐵路樞紐;方差分析;神經(jīng)網(wǎng)絡;候車時間
我國高速鐵路建設雖然起步較晚,但到目前為止已經(jīng)成為世界的領跑者,無論是在速度上,還是規(guī)模上均居世界首位。隨著我國高速鐵路的發(fā)展,一大批高鐵客運樞紐如北京南站、上海虹橋樞紐站、廣州南站等如雨后春筍般陸續(xù)建成并投入使用。高鐵客運樞紐一經(jīng)出現(xiàn)便得到了社會的廣泛關注,它作為多種交通方式銜接的重要節(jié)點,城市間往來的強勁紐帶,無疑將集聚大量的乘客,在乘客多方式換乘中扮演著至關重要的角色。候車時間作為評價高鐵樞紐服務水平和集散效率的重要指標,對其準確把握及不斷優(yōu)化,已經(jīng)成為提高高鐵樞紐服務水平的重要抓手。雖然我國在短期內積累了一些有關高鐵客運樞紐設計、建設及運營管理的寶貴實踐經(jīng)驗,但高鐵客運樞紐在我國畢竟屬于新生事物,有關其規(guī)劃、設計、建設及管理的理論研究成果相對匱乏,有關高鐵樞紐內乘客候車時間的理論研究相對不足,因此對高鐵乘客的候車時間進行分析并構建其計算模型是十分必要的。
目前,乘客候車時間的相關研究已取得了一定成果,Brunetta等[1]指出乘客在機場的等候時間與出行距離有關,出行距離越長,在機場內等候的越久,且等候時間受乘客自身特性的影響,71%商務出行乘客的等候時間大于2h,而只有55%娛樂休閑出行乘客的等候時間大于2h。Tumquist[2]在研究市內公共交通車輛到達間隔對候車時間的影響時,發(fā)現(xiàn)隨著車輛到達間隔的增大,會出現(xiàn)兩類不同性質的乘客,一類為隨機乘客,另一類為非隨機乘客,前者的到達完全隨機,可以認為到達時間服從均勻分布,后者的到達有一定的計劃性,并通過調查驗證了后者的到達服從對數(shù)正態(tài)分布。Fan等[3]指出10min的公交發(fā)車間隔為隨機乘客與非隨機乘客分界的發(fā)車間隔時間。Seddon等[4]對曼徹斯特地區(qū)公交乘客候車時間進行了研究,分析了乘客在公交站臺的等候時間特性,建立了乘客平均等候時間與車輛到達間隔之間的回歸關系模型。鐘紹林等[5]對北京西站乘客的候車時間進行了調查,分析了乘客出行目的、個人屬性特征、乘坐的市內交通工具等因素與候車時間的關系。何宇強、張?zhí)靷サ萚6,7]對我國普通鐵路客運站乘客到達規(guī)律展開了分析,分析結果表明乘客的等候時間服從對數(shù)正態(tài)分布。付延冰等[8]分析了常規(guī)公交站點乘客等車過程的隨機特性,根據(jù)隨機過程理論推導出乘客的平均累積等車時間的計算公式,指出有效控制相鄰兩公共汽車離開公交站點的間隔時間并盡可能減少其波動可以縮短公交站點乘客的累積等車時間。
高鐵候車時間的相關研究已引起學者們的關注和重視,但研究大多以市內常規(guī)公交和軌道交通換乘站乘客的候車時間為研究對象,且在現(xiàn)有的研究成果中,往往以某個因素對候車時間的影響為研究重點,缺乏多種因素影響下的高鐵客運樞紐乘客候車時間量化分析方法研究。本文以高鐵乘客的候車時間為研究對象,在借鑒已有相關研究成果的基礎上,通過對高鐵樞紐內乘客候車時間分布特性分析入手,甄別出候車時間的顯著影響因素,構建提前購票乘客候車時間預測模型,并利用調查數(shù)據(jù)驗證模型的有效性,為高鐵樞紐設計、運營組織及服務水平優(yōu)化提供參考。
1.1乘客候車時間分布特性分析
國外學者在研究乘客等候行為時,將乘客分為兩種類型,一類乘客清楚的知道運營車輛的發(fā)車時間安排,他們往往選擇一個離發(fā)車時間較近的時刻到達,以減少等候時間;另一類乘客不清楚運營車輛的發(fā)車時間,他們到達的時間較為隨機。基于上述觀點將乘坐高鐵列車的乘客分為提前購票乘客和到站后購票乘客兩類,通過問詢調查發(fā)現(xiàn)有38.3%的乘客選擇提前購票,且隨著網(wǎng)絡、手機App等查詢、訂票手段的不斷發(fā)展完善,選擇提前購票乘客的比例將會越來越高。
由于到站后購票乘客及隨機乘客的到達具有很大的隨機性和主觀性,他們的平均等候時間可以通過式(1)[9,10]估算得到,因此本文著重對提前購票乘客候車時間進行分析。
式中:W為平均等候時間;h為平均發(fā)車間隔時間;σ為發(fā)車間隔時間的標準差。
依據(jù)國內研究現(xiàn)狀分析可知,普通鐵路樞紐的乘客候車時間近似的服從對數(shù)正態(tài)分布,其分布的概率密度函數(shù)f(t)如下:
式中:t為乘客等候時間;μ為等候時間對數(shù)的平均值;σ為等候時間對數(shù)的標準差。
參數(shù)μ和σ可以通過極大似然估計求得,估算公式如下:
通過問卷調查得到北京南站及哈爾濱西站不同候車時間對應乘客人數(shù)比例見圖1。北京南站提前購票乘客的平均候車時間為61min,有80%的乘客選擇在開車前80min以內到達車站。哈爾濱西客站提前購票乘客的平均候車時間為71min,有80%的乘客選擇在開車前95min以內到達車站。
圖1 乘客候車時間分布
將上述候車時間數(shù)據(jù)進行對數(shù)變換,利用柯爾莫哥洛夫-斯摩洛夫檢驗(K-S檢驗),對變換后的數(shù)據(jù)進行正態(tài)分布檢驗,通過檢驗得出,轉換后的北京南站乘客候車時間服從均值為4.112,標準差為0.357的正態(tài)分布(檢驗P值為0.884)轉換后的哈爾濱西站乘客候車時間服從均值為4.263,標準差為0.437的正態(tài)分布(檢驗P值為0.731)。由此可以推斷兩個高鐵樞紐站內提前購票乘客候車時間均服從對數(shù)正態(tài)分布。
1.2乘客候車時間影響因素篩選
高鐵樞紐提前購票乘客的候車時間受出行目的、乘客年齡、對樞紐的熟悉程度等因素的綜合影響[1],論文初選乘客的性別、年齡、出行目的、市內出行時間(乘客從市內出發(fā)直至到達高鐵樞紐所花費的時間)、市內交通方式(乘客到達高鐵樞紐所選用的市內交通方式)、對樞紐的熟悉程度、受教育水平、對外出行距離8個因素作為高鐵樞紐乘客候車時間的影響因素。通過乘客等候時間問卷調查,收集了北京南站及哈爾濱西站乘客候車時間對應的各初選影響因素的樣本數(shù)據(jù),以判斷各初選因素對乘客候車時間影響的顯著性。表1為利用SPSS軟件對北京南站候車時間進行多因素方差分析的結果,可以看出市內出行時間、對外出行距離、對樞紐的熟悉程度、受教育水平、市內交通方式均具有統(tǒng)計學意義(P值小于0.05),說明它們對候車時間都具有顯著性影響,而乘客年齡、乘客性別、出行目的對對候車時間的影響不顯著。因此最終選取市內出行時間、對外出行距離、對樞紐的熟悉程度、受教育水平、市內交通方式作為影響乘客候車時間的5個主要因素。
表1 候車時間影響因素方差分析結果
1.3乘客候車時間影響因素分析
(1)對外出行距離對候車時間的影響 目前從北京南站出發(fā)最遠抵達的城市為上海,出行里程約為1400km,從哈爾濱西站出發(fā)最遠抵達的城市為大連,出行里程約為930km。由此將出行距離劃分為三個等級0~500km、500~1000km及1000~1500km,不同等級出行距離對應的平均候車時間見圖2。從圖中可以看出隨著出行距離的加長,乘客的平均候車時間也相應的加長。
圖2 出行距離與平均候車時間關系
(2)市內出行時間對候車時間的影響 通過調查得到,前往北京南站乘客的平均市內出行時間為70.8min,前往哈爾濱西客站乘客的平均市內出行時間為52.4min。圖3為乘客市內出行時間與高鐵樞紐內平均候車時間折線圖,可以看出隨著市內出行時間的增加,乘客的平均候車時間呈現(xiàn)出不斷增加的趨勢。主要原因在于,較長的市內出行時間,對應了較長的市內出行距離,出行距離的增加,加大了出行時間的不確定性,增加了乘客對市內出行時間的掌控難度,乘客往往預留的大量的富裕時間以應對這種不確定性,從而造成候車時間偏長。
圖3 市內出行時間與平均候車時間關系
(3)市內交通方式對候車時間的影響 北京南站及哈爾濱西客站不同市內交通方式乘客的平均候車時間見圖4,從圖中可以看出步行前往樞紐的乘客的平均候車時間最短,其次為乘坐地鐵到達的乘客,乘坐公交車到達的乘客平均候車時間最長,乘坐出租車和私家車到達樞紐的乘客的平均等候時間差異不明顯。造成以上差異的主要原因是步行前往樞紐的乘客,其市內出行時間最容易掌控,乘客往往選擇離發(fā)車時間較近的時刻前往樞紐。而地鐵與出租車、私家車及公交車比較起來,最大的特點是其運行的準點率高,其市內出行時間也較容易掌控。
圖4 市內交通方式與平均候車時間關系
(4)樞紐的熟悉程度對候車時間的影響 通過對調查數(shù)據(jù)的分析及與乘客之間的訪談發(fā)現(xiàn),對樞紐的熟悉程度,也是影響候車時間的一個因素,往往對樞紐越熟悉的乘客,在其他條件相同的情況下,其候車時間往往越短。本文將對樞紐的熟悉程度分為很熟悉、較熟悉和不熟悉三個等級、不同熟悉程度的乘客的平均候車時間見圖5。
圖5 對樞紐的熟悉程度與平均候車時間關系
(5)受教育水平對候車時間的影響 本文將乘客的受教育水平劃分為三個等級,分別是大專及其以下、大學本科、研究生及以上。受教育水平不同的乘客對應的平均候車時間見圖6。從圖中可以看出隨著受教育水平的提高,乘客的平均候車時間有降低的趨勢,但從各組間的差異來看,受教育水平對候車時間的影響程度,明顯不如論文提及的其他幾個因素。
圖6 不同受教育水平乘客的平均候車時間對比
2.1預測模型選擇
由于提前購票乘客候車時間受到多種因素的影響,且各種因素對其影響的疊加表現(xiàn)為極度的非線性,用非線性函數(shù)對提前購票乘客候車時間進行分析是十分必要的,而人工神經(jīng)網(wǎng)絡的一大特點就是非線性映射,它可以有效的解決非線性函數(shù)逼近問題,利用人工神經(jīng)網(wǎng)絡可以較為準確的擬合購票乘客候車時間與各影響因素之間的關系。因此本文選用人工神經(jīng)網(wǎng)絡作為提前購票乘客候車時間的預測模型。
2.2經(jīng)典BP神經(jīng)網(wǎng)絡概述
人工神經(jīng)網(wǎng)絡具有很強的自適應、學習及抗干擾能力,人工神經(jīng)網(wǎng)絡中以BP神經(jīng)網(wǎng)絡應用最為廣泛,據(jù)統(tǒng)計有近90%的神經(jīng)網(wǎng)絡應用是基于BP網(wǎng)絡的[11]。
學習與訓練特性是神經(jīng)網(wǎng)絡的基本特性,在BP神經(jīng)網(wǎng)絡中學習算法是誤差反向傳播(Backpropagation)算法[12],該算法主要包含以下幾個步驟。
第一步:對各權值wij和神經(jīng)元閾值初始化,賦值為(-1,1)上分布的隨機數(shù);
第二步:隨機選取第k個輸入樣本x(k)及對應期望輸出;
第三步:計算隱含層及輸出層各神經(jīng)元的輸入和輸出;
第四步:利用網(wǎng)絡期望輸出d0(k)和實際輸出y0(k),計算誤差函數(shù)E對各權值的負偏導數(shù)δ;
第五步:按照下式對各權值進行修正;
式中:wij(t+1)為調整后的權值;wij(t)為當前的權值;η為學習率;t為訓練次數(shù)。
第六步:判斷系統(tǒng)誤差E其是否在允許的誤差范圍之內,如果在允許的誤差范圍之內,則結束,反之返回第二步。
2.3經(jīng)典BP神經(jīng)網(wǎng)絡的不足及改進
BP神經(jīng)網(wǎng)絡的不足主要包括BP神經(jīng)網(wǎng)絡的收斂速度慢,對于一些復雜問題,BP算法需要的訓練時間可能非常長;BP算法容易陷入局部極小值;通常憑借經(jīng)驗選擇網(wǎng)絡隱含層的層數(shù)和單元數(shù),在一定程度上也增加了網(wǎng)絡學習的負擔,降低了網(wǎng)絡的泛化能力。
本文主要針對BP神經(jīng)網(wǎng)絡收斂速度慢的和容易陷入局部極小值的問題進行改進,造成BP神經(jīng)網(wǎng)絡收斂速度過慢的主要原因在于,在網(wǎng)絡不斷的學習過程中,其學習率η始終保持不變,且學習率在選擇上一般憑借經(jīng)驗,如果學習率選擇過小,則模型收斂的過慢,如果學習率選擇過大,則模型權值可能修正過度,導致模型震蕩,反而降低了收斂效率。
因此,本文采用可變學習率的方法,來加快收斂速率,該方法的主要原理為當權值的改變真的減少了系統(tǒng)誤差,則可以進一步增大學習率,加快收斂步伐,反之降低學習率,減少模型震蕩??勺儗W習率η'可由式(10)表示。式中參數(shù)的典型取值為A=1.05,B=0.7,K=1.04。
為了降低BP網(wǎng)絡產(chǎn)生局部極小值的可能性,在修正權值時附加一個慣性因子mc(0<mc<1),如公式(11)所示,使權值的調節(jié)向著誤差曲面底部的平均方向變化,可以在一定程度降低BP網(wǎng)絡產(chǎn)生局部極小值的可能性。
BP網(wǎng)絡的訓練誤差不一定越小越好,過小的訓練誤差可能導致所建網(wǎng)絡的泛化性能不足。為了提高BP網(wǎng)絡的泛化能力,引入“提前停止”的方法,該方法將網(wǎng)絡訓練樣本首先劃分為訓練集及驗證集,其中訓練集用于網(wǎng)絡的訓練,驗證集用于在網(wǎng)絡訓練同時,監(jiān)控網(wǎng)絡的訓練過程,在訓練初始階段,驗證集形成的驗證誤差通常會隨之網(wǎng)絡的訓練誤差減小而減小,當網(wǎng)絡開始進入過度訓練時,驗證誤差就會逐漸增大,當驗證誤差達到一定程度后,網(wǎng)絡訓練將會強制提前停止,這樣可以有效的控制網(wǎng)絡的冗余性,提高網(wǎng)絡泛化能力。
2.4基于改進的BP神經(jīng)網(wǎng)絡乘客候車時間預測
利用改進的BP神經(jīng)網(wǎng)絡對乘客候車時間進行預測,模型的輸入層單元數(shù)由論文篩選的候車時間影響因素個數(shù)決定,由此輸入層單元數(shù)為五個,輸出層為提前購票乘客候車時間。
關于模型隱層的數(shù)量,與所要分析問題的復雜程度密切相關,目前還沒有一個的公認確定方法,大多數(shù)是憑借經(jīng)驗確定,經(jīng)驗表明,對于簡單的分析問題,一個隱層足夠滿足分析要求,當問題較為復雜時,采用雙層隱層結構,有利于提高神經(jīng)網(wǎng)絡的性能??紤]到候車時間的隨機性較強,且其影響因素眾多,因此論文選用雙層隱層結構。
關于單個隱層單元數(shù),通常采用經(jīng)驗估算公式進行確定,經(jīng)驗估算公式見表2。根據(jù)本模型的輸入單元數(shù)及輸出單元數(shù),依據(jù)經(jīng)驗公式,計算得到單個隱層單元數(shù)在3~13個之間較為合適,本文選取中間值8個,作為第一層隱層的單元數(shù),當采用多層隱層結構時,第一個隱層單元數(shù)與第二個隱層單元數(shù)的比約為3∶1時[13],可以提高網(wǎng)絡性能,因此確定第二個隱層的單元數(shù)為3。
表2 隱層單元數(shù)目的經(jīng)驗估算公式[14]
理論上講任意連續(xù)的非多項式函數(shù)都可以作為BP網(wǎng)絡的傳遞函數(shù),但Sigmoid型函數(shù)有其自身的優(yōu)點,如光滑性及方便求導,而在權值的反向傳播計算過程中,要計算傳遞函數(shù)的導數(shù),選用Sigmoid型函數(shù)作為傳遞函數(shù)可以節(jié)省計算的存儲空間并提高模型的收斂速度,常用的Sigmoid型函數(shù)有l(wèi)ogsig及tansig,因此確定第一個隱層的傳遞函數(shù)為logsig,第二個隱層的傳遞函數(shù)為tansig。為了擴大模型的輸出范圍,提高模型的泛化能力,確定輸出層的傳遞函數(shù)為purelin。最終確定的候車時間神經(jīng)網(wǎng)絡預測模型結構見圖7,學習算法采用改進后的BP算法。模型輸入變量中分類變量的編碼見表3。
圖7 候車時間BP神經(jīng)網(wǎng)絡預測模型
變量 變量編碼對外出行距離0~500km 500~1000km 1000~1500km 1 2 3樞紐熟悉程度很熟悉 較熟悉 不熟悉1 2 3受教育水平 研究生及以上 本科 大專及以下1 2 3市內交通方式步行 地鐵 私家車 出租車 公交車12 3 45
利用調查所得的北京南站720個乘客等候時間樣本數(shù)據(jù),對預測模型進行標定,隨機抽取四分之三的樣本用于訓練,剩余四分之一的樣本構成訓練過程中的驗證集,由于輸入?yún)?shù)中市內出行時間與其余幾個分類變量的編碼在數(shù)量級上差別較大,在模型訓練前首先利用matlab中的數(shù)據(jù)歸一化函數(shù)premnmx[15],對輸入?yún)?shù)進行歸一化處理。模型設定的訓練步數(shù)為8000,訓練期望誤差為0.005,模型參數(shù)A=1.05,B=0.7,K=1.04,mc=0.9。訓練過程中的訓練誤差與驗證誤差曲線見圖8,從圖8中可以看出在訓練初始階段,驗證集形成的驗證誤差通常會隨之網(wǎng)絡的訓練誤差減小而減小,當訓練步數(shù)達到4500步左右時,驗證誤差開始增大,訓練步數(shù)達到6217步時訓練強制停止,此時的訓練誤差為0.214。
圖8 訓練誤差與驗證誤差曲線
利用訓練過后的候車時間預測模型對哈爾濱西客站336個乘客候車時間調查樣本進行預測,等候時間調查結果與預測結果的對比見圖9,等候時間預測誤差見圖10,從圖9、圖10中可以看出,預測結果與調查結果較為吻合,大多數(shù)預測誤差在正負20min以內,平均相對預測誤差為11.2%。以上結果表明,預測結果具有一定的準確性,所構建的預測模型是可行的。
圖9 等候時間預測與調查結果對比
圖10 等候時間預測誤差
(1)通過對高鐵客運樞紐提前購票乘客候車時間時間分布特性的統(tǒng)計分析,發(fā)現(xiàn)乘客候車時間服從對數(shù)正態(tài)分布。
(2)利用方差分析手段分析了乘客的性別、年齡、出行目的、市內出行時間、市內交通方式、對樞紐的熟悉程度、受教育水平、對外出行距離8個因素對高鐵客運樞紐提前購票乘客候車時間的影響,依據(jù)分析結果發(fā)現(xiàn)市內出行時間、對外出行距離、對樞紐的熟悉程度、受教育水平、市內交通方式均對候車時間影響顯著。
(3)分析了傳統(tǒng)BP神經(jīng)網(wǎng)絡模型的不足,并給出了改進方法,利用改進的BP神經(jīng)網(wǎng)絡構建了高鐵客運樞紐提前購票乘客候車時間預測模型并標定了模型的參數(shù),利用實地調查數(shù)據(jù)驗證了模型的有效性。
[1]LorenzoBrunetta,LucaRighi,GiovanniAndreatta.Anoperations researchmodelfortheevaluationofanairportterminal:SLAM (simplelandsideaggregatemodel)[J].JournalofAirTransport Management,1999,5(3):161-175.
[2]Tumquist,M.A..Strategiesforimprovingreliabilityofbustransit service[J].TransportationResearchRecord,1981,818:7-13.
[3]WeiFan,RandyB.Machemehl.Characterizingbustransitwaiting times[C].ProceedingsoftheSecondMaterialSpecialtyConference oftheCanadian,2002.
[4]SeddonPA,DayMP.Buspassengerwaitingtimeingreat manchester[J].TrafficEngineeringandControl,1974,15(9):422-445.
[5]鐘紹林,王修華,何宇強,等.北京西站客流集散特征調查[J].鐵道運輸與經(jīng)濟,2005,27(2):37-39.
[6]何宇強,毛保華,陳紹寬,等.鐵路客運站旅客最高聚集人數(shù)計算方法研究[J].鐵路學報,2006,28(1):6-11.
[7]張?zhí)靷?鐵路客運站旅客聚集規(guī)律研究[J].鐵路學報,2006,31(1): 31-34.
[8]付延冰,陳治亞.基于隨機分析的公交站點乘客等車時間[J].系統(tǒng)工程,2009,27(6):119-122.
[9]WeldingP.I.Theinstabilityofaclose-intervalservice[J].Operational ResearchQuarterly,1957,8(3):133-142.
[10]OsunaE.E,NewellG.F.Centralstrategiesforanidealizedpublic transportsystem[J].TransportationScience,1972,6(1):52-72.
[11]SimonHaykin.神經(jīng)網(wǎng)絡原理[M].北京:機械工業(yè)出版社,2004.
[12]董長虹.Matlab神經(jīng)網(wǎng)絡與應用 [M].北京:國防工業(yè)出版社, 2005.
[13]王吉權.BP神經(jīng)網(wǎng)絡的理論及其在農(nóng)業(yè)機械化中的應用研究[D].遼寧沈陽:沈陽農(nóng)業(yè)大學,2011.
[14]飛思科技研發(fā)中心.神經(jīng)網(wǎng)絡理論與MATLAB7實現(xiàn)[M].北京:電子工業(yè)出版社,2005.
[15]張磊,郭蓮英.MATLAB實用教程[M].北京:人民郵電出版社, 2008.
U491.6
A
1009-7716(2016)11-0114-06
10.16799/j.cnki.csdqyfh.2016.11.033
2016-07-01
王波(1974-),男,遼寧本溪人,高級工程師,從事城市交通規(guī)劃研究工作。