吳 蔚
(廣州市城市規(guī)劃勘測設計研究院,廣東 廣州 510060)
每逢節(jié)假日,特別是春運期間,綜合客運樞紐區(qū)域具有人群聚集臨時性、突發(fā)性、人群類別復雜等特征。為保障對聚集人群的及時疏運,需要有技術手段實現(xiàn)綜合客運樞紐區(qū)域人群聚集等特征的動態(tài)獲取,并做出精確預測。溫慧英等[1]分析了公交站點間的相似性,提出一種基于模糊神經(jīng)網(wǎng)絡的預測方法,對公交客流進行短時預測;Du和Ren[2]以工業(yè)經(jīng)濟指數(shù)和柯布—道格拉斯理論為基礎,提出了一種列車客流流量預測模型,以幫助鐵路局對運行策略進行分析;李俊芳等[3]在BP神經(jīng)網(wǎng)絡的基礎上建立了車站客流預測模型,并以日本首都為例證明此模型能較好地反映圈層人口變量與客流之間的聯(lián)系;盧凱等[4]提出了一種基于KNN回歸算法的客運樞紐聚集人數(shù)組合預測方法,在分析客運樞紐客流聚集規(guī)律的基礎上,以數(shù)值相似和趨勢相似為原則運用KNN回歸算法預測區(qū)域聚集人數(shù)。目前,大多數(shù)學者通過時間序列法[5-6]、機器學習、神經(jīng)網(wǎng)絡等方法進行客流預測,卻忽視了與客流關系最為密切的列車趟次因素。
由于乘客能在線上購票系統(tǒng)、火車票代售點或火車票售票大廳進行車票預訂,故列車趟次的安排、列車時刻表與運行圖的制定需至少提前30天。若聚集人數(shù)與列車趟次存在某種關聯(lián)性,可利用列車趟次建立的聚集人數(shù)預測模型,為研究客運樞紐聚集人數(shù)預測提供基礎。
根據(jù)2017年廣州鐵路全年數(shù)據(jù),繪制廣州火車站和廣州南站列車趟次折線圖,如圖1所示。
從圖1可以看出,廣州火車站和廣州南站的列車趟次變化趨勢一致。但相比較而言,廣州南站列車趟次波動幅度較大,廣州火車站列車趟次波動幅度小。廣州南站列車趟次在非節(jié)假日期間有明顯的周期性:七天一周期,周五、周六、周日趟次多,周一較多,周二到周四較少;而廣州火車站列車趟次較為穩(wěn)定,非節(jié)假日列車趟次幾乎不變。在節(jié)假日和春運期間,列車趟次有明顯增加。
圖1 廣州火車站和廣州南站列車趟次折線圖
在當前條件下,無法直接獲得日客運樞紐聚集人數(shù)量。由于手機信令數(shù)據(jù)時間粒度為5 min,而鐵路數(shù)據(jù)為每日列車趟次,故在做客運樞紐聚集人數(shù)與列車趟次關聯(lián)性分析時需要將每日288個客流數(shù)據(jù)相加求和,獲得日區(qū)域總客流總量。這個指標不僅與日客運樞紐聚集人數(shù)量有關,還與平均等待時間有關。由于平均等待時間變化較小,此指標一定程度上能反映客運樞紐聚集人數(shù)情況。
分別對兩個火車站原始卡口數(shù)據(jù)表每五分鐘的客流量進行預處理:缺失值用插值法補全,若連續(xù)缺失半個小時及以上數(shù)據(jù),則剔除該天數(shù)據(jù);將異常值當成缺失值進行處理,將手機信令數(shù)據(jù)按市場份額換算為聚集人數(shù)。
分別統(tǒng)計兩個火車站每天的客運樞紐聚集人數(shù)總和。
根據(jù)圖1可以看出兩個車站的列車趟次在非節(jié)假日、節(jié)假日、春運、暑期有各自的隨時間分布特性,由于暑期除數(shù)值增大外其變化趨勢與非節(jié)假日類似,這里將其看作特殊的非節(jié)假日。故分成節(jié)假日、非節(jié)假日兩類,在其中抽取樣本,進行關聯(lián)性分析研究。
定距變量間的線性關系常用Pearson相關系數(shù)衡量。其絕對值越接近于1,說明兩個變量的線性相關性越強,越接近于0,相關性越弱。
計算公式:
式中,X,Y——兩個變量的值向量。
上步利用Pearson相關系數(shù)對兩個變量之間的相關性進行初步分析,相關性只描述線性相關程度,對于非線性的相關程度并不能很好地描述。故利用SPSS Statistics 22軟件繪制XY散點圖,擬合曲線,做回歸分析,計算復可決系數(shù),進一步探究兩個變量之間的關聯(lián)性。
復可決系數(shù)的計算公式為:
式中,y——觀測值向量,——擬合值向量。
為研究聚集人數(shù)與列車趟次的關聯(lián)性,將樣本分成兩類,分別求取Pearson相關系數(shù),使用SPSS Statistics 22繪制散點圖,擬合曲線,獲得復可決系數(shù),分析關聯(lián)程度。
選取2017年非節(jié)假日的廣州火車站和廣州南站客運樞紐聚集人數(shù)數(shù)據(jù)作為樣本,分別計算周一、周二、周三、……、周日廣州火車站和廣州南站聚集人數(shù)總量與列車趟次間的相關系數(shù),如表1所示。
表1 廣州火車站和廣州南站非節(jié)假日相關系數(shù)
從表1可以看出非節(jié)假日廣州火車站聚集人數(shù)總量與列車趟次之間的相關系數(shù)較為穩(wěn)定,大多在0.5上下波動,說明兩者間具有中等程度相關性;且整體的相關系數(shù)與各日相關系數(shù)差別不大,說明各日差別不大,平均等待時間較為一致。而廣州南站各日相關系數(shù)差別較大,整體相較之要小很多。說明各日間存在明顯差異,這一點從圖1中可以看出:廣州火車站非節(jié)假日列車趟次非常穩(wěn)定,而廣州南站列車趟次在非節(jié)假日存在周期性。廣州南站周二、周三、周四相關系數(shù)較小,周一、周五、周六、周日相關系數(shù)較大,而列車趟次在周二、周三、周四較少,周一、周五、周六、周日較多,猜測兩者間的相關性程度與列車的需求有關。
在周五、周六、周日、周一出行的人大多活動時間僅為周末,時間較緊,多選擇速度快乘坐時間短的高鐵,廣州南站需求大;而周二、周三、周四出行的人并不趕時間,愿意選擇普通火車,廣州火車站需求大,致使廣州火車站和南站的聚集人數(shù)與列車趟次的關聯(lián)性在不同時間存在較大差異。可見,列車需求越大聚集人數(shù)與列車趟次的關聯(lián)程度越高。
選取2017年春運期間的廣州火車站和廣州南站客運樞紐聚集人數(shù)數(shù)據(jù)作為節(jié)假日樣本,計算廣州火車站和廣州南站聚集人數(shù)總量與列車趟次間的相關系數(shù),如表2所示。
表2 廣州火車站和廣州南站春運相關系數(shù)
根據(jù)春運數(shù)據(jù)繪制散點圖,擬合曲線,得到圖2。總的來說,春運期間,廣州火車站和廣州南站的聚集人數(shù)與列車趟次的關聯(lián)性程度較高。根據(jù)Pearson系數(shù),可以看出節(jié)前廣州火車站的聚集人數(shù)與列車趟次的關聯(lián)性大于廣州南站,而節(jié)后廣州南站大于廣州火車站。原因可能有供需關系有關。節(jié)前多為工人學生返鄉(xiāng),大多選擇廣州火車站,火車站需求多,滿載率高,致使廣州火車站的聚集人數(shù)與列車趟次間呈較高關聯(lián)性。同理,節(jié)后多為廣州出游,廣州南站需求大,聚集人數(shù)與列車趟次間關聯(lián)性高。
圖2 2017年春運(40天)客運樞紐聚集人數(shù)總量散點圖
聚集人數(shù)總和與聚集人數(shù)和等待時間有關。在分析聚集人數(shù)總和與列車趟次之間的關聯(lián)性時,需要對聚集人數(shù)與列車趟次以及等待時間與列車趟次之間的關系進行分析,如圖3、圖4所示。
圖3 平均等待時間隨列車趟次變化曲線圖
圖4 日客運樞紐聚集人數(shù)隨列車趟次變化曲線圖
在列車趟次和聚集人數(shù)都較少,如非節(jié)假日情況下,此時乘客對于列車的需求遠小于供給,隨著列車趟次的增加,聚集人數(shù)也增加,不過漲幅較小,且不會因擁擠排隊而引起乘客額外滯留,平均等待時間較為穩(wěn)定。當列車趟次增加到一定程度,如節(jié)假日情況下,聚集人數(shù)大幅增加,此時乘客對于列車的需求漸漸接近供給,乘客需要更多的時間排隊安檢、驗身份證、檢票等,平均等待時間增加。隨著列車趟次增加,區(qū)域內人數(shù)逐漸接近飽和,此時工作人員需要采用一些管制措施進行限流。
該文以廣州火車站和廣州南站為例,通過計算相關系數(shù)、繪制散點圖、曲線擬合進行回歸分析,闡述了客運樞紐聚集人數(shù)與列車趟次之間的關聯(lián)程度。提出了兩者的關聯(lián)程度與客運需求有關,需求越大,兩者的關聯(lián)性越強。最后,根據(jù)數(shù)據(jù)和實際情況分析,得到乘客平均等待時間以及聚集人數(shù)隨列車趟次的變化曲線圖。