楊 靜, 代盛旭, 張紅亮, 汪 波
(1.北京建筑大學土木與交通工程學院, 北京 100044; 2.北京交通大學交通運輸學院, 北京 100044; 3.北京市交通信息中心, 北京 100073)
大型活動散場時,地鐵車站產(chǎn)生的大規(guī)??土髟诙虝r間內(nèi)聚集和消散過程,是對車站集散能力的重要考驗,也是車站管理人員的關(guān)注重點。車站進站客流的變化情況與大型活動特性緊密相關(guān),但又受到很多隨機因素影響,整體呈現(xiàn)較強的集中性和隨機性,以5~15 min為時間跨度進行短時進站客流量預(yù)測更能夠適應(yīng)車站車流的時變性特點。
在常規(guī)情況下,地鐵車站主要承擔的是通勤客流,這部分客流的規(guī)律性較強,可采用時間序列方法進行短時預(yù)測,楊靜等[1]提出一種基于小波變換與自回歸滑動平均(auto-regressive moving average, ARMA)的組合預(yù)測模型,對于常態(tài)客流的短時預(yù)測效果較好,差分整合移動平均自回歸模型(auto-regressive integrated moving average, ARIMA對于常規(guī)情況的車站短時客流需求也具有較好的預(yù)測效果[2]。對于非常規(guī)的大客流,如自然災(zāi)害、突發(fā)事故等情況,當前研究更多地關(guān)注大客流的傳播和消散機理[3]。事實上,部分非常規(guī)大客流是可預(yù)知的,例如:大型活動的散場客流,車站工作人員在大型活動舉辦前會收到大客流預(yù)警,可以根據(jù)已知信息制訂預(yù)案[4]。有關(guān)大型活動的客流研究較多的集中于客流特性分析。Simon[5]基于GPS數(shù)據(jù)和活動數(shù)據(jù)預(yù)測了活動散場時段的交通流量。崔洪軍等[6]基于宏觀交通流理論,利用觀眾步行速度的概率分布,確定了觀眾達到停車場的流量分布規(guī)律。王興川等[7]將活動期間的客流劃分為背景客流與活動客流,并分別采用改進ARIMA模型對其進行預(yù)測。
隨著計算機運算能力的飛速增長,神經(jīng)網(wǎng)絡(luò)在客流預(yù)測中展現(xiàn)出了更強的適用性,任崇嶺等[8]基于小波神經(jīng)網(wǎng)絡(luò)模型預(yù)測了地鐵車站常態(tài)客流,論文模型的預(yù)測精度顯著高于時間序列模型。Li等[9]基于徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測了計劃大型活動(planned special events, PSEs)的客流需求,徑向基神經(jīng)網(wǎng)絡(luò)在BP(back propagration)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上對激活函數(shù)進行了改進,然而該網(wǎng)絡(luò)的各計算層均為線性計算層,難以直接分析輸入變量的相互關(guān)聯(lián)。近年來的深度學習結(jié)構(gòu)基于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)加入更多的線性計算層,輸入變量通過多層傳遞間接實現(xiàn)組合分析。Nicholas等[10]建立了包含21層線性計算層的深度神經(jīng)網(wǎng)絡(luò)預(yù)測了某籃球比賽的短時交通流量。然而,網(wǎng)絡(luò)深度直接影響著模型計算量,網(wǎng)絡(luò)深度過高時會出現(xiàn)梯度衰減與噪聲放大等計算問題。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)作為一種新的深度學習結(jié)構(gòu),通過引入卷積層、池化層等非線性計算層,能夠?qū)斎脒M行組合分析,并且保持較低的網(wǎng)絡(luò)深度,對于預(yù)測短時公交客流[11]、地鐵換乘客流[12]、路網(wǎng)短時交通流[13-14]以及車頭時距[15]均具有較高的精確度。大型活動散場期間的地鐵車站客流影響因素較多且相互關(guān)聯(lián),擬采用卷積神經(jīng)網(wǎng)絡(luò)對這部分客流進行預(yù)測。
綜上,擬利用卷積神經(jīng)網(wǎng)絡(luò)提取客流序列與活動特征,經(jīng)過卷積層、池化層與線性計算層的逐層計算,擬合活動特征與客流時空分布的映射關(guān)系,并針對問題特性對模型進行適應(yīng)性優(yōu)化,建立一個適用于大型活動散場期間地鐵車站的短時進站客流預(yù)測模型。
在大型活動散場期間,進站客流T(t)根據(jù)發(fā)生原理的不同可以分為兩個部分:不受大型活動影響的背景客流B(t)和由大型活動引起的活動客流A(t)。背景客流屬于常規(guī)客流,具有一定的規(guī)律性,可利用同期歷史數(shù)據(jù)采用一般時間序列方法預(yù)測;活動客流的分布時段集中、隨機性強,與大型活動特性緊密相關(guān),需要進行單獨分析,因此將活動客流從進站客流中拆分。利用時間序列方法預(yù)測得到某一時段t內(nèi)的背景客流B(t),初步拆分的活動客流A(t)即為進站客流T(t)與B(t)的差值。為保證活動客流在分布時段上的連續(xù)性,需要對A(t)進行降噪處理,摒除背景客流短時波動的干擾,以得到最終的活動客流數(shù)據(jù)。
設(shè)活動客流A(t)僅在n個活動影響時間TAi∈[ai,bi](i=1,2,…,n)內(nèi)出現(xiàn),為避免客流波動變化的噪聲,記活動影響時間上下界ai、bi滿足
bi-ai≥δtint
(1)
式(1)中:tint為自動售檢票(automatic fare collection, AFC)數(shù)據(jù)的統(tǒng)計時間間隔;δ為降噪因子,δ∈N。降噪因子δ的取值越大,對活動客流的降噪效果越好,取值越小,活動客流的時空特征提取越完整。當δ取0時,拆分的活動客流與實際流量變化基本一致,但客流曲線存在較多的噪聲,不利于計算分析,如圖1(a)所示。當δ取較大值6時,拆分時的降噪過程消除了活動客流較為稀疏的部分,保留了活動客流的峰值特征,如圖1(b)所示。δ的取值應(yīng)根據(jù)大型活動的性質(zhì)確定。如演唱會、體育賽事等活動結(jié)束時客流到達車站較為集中,則δ可以取較大值,使活動影響時間的最小區(qū)間δtint較大,消除由于客流的隨機性帶來的噪聲。對于持續(xù)時間較長,且客流到達分散的活動,例如商品交易、展覽類活動,δ則應(yīng)取較小值。
基于客流拆分結(jié)果,針對活動客流特征進行分析。區(qū)別于常態(tài)客流,活動客流分布不僅與前向時段的進站客流量相關(guān),還需要考慮大型活動的類型,大型活動的舉辦地點,大型活動的規(guī)模以及活動舉辦時間等因素。
由于活動性質(zhì)的不同,活動客流的分布存在明顯差異。商品交易、展覽類活動在一天內(nèi)不具有明顯的活動起止時間,活動客流分布特征表現(xiàn)為低峰值,持續(xù)時間長。體育賽事、演唱會類活動的人員到達及離開則具有明顯的峰值,活動客流分布特征表現(xiàn)為高峰值,持續(xù)時間短。將拆分后的活動客流進行K-means聚類,根據(jù)活動客流的分布特征,聚類指標選取為客流峰值與活動客流總量的比值,以及活動客流的持續(xù)時長,將活動客流分為兩類,聚類中心點的活動客流分布如圖2所示,Ⅰ類對應(yīng)展覽類活動客流,Ⅱ類對應(yīng)演唱會類活動,并按照聚類結(jié)果將客流樣本批量添加標簽,完成活動類型的特征標記。
圖1 降噪前后的拆分活動客流Fig.1 Split activity passenger flow before and after noise reduction
圖2 活動客流的時間分布特征Fig.2 Time distribution characteristics of active passenger flow
大型活動場館鄰近軌道交通站點的進站客流高峰開始時刻等于活動散場時刻加上前往車站所花費的時間。由于地鐵客流數(shù)據(jù)為自動售檢票AFC刷卡數(shù)據(jù),該時間距離除靜態(tài)的步行時間,還包含了站外的限流排隊時間。對于具體的場館及其鄰近車站,步行時間為常數(shù);限流排隊時間由該時段的活動客流量決定,活動客流量越大,限流排隊時間越長,進站客流在AFC數(shù)據(jù)上呈現(xiàn)的峰值出現(xiàn)越晚。
根據(jù)大型活動籌辦方的預(yù)計活動人數(shù),以及選取軌道交通出行方式的分擔比例,可以得到活動客流總量的期望值??紤]到大型活動籌辦方的預(yù)計活動人數(shù)通常以不同置信水平的區(qū)間給定,可將活動的預(yù)計活動客流量視為隨機變量且對稱分布。
對于散場時間集中的大型活動,活動的起止時間顯著影響了活動客流在時間軸上的分布,在活動特征標記時,將活動開始時間和活動結(jié)束時間轉(zhuǎn)換為時間戳標記。
本文模型包含兩個非線性計算層,利用卷積核移動組合提取活動特征與客流序列,線性計算層計算效率較高,但只能逐一提取活動特征,無法捕捉特征之間的相互關(guān)聯(lián)。因此選用了非線性計算層與線性計算層組合的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),利用非線性計算層提取活動特征傳遞至線性計算層輸出活動客流的時空分布,以獲得更好的預(yù)測效果。
區(qū)別于常態(tài)客流的輸入層,針對大型活動散場客流的卷積神經(jīng)網(wǎng)絡(luò)輸入層除了包括進站客流的時間序列,額外加入活動特征相關(guān)的4個輸入變量:活動類型、活動地點、活動規(guī)模和活動時間。其中活動類型為boolean變量,分別代表展覽類活動與演唱會類活動;活動地點與活動規(guī)模為數(shù)值變量;活動時間為boolean變量序列,結(jié)合時間戳序列反映該時段是否正在舉辦活動。
卷積神經(jīng)網(wǎng)絡(luò)的主要計算層包括卷積層、池化層與全連接層。卷積層通過提取卷積核覆蓋區(qū)域的變量進行組合并提取特征,隨著卷積核的逐步移動,提取所有的組合形式以特征圖的形式輸出至池化層。卷積操作可表示為
(2)
式(2)中:l∈N,為網(wǎng)絡(luò)層數(shù);x(l)為各計算層張量;x(0)為輸入層張量;wi,j為卷積核記錄的權(quán)重;H和W為卷積核尺寸。(il+1,jl+1)為卷積核中心的位置坐標,并滿足
0≤il+1 (3) 0≤jl+1 (4) 針對活動客流數(shù)據(jù)的突變性與波動性,取最大池化對提取的客流特征進行池化,保留了活動客流峰值的時空特征,加強了特征的稀疏表達,最大池化為 (5) 全連接層的功能是將提取的特征表示映射到樣本標記空間,將一系列卷積池化層的特征圖以張量的形式輸出,該層是一個普通的前饋網(wǎng)絡(luò),可記為 x(l+1)=f(wx(l)+b) (6) 式(6)中:w為權(quán)重矩陣;b為偏置矩陣;f為激活函數(shù),選取Relu函數(shù)。 構(gòu)建完畢的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括兩個非線性計算層x(1)、x(2),以及三個線性計算層x(3)、x(4)、x(5),輸入層x(0)通過5個計算層輸出客流量預(yù)測值y,實現(xiàn)活動特征與活動散場期間進站客流量的映射關(guān)系構(gòu)建,如圖3所示??蓪⒃撚成潢P(guān)系以隱函數(shù)表示為 y=x(5)=F(x(0)) (7) 圖3 針對大型活動散場客流的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Convolution neural network structure for large-scale event scattered passenger flow 大型活動散場時的地鐵進站客流具有明顯的集中到達特性,在客流時間曲線上表現(xiàn)為突變點,流量自該點起出現(xiàn)陡增。在此突變點,客流量急劇變化,參數(shù)更新的誤差將被放大,為消除這部分誤差,計算機會重復進行的迭代,容易造成過擬合現(xiàn)象。因此在目標函數(shù)中引入模型復雜度懲戒項,將神經(jīng)網(wǎng)絡(luò)的權(quán)重變量w以2-范數(shù)形式加入目標函數(shù),進而弱化參數(shù)更新的誤差。優(yōu)化后的目標函數(shù)為 (8) 式(8)中:L為損失函數(shù);y為預(yù)測流量向量;y*為實際流量向量;wl為第l層神經(jīng)元與下層神經(jīng)元連接的權(quán)重向量。 神經(jīng)網(wǎng)絡(luò)的訓練過程通過誤差的反向傳播實現(xiàn),CNN網(wǎng)絡(luò)通常使用隨機梯度算法及其變體。將使用Adam算法作為CNN的訓練算法。作為一種矩估計算法,Adam算法[16]采用梯度的矩估計代替了傳統(tǒng)最優(yōu)化算法的Jacobi陣或Hessian陣,單次迭代的計算效率較高。針對活動客流集中到達時Adam算法學習率的更新問題,在Adam算法的學習率衰減項Δθt的更新規(guī)則中補充一階梯度差懲戒項,當兩個迭代點的一階梯度差值較大時,降低學習率的變化速度,以較小的迭代步長進行尋優(yōu),表達式為 (9) 式(9)中:θ為學習率;η為超參數(shù)。 地鐵短時客流預(yù)測流程中,主程序部分為CNN的前向傳播結(jié)構(gòu),如圖4所示,將輸入數(shù)據(jù)預(yù)處理為訓練集和測試集,模型初始化后將訓練集分次喂入神經(jīng)網(wǎng)絡(luò),通過正則化的損失函數(shù)計算預(yù)測值與真實值的誤差,調(diào)用Adam算法并接受其返回值完成CNN的訓練,將測試集輸入訓練完畢的CNN模型,進行預(yù)測并計算評價指標,實現(xiàn)地鐵活動客流的預(yù)測,并采用ARMA模型對背景客流進行預(yù)測,最終實現(xiàn)大型活動期間的地鐵短時進站客流預(yù)測。 圖4 基于Adam-CNN的地鐵短時客流預(yù)測流程Fig.4 Short-term passenger flow prediction process of subway based on Adam-CNN 研究采用北京地鐵8號線奧林匹克公園站從2018年8月—9月的AFC數(shù)據(jù),訓練集選取8月11日、8月24日、9月8日、9月9日共4 d的進站AFC數(shù)據(jù),測試集選取8月25日的AFC數(shù)據(jù),預(yù)測時間間隔為5 min。經(jīng)車站工作人員確認,以上5 d大型活動均是鳥巢體育館舉辦演唱會,活動時段為當日19:00—22:00,平峰時段場館至車站步行時間12 min,預(yù)計活動規(guī)模為(1.2~1.4)萬人。 實驗環(huán)境采用Ubuntu16.04版本的Linux操作系統(tǒng),學習框架為Tensorflow,軟件編程環(huán)境為Python2.7。對9種不同CNN網(wǎng)絡(luò)結(jié)構(gòu)的性能進行了測試,結(jié)果如表1所示??芍?,測試集準確率最高的兩種網(wǎng)絡(luò)結(jié)構(gòu)分別為1層卷積層、卷積核尺寸3×3,以及2層卷積層、卷積核尺寸4×4。在性能相差不大的前提下,考慮選取規(guī)模較小的網(wǎng)絡(luò)結(jié)構(gòu),即1層卷積層、卷積核尺寸3×3。卷積核個數(shù)均為64,卷積步長取3,保留卷積前變量個數(shù),池化層取最大池化。全連接層神經(jīng)元個數(shù)為512,激活函數(shù)選擇Relu函數(shù),Adam算法的超參數(shù)u和v分別取0.9和0.999,ε取10-8,權(quán)值與偏置按正態(tài)分布隨機賦值。 表1 不同CNN結(jié)構(gòu)的性能對比Table 1 Performance comparison of different CNN structures 首先使用上文所建Adam-CNN預(yù)測模型對活動客流進行預(yù)測,并與較為傳統(tǒng)的基于隨機梯度下降法(stochastic gradient descent, SGD)的SGD-CNN模型,以及時間序列方法ARMA作對比,結(jié)果如表2所示。采用如下3個評價指標比較兩個模型的預(yù)測效果:平均絕對誤差MAE、平均絕對百分誤差MAPE以及擬合度R2。 從圖5所示的預(yù)測曲線來看,ARMA預(yù)測的進站客流峰值存在一定的滯后性,約為2個統(tǒng)計時間間隔(10 min)。從總體統(tǒng)計指標來看,ARMA預(yù)測的活動客流曲線擬合度R2=0.783,誤差較大,難以直接應(yīng)用于大型活動期間的活動客流預(yù)測。預(yù)測結(jié)果對比顯示,SGD-CNN與Adam-CNN預(yù)測精度顯著高于ARMA模型,對于活動散場期間的客流預(yù)測均具有較好的適用性,其中Adam-CNN預(yù)測5 min內(nèi)活動客流進站人數(shù)絕對誤差MAE為16.60人次,與實際活動客流曲線的擬合度R2達到0.992,絕對百分誤差MAPE為5.96%,具有更高的預(yù)測精度。 表2 活動客流預(yù)測結(jié)果對比Table 2 Comparison of forecast results of activity passenger flow 圖5 Adam-CNN模型活動客流預(yù)測結(jié)果Fig.5 Forecast results of activity passenger flow of Adam-CNN model 之后,采用ARMA對背景客流B(t)進行預(yù)測,訓練數(shù)據(jù)選取大型活動舉辦前6 d的數(shù)據(jù),預(yù)測結(jié)果與活動客流A(t)按統(tǒng)計時段累加,得到大型活動散場期間的總進站客流T(t),對應(yīng)圖6所示的進站客流預(yù)測值。從統(tǒng)計指標看(表3),總進站客流的平均絕對誤差MAE為14.13人,由于平峰時段客流量較低,總進站客流的MAPE上升至7.35%,擬合度R2=0.990。從圖7中可以看出,北京地鐵奧林匹克公園站各時段的客流預(yù)測值與實際值均分布在45°線附近。分析結(jié)果表明,基于Adam-CNN網(wǎng)絡(luò)的地鐵短時客流預(yù)測模型精度較高,對客流峰值預(yù)測準確,是一種適用于大型活動散場期間的地鐵短時進站客流的預(yù)測方法。 表3 大型活動散場期間地鐵短時進站客流預(yù)測結(jié)果對比Table 3 Prediction result comparison of short-term passenger flow of metro station in the period of planned special events 圖6 大型活動散場期間進站客流預(yù)測結(jié)果Fig.6 Forecast results of inbound passenger flow during large-scale activities 圖7 大型活動散場期間進站客流預(yù)測擬合精度Fig.7 Fitting accuracy of inbound passenger flow forecast during large-scale activities 基于深度學習框架,將客流序列與活動客流特征作為模型輸入,利用卷積層對活動客流特征進行提取,并經(jīng)過池化層與全連接層逐層計算,建立了活動特征與客流時空分布的映射關(guān)系,并基于Adam算法對CNN模型進行適應(yīng)性優(yōu)化,提出了一種適用于大型活動散場期間地鐵車站的客流預(yù)測模型。 非常態(tài)客流的預(yù)測問題是當前交通規(guī)劃和運營中的一個重大挑戰(zhàn),當前研究大多集中在短期或長期預(yù)測范圍內(nèi)的常規(guī)客運需求預(yù)測,對大型活動散場期間的短時客流預(yù)測研究較少。針對非定期舉辦的大型活動短時進站客流需求進行研究,對于城市軌道交通運營單位,尤其是大型活動場館臨近的地鐵車站及所在線路,向乘客實時傳達服務(wù)信息,根據(jù)客流需求合理地分配運輸資源,有序開展站內(nèi)工作組織等工作提供有力支撐。3.2 基于Adam算法的模型適應(yīng)性優(yōu)化
3.3 基于Adam-CNN的地鐵短時客流預(yù)測流程
4 案例分析
4.1 數(shù)據(jù)描述
4.2 模型參數(shù)設(shè)置
4.3 預(yù)測結(jié)果分析
5 結(jié)論