趙建立,石敬詩(shī),孫秋霞,任 玲,劉彩紅
(1.山東科技大學(xué)a.計(jì)算機(jī)科學(xué)與工程學(xué)院,b.數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,山東青島266590;2.青島地鐵集團(tuán)有限公司,山東青島266000)
隨著數(shù)字城市的飛速發(fā)展,以及IC 卡的大量普及,公共出行的數(shù)據(jù)挖掘與預(yù)測(cè)成為新的研究熱點(diǎn).本文分析地鐵站的歷史刷卡數(shù)據(jù),對(duì)多站點(diǎn)的進(jìn)出客流量進(jìn)行短時(shí)預(yù)測(cè).不僅可以幫助出行者合理地選擇出行路線,規(guī)避交通擁堵;也可幫助地鐵運(yùn)管部門(mén)提前安排車(chē)次調(diào)度,部署站點(diǎn)安保措施,具有重要的研究?jī)r(jià)值.
軌道交通流量預(yù)測(cè)模型主要分為3類.第1類是基于時(shí)間序列的統(tǒng)計(jì)模型,白麗[1]利用ARIMA模型分析地鐵站每日客流量的歷史數(shù)據(jù),實(shí)現(xiàn)常態(tài)的日客流量預(yù)測(cè),但其局限于單變量預(yù)測(cè)與時(shí)間分析,沒(méi)有考慮空間因素.第2 類是基于非參數(shù)的預(yù)測(cè)模型,郇寧等[2]基于改進(jìn)的K 最近鄰算法,實(shí)現(xiàn)軌道交通中進(jìn)站客流的短時(shí)預(yù)測(cè);Tang等[3]構(gòu)建時(shí)空長(zhǎng)短期記憶(ST-LSTM)網(wǎng)絡(luò),用于多個(gè)站點(diǎn)的出站客流量預(yù)測(cè).這兩類模型都實(shí)現(xiàn)了多站點(diǎn)的同步預(yù)測(cè),但沒(méi)能實(shí)現(xiàn)進(jìn)出客流量的同步預(yù)測(cè).
第3類是基于多特征提取的混合模型.Ma等[4]將地鐵客流數(shù)據(jù)先轉(zhuǎn)換為客流圖像與時(shí)間序列,再運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和雙向LSTM 分別提取空間與時(shí)間特征;該方法需要對(duì)研究區(qū)域進(jìn)行網(wǎng)格劃分,大量無(wú)用網(wǎng)格會(huì)增加計(jì)算負(fù)擔(dān).Liu等[5]利用LSTM 挖掘時(shí)間特征,基于嵌入層與全連接層融合空間特征、外部環(huán)境及地鐵運(yùn)營(yíng)等多源信息.Zhang 等[6]結(jié)合殘差網(wǎng)絡(luò)、圖卷積網(wǎng)絡(luò)和LSTM構(gòu)建客流量預(yù)測(cè)模型,并融合了天氣與空氣狀況.多源信息的加入可提升預(yù)測(cè)精度,但多源信息的收集與處理難度大,使模型過(guò)于復(fù)雜.
綜上,本文構(gòu)建一個(gè)新的適用于軌道交通的客流量預(yù)測(cè)模型.該模型簡(jiǎn)潔、易操作,聚焦于客流量的時(shí)空特征挖掘.將每個(gè)時(shí)間段進(jìn)出站的客流量數(shù)據(jù)用特定的張量格式表示,利用卷積神經(jīng)網(wǎng)絡(luò)與殘差網(wǎng)絡(luò)分別建模,挖掘時(shí)間與空間特征.最后通過(guò)加權(quán)融合的方式,得到目標(biāo)時(shí)間段中多站點(diǎn)進(jìn)出客流量的預(yù)測(cè)結(jié)果.
地鐵站的短時(shí)客流量預(yù)測(cè)是一個(gè)典型的時(shí)空序列預(yù)測(cè)問(wèn)題,即利用已有的r個(gè)歷史觀測(cè)值預(yù)測(cè)下一個(gè)時(shí)間步的客流量Xt,其中,n表示時(shí)間步編號(hào).表示第t個(gè)時(shí)間步m個(gè)站點(diǎn)的客流量觀測(cè)值,其中,2 為進(jìn)站與出站兩種客流,m為站點(diǎn)的總數(shù)量,Si(t)為第t個(gè)時(shí)間步站點(diǎn)i(1 ≤i≤m)的觀測(cè)值,即
如圖1 所示,輸入模型的觀測(cè)張量可以表示為X∈?r×2×m,圖中,Si表示第i個(gè)站點(diǎn)的客流量觀測(cè)值.
圖1 地鐵站的進(jìn)出客流量Fig.1 Subway station passenger inflow and outflow
地鐵作為通勤人員的重要交通工具,其客流量波動(dòng)具有一定的時(shí)間與空間特征.對(duì)于單個(gè)地鐵站,主要考慮時(shí)間特征的挖掘,例如工作日,地鐵客流會(huì)出現(xiàn)早晚高峰,車(chē)站的人流量相對(duì)較大;對(duì)于多站點(diǎn)客流量預(yù)測(cè),除時(shí)間特征外還需考慮空間特征的影響,例如某一站點(diǎn)的進(jìn)站客流突然增加,會(huì)影響其他站點(diǎn)的出站客流量.為充分挖掘這些時(shí)空特征,本文構(gòu)建混合深度學(xué)習(xí)模型.首先,將二維卷積神經(jīng)網(wǎng)絡(luò)(Two Dimensional Convolutional Neural Network, CNN2D)與殘差網(wǎng)絡(luò)(Residual Network,ResNet)組成深層網(wǎng)絡(luò)挖掘空間特征,利用一維卷積神經(jīng)網(wǎng)絡(luò)(One Dimensional Convolutional Neural Network, CNN1D)挖掘時(shí)間特征;然后,基于參數(shù)矩陣融合方式,將時(shí)空特征加權(quán)融合為Xfusion;最后,通過(guò)激活函數(shù)得到最終預(yù)測(cè)值模型簡(jiǎn)稱為ResNet-CNN1D模型,結(jié)構(gòu)如圖2所示.
挖掘空間特征的模型是由二維卷積層(CNN2D,簡(jiǎn)稱CNN)和殘差網(wǎng)絡(luò)(ResNet)組成的深層網(wǎng)絡(luò).將客流量的觀測(cè)張量X∈?r×2×m輸入第一個(gè)二維卷積層,連續(xù)堆疊L個(gè)殘差單元,再加入一個(gè)二維卷積層,其中,二維卷積結(jié)構(gòu)如圖3所示.
圖2 ResNet-CNN1D 模型Fig.2 ResNet-CNN1D model
圖3 中,卷積核大小為3×3,單個(gè)卷積層只能考慮局部空間的依賴性,適當(dāng)增加網(wǎng)絡(luò)深度可以相應(yīng)增加最后卷積層的感知野,擴(kuò)大空間依賴范圍[7].地鐵站的空間關(guān)系中,并不局限于鄰近站點(diǎn),以青島市地鐵3號(hào)線刷卡數(shù)據(jù)為例,統(tǒng)計(jì)1周內(nèi)乘客出行的OD(Origin-Destination)信息,如圖4 所示.可知,乘客地鐵出行的OD 站點(diǎn)間隔為6 站的最多,休息日與工作日的短距離出行(1 站以內(nèi))分別占總出行量的6.2%和5.3%.因此,有必要設(shè)計(jì)一個(gè)多層卷積網(wǎng)絡(luò),捕捉間隔遙遠(yuǎn)站點(diǎn)間的空間依賴關(guān)系.青島市地鐵3號(hào)線的站點(diǎn)數(shù)量為22個(gè),若要挖掘所有站點(diǎn)之間的依賴關(guān)系,至少需要10 個(gè)連續(xù)的卷積層堆疊.
網(wǎng)絡(luò)深度對(duì)模型的空間特征挖掘有很大幫助,但深度過(guò)度增加,模型精度會(huì)停滯甚至下降.針對(duì)這種“退化”現(xiàn)象,He等[8]提出使用殘差網(wǎng)絡(luò)幫助模型訓(xùn)練.圖5是ResNet-CNN1D模型中構(gòu)建的殘差單元,其公式為
(2) 隨著排水管壁面積的增大,整個(gè)系統(tǒng)的滲流量也隨之增大,土體細(xì)顆粒流失速度加劇,土體內(nèi)部滲流通道的發(fā)育速度也加快。在試驗(yàn)過(guò)程中,不同土體梯度比Gr值在下降一段時(shí)間后開(kāi)始緩慢上升(如圖3所示),分析可知:在水的滲流力和壓重的雙重作用下,土體內(nèi)細(xì)顆粒被帶動(dòng)向排水管壁表面及孔隙中移動(dòng),土體內(nèi)的滲流通道開(kāi)始發(fā)育,細(xì)顆粒在流經(jīng)排水管壁時(shí)會(huì)滯留在排水管壁表面或者淤積在排水管壁孔隙中,當(dāng)滲流通道發(fā)育完全后,梯度比GR值不再下降而是隨著滯留在排水管壁表面或淤積在排水管壁孔隙中的細(xì)顆粒含量的增大而緩慢上升。
圖3 二維卷積Fig.3 Two-dimensional convolution
圖4 OD 距離統(tǒng)計(jì)Fig.4 OD distance statistics
式中:X(l+1)為殘差單元的潛在映射;X(l)為殘差單元的輸入;f(·)為殘差函數(shù),即神經(jīng)網(wǎng)絡(luò)中實(shí)際訓(xùn)練的映射,本文利用2個(gè)激活層(ReLU)和2個(gè)二維卷積層構(gòu)建殘差函數(shù);θ(l)為在第l層中所有的可學(xué)習(xí)參數(shù).ResNet-CNN1D 模型中L=4,這樣就構(gòu)建成10 個(gè)卷積層堆疊的深層殘差網(wǎng)絡(luò),用于捕捉站點(diǎn)間的空間特征Xspatial.
利用一維卷積網(wǎng)絡(luò)(CNN1D)捕捉客流量的時(shí)間特征.CNN1D 使卷積核在時(shí)間軸上執(zhí)行特征檢測(cè),對(duì)每個(gè)輸入序列執(zhí)行相同的輸入變換,故在時(shí)間軸上某個(gè)位置學(xué)到的特征稍后可以在其他位置被識(shí)別.相比于廣泛應(yīng)用的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),CNN1D 不僅可以更好地并行訓(xùn)練,減少模型訓(xùn)練時(shí)間;還不受先前時(shí)間步的數(shù)據(jù)限制,可以更好地捕獲數(shù)據(jù)的急劇變化[9],比如早晚高峰期間客流量的劇烈波動(dòng).
圖5 殘差單元Fig.5 Residual unit
圖6 為CNN1D 結(jié)構(gòu)示意圖,先將輸入序列重塑為X∈?(r×2)×m,其中,r為輸入序列的時(shí)間步數(shù)量,r×2 為輸入序列的長(zhǎng)度.卷積核u∈?k×m,k為卷積核的長(zhǎng)度.序列X與卷積核u進(jìn)行卷積,可以生成一個(gè)特征映射E∈?(r×2-k+1)×1,即
式中:*表示卷積;b為偏置項(xiàng);g(·)為激活函數(shù).
圖6 CNN1D 結(jié)構(gòu)示意圖Fig.6 Schematic diagram of CNN1D structure
利用維度相同的n個(gè)卷積核,生成n個(gè)特征映射,重新排列組成序列X的特征圖V∈?(r×2-k+1)×n,即
式中:“;”為列向量的連接;En為由第n個(gè)卷積核生成的特征映射.
ResNet-CNN1D模型采用參數(shù)矩陣融合方法,將空間特征Xspatial與時(shí)間特征Xtemporal進(jìn)行加權(quán)融合,公式為
式中:×為Hadamard 乘積;為目標(biāo)時(shí)間t的預(yù)測(cè)值;Wspatial,Wtemporal為可學(xué)習(xí)的參數(shù)矩陣,分別調(diào)整融合結(jié)果受空間特征與時(shí)間特征的影響程度;融合結(jié)果通過(guò)激活函數(shù)g(·)得到最終預(yù)測(cè)值.
數(shù)據(jù)來(lái)源2017年8月1日~10月31日青島市地鐵3號(hào)線進(jìn)出站刷卡數(shù)據(jù).青島市區(qū)當(dāng)時(shí)只有這一條地鐵線路,不存在地鐵換乘因素.3 號(hào)線從青島站到青島北站,一共22 個(gè)站點(diǎn);首、末班車(chē)時(shí)間分別為06:00 和23:15,以15 min 等間隔劃分,92 d里共劃出6 348 個(gè)時(shí)間步.將前89 d 作為訓(xùn)練集,后3 d作為測(cè)試集.
為判斷模型預(yù)測(cè)效果,選用平均絕對(duì)誤差(MAE,單位:人次),均方根誤差(RMSE,單位:人次)量化分析,誤差計(jì)算公式為
為驗(yàn)證模型有效性,選取5 個(gè)經(jīng)典模型(ARIMA,SVR,LSTM,CLTFP[10],ConvLSTM)與ResNet-CNN1D做性能分析.
ResNet-CNN1D 模型中,觀測(cè)時(shí)間步長(zhǎng)r=5,MAE,RMSprop 分別為損失函數(shù)、優(yōu)化器,學(xué)習(xí)率為0.000 5.激活函數(shù)g(·) 為ReLu,數(shù)據(jù)在0~1間標(biāo)準(zhǔn)化.二維卷積層的卷積核大小為3×3,一維卷積層的卷積核長(zhǎng)度為5,殘差單元數(shù)量L=4.為保證時(shí)間序列的連續(xù)性,不使用池化層;為保留邊緣信息,采用padding. 使用Python 語(yǔ)言在Keras 和TensorFlow 框架下構(gòu)建模型,訓(xùn)練過(guò)程中使用GPU加速.
對(duì)比模型中,所有參數(shù)設(shè)置都采用調(diào)優(yōu)和對(duì)比統(tǒng)一的原則. ARIMA 模型的參數(shù)p,d,q∈[0,1,0]~[7,1,5],并利用網(wǎng)格搜索的方式尋找最優(yōu)參數(shù). SVR 內(nèi)核為徑向基函數(shù),參數(shù)C,ξ,γ∈[1 ,0.05,0.05] ~[1 00,0.25,0.25] ,同樣基于網(wǎng)格搜索確定最優(yōu)參數(shù). LSTM 的輸出維度為44,ConvLSTM的卷積核大小為3×3.其余模型均基于ResNet-CNN1D 模型中部分組件,參數(shù)設(shè)置與ResNet-CNN1D模型保持一致.
(1)模型的變體比較.
對(duì)ResNet-CNN1D 模型的各組件進(jìn)行拆分實(shí)驗(yàn),結(jié)果如表1 所示. CNN1D 與ResNet 分別作為挖掘時(shí)間與空間特征的組件,由于只能學(xué)習(xí)到單一的特征信息,預(yù)測(cè)效果不佳;CNN2D(2)-CNN1D與CNN2D(10)-CNN1D 的區(qū)別在于二維卷積層的數(shù)量不同,10 層的效果優(yōu)于2 層,即深層卷積網(wǎng)絡(luò)能更好地捕捉站點(diǎn)間的空間特征,有利于提升預(yù)測(cè)精度;CNN2D(10)-CNN1D 與ResNet-CNN1D 相比,前者沒(méi)有采用殘差網(wǎng)絡(luò)的結(jié)構(gòu),實(shí)驗(yàn)證明殘差結(jié)構(gòu)的加入,有利于模型優(yōu)化與精度提升.總之,ResNet-CNN1D不僅能融合時(shí)空特征信息,深層網(wǎng)絡(luò)與殘差結(jié)構(gòu)的加入,使模型更充分地捕捉間隔遙遠(yuǎn)站點(diǎn)間的相關(guān)性.
表1 模型組件實(shí)驗(yàn)結(jié)果Table 1 Experimental results of model components
(2)交通流中經(jīng)典預(yù)測(cè)模型比較.
與經(jīng)典模型對(duì)比結(jié)果如表2所示,可以發(fā)現(xiàn):
①本文ResNet-CNN1D 模型在進(jìn)站、出站和總客流量的預(yù)測(cè)中,均保持最佳預(yù)測(cè)精度.
② ARIMA 適用于單變量且平穩(wěn)的時(shí)間序列,故只提取20 d 的適用性數(shù)據(jù),共計(jì)1 380 個(gè)時(shí)間步,作為模型的初始訓(xùn)練集,以實(shí)時(shí)更新訓(xùn)練集的方式預(yù)測(cè)下一時(shí)間步,因此,每個(gè)站點(diǎn)在預(yù)測(cè)下一個(gè)時(shí)間步時(shí),都需要訓(xùn)練一個(gè)獨(dú)立模型;SVR的輸入是所有站點(diǎn)前5個(gè)時(shí)間步的觀測(cè)數(shù)據(jù),輸出是單一站點(diǎn)進(jìn)站或出站的預(yù)測(cè)結(jié)果,故每個(gè)站點(diǎn)的進(jìn)站或出站預(yù)測(cè),均需要一個(gè)獨(dú)立模型.與神經(jīng)網(wǎng)絡(luò)訓(xùn)練單一模型便可同時(shí)預(yù)測(cè)所有站點(diǎn)的進(jìn)出客流量相比,ARIMA 和SVR 構(gòu)建模型較多,調(diào)參過(guò)程更加復(fù)雜.此外,ARIMA 因無(wú)法捕捉客流的非線性特征,預(yù)測(cè)效果較差;SVR雖然解決了非線性問(wèn)題,但不適用于多變量同步預(yù)測(cè)的回歸問(wèn)題.
③LSTM 和CLTFP 都是基于序列形式的客流量預(yù)測(cè),進(jìn)站和出站數(shù)據(jù)需通過(guò)拼接方式用一維向量表示,模型不能很好地捕捉進(jìn)站與出站之間的相關(guān)性.ConvLSTM是一種可以挖掘時(shí)空特征的LSTM 模型,但隨網(wǎng)絡(luò)深度的增加,模型的訓(xùn)練過(guò)程變得十分困難,而淺層的網(wǎng)絡(luò)結(jié)構(gòu)又無(wú)法充分捕捉空間特征.
表2 經(jīng)典模型對(duì)比Table 2 Comparisonof classic models
(3)預(yù)測(cè)結(jié)果的可視分析.
為更好展示ResNet-CNN1D模型的預(yù)測(cè)效果,將10月29日(休息日)和30日(工作日)李村站客流量的真實(shí)值與預(yù)測(cè)值可視化,如圖7所示.可知:李村站周日的客流量相對(duì)平緩,沒(méi)有突然的客流高峰期;工作日存在明顯的早晚高峰期,早晨是進(jìn)站高峰,晚上是出站高峰.ResNet-CNN1D 模型可以精準(zhǔn)地預(yù)測(cè)到工作日早晚高峰的客流值,以及周末的多個(gè)局部客流峰值.
圖7 李村站客流量真實(shí)值與預(yù)測(cè)值對(duì)比圖Fig.7 Actual and predicted passenger flow of Licun station
將時(shí)間特征組件替換成LSTM 網(wǎng)絡(luò),構(gòu)成ResNet-LSTM 模型. LSTM 已經(jīng)在ST-LSTM[3]與CLTFP[10]模型中被證實(shí)具有很好的時(shí)間特征的學(xué)習(xí)能力.如圖8 所示,隨著殘差單元數(shù)量變化,ResNet-LSTM 與ResNet-CNN1D 在總客流量預(yù)測(cè)中,表現(xiàn)出相似的變化趨勢(shì).另外,當(dāng)空間特征組件的深度過(guò)淺或過(guò)深時(shí),ResNet-CNN1D模型表現(xiàn)出更佳的預(yù)測(cè)效果.
圖8 ResNet-LSTM 與ResNet-CNN1D 模型對(duì)比Fig.8 Comparison of ResNet-LSTM and ResNet-CNN1D model
如表3 所示,殘差單元數(shù)量確定為4 后,對(duì)比ResNet-LSTM 與ResNet-CNN1D 模型的預(yù)測(cè)誤差可以發(fā)現(xiàn),兩模型的預(yù)測(cè)精度不相上下;但時(shí)間消耗方面,ResNet-CNN1D 的訓(xùn)練時(shí)間減少了35%.所以,相比于LSTM,CNN1D更適合挖掘地鐵客流量的時(shí)間特征.
表3 模型對(duì)比結(jié)果Table 3 Model comparison results
針對(duì)多地鐵站的短時(shí)客流量預(yù)測(cè)問(wèn)題,本文提出一個(gè)新的端到端混合網(wǎng)絡(luò)模型,將基于二維卷積的殘差網(wǎng)絡(luò)與一維卷積網(wǎng)絡(luò)進(jìn)行結(jié)合.二維卷積的特征檢測(cè)是在站點(diǎn)維度上進(jìn)行,結(jié)合深層殘差結(jié)構(gòu),充分捕捉站點(diǎn)間的空間特征.一維卷積層的特征檢測(cè)是在時(shí)間軸上移動(dòng),充分挖掘客流量的時(shí)間特征.最后通過(guò)加權(quán)融合,得到目標(biāo)時(shí)段客流量的預(yù)測(cè)結(jié)果.本文采用青島市地鐵3號(hào)線的刷卡數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,預(yù)測(cè)結(jié)果明顯優(yōu)于常用5種模型.下一步研究將重點(diǎn)考慮多線路地鐵客流量的預(yù)測(cè)問(wèn)題,進(jìn)一步挖掘更復(fù)雜交通網(wǎng)絡(luò)中站點(diǎn)間的時(shí)空相關(guān)性.