李科君 高瑾瑤 宋建華 任 剛
(中電科大數(shù)據(jù)研究院有限公司1) 貴陽(yáng) 550022) (東南大學(xué)江蘇省城市智能交通重點(diǎn)實(shí)驗(yàn)室2) 南京 211189)(東南大學(xué)現(xiàn)代城市交通技術(shù)江蘇高校協(xié)同創(chuàng)新中心3) 南京 211189)
城市軌道交通作為城市公共交通系統(tǒng)的重要組成部分,具有大運(yùn)量、準(zhǔn)時(shí)和快捷等特點(diǎn),承擔(dān)著許多城市中遠(yuǎn)距離通勤及彈性出行的客流需求.客流預(yù)測(cè)是城市軌道交通規(guī)劃、運(yùn)營(yíng)與管理的基礎(chǔ),短時(shí)客流預(yù)測(cè)能夠反映客流實(shí)時(shí)變化規(guī)律,是系統(tǒng)資源調(diào)配、站臺(tái)擁擠管理的重要依據(jù).通過(guò)利用城市軌道交通AFC刷卡數(shù)據(jù),準(zhǔn)確、可靠地預(yù)測(cè)短時(shí)段進(jìn)站客流量,并根據(jù)客流的變化情況及時(shí)調(diào)整行車(chē)計(jì)劃,進(jìn)行客流誘導(dǎo)與控制、站臺(tái)客流組織與疏散等,有助于提高城市軌道交通系統(tǒng)運(yùn)營(yíng)管理的科學(xué)性、高效性及安全性.
常見(jiàn)的短時(shí)交通流的預(yù)測(cè)方法大致可以分為以下四種:基于線(xiàn)性理論的方法、基于非線(xiàn)性理論的方法、基于混合理論的方法和其他預(yù)測(cè)方法[1].客流預(yù)測(cè)的研究中也多借鑒于交通流預(yù)測(cè)的方法.基于線(xiàn)性理論的方法主要包括自回歸滑動(dòng)平均模型[2-3]和卡爾曼濾波模型[4]等;非線(xiàn)性理論方法有支持向量機(jī)[5]、非參數(shù)回歸[6]、神經(jīng)網(wǎng)絡(luò)模型[7]等;混合方法是指多種預(yù)測(cè)方法在預(yù)測(cè)過(guò)程或者結(jié)果上的組合使用.
城市軌道交通短時(shí)進(jìn)站客流是具有動(dòng)態(tài)性、非線(xiàn)性、不確定性、周期性的時(shí)間序列,傳統(tǒng)AR、ARMA等線(xiàn)性時(shí)間序列預(yù)測(cè)模型不能很好地捕捉其非線(xiàn)性特征,但人工神經(jīng)網(wǎng)絡(luò)具有非線(xiàn)性的映射能力以及較高的容錯(cuò)率等特點(diǎn).非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)模型(nonlinear autoregression neural network,NARNN)是一種通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)非線(xiàn)性回歸的模型,它結(jié)合了自回歸方法對(duì)時(shí)間序列潛在機(jī)理挖掘的能力以及神經(jīng)網(wǎng)絡(luò)算法的非線(xiàn)性函數(shù)擬合能力,算法靈活,不需要像其他方法構(gòu)建詳細(xì)的模型,且具有自適應(yīng)、自學(xué)習(xí)的優(yōu)勢(shì),其在一些領(lǐng)域的預(yù)測(cè)研究中得到了應(yīng)用[8-10].文中構(gòu)建非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)(NARNN)模型進(jìn)行地鐵車(chē)站短時(shí)進(jìn)站客流的預(yù)測(cè),結(jié)果表明其具有一定的應(yīng)用價(jià)值,且預(yù)測(cè)精度優(yōu)于線(xiàn)性時(shí)間序列預(yù)測(cè)模型.
文中研究的對(duì)象是短時(shí)進(jìn)站客流,在利用數(shù)據(jù)進(jìn)行預(yù)測(cè)之前,需要對(duì)進(jìn)站客流的發(fā)展變化規(guī)律進(jìn)行觀(guān)測(cè)和分析.選取南京地鐵三號(hào)線(xiàn)夫子廟站2017年10月16—20日(周一—周五)及10月1—7日(國(guó)慶節(jié)假日)的日進(jìn)站客流量進(jìn)行分析.將該站的AFC日進(jìn)站刷卡數(shù)據(jù)從地鐵運(yùn)營(yíng)時(shí)間06:00—23:30按照每5,15 min分別進(jìn)行累計(jì)統(tǒng)計(jì),畫(huà)圖觀(guān)察工作日、節(jié)假日(國(guó)慶周)的短時(shí)進(jìn)站客流量變化情況,兩種特征日的進(jìn)站客流時(shí)間序列見(jiàn)圖1.
圖1 夫子廟站進(jìn)站客流時(shí)間序列
經(jīng)過(guò)數(shù)據(jù)統(tǒng)計(jì)與對(duì)比分析可以發(fā)現(xiàn),夫子廟站國(guó)慶周的日均客流量為41 865人·次/d,顯著高于平常工作周的日均客流量24 360人·次/d,造成這一現(xiàn)象的原因是夫子廟站點(diǎn)附近的夫子廟、秦淮河等著名旅游景點(diǎn)國(guó)慶期間吸引著大量的旅游客流.由圖1可知,工作日和國(guó)慶周的日進(jìn)站客流時(shí)間分布不同,兩種特征日的客流高峰出現(xiàn)時(shí)段及客流變化趨勢(shì)都有所差異,但每種特征日的內(nèi)部都有相似的規(guī)律.在同一時(shí)間測(cè)度下,工作日客流變化較平穩(wěn),且有明顯的高峰和平峰;相較于工作日,國(guó)慶假日期間進(jìn)站客流時(shí)間分布波動(dòng)性更強(qiáng),且全天客流量都較大,高峰時(shí)段不凸顯.通過(guò)進(jìn)一步對(duì)比同一特征日的兩種時(shí)間測(cè)度,明顯可以看出較短的5 min時(shí)間測(cè)度數(shù)據(jù)波動(dòng)大、不平穩(wěn).
以上分析表明,地鐵短時(shí)進(jìn)站客流是一種不穩(wěn)定的并隱含著大量動(dòng)態(tài)特征的非線(xiàn)性、非平穩(wěn)時(shí)間序列;同時(shí)工作周和節(jié)假日周的客流發(fā)展變化分別隱藏著一定的日分布規(guī)律,每日客流的增長(zhǎng)與下降趨勢(shì)類(lèi)似,即具有一定的周期性.考慮上述的時(shí)間序列特征,本文構(gòu)建非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)(NARNN)模型對(duì)普通工作日及節(jié)假日期間旅游景點(diǎn)夫子廟站的地鐵短時(shí)進(jìn)站客流進(jìn)行預(yù)測(cè),通過(guò)對(duì)工作日及節(jié)假日地鐵進(jìn)站刷卡數(shù)據(jù)內(nèi)部發(fā)展規(guī)律的挖掘,實(shí)現(xiàn)短時(shí)進(jìn)站客流預(yù)測(cè).
非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)為帶有延時(shí)函數(shù)的神經(jīng)網(wǎng)絡(luò),延時(shí)的階數(shù)決定神經(jīng)網(wǎng)絡(luò)的輸入個(gè)數(shù),是專(zhuān)門(mén)針對(duì)時(shí)間序列預(yù)測(cè)問(wèn)題的模型.標(biāo)準(zhǔn)的NARNN結(jié)構(gòu)示意圖見(jiàn)圖2,其中時(shí)間序列y(t)既是輸入也是輸出,網(wǎng)絡(luò)中包含若干隱藏層和一個(gè)輸出層.該神經(jīng)網(wǎng)絡(luò)中嵌入了一個(gè)延遲函數(shù),用于將時(shí)間序列y(t)進(jìn)行延遲處理.該神經(jīng)網(wǎng)絡(luò)中隱含層采用非線(xiàn)性傳輸函數(shù),輸出層采用線(xiàn)性傳輸函數(shù).
d-延遲階數(shù);W-神經(jīng)元之間的聯(lián)結(jié)權(quán)值矩陣;b-各層神經(jīng)元的的閾值向量;S-各層的神經(jīng)元個(gè)數(shù)圖2 非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)實(shí)質(zhì)上是自回歸模型(AR)的非線(xiàn)性化,通過(guò)利用神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、自適應(yīng)以及可以實(shí)現(xiàn)非線(xiàn)性映射的特點(diǎn),對(duì)具有非線(xiàn)性特征的時(shí)間序列進(jìn)行擬合及預(yù)測(cè).整個(gè)網(wǎng)絡(luò)的預(yù)測(cè)原理就是通過(guò)時(shí)間序列某時(shí)刻t的前d個(gè)時(shí)刻的值來(lái)預(yù)測(cè)該時(shí)刻的值,表示為
y(t)=f(y(t-1),y(t-2),…,y(t-d)) (1)
式中:d為延時(shí)階數(shù);f(·)為神經(jīng)網(wǎng)絡(luò)模型.由式(1)可知,該模型承認(rèn)事物發(fā)展的延續(xù)性,用過(guò)去的值來(lái)推斷當(dāng)前的值.本研究將1 d內(nèi)的客流量按照每5 min和每15 min分別統(tǒng)計(jì),此時(shí)時(shí)間序列中t為第t個(gè)5 min或15 min統(tǒng)計(jì)時(shí)段,t-d為t之前的d個(gè)5 min或15 min統(tǒng)計(jì)時(shí)段.
非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)見(jiàn)圖3,輸出信號(hào)的時(shí)間延遲作為該網(wǎng)絡(luò)中時(shí)間延遲反饋,將輸出的時(shí)間d階延遲信號(hào)當(dāng)作網(wǎng)絡(luò)的輸出.網(wǎng)絡(luò)結(jié)構(gòu)為d-l-1,即一個(gè)輸入層、一個(gè)隱含層及一個(gè)網(wǎng)絡(luò)輸出.輸入延遲階數(shù)d決定了輸入神經(jīng)元的個(gè)數(shù),隱含層神經(jīng)元個(gè)數(shù)為l,網(wǎng)絡(luò)輸出為一個(gè)值.網(wǎng)絡(luò)的最終輸出y由式(3)中的輸出層傳輸函數(shù)f2得到.
(2)
式中:xi為網(wǎng)絡(luò)的輸入,分別對(duì)應(yīng)時(shí)間序列t時(shí)刻之前的d個(gè)時(shí)刻的觀(guān)測(cè)值;wi,j為輸入神經(jīng)元與隱含層神經(jīng)元之間的聯(lián)結(jié)權(quán)值;aj為隱含層神經(jīng)元的閾值.
(3)
式中:wj為隱含層神經(jīng)元與輸出層神經(jīng)元之間的聯(lián)結(jié)權(quán)值;b為輸出層神經(jīng)元的閾值;mj為隱含層各神經(jīng)元的輸出;mj根據(jù)式(2)中的隱含層傳輸函數(shù)f1得到.
圖3 非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)拓?fù)鋱D
采用BP學(xué)習(xí)方法對(duì)該神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,第一個(gè)階段是輸入已知學(xué)習(xí)樣本,通過(guò)設(shè)置的網(wǎng)絡(luò)結(jié)構(gòu)和前一次迭代的權(quán)值和閾值,從網(wǎng)絡(luò)的第一層向后計(jì)算各神經(jīng)元的輸出.第二個(gè)階段是對(duì)權(quán)值和閾值進(jìn)行修改,從最后一層向前計(jì)算各權(quán)值和閾值對(duì)總誤差的影響(梯度),據(jù)此對(duì)各權(quán)值和閾值進(jìn)行修改.以上兩個(gè)過(guò)程反復(fù)交替,直到達(dá)到收斂為止.模型中的網(wǎng)絡(luò)誤差性能函數(shù)選取為MSE(mean square error),隱含層傳輸函數(shù)選取Tan-sigmoid函數(shù),輸出層的傳輸函數(shù)選為pure-line 線(xiàn)性函數(shù).為了提高神經(jīng)網(wǎng)絡(luò)的泛化能力、防止“過(guò)適配”現(xiàn)象,采用貝葉斯歸一化法(bayesian regularization)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練.
在訓(xùn)練時(shí),網(wǎng)絡(luò)采用開(kāi)環(huán)的形式,將時(shí)間序列通過(guò)延時(shí)函數(shù)進(jìn)行輸入和輸出數(shù)據(jù)的分解及對(duì)應(yīng),在預(yù)測(cè)階段,網(wǎng)絡(luò)采用閉環(huán)形式,將t時(shí)刻的輸出在t+1時(shí)刻作為輸入被反饋,通過(guò)輸入構(gòu)建自回歸模型,通過(guò)對(duì)該輸入權(quán)值和歷史數(shù)據(jù)權(quán)值的修正,網(wǎng)絡(luò)遞歸的產(chǎn)生了一個(gè)自回歸模型以便預(yù)測(cè)下一個(gè)輸出.隱含層中的神經(jīng)元可以對(duì)相同的自回歸過(guò)程產(chǎn)生一些變化,這有助于區(qū)別滯后的重要程度,也能夠發(fā)現(xiàn)時(shí)間序列最合適的滯后結(jié)構(gòu).
在建立NARNN模型之前,先對(duì)原始的地鐵進(jìn)站閘機(jī)AFC刷卡數(shù)據(jù)庫(kù)里的數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)研究時(shí)間范圍內(nèi)的車(chē)站刷卡數(shù)據(jù)進(jìn)行篩選,剔除異常數(shù)據(jù),并按照每5,15 min間隔統(tǒng)計(jì)短時(shí)進(jìn)站客流量,將其處理成時(shí)間序列的形式.建立預(yù)測(cè)模型的具體步驟如下:①生成時(shí)間序列,將原始數(shù)據(jù)進(jìn)行歸一化,轉(zhuǎn)化為值域?yàn)閇-1,1]的序列;②設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),初始化時(shí)間延遲階數(shù)、隱含層神經(jīng)元個(gè)數(shù);③對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行多次訓(xùn)練,根據(jù)誤差自相關(guān)圖滿(mǎn)足95%的置信區(qū)間的要求,調(diào)整網(wǎng)絡(luò)的結(jié)構(gòu),并根據(jù)擬合效果圖選擇合適的模型參數(shù);④用訓(xùn)練好的模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè),根據(jù)選取的誤差指標(biāo)分析網(wǎng)絡(luò)預(yù)測(cè)性能.研究中采用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行輔助建模與分析.
以南京地鐵三號(hào)線(xiàn)夫子廟站的進(jìn)站客流AFC刷卡數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),從原始的ACCESS數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)的篩選與預(yù)處理.原始刷卡數(shù)據(jù)記錄了進(jìn)站時(shí)間、交易發(fā)生時(shí)間、車(chē)站號(hào)、卡號(hào)、票卡類(lèi)型等信息,其中進(jìn)站時(shí)間精確到秒.依據(jù)夫子廟站對(duì)應(yīng)的車(chē)站號(hào)對(duì)進(jìn)站時(shí)間數(shù)據(jù)進(jìn)行篩選,剔除掉異常數(shù)據(jù),分別按照每5,15 min對(duì)10月1—7日(代表節(jié)假日),10月16—20日(代表工作周)每日06:00—23:30的進(jìn)站客流量進(jìn)行統(tǒng)計(jì),并將其處理成時(shí)間序列的形式.按照85%和15%的比例劃分訓(xùn)練集和測(cè)試集,工作日的5 min間隔試驗(yàn)數(shù)據(jù)共有355個(gè),比例選取前300個(gè)為訓(xùn)練樣本,后55個(gè)為測(cè)試樣本,15 min間隔試驗(yàn)數(shù)據(jù)共有1 060個(gè),選取前896個(gè)為訓(xùn)練樣本,后164個(gè)為測(cè)試樣本.節(jié)假日的5 min間隔試驗(yàn)數(shù)據(jù)共有497個(gè),選取前420個(gè)為訓(xùn)練樣本,后77個(gè)為測(cè)試樣本,15分鐘間隔試驗(yàn)數(shù)據(jù)共有1 484個(gè),選取前1 254個(gè)為訓(xùn)練樣本,后230個(gè)為測(cè)試樣本.
根據(jù)實(shí)際的數(shù)據(jù)進(jìn)行建模分析.其中自回歸階數(shù),即延時(shí)階數(shù)d決定了非線(xiàn)性自回歸神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元的個(gè)數(shù),從而也影響到隱含層神經(jīng)元個(gè)數(shù)的選擇,其對(duì)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)以及預(yù)測(cè)結(jié)果有著決定性的影響.目前尚未找到特定精確的方法來(lái)確定其值,采取多次試驗(yàn)測(cè)算的方法來(lái)確定最優(yōu)的延時(shí)階數(shù),即設(shè)置不同的d值構(gòu)造神經(jīng)網(wǎng)絡(luò),對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行多次訓(xùn)練,在誤差自相關(guān)圖滿(mǎn)足95%置信區(qū)間的網(wǎng)絡(luò)結(jié)構(gòu)中,選取預(yù)測(cè)誤差平方和(MSE)最小的神經(jīng)網(wǎng)絡(luò)作為最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).在對(duì)神經(jīng)網(wǎng)絡(luò)的多次訓(xùn)練中,發(fā)現(xiàn)對(duì)于5 min時(shí)間測(cè)度的工作日和節(jié)假日最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為6-15-1,即時(shí)間延遲階數(shù)為6,可以解讀為當(dāng)前時(shí)刻的客流量與前6個(gè)5 min的客流量關(guān)系最密切,通過(guò)每6個(gè)5 min間隔的客流量進(jìn)行預(yù)測(cè)能較好的捕捉到客流數(shù)據(jù)的內(nèi)在發(fā)展規(guī)律,得到較好的預(yù)測(cè)結(jié)果.對(duì)于15 min時(shí)間測(cè)度的工作日和節(jié)假日最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為4-10-1,即時(shí)間延遲階數(shù)為4,可以解讀為當(dāng)前時(shí)刻的客流量與前4個(gè)15 min的客流量關(guān)系最密切,通過(guò)每4個(gè)15 min間隔的客流量進(jìn)行預(yù)測(cè)能較好的捕捉到客流數(shù)據(jù)的內(nèi)在發(fā)展規(guī)律,得到較好的預(yù)測(cè)結(jié)果.進(jìn)一步運(yùn)用傳統(tǒng)的線(xiàn)性時(shí)間序列ARIMA(p,d,q)預(yù)測(cè)模型對(duì)同樣的試驗(yàn)樣本數(shù)據(jù)進(jìn)行建模及預(yù)測(cè),選取不同參數(shù)設(shè)置下的各個(gè)ARIMA模型中預(yù)測(cè)平均絕對(duì)誤差最小的模型與文中提出的模型進(jìn)行預(yù)測(cè)結(jié)果的對(duì)比分析,測(cè)試樣本得到的預(yù)測(cè)數(shù)據(jù)和真實(shí)客流值的比較見(jiàn)圖4~5.
圖4 工作日短時(shí)客流預(yù)測(cè)圖
圖5 節(jié)假日短時(shí)客流預(yù)測(cè)圖
MAE(mean absolute error)能很好地反映預(yù)測(cè)值誤差的實(shí)際情況,RMSE(root mean squared error)可以評(píng)價(jià)數(shù)據(jù)與預(yù)測(cè)模型適應(yīng)性.采用平均絕對(duì)誤差MAE和均方根誤差RMSE兩個(gè)評(píng)價(jià)指標(biāo)對(duì)各個(gè)模型的預(yù)測(cè)性能進(jìn)行量化對(duì)比分析,結(jié)果列于表1~2.
(4)
(5)
表1 工作日預(yù)測(cè)誤差指標(biāo)
表2 節(jié)假日預(yù)測(cè)誤差指標(biāo)
由圖4~5可知,NARNN模型預(yù)測(cè)結(jié)果與測(cè)試數(shù)據(jù)的實(shí)際值能較好地?cái)M合,該模型能夠反映出客流數(shù)據(jù)的動(dòng)態(tài)發(fā)展趨勢(shì)及變化規(guī)律,且相比于ARIMA模型,其預(yù)測(cè)結(jié)果更貼近真實(shí)值.由表1~2可知,NARNN模型有比ARIMA模型更小的MAE和RMSE指標(biāo)值,即其有更高的預(yù)測(cè)精度和模型適應(yīng)性.NARNN模型對(duì)工作日和節(jié)假日預(yù)測(cè)的MAE值在相同的時(shí)間間隔測(cè)度下相差不大,分別為17人·次/5 min、43人·次/15 min及18人·次/5 min、48人·次/15 min,相比于工作日132人·次/5 min、395人·次/15 min的平均進(jìn)站客流量,節(jié)假日177人·次/5 min、527人·次/15 min的平均進(jìn)站客流量,該誤差在可接受的范圍內(nèi),表明該模型可以用于短時(shí)進(jìn)站客流的預(yù)測(cè).通過(guò)進(jìn)一步比較不同時(shí)間間隔的誤差指標(biāo),15 min預(yù)測(cè)結(jié)果的MAE值均小于經(jīng)5 min時(shí)間間隔擴(kuò)算得到的MAE值,該結(jié)果表明隨著數(shù)據(jù)的波動(dòng)性和隨機(jī)性增大,模型的預(yù)測(cè)精度有所降低.
利用非線(xiàn)性自回歸歸神經(jīng)網(wǎng)絡(luò)(NARNN)模型對(duì)地鐵短時(shí)進(jìn)站客流進(jìn)行了預(yù)測(cè),采用實(shí)際的地鐵車(chē)站工作日及節(jié)假日AFC刷卡數(shù)據(jù)進(jìn)行了實(shí)例分析,并與線(xiàn)性ARIMA預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行比較分析.研究結(jié)果表明,該模型在不同時(shí)間測(cè)度下對(duì)工作日和節(jié)假日的地鐵進(jìn)站客流數(shù)據(jù)均能較好地?cái)M合,表明其具有一定的應(yīng)用價(jià)值,但隨著數(shù)據(jù)波動(dòng)性和隨機(jī)性的增大,模型的預(yù)測(cè)精度有所降低;與線(xiàn)性時(shí)間序列預(yù)測(cè)模型相比,該模型預(yù)測(cè)結(jié)果具有更小的平均絕對(duì)誤差和均方根誤差,表明其預(yù)測(cè)精度優(yōu)于線(xiàn)性時(shí)間序列預(yù)測(cè)模型.