張軍芳 杜鵬 房月華 張利民 趙鑫
摘 要:大數(shù)據(jù)背景下傳統(tǒng)的公交到站時間預(yù)測方法在預(yù)測精度和訓(xùn)練速度方面已經(jīng)不能滿足人們的期望。文章以衡水市公交運行實際數(shù)據(jù)為例,運用深度學(xué)習(xí)中的長短時記憶網(wǎng)絡(luò)(LSTM)和人工神經(jīng)網(wǎng)絡(luò)(ANN)混合模型,綜合考慮運行時段、天氣狀況、道路基礎(chǔ)設(shè)施、是否交叉路口、是否高峰路段等因素,對公交車的到站時間進(jìn)行預(yù)測研究,結(jié)果顯示混合模型在預(yù)測公交車在前一個站點的??繒r間和站間的行使時間方面均具有較高準(zhǔn)確性。
關(guān)鍵詞:長短時記憶網(wǎng)絡(luò) 人工神經(jīng)網(wǎng)絡(luò) 預(yù)測 準(zhǔn)確性
Research on Bus Arrival Time Prediction based on Deep Learning
Zhang Junfang, Du Peng, Fang Yuehua, Zhang Limin, Zhao Xin
Abstract:Under the background of big data, the traditional bus arrival time prediction method cannot meet people's expectations in terms of prediction accuracy and training speed. Taking the actual bus operation data of Hengshui City as an example, this paper uses the hybrid model of long-term and short-term memory network(LSTM)and artificial neural network(ANN)in deep learning to predict the bus arrival time by comprehensively considering the factors such as operation time, weather conditions, road infrastructure, whether there is an intersection and whether there is a peak section. The results show that the hybrid model has high accuracy in predicting the bus stop time at the previous stop and the travel time between stops.
Key words:long-term and short-term memory network, artificial neural network, prediction, accuracy
1 引言
公交到站時間預(yù)測是智能公共交通信息服務(wù)系統(tǒng)的重要組成部分,精確的到站時間能有效緩解站臺等車乘客的焦慮情緒,讓出行者合理安排出行計劃。調(diào)查結(jié)果表明,公交乘客根據(jù)預(yù)測信息合理選擇乘車的時間,能使乘客節(jié)約63%的等待時間;而對于管理者而言,準(zhǔn)確的到站時間信息是實現(xiàn)靈活調(diào)度、科學(xué)管理的前提[1]。目前城市公交公司已經(jīng)將到站預(yù)測運用于公交公司的運營調(diào)度中,然而車輛的到站時間受實時的天氣、交通狀況、交通需求等諸多因素的影響,所以實時準(zhǔn)確的公交到站時間預(yù)測既是智能公共交通服務(wù)系統(tǒng)的重點,又是公交運行管理的難點。
目前,國內(nèi)的公交車輛普遍安裝了車載GPS裝置。國內(nèi)上海、南京、廣州等一些大城市,在市區(qū)內(nèi)的一些特殊線路候車站點上都安裝了電子停車標(biāo)志,以告知乘客車輛的預(yù)計到達(dá)時間。一些互聯(lián)網(wǎng)公司也通過開發(fā)手機軟件來發(fā)布實時公共交通信息,比較美國的谷歌地圖,國內(nèi)的高德地圖,百度地圖等,基本上都配置了公交線路實時信息查詢的功能,用戶可以登錄手機應(yīng)用程序查看市區(qū)內(nèi)的公交線路,公交站點與站點的地圖,以獲得車輛的到達(dá)時間[1]。
根據(jù)衡水市公交運行數(shù)據(jù),結(jié)合公交運行與調(diào)度情況,綜合考慮衡水市公交運行時段、天氣狀況、道路基礎(chǔ)設(shè)施、是否交叉路口、是否高峰路段等因素,建立混合模型,預(yù)測公交運行的準(zhǔn)時性。
2 方法介紹
研究發(fā)現(xiàn),人工神經(jīng)網(wǎng)絡(luò)(ANN)只能記憶短時期的信息,信息隨著學(xué)習(xí)量的增多或者學(xué)習(xí)周期的增長將會導(dǎo)致梯度消失或者梯度爆炸現(xiàn)的發(fā)生象[2,3]。長短時記憶網(wǎng)絡(luò) (LSTM)是一種特殊的RNN網(wǎng)絡(luò)模型,由 Hochreiter等人[4]于1997年提出,后期被 Alex Graves進(jìn)行了改進(jìn)和應(yīng)用[3,5],該模型可以記憶長時期的規(guī)律,并且有效避免梯度消失現(xiàn)象[3,4]。相對于RNN網(wǎng)絡(luò)模型,LSTM模型中增加了輸入門、輸出門、忘記門用于控制記憶的序列信息,如圖1所示。記憶塊中有記憶線和輸入輸出線主線,其中,記憶線時刻完成的運算為其前一時刻的記憶狀態(tài)經(jīng)過忘記門狀態(tài)和輸入門狀態(tài)處理后得到該時刻記憶線輸出;輸入輸出線的運算為在時刻輸入一組新的變量值,并與前一時刻隱層輸出狀態(tài)共同通過輸出門狀態(tài)的運算后,再參考記憶線在該時刻的輸出,得到隱層的輸出結(jié)果。流程如圖2所示[3]。
3 數(shù)據(jù)處理
3.1 數(shù)據(jù)來源
本文使用的數(shù)據(jù)來自衡水市公交公司2020年9月1日至9月20日的數(shù)據(jù),共包含5804條數(shù)據(jù)。數(shù)據(jù)結(jié)構(gòu)如表1所示。
3.2 數(shù)據(jù)預(yù)處理
一般地,時間切片的最優(yōu)值為5min,所以將一天劃分為190個時間切片。在實際行車過程中,車輛可能會遇到突發(fā)事件,因此在統(tǒng)計的數(shù)據(jù)中存在一些異常數(shù)據(jù),將時間窗的上限設(shè)置300s,下限設(shè)置為25s,從而過濾異常數(shù)據(jù)以減少噪聲干擾[6]。
3.3 公交車到站時間預(yù)測
一般地,公交車到站時間可通過下式進(jìn)行預(yù)測:
式中為k第輛公交車到達(dá)目標(biāo)站點的預(yù)測時間;為第k輛公交車到達(dá)前一個站點的實際時間;為第k輛公交車在前一個站點處的預(yù)測停靠時間;為第k輛公交車在前一個站點到目標(biāo)站點間的預(yù)測行使時間。
公交到站時間預(yù)測可以轉(zhuǎn)化為:預(yù)測公交車在前一個站點的??繒r間和在站間的行使時間。
以衡水市實際公交數(shù)據(jù)為例,運用深度學(xué)習(xí)中的長短時記憶網(wǎng)絡(luò)LSTM和人工神經(jīng)網(wǎng)絡(luò)ANN混合模型對公交車運行時段、天氣狀況、道路基礎(chǔ)設(shè)施、是否交叉路口、是否路段因素對公交在前一個站點的??繒r間和公交在站間的行使時間進(jìn)行預(yù)測[7],結(jié)果顯示預(yù)測具有較高的精確性,結(jié)果如圖3。
4 結(jié)論
作為智能公共交通系統(tǒng)的重要組成部分,公交到站時間預(yù)測為提供實時準(zhǔn)確的公交到站時間可以實現(xiàn)如下經(jīng)濟社會效益:
(1)對于出行者而言,出行者可以合理的規(guī)劃出行,節(jié)省在站點的等車時間,緩解出行者等車期間的焦慮情緒;(2)對于公交企業(yè)而言,提供實時準(zhǔn)確的公交到站時間一方面可以優(yōu)化公交調(diào)度,另一方面有利于多模式交通方式間的協(xié)調(diào);(3)對于政府而言,可以提高公交吸引率,緩解城市交通擁堵,提升城市形象;(4)從社會效益方面而言,公交到站時間預(yù)測研究會降低公交車到站時間的預(yù)測誤差,推動公交服務(wù)類軟件的進(jìn)一步應(yīng)用。
基金項目:
衡水學(xué)院2020年度校級自然科學(xué)類課題(2020ZR01):基于多源公交數(shù)據(jù)和LSTM的公交到站時間預(yù)測研究。
衡水學(xué)院2020年度校級自然科學(xué)類課題(2020ZR08):高效薄膜硅-晶體硅異質(zhì)結(jié)電池器件結(jié)構(gòu)模擬及產(chǎn)業(yè)化工藝研究。
河北省教育廳資助青年基金項目自然科學(xué)類(QN2020529):基于大數(shù)據(jù)和人工智能的網(wǎng)絡(luò)輿情挖掘及預(yù)測研究。
參考文獻(xiàn):
[1]葉之放.基于多源公交數(shù)據(jù)和LSTM的公交到站時間預(yù)測研究[D].華南理工大學(xué),2019.
[2]FUR,ZHANG Z,LI L.Using LSTM and GRU Neural Network Methods for Traffic Flow Prediction [C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation(YAC).Wuhan:IEEE,2016:324-328.
[3]李高盛,彭玲等.基于LSTM的城市公交車站短時客流量預(yù)測研究[J].公路交通科技,2019,36(2):128-132.
[4]HOCHREITERS,SCHMIDHUBERJ.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[5] Graves A.Supervised sequence labeling with recurrent neural networks[M]. Berlin: Springer-Verlag,2012.
[6]張欣環(huán),劉宏杰等.基于時空特征向量的長短期記憶人工神經(jīng)網(wǎng)絡(luò)的城市公交旅行時間預(yù)測[J]. 計算機應(yīng)用, 2021.3 (41):875-880.
[7]張瑜.基于城市公交軌跡數(shù)據(jù)的車輛到站時間預(yù)測算法研究[D].大連海事大學(xué),2020年.