林藝華
摘 要:用深度學(xué)習(xí)的方法對(duì)高速公路上的定時(shí)交通流進(jìn)行監(jiān)測(cè),有關(guān)部門(mén)根據(jù)監(jiān)測(cè)到的數(shù)據(jù)結(jié)果進(jìn)行交通管控,緩解道路壓力,保障交通安全。首先,用遞歸神經(jīng)網(wǎng)絡(luò)RNN進(jìn)行短期交通流量預(yù)測(cè),然后利用殘差反卷積形成深層網(wǎng)絡(luò)從而實(shí)現(xiàn)長(zhǎng)期的交通流量預(yù)測(cè)。在此基礎(chǔ)上,創(chuàng)新性的使用圖卷積進(jìn)行特征提取,提高模型的魯棒性。通過(guò)實(shí)驗(yàn)證明,基于深度學(xué)習(xí)的長(zhǎng)短期交通流量預(yù)測(cè)具有重要的研究意義和使用價(jià)值。
關(guān)鍵詞:深度學(xué)習(xí);RNN;殘差反卷積;圖卷積:交通流量預(yù)測(cè)
中圖分類(lèi)號(hào):TP38 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1001-5922(2021)05-0182-05
Research on Expressway Traffic Flow Data Monitoring Method Based on Depth Learning
Lin Yihua
(Yuexiu (China) Transportation Infrastructure Investment Limited Company, Guangzhou 510600, China )
Abstract:The content of this paper is to monitor the regular traffic flow on expressways with the method of deep learning, and relevant departments carry out traffic control according to the monitored data results to relieve road pressure and ensure traffic safety.? First, the recurrent neural network RNN is used for short-term traffic flow prediction, and then the residual deconvolution is used to form a deep network to realize long-term traffic flow prediction.? On this basis, the innovative use of graph convolution for feature extraction improves the robustness of the model.? Experiments show that the long-term and short-term traffic flow prediction based on depth learning has important research significance and application value.
Key words:deep learning;? RNN; residual deconvolution; graph convolution: traffic flow prediction
0 前言
隨著城市化的不斷發(fā)展,越來(lái)越多的人開(kāi)始聚集。這給我國(guó)旅游業(yè)帶來(lái)了機(jī)遇,但是卻給交通管制帶來(lái)了前所未有的壓力。目前,一些關(guān)于交通的單位時(shí)間內(nèi)人流量和速度的研究已經(jīng)成為了重點(diǎn)的研究?jī)?nèi)容?;谥衅诤烷L(zhǎng)期客流預(yù)測(cè)通常指的是時(shí)間跨度在未來(lái)3~15年的范圍之內(nèi),而短期客流預(yù)測(cè)通常具有下一周或一個(gè)月的預(yù)測(cè)范圍。對(duì)城市客流的研究是城市交通規(guī)劃、運(yùn)營(yíng)和安全防護(hù)的重要方面。短期客流預(yù)測(cè)可用于優(yōu)化線路和客流組織,為運(yùn)營(yíng)商提供預(yù)警和多方?jīng)Q策,進(jìn)一步提高城市的科學(xué)管理水平,對(duì)于安全和操作具有實(shí)際重要性。該預(yù)測(cè)可以為先進(jìn)的客流控制和誘導(dǎo)方法提供證據(jù),該方法可以防止擁塞,踐踏和其他安全事故。而一些長(zhǎng)期預(yù)測(cè)也是在短期預(yù)測(cè)的舉出上不斷的進(jìn)行優(yōu)化的,因此二者都對(duì)交通管制具有指導(dǎo)意義。
1 基于RNN的交通流量預(yù)測(cè)
RNN循環(huán)神經(jīng)網(wǎng)絡(luò)中的LSTM長(zhǎng)短期記憶網(wǎng)絡(luò)目前在對(duì)自然語(yǔ)言的處理上有著很好的效果。由于,LSTM的提出能夠很好的解決RNN的梯度爆炸和消失的問(wèn)題,二者的結(jié)合使用符合交通流預(yù)測(cè)的問(wèn)題。
1.1 RNN的簡(jiǎn)介
RNN被稱(chēng)為循環(huán)神經(jīng)網(wǎng)絡(luò)是因?yàn)樗妮斎牒洼敵霾皇窍嗷オ?dú)立的,能夠利用記憶來(lái)聯(lián)系上下文的關(guān)系。在交通流的預(yù)測(cè)中,未來(lái)的交通流量是和之前的樣本數(shù)據(jù)有聯(lián)系的,所以用RNN來(lái)做交通流預(yù)測(cè)。
圖1展示了RNN的完整結(jié)構(gòu)圖,以預(yù)測(cè)5個(gè)長(zhǎng)度的句子為例,具體可以通過(guò)以下的公式進(jìn)行運(yùn)算。
xt指是在時(shí)刻t的輸入樣本數(shù)據(jù),例如x1是一個(gè)one-hot vector對(duì)應(yīng)整個(gè)句子的第二個(gè)單詞,st是在時(shí)刻t的隱藏狀態(tài),也是網(wǎng)絡(luò)的記憶部分,具體st計(jì)算如下:
函數(shù) f 使用的是非線性的例如tanh或者ReLU,Ot是時(shí)刻的輸出,例如在我們進(jìn)行預(yù)測(cè)時(shí)時(shí)一個(gè)句子的下一個(gè)單詞,那么我們希望得到的輸出是我們字典中所有詞的概率組成的向量,計(jì)算公式如下:
具體來(lái)用以下的公式來(lái)表示RNN在其具體的某一層網(wǎng)絡(luò)結(jié)構(gòu)的的計(jì)算方法:
狀態(tài)和當(dāng)前輸入傳輸給Tanh函數(shù),得到的結(jié)果在-1和1之間,從而進(jìn)行判斷來(lái)調(diào)節(jié)網(wǎng)絡(luò),最后把Tanh輸出和Sigmoid二者的輸出相乘,Sigmoid輸出將決定在Tanh輸出中哪些信息是相對(duì)重要的并需要保留的。
1.2 數(shù)據(jù)的準(zhǔn)備及處理
本次實(shí)驗(yàn)是對(duì)道路交通流的短期預(yù)測(cè),也是后續(xù)研究的基礎(chǔ)實(shí)驗(yàn)。由于keras相當(dāng)于對(duì)tensorflow函數(shù)的封裝。所以,實(shí)驗(yàn)環(huán)境使用的是keras2.3版本,python3.6版本,windows環(huán)境下的tensorflow-gpu1.5版本。把Caltrans Performance Measurement System (PeMS)獲取的作為本次實(shí)驗(yàn)的數(shù)據(jù)集,得到的原始數(shù)據(jù)是長(zhǎng)度為n的一個(gè)一維數(shù)據(jù),通過(guò)數(shù)據(jù)標(biāo)準(zhǔn)化,并且用keras對(duì)數(shù)據(jù)進(jìn)行清洗,劃分出實(shí)驗(yàn)所需的訓(xùn)練集和測(cè)試集。具體按照訓(xùn)練集70%,測(cè)試集30%。
1.3 實(shí)驗(yàn)所用的網(wǎng)絡(luò)模型
把上述劃分好的數(shù)據(jù)集進(jìn)行亂序處理。圖2所示是本次實(shí)驗(yàn)的兩層隱層LSTM網(wǎng)絡(luò)結(jié)構(gòu)??梢钥闯觯谝粚覮STM網(wǎng)絡(luò)的輸出增大為64,而第二層LSTM實(shí)現(xiàn)了降維處理。第一層和第二層的疊加使用能夠有效的利用LSTM產(chǎn)生的輸入和輸出之間的聯(lián)系。用RNN結(jié)構(gòu)中的忘記門(mén)和輸出門(mén)來(lái)緩解梯度爆炸的情況的出現(xiàn)。
1.4 網(wǎng)絡(luò)訓(xùn)練過(guò)程
編碼器使用的是Auto-Encoders自動(dòng)編碼。首先,對(duì)第一層輸入進(jìn)行編碼,然后利用第二層的參數(shù)計(jì)算進(jìn)行重新輸入,然后利用重新設(shè)置的輸入與實(shí)際輸入形成損失參數(shù),整體是一個(gè)三層結(jié)構(gòu)。同時(shí),提出圖卷積(圖3)循環(huán)網(wǎng)絡(luò)創(chuàng)新的在交通流檢測(cè)上的應(yīng)用。
時(shí)空注意力機(jī)制的應(yīng)用能夠關(guān)注到重要的交通信息,防止出現(xiàn)遺漏狀況。訓(xùn)練過(guò)程用train_seas()函數(shù)進(jìn)行訓(xùn)練,使用RMS作為優(yōu)化器,學(xué)習(xí)率設(shè)置為0.001.一個(gè)batch為256,進(jìn)行12個(gè)循環(huán)次數(shù),訓(xùn)練時(shí)間在30min之內(nèi)。用CPU來(lái)實(shí)驗(yàn)也可以進(jìn)行,時(shí)間上過(guò)慢。
1.5 實(shí)驗(yàn)結(jié)果
在本次實(shí)驗(yàn)中,我們使用的是MAE、MSE、RMSE、MAPE、R2幾個(gè)指標(biāo)對(duì)交通流的預(yù)測(cè)結(jié)果準(zhǔn)確性進(jìn)行評(píng)估。這里,使用之前訓(xùn)練好的模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè)。具體的實(shí)驗(yàn)結(jié)果如圖4所示。
其中,藍(lán)色為真實(shí)值,橙色為使用RNN和LSTM預(yù)測(cè)出的結(jié)果值??梢钥闯?,由于訓(xùn)練次數(shù)不夠,模型的擬合程度不高。數(shù)值的波動(dòng)性較大,可能由于采集的數(shù)據(jù)中存在中斷現(xiàn)象導(dǎo)致的。通過(guò)其他線條的預(yù)測(cè)結(jié)果顯示,這種方法檢測(cè)效果良好,如表1所示。
GRN是一種圖卷積循環(huán)神經(jīng)網(wǎng)絡(luò),SAES傳統(tǒng)的預(yù)測(cè)方式,是利用編碼器對(duì)交通流進(jìn)行監(jiān)測(cè)的一種方式。從三者的精度對(duì)比圖可知,基于循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方式精度不差,且代碼量簡(jiǎn)單,所以使用這種方法具有可行性。
2 基于殘差網(wǎng)絡(luò)的交通流監(jiān)測(cè)
目前,基于對(duì)高速公路上交通流預(yù)測(cè)大多采用的是短時(shí)預(yù)測(cè)。短期預(yù)測(cè)大多基于一周內(nèi)的樣本數(shù)據(jù)進(jìn)行預(yù)測(cè),上一章節(jié)中的RNN就是短期預(yù)測(cè)的一種代表方式。本章將研究使用一種深層次的殘差反卷積網(wǎng)絡(luò)模型對(duì)交通流量實(shí)現(xiàn)長(zhǎng)時(shí)間的預(yù)測(cè)。其在精度上有了較大的提升,并且算法的魯棒性較強(qiáng)。
2.1 實(shí)驗(yàn)配置和數(shù)據(jù)集介紹
本次研究使用的是從網(wǎng)絡(luò)上利用python爬蟲(chóng)技術(shù)爬取的高速公路上海市延安高架和內(nèi)環(huán)的連續(xù)3d之內(nèi)的樣本數(shù)據(jù),即以高速公路上的交通流量為標(biāo)準(zhǔn)。從而實(shí)現(xiàn)長(zhǎng)時(shí)的交通流量預(yù)測(cè)實(shí)驗(yàn)。選取的實(shí)驗(yàn)驗(yàn)證時(shí)間為上午的八點(diǎn)到十點(diǎn)內(nèi)的時(shí)間段。對(duì)于爬取到的缺失數(shù)據(jù)進(jìn)行刪除或修復(fù),要考慮到數(shù)據(jù)的連續(xù)性。選擇1000個(gè)數(shù)據(jù)作為訓(xùn)練集,同時(shí)選取了30個(gè)樣本數(shù)據(jù)作為測(cè)試集。每隔350m進(jìn)行檢測(cè)。
本次實(shí)驗(yàn)由于實(shí)驗(yàn)的樣本數(shù)據(jù)容量較大以及網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)復(fù)雜,所以對(duì)硬件配置的要求高一些。所用的實(shí)驗(yàn)環(huán)境是windows系統(tǒng)下的tensorflow,i7的NVIDIA Geforce GTX1080 GPU,也可以用遠(yuǎn)程服務(wù)器進(jìn)行實(shí)驗(yàn)。
2.2 實(shí)驗(yàn)所用的網(wǎng)絡(luò)模型
為了增強(qiáng)數(shù)據(jù)的關(guān)聯(lián)性從而更好地提升精度,增強(qiáng)魯棒性。將得到的原始數(shù)據(jù)按照每五分鐘的時(shí)間間隔,進(jìn)行輸入。同時(shí),這種方法的使用還能有效的去除噪音對(duì)數(shù)據(jù)產(chǎn)生的影響。在對(duì)歷史數(shù)據(jù)的選取過(guò)程中用以下的公式進(jìn)行數(shù)據(jù)的輸入。
其中,Si表示不同的時(shí)間輸入,x指的是每天監(jiān)測(cè)到的交通流矩陣數(shù)據(jù)樣本。m表示所用到的檢測(cè)器的數(shù)量,n是取到的時(shí)間間隔在時(shí)間跨度上的劃分。這里的T是周期性的,由于每5min監(jiān)測(cè)一次,所以接下來(lái)的矩陣時(shí)間維度上的輸入為T(mén)-5,T-10。
本次實(shí)驗(yàn)最重要的部分就是最后的生成器部分,使用的是殘差反卷積的網(wǎng)絡(luò)模型,并在此基礎(chǔ)上進(jìn)一步進(jìn)行模型的改進(jìn)。具體的網(wǎng)絡(luò)模型結(jié)構(gòu)圖如下圖5所示。
由圖5得到了實(shí)驗(yàn)所用到的網(wǎng)絡(luò)結(jié)構(gòu)圖,首先將輸入的交通數(shù)據(jù)流矩陣作為輸入經(jīng)過(guò)三層卷積神經(jīng)網(wǎng)絡(luò),激活函數(shù)分別使用了Tanh和Relu,然后經(jīng)過(guò)上采樣進(jìn)入反卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)中去。上采樣的作用是較少數(shù)據(jù)量和改變數(shù)據(jù)的維度。經(jīng)過(guò)了三層反卷積最后得到了樣本數(shù)據(jù)的特征圖。反卷積操作與卷積操作是相反的。運(yùn)用反卷積能夠減少在特征提取過(guò)程中的相關(guān)特征丟失,并且保持了數(shù)據(jù)有相同的維度。
2.3 實(shí)驗(yàn)的訓(xùn)練過(guò)程
引入了空間的注意力機(jī)制,使得模型能夠更具泛化性。從而實(shí)現(xiàn)時(shí)間和空間上的動(dòng)態(tài)聯(lián)系。本小節(jié)中將重點(diǎn)介紹實(shí)驗(yàn)訓(xùn)練過(guò)程中的重要過(guò)程,反卷積上采樣操作。反卷積是圖像的上采樣的經(jīng)典操作之一,其他兩種是雙線性插值法和反池化法。反卷積又叫做轉(zhuǎn)置卷積,其操作過(guò)程與一半的卷積過(guò)程相反。其操作過(guò)程較為簡(jiǎn)單,以下面的公式推導(dǎo)來(lái)理解反卷積的具體實(shí)現(xiàn)過(guò)程:
o=size of output
i = size of input
P = padding
S = strides
利用上述已經(jīng)定義好上述的數(shù)學(xué)描述,那么在進(jìn)行反卷積時(shí)的輸入與輸出的計(jì)算關(guān)系式為利用上面反卷積可以實(shí)現(xiàn)圖像由小分辨率到大分辨率的對(duì)應(yīng)映射。解決了經(jīng)過(guò)CNN卷積層后圖像尺寸變小的問(wèn)題。這里,可以在相關(guān)步驟內(nèi)提取到更為清晰的交通流特征數(shù)據(jù)。
2.4 實(shí)驗(yàn)結(jié)果分析
本次實(shí)驗(yàn)設(shè)置的每個(gè)卷積核的步長(zhǎng)為1,學(xué)習(xí)率設(shè)置為0.0001,網(wǎng)絡(luò)進(jìn)行了約20000次的訓(xùn)練。首先,展示出了利用不同的時(shí)間輸入粒子的有效性。具體的判別方法與第二章中的實(shí)驗(yàn)相似。
評(píng)估實(shí)驗(yàn)結(jié)果的精度使用的是平均誤差MSE,平均絕對(duì)誤差MAE以及均方根誤差RMSE。以下為不同時(shí)間輸入的有效性驗(yàn)證。并且創(chuàng)新型的在實(shí)驗(yàn)中引入注意力機(jī)制,確保各個(gè)檢測(cè)器之間有著相同的距離,這里設(shè)置為3.5km,在時(shí)間維度,考慮到不同的時(shí)間間隔高速公路上的交通流數(shù)據(jù)的關(guān)聯(lián)性。如表2所示。
DCN為我們本次實(shí)驗(yàn)的反卷積操作,而另外兩組對(duì)比實(shí)驗(yàn)是記錄了單獨(dú)提取低時(shí)間2min和高時(shí)間25min作為兩種不同的間隔時(shí)間的實(shí)驗(yàn)結(jié)果。經(jīng)實(shí)驗(yàn)結(jié)果驗(yàn)證,本次研究提出的提取關(guān)聯(lián)的時(shí)間粒子模型在有著較好的性能。
2.5 評(píng)價(jià)方法
在進(jìn)行道路系統(tǒng)的交通流的預(yù)測(cè)過(guò)程中,需要使用間隔時(shí)間來(lái)進(jìn)行時(shí)時(shí)間步的設(shè)置。在實(shí)現(xiàn)長(zhǎng)期預(yù)測(cè)時(shí),這種方法尤為適用。
均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)都符合這一要求,盡管RMSE更常用,并將在本次研究中采用。與MAE不同,RMAE對(duì)待測(cè)數(shù)據(jù)更敏感 。這個(gè)問(wèn)題的性能指標(biāo)將是從第1d到第7d的一周內(nèi)時(shí)間交通流的RMSE。可以使用的一個(gè)可能的評(píng)分是所有預(yù)測(cè)日的RMSE,它更具有準(zhǔn)確性。
均方根誤差,它是實(shí)驗(yàn)所測(cè)的預(yù)測(cè)值與真值偏差的平方和觀測(cè)次數(shù)n比值的平方根,在實(shí)際測(cè)量中,由于實(shí)驗(yàn)的次數(shù)不多,真值只能用最能被信任的量(最佳)值來(lái)代替。同時(shí),均方根誤差能夠快速區(qū)別出數(shù)據(jù)中的最大值和最小值,所以,均方根誤差能夠很好地反映出試驗(yàn)過(guò)程是否準(zhǔn)確。其作為實(shí)驗(yàn)精度的評(píng)價(jià)指標(biāo)之一,這一測(cè)量列真誤差的均方根差(真誤差平方的算術(shù)平均值再開(kāi)方),稱(chēng)為標(biāo)準(zhǔn)偏差,以σ表示。σ反映了測(cè)量數(shù)據(jù)偏離真實(shí)值的程度,σ越小,表示測(cè)量精度越高,因此可用σ作為評(píng)定這一測(cè)量過(guò)程精度的標(biāo)準(zhǔn)。具體的公式如下式:
3 結(jié)語(yǔ)
文章首先論述了高速公路的交通數(shù)據(jù)流的幾種監(jiān)控方法以及其數(shù)據(jù)特點(diǎn),然后使用深度學(xué)習(xí)的研究方法。創(chuàng)新性的使用了圖卷積神經(jīng)網(wǎng)絡(luò)代替?zhèn)鹘y(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)高速公路上的交通流數(shù)據(jù)進(jìn)行特征提取。同時(shí),做了兩組對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)證明RNN和LSTM相結(jié)合的方法比傳統(tǒng)的編碼器預(yù)測(cè)交通數(shù)據(jù)流在性能上有了很大提升。又提出了一種引入注意力機(jī)制的殘差神經(jīng)網(wǎng)絡(luò)用于交通流的長(zhǎng)期預(yù)測(cè),將RMSE作為模型的評(píng)價(jià)指標(biāo)進(jìn)行實(shí)驗(yàn)評(píng)估,經(jīng)過(guò)不斷的對(duì)比實(shí)驗(yàn)驗(yàn)證出提出的融合模型具有有效性。
同時(shí),通過(guò)優(yōu)化算法配置參數(shù)來(lái)進(jìn)行網(wǎng)絡(luò)和算法上的優(yōu)化。分別在自制的輕量數(shù)據(jù)集和具有實(shí)際生活中的上海高速公路路段的交通流進(jìn)行監(jiān)測(cè),在兩個(gè)數(shù)據(jù)集上都有著良好的預(yù)測(cè)效果。并且克服了RNN在預(yù)測(cè)過(guò)程中易出現(xiàn)的梯度消失和爆炸等情況。在以后的實(shí)驗(yàn)中,要克服硬件上的困難,在稍大一些的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),從而對(duì)算法進(jìn)行優(yōu)化,提升模型得到泛化性。
參考文獻(xiàn)
[1]陳淑燕.交通流量預(yù)測(cè)方法和多相位交通信號(hào)模糊技術(shù)的研究[D]南京:東南大學(xué),2003.
[2]賀國(guó)光,李宇.基于數(shù)學(xué)模型的短時(shí)交通預(yù)測(cè)方法探討[J].系統(tǒng)工程理論與實(shí)踐,2000(12):51-56.
[3]胡小健,陸健.基于二步自適應(yīng)的交通實(shí)時(shí)預(yù)測(cè)模型[[J]南京:東南大學(xué),210096
[4] Zheng Zhao,Weihai Chen,Xingming Wu,et al. LSTM network: a deep learning approach for short-term traffic forecast[J]. IET Intelligent Transport Systems, 2017, 11(2):68-75.
[5] Yang Hao-Fan; Dillon Tharam S; Chen Yi-Ping Phoebe. Optimized Structure of the Traffic Flow ForecastingModel With a Deep Learning Approach[J]. IEEE Transactions on Neural Networks& Learning Systems, 2017, 28(10):2371-2381.
[6] Lv Y, DuanY, Kang W, et al. Traffic Flow Prediction With Big Data: A Deep LearningApproach[J]. IEEE Transactions on Intelligent Transportation Systems, 2015,16(2):865-873.
[7] KoesdwiadyA, Soua R, Karray F. Improving Traffic Flow Prediction With Weather Informationin Connected Cars: A Deep Learning Approach[J]. IEEE Transactions on VehicularTechnology, 2016, 65(12):9508-9517.
[8] Omar Y.Al-Jarrah,Paul D.Yoo,Sami Muhaidat , et al. Efficient Machine Learning for Big Data : A Review [J]. Big Data Research, 2015, 2(3):87-93.
[9] Chun Mei Duan.Design of Big Data Processing System Architecture Based on Hadoop under the Cloud Computing[J]. Applied Mechanics and Materials, 2014, 3207:6302-6306.
[10] Anyu Cheng,Xiao Jiang,Yongfu Li, et al. Multiple sources and multiple measures based traffic flowprediction using the chaos theory and support vector regression method[J]. Physica A: Statistical Mechanics and its Applications, 2017, 466:422-434.