馬德明,梁宏斌
基于時空混合殘差網(wǎng)絡(luò)的事故黑點預(yù)測研究
馬德明,梁宏斌
(西南交通大學(xué),交通運輸與物流學(xué)院,成都 611756)
深度學(xué)習(xí)在圖像識別、自然語言處理方面的研究進展突飛猛進,也逐漸開始應(yīng)用于交通領(lǐng)域,目前主要應(yīng)用于交通流和交通需求預(yù)測,但對事故的研究較少。本文將事故數(shù)據(jù)作為一種時空數(shù)據(jù),在時間和空間維度分析其與其他深度學(xué)習(xí)所研究數(shù)據(jù)的差異,利用深度學(xué)習(xí)相關(guān)技術(shù)分別從時間和空間維度建模,提取相應(yīng)的特征與屬性,并將這些模型組件組裝與融合,搭建了時空混合殘差網(wǎng)絡(luò),用于事故黑點預(yù)測。在對真實數(shù)據(jù)進行預(yù)處理后載入模型進行實驗,訓(xùn)練效果良好,損失最后降到0.862 4,隨機選取序列的預(yù)測事故圖平均誤差為-5.45%,與其他模型相比損失最小,結(jié)果表明本網(wǎng)絡(luò)具有較好的事故黑點預(yù)測能力。
交通事故;事故預(yù)測;深度學(xué)習(xí);事故黑點
當(dāng)前隨著交通的不斷發(fā)展,事故也間接地有所增加,事故受到道路交通發(fā)展的影響。事故黑點是交通安全研究的重要方向,在高效整治交通事故方面可起到關(guān)鍵作用。
當(dāng)前研究事故黑點的方法多為線性回歸方法或多元統(tǒng)計分析方法,Lord等[1]研究表明采用廣義估計方程比普通數(shù)學(xué)模型能更好地分析交通事故的時間相關(guān)性;MA與Gill[2,3]建立了多變量泊松-對數(shù)正態(tài)回歸模型來進行事故數(shù)的預(yù)測與事故黑點的探測;考慮位于同一交通通道的交叉口之間的空間相關(guān)性,WANG等[4]采用廣義估計方程分析Central Florida地區(qū)的交叉口安全影響因素;Huang與Fawcett等[5,6]應(yīng)用貝葉斯進行事故黑點識別;Murat[7]考慮事故類型和事故產(chǎn)生的影響因素,采用香農(nóng)熵方法確定黑點的安全水平;孟祥海[8]研究了滑動窗窗體長度及滑動步長對事故多發(fā)路段鑒別影響;Bham[9]基于主成分分析方法提出一種綜合分級度量來識別高速路上的事故黑點;Wang[10]建立一元負二項條件自回歸模型和二元負二項空間條件自回歸模型來分析單車事故和多車事故的影響因素以及這些因素在事故黑點中的一致性情況;Harirforoush[11]提出網(wǎng)絡(luò)核密度估計的空間分布與臨界事故率網(wǎng)絡(luò)篩選綜合方法來探測事故黑點;Ulak[12]比較了常用的基于網(wǎng)絡(luò)的熱點檢測方法,深入了解所選熱點檢測方法在使用不同空間權(quán)重時的異同;Zahran[13]對比了基于風(fēng)險水平的空間交通事故分析方法與道路審計方法的差異,并確定了所研究道路的危險水平;石小林等[14]運用二元Logit模型對事故嚴重程度進行了分析。
現(xiàn)階段深度學(xué)習(xí)在圖像識別、自然語言處理等方面取得了重大的突破,而在交通領(lǐng)域的應(yīng)用還不太廣泛,主要應(yīng)用于交通流的研究。Shi[15]對時空序列預(yù)測問題的機器學(xué)習(xí)方法進行了系統(tǒng)的回顧;Li[16]將交通流建模為有向圖上的擴散過程,并引入擴散卷積遞歸神經(jīng)網(wǎng)絡(luò),建立了將交通流的空間與時間相關(guān)性結(jié)合的深度學(xué)習(xí)框架;Zhao[17]將圖卷積網(wǎng)絡(luò)和門控遞歸單元相結(jié)合,提出了時態(tài)圖卷積網(wǎng)絡(luò)模型進行城市交通量的預(yù)測;Zhang[18]基于深度學(xué)習(xí)的方法提出ST-ResNet模型,用來集中預(yù)測一個城市每個區(qū)域的人群流入和流出情況。
本文在分析事故數(shù)據(jù)時空特性的基礎(chǔ)上,將深度學(xué)習(xí)技術(shù)應(yīng)用于事故黑點預(yù)測研究中,建立了時空混合殘差網(wǎng)絡(luò)來預(yù)測事故黑點,并以真實數(shù)據(jù)進行實驗,驗證了模型的有效性。
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),是處理位置相關(guān)信息的有效深度學(xué)習(xí)結(jié)構(gòu),通過卷積神經(jīng)網(wǎng)絡(luò),可以提取出事故數(shù)據(jù)空間維度的特征。
對于某些問題,我們關(guān)注的重點在于部分較為重要的輸出節(jié)點與輸入節(jié)點之間的關(guān)系,這部分重要的節(jié)點以圖像的形式表現(xiàn)出來就稱為感知域。此時層與層之間并非全連接,而是僅連接到感知域。此外,使用權(quán)值共享的思想,可將參數(shù)量再進一步的減少。例如使用權(quán)值矩陣:
與感知域的輸出相乘累加,作為相應(yīng)位置的下一層輸入;同時滑動感知域窗口,對于其他的感知域也采用該權(quán)值矩陣與感知域的輸出相乘累加,作為對應(yīng)位置的下一層輸入。這種共享權(quán)值的“局部連接”網(wǎng)絡(luò)其實就是卷積神經(jīng)網(wǎng)絡(luò)。每個輸出節(jié)點用權(quán)值相乘累加的方式提取對應(yīng)感知域的特征信息,其實就是離散卷積運算:
網(wǎng)絡(luò)模型層數(shù)的增加是一把雙刃劍,雖然可以提高網(wǎng)絡(luò)泛化能力,但另一方面網(wǎng)絡(luò)的層數(shù)越多就越難訓(xùn)練,這主要是由于梯度彌散和梯度爆炸現(xiàn)象造成的。為了解決深層神經(jīng)網(wǎng)絡(luò)這兩個問題,深度殘差網(wǎng)絡(luò)通過在卷積層的輸入和輸出之間添加跳過連接或殘差連接建立回退機制,如圖1所示。
圖1 ResNet結(jié)構(gòu)
經(jīng)過添加這樣一個跳過連接后,即使出現(xiàn)梯度彌散或者梯度爆炸問題,也可以通過此跳過連接的回退機制,將梯度以線性的方式回退到之前的輸出中進行梯度更新,完成殘差學(xué)習(xí)。即最差的效果也不會低于上一輸出層的效果,大大提高了模型的訓(xùn)練效率與表達能力。
事故數(shù)據(jù),本質(zhì)上是一種時空數(shù)據(jù)。在時間維度上記錄事故發(fā)生的時間,在空間維度上標記事故發(fā)生的位置。時空數(shù)據(jù)相對于文本數(shù)據(jù)、圖像數(shù)據(jù)、視頻數(shù)據(jù)等一系列在深度學(xué)習(xí)研究中常見的數(shù)據(jù),具有以下特點:
(1)時間維度的周期性和趨勢性。事故數(shù)據(jù)在一定程度上具有周期性,這本質(zhì)上跟隨交通流量的變化而表現(xiàn)出來。同時事故的重復(fù)性變化不是嚴格的發(fā)生,而是具有趨勢性的上揚和下降,例如隨著冬天的到來氣溫逐漸降低,事故的發(fā)生相對于天暖的時候有所增加,這不是嚴格的周期性,而是趨勢性的上揚問題。
(2)空間維度的距離性和層次性。根據(jù)地理學(xué)第一定律可知,距離越遠,其相似度越低,這是空間相關(guān)性的基礎(chǔ)??臻g粒度的劃分可以有不同的大小,以反映不同層次的信息。大粒度可以反映整體的網(wǎng)絡(luò)結(jié)構(gòu)信息,小粒度可以反映局部的細節(jié)信息,空間層次性劃分的意義在于:有的事故的相似度,或稱為相關(guān)性,可能在較小的一層很低甚至不存在,但是往上歸納一層即可找到;而有的事故的相似度在較大的一層比較高,但是在較小的一層中能分析出它們之間的差異。距離和層次是空間數(shù)據(jù)的特有屬性。
在交通事故預(yù)測問題中,發(fā)生在不同地點的交通事故存在相似之處,這其中的空間相似性主要包括道路線形(橫縱曲線)、周邊環(huán)境特征、道路限速等空間特征的相似性,這些空間特征會不同程度的影響事故的發(fā)生,在不同的地點隱性表達。
相鄰區(qū)域的地理和環(huán)境特性具有一定的相似性,卷積神經(jīng)網(wǎng)絡(luò)可以通過卷積操作,利用過濾器,即前文所述的感知域來捕獲這種相似性。如圖2所示,淺層的網(wǎng)絡(luò)層負責(zé)捕獲附近地點和距離較近地點的空間相似性,并將這種特性編譯到輸出中,深層的網(wǎng)絡(luò)層基于之前的輸出,捕獲距離較遠地點甚至是全城范圍內(nèi)的空間相似性。經(jīng)過以上的處理,整個城市的空間相似性就已經(jīng)被提取出來,并儲存在最后的網(wǎng)絡(luò)圖中。
圖2 多層卷積
這樣的處理,具有以下三點優(yōu)勢:
(1)保證時間維度仍然具有一定的連續(xù)性,可以提取出序列信息;
(2)刻畫時間維度的特性;
(3)減少總序列的長度,從而間接減少單個卷積層所需要處理的圖像數(shù)量,提高學(xué)習(xí)效率。
為了解決深層網(wǎng)絡(luò)訓(xùn)練效果差的問題,本文在模型中使用殘差學(xué)習(xí)。對于每一個卷積神經(jīng)網(wǎng)絡(luò),堆棧了個殘差單元,如圖4所示。
圖4 殘差單元
殘差單元的處理過程可表示如下:
前文分別對空間和時間維度建模后,構(gòu)建了相關(guān)的組件,為了組建完整的神經(jīng)網(wǎng)絡(luò),將上述組件按一定的規(guī)則或連接方式進行組裝,最終的網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。
圖5 時空混合殘差網(wǎng)絡(luò)
不同的地點所發(fā)生的事故在一定程度上表現(xiàn)出周期性和趨勢性,但是各自地點所體現(xiàn)出的周期性屬性和趨勢性屬性的強度卻不完全相同,為了能夠準確地在不同地點反映出這兩種特性,本文使用了基于參數(shù)矩陣的融合方法:
最后,預(yù)測值與真實值之間的損失(loss)用均方差來計算:
本文的模型實現(xiàn)代碼結(jié)果如圖6所示。
圖6 模型的代碼架構(gòu)
各模塊所實現(xiàn)的具體功能如表1所示。
表1 模塊與功能
本文使用的數(shù)據(jù)是美國弗吉尼亞州的事故數(shù)據(jù),該數(shù)據(jù)集包含了弗吉尼亞州從2010年1月1日至2017年3月18日所發(fā)生的事故,從總共79萬條數(shù)據(jù)中篩選18萬條北弗吉尼亞地區(qū)數(shù)據(jù)用于實驗,數(shù)據(jù)坐標范圍如表2所示,分別為東南角和西北角的坐標數(shù)據(jù)。
表2 數(shù)據(jù)范圍頂點坐標
為滿足多層卷積神經(jīng)網(wǎng)絡(luò)輸入格式的要求,需將所在區(qū)域劃分為×的空間網(wǎng)格,作為后續(xù)事故數(shù)據(jù)映射的框架。在實際研究中,網(wǎng)格劃分標準的確定需要權(quán)衡數(shù)據(jù)覆蓋率、計算復(fù)雜度和預(yù)測難度三者之間的關(guān)系。本文在綜合考量上述三者關(guān)系的基礎(chǔ)上經(jīng)過多次實驗,最后選擇表3所示的網(wǎng)格劃分方式。
表3 網(wǎng)格劃分概況
這樣的網(wǎng)格劃分方式既避免了數(shù)據(jù)稀疏問題的出現(xiàn),同時降低了計算復(fù)雜度與預(yù)測難度,提高了網(wǎng)絡(luò)的訓(xùn)練效率與預(yù)測精度。
圖7 事故映射圖示例
本文分別對16×16和32×32的網(wǎng)格規(guī)模模型進行了實驗,發(fā)現(xiàn)16×16的網(wǎng)絡(luò)規(guī)模更加適合本數(shù)據(jù)集,故以下的分析均基于16×16網(wǎng)格規(guī)模的實驗結(jié)果。
圖8為模型的訓(xùn)練損失變化圖。淺色折線為實際損失變化曲線,但是不便于分析,故進行了平滑處理,得到平滑后的訓(xùn)練損失變化曲線。為了有更好的展示效果,未將損失的高位部分展示出來,模型損失值的最高點位于8.234,隨后迅速下降,約于150步附近達到0.885 8處,隨后在波動中整體呈現(xiàn)出損失下降的趨勢,說明模型在不斷地被訓(xùn)練與優(yōu)化,且符合深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的普遍情況,約于2790步處達到模型的最優(yōu)點,損失值為0.658。
圖8 訓(xùn)練損失
圖9為模型的測試損失變化圖。淺色折線為實際損失變化曲線,但是不便于分析,故進行了平滑處理,得到平滑后的測試損失變化曲線。可觀察到,經(jīng)過訓(xùn)練后的模型,剛開始損失值就較低,起始為0.960 1,后有所上升,屬于隨機情況,最高值為10步附近的1.019,隨后也迅速下降,約于130步附近達到0.922 3,隨后在波動中呈現(xiàn)下降趨勢,在328步附近達到最低值0.862 4。
圖9 測試損失
測試損失略高于訓(xùn)練損失屬于正常情況,因為測試損失不僅包括了模型的泛化能力,還包括了訓(xùn)練集上的損失。根據(jù)訓(xùn)練損失和測試損失,可說明該時空混合殘差網(wǎng)絡(luò)具有預(yù)測事故黑點的能力。
從真實事故數(shù)據(jù)中隨機選取4個時間序列的事故映射圖,并同時選取對應(yīng)序列的預(yù)測事故圖,用于實驗結(jié)果的絕對誤差分析。實驗結(jié)果的具體絕對誤差如表4所示,其中絕對誤差的定義為(預(yù)測值-真實值)/真實值。
表4 絕對誤差
由表4可知,事故黑點預(yù)測效果整體非常好,其中效果最好的地區(qū)誤差甚至降到了1%附近?,F(xiàn)無法做到準確的定位、預(yù)測每一起交通事故,更多的是盡可能準確地去預(yù)測在何時、何地會出現(xiàn)大量的交通事故,即事故黑點,故總體而言,預(yù)測準確度均在較高水平。對于本次選取的4個隨機序列,平均絕對誤差為-5.45%,除去效果最差的序列a,其余3個序列的平均誤差僅為-2.89%,已經(jīng)達到非常高的準確度。
除了進行本文所提出的時空混合殘差網(wǎng)絡(luò)實驗,為了對比模型的效果,還應(yīng)用了自回歸模型(AR),有時序選擇的長短時記憶網(wǎng)絡(luò)(S-LSTM),卷積長短時記憶網(wǎng)絡(luò)(ConvLSTM)進行對比實驗。實驗的損失計算仍用均方差,其結(jié)果如表5所示。
表5 實驗效果對比
由上表可知,本文的時空混合殘差網(wǎng)絡(luò)優(yōu)于其他幾個模型,驗證了本模型的有效性。
使用深度學(xué)習(xí)方法時對數(shù)據(jù)有不同的要求,故本文首先分析了事故數(shù)據(jù)相對于文本數(shù)據(jù)、圖像數(shù)據(jù),在時間和空間維度所呈現(xiàn)出的特性,在此基礎(chǔ)上對時間和空間維度分別建模捕捉其時空特征,并將上述建模得到的組件進行組裝與融合,構(gòu)建時空混合殘差網(wǎng)絡(luò)。在對真實數(shù)據(jù)集進行預(yù)處理后,輸入模型進行實驗,訓(xùn)練效果較優(yōu),隨機選取的序列事故映射圖的平均誤差在-5.45%,同時和其他模型相比損失最低,表明該模型具有較好的事故黑點預(yù)測能力。但本文的研究中未能將事故產(chǎn)生的經(jīng)濟損失,人員傷亡等屬性囊括在內(nèi),后續(xù)的研究可將事故嚴重程度和其他影響因素作為輸入對象,以提高預(yù)測的準確度。
[1] LORD D, PERSAUD B N. Accident prediction models with and without trend: application of the generalized estimating equations procedure [J]. Transportation Research Record, 2000, 17 (1): 102-108.
[2] MA J, KOCKELMAN K M, DAMIEN P. A multivariate Poisson-lognormal regression model for prediction of crash counts by severity, using Bayesian methods [J]. Accident Analysis & Prevention, 2008, 40 (3): 964-975.
[3] GILL G S, CHENG W, ZHOU J, et al. Comparative analysis of cost-weighted site ranking using alternate distance-based neighboring structures for spatial crash frequency modeling [J]. Journal of Transportation Safety & Security, 2019, 11 (1): 79-101.
[4] WANG X, ABDEL-ATY M. Crash estimation at signalized intersections along Corridors: analyzing Spatial Effect and Identifying Significant Factors [J]. Transportation Research Record, 2006, 1953 (1): 98-111.
[5] HUANG H, CHIN H C, HAQUE M M. Empirical Evaluation of Alternative Approaches in Identifying Crash Hot Spots: Naive Ranking, Empirical Bayes, Full Bayes Methods [J]. Transportation Research Record, 2009, 2103 (1): 32-41.
[6] FAWCETT L, THORPE N, MATTHEWS J, et al. A novel Bayesian hierarchical model for road safety hotspot prediction [J]. Accident Analysis & Prevention, 2017, 99 (1): 262-271.
[7] MURAT Y S. An entropy (shannon) based traffic safety level determination approach for black spots [J]. Procedia-social and Behavioral Sciences, 2011, 20: 786-795.
[8] 孟祥海, 張道玉, 吳佩潔. 滑動窗窗體長度及滑動步長對事故多發(fā)路段鑒別影響 [J]. 交通運輸系統(tǒng)工程與信息, 2018, 18 (4): 148-155.
[9] BHAM G H, MANEPALLI U R, SAMARANAYKE V. A composite rank measure based on principal component analysis for hotspot identification on highways [J]. Journal of Transportation Safety & Security, 2019, 11 (3): 225-242.
[10] WANG X, FENG M. Freeway single and multi-vehicle crash safety analysis: influencing factors and hotspots [J]. Accident Analysis & Prevention, 2019, 132 (1): 52-68.
[11] HARIRFOROUSH H, BELLALITE L. A new integrated GIS-based analysis to detect hotspots: a case study of the city of Sherbrooke [J]. Accident Analysis & Prevention, 2019, 130 (1): 62-74.
[12] ULAK M B, OZGUVEN E E, VANLI O A, et al. Exploring alternative spatial weights to detect crash hotspots [J]. Computers, Environment and Urban Systems, 2019, 78 (1): 13-98.
[13] ZAHRAN E-S M M, TAN S J, TAN E H A, et al. Spatial analysis of road traffic accident hotspots: evaluation and validation of recent approaches using road safety audit [J]. Journal of Transportation Safety & Security, 2019, 2 (1): 1-30.
[14] 石小林, 李涵, 黃子富. 基于二元Logit模型的直角事故受傷嚴重程度分析[J]. 交通運輸工程與信息學(xué)報, 2020, 18 (1): 106-110.
[15] SHI X, YEUNG D-Y. Machine learning for spatiotemporal sequence forecasting: A survey [J]. ArXiv Preprint ArXiv: 2018, 1808 (1): 65-68.
[16] LI Y, YU R, SHAHABI C, et al. Diffusion convolutional recurrent neural network: Data-driven traffic forecasting [J]. ArXiv Preprint ArXiv: 2017, 1707 (1): 19-26.
[17] ZHAO L, SONG Y, ZHANG C, et al. T-gcn: a temporal graph convolutional network for traffic prediction [J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 9 (1): 3848-3858.
[18] ZHANG J, ZHENG Y, Qi D. Deep spatio-temporal residual networks for citywide crowd flows prediction[J]. ArXiv Preprint ArXiv: 2016, 1610 (1): 81-100.
Accident Black Spot Prediction Based on Spatio-Temporal Heterogeneous Residual Network
MA De-ming,LIANG Hong-bin
(School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 611756, China)
Deep learning has progressed rapidly in theresearch areas of image recognitionand natural language processing. Additionally, its application in the field of transportation isincreasinggradually. Currently, it is mainly utilized in the prediction of the traffic flow and demand. However, the research on accidents is yet insufficient. In this study, we analyzed the difference between accident data as a type of spatio-temporal data and compared it with otherspatio-temporal data studied through deep learning. Building a spatio-temporal heterogeneous residual network for accident hotspot prediction requires spatial and temporal dimension modeling, extraction of corresponding features and attributes, and assembly and fusion of these model components. The real data were pre-processed and loaded into the model, which was then experimented on. The training effect was satisfactory, and the loss had decreased from 8.234 to 0.862 4. The average error of the predicted accident map of a randomly selected sequence was -5.45%, and the loss in this case was minimal when compared with other models. The results indicate that the proposed network exhibited a superiorcapability of predicting accident hotspots.
traffic accident; accident prediction; deep learning; accident hotspot
1672-4747(2020)04-0068-08
U491.31
A
10.3969/j.issn.1672-4747.2020.04.009
2020-03-15
馬德明(1995—),男,云南楚雄人,主要研究方向為交通安全、事故黑點,E-mail: chdrailmdm@163.com
梁宏斌(1972—),男,四川成都人,副教授,博士,研究方向為移動云計算、信息安全等,E-mail: 14273385@qq.com
馬德明,梁宏斌. 基于時空混合殘差網(wǎng)絡(luò)的事故黑點預(yù)測研究[J]. 交通運輸工程與信息學(xué)報,2020, 18(4): 68-75
(責(zé)任編輯:劉娉婷)