馬彬濤,郝帥潔,廖星星
(長(zhǎng)安大學(xué) 汽車學(xué)院,陜西 西安 710064)
隨著我國(guó)經(jīng)濟(jì)發(fā)展,機(jī)動(dòng)車保有量不斷增多,道路交通量快速增長(zhǎng),各類安全風(fēng)險(xiǎn)交織疊加,交通事故預(yù)防任務(wù)艱巨繁重[1]。
在大數(shù)據(jù)時(shí)代,事故數(shù)據(jù)的合理挖掘分析對(duì)于事故的管理預(yù)防有著非常重要的意義。國(guó)內(nèi)外學(xué)者在利用交通事故數(shù)據(jù)來(lái)分析事故方面做了很多研究,事故預(yù)測(cè)是一個(gè)非常重要的方面。本文重點(diǎn)概述主要事故預(yù)測(cè)模型,對(duì)這些模型優(yōu)缺點(diǎn)進(jìn)行比較評(píng)價(jià),并進(jìn)行了案例分析。
用車輛事故數(shù)據(jù)預(yù)測(cè)交通事故的流程可分為三步[2]。
(1)確定預(yù)測(cè)的目標(biāo):根據(jù)現(xiàn)有事故數(shù)據(jù)的情況及預(yù)測(cè)目標(biāo)選擇適合的方法。
(2)建立事故風(fēng)險(xiǎn)預(yù)測(cè)模型:根據(jù)數(shù)據(jù)建立不同的預(yù)測(cè)模型,并進(jìn)行精度比較,選擇最合適的預(yù)測(cè)模型合理評(píng)價(jià)預(yù)測(cè)結(jié)果。
(3)對(duì)預(yù)測(cè)結(jié)果進(jìn)行跟蹤:為了確保預(yù)測(cè)模型的適用性,需要對(duì)模型預(yù)測(cè)的結(jié)果不斷跟蹤,并在此過(guò)程中不斷完善模型。道路交通事故預(yù)測(cè)流程如圖1所示。
圖1 道路交通事故預(yù)測(cè)流程
國(guó)內(nèi)外學(xué)者對(duì)于交通事故的預(yù)測(cè)使用了不同的預(yù)測(cè)模型。對(duì)于不同的事故數(shù)據(jù)類型,選擇合適的模型進(jìn)行風(fēng)險(xiǎn)評(píng)估非常重要。建立預(yù)測(cè)模型采用的主要方法有回歸分析、灰色分析、貝葉斯網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、集成學(xué)習(xí)等。
回歸分析法主要利用數(shù)據(jù)統(tǒng)計(jì)的原理,對(duì)事故數(shù)據(jù)進(jìn)行數(shù)學(xué)處理,從而確定因變量與某些自變量之間的相關(guān)關(guān)系,建立回歸模型預(yù)測(cè)因變量的變化情況。
FRANCESCA等人[3]采用Logistic 回歸分析來(lái)研究駕駛員特征與事故嚴(yán)重程度之間的關(guān)系;YAU等人[4]利用Logistic 回歸模型分析道路交通安全與其影響因素之間的關(guān)系;CHANG[5]采用多元自適應(yīng)樣條回歸模型研究道路因素與環(huán)境因素對(duì)交通事故發(fā)生的影響。趙小強(qiáng)等人[6]使用多元回歸分析和決策樹這兩種模型預(yù)測(cè)北京城市快速路上的交通事故。
灰色預(yù)測(cè)通過(guò)鑒別系統(tǒng)因素之間發(fā)展趨勢(shì)的相異程度,進(jìn)行關(guān)聯(lián)分析,并對(duì)反映預(yù)測(cè)對(duì)象特征的數(shù)值進(jìn)行處理,最后建立微分方程模型來(lái)預(yù)測(cè)事故發(fā)展趨勢(shì)。
陳玉飛等人[7]使用特征灰色關(guān)聯(lián)矩陣研究,最終提出了死亡人數(shù)的交通事故的預(yù)測(cè)模型。HSU等人[8]利用灰色系統(tǒng)理論預(yù)測(cè)了德國(guó)2025 年前道路交通事故的發(fā)展趨勢(shì)。DU等人[9]利用道路交通事故建立了灰色 Verhulst 預(yù)測(cè)模型。LI等人[10]同時(shí)使用灰色理論和馬爾可夫鏈理論,最終擬合出來(lái)道路交通時(shí)序數(shù)據(jù)的總體趨勢(shì)。交通事故灰色理論與馬爾可夫組合預(yù)測(cè)模型能夠十分有效地挖掘道路交通事故數(shù)據(jù)中有價(jià)值的信息,大幅度提高模型預(yù)測(cè)精度。
貝葉斯網(wǎng)絡(luò)模型可以彌補(bǔ)回歸分析模型、離散選擇模型、事故樹分析法等方法的孤立性、表象片面性等問(wèn)題,引導(dǎo)事故致因因素向多維性和關(guān)聯(lián)性的方向發(fā)展。
吳迪[11]使用貝葉斯網(wǎng)絡(luò)建立了危險(xiǎn)貨物道路運(yùn)輸事故預(yù)測(cè)模型。YANG 等人[12]運(yùn)用貝葉斯動(dòng)態(tài)邏輯回歸的方法提出了實(shí)時(shí)碰撞風(fēng)險(xiǎn)評(píng)估模型。童璐璐[13]使用貝葉斯網(wǎng)絡(luò)將事故影響因素與嚴(yán)重程度結(jié)合,得出了高速公路交通事故嚴(yán)重程度的預(yù)測(cè)模型。宋賀[14]利用危險(xiǎn)貨物運(yùn)輸罐車駕駛試驗(yàn)數(shù)據(jù),使用貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法構(gòu)建了危險(xiǎn)貨物道路運(yùn)輸事故預(yù)測(cè)模型。GRANDE等人[15]利用貝葉斯網(wǎng)絡(luò)模型從地形、環(huán)形交叉口、限制速度等因素預(yù)測(cè)了道路交通事故嚴(yán)重程度的影響。
BP神經(jīng)網(wǎng)絡(luò)在回歸預(yù)測(cè)和分類預(yù)測(cè)的研究中都很適用,大量研究表明神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度很好。鄧曉慶等人[16]通過(guò)構(gòu)建 BP 神經(jīng)網(wǎng)絡(luò)對(duì)高速公路上的交通事故進(jìn)行了分析和預(yù)測(cè)。陳海龍、彭偉[17]提出了改進(jìn)BP神經(jīng)網(wǎng)絡(luò)在交通事故預(yù)測(cè)中的應(yīng)用研究。交通事故數(shù)據(jù);輸出層輸出最終預(yù)測(cè)的結(jié)果;隱藏層處在輸入和輸出單元之間,通過(guò)算法對(duì)數(shù)據(jù)進(jìn)行分析。神經(jīng)元間的連接強(qiáng)度大小由權(quán)值等參數(shù)來(lái)決定。
BP神經(jīng)網(wǎng)絡(luò)模型如圖2所示,輸入層是輸入
圖2 BP神經(jīng)網(wǎng)絡(luò)模型圖
集成學(xué)習(xí)是為了獲得更加顯著的預(yù)測(cè)效果,將多個(gè)基礎(chǔ)模型組合起來(lái)使用,完成事故預(yù)測(cè)工作。集成學(xué)習(xí)方法有“串行”以及“并行”兩種方式。Boosting采用“串行”的方式,Bagging采用“并行”的方式。兩者比較如表1所示。
表1 Boosting和Bagging對(duì)比
BASSO等人[18]利用隨機(jī)森林、支持向量機(jī)和邏輯回歸的校正模塊為智利圣地亞哥的高速公路開(kāi)發(fā)了事故預(yù)測(cè)模型。張蔚[19]結(jié)合多目標(biāo)優(yōu)化和集成學(xué)習(xí)的模型也能夠運(yùn)用于我國(guó)交通事故的分析和預(yù)測(cè),上官[20]等人通過(guò)自然駕駛數(shù)據(jù),使用RF、XGBoost、SVM和MLP 4種建模方法對(duì)實(shí)時(shí)駕駛風(fēng)險(xiǎn)狀態(tài)進(jìn)行預(yù)測(cè)。
對(duì)于各種預(yù)測(cè)模型進(jìn)行了分析,各模型優(yōu)缺點(diǎn)比較情況如表2所示。
表2 各預(yù)測(cè)模型優(yōu)缺點(diǎn)比較
對(duì)數(shù)據(jù)預(yù)測(cè)事故介紹了五種現(xiàn)有模型,基于現(xiàn)有的某地2014—2020年事故發(fā)生的次數(shù),發(fā)現(xiàn)事故樣本適用于灰色預(yù)測(cè)模型,因此,采用灰色分析進(jìn)行事故案例分析。具體數(shù)據(jù)如表3所示。
表3 某地2014—2020年事故統(tǒng)計(jì)數(shù)量
1.建立事故數(shù)據(jù)時(shí)間序列
2.級(jí)比λ(k)計(jì)算及判斷
所有λ都落在(0.7788,1.2840)內(nèi),則數(shù)列x(0)可以作為模型GM(1,1)進(jìn)行灰色預(yù)測(cè)。
3.GM(1,1)建模
對(duì)原始數(shù)據(jù)x(0)做一次累加,得到:
4.構(gòu)造數(shù)據(jù)矩陣B及數(shù)據(jù)向量Y
5.計(jì)算μ
得到(a,b)T=(0.007 2,799.490 6)T
6.建立模型
7.求數(shù)列值x(1)(k+1)及各個(gè)年份的預(yù)測(cè)的事故數(shù)x(0)(k+1)
將k=0,1,2,3,4,5,6代入得到
8.模型評(píng)價(jià)
為了評(píng)價(jià)預(yù)測(cè)模型的準(zhǔn)確度及其適用性,需要對(duì)模型性能進(jìn)行評(píng)價(jià)。
對(duì)于模型性能的評(píng)價(jià)主要有兩個(gè)方面:一是比較預(yù)測(cè)結(jié)果的偏離程度:誤差率(E);二是衡量預(yù)測(cè)模型的擬合能力:均方根誤差(RMSE)[21]
具體計(jì)算公式如下:
其中,n為樣本數(shù),X0為原始值,XP為預(yù)測(cè)值。
可以看出總的誤差率非常小,預(yù)測(cè)結(jié)果準(zhǔn)確;RMSE相對(duì)于事故原始均值777來(lái)說(shuō)很小,因此,擬合程度很好。
整個(gè)預(yù)測(cè)結(jié)果如表4所示。
表4 某地2014—2020事故預(yù)測(cè)結(jié)果
9.2020年后事故數(shù)預(yù)測(cè)
由式(7)計(jì)算得,2021年事故數(shù)為758起。之后年份的事故數(shù)可以類似進(jìn)行預(yù)測(cè),這分析可以用于此地改善某方面的安全措施,通過(guò)預(yù)測(cè)事故數(shù)和實(shí)際發(fā)生的事故數(shù)相比可以一定程度上評(píng)價(jià)實(shí)施安全措施后的效果。
本文從交通事故的預(yù)測(cè)流程、預(yù)測(cè)模型、模型比較及案例分析三個(gè)方面介紹了基于車輛事故數(shù)據(jù)的交通事故預(yù)測(cè)分析。為研究事故預(yù)測(cè)提供了思路。
數(shù)據(jù)的獲取仍是事故數(shù)據(jù)分析的關(guān)鍵前提,未來(lái)應(yīng)提高事故數(shù)據(jù)的使用程度,通過(guò)對(duì)更全面事故數(shù)據(jù)訓(xùn)練,實(shí)現(xiàn)實(shí)時(shí)的事故發(fā)生感知預(yù)測(cè),對(duì)司機(jī)進(jìn)行實(shí)時(shí)預(yù)警,從而提高道路的安全程度。