王 蕾, 邱 鋒, 2, 夏永旭, 韓興博
(1. 長安大學(xué)公路學(xué)院, 陜西 西安 710064; 2. 陜西碧桂園置業(yè)有限公司, 陜西 西安 710065)
公路隧道的快速發(fā)展給我們帶來了顯著的經(jīng)濟(jì)與社會效益,然而由于其結(jié)構(gòu)的封閉性與復(fù)雜性,導(dǎo)致運(yùn)營安全方面存在很大的潛在威脅。尤其隨著長隧道和特長隧道的不斷增加,隧道路段已成為交通事故的高發(fā)路段[1],且一旦發(fā)生事故,其嚴(yán)重程度和致死率遠(yuǎn)高于普通路段。因此,研究公路隧道交通安全,特別是交通事故的預(yù)測,對公路隧道交通安全管理工作具有非常重要的現(xiàn)實(shí)意義。
近年來,國內(nèi)外許多學(xué)者對公路隧道交通安全問題進(jìn)行了研究,并取得了一定的成果[2-6],但這些研究多以對事故結(jié)果的統(tǒng)計(jì)分析為主。后續(xù),也有學(xué)者關(guān)注公路隧道交通事故的預(yù)測工作。易富君等[7]構(gòu)建了基于遺傳算法優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)模型,并提出了公路隧道群交通事故的微觀預(yù)測方法; 段萌萌等[8]研究了高橋隧比高速公路交通事故的影響因素及規(guī)律,采用多元非線性回歸分析法建立了事故預(yù)測模型; 馬壯林等[9]采用有序Logit模型和廣義有序Logit模型對交通事故嚴(yán)重程度進(jìn)行了預(yù)測; Ciro等[10]以200余起公路隧道交通事故數(shù)據(jù)為基礎(chǔ),采用隨機(jī)參數(shù)方法建立了事故頻率預(yù)測模型; 詹偉等[11]結(jié)合事故灰色預(yù)測模型與馬爾可夫模型,分析了隧道群路段交通事故的發(fā)展變化趨勢; 楊健等[12]以沈海高速羅長隧道群為研究對象,建立了基于BP神經(jīng)網(wǎng)絡(luò)的交通事故非線性綜合預(yù)測方法。
總結(jié)上述研究發(fā)現(xiàn),目前的公路隧道交通事故研究多以統(tǒng)計(jì)分析為主,有關(guān)事故預(yù)測的研究相對較少,且影響因素考慮不全面,基于道路環(huán)境影響因素的事故預(yù)測研究更是幾近于無。本文以秦嶺某隧道群事故統(tǒng)計(jì)資料為基礎(chǔ),擬通過相關(guān)性分析對影響公路隧道交通事故預(yù)測的道路環(huán)境因素進(jìn)行主要變量篩選,同時采用樸素貝葉斯模型、隨機(jī)森林模型、BP神經(jīng)網(wǎng)絡(luò)模型和支持向量機(jī)模型分別對公路隧道交通事故形態(tài)、嚴(yán)重程度、傷亡情況和持續(xù)時間進(jìn)行預(yù)測,以期能在進(jìn)行不同類別事故預(yù)測時選取合適的預(yù)測模型,并為今后的公路隧道交通事故預(yù)測工作提供一定的參考。
交通事故的發(fā)生是諸多因素綜合作用的結(jié)果,當(dāng)其發(fā)生在公路隧道中時更顯復(fù)雜,為了得到相對準(zhǔn)確的預(yù)測結(jié)果,預(yù)測方法的選擇尤為重要,如果選擇不合適的預(yù)測方法,結(jié)果將差之千里。下文將對幾個常用的預(yù)測模型進(jìn)行分析研究。
樸素貝葉斯模型是在各特征屬性條件獨(dú)立的基礎(chǔ)上基于貝葉斯公式所建立的一種智能算法。其基本思路是通過先驗(yàn)概率得到后驗(yàn)概率,即交通事故的預(yù)測可以通過各影響因素發(fā)生的概率計(jì)算得到,文獻(xiàn)[13]詳細(xì)介紹了樸素貝葉斯模型的基本原理及算法步驟。
樸素貝葉斯模型算法簡單,對小樣本量數(shù)據(jù)預(yù)測較為準(zhǔn)確。其缺點(diǎn)在于其條件獨(dú)立性假設(shè)較難滿足,并且會因?yàn)橄闰?yàn)概率的不準(zhǔn)確導(dǎo)致預(yù)測效果不佳。
BP神經(jīng)網(wǎng)絡(luò)模型是一種多層網(wǎng)絡(luò)模型,由輸入層、隱層、輸出層3層構(gòu)成,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。其算法過程由正向的結(jié)果輸出和反向的誤差調(diào)整構(gòu)成,若數(shù)據(jù)經(jīng)過正向輸出所得結(jié)果誤差較大,則反向傳播預(yù)測誤差調(diào)節(jié)隱含層神經(jīng)元,重復(fù)此過程直到誤差滿足要求[14]。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
BP神經(jīng)網(wǎng)絡(luò)模型非線性映射能力較強(qiáng)且具有較強(qiáng)的容錯能力,但由于其收斂速度慢導(dǎo)致算法低效,也有可能陷入局部極值而得不到最優(yōu)結(jié)果。
隨機(jī)森林模型是由很多決策樹分類模型組成的組合分類模型,通過有放回地隨機(jī)抽樣組成決策樹,然后組合多棵決策樹的預(yù)測,通過投票得出最終的預(yù)測結(jié)果,其構(gòu)建過程如圖2所示。
圖2 隨機(jī)森林模型結(jié)構(gòu)圖[15]
隨機(jī)森林模型預(yù)測準(zhǔn)確度較高,不容易出現(xiàn)過擬合的現(xiàn)象,然而當(dāng)樣本量較小時,隨機(jī)森林模型的不完全抽取可能會使得所抽取數(shù)據(jù)沒有代表性。
支持向量機(jī)模型是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化所建立的數(shù)據(jù)模型,具體原理在文獻(xiàn)[16]中有詳細(xì)介紹。它的優(yōu)點(diǎn)在于結(jié)構(gòu)簡單、適應(yīng)性好、泛化能力強(qiáng),但由于缺乏相關(guān)依據(jù)使得核函數(shù)的選擇較為困難,數(shù)據(jù)中特殊點(diǎn)的存在也會對結(jié)果造成一定影響。
交通事故影響因素涉及人、車、道路環(huán)境3大方面,本文擬著重研究道路環(huán)境因素對公路隧道交通事故的影響。結(jié)合前人研究成果及西漢高速秦嶺隧道群的調(diào)查統(tǒng)計(jì)資料,選取相關(guān)影響因素作為特征變量,如表1所示。
為降低計(jì)算成本與難度,對上述自變量進(jìn)行相關(guān)性分析,以篩選出相關(guān)性較高且對預(yù)測結(jié)果具有顯著影響的自變量參數(shù)。本文采用的是皮爾森相關(guān)性系數(shù)法,計(jì)算公式如下:
(1)
式中:ρXY為自變量X對因變量Y的相關(guān)性系數(shù); COV(X,Y)為變量X與變量Y的協(xié)方差;D(·)為變量的方差;E(·)為變量的數(shù)學(xué)期望。
表1 變量描述表
分別以事故形態(tài)、事故嚴(yán)重程度、事故傷亡情況和事故持續(xù)時間作為因變量,通過皮爾森相關(guān)性分析計(jì)算各自變量的相關(guān)系數(shù),選取9個最大系數(shù)的自變量,對其進(jìn)行編碼賦值后將其納入到預(yù)測模型之中,篩選結(jié)果如表2所示。
本文以西漢高速秦嶺某隧道群的交通事故為研究對象,西漢高速秦嶺段具有交通量大、隧道數(shù)量多、線形復(fù)雜、事故頻發(fā)等特點(diǎn),全線共有130座隧道,隧道總長約110 km,本文所選取的隧道群處于事故多發(fā)路段,其設(shè)計(jì)速度為80 km/h,均為雙洞分離式隧道,事故數(shù)據(jù)采集時間為2014年8月至2017年底,共計(jì)496起事故,具體分布如表3所示。以上述事故數(shù)據(jù)為樣本,將篩選的4組36個自變量作為模型參數(shù),采用不同模型分別對事故形態(tài)、嚴(yán)重程度、傷亡情況和持續(xù)時間進(jìn)行預(yù)測。
表2 自變量篩選及賦值
表3秦嶺公路隧道交通事故統(tǒng)計(jì)數(shù)據(jù)
Table 3 Statistical data of traffic accidents of Qinling Highway Tunnel group
年份交通事故數(shù)20143520151012016208201752
采用Matlab隨機(jī)函數(shù)將收集到的496起事故數(shù)據(jù)隨機(jī)分為2部分,依次作為訓(xùn)練集和測試集,對數(shù)據(jù)進(jìn)行反復(fù)迭代得出預(yù)測準(zhǔn)確率,連續(xù)5次運(yùn)行模型程序,取其平均值作為最終準(zhǔn)確率,以預(yù)測結(jié)果的準(zhǔn)確率對不同模型進(jìn)行評價。準(zhǔn)確率計(jì)算公式如下:
(2)
式中: accuracy為模型預(yù)測準(zhǔn)確率; length(predict=text label)為預(yù)測準(zhǔn)確個數(shù); length(text label)為訓(xùn)練集個數(shù)。
3.1.1 樸素貝葉斯模型
采用貝葉斯模型分別計(jì)算各事故形態(tài)的發(fā)生概率,選擇最高概率結(jié)果所對應(yīng)的形態(tài)作為預(yù)測結(jié)果,并與實(shí)際事故形態(tài)進(jìn)行對比,計(jì)算預(yù)測準(zhǔn)確率。部分貝葉斯模型事故形態(tài)預(yù)測結(jié)果如表4所示。
表4 貝葉斯模型事故形態(tài)預(yù)測結(jié)果
根據(jù)調(diào)查數(shù)據(jù)進(jìn)行多次預(yù)測,計(jì)算得到樸素貝葉斯模型的預(yù)測準(zhǔn)確率約為69%,標(biāo)準(zhǔn)差為0.92。
3.1.2 BP神經(jīng)網(wǎng)絡(luò)模型
針對模型中的多項(xiàng)分類,激活函數(shù)選取Softmax函數(shù),迭代次數(shù)設(shè)為30 000次,學(xué)習(xí)率為0.01,隱含層節(jié)點(diǎn)數(shù)為5,連續(xù)多次運(yùn)行BP神經(jīng)網(wǎng)絡(luò)模型程序,準(zhǔn)確率見圖3??芍P偷念A(yù)測準(zhǔn)確率平均值約為82.09%,標(biāo)準(zhǔn)差為1.38,模型訓(xùn)練時間約為1 min。
3.1.3 隨機(jī)森林模型和支持向量機(jī)模型
將前文所選特征向量納入隨機(jī)森林模型和支持向量機(jī)模型,連續(xù)多次運(yùn)行模型,預(yù)測準(zhǔn)確率如圖4所示。隨機(jī)森林模型的預(yù)測準(zhǔn)確率平均值約為84%,標(biāo)準(zhǔn)差為0.29; 支持向量機(jī)模型的預(yù)測準(zhǔn)確率平均值約為71%,標(biāo)準(zhǔn)差為0.61。
圖3 BP神經(jīng)網(wǎng)絡(luò)模型事故形態(tài)預(yù)測準(zhǔn)確率
Fig. 3 Prediction accuracy of accident form by BP neural network model
圖4 隨機(jī)森林模型和支持向量機(jī)模型事故形態(tài)預(yù)測準(zhǔn)確率
Fig. 4 Prediction accuracy of accident form by random forest model and support vector machine model
將以上模型進(jìn)行對比分析,綜合考慮預(yù)測模型的準(zhǔn)確率與穩(wěn)定性,不難看出隨機(jī)森林模型最適合對公路隧道交通事故形態(tài)進(jìn)行預(yù)測。
公路隧道交通事故嚴(yán)重程度的準(zhǔn)確預(yù)測對快速救援與交通疏導(dǎo)意義重大,對于損失巨大且傷亡慘重的重大及特大交通事故的預(yù)測一直都是預(yù)測工作的重中之重,在進(jìn)行模型選擇時需重點(diǎn)考慮大型事故預(yù)測的準(zhǔn)確程度。參照我國《道路交通事故處理辦法》及公安部頒布的交通事故分類方法,將事故嚴(yán)重程度分為4類,如表5所示。預(yù)測模型訓(xùn)練集與測試集的構(gòu)建與前文相同,不同模型預(yù)測準(zhǔn)確率結(jié)果統(tǒng)計(jì)如表6所示。
由表6可知: 隨機(jī)森林模型在預(yù)測輕微事故時準(zhǔn)確率最高,但對一般、重大和特大事故的預(yù)測較為困難。貝葉斯模型在預(yù)測輕微事故時準(zhǔn)確率雖不及其他模型,但其對一般和重大事故的預(yù)測準(zhǔn)確率較高,而且貝葉斯模型對小樣本量數(shù)據(jù)的預(yù)測較為擅長。因此,在進(jìn)行公路隧道交通事故嚴(yán)重程度預(yù)測時可優(yōu)先考慮貝葉斯模型。
表5 事故嚴(yán)重程度分類
表6 不同模型事故嚴(yán)重程度預(yù)測準(zhǔn)確率
采用4大智能模型分別對傷亡情況進(jìn)行預(yù)測,預(yù)測準(zhǔn)確率結(jié)果統(tǒng)計(jì)如表7所示。由于傷亡事故數(shù)據(jù)樣本量較小,模型在運(yùn)行時表現(xiàn)稍顯不佳,準(zhǔn)確率相對較低。其中,BP神經(jīng)網(wǎng)絡(luò)模型共預(yù)測到6次傷亡事故,準(zhǔn)確率為50%,但結(jié)合實(shí)際發(fā)生的32起傷亡事故,其預(yù)測成功率僅為9%;貝葉斯模型的準(zhǔn)確率雖然較低,但預(yù)測成功率達(dá)到了40%,考慮傷亡最小化原則,選擇貝葉斯模型作為公路隧道交通事故傷亡情況預(yù)測模型。
交通事故持續(xù)時間指的是從交通事故發(fā)生到交通恢復(fù)正常的總時間,可劃分為事故檢測響應(yīng)階段、事故清除階段及交通恢復(fù)階段3個階段,通常采用事故響應(yīng)處理時間與擁堵消散時間2個指標(biāo)來描述事故路段擁堵的時間影響。擁堵持續(xù)時間即為事故響應(yīng)處理時間與擁堵消散時間之和[14],因此,本文采用擁堵持續(xù)時間代替交通事故持續(xù)時間作為因變量。
表7 不同模型事故傷亡情況預(yù)測準(zhǔn)確率
圖5為BP神經(jīng)網(wǎng)絡(luò)模型對事故持續(xù)時間的預(yù)測結(jié)果圖??梢钥闯?,預(yù)測值與實(shí)際值的起伏趨勢大致相似,20~50 min期間的預(yù)測值相對較為準(zhǔn)確,而其他時間段預(yù)測值誤差極大。
圖5 BP神經(jīng)網(wǎng)絡(luò)模型事故持續(xù)時間預(yù)測結(jié)果
Fig. 5 Prediction results of accident duration by BP neural network model
圖6為隨機(jī)森林模型對事故持續(xù)時間的預(yù)測結(jié)果圖??梢悦黠@看出,預(yù)測值和實(shí)際值的吻合程度較高,特別是持續(xù)時間較長時,預(yù)測結(jié)果誤差依舊較小。
圖6 隨機(jī)森林模型事故持續(xù)時間預(yù)測結(jié)果
Fig. 6 Prediction results of accident duration by random forest model
圖7為支持向量機(jī)模型對事故持續(xù)時間的預(yù)測結(jié)果圖。圖中預(yù)測結(jié)果誤差明顯過大,不予考慮。BP神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)森林模型的預(yù)測準(zhǔn)確率對比結(jié)果如圖8所示??梢姡S機(jī)森林模型最適宜于對交通持續(xù)時間進(jìn)行預(yù)測。
圖7 支持向量機(jī)模型事故持續(xù)時間預(yù)測結(jié)果
Fig. 7 Prediction results of accident duration by support vector machine model
圖8 BP神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)森林模型事故持續(xù)時間預(yù)測準(zhǔn)確率
Fig. 8 Prediction accuracy of accident duration by BP neural network model and random forest model
1)隨機(jī)森林模型在預(yù)測公路隧道交通事故形態(tài)時最為可靠,準(zhǔn)確率約為84%;
2)貝葉斯模型對重大或特大事故的預(yù)測準(zhǔn)確率高達(dá)50%,在對公路隧道交通事故嚴(yán)重程度和傷亡情況進(jìn)行預(yù)測時可優(yōu)先考慮;
3)使用隨機(jī)森林模型預(yù)測公路隧道交通事故持續(xù)時間,絕對誤差為20 min時模型準(zhǔn)確率將超過70%;
4)由于事故數(shù)據(jù)的局限性,在進(jìn)行傷亡情況預(yù)測時模型表現(xiàn)不佳,今后工作中應(yīng)盡可能開展數(shù)量更多、區(qū)域更廣、持續(xù)時間更長的數(shù)據(jù)搜集工作。