季 芳,熊 堅,楊文臣,郭鳳香
(1.昆明理工大學 交通工程學院,云南 昆明 650500;2.云南省交通規(guī)劃設計研究院,云南 昆明 650500)
隨著我國山區(qū)高速公路里程的不斷增長,山區(qū)高速公路的交通安全狀況引起人們的重視。大量研究表明,人是致使高速公路交通事故發(fā)生的主要因素。但不可否認的是,仍存在由道路線形條件復雜、天氣狀況惡劣等其他因素直接或間接導致的大量交通事故。因此,研究山區(qū)高速公路的交通事故預測模型具有重大的實用價值[1-4]。鑒于此,本文期望可以從現(xiàn)有的大量山區(qū)高路公路的交通事故記錄中,通過對非人為因素的分析,來預測山區(qū)高速公路的交通事故。從而更好地識別山區(qū)高速公路上的高危路段,給予駕駛人更全面的駕駛提醒,提高山區(qū)高速公路的安全性。
傳統(tǒng)的一些預測模型,包括概率預測法、貝葉斯預測模型等。在山區(qū)高速公路這一復雜的系統(tǒng)中,其在研究多個因素對交通事故的影響方面均存在不足,無法做出有效的預測[5-7]。此外,山區(qū)高速公路的事故發(fā)生存在較大的隨機性,各影響因素與事故間不存在嚴格的線性關系。因此,需要選擇一些用于非線性關系研究模型來做預測。本文采用基于粒子群優(yōu)化的BP網絡建立了山區(qū)高速公路的事故嚴重等級的預測模型,并基于昆石高速公路的事故數(shù)據(jù)對模型進行驗證。
粒子群中的粒子所在的位置在不斷地更新,是根據(jù)下列公式進行位置移動的
(1)
(2)
式中,i=1,2,…,m;d=1,2,…,D;w是一個非負數(shù),是粒子群的慣性因子;加速常數(shù)c1和c2均為非負常數(shù),一般取值為2;r1和r2是[0,1]范圍內隨機變換的一個隨機數(shù)值;α為粒子群的約束因子,調控粒子速度的權重[10]。
BP算法自身存在以下不足:(1)BP算法的收斂速度偏慢,尤其當訓練樣本的數(shù)量極為龐大時;(2)存在局部最優(yōu)問題,導致整體學習和訓練結果不佳。因此,用粒子群算法優(yōu)化神經網絡的學習算法,彌補BP網絡的不足,并提高BP網絡的收斂速度及網絡的學習能力。
基于粒子群優(yōu)化的BP神經網絡,如圖1所示。
圖1 基于粒子群優(yōu)化的BP網絡結構圖
(1)輸入層變量。輸入層變量主要包括一些對交通事故嚴重程度有著緊密聯(lián)系的影響因素,當然不是所有的影響因素均能夠作為輸入層的變量,變量的選取也需要結合實際的數(shù)據(jù)情況[11]。綜合實際事故記錄情況,確定以下5個變量為BP網絡模型的輸入層變量:1)時間:據(jù)夜間事故死亡率的分析顯示:高速公路夜間的交通事故率比白天大1~1.5倍;2)天氣:根據(jù)云南的氣候情況和所記錄的事故數(shù)據(jù)分析,本文的天氣情況主要包括:晴、陰、雨、霧4類;3)車輛類型:發(fā)生事故時車輛的數(shù)目是隨機的,車輛類型也難以做出一個統(tǒng)一的判定,本文在處理該問題時,采用了肇事車輛的車型來量化這一影響因素;4)道路平曲線半徑:道路平曲線半徑設計不當是發(fā)生交通事故的主要原因之一,本文將道路平曲線半徑分為4個等級;5)道路縱坡坡度:縱坡坡度過大時,需要保持車輛的合理速度,維持連貫的駕駛狀態(tài)將對行車安全造成較大的影響。相關研究表明,在長下坡極易發(fā)生交通事故。
(2)輸出層變量。為了分析輸入因素對事故的影響,將事故嚴重等級作為輸出變量。基于昆石高速公路的事故記錄情況,選擇事故的傷亡人員數(shù)作為事故嚴重等級的衡量標準。根據(jù)相關事故等級的劃分標準,本文將事故嚴重等級量化為0,1,2,3這4個等級:1)輕微事故:輕傷1~2人,財產損失機動車事故不足1 000元;2)一般事故:重傷1~2人,或輕傷3人以上,財產損失不足3萬元;3)重大事故:死亡1~2人,或者重傷3人以上10人以下,財產損失3萬元以上不足6萬元;4)特大事故:死亡3人以上,或者重傷11人以上,同時重傷8人以上或者死亡2人,同時重傷5人以上,財產損失6萬元以上。
在考慮事故嚴重等級時,為了讓輸出的結果能夠有一個統(tǒng)一的量化標準。在本文的研究中,事故的嚴重程度還是以人員傷亡情況作為主要衡量標準的。因財產損失存在一定的估計,采用傷亡人員數(shù)作為衡量標準同時也體現(xiàn)了安全為第一的原則。
事故數(shù)據(jù)的記錄,大多為文字記錄,難以直接應用于事故預測模型。根據(jù)本文所采用的BP網絡模型的需要,對這些數(shù)據(jù)進行了量化處理[12]。在數(shù)據(jù)整理篩選完畢后,基于所選的312個抽樣數(shù)據(jù)來建立模型?;诖?,對數(shù)據(jù)的量化處理是本文事故數(shù)據(jù)處理的主要工作。具體的變量量化情況,如表1所示。
表1 變量的量化
鑒于MATLAB神經網絡工具箱的方便實用,本文采用它來實現(xiàn)該網絡。將神經網絡的均方誤差作為粒子群算法的適應度,適應度的計算通過調用子函數(shù)來實現(xiàn)[13-16]具體神經網絡模型的實現(xiàn)過程,如圖2所示。可見網絡的模型建立,是通過5個輸入層的輸入變量,經過隱含層,來實現(xiàn)輸出層的1個變量的輸出。
圖2 神經網絡模型的實現(xiàn)過程
完成編程后,對數(shù)據(jù)進行神經網絡的訓練以及測試。本文以昆石高速公路K0~K78路段,2008年~2012年之間的312條事故數(shù)據(jù)為樣本數(shù)據(jù)。并隨機抽取樣本數(shù)據(jù)中的260條作為模型的訓練數(shù)據(jù),將剩下的52條作為測試數(shù)據(jù)進行模型驗證。通過不斷迭代,使數(shù)據(jù)訓練的效果達到較佳水平。最終網絡的訓練結果,如圖3所示。
圖3 均方誤差(MSE)變化趨勢圖
由圖可見,PSO-BP的網絡收斂速度比BP的收斂速度快,且PSO-BP最后達到的網絡均方誤差值也相較BP更小,這也體現(xiàn)了粒子群算法的優(yōu)化效果?;旧系恋?代以后,PSO-BP網絡的誤差已趨于收斂,而不加優(yōu)化的BP網絡還未呈現(xiàn)出明顯的收斂趨勢。同時,還可以看出在多次迭代之后,PSO-BP的網絡誤差值明顯低于BP網絡的誤差值。
經過網絡的迭代訓練,最終的網絡訓練集和測試集誤差如表2所示。
表2 整體網絡誤差對比表
從表2可得出結論:(1)PSO-BP模型的總體誤差比BP模型??;(2)兩個模型的訓練集誤差均比測試集誤差小。這是因訓練集的誤差是模型經過多次迭代而來的,而測試集的誤差是將測試集的數(shù)據(jù)直接放入模型進行的驗證,不存在迭代,是一次驗證而出的結果。
將樣本中所取的52條測試數(shù)據(jù)放入模型進行驗證,該52條測試數(shù)據(jù)所驗證的模型的預測準確率為89.6%。這一驗證結果說明,所建立的預測模型可用作事故嚴重等級的預測分析。
所建立的模型在上一節(jié)通過驗證且準確率較佳,故在預測模型的基礎上,進行仿真模擬分析,研究單個影響因素與事故嚴重程度間的關系,以期得到一定的事故發(fā)生規(guī)律。
在所有的仿真結果分析中,均給出統(tǒng)一的情境設定,5個輸入層變量定為:凌晨;晴天;重型貨車;半徑為600~2 000 m;坡度取值區(qū)間為[-5,-3);所設定的情境輸入層數(shù)據(jù)量化后為:(0,0,4,0,1)。
(1)時間-事故的預測分析。在時間-事故的輸入輸出關系研究中,設定的情境輸入層數(shù)據(jù)量化為:(*,0,4,0,1),通過模型的仿真模擬,得出事故嚴重等級預測值,據(jù)此進行時間-事故間的關系分析。程序運行后,模型的預測結果如圖4所示。
圖4 時間與傷亡人數(shù)的量化關系圖
圖4中,橫坐標為量化的時間,為0~3,表征凌晨、上午、下午、晚上這4個時間段;縱坐標為量化的傷亡人員數(shù),表征事故的嚴重等級。發(fā)現(xiàn)在時間段0,即凌晨0:00~8:00;其次在時間段3,也就是晚上的18:00~0:00,事故的嚴重等級預測值較高,模型預測在這兩個時間段更易發(fā)生嚴重的交通事故。這一現(xiàn)象的可能原因是在深夜與凌晨這兩個時間段,駕駛人更易出現(xiàn)疲勞駕駛以及貨車存在的超載現(xiàn)象,導致較為嚴重的事故發(fā)生。
(2)天氣-事故的預測分析。在天氣-事故的輸入輸出關系研究中,設定的情境輸入層數(shù)據(jù)量化為:(0,*,4,0,1)。通過模型的仿真模擬,得出事故嚴重等級預測值,據(jù)此進行天氣-事故間的關系分析。程序運行后,模型的預測結果如圖5所示。
圖5 天氣與傷亡人數(shù)的量化關系圖
圖5中,橫坐標為量化的天氣,賦值為0~3,表征晴、陰、雨、霧這4種天氣狀況;縱坐標為量化的傷亡人員數(shù),表征事故的嚴重等級??梢钥闯?,在天氣情況為2和3時,也就是雨天與霧天的天氣狀況下,事故的嚴重等級預測值較高,模型預測在雨天及霧天更易發(fā)生嚴重的交通事故。這一現(xiàn)象可能的原因是因為在高速公路上的車輛行駛車速較高,雨天狀況下路表摩擦降低,更易發(fā)生事故;霧天狀況下,駕駛人的視覺觀察能力受限,極易導致多車追尾事故,致使重大事故的發(fā)生。
(3)半徑-事故的預測分析。在半徑-事故的輸入輸出關系研究中,設定的情境輸入層數(shù)據(jù)量化為:(0,0,4,0,*)。通過模型的仿真模擬,得出事故嚴重等級預測值,據(jù)此進行半徑-事故間的關系分析。程序運行后,模型預測結果如圖6所示。
圖6 半徑與傷亡人數(shù)的量化關系圖
圖6中,橫坐標為量化的半徑,賦值為0~3,表征4種半徑的取值范圍;縱坐標為量化的傷亡人員數(shù),表征事故的嚴重等級。可見,在半徑編號為0和1時,即在半徑取值范圍為0~600 m和600~1 500 m時,事故的嚴重等級預測值均較高,模型預測在這兩個半徑取值范圍內的地點更易發(fā)生嚴重的交通事故。這一現(xiàn)象可能的原因是在小半徑處,尤其是曲線半徑驟然變小時,若保持原有的行車速度,易發(fā)生側翻事故,導致嚴重事故的發(fā)生。
(4)車輛類型-事故的預測分析。在車輛類型-事故的輸入輸出關系研究中,設定的情境輸入層數(shù)據(jù)量化為:(0,0,*,0,1)。通過模型的仿真模擬,得出事故嚴重等級預測值,進行車輛-事故的關系分析。程序運行后,模型預測結果如圖7所示。
圖7 車輛類型與傷亡人數(shù)的量化關系圖
圖7中,橫坐標為量化的車輛類型,賦值為0~6,表征7種類型的肇事車輛;縱坐標為量化的傷亡人員數(shù),表征事故的嚴重等級??梢钥闯?,在車輛類型編號為3和5時,即在車輛為重型貨車和汽車列車的情況下,事故的嚴重等級預測值較高,模型預測這兩類車型更易發(fā)生嚴重的事故。這一現(xiàn)象可能的原因是在山區(qū)高速公路上,重型貨車和汽車列車的裝載大且車速較快。尤其與客車發(fā)生碰撞時,極易造成人員傷亡,致使嚴重事故的發(fā)生。
本文采用基于粒子群優(yōu)化的BP網絡建立了山區(qū)高速公路的事故嚴重等級的預測模型,并基于昆石高速公路的事故數(shù)據(jù)對模型進行驗證。經驗證,模型的預測效果較佳。預測準確率為89.6%后,通過設定情境,用模型進行仿真分析,得出了一些事故發(fā)生規(guī)律。仿真結果表明:在凌晨時段、雨霧天、以及在小半徑處,駕駛重型貨車等情況下,更易發(fā)生嚴重的事故,這就需要駕駛人在這些情況下更加注重行車安全。