文圖|黃瑛 黃淑兵 周云龍
【導(dǎo)讀】
交通事故成因分析是交通安全領(lǐng)域的重要研究問題。本文將車輛通行特征引入交通事故成因分析中,基于FP-growth算法,定量描述了車輛通行特征與交通事故之間的關(guān)聯(lián)關(guān)系,并根據(jù)篩選出的關(guān)聯(lián)規(guī)則提出相應(yīng)對策與建議。研究結(jié)果表明,同一違法對于不同通行特征車輛的交通事故風(fēng)險不同,在道路交通管理部門違法查處時應(yīng)重點關(guān)注對應(yīng)高風(fēng)險通行特征車輛,降低交通事故發(fā)生概率,以支撐交通事故預(yù)防“減量控大”工作。
交通事故;通行特征;關(guān)聯(lián)規(guī)則
在交通環(huán)境日益復(fù)雜化的情況下,如何壓降交通事故成為亟需解決的問題。目前,我國的交通事故風(fēng)險主動管理還處于初級階段,因此有必要深入挖掘交通事故影響因素,探究各因素與事故的關(guān)聯(lián)關(guān)系,有助于公安交通管理部門更具針對性地制定交通事故預(yù)防措施及管理辦法。本文基于交通事故數(shù)據(jù)與卡口通行軌跡數(shù)據(jù),利用FP-growth算法對車輛通行特征與交通事故數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則進行深度挖掘,篩選出不同違法對應(yīng)的交通事故高風(fēng)險車輛通行特征標簽集合,并提出相應(yīng)對策與建議,可供公安交通管理部門參考。
關(guān)聯(lián)規(guī)則挖掘最早是為挖掘顧客普遍消費行為而提出的,目前已被廣泛用于商業(yè)、移動通信、網(wǎng)絡(luò)安全和交通安全等領(lǐng)域。本文研究的車輛通行特征與交通事故關(guān)聯(lián)關(guān)系,指在交通事故車輛集合中頻繁出現(xiàn)的車輛通行特征與交通事故特征之間的關(guān)聯(lián)關(guān)系。設(shè)I={ i1, i2, … , in }為所有車輛通行特征與交通事故特征標簽集合,其中ik (k=1, 2… , n)稱為項目,項目的集合稱為項集。設(shè)D={ d1, d2, … , dm }為記錄集,每個記錄dj ( j=1, 2, …, m)均對應(yīng)I上一個子集。令項集XI,YI,互相之間沒有重復(fù)項,則關(guān)聯(lián)規(guī)則可以定義為:
其中,X為先決條件,Y為相應(yīng)關(guān)聯(lián)結(jié)果。
對數(shù)據(jù)集進行關(guān)聯(lián)規(guī)則挖掘過程中,會出現(xiàn)大量無效的關(guān)聯(lián)規(guī)則,需利用評價指標對關(guān)聯(lián)規(guī)則進行篩選,常用指標有三個,分別是支持度(Support)、置信度(Confidence)和提升度(Lift)。
1.支持度
支持度是同時包含X和Y的項集的出現(xiàn)次數(shù)與數(shù)據(jù)集記錄總數(shù)的比例,本文指計算公式如下:
其中,|D|是記錄總數(shù),|X∪Y|是同時包含X和Y項集的記錄數(shù)。
2.置信度
置信度指包含項集X的集合中同時也包含項集Y的比例,計算公式如下:
其中,|X| 表示包含項集X的記錄數(shù)。
3.提升度
提升度指包含項集X和項集Y的記錄比例與只包含項集Y的記錄比例的比值,即關(guān)聯(lián)規(guī)則XY的置信度與項集Y的支持度的比值,計算方法如下:
關(guān)聯(lián)規(guī)則的挖掘過程主要包括兩個步驟,首先掃描數(shù)據(jù)庫,找出所有的頻繁項集,然后根據(jù)頻繁項集計算符合篩選標準的關(guān)聯(lián)規(guī)則。目前常用的關(guān)聯(lián)規(guī)則挖掘算法有Apriori算法和FP-growth算法,相較于Apriori算法,F(xiàn)P-growth算法可避免產(chǎn)生大量的候選項集,能有效節(jié)省運算開銷。本文選擇FP-growth算法對車輛通行特征和交通事故特征進行關(guān)聯(lián)規(guī)則挖掘,具體步驟如下:
1.根據(jù)軌跡數(shù)據(jù)與交通事故數(shù)據(jù)計算每起交通事故對應(yīng)的車輛通行特征與事故特征標簽,構(gòu)建交通事故記錄集;2.確定關(guān)聯(lián)規(guī)則篩選規(guī)則,定義最小支持度和最小置信度取值;3.遍歷事故記錄集,計算每個項目的出現(xiàn)次數(shù),刪除小于最小支持度的項目,然后將原始交通事故記錄集中的項目按出現(xiàn)次數(shù)降序重新排列;4.再次掃描事故記錄集,按從上往下降序的規(guī)則創(chuàng)建項頭表以及FP-tree;5.按照項頭表自下而上訪問FP-tree生成條件模式基,遞歸調(diào)用樹結(jié)構(gòu),若為單路徑,轉(zhuǎn)至步驟6,若為非單一路徑,則繼續(xù)調(diào)用樹結(jié)構(gòu),直到形成單一路徑;6.對路徑中的節(jié)點進行組合,并與后綴頻繁項生成最終的頻繁模式,篩選出不小于最小置信度閾值的關(guān)聯(lián)規(guī)則。
本文研究對象為死亡3人以上交通事故,案例數(shù)據(jù)集包括2018年1月至2020年6月期間的部分交通事故數(shù)據(jù)與交通事故發(fā)生前90天內(nèi)的卡口通行軌跡數(shù)據(jù),其中事故數(shù)據(jù)含號牌號碼、事故發(fā)生時間、車輛類型、道路代碼、道路類型、事故原因等字段,共計957條;軌跡數(shù)據(jù)包含號牌號碼、過車時間、卡口編號、道路代碼、道路類型等字段,共計43萬條。
車輛歷史軌跡中涵蓋了大量與交通事故相關(guān)的隱藏信息,對全面刻畫車輛特征、深度挖掘事故原因有重要意義。通過車輛歷史軌跡復(fù)盤,可發(fā)現(xiàn)車輛在交通事故發(fā)生前有以下規(guī)律:
從車輛對交通事故路段的熟悉程度看,約48%的交通事故車輛90天內(nèi)未經(jīng)過事故路段。在全部566條交通事故路段中,528條(占比93.3%)已布設(shè)卡口,共涉及交通事故車輛914輛,其中439輛(占比48.0%)在交通事故發(fā)生前90天內(nèi)從未經(jīng)過交通事故路段,229輛(占比25.1%)在90天內(nèi)經(jīng)過交通事故路段的天數(shù)小于10天,246輛(26.9%)在90天內(nèi)經(jīng)過交通事故路段的天數(shù)超過10天。
從車輛在交通事故發(fā)生前的行駛時長看,約60%因疲勞引發(fā)的交通事故在行駛4小時后發(fā)生。在33起由疲勞引發(fā)的交通事故中,8起(占比24.2%)發(fā)生在行駛1小時內(nèi),5起(占比15.2%)發(fā)生在行駛1至4小時內(nèi),20起(占比60.6%)發(fā)生在行駛4小時后。
從車輛經(jīng)常行駛時段看,夜間交通事故中,約80%的車輛缺乏夜間行駛經(jīng)驗。在全部957輛交通事故車輛中,309輛(占比32.3%)交通事故發(fā)生在夜間,其中55輛(占比17.8%)經(jīng)常在夜間行駛(在90天內(nèi)22點至凌晨6點累計通行時間超過90小時),254輛(占比82.2%)偶爾在夜間行駛。
從車輛經(jīng)常行駛道路類型看,高速公路交通事故中,約60%的車輛經(jīng)常在高速行駛。在全部957輛交通事故車輛中,206輛(占比21.5%)交通事故發(fā)生道路類型為高速,其中120輛(占比58.3%)經(jīng)常在高速行駛(在90天內(nèi)高速累計通行時間超過90小時),86輛(占比41.7%)偶爾在高速行駛。
從不同通行特征交通事故原因看,經(jīng)常跑長途的重型貨車比未經(jīng)常跑長途的重型貨車更易由于疲勞駕駛、無證駕駛或準駕不符等發(fā)生交通事故。在255輛重型貨車中,94輛(占比36.9%)經(jīng)常跑長途(在90天內(nèi)通行距離大于300千米的出行超過10次)。對于經(jīng)常跑長途的重型貨車,交通事故原因排名前五的為:駕車時有其他妨礙安全行車的行為、超速、未保持安全間距、疲勞駕駛、無證駕駛或準駕不符;對于未經(jīng)常跑長途的重型貨車,交通事故原因排名前五的為:駕車時有其他妨礙安全行車的行為、超速、未讓行、超載、逆向行駛或倒車。
結(jié)合歷史軌跡復(fù)盤情況,確定關(guān)聯(lián)規(guī)則挖掘所需要的車輛通行特征與交通事故特征標簽,其中車輛通行特征標簽按統(tǒng)計時段可分為歷史軌跡標簽與交通事故軌跡標簽,歷史軌跡標簽指交通事故發(fā)生前90天內(nèi)的車輛通行特征標簽,交通事故軌跡標簽指交通事故發(fā)生當次出行的軌跡特征標簽。對標簽進行統(tǒng)一描述和定義,如表1所示。
表1 事故特征標簽
設(shè)置最小支持度閾值為0.01,最小置信度取值為0.09,運用FP-growth算法對交通事故數(shù)據(jù)進行關(guān)聯(lián)規(guī)則挖掘,可以得到以下幾點規(guī)則,見表2。
表2 事故關(guān)聯(lián)規(guī)則
由表2可見,不同通行特征車輛發(fā)生死亡3人以上交通事故的主要違法原因不同:經(jīng)常通行的重型貨車在國省道行駛時容易因超載而發(fā)生交通事故;不熟悉路線且缺乏高速行駛經(jīng)驗的車輛在高速上行駛時容易因操作不當而發(fā)生交通事故;不經(jīng)常在城市道路行駛且不熟悉線路的重型貨車在城市道路行駛時容易因闖紅燈而發(fā)生交通事故;經(jīng)常跑長途的重型貨車在長時間行駛后容易在高速上因疲勞駕駛而發(fā)生交通事故;不熟悉路況且經(jīng)常通行的重型貨車在城市道路行駛時容易因未讓行而發(fā)生交通事故;小型客車夜間在偶爾通行的城市道路上行駛時容易因酒駕而發(fā)生交通事故;缺乏國省道行駛經(jīng)驗的小型客車在長時間行駛后容易在國省道上因逆向行駛或倒車而發(fā)生交通事故;經(jīng)常跑長途且經(jīng)常在夜間行駛的車輛容易夜間在國省道行駛時因未保持安全間距而發(fā)生交通事故;經(jīng)常跑長途的大型客車容易因超速發(fā)生交通事故;經(jīng)常通行且跑長途的車輛在縣鄉(xiāng)道行駛時容易因超速而發(fā)生交通事故。
鑒于上述分析,建議從道路隱患排查、車輛隱患排查兩個方面有針對性加強管控工作,遏制較大交通事故多發(fā)勢頭。
在道路隱患排查方面,針對駕駛?cè)瞬皇煜ぢ窙r易導(dǎo)致交通事故發(fā)生的隱患,建議完善事故多發(fā)路段的道路指示標志標線以及安全警示設(shè)施設(shè)備,借助互聯(lián)網(wǎng)出行服務(wù)企業(yè),對在交通事故多發(fā)路段行駛的車輛精準發(fā)布警示提示;針對駕駛?cè)似毡槿狈σ归g行駛經(jīng)驗的隱患,建議推動道路照明設(shè)施完善建設(shè),加強道路指示標志標線的運行維護工作,在交通事故多發(fā)路段增設(shè)主動發(fā)光標志。
在車輛隱患排查方面,建議參考表2中標簽組合加強對疲勞駕駛、闖紅燈、未讓行、超載、超速、酒駕、逆向行駛、倒車等違法行為的查處力度;聯(lián)合相關(guān)部門,定期深入本地客貨運輸企業(yè)開展安全隱患監(jiān)督檢查,建立與交通、高速公路管理公司等部門的聯(lián)勤聯(lián)動和數(shù)據(jù)共享機制;加強經(jīng)常長距離行駛重型車輛、長途客車、農(nóng)村面包車、缺乏夜間或高速行駛經(jīng)驗車輛的安全警示教育宣傳。