陳彬 于鵬程 張奇
摘 要:道路交通事故總量居高不下,嚴(yán)重威脅百姓的生命財產(chǎn)安全。本文通過Apriori算法對高速公路和城市道路兩種典型交通環(huán)境下的交通事故致因進(jìn)行關(guān)聯(lián)規(guī)則挖掘,用以發(fā)現(xiàn)事故致因間的關(guān)聯(lián)關(guān)系,從而可對道路交通事故防控起到一定的指導(dǎo)作用。
關(guān)鍵詞:事故致因;關(guān)聯(lián)規(guī)則;Apriori算法
中央級公益性科研院所基本科研業(yè)務(wù)費(fèi)專項資金資助項目:基于道路交通事故再現(xiàn)的風(fēng)險意識評估與提升技術(shù)研究(111041000000180001201101)
根據(jù)公安部交通管理局發(fā)布數(shù)據(jù)顯示,自2018年全國接報道路交通事故起數(shù)同比上升21.8%后,基本維持穩(wěn)態(tài)波動。道路交通事故的發(fā)生是由涉及到人員因素、車輛因素和交通環(huán)境因素等多方面客觀和主觀因素導(dǎo)致,傳統(tǒng)的道路交通事故分析已不能滿足事故防控需求。因此,為了切實找到事故發(fā)生的客觀規(guī)律,需要通過關(guān)聯(lián)規(guī)則分析對事故發(fā)生的影響因素進(jìn)行耦合分析[1],尋找其潛在的關(guān)聯(lián)規(guī)則,探尋事故發(fā)生的內(nèi)在規(guī)律,從而對實現(xiàn)事故“減量控大”[2],指導(dǎo)各地制定有針對性措施提供有益借鑒。
1關(guān)聯(lián)規(guī)則
挖掘關(guān)聯(lián)規(guī)則[3]就是尋找多要素間的頻繁項集合。為了量化表現(xiàn)項集間的關(guān)系,需要使用到兩個度量值:支持度(support)和可信度(confidence)。
其中,Support(X)表示X項目的支持度,number(X)表示X項集的頻數(shù),number(N)表示數(shù)據(jù)集總項集的頻數(shù)。公式表示為該項集記錄占數(shù)據(jù)集總記錄的比例。而“最小支持度”則是根據(jù)經(jīng)驗預(yù)設(shè)定的一個閾值。
此外,針對具體問題具體分析,有學(xué)者在選取最小支持度和最小可信度時,不采用設(shè)置閾值做對比的方法,而是直接將計算結(jié)果的前百分之N(N一般選用20)作為選取結(jié)果。尋找頻繁項集,就是篩選出達(dá)到已設(shè)定的最小支持度的項集。找出頻繁項集,是挖掘關(guān)聯(lián)規(guī)則的第一步,也是最重要的一步,然后再從頻繁項集中,計算項集之間的可信度。只有支持度和可信度都得到之后,才能夠挖掘出強(qiáng)關(guān)聯(lián)規(guī)則,即支持度與可信度同時滿足最小支持度與最小可信度的閾值設(shè)定,該關(guān)聯(lián)規(guī)則就是強(qiáng)關(guān)聯(lián)規(guī)則。
2 Apriori算法
Apriori算法[4]是通過遍歷輸入數(shù)據(jù)集,從單元素開始計算支持度,篩選出滿足最小支持度的頻繁一項集,再從這些頻繁一項集中連接各個元素生成兩個元素的候選二項集,計算支持度,篩選出頻繁二項集,以此類推,直到不能生成新的頻繁項集為止。自此,得到所有頻繁項集,從頻繁二項集開始計算可信度,每個頻繁項集間的所有元素都可互相計算可信度數(shù)值。由于所有頻繁項集都是滿足最小支持度閾值的,所以此時僅考慮并篩選出滿足最小可信度閾值的關(guān)聯(lián)關(guān)系,即為強(qiáng)關(guān)聯(lián)規(guī)則。
3實驗分析
3.1 實驗數(shù)據(jù)和關(guān)聯(lián)屬性
實驗分析使用道路交通事故抽樣數(shù)據(jù),經(jīng)數(shù)據(jù)處理后,發(fā)現(xiàn)有16項事故影響屬性可能與事故發(fā)生存在強(qiáng)關(guān)聯(lián)關(guān)系,如表1所示。
3.2 實驗條件和實驗結(jié)果
本文選取了高速公路和城市道路[5]兩種交通場景進(jìn)行關(guān)聯(lián)性分析,為了保證實驗結(jié)果不遺漏有效信息,實驗設(shè)置上相對選取了較小的最小支持度(min_Sup)閾值和最小可信度(min_ Conf)閾值,且因為不同場景的數(shù)據(jù)采樣量不同,所以參數(shù)設(shè)置上也有所差異。
3.2.1 高速公路場景
高速公路場景下,取最小支持度min_Sup= 90/N(高速公路),其中N(高速公路)為高速公路場景下數(shù)據(jù)采樣量總量。取最小可信度min_Conf = 0.05。通過python編程,經(jīng)Apriori算法計算,結(jié)果按照可信度由高到底,取前10條違法行為和事故形態(tài)間的強(qiáng)關(guān)聯(lián)規(guī)則,如表2所示。
3.2.2 城市道路場景
城市道路場景下,取最小支持度min_Sup = 100/N(城市道路)、最小可信度min_Conf = 0.05。通過python編程,經(jīng)Apriori算法計算,結(jié)果按照可信度由高到底,取前10條違法行為和事故形態(tài)間的強(qiáng)關(guān)聯(lián)規(guī)則,如表3所示。
3.3 實驗分析和總結(jié)
拋開數(shù)據(jù)樣本本身的局限性來說,由兩組實驗的結(jié)果可見,高速公路和城市道路場景下的強(qiáng)關(guān)聯(lián)規(guī)則既有相同性,也有差異性。
相同性在于在發(fā)生事故的前提下,發(fā)生“碰撞運(yùn)動車輛”的事故形態(tài)的強(qiáng)度都很高,最高由“違法變更車道”的行為發(fā)生時,會有約90%的概率導(dǎo)致“碰撞運(yùn)動車輛”的事故結(jié)果;最低由“違法上道路行駛”的行為發(fā)生,會有約11%的概率導(dǎo)致“碰撞運(yùn)動車輛”的事故結(jié)果,可見在這兩種場景下,違法行為都很容易導(dǎo)致車輛間的碰撞事故。
差異性主要體現(xiàn)在以下幾個方面:
(1)高速公路場景下的強(qiáng)關(guān)聯(lián)規(guī)則在強(qiáng)度上明顯弱于城市道路場景。在城市道路場景中,前10項關(guān)聯(lián)規(guī)則中最高關(guān)聯(lián)強(qiáng)度可達(dá)約90%,最低也在57%左右,而在高速公路場景,最高約60%,最低則只有11%左右;
(2)不同場景下的強(qiáng)關(guān)聯(lián)規(guī)則不同。在高速公路場景下,強(qiáng)關(guān)聯(lián)規(guī)則的違法行為主要集中在“疲勞駕駛”“違法上道路行駛”和“超速行駛”上,而在城市道路場景,強(qiáng)關(guān)聯(lián)規(guī)則的違法行為分布均勻;在城市道路場景下,強(qiáng)關(guān)聯(lián)規(guī)則的事故形態(tài)主要集中在“碰撞運(yùn)動車輛”,而在高速公路場景,主要集中在“追尾碰撞”和“碰撞運(yùn)動車輛”。
(3)不同場景下相同違法行為導(dǎo)致相同事故形態(tài)的關(guān)聯(lián)度差別大?!斑`法上道路行駛→碰撞運(yùn)動車輛”的關(guān)聯(lián),在高速公路場景的關(guān)聯(lián)度只有11%左右,而在城市道路場景約58%。
(4)不同場景下相同違法行為導(dǎo)致不同事故形態(tài)比例差別也很大。在城市道路場景中,“違法上道路行駛”只與“碰撞運(yùn)動車輛”具有強(qiáng)關(guān)聯(lián),而在高速公路場景中,其強(qiáng)關(guān)聯(lián)要素還包括“刮撞行人”和“追尾碰撞”。
4結(jié)束語
使用Apriori算法對事故數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘分析,可以準(zhǔn)確找到各屬性間的關(guān)聯(lián)關(guān)系,對事故防控可以一定的指導(dǎo)作用。下步除了將關(guān)聯(lián)規(guī)則分析由違法行為和事故形態(tài)向多維度挖掘外,還將進(jìn)一步拓展交通場景,最終形成事故致因的關(guān)聯(lián)規(guī)則庫,為道路交通事故“減量控大”提供支撐。
參考文獻(xiàn)
[1]馬庚華,鄭長江,鄧評心,李銳.關(guān)聯(lián)規(guī)則挖掘在道路交通事故分析中的應(yīng)用[J].西華大學(xué)學(xué)報(自然科學(xué)版),2019,38(03):93-97+112.
[2]交宣.公安部交管局:深入推進(jìn)道路交通事故預(yù)防“減量控大”工作 全力確保道路交通安全形勢穩(wěn)定[J].汽車與安全,2020(10):9-11.
[3]王冬秀,賴先濤,李輝,蘇宇.道路交通事故中關(guān)聯(lián)規(guī)則挖掘研究[J].計算機(jī)與現(xiàn)代化,2012(08):206-208+217.
[4]李英,湯庸.基于關(guān)聯(lián)規(guī)則與相似度的數(shù)據(jù)挖掘算法研究[J].華南師范大學(xué)學(xué)報(自然科學(xué)版),2021,53(05):121-127.
[5]城市道路交通事故特點(diǎn)分析[J].汽車與安全,2019(07):13-14+2.