胡國超
摘要:將數(shù)據(jù)挖掘技術(shù)應(yīng)用在交通事故分析過程中,可以加強交通事故的研判準(zhǔn)確性,將傳統(tǒng)交通事故統(tǒng)計分析系統(tǒng)中存在的問題合理解決,加強交通事故分析的信息化、科學(xué)化。綜上所述,本文將基于數(shù)據(jù)挖掘技術(shù)對交通事故分析系統(tǒng)進行構(gòu)建,以期加強統(tǒng)計分析、關(guān)聯(lián)分析、挖掘分析等多項功能。
關(guān)鍵詞:數(shù)據(jù)挖掘;道路交通;交通事故分析;數(shù)據(jù)倉庫
我國信息技術(shù)水平的不斷提升,各行各業(yè)都開始應(yīng)用大數(shù)據(jù)技術(shù)。我國的道路交通行業(yè)在對人、車、路等多方面進行管理時,會生成海量的動態(tài)、靜態(tài)交通數(shù)據(jù),因此使用數(shù)據(jù)挖掘技術(shù),可以加強道路交通管理的水平,還可以加強交通事故信息分析系統(tǒng)的運行效果。
一、基于數(shù)據(jù)挖掘技術(shù)的道路交通事故分析系統(tǒng)流程設(shè)計
基于數(shù)據(jù)挖掘技術(shù)的道路交通事故分析系統(tǒng)可以從交通管理綜合應(yīng)用平臺獲得相關(guān)數(shù)據(jù),從而對數(shù)據(jù)進行統(tǒng)一分類管理在對分析系統(tǒng)流程進行設(shè)計的過程中,需要成立交通事故信息綜合分析數(shù)據(jù)庫,將其作為基礎(chǔ),對交通事故的相關(guān)信息進行統(tǒng)計分析,駕駛者出現(xiàn)違反交通法律信息等與數(shù)據(jù)技術(shù)存在直接關(guān)聯(lián),并且將歷史數(shù)據(jù)的預(yù)測分析作為基礎(chǔ)提供可視化分析功能,之后將分析與挖掘之后的結(jié)果輸出,從而對交通事故信息進行綜合分析與研究判斷。
二、基于數(shù)據(jù)挖掘技術(shù)的道路交通事故分析系統(tǒng)整體功能設(shè)計
在對數(shù)據(jù)挖掘技術(shù)的道路交通事故分析系統(tǒng)整體功能的設(shè)計過程中,其中應(yīng)包含事故統(tǒng)計分析、關(guān)聯(lián)分析、數(shù)據(jù)挖掘分析等分析功能,在交通事故的統(tǒng)計分析中包含事故任意分析、特點分析、事故原因綜合分析。
三、基于數(shù)據(jù)挖掘技術(shù)的道路交通事故分析系統(tǒng)詳細功能設(shè)計
(一)事故統(tǒng)計分析功能
在對交通事故進行統(tǒng)計分析的過程中,會對原有的交通事故統(tǒng)計分析進行拓展,使原有的統(tǒng)計分析功能獲得完善與優(yōu)化,還可以對原本沒有分析的項目擴展,將原有需要改進的項目進行優(yōu)化。其中包含交通該事故信息任意分析、交通事故特點綜合分析等方面。
在任意分析的過程中,需要將時間、任意條件等數(shù)據(jù)開展單項或組合式的分析。在對交通事故特點進行綜合分析時,需要增設(shè)片區(qū)統(tǒng)計[1]、大城市交通事故綜合統(tǒng)計分析等相關(guān)功能。
(二)關(guān)聯(lián)分析功能
1.交通事故與駕駛員的信息關(guān)聯(lián)分析
為了對不同駕駛證種類持有者進行數(shù)量統(tǒng)計與分析,對相同、不同區(qū)域內(nèi)的駕駛員數(shù)量與交通事故之間的關(guān)系進行分析,還會對不同駕照類型與每萬駕駛員交通事故的不同區(qū)域交通事故發(fā)生率進行統(tǒng)計??梢允褂肑S表示每萬駕駛?cè)耸鹿拾l(fā)生率,即JS=■×104,其中A表示事故數(shù)量,D表示駕駛員數(shù)量。另外,還需要對肇事駕駛員的發(fā)證區(qū)域[2]、駕駛員考試的通過率等多方面對駕駛員與交通事故之間的關(guān)系進行分析。
2.交通事故與機動車輛信息關(guān)聯(lián)分析
為了對不同區(qū)域的機動車數(shù)量與交通事故之間的發(fā)生幾率與發(fā)生關(guān)系進行分析,需要對萬車死亡的概率進行計算??梢允褂肳C對萬車死亡的發(fā)生幾率進行表示,利用相關(guān)的公式進行系統(tǒng)計算,并且作為A交通事故發(fā)生的數(shù)量,D為機動車輛的數(shù)量。
3.交通事故與違法信息關(guān)聯(lián)性分析
基于數(shù)據(jù)挖掘的道路交通分析系統(tǒng)中,會對管轄區(qū)域內(nèi)的違法行為處罰實際情況與事故認定原因互相對比,之后將違法信息與交通事故之間存在的關(guān)系充分掌握。
4.交通事故與人口數(shù)量、經(jīng)濟等相關(guān)信息的關(guān)聯(lián)性分析
系統(tǒng)會獲取交通事故與人口數(shù)量、經(jīng)濟等相關(guān)信息,通過對不同區(qū)域中的十萬人口死亡率、GDP事故發(fā)生率等相關(guān)數(shù)據(jù)進行分析,對交通事故的實際發(fā)生情況進行分析。可以使用Jr對十萬人口的死亡率進行表示,即Jr=■×105,其中A表示交通事故的數(shù)量,r表示人口的整體數(shù)量。使用JZ對發(fā)生的的事故發(fā)生率進行表示,即JZ=■×108,其中A表示交通事故總量,Z表示GDP[3]。使用對百公里發(fā)生的交通事故率進行表示,即JP=■×100,其中A表示事故發(fā)生總量,L表示道路的總長度。使用Jx表示綜合交通事故率,JZ=■×100其中A表示事故的總量,P為人口總數(shù)量。
(三)數(shù)據(jù)挖掘分析功能
第一,對交通事故數(shù)據(jù)進行預(yù)測。使用常用的指數(shù)平滑法、自動回歸滑動平均法等平均處理模型,對交通事故發(fā)生的四項指標(biāo)進行計算,其中包含事故的發(fā)生數(shù)量、死亡人數(shù)、受傷人數(shù)、造成經(jīng)濟損失,可以對交通事故的未來走向進行準(zhǔn)確預(yù)測。第二,對單項的因素進行關(guān)聯(lián)性分析。通過對單項因素的關(guān)聯(lián)性進行分析, 可以對交通事故的原因與定性影響因素之間存在的關(guān)系是否獨立進行判斷。第三,對事故的原因關(guān)聯(lián)性進行分析。將單相事故因素的關(guān)聯(lián)性分析作為基礎(chǔ),對管轄區(qū)域的交通事故發(fā)生嚴(yán)重程度與事故關(guān)聯(lián)性的因素進行構(gòu)建,其中包含駕駛員的駕齡、車輛品牌、車輛類型等多方面,之后會形成邏輯回歸模型,對相關(guān)定性與函數(shù)之間存在的關(guān)系進行擬合、定性、分析,可以將不同變量之間形成的影響作用完全描述,計算出最終的危險系數(shù)值,還可以提供相關(guān)原因與交通事故嚴(yán)重程度的危險系數(shù)示意圖,之后會得出相關(guān)的分析結(jié)論。第四,對交通事故多發(fā)的路段進行全面通緝分析。在數(shù)據(jù)挖掘道路交通事故分析系統(tǒng)中會對重點道路進行分析,將交通事故多發(fā)路段進行篩選,之后會使用將密度作為基礎(chǔ)的聚類算法進行計算,從而加強交通事故多發(fā)路段的統(tǒng)計與分析效果。
(四)可視化分析
在系統(tǒng)進行可視化分析的過程中,會將交通事故統(tǒng)計分析、關(guān)聯(lián)性分析等相關(guān)結(jié)果顯示在地圖中,可以從宏觀的角度對全國的道路交通事故區(qū)域劃分進行掌控,還可以使用分析區(qū)域進行分級、分色的顯示。
(五)重點關(guān)注
構(gòu)建系統(tǒng)的重點關(guān)注功能時,需要將事故的上升點數(shù)據(jù)作為基礎(chǔ)進行分析與構(gòu)建,需要對各個區(qū)域的交通事故上升實際情況進行分析,還可以劃分為3、5、10人的事故上升情況,對重點的車輛事故上升情況監(jiān)控。
四、結(jié)語
基于數(shù)據(jù)挖掘技術(shù)對道路交通事故分析系統(tǒng)進行構(gòu)建,可以加強數(shù)據(jù)的挖掘與分析效果,找出交通事故的發(fā)展規(guī)律,從而加強預(yù)防措施的科學(xué)性與準(zhǔn)確性。
參考文獻:
[1]胡鵬. 數(shù)據(jù)挖掘在交通管理中的應(yīng)用研究[J]. 計算機安全,2013(10):54-57.
[2]郭璘,周繼彪,董升,張水潮. 基于改進K-means算法的城市道路交通事故分析[J]. 中國公路學(xué)報,2018,31(04):270-279.
[3]惠寶鋒,馮桂蓮,王詠寧. 基于OLAP的道路交通事故影響因素分析[J]. 軟件工程,2018,21(07):21-23+20.
(作者單位:安徽百友司法鑒定中心)