李 卓,陳雨人
(同濟(jì)大學(xué)交通運(yùn)輸工程學(xué)院,上海201804)
基于決策樹(shù)方法的偏遠(yuǎn)地區(qū)山區(qū)公路駕駛安全性研究
李 卓,陳雨人
(同濟(jì)大學(xué)交通運(yùn)輸工程學(xué)院,上海201804)
山區(qū)公路復(fù)雜的組合駕駛環(huán)境因素與事故數(shù)據(jù)的缺乏記錄都使得分析山區(qū)公路駕駛安全性十分困難。建立了一套完整的山區(qū)公路駕駛安全性實(shí)驗(yàn)方法,并提供了一種結(jié)合了隨機(jī)森林法則與基于機(jī)器學(xué)習(xí)決策樹(shù)的方法,以分析山區(qū)公路上導(dǎo)致駕駛事故的主要因素。實(shí)驗(yàn)團(tuán)隊(duì)使用行車(chē)記錄儀結(jié)合視頻識(shí)別技術(shù)以獲取沿途的道路駕駛環(huán)境與駕駛員在試驗(yàn)中的駕駛行為。用“最大信息熵增長(zhǎng)率”法結(jié)合AIC準(zhǔn)則以分析歸納模型中包含的主要駕駛環(huán)境因素。結(jié)論顯示:急窄彎道、穿行于村鎮(zhèn)間、缺乏視距是影響駕駛員在山區(qū)公路上安全行駛的主要原因。證明了這種方法可以用于指導(dǎo)山區(qū)公路的設(shè)計(jì),提高山區(qū)公路上的行駛安全性。
駕駛安全性實(shí)驗(yàn);駕駛環(huán)境因素;決策樹(shù)分類(lèi)
山區(qū)公路在運(yùn)輸、旅游和村鎮(zhèn)往來(lái)路線(xiàn)上往往扮演著重要的角色。但是近年來(lái),由于行車(chē)環(huán)境的不協(xié)調(diào),山區(qū)公路上出現(xiàn)了越來(lái)越多的交通事故與潛在的危險(xiǎn)路段?,F(xiàn)階段,山區(qū)公路的設(shè)計(jì)理論趨于規(guī)范化[1],且被普遍應(yīng)用于各類(lèi)山區(qū)公路設(shè)計(jì)中。但是山區(qū)公路往往具有復(fù)雜的環(huán)境條件,僅用規(guī)范化設(shè)計(jì)理論難以避免一些路段事故頻發(fā)。因此,許多學(xué)者紛紛開(kāi)展了相關(guān)的研究,如:車(chē)速限制研究[2-4],結(jié)合交通量,道路環(huán)境,事故數(shù)據(jù)的交通事故成因分析,統(tǒng)計(jì)建模以進(jìn)行事故預(yù)測(cè)等[5]。以上技術(shù)路線(xiàn)可以總結(jié)為歸納演繹法。在歸納學(xué)習(xí)法中,研究者通過(guò)觀測(cè)數(shù)據(jù)樣本,進(jìn)行其他場(chǎng)景下的預(yù)測(cè),以得到普適性的結(jié)論。許多不同的方法應(yīng)用于分析駕駛安全性,綜述研究[6]中已經(jīng)做了詳盡的總結(jié):Probit模型,Logit模型,Log-linear模型等等。數(shù)據(jù)挖掘技術(shù)是一種分析大量數(shù)據(jù)并且將之轉(zhuǎn)換有用信息與知識(shí)的方法。人工神經(jīng)網(wǎng)絡(luò)與一些分類(lèi)、回歸方法已經(jīng)被普遍地應(yīng)用于道路安全分析中。但是偏遠(yuǎn)地區(qū)的山區(qū)公路經(jīng)常遠(yuǎn)離目前的道路信息系統(tǒng)監(jiān)管范圍,而且相關(guān)的事故數(shù)據(jù)也難以獲得。目前在以往的研究中,針對(duì)這類(lèi)山區(qū)公路上的駕駛安全性分析比較少。因此,在分析駕駛行為安全性之前,必須通過(guò)實(shí)地調(diào)查與實(shí)驗(yàn)獲取研究道路上的駕駛環(huán)境變量。
因此本研究的目的是提出一種針對(duì)缺乏事故數(shù)據(jù)的山區(qū)道路的研究方法,并且將研究成果應(yīng)用于消除山區(qū)公路上的事故多發(fā)段。作為案例,本研究中的研究方法已經(jīng)應(yīng)用于國(guó)道318,并且根據(jù)研究結(jié)論已經(jīng)完成了318國(guó)道安全性評(píng)估。余下篇幅將從以下內(nèi)容展開(kāi):首先羅列研究框架,然后介紹研究中所用的數(shù)據(jù)集,詳細(xì)介紹實(shí)驗(yàn)路段的特點(diǎn)與實(shí)驗(yàn)方法,最后對(duì)于研究做結(jié)論總結(jié)。本研究提出了一種決策樹(shù)方法用于分析道路駕駛環(huán)境因素對(duì)駕駛者的影響機(jī)理。
目前已有許多對(duì)車(chē)流和道路幾何特性相關(guān)的變量與交通事故的評(píng)估,以及交通事故預(yù)測(cè)的試驗(yàn)方法。如果事故數(shù)據(jù)十分詳盡,包含了各種屬性變量,那么可以使用聚類(lèi)分析以研究不同類(lèi)型的交通事故。但是這種方法不能用于本研究的道路。因此,首先需要采集觀測(cè)數(shù)據(jù),再進(jìn)行數(shù)據(jù)分析。
決策樹(shù)是數(shù)據(jù)挖掘技術(shù)中的一種[7]。決策樹(shù)方法中包含了兩種數(shù)據(jù)集(屬性變量與分類(lèi)變量)。需要根據(jù)已有研究標(biāo)準(zhǔn)定義不同路段的道路駕駛安全等級(jí),然后將安全等級(jí)作為分類(lèi)變量進(jìn)行數(shù)據(jù)挖掘。此外,屬性變量應(yīng)該從試驗(yàn)中獲取。所以本研究的框架為:
1)實(shí)地實(shí)驗(yàn),記錄實(shí)驗(yàn)數(shù)據(jù);
2)對(duì)實(shí)驗(yàn)過(guò)程進(jìn)行安全性評(píng)估(分類(lèi)變量),提取駕駛環(huán)境因素(屬性變量);
3)決策樹(shù)方法分析并總結(jié)結(jié)論。
國(guó)道318位于偏遠(yuǎn)的高海拔地區(qū)。全實(shí)驗(yàn)路段的總里程為52 569 m。道路為雙向兩車(chē)道,但是中央分割線(xiàn)不全,部分路段雙向行駛車(chē)道分割模糊。道路地圖如圖1(a)所示??梢?jiàn),道路沿線(xiàn)上經(jīng)過(guò)了一些村莊與山谷線(xiàn)路段。道路路況艱難,周邊環(huán)境復(fù)雜。根據(jù)調(diào)查,該試驗(yàn)道路上有多處事故高發(fā)路段,但是具體的統(tǒng)計(jì)信息與事故段位置無(wú)從獲知。因此,研究團(tuán)隊(duì)遠(yuǎn)赴該地區(qū),進(jìn)行了實(shí)地實(shí)驗(yàn)以采集道路行駛環(huán)境因素,以期對(duì)于該路段的駕駛安全性進(jìn)行評(píng)估。實(shí)驗(yàn)與數(shù)據(jù)處理過(guò)程將在下文介紹。
圖1 國(guó)道318靈芝地區(qū)段與該路段上的實(shí)驗(yàn)車(chē)速Fig.1 National road 318 in Linzhi areas and the travel speed recorded
2.1 實(shí)驗(yàn)?zāi)康呐c實(shí)驗(yàn)方法
為了全面地觀測(cè)該試驗(yàn)道路,本研究實(shí)施了一系列實(shí)車(chē)行駛實(shí)驗(yàn)。實(shí)驗(yàn)過(guò)程簡(jiǎn)述如下:在良好天氣條件下,讓駕駛員沿路進(jìn)行自然駕駛,使用一輛裝載了行車(chē)記錄器(GARMIN GDR35)的測(cè)試車(chē)。行車(chē)記錄器與全球定位系統(tǒng)(GPS)相結(jié)合,并且完美地將GPS信號(hào)與攝像機(jī)鏡頭結(jié)合。這使得它可以同時(shí)記錄車(chē)輛位置、車(chē)速、加減速度與駕駛員的視野內(nèi)容。采集的信息將以1 Hz的頻率記錄,采集的視頻分辨率為1 920*1 080像素,幀率30幀/s,攝像機(jī)鏡頭焦距為f=2.0,視野角度為水平51.222 25°,垂直34.998 939°。
道路環(huán)境復(fù)雜如圖1(b)所示,即便實(shí)驗(yàn)中的駕駛員已經(jīng)有十幾年的戶(hù)外駕駛經(jīng)驗(yàn)與山地駕駛技巧,但是他仍然難以保持穩(wěn)定的駕駛車(chē)速。讓駕駛員行駛在道路的右側(cè)車(chē)道上,但是就行車(chē)記錄儀所記錄的結(jié)果來(lái)看有時(shí)這很難做到。沒(méi)有指定實(shí)驗(yàn)期望車(chē)速,而且該道路交通量極小,因此可以認(rèn)為實(shí)驗(yàn)符合自然駕駛的標(biāo)準(zhǔn)。
圖2 駕駛視頻識(shí)別軟件Fig.2 Driving video recognition software
2.2 實(shí)驗(yàn)數(shù)據(jù)處理與駕駛安全性評(píng)估
如圖2所示,本研究使用了一款自主開(kāi)發(fā)的視頻識(shí)別軟件以識(shí)別駕駛?cè)兄胺降缆飞系鸟{駛環(huán)境信息。該視頻識(shí)別技術(shù)基于現(xiàn)有研究中的模型。該視頻識(shí)別軟件可以提取出6種駕駛環(huán)境因素(是否是急陡彎(IFSC)(評(píng)判標(biāo)準(zhǔn)是平均圓曲線(xiàn)半徑小于200 m),是否經(jīng)過(guò)村鎮(zhèn)(IFTV)),是否有中央分隔線(xiàn)(IFCL),是否有足夠的時(shí)距(IFSD),是否有安全護(hù)欄(IFRR)與道路是否顛簸(IFBR)),基于駕駛員的視覺(jué)車(chē)道模型Cat-Mull-Rom spline。這款軟件還可以識(shí)別圓曲線(xiàn)半徑,坡道坡度,行駛里程等。每秒駕駛環(huán)境因素被識(shí)別為6個(gè)啞元變量(0表示未發(fā)生,1表示發(fā)生)。由于瞬時(shí)記錄的駕駛環(huán)境因素需要經(jīng)過(guò)駕駛員感知,思考,反應(yīng)到駕駛行為中去,所以數(shù)據(jù)分析的時(shí)間尺度需要擴(kuò)大。將試驗(yàn)路段根據(jù)直緩點(diǎn),緩圓點(diǎn),圓弧中點(diǎn),圓緩點(diǎn),緩直點(diǎn)分為85個(gè)路段。每個(gè)路段平均長(zhǎng)656 m,平均行程時(shí)間35 s。在每段路段上,計(jì)算6個(gè)啞元變量的距離占有率,以反應(yīng)6種影響因素的強(qiáng)弱。結(jié)合每段路段的平均圓曲線(xiàn)半徑(ACR)與平均坡度(ASR),對(duì)于每段路段都有8個(gè)變量。
根據(jù)上文的數(shù)據(jù)處理方法,需要根據(jù)8個(gè)變量評(píng)估每段路段的駕駛安全性。本研究使用路段上的車(chē)速記錄來(lái)評(píng)估各個(gè)路段的駕駛安全等級(jí)作為分類(lèi)變量。通過(guò)行駛車(chē)速可以評(píng)估交通事故潛在風(fēng)險(xiǎn)。在已有的研究中,相鄰路段的車(chē)速差是最關(guān)鍵的評(píng)估因素(ATS)。良好的設(shè)計(jì)與行駛環(huán)境可以使得駕駛員以平穩(wěn)、連續(xù)、安全的車(chē)速行駛,從而降低了發(fā)生交通事故的可能性。目前已有幾種關(guān)于△v的評(píng)估標(biāo)準(zhǔn)。參考V85%標(biāo)準(zhǔn)[2],以相鄰路段的平均車(chē)速差作為評(píng)估標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)基于駕駛員駛過(guò)相鄰兩個(gè)路段的平均車(chē)速(△ia對(duì)于第i個(gè)路段)的絕對(duì)差值。該標(biāo)準(zhǔn)如表1所示。
表1 ATS標(biāo)準(zhǔn)Tab.1 ATS criterion
另一種建立駕駛行為與駕駛安全性的標(biāo)準(zhǔn)為車(chē)速下降系數(shù)法SRC[2]。
這種方法考慮vi(當(dāng)車(chē)輛從第i個(gè)路段駛出,進(jìn)入第i+1個(gè)路段時(shí)的瞬時(shí)車(chē)速)與ai(車(chē)輛駛出第i個(gè)路段駛出,進(jìn)入第i+1個(gè)路段時(shí)的瞬時(shí)減速度)。這種標(biāo)準(zhǔn)如表2所示。
表2 SRC標(biāo)準(zhǔn)Tab.2 SRC criterion
同時(shí)使用ATS標(biāo)準(zhǔn)與SRC標(biāo)準(zhǔn)對(duì)實(shí)驗(yàn)數(shù)據(jù)的駕駛危險(xiǎn)性進(jìn)行了分類(lèi)。
3.1 問(wèn)題描述與假設(shè)
為了方便本研究反應(yīng)問(wèn)題,提出了如下基本假設(shè):
1)為了分析許多駕駛環(huán)境因素的影響,這個(gè)問(wèn)題轉(zhuǎn)化為多等級(jí)分類(lèi)問(wèn)題,定義1—3對(duì)應(yīng)3種不同的駕駛安全性等級(jí)。
2)所有的訓(xùn)練集假設(shè)由獨(dú)立同分布的樣本構(gòu)成,因此他們會(huì)單獨(dú)進(jìn)入決策樹(shù)的構(gòu)建。
定義本研究中的變量如表3。
表3 變量設(shè)計(jì)Tab.3 Variable design
決策樹(shù)采用分而治之的策略,決策樹(shù)過(guò)程為遞歸過(guò)程,樹(shù)上每個(gè)節(jié)點(diǎn)不但可以評(píng)估駕駛的危險(xiǎn)性,還可以找出導(dǎo)致不安全駕駛行為的關(guān)鍵因素。因此決策樹(shù)方法適用于分析多駕駛環(huán)境因素的組合影響。決策樹(shù)的末端分支將通過(guò)這些駕駛環(huán)境因素指向不同的駕駛安全性分類(lèi)。
3.2 決策樹(shù)算法流程
使用經(jīng)典的C4.5方法[10]訓(xùn)練觀測(cè)樣本。算法流程如下:
1)數(shù)據(jù)訓(xùn)練集D={(x1,y1),(x2,y2),…,(xm,ym)}與屬性變量集A={a1,a2,…,ad};
2)TreeGenerate(D,A)創(chuàng)建樹(shù)節(jié)點(diǎn)記為Node;
3)If如果D中的樣本已經(jīng)全被分為類(lèi)C then
標(biāo)記Node為C的葉節(jié)點(diǎn);return
end if
4)If A中所有的屬性變量已經(jīng)被剔除OR所有的訓(xùn)練集D中的樣本在A屬性值上取值相同then
將Node標(biāo)記為葉節(jié)點(diǎn),并且將其類(lèi)別標(biāo)記為D中樣本數(shù)最多的類(lèi)return
end if
5)選擇最優(yōu)的劃分屬性變量ao,隨后在屬性集中剔除該屬性ao;
6)forao在當(dāng)前D中的每一個(gè)值do
為Node創(chuàng)建一個(gè)分支并選出Ds;
if Ds為空 then
將Node標(biāo)記為葉節(jié)點(diǎn),將它的類(lèi)別標(biāo)記為D中樣本最多的類(lèi)return;
else
TreeGenerate(D,A{ao})創(chuàng)建分結(jié)點(diǎn);
end if
end for
7)輸出一個(gè)以Node為根節(jié)點(diǎn)的決策樹(shù)
在第5步中,使用“最大信息熵增加率”規(guī)則選取最佳分類(lèi)屬性劃分樣本集。這個(gè)過(guò)程解釋如下。
1)以樣本集信息熵表征其純度。
信息熵越小,樣本集純度越高。因此,使用信息熵增加率較高的屬性劃分樣本集,可以提高樣本集純度,更好的界定危險(xiǎn)駕駛行為的分級(jí)機(jī)理。
2)使用信息熵增加率表征樣本集純度的增加。
當(dāng)前樣本集中僅剩一個(gè)樣本時(shí),劃分終止。
3)使用文獻(xiàn)[10]中提出的一種啟發(fā)式算法,尋找一系列須有高信息熵增加率的aos,然后選出當(dāng)前具有最大信息熵增加率的屬性ao。
為使分類(lèi)器的結(jié)果偏差盡可能小,將C4.5算法與隨機(jī)森林法則結(jié)合。每次決策樹(shù)訓(xùn)練,隨機(jī)選取樣本集中的85%樣本,進(jìn)行訓(xùn)練并得出一顆決策樹(shù)。如此進(jìn)行10次,得出10棵決策樹(shù)。在測(cè)試數(shù)據(jù)的分類(lèi)過(guò)程中,10棵樹(shù)得出10組不同的結(jié)果,通過(guò)眾數(shù)投票得出每一個(gè)樣本的分類(lèi)結(jié)果。對(duì)投票過(guò)程記性了統(tǒng)計(jì),定義投票一致性(VV)以表征模型的穩(wěn)定性。VV越小表明10決策樹(shù)傾向于得出不同的結(jié)論一致性越差,這也說(shuō)明了模型的分類(lèi)效果較為不穩(wěn)定。
3.3 結(jié)果驗(yàn)證方法
為了驗(yàn)證模型的穩(wěn)定性與準(zhǔn)確性,使用kfold交叉驗(yàn)證法??傮w樣本集被劃分為k份。選擇其中一份作為測(cè)試數(shù)據(jù),其余k-1份作為訓(xùn)練數(shù)據(jù)。如此交叉進(jìn)行k次測(cè)試,以保證在全樣本范圍內(nèi)對(duì)模型進(jìn)行有效檢驗(yàn)。本研究中k取5,最終以5次測(cè)試的準(zhǔn)確性驗(yàn)證該模型。總體算法流程圖如圖3。
圖3 算法流程圖Fig.3 Algorithm flow chart
3.4 變量影響作用度量納入該模型的變量重要性度量如下。
其中,C為分類(lèi)種類(lèi),本研究共3類(lèi);nai為屬性值數(shù)量(a=ai)。VIM(a)表征了當(dāng)使用屬性值a時(shí),在類(lèi)別C上的信息熵增量。VIM的值表征了每個(gè)變量標(biāo)準(zhǔn)化的重要性度量,通過(guò)該指標(biāo)可以得出納入模型的各個(gè)屬性之間的優(yōu)先度排序。
基于MATLAB軟件,以上算法得以實(shí)現(xiàn)。為了使得決策樹(shù)中的劃分易于理解與解釋?zhuān)狙芯肯薅Q策樹(shù)最高4層。
4.1 變量篩選
根據(jù)最大信息熵增加率規(guī)則,最初被選用于劃分的屬性成為根節(jié)點(diǎn),其對(duì)于診斷駕駛安全性分類(lèi)最為有效。根據(jù)表4統(tǒng)計(jì),路段上的急陡彎、視距不足、經(jīng)過(guò)村鎮(zhèn)是3類(lèi)最主要的影響駕駛安全性的道路環(huán)境因素。
表4 每種屬性變量成為根節(jié)點(diǎn)的頻數(shù)統(tǒng)計(jì)Tab.4 The frequency of each attribute variable developing into root-node
變量篩選的目的為找出可以最恰當(dāng)解釋與訓(xùn)練樣本集的屬性變量。此外,通過(guò)對(duì)于8個(gè)屬性變量的VIM值計(jì)算,可以根據(jù)變量的標(biāo)準(zhǔn)化重要度得出進(jìn)入模型的優(yōu)先度排序。確定排序后,本研究通過(guò)AkaikeInformation Criterion,AIC[11]法則確定進(jìn)入模型的最佳變量數(shù)量。AIC準(zhǔn)則是為了權(quán)衡模型復(fù)雜度與模型精度,避免模型發(fā)生過(guò)擬合現(xiàn)象,其AIC指標(biāo)計(jì)算方法如下。
式中:RSS是模型測(cè)試中的均方差;K是進(jìn)入模型的變量數(shù);n為樣本集觀察數(shù)。
圖4 AIC值與RRS值Fig.4 AIC values and RRS values
由圖4可見(jiàn),當(dāng)變量數(shù)為3時(shí),AIC值最小,此時(shí)模型的復(fù)雜度最為適宜。根據(jù)VIM值確定出進(jìn)入模型的3個(gè)屬性變量為IFSC,IFSD,IFTV。這個(gè)結(jié)果與根據(jù)最大信息熵增加率規(guī)則確定的3個(gè)最主要影響因素的結(jié)果吻合。
4.2 模型訓(xùn)練與測(cè)試結(jié)果
在SRC標(biāo)準(zhǔn)下:8參數(shù)模型的5組測(cè)試平均準(zhǔn)確性與VV值分別達(dá)到了0.86與0.73。如果僅使用以上3參數(shù)模型,平均準(zhǔn)確性與VV值分別達(dá)0.80與0.71。同理在V85%標(biāo)準(zhǔn)下:8參數(shù)模型的5組測(cè)試平均準(zhǔn)確性與VV值分別達(dá)到了0.89與0.75。3參數(shù)模型平均準(zhǔn)確性與VV值分別達(dá) 0.78與0.69。說(shuō)明3參數(shù)模型已可以對(duì)多數(shù)駕駛安全性的變化情況作出解釋?zhuān)容^高,模型內(nèi)部統(tǒng)一性較高。
通過(guò)實(shí)地測(cè)試對(duì)于偏遠(yuǎn)地區(qū)山區(qū)公路駕駛安全性做了分析。使用了行車(chē)記錄儀記錄駕駛員對(duì)環(huán)境的視覺(jué)信息,并通過(guò)視頻識(shí)別技術(shù)從中提取出8種駕駛環(huán)境影響因素。同時(shí)根據(jù)實(shí)驗(yàn)車(chē)輛行駛軌跡對(duì)路段行駛安全性進(jìn)行分級(jí)。建立了決策樹(shù)算法分析了組合駕駛環(huán)境因素對(duì)于山區(qū)公路監(jiān)視安全性的影響。
從標(biāo)準(zhǔn)化變量重要度和參與劃分的統(tǒng)計(jì)頻數(shù)兩個(gè)方面均證實(shí)了小半徑曲線(xiàn)(<200 m)、停車(chē)視距不足與車(chē)輛穿過(guò)村莊這3個(gè)因素對(duì)于駕駛安全性影響最大,進(jìn)一步研究了組合因素(諸如:安全欄缺失,中心線(xiàn)確實(shí),等)的影響,并訓(xùn)練得出了較為精確的決策樹(shù)模型,解釋了駕駛環(huán)境因素對(duì)路段駕駛安全性的影響機(jī)理。本研究中的試驗(yàn)與分析方法不需要事故數(shù)據(jù),通過(guò)該實(shí)驗(yàn)路段所訓(xùn)練得出的決策樹(shù)可以用于其他山區(qū)公路的駕駛安全性分析,并得出各個(gè)路段的安全性分析結(jié)果,指導(dǎo)山區(qū)公路的設(shè)計(jì)與設(shè)施改善。
[1]楊志清,郭忠印,杜曉麗.基于視覺(jué)信息的高速公路運(yùn)行車(chē)速預(yù)測(cè)模型[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2007,35(7):929-934.
[2]馬社強(qiáng),劉東,路峰.車(chē)速對(duì)交通安全的影響及管理研究[J].公路交通技術(shù),2008(5):139-142.
[3]陳濤,魏朗.道路行車(chē)安全性虛擬評(píng)價(jià)方法研究[J].安全與環(huán)境學(xué)報(bào),2006,6(6):115-118.
[4]孟妮,韓丹.聚類(lèi)分析和模糊邏輯在駕駛行為辨識(shí)中的應(yīng)用[J].計(jì)算機(jī)與數(shù)字工程,2013,41(7):1097-1099.
[5]WANG Y,SHEN D,TEOH E K.Lane detection using spline model[J].Pattern Recognition Letters,2000,21(8):677-689.
[6]SAVOLAINEN P T,MANNERING F L,LORD D,et al.The statistical analysis of highway crash-injury severities:A review and assessment of methodological alternatives[J].Accident Analysis&Prevention,2011,43(5):1666-1676.
[7]HAN J,KAMBER M,KAMBER M.Data Mining:Concepts and techniques,morgan kaufmann.Machine Press,2001 in Chinese,2006,5(4):394-395.
[8]王岳,陳雨人.低等級(jí)公路交叉口與城市道路非信號(hào)燈交叉口車(chē)輛運(yùn)行速度特征比較分析[J].華東交通大學(xué)學(xué)報(bào),2016,33(3):79-86.
[9]陳雨人,余博,賀思虹.基于視覺(jué)感知偏差的公路幾何平縱協(xié)調(diào)性分析技術(shù)[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2015,43(9):1347-1354.
[10]QUINLAN J R.C4.5:programs for machine learning[M].Morgan Kaufmann Publishers Inc,2014:62-79.
[11]AKAIKE H.Factor analysis and AIC[J].Psychometrika,1987,52(3):317-332.
Analysis of Driving Safety on Mountain Highway in Remote Areas Based on Decision Tree Method
Li Zhuo,Chen Yuren
(College of Transportation Engineering,Tongji University,Shanghai 201804,China)
The combination of complex driving environment factors and the lack of accident data make the analysis of driving safety on mountain highway difficult.This paper proposed a complete set of experimental methods for driving safety on mountain highway and provided a decision tree method combining with Random Forest method to identify the main factors leading to accidents.By using automobile data recorder and radio frequency identification,the experimental team obtained information about the driving environment and drivers’behaviors. The approach of maximum gain ratio and Akaike information criterion are adopted to analyze and summarize the main driving environment factors involved in the model.The results showed that sharp road curvatures,traveling through villages and lack of sight distance are the main factors for driving safety on mountain highway.It is confirmed that this approach can provide reference for the design of mountain highway to improve driving safety.
driving safety experiment;driving environment factors;decision tree method
U411
A
1005-0523(2017)02-0029-08
(責(zé)任編輯 王建華)
2016-09-03
國(guó)家科技支撐計(jì)劃課題(2014BAG01B06)
李卓(1992—),女,碩士研究生,主要研究方向?yàn)榈缆钒踩c環(huán)境。
指導(dǎo)老師:陳雨人(1966—),男,博導(dǎo),研究方向?yàn)榈缆芬?guī)劃與設(shè)計(jì)、交通安全與環(huán)境等。