孫小端,侯洋洋,賀玉龍,馮丙丙
(北京工業(yè)大學(xué) 交通工程北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124)
?
青藏高原雙車(chē)道事故嚴(yán)重程度預(yù)測(cè)模型的建立
孫小端,侯洋洋,賀玉龍,馮丙丙
(北京工業(yè)大學(xué) 交通工程北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124)
分析了青藏高原地區(qū)的交通事故數(shù)據(jù),發(fā)現(xiàn)大部分交通事故都是死傷人數(shù)較高的事故,即死傷事故占比較大。將事故嚴(yán)重程度作為因變量,選取海拔、氧含量、天氣、事故地點(diǎn)的線形、事故地點(diǎn)的環(huán)境、肇事車(chē)輛的類(lèi)型、交通量、大車(chē)比例、大小車(chē)的速度差等9個(gè)因素作為自變量,建立了累積Logistic回歸預(yù)測(cè)模型,研究了影響高原地區(qū)交通事故嚴(yán)重程度的因素。結(jié)果表明:海拔、大車(chē)比例、交通量、肇事車(chē)輛類(lèi)型和大小車(chē)的速度差與交通事故嚴(yán)重程度有顯著的相關(guān)性。預(yù)測(cè)模型的建立能夠?yàn)橄嚓P(guān)公路管理部門(mén)制定安全措施提供理論依據(jù)。
交通工程;累積Logistic模型;青藏高原;事故嚴(yán)重程度預(yù)測(cè)
青藏高原地區(qū)因其特殊的地理位置、低壓缺氧的氣候、惡劣的自然條件、復(fù)雜的地質(zhì)條件和脆弱的生態(tài)環(huán)境,使得道路行車(chē)安全性極差,極易發(fā)生重特大事故。高原地區(qū)人煙稀少,交通安全保障設(shè)施不足,導(dǎo)致發(fā)生交通事故后常常得不到及時(shí)的救援,造成人員傷亡,加劇交通事故的嚴(yán)重程度;高原無(wú)人區(qū)的部分路段線形差,路側(cè)多山峰也易造成嚴(yán)重交通事故的發(fā)生;高原地區(qū)海拔高,駕駛員容易缺氧,易疲勞,也成為影響交通安全的重要因素。
近年來(lái),我國(guó)交通安全形勢(shì)比較嚴(yán)峻,突出表現(xiàn)為交通事故較嚴(yán)重。據(jù)2013年道路交通事故統(tǒng)計(jì)年報(bào)[1],根據(jù)2009—2013年各省市一次性死亡10人以上的重、特大道路交通事故數(shù)據(jù)整理出東部地區(qū)、中部地區(qū)和西部地區(qū)的事故數(shù)及傷亡人數(shù),發(fā)現(xiàn)西部地區(qū)無(wú)論事故數(shù)量還是傷亡人數(shù)均高于中、東部地區(qū)(圖1)。
圖1 2009—2013年一次死亡10人以上的重、特大交通故數(shù)及傷亡人數(shù)地區(qū)分布Fig. 1 The number of major traffic accidents with more than 10 people death and the area distribution of deaths/injuries in 2009-2013
國(guó)內(nèi)外關(guān)于高海拔的公路交通安全預(yù)測(cè)模型的相關(guān)研究較少,多集中在非高原條件下的交通安全預(yù)測(cè)模型的研究。王謙等[2]通過(guò)對(duì)高原地區(qū)1 894起交通傷亡事故的分析,得出高原交通事故地點(diǎn)、事故車(chē)型、事故形態(tài)、事故原因等分布規(guī)律及特性。
在非高原條件下,常常采用Logistic回歸模型來(lái)分析交通事故嚴(yán)重程度與交通環(huán)境等的關(guān)系。如K.KIM等[3]采用對(duì)數(shù)線性模型和Logistic回歸模型兩種方法研究了事故類(lèi)型與交通事故嚴(yán)重程度之間的關(guān)系;C.R.MERCIER等[4]采用Logistic回歸模型分析了事故嚴(yán)重程度與性別、年齡和鄉(xiāng)村公路上發(fā)生的正面碰撞之間的關(guān)系;K.K.W.YAU等[5]利用Logistic回歸模型分析了單車(chē)碰撞事故和多車(chē)碰撞事故的影響因素;馬壯林等[6]利用Logistic 回歸模型對(duì)公路交通事故嚴(yán)重程度影響因素進(jìn)行了分析。
上述研究都只是基于平原和山區(qū)道路交通事故,較少涉及高原低氧環(huán)境下的交通事故。筆者基于青藏高原的交通事故數(shù)據(jù),分析了高原低氧環(huán)境下交通事故嚴(yán)重程度的影響因素。以交通事故嚴(yán)重程度為因變量,選擇海拔、氧含量、天氣、事故地點(diǎn)的線形、事故地點(diǎn)環(huán)境、肇事車(chē)輛的類(lèi)型、交通量、大車(chē)比例、大小車(chē)的速度差等9個(gè)因素為自變量,分析交通事故嚴(yán)重程度與這9個(gè)因素的關(guān)系,并采用Logistic回歸分析建立預(yù)測(cè)模型。
1.1 數(shù)據(jù)收集
筆者主要采集并處理了青海省境內(nèi)雙車(chē)道公路的交通安全數(shù)據(jù)。青海省境內(nèi)以高原地形為主,高海拔特征明顯。根據(jù)研究需要,所采集的數(shù)據(jù)內(nèi)容包括交通流、交通環(huán)境、交通事故、道路及路側(cè)相關(guān)數(shù)據(jù)等。交通流數(shù)據(jù)通過(guò)對(duì)所研究的各個(gè)路段鋪設(shè)MetroCount獲?。唤煌ōh(huán)境數(shù)據(jù)主要包括海拔和氧含量,由手持檢測(cè)設(shè)備獲??;交通事故數(shù)據(jù)從當(dāng)?shù)亟痪块T(mén)獲得,采用的完整交通事故信息為661條,其中每一條的交通事故信息包括事故發(fā)生的地點(diǎn)、肇事車(chē)輛的類(lèi)型、肇事車(chē)輛司機(jī)的年齡、天氣和事故形態(tài)等,基于交通事故信息及調(diào)研數(shù)據(jù)來(lái)探究交通事故嚴(yán)重程度與影響因素之間的關(guān)系;道路及路側(cè)相關(guān)數(shù)據(jù)通過(guò)道路設(shè)計(jì)線形資料、現(xiàn)場(chǎng)調(diào)研及調(diào)研時(shí)拍攝的視頻錄像資料獲取。
1.2 數(shù)據(jù)分析
通過(guò)對(duì)所采集的交通事故數(shù)據(jù)進(jìn)行分析,筆者研究了交通事故嚴(yán)重程度及傷亡人數(shù)的影響因素。表1是海拔高度、大車(chē)比例、交通量、大小車(chē)速度差與平均每起事故傷亡人數(shù)的關(guān)系。由表1可見(jiàn):
1)不同的海拔高度下平均每起交通事故的受傷人數(shù)和死亡人數(shù)是不同的,整體趨勢(shì)上,傷亡人數(shù)隨著海拔的上升而增加。說(shuō)明隨著海拔的增加,交通事故的嚴(yán)重程度也加劇。因?yàn)殡S著海拔的升高,含氧量降低,一方面會(huì)對(duì)駕駛員的身體狀況產(chǎn)生影響,降低人的反應(yīng)能力,造成事故的發(fā)生;另一方面會(huì)降低汽車(chē)的動(dòng)力性能。
2)在道路交通中隨著大車(chē)交通量所占比例的上升,交通事故嚴(yán)重程度明顯地增大,傷亡人數(shù)明顯上升。大車(chē)比例這一因素是影響重大交通事故發(fā)生的重要因素。
3)不同的交通量平均每起交通事故的受傷人數(shù)和死亡人數(shù)是不同的。整體趨勢(shì)上,平均每起事故的受傷人數(shù)是隨著交通量的增加而降低;平均死亡人數(shù)在交通量為4 000~6 000(含6 000)pcu/d時(shí)達(dá)到最高,在交通量>6 000 pcu/d時(shí),則隨著交通量的增加而降低。說(shuō)明隨著交通量的增加,公路上車(chē)輛速度相應(yīng)減慢,發(fā)生交通事故的概率也會(huì)減少。
表1 海拔高度、大車(chē)比例、交通量、大小車(chē)速度差與平均每起事故傷亡人數(shù)關(guān)系
4)隨著大小車(chē)速度差的增加,平均每起交通事故的受傷人數(shù)和死亡人數(shù)整體上是增加的,在速度差為15~20 km/h范圍時(shí),平均死亡人數(shù)的增長(zhǎng)趨勢(shì)較快;而平均受傷人數(shù)是有起伏的增加。
根據(jù)因變量不同,Logistic回歸模型可分為2種類(lèi)型:①因變量為二分類(lèi)的Logistic回歸;②因變量為多分類(lèi)的Logistic回歸,當(dāng)因變量為有序變量時(shí),為有序多分類(lèi)Logistic回歸,也稱(chēng)之為累積Logistic回歸,例如疾病的嚴(yán)重程度是高、中、低等;當(dāng)因變量為無(wú)序多分類(lèi)時(shí),為無(wú)序多分類(lèi)Logistic回歸,比如傾向于選擇哪種產(chǎn)品。筆者研究的內(nèi)容為事故的嚴(yán)重程度,所以選用累積Logistic回歸模型。
累積Logistic回歸模型其實(shí)就是二分類(lèi)Logistic回歸模型的拓展,模型定義[7]如下:
設(shè)有序變量Y有j個(gè)等級(jí),按順序取值,Y取1,2,…,j,則累積Logistic回歸模型可表示為
(1)
則累積Logistic回歸模型可以表示為
j= 1,2,…,j-1
(2)
3.1 因變量選取
交通事故嚴(yán)重程度因變量是根據(jù)每起事故的傷亡情況進(jìn)行劃分的。公安部于1991年發(fā)布了《關(guān)于修訂道路交通事故等級(jí)劃分標(biāo)準(zhǔn)的通知》,將交通事故分為輕微事故、受傷事故、重大事故和特大事故等4個(gè)等級(jí);2004年,又發(fā)布了《交通事故統(tǒng)計(jì)暫行規(guī)定》,將交通事故嚴(yán)重程度劃分為死亡事故、重傷事故、輕傷事故和財(cái)產(chǎn)損失事故等4個(gè)等級(jí)。
筆者參照1991年公安部的標(biāo)準(zhǔn),結(jié)合實(shí)際調(diào)查的交通事故數(shù)據(jù),將事故嚴(yán)重程度分為嚴(yán)重事故、受傷事故、僅財(cái)損事故3類(lèi),見(jiàn)表2。
表2 交通事故嚴(yán)重程度劃分
3.2 自變量選取
根據(jù)在青海調(diào)研收集到的道路線形信息、交通流信息和交通事故信息,考慮高原特性,選出9個(gè)自變量,即海拔、氧含量、交通量、大車(chē)比例、大小車(chē)的速度差、天氣、事故地點(diǎn)的線形、事故地點(diǎn)的環(huán)境、肇事車(chē)輛的類(lèi)型。
3.3 變量分析
以交通事故嚴(yán)重程度作為因變量,其賦值及自變量的劃分標(biāo)準(zhǔn)見(jiàn)表3。
在選定的9個(gè)因素中同時(shí)存在著定性變量和定量變量,這兩類(lèi)變量的賦值不盡相同。
定量變量的賦值或輸入采用實(shí)際的變量值即可。研究的定量變量包括海拔、氧含量、交通量、大車(chē)比例、大小車(chē)的速度差。其中大車(chē)比例是大車(chē)數(shù)量占交通量的比例。
對(duì)于定性變量,需要引入虛擬變量。研究的定性變量包括天氣、事故地點(diǎn)的線形、肇事車(chē)輛的類(lèi)型和事故地點(diǎn)的環(huán)境。
1)天氣。根據(jù)收集到天氣信息,將天氣分為晴天和非晴天,晴天賦值為0,非晴天為1。
2)事故地點(diǎn)的線形。根據(jù)道路全線的線形,事故發(fā)生地點(diǎn)線形分為在直線或平曲線上,事故地點(diǎn)發(fā)生在直線上賦值為0,在平曲線上為1。
3)肇事車(chē)輛的類(lèi)型。交通事故信息中肇事車(chē)車(chē)輛的類(lèi)型較多,筆者只分小型車(chē)和大型車(chē)2類(lèi),小型車(chē)賦值為0,大型車(chē)賦值為1。
4)事故地點(diǎn)的環(huán)境。筆者的研究,除穿越村鎮(zhèn)的路段外,大量存在于山區(qū)、戈壁等無(wú)人區(qū)地帶,所以根據(jù)高原地區(qū)的特殊地理環(huán)境,研究的事故地點(diǎn)環(huán)境分為無(wú)人區(qū)和非無(wú)人區(qū),非無(wú)人區(qū)賦值為0,無(wú)人區(qū)賦值為1。
表3 變量描述
根據(jù)青藏高原交通事故數(shù)據(jù),9個(gè)因素對(duì)交通事故嚴(yán)重程度影響的顯著性是不同的。筆者采用逐步混合選法,選擇顯著性高的因素進(jìn)入模型。取顯著性水平0.05,得到海拔、大車(chē)比例、交通量、肇事車(chē)輛和大小車(chē)的速度差這5個(gè)自變量與交通事故嚴(yán)重程度顯著相關(guān),見(jiàn)表4。
表4 參數(shù)估計(jì)值
由表4可以得到嚴(yán)重事故對(duì)受傷事故和僅財(cái)損事故的對(duì)數(shù)發(fā)生比,以及嚴(yán)重事故和受傷事故對(duì)僅財(cái)損事故的對(duì)數(shù)發(fā)生比。
由于因變量水平為3,可建立兩個(gè)回歸方程,故有兩個(gè)常數(shù)項(xiàng)。而因變量為有序多分類(lèi)Logistic回歸的前提假設(shè)之一是,各自變量對(duì)因變量的影響是在兩個(gè)回歸方程中相同,所以各自變量的偏回歸系數(shù)只有一個(gè)。因此,得到以下模型:
-7.10-1.41x1-2.20×10-4x3-18.23x4+0.11x5+0.89x9
(3)
(4)
式中:P1、P2、P3為發(fā)生嚴(yán)重事故、受傷事故、僅財(cái)損事故的預(yù)測(cè)概率。
可以得到死亡事故和傷亡事故的累積Logistic概率預(yù)測(cè)模型:
P(Y≤1)=
(5)
P(Y≤2)=
(6)
5.1 平行性檢驗(yàn)
有序Logistic回歸分析的前提是必須滿(mǎn)足平行性檢驗(yàn),平行性檢驗(yàn)即檢驗(yàn)各自變量對(duì)于因變量的影響在各個(gè)回歸方程中是否相同。進(jìn)行似然比檢驗(yàn),若被拒絕,說(shuō)明有序Logistic模型是不合適的。
表5是對(duì)模型進(jìn)行平行性檢驗(yàn)的結(jié)果,可知顯著性>0.05,說(shuō)明各回歸方程互相平行,所有Logistic 函數(shù)都成立,累積Logistic回歸模型是合適的。
表5 平行性檢驗(yàn)
注:零假設(shè)規(guī)定位置參數(shù)(斜率系數(shù))在各響應(yīng)類(lèi)別中都是相同的。
5.2 擬合度檢驗(yàn)
表6為對(duì)模型中所有自變量偏回歸系數(shù)是否全為0進(jìn)行似然比檢驗(yàn),結(jié)果顯著性<0.001,說(shuō)明至少有一個(gè)自變量的偏回歸系數(shù)≠0,即包含的海拔高度、大車(chē)比例、交通量、大小車(chē)的速度差、肇事車(chē)輛的類(lèi)型等5個(gè)自變量的模型,其擬合效果好于僅包含常數(shù)項(xiàng)的無(wú)效模型。
表6 擬合度檢驗(yàn)
5.3 準(zhǔn)確度檢驗(yàn)
對(duì)因變量結(jié)果預(yù)測(cè)的準(zhǔn)確度也可以反應(yīng)模型的效果。根據(jù)軟件輸出結(jié)果的預(yù)測(cè)類(lèi)別項(xiàng),輸出結(jié)果計(jì)算得到的準(zhǔn)確率為77.41%,說(shuō)明模型的準(zhǔn)確度較高。
基于青藏高原雙車(chē)道公路實(shí)地調(diào)研數(shù)據(jù),結(jié)合交通事故數(shù)據(jù)和交通流數(shù)據(jù)進(jìn)行了分析,得到以下結(jié)論:
1)以海拔、氧含量、天氣、事故地點(diǎn)的線形、事故地點(diǎn)環(huán)境、肇事車(chē)輛的類(lèi)型、交通量、大車(chē)比例、大小車(chē)的速度差等為自變量,交通事故嚴(yán)重程度為因變量,分析了自變量與因變量之間顯著相關(guān)關(guān)系。研究發(fā)現(xiàn):海拔、大車(chē)比例、交通量、肇事車(chē)輛的類(lèi)型和大小車(chē)的速度差這5個(gè)自變量與交通事故嚴(yán)重程度顯著相關(guān)。
2)以交通事故嚴(yán)重程度為因變量,海拔、大車(chē)比例、交通量、肇事車(chē)輛和大小車(chē)的速度差這5個(gè)為自變量,采用累積Logistic回歸模型建立交通事故嚴(yán)重程度的預(yù)測(cè)模型。通過(guò)對(duì)模型驗(yàn)證,其準(zhǔn)確性和擬合度的檢驗(yàn)效果都比較高。
[1] 公安部交通管理局.中華人民共和國(guó)道路交通事故統(tǒng)計(jì)年報(bào)(2013年度)[R].無(wú)錫:公安部交通管理科學(xué)研究所,2014:139. Traffic Management Bureau of Ministry of Public Security.ChineseAnnualReportonRoadTrafficAccidentStatistics: 2013 [R]. Wuxi: Traffic Management Research Institute of the Ministry of Public Security, 2014: 139.
[2] 王謙,俞祥海,胡湘林,等.1894例青藏高原道路交通傷分析[J].中華創(chuàng)傷雜志,2004,20(3):136-138. WANG Qian, YU Xianghai, HU Xianglin, et al. Analysis on 1894 cases of road traffic injuries in the Qinghai-Tibet plateau [J].ChineseJournalofTrauma, 2004, 20(3):136-138.
[3] KIM K, NITZ L, RICHARDSON J, et al. Analyzing the relationship between crash types and injuries in motor vehicle collisions in Hawaii [J/OL].TransportationResearchRecord,1994,1467:9-13[2016-07-21]. http://onlinepubs.trb.org/Onlinepubs/trr/1994/1467/1467-002.pdf.
[4] MERCIER C R, SHELLEY L M C, ADKINS G H, et al. Age and gender as predictors of injury severity in head-on highway vehicular collisions[J/OL].TransportationResearchRecordJournaloftheTransportationResearchBoard, 1997, 1581 (1): 37-46 [2016-07- 21].http://trrjournalonline.trb.org/doi/pdf/10.3141/1693-09.
[5] YAU K K W, LO H P, FUNG S H. Multiple-vehicle traffic accidents in Hong Kong [J/OL].AccidentAnalysis&Prevention, 2006, 38 (6): 1157 -1161[2016-07-21].http://ac.els-cdn.com/S0001457506000807/1-s2.0-S0001457506000807-main.pdf?_tid=1a163c4a-57c2-11e7-bceb-00000aacb361&acdnat=1498187863_4e467bc07603b17e4bd21ffad7473a56.
[6] 馬壯林,邵春福,李霞.基于Logistic模型的公路隧道交通事故嚴(yán)重程度的影響因素[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版), 2010, 40(2): 423- 426. MA Zhuanglin, SHAO Chunfu, LI Xia. Analysis of factors affecting accident severity in highway tunnels based on Logistic model [J].JournalofJilinUniversity:EngineeringandTechnologyEdition, 2010, 40 (2): 423-426.
[7] 王濟(jì)川,郭志剛.Logistic 回歸模型——方法與應(yīng)用[M].北京:高等教育出版社,2001:237-239. WANG Jichuan, GUO Zhigang.LogisticRegressionModel:MethodsandApplications[M].Beijing:Higher Education Press,2001: 237-239.
(責(zé)任編輯:田文玉)
Establishment of Accident Severity Prediction Model of Two-Lane Highway on Qinghai-Tibet Plateau
SUN Xiaoduan, HOU Yangyang, HE Yulong, FENG Bingbing
(Beijing Key Laboratory of Traffic Engineering, Beijing University of Technology, Beijing 100124, P. R. China)
Based on the analysis of traffic accident data of Qinghai-Tibetan plateau, it is found that most of the traffic accidents are of high casualties, which means the proportion of accidents with deaths and injuries is relatively larger. The cumulative Logistic regression was used to research the factors which affected the severity of traffic accidents in plateau area. The collected accident severity was selected as the dependent variable. The altitude of the environment, the oxygen content, the weather, the linear and environment of the accident site, the type of the vehicle, the traffic volume, carts ratio, the speed difference between cart and car were selected as independent variables. Therefore, the cumulative Logistic regression model was established. The results show that five independent variables including altitude, carts ratio, the vehicle type and the speed difference between the cart and the car are significantly correlated with the severity of accident. This prediction model can provide theoretical basis for the related highway management departments to make safety measures.
traffic engineering; cumulative Logistic model; Qinghai-Tibet plateau; accident severity prediction
10.3969/j.issn.1674-0696.2017.07.18
2016-08-27;
2017-03-30
國(guó)家科技支撐計(jì)劃課題(2014BAG05B02)
孫小端(1956—),女,美籍華人,教授,博士生導(dǎo)師,主要從事交通安全方面的研究。E-mail:bjut2003@gmail.com。
U491.31
A
1674-0696(2017)07-106-05