胡郁蔥 韋湖 曾強
(華南理工大學(xué) 土木與交通學(xué)院,廣東 廣州 510640)
隨著我國社會經(jīng)濟的高速發(fā)展,機動車保有量和公路通車里程持續(xù)增長,交通安全問題日益突出。作為道路交通運輸網(wǎng)絡(luò)的主骨架,高速公路具有行車速度快、貨車等大型車比例高等特點,且為相對封閉的系統(tǒng),一旦發(fā)生事故,容易導(dǎo)致嚴重的人員傷亡和巨大的財產(chǎn)損失。據(jù)統(tǒng)計[1],我國高速公路交通事故的致死率約為35%,遠高于其他類型道路。如何降低高速公路事故的嚴重程度,是交通管理部門和安全研究人員面臨的重要課題。為此,有必要深入探究高速公路事故嚴重程度的影響因素及其效應(yīng),為制定經(jīng)濟、有效的安全改善對策奠定基礎(chǔ)。
近年來,國內(nèi)外學(xué)者運用統(tǒng)計回歸模型和機器學(xué)習(xí)方法對高速公路事故嚴重程度進行了大量研究[2-12]。例如,Yu等[2]采用二項隨機參數(shù)Logit模型和支持向量機分析了實時交通參數(shù)(平均速度、速度標(biāo)準差)和天氣指標(biāo)(溫度、能見度、降水量)對美國科羅拉多州I-70 高速公路事故傷亡程度的影響?;诿绹鴳讯砻髦軮-80 高速公路10 年間的交通事故數(shù)據(jù),Haq等[3]采用貝葉斯層級二項Logit模型對各類型卡車事故(卡車單車事故、卡車與小汽車碰撞事故、卡車與SUV或皮卡車碰撞事故、卡車與卡車碰撞事故)的傷亡程度影響因素進行了計量分析研究,并通過貝葉斯二項Logit 模型分析了因爆胎導(dǎo)致的交通事故嚴重程度的影響因素[4]。這些研究均將事故嚴重程度劃分為兩個等級,例如無傷亡和傷亡事故、嚴重和非嚴重事故。當(dāng)劃分的嚴重等級超過兩個時,則通常采用多項Logit/Probit、有序Logit/Probit及其改進模型對事故嚴重程度進行統(tǒng)計回歸分析[5]。王磊等[6]分別采用多項Logit和有序Logit 模型分析了國內(nèi)3 條高速公路上發(fā)生的227 起交通事故的嚴重程度。鑒于事故數(shù)據(jù)中未被觀測的異質(zhì)性,陳昭明等[7]采用混合Logit 模型(又稱多項隨機參數(shù)Logit 模型)分析了黑龍江省3 條高速公路的事故嚴重性,Hou等[8]則采用混合Logit模型對黑龍江省3條高速公路上發(fā)生的單車事故嚴重程度進行了回歸分析?;趶V東省開陽高速公路2014 年的交通事故嚴重性分析,Zeng等[9]構(gòu)建了貝葉斯空間廣義有序Logit模型,在表征事故嚴重等級間的有序關(guān)系的同時,避免了傳統(tǒng)有序Logit模型對觀測因素影響效應(yīng)的限制,并解析了相鄰路段上事故嚴重等級間的空間關(guān)聯(lián);Zhang等[10]則在多項Logit模型的基礎(chǔ)上考慮事故間的空間關(guān)聯(lián),建立了貝葉斯空間多項Logit模型。在機器學(xué)習(xí)方面,Huang等[11]利用滬昆高速公路湖南段的交通事故數(shù)據(jù),采用分類回歸樹識別了事故嚴重程度的重要影響因素及其交互作用;呂璞等[12]則采用深度卷積神經(jīng)網(wǎng)絡(luò)對廣西境內(nèi)的某山區(qū)高速公路嚴重程度進行了預(yù)測。
上述研究雖然分析了人、車、路、環(huán)境和路政救援等因素對高速公路事故嚴重程度的影響,但由于事故等級劃分、分析方法和人文地理環(huán)境等方面的差異,研究結(jié)論并不完全統(tǒng)一。相對于兩類嚴重等級劃分,多類(不少于3類)嚴重等級劃分通常能夠更全面地反映真實的事故傷亡程度,同時也能更深入地揭示各類因素的影響。在分析方法上,統(tǒng)計回歸模型相對機器學(xué)習(xí)方法的應(yīng)用更為普遍。這主要是因為統(tǒng)計回歸模型不僅能夠?qū)κ鹿蕠乐氐燃夁M行預(yù)測,而且能夠清楚地解析其受到觀測因素的影響效應(yīng)及各類數(shù)據(jù)特征。異質(zhì)性和空間關(guān)聯(lián)是事故嚴重程度統(tǒng)計建模時考慮的兩個重要問題[13],其中異質(zhì)性體現(xiàn)了未被觀測但與被觀測因素相關(guān)的因素對事故嚴重程度的影響,空間關(guān)聯(lián)則體現(xiàn)了未被觀測的因素對空間相鄰事故嚴重程度的共同影響??臻g關(guān)聯(lián)是異質(zhì)性的重要來源之一。有研究表明[14],解析事故數(shù)據(jù)中的空間關(guān)聯(lián)將顯著降低甚至消除其異質(zhì)性效應(yīng)。盡管文獻[9-10]中構(gòu)建的貝葉斯空間模型展現(xiàn)了良好的擬合預(yù)測性能,但其考慮的是路段層面的空間關(guān)聯(lián),僅反映了未被觀測的道路因素對相鄰路段上發(fā)生事故的嚴重程度的共同影響。由于劃分的路段長度不一,路段空間關(guān)聯(lián)并不能完全準確地揭示事故間的空間關(guān)聯(lián)程度,且未考慮單個事故的空間影響范圍。
為此,文中采集了廣深沿江高速公路東莞段2014—2019年的交通事故數(shù)據(jù),將事故嚴重程度劃分為3 類(無傷亡事故、輕傷事故和重傷亡事故),考慮事故間的空間相關(guān)性和單個事故的空間影響范圍,建立基于不同距離閾值的貝葉斯空間廣義有序Probit模型,分析涉事車輛、天氣狀況、道路條件、發(fā)生地點和時間、事故類型等因素對事故嚴重程度的影響?;谌舾蓚€空間關(guān)聯(lián)距離閾值,構(gòu)建事故空間關(guān)聯(lián)矩陣,并根據(jù)模型的擬合性能確定事故間的空間影響范圍。最后,根據(jù)模型參數(shù)估計結(jié)果識別事故嚴重程度的顯著影響因素,計算顯著因素的邊際效應(yīng),量化其對不同嚴重等級事故發(fā)生概率的影響,以期為制定降低高速公路事故嚴重程度的改善方案及其經(jīng)濟性評價提供技術(shù)支持。
廣深沿江高速東莞段全長46.257 km,共設(shè)橋梁42.853 km,橋梁長度占路線總長的92.64%,設(shè)計速度為100 km/h,路段采用全封閉、全立交、控制出入的雙向八車道高速公路標(biāo)準。
課題組收集了廣深沿江高速東莞段2014—2019年的事故數(shù)據(jù),剔除含遺漏或異常數(shù)據(jù)的事故數(shù)據(jù)后,剩余的1 490 條事故數(shù)據(jù)用于研究。這些交通事故數(shù)據(jù)包含1 273 起無傷亡事故(占85%)、188 起輕傷事故(占13%)、14 起重傷事故(占1%)和15 起死亡事故(占1%)。由于重傷事故和死亡事故的比例過低,因此將這兩類事故合并為重傷亡事故,據(jù)此將高速公路交通事故嚴重程度分為3 類:無傷亡事故、輕傷事故和重傷亡事故。這些事故按照其地點樁號排序后的嚴重程度分布如圖1所示。
圖1 事故嚴重程度的空間分布Fig.1 Spatial distribution of crash severity
為了衡量相鄰事故間嚴重程度的相似程度,構(gòu)造評價指標(biāo)——平均嚴重程度絕對偏差MA,計算公式如下:
式中,yi為地點樁號從小到大排列的第i起事故的傷亡嚴重程度。經(jīng)計算,這些事故的平均嚴重程度絕對偏差僅為0.29,接近于0,說明相鄰事故間的嚴重程度相似度很高。
除了事故嚴重等級信息外,事故數(shù)據(jù)中還包含事故類型、涉事車輛信息、事故發(fā)生時間、天氣情況、事故發(fā)生地點。參考以往相關(guān)研究[9-10],從道路、車輛、環(huán)境3個維度選取10個因素構(gòu)建事故嚴重程度預(yù)測的解釋變量集。表1給出了各變量的具體含義及描述性統(tǒng)計量。對于包含3 類或3 類以上的分類變量,若其中一類被選為參考項,則其他類別轉(zhuǎn)化為0-1變量[15]。
鑒于事故嚴重程度間的有序關(guān)系以及相鄰事故間的空間相關(guān)性,建立事故嚴重程度分析的空間廣義有序Probit模型,并將其與傳統(tǒng)多項Logit模型和廣義有序Probit 模型進行對比。這些模型的基本結(jié)構(gòu)、貝葉斯估計方法、評價指標(biāo)和邊際效應(yīng)估計方法分別如下。
2.1.1 多項Logit模型
多項Logit 模型基于效用理論擬合自變量與包含多個類別的分類變量間的內(nèi)在關(guān)系。對于任一交通事故i,其嚴重程度的效用函數(shù)為
式中:Xi為事故i對應(yīng)的影響因素觀測值組成的向量;βk為這些因素對應(yīng)事故嚴重程度k的回歸系數(shù)組成的向量(包括常數(shù)項);嚴重程度k的取值1、2、3 分別表示無傷亡、輕傷和重傷亡事故;εi,k為隨機項,并假定相互獨立,且服從Gumbel分布(Ⅰ類廣義極值分布)。
事故i嚴重程度為k的概率為
2.1.2 廣義有序Probit模型
上述事故數(shù)據(jù)中劃分的無傷亡、輕傷和重傷亡事故嚴重等級存在明顯的有序關(guān)系,使得相鄰事故嚴重等級間存在一定的相關(guān)性。廣義有序Probit 模型是解析事故嚴重程度間有序關(guān)系的重要方法之一。對于任一交通事故i,構(gòu)造潛變量zi,以表征事故的潛在傷亡傾向:
式中,β為影響因素集Xi對應(yīng)的回歸系數(shù)向量(包括常數(shù)項),隨機項εi假定服從標(biāo)準正態(tài)分布。
事故i的嚴重等級yi與其潛在傷亡傾向zi的映射關(guān)系為
式中,μi,0和μi,1為定義各事故等級邊界的閾值,且滿足如下關(guān)系:
Zi為μi,1的影響因素集,α為對應(yīng)的回歸系數(shù)向量(包括常數(shù)項)。不失一般性[16],令μi,0=0。
事故i嚴重程度為k(k= 1,2,3)的累積發(fā)生概率為
由此可以計算,事故i嚴重程度為k(k=1,2,3)的概率分別為
2.1.3 空間廣義有序Probit模型
發(fā)生地點相鄰的交通事故可能受到某些未被觀測到的因素的共同影響,從而形成事故嚴重程度間的空間相關(guān)性。參考以往研究[9-10],在潛在傷亡傾向zi的鏈接函數(shù)中加入具有條件自回歸先驗的隨機項?i以解釋事故間的空間關(guān)聯(lián),從而構(gòu)建空間廣義有序Probit模型,即
式中:wi,j為事故i和事故j的空間鄰接權(quán)重,令事故的空間關(guān)聯(lián)距離閾值為ds,若事故j與事故i的距離di,j≤ds,則wi,j= 1,否則wi,j= 0;σ?為空間關(guān)聯(lián)項的方差參數(shù)。
對應(yīng)地,事故i嚴重程度為k(k=1,2,3)的概率的計算公式分別如下:
由于空間廣義有序Probit 模型結(jié)構(gòu)復(fù)雜,因此采用貝葉斯方法對上述模型進行參數(shù)估計。WinBUGS 是進行貝葉斯估計的主流軟件之一,它根據(jù)參數(shù)的先驗分布和整理的數(shù)據(jù)集,采用吉布斯抽樣算法和馬爾科夫鏈蒙特卡洛(Markov Chain Monte Carlo,MCMC)仿真,推斷出參數(shù)的后驗分布[17]。
由于缺少有效的先驗信息,因此將均值為0、方差很大的正態(tài)分布N(0,104)作為模型中所有的回歸系數(shù)(β和α中的元素)的先驗分布,將γ分布γ(0.01,0.01)作為空間精度(方差的倒數(shù))參數(shù)1/σ?的先驗分布。條件自回歸正態(tài)分布由WinBUGS 中的Car.normal函數(shù)來表示。設(shè)定一條鏈進行150 000次MCMC 仿真迭代,并舍棄前100 000 次迭代,根據(jù)WinBUGS 中的Gelman-Rubin 統(tǒng)計量,判斷MCMC仿真的收斂情況。
采用偏差信息準則(Deviance Information Crite?rion,DIC,記為CDI)和各事故嚴重等級及全體數(shù)據(jù)的分類準確度(Classification Accuracy,CA,記為AC)比較各個模型的優(yōu)劣。DIC綜合考慮了模型擬合度和復(fù)雜度[18],其值越小代表模型的整體性能越好;當(dāng)兩個模型的DIC差值超過10時,可判定模型間具有顯著的差異。DIC可以在WinBUGS軟件中直接獲取,其計算公式為
式中:為后驗平均偏差,反映了模型的擬合程度;npD為有效參數(shù)的數(shù)量,體現(xiàn)了模型的復(fù)雜程度。
各事故嚴重等級的分類準確度衡量了模型對各嚴重等級的事故實現(xiàn)準確估計的比例,計算公式如下:
式中,為事故i的模型估計嚴重等級,yi為事故i的實際嚴重等級。
全體數(shù)據(jù)的分類準確度則衡量了模型對所有事故數(shù)據(jù)實現(xiàn)準確估計的比例,計算公式如下:
雖然可以通過各因素對潛在嚴重傾向和閾值的系數(shù)估計量判別該因素是否對事故嚴重程度具有顯著影響,但是并不能直接通過相應(yīng)系數(shù)確定顯著因素對各事故嚴重程度發(fā)生概率的影響。為此,需根據(jù)參數(shù)估計結(jié)果,進一步計算顯著因素的邊際效應(yīng)。
以空間廣義有序Probit 模型為例,連續(xù)變量x對嚴重等級k(k=1,2,3)的邊際效應(yīng)計算公式分別如下:
式中,βx和αx分別為變量x在潛變量zi和閾值μi,1擬合中的系數(shù)。
0-1 變量x對嚴重等級k(k=1,2,3)的邊際效應(yīng)計算公式如下:
為了探索事故間的空間影響范圍,令其關(guān)聯(lián)距離閾值分別為200、250 和300 m。根據(jù)前述貝葉斯方法獲得的廣義有序Probit 模型及各空間廣義有序Probit 模型的評價指標(biāo)結(jié)果及空間方差參數(shù)的估計量如表2所示。
由表2可知,基于各關(guān)聯(lián)距離閾值的空間廣義有序Probit模型的Dˉ值均明顯小于多項Logit模型和廣義有序Probit 模型,說明解釋事故間的空間關(guān)聯(lián)能夠顯著提高事故嚴重性分析模型的擬合性能[9-10]。盡管npD值表明空間廣義有序Probit 模型更加復(fù)雜,但其更小的CDI值(與多項Logit模型和廣義有序Pro?bit 模型的差值均超過了130)反映了空間模型更佳的綜合性能。分類準確性結(jié)果進一步證實了空間廣義有序Probit 模型的優(yōu)越性。具體而言,除了在無傷亡事故等級上達到了100%的分類準確度外,空間廣義有序Probit 模型在其他事故嚴重等級和全體事故上也都具有更高的分類準確度。尤其是針對重傷亡事故,多項Logit模型和廣義有序Probit模型的分類準確度均為零,而空間廣義有序Probit 模型最高達到了55.17%。重傷亡事故因造成了嚴重的人員傷亡,一直是社會大眾和交通安全部門關(guān)注的重點,準確地估計和預(yù)測該類事故的發(fā)生概率對高速公路交通安全狀況的改善具有重要的實踐價值。此外,3 個空間模型中的空間方差參數(shù)估計量均明顯大于0,充分說明了事故間高強度的空間關(guān)聯(lián)性,進一步體現(xiàn)了空間廣義有序Probit模型的合理性。
表2 模型結(jié)果對比Table 2 Comparison of model results
對比各空間廣義有序Probit 模型可以發(fā)現(xiàn):基于250 m 關(guān)聯(lián)距離閾值的空間廣義Probit 模型的CDI值最?。ㄅc其他空間模型的差值均超過了200),且分類準確度(尤其是對輕傷和重傷亡事故)最高,這些指標(biāo)均體現(xiàn)了該模型的優(yōu)異性能。而且,該模型中的空間方差參數(shù)估計量最大,說明以250 m 作為關(guān)聯(lián)距離閾值能夠最大程度地挖掘相鄰事故間的空間相關(guān)性,用以解釋未被觀測到的因素對相鄰事故嚴重程度的共同影響。綜合以上結(jié)果,可以認為250 m是最佳的事故空間關(guān)聯(lián)距離閾值。
由3.1 節(jié)可知,基于250 m 關(guān)聯(lián)距離閾值的空間廣義有序Probit 模型綜合性能最佳,因此根據(jù)該模型的參數(shù)估計結(jié)果識別對事故嚴重程度具有顯著影響的因素(如表3所示),并以此估計其邊際效應(yīng)(如表4所示),量化顯著因素對各事故嚴重程度發(fā)生概率的影響。
由表3 可知,單車事故、本省車、客車、貨車、周末和曲率6個變量對潛在傷亡傾向具有顯著影響,其他類型車輛和夏天這2個變量對輕傷與重傷亡間的閾值具有顯著影響,而橋梁則對兩者有顯著影響。表3 中的9 個變量都是高速公路交通事故嚴重程度的顯著影響因素。
表3 基于250 m關(guān)聯(lián)距離閾值的空間廣義Probit模型的參數(shù)估計結(jié)果1)Table 3 Results of parameter estimation in the spatial generalized ordered Probit model with 250 m correlation distance threshold
由表4可知,單車事故比多車事故的嚴重程度低。具體而言,相對于多車事故,單車事故造成無傷亡的概率高7.58%,造成人員輕傷的概率低5.94%,造成人員重傷或死亡的概率低1.64%。這可能是因為多車事故涉及的人員和車輛更多,在事故發(fā)生時,駕駛員為了降低本車人員傷亡而采取的避險措施有可能對其他車輛的駕駛員和乘客造成更大的傷害;而單車事故涉及的人員和車輛較少,在事故發(fā)生時,駕駛員能夠相對從容地采取有效措施來降低人員傷亡程度[9]。
表4 顯著影響因素的邊際效用Table 4 Marginal effects of significant influential factors
相對于涉及外省車的交通事故,僅涉及本省車的交通事故導(dǎo)致無傷亡的概率高4.56%,導(dǎo)致人員輕傷的概率低3.54%,導(dǎo)致重傷或死亡的概率低1.02%。這可能是因為本省車駕駛員對道路交通環(huán)境更加熟悉,能夠更快地感知道路上的行車危險源,并及時做出反應(yīng),從而降低了事故傷亡程度[19]。
在車輛類型方面,相對于小汽車間的交通事故,涉及客車、貨車和其他類型車輛(例如,拖掛車、油罐車等)的交通事故都更容易導(dǎo)致人員傷亡,重傷亡的概率分別提高3.27%、1.53%和4.11%。根據(jù)文獻[9,20]的研究結(jié)論,客車、貨車和其他類型車輛相比于小汽車的體積和質(zhì)量都更大,在事故發(fā)生時,會對其他車輛和人員造成更嚴重的傷害。
相對于工作日,周末發(fā)生的交通事故造成無傷亡的概率高4.18%,造成人員輕傷的概率低3.31%,造成人員重傷或死亡的概率低0.87%。Christoforou 等[21]也有類似的研究發(fā)現(xiàn)。對于本研究,這可能是因為周末往返廣州、深圳及沿線的東莞等城市進行休閑娛樂、探親訪友的人員及車輛眾多,車流量比工作日更大,車速相對較低,使得事故發(fā)生時的車輛間(或車輛與固定物體間)碰撞較輕,傷亡程度較低。
相比于春季,夏季發(fā)生的交通事故導(dǎo)致重傷或死亡的概率高2.38%。廣深沿江高速公路位于北回歸線以南并靠近南海,夏季頻降暴雨且多伴隨強風(fēng)甚至臺風(fēng),這些惡劣天氣會顯著惡化高速公路的安全行車環(huán)境。
道路平面曲率每增加1 km-1,無傷亡事故的概率增加6.99%,輕傷事故和重傷亡事故的概率分別降低5.45%和1.54%。道路曲率越大,曲線半徑就越小,車輛通過該路段時的速度相對也就越低;而且,曲線段的設(shè)置將緩解因道路線形的單調(diào)性導(dǎo)致的駕駛疲勞,從而減少因駕駛員反應(yīng)不及時導(dǎo)致的重大傷亡事故。
相比于非橋梁路段,橋梁上發(fā)生的交通事故導(dǎo)致人員輕傷的概率增加8.85%,重傷亡的概率降低0.08%。橋梁占廣深沿江高速公路東莞段90%以上的路段長度,它能夠有效減少高低起伏的地形地勢條件對道路線形的不利影響,保持線路的整體平順性,在保障高速公路交通運輸效率的同時,提高其安全性水平,從而顯著降低重傷亡事故發(fā)生的概率。
基于事故間的空間關(guān)聯(lián),文中建立了貝葉斯空間廣義有序Probit模型,分析了車輛類型與歸屬地、天氣狀況、發(fā)生時間和季節(jié)、道路曲率與坡度、事故類型等因素對高速公路事故嚴重程度的影響。DIC 和分類準確度等指標(biāo)結(jié)果表明,空間廣義有序Probit 模型優(yōu)于多項Logit 模型和廣義有序Probit 模型,且250 m 為最佳的空間關(guān)聯(lián)距離閾值。研究發(fā)現(xiàn):涉及客車、貨車和其他類型車輛以及夏天發(fā)生的交通事故的嚴重程度相對較高;本省車、周末和曲率高的路段上發(fā)生的交通事故的嚴重程度相對較低,單車事故比多車事故的嚴重程度低。
本研究的不足之處在于:分析的高速公路范圍較窄,采集的交通事故數(shù)據(jù)相對有限,且未能獲取肇事駕駛?cè)说南嚓P(guān)屬性;模型分析結(jié)果的可移植性仍有待檢驗。后續(xù)研究中,將對此進行改進,進一步提高模型的準確性。