孟祥海,張道玉,吳佩潔
(哈爾濱工業(yè)大學交通科學與工程學院,哈爾濱150090)
事故次數(shù)法是最原始、最簡單的基于交通事故數(shù)據(jù)對事故多發(fā)路段進行鑒別的方法,即直接用固定長度內(nèi)一定時間發(fā)生的事故數(shù)來鑒別事故多發(fā)路段.為了更加科學的鑒別事故多發(fā)路段,一些學者運用概率統(tǒng)計學知識,給出了固定長度內(nèi)一定時間段發(fā)生事故的事故率及事故次數(shù)概率分布,用于增強鑒別結果的準確性[1].后來研究發(fā)現(xiàn)交通事故發(fā)生的概率與交通量有著密切的關系,因此又引入交通量給出質(zhì)量控制法來鑒別事故多發(fā)路段.為了衡量交通事故的嚴重程度,文獻[2]引入交通事故經(jīng)濟損失,給出當量財產(chǎn)損失事故法,從而對事故鑒別方法進一步改進.近些年國內(nèi)外學者又引入一些新方法進行事故多發(fā)路段鑒別,如Michal Bíl[3]首先對交通事故進行聚類分析,然后運用核密度法挑出事故嚴重的區(qū)域,最后用蒙特卡洛法進行模擬估計,并進行驗證得出最終鑒別結果;張道玉等[4]通過運用改進貝葉斯網(wǎng)絡對高速公路交通設施進行風險評估進而對事故多發(fā)路段進行識別.
以上基于歷史事故數(shù)據(jù)的事故多發(fā)路段鑒別方法均是基于事故次數(shù)統(tǒng)計進行的,在統(tǒng)計過程中,需將路段劃分為同一長度(將道路按照某一長度分段)或不同的長度(將道路按照路段性質(zhì)劃分).在定長或不定長的劃分方法中,一旦確定路段長度,位置也將固定.用固定的路段對歷史事故進行統(tǒng)計,有時會遺漏事故多發(fā)點(固定長度的路段分界線正好將事故多發(fā)點處的事故數(shù)分隔,導致統(tǒng)計時每個路段的事故數(shù)變少),有時會夸大事故多發(fā)路段(事故數(shù)較為集中,僅占劃分路段的一部分,而判別時會將整個路段識別為事故多發(fā)路段).為彌補這一缺陷,可將用于統(tǒng)計的路段長度設置為可變的長度,并且設置為像窗子一樣可以滑動,即本文將給出的滑動窗口法.為進一步研究滑動窗口法在事故多發(fā)路段鑒別時的效果,本文以京珠高速公路粵北段為例,分析滑動窗口法鑒別事故多發(fā)路段時可能存在的問題,研究滑動窗窗體長度、滑動步長對事故多發(fā)路段鑒別的影響,并運用分位數(shù)法給出最佳窗體長度及滑動步長的取值范圍.
滑動窗口法是時間系列法的一種.1974年B.Rubinger首次提出滑動窗口法的概念,隨后逐漸確立了滑動窗口法的基本步驟,形成了滑動窗口法的雛形[5].隨后滑動窗口法在計算機及相關領域中得到不斷完善.滑動窗口法因其具有簡單易行、可操作性強、實用性強、精確度高等優(yōu)點,在其他領域也得到廣泛運用.Elvik R.等將基于時間系列的滑動窗口法推廣到基于空間的滑動窗口法,并運用于道路交通事故多發(fā)點的鑒別,形成了基于滑動窗口法的道路事故多發(fā)路段鑒別方法[6].滑動窗口法在歐美等國家得到較為廣泛的運用,甚至有的國家還據(jù)此編制成軟件用于事故多發(fā)路段鑒別[7].
滑動窗口法能更好地反映道路沿線上事故點的集疏情況,從而能更準確地確定事故多發(fā)路段的具體地點.在我國應用滑動窗口法來鑒別事故多發(fā)路段將會是一種發(fā)展趨勢.
滑動窗口法鑒別事故多發(fā)路段的步驟如下:
(1)匹配交通事故數(shù)據(jù).將統(tǒng)計期內(nèi)的每起事故按事故發(fā)生地點樁號標注于道路上,形成沿道路縱向的事故點分布圖.
(2)確定滑動窗的窗體長度和事故多發(fā)路段鑒別標準.依據(jù)道路類型,選擇適當?shù)幕瑒哟按绑w長度,一般為0.1~1.0 km,并根據(jù)不同的窗體長度確定相應的事故多發(fā)路段鑒別標準.
(3)確定滑動步長并搜索事故多發(fā)路段.為了不出現(xiàn)遺漏區(qū)域,步長(s)應小于或等于窗體長度(l),即0<s≤l.在已知窗體長度、滑動步長及事故多發(fā)點鑒別標準后,即可沿道路縱向開始搜索事故多發(fā)路段,搜索過程如圖1所示.當某個窗口上的事故數(shù)大于鑒別標準時,該窗口就是初步確定的事故多發(fā)路段.
圖1 滑動窗法示意圖Fig.1 A diagram of sliding window
(4)確定事故多發(fā)路段.滑動時,當?shù)趇個窗口為初步確定的事故多發(fā)路段時,記錄該窗口的起始樁號(i-1)s.繼續(xù)滑動窗口,若第i+1個窗口不是初步確定的事故多發(fā)路段,記錄第i個窗口的終點樁號(i-1)s+l,得到的事故多發(fā)路段范圍為[(i-1)s,(i-1)s+l].若在第i窗口之后的連續(xù)至第j個窗口全部為初步確定的事故多發(fā)路段,記錄下第j個窗口的終點樁號(j-1)s+l,此時確定出的事故多發(fā)路段為[(i-1)s,(j-1)s+l].當連續(xù)多個窗口均為初步確定的事故多發(fā)路段時,事故多發(fā)路段鑒別過程如圖2所示.
圖2 事故多發(fā)段鑒別示意圖Fig.2 A diagram of black spots identification
(5)事故多發(fā)路段鑒別結果匯總.給出每個事故多發(fā)路段起終點樁號、長度、各段發(fā)生的事故總數(shù)、累計事故多發(fā)路段里程等信息.
在運用滑動窗口法鑒別事故多發(fā)路段時,若采用的窗體長度、滑動步長不合理,會出現(xiàn)事故多發(fā)路段遺漏或夸大兩種情況.
遺漏事故多發(fā)路段的示例如圖3(a)所示.假設事故多發(fā)路段鑒別標準為10起事故,取滑動步長等于窗體長度時,在滑動過程中窗口1(事故次數(shù)8起)和窗口2(事故次數(shù)8起)均不是初始的事故多發(fā)路段.但取滑動步長為窗體長度的1/2時,窗口3上的事故數(shù)達到了11起,為事故多發(fā)路段.
夸大事故多發(fā)路段的示例如圖3(b)所示.同上,在滑動窗滑動過程中窗口1(事故次數(shù)12起)與窗口2(事故次數(shù)11起)均是初始的事故多發(fā)路段,此時,確定事故多發(fā)路段是從窗口1起點至窗口2終點所包含的路段.而交通事故主要集中于窗口1和窗口2的交界處,最有可能的事故多發(fā)路段則是窗口3所處的路段,窗口3左右側多余的區(qū)段夸大了事故多發(fā)路段的范圍.
圖3 遺漏及夸大事故多發(fā)路段示例Fig.3 A diagram of the black spots be omitted and be exaggerated
數(shù)據(jù)來源于廣東省交通運輸廳科技項目“基于全社會成本的高速公路設計方案評價技術研究”.數(shù)據(jù)為在京珠高速公路粵北段并行路線(廣樂高速公路)建成之前公安管理部門采集的京珠高速公路2006—2012年發(fā)生的1 170起交通事故.京珠高速公路粵北段全長109 km,設計速度為100 km/h和80 km/h,是1條典型的山嶺區(qū)雙向4車道高速公路.
在2006—2012年,京珠高速公路運行狀態(tài)及運行條件并未發(fā)生突變,因此可將該期間視為同質(zhì)期間.在同質(zhì)期間內(nèi),統(tǒng)計期越長,事故多發(fā)路段與非事故多發(fā)路段的事故數(shù)之差越大,就越能凸顯出事故多發(fā)路段,因此本研究將統(tǒng)計周期定為7年.
運用課題組開發(fā)的“交通事故與公路建設信息管理系統(tǒng)”,將7年間1 170起事故按事故發(fā)生地點匹配到公路路線上,得到了沿公路走向分布的交通事故分布圖,如圖4所示.
圖4 京珠高速公路事故分布圖Fig.4 The distribution of traffic accident in Jingzhu freeway
確定事故多發(fā)路段的鑒別標準,是在一定置信水平及路段長度下確定出事故次數(shù)的臨界值.若某一路段上實際發(fā)生的事故數(shù)大于事故次數(shù)臨界值,該段路就是事故多發(fā)路段.窗體長度越長,事故次數(shù)臨界值就越大.相關研究表明,路段上的事故一般服從泊松分布或負二項分布[8-9],因此,事故多發(fā)路段鑒別標準可按以下方法確定:
當事故次數(shù)服從泊松分布時,不同窗體長度下的事故多發(fā)路段鑒別標準可按式(1)計算確定.
式中:N為事故次數(shù);Nmin為事故多發(fā)路段鑒別標準,即事故次數(shù)臨界值;P(N≥Nmin)是事故次數(shù)大于事故次數(shù)臨界值的概率;λ為平均每公里的事故次數(shù);l為滑動窗窗體長度;a為顯著性水平,事故多發(fā)路段鑒別時取5%.
當事故次數(shù)服從負二項分布時,不同窗體長度下的事故多發(fā)路段鑒別標準可按式(2)計算確定.
式中:k表示負二項分布的參數(shù),即過度離散參數(shù),k>0;Γ(·)為伽瑪函數(shù).
負二項分布為泊松分布的一種,因此本文按泊松分布下的計算公式計算.京珠高速公路粵北段平均每公里的事故次數(shù)為10.7起,即λ=10.7,按照式(1)可得出的不同窗體長度下的事故多發(fā)路段鑒別標準如表1所示.
表1 不同窗體長度下的事故多發(fā)路段鑒別標準Table 1 Different identification standard in different window size
本文用控制變量法分析窗體長度對事故多發(fā)路段鑒別結果的影響,事故多發(fā)路段鑒別結果用累計事故多發(fā)路段長度來表征.在固定滑動步長的基礎上,通過改變窗體長度確定事故多發(fā)路段鑒別標準、鑒別事故多發(fā)路段并分析累計事故多發(fā)路段長度的變化情況.將該方法運用于京珠高速公路粵北段,得到不同窗體長度下事故多發(fā)路段鑒別結果,如圖5所示.
圖5 窗體長度與累計事故多發(fā)路段長度的關系Fig.5 The relationship of window size and cumulative length of black spots
由圖5中關系可知,在固定滑動步長下,隨著窗體長度的增加,累計事故多發(fā)路段長度均呈現(xiàn)逐漸增加的趨勢.以滑動步長100 m為例,當窗體長度由100 m增至1 000 m時,累計事故多發(fā)路段長度由11.8 km增至24.6 km.即選擇的窗體長度越長,鑒別出的事故多發(fā)路段越多,夸大事故多發(fā)路段的可能性也就越大.
同樣運用控制變量法來分析滑動步長對事故多發(fā)路段鑒別結果的影響,結果如圖6和圖7所示.
圖6 1 000 m窗體長度在不同滑動步長下的事故多發(fā)路段鑒別結果Fig.6 The result of black spots in different sliding length and 1 000 m window size
圖7 滑動步長與累計事故多發(fā)路段長度的關系Fig.7 The relationship of window sliding length and cumulative length of black spots
分析滑動步長與累計事故多發(fā)路段長度的關系可知,在各種窗體長度下,隨著滑動步長的增加,累計事故多發(fā)路段長度均呈逐漸減少趨勢.以窗體長度為1 000 m為例(圖6),當滑動步長由100 m增至1 000 m時,累計事故多發(fā)路段長度由27.7 km減少至17.0 km.選擇的滑動步長越長,鑒別出的事故多發(fā)路段越少,遺漏事故多發(fā)路段的可能性也就越大.
窗體長度及滑動步長會明顯地影響鑒別結果:窗體長度越長,夸大事故多發(fā)路段的可能性越大;滑動步長越長,遺漏事故多發(fā)路段的可能性越大.為此,本文應用分位數(shù)法探討最佳窗體長度、滑動步長及其組合問題.分位數(shù)的計算公式為
式中:p為選定的分位數(shù);MP是p分位數(shù)下序列數(shù)的數(shù)值;x(i)為系列數(shù)中第i個數(shù)的數(shù)值,i=1,2,3,…,n;k為序列數(shù)的序號,取為[(n+1)p],此處[]為取整符號;n為序列數(shù)所包含的數(shù)值個數(shù).
本文選取第一四分位數(shù)作為遺漏事故多發(fā)路段的邊界條件;第三四分位數(shù)作為夸大事故多發(fā)路段的邊界條件;n為55(本例中為表3中的55種組合情況).第一四分位數(shù)p為1 4,序列號k=[(55+1)×1/4]=14,此時,M14=x(14)=159×100 m;第三四分位數(shù)p為3 4,序列號k=[(55+1)×3/4]=42,此時,M34=x(42)=215×100 m.因此,根據(jù)分位數(shù)法確定出的最合理的累計事故多發(fā)路段長度范圍為[159,215].由最合理的累計事故多發(fā)路段長度取值范圍,確定出的窗體長度及滑動步長,如表2中的陰影區(qū)域.
表2 最佳窗體長度及滑動步長下的累計事故多發(fā)路段Table 2 The cumulative black spots length in optimum window size and sliding length(100 m)
由表2可知:滑動窗窗體長度可根據(jù)道路線形等條件來取值,但不宜小于300 m,而滑動步長以不小于100 m為宜.進一步探討最佳窗體長度與滑動步長的關系,建立最佳鑒別結果下窗體長度和滑動步長的關系,如圖8所示.可知:滑動步長與窗體長度的比值在0.4~0.8時最佳.
圖8 最佳鑒別結果下窗體長度和滑動步長的關系Fig.8 The relationship of window size and sliding length in optimum result
本文主要結論如下:
(1)在運用滑動窗口法鑒別事故多發(fā)路段時,若采用的滑動窗體長度、滑動步長不合理,會出現(xiàn)事故多發(fā)路段遺漏或夸大.
(2)不同窗體長度下采用的事故多發(fā)路段鑒別標準不同,可根據(jù)滑動窗體長度使用泊松分布或負二項分布確定事故多發(fā)路段鑒別標準.
(3)應用滑動窗口法鑒別事故多發(fā)路段時,選擇的窗體長度越長,夸大事故多發(fā)路段的可能性也越大;選擇的滑動步長越長,遺漏事故多發(fā)路段的可能性也越大.
(4)可用分位數(shù)法確定最佳窗體長度及滑動步長.運用分位數(shù)法可知窗體長度可根據(jù)道路線形來取值,以不小于300 m為宜,滑動步長應不小于100 m,且滑動步長與窗體長度的比值在0.4~0.8時最佳.
對后續(xù)研究工作的展望如下:
(1)事故多發(fā)路段的鑒別還與交通量、道路線形等因素密切相關,在后續(xù)研究工作中可以在滑動窗口法中融入這些因素,以增加事故多發(fā)路段鑒別的可靠性.
(2)本文中滑動窗口法在鑒別事故多發(fā)路段時,僅僅給出了是否為事故多發(fā)路段,在后續(xù)工作中可以對事故多發(fā)路段進行危險等級研究,以達到事故多發(fā)路段的精細化鑒別.