黃合來,鄧 雪,許鵬鵬
(1.中南大學 交通運輸工程學院,湖南 長沙410075;2.西南交通大學 交通運輸與物流學院,四川 成都610031)
傳統(tǒng)交通安全實踐局限于“打補丁式”的微觀工程措施,缺乏在交通系統(tǒng)規(guī)劃過程中的前瞻性考慮.通過在規(guī)劃階段對交通安全問題作前瞻性的分析來提高路網(wǎng)的安全水平非常重要.當前,新一代的交通規(guī)劃方法,即“交通安全規(guī)劃”,在發(fā)達國家尤其是美國成為一個重要研究熱點[1].交通規(guī)劃層面的影響因素與交通安全水平的關聯(lián)方法,即區(qū)域安全預測模型,是“交通安全規(guī)劃”理論的核心技術之一.
國外已經(jīng)做了大量定量研究[2-6]來分析不同規(guī)劃層面的影響因素與交通安全水平的關系,交通分析小區(qū)(traffic analysis zone,TAZ)是主要的空間分析單元.已有研究主要從區(qū)域人口經(jīng)濟特征[3]、土地利用特征[4]、區(qū)域 交通特征[5]和區(qū)域路 網(wǎng) 特 征[5-6]等方面進行分析.就統(tǒng)計方法而言,主要應用廣義線性模型對TAZ事故頻數(shù)與相關變量的關系進行建模[4],假設TAZ的事故分布在空間上不相關.然而,安全數(shù)據(jù)具有復雜的空間分布特征,對空間特征的忽視將大大影響安全水平估計的準確性和魯棒性.為了克服廣義線性模型的局限性,空間統(tǒng)計方法[6]逐漸成為安全分析領域的一個前沿研究方向.
在國內(nèi),文獻[7]建議結合我國交通規(guī)劃的工作流程考慮交通安全,文獻[8]探討了城市總體規(guī)劃和土地規(guī)劃中影響因素的安全效應.而從區(qū)域宏觀層面反映路網(wǎng)特征、交通特征與交通安全之間關系的定量研究在我國幾乎沒有展開.
本文基于美國佛羅里達州Hillsborough縣的數(shù)據(jù)進行區(qū)域安全建模研究.基于安全同質性原則,將該縣重新劃分為不同數(shù)量規(guī)模的交通安全分析小區(qū)(traffic safety analysis zone,TSAZ),提取小區(qū)層面數(shù)據(jù),引入空間條件自回歸先驗信息建立貝葉斯空間模型,分析區(qū)域安全影響因素;評價不同分區(qū)規(guī)模對安全因素效應的影響,為交通安全規(guī)劃提供技術支撐和理論依據(jù).
區(qū)劃問題是交通規(guī)劃中一個最為基礎的問題,傳統(tǒng)交通分析小區(qū)的劃分鮮有考慮安全相關因素,而現(xiàn)存大部分區(qū)域安全研究均以交通分析小區(qū)為基本單元.TSAZ 的劃分在兼顧交通規(guī)劃層面因素的前提下,考慮事故特征的區(qū)域同質性.本文基于Full-order-CLK 算法[9],按照嚴重事故、道路長度和總出行生成的聚集程度(權重分別為0.50,0.25,0.25)獲得Hillsborough 縣的多種分區(qū)方案,并基于200,500和700個TSAZ分區(qū)方案建立事故預測模型,分區(qū)方案如圖1所示.
采用佛羅里達州Hillsborough縣所有州立道路3年的數(shù)據(jù)(2005—2007年),包括事故數(shù)據(jù)、道路特征數(shù)據(jù)、出行數(shù)據(jù)以及空間分布特征數(shù)據(jù).
事故數(shù)據(jù)從佛羅里達州運輸部事故分析報告系統(tǒng)中獲得,其提供的最重要的信息是事故發(fā)生的小區(qū)歸屬以及傷害嚴重性等級.對于事故傷害的嚴重程度,分為5個等級:1為沒有受傷,2為輕傷,3為非致殘傷害,4為致殘傷害,5為交通死亡.
相關路網(wǎng)特征數(shù)據(jù)和出行數(shù)據(jù)主要來源于佛羅里達州運輸部.基于GIS地圖小區(qū)劃分邊界對數(shù)據(jù)進行集計處理,獲得小區(qū)層面的變量.
(1)路段總長度:每個TSAZ內(nèi)道路中心線總里程數(shù).
(2)分類的路段長度:每個TSAZ內(nèi)路段中心線公里數(shù)按速度限制分類,①限速24km(15英里)的路段長度;②限速40km(25英里)的路段長度;③限速56km(35 英里)的路段長度;④限速105km(65英里)的路段長度.其中,限速40km 和56km的路段是主要類型,分別占路段總長度的76.86%和13.01%.為避免變量冗余問題,將所有分類歸為限速低于56km 的路段長度和限速大于或等于56km的路段長度2類.
(3)交叉口數(shù)量:每個TSAZ的交叉口總數(shù).
(4)總出行發(fā)生量:每個TSAZ 總的出行發(fā)生量.
(5)總出行吸引量:每個TSAZ 總的出行吸引量.
(6)基于TSAZ的出行發(fā)生量和吸引量,包括從家去工作,從家去上學,從家去購物,從家去社交活動,從家去其他,非從家去工作,非從家去其他的出行發(fā)生量和吸引量;輕型/重型卡車,出租車,飛機的出行發(fā)生量和吸引量;其他TSAZ到目標TSAZ 的出行發(fā)生量和吸引量.
使用ArcGIS軟件自動生成相鄰小區(qū)的空間鄰接矩陣.
定義嚴重性等級為4(致殘傷害)和5(交通死亡)的事故為嚴重事故,其余為非嚴重事故.分別調(diào)查與各TSAZ有關的總事故和嚴重事故,作為預測模型的響應變量.
在因素較多且因素間存在廣泛多重共線性的情況下,模型解釋變量的篩選具有一定的挑戰(zhàn)性.模型的數(shù)據(jù)擬合度和簡約程度是兩個重要的變量選擇標準.通過數(shù)據(jù)探索性分析和對變量的逐一篩選,選定3類重要的安全影響因素,包括路段長度、交叉口數(shù)量和出行量.路段長度是反映交通基礎設施規(guī)模的重要指標之一;交叉口是交通事故多發(fā)點,在控制了路段長度的前提下,采用交叉口密度(小區(qū)內(nèi)交叉口總數(shù)/小區(qū)道路總長度)反映交通狀況的復雜程度.此外,出行量是交通事故發(fā)生的直接機會變量,也是傳統(tǒng)交通規(guī)劃的重要數(shù)據(jù)來源.本研究選用總出行發(fā)生量和吸引量作為重要解釋變量,同時,由于家庭和工作出行數(shù)據(jù)是一個重要的出行類型,也在模型中重點考慮.
為了避免總出行量和工作出行量的強相關問題,將其分別加入模型,即同一種分區(qū)、同一種響應變量下,建立兩個事故預測模型,每個模型包含5個解釋變量.具體模型變量如表1所示.
2.1.1 泊松模型
由于泊松模型能夠契合道路交通事故的零散性、隨機性以及事故頻次為非負整數(shù)的特點,被廣泛應用于事故預測中.假定在2005—2007年3年中各分析小區(qū)內(nèi)事故頻次Yi服從泊松分布,則第i個小區(qū)發(fā)生k次事故的概率為
式中:λ為泊松分布的強度參數(shù),反映該小區(qū)內(nèi)某時段平均發(fā)生事故頻次.
將λ進行對數(shù)處理,建立與解釋變量的線性關系,作為模型的連接函數(shù),即
式中:β0 和β為待估系數(shù);Xi為解釋變量的向量.
2.1.2 泊松-對數(shù)正態(tài)模型
泊松模型假定事故均值與方差相等.然而,事故數(shù)據(jù)往往具有過度離散性,其方差顯著大于均值[3].泊松-伽馬模型與泊松-對數(shù)正態(tài)模型通過引入模型殘差隨機項,容許事故過度離散特征的存在,成為兩個主流的事故預測模型的基本結構,本文采用泊松-對數(shù)正態(tài)模型進行研究.在泊松-對數(shù)正態(tài)模型中,假定第i個小區(qū)的事故頻次Yi服從泊松分布
泊松-對數(shù)正態(tài)回歸模型在基本泊松模型的連接函數(shù)中加入一個反映數(shù)據(jù)過度離散特征的殘差項θi,并假定其服從均值為零的正態(tài)分布,即
式中:τθ為精度參數(shù),等于方差的倒數(shù).
2.1.3 貝葉斯空間模型
空間相關廣泛地存在于相鄰的空間小區(qū)中,對影響事故頻次因素的估計效果的精確度有顯著影響.貝葉斯空間模型能有效地擬合空間相關特征[3].本研究在泊松-對數(shù)正態(tài)模型的基礎上,引入條件自回歸模型[10]反映相鄰小區(qū)間可能的空間關聯(lián).假設Yi是第i個TSAZ的3年平均事故率,模型如下:
在貝葉斯模型估計中,為β和θi設定無信息先驗分布φi滿足條件自回歸模型的先驗分布
本研究采用貝斯特等人建立的先驗分布形式以保證模型收斂[3].
式中:τθ和τc分別表示由空間效應和隨機效應導致的過度離散特征,其比值α能反映數(shù)據(jù)過度離散特征的結構,可由下式估計:
式中:s為標準差.
采用貝葉斯偏差信息準則 (deviance information criterion,DIC)對待選模型進行科學評價.DIC準則綜合考慮模型擬合優(yōu)度和模型復雜性,其計算方法如下[11]:
一般地,DIC 越小,模型越優(yōu).DIC 差值大于5則表明模型之間具有顯著的差異.
采用WinBUGS軟件[12]對模型進行參數(shù)估計.使用3條鏈進行迭代,通過查看歷史記錄檢查其收斂情況.確保所有參數(shù)收斂以后,舍去前1 000次迭代結果.為減少自相關性,在剩下的樣本中每10 個中抽取1個,從1 001次開始進行10 000次迭代.
如圖2所示,以200個TSAZ為例,說明佛羅里達州Hillsborough縣2005—2007年事故頻次地理分布特點.該縣共發(fā)生57 694起事故,最低為東北部第112個TSAZ的7起,最高為東部第161個TSAZ的3 256起,事故頻率標準差為369.47,變化范圍較大;共發(fā)生4 854起嚴重事故,在TSAZ內(nèi)變化范圍從0~148起,標準差為23.14,其中第190個TSAZ嚴重事故頻次最大,第15個TSAZ內(nèi)的嚴重事故數(shù)為0.西北部地區(qū)事故相對集中,而東南部地區(qū)事故相對較少.以往研究表明,事故的空間分布與區(qū)域人口經(jīng)濟特征[3]、土地使用功能[4]等因素密切相關.西北部海岸地區(qū)經(jīng)濟發(fā)展水平高,人口相對密集,事故頻次較高;而東南部地區(qū)的事故頻次較低.
圖2 佛羅里達州Hillsborough縣2005—2007年事故地理分布圖(以200個TSAZ為例)Fig.2 Crash distribution maps of Hillsborough County,F(xiàn)lorida from 2005to 2007(200TSAZ as an example)
3.2.1 DIC評價
如表2所示,泊松-對數(shù)正態(tài)模型和貝葉斯空間模型的pD值大于泊松模型而DIC 值遠小于泊松模型,說明前兩者模型結構較為復雜,且擬合效果大大優(yōu)于泊松模型;泊松-對數(shù)正態(tài)模型與貝葉斯空間模型相比,兩者的DIC值較為接近,僅從DIC值無法得出最優(yōu)模型.從表3和表4可知,隨著分區(qū)數(shù)目增多,空間因素比例α逐漸增大且統(tǒng)計顯著,說明貝葉斯空間模型能夠更好地擬合安全水平空間相關性特征.
表2 基于DIC值的模型評價Tab.2 Model evaluation on the basis of DIC
表3 總事故模型參數(shù)估計Tab.3 Estimation for total crash models
表4 嚴重事故模型參數(shù)估計Tab.4 Estimation for severe crash models
從表2還可以看出,同一種模型,隨著分區(qū)數(shù)目增多,DIC值顯著增大,模型擬合度降低,說明本文所采用的宏觀區(qū)域交通指標變量在區(qū)域面積較大時對事故率的預測更為準確.
3.2.2 變量分析
對于總事故,無論分區(qū)數(shù)目多少,泊松模型中的解釋變量全部顯著.而貝葉斯空間模型的顯著性解釋變量數(shù)目較少,當TSAZ的數(shù)目為200時,顯著性解釋變量只有2個(限速低于56km 的路段和限速大于等于56km 的路段長度);當TSAZ的數(shù)目分別為500和700時,貝葉斯空間模型的顯著性解釋變量增多且趨于穩(wěn)定,除限速低于56km 的路段長度和總的出行吸引量外,其余變量全都顯著.
對于嚴重事故,泊松模型的顯著性解釋變量數(shù)目最多.在貝葉斯空間模型中,當TSAZ數(shù)目為200時,顯著性解釋變量僅有1個(限速大于等于56km的路段長度);當TSAZ 數(shù)目為500時,顯著性解釋變量有2個(限速大于等于56km 的路段長度和交叉口密度);當TSAZ 數(shù)目為700時,顯著性解釋變量增多且趨于穩(wěn)定,除限速低于56km 的路段長度和總的出行吸引量外,其余變量全都顯著.
交叉口:在大多數(shù)模型中,交叉口密度都是顯著正相關,尤其是當分區(qū)數(shù)目足夠多時.模型穩(wěn)定后,給定路段長度、出行數(shù)據(jù),交叉口數(shù)目越多,事故發(fā)生的頻次越高.
路段長度:限速低于56km 的路段長度在貝葉斯空間模型中幾乎都不顯著,而其在泊松模型和泊松-對數(shù)正態(tài)模型中幾乎都是顯著負相關;限速大于等于56km 的路段長度在所有模型中都是顯著正相關,且在同一模型中其系數(shù)最大,說明高速路段長度是預測道路安全水平的主要指標.
出行數(shù)據(jù):總出行吸引量在泊松-對數(shù)正態(tài)模型和貝葉斯空間模型中都不顯著;同一模型中,總出行發(fā)生量的系數(shù)總是大于總出行吸引量的系數(shù),說明出行發(fā)生量對事故發(fā)生的預測能力更強;同一模型中,從家里去工作的出行發(fā)生量的系數(shù)總是大于非從家里去工作的出行發(fā)生量的系數(shù),說明以家為基準的工作出行量有更好的事故預測能力;大多數(shù)出行數(shù)據(jù)的系數(shù)都為正,說明出行量與事故發(fā)生成正比例關系.
最后,從空間因素比例α 的估計參數(shù)來看,隨著分區(qū)數(shù)目增加,空間因素比例α增加.當分區(qū)數(shù)目足夠多時,有必要考慮相鄰區(qū)域的空間相關性,而文中提出的貝葉斯空間模型能較好擬合空間相關性;同時,在貝葉斯空間模型中,隨著分區(qū)數(shù)目增多,顯著變量數(shù)目也增多.然而,如前所述,在使用宏觀區(qū)域交通指標變量預測安全水平時,在區(qū)域較大的情況下數(shù)據(jù)擬合程度降低.因此,實際中分區(qū)規(guī)模要適中,以平衡擬合度和變量顯著性,既達到統(tǒng)計上的要求又保證工程應用的可行性.
(1)對比傳統(tǒng)的泊松模型和泊松-對數(shù)正態(tài)模型,貝葉斯空間模型具有更高的數(shù)據(jù)擬合度.
(2)分區(qū)數(shù)目越多,空間因素在隨機因素中的比例越高.
(3)同一分區(qū)下,路網(wǎng)特征變量(交叉口密度、限速低于56km 的路段長度和限速大于等于56km 的路段長度)的安全效應具有魯棒性.
(4)限速大于等于56km 的路段長度是預測安全水平的主要指標.
本文就交通安全規(guī)劃的核心技術問題——區(qū)域安全建模進行了研究,基于美國佛羅里達州Hillsborough縣的數(shù)據(jù),在TSAZ 層面針對事故均值提出了能夠有效擬合事故空間相對特征的區(qū)域安全建模研究提供技術基礎.
[1] Washington S P,Schalkwyk V I,Mitra S,et al.Incorporating safety into long-range transportation planning[R].Washington D C:Transportation Research Board,2006.
[2] Huang H,Abdel-Aty M.Multilevel data and Bayesian analysis in traffic safety[J].Accident Analysis and Prevention,2010,42(6):1556.
[3] Huang H,Abdel-Aty M,Darwiche A L.County-level crash risk analysis in Florida: Bayesian spatial modeling [J].Transportation Research Record,2010,2148,27.
[4] Guevara F L D,Washington S P,Oh J.Forecasting crashes at the planning level:simultaneous negative binomial crash model applied in Tucson,Arizona [J].Transportation Research Record,2004,1897:191.
[5] Haynes R,Jones A,Kennedy V,et al.District variations in road curvature in England and Wales and their association with roadtraffic crash[J].Environment and Planning:A,2007,39(5):1222.
[6] Hadayeghi A,Shalaby A,Persaud B.Development of planninglevel transportation safety models using full Bayesian semi parametric additive technique [J].Journal of Transportation Safety and Security,2010,2(1):45.
[7] 繆玉玲,陳小桐,李峰,等.引入交通安全對交通規(guī)劃的新思考[C]//第二屆全國公路科技創(chuàng)新高層論壇論文集.北京:當代中國出版社,2004:58-63.MIAO Yuling,CHEN Xiaotong,LI Feng,et al.The new thinking of introducing traffic safety on transportation planning[C]//Papers of the Second National Highway Science and Technology Innovation Forum.Beijing:Contemporary China Publishing House,2004:58-63.
[8] 唐玨琳.城市規(guī)劃中的交通安全因素分析[J].公路與汽運,2007(4):47.TANG Juelin.Factor analysis of traffic safety in urban planning[J].Highways and Automotive Applications,2007(4):47.
[9] Guo D. Regionalization with dynamically constrained agglomerative clustering and partitioning (REDCAP) [J].International Journal of Geographical Information Science,2008,22(7):801.
[10] Besag J.Spatial interaction and the statistical analysis of lattice systems[J].Journal of Royal Statistical Society Series B,1974,36(2):192.
[11] Spiegelhalter D,Best N,Carlin B P,et al.Bayesian measures of model complexity and fit[J].Journal of Royal Statistical Society B,2002,64(4):583.
[12] Spiegelhalter D J,Thomas A,Best N G,et al.WinBUGS version 1.4.1 user manual[M].Cambridge:MRC Biostatistics Unit,2003.