段泓序
摘 要:通過實時采集交通數(shù)據,提取可以反映交通事故的特征,從而自動檢測交通事故加快相關部門采取措施,不但可以緩解由事故帶來的交通擁堵,也可以有效的減少環(huán)境污染和能源浪費。固定檢測器數(shù)據穩(wěn)定、浮動車數(shù)據覆蓋率高,因此,結合兩種數(shù)據研究一種在城市道路上可以快速、及時有效檢測交通事故的方法是非常有必要的。本文首先針對人工播報的事故地點存在自然語言描述與空間地理信息系統(tǒng)描述的不一致性,設計了一種交通事故定位方法。然后在基礎維度、時間維度和空間維度對交通事故進行了屬性分析和提取,針對不同的道路交通運行情況選用不同的屬性集合,建立可以對異常點進行識別的孤立森林模型。最終設計了基于異常值得分的事故檢測算法。
關鍵詞:多源交通數(shù)據;交通事故檢測;孤立森林
中圖分類號:U491 文獻標識碼:A 文章編號:1671-2064(2019)09-0251-03
0 引言
城市道路交通事故不僅關系到人們的生命和財產安全,也關系到城市發(fā)展和社會長治久安,漸漸成為了政府和大眾關注的重點問題,世界各國對于交通事故檢測方法的研究投入了極大的精力。因此,將計算機技術應用在交通領域上,及時快速的檢測出城市道路上發(fā)生的交通事故,輔助相關部門及時啟動救援和交通疏導工作,成為了本文的研究內容。
浮動車數(shù)據覆蓋率高,上傳周期短,但是數(shù)據波動性大,固定檢測器數(shù)據雖然上傳周期沒有浮動車快,但是數(shù)據較穩(wěn)定,而且測得的流量數(shù)據準確[1]。因此本文希望結合浮動車數(shù)據處理得到的路況數(shù)據、車輛行駛軌跡數(shù)據和由固定檢測器采集到的占有率數(shù)據,針對城市快速路研究并實現(xiàn)出一種基于多源交通數(shù)據的交通事故自動檢測方法。
1 相關工作
交通事故檢測的數(shù)據來源一般是各類固定檢測器和移動檢測器,通過對數(shù)據的處理分析,判斷是否發(fā)生事故。異常對象所具有的屬性值會明顯不同于數(shù)據集合的整體期望或其它數(shù)據的屬性值[2]。
常用的異常點檢測方法有基于統(tǒng)計、基于距離、基于密度和基于聚類的異常檢測方法等?;诮y(tǒng)計的異常檢測算法在不同地點和不同時間分布的不一致,導致其使用存在局限性;基于距離和基于密度的異常點識別算法的時間復雜度在大數(shù)據量下較高;基于聚類的方法對于確定類別的個數(shù)和每個類之間數(shù)據量的大小確定比較困難[3]。通過對問題進行分析,本文確定了使用基于孤立森林的檢測模型來實時檢測交通事故。
2 方法
本文使用基于孤立森林模型的異常點檢測方法來檢測交通事故,需要對交通事故進行分析,確定事故檢測需要使用的屬性,通過歷史數(shù)據并結合提取出來的屬性集合,訓練好孤立森林模型并進行檢測,整體研究思路如圖1所示。
2.1 交通事故空間定位方法
首先根據事故文本播報信息中的地點信息對POI(point of interest)信息進行篩選,得到事故地點的中心坐標,對坐標進行地圖匹配,計算該坐標到路鏈的垂直距離,得到固定半徑范圍內的路鏈;對電子地圖內的所有單向行駛的路鏈,計算車流方向,獲取道路等級,組成POI索引表。
對于某一起播報信息,提取事故地點和車流方向;在構建的POI索引表中先查找事故地點,再根據車流方向和道路等級進行篩選,最終獲得匹配路鏈。
2.2 交通事故屬性分析
事故的發(fā)生會導致交通屬性指標產生變化,超過合理的波動范圍,本文從基礎屬性,時間屬性,空間屬性三個維度進行分析。
2.2.1 基礎屬性
當路鏈的歷史路況都是非擁堵狀態(tài)時,一旦發(fā)生交通事故,當前路鏈速度波動超過正常范圍,此時特征為當前路鏈速度vl,t。當路鏈的歷史數(shù)據都是擁堵狀態(tài)時,路鏈速度數(shù)據基本不產生波動,但由于當前路鏈發(fā)生事故,后繼路鏈由于車流量的減少速度呈現(xiàn)上升狀態(tài),所以此時特征為后繼路鏈速度。
在交通流穩(wěn)定的周期內,固定時間通過某條固定路鏈的出租車數(shù)目變化不大,屬性為nl,t。
未發(fā)生事故時,路鏈上下游占有率數(shù)據都保持穩(wěn)定;發(fā)生事故后,路鏈上游因為車輛排隊造成擁堵使占有率變高,路鏈下游因為車流量的減少暢通使得占有率變低。當路況為非擁堵狀態(tài)時,提取屬性路鏈上游占有率和路鏈下游占有率;當路況為擁堵狀態(tài)時,路鏈上游占有率基本不會變化,但是下游占有率會因為車流量的減少而減小,所以只提取屬性。
2.2.2 時間屬性
在事故發(fā)生后,時間上表現(xiàn)為交通事故的持續(xù)時間。
測試選取了2017年6月的交通臺播報的事故數(shù)據共191條。將播報的事故定位到路鏈號,浮動車數(shù)據含有路鏈平均速度的路況數(shù)據,出租車軌跡數(shù)據和占有率數(shù)據。
模型會對每條交通數(shù)據計算異常值得分,圖2是一段道路100條數(shù)據的異常值得分情況,路鏈號以數(shù)字代替。
根據不同的異常值得分閾值判定部分FAR和DR對應關系如表1所示。在兼顧DR和FAR的值時,當異常值得分=0.5時,檢出率為86.3%,誤警率為1.3%。
4 結語
本文的方法不依賴數(shù)據的統(tǒng)計分布形式,且對于擁堵和非擁堵路況使用的屬性不同,最終得到檢測率87.3%,誤警率1.3%,因此可以認為本方法具有顯著的優(yōu)越性與良好的適用性。未來若能考慮多方面因素設計出多道路類型的事故檢測方法,將進一步擴大事故檢測方法的使用范圍,同時可以考慮使用異質的交通數(shù)據,采用更深層次的融合來適應模型。
參考文獻
[1] 呂衛(wèi)鋒,諸彤宇.給中國增一個驕傲——解析基于浮動車的動態(tài)交通信息服務系統(tǒng)[J].中國交通信息產業(yè),2007(08):136-137.
[2] 余柳,于雷,戚懿,等.基于浮動車數(shù)據的城市快速路交通事件檢測算法研究[J].交通運輸系統(tǒng)工程與信息,2008,8(4):36-41.
[3] B.R.Preiss.Data Structures and Algorithms with Object-Oriented Design Patterns in Java[M]. Wiley,1999.