陳岳峰
(福建省高速公路集團有限公司,福州 350001)
近10 年來, 我國道路交通事故起數(shù)與死亡人數(shù)、萬車死亡率等指標整體呈現(xiàn)下降趨勢,但當前事故仍頻發(fā),國民生命財產(chǎn)安全需要保障。 全面建成小康社會中一項社會指標是非正常死亡率, 而交通事故死亡占我國非正常死亡人數(shù)中較大的一部分,有效、持續(xù)降低交通事故死亡人數(shù),對于我國社會經(jīng)濟全面發(fā)展具有突出意義。
交通事故的超強隨機性和復(fù)雜誘因, 涉及到道路設(shè)施、交通運行、天氣環(huán)境、交通行為等方方面面,導(dǎo)致安全風(fēng)險是最難以預(yù)測的現(xiàn)象之一,同時,交通事故是典型的觀測科學(xué),大數(shù)據(jù)平臺是突破安保關(guān)鍵技術(shù)的關(guān)鍵。風(fēng)險防控的關(guān)鍵在于實現(xiàn)“先知、先覺、先控”,而實現(xiàn)的前提是“全知、全覺、全控”,因此建立完整覆蓋安全風(fēng)險各要素的、不同來源和形式數(shù)據(jù)相互融合的大數(shù)據(jù)平臺,也是十分必要的。
目前,國內(nèi)外已經(jīng)收集、積累了大量的道路設(shè)施、道路交通運行數(shù)據(jù), 比如美國的公路安全信息系統(tǒng)(Highway Safety Information System, HSIS)[1]、 聯(lián)合國亞太經(jīng)濟社會委員會牽頭建立的 “亞洲公路數(shù)據(jù)庫(Asia Highway Database)”[2]、美國伊利諾伊州交通廳開展的“實現(xiàn)公路零死亡”(Driving Zero Fatalities to a Reality)項目[3]、歐盟的“提供全歐盟范圍實時交通信息服務(wù)”(Provision of EU-Wide Real-Time Traffic Information Services)[4]、中國道路風(fēng)險評估系統(tǒng)ChinaRAP[5-6]、北京市交通運行監(jiān)測調(diào)度中心(TOCC)的路網(wǎng)運行監(jiān)測系統(tǒng)、交通運輸部路況管理信息系統(tǒng)等[7]。 但數(shù)據(jù)的管理與深度挖掘應(yīng)用尚淺,現(xiàn)有數(shù)據(jù)庫多為單一的基礎(chǔ)設(shè)施、事故、交通運行、天氣等的數(shù)據(jù)庫,沒有多種類數(shù)據(jù)源融合的多源異構(gòu)數(shù)據(jù)庫;現(xiàn)有數(shù)據(jù)集中存在大量的非結(jié)構(gòu)化數(shù)據(jù)(例如視頻數(shù)據(jù)),均未得到很好地結(jié)構(gòu)化處理,尚未發(fā)揮應(yīng)有的巨大潛能;現(xiàn)有數(shù)據(jù)庫大多屬于傳統(tǒng)的數(shù)據(jù)庫模式, 尚未建立起現(xiàn)代大數(shù)據(jù)架構(gòu),在數(shù)據(jù)規(guī)模積累越來越大的情況下,現(xiàn)有系統(tǒng)難以對數(shù)據(jù)進行有效地管理、處理和分析;尤為突出的是,現(xiàn)有的傳統(tǒng)模式數(shù)據(jù)庫彼此孤立,不同數(shù)據(jù)源之間無法實現(xiàn)信息融合,從而為數(shù)據(jù)聯(lián)合分析與應(yīng)用制造了障礙。
為了解決公路基礎(chǔ)設(shè)施、交通運行與安全等跨部門、跨行業(yè)的數(shù)據(jù)融合技術(shù)問題, 本文攻克道路設(shè)施與運行相關(guān)的大數(shù)據(jù)的融合、清洗與增補技術(shù),建立數(shù)據(jù)融合與智能監(jiān)管功能界面,建成多源異構(gòu)數(shù)據(jù)平臺,突破交通安全保障全過程、全環(huán)節(jié)的數(shù)據(jù)統(tǒng)籌與科學(xué)管理關(guān)鍵技術(shù),可作為國家、區(qū)域、地方等不同層級的公路安全評價及公路設(shè)施安全提升的工作基礎(chǔ), 也可成為高速公路各項數(shù)據(jù)的存儲數(shù)據(jù)庫與展示平臺。
大數(shù)據(jù)智能分析平臺為一個大數(shù)據(jù)平臺加上3 項應(yīng)用技術(shù): 應(yīng)用技術(shù)1 “駕駛模擬與虛擬現(xiàn)實交通安全評價”、應(yīng)用技術(shù)2“道路設(shè)計與運行風(fēng)險評估”、應(yīng)用技術(shù)3“事件管控與應(yīng)急處置”,潛在的用戶涵蓋了部、省、地市各級道路交通行業(yè)主管部門和公路運營管理實體公司等。
應(yīng)用技術(shù)1 潛在的用戶主要為各級道路交通行業(yè)主管部門、公路運營管理實體公司及大型車企等,其成果可應(yīng)用于安評項目及車載終端產(chǎn)品研發(fā)。
應(yīng)用技術(shù)2 的核心應(yīng)用領(lǐng)域有3 個:安評項目、生命防護工程項目、智慧道路建設(shè)項目及智慧應(yīng)急保障項目,其成果用于完成3 個核心業(yè)務(wù):在安全項目中,用為安全評價的數(shù)學(xué)模型和應(yīng)用系統(tǒng);在生命防護工程項目中,用為風(fēng)險評估的數(shù)學(xué)模型和應(yīng)用系統(tǒng); 在智慧城市或智慧道路建設(shè)項目中, 用為實時風(fēng)險預(yù)測和事故預(yù)防預(yù)警的數(shù)學(xué)模型和應(yīng)用系統(tǒng),在應(yīng)急保障項目中,用為事件智慧管控與應(yīng)急處置的數(shù)學(xué)模型和應(yīng)用系統(tǒng)。
應(yīng)用技術(shù)3 潛在的用戶主要為高速公路交通主管單位,包括路段級管理單位和路網(wǎng)級管理單位,應(yīng)用場景主要為高速公路特殊事件下的管控和應(yīng)急處置, 其成果用于完成1 個核心業(yè)務(wù): 為高速公路發(fā)生特殊事件下管控及應(yīng)急處置提供方案庫、對策庫及匹配算法。
業(yè)務(wù)環(huán)節(jié)涵蓋交通事故的事前、事中、事后等各環(huán)節(jié)的安全分析與決策支持, 從道路交通行業(yè)的業(yè)務(wù)環(huán)節(jié)中劃分,即涵蓋了道路設(shè)施設(shè)計、運營和養(yǎng)護的各個環(huán)節(jié)之中,整體的業(yè)務(wù)流程如圖1 所示。
圖1 平臺整體業(yè)務(wù)流程
大數(shù)據(jù)智能分析平臺整體的數(shù)據(jù)流程如圖2 所示。
圖2 平臺整體數(shù)據(jù)流程
整體數(shù)據(jù)流向采用“分-合-分”的形態(tài)。 在底層數(shù)據(jù)庫方面,應(yīng)用技術(shù)1、2、3 各自建立數(shù)據(jù)集,單獨開發(fā)形成數(shù)據(jù)庫。 應(yīng)用技術(shù)1 匯聚自身業(yè)務(wù)所需數(shù)據(jù)源,形成“道路特征與駕駛行為數(shù)據(jù)庫”; 應(yīng)用技術(shù)2 匯聚自身業(yè)務(wù)所需數(shù)據(jù)源, 形成 “道路設(shè)施數(shù)據(jù)庫”“交通事故數(shù)據(jù)庫”“交通運行(交通流)數(shù)據(jù)庫”及“道路環(huán)境數(shù)據(jù)庫”等4 個底層數(shù)據(jù)庫,然后再整合形成“道路設(shè)施與交通運行動態(tài)風(fēng)險預(yù)測預(yù)警數(shù)據(jù)平臺”;應(yīng)用技術(shù)3 匯聚自身業(yè)務(wù)所需數(shù)據(jù)源,形成“道路交通事件管控與應(yīng)急處置數(shù)據(jù)庫”。
上述3 個數(shù)據(jù)庫系統(tǒng)按照分布式、本地化的原則,與包括CAD 設(shè)計文件、視頻流數(shù)據(jù)、圖像資料、文本文件等其它多源異構(gòu)數(shù)據(jù)源統(tǒng)一經(jīng)過大數(shù)據(jù)平臺 “分布式文件系統(tǒng)”和“資源調(diào)配”的流程,最終設(shè)計形成大數(shù)據(jù)架構(gòu),匯集形成“道路設(shè)施、運行與安全多源融合數(shù)據(jù)庫”。
平臺對所有能獲取的道路設(shè)施、 運行與安全多源數(shù)據(jù)按設(shè)計流程(圖3)進行整理和分析,包括數(shù)據(jù)鑒別、數(shù)據(jù)分類、數(shù)據(jù)清洗(含增補)、數(shù)據(jù)處理、數(shù)據(jù)重構(gòu)、數(shù)據(jù)融合等(圖4~5),并將數(shù)據(jù)分類存儲到云平臺上。
整體大數(shù)據(jù)平臺架構(gòu)設(shè)計如圖6 所示, 該平臺主要分為數(shù)據(jù)集成層、文件存儲層、數(shù)據(jù)存儲層、編程模型層、數(shù)據(jù)分析層、應(yīng)用層。
圖3 道路設(shè)施、運行與安全多源融合數(shù)據(jù)庫設(shè)計流程
圖4 數(shù)據(jù)鑒別與需求分類流程(部分)
圖5 數(shù)據(jù)清洗與數(shù)據(jù)處理流程(部分)
圖6 大數(shù)據(jù)智能分析平臺架構(gòu)
(1)數(shù)據(jù)集成層
對底層數(shù)據(jù)庫的融合與集成, 共包括了五大類數(shù)據(jù)庫:道路設(shè)施數(shù)據(jù)庫、道路交通事故數(shù)據(jù)庫、道路交通運行數(shù)據(jù)庫、道路環(huán)境數(shù)據(jù)庫、駕駛模擬數(shù)據(jù)庫。其中,道路設(shè)施數(shù)據(jù)庫涵蓋道路線形、路面、路側(cè)、交通防護及安保設(shè)施、交通控制設(shè)施等的數(shù)據(jù)集;道路交通事故數(shù)據(jù)庫涵蓋交通事故的準確時間、地點、形態(tài)、嚴重程度、傷亡人數(shù)、財產(chǎn)損失等;道路交通運行數(shù)據(jù)庫涵蓋交通運行動態(tài)數(shù)據(jù),包括流量、速度、占有率等,其時間粒度為5 min;道路環(huán)境數(shù)據(jù)主要是指公路交通氣象, 涵蓋溫度、 濕滑系數(shù)、路面狀態(tài)、相對濕度、風(fēng)向、風(fēng)速、水量、冰量、雪量、能見度、空氣溫度、路面溫度等指標,以及特殊交通天氣現(xiàn)象例如“團霧”等的數(shù)據(jù);駕駛模擬數(shù)據(jù)庫主要是駕駛模擬、虛擬現(xiàn)象實驗中產(chǎn)生的大量數(shù)據(jù),作為現(xiàn)實道路采集數(shù)據(jù)的有效補充,尤其突出的是虛擬現(xiàn)實、駕駛模擬中能夠產(chǎn)生在現(xiàn)實世界中尚未采集到的極限區(qū)間的數(shù)據(jù)(例如特大交通量等)。
(2)文件存儲層
采用Hadoop HDFS 負責(zé)道路設(shè)施與運行大數(shù)據(jù)的存儲系統(tǒng),利用Hadoop 的負載均衡特性把海量數(shù)據(jù)存儲到不同的存儲子節(jié)點上。 HDFS 支持流式數(shù)據(jù)訪問和存儲超大文件,并且負責(zé)提供日志收集系統(tǒng)(flume)、數(shù)據(jù)相移工具(sqoop)、 分布式應(yīng)用程序協(xié)調(diào)工具(zookeeper)、Hbase 等高層應(yīng)用。
(3)數(shù)據(jù)存儲層
采用Hadoop Yarn 作為通用資源管理器, 為上層應(yīng)用提供統(tǒng)一的資源管理和調(diào)度。
(4)編程模型層
可以有兩個選項, 分別是MapReduce 計算框架和Spark 計算框架。 本文當前傾向選用Spark 計算框架,在實際運行中將根據(jù)數(shù)據(jù)和建模的需求, 評估這兩個計算框架的適用性,最終選用一個最適合的計算框架。
(5)數(shù)據(jù)分析層
視編程模型的選擇而定。 如果選擇MapReduce 計算框架,則在數(shù)據(jù)分析層集成了Hive 數(shù)據(jù)分析、Pig 數(shù)據(jù)分析、Mahout 機器學(xué)習(xí);如果采用Spark 計算框架,則提供多種大數(shù)據(jù)分析方法,包括:聚類分析、預(yù)測性分析、數(shù)據(jù)挖掘、數(shù)據(jù)管理等。
(6)應(yīng)用層
包括虛擬現(xiàn)實與駕駛模擬交通安全評價應(yīng)用系統(tǒng)、道路設(shè)施與運行動態(tài)風(fēng)險預(yù)測預(yù)警應(yīng)用系統(tǒng)以及道路交通事件智慧管控與應(yīng)急處置應(yīng)用系統(tǒng)。
為建立面向大數(shù)據(jù)存儲與處理、 面向前沿技術(shù)和實際應(yīng)用的大數(shù)據(jù)平臺, 基于阿里云、Hadoop 平臺框架及C#、MySQL、Python、Node.js 等多種工具進行界面設(shè)計和功能完善, 大數(shù)據(jù)平臺已基本能實現(xiàn)云數(shù)據(jù)的可視化和智能化統(tǒng)計分析,并具備道路安全評價、交通運行風(fēng)險評估以及事件管控與應(yīng)急處置等一系列功能。道路設(shè)施、運行與安全大數(shù)據(jù)平臺信息界面如圖7 所示。
圖7 道路設(shè)施、運行與安全大數(shù)據(jù)平臺信息界面
建立了貫穿道路設(shè)施與交通運行風(fēng)險防控的大數(shù)據(jù)平臺,突破了“數(shù)據(jù)孤島”的難題,實現(xiàn)了交通事故與道路設(shè)施、交通運行、交通環(huán)境等不同來源、不同結(jié)構(gòu)數(shù)據(jù)的融合;還實現(xiàn)了非結(jié)構(gòu)化的設(shè)計資料、道路圖片數(shù)據(jù)、交通監(jiān)控視頻數(shù)據(jù)等的集成與融合,發(fā)揮大數(shù)據(jù)優(yōu)勢,將非結(jié)構(gòu)化數(shù)據(jù)進行可視化和充分應(yīng)用。 對于未來相似領(lǐng)域的交通安全大數(shù)據(jù)的研究與應(yīng)用, 本文的成果具有顯著的引領(lǐng)意義。
道路設(shè)施、 運行與安全大數(shù)據(jù)智能分析平臺的研究成果未來還可進一步拓展到全國各省公路網(wǎng), 拓展大數(shù)
(1)對于本文中按照船員不上岸的待航停泊區(qū),其功能較為單一,選址時首先按一般原則選取。
(2)通過對沙縣城關(guān)下游待航停泊區(qū)的3 個方案進行比選,分別從安全性、經(jīng)濟性、船舶調(diào)度難易性和河道美觀性進行方案分析比選其優(yōu)缺點,最終推選方案一。針對經(jīng)濟性和安全性進行比選時,始終以安全為首。
(3)山區(qū)河流停泊區(qū)一般不宜布置在彎道凹岸段,主要是此處水流流速較大,且為航道轉(zhuǎn)彎處,不利于船舶渟靠。通過對官蟹下游待航停泊區(qū)凹岸段流向流速分析,本工程建成后對流速流向基本無影響, 且流速滿足船舶安全靠泊要求; 同時, 為保證船舶上行離岸時安全過閘要求,停泊區(qū)前沿線應(yīng)盡量與上游航道中心線平行。