為預(yù)防和減少道路交通事故的發(fā)生,各地公安交通管理部門全力開展交通安全隱患排查整治攻堅行動,與此同時,隨著全國公安交通管理部門持續(xù)推廣大數(shù)據(jù)和人工智能技術(shù)應(yīng)用,形成了一些實戰(zhàn)的數(shù)據(jù)模型,用于道路交通管控、風險預(yù)測、執(zhí)勤執(zhí)法和監(jiān)管服務(wù)。在此背景之下,利用交管大數(shù)據(jù)開展交通安全隱患對象的排查,包括對隱患駕駛?cè)?、車輛、道路及重點企業(yè)的研判,是一項值得探索和實踐的工作。
構(gòu)建包括駕駛?cè)?、車輛、企業(yè)、道路、事故、違法等核心交通管理要素的全息檔案。考慮到這些對象的登記信息、業(yè)務(wù)辦理記錄、道路過車記錄等分散在不同的信息系統(tǒng)內(nèi),而不同對象之間具有關(guān)聯(lián)性,因此將每個對象的所有信息經(jīng)過數(shù)據(jù)治理、標簽畫像構(gòu)建關(guān)系圖譜,綜合各類信息形成全息檔案。其中,標簽是對某一對象的基本屬性、違法行為、事故行為等維度進行畫像得到的,如重型貨車、頻繁違法、多次傷人事故等,能夠清晰地了解該對象的特征,可以按照標簽組合的形式進行查詢,快速定位到符合特定標簽特征的對象。以車輛全息檔案為例,每輛機動車的檔案中包括基本信息、車主、標簽、風險評價、關(guān)系分析、車輛軌跡、活躍時段分析以及各種業(yè)務(wù)辦理記錄。車輛的關(guān)系分析中包括了與人的駕乘、登記、違法處理關(guān)系,與企業(yè)的從屬關(guān)系以及與違法、事故之間的關(guān)聯(lián)關(guān)系等。關(guān)系圖譜可以幫助交通管理部門更便捷地洞察不同對象之間的關(guān)聯(lián)性,有助于打破數(shù)據(jù)孤島,便于快速掌握一個對象的全面信息,并可以通過關(guān)系圖譜逐層挖掘、溯源,為隱患對象研判奠定數(shù)據(jù)底座。
1.隱患車輛研判。隱患車輛主要包括非法改裝車輛、疑似超員車輛、逾期未報廢或未年檢的重點車輛、頻繁違法或事故車輛等。
(1)非法改裝車輛研判。在海量車輛過車圖像的基礎(chǔ)上,利用AI圖像識別技術(shù)可以識別非法加裝燈帶的大貨車。這一方法需要提前采集大量的素材,通過AI算法訓(xùn)練,得到準確的圖像識別算法?;诳诘母咔遄ヅ膱D像,通過AI圖像識別技術(shù),分析車輛特征,比對研判是否疑似加裝燈帶的車輛。對于加裝燈帶導(dǎo)致車輛號牌無法識別的,可以通過以圖搜圖技術(shù),識別出號牌正常且外觀特征高度相似的車輛,根據(jù)車輛的全息檔案和關(guān)系圖譜快速找到車主,獲取車輛日常軌跡特征,便于攔截處罰(見圖1)。
圖1 非法加裝燈帶大貨車識別
對于車輛輪廓超限的車輛,主要利用前端卡口抓拍圖像和激光檢測輪廓數(shù)據(jù),結(jié)合車管庫信息進行研判。在監(jiān)測點,采用卡口抓拍車輛過車圖像,經(jīng)結(jié)構(gòu)化后獲得車牌號、車型、顏色、品牌等特征數(shù)據(jù),采用橫縱激光檢測單元掃描車輛采集輪廓數(shù)據(jù),包括長度、寬度、高度及欄板高度,通過匹配車輛輪廓數(shù)據(jù)與車輛特征數(shù)據(jù),與交通運輸部規(guī)定的超限標準閾值比對,可判定車輛是否超限;與車管庫數(shù)據(jù)比對,可對涉嫌非法加高欄板的非法改裝進行研判。
(2)疑似超員車輛研判。對于疑似超員車輛,主要針對高速、國省道的場景,可以利用卡口牌識信息和手機信令數(shù)據(jù),采用定點時空分析的方法進行研判(見圖2)。通過間隔一定距離的多個監(jiān)測點,每個監(jiān)測點利用前端卡口采集車輛號牌信息、車碼采集器采集手機IMSI信息及經(jīng)過時間,通過多點數(shù)據(jù)的碰撞比對,獲取通過各監(jiān)測點的相同目標,作為車輛實載人數(shù),再根據(jù)車牌號與車管庫中車輛核載人數(shù)比對。若實載人數(shù)大于核載人數(shù),則為疑似超員車輛。
圖2 超員車輛監(jiān)測點示意圖
(3)逾期未報廢或未年檢的重點車輛、頻繁違法或事故車輛的研判。利用信息網(wǎng)中的車管庫數(shù)據(jù)、違法數(shù)據(jù)和事故數(shù)據(jù),通過信息的篩選、數(shù)據(jù)的碰撞,判定是否符合業(yè)務(wù)規(guī)則,符合的車輛即為需要重點關(guān)注的隱患車輛。例如根據(jù)事故數(shù)據(jù),可統(tǒng)計得到一年內(nèi)發(fā)生事故3次以上且事故責任為同責以上的車輛,這些車輛即為頻繁事故車輛,存在較大的安全風險。
2.隱患駕駛?cè)搜信?。隱患駕駛?cè)酥饕ㄓ馄谖磽Q證或未審驗以及頻繁違法、多次嚴重違法或頻繁發(fā)生交通事故的人員。研判方法同車輛類似,通過數(shù)據(jù)比對、信息篩選判定隱患駕駛?cè)耍ㄟ^打上對應(yīng)的標簽,按照標簽可以快速查找對應(yīng)類型的隱患駕駛?cè)恕?/p>
3.隱患企業(yè)研判。隱患企業(yè)主要是隱患車輛較多的企業(yè),根據(jù)隱患車輛的所屬關(guān)系,可溯源隱患企業(yè),進行源頭治理。為了對企業(yè)的安全風險進行綜合的研判,可以基于交管大數(shù)據(jù)從企業(yè)狀態(tài)、車證核驗、交通違法、交通事故和文明行為這五個維度出發(fā),通過特征積分方式對企業(yè)進行量化的綜合安全風險評價,確定企業(yè)風險等級,將風險等級較高的列為隱患企業(yè)。根據(jù)綜合評價,當企業(yè)名下的車輛和駕駛?cè)说能囎C核驗情況比較拖沓,發(fā)生的違法和事故比較多,表示該企業(yè)的安全風險是比較大的。
4.隱患道路研判。隱患道路主要是事故多發(fā)點段,大多存在交通安全設(shè)施不到位、交通組織設(shè)計不合理、違法監(jiān)管缺失等問題。對隱患點段的研判,可以綜合利用交通事故和違法數(shù)據(jù),基于自然語言處理的地址解析技術(shù)對事故地點和違法地點進行解析,獲取地點的經(jīng)緯度。每個路口、路段的事故數(shù)、違法數(shù)及詳細的類型可以基于統(tǒng)一的時空基準進行統(tǒng)計和分析,通過圖上研判,能夠直觀地看出違法和事故數(shù)據(jù)的時空分布。對于事故數(shù)據(jù),相對比較客觀地反映了一個地點發(fā)生的事故數(shù)量(除去未報案的事故沒有記錄)。對于違法數(shù)據(jù),由于非現(xiàn)場執(zhí)法的違法數(shù)據(jù)反映了電子警察抓拍的違法情況,現(xiàn)場執(zhí)法的違法數(shù)據(jù)一定程度上反映了路面執(zhí)勤民警的覆蓋情況,因此違法數(shù)據(jù)較少的地點則說明缺少現(xiàn)場和非現(xiàn)場的違法監(jiān)管。于是,通過圖上研判,可以識別出事故多違法少、事故多違法也多的地點,這些地點或是交通設(shè)計存在問題,或是缺少違法監(jiān)管,路口隱患嚴重,需要重點關(guān)注和治理。
對于非法改裝大貨車、疑似超員車輛等隱患人、車,當前端感知設(shè)備采集數(shù)據(jù)并經(jīng)后端算法研判為疑似隱患車輛后,通過系統(tǒng)預(yù)警,追蹤到車輛出現(xiàn)的位置,根據(jù)軌跡預(yù)測,由交警指揮中心調(diào)動警力在下游位置實施攔截查處,現(xiàn)場進行處罰和教育。
關(guān)系圖譜是通過物信融合、圖數(shù)據(jù)庫、可視分析等技術(shù),將接入的標準化數(shù)據(jù)按圖數(shù)據(jù)庫方式進行關(guān)聯(lián)、時空分析,計算多種配置條件下關(guān)鍵要素之間的關(guān)聯(lián)關(guān)系,實現(xiàn)數(shù)據(jù)底層關(guān)聯(lián),形成龐大的關(guān)系圖譜。關(guān)系圖譜支持多層拓展,可以實現(xiàn)數(shù)據(jù)由“點”到“線”、到“面”、再到“多維”的逐層關(guān)系演進,同時支持通過可視化技術(shù)進行交互和展示,可以更便捷地洞察多維數(shù)據(jù)背后不同對象之間的關(guān)聯(lián)性,深度挖掘?qū)ο箝g的關(guān)系,進一步提高數(shù)據(jù)分析、挖掘和情報研判的效率。在交通管理領(lǐng)域中,各對象之間的關(guān)系主要是人、車、企、道路、違法、事故之間的關(guān)系,在其他部門數(shù)據(jù)支撐下,還可拓展車、保險公司、維修廠家等關(guān)系。
特征積分是以積分引擎為基礎(chǔ),結(jié)合對象的特征規(guī)則,利用積分算法對對象的特征積分進行計算,可用于一個對象的多維評價。一個對象的特征可以分為多個維度,每個維度包含多個特征單項。特征單項根據(jù)特征規(guī)則從對象的相關(guān)數(shù)據(jù)中進行提取,每個單項可以設(shè)定最大、最小閾值和分別對應(yīng)的分值。一個積分運算可對不同維度、特征單項賦予不同的權(quán)重、閾值等,最后采用加權(quán)平均和加權(quán)求和的方式計算對象的特征積分值。特征積分服務(wù)提供積分運算能力,可以提供執(zhí)行策略,定時批量執(zhí)行計算任務(wù)。根據(jù)特征積分得到的結(jié)果,可以為不同對象的研判、標簽畫像等提供數(shù)據(jù)支撐。
由于類似事故和違法數(shù)據(jù)中涉及地點的描述存在不規(guī)范、無統(tǒng)一標準的情況,例如“江南大道江陵路口”和“江陵路江南大道交叉口”為同一路口的不同描述方式。因此對于數(shù)據(jù)中的非標準地址,采用基于自然語言處理(NLP)的地址解析技術(shù),將其轉(zhuǎn)化為標準化的地址,并根據(jù)地圖服務(wù)引擎獲取地址的經(jīng)緯度,從而可以用于數(shù)據(jù)空間分布的計算和圖上研判。通過標準地址轉(zhuǎn)換,能夠輸出自然語句中包含的道路名稱、道路ID、路口/路段名、路口/路段ID及經(jīng)緯度信息。首先需要通過自然語言處理(NLP)對原始的事故、違法地址的描述做分詞工程處理,即將字符串通過分詞技術(shù)轉(zhuǎn)換為結(jié)構(gòu)化的詞語形式。然后再結(jié)合地址抽取和解析定位能力,實現(xiàn)將非結(jié)構(gòu)化的地址文本轉(zhuǎn)化為空間數(shù)據(jù),將目標地址準確的解析抽取出來。最后通過地圖服務(wù)實現(xiàn)事故和違法事件的定位,并支持道路名字、路口或路段名字、經(jīng)緯度等定位信息的輸出。
綜上,本文以人工智能圖像識別技術(shù)、關(guān)系圖譜、特征積分、地址解析等技術(shù)為支撐,采用了物信融合的數(shù)據(jù)匹配、基于業(yè)務(wù)規(guī)則的數(shù)據(jù)碰撞、多維綜合評價和圖上研判等方法,可以提高交通管理部門隱患排查的效率和精準性。但在實踐的過程中發(fā)現(xiàn),研判的準確性和可靠性與數(shù)據(jù)質(zhì)量有著密切的關(guān)系,例如卡口抓拍圖片的有效性、準確性、地址錄入的規(guī)范性等。因此,在未來依賴大數(shù)據(jù)的分析研判應(yīng)用中,需要制定一套標準和規(guī)范的數(shù)據(jù)治理流程和方法,并且貼合每一類數(shù)據(jù)的特征,保證有效的數(shù)據(jù)為分析所用。