杜慶靈,李洪波,趙 凱
(1.河南警察學(xué)院 信息安全系,河南 鄭州 450046;2.開(kāi)封市公安局 科通處,河南 開(kāi)封 475000)
道路交通智能監(jiān)測(cè)系統(tǒng)(簡(jiǎn)稱智能卡口)是治安防控的重要技術(shù)手段,也是“平安中國(guó)”的重要組成部分,它是采用計(jì)算機(jī)、網(wǎng)絡(luò)、智能視頻等技術(shù)實(shí)現(xiàn)對(duì)車輛信息的獲取,如車輛牌照號(hào)、車身、車型、車的顏色、某時(shí)通過(guò)某地點(diǎn)等信息。利用這些信息,公安機(jī)關(guān)可對(duì)車輛實(shí)施有效的管控,同時(shí)可與政府其他部門共享這些信息。各級(jí)公安機(jī)關(guān)在省界、市界、縣界、鄉(xiāng)界、重點(diǎn)路口、城市出入口及高速公路安裝了數(shù)量眾多的智能卡口系統(tǒng),對(duì)公安機(jī)關(guān)打防管控工作提供了強(qiáng)有力的支撐。在“平安城市”“平安鄉(xiāng)鎮(zhèn)”的建設(shè)過(guò)程中,各級(jí)公安機(jī)關(guān)也建設(shè)了許多微卡口,這些微卡口盡管不如標(biāo)準(zhǔn)的智能卡口系統(tǒng)在車輛信息獲取方面功能強(qiáng)大,但也提供了非常有用的車輛信息。智能卡口(含微卡口)獲取的車輛信息有兩大類:一類是抓拍的車輛圖片,另一類是從圖片中提取的信息。如前面提到的車輛牌照號(hào)等,這些信息可為結(jié)構(gòu)化或非結(jié)構(gòu)化信息,車輛圖片是非結(jié)構(gòu)化信息,而從車輛圖片中提取的車輛牌照號(hào)以及具有測(cè)速功能的智能卡口系統(tǒng)測(cè)到的通過(guò)某一點(diǎn)的車速,則是結(jié)構(gòu)化信息。如何更好地挖掘利用這些結(jié)構(gòu)化、非結(jié)構(gòu)化信息,一直是智能卡口應(yīng)用部門,尤其是公安機(jī)關(guān)研究的重要內(nèi)容。[1]
近年來(lái),各級(jí)公安機(jī)關(guān)進(jìn)行了智能卡口系統(tǒng)的大規(guī)模建設(shè),開(kāi)展了基本的應(yīng)用,取得了一定的成績(jī),但這些結(jié)構(gòu)化、非結(jié)構(gòu)化的信息不能得到充分的利用,沒(méi)有發(fā)揮它們應(yīng)有的價(jià)值。隨著智能卡口系統(tǒng)建設(shè)規(guī)模的擴(kuò)大及工作需求,各智能卡口系統(tǒng)之間需要進(jìn)行聯(lián)網(wǎng),實(shí)現(xiàn)省、市、縣之間車輛信息的共享,并得到深度挖掘、分析和應(yīng)用。原有的智能卡口系統(tǒng)對(duì)車輛信息的管理方式已不能適應(yīng)新的需求,這就促使各級(jí)公安機(jī)關(guān)采用新的技術(shù),實(shí)施對(duì)智能卡口信息的有效管理與應(yīng)用。智能卡口系統(tǒng)產(chǎn)生的是海量數(shù)量,且各智能卡口系統(tǒng)分布在不同地點(diǎn),以省轄市為例,有市本級(jí)自建的智能卡口系統(tǒng),也有所屬各縣建設(shè)的智能卡口系統(tǒng),有的數(shù)據(jù)可以在市、縣兩級(jí)存儲(chǔ)(如結(jié)構(gòu)化數(shù)據(jù)),而圖片信息因其量太大,不宜匯總到市級(jí)存儲(chǔ),存儲(chǔ)在縣本級(jí)即可,但市級(jí)應(yīng)能統(tǒng)一管理、調(diào)度這些圖片信息,同時(shí)省級(jí)公安機(jī)關(guān)也應(yīng)能管理、調(diào)度本省的智能卡口信息?;趯?shí)際工作需求,結(jié)合智能卡口特點(diǎn),大數(shù)據(jù)技術(shù)是對(duì)智能卡口信息管理的比較理想的技術(shù),有的公安機(jī)關(guān)利用大數(shù)據(jù)技術(shù),構(gòu)建了智能卡口信息管理系統(tǒng),但那是初步的,并沒(méi)有充分利用大數(shù)據(jù)技術(shù)各組件,在應(yīng)用層面僅提高了信息查詢速度,并沒(méi)有真正實(shí)現(xiàn)分布式管理及深度應(yīng)用。[2]本文以省轄市級(jí)公安機(jī)關(guān)為研究對(duì)象,研究利用大數(shù)據(jù)技術(shù)構(gòu)建智能卡口信息管理平臺(tái)的問(wèn)題,給出平臺(tái)的具體設(shè)計(jì),包括功能、體系結(jié)構(gòu)等,并分析其性能。
大數(shù)據(jù)技術(shù)包括基礎(chǔ)技術(shù)和應(yīng)用技術(shù)?;A(chǔ)技術(shù)主要指構(gòu)建大數(shù)據(jù)處理的各個(gè)基本組件,如數(shù)據(jù)庫(kù)、流計(jì)算、內(nèi)存計(jì)算等;應(yīng)用技術(shù)主要是指結(jié)合行業(yè)應(yīng)用的各種算法、模型等。下面給出大數(shù)據(jù)平臺(tái)通用架構(gòu)和關(guān)鍵技術(shù)。
大數(shù)據(jù)平臺(tái)通用架構(gòu)主要包括數(shù)據(jù)采集、分布式數(shù)據(jù)庫(kù)、數(shù)據(jù)索引、數(shù)據(jù)分析等模塊,如圖1所示。
圖1 大數(shù)據(jù)平臺(tái)通用架構(gòu)圖
數(shù)據(jù)采集: 主要通過(guò)采集工具采集歷史數(shù)據(jù),通過(guò)高速數(shù)據(jù)總線采集實(shí)時(shí)數(shù)據(jù),進(jìn)入大數(shù)據(jù)平臺(tái)。
分布式數(shù)據(jù)庫(kù): 主要管理結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),并具有擴(kuò)展性。
數(shù)據(jù)索引:采用高速搜索引擎對(duì)數(shù)據(jù)進(jìn)行快速檢索、統(tǒng)計(jì)分析等。
數(shù)據(jù)處理分析:基于分布式計(jì)算、集群處理,實(shí)現(xiàn)流式計(jì)算及大規(guī)模數(shù)據(jù)計(jì)算。
大數(shù)據(jù)平臺(tái)是數(shù)據(jù)的存儲(chǔ)、計(jì)算中心,具有分布式、統(tǒng)一管理等特點(diǎn),可匯集各種類型的數(shù)據(jù),為大數(shù)據(jù)的綜合應(yīng)用提供支撐。大數(shù)據(jù)平臺(tái)技術(shù)架構(gòu)如圖2所示。
圖2 大數(shù)據(jù)平臺(tái)技術(shù)架構(gòu)圖
分布式文件系統(tǒng):負(fù)責(zé)大數(shù)據(jù)的存儲(chǔ),將數(shù)據(jù)分別存儲(chǔ)在多臺(tái)獨(dú)立的存儲(chǔ)設(shè)備,實(shí)現(xiàn)統(tǒng)一的管理和調(diào)度,是分布式計(jì)算的基礎(chǔ)。
分布式資源管理:基于Hadoop分布式資源管理架構(gòu),負(fù)責(zé)存儲(chǔ)、計(jì)算等資源的管理。
分布式數(shù)據(jù)庫(kù):是分布式、按列存儲(chǔ)、多維度結(jié)構(gòu)的實(shí)時(shí)分布式數(shù)據(jù)庫(kù),適合構(gòu)建低延時(shí)的數(shù)據(jù)服務(wù)系統(tǒng)。
內(nèi)存計(jì)算引擎:是一種分布式的計(jì)算框架,其核心是彈性分布式數(shù)據(jù)集,可快速在內(nèi)存中對(duì)數(shù)據(jù)集進(jìn)行多次迭代,支持復(fù)雜的數(shù)據(jù)挖掘算法和圖形計(jì)算算法。
分布式協(xié)作:是對(duì)大型分布式系統(tǒng)的可靠協(xié)調(diào)系統(tǒng),提供集群節(jié)點(diǎn)間的資源協(xié)調(diào)服務(wù),保證分布式系統(tǒng)的可靠運(yùn)行。
分布式數(shù)據(jù)總線:負(fù)責(zé)數(shù)據(jù)的采集、整合與交互,基于發(fā)布/訂閱的分布式消息系統(tǒng)。
利用大數(shù)據(jù)技術(shù),可以構(gòu)建省轄市級(jí)智能卡口信息綜合應(yīng)用平臺(tái)[3-5]。
平臺(tái)整體拓?fù)浣Y(jié)構(gòu)如圖3所示。
圖3 平臺(tái)整體結(jié)構(gòu)拓?fù)浣Y(jié)構(gòu)圖
圖3表明,省轄市級(jí)智能卡口信息綜合應(yīng)用平臺(tái)可布署在視頻卡口專網(wǎng)側(cè),公安業(yè)務(wù)專網(wǎng)側(cè)也可通過(guò)安全邊界利用卡口的信息開(kāi)展應(yīng)用。這樣布署的好處在于許多應(yīng)用可直接在視頻卡口專網(wǎng)側(cè)展開(kāi),不需要通過(guò)邊界,只有當(dāng)與其他公安業(yè)務(wù)結(jié)合應(yīng)用時(shí)才通過(guò)邊界。同時(shí),縣級(jí)公安機(jī)關(guān)只建智能卡口管理系統(tǒng)開(kāi)展本級(jí)應(yīng)用,并將卡口數(shù)據(jù)上傳至所屬市級(jí)平臺(tái),也可共享本市、省的聯(lián)網(wǎng)卡口信息。省級(jí)公安機(jī)關(guān)構(gòu)建智能卡口信息綜合應(yīng)用平臺(tái),聯(lián)網(wǎng)全省卡口信息,并為全省智能卡口信息應(yīng)用服務(wù)。
基于智能卡口信息,應(yīng)用大數(shù)據(jù)技術(shù),解決傳統(tǒng)的數(shù)據(jù)管理系統(tǒng)難以支撐海量機(jī)動(dòng)車過(guò)往信息的接收、存儲(chǔ)、處理分析等問(wèn)題,構(gòu)建智能卡口信息綜合應(yīng)用平臺(tái),平臺(tái)采用分布式架構(gòu),實(shí)現(xiàn)實(shí)時(shí)流式計(jì)算、分布式數(shù)據(jù)存儲(chǔ)、計(jì)算及數(shù)據(jù)挖掘等。平臺(tái)邏輯架構(gòu)圖見(jiàn)圖4。
圖4 平臺(tái)邏輯架構(gòu)
該平臺(tái)邏輯上可分為4層:數(shù)據(jù)資源、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算、業(yè)務(wù)應(yīng)用。
數(shù)據(jù)資源層:接收來(lái)自智能卡口、電子警察(燈控路口闖紅燈自動(dòng)抓拍系統(tǒng))、微卡口、視頻監(jiān)控等系統(tǒng)的車輛及相關(guān)信息,經(jīng)預(yù)處理后送向數(shù)據(jù)存儲(chǔ)層。
數(shù)據(jù)存儲(chǔ):數(shù)據(jù)資源送來(lái)的數(shù)據(jù)有視頻、圖片等,這些數(shù)據(jù)有結(jié)構(gòu)化的,也有半結(jié)構(gòu)化和非結(jié)構(gòu)化的,可根據(jù)數(shù)據(jù)的特征及應(yīng)用采用不同的數(shù)據(jù)庫(kù)方式存儲(chǔ)。
數(shù)據(jù)計(jì)算:包括動(dòng)態(tài)數(shù)據(jù)計(jì)算和靜態(tài)數(shù)據(jù)計(jì)算。靜態(tài)數(shù)據(jù)計(jì)算主要是總線計(jì)算,對(duì)實(shí)時(shí)要求不高,可屏蔽SQL和NOSQL調(diào)用。動(dòng)態(tài)數(shù)據(jù)技術(shù)對(duì)實(shí)時(shí)要求較高,如報(bào)警處理和車輛布控等,要求利用大數(shù)據(jù)的高并發(fā)、高強(qiáng)度的計(jì)算能力。
業(yè)務(wù)應(yīng)用:大數(shù)據(jù)技術(shù)采用分布存儲(chǔ)實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的管理,利用高效的搜索引擎可實(shí)現(xiàn)對(duì)各種查詢的秒級(jí)響應(yīng),利用各種算法模型可對(duì)海量數(shù)據(jù)實(shí)現(xiàn)深入挖掘。結(jié)合公安業(yè)務(wù),可實(shí)現(xiàn)車輛軌跡分析、套牌分析、稽查布控等應(yīng)用。
省轄市級(jí)智能卡口信息綜合應(yīng)用平臺(tái)根據(jù)業(yè)務(wù)需求應(yīng)具有多種功能,各功能模塊如圖5所示。
卡口聯(lián)網(wǎng):具有匯聚聯(lián)接本級(jí)及全市所屬各縣智能卡口并上聯(lián)至全省的功能,它是卡口信息綜合應(yīng)用的基礎(chǔ)。
數(shù)據(jù)匯聚:根據(jù)資源共享、分級(jí)管理的要求,匯聚所屬縣級(jí)所有卡口數(shù)據(jù),包括實(shí)時(shí)過(guò)車數(shù)據(jù)、卡口圖片二次分析數(shù)據(jù)等。
圖5 平臺(tái)功能模塊示意圖
車輛布控警告:平臺(tái)具有布控和撤控功能,能響應(yīng)各級(jí)智能卡口管理平臺(tái)(系統(tǒng))的布控、撤控指令,根據(jù)用戶需求,可按車牌號(hào)碼、車輛顏色、車輛類型、布控的有效時(shí)間段等條件對(duì)車輛進(jìn)行布控。
卡口圖片二次分析:前端卡口抓拍的圖片,在進(jìn)行了一次分析抓到過(guò)車的基本信息后,該平臺(tái)可對(duì)圖片進(jìn)行二次分析,以獲取更多的有用信息,這些信息包括車身顏色、車型識(shí)別、車標(biāo)識(shí)別、車輛品牌識(shí)別、遮陽(yáng)板識(shí)別、安全帶,以及司機(jī)接打電話等狀態(tài)的智能識(shí)別和檢測(cè)。
以圖搜圖:根據(jù)目標(biāo)車輛的特征,平臺(tái)自動(dòng)分析照片中的目標(biāo)車輛特征,進(jìn)而在系統(tǒng)中進(jìn)行篩迭、檢索符合條件的處理軌跡。具體過(guò)程如下:圖片二次識(shí)別服務(wù)器從卡口圖片中提取車輛特征信息,并將該信息存儲(chǔ)到卡口大數(shù)據(jù)集群中,當(dāng)需要時(shí),導(dǎo)入一張目標(biāo)圖片,平臺(tái)根據(jù)圖片中車輛的特征信息,查詢目標(biāo)車輛,對(duì)指定時(shí)間段內(nèi)的卡口圖片進(jìn)行查找,結(jié)果按相似度從高到低進(jìn)行排列顯示。
大數(shù)據(jù)挖掘: 該模塊提供全省、全市道路、車輛、車流、卡口等相關(guān)信息的數(shù)據(jù)挖掘分析,包括按時(shí)間、車型、車輛屬地、道路車流等信息進(jìn)行多維度數(shù)據(jù)挖掘統(tǒng)計(jì)分析。
由于平臺(tái)采用HDFS和HBase等成熟的分布式系統(tǒng)框架,確保了系統(tǒng)的擴(kuò)展性和穩(wěn)定性,具有海量接入和大并發(fā)量訪問(wèn)的能力。平臺(tái)利用分布式計(jì)算技術(shù),可提供快捷的數(shù)據(jù)分析、挖掘能力,支持費(fèi)結(jié)構(gòu)數(shù)據(jù)的結(jié)構(gòu)化處理,可進(jìn)行智能研判;平臺(tái)采用全文檢索技術(shù),通過(guò)對(duì)海量的視頻圖像建立結(jié)構(gòu)化信息索引,實(shí)現(xiàn)對(duì)視頻圖像數(shù)據(jù)的快速查詢,結(jié)合智能技術(shù),實(shí)現(xiàn)以圖搜圖方式的搜索視頻和圖像,采用全分布式系統(tǒng)架構(gòu),提供海量數(shù)據(jù)的存儲(chǔ)能力,包括分布式文件系統(tǒng)和分布式數(shù)據(jù)庫(kù)系統(tǒng),用于存儲(chǔ)非結(jié)構(gòu)、半結(jié)構(gòu)化數(shù)據(jù)。
智能卡口產(chǎn)生的信息具有大數(shù)據(jù)的特征,屬大數(shù)據(jù)范疇。由于智能卡口分布廣泛,數(shù)據(jù)存儲(chǔ)分散,為了更好地管理、應(yīng)用這些信息,大數(shù)據(jù)技術(shù)是必然選擇。大數(shù)據(jù)技術(shù)分為基礎(chǔ)技術(shù)和應(yīng)用技術(shù),本文主要利用大數(shù)據(jù)基礎(chǔ)技術(shù),結(jié)合公安、政法及政府其他部門行業(yè)的應(yīng)用,研究大數(shù)據(jù)在處理智能卡口信息的應(yīng)用技術(shù),屬大數(shù)據(jù)應(yīng)用技術(shù)領(lǐng)域。在大數(shù)據(jù)技術(shù)架構(gòu)下,給出了省轄市級(jí)智能卡口信息綜合應(yīng)用平臺(tái)的設(shè)計(jì),本文的討論可為省級(jí)、省轄市公安機(jī)關(guān)建設(shè)智能卡口信息綜合應(yīng)用平臺(tái)提供參考。