于志青
(河南警察學(xué)院 交通管理工程系, 河南 鄭州 450000)
目前,公眾不能通過互聯(lián)網(wǎng)直接訪問公安部門的業(yè)務(wù)專網(wǎng),互聯(lián)網(wǎng)和公安業(yè)務(wù)專網(wǎng)之間是隔離的,公眾要獲得相應(yīng)的信息,須通過互聯(lián)網(wǎng)發(fā)出請(qǐng)求,經(jīng)過專業(yè)的渠道送向公安業(yè)務(wù)專網(wǎng),專網(wǎng)對(duì)信息進(jìn)行處理后才能將結(jié)果反饋給用戶。由于公安交通管理信息目前采用的是傳統(tǒng)的數(shù)據(jù)處理架構(gòu),在處理信息量大的圖片和視頻時(shí),處理時(shí)間長(zhǎng),造成公眾查詢時(shí)等待的時(shí)間較長(zhǎng),因此便民服務(wù)平臺(tái)不對(duì)公眾提供此類信息的服務(wù)。當(dāng)前涉及的公安交通管理信息基本都是省級(jí)、省轄市級(jí)公安機(jī)關(guān)建庫,如在構(gòu)建省級(jí)、省轄市級(jí)公安機(jī)關(guān)交通信息綜合平臺(tái)時(shí),以大數(shù)據(jù)技術(shù)構(gòu)建,將為互聯(lián)網(wǎng)便民服務(wù)提供更加有力的支撐。關(guān)于公安便民服務(wù)、公安大數(shù)據(jù)應(yīng)用方面的研究,有從行政管理的角度研究公安互聯(lián)網(wǎng)便民服務(wù)平臺(tái)建設(shè)的[1],也有討論利用互聯(lián)網(wǎng)與大數(shù)據(jù)如何支撐公安工作的[2-4],用大數(shù)據(jù)技術(shù)構(gòu)建公安交通集成指揮平臺(tái)已取得較好的效果[5],大數(shù)據(jù)技術(shù)在交通管理和公安工作應(yīng)用已初見成效[6-9],而基于大數(shù)據(jù)技術(shù)的公安交通互聯(lián)網(wǎng)便民服務(wù)平臺(tái)目前少有文獻(xiàn)探討。本文重點(diǎn)研究基于大數(shù)據(jù)的公安交通互聯(lián)網(wǎng)便民平臺(tái),介紹其構(gòu)建、設(shè)計(jì)方法,并分析其性能。
對(duì)大數(shù)據(jù)這一概念目前還沒有統(tǒng)一的權(quán)威解釋,綜合各專家、學(xué)者和公司對(duì)大數(shù)據(jù)的說明,可以給出大數(shù)據(jù)的內(nèi)涵:具有可用于發(fā)現(xiàn)規(guī)律和預(yù)測(cè)未來價(jià)值的多樣或大量的數(shù)據(jù)。
面對(duì)大數(shù)據(jù),原有的數(shù)據(jù)處理技術(shù)已不能完全滿足需求,有必要研發(fā)適用大數(shù)據(jù)的數(shù)據(jù)處理技術(shù)?;诖?,大數(shù)據(jù)技術(shù)應(yīng)運(yùn)而生。
目前,Hadoop是大數(shù)據(jù)基礎(chǔ)技術(shù)的代表,它是一種大數(shù)據(jù)管理系統(tǒng),源于谷歌的分布式模型,由Apache基金會(huì)開發(fā),是開源的。中國(guó)也有許多機(jī)構(gòu)研究、學(xué)習(xí)Hadoop平臺(tái),許多公司在Hadoop的基礎(chǔ)上,開發(fā)了自己的大數(shù)據(jù)管理系統(tǒng),如阿里、華為、浪潮、上海星環(huán)等。中國(guó)最早使用Hadoop技術(shù)的是中國(guó)電信運(yùn)營(yíng)商,使用該技術(shù)后,1 500億條的網(wǎng)絡(luò)日志查詢,1 s之內(nèi)就有結(jié)果 ;若采用傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng),查詢時(shí)間要用小時(shí)計(jì)算[10]45-47。
大數(shù)據(jù)管理要比傳統(tǒng)的數(shù)據(jù)庫管理復(fù)雜得多。大數(shù)據(jù)技術(shù)構(gòu)件下,不同的子項(xiàng)目適用于大數(shù)據(jù)處理中的不同場(chǎng)景,子項(xiàng)目之間是互為補(bǔ)充的關(guān)系。大數(shù)據(jù)技術(shù)構(gòu)件如圖1所示[10]67。
圖1 大數(shù)據(jù)技術(shù)構(gòu)件圖
在組件中,有用于分布式文件存儲(chǔ)管理的HDFS,有用于分布式協(xié)調(diào)服務(wù)的Zookeeper, 有用于分布式發(fā)布訂閱消息的Kafka, 有用于分布式實(shí)時(shí)列式存儲(chǔ)的Hbase數(shù)據(jù)庫等。
與大數(shù)據(jù)技術(shù)相關(guān)聯(lián)的還有云計(jì)算技術(shù)。云計(jì)算是以提供服務(wù)為導(dǎo)向的分布式計(jì)算,其核心是分布式、虛擬式、多租戶。云計(jì)算技術(shù)與大數(shù)據(jù)技術(shù)二者均源自谷歌的分布式模型,是分布式計(jì)算的實(shí)現(xiàn)。大數(shù)據(jù)技術(shù)重點(diǎn)是對(duì)數(shù)據(jù)的處理技術(shù);云計(jì)算技術(shù)不但包括對(duì)數(shù)據(jù)的處理,同時(shí)也包括對(duì)各種資源的調(diào)度,如存儲(chǔ)、數(shù)據(jù)、操作系統(tǒng)、應(yīng)用軟件等。因此,云計(jì)算技術(shù)包括大數(shù)據(jù)技術(shù),但大數(shù)據(jù)技術(shù)也可獨(dú)立部署。
公安交通互聯(lián)網(wǎng)便民服務(wù)平臺(tái)是“互聯(lián)網(wǎng)+政務(wù)”服務(wù)的重要組成部分。平臺(tái)分為互聯(lián)網(wǎng)端和公安交通業(yè)務(wù)端?;ヂ?lián)網(wǎng)端的功能應(yīng)以服務(wù)公民需求為原則,但這些功能是否實(shí)現(xiàn)、是否可以達(dá)到便民的目的,除網(wǎng)絡(luò)傳輸?shù)臉?gòu)建外,重點(diǎn)是公安交通業(yè)務(wù)端的業(yè)務(wù)系統(tǒng)及相關(guān)數(shù)據(jù)如何支撐公眾從互聯(lián)網(wǎng)端發(fā)出的請(qǐng)求。一方面,公安交通互聯(lián)網(wǎng)便民服務(wù)平臺(tái)的功能實(shí)現(xiàn)取決于公安交通業(yè)務(wù)端對(duì)業(yè)務(wù)系統(tǒng)和數(shù)據(jù)的組織形式。例如,公民由互聯(lián)網(wǎng)請(qǐng)求辦理駕駛證的審核,公安交通業(yè)務(wù)端的駕駛證管理系統(tǒng)應(yīng)能找到相關(guān)的信息,并按相關(guān)規(guī)定處理,這就要求公安交通業(yè)務(wù)的處理平臺(tái)能夠高效地處理來自互聯(lián)網(wǎng)端的不同請(qǐng)求。另一方面,公安交通業(yè)務(wù)端的平臺(tái)也可把關(guān)于交通的有關(guān)信息,經(jīng)分析處理后,推送至互聯(lián)網(wǎng)端的公民,包括訂閱的消息、實(shí)時(shí)或及時(shí)地推送消息等。因此,公安業(yè)務(wù)端的平臺(tái)構(gòu)建是公安交通互聯(lián)網(wǎng)便民服務(wù)平臺(tái)的關(guān)鍵。本文核心以大數(shù)據(jù)技術(shù)、云計(jì)算技術(shù)為基礎(chǔ),構(gòu)建公安交通業(yè)務(wù)端的互聯(lián)網(wǎng)便民服務(wù)平臺(tái)或稱為公安交通便民服務(wù)支撐平臺(tái)。平臺(tái)基本體系結(jié)構(gòu)如圖2所示。
圖2 平臺(tái)基本體系結(jié)構(gòu)示意圖
當(dāng)前的部署在互聯(lián)網(wǎng)端的公安交通便民服務(wù)平臺(tái)功能模塊一般有業(yè)務(wù)辦理、信息查詢、公告發(fā)布、辦事指南等,這些功能的實(shí)現(xiàn)需要公安網(wǎng)端的公安業(yè)務(wù)系統(tǒng)支持,如業(yè)務(wù)辦理、信息查詢等;有些則不需要,如辦事指南、服務(wù)導(dǎo)航等。當(dāng)公安業(yè)務(wù)端的系統(tǒng)和數(shù)據(jù)基于大數(shù)據(jù)架構(gòu)時(shí),互聯(lián)網(wǎng)端的功能將有所增加,效率將會(huì)提升。功能模塊設(shè)計(jì)如圖3所示。
圖3 平臺(tái)功能模塊圖
業(yè)務(wù)辦理:包括機(jī)動(dòng)車業(yè)務(wù)、駕駛證業(yè)務(wù)、違法處理業(yè)務(wù)等。這些業(yè)務(wù)已不是傳統(tǒng)意義下簡(jiǎn)單的預(yù)約和辦理過程查詢,而是可實(shí)現(xiàn)真正意義的辦理。
如違法處理業(yè)務(wù),有些類型的違法處理不到違法處理地點(diǎn),即可完成對(duì)現(xiàn)場(chǎng)抓拍圖片、視頻的調(diào)閱查詢,并上交罰款等過程。而駕駛證業(yè)務(wù),在一定條件下實(shí)現(xiàn)網(wǎng)上辦理,如換證、審證等。
信息訂閱:指公民由于對(duì)某類信息或事件比較感興趣,從而訂閱這類信息,平臺(tái)會(huì)及時(shí)地發(fā)送這些信息給該類公民。如某一公民訂閱了某一高架橋的交通信息,當(dāng)有異常情況發(fā)生時(shí),平臺(tái)會(huì)立即將信息告訴給該用戶。
信息推送:當(dāng)公安交通部門有重要消息要發(fā)布時(shí),平臺(tái)會(huì)將此信息推送至每位用戶,包括固定的和移動(dòng)的信息接收終端。同時(shí)也可將特定信息推送至特定用戶。如某一輛車被套牌,平臺(tái)即可將此類信息推送至指定用戶。
移動(dòng)超市:這一功能主要指支持各種移動(dòng)終端的應(yīng)用,包括平板電腦、手機(jī)等設(shè)備。
公安交通部門掌握的數(shù)據(jù)可分為三類:第一類是公安交通自身業(yè)務(wù)活動(dòng)和通過技術(shù)手段獲取的數(shù)據(jù),如車駕管信息、智能卡口抓拍的車輛信息、電子警察抓拍的車輛信息等;第二類是與政府交通部門共享的信息,如高速公路車輛通行信息、路況視頻監(jiān)控信息等;第三類是從社會(huì)單位獲取的共享信息,如停車場(chǎng)信息等。這些信息有的是結(jié)構(gòu)化數(shù)據(jù)、有的是非結(jié)構(gòu)化數(shù)據(jù),如車輛照片、視頻錄像等。如何存儲(chǔ)、處理、管理這些數(shù)據(jù),是十分重要的問題,搭建科學(xué)合理的數(shù)據(jù)處理架構(gòu),可為數(shù)據(jù)的綜合應(yīng)用提供有力的技術(shù)支撐?,F(xiàn)根據(jù)公安交通數(shù)據(jù)的特性,利用大數(shù)據(jù)技術(shù)和云計(jì)算技術(shù),構(gòu)建公安交通便民服務(wù)平臺(tái)。
為了能夠滿足公安交通業(yè)務(wù)需求和便民服務(wù)需求,公安業(yè)務(wù)專網(wǎng)端的平臺(tái)可采用大數(shù)據(jù)技術(shù)構(gòu)建。目前比較成熟的大數(shù)據(jù)技術(shù)是Hadoop,國(guó)內(nèi)許多廠商的大數(shù)據(jù)平臺(tái)均是基于Hadoop的構(gòu)建。利用該技術(shù),可對(duì)公安交通數(shù)據(jù)進(jìn)行智能處理,獲取公安和公眾需要的數(shù)據(jù)。系統(tǒng)架構(gòu)如圖4所示。
圖4 系統(tǒng)架構(gòu)圖
資源層:主要是各種數(shù)據(jù)的采集和預(yù)處理,如來自智能卡口系統(tǒng)的數(shù)據(jù)、電子警察系統(tǒng)的數(shù)據(jù)、社會(huì)停車場(chǎng)管理的數(shù)據(jù)、高速交通管理系統(tǒng)的數(shù)據(jù)等,經(jīng)初步處理后,送向存儲(chǔ)層。
數(shù)據(jù)存儲(chǔ):數(shù)據(jù)資源層送來的數(shù)據(jù),按其結(jié)構(gòu)化程度,大致可分為結(jié)構(gòu)、半結(jié)構(gòu)、非結(jié)構(gòu)。結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)管理可采用Hadoop分布式架構(gòu);非結(jié)構(gòu)化存儲(chǔ)管理可采用Hbase+Hadoop+HDFS,以及MapReduce、 Spark計(jì)算模型,實(shí)現(xiàn)分布式并行處理,將Hbase作為中心數(shù)據(jù)庫,利用Hbase分布式處理,將海量的車輛信息拆分成并行處理的小事件,利用Hbase分布式檢索工具,通過分布式的讀取和檢索,可提高系統(tǒng)的性能。對(duì)原有的存儲(chǔ)在Oracle數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù),遷移到Hbase數(shù)據(jù)庫中,遷移時(shí)同步創(chuàng)建索引。
數(shù)據(jù)計(jì)算: 數(shù)據(jù)計(jì)算包括靜態(tài)數(shù)據(jù)計(jì)算和動(dòng)態(tài)數(shù)據(jù)計(jì)算。靜態(tài)數(shù)據(jù)計(jì)算主要指離線計(jì)算,實(shí)時(shí)性要求不高;動(dòng)態(tài)數(shù)據(jù)計(jì)算實(shí)時(shí)性要求較高。如車流量預(yù)測(cè)等,Hadoop體系不具有向用戶主動(dòng)推送實(shí)時(shí)信息的功能,而公安交通業(yè)務(wù)和便民服務(wù)則需要這種功能,這就需要在Hadoop原體系中創(chuàng)建一個(gè)中心,負(fù)責(zé)對(duì)信息的過濾和實(shí)時(shí)推送。在數(shù)據(jù)計(jì)算層還包括對(duì)各種數(shù)據(jù)的統(tǒng)計(jì)分析,這主要基于Spark/MapReduce實(shí)現(xiàn),可根據(jù)針對(duì)不同的需求進(jìn)行各種統(tǒng)計(jì)分析,如在路口某一時(shí)段、路段的統(tǒng)計(jì),可用這些結(jié)果開展更好的便民服務(wù)。同時(shí),也可以進(jìn)行各種分析,將分析結(jié)果告知用戶,如套牌、假牌等。在套牌方面,可將分析結(jié)果告知被套牌方;也可將結(jié)果告知套牌方,起到警示作用。
業(yè)務(wù)應(yīng)用: 業(yè)務(wù)應(yīng)用既有基于民警的應(yīng)用,也有基于其他政府部門的應(yīng)用,同時(shí)具有便民服務(wù)方面的應(yīng)用。民警應(yīng)用方面,主要包括民警各種業(yè)務(wù)應(yīng)用,如車輛追蹤、車輛布控、異常車輛分析等;其他政府部門應(yīng)用,如城管、交通等,可通過政府部門間信息共享平臺(tái)將數(shù)據(jù)送向政府部門;便民服務(wù)方面,主要指通過安全通道,將信息送向互聯(lián)網(wǎng)端便民服務(wù)平臺(tái),支持各種便民服務(wù)功能的實(shí)現(xiàn)。
該平臺(tái)采用的大數(shù)據(jù)技術(shù)中的分布式數(shù)據(jù)庫(Hbase),可對(duì)海量數(shù)據(jù)進(jìn)行有效的管理;分布式的搜索引擎構(gòu)架,可提供海量數(shù)據(jù)的秒級(jí)查詢響應(yīng)。分布式的計(jì)算框架可對(duì)海量數(shù)據(jù)進(jìn)行深入挖掘,支持高效迭代算法的Spark集群計(jì)算框架,可提升多種不同類型、數(shù)據(jù)挖掘算法的性能。不僅具有較強(qiáng)的集群系統(tǒng)計(jì)算資源和集群擴(kuò)容能力,檢索功能強(qiáng)大,支持多條件查詢、相似性查詢、模糊查詢等;而且具有高效強(qiáng)容災(zāi)備份的機(jī)制,集群中的單點(diǎn)故障不影響查詢功能。
在公安機(jī)關(guān),用大數(shù)據(jù)技術(shù)構(gòu)建的大數(shù)據(jù)平臺(tái)有多種,如交警、治安、刑偵等;但云計(jì)算中心只有一個(gè),負(fù)責(zé)各大數(shù)據(jù)平臺(tái)的資源調(diào)度,如數(shù)據(jù)、存儲(chǔ)、計(jì)算資源等,并由云計(jì)算中心統(tǒng)一對(duì)公安機(jī)關(guān)內(nèi)部及外部提供服務(wù)。因此,與互聯(lián)網(wǎng)對(duì)應(yīng)的對(duì)接及處理,實(shí)際是由公安業(yè)務(wù)網(wǎng)端的云計(jì)算中心完成的,云計(jì)算中心也是公安交通便民服務(wù)平臺(tái)的支撐。具體構(gòu)建如圖5所示。
圖5 云計(jì)算中心總體框架
便民服務(wù)一直是政府對(duì)社會(huì)實(shí)施有效管理的內(nèi)容,而利用網(wǎng)絡(luò)技術(shù)、信息技術(shù)等提供高效的便民服務(wù)也是政府職能的重要體現(xiàn)。公安交通便民服務(wù)是公安便民服務(wù)的主要內(nèi)容之一,也是互聯(lián)網(wǎng)+政務(wù)的重要體現(xiàn)。大數(shù)據(jù)技術(shù)是目前海量數(shù)據(jù)處理的主要技術(shù),將大數(shù)據(jù)技術(shù)應(yīng)用于公安交通便民服務(wù)領(lǐng)域是十分有意義的。