摘 要:在國家發(fā)展與改革委員會、交通運輸部等部門起草的《關于促進智慧城市健康發(fā)展的指導意見》中,智能交通被列為十大智慧工程之一,該文件在各地方得到了積極響應,越來越多的城市開始建設智慧城市和智慧交通。由此,本文設想將數(shù)據(jù)分析與交通警務工作相結(jié)合,實現(xiàn)數(shù)據(jù)支撐下的科學決策,以此提高警務資源分配效率,提升道路交通安全,改善人們的出行體驗。本文首先收集了2016年8月1日至2017年12月31日機場區(qū)域所有的報警記錄,通過大量數(shù)據(jù)的清洗和關鍵詞的提取,將這些記錄轉(zhuǎn)換為可用于數(shù)據(jù)分析的結(jié)構化數(shù)據(jù);進而,本文應用時間序列分析、聚類分析和判別分析對數(shù)據(jù)進行了挖掘,通過提取時間序列數(shù)據(jù),本研究建立了ARIMA(3,1,4)模型,對機場區(qū)域每天的事故發(fā)生頻率進行擬合和預測;其次,本文針對機場區(qū)域的地點,按照事故發(fā)生密度進行了聚類,其聚類結(jié)果可為警方制定應急方案和巡更計劃提供輔助參考;此外,本文還進行了判別分析,通過對時間、地點和天氣等信息進行擬合來判斷某一時間、某一地點在某一天氣情況下可能發(fā)生的交通事故;最后,本文還建立了一套信息系統(tǒng)來實現(xiàn)數(shù)據(jù)管理和可視化功能。
關鍵詞:數(shù)據(jù)分析;智慧交通;警務系統(tǒng)
中圖分類號:TP311.13文獻標識碼:A 文章編號:2096-4706(2018)09-0119-03
Abstract:In the guidance of the National Development and Reform Commission and the Ministry of Transportation,“the guidance on promoting the healthy development of intelligent cities”,intelligent transportation has been listed as one of the ten great intelligent projects. This document has been actively responded in various places,and more and more cities have begun to build intelligent cities and intelligent traffic. Therefore,this paper conceives the combination of data analysis and traffic police work to achieve scientific decision-making under the support of data,so as to improve the efficiency of police resources distribution,improve road traffic safety and improve people’s travel experience. This paper first collected all the alarm records in the airport area from August 1,2016 to December 31,2017,and converted these records into structured data that could be used for data analysis through a large number of data cleaning and keyword extraction,and then the data were dug with time series analysis,clustering analysis and discriminant analysis. By extracting the time series data, the ARIMA(3,1,4) model is established to fit and predict the frequency of the daily accidents in the airport area. Secondly,this paper cluster the location of the airport area according to the density of the accident occurrence,and the clustering results can make the emergency plan and the patrol plan for the police. In addition,a discriminant analysis is carried out in this paper. By fitting time,location and weather information to judge a possible traffic accident at a certain time and a certain place in a certain weather condition,a set of information system is also established to realize data management and visualization.
Keywords:data analysis;intelligent traffic;police system
0 引 言
隨著信息技術的大力發(fā)展和“互聯(lián)網(wǎng)+”的不斷推進,完善警務情報收集體系,從以人工判斷為主導過渡到以警務情報信息為主導。加強公安警務信息化建設,提高公安機構能力成熟度,以及建立智慧城市已成為世界性課題,引領著全球警務工作的發(fā)展與變革。
1 問題描述
近年來,雖然我國公安信息化建設有了很大進步,但是在警務情報整合、警情數(shù)據(jù)的挖掘以及后續(xù)的分析結(jié)果利用上仍存在不足之處。我國雖然在“互聯(lián)網(wǎng)+”交通管理方面的研究頗豐,但是大多是定性分析,定量研究與創(chuàng)新較少。因此,本文希望將大數(shù)據(jù)和交通警務管理進行融合,通過對現(xiàn)有數(shù)據(jù)進行數(shù)據(jù)挖掘,充分發(fā)現(xiàn)數(shù)據(jù)中蘊含的知識,使警局在部署工作時從利用主觀經(jīng)驗判斷向利用數(shù)據(jù)分析結(jié)果進行科學輔助決策轉(zhuǎn)變,從而實現(xiàn)“警務先于警情走”,提高公安部門運轉(zhuǎn)效率。
2 解決方案與比較優(yōu)勢
本文收集了機場區(qū)域的報警數(shù)據(jù),經(jīng)過大量的清洗工作后,應用Python進行了數(shù)據(jù)分析和可視化展示,通過搭建網(wǎng)站實現(xiàn)了數(shù)據(jù)維護和一定程度的數(shù)據(jù)展示,通過設置權限系統(tǒng),控制不同角色對于數(shù)據(jù)的增、刪、改、查的權限,從而提高系統(tǒng)的安全性。盡管系統(tǒng)界面較為簡單,功能也不完善,但是基本達到了最初設想的通過數(shù)據(jù)分析發(fā)現(xiàn)事故發(fā)生規(guī)律,輔助優(yōu)化警力配置等的目的。
相對于我國以往的“互聯(lián)網(wǎng)+交通管理”方面,本系統(tǒng)通過大數(shù)據(jù)分析,經(jīng)過大量的數(shù)據(jù)清洗,通過多種算法擬合預測交通事故的發(fā)生規(guī)律,并進行定量研究。
2.1 數(shù)據(jù)預處理
在清洗原始數(shù)據(jù)的過程中,本文針對不同軟件的特點和優(yōu)勢,分步依次進行了清洗。
(1)在Python中利用循環(huán),依次打開51個Excel,刪除標題并合并到一個數(shù)據(jù)框中,然后提取需要分析的多個列,并將數(shù)據(jù)框?qū)懙揭粋€Excel中;
(2)由于可分析項數(shù)較少,且交通事故和擁堵的發(fā)生與天氣有著密不可分的關系。因此,本文在天氣預報網(wǎng)下載了2016年8月1日至2017年12月31日的天氣情況,包括日期、星期、最高氣溫、最低氣溫、天氣、風向風力、空氣質(zhì)量指數(shù)和空氣質(zhì)量等級,共計8項。然后在Excel中用Vlookup函數(shù)將每一天的天氣插入到每一行(事故記錄)中;
(3)在Excel開發(fā)工具中,選用Visual Basic對文字描述進行關鍵字提取。對案發(fā)地點列進行文本篩選,獲得案發(fā)地點關鍵詞。對案件內(nèi)容進行文本篩選,獲得案件分類;
(4)對于時間變量,為了充分研究月份、日期、小時等變量對交通事故的影響,對報警時間這一列進行分列操作,將報警時間細分成月、日、小時等多列。
2.2 警務數(shù)據(jù)分析預測
2.2.1 時間序列算法
時間序列是一系列按照時間順序排列的數(shù)據(jù)點,最常見的是按照相等時間間距排列的連續(xù)序列,因此時間序列通常是離散數(shù)據(jù)。時間序列分析是研究 時間序列數(shù)據(jù)的統(tǒng)計方法,用于提取數(shù)據(jù)中蘊含的有意義的統(tǒng)計量和其他數(shù)據(jù)特征。時間序列預測是一種基于先前觀測值建立模型預測未來的方法。
本文利用之前處理過的數(shù)據(jù)進行分析,并建立合適的ARIMA模型,制作訓練集用作模型擬合,測試集數(shù)據(jù)作為驗證模型效果。
2.2.2 聚類分析
本研究采用數(shù)據(jù)挖掘領域經(jīng)典之一的K-means算法,將n個對象依據(jù)他們的各自屬性分成k個簇。算法步驟為:(1)選取合適的簇中心;(2)將各個點劃分到距離最近的簇中心;(3)計算新的簇中心,返回步驟1進行迭代,直到簇中心不再發(fā)生變化。度量樣本點到簇中心的距離,通常在歐式空間中采用歐氏距離,在進行文檔聚類時偏向于使用一線相似度函數(shù)或者曼哈頓距離,本研究選取歐氏距離。該算法的最終目標是使同一簇中的差異非常小,并且最大化不同簇之間的差異。在統(tǒng)計學上,一般采用均方誤差SSE來度量這一過程。
本次研究共選取了9種算法,分別對數(shù)據(jù)進行了模型擬合,通過計算每種算法的準確率,交叉驗證得分和運行時間,將不同的算法進行了對比。
2.2.3 系統(tǒng)界面
該系統(tǒng)的界面是由VisualStudio2015實現(xiàn)的,所有頁面布局采用軟件自帶的模板,使所有頁面風格統(tǒng)一,簡約大方。該頁面主要分為導航欄、功能區(qū)和介紹。導航欄的設計在各個頁面中都是不變的,但是不同的用戶登錄會稍有不同。功能區(qū)的四個按鈕可以跳轉(zhuǎn)到本網(wǎng)站的四大主題功能,最下方為本研究的部分介紹,是三個靜態(tài)文本柵格。
2.2.4 系統(tǒng)說明
本網(wǎng)站主要有四大功能:數(shù)據(jù)分析過程展示、原始數(shù)據(jù)管理、時間序列數(shù)據(jù)管理以及時間序列預測結(jié)果展示。數(shù)據(jù)分析界面在Jupiter notebook中采用Python3做數(shù)據(jù)分析,導出為html界面,鏈接至系統(tǒng)而成,該界面完好地保留了Jupiter notebook中Markdown的精美外觀,雖然是個靜態(tài)界面,很好地展示了Python程序和其輸出結(jié)果;原始數(shù)據(jù)管理環(huán)節(jié)將原始數(shù)據(jù)處理好后,通過Python插入數(shù)據(jù)庫,再由網(wǎng)站訪問數(shù)據(jù)庫、提取數(shù)據(jù)并呈現(xiàn)在網(wǎng)站上,在這個界面中,可以進行原始數(shù)據(jù)的增加、刪除、查看和修改等操作;時間序列數(shù)據(jù)管理及展示為本系統(tǒng)的第二大功能。是通過Python插入數(shù)據(jù)庫后,網(wǎng)站通過讀取數(shù)據(jù)庫中數(shù)據(jù),并借助Echarts進行展示。網(wǎng)站中第一列為日期序列,第二列為當天發(fā)生的交通事故的總數(shù)。
2.2.5 系統(tǒng)權限說明
本系統(tǒng)設置了權限系統(tǒng),為了提高系統(tǒng)的安全性,本網(wǎng)站對不同角色的權限進行了設置。訪問本系統(tǒng)四大功能模塊時需要登錄,不同的用戶分配不同的角色,不同的角色對應不同的界面,享有不同的增加、刪除、查看和編輯權限。權限的設置主要在控制器中,通過對不同的行為設置角色驗證來實現(xiàn)。
本系統(tǒng)中,權限設計是通過“權限—角色—用戶”這一映射關系實現(xiàn)的。主要分為系統(tǒng)的角色管理界面和用戶管理界面,這兩個界面只有擁有Admin權限的人才可見以及進行創(chuàng)建、編輯、查看和刪除;擁有Leader或Manager角色的人可以對數(shù)據(jù)分析過程進行查看,對原始數(shù)據(jù)和時間序列數(shù)據(jù)進行增、刪、改、查,對于預測數(shù)據(jù)只能進行查看;僅擁有Police角色的人的權限更低,他們可以對數(shù)據(jù)分析進行查看,對原始數(shù)據(jù)進行增加和查看,對預測數(shù)據(jù)只能進行查看。
3 結(jié) 論
智慧城市和智慧交通是大勢所趨,這二者的建設不僅可以提高人們的居住環(huán)境,提升居住幸福感,還可以促進城市化建設,使城市更加宜居。隨著我國信息化建設不斷深入,警務機構的信息化意識不斷提高,信息收集和處理工作將會變得更加簡單且高效。與此同時,數(shù)據(jù)分析與挖掘領域也在飛速發(fā)展。在可以預見的未來,算法將會更加多樣化,分析和預測的精準度也會隨之提高?!盎ヂ?lián)網(wǎng)+警務+大數(shù)據(jù)”這一思想將會使警務資源得到更加合理且高效的分配,使道路更加安全便利,也使我們真正跨入大數(shù)據(jù)時代。
參考文獻:
[1] 李嘉慶,陳永剛.濰坊:110與12345聯(lián)動實現(xiàn)非警務警情有效分流 [N].人民公安報,2017–08–30.
[2] 王海燕,胡婷,劉際鵬.城市級公安警務實戰(zhàn)應用系統(tǒng)設計與實現(xiàn) [J].自動化技術與應用,2017,36(8):53-60.
[3] 郭敏.“互聯(lián)網(wǎng)+”北京市公安交通管理局警務管理模式研究 [D].北京:北京交通大學,2017.
[4] 陳雅,羅釗,劉敏.移動智慧化警務工作平臺雙向警情分析模式解析 [J].廣西警察學院學報,2017,30(2):75-78.
作者簡介:李嘉欣(1995-),女,漢族,北京人,本科。研究方向:數(shù)據(jù)分析。