程 明
(天津公安警官職業(yè)學(xué)院偵查系,天津300382)
?
公安大數(shù)據(jù)應(yīng)用的現(xiàn)狀及完善
程明
(天津公安警官職業(yè)學(xué)院偵查系,天津300382)
摘要:大數(shù)據(jù)應(yīng)用在案件偵破、社區(qū)治安、公共服務(wù)、交通監(jiān)管等方面都存在巨大的利用空間,從而幫助警務(wù)人員及時有效地預(yù)測險情,通過建立預(yù)測分析模型等方法,及時發(fā)現(xiàn)公共安全隱患,實現(xiàn)精準打擊。但是,大數(shù)據(jù)應(yīng)用不可避免地會引發(fā)信息安全、數(shù)據(jù)權(quán)利、知識產(chǎn)權(quán)、司法管轄等新的法律問題。為了能夠更好地運用大數(shù)據(jù)系統(tǒng),實現(xiàn)警務(wù)工作向更高端的數(shù)據(jù)化轉(zhuǎn)型,必須從技術(shù)、標準、法律、管理等多角度,依據(jù)國家法律與政策,結(jié)合公安工作實際,認清并解決大數(shù)據(jù)在實際應(yīng)用中的相關(guān)問題,以消除我國公安大數(shù)據(jù)在應(yīng)用方面的障礙。
關(guān)鍵詞:大數(shù)據(jù);公安工作;應(yīng)用;問題
關(guān)于“大數(shù)據(jù)”的定義,全球知名咨詢機構(gòu)麥肯錫公司在其研究報告《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)率的前沿》中這樣提出——“‘大數(shù)據(jù)’是指大小超出了典型數(shù)據(jù)庫軟件的采集、存儲、管理和分析等能力的數(shù)據(jù)集”①。該定義指出了大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別所在,這主要體現(xiàn)在資料數(shù)據(jù)的容量、規(guī)模等方面,更重要的是它能夠?qū)崿F(xiàn)在更短的時間內(nèi)對數(shù)據(jù)進行獲取、管理和處理,從而為決策提供服務(wù)性的咨詢意見。但事實上,大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)并不是割裂開的,其不僅是數(shù)據(jù)積累發(fā)展到一定程度后形成的海量數(shù)據(jù)存量,而且由于數(shù)據(jù)來源的豐富、全面化,“大數(shù)據(jù)”成為了“全數(shù)據(jù)”的代名詞。其特點包含以下幾個方面:第一,由于可存儲介質(zhì)的技術(shù)發(fā)展迅猛,許多實物信息都具備了轉(zhuǎn)為數(shù)據(jù)信息的可能,導(dǎo)致數(shù)據(jù)體量龐大,實現(xiàn)了質(zhì)的飛躍;第二,數(shù)據(jù)種類龐雜,分類日漸細微化,包括網(wǎng)絡(luò)信息,語音、視頻、圖片、地理位置信息等;第三,對數(shù)據(jù)的處理效率較高,可倚借日漸高效的數(shù)據(jù)處理能力,很容易找到數(shù)據(jù)中的印證點、交叉處,迅速捕獲、推導(dǎo)出新信息;第四,價值回報很高,免去了繁瑣、粗放型的處理方式,直接利用數(shù)據(jù)進行有效、精確的分析,就能帶來很高的收益。
目前,大數(shù)據(jù)正日益成為我國警務(wù)部門處理業(yè)務(wù)的重要“法寶”。對于公安警務(wù)工作中的信息數(shù)據(jù)進行探索,不再是傳統(tǒng)意義上的各個業(yè)務(wù)系統(tǒng)存儲在公安數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù),而是囊括了各種渠道、各種途徑產(chǎn)生的各種數(shù)據(jù),這些都應(yīng)歸納在大數(shù)據(jù)的范疇。公安機關(guān)負責社會管理和行政、司法的重要職責,必然承接大量的社會信息,必須做好數(shù)據(jù)收集和管理及應(yīng)用的技術(shù)建設(shè)和應(yīng)用拓展工作,才能使大數(shù)據(jù)技術(shù)的運用成為我國警務(wù)工作的常規(guī)手段與有力武器,以適應(yīng)新的工作習(xí)慣與思維,從而提高警務(wù)工作效率。
(一)注重細節(jié),為公安工作開辟新思路
過去,我國警務(wù)人員旨在實現(xiàn)公安工作科學(xué)化、專業(yè)化和規(guī)范化的目標,并通過不斷總結(jié)實際經(jīng)驗和交流學(xué)習(xí),形成的是一套依賴經(jīng)驗、設(shè)證、討論下的辦案思路[1]。這在過去不失為一套有效的工作模式,也存在其自身的優(yōu)勢,但在大數(shù)據(jù)時代的當下,日益增長的數(shù)據(jù)體量,不斷涌現(xiàn)的新奇形式,使得僅憑運用傳統(tǒng)模式已難以應(yīng)對現(xiàn)實。調(diào)查案(事)件真相的過程,往往需要進行一步步的設(shè)證推理,在過去,這種設(shè)證推理的進行方式,往往就是“隨機采樣”后,面對寥寥的證據(jù)和線索,憑借已有工作思路和辦案經(jīng)驗人為地選出一條線索,假定其為關(guān)鍵線索以開展進一步的調(diào)查工作。雖然這種模式很好地鍛煉了警務(wù)人員查找線索、整理線索、分析論證的能力,利于快速積累辦案經(jīng)驗,進一步促進工作效率的提高;但這種辦案模式實是條件不允許之時的無奈之舉,其本身存在著一定的局限性,該局限性和“隨機采樣”、經(jīng)驗主義的辦案思路直接相關(guān)。
首先,經(jīng)驗主義的設(shè)證推理假設(shè)起點帶有偶然性,缺乏較強的數(shù)據(jù)支撐,一旦出錯警務(wù)工作人員往往已經(jīng)先入為主地進入到了慣性思維,大量的人力物力將被浪費;其次,隨機采樣這種方式在解答未知的假設(shè)推理時將難以適用,而如果為了解答重新提出假設(shè),這無疑會形成一種惡性循環(huán)[2]。這兩點恰能說明為何有時的案件調(diào)查工作會難以避免地走進“死胡同”,原因就在于對一個經(jīng)驗主義的設(shè)證推理在心理上過度強化,以至于耗費了大量時間,選擇性地無視了其他關(guān)聯(lián)線索,卻搜尋不到新線索。面對上述弊端,通過利用大數(shù)據(jù)技術(shù),可以得到緩解甚至解決。其使案件的全面收集、分析工作實現(xiàn)最大化,對事件發(fā)展的走勢與場景復(fù)原能做出有科學(xué)根據(jù)和數(shù)據(jù)支撐的綜合判斷。以樣本模擬整體的思路,是對以經(jīng)驗為主導(dǎo)的工作思路的一種革命性的影響,“大數(shù)據(jù)”思維的充分運用,能解除隨機的經(jīng)驗判斷下“摸黑行走”的束縛,不僅有助于降低個人臆斷引發(fā)對事物研判錯誤的可能性,從而提高警務(wù)人員決策的準確性和科學(xué)性,而且這還會為公安工作帶來額外價值。一個典型的例子就是,美國的Xoom公司在2011年利用數(shù)據(jù)分析系統(tǒng)對新澤西地區(qū)“發(fā)現(xiàn)卡”匯款交易明細進行了整合分析,通過數(shù)據(jù)關(guān)聯(lián)性的整體評估,就成功發(fā)現(xiàn)了某犯罪集團正在實施詐騙的犯罪事實②。
大數(shù)據(jù)分析還在反腐領(lǐng)域大有功用。世界銀行副行長兼總會計師Chuck Mc Donough就曾力主將大數(shù)據(jù)應(yīng)用引入反腐領(lǐng)域。其認為,數(shù)據(jù)分析工具和技術(shù)可以用來對那些具有“潛在腐敗”風(fēng)險的交易進行定點檢查,從而幫助企業(yè)及早發(fā)現(xiàn)違法行為,企業(yè)的法律責任和風(fēng)險也可以由此得到一定的規(guī)避③。較之企業(yè),政府就更需要這樣的分析工具去預(yù)防與治理腐敗了。而今,政府利用大數(shù)據(jù)從體量龐大的數(shù)據(jù)中發(fā)掘涉腐信息的巨大優(yōu)勢,通過數(shù)據(jù)分析總結(jié)腐敗行為一般的行事規(guī)律和共同特征,為治腐方案提供決策依據(jù)。人民網(wǎng)就曾利用制作“反四風(fēng)地圖”,示范了大數(shù)據(jù)應(yīng)用顯示出的總結(jié)能力。該“地圖”是以1600余名被中紀委查處的官員和1000余件違紀的案件為數(shù)據(jù)樣本繪制而出。通過這張“地圖”我們可以清楚地看到,從比重上看,在占全國被通報案違紀類型首位,具體比重約為37.3%的公款違紀中,它的大部分被公款旅游所占據(jù)。同時令人震驚的是,公款違紀竟體現(xiàn)出地域化的特點,在全國因工作時間打牌、打麻將被通報的案例中,貴州、湖北、四川三省就占據(jù)了總數(shù)67.7%的比例,在因“涉酒”被通報的案例中,山東省就占到全國通報案例的十分之一;而就被通報對象構(gòu)成上看,基層干部所占的比重竟然達到78%[3],遠遠高于廳局級、縣處級干部。與人民網(wǎng)的小型數(shù)據(jù)樣本相比,中紀委定然有更加詳盡、系統(tǒng)的數(shù)據(jù)分析,能一目了然官員貪腐的伎倆,做到有的放矢。此外,另有國內(nèi)學(xué)者曾以10年為跨度,收集總結(jié)了我國當時的服刑人員曾入住旅館的相關(guān)數(shù)據(jù),其中包含五億多條在押人員的旅館入住信息數(shù)據(jù),六十五萬條服刑人員的個人信息。整理數(shù)據(jù)的結(jié)果顯示,凌晨一點到六點是在押人員入住旅館的高峰期,而且在凌晨三點達到峰值。顯然,這與正常的住店旅客存在很大差別。通過細化和排序在押人員的犯罪類型數(shù)據(jù),研究人員得出以下的犯罪罪名比重的數(shù)據(jù):涉嫌盜竊比重較大,占到26.34%,有些犯罪雖然沒有占到十分之一的權(quán)重,但是還是屬于頻發(fā)案件,如涉嫌尋釁滋事占到8.21%,涉嫌聚眾斗毆占到7.13%,涉嫌賭博占到6.72%,多為群體性犯罪。毫無疑問,上述分析統(tǒng)計結(jié)果啟示和指導(dǎo)了公安部門更有針對性地盤查和監(jiān)控,維護社會治安,預(yù)防和打擊犯罪。通過以上兩個范例我們可以看出大數(shù)據(jù)在發(fā)掘過去警務(wù)工作中“盲點”的作用不可忽視。經(jīng)過總結(jié)過去已有數(shù)據(jù),并結(jié)合常規(guī)數(shù)據(jù)的工作,我們可以發(fā)現(xiàn)這非常有利于探索警務(wù)工作的普遍規(guī)律,繼而為我國開展公安工作開辟新的思路。
(二)更新及時,緊密跟蹤案(事)件的變化脈絡(luò)
數(shù)據(jù)不僅有分析總結(jié)功能,還有記錄、跟進的作用。眾所周知,信息的時效性就是警務(wù)人員工作的生命線所在。在數(shù)據(jù)的收集、存儲、分析工具匱乏之際,可供參照與印證的數(shù)據(jù)與信息出現(xiàn)空白,分析與判斷上的偏差就不易察覺。因此,辦案信息往往會出現(xiàn)“失之毫厘,謬以千里”的蝴蝶效應(yīng),因為一個數(shù)據(jù)量的細微誤差,就改變了警務(wù)工作的重點與方向。這對于需要經(jīng)常應(yīng)對突發(fā)狀況,如危險品的擴散,犯罪團伙的預(yù)謀性犯罪,突發(fā)疾病災(zāi)害的秩序穩(wěn)定等,都是致命的問題。為避免此種狀況,長期以來公安部門采取過各種途徑確保數(shù)據(jù)的精確性,如制定嚴格的辦案手續(xù)與流程,使其免受污染,加強對警務(wù)人員的素質(zhì)素養(yǎng)培養(yǎng),提高知識水平等。但大數(shù)據(jù)時代下的解決方式,是一種完全另辟蹊徑、變革徹底的思路。大數(shù)據(jù)所具有的分析科學(xué)化、誤差率低的特點,可以增強信息分析的可信度,節(jié)省對冗雜數(shù)據(jù)進行篩選、反復(fù)確認的無效時間;大數(shù)據(jù)網(wǎng)絡(luò)所倚借的傳播途徑方便快捷,能幫助警務(wù)人員跑贏險情的發(fā)展。2013年4月15日發(fā)生的“波士頓爆炸案”中,在馬拉松比賽的終點處發(fā)生爆炸的兩枚炸彈造成了3人死亡,176人受傷的嚴重后果。案件經(jīng)過迅速偵查,犯罪嫌疑人目標鎖定在了兩名車臣裔美國人頭上。為更快獲取兩個嫌疑人的信息,美國偵查部門通過媒體和社交網(wǎng)站發(fā)出呼吁,請求知情的民眾提供相關(guān)線索,幫助警方將犯罪嫌疑人逮捕歸案。通過民眾的積極提供的大量的包括一些街頭照片、視頻的資料,警方及時獲取到了有效信息,從而在4月19日將犯罪嫌疑人成功抓獲。從該案件四天內(nèi)迅速結(jié)案的經(jīng)驗中,我們可以找到大數(shù)據(jù)分析在其中起到的舉足輕重的作用,那就是時效性與準確性的緊密結(jié)合,幫助辦案機關(guān)迅速捕獲有效信息。
(三)警情預(yù)測,助公安部門防患于未然
真正完善的數(shù)據(jù)分析系統(tǒng),應(yīng)該是不僅能整理舊故,抓住當下,還應(yīng)該能把握未來。對不確定性事件發(fā)生概率的準確把握,就是公安機關(guān)決斷是否投入警力資源的關(guān)鍵所在?!按蚍澜Y(jié)合,重在預(yù)防”是在公安職能要求下,對社會犯罪工作提出的新任務(wù)重心。過去,由于缺乏全面的數(shù)據(jù)了解,職能在險情過后去追究社會防控網(wǎng)絡(luò)的漏洞,做亡羊補牢的工作,警情的預(yù)測仍是建立在小型數(shù)據(jù)庫的初級分析階段,所總結(jié)出的事件因果關(guān)系呈線條化、單一化,對日后的犯罪預(yù)防作用有限。我國境內(nèi)在2014年3月到7月期間相繼發(fā)生了5起恐怖襲擊事件,并造成大量警務(wù)人員和無辜群眾在恐怖襲擊事件中傷亡的嚴重后果。其中,僅“5·22事件”一起就有31人死亡、90余人受傷。從以上數(shù)據(jù)可以得知,和案件的偵破相比,對犯罪的預(yù)防顯得更為重要和珍貴。而隨著我國犯罪類型與途徑的日益復(fù)雜化,動機的多樣化,我國的犯罪防范工作中存在的滯后性亟待解決,社會秩序的穩(wěn)定和人民生命財產(chǎn)的安全急需擁有更為先進的險情預(yù)警機制。因此,引入數(shù)據(jù)分析工具,將是公安部門根本性地變革防范工作機制的良好契機。警務(wù)人員不用再在事件處于危機關(guān)口時再去回溯源頭,在時間軸上向后找尋,而有條件檢測出與危險存在較強關(guān)聯(lián)的信息的出現(xiàn),并通過對關(guān)聯(lián)信息的跟蹤證實,促進對犯罪的防微杜漸,將危險發(fā)生概率降到最低。根據(jù)報道顯示,自2003年起,美國南加州阿罕布拉市警方在打擊盜劫民宅和機動車的案件中,名為“PREDPOL”的計算機軟件的應(yīng)用使得在短短半年內(nèi)全市案發(fā)率下降32%,收效甚巨。這個軟件的原理就是采用大數(shù)據(jù)的思路,以預(yù)報地震的模型作為基礎(chǔ),用計算來綜合預(yù)測出犯罪可能發(fā)生的時間地點,從而為公安機關(guān)判斷和部署相應(yīng)的工作提供了極其重要的幫助。上述案例再次證明了公安部門工作與數(shù)據(jù)分析間結(jié)合所產(chǎn)生的強大效果與威力。大數(shù)據(jù)的預(yù)警功能,需要得到我國公安部門的進一步挖掘與利用。
(一)公安大數(shù)據(jù)應(yīng)用的現(xiàn)狀
目前公安系統(tǒng)在為信息化數(shù)據(jù)的建設(shè)而提供了硬件設(shè)施與配套結(jié)構(gòu)體系,這些系統(tǒng)功能和作用不同,主要包括進行接處警與指揮調(diào)度、案事件管理,還有獲取警用地理信息、進行視頻監(jiān)控等。該體系建設(shè)所取得的進步,也促進了數(shù)據(jù)的日積月累,信息體量迅速升級。但在硬件設(shè)施得到保障的同時,還需要對數(shù)據(jù)篩選分析能力、信息的關(guān)聯(lián)性判斷等專業(yè)技術(shù)性工作進行加強。為了解決信息傳播形式中圖像、文字、電子信息等半結(jié)構(gòu)化數(shù)據(jù)的整理問題,公安機關(guān)將數(shù)據(jù)載體全都電子化和可存儲化,還引入了“云計算”方式,對數(shù)據(jù)進行虛擬存儲,由此加強信息的聯(lián)結(jié)與整合。通過利用分布式的處理方式對這些數(shù)據(jù)的分析,直接為公安機關(guān)的決策指揮提供信息來源的支撐,從而加強治安防控的能力。另外,我國公安系統(tǒng)還利用其規(guī)范化對公安警務(wù)人員的管理,防范公安系統(tǒng)內(nèi)部出現(xiàn)腐敗、瀆職等嚴重危及公安管理秩序的事件。目前,我國公安系統(tǒng)中已出現(xiàn)合理利用分析工具的范例。例如:天津市公安系統(tǒng)經(jīng)過幾年的建設(shè),在數(shù)據(jù)整合與共享方面做了大量的工作,市局信息中心以中轉(zhuǎn)庫,匯集庫,標準庫,專題庫等不同形式,建成了市局綜合數(shù)據(jù)庫,匯集了包含交通、人口、車輛、網(wǎng)吧、卡口、衛(wèi)生、安全、旅游、國土信息資源在內(nèi)的400類119億條的公安內(nèi)部業(yè)務(wù)數(shù)據(jù)和社會信息資源,為指揮部門開展分析研判,為一線實戰(zhàn)部門進行案情分析、人員排查、比對關(guān)聯(lián)等提供了強有力的服務(wù)與支持。各類數(shù)據(jù)資源通過數(shù)據(jù)平臺整合、清理、標準化后為警務(wù)信息綜合應(yīng)用平臺、DQB平臺、警用地理信息系統(tǒng),移動警務(wù)系統(tǒng)等多個系統(tǒng)提供數(shù)據(jù)支撐。通過請求服務(wù)系統(tǒng)為各警種提供數(shù)據(jù)調(diào)用的通道,使掌握的數(shù)據(jù)在更大的范圍內(nèi)開展共享與使用。據(jù)了解,全國各地也紛紛開展大數(shù)據(jù)整合與應(yīng)用研究,譬如蘇州開發(fā)使用的犯罪預(yù)測系統(tǒng)可以通過對以往案發(fā)數(shù)據(jù)、人口地理信息、甚至天氣等多種數(shù)據(jù)進行分析來預(yù)測未來指定時間段內(nèi)某地域發(fā)案概率等。
(二)公安大數(shù)據(jù)應(yīng)用中的若干問題
根據(jù)我國公安大數(shù)據(jù)的運用和發(fā)展情況,它還處于起步階段,還不能構(gòu)成完整的數(shù)據(jù)支撐體系,在采集范圍與渠道、數(shù)據(jù)收集的技術(shù)手段、運行機制及各方權(quán)益保障方面還有許多空白和難點,總結(jié)下來主要包含:
1.整合的數(shù)據(jù)種類以傳統(tǒng)數(shù)據(jù)為主,大量的新型數(shù)據(jù)尚未納入視野。隨著公安對于信息化建設(shè)的不斷重視和深化,在近幾年可利用的信息量明顯增多,數(shù)據(jù)種類日益豐富,但在整合與共享數(shù)據(jù)的過程中,部門與部門之間還是以共享存儲在系統(tǒng)數(shù)據(jù)庫中的傳統(tǒng)數(shù)據(jù)為主,而系統(tǒng)應(yīng)用過程中產(chǎn)生的日志類信息、在業(yè)務(wù)中獲取的其他文本類,語言類、視頻類、位置類等新興數(shù)據(jù)尚未作為整合與共享的主要內(nèi)容,導(dǎo)致大量數(shù)據(jù)缺失或采集獲取的不及時,使得可供分析研判的數(shù)據(jù)范圍狹窄,規(guī)模不夠。
2.處理分析能力過于單一,對大數(shù)據(jù)挖掘尚未形成有效的手段。大數(shù)據(jù)處理的難點是對非結(jié)構(gòu)化的數(shù)據(jù)進行分析與挖掘,而當前的信息處理中,傳統(tǒng)的數(shù)據(jù)分析工具和分析方法還是占據(jù)主導(dǎo)地位,在處理很多數(shù)據(jù)時只是簡單的累加,比對和單一模式的計算,信息的內(nèi)在關(guān)聯(lián)挖掘不足,不能完全滿足公安工作的需要,對非結(jié)構(gòu)化的數(shù)據(jù)處理還沒有建設(shè)專門的平臺,開發(fā)專門的工具,在數(shù)學(xué)模型等方面技術(shù)創(chuàng)新不夠,信息應(yīng)用效率和水平還處于較低的水平。
3.大數(shù)據(jù)采集、整合、應(yīng)用等多個環(huán)節(jié)的標準缺失尚未形成有效的工作機制。從當前的工作情況來看,對大數(shù)據(jù)的采集、整合、應(yīng)用都只是技術(shù)部門在單項進行規(guī)劃和研究,與作戰(zhàn)部門和警種基層業(yè)務(wù)沒有建立完整的工作流程及工作機制,沒形成雙向的互動,導(dǎo)致警務(wù)工作在很大程度上還是借助傳統(tǒng)的經(jīng)驗,開展個案化的因果分析,基層部門不了解數(shù)據(jù)采集和整合的標準規(guī)范,也不掌握利用大數(shù)據(jù)進行分析的方法和途徑,更提不出有效的數(shù)據(jù)應(yīng)用需求,對于數(shù)據(jù)的不敏感,又造成很多鮮活的第一手數(shù)據(jù)采集不夠及時有效,一些新的情況無法實時納入分析視野。從整體上來說,在數(shù)據(jù)管理上缺乏成體系的專門機構(gòu)及專業(yè)人員進行標準制定和規(guī)范管理。
4.目前大數(shù)據(jù)在公安工作中的應(yīng)用雖然已取得了初步的進展,但是我們必須意識到,正是大數(shù)據(jù)的應(yīng)用存在著對開展公安工作的巨大潛在價值和亟待被推廣化的趨勢,導(dǎo)致了對大數(shù)據(jù)的保護與規(guī)范成為我們必須同時關(guān)注的問題。我們最終目的是不斷拓展大數(shù)據(jù)收集與處理的廣度與深度,使大數(shù)據(jù)應(yīng)用沿著穩(wěn)定健康的方向發(fā)展。在這一過程中,不可避免的會涉及到各種問題,看似針對不同的主體,實則命脈相關(guān)。對于公民個人隱私和個人信息的保護問題,對于商業(yè)秘密的保護和對商業(yè)公平競爭的鼓勵方法,對于政府如何優(yōu)化實踐政府職能的問題,對于國家秘密的保守和維護國家安全的問題都是需要我們認真考慮的問題。如何處理好這樣一對矛盾,是決定大數(shù)據(jù)應(yīng)用能否在公安工作中發(fā)揮應(yīng)有作用的關(guān)鍵問題。
(三)建立并完善公安大數(shù)據(jù)應(yīng)用體系的措施
結(jié)合大數(shù)據(jù)的發(fā)展趨勢,公安部門的應(yīng)用和支撐體系應(yīng)該從基礎(chǔ)架構(gòu)、采集整合、分析處理、數(shù)據(jù)應(yīng)用以及機制標準等幾個方面進行完善,并切實將改革措施推進落實,才能確保取得實效,服務(wù)警務(wù)工作實戰(zhàn)。
1.明確技術(shù)架構(gòu)頂層設(shè)計,搭建大數(shù)據(jù)管理平臺
大數(shù)據(jù)建設(shè)離不開云計算,二者密切相關(guān),為此應(yīng)該在原有的信息化管理平臺的基礎(chǔ)上,進一步拓展云服務(wù)等功能,推動并實現(xiàn)共享共建軟硬件、服務(wù)和信息資源的工作,從而提高大數(shù)據(jù)對海量數(shù)據(jù)的存儲能力和處理能力,為搭建大數(shù)據(jù)管理平臺提供優(yōu)質(zhì)的運行保障和硬件支持,確保數(shù)據(jù)支撐體系建設(shè)的根基牢固。
2.拓展數(shù)據(jù)采集渠道和范圍,強化“三個整合”
所謂三個整合,一是要整合公安系統(tǒng)內(nèi)部數(shù)據(jù)信息,最大限度挖掘可整合數(shù)據(jù)種類,破除數(shù)據(jù)壁壘,把分散在各個部門、各個警種的業(yè)務(wù)系統(tǒng)信息統(tǒng)一歸集到信息中心,范圍可以考慮拓展電子圍欄、視頻圖像、車輛軌跡、PDT軌跡、民警通過各業(yè)務(wù)應(yīng)用系統(tǒng)查詢、調(diào)用的行為日志等非結(jié)構(gòu)化數(shù)據(jù),同時,也要進一步融合更多種類的結(jié)構(gòu)化數(shù)據(jù),通過警綜平臺,社區(qū)警務(wù)平臺、移動警務(wù)系統(tǒng)及各業(yè)務(wù)應(yīng)用系統(tǒng)開展更全面的信息采集錄入工作,作為大數(shù)據(jù)來源的重要補充;二是要整合社會信息資源,充分利用行政、網(wǎng)絡(luò)、個人等各方面信息優(yōu)勢,提供有償購買和資源提供等多種方式,促進社會的信息融通,從而有效拓寬數(shù)據(jù)的收集渠道。例如:從互聯(lián)網(wǎng)上抓取的海量信息、微信朋友圈、QQ群、網(wǎng)商,調(diào)動物流、電信、水電煤氣、社保衛(wèi)生等各種企事業(yè)單位、行業(yè)協(xié)會和中介組織等的信息優(yōu)勢,形成全民采集,全民共建的大數(shù)據(jù)匯集效應(yīng)[4];三是加強與其他省市公安機關(guān)數(shù)據(jù)信息交換工作,以大數(shù)據(jù)整合與應(yīng)用協(xié)作會議等方式,組織各個省市簽訂數(shù)據(jù)交換共享合作協(xié)議,以實體數(shù)據(jù)交換,相互開通授權(quán),線下協(xié)查機制等不同方式實現(xiàn)數(shù)據(jù)的共享應(yīng)用。通過以上三個方面,形成數(shù)據(jù)全警采,全警錄,全警用的新局面。
3.數(shù)據(jù)處理體系的建立,需要堅持四個步驟
首先是數(shù)據(jù)的預(yù)處理,涉及數(shù)據(jù)的存儲化、電子化后的導(dǎo)入。信息中心規(guī)劃建設(shè)的信息資源服務(wù)平臺,主要實現(xiàn)對全部數(shù)據(jù)的同步、標準化和共享過程的管理。以查詢、核查、比對、下載等服務(wù)接口方式,對數(shù)據(jù)進行封裝,相應(yīng)其他系統(tǒng)的數(shù)據(jù)應(yīng)用需求,在不同實體數(shù)據(jù)的前提下,滿足業(yè)務(wù)應(yīng)用的需要,避免數(shù)據(jù)多出存儲帶來的問題[5]。第二步,是對數(shù)據(jù)的分組統(tǒng)計。進行科學(xué)的數(shù)據(jù)分類和分組,建立公安數(shù)據(jù)目錄,綜合資源庫,數(shù)據(jù)倉庫、數(shù)據(jù)主題數(shù)據(jù)庫,從而達到可以智能檢索海量數(shù)據(jù)的效果。第三步,是提高和完善數(shù)據(jù)的運算分析系統(tǒng)。建立分布式數(shù)據(jù)庫,利用分布式計算集群完成對數(shù)據(jù)庫內(nèi)關(guān)聯(lián)信息的普通類分析或?qū)m椃治?,以滿足快速整理總結(jié)的需要。第四步,是根據(jù)現(xiàn)有的計算和分析結(jié)果建立模型,解決高級別數(shù)據(jù)分析的需求,真正實現(xiàn)數(shù)據(jù)的實地運用,從而達到利用數(shù)據(jù)得出預(yù)測結(jié)果,完善靜物預(yù)測流程,暢通公安數(shù)據(jù)技術(shù)服務(wù)的效果,從而為警務(wù)工作提供宏觀指導(dǎo)和決策支持。
4.轉(zhuǎn)變數(shù)據(jù)應(yīng)用方式,開展“三類應(yīng)用”
一是對文本信息的語義分析類應(yīng)用,對采集的情報和互聯(lián)網(wǎng)發(fā)帖信息進行分析和監(jiān)控,根據(jù)重點詞組頻率進行自動的篩選,供人工判斷實現(xiàn)對于互聯(lián)網(wǎng)的輿情分析、情報線索采集分析;二是對于海量非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用,例如圖片、視頻、語音、文本等信息進行快速的檢索調(diào)取,例如:利用卡口車輛的位置、顏色、通過時間等信息進行套牌車排查測試,在短時間內(nèi)提取到淹沒于大量數(shù)據(jù)中的微觀細節(jié)和異常情況,對車輛實現(xiàn)了快速定位,變傳統(tǒng)的被動處理為主動發(fā)現(xiàn),提升了公安機關(guān)偵查破案、預(yù)知預(yù)警的能力[6];三是利用列存數(shù)據(jù)庫和內(nèi)存數(shù)據(jù)等工具,對大量結(jié)構(gòu)化信息進行復(fù)雜的運算。例如:通過對于車輛卡口數(shù)據(jù)的分析,多次在短時間內(nèi)通過同一路口的車輛、輔助以車輛基礎(chǔ)數(shù)據(jù)的配合,可以實現(xiàn)同行車輛、同行車隊、車輛異常軌跡的分析,甚至可以分析出每天有多少個婚禮、多少個葬禮的舉辦。通過對巡邏車的定位信息,將警員巡邏軌跡與案件軌跡進行綜合疊加,綜合分析出巡控路線和點位與發(fā)案密度之間的關(guān)聯(lián)度,從而實現(xiàn)對于巡邏路線的針對性調(diào)整,降低發(fā)案率。
5.協(xié)調(diào)開展機制建設(shè),從“三個層面”保障體系建設(shè)
一是從省市一級公安機關(guān)層面做大做強信息中心,并且以此為信息樞紐,構(gòu)建全局信息數(shù)據(jù)專職部門,組件專業(yè)團隊開展技術(shù)工作,作為全局信息采集管理的龍頭和牽引,健全工作機制,規(guī)范采集流程,制定信息數(shù)據(jù)采集、管理、應(yīng)用等方面的規(guī)范標準,界定民警的工作職責,任務(wù)分工和考核獎懲;二是從縱向?qū)用?,建立“手段涉密,?shù)據(jù)不涉密”的重要理念,以信息化領(lǐng)導(dǎo)小組的名義,整合技偵、國保、文保、網(wǎng)監(jiān)等單位的海量數(shù)據(jù),通過簽訂任務(wù)書、責任狀等方式,使各級領(lǐng)導(dǎo)充分認識數(shù)據(jù)整合工作對于公安整體工作的重要意義,將數(shù)據(jù)整合工作納入全局的績效考核。鼓勵各分局、直屬單位采取各種形式的協(xié)調(diào)社會信息資源,給予一定考核加分獎勵[7];三是從橫向?qū)用嫱苿邮屑壵块T出臺政策,為了反恐、維穩(wěn)的工作需要,各大部門的數(shù)據(jù)應(yīng)向公安部門匯集,力求建立各個橫向數(shù)據(jù)中心之間和各級縱向政務(wù)數(shù)據(jù)庫之間進行數(shù)據(jù)的及時交換、整合、比對機制,并實現(xiàn)對它的更新和維護機制。同時,以大數(shù)據(jù)或者警務(wù)機制論壇等方式,定期組織技術(shù)專家和各部門業(yè)務(wù)專家進行深入交流,從豐富的實戰(zhàn)經(jīng)驗出發(fā),在現(xiàn)有的數(shù)據(jù)基礎(chǔ)上,形成有效的大數(shù)據(jù)應(yīng)用模型,創(chuàng)造良好的互動機制。
大數(shù)據(jù)時代已經(jīng)來到我們身邊,數(shù)據(jù)本身并不會增加任何價值,其主要效能體現(xiàn),在如何處理、分析和利用這些數(shù)據(jù)[8],公安機關(guān)要順應(yīng)發(fā)展趨勢,抓住發(fā)展機遇,應(yīng)用大數(shù)據(jù),依靠大數(shù)據(jù),讓數(shù)據(jù)驅(qū)動決策,讓數(shù)據(jù)支持實戰(zhàn),讓數(shù)據(jù)服務(wù)管理,全面深化警務(wù)改革,推動公安工作再上新臺階。
注釋:
①麥肯錫咨詢公司2011年發(fā)布名為《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿》的科研報告。載于http://www.docin.com/p-734982709.html.2012-6-28-25-57.互聯(lián)網(wǎng)之家,2015年10月18日登陸.
②英特爾IT中心網(wǎng)站資料,載于http://baike.so.com/doc/5372887.html,2013-04-15.
③云計劃第一門戶發(fā)布的《世行運營總監(jiān):利用大數(shù)據(jù)分析反腐敗》,2013年3月28日,載于http://cio.zdnet.com.cn/cio/2013/0328/2150842.shtml,2015-01-29.
參考文獻:
[1]魏婧楠.大數(shù)據(jù)時代天津公安信息化建設(shè)研究[D].天津大學(xué)碩士學(xué)位論文數(shù)據(jù)庫.2013.
[2][3]張鶴飛.大數(shù)據(jù)技術(shù)與公安工作:應(yīng)用與挑戰(zhàn)[J].北京警察學(xué)院學(xué)報,2015,(2).
[4]馮冠籌.大數(shù)據(jù)時代實施預(yù)測警務(wù)探究[J].廣東公安科技,2014,(1).
[5]徐子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].桂林:廣西師范大學(xué)出版社,2015.168-180.
[6]梅建明.論反恐數(shù)據(jù)挖掘[J].中國人民公安大學(xué)學(xué)報(社會科學(xué)版),2007,(2).
[7]吳成良,谷棣.棱鏡門折射大數(shù)據(jù)時代喜與憂[N].環(huán)球時報,2013-06-28(B05).
[8]傅志華.大數(shù)據(jù)的前世今生——大數(shù)據(jù)特征與發(fā)[DB/OL].互聯(lián)網(wǎng)數(shù)據(jù)中心,http://www.36dsj.com/archives/14256.2015-09-29.
(責任編輯:宋波)
Some Issues in the Application of Big Data Technologies of Public Security
CHENG Ming
(Department of Criminal Investigation,Tianjin Public Security Professional College,Tianjin 300191,China)
Abstract:There is potential value for the bigdata technologies tobe used in the area ofinvestigation,communityservices,public service,traffic control,and soon.Police officers can predict the danger in a timelyand effective way,discover the hidden dangers of public security in time and achieve precise strike by establishing prediction analysis model.However,the application of the big data technologies itself gives rise to some new legal problems such as information security,data rights,intellectual property,and jurisdiction.To make full use ofthe bigdata systemand turn policingwork intoa higher level,we should identifyand solve problems related to big data in practical application by taking the points of the technology,standard,the lawand the management,obeyingthe lawand the policyofour country,and combiningwith the actual condition ofthe policing,toeliminate the obstacles in the application ofbigdata technologies.
Key words:the application ofbigdata technologies;policing;value and problem
中圖分類號:D922.14
文獻標識碼:A
文章編號:1674-828X(2016)02-0094-05
收稿日期:2016-01-10
基金項目:天津市公安局“公安大數(shù)據(jù)應(yīng)用與法律保障的研究”的階段性成果,項目編號:2014KYSJJY025。
作者簡介:程明,男,天津公安警官職業(yè)學(xué)院偵查系助教,主要從事刑事偵查理論與實踐研究。