陳愷迪
(中國人民公安大學(xué),北京 100038)
根據(jù)開放知識基金會(Open Knowledge Foundation)的定義,開放數(shù)據(jù)是指能夠被免費使用、重復(fù)使用并能夠被任何人重新分發(fā)(redistributed)的數(shù)據(jù)[1]。得益于互聯(lián)網(wǎng)和數(shù)據(jù)技術(shù)的發(fā)展,當(dāng)前開放數(shù)據(jù)在各領(lǐng)域得到了廣泛應(yīng)用。在政府行政領(lǐng)域,各國政府都在積極開展數(shù)據(jù)開放實踐,建立屬于本國的數(shù)據(jù)開放平臺以公布適合開放的、能夠被重復(fù)使用的數(shù)據(jù)。
數(shù)據(jù)開放與信息公開有所區(qū)別。與數(shù)據(jù)開放相比,信息公開是政府的單方面行為,而數(shù)據(jù)開放強調(diào)政府利用信息技術(shù)和服務(wù)平臺,主動向公眾提供無需特別授權(quán)和可被機器讀取、能夠再次開發(fā)利用的原始數(shù)據(jù)。數(shù)據(jù)開放是一種數(shù)據(jù)的流動,能夠發(fā)現(xiàn)更多有價值的信息。與信息公開主要是一種行政行為不同,數(shù)據(jù)開放的目的在于利用[2],即讓外部用戶能夠使用這些數(shù)據(jù),由此政府可以從民眾的才智中受益,不斷提高政策制定和執(zhí)行的水平。雖然當(dāng)前民眾獲取數(shù)據(jù)的渠道很多,但是政府?dāng)?shù)據(jù)由于其規(guī)模、廣度和權(quán)威性的不同而具有特別重要的價值[3]589。
作為政府?dāng)?shù)據(jù)的一部分,警務(wù)數(shù)據(jù)對于研究和處理與犯罪和警務(wù)相關(guān)的社會問題尤為重要,將警務(wù)數(shù)據(jù)與其他領(lǐng)域的開放數(shù)據(jù)相結(jié)合能夠釋放出警務(wù)數(shù)據(jù)的巨大價值。2015年,我國發(fā)布《促進大數(shù)據(jù)發(fā)展行動綱要》,指出大數(shù)據(jù)應(yīng)用能夠揭示傳統(tǒng)技術(shù)方式難以展現(xiàn)的關(guān)聯(lián)關(guān)系,推動政府?dāng)?shù)據(jù)開放共享,促進社會事業(yè)數(shù)據(jù)融合和資源整合,將極大提升政府整體數(shù)據(jù)分析能力,為有效處理復(fù)雜社會問題提供新的手段[4]。通過對北京、上海、深圳等十幾個警務(wù)門戶網(wǎng)站和政府?dāng)?shù)據(jù)開放平臺進行梳理,目前,我國在國家、省、市各級公安機關(guān)已建立自己的警務(wù)門戶網(wǎng)站,但絕大多數(shù)網(wǎng)站都以警務(wù)信息公開為主,部分網(wǎng)站的數(shù)據(jù)公開模塊公布的數(shù)據(jù)類型單一,數(shù)據(jù)量小且以靜態(tài)的數(shù)字或簡單的統(tǒng)計為主。例如,公安部網(wǎng)站的信息公開模塊主要通過文章來呈現(xiàn)數(shù)據(jù),各類數(shù)據(jù)未作區(qū)分且以匯總類數(shù)據(jù)為主。與之相似,大多經(jīng)濟發(fā)達地區(qū)的省、市公安機關(guān)門戶網(wǎng)站也存在這一現(xiàn)象。即便部分網(wǎng)站設(shè)立數(shù)據(jù)開放模塊并接入政府?dāng)?shù)據(jù)開放平臺,相關(guān)主題數(shù)據(jù)仍是以信息公開的內(nèi)容為主。
雖然我國的警務(wù)門戶網(wǎng)站建設(shè)總體上處于信息公開階段,但警務(wù)數(shù)據(jù)開放在許多國家已經(jīng)進入實踐并取得一定經(jīng)驗。例如,2010年英國政府創(chuàng)建“開放政府牌照”(Open Government License),旨在授予用戶使用開放數(shù)據(jù)的權(quán)限,同時建立警務(wù)數(shù)據(jù)開放網(wǎng)站,允許用戶訪問多種類型的警務(wù)數(shù)據(jù)[5]97。為了利用數(shù)據(jù)和技術(shù)來增進社區(qū)信任,2015年8月奧巴馬政府發(fā)起警務(wù)數(shù)據(jù)倡議(Police Data Initiative),希望通過此舉來增加警務(wù)部門的影響力和民眾對警務(wù)部門的信任度[6]。根據(jù)警務(wù)數(shù)據(jù)倡議,目前美國形成了一個旨在促進主要執(zhí)法部門、科技工作者和研究人員參與到社區(qū)合作中,強化以信任、責(zé)任和創(chuàng)新為基礎(chǔ)的公共安全的執(zhí)法組織,該組織涵蓋120多個執(zhí)法部門[7]。
為此,本文將對國外比較成熟的警務(wù)數(shù)據(jù)開放平臺展開研究,以期為我國警務(wù)數(shù)據(jù)開放平臺的建設(shè)提供借鑒。
本文的研究對象為警務(wù)數(shù)據(jù)開放平臺。國外學(xué)界對于政府開放數(shù)據(jù)的系統(tǒng)多使用“開放數(shù)據(jù)門戶網(wǎng)站”(Open Data Portal)這一概念。開放數(shù)據(jù)門戶網(wǎng)站是指一套用來收集多源異構(gòu)數(shù)據(jù),在用戶友好的儀表板(User-friendly Dashboard)上公開數(shù)據(jù),并提供應(yīng)用程序編程接口(API)供用戶瀏覽和下載數(shù)據(jù)的基于網(wǎng)絡(luò)的系統(tǒng)(Web-based System)[3]593。由于國內(nèi)學(xué)者通常將政府網(wǎng)站內(nèi)開放數(shù)據(jù)的系統(tǒng)稱為政府?dāng)?shù)據(jù)開放平臺,本文將應(yīng)用在警務(wù)領(lǐng)域的數(shù)據(jù)開放系統(tǒng)統(tǒng)稱為警務(wù)數(shù)據(jù)開放平臺。
國內(nèi)學(xué)者對于警務(wù)數(shù)據(jù)開放平臺的研究仍較少。張寧以上海等8個城市的公安局在政府?dāng)?shù)據(jù)開放平臺開放的公安數(shù)據(jù)為研究樣本,從開放的數(shù)量、主題等方面對這些數(shù)據(jù)進行研究。[8]但是作為研究樣本的數(shù)據(jù)絕大部分仍然屬于信息公開的范疇,只是信息公開的內(nèi)容以數(shù)據(jù)集的形式存在。阮重駿通過比較中美兩國的犯罪數(shù)據(jù)公開,得出我國目前需要公開更多樣的更加全面的統(tǒng)計數(shù)據(jù),建立交互式的犯罪數(shù)據(jù)公開平臺。[9]但是作為研究對象的數(shù)據(jù)和系統(tǒng)主要為國家層面的數(shù)據(jù)和系統(tǒng),城市層面的犯罪數(shù)據(jù)公開僅提及了辛辛那提市警察部門在其交互式網(wǎng)站的的數(shù)據(jù)公開,且數(shù)據(jù)內(nèi)容只包含犯罪數(shù)據(jù)。
目前世界范圍內(nèi)很多國家和地區(qū)設(shè)立了警務(wù)數(shù)據(jù)開放平臺,但平臺建設(shè)水平和完善程度參差不齊。本文從政府?dāng)?shù)據(jù)開放水平較高的英國、美國和澳大利亞①根據(jù)萬維網(wǎng)基金會(World Wide Web Foundation)提供的世界開放數(shù)據(jù)晴雨表(Open Data Barometer),英國、澳大利亞和美國依得分從高到低分別處于世界第2位、第3位和第9位。從榜單中得分前10位的國家來看,上述3個國家在警務(wù)數(shù)據(jù)開放平臺建設(shè)上有著更為豐富的實踐,而且3個國家在政府?dāng)?shù)據(jù)開放平臺建設(shè)上的豐富實踐使得它們常被國內(nèi)學(xué)者選作政府?dāng)?shù)據(jù)開放的研究對象。參見杜荷花:《國外政府?dāng)?shù)據(jù)開放平臺隱私保護政策的考察與借鑒》.載《圖書館建設(shè)》2020年第3期。邸弘陽,任思琪:《政府?dāng)?shù)據(jù)公開網(wǎng)絡(luò)平臺的數(shù)據(jù)管理與利用方式研究》載《圖書館雜志》2017年第1期。選擇若干警務(wù)數(shù)據(jù)開放平臺作為研究對象,包括英國國家警務(wù)數(shù)據(jù)開放平臺,美國的9個建設(shè)較為完善的城市一級警務(wù)數(shù)據(jù)開放平臺,澳大利亞的6個州一級警務(wù)數(shù)據(jù)開放平臺和北部領(lǐng)地警務(wù)數(shù)據(jù)開放平臺(見表1)??傮w而言這些平臺的運行時間較長,迭代次數(shù)較多,數(shù)據(jù)較為豐富。
表1:平臺基本情況
借鑒國內(nèi)外學(xué)者對于政府?dāng)?shù)據(jù)開放平臺的豐富研究,本文將從3個角度對上述警務(wù)數(shù)據(jù)開放平臺的建設(shè)現(xiàn)狀進行梳理和分析:一是平臺設(shè)立層級的角度;二是平臺數(shù)據(jù)的角度,包括數(shù)據(jù)的數(shù)量、主題、隱匿處理、更新和下載格式;三是平臺功能的角度。
3個國家警務(wù)數(shù)據(jù)開放平臺設(shè)立的層級有所差別。英國主要通過英國國家警務(wù)數(shù)據(jù)開放平臺公開警務(wù)數(shù)據(jù)。雖然少數(shù)城市或地區(qū)也建立了警務(wù)數(shù)據(jù)開放平臺,但模塊較少且部分平臺直接接入國家警務(wù)數(shù)據(jù)開放平臺。澳大利亞的警務(wù)數(shù)據(jù)開放平臺基本建立在州這一層面,本文調(diào)查的6個州都在自己的警務(wù)網(wǎng)站上設(shè)有專門的開放數(shù)據(jù)模塊,北部領(lǐng)地也有屬于自己的警務(wù)數(shù)據(jù)開放平臺,但在城市這一層級并沒有設(shè)立警務(wù)數(shù)據(jù)開放平臺。美國警務(wù)數(shù)據(jù)平臺主要設(shè)立在城市一級,本文研究的美國9個城市的警務(wù)數(shù)據(jù)開放平臺可以分為兩類:一類是在警局自有網(wǎng)站的基礎(chǔ)上設(shè)立Data或Open Data模塊,然后根據(jù)自身需要設(shè)置具體模塊及功能;另一類是將數(shù)據(jù)接入本級政府已有的政府?dāng)?shù)據(jù)開放平臺,依托城市政府?dāng)?shù)據(jù)開放平臺來公開數(shù)據(jù)(如紐約市和洛杉磯市)。比較而言,前者讓警務(wù)部門擁有更大的自由度,可以更加自主地選擇展示的內(nèi)容和展示的方式,但不同平臺之間的差異明顯,給不同城市的數(shù)據(jù)整合帶來較大困難;后者采用統(tǒng)一的平臺和格式,警務(wù)部門僅需上傳數(shù)據(jù)即可,但是平臺的界面和數(shù)據(jù)展示的模式較為單一。
通過以上比較分析發(fā)現(xiàn),警務(wù)數(shù)據(jù)開放平臺的設(shè)立層級與相應(yīng)警務(wù)部門管轄的人口、地域范圍以及行政區(qū)劃等因素密切相關(guān),由于前述因素的不同,3個國家的警務(wù)數(shù)據(jù)開放平臺分別建立在3個不同的行政區(qū)劃層面。
警務(wù)數(shù)據(jù)開放平臺依托不同的網(wǎng)站建立,設(shè)立在警務(wù)網(wǎng)站內(nèi)部的警務(wù)數(shù)據(jù)開放平臺可以個性化地定制平臺的模塊。在本文調(diào)查的警務(wù)數(shù)據(jù)開放平臺中,比較常見的模式是在警務(wù)網(wǎng)站中設(shè)置開放數(shù)據(jù)模塊,通過網(wǎng)絡(luò)頁面公布不同時期、不同類別的警務(wù)數(shù)據(jù)。其中部分建設(shè)相對不完善的平臺在開放數(shù)據(jù)模塊中僅設(shè)置了數(shù)據(jù)模塊,并且只公布了統(tǒng)計數(shù)據(jù)或者報告;而部分建設(shè)比較完善的平臺則包含更多的模塊,如英國國家警務(wù)數(shù)據(jù)開放平臺除了主頁和數(shù)據(jù)模塊外還包括API、變更日志(Changelog)、聯(lián)系方式(Contact)等模塊。除此之外,美國的西雅圖市、芝加哥市和澳大利亞的昆士蘭州等地警務(wù)數(shù)據(jù)開放平臺還在頁面上設(shè)立了犯罪地圖模塊(Crime Map)和儀表盤模塊(Dashboard)等,以方便用戶快速找到所需的功能。這些平臺往往展示的數(shù)據(jù)較多,設(shè)立更多模塊以方便用戶的使用,同時在平臺功能上也可以有更多的創(chuàng)新。
1.數(shù)據(jù)量
不同平臺的數(shù)據(jù)量存在明顯差異(見表2)。按照數(shù)據(jù)集數(shù)量和數(shù)據(jù)量的不同,這些平臺可以分為4種類型:第一類是數(shù)據(jù)集多、數(shù)據(jù)量大的平臺,如英國國家警務(wù)數(shù)據(jù)開放平臺和紐約市的警務(wù)數(shù)據(jù)開放平臺。這類平臺建設(shè)的時間較早、運行周期較長,已經(jīng)公開了相當(dāng)數(shù)量的數(shù)據(jù)。第二類是數(shù)據(jù)集較多、數(shù)據(jù)量相對較小的平臺,如北部領(lǐng)地、奧克蘭市和路易斯維爾市的平臺。但經(jīng)過深入分析發(fā)現(xiàn),北部領(lǐng)地以月份作為數(shù)據(jù)集的劃分單位,奧克蘭市和路易斯維爾市則以天作為數(shù)據(jù)集的劃分單位,劃分單位的不同導(dǎo)致各平臺數(shù)據(jù)集的數(shù)量差別較大。第三類是數(shù)據(jù)集較少、數(shù)據(jù)量相對較大的平臺,如洛杉磯市和西雅圖市的平臺。這類平臺盡管數(shù)據(jù)集數(shù)量較少,但是單個數(shù)據(jù)集的數(shù)據(jù)量較大,如西雅圖市警方公開的整合犯罪數(shù)據(jù)(Migrated Crime Data)包含犯罪類型、時間、地點等37個數(shù)據(jù)標(biāo)簽,共962265條數(shù)據(jù)。第四類是平臺數(shù)據(jù)集和數(shù)據(jù)量都較少的平臺,如波士頓市、昆士蘭州的平臺,這一類平臺公布的主要是犯罪數(shù)據(jù)。
表2:平臺數(shù)據(jù)量
雖然警務(wù)數(shù)據(jù)開放屬于政府?dāng)?shù)據(jù)開放的一種形式,但是二者之間存在一定的差別。學(xué)者對政府?dāng)?shù)據(jù)開放平臺進行研究時,通常以平臺的數(shù)據(jù)集、數(shù)量和數(shù)據(jù)集內(nèi)的數(shù)據(jù)量作為衡量平臺數(shù)據(jù)質(zhì)量和價值的指標(biāo),但這種衡量標(biāo)準(zhǔn)對于警務(wù)數(shù)據(jù)開放平臺并不完全適用。一方面,各警務(wù)數(shù)據(jù)開放平臺展現(xiàn)數(shù)據(jù)的方式不同,如有些平臺通過儀表盤或者犯罪地圖的形式呈現(xiàn)數(shù)據(jù),由于下載方式和文件類型與其他數(shù)據(jù)不同,這一類數(shù)據(jù)往往較難納入統(tǒng)計范圍。另一方面,數(shù)據(jù)集劃分標(biāo)準(zhǔn)的不同使數(shù)據(jù)集數(shù)量的統(tǒng)計缺乏統(tǒng)一口徑,例如,部分警務(wù)數(shù)據(jù)開放平臺公布的更多是匯總的數(shù)據(jù),而部分平臺公布的主要是事件級別(Incident-level)的數(shù)據(jù);有些平臺將犯罪數(shù)據(jù)統(tǒng)一放至一個數(shù)據(jù)集中,而有些平臺基于不同的細分犯罪類型分別建立數(shù)據(jù)集。因此數(shù)據(jù)集多并不意味著數(shù)據(jù)豐富,數(shù)據(jù)價值不能僅僅通過數(shù)據(jù)量或數(shù)據(jù)集的數(shù)量來判斷,那些數(shù)據(jù)集較少但是數(shù)據(jù)集相關(guān)性強且容易使用的數(shù)據(jù)開放平臺可能比那些數(shù)據(jù)集多但較難使用和獲取數(shù)據(jù)的平臺具有更大的公共價值[10]。
2.數(shù)據(jù)主題
表3(見下頁)顯示了對各平臺數(shù)據(jù)主題的統(tǒng)計情況,從中可見,本文調(diào)查的所有警務(wù)數(shù)據(jù)開放平臺都公開了犯罪數(shù)據(jù),而且據(jù)筆者統(tǒng)計犯罪數(shù)據(jù)在總體數(shù)據(jù)中的占比相對較高。除了犯罪數(shù)據(jù)之外,相比較而言,英國和美國的警務(wù)數(shù)據(jù)開放平臺公開了更多其他主題的數(shù)據(jù)。同時,在表3列舉的數(shù)據(jù)主題以外,有些平臺還公開了其他主題的數(shù)據(jù),如英國國家警務(wù)數(shù)據(jù)開放平臺公開了呼吸測試(Breath Test)、毒品扣押(Drug Seizures)等主題的數(shù)據(jù),芝加哥警方公開了觀點數(shù)據(jù)(Sentiment Data)等。
選擇公開哪些主題的數(shù)據(jù)需要考慮多方面的因素,其中,當(dāng)前的治安狀況以及民眾的關(guān)切是優(yōu)先考慮的因素。從表3可以看出,與英國和澳大利亞相比,美國的警務(wù)數(shù)據(jù)開放平臺公開了更多的槍擊案件數(shù)據(jù)和武力使用數(shù)據(jù),這與美國社會中槍擊案件的發(fā)生頻率較高、民眾對于警察使用武力的問題極為關(guān)注不無關(guān)系。所以,平臺公開的數(shù)據(jù)主題在一定程度上反映了當(dāng)?shù)貢r下社會治安的突出問題和民眾關(guān)切的重點。
3.數(shù)據(jù)的隱匿處理
開放數(shù)據(jù)是指不受隱私限制并且非機密的數(shù)據(jù),是通過公共財產(chǎn)產(chǎn)出并且在使用和分發(fā)上沒有任何限制的數(shù)據(jù),而警務(wù)部門提供的犯罪數(shù)據(jù)與此恰恰相反[11]。警務(wù)數(shù)據(jù)在公開和使用上受到一定限制,而且包含所報告或者所記錄犯罪的秘密信息[12]4。包含較為詳細內(nèi)容的警務(wù)數(shù)據(jù)尤其是事件級別的數(shù)據(jù)普遍涉及個人身份和位置等隱私信息。為了盡量使被公開的警務(wù)數(shù)據(jù)在保證準(zhǔn)確性的前提下不侵犯個人隱私,警務(wù)數(shù)據(jù)開放平臺會對數(shù)據(jù)進行不同程度的隱匿處理。
較為簡單的隱匿處理方式是將重要信息的全部或部分進行隱藏,除此之外,實踐中一些警務(wù)部門進一步細化了不同類型信息的隱匿處理規(guī)則。例如,英國國家警務(wù)數(shù)據(jù)開放平臺介紹了數(shù)據(jù)匿名化處理的一系列方法,包括具體的日期僅精確到月份、犯罪編號和犯罪類型替換、犯罪發(fā)生地的經(jīng)緯度按照統(tǒng)一標(biāo)準(zhǔn)進行轉(zhuǎn)化等。不僅如此,對于地點的匿名處理,英國警方還設(shè)置了一套專門的流程來實現(xiàn)數(shù)據(jù)公開和隱私保護的平衡。
在本文調(diào)查的所有平臺中,像英國警方這樣深入進行數(shù)據(jù)隱匿處理的并不多。隱匿處理意味著在數(shù)據(jù)開放之外還有許多額外的工作,且對數(shù)據(jù)的準(zhǔn)確度以及用戶對數(shù)據(jù)的理解也會產(chǎn)生影響。因此絕大多數(shù)平臺只是通過簡單的隱匿方式對數(shù)據(jù)進行處理,公布并說明匿名化處理規(guī)則的平臺也較少,甚至部分平臺出現(xiàn)數(shù)據(jù)未隱匿處理的情況,用戶可以看到具體的時間和地理位置等信息。
4.數(shù)據(jù)更新頻率
及時和持續(xù)更新數(shù)據(jù)對于警務(wù)數(shù)據(jù)開放平臺具有重要意義,現(xiàn)實中犯罪行為和警務(wù)行動在持續(xù)不斷地發(fā)生,平臺只有及時、不斷更新數(shù)據(jù)才能發(fā)揮數(shù)據(jù)的最大價值。實踐中許多數(shù)據(jù)開放平臺在創(chuàng)建之初短時間內(nèi)公布了大量的數(shù)據(jù),但此后只是斷斷續(xù)續(xù)地公開少量數(shù)據(jù)甚至不再更新和公布數(shù)據(jù)[13],這與數(shù)據(jù)開放原則相違背。除了作為本文研究對象的平臺之外,筆者在研究過程中還瀏覽了其他平臺,之所以未選擇其他平臺作為研究對象,一方面是因為那些平臺建設(shè)不完善、界面設(shè)置落后、數(shù)據(jù)量小,另一方面是因為它們長期不更新數(shù)據(jù)。
數(shù)據(jù)更新的頻率主要包括日更新、周更新、月更新、季度更新和年更新等。在本文調(diào)查的平臺中,所有平臺的所有主題數(shù)據(jù)至少每年都更新一次,在此基礎(chǔ)上不同平臺的不同主題數(shù)據(jù)的更新頻率有所不同。總體來看,建設(shè)較為完善的平臺能夠?qū)Σ煌瑪?shù)據(jù)實現(xiàn)不同頻率的更新。值得注意的是,在本文調(diào)查的平臺中,西雅圖市警務(wù)數(shù)據(jù)開放平臺是唯一一個按小時更新部分數(shù)據(jù)的平臺。該平臺公開了最近24小時的報警數(shù)據(jù),用戶可以按照過去1小時、過去7小時和過去24小時3種篩選范圍進行統(tǒng)計,這種更新頻率實現(xiàn)了數(shù)據(jù)的動態(tài)更新。
5.數(shù)據(jù)下載格式
機器可處理(Machine-processable)是數(shù)據(jù)開放的一項重要原則[14]。為了便于用戶挖掘數(shù)據(jù)的價值,各警務(wù)數(shù)據(jù)開放平臺都提供了多種格式的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),通過設(shè)立鏈接的方式提供了XLSX、CSV、PDF等不同格式數(shù)據(jù)的下載路徑。此外部分平臺在提供基礎(chǔ)的數(shù)據(jù)下載格式之外還使用可視化工具為用戶提供其他數(shù)據(jù)下載格式,如使用Tableau可視化工具提供圖像、交叉表等數(shù)據(jù)下載格式。
為了滿足商業(yè)分析的需求,數(shù)據(jù)公司研制了多種分析工具以便用戶挖掘數(shù)據(jù)價值。在本文調(diào)查的警務(wù)數(shù)據(jù)開放平臺中,部分平臺將商業(yè)分析工具作為數(shù)據(jù)展示的拓展窗口內(nèi)嵌在自己的平臺中,有的平臺甚至選擇使用商業(yè)分析工具展示所有的數(shù)據(jù)和功能。
在被調(diào)查的平臺中,共有5個平臺使用了商業(yè)分析工具。各平臺提供的商業(yè)分析工具主要包括兩款產(chǎn)品:一是Tableau公司開發(fā)的可視化分析平臺,二是微軟公司開發(fā)的數(shù)據(jù)可視化工具Power BI。在功能實現(xiàn)上,兩款產(chǎn)品并沒有本質(zhì)的差異;在使用廣度上,Tableau的使用明顯廣于Power BI(見表4)。
除了商業(yè)分析工具外,平臺本身包含的工具以及部分平臺自己研制的數(shù)據(jù)分析工具也為用戶提供了多種功能選項。這些便捷的數(shù)據(jù)可視化工具不僅有助于更立體地展示數(shù)據(jù),而且能夠節(jié)省用戶的時間和精力,方便用戶開展個性化的分析。
表3:各平臺公開的數(shù)據(jù)主題
表4:平臺提供的商業(yè)分析工具
在數(shù)據(jù)時代,盡管數(shù)據(jù)的記錄、收集和系統(tǒng)抓取已經(jīng)取得巨大進步,但犯罪數(shù)據(jù)整合仍然非常困難[15]1。每個城市都在各自的網(wǎng)站上獨立公布自己的數(shù)據(jù),數(shù)據(jù)的形式和內(nèi)容千差萬別,因此在不同城市的平臺中查找相關(guān)數(shù)據(jù)是一件比較困難的事[16]。總體而言,各個地區(qū)、各個平臺的數(shù)據(jù)之間的差異主要體現(xiàn)在以下兩個方面:
第一,數(shù)據(jù)主題差異較大。不同平臺僅在犯罪主題數(shù)據(jù)的公開上具有較高的一致性,而在其他主題數(shù)據(jù)如警察使用武力數(shù)據(jù)、抓捕數(shù)據(jù)等的統(tǒng)計和公開上存在巨大差異,甚至有些數(shù)據(jù)主題只存在于某一個平臺上,而其他平臺都未涉及。
第二,即使屬于同一主題,數(shù)據(jù)之間也存在較大差異。例如,由于各國法律對于犯罪的定義不同,即使純粹地對犯罪記錄數(shù)據(jù)進行比較基本上也是不可能的[17]。數(shù)據(jù)之間的差異使得在使用數(shù)據(jù)進行橫向比較或研究時障礙重重。一方面,不同數(shù)據(jù)的標(biāo)簽差異明顯。以犯罪數(shù)據(jù)為例,美國有些城市提供的犯罪數(shù)據(jù)包含20多個數(shù)據(jù)標(biāo)簽,有些城市提供的犯罪數(shù)據(jù)卻僅有幾個標(biāo)簽。另一方面,數(shù)據(jù)分類和概念使用缺乏統(tǒng)一標(biāo)準(zhǔn)。例如,由于參考標(biāo)準(zhǔn)和法律依據(jù)等的不同,各平臺對同一類犯罪的分類結(jié)果各不相同;又如,在這些平臺上,不同的術(shù)語可能被用來描述同一事物,或者同一個術(shù)語被用來指稱不同的事物,這些問題都會導(dǎo)致數(shù)據(jù)產(chǎn)生巨大差異[15]4。
對于警務(wù)數(shù)據(jù)開放平臺公開的數(shù)據(jù)的準(zhǔn)確性,不少用戶和研究人員持有懷疑態(tài)度。有學(xué)者研究英國國家警務(wù)數(shù)據(jù)開放平臺公開的已經(jīng)進行地理編碼的數(shù)據(jù)后發(fā)現(xiàn),該平臺中關(guān)于較大空間單位的數(shù)據(jù)信息準(zhǔn)確性較高,而關(guān)于較小空間單位尤其是區(qū)位層級(Postcode level)的空間數(shù)據(jù)信息誤差較大[5]109;對于犯罪數(shù)據(jù),由于記錄方式的不同,數(shù)據(jù)未上報(Under-reporting)和未記錄(Under-recording)現(xiàn)象、犯罪發(fā)生在不同地點卻按照同一地點記錄的現(xiàn)象、數(shù)據(jù)遺失(Missing data)等問題一直存在[12]8。同時,隱私保護要求對數(shù)據(jù)進行隱匿處理,研究人員擔(dān)心在依托警務(wù)開放數(shù)據(jù)開展研究時這種隱匿處理會導(dǎo)致研究結(jié)果不準(zhǔn)確。此外,數(shù)據(jù)的不準(zhǔn)確也會制約研究者開展有關(guān)犯罪時空分布的研究,因為這一類研究非常依賴犯罪發(fā)生于何時何地的準(zhǔn)確數(shù)據(jù)[18]。
當(dāng)前各平臺公開的犯罪數(shù)據(jù)主要是對傳統(tǒng)犯罪的統(tǒng)計,鮮少涉及新興的網(wǎng)絡(luò)犯罪、經(jīng)濟犯罪等對民眾生活造成嚴重影響的犯罪類型。同時從數(shù)據(jù)挖掘和研究的角度來看,研究者不僅希望平臺提供更多的數(shù)據(jù)主題,而且希望數(shù)據(jù)本身的標(biāo)簽也更加豐富。缺乏諸如作案手法等指標(biāo)的數(shù)據(jù)將給相關(guān)研究如刻畫犯罪人的肖像帶來困難[12]12。
雖然各警務(wù)數(shù)據(jù)開放平臺都提供了多種數(shù)據(jù)格式供用戶下載,但是仍然存在一些不足。首先,以PDF格式呈現(xiàn)的數(shù)據(jù)在許多平臺中占據(jù)相當(dāng)?shù)谋壤?,這種數(shù)據(jù)格式在下載后往往無法轉(zhuǎn)換為其他格式,這為數(shù)據(jù)的匯總和分析增添了難度。其次,部分使用可視化工具的平臺沒有提供下載功能,或者沒有提供其他常用的數(shù)據(jù)格式。
盡管目前我國的警務(wù)門戶網(wǎng)站尚不具備數(shù)據(jù)開放功能,但無論是從技術(shù)能力還是從數(shù)據(jù)儲備來看,我國的許多地區(qū)都已經(jīng)完全具備搭建警務(wù)數(shù)據(jù)開放平臺的條件,甚至有些條件相比發(fā)達國家更為充分。因此我國應(yīng)當(dāng)加快警務(wù)數(shù)據(jù)開放的步伐。
第一,轉(zhuǎn)變對于警務(wù)數(shù)據(jù)開放的認識。首先,要明確數(shù)據(jù)開放和信息公開的區(qū)別,信息公開不能代替數(shù)據(jù)開放。其次,警務(wù)數(shù)據(jù)不可以完全公開,但是完全可以公開。警務(wù)數(shù)據(jù)并非全部都是秘密數(shù)據(jù),非秘密的數(shù)據(jù)可以向公眾開放,部分數(shù)據(jù)也可以通過隱匿處理后公之于眾。最后,警務(wù)數(shù)據(jù)開放并非只是搭建一個數(shù)據(jù)平臺將數(shù)據(jù)導(dǎo)入即可,而是一項系統(tǒng)性工程,數(shù)據(jù)開放的價值在于利用,數(shù)據(jù)本身也需要不斷更新。
第二,選擇若干市一級的公安機關(guān)試點建設(shè)警務(wù)數(shù)據(jù)開放平臺?;谇拔膶τ?、美國和澳大利亞的警務(wù)數(shù)據(jù)開放平臺的分析,從平臺設(shè)立等級角度來看,考慮到管轄的人口數(shù)量、地域范圍以及行政區(qū)劃的層級等因素,當(dāng)前我國建設(shè)國家級或者省一級警務(wù)數(shù)據(jù)開放平臺仍有較大難度;為了保證數(shù)據(jù)開放的質(zhì)量和規(guī)模,可以考慮以市一級公安機關(guān)為主體搭建警務(wù)數(shù)據(jù)開放平臺,尤其是選擇在數(shù)據(jù)警務(wù)建設(shè)中走在前列的城市開展試點可以達到更好的效果。但開展試點同時需要注意,特殊主題的數(shù)據(jù)開放可以由市一級公安機關(guān)根據(jù)自身情況自行決定,部分主要的數(shù)據(jù)主題,如犯罪數(shù)據(jù)開放的標(biāo)準(zhǔn)則需要仔細研究,包括至少應(yīng)當(dāng)包含哪些標(biāo)簽,特定標(biāo)簽的數(shù)據(jù)應(yīng)當(dāng)是怎樣的格式,隱匿處理的模式等,可以考慮由上級公安機關(guān)提出指導(dǎo)意見,提前考慮數(shù)據(jù)整合的需要,避免出現(xiàn)國外警務(wù)數(shù)據(jù)開放平臺各自為戰(zhàn)的現(xiàn)象。與此同時,數(shù)據(jù)主題和標(biāo)簽的選擇也可以考慮征求公眾以及研究學(xué)者的意見,既回應(yīng)社會的關(guān)切,也能夠滿足研究需求,達到多贏局面。
第三,充分利用已有網(wǎng)站和網(wǎng)絡(luò)平臺。雖然我國警務(wù)數(shù)據(jù)開放仍處于起步階段,但警務(wù)數(shù)據(jù)開放平臺的建設(shè)不需要從零開始。現(xiàn)有的警務(wù)門戶網(wǎng)站或網(wǎng)絡(luò)平臺、網(wǎng)站內(nèi)部的信息公開模塊以及本級政府的數(shù)據(jù)開放平臺等都可以作為搭建警務(wù)數(shù)據(jù)開放平臺的基礎(chǔ)。盡管個別公安機關(guān)已經(jīng)設(shè)立數(shù)據(jù)開放模塊并接入城市的政府?dāng)?shù)據(jù)開放平臺,但是綜合本文中對各國外警務(wù)數(shù)據(jù)開放平臺的分析,在警務(wù)門戶網(wǎng)站上設(shè)立數(shù)據(jù)開放模塊具備更高的自主性,能夠定制化滿足自身對于數(shù)據(jù)開放的需求,且商業(yè)工具的使用、平臺功能的實現(xiàn)和創(chuàng)新也都是由建立在警務(wù)門戶網(wǎng)站基礎(chǔ)上的警務(wù)數(shù)據(jù)開放平臺實現(xiàn),因此從警務(wù)門戶網(wǎng)站入手能夠在現(xiàn)有政府?dāng)?shù)據(jù)開放的框架外,實現(xiàn)更高水平的警務(wù)數(shù)據(jù)開放。
第四,利用現(xiàn)有合作框架探索警務(wù)數(shù)據(jù)開放的新模式。開放數(shù)據(jù)更新的頻率可以由公安機關(guān)根據(jù)自身工作情況或者掌握的數(shù)據(jù)決定,但警務(wù)數(shù)據(jù)開放除此之外還要考慮公開多少數(shù)據(jù)、公開哪些主題的數(shù)據(jù)以及如何公開數(shù)據(jù)等問題,完全依靠我國警務(wù)部門現(xiàn)有的人力、物力以及技術(shù)能力可能難以完成數(shù)據(jù)開放的任務(wù)。而警企合作、校局合作等現(xiàn)有的合作框架為問題的解決提供了更多的可能,而且通過多方合作,警務(wù)部門可以在數(shù)據(jù)標(biāo)準(zhǔn)完善、平臺功能創(chuàng)新等方面做出更多的探索。通過收集各方的反饋意見,警務(wù)部門也可以對數(shù)據(jù)和平臺本身不斷進行更新,不斷提升數(shù)據(jù)的準(zhǔn)確性、豐富性以及平臺應(yīng)用的便捷性。
當(dāng)前國外警務(wù)數(shù)據(jù)開放平臺的建設(shè)經(jīng)驗為我們提供了有益的借鑒。在科技強警和智慧警務(wù)、數(shù)據(jù)警務(wù)建設(shè)不斷深化的今天,我國的公安機關(guān)相比國外警務(wù)部門擁有更為豐富的數(shù)據(jù)資源,如何更大范圍、更深層次地釋放這些數(shù)據(jù)的價值,讓數(shù)據(jù)資源“反哺”公安警務(wù)實踐,警務(wù)數(shù)據(jù)開放是一條值得探索的重要路徑。