王欣
20世紀90年代開始,發(fā)源于英美的“情報主導警務”“ComStat模式”事實上都可以看做是今天大數(shù)據(jù)警務的雛形,只不過那時可以利用的數(shù)據(jù)資源遠遠少于現(xiàn)在。近十年內,在熱點警務、數(shù)據(jù)驅動警務的概念驅動下,不少軟件工具被開發(fā)設計出來并應用在美國的警務工作中。以往,美國警察組織體系相對地方化、權力分散化,但在“9 ·11事件”后美國就開始注重信息數(shù)據(jù)的融合和共享,進行了多項立法,開發(fā)了多個項目,其中包括著名的融合中心來推動跨地方、跨部門的警務數(shù)據(jù)共享,以應對越來越嚴重的恐怖主義威脅和有組織犯罪。
洛杉磯警察局和紐約警察局是美國較大規(guī)模的警察局,城市經濟發(fā)達,財政投入充足,警務信息技術也一直比較領先。尤其是洛杉磯警察局,緊鄰美國軟件開發(fā)的大本營——硅谷,擁有得天獨厚的軟件開發(fā)人才基礎,在大數(shù)據(jù)警務方面走在了英美最前沿。PredPol【這是一款“預測性警務”(predictive policing)軟件程序,它通過一套專有算法分析歷史犯罪數(shù)據(jù),然后計算出10~20個最有可能在警察下一次執(zhí)勤時發(fā)生犯罪活動的地點。下簡稱PredPol】和帕蘭提爾(Palantir)兩個平臺都是在洛杉磯警察局最先開發(fā)使用的,其中Predpol主要是熱點警務,用于犯罪預測和合理調度分配警力資源,帕蘭提爾則是一個整合多個平臺、多種數(shù)據(jù)源、多地方數(shù)據(jù)庫和視頻監(jiān)控、車牌感知等終端數(shù)據(jù)采集系統(tǒng)的超級智能搜索引擎,不僅僅用于犯罪偵查信息的檢索,還能夠主動預警具有風險的個人和高風險受害者,使警方可以提前行動。英國也開發(fā)了類似的其他軟件平臺,綜合起來看,這些軟件工具主要有以下三種大數(shù)據(jù)應用方式:犯罪熱點預測,犯罪個體和受害者個體風險預測,基于大數(shù)據(jù)平臺的信息融合、檢索與挖掘。同時,政府在努力不斷地拓寬數(shù)據(jù)來源,一方面大力促進政府部門間的數(shù)據(jù)共享與整合,另一方面加大信息采集設備的布設,增加監(jiān)控攝像頭、移動攝像頭、車牌讀取器以及其他物聯(lián)網信息采集終端,最后努力通過立法、合作、購買等方式將交通、金融、商務、通信等私有數(shù)據(jù)納入大數(shù)據(jù)警務體系。
PredPol全解析
PredPol是加州大學洛杉磯分校和圣塔 ·克拉羅大學的數(shù)學家和社會學家以及洛杉磯警局共同合作開發(fā),美國有西雅圖、亞特蘭大等幾十個城市都在使用PredPol預測幫派犯罪、毒品犯罪、槍支暴力、街面盜搶等犯罪活動。英國肯特警察局使用該工具預測毒品犯罪和搶劫??咸鼐植粌H利用該工具派警,還會安排參與公共安全的市民志愿者和毒品干預人員前往該地區(qū)。基于PredPol的犯罪熱點預測信息,警官可以結合預測地點的谷歌街景圖像提高發(fā)現(xiàn)和阻止犯罪的能力。在使用中巡邏警官只須攜帶一個電子地圖,地圖上會指示出發(fā)生犯罪的熱點地區(qū),他們則按照地圖指示開展巡邏。據(jù)開發(fā)者提供的研究報告顯示,該軟件能夠有效地降低犯罪率,圣塔 ·科魯茲警察局從2012年1月到6月,與前些年同期相比盜竊案件減少了 14%,洛杉磯警察局的福特希爾分局從2013年到2014年一年的犯罪率減少了20%,在其他地區(qū)也得到了類似的報告。
但是在警察局內部和外部對該軟件有不少質疑的觀點。有些警官認為,犯罪預測算法不過是告訴警官一些他們早就知道的知識。對于這種說法,軟件的設計者布蘭廷漢姆并不認同,他說:“犯罪熱點的動態(tài)性是超乎想象的,城市里有良善之區(qū),也有犯罪熱點,沒有這些犯罪預測工具的幫助,警察個人是很難準確判斷的?!北M管與始于上世紀90年代的犯罪制圖思想方法相同,但是與犯罪制圖相比,PredPol基于更大的數(shù)據(jù)量,用更加復雜的數(shù)學方法去計算,該軟件比簡單的熱點地圖效果好得多,諸多科學實驗已經證明了軟件的有效性。然而批評者并不完全認可實驗結果,他們認為應當在更多的城市進行更多更準確的實驗,以檢驗其效果。事實上,犯罪預測并不是完全機械指揮基層警官的,在很多城市使用PredPol的警官并不會完全盲目唯犯罪預測地圖是從,警官們仍然有很大的自由裁量權,僅僅依靠算法是不夠的,警官們仍然需要足夠了解自己的片區(qū),根據(jù)需求自己作出調節(jié)。
還有一些觀點認為跟著犯罪熱點去調度巡邏警官追著犯罪跑,并非真正的主動預防警務方法。辛辛那提大學的犯罪學教授約翰 ·艾克認為:“預測警務是今日警務的刀鋒,但是這個刀鋒已經鈍了……如果某個地方在很長一段時間其犯罪問題都是可預測的,那么說明這個地方一定有什么根本上的問題。這個地方的管理者的失職使其變成了一個犯罪熱點,那么管理者就有責任修正問題,而不是在這個地方巡邏、攔截盤查大量的無辜人員,干擾他們的生活?!?/p>
從技術上分析,PredPol也存在一些局限。該模型使用的是類似基于地震后的余震預測模型的算法,采用的是自預測的算法,將犯罪類型、犯罪地點和犯罪時間作為輸入變量,輸出對未來一小段時間內的犯罪類型、犯罪地點和犯罪時間的預測。因此,PredPol是基于過去的事件來預測未來事件,并不考慮環(huán)境變化的復雜因素,事實上人們日常行為模式和城市地理環(huán)境都會影響犯罪熱點的分布。犯罪預測領域還有其他一些軟件模型用于犯罪熱點預測,例如美國羅格斯大學兩位教授開發(fā)的風險區(qū)域模型(RTM)軟件,這是一個中長期犯罪預測模型,將不同的因素疊加到地圖層中以預測未來一段時間犯罪的變化。RTM可以和PredPol這樣的短期預測地圖共同使用。類似的工具還有MoRiLE模型(執(zhí)法部門風險管理模型),該軟件會考慮不同類型疊加起來造成的總體危害來指導警力資源的調配,包括對個人、對組織、社區(qū)的危害以及公眾的期望和經濟損失。
總之,盡管犯罪預測工具仍然在部分地區(qū)比較流行,但是并非大數(shù)據(jù)警務的主要方向,很多人對其功效仍然心存質疑。該軟件在一定程度上忽視了基層巡邏警員的智慧,機械地按照計算機風險評估去調度警員巡邏路線,必然會導致一線警官本能的心理抵觸,也容易被犯罪分子掌握規(guī)律使得預測失效。
帕蘭提爾大數(shù)據(jù)融合與分析系統(tǒng)
與犯罪預測和個人風險評估工具相比,帕蘭提爾才是真正的大數(shù)據(jù)工具。帕蘭提爾公司是一家很有傳奇色彩的公司,其創(chuàng)辦者是來自硅谷的三位天才計算機工程師,而其公司和軟件平臺名稱則來自指環(huán)王中的一個能夠穿越時空看到一切的水晶球。2004年開始,該公司就開始為CIA服務,主要提供信息整合和分析的軟件服務。自從2011年起,他們開始幫助洛杉磯警察局分析數(shù)據(jù),該公司也與FBI合作,帕蘭提爾并沒有公開使用他們工具的警方用戶有多少,但是很多國家安全機構以及著名的加州警局和紐約警局都曾經與該公司合作過,據(jù)說發(fā)現(xiàn)麥道夫的旁氏騙局和抓獲本 ·拉登都有該軟件的功勞。目前,這家名不見經傳的公司正在默默地改變著美國警務的方式。
帕蘭提爾首先是一個數(shù)據(jù)整合平臺。與世界上所有組織一樣,美國執(zhí)法系統(tǒng)中存在著大量的、孤島式的信息系統(tǒng),加之美國警察組織的分散特點,更增加了數(shù)據(jù)整合的困難。帕蘭提爾提供所有分析功能都是建立在數(shù)據(jù)整合的基礎之上,目前該系統(tǒng)能夠整合美國警方常見的案件管理數(shù)據(jù)、個人生物信息數(shù)據(jù)、逮捕數(shù)據(jù)、犯罪記錄數(shù)據(jù)、機動車信息、幫派和嫌疑人等數(shù)據(jù),還整合了來自其他政府部門和私有機構的一些數(shù)據(jù)。有了這樣的整合,使用者可以通過一站式智能檢索輕松地獲取所需信息。根據(jù)德州大學奧斯汀分校社會學家莎拉 ·布萊恩的一份調研報告,該平臺的使用和社交網絡一樣簡單,只要在計算機鍵入該嫌疑人的名字和外貌特征,數(shù)據(jù)庫就會給出可能的嫌犯,這些嫌疑人的年齡、描述、住址、幫派、機動車等信息都會出現(xiàn)在相關的區(qū)域。其中有些信息是在攔截盤查過程中記錄的,不僅僅記錄了當事人,也記錄他的同行人員。
帕蘭提爾還是提供智能案件管理功能,并且提供案件情報分析等輔助調查功能。例如,系統(tǒng)能夠自動根據(jù)案件中的內容進行信息匹配,串并不同地區(qū)不同警官偵辦的案件。據(jù)莎拉 ·布萊恩描述,警方探員很容易通過帕蘭提爾系統(tǒng)找到相關聯(lián)的案件,一個探員能夠使用“杰克、搶劫、男、五英尺11英寸高”這樣的描述進行信息碰撞,從而使其他探員也能夠了解有人在偵破這樣的案件,為串并案件創(chuàng)造條件。系統(tǒng)還能通過數(shù)據(jù)碰撞挖掘偵破案件,例如當多個地區(qū)發(fā)生線纜被盜的案件時,系統(tǒng)可以在丟失線纜的地區(qū)查找重復出現(xiàn)的車牌,從而篩選出可疑車輛。
帕蘭提爾也具有風險預測預警功能。與積分模型和熱點警務的預測不同,帕蘭提爾的預測是根據(jù)具體的個體行為和具體信息發(fā)布警告的。警官可以像在臉書上關注朋友一樣訂閱關注人員的動態(tài)信息,只要有敏感行為發(fā)生,警官就會在自己的手機上收到關于此人的警告信息。洛杉磯警局已經將裝在警車上和街道上的攝像頭都整合到帕蘭提爾的系統(tǒng)里,攝像機能夠讀取車牌信息,并將時間和地理位置錄入系統(tǒng)。例如,一個銀行搶劫嫌疑人的車輛被攝像頭捕捉到正在進入特定銀行周邊區(qū)域,警官就會收到一條警告。該系統(tǒng)還能幫助警察減少行動風險,例如,當警察打算搜查嫌疑人房屋時,他們可以先在平臺上尋找相關信息,了解目標是否有槍支注冊,相鄰的住戶是否有槍支,以及在該區(qū)域是否有通緝犯或者相關聯(lián)的幫派存在,從而降低搜查帶來的風險。
豐富的信息采集終端
大數(shù)據(jù)的特點包括使用海量數(shù)據(jù)和多種多樣的數(shù)據(jù)來源。為增加數(shù)據(jù)量,英美警方使用各種方法加大信息采集力度,車牌識別、人臉識別等技術的應用范圍迅速擴大,對視頻內容的進一步提取與分析成為警方亟須解決的技術問題。洛杉磯警局在公共地區(qū)接入了閉路監(jiān)控攝像頭,警察巡邏車上安裝了車牌讀取器,最近還嘗試使用搭載在飛機上的實時攝像頭,來監(jiān)視和記錄城市的整體情況。2012年紐約警察局和微軟合作開發(fā)了DAS系統(tǒng)(區(qū)域警報系統(tǒng)),該系統(tǒng)能夠從監(jiān)控攝像頭、自動車牌識別系統(tǒng)、射頻感應器等多個數(shù)據(jù)源,實時地分析潛在的威脅。2013年11月,正值波士頓爆炸案發(fā)生后的半年,紐約市警察局為了保障即將舉辦的紐約馬拉松比賽,在馬拉松沿線布置了幾百個臨時攝像頭,用DAS實時分析捕捉到的信息。盡管該系統(tǒng)投入不菲,但是作為微軟合作伙伴的紐約警察局,每年可以從微軟銷售給全國其他警察部門的該軟件的利潤中提取30%,而且這個系統(tǒng)帶來的工作效率的提高將遠遠大于當初的投入。FBI提取了大量來自刑事記錄中的相片信息,以及如員工背景審查等非刑事原因的記錄中提取的相片,形成了一個海量的人臉檢索、對比、識別系統(tǒng),該系統(tǒng)可以用于在關鍵地理位置實現(xiàn)人像對比和案件調查。
大數(shù)據(jù)警務面臨的挑戰(zhàn)
大數(shù)據(jù)改變了傳統(tǒng)警務的方式,帶來了前所未有的效率與便捷,但是也引起了民權人士的擔憂,一些人擔心會生活在“數(shù)字暴政”之下。還有一些學者提出大數(shù)據(jù)警務改變了美國憲法第四修正案賦予的人權,即必須具備“合理懷疑”的前提下才能攔截盤查,然而現(xiàn)在警方無需獲得任何許可即可通過大數(shù)據(jù)開展調查。盡管有著種種人權、倫理障礙,近些年迫于反恐壓力不斷增大,政府也在不斷賦予警察更多的數(shù)據(jù)獲取權限。
除法律、倫理障礙之外,信息孤島問題仍然是全方位開展大數(shù)據(jù)警務的最大障礙。美國為此也作出過大量的努力,促進國家層面的數(shù)據(jù)共享與融合。例如,成立了多級別多層次的信息融合中心,以促進地方、州和聯(lián)邦的執(zhí)法數(shù)據(jù)共享與交換。