熊建英
(江西警察學(xué)院 安全管理系,江西 南昌 330003)
在信息化發(fā)展的大背景下,公安工作劃為四個階段,即“傳統(tǒng)警務(wù)、信息警務(wù)、數(shù)據(jù)警務(wù)、智慧警務(wù)”,相應(yīng)的信息化發(fā)展歷程也可劃分為三個階段(如圖1所示),其中在IT階段通過計算機信息系統(tǒng)大大提升了警務(wù)工作的效率;在DT階段實現(xiàn)利用大數(shù)據(jù)匯聚開展警務(wù)情報分析研判工作;而在AI階段,則更多的是基于大數(shù)據(jù)的預(yù)測促進警務(wù)發(fā)展。
圖1 公安信息化發(fā)展階段
IT階段具有標(biāo)記性的事件是2003年正式啟動的“金盾工程”,該工程完成了公安信息網(wǎng)絡(luò)基礎(chǔ)設(shè)施的建設(shè)和架構(gòu)、基礎(chǔ)信息采集、警務(wù)工作信息化流轉(zhuǎn)等,提高了社會資源共享、公安信息資源綜合利用水平。在DT階段,2013年通過云計算為公安大數(shù)據(jù)處理提供了存儲、運算、展示的基礎(chǔ)平臺。2014年將大數(shù)據(jù)技術(shù)服務(wù)于公安實戰(zhàn),歷經(jīng)數(shù)年在數(shù)據(jù)資源共享、系統(tǒng)整合和信息深度應(yīng)用上取得了實質(zhì)性提升。有了云計算提供的算力支持,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等發(fā)展帶來的大數(shù)據(jù)整合,為從大數(shù)據(jù)中獲取大價值提供了技術(shù)保障,進一步推動了智慧警務(wù)的發(fā)展[1]。目前,公安部科技信息化局對大數(shù)據(jù)智能化建設(shè)推進方案進行了詳細部署,用于指導(dǎo)多省市的大數(shù)據(jù)規(guī)劃設(shè)計,形成全國統(tǒng)一戰(zhàn)略。
公安部門正面臨各類監(jiān)管數(shù)據(jù)呈幾何增長和高頻流動,這就使得公安人員在信息利用方面還有待提高[2][3]。
一是在數(shù)據(jù)資源采集方面。目前,很多網(wǎng)絡(luò)數(shù)據(jù)都不能實現(xiàn)智能化的自動采集,也有不少民警對原始數(shù)據(jù)的敏感度不夠,忽略數(shù)據(jù)質(zhì)量,導(dǎo)致很多數(shù)據(jù)質(zhì)量較低,無法保證完整性、一致性,為進一步價值挖掘帶來困難。
二是在數(shù)據(jù)融合創(chuàng)新方面。目前,在數(shù)據(jù)處理過程中主要還是以查詢、統(tǒng)計等傳統(tǒng)分析方法為主,運用數(shù)據(jù)建模實現(xiàn)深度挖掘能力偏低,無法滿足警務(wù)實戰(zhàn)的需要。數(shù)據(jù)的運用需要民警辦案經(jīng)驗、大數(shù)據(jù)、IT技術(shù)的融合,能否找到技術(shù)與業(yè)務(wù)的契合點,這就需要辦案人員具有相應(yīng)的思維能力。
三是在大數(shù)據(jù)應(yīng)用方面。目前,很多民警在數(shù)據(jù)應(yīng)用上數(shù)據(jù)思維能力不強,往往依靠傳統(tǒng)經(jīng)驗開展個案的因果分析,不能應(yīng)對新情況。而大數(shù)據(jù)時代,偵查治理需要從個體思維轉(zhuǎn)向總體思維、因果思維轉(zhuǎn)向相關(guān)思維、自然思維轉(zhuǎn)向智能思維。
人們習(xí)慣按經(jīng)驗、感性思維對事物進行判斷,這種思維方式不夠嚴謹、理性,容易出錯。香濃在信息論中將信息定義為一種對不確定的隨機性的消除,而數(shù)據(jù)是信息的載體,如果獲取的數(shù)據(jù)越多,對事物了解的維度也將越多,從而可以更好地消除不確定,做出準(zhǔn)確的決策[4]。過去由于技術(shù)限制無法采集、存儲、處理大量數(shù)據(jù),只能進行數(shù)據(jù)抽樣分析,認識事物會存在很大誤差。而在大數(shù)據(jù)時代,可以方便、快捷、動態(tài)地獲取研究對象相關(guān)的海量數(shù)據(jù),為了更全面、立體、系統(tǒng)地認識事物,思考方式也應(yīng)該從感性思維轉(zhuǎn)向更理性的數(shù)據(jù)思維。
在利用大數(shù)據(jù)認識世界的同時,需要重構(gòu)對數(shù)據(jù)的理解。首先,需要高質(zhì)量的數(shù)據(jù),因為收集數(shù)據(jù)的目的是要產(chǎn)生價值,大數(shù)據(jù)的大是反映事物的信息維度多,但并非數(shù)據(jù)越多越好,無用的數(shù)據(jù)只是垃圾。阿里首席數(shù)據(jù)運營師車品覺提出,盲目地收集不但不會給企業(yè)帶來價值,也承擔(dān)著數(shù)據(jù)收集與管理成本[5]48-53。其次,大數(shù)據(jù)需要管理和利用,大數(shù)據(jù)是真實世界的刻畫,在力求數(shù)據(jù)真實的同時,收集的大數(shù)據(jù)要合理利用,從數(shù)據(jù)中挖掘有價值的規(guī)律,尊重數(shù)據(jù),用數(shù)據(jù)作為管理決策的重要依據(jù)。最后,大數(shù)據(jù)需要構(gòu)建一整套優(yōu)良的數(shù)據(jù)驅(qū)動流程。
表3為兩種運營模式下的運營時間對比。由表3可知,采用站站停運營模式時,13號線全線運營時間為82 min,因本線客流平均運距超過常規(guī)地鐵,且直達客流較多,客流特征適應(yīng)性較差。因此,有必要對快慢車組合運營進行研究。
數(shù)據(jù)思維被認為是“企業(yè)管理的第一思維”。人的思維是對事物認識的高級階段,是人腦活動的內(nèi)在程序,是一種習(xí)慣性思考問題和處理問題的模式,涉及看問題的角度、問題分析的層次和方法,對人的行為模式產(chǎn)生直接影響。恩格斯曾經(jīng)提出:每一個時代的理論思維,都是一種歷史的產(chǎn)物,它在不同的時代具有不同的形式,同時具有完全不同的內(nèi)容[6]。數(shù)據(jù)驅(qū)動方法從20世紀70年代開始起步,數(shù)據(jù)思維需要人們尊重事實、遵循理性、遵守邏輯、追求精確等,強調(diào)“數(shù)據(jù)勝于事實、用數(shù)據(jù)說話、數(shù)據(jù)產(chǎn)生價值”等觀念[5]48-53?;ヂ?lián)網(wǎng)出現(xiàn)后,可用的數(shù)據(jù)量劇增,數(shù)據(jù)驅(qū)動方法的優(yōu)勢越來越明顯。由于各個領(lǐng)域數(shù)據(jù)不斷向外擴展,使得數(shù)據(jù)開始出現(xiàn)交叉,各個維度的數(shù)據(jù)從點和線漸漸連成了網(wǎng),數(shù)據(jù)之間關(guān)聯(lián)性增強,也就形成了大數(shù)據(jù)[7]。而大數(shù)據(jù)思維則是大數(shù)據(jù)時代的產(chǎn)物,即具有數(shù)據(jù)思維的一般共性,也由于自身所特有的4V屬性(如圖2所示,即數(shù)量大、種類雜、速度快、價值密度低),在思維方式上呈現(xiàn)出獨有的特征?!洞髷?shù)據(jù)時代》將大數(shù)據(jù)思維方式歸結(jié)為三點:利用全體數(shù)據(jù)替代隨機樣本,允許數(shù)據(jù)的混雜性而不追求精確性,分析事物采用相關(guān)關(guān)系代替因果關(guān)系[8]。
圖2 大數(shù)據(jù)的4V特征
警務(wù)人員需要培養(yǎng)與之相適應(yīng)的大數(shù)據(jù)思維習(xí)慣,下面從警務(wù)工作視角介紹大數(shù)據(jù)思維原理。
大數(shù)據(jù)思維下,“流程”核心轉(zhuǎn)變?yōu)椤皵?shù)據(jù)”核心,這是當(dāng)前IT產(chǎn)業(yè)的變革,計算框架轉(zhuǎn)變?yōu)橐源髷?shù)據(jù)存儲、計算為核心的范式,數(shù)據(jù)成為智能化的基礎(chǔ)。公安信息化建設(shè)也向“數(shù)據(jù)核心”轉(zhuǎn)變。過去公安信息系統(tǒng)依靠存儲、數(shù)據(jù)庫、應(yīng)用三層傳統(tǒng)的架構(gòu),按工作流程構(gòu)建信息系統(tǒng)?,F(xiàn)在則更關(guān)注數(shù)據(jù)整合利用,綜合利用大數(shù)據(jù)、云計算、人工智能、物聯(lián)網(wǎng)的新技術(shù),在云的框架下實現(xiàn)大數(shù)據(jù)存儲和計算。
大數(shù)據(jù)的意義在于“有用”,從數(shù)據(jù)中獲取知識,基于大數(shù)據(jù)形成的決策可以為組織創(chuàng)造新的價值。而實現(xiàn)數(shù)據(jù)轉(zhuǎn)換為價值需要把業(yè)務(wù)問題定義成一個可分析的數(shù)據(jù)問題,數(shù)學(xué)上是一個回歸分析問題,是從自變量數(shù)據(jù)X中找到因變量數(shù)據(jù)Y之間的關(guān)聯(lián),實現(xiàn)從數(shù)據(jù)到價值的轉(zhuǎn)變[5]48-53。例如,對某P2P網(wǎng)貸平臺風(fēng)險進行評估,希望得到價值風(fēng)險值Y,就需要很多數(shù)據(jù)X來評估。這些可以被利用的數(shù)據(jù)包括P2P網(wǎng)站平臺、公司工商信息、法律訴訟、網(wǎng)絡(luò)輿情、政府公開信息等多維數(shù)據(jù),將一套通過機器學(xué)習(xí)獲得的或通過經(jīng)驗構(gòu)建的計算規(guī)則運用于這些可被觀察的數(shù)據(jù),也就實現(xiàn)了從數(shù)據(jù)到價值的轉(zhuǎn)換。
從抽樣中得到的結(jié)論往往是片面的,數(shù)據(jù)量越大,更能全面反映客觀事實,得到的結(jié)論更接近事實。例如,以前想要知道某條路段的交通擁堵情況,可以抽樣一周路面的車流量數(shù)據(jù),再推斷一般路面情況。但是,這個被抽樣的數(shù)據(jù)不一定能代表整體,可能出現(xiàn)很多不確定性,有可能受其他路段臨時管制影響、受天氣影響等。但現(xiàn)在交管部門具有存儲和處理大數(shù)據(jù)的能力,可以從年度、月度、周、天、時段等更多維度展示某一路段的交通特征,從更全面的樣本觀察規(guī)律和態(tài)勢。甚至可以將交通信息在地圖上進行動態(tài)展示,這些信息可以有效、有針對性地支撐交通管理決策的制定。
大數(shù)據(jù)的使用讓關(guān)注精度轉(zhuǎn)變?yōu)殛P(guān)注效率。大數(shù)據(jù)標(biāo)志著人類在尋求量化和認識世界的道路上前進了一大步,過去很多不可計量、存儲、分析和共享的信息都被數(shù)據(jù)化了,如聲音、行為等。大數(shù)據(jù)思維有點像混沌思維,確定與不確定交織在一起,數(shù)據(jù)的規(guī)律具有高概率、高關(guān)聯(lián)度的特征,這并不是一種精確的對應(yīng)關(guān)系。例如,挖掘隱性吸毒人員時,如果某些人員出現(xiàn)異常行為,如出入特定場所、從事某些職業(yè)、與吸毒人員來往密切等,挖掘模型會計算出這些人員可能吸毒的概率。只要大數(shù)據(jù)分析指出可能性,公安機關(guān)便可以此為依據(jù)做出預(yù)警響應(yīng)。
大數(shù)據(jù)思維模式下,因果關(guān)系轉(zhuǎn)變?yōu)殛P(guān)注相關(guān)性。關(guān)注相關(guān)關(guān)系,是指關(guān)注數(shù)據(jù)之間表現(xiàn)出來的關(guān)聯(lián)性。很多時候可以利用大數(shù)據(jù)的強關(guān)聯(lián)性替代因果性,從而快速找到解決問題的方法。例如,英國通過大數(shù)據(jù)縮小恐怖分子排查范圍??植婪肿悠茐臉O大,也難以監(jiān)控。很多學(xué)者都希望可以提前把他們篩選出來,但通過通信、資金往來的監(jiān)控難以找到有效的篩選方法。而英國經(jīng)濟學(xué)家霍斯利通過大數(shù)據(jù)發(fā)現(xiàn)恐怖分子不買保險,他在傳統(tǒng)的行為監(jiān)測中添加了這個條件,把懷疑范圍大大縮小,警方也根據(jù)這一線索抓獲恐怖分子。不能說不買保險的人就是恐怖分子,但大數(shù)據(jù)表明恐怖分子與購買保險具有強相關(guān)性。從這一相關(guān)性出發(fā),可以很快找到篩選的方法。大數(shù)據(jù)的相關(guān)性分析可以更快速找到解決問題方案,可以先知道結(jié)果,然后再倒推原因,逆向推理也可以建立邏輯關(guān)系因果鏈條。
預(yù)測是大數(shù)據(jù)的核心,計算機會將數(shù)學(xué)算法運用到海量數(shù)據(jù)上,從而預(yù)測事情發(fā)生的可能性。2002年電影《少數(shù)派報告》上映的時候,預(yù)測犯罪還是科幻電影里的情節(jié)。但是,到了大數(shù)據(jù)時代,現(xiàn)在越來越多的案例表明犯罪預(yù)測成為可能。在洛杉磯,警局就從歷史大量案件的數(shù)據(jù)中挖掘特征和規(guī)律,來預(yù)測犯罪高發(fā)的地區(qū),合理安排警察巡邏。這種大數(shù)據(jù)分析預(yù)測成功地降低了轄區(qū)內(nèi)的犯罪率,預(yù)測警務(wù)也成為大數(shù)據(jù)警務(wù)的熱門領(lǐng)域。
大數(shù)據(jù)讓人找信息轉(zhuǎn)變?yōu)樾畔⒄胰?。在互?lián)網(wǎng)的發(fā)展進程中先是人找信息,如通過搜索引擎找到自己所需的信息。但現(xiàn)在很多情況是網(wǎng)絡(luò)根據(jù)用戶偏好,將信息推送給相應(yīng)的人,這也是智能交互時代的轉(zhuǎn)變?!靶畔⒄胰恕本褪峭ㄟ^大數(shù)據(jù)挖掘,把信息推薦給人。公安領(lǐng)域就是由案情到人的思維方式,通過大數(shù)據(jù)挖掘出案件線索,再落地到現(xiàn)實中的人。例如,通過監(jiān)測互聯(lián)網(wǎng)大數(shù)據(jù)發(fā)現(xiàn)涉恐線索,再將這些線索與涉恐人員、涉恐事件信息庫比對,落實嫌疑人。
大數(shù)據(jù)讓人懂機器轉(zhuǎn)變?yōu)闄C器懂人。以往操作計算機的是專業(yè)人員,而現(xiàn)在即使用戶毫無計算機專業(yè)基礎(chǔ),仍然可以使用機器。在警務(wù)工作中,大數(shù)據(jù)應(yīng)用不是抬高技術(shù)門檻,讓用戶望而卻步,而是打造更適合用戶的數(shù)字化環(huán)境。如警務(wù)平臺要減少民警操作步驟,要設(shè)計更簡潔清晰的操作界面,要適應(yīng)警務(wù)人員的工作習(xí)慣。
在警務(wù)視角下,大數(shù)據(jù)思維是指通過數(shù)據(jù)化的整體性思維對數(shù)據(jù)資源、警務(wù)模式、犯罪治理、管理決策進行重新審視,以構(gòu)建多源異構(gòu)的大數(shù)據(jù)管理為基礎(chǔ),通過數(shù)據(jù)采集、整理、分析研判,從海量數(shù)據(jù)相關(guān)性中快速洞見情報信息,從多維信息中消除不確定性,從而讓數(shù)據(jù)驅(qū)動警務(wù)運作的思維方式[2]。推進警務(wù)大數(shù)據(jù)深度應(yīng)用關(guān)鍵要讓大數(shù)據(jù)思維貫穿于案件偵查、社會治理等警務(wù)工作中。從不同的驅(qū)動角度分析思維與警務(wù)工作融合,典型類型如表1所示。
表1 警務(wù)工作中大數(shù)據(jù)的主要分析類型表
大數(shù)據(jù)偵查類分析是一種案件驅(qū)動的被動分析模式,這也是警務(wù)工作中最為常見的分析方法,適合于刑偵、經(jīng)偵等案件偵查。基于大數(shù)據(jù)背景下的偵查分析,需要在辦案過程中結(jié)合案件相關(guān)信息,依托各類應(yīng)用系統(tǒng)進行查詢、分析、比對等,從而獲取或挖掘出案件線索,為案件偵查提供方向、思路和方法[9]。由于犯罪活動相關(guān)的信息與社會信息相交織,嫌疑人在案前、案中、案后的每一個行為都可能被現(xiàn)代電子產(chǎn)品所記錄下來,關(guān)鍵線索信息也隱藏在各類數(shù)據(jù)中。通過對犯罪嫌疑人遺留在犯罪現(xiàn)場的痕跡物證的搜集,通過現(xiàn)場視頻人像、DNA、指紋、被害人等信息關(guān)聯(lián)出多種數(shù)據(jù)。利用大數(shù)據(jù)思維方法引導(dǎo),從大數(shù)據(jù)相關(guān)性原理出發(fā)將偵查假設(shè)、邏輯推理與數(shù)據(jù)相結(jié)合,依托網(wǎng)絡(luò)各類數(shù)據(jù)資源平臺進行關(guān)聯(lián)分析,利用大數(shù)據(jù)多維信息做證據(jù)的交叉驗證,用信息找人原理,從數(shù)據(jù)痕跡確定嫌疑人身份和位置等(如圖3所示)。
圖3 偵查類數(shù)據(jù)分析范例
大數(shù)據(jù)治理類分析是以數(shù)據(jù)驅(qū)動的主動分析模式,通過相關(guān)性分析、對關(guān)鍵元素進行統(tǒng)計分析,可以更有效、更智能、更精準(zhǔn)地支持治理決策,適用于社會警務(wù)、治安防控等[10][11]。在社會治理方面,通過大數(shù)據(jù)技術(shù)提升公安機關(guān)社會治理的智能化水平,包括采用全樣本原理分析事物整體規(guī)律、預(yù)測性原理感知風(fēng)險隱患,主動實現(xiàn)風(fēng)險預(yù)測、犯罪防范等。例如,在服務(wù)群眾方面,采用機器懂人的思維原理,通過數(shù)據(jù)分析有效預(yù)測群眾辦事的熱點時間、熱點事務(wù)等,科學(xué)安排警力,優(yōu)化服務(wù)流程。在交通管理方面,通過全樣本原理和預(yù)測原理分析交通數(shù)據(jù),可以預(yù)知交通流量、重點交通區(qū)域與擁堵情況,合理疏導(dǎo)。在社區(qū)治理方面,可以結(jié)合常駐人口和流動人口、發(fā)案時間與地點、作案特征等信息做相關(guān)性和預(yù)測性分析,從而優(yōu)化小區(qū)安防,加強巡邏,加大安全宣傳,預(yù)防犯罪發(fā)生(如圖4所示)。
圖4 治理類數(shù)據(jù)分析范例
大數(shù)據(jù)目標(biāo)研判性分析是一種以明確目標(biāo)為驅(qū)動的數(shù)據(jù)主動分析模式。圍繞某個對象搜集相關(guān)大數(shù)據(jù),構(gòu)建行為特征,通過機器學(xué)習(xí)建立智能預(yù)測模型,實現(xiàn)對目標(biāo)行為的綜合研判、預(yù)測、預(yù)警[12][13]。這類分析適用于監(jiān)測重點人口、重點行業(yè)、某類犯罪活動等。例如,在重要節(jié)日安保方面,可以通過對各種流量數(shù)據(jù)進行監(jiān)控,有針對性地加強安保巡邏,提前規(guī)避一些重大公共安全事件的發(fā)生。在重點人口管理方面通過大量行為數(shù)據(jù)分析,對異動風(fēng)險進行預(yù)測預(yù)警。將行為數(shù)據(jù)與重點人員數(shù)據(jù)庫相比對,如對涉穩(wěn)群體的異常交通數(shù)據(jù)實時監(jiān)測,對其行為趨勢進行分析,研判風(fēng)險級別,提前做好風(fēng)險應(yīng)對(如圖5所示)。
圖5 目標(biāo)研判類數(shù)據(jù)分析范例
社會已經(jīng)全面數(shù)字化、網(wǎng)絡(luò)化,大數(shù)據(jù)雖然不是萬能的,但在現(xiàn)代社會是不可或缺的。大數(shù)據(jù)思維原理可以歸納為:引用盡量全面的數(shù)據(jù),從多維混雜的數(shù)據(jù)中進行相關(guān)性分析預(yù)測。大數(shù)據(jù)思維是一種可以貫穿人們工作生活,輔助處理問題的能力。從警務(wù)工作中數(shù)據(jù)分析的利用來看,傳統(tǒng)的思維在改進,智能分析化程度在提高。隨著大數(shù)據(jù)警務(wù)的發(fā)展,警務(wù)工作也從案件驅(qū)動更多轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動、目標(biāo)驅(qū)動;由被動分析轉(zhuǎn)化為主動分析;由簡單的查詢,轉(zhuǎn)為大數(shù)據(jù)關(guān)聯(lián)分析、模型化智能分析。