張蕾華, 張惠絨
(山西警察學院偵查系,山西太原 030401)
偵查畫像是公安機關推進偵查工作的重要技術手段。公安機關在偵查破案過程中根據(jù)已獲得情報和線索對犯罪嫌疑人進行描述和刻畫,以此作為尋找和確認犯罪人的依據(jù)。它包括人臉模擬畫像、犯罪地理畫像和犯罪心理畫像3個階段。人臉模擬畫像技術最早運用在案件偵破過程中,它是依據(jù)現(xiàn)場目擊者的語言描述,對犯罪嫌疑人的面部特征進行描繪從而識別鎖定犯罪嫌疑人的一種手段。隨著技術發(fā)展出現(xiàn)了計算機智能人臉模擬畫像,其原理是基于事先儲存的大量人臉各部位模板,通過計算機圖像處理功能進行不斷調整和組合,形成與犯罪嫌疑人高度契合的人臉圖像[1]。其次是犯罪地理畫像技術。犯罪地理畫像是對犯罪人地緣關系的一種刻畫,通常適用于系列殺人、強奸案件,將系列案件的發(fā)生地標注在地圖上進行分析,進而推斷犯罪人的居住地點、經(jīng)常出行地點和可能再次作案的地點[2]。有學者提出犯罪地理畫像不僅可以分析系列案件犯罪嫌疑人的地緣關系,也可以運用于殺人分尸拋尸案件,警方可以通過多個拋尸地點在空間位置關系來查找第一殺人現(xiàn)場[3]。犯罪心理畫像技術是根據(jù)已掌握情況對犯罪嫌疑人進行相關行為、心理過程、動機的綜合分析,形成對犯罪嫌疑人形象和心理特征群的描述[4]。這是唯一持續(xù)至今仍然廣為使用的一種偵查技術手段。在西方,犯罪心理畫像有多種稱謂:犯罪人畫像、行為畫像、地理畫像、犯罪人格畫像等[5]。犯罪心理畫像技術是基于犯罪嫌疑人的作案手段和現(xiàn)場痕跡推斷其犯罪心理、行為習慣乃至其他社會特征。這也是偵查畫像技術的重大發(fā)展。
社會環(huán)境層面。進入網(wǎng)絡信息社會,尤其2020年疫情以來,大數(shù)據(jù)技術滲透進人們的日常生活和工作也因此儲備了海量的數(shù)據(jù)。對于公安機關來講,數(shù)據(jù)也已經(jīng)成為公安情報工作的研究對象[6]。海量的數(shù)據(jù)中包含大量有關生活軌跡、興趣愛好、日常習慣的信息,電商可以通過這些數(shù)據(jù)信息進行人員刻畫進而制定精準營銷策略。同理,公安機關可以利用這些信息對業(yè)務對象進行多維的刻畫,分析其個人屬性、性格愛好、經(jīng)濟基礎、消費水平等特征。
技術發(fā)展層面。信息科技的發(fā)展已經(jīng)使人類具備存儲并分析挖掘海量數(shù)據(jù)潛在價值的技術,“元宇宙”被稱為是互聯(lián)網(wǎng)的下一個發(fā)展階段,人們普遍認為終極的“元宇宙”將聯(lián)通物理世界和數(shù)字世界,是未來的生活方式。支撐“元宇宙”的技術基礎已經(jīng)具備[7]。它不僅產生和存儲數(shù)據(jù),而且能夠對數(shù)據(jù)進行有效的分析挖掘,是進行數(shù)據(jù)畫像依托的技術基礎。
(1)網(wǎng)絡數(shù)據(jù)廣泛存在。人們在搜索資料、瀏覽網(wǎng)頁、網(wǎng)絡社交、網(wǎng)上購物的時候會留下相應的數(shù)據(jù)痕跡,這些幾乎覆蓋線上線下的數(shù)據(jù)可以反映個人出行、消費、社交等特征,公安機關通過分析這些數(shù)據(jù)就可以挖掘有關其性別、社交性格、行為狀態(tài),構建初步的特征畫像,將這些數(shù)據(jù)整合分析就可以刻畫出行為軌跡,進而分析是否和犯罪有關聯(lián)[8]。
(2)網(wǎng)絡數(shù)據(jù)形態(tài)多樣。從數(shù)據(jù)來源看,有來自不同部門和領域的數(shù)據(jù),如交通數(shù)據(jù)、氣象數(shù)據(jù)、傳感器感知數(shù)據(jù);從數(shù)據(jù)形態(tài)來看,有文本數(shù)據(jù)、影像數(shù)據(jù)、語音數(shù)據(jù);從數(shù)據(jù)結構來看,有結構化數(shù)據(jù)、非結構化數(shù)據(jù),還有半結構化數(shù)據(jù);從數(shù)據(jù)種類來看,有網(wǎng)約車、共享單車的出行數(shù)據(jù),有外賣的地理空間數(shù)據(jù),有銀行網(wǎng)貸的金融數(shù)據(jù),有移動支付的消費數(shù)據(jù),等等。這些多源、異構、海量的數(shù)據(jù)為進行業(yè)務對象畫像、數(shù)據(jù)建模、行為預測提供了廣泛和多維度的資源。
(3)網(wǎng)絡數(shù)據(jù)即時動態(tài)?,F(xiàn)實社會人們的交往行為具有“在場性”特點,但同時呈現(xiàn)出“去場化”和虛擬性的特點,人們可以隨時隨地與身在全球各地的其他個體進行溝通交流,而且所獲得的數(shù)據(jù)都是實時動態(tài)的[9]。偵查工作中,時間和空間是非常重要的兩個要素,而這些即時動態(tài)的數(shù)據(jù)能夠為偵查畫像技術提供時間和空間維度的標準。
現(xiàn)實行為和網(wǎng)絡活動之間存在緊密的一一映射關系,所以現(xiàn)實社會與網(wǎng)絡空間是一種鏡像關系,每一個現(xiàn)實社會當中的人都可以在網(wǎng)絡空間中找到與自己相對應的“數(shù)據(jù)人”[10]。偵查人員能夠根據(jù)現(xiàn)實空間的人和事物去搜尋與其對應的數(shù)據(jù)形式,還可以通過該數(shù)據(jù)形式分析出行為軌跡與心理特征等信息,再折回現(xiàn)實空間形成目標人的數(shù)據(jù)畫像。
(1)能夠實現(xiàn)從靜態(tài)特征到動態(tài)軌跡的刻畫。傳統(tǒng)的犯罪人畫像常常是一個人個人屬性描述,性別、年齡、相貌、文化程度……這些信息是相對靜態(tài)和穩(wěn)定的。在融合網(wǎng)絡數(shù)據(jù)的偵查畫像技術中,更多的過程數(shù)據(jù)開始被利用對人員進行動態(tài)描摹,這就突破了僅依據(jù)個人特征數(shù)據(jù)靜態(tài)構建模型的限制。借助網(wǎng)絡動態(tài)大數(shù)據(jù)分析,可以發(fā)現(xiàn)犯罪人的行為特點及行為軌跡,進而構建類案犯罪行為的數(shù)據(jù)畫像,就能夠實現(xiàn)對犯罪特異行為的快速識別和情報預警。
(2)能夠實現(xiàn)從簡單特征到多維影像的刻畫。傳統(tǒng)案件偵查中,囿于犯罪現(xiàn)場和偵查員所掌握的信息,對犯罪人的描繪常常是性別、年齡、身高等簡單的個人屬性特征,而融合網(wǎng)絡數(shù)據(jù)的偵查畫像技術還可以拓展偵查對象的心理特征、愛好習慣、個性情感進行多維的描述。
(3)能夠實現(xiàn)從模糊描述到精確刻畫。海量數(shù)據(jù)的挖掘技術能夠實現(xiàn)更精準的人員刻畫,畫像可描述的特征越來越豐富,并可以將目標人的所有特征、行為都進行數(shù)據(jù)化的表示。
在大數(shù)據(jù)的時代背景下,偵查畫像應具有傳統(tǒng)犯罪畫像和數(shù)據(jù)精算分析技術的雙重特點。精算思想以概率統(tǒng)計為基礎,一直應用于保險領域,如今正逐步向其他行業(yè)領域拓展。對風險的量化分析是其核心,對于不確定性的分析是精算研究的主要內容[11]。數(shù)據(jù)精算理論在偵查工作中深入應用可以有效解決海量數(shù)據(jù)帶給人們數(shù)據(jù)爆炸的困惑。
(1)能夠實現(xiàn)從被動分析到主動預測。精算思想的核心是“預”,引入精算思想的偵查畫像技術不僅僅停留在案件發(fā)生之后的案情“解讀”,還應該有罪案發(fā)生前期的“預測”。融合網(wǎng)絡數(shù)據(jù)的偵查畫像除了具備傳統(tǒng)畫像的功效之外,還能夠預測和預防犯罪。因為網(wǎng)絡數(shù)據(jù)中存儲和記錄著犯罪人在案件預備階段的行為特性與心理痕跡,以大數(shù)據(jù)技術為支撐的類案犯罪人畫像,偵查機關可以依據(jù)數(shù)據(jù)畫像提前預測犯罪,實現(xiàn)情報預警和主動偵查。
(2)能夠實現(xiàn)快速精準畫像。連鎖超市塔吉特擁有專業(yè)的顧客數(shù)據(jù)分析模型,可對購買行為進行精確分析,然后實施精準營銷策略,這是通過購物數(shù)據(jù)對社會個體特征的精準畫像。可以借鑒這種商業(yè)“數(shù)據(jù)畫像模式”用于對犯罪嫌疑人的畫像描繪,刻畫嫌疑人或相關人的身份、興趣、愛好、人際交往關系等特征,為偵查活動提供線索和情報[12]。
(1)犯罪行為的異動性。偵查異動思維理論認為,具有社會危害性的犯罪行為是一種異于正常的特殊行為,犯罪行為人是異于常人的特殊人群[13]。異動性表現(xiàn)有異動動作、異動表情、異動服飾、異動物品,比如涉恐犯罪人員可能具有著裝與季節(jié)不符、攜帶可疑物品、頻繁出入大型活動場所、神情恐慌等表現(xiàn)。中國工程院院士鄔賀銓表示:恐怖分子在行動之前,肯定會有蛛絲馬跡表露出來,公安機關可以不斷地收集積累數(shù)據(jù),提煉關鍵特征標簽畫像,從而對恐怖犯罪進行排查和預警[14]。
(2)異動行為的網(wǎng)絡化。在通過監(jiān)控分析恐怖分子日常各種數(shù)據(jù),如出行、購物、聊天記錄等網(wǎng)絡行為進行恐怖犯罪預警和排查,已經(jīng)成為國際反恐的常用手段。融合網(wǎng)絡數(shù)據(jù)的偵查畫像技術的客體已經(jīng)由現(xiàn)實行為轉變?yōu)榫W(wǎng)絡數(shù)據(jù),與傳統(tǒng)的偵查畫像技術不同,公安機關通過挖掘分析帶有個人特征的網(wǎng)絡數(shù)據(jù),對具有網(wǎng)絡映射的行為進行特征標簽進而刻畫偵查對象的身份、興趣愛好、行為特征、犯罪嫌疑等情況。
大數(shù)據(jù)時代,所有的網(wǎng)絡活動都可以成為碎片化的數(shù)據(jù)痕跡,反映出個人的性格、習慣、態(tài)度等。融合網(wǎng)絡數(shù)據(jù)的畫像就是基于數(shù)據(jù)的現(xiàn)實代表,大數(shù)據(jù)環(huán)境為畫像信息標簽化提供了藍本[15],公安機關可以通過這些數(shù)據(jù)信息進行犯罪人畫像,為犯罪情報預警提供支持,見圖1。
圖1 融合網(wǎng)絡數(shù)據(jù)的偵查畫像技術實施框架
進行數(shù)據(jù)畫像必須要有相應的數(shù)據(jù)條件,全面、多維的數(shù)據(jù)是進行畫像的基礎,采集的數(shù)據(jù)應確保內容可靠、完整、多樣。技術人員可以通過數(shù)據(jù)爬蟲、采集程序獲取包括用戶基本信息、行為數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等信息。其中,基本信息包括姓名、性別、職業(yè)、郵箱等;行為數(shù)據(jù)包括網(wǎng)頁瀏覽、網(wǎng)絡購物、外賣預定、出行地址等等,能夠反映行為人的興趣偏好,通常是動態(tài)變化的;用戶統(tǒng)計數(shù)據(jù)如熱門檢索主題、地域分布、受訪頁面等,能夠體現(xiàn)一段時間內用戶的整體需求與訪問情況[16]。數(shù)據(jù)收集過程應注意兩點:
(1)數(shù)據(jù)收集技巧,要善于由一點向多點發(fā)散。
(2)多點關聯(lián)搜索與挖掘數(shù)據(jù)。
對于采集到的數(shù)據(jù)需要經(jīng)過一系列規(guī)范化、標準化的處理才能用于畫像構建,即數(shù)據(jù)清洗、標引、解析和關聯(lián)等。對原始信息數(shù)據(jù)缺失或填寫不規(guī)范的數(shù)據(jù),通過人工或機器的方式對其規(guī)范化處理,以便進行后續(xù)分析、挖掘工作;對于非結構化數(shù)據(jù)必須要通過標引、解析將其轉化為結構化的數(shù)據(jù),為下一步構建畫像標簽體系服務;對于其他某類數(shù)據(jù)要從不同的文件中提取出來并進行合并,解析后再以統(tǒng)一的格式存放到指定文件或數(shù)據(jù)庫當中??傊?對于采集來的原始數(shù)據(jù)必須采用相關技術對其進行加工和處理,使其規(guī)范化、標準化以提高數(shù)據(jù)的可用性。
在當前數(shù)據(jù)畫像應用中,客體標簽的建立是一個主要環(huán)節(jié)[17]。畫像技術的核心是構建標簽體系。標簽是描述客觀事物的方法,或者說是對業(yè)務對象邏輯的抽象表達。有學者指出,建立用戶畫像的關鍵就是生成描述畫像的標簽。由于標簽具有規(guī)范性,標簽亦可以被計算機方便地進行提取、聚類等處理[18]。畫像過程中每一個數(shù)據(jù)標簽的背后是大量的數(shù)據(jù)分析和挖掘,因此大大提高了數(shù)據(jù)可用性意義識別,可以說,犯罪人的畫像就是特征標簽的集合,特征標簽越豐富,人員的畫像就越形象,越能支撐情報人員做出準確的決策。利用大數(shù)據(jù)統(tǒng)計分析和基礎屬性標注技術,對公安業(yè)務對象實體形成特定的標簽體系,還能夠結合不同的業(yè)務場景,利用標簽挖掘與實體相似行為的模型,可以快速定位具有犯罪異常的行為的對象,提高打擊犯罪和防范突發(fā)事件的能力。
經(jīng)過以上階段的數(shù)據(jù)處理,我們通過機器學習技術,對目標人的行為、偏好進行算法評估,就如同一個y=kx+b的算法,x代表已經(jīng)掌握的數(shù)據(jù)信息,y是對目標的行為偏好特征的刻畫,我們要通過不斷的調整k和b來得出精確的y。這個過程涉及到各類計算機算法,通過各類算法要把目標人的基本屬性(性別、年齡、戶籍地域)、心理特征、行為特征、興趣愛好、社交網(wǎng)絡等特征完成標簽化。
案件偵查過程中,公安機關想方設法要解決的兩個關鍵問題就是:他是誰?他在哪里?這正是偵查畫像要解決的。一方面,通過網(wǎng)絡數(shù)據(jù)的集合映射進行犯罪人畫像,分析現(xiàn)實生活中的犯罪行為人特征,進而發(fā)現(xiàn)追蹤犯罪人。另一方面,對犯罪人的特征進行深度凝練并全面刻畫,為其貼上特征數(shù)據(jù)標簽,實現(xiàn)犯罪人與犯罪行為快速、精準的映射和匹配,也就是對犯罪個體信息的標簽化,通過收集特定犯罪對象群體的數(shù)據(jù)信息,刻畫類案犯罪對象的特性全貌,這樣公安機關就可以全方位、多視角掌握犯罪嫌疑人行為特征并進行情報預警。
融合網(wǎng)絡數(shù)據(jù)的偵查畫像技術是以公安大數(shù)據(jù)為基礎,通過網(wǎng)絡數(shù)據(jù)資源多維度的刻畫犯罪嫌疑對象,即根據(jù)目標對象的人口學特征、網(wǎng)絡社交活動、網(wǎng)絡瀏覽內容和消費行為等信息,刻畫推測出犯罪人的個體特征,如表1。融合網(wǎng)絡數(shù)據(jù)的偵查畫像技術能夠按照相應的規(guī)則將這些數(shù)據(jù)進行自動識別,從數(shù)以千萬計的用戶數(shù)據(jù)中找出目標犯罪人。
表1 依托網(wǎng)絡數(shù)據(jù)的個體特征刻畫
目前最常見的是利用行為軌跡特征來構建畫像。行為軌跡特征主要是目標人的日?;顒有畔?如上網(wǎng)動態(tài)、交通出行、旅游等相關活動,通過這些行為以及行為背后的數(shù)據(jù)進行統(tǒng)計分析,從而獲取其網(wǎng)絡行為偏好。羅格斯大學的學者熊輝等研究發(fā)現(xiàn),有相當數(shù)量的扒手是在地鐵和公交車上被抓的。于是,他們對北京智能公交一卡通數(shù)據(jù)進行分析研究,根據(jù)交通軌跡來區(qū)分正常人和小偷,并且成功地識別出了92.7%的小偷。通過對不同人的行為軌跡進行可視化研究之后發(fā)現(xiàn):正常的出行者軌跡通??傇诰幼〉睾凸ぷ鞯貎牲c之間;旅游者會頻繁地訪問景點區(qū)域;購物者主要訪問商業(yè)區(qū)域;正常的人出行會選擇最短的距離、最快的時間,而扒手的行為軌跡是一種流浪的模式,他們沒有清晰的目的地,經(jīng)常會隨機地停留、頻繁地換乘,還會經(jīng)常出現(xiàn)短途出行,比如訪問人流量高的購物區(qū)或是景點[19],如圖2,這是通過網(wǎng)絡數(shù)據(jù)對人的行為軌跡的刻畫,以此進行不同的人的身份識別和行為特征的認定。
圖2 基于公交卡數(shù)據(jù)的不同群體行為軌跡刻畫
融合網(wǎng)絡數(shù)據(jù)的偵查畫像技術改變了傳統(tǒng)警務的執(zhí)法模式,提升了犯罪預測的效率與精確度。在畫像過程中,公安機關可以識別目標對象的個人信用、犯罪風險和犯罪可能等特征數(shù)據(jù),深入分析挖掘后獲得潛在罪犯的情報信息,通過網(wǎng)絡數(shù)據(jù)建模構建畫像,就能夠對其海量的行為數(shù)據(jù)進行監(jiān)控和提煉,一旦有異于常規(guī)的動作就會迅速被發(fā)現(xiàn)。京東集團風控平臺曾經(jīng)通過人員畫像成功發(fā)現(xiàn)一起盜刷銀行卡案件,并且先于被害人報案第一時間發(fā)出預警。風控平臺根據(jù)受案人的網(wǎng)絡購物數(shù)據(jù)對其進行的畫像:男性、20歲左右、有女朋友,經(jīng)常購買電子產品的小禮物;消費水平偏低,價格通常幾百元左右;支付方式固定用微信零錢。犯罪人的作案手段是通過一個虛假考試成績查詢短信在被害人手機埋入木馬程序,然后盜刷其綁定的銀行卡。風控平臺發(fā)現(xiàn)犯罪人此次的購買方式和以前平臺的畫像出現(xiàn)極大偏差:首先,購買的物品是一個充氣玩偶,試想一位男性有女朋友為什么要買充氣玩偶呢?第二,購買物品的價格是全網(wǎng)的最高價格(49 966元),而且毫不猶豫,支付速度極快,選擇最貴的直接支付,不同于以前還要花時間瀏覽貨比三家;第三,改變了先前的微信付款方式而直接刷銀行卡支付。作案人購買的物品、消費價格水平、瀏覽時間還有支付方式這些要素都發(fā)生變化,所以觸發(fā)了預警(見圖3)。本案當中,盜刷銀行卡犯罪是一種違反常態(tài)的特異行為,京東風控平臺能夠先于被害人報警發(fā)現(xiàn)案情并發(fā)出預警,得益于平臺系統(tǒng)對客戶的精準畫像。
圖3 基于網(wǎng)絡數(shù)據(jù)的犯罪行為識別預警
數(shù)據(jù)已經(jīng)成為公安情報的重要資源,大數(shù)據(jù)也為人類理解復雜系統(tǒng)關系提供了新的思維方式[20]。融合網(wǎng)絡數(shù)據(jù)的偵查畫像對當今大數(shù)據(jù)時代公安機關打擊預防犯罪具有重要意義,能夠幫助情報人員從海量數(shù)據(jù)中挖掘公安業(yè)務對象的群體或個人特征,全面掌控并動態(tài)追蹤犯罪行為,有針對性地開展重點人員管控及犯罪預防打擊等工作。融合網(wǎng)絡數(shù)據(jù)的偵查畫像技術能夠對犯罪嫌疑人的個體特征、行為軌跡、時空信息等進行有深度、有準度、有力度的分析刻畫,打破了傳統(tǒng)偵查畫像技術的功能局限,推動數(shù)據(jù)畫像技術在偵查場域中的應用,提高公安機關偵查工作技術化和智能化。