徐會軍 福建警察學院
犯罪治理是國家治理體系和治理能力現(xiàn)代化的重要內容之一,開展犯罪預防,維護社會治安,是關系人民群眾生命財產安全和改革、發(fā)展、穩(wěn)定的大事,對犯罪趨勢的預測可以指導警力有效投入,然而,很多公安實戰(zhàn)部門仍然使用同比、環(huán)比等較為簡單和傳統(tǒng)的趨勢分析手段應對宏觀情報,缺少較為科學的定量分析手段。在我國,盜竊類案件是占比較高的刑事案件,但由于其高發(fā)低破的特點,是公安機關較為頭痛的一類犯罪,因此,以盜竊案件類為對象,開展基于深度學習的犯罪預測研究與應用,對于公安部門依據(jù)預測結果開展高發(fā)案件的專項整治行動與情報研判分析具有十分重要的實際意義。
本文以日為時間單位,采用LSTM網(wǎng)絡開展盜竊案件的趨勢預測分析,探索適合地區(qū)環(huán)境的犯罪預測模型和分析手段。
犯罪預測的研究方向包括:犯罪時空預測(時序預測和犯罪預測)、犯罪類型預測、犯罪人預測、受害人預測和再犯預測[1],本文主要開展犯罪時序預測研究。時間序列數(shù)據(jù)通常能夠刻畫事物及現(xiàn)象的發(fā)展過程,并揭示其發(fā)展規(guī)律,通過建立合適的數(shù)學模型對過去時空的時間序列數(shù)據(jù)進行統(tǒng)計分析則可以實現(xiàn)有效預測[2],犯罪時序預測是利用犯罪數(shù)量時序數(shù)據(jù)進行犯罪預測的一種犯罪預測方法。
我國警務研究者自80年代初就開始運用不同的數(shù)理統(tǒng)計方法開展犯罪時序預測研究。楊萍采用數(shù)學模型對云南省1977~1986年連續(xù)10年的年刑事案件模擬仿真,較為準確的預測1987年的刑事案件數(shù),為犯罪預測的可能性提供科學依據(jù)[3];李其富應用灰色預測模型GM(1,1)對全國的殺人案和搶劫案的案件數(shù)進行了外推預測[4];屈茂輝等建立了中國財產類犯罪的ARMA(1,10)時序預測模型[5];唐德權等采用2014年芝加哥犯罪數(shù)據(jù),設計了一種多模態(tài)信息特征融合的犯罪預測算法[6];張晟運用決策樹算法分析多發(fā)性盜竊案件以期預測潛在案發(fā)時段和區(qū)域[7];鄧靈評引入多種聚類算法對入室盜竊犯罪行為分析,探索盜竊犯罪的時空規(guī)律[8]。研究者嘗試多維度進行犯罪分析和預測,但多數(shù)依賴國外數(shù)據(jù)或國內的宏觀統(tǒng)計數(shù)據(jù),主要采用傳統(tǒng)的機器學習方法或數(shù)理統(tǒng)計方法,多數(shù)集中于長期或宏觀視角的研究分析,缺乏對于微觀層面的數(shù)據(jù)分析以及對于短期預測研究還需進一步豐富與改進[9]。
傳統(tǒng)的犯罪分析對于經(jīng)驗的依賴性強,容易受主觀盲目性、分析數(shù)據(jù)量等因素限制;目前,我國犯罪的情勢出現(xiàn)了新變化,新型犯罪不斷出現(xiàn),需要推廣科學的研究方法在犯罪學中的應用[10],社會治理亟需犯罪學界貢獻出更為科學有效的犯罪治理良策。犯罪預測面臨的一個主要挑戰(zhàn)是能否準確有效地分析日益增長的犯罪數(shù)據(jù)集[11],大數(shù)據(jù)時代的來臨,為短期犯罪預測提供了技術支撐。在當前大數(shù)據(jù)時代背景下,隨著機器學習方法在各研究領域的不斷普及和應用,犯罪預測防控研究迎來了新的機遇,運用深度學習方法開展犯罪分析與預測研究,能夠有效促進理論與實踐,為社會治理與犯罪防控提供科學有效的手段。
犯罪事件具有時間和空間上的關聯(lián)性,這種關聯(lián)性在學習算法中表現(xiàn)為對數(shù)據(jù)時空特征的記憶性。深度學習之所以比傳統(tǒng)機器學習具有更強的泛化能力,就是因為其良好的記憶能力,尤其長短期記憶模型(Long Short-Term Memory,LSTM)算法能夠有效記住犯罪事件在發(fā)生時間和空間上的長期或短期特征,這是傳統(tǒng)機器學習算法所不具備的。LSTM是由RNN發(fā)展而來的一種遞歸網(wǎng)絡[12],具有隱藏單元循環(huán)遞歸的特點,能夠將上一時間節(jié)點的特性傳遞到當前節(jié)點,在性能上具有更好的優(yōu)勢,近年來被廣泛應用于時序分析研究上,沈寒蕾等提出基于長短期記憶模型的入室盜竊犯罪預測研究[9];顏靖華等提出基于LSTM網(wǎng)絡的盜竊犯罪時間序列預測研究,對比ARIMA、支持向量回歸、隨機森林以及XGBoost等方法的預測結果,具有較高的預測精度[13];劉學仁等提出基于長短期記憶模型的盜三車犯罪預測[14]。從研究結果來看,基于深度學習的犯罪預測分析手段具有較為出色的預測表現(xiàn),能夠較好的實現(xiàn)犯罪行為的分析預測。
本文通過對A市的盜竊警情數(shù)據(jù)開展基于LSTM的盜竊犯罪趨勢預測分析研究,通過分析提取盜竊案件內在的規(guī)律性和關聯(lián)性,充分運用大數(shù)據(jù)技術“大海撈針”的特點,為A市公安機關預防犯罪行為的發(fā)生和案發(fā)后的情報研判提供較為科學的方法,對于指導公安機關實施微觀打擊,提升綜合戰(zhàn)斗力,具有十分重要的實戰(zhàn)意義。
1943年,Warren McCulloch和Walter Pitts提出人工神經(jīng)網(wǎng)絡(Artificial Neural Networks,ANN),打開了人工神經(jīng)網(wǎng)絡的全新局面。ANN是一種模擬人體大腦神經(jīng)活動行為的復雜網(wǎng)絡結構,通過對人腦神經(jīng)元的建模和聯(lián)接,構建出具有人腦神經(jīng)功能的模型。神經(jīng)網(wǎng)絡從環(huán)境中學習,將結果以樣本模式存儲并輸入網(wǎng)絡,再根據(jù)學習算法調整各層網(wǎng)絡的權值矩陣,學習過程的結束與否由網(wǎng)絡的權值收斂值決定。
循環(huán)神經(jīng)網(wǎng)絡(RNN)是指隨著時間的推移而反復出現(xiàn)的一種結構。它廣泛應用于自然語言處理(NLP)、語音和圖像處理等領域。RNN實現(xiàn)了類似人腦的機制,能在一定程度上保留處理過的信息,不同于其他類型的神經(jīng)網(wǎng)絡不能保留處理過的信息,因此是進行時間序列分析的最好選擇。
RNN存在長序列依賴會出現(xiàn)梯度爆炸和梯度消失問題[15],而犯罪事件的近期重復性特點,具有時空范圍依賴度,因此無法用于犯罪預測研究。1997年,Hochreiter等人解決了長期依賴問題,在RNN改進基礎上提出LSTM模型[12],可以對長期依賴信息進行學習,能夠處理梯度消失問題,使得可處理序列長度更長的問題。LSTM擁有優(yōu)異的長序列性能,是一種包含多個神經(jīng)網(wǎng)絡模塊的連接鏈結構,LSTM網(wǎng)絡引入了三個門限(交互運算過程),分別是遺忘門ft更 新門it和 輸出門ot,如圖1所示。
圖1 LSTM內部運算結構圖
(1)首先細胞狀態(tài)Ct-1的信息,將在最上面那條線上傳遞;利用不同門運算過程,t時刻的隱層狀態(tài)ht與輸入Xt會 對Ct進行狀態(tài)更新并傳遞到下一時刻。
(2)遺忘門層:使用取值為[0,1]間控制變量σ逐位與狀態(tài)變量Ct-1相乘,當σ為0時,則Ct-1對應的信息就被舍去(遺忘)了,只有σ為1時才保留完整狀態(tài)信息。
(3)更新門層:這一層有兩個步驟,一是通過變量σ控制狀態(tài)變量,表示有所選擇的遺忘過去信息,獲得輸出it;二是通過歸一處理為[-1,1]的激活函數(shù)tanh進行類似遺忘門的過程,表示有保留的獲取更新信息Ct,兩部分信息加起來就是更新內容。
(4)輸出門層:利用變量σ控制輸出內容,并通過tanh函數(shù)縮放為最后t時刻的輸出。
以上就是LSTM在t時刻的完整運算過程。本文的研究就是在上述過程中實現(xiàn)對盜竊警情的分析預測。
本研究主要目的在于探索深度學習技術在犯罪趨勢預測的應用實踐,針對A市3年的日盜竊犯罪的110接警數(shù)據(jù),運用TensorFlow平臺的LSTM模型模擬預測,為犯罪預測提供較為科學的方法手段。
1. 時間分割
考慮到數(shù)據(jù)的特殊性,研究首先對110警情數(shù)據(jù)進行脫敏處理,僅保留數(shù)據(jù)的時間列;然后進行時間分割,為LSTM模型輸入數(shù)據(jù)做準備。本研究假定犯罪預測模型是針對指定區(qū)域每天的犯罪情況做預測,因此,通過Excel透視表功能,將數(shù)據(jù)整合以日尺度為單位的時間序列,從時間維度上將原始數(shù)據(jù)按天進行分割,整理為包括每日的盜竊犯罪案件數(shù)量和對應時間的數(shù)據(jù)集。經(jīng)整理,數(shù)據(jù)集共包含盜竊警情56000起,日均51起,其中,最高105起,最低4起,標準差為19.5起。從數(shù)據(jù)集的時間分布趨勢上看(如圖2所示),警情數(shù)量隨時間波動較大,呈上升趨勢,之后趨于平穩(wěn)的狀態(tài)。
圖2 盜竊警情分布趨勢
2. 平穩(wěn)性檢驗
為確保數(shù)據(jù)集具有較好的平穩(wěn)時序特征,需要對數(shù)據(jù)集進行單位根(ADF)檢驗。因為數(shù)據(jù)集的ADF檢驗值小于1%置信水平的臨界值,對數(shù)據(jù)集進行一階差分平移,平移后,數(shù)據(jù)集的ADF檢驗值小于1%置信水平的臨界值,屬于平穩(wěn)序列,能夠進行時序預測(見表1)。
表1 數(shù)據(jù)集的ADF檢驗結果
3. 建立多變量序列
本文參考顏靖華等人提供的特征因素提取方法[13],引入月份(month)、工作日(Is_weekend)、是否節(jié)假日(Is_holiday)、每月均值(month_avg)、每工作日均值(weekend_avg)、每非工作日均值(weekday_avg)以及前一日的警情數(shù)量(count_lag1),建立多變量時間序列,并轉換為監(jiān)督學習數(shù)據(jù)集,其中滯后觀察日為1,并進行歸一化處理。
4. 模型構建
預測模型主要由LSTM、Dense兩個層級構成,將上述數(shù)據(jù)集按比例分割成訓練集和測試集數(shù)據(jù)輸入LSTM模型,其中損失函數(shù)為MAE,優(yōu)化器函數(shù)為ADAM,設置好epoch、batchsize等參數(shù),并采用均方根誤差(RMSE)對模型進行性能評估。
(二)結果與討論
擬合結果如圖3所示,虛線前的日期為訓練集,虛線后的日期為測試集。在訓練集中,LSTM模型較好地捕捉了盜竊犯罪案件數(shù)量的波動,擬合效果較好。將測試集結果輸入LSTM模型進行性能評估,預測性能評估指標RMSE為0.099,表明測試結果較好。圖4為預測結果進行反歸一化及逆向1階差分等還原操作過程后數(shù)據(jù)對比效果。
圖3 LSTM損失分析過程
圖4 LSTM預測結果
本文采用LSTM模型實現(xiàn)了多變量時間序列的日尺度盜竊警情數(shù)據(jù)的預測分析,結果表明,LSTM模型能夠較為出色的對日尺度下的警情進行模擬預測,能夠一定程度的給出犯罪行為的總體趨勢演變情況。本文研究基于盜竊案件是一個獨立的封閉系統(tǒng)的假定下開展,然而,犯罪行為是一個受眾多因素影響的復雜事件,本文的研究僅僅提供了一個犯罪預測的方法和手段,在犯罪預測和情報研判實戰(zhàn)中,應當融合社會等因素,預測結果也只能作為警力部署和智慧決策的參考。
從技術角度上看,犯罪預測面臨的一個難點就在于能否準確有效地分析日益增長的犯罪數(shù)據(jù)集,對于使用規(guī)模較大的數(shù)據(jù)集時,模型精度就高,反之,模型精度就會較低,因此,一個具有較高精度的犯罪預測分析模型的實現(xiàn),需要大量的歷史案例積累進行訓練。另外,受限于犯罪預測算法的局限性和不確定性,多種模型的混合應用能夠有效提高犯罪預測的精度[11],后續(xù)的研究將引入更多的因素,通過構建混合模型來提升預測精度,讓預測方法更加科學,更貼近實戰(zhàn)。