◆周逸璇 李晶晶 徐津霞 劉紅杏
(1.云南司法警官職業(yè)學(xué)院“科學(xué)研究基金項目”課題組 云南 650211;2.云南中醫(yī)藥大學(xué) 云南 650211)
社區(qū)矯正最初起源于西方國家,我國從2003 年開始在北京等6 個省、市開始社區(qū)矯正試點工作,2007 年推廣至全國實行[1]。十多年來,經(jīng)過各地社區(qū)矯正機構(gòu)的共同努力下,成功地將一大批社區(qū)矯正對象教育矯正為守法公民,在社會治理和法治中國建設(shè)中發(fā)揮了重要的作用,節(jié)約了國家的刑罰執(zhí)行成本,維護了社會的和諧與穩(wěn)定,有效促進了司法文明的進步與發(fā)展[2]。2020 年7 月1 日起開始施行的《中華人民共和國社區(qū)矯正法》,將國家支持社區(qū)矯正機構(gòu)提高信息化水平寫入了總則,第一次以立法的形式確立了運用現(xiàn)代科學(xué)技術(shù)對社區(qū)矯正對象進行監(jiān)管和教育幫扶的法律地位,為社區(qū)矯正信息化發(fā)展提供了有力的法律依據(jù)[3]。
在現(xiàn)階段,利用數(shù)據(jù)挖掘、模式識別和機器學(xué)習(xí)等大數(shù)據(jù)技術(shù)對社區(qū)矯正對象從入矯、施矯到解矯全過程產(chǎn)生的數(shù)據(jù)整合成數(shù)據(jù)集,然后進行聚類、關(guān)聯(lián)、分類和深度分析,提煉信息規(guī)律,獲取知識,基于數(shù)據(jù)分析對社區(qū)矯正對象再次犯罪的相關(guān)因素進行研究,進而對社區(qū)矯正對象再犯罪的危險性進行預(yù)測預(yù)警,可以有效預(yù)防和減少犯罪,提升教育矯正質(zhì)量,達到維護社會安全穩(wěn)定的目的[4]。
社區(qū)矯正是立足我國基本國情發(fā)展起來的具有中國特色的刑事執(zhí)行制度,是與監(jiān)禁矯正相對的非監(jiān)禁刑罰執(zhí)行制度,是指將管制、緩刑、暫予監(jiān)外執(zhí)行、假釋的符合法定條件的罪犯置于社區(qū)內(nèi),由專門的司法行政機關(guān)、社區(qū)矯正機構(gòu)和司法所在相關(guān)社會團體和社會志愿者的協(xié)助下,在判決、裁定或決定確定的期限內(nèi),矯正其犯罪的行為惡習(xí)和心理,促進其改造為遵紀(jì)守法的合格公民,促進其順利回歸社會的非監(jiān)禁刑罰執(zhí)行活動[5]。
被判處管制、宣告緩刑、假釋或者暫予監(jiān)外執(zhí)行的罪犯[6]。
關(guān)于大數(shù)據(jù)的定義,在不同領(lǐng)域有著不同的概念。麥肯錫的報告提出,“大數(shù)據(jù)”是一種數(shù)據(jù)集,該數(shù)據(jù)集超出了一般普通數(shù)據(jù)庫軟件的采集、存儲、管理和分析能力[7]。大數(shù)據(jù)并不是描述數(shù)據(jù)量的大小,而是在種類繁多,數(shù)量龐大的多樣數(shù)據(jù)中快速地獲取有用的信息[8]。關(guān)于大數(shù)據(jù)的特點,普遍認為有四個:大量化、多樣化、快速化和價值化。通俗地講,就是從海量的數(shù)據(jù)中挖掘出有價值的信息[9]。
社區(qū)矯正對象再犯罪,是指社區(qū)矯正對象在社區(qū)矯正期間再一次實施犯罪[10]。
截至目前,全國司法行政機關(guān)和社區(qū)矯正機構(gòu)累計接收社區(qū)矯正對象478 萬人,累計解除矯正對象411 萬人。2019 年全國新接收社區(qū)矯正對象57 萬人,解除矯正59 萬人,全年列管126 萬人[10]。目前,全國社區(qū)矯正對象的再犯罪率為0.2%,但是部分省份的部分地區(qū)遠遠高出了這個數(shù)值,因此研究如何利用大數(shù)據(jù)分析對社區(qū)矯正對象的再犯罪情況進行預(yù)警,具有非常重要的現(xiàn)實意義。
目前,全國各省、市均已建立了社區(qū)矯正管理信息系統(tǒng),系統(tǒng)中均包含社區(qū)矯正工作產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)(例如社區(qū)矯正對象基本信息和刑罰執(zhí)行信息等)、半結(jié)構(gòu)化數(shù)據(jù)(例如社區(qū)矯正對象電子定位數(shù)據(jù)和教育學(xué)習(xí)數(shù)據(jù)等)和非結(jié)構(gòu)化數(shù)據(jù)(例如社區(qū)矯正對象的電話記錄、視頻監(jiān)控)等海量數(shù)據(jù)。
通過大數(shù)據(jù)分析對社區(qū)矯正對象進行再犯罪預(yù)警的目標(biāo)是在采集相關(guān)數(shù)據(jù)的基礎(chǔ)上,通過特定算法,分析出哪些社區(qū)矯正對象具有較大的再犯罪風(fēng)險,做出預(yù)警判斷,可以對預(yù)警風(fēng)險系數(shù)較高的社區(qū)矯正對象進行有針對性的監(jiān)督管理和教育幫扶,消除其可能重新犯罪的因素,具體研究內(nèi)容如下。
表1 為初始考慮的相關(guān)指標(biāo),它們當(dāng)中存在著不盡相同的關(guān)聯(lián)關(guān)系,并且會預(yù)警結(jié)果產(chǎn)生不同的的影響,一些指標(biāo)可能是噪聲指標(biāo),因此通過相關(guān)性分析選擇出核心指標(biāo)非常關(guān)鍵。
表1 初始考慮的指標(biāo)
本研究通過Spearman 相關(guān)系數(shù)來計算不同指標(biāo)之間的線性相關(guān)性,具體的計算方法為:第一步是變量轉(zhuǎn)換,將指標(biāo)的變量值轉(zhuǎn)換為排列順序,第二步是計算轉(zhuǎn)換后的排列順序數(shù)值的相關(guān)系數(shù),具體計算公式如下:
其中Rxi和Ryi分別表示第i個X變量和Y變量重新排序后的次序,x和表示Rxi和Ryi的均值;
根據(jù)判斷|r|值的不同,則代表的線性相關(guān)關(guān)系程度如下:
表2 是在對表1 中各類指標(biāo)與目標(biāo)變量之間的相關(guān)性分析和對目標(biāo)變量結(jié)果的影響程度進行分析之后,得出的關(guān)鍵指標(biāo)分析結(jié)果。
表2 關(guān)鍵性指標(biāo)分析結(jié)果
12 緯度 不顯著 重點關(guān)注 27 完成社區(qū)服務(wù)情況 非常顯著 重點關(guān)注 13 定位地點位置名稱 不顯著 重點關(guān)注 28 思想?yún)R報及溝通 非常顯著 重點關(guān)注 14 定位狀態(tài) 非常顯著 重點關(guān)注 29 認罪服法態(tài)度 非常顯著 重點關(guān)注 15 定位時間 不顯著 重點關(guān)注 30 對社會的心態(tài) 非常顯著 重點關(guān)注
目前,主流的預(yù)警算法有決策樹、神經(jīng)網(wǎng)絡(luò)、邏輯回歸等。通過對比分析,決策樹具有預(yù)測準(zhǔn)確率好、速度很快、魯棒性強、可擴展性很優(yōu)秀、容易理解等優(yōu)勢,因此本研究選擇決策樹作為預(yù)警算法。
決策樹是一個類似于流程圖的樹形結(jié)構(gòu),其中每個內(nèi)部節(jié)點標(biāo)識一個屬性測試,每個輸出表示一個測試輸出,每個葉節(jié)點代表類或類分布。也就是說,決策樹根據(jù)不同的特性,以樹型結(jié)構(gòu)表示分類或決策集合,產(chǎn)生規(guī)則和發(fā)現(xiàn)規(guī)律[11]。
綜合考慮選取文化程度、是否有前科、是否累犯、對社會的心態(tài)、犯罪類型、自控能力、婚姻家庭關(guān)系、自控能力、對社區(qū)矯正的認識和接受程度、捕前職業(yè)、性別、矯正類別、居住條件、認罪服法態(tài)度、社會鄰里關(guān)系為指標(biāo),使用決策樹對2019 年云南省某縣在冊120 名社區(qū)矯正對象再犯罪進行預(yù)測和探索結(jié)果,具體分析情況如表3。
表3 決策樹分析結(jié)果
利用Clementine 建立模型過程包括數(shù)據(jù)源的建立->類型選擇->字段過濾->特征指標(biāo)的選擇->決策樹模型->結(jié)果分析,具體操作如圖1 所示。
圖1 模型建立
表4 內(nèi)容是對云南省4 個州(市)在冊社區(qū)矯正對象全年監(jiān)管情況的再犯罪情況的預(yù)測及驗證結(jié)果。
表4 決策樹分析結(jié)果
本文在對社區(qū)矯正對象監(jiān)管情況產(chǎn)生的大數(shù)據(jù)進行指標(biāo)篩選和相關(guān)性分析,得出關(guān)鍵性指標(biāo)參數(shù),然后通過對比主流的預(yù)警算法,選擇了決策樹作為本預(yù)警研究的算法,最后使用Clementine 建立模型,選取云南省4 個州市2019 年列管的社區(qū)矯正對象進行預(yù)測,并對預(yù)測結(jié)果進行了驗證。
下一步的主要工作是利用計算系統(tǒng)對社區(qū)矯正對象的社會關(guān)系、同案犯關(guān)系等網(wǎng)絡(luò)進行分析,研究不同社會關(guān)系、教育學(xué)習(xí)和社區(qū)服務(wù)情況、個人文化程度、心理特征等不同因素對影響服刑人員再次犯罪的顯著性并加以分析,為有效預(yù)警社區(qū)矯正對象再次犯罪提供科學(xué)依據(jù)。