亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于關(guān)聯(lián)規(guī)則的再犯罪特征分析

        2017-08-16 10:25:54馮卓慧馮前進(jìn)
        關(guān)鍵詞:項(xiàng)集約簡盜竊罪

        馮卓慧,馮前進(jìn)

        (浙江警官職業(yè)學(xué)院信息技術(shù)與管理系,杭州 310018)

        ?

        基于關(guān)聯(lián)規(guī)則的再犯罪特征分析

        馮卓慧,馮前進(jìn)

        (浙江警官職業(yè)學(xué)院信息技術(shù)與管理系,杭州 310018)

        為有效提高罪犯教育改造質(zhì)量,將基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方法引入到再犯罪特征的分析之中,以某監(jiān)獄罪犯數(shù)據(jù)庫的刑釋人員為樣本數(shù)據(jù),采用Johnson約簡算法和Apriori關(guān)聯(lián)算法對其進(jìn)行屬性約簡處理和關(guān)聯(lián)規(guī)則分析。結(jié)果表明:罪名、年齡、文化程度和刑期之間具有較強(qiáng)的正相關(guān),即犯有盜竊罪前科、年齡小、文化程度低、刑期短是再犯罪的主要特征。該方法能揭示潛在的再犯罪規(guī)律,對刑罰機(jī)關(guān)具有參考價值,使其教育改造工作更具有針對性。

        關(guān)聯(lián)規(guī)則;再犯罪;數(shù)據(jù)挖掘;屬性約簡;Apriori

        數(shù)據(jù)挖掘(data mining)是數(shù)據(jù)庫知識發(fā)現(xiàn)過程中的一個步驟,是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。作為一種通用技術(shù),數(shù)據(jù)挖掘可以用于任何類型的數(shù)據(jù),目前已在國內(nèi)各個行業(yè)和領(lǐng)域都展開了廣泛的應(yīng)用,但在監(jiān)獄管理中還處于探索和起步階段。再犯罪既重新違法犯罪,是因犯罪被處以監(jiān)禁刑或社區(qū)矯正,再犯被處以監(jiān)禁刑或社區(qū)矯正的犯罪[1]。一直以來,再犯罪都是世界各國普遍面臨的一個社會安全問題,再犯罪也以其特殊的危害性成為我國刑罰機(jī)關(guān)工作的重點(diǎn)。根據(jù)調(diào)查,浙江省某監(jiān)獄2011年重新犯罪人員占全年入監(jiān)人數(shù)的比例高達(dá)29.3%[2]。這反映了監(jiān)獄的教育改造任務(wù)還未圓滿完成,罪犯改造質(zhì)量有待提高。要降低重新違法犯罪率,必須先找出刑釋解教人員再犯罪的潛在規(guī)律和特征因素,才能較為準(zhǔn)確的進(jìn)行預(yù)測。根據(jù)這一問題,國內(nèi)很多研究人員對其進(jìn)行過研究,但主要都是從主觀經(jīng)驗(yàn)或簡單統(tǒng)計來進(jìn)行分析[3-6]。因此,應(yīng)用數(shù)據(jù)挖掘技術(shù),對罪犯數(shù)據(jù)庫進(jìn)行科學(xué)有效的分析,從中發(fā)現(xiàn)一些潛在的客觀規(guī)律,有助于提高再犯罪預(yù)測的準(zhǔn)確性,為刑罰機(jī)關(guān)在教育改造工作中提供決策支持。

        一、關(guān)聯(lián)規(guī)則

        (一)理論介紹

        所謂關(guān)聯(lián),反映的是一個屬性和其他屬性之間依賴或關(guān)聯(lián)的知識。例如,在查找英文詞典時,可以發(fā)現(xiàn)有兩個英文單詞都能形容關(guān)聯(lián)的含義。一個是相關(guān)性relevance,另一個是關(guān)聯(lián)性association,兩者都可以用來描述事物之間的關(guān)聯(lián)程度。關(guān)聯(lián)規(guī)則能夠揭示數(shù)據(jù)之間的相互關(guān)系,而這種關(guān)系并沒有在數(shù)據(jù)中直接表現(xiàn)出來[7-8]。

        可以通過以下幾個參數(shù)來描述一個關(guān)聯(lián)規(guī)則的屬性:

        a)支持度(support)

        支持度是D中事務(wù)包含A∪B的百分比。項(xiàng)集A的支持度可以定義為:

        b)置信度(confidence)

        置信度是D中包含A的事務(wù)同時也包含B的事務(wù)的百分比。計算公式為:

        c)提升度(lift)

        提升度是置信度與支持度的比值。描述項(xiàng)集A的出現(xiàn)對項(xiàng)集B的出現(xiàn)有多大的影響,計算公式為:

        當(dāng)同時滿足最小支持度閾值和最小置信度閾值(閾值可根據(jù)挖掘需要由用戶設(shè)定),則認(rèn)為這些規(guī)則是強(qiáng)規(guī)則。

        (二)Apriori算法

        Apriori算法是1994年由RakeshAgrawal和RamakrishnanSrikant提出的一種頻繁項(xiàng)集挖掘算法,該算法通過前一次找到的頻繁項(xiàng)來生成本次的頻繁項(xiàng),目的在于從一個數(shù)據(jù)集中找出各項(xiàng)之間的關(guān)系。該算法的核心思想是:利用1-頻繁項(xiàng)集生成2-頻繁項(xiàng)集,然后根據(jù)2-頻繁項(xiàng)集生成3-頻繁項(xiàng)集,以此類推,直到生成所有的頻繁項(xiàng)集,最后從頻繁項(xiàng)集中找出符合條件的關(guān)聯(lián)規(guī)則[9-10]。Apriori算法通過多次掃描數(shù)據(jù)庫,每次利用候選頻繁項(xiàng)集來產(chǎn)生新的頻繁項(xiàng)集;算法簡單易懂,具有較好的擴(kuò)展性,但是每次生成候選頻繁項(xiàng)集都要掃描數(shù)據(jù)庫,且產(chǎn)生侯選頻繁項(xiàng)集時循環(huán)生成的組合過多,導(dǎo)致效率低下。

        二、分析方法

        (一)數(shù)據(jù)處理

        首先檢查數(shù)據(jù)的完整性。一般情況下,罪犯數(shù)據(jù)庫中的缺失值較少,對于這少數(shù)部分缺失值可以通過查閱檔案補(bǔ)全或直接忽略。其次,將數(shù)據(jù)中的屬性值進(jìn)行離散化和歸類處理。此外,罪犯數(shù)據(jù)庫中基本的屬性分類就多達(dá)20多項(xiàng),且某些屬性值分類也較多,例如罪名(根據(jù)《刑法修正九》及兩高《關(guān)于執(zhí)行<中華人民共和國刑法>確定罪名的補(bǔ)充規(guī)定(六)》的規(guī)定,罪名多達(dá)468個),其中大部分屬性值出現(xiàn)頻率很小,若直接使用Apriori算法進(jìn)行處理將非常耗時。因此,采用屬性約簡事先把出現(xiàn)頻率低的屬性值排除在外,可以有效減少數(shù)據(jù)集,提高效率。

        (二)屬性約簡

        屬性約簡是在保證系統(tǒng)本身分類能力不變的前提下,刪除其中冗余的屬性,保留起決定作用的核心屬性,它是粗糙集理論中最重要的一個部分。通過知識約簡,導(dǎo)出問題的決策或分類規(guī)則,其對于研究關(guān)聯(lián)規(guī)則的知識發(fā)現(xiàn)有著極其重要的意義。粗糙集約簡算法主要有基于信息熵、基于可辨識矩陣、基于遺傳算法和基于Johnson算法等算法。其中基于Johnson的約簡算法可由用戶來決定屬性權(quán)重,且該算法得出的約簡組合只有一組,相比于其他方法而言更加直觀。其基本思想是選取出現(xiàn)頻率最大的屬性加入約簡組合,若一個屬性出現(xiàn)的頻率越高,則它的可分辨能力就越強(qiáng)[11-13]。算法基本步驟如下:

        a)令S={U,R,V,f};R=C∪D,其中C和D分別為條件屬性和決策屬性C=∪ai,i=1,2,…,n;

        b)計算可分辨矩陣M,M={mij:mij≠?};

        c)計算屬性ai在M中出現(xiàn)的頻率Countai(M);

        d)將Max(Countai(M))的屬性記為a,約簡RED=RED∪{a};

        e)刪除M中所包含全部a屬性;

        f)如果M≠?,則轉(zhuǎn)到步驟c;否則計算結(jié)束。

        (三)規(guī)則提取

        將處理好的樣本數(shù)據(jù)進(jìn)行導(dǎo)入后并轉(zhuǎn)換至矩陣,設(shè)置相關(guān)的閾值參數(shù),使用Apriori算法進(jìn)行挖掘,最后對生成的規(guī)則進(jìn)行評價。

        相關(guān)的部分Python代碼如下:

        importpandasaspdfromaprioriimport*#導(dǎo)入函數(shù)importtime#導(dǎo)入時間庫用來計算用時filename=crimedata.csv#導(dǎo)入樣本數(shù)據(jù)data=pd.read_csv(filename,header=None,dtype=object)print(u 轉(zhuǎn)換原始數(shù)據(jù)至矩陣…)cvt=lambdax:pd.series(1,index=x[pd.notnull(x)])#轉(zhuǎn)換矩陣的過渡函數(shù)c=map(cvt,data.as_matrix())#用map方式執(zhí)行data=pd.DataFrame(c).fillna(0)#實(shí)現(xiàn)矩陣轉(zhuǎn)換delc#刪除中間變量節(jié)省內(nèi)存support=0.3#最小支持度confidence=0.8#最小置信度lift=1.0#最小提升度starttime=time.clock()#計時開始findrules(data,support,confidence,lift)#開始搜索關(guān)聯(lián)規(guī)則endtime=time.clock()#計時結(jié)束print(u 搜索完成,用時:%0.2f秒%(end-start))

        三、實(shí)例分析

        (一)分析過程

        本實(shí)例以某男犯監(jiān)獄2011年至2013年期間的刑釋人員為樣本。首先,從基礎(chǔ)數(shù)據(jù)中選取{民族、文化程度、籍貫、婚否、罪名、刑期、出監(jiān)年齡}作為條件屬性,是否再犯作為決策屬性。部分條件屬性進(jìn)行了合并(如出監(jiān)年齡=刑期止日-出生日期)或刪除(如刪除逮捕機(jī)關(guān)、逮捕日期、判決機(jī)關(guān)、判決日期等不相關(guān)或相似的屬性)。其次,將數(shù)據(jù)集中的屬性值進(jìn)行離散化和歸類處理。例如將文化程度離散化為 {1:小學(xué)及以下,2:初中,3:高中(中職),4:???高職),5:本科及以上};罪名是通過編碼來記錄的,本身是離散化的,但是為了便于分析還是需要經(jīng)過一些歸類處理(例如:4002、400201、400202、400203分別表示“盜竊”、“慣竊”、“盜竊未遂”和“盜竊預(yù)備”,歸類后統(tǒng)一用4002表示);刑期離散化為{1:36個月以下,2:36~72個月,3:72~108個月,4:108個月以上};第一次犯罪出監(jiān)年齡離散化為{1:25周歲以下,2:25~35周歲,3:35~45周歲,4:45周歲以上}。

        將離散后的數(shù)據(jù)導(dǎo)入Rosette并使用Johnson約簡算法進(jìn)行屬性約簡,得到的約簡R={文化程度、罪名、刑期和出監(jiān)年齡},分別記為A, B, C, D。最終的樣本數(shù)據(jù)如表1所示。

        表1 經(jīng)過處理后的部分樣本數(shù)據(jù)

        (二)分析結(jié)果

        當(dāng)Apriori算法的最小支持度設(shè)置為0.3,最小置信度設(shè)置為0.8,最小提升度為1,規(guī)則條數(shù)為13,結(jié)果如表2(編碼4002為盜竊罪)。

        表2 生產(chǎn)的規(guī)則結(jié)果1

        第1條規(guī)則解釋為:犯有盜竊罪的,刑期短(3年以內(nèi)),且文化程度低(小學(xué)及以下)的罪犯人數(shù)占總樣本數(shù)據(jù)的42%;同時這些刑期短的盜竊犯中,95%的文化程度為小學(xué)及以下;提升度(lift)表明該規(guī)則比發(fā)現(xiàn)同時滿足前兩項(xiàng)條件(犯有盜竊罪和文化程度低)的情況下更常見。

        此外,將最小支持度設(shè)置為0.3,最小置信度設(shè)置為0.6,最小提升度為1,對罪犯的所有罪名進(jìn)行單獨(dú)挖掘,發(fā)現(xiàn)結(jié)果如表3所示。

        表3 生產(chǎn)的規(guī)則結(jié)果2

        注:括號內(nèi)“*”號表示犯罪前科記錄中的罪名編號。

        結(jié)果顯示,本次犯罪和犯罪前科記錄中都包含盜竊罪的占總樣本數(shù)據(jù)的36%;在本次犯有盜竊罪的罪犯中,前科記錄也包含盜竊罪的占70%。前科記錄中含有盜竊罪的,本次又犯有盜竊罪的占61%。

        (三)規(guī)則評價

        在分析中使用提升度作為相關(guān)性度量后,篩選出了所有的正相關(guān)規(guī)則,如表2中的規(guī)則1,lift=2.1505表明該規(guī)則比發(fā)現(xiàn)同時滿足前兩項(xiàng)條件(犯有盜竊罪和文化程度低)的情況下更常見;同樣表3中表明這兩條規(guī)則都不是偶然,它比發(fā)現(xiàn)只犯有一次盜竊罪更普遍。此外,表2中發(fā)現(xiàn)具有一些包含關(guān)系的規(guī)則,這些規(guī)則的后繼(RHS)相同,而先導(dǎo)(LHS)為子集關(guān)系的規(guī)則,如規(guī)則2的LHS包含了規(guī)則1、3、4、5、6、7的LHS,且規(guī)則2的提升度大于其他規(guī)則的提升度,這類規(guī)則可以全部合并成規(guī)則2。最后,根據(jù)結(jié)果可以看出,文化程度低(小學(xué)及以下)、刑期短(36個月以下)、年齡小(25周歲以下)以及之前犯有盜竊罪的是再犯罪的主要特征,上述結(jié)果對之前一些犯罪原因分析的相關(guān)文獻(xiàn)研究結(jié)論進(jìn)行了進(jìn)一步的佐證。表3表明,盜竊罪具有其多發(fā)性和頻繁性。針對盜竊的犯罪特點(diǎn),刑法機(jī)關(guān)應(yīng)加強(qiáng)對罪犯的知識技能訓(xùn)練和心理矯治,采用一套科學(xué)客觀的循證矯正方法來預(yù)防和降低實(shí)施盜竊犯罪行為再次發(fā)生的可能性,提高其回歸社會的信心和適應(yīng)能力[14-15]。

        四、結(jié) 語

        本文基于關(guān)聯(lián)規(guī)則研究了再犯罪的特征因素。從分析結(jié)果得出,再犯罪因素主要與罪犯的文化程度、罪名、刑期和年齡相關(guān),基本上與之前在主觀和經(jīng)驗(yàn)上來進(jìn)行分析的文獻(xiàn)結(jié)果相吻合。目前,我國監(jiān)獄機(jī)關(guān)都已經(jīng)建立罪犯數(shù)據(jù)庫,但是該數(shù)據(jù)庫還是主要用于基本的信息存儲和報表統(tǒng)計,缺少對分析和預(yù)測等高級功能的支持機(jī)制。未來,可以針對罪犯數(shù)據(jù)庫,采用多種挖掘算法進(jìn)行更深入的挖掘,找出歷史數(shù)據(jù)之間的潛在聯(lián)系,促使監(jiān)獄機(jī)關(guān)做出相應(yīng)的決策,制訂一系列行之有效的改造方法,從而提高罪犯再教育的成功率。

        [1] 曾赟.論再犯罪危險的審查判斷標(biāo)準(zhǔn)[J].清華法學(xué),2012,8(1):64-77.

        [2] 張崇脈.我國重新犯罪研究的內(nèi)容分析:以期刊論文為樣本[J].預(yù)防青少年犯罪研究,2015(6):12-22.

        [3] 潘開元,李仲林.北京市監(jiān)獄管理局在押累犯犯罪原因及矯正對策[J].中國司法,2006(4):34-37.

        [4] 賀志明,秦志斌,胡赪.刑釋人員重新犯罪的原因分析[J].湖南工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報,2012,12(2):59-61.

        [5] 劉宏斌.當(dāng)前我國盜竊犯罪的現(xiàn)狀及治理[J].中國人民公安大學(xué)學(xué)報(社會科學(xué)版),2011,27(4):118-122.

        [6] 趙軍.我國犯罪預(yù)測及其研究的現(xiàn)狀、問題與發(fā)展趨勢:對“中國知網(wǎng)”的內(nèi)容分析[J].湖南大學(xué)學(xué)報(社會科學(xué)版),2011,25(3):155-160.

        [7] 佚名.關(guān)聯(lián)規(guī)則算法概述[J].通信企業(yè)管理,2005(9):76-77.

        [8] 鄧靈評.基于數(shù)據(jù)挖掘的犯罪行為分析及系統(tǒng)實(shí)現(xiàn)[D].成都:成都西南交通大學(xué),2014.

        [9] AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules[C]//Proceeding of the 20th VLDB Conferece. Santiago: Chile, 1994,1215:487-499.

        [10] HAN JW, KAMBER M. 數(shù)據(jù)挖掘:概念與技術(shù)[M].第3版.北京:機(jī)械工業(yè)出版社,2012.

        [11] PAWLAK Z. Rough Sets: Theoretical Aspects of Reasoning about Data[M]. Dordrecht:Kluwer Academic Publishers,1992.

        [12] 徐章艷,楊炳儒,宋威,等.幾種不同屬性約簡的比較研究[J].小型微型計算機(jī)系統(tǒng),2008,29(5):848-853.

        [13] 唐衛(wèi)國,張濤,羅奕,等.粗糙集屬性約簡算法綜述[J].大眾科技,2015,17(11):17-19.

        [14] 曾赟.中國監(jiān)獄罪犯教育改造質(zhì)量評估研究[J].中國法學(xué),2013(3):149-162.

        [15] 王銳,丁平,劉偉兵.關(guān)于盜竊慣犯人格特征評估與犯罪對策的研究[J].遼寧警專學(xué)報,2010(3):76-78.

        (責(zé)任編輯: 陳和榜)

        Analysis on the Features of Recidivism Based on Association Rules

        FENGZhuohui,FENGQianjin

        (Department of Information Management, Zhejiang Police Vocational Academy, Hangzhou 310018, China)

        In order to improve the quality of education reform of criminals effectively, data mining based on association rules was utilized to explore the features of recidivism. Johnson reduction algorithm and Apriori algorithm were applied to analyze partial sample data of released prisoners in the criminal database of a prison. The analysis results show that the charge, age and cultural degree are positively related to the term of penalty. In other words, criminal record of larceny, younger age, low cultural degree and short term of penalty are main features of recidivism. The method of this article can reveal the potential recidivist. Therefore it has reference value for penalty organs and is one of useful tools to improve the quality of correction in prison.

        association rules; recidivism; data mining; attribute reduction; Apriori

        10.3969/j.issn.1673-3851.2017.02.009

        2016-05-18 網(wǎng)絡(luò)出版日期:2017-01-03

        浙江省教育廳一般科研項(xiàng)目(Y201533854)

        馮卓慧(1979-),男,湖北荊州人,講師,碩士,主要從事數(shù)據(jù)庫、數(shù)據(jù)挖掘、信息安全方面的研究。

        TP274

        A

        1673- 3851 (2017) 01- 0057- 04

        猜你喜歡
        項(xiàng)集約簡盜竊罪
        盜竊罪中罰金刑裁量規(guī)則研究
        基于二進(jìn)制鏈表的粗糙集屬性約簡
        實(shí)值多變量維數(shù)約簡:綜述
        基于模糊貼近度的屬性約簡
        從“占有關(guān)系”重新界分職務(wù)侵占罪與盜竊罪
        盜竊罪若干問題探析
        盜竊罪中刑事推定規(guī)則的適用
        關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        一種頻繁核心項(xiàng)集的快速挖掘算法
        一種改進(jìn)的分布約簡與最大分布約簡求法
        河南科技(2014年7期)2014-02-27 14:11:29
        视频一区视频二区自拍偷拍| 免费av片在线观看网址| 亚洲av色香蕉一区二区三区老师| 亚洲妇女自偷自偷图片| 欧美日韩不卡视频合集| 自慰高潮网站在线观看 | 狠狠色综合7777久夜色撩人ⅰ| 免费av片在线观看网站| 精品国产你懂的在线观看| 美女脱掉内裤扒开下面让人插| 久久天天躁狠狠躁夜夜不卡| 麻豆国产人妻欲求不满| 久久久诱惑一区二区三区| 免费观看人妻av网站| 亚洲成在人线av品善网好看| 九九精品视频在线观看| 日本一极品久久99精品| 亚洲日本精品国产一区二区三区 | 精品精品国产三级av在线| 美腿丝袜诱惑一区二区| 激情第一区仑乱| 麻豆国产av尤物网站尤物| 在线视频精品少白免费观看| 一边摸一边抽搐一进一出口述| 日本阿v网站在线观看中文| 91精品91久久久久久| 国产精品成人一区二区在线不卡| 国产人妻人伦精品1国产| 日韩视频第二页| 中文字幕精品乱码一区| 天天做天天爱夜夜夜爽毛片| 综合无码一区二区三区| 99在线国产视频| 久久久精品国产免费看| 国产av国片精品有毛| 极品美女扒开粉嫩小泬| 国产免费人成视频在线观看播放 | 99re久久精品国产| 扒下语文老师的丝袜美腿| 91精品国产色综合久久| 94久久国产乱子伦精品免费 |