韓 寧, 陳 巍
(1.中國(guó)人民公安大學(xué),北京 100038;2.公安部十二局,北京 100741)
隨著犯罪職業(yè)化、團(tuán)伙化、流竄化的趨勢(shì)日益凸顯,在各類(lèi)犯罪尤其是多發(fā)性侵財(cái)犯罪案件中,系列案件占有相當(dāng)大的比重。對(duì)系列案件展開(kāi)偵查的前提,是對(duì)若干有內(nèi)在聯(lián)系的不同案件進(jìn)行串并,從中發(fā)現(xiàn)相同的規(guī)律和特征,變個(gè)案?jìng)刹闉榇競(jìng)刹?,使偵查工作效益最大化?]。在刑偵數(shù)據(jù)庫(kù)中,由于缺少形成類(lèi)別的先驗(yàn)知識(shí),搜集或者存儲(chǔ)的數(shù)據(jù)集樣本往往沒(méi)有類(lèi)標(biāo)號(hào),使用聚類(lèi)的方法將具有相同特征的對(duì)象歸為一類(lèi),可以將不同犯罪主體所形成的系列案件串并在一起。傳統(tǒng)的經(jīng)驗(yàn)型串并案分析,是利用各類(lèi)案件的內(nèi)在規(guī)律和相似性特點(diǎn),根據(jù)一個(gè)比較明確的對(duì)象或單一可標(biāo)識(shí)屬性,到案件數(shù)據(jù)庫(kù)中進(jìn)行碰撞搜索,找到具有相同對(duì)象或?qū)傩孕畔⒌陌讣?,從而?shí)現(xiàn)串并案分析。
串案和并案(簡(jiǎn)稱(chēng)串并案)是偵破系列案件特別是在個(gè)案?jìng)刹橄萑肜Ь硶r(shí)的常用方法。所謂系列案件的串并是指把不同地域或不同時(shí)間發(fā)生的多起案件,通過(guò)對(duì)案件中發(fā)現(xiàn)的各種痕跡、線索進(jìn)行分析,認(rèn)為這些案件可能為同一犯罪主體所為,因而把這些案件進(jìn)行合并偵查的辦案手段。系列案件的串并可以把看似無(wú)關(guān)聯(lián)的線索、物證進(jìn)行綜合分析,找出足夠的證據(jù)鎖定犯罪嫌疑人。對(duì)串并案而言,一般是根據(jù)已發(fā)案件的某些特征,到案件數(shù)據(jù)中進(jìn)行碰撞搜索,找到具有相同對(duì)象或?qū)傩孕畔⒌陌讣瑢⑵浯⒃谝黄?。但是在?shí)際工作中我們經(jīng)常發(fā)現(xiàn),通過(guò)這種串并后得到的結(jié)果列表往往有幾千甚至上萬(wàn)的案件信息,如果要進(jìn)行串并就需要花費(fèi)分析人員大量的時(shí)間,對(duì)這些案件中無(wú)法使用精確查詢(xún)的非格式化信息進(jìn)行人工排查,通過(guò)選取幾個(gè)關(guān)鍵字或近義詞對(duì)這些案件信息進(jìn)行逐條分析,這種分析不但繁瑣,而且效率低下。串并案分析就是針對(duì)此問(wèn)題提出的,模擬用戶(hù)在人工排查時(shí)的分析過(guò)程,通過(guò)關(guān)鍵字和同義詞檢索案件信息中的非格式文本,如簡(jiǎn)要案情、現(xiàn)場(chǎng)情況、處理情況等進(jìn)行全文檢索。串并案分析不但可以大大減輕分析人員的工作量,而且可以減少案件的投入成本。
系列案件串并的條件就是對(duì)案件進(jìn)行串并的依據(jù)。根據(jù)在系列案件串并中作用的大小,可把系列案件串并的條件分為系列案件串并的確定性條件和可能性條件。系列犯罪案件中,作案人的犯罪行為多種多樣,包括出入現(xiàn)場(chǎng)的方式,作案工具的使用,作案時(shí)間、地點(diǎn)的選擇,運(yùn)贓、銷(xiāo)贓的手段,現(xiàn)場(chǎng)活動(dòng)的先后次序、習(xí)慣,偽裝、破壞現(xiàn)場(chǎng)的伎倆,等等。在諸多系列犯罪案件中,最重要的是犯罪嫌疑人作案目標(biāo)、地點(diǎn)、手段和時(shí)間等四個(gè)方面的選擇。犯罪行為的動(dòng)力定型,指的是系列犯罪案件的作案人在其不斷的犯罪實(shí)踐中所形成的習(xí)慣化了的犯罪行為方法和作案手段。這種犯罪行為的動(dòng)力定型具有穩(wěn)定性的特點(diǎn)。由于犯罪心理的思維定勢(shì)和犯罪行為的動(dòng)力定型,上述作為指標(biāo)的行為特征在不同的系列案件中能或多或少地表現(xiàn)出穩(wěn)定性、規(guī)律性。由于不同犯罪案件作案人的犯罪動(dòng)機(jī)不同,以及對(duì)客觀事物的認(rèn)識(shí)、自身的犯罪經(jīng)歷、作案條件的不同,在一串具體的系列犯罪案件中,其犯罪行為又各有其特殊性、特定性。此外,犯罪案件作案人的行為特征之間又是相互聯(lián)系、相互影響的,不能就各個(gè)行為特征指標(biāo)進(jìn)行孤立的分析和研究,而要作綜合性的分析和研究。
聚類(lèi)可以定義如下:在數(shù)據(jù)空間A中,數(shù)據(jù)集X由許多數(shù)據(jù)點(diǎn)(或數(shù)據(jù)對(duì)象)組成,數(shù)據(jù)點(diǎn)xi=(xi1,…,xid)?A,是數(shù)據(jù)集X的屬性(或特征,或維度),xij既可以是數(shù)值型的,也可以是枚舉型的。數(shù)據(jù)集X相當(dāng)于是一個(gè)N×d矩陣。假設(shè)數(shù)據(jù)集X中有N個(gè)對(duì)象xi(i=1,…,N)。聚類(lèi)的最終目的是把數(shù)據(jù)集X按屬性劃分為k個(gè)Cm(m=1,…,k),其中有些對(duì)象經(jīng)過(guò)分割后變?yōu)樵肼?。所有這些分割與噪聲的并集就是數(shù)據(jù)集X,并且這些分割之間沒(méi)有交集,即
這些分割Cm就是聚類(lèi)。此外,在模糊聚類(lèi)中,每個(gè)對(duì)象不再僅屬于單個(gè)聚類(lèi),而是以不同的隸屬度屬于多個(gè)聚類(lèi)。
3.2.1 向量空間模型
向量空間模型(VSM,VectorSpaceModel)是刑事案件分類(lèi)所使用的較為普遍的方法之一。在這種模型中,刑事案件空間被看作是由一組正交詞條向量組成的向量空間,每個(gè)刑事案件表示為其中的一個(gè)范化特征向量:
V(d)=(t1,w1(d),…,ti,wi(d),…,tn,wn(d)),其中ti,也可以要求ti是d中出現(xiàn)的所有短語(yǔ),以提高刑事案件內(nèi)容的準(zhǔn)確性。Wi(d)常被定義為ti在d出現(xiàn)頻率tfi(d)的函數(shù),常用的函數(shù)有布爾函數(shù)、平方根函數(shù)、對(duì)數(shù)函數(shù)、TFIDF函數(shù)等。本次建模中采用了一種新的wi(d)的計(jì)算模型[3],具體步驟如下。
3.2.1.1 構(gòu)建特征向量空間
案件聚類(lèi)是在一個(gè)非常高的維度中進(jìn)行的。理論證明,隨著維度的增加,計(jì)算的復(fù)雜度將呈指數(shù)級(jí)增長(zhǎng)。利用VSM來(lái)計(jì)算刑事案件相似度矩陣時(shí),特征空間的維度很大,增加了計(jì)算的復(fù)雜性。因此,案件聚類(lèi)的首要問(wèn)題是要將數(shù)據(jù)進(jìn)行降維。原子特征詞是指從所有案件數(shù)據(jù)庫(kù)中找出能夠反映出案件特點(diǎn)的聚類(lèi)中的原子部分。這樣做可以將數(shù)組維度從一個(gè)非常高的維度降低到一個(gè)維度相對(duì)較低的空間。
原子特征詞詞典的確立是基于關(guān)鍵詞的文本分類(lèi)的非常關(guān)鍵的基礎(chǔ)問(wèn)題,詞典中原子特征詞的選取既要考慮這些詞在簡(jiǎn)要案情中出現(xiàn)的統(tǒng)計(jì)特征,選取那些反映簡(jiǎn)要案情的原子特征詞;又要做停用詞表,去掉那些在特定語(yǔ)言中出現(xiàn)頻率較高但含義虛泛的詞,以降低特征空間的維數(shù);同時(shí)還要考慮關(guān)鍵詞的頻幅限制,以防止因少數(shù)關(guān)鍵詞在簡(jiǎn)要案情中頻幅過(guò)高而造成的聚類(lèi)中心的偏移影響。
3.2.1.2 關(guān)鍵詞相似度計(jì)算模型[4]
案情分析是案件偵查過(guò)程中必不可少的環(huán)節(jié),偵查推進(jìn)的過(guò)程以案情分析的不斷深入為基礎(chǔ)。偵查人員通過(guò)案情分析加深對(duì)案件的理解,也通過(guò)案情分析將偵查中收集到的各種情報(bào)信息進(jìn)行綜合,用以準(zhǔn)確地刻畫(huà)犯罪嫌疑人的特征,進(jìn)而明確縮小偵查范圍。案情分析包括涉案時(shí)間、地點(diǎn)、犯罪嫌疑人和犯罪行為的分析。由于我們對(duì)簡(jiǎn)要案情進(jìn)行了抽取和加工,因此大部分的簡(jiǎn)要案情關(guān)鍵詞與原子特征詞并不完全相同。由于在傳統(tǒng)的相似度計(jì)算模型中兩者的相似度將是0,這會(huì)使得構(gòu)建的刑事案件空間向量矩陣絕大部分元素出現(xiàn)0。因此,必須考慮兩種關(guān)鍵詞之間的部分相似性[5]。
假設(shè)兩個(gè)關(guān)鍵字ki和kj,字符長(zhǎng)度分別為li和lj,連續(xù)相同字符串長(zhǎng)度為l,則該兩個(gè)關(guān)鍵字相似度定義為 T(ki,kj):
顯然有 T(ki,kj)∈[0,1]。這個(gè)公式考慮了關(guān)鍵字之間的部分相似性,提高了相似度計(jì)算的精度。例如:兩個(gè)關(guān)鍵字“入室盜竊案”和“住宅盜竊案”,在許多刑事案件聚類(lèi)方法中將這兩個(gè)關(guān)鍵字的相似度定義為0(即兩者完全不同),這在某種程度上影響了刑事案件相似度的精確度。利用我們給出的公式(1)計(jì)算結(jié)果為0.4286,能更加準(zhǔn)確地表示兩者的相似度。
3.2.1.3 相似度加權(quán)計(jì)算模型
每一起刑事案件簡(jiǎn)要案情中一般有若干個(gè)關(guān)鍵詞,通過(guò)關(guān)鍵詞相似度計(jì)算模型中公式(1)計(jì)算所得的值也相應(yīng)地有若干個(gè)。為了進(jìn)一步提高刑事案件相似度的精確度,我們結(jié)合關(guān)鍵詞相似度計(jì)算模型和關(guān)鍵詞的頻次提出一種新的計(jì)算刑事案件相似度的相似度加權(quán)計(jì)算模型。
3.2.1.4 刑事案件空間向量的構(gòu)建
VSM的目標(biāo)是將刑事案件數(shù)據(jù)表示為特征空間中的一個(gè)向量。該矩陣以刑事案件作為行,以原子特征詞作為刑事案件的特征詞,即作為列。每一起刑事案件情況的每一個(gè)關(guān)鍵詞分別和每一個(gè)原子特征詞進(jìn)行相似度計(jì)算,乘以該關(guān)鍵詞在簡(jiǎn)要案情中出現(xiàn)的頻次加1后的最大值作為最終結(jié)果,因?yàn)樵撛~在案件關(guān)鍵詞中也出現(xiàn)1次。假設(shè)n起刑事案件,m個(gè)案件原子特征詞,則刑事案件的空間向量矩陣表示為:
其中,刑事案件在m維空間的特征分量wij(i=1,2…,n;j=1,2…,m)計(jì)算是通過(guò)每起刑事案件的關(guān)鍵詞與原子特征詞之間的相似度乘以該關(guān)鍵詞在簡(jiǎn)要案情中出現(xiàn)的頻次加1,并取最大值得到。
3.2.2 FCM 聚類(lèi)算法
3.2.2.1 FCM 聚類(lèi)算法模型
FCM算法是一種基于劃分的聚類(lèi)算法,它的思想就是使得被劃分到同一類(lèi)的對(duì)象之間相似度最大,而不同類(lèi)之間的相似度最小。模糊C均值算法是普通C均值算法的改進(jìn),普通C均值算法對(duì)于數(shù)據(jù)的劃分是硬性的,而FCM則是一種柔性的模糊劃分。FCM算法在迭代尋優(yōu)過(guò)程中,不斷更新各類(lèi)的中心及隸屬度矩陣各元素的值,直到逼近下列準(zhǔn)則函數(shù)最小值。
3.2.2.2 FCM 聚類(lèi)算法步驟
1)確定類(lèi)數(shù) c(2≤c≤N)、參數(shù) m、矩陣 A和一個(gè)適當(dāng)?shù)恼`差參數(shù)ε>0;
2)置定初始模糊分類(lèi)矩陣U(0),uij表示U中元素,令s=0;
3)計(jì)算U(s)時(shí)的{V(s)i}
再計(jì)算xj的新隸屬度。
如果Ij=Φ那么否則uij=0,
5)以一個(gè)適當(dāng)?shù)木仃嚪稊?shù)比較U(s)和U(s+l),如果‖U(s)-U(s+l)‖<ε停止;否則,s=s+1,返回3)。
1)數(shù)據(jù)抽樣:從某市刑事案件3932起中,通過(guò)系統(tǒng)抽樣法,從中選取了近700起刑事案件,其中盜竊257起,搶劫120起,兇殺320起。
2)數(shù)據(jù)清洗:通過(guò)對(duì)刑事案件進(jìn)行處理,取出每一起刑事案件的簡(jiǎn)要案情部分,并統(tǒng)計(jì)每一起刑事案件簡(jiǎn)要案情中關(guān)鍵詞出現(xiàn)的頻次。去掉其中表達(dá)不規(guī)范的摘要,最終選取盜竊案件、搶劫案件、兇殺案件三種不同類(lèi)別刑事案件共681起,其中盜竊207起,搶劫98起,兇殺376起。
3)抽取原子特征詞:取出681起刑事案件中所有的關(guān)鍵詞,從中人工選取108個(gè)原子特征詞,如表1。通過(guò)編寫(xiě)程序,求出每一起刑事案件中的每一個(gè)關(guān)鍵詞相對(duì)于108個(gè)原子特征詞的相似度值,然后乘以該關(guān)鍵詞在簡(jiǎn)要案情中出現(xiàn)的頻次加1之后最大相似度值,即為相似度加權(quán)值。
4)構(gòu)建刑事案件空間向量矩陣:以681起刑事案件作為行,32個(gè)原子特征詞作為列,以步驟(3)中求出的相似度加權(quán)值作為矩陣元素來(lái)構(gòu)建刑事案件空間向量矩陣R,圖1為R的部分元素。該矩陣每一行即為一起刑事案件的一個(gè)空間向量,每一列(每一維)即為一個(gè)刑事案件特征。通過(guò)相似度加權(quán)計(jì)算的方法所取得的值與現(xiàn)有的方法相比較更加準(zhǔn)確地反映出某個(gè)關(guān)鍵詞在刑事案件中的權(quán)重,而且所得的刑事案件空間向量矩陣R中的數(shù)據(jù)的稀疏程度將大大降低,這樣通過(guò)FCM聚類(lèi)做出的結(jié)果將會(huì)更加地精確、穩(wěn)定。
表1 原子特征詞表
5)聚類(lèi)實(shí)現(xiàn):將刑事案件空間向量矩陣R中的數(shù)據(jù)存入文本文檔,作為Matlab中FCM算法的數(shù)據(jù)源。運(yùn)行FCM算法100以上,取出其中聚類(lèi)目標(biāo)函數(shù)值最小時(shí)的聚類(lèi)結(jié)果作為最終結(jié)果輸出。通過(guò)多次運(yùn)行并對(duì)結(jié)果進(jìn)行比較發(fā)現(xiàn),聚類(lèi)的結(jié)果比較穩(wěn)定。
圖1 刑事案件空間向量矩陣
1)實(shí)驗(yàn)測(cè)試。實(shí)驗(yàn)中的數(shù)據(jù)采用隨機(jī)數(shù)生成器產(chǎn)生。數(shù)據(jù)集的每個(gè)屬性值是[0,100]上的實(shí)數(shù),聚類(lèi)簇的形狀是多維度超矩形,聚類(lèi)簇內(nèi)部數(shù)據(jù)點(diǎn)的密度遠(yuǎn)遠(yuǎn)高于非聚類(lèi)簇區(qū)域,聚類(lèi)簇內(nèi)部數(shù)據(jù)點(diǎn)分布服從均勻分布,非聚類(lèi)簇區(qū)域的噪聲服從均勻分布。
2)抽樣率對(duì)精度的影響。測(cè)試抽樣率與聚類(lèi)正確率的關(guān)系。測(cè)試數(shù)據(jù)集包含10000個(gè)數(shù)據(jù)對(duì)象,數(shù)據(jù)維度是10,聚類(lèi)簇個(gè)數(shù)是5。圖2的橫坐標(biāo)是抽樣率,縱坐標(biāo)是被正確分類(lèi)的對(duì)象數(shù)與全體對(duì)象數(shù)之比。
3)效率測(cè)試。首先測(cè)試運(yùn)行時(shí)間與維度的關(guān)系。測(cè)試數(shù)據(jù)集包含10000個(gè)數(shù)據(jù)對(duì)象,數(shù)據(jù)維度從10到50,聚類(lèi)簇個(gè)數(shù)是5,噪聲數(shù)據(jù)的比例是10%,抽樣率為5%。測(cè)試結(jié)果見(jiàn)圖3。
圖2 聚類(lèi)正確率與抽樣率的關(guān)系圖
再測(cè)試運(yùn)行時(shí)間與數(shù)據(jù)量的關(guān)系。測(cè)試數(shù)據(jù)集的對(duì)象數(shù)目從10000到100000,數(shù)據(jù)維度是20,聚類(lèi)簇個(gè)數(shù)是5,噪聲數(shù)據(jù)的比例是10%,抽樣率為5%。測(cè)試結(jié)果見(jiàn)圖4。
圖3 運(yùn)行時(shí)間與維度的關(guān)系圖
圖4 運(yùn)行時(shí)間與數(shù)據(jù)量的關(guān)系
建立一張二維表,通過(guò)FCM聚類(lèi)所得的刑事案件分類(lèi)結(jié)果與簡(jiǎn)要案情在具體案例中的案件分類(lèi)相比,可以清楚地看到該案件是否為交叉案件,同時(shí)可以清楚地看到該刑事案件屬于哪幾類(lèi)案件交叉及各類(lèi)案件之間的交叉點(diǎn)(關(guān)注點(diǎn))。
表2中每個(gè)字段中前一個(gè)數(shù)字表示刑事案件通過(guò)FCM聚類(lèi)方法聚成的結(jié)果,共分為3類(lèi),分別用A、B、C表示;后一個(gè)數(shù)據(jù)表示刑事案件的實(shí)際分類(lèi),其中“1”代表“刑事案件”;“2”代表“盜竊”;“3”代表“入室盜竊”。例如:“A1”前一個(gè)“A”代表刑事案件通過(guò)FCM聚類(lèi)后分在第一類(lèi)中,而后一個(gè)“1”表示刑事案件現(xiàn)實(shí)中被歸為盜竊。從表2中可以看出:
表2 部分案件交叉表
1)刑事案件中哪些屬于交叉案件范疇。當(dāng)一部分刑事案件通過(guò)原子特征詞被聚為同一類(lèi)時(shí),說(shuō)明這些刑事案件研究或探討的內(nèi)容有相同或相似的方面。在這一類(lèi)中的刑事案件如果現(xiàn)實(shí)中屬于不同案件時(shí),那么說(shuō)明案件之間有交叉的部分,其中一些刑事案件屬于交叉案件。從原子特征詞中,我們可以進(jìn)一步看出案件之間共同關(guān)注的部分。
2)如果某個(gè)原子特征詞分別在不同案件中出現(xiàn),那么從中可以很明顯地看出該原子特征詞被哪些案件同時(shí)關(guān)注。例如第八行的原子特征詞“作案時(shí)間”通過(guò)FCM聚類(lèi)被分為同一類(lèi),但在現(xiàn)實(shí)中同時(shí)出現(xiàn)于“盜竊”、“搶劫”、“兇殺”三類(lèi)案件。從中可以看出,這三類(lèi)案件正在同時(shí)研究“時(shí)間”這個(gè)方面。
3)通過(guò)原子特征詞的統(tǒng)計(jì)頻次,我們可以進(jìn)一步看出某個(gè)原子特征詞的關(guān)注度。如果某個(gè)原子特征詞在某些案件中同時(shí)多次出現(xiàn),那么可以肯定地是這個(gè)原子特征詞是不同案件研究的熱點(diǎn)問(wèn)題。例如:“錢(qián)財(cái)”在盜竊案中出現(xiàn)的頻次為7,在搶劫案中出現(xiàn)的頻次為98,在兇殺案中出現(xiàn)的頻次為11,而且是被聚為同一類(lèi)中。從中可以看出,三類(lèi)案件在“撬”方面屬于交叉案件范疇,而且它在三類(lèi)案件中的關(guān)注度很高。
4)統(tǒng)計(jì)分析。從表3中統(tǒng)計(jì)的結(jié)果可以看出,聚類(lèi)結(jié)果的第A類(lèi)主要是由盜竊(占49.7%)和搶劫(30%)組成,搶奪案占20.3%,因此第A類(lèi)中可以分析出盜竊與搶劫、搶劫與搶奪之間的交叉關(guān)系;第2類(lèi)中主要是由搶劫(占75.2%)和搶奪(占22.7%)組成,因此第B類(lèi)的結(jié)果可以分析出搶劫與盜竊之間的交叉關(guān)系;第C類(lèi)主要由搶奪(占90%)組成,包含9.1%的搶劫,有可能成為研究的新的增長(zhǎng)點(diǎn)。
表3 聚類(lèi)結(jié)果的案件類(lèi)別統(tǒng)計(jì)表
采用聚類(lèi)操作以后,將數(shù)據(jù)庫(kù)中的案件按照一定的判斷標(biāo)準(zhǔn)分成若干類(lèi),并形成一套分類(lèi)規(guī)則。如對(duì)于案件來(lái)說(shuō),包含了案件類(lèi)別、選擇時(shí)機(jī)、選擇處所、作案手段、作案特點(diǎn),作案人的籍貫等多種屬性,如果有兩個(gè)案件在這些屬性上的多個(gè)或全部屬性上都有相似性,就可以認(rèn)為這兩個(gè)案件具有相似性,可以考慮歸到一個(gè)類(lèi)中。其中時(shí)間范圍、地區(qū)范圍、案件類(lèi)別用來(lái)查詢(xún)需要聚類(lèi)的案件的條件,差異度閾值是指小于這個(gè)差異度值的兩個(gè)對(duì)象分到同一個(gè)簇中。把時(shí)間設(shè)為2006年1月1日至2006年6月30日,地區(qū)為舟山市,案件類(lèi)別為盜竊摩托車(chē)案,把差異度閾值設(shè)置為0.5,得到的結(jié)果如圖5。
圖5 串并案分析圖
各種信息資料為偵查破案提供了蘊(yùn)含豐富寶藏的金礦,充分發(fā)揮聚類(lèi)分析技術(shù)對(duì)海量信息展開(kāi)挖掘,采用串并案件、并案?jìng)刹榈姆椒?,針?duì)犯罪行為中所反映的規(guī)律特點(diǎn),有效開(kāi)展串并案工作,不但可以拓寬偵查途徑,擴(kuò)大線索來(lái)源,為疑難案件打開(kāi)突破口,還可以提高刑偵部門(mén)獲取犯罪信息的能力,從而帶動(dòng)整體破案能力的提升。將情報(bào)、技術(shù)、辦案三者相結(jié)合,互為補(bǔ)充、相互印證的串并案模式,體現(xiàn)了情報(bào)貼近實(shí)戰(zhàn),從實(shí)戰(zhàn)中來(lái)、又為實(shí)戰(zhàn)服務(wù)的自為戰(zhàn)的做法,豐富了串并案信息,形成了串并案合力,發(fā)揮了串并案?jìng)刹榈男б?。文章在?duì)串并案的概念進(jìn)行界定的基礎(chǔ)上,分析了串并案中存在的問(wèn)題,對(duì)串并案的意義、條件和分類(lèi)進(jìn)行了研究。提出了串并案分析模型,并對(duì)模型進(jìn)行了詳細(xì)設(shè)計(jì)和實(shí)驗(yàn)分析。
[1]金光,劉士榮,李榮茜,等.數(shù)據(jù)挖掘技術(shù)在犯罪行為分析中的應(yīng)用[J].寧波大學(xué)學(xué)報(bào):理工版,2002(1):56-58.
[2]錢(qián)進(jìn).最大頻繁項(xiàng)目集挖掘技術(shù)研究與展望[J].微計(jì)算機(jī)應(yīng)用,2005,26(6):652-654.
[3]汪陽(yáng),黃天戍,杜廣宇.一種基于聚類(lèi)和主成分分析的常檢測(cè)方法[J].計(jì)算機(jī)工程與應(yīng)用,2008,21(4):21-24.
[4]鄭永紅.犯罪信息工作中的數(shù)據(jù)挖掘技術(shù)[J].廣東公安科技,2005,6(1):39-41.
[5]郝宏奎.論并案?jìng)刹闂l件的科學(xué)運(yùn)用[J].中國(guó)人民公安大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2006,12(2):40-47.
[6]王景東,巴特爾.試論“三位一體”的系列案件偵查模式[J].北京人民警察學(xué)院學(xué)報(bào),2007(5):23-26.