劉元元,胡峻梅,楊珉,李曉松
(1.四川大學(xué)華西公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室,四川成都 610041;2.中國政法大學(xué)證據(jù)科學(xué)教育部重點實驗室,北京 100088;3.四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院法醫(yī)精神病學(xué)教研室,四川成都 610041;4.英國諾丁漢大學(xué)社區(qū)健康科學(xué)學(xué)院精神科,英國諾丁漢 NG7 2TU)
暴力風(fēng)險評估中的統(tǒng)計預(yù)測方法及其應(yīng)用
劉元元1,2,胡峻梅2,3,楊珉1,4,李曉松1
(1.四川大學(xué)華西公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室,四川成都 610041;2.中國政法大學(xué)證據(jù)科學(xué)教育部重點實驗室,北京 100088;3.四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院法醫(yī)精神病學(xué)教研室,四川成都 610041;4.英國諾丁漢大學(xué)社區(qū)健康科學(xué)學(xué)院精神科,英國諾丁漢 NG7 2TU)
目的如何改進暴力風(fēng)險評估是一個亟待解決的全球性難題,通過統(tǒng)計學(xué)方法進行犯罪的暴力風(fēng)險評估是其中不可或缺的一環(huán),作用十分重要。本文主要從統(tǒng)計學(xué)角度對暴力風(fēng)險評估預(yù)測方法進行了回顧,并對其中較為常用的多元統(tǒng)計模型代表的Logistic回歸模型、數(shù)據(jù)挖掘技術(shù)代表的決策樹模型以及人工智能技術(shù)代表的神經(jīng)網(wǎng)絡(luò)模型及其應(yīng)用進行綜述,以期為暴力風(fēng)險評估的進一步研究提供參考。
統(tǒng)計學(xué);暴力;綜述[文獻類型];危險性評估
暴力及暴力犯罪是一個全球性的公共衛(wèi)生問題,無論任何法律體系和政府,均面臨對暴力及暴力犯罪行為的預(yù)防與管理,涉及暴力風(fēng)險評估。暴力風(fēng)險評估是通過量化的方法對暴力事件發(fā)生及其帶來的影響和損失的可能程度進行預(yù)測和評估。其預(yù)測評估效果好壞將直接影響到社會穩(wěn)定及民眾安全,具有重要意義。近三十年在暴力風(fēng)險評估的研究中,較多集中于對預(yù)測因子的開發(fā)和驗證[1],相對而言,對統(tǒng)計方法的研究較少。眾所周知,除客觀準確的臨床判斷外,所采用的統(tǒng)計預(yù)測方法也將在很大程度上決定評估結(jié)果的準確性。因此,本文主要從統(tǒng)計學(xué)角度對暴力風(fēng)險評估的預(yù)測方法進行回顧,對常用的Logistic回歸、決策樹和神經(jīng)網(wǎng)絡(luò)等多元統(tǒng)計模型和數(shù)據(jù)挖掘技術(shù)及其應(yīng)用進行綜述,以期為今后暴力風(fēng)險評估的深入研究提供參考。
目前在暴力及暴力犯罪預(yù)測研究中采用的統(tǒng)計方法較多,如受試者工作特征(receiver operating characteristic,ROC)曲線分析[2]、傳統(tǒng)的Nuffield法[3]、交互分類表(cross-classification tables)、多重回歸分析(multiple regression methods)[4]、多重判別分析(multiple discriminant analysis)、多維列聯(lián)表分析(multidimensional contingency table analysis)[5]、Logistic回歸分析、判別分析、聚類分析,還有如決策樹模型(decision tree model)、神經(jīng)網(wǎng)絡(luò)(neural networks,NN)模型等數(shù)據(jù)挖掘技術(shù)等[6-8]。其中作為傳統(tǒng)多元統(tǒng)計方法的經(jīng)典代表,Logistic回歸模型是目前應(yīng)用最多且最為廣泛的方法之一。而近年新興的數(shù)據(jù)挖掘技術(shù)中,決策樹模型以及作為人工智能技術(shù)代表的神經(jīng)網(wǎng)絡(luò)模型也引起了越來越多的關(guān)注。
Logistic回歸模型是對二分類因變量做回歸分析時應(yīng)用最為普遍的多元統(tǒng)計分析方法[9]。與線性回歸模型不同,Logistic回歸模型既不假設(shè)因變量和自變量間存在線性關(guān)系,也不要求變量服從正態(tài)分布或具備方差齊性,自變量可以是連續(xù)性變量也可以是分類變量。因此,該方法具有限制條件少、適用范圍廣的優(yōu)點[10]。除了探討影響因素分析外,Logistic回歸模型還可用于分類預(yù)測。其基本原理是將因變量轉(zhuǎn)變成為logit變量(即因變量結(jié)局是否發(fā)生的概率的自然對數(shù)),并應(yīng)用極大似然估計法來估計模型參數(shù)[11],這樣Logistic回歸模型可用于估計某一特定事件(如罪犯釋放后的暴力再犯)的發(fā)生概率。目前,該方法已被司法精神病學(xué)和心理學(xué)領(lǐng)域廣為認可,用于暴力和其他犯罪行為的預(yù)測,并獲得了較好的效果[12-14]。國內(nèi)王小平等[15]曾采用Logistic回歸建模對150例精神分裂癥患者的攻擊行為進行預(yù)測,及其相關(guān)因素進行了研究,主要包括人格特征、智力結(jié)構(gòu)、腦電圖、社會支持和早年不良家庭環(huán)境等,并通過結(jié)果制定了一個有21個條目的攻擊行為預(yù)測表,其預(yù)測準確性達90.3%,有一定預(yù)測效度。
決策樹模型又稱分類樹模型(classification tree model),這類方法近年來得到較多研究學(xué)者和臨床醫(yī)生的推薦,因為該模型被認為反映了實際臨床思考過程,是臨床實踐中風(fēng)險判斷和決策制定的良好代表[16]。從最早的自動交互檢測(automatic interaction detection,AID)[17]模型到之后被廣為使用的分類回歸樹(classification and regression tree,CART)模型[18],均是一種“問題-決定式樹模型”(question-decisiontree model)。其基本原理為逐步回答一系列有層次結(jié)構(gòu)性的問題(分割變量),每一步?jīng)Q策緊扣上一問題的答案,直至最終歸類(終結(jié)點)的獲得。其結(jié)構(gòu)示意圖呈樹狀(圖1),故而得名“樹”模型。除CART模型外,決策樹模型還包括卡方自動交互檢測(chi-square automatic interaction detection,CHAID)[19]模型、C4.5算法(之前的版本是ID3算法,之后的版本是C5.0/See5算法)[20-21]、QUEST算法(quick,unbiased,efficient statistical trees)[22]、提舉樹(boosted trees)[23]模型和迭代分類樹(iterative classification trees,ICT)[24]模型等。
圖1 決策樹模型結(jié)構(gòu)示意圖
Gardner等[12]最先將CART模型應(yīng)用到暴力預(yù)測中,他們在一個精神病急診科患者樣本中對負二項回歸、一般傳統(tǒng)回歸模型與CART模型進行了比較,并采用了自舉法(bootstrapping)進行驗證,結(jié)果顯示3種方法的準確性無差異,但他們認為CART模型在實踐中使用起來更簡便。Stalans等[25]采用了基于最優(yōu)判別分析構(gòu)建的分類樹模型和Logistic回歸模型對1344名暴力犯罪緩刑犯進行了累犯預(yù)測,結(jié)果發(fā)現(xiàn)分類樹模型的靈敏度明顯高于Logistic回歸模型,但受試者工作特征曲線下面積(AUC)則顯示Logistic回歸模型略優(yōu)。Rosenfeld等[26]在204名犯人中對CART模型和Logistic回歸模型進行了比較,但在刀切法(jackknife method)交叉驗證后,CART模型的預(yù)測準確性明顯降低,而Logistic回歸模型則表現(xiàn)出了良好的穩(wěn)定性。類似地,Thomas等[13]在UK700研究中比較了CART和Logistic回歸模型對精神病患者的暴力預(yù)測效果。結(jié)果顯示在十折交叉驗證后,CART模型的預(yù)測表現(xiàn)較Logistic回歸模型有更多準確性的降低和模型的不穩(wěn)定。
此外,決策樹模型在暴力犯罪預(yù)測中的另一著名范例應(yīng)用是Steadman等[24]自1998年起進行的MacArthur暴力風(fēng)險評估研究(MacArthur Violence Risk Assessment Study)中的ICT模型。該項研究的主要目的是創(chuàng)建一個可以在精神病患者人群中使用的暴力風(fēng)險預(yù)測和管理臨床評估工具。這項前瞻性的多中心項目所包含的樣本含量在當時的暴力風(fēng)險評估領(lǐng)域中是最龐大的[16],研究人員在多個社區(qū)內(nèi)調(diào)查隨訪了1100名精神病患者的暴力犯罪情況。他們希望在該項目中,能克服先前暴力風(fēng)險評估領(lǐng)域中存在的一些方法學(xué)問題,如預(yù)測因子的納入受限制、評估標準單一等。最后研究者們基于決策樹模型原理建立了ICT模型,除進行了相應(yīng)報道[16,24,27-32]外,還實現(xiàn)了ICT相應(yīng)軟件“暴力風(fēng)險分級(classification of violence risk,COVR)”的開發(fā)[33]。
ICT實際上是數(shù)個標準決策樹模型(如CHAID或CART)的重復(fù)組合。該模型確定了兩個臨界點,分別用以判斷低風(fēng)險(低于低臨界點者)和高風(fēng)險(高于高臨界點者)對象,此后,對介于高和低風(fēng)險之間的被試(患者)再次采用新的分類樹模型作進一步分析[31]。在以上研究當中,以暴力風(fēng)險程度(高風(fēng)險、低風(fēng)險和風(fēng)險不確定)作為應(yīng)變量,預(yù)測將發(fā)生暴力的概率高于所研究目標群體暴力基線率2倍的個體被歸入“高風(fēng)險”組,低于暴力基線率0.5倍的個體則被歸入“低風(fēng)險”組,而被預(yù)測概率介于兩者之間的個體將被定義為風(fēng)險不確定或“中等風(fēng)險”組?;诘谝粋€標準決策樹模型的預(yù)測結(jié)果,第二個標準決策樹模型將針對第一個模型結(jié)果中的“中等風(fēng)險”組作進一步分類預(yù)測(再尋找“高風(fēng)險”、“低風(fēng)險”組),此過程反復(fù)進行,直至不能將更多的個體分入“高風(fēng)險”、“低風(fēng)險”組(樹終節(jié)點內(nèi)的個體數(shù)不低于50例)[30]。ICT模型中被報道最高精度為AUC值可達0.88[29],但是這些研究普遍存在一個問題,由于現(xiàn)實中缺少對“高風(fēng)險”、“低風(fēng)險”在個體水平上的金標準,因此,以上研究缺乏與實際情況相關(guān)的金標準對其的驗證。因此,對ICT模型的驗證和推廣仍有待進一步研究。此外,有學(xué)者質(zhì)疑這種復(fù)雜的分類系統(tǒng)并不比傳統(tǒng)的回歸方法簡單[26]。
神經(jīng)網(wǎng)絡(luò)模型來自對人工智能的研究,其最大特點一是對容錯性的模仿,二是通過構(gòu)造低水平的腦結(jié)構(gòu)以實現(xiàn)生物神經(jīng)系統(tǒng)的學(xué)習(xí)能力[34]。此外,還具有對數(shù)據(jù)分布特征要求低、可以構(gòu)建幾乎各種非線性結(jié)構(gòu)等優(yōu)點[35]。目前,該模型常被用于解決許多計算量龐大的問題,以辨識多重輸入變量之間不為人腦所識別的復(fù)雜關(guān)系和模式[36]。神經(jīng)網(wǎng)絡(luò)的種類較多,如多層感知器網(wǎng)絡(luò)(multilayer perceptron networks)、概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural networks)、廣義回歸神經(jīng)網(wǎng)絡(luò)(general regression neural networks)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radial basis function networks)、級聯(lián)算法(cascade correlation)、函數(shù)鏈接型神經(jīng)網(wǎng)絡(luò)(functional link networks)、學(xué)習(xí)矢量量化網(wǎng)絡(luò)(learning vector quantization networks)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent networks)、混合網(wǎng)絡(luò)(hybrid networks)、Kohonen網(wǎng)絡(luò)(Kohonennetworks)、Gram-Charlier網(wǎng)絡(luò)(Gram-Charlier networks)、Hebb網(wǎng)絡(luò)(Hebb networks)、自適應(yīng)神經(jīng)元網(wǎng)絡(luò)(Adalinenetworks)、異聯(lián)想網(wǎng)絡(luò)(Heteroassociative networks)等[37]。
多層感知器(multilayer perception,MLP)是目前神經(jīng)網(wǎng)絡(luò)中發(fā)展最為成熟和應(yīng)用最為廣泛的一種模型[38]。如未作特別注明,大多數(shù)文獻中所指的神經(jīng)網(wǎng)絡(luò)或人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)實際上都是指MLP[37],該模型較為穩(wěn)定且有較好的容錯能力。其前向反饋結(jié)構(gòu)(圖2)包括:輸入層(input layer)、隱含層(hidden layer)、輸出層(output layer)、偏倚項(bias term)以及權(quán)重系數(shù)(weight)[39]。MLP中的隱含層數(shù)目和各隱含層中的隱含單位(hidden units)數(shù)目越多,其模擬和運算功能則越強大[34]。以MLP為代表的神經(jīng)網(wǎng)絡(luò)的預(yù)測功能是通過訓(xùn)練學(xué)習(xí)(train)和測試(test)來實現(xiàn)。其訓(xùn)練學(xué)習(xí)過程包括:(1)輸入一對“自變量-目標變量”(input-target pair);(2)計算相應(yīng)預(yù)測值;(3)根據(jù)誤差函數(shù)(error function)計算預(yù)測值與對應(yīng)目標值間的差異;(4)采用訓(xùn)練算法(training algorithm)調(diào)整網(wǎng)絡(luò)內(nèi)部的權(quán)重系數(shù);第(1)至(4)步的訓(xùn)練循環(huán)(training cycle)稱為一次迭代(iteration);(5)不斷重復(fù)訓(xùn)練迭代,直到模型有效產(chǎn)生較為準確的預(yù)測值[40]。許多不同領(lǐng)域的研究均顯示,與傳統(tǒng)統(tǒng)計方法相比較,神經(jīng)網(wǎng)絡(luò)模型在分類預(yù)測上的預(yù)測效果與傳統(tǒng)方法相當,甚至更優(yōu)[41-44]。
圖2 MLP結(jié)構(gòu)示意圖
影響暴力發(fā)生的各種因素之間的關(guān)系和模式是復(fù)雜且難以識別的。犯罪的影響因素眾多,如個體(內(nèi)在的)因素(如年齡、性別、婚姻狀態(tài)、精神疾病有無等),環(huán)境(外在的)因素(如暴露于危險環(huán)境中、是否受外界刺激等)。同時,隨時間改變,各種因素可能交互影響,這些都決定了犯罪預(yù)測模式的建立將非常復(fù)雜和困難。而且,影響因素的數(shù)據(jù)分布特征往往不符合一些傳統(tǒng)統(tǒng)計方法對數(shù)據(jù)的要求。因此,用神經(jīng)網(wǎng)絡(luò)模型來進行風(fēng)險預(yù)測應(yīng)該具有一定的潛力[45]。
Brodzinski等[46]首次將神經(jīng)網(wǎng)絡(luò)模型用于再犯分類預(yù)測。他們對美國778名青少年緩刑犯的資料進行了分析,將樣本劃分為訓(xùn)練樣本390例、測試樣本388例,結(jié)果在測試樣本中得到了高達99%的分類準確度,而與之相比較的判別分析則只達到了66%的總體準確度。但由于該文獻未給出神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練樣本中的分類準確度,尚無法判斷該研究中是否存在過度擬合(overfitting)的問題。Caulkins等[41]對神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)統(tǒng)計方法(包括多重回歸、關(guān)聯(lián)分析等)的再犯預(yù)測效果進行了比較,采用回顧性方法收集了1970至1972年從美國監(jiān)獄釋放的3 389名犯人的隨訪資料,采用反映當前犯罪、歷史犯罪、社會情況和監(jiān)獄改造情況等29個變量做預(yù)測因子,結(jié)果顯示神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果并沒有較傳統(tǒng)統(tǒng)計方法更優(yōu)。由于文中的幾種預(yù)測方法所得預(yù)測準確性無論在訓(xùn)練和測試樣本中均較差,研究者們總結(jié)認為導(dǎo)致預(yù)測失敗的原因并非所選統(tǒng)計方法預(yù)測效能不足,而有可能是由于預(yù)測因子選擇不當?shù)纫蛩卦斐伞?000年,Palocsay等[35]比較了神經(jīng)網(wǎng)絡(luò)模型和Logistic回歸模型對再犯預(yù)測的效果,收集了1978至1980年從美國北卡羅來納州監(jiān)獄釋放出的超過10000名犯人的隨訪資料。預(yù)測因子共9個,包括性別、是否為非洲裔美國人、是否有嚴重的酗酒史、是否有烈性毒品使用史等。結(jié)果顯示兩種方法的分類正確率均在60%~69%,而神經(jīng)網(wǎng)絡(luò)模型略佳,且差異有統(tǒng)計學(xué)意義。研究者們認為神經(jīng)網(wǎng)絡(luò)模型的表現(xiàn)雖然較大程度上依賴于其網(wǎng)絡(luò)拓撲結(jié)構(gòu)(包括隱含層數(shù)量、隱含層內(nèi)的隱含神經(jīng)元數(shù)量、激活函數(shù)種類)的選擇,但卻可能在再犯預(yù)測領(lǐng)域中比傳統(tǒng)統(tǒng)計方法更具優(yōu)勢,原因是神經(jīng)網(wǎng)絡(luò)模型應(yīng)用起來更靈活、適用范圍更廣等。之后,Grann 等[47]將神經(jīng)網(wǎng)絡(luò)模型、傳統(tǒng)的Nuffield法、Logistic回歸模型和非加權(quán)法(即直接把預(yù)測因子得分簡單相加進行ROC分析)的暴力再犯預(yù)測效果進行了比較,他們使用歷史-臨床-風(fēng)險-20項清單(historical-clinicalrisk management-20,HCR-20)對瑞典的404名司法精神病患者進行評估,采用HCR-20中的10項歷史條目作為預(yù)測因子。結(jié)果顯示,各方法的AUC變化范圍在0.51~0.79,訓(xùn)練樣本中Logistic回歸模型和神經(jīng)網(wǎng)絡(luò)模型均未比非加權(quán)法或Nuffield法更準確;而在驗證樣本中,Logistic回歸模型和神經(jīng)網(wǎng)絡(luò)模型,尤其是神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果卻明顯降低。研究者們認為要想提高預(yù)測準確度,預(yù)測方法并非是最重要的,首當其沖應(yīng)該是預(yù)測因子的選擇和組合。同時,他們還指出神經(jīng)網(wǎng)絡(luò)模型的最大問題在于其“黑箱”特征,這種可解釋性差的模型對臨床和實踐是沒有太大幫助的。
針對以上3類方法在風(fēng)險評估中孰優(yōu)孰劣所表現(xiàn)出的不同效果和報道,Liu等[48]將Logistic回歸、CART和MLP 3種模型同時應(yīng)用于暴力風(fēng)險評估并進行了比較。該研究對英國1225名男性監(jiān)獄犯人釋放后是否發(fā)生暴力再犯進行了為期平均3.31年的隨訪,以HCR-20的20項條目得分作為預(yù)測因子對暴力再犯這一結(jié)局變量進行了預(yù)測評估。在經(jīng)過多重驗證和比較后,該研究結(jié)果顯示3種模型的正確率范圍為0.59~0.67,AUC范圍為0.65~0.72,神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果總體比另外兩種模型略優(yōu),但差異沒有統(tǒng)計學(xué)意義。
綜上,不同的分類預(yù)測方法各有優(yōu)劣。Logistic回歸模型在樣本足夠時表現(xiàn)穩(wěn)定,且相對最不容易發(fā)生過度擬合,但對極端值和特殊觀測對象亞組不太敏感;CART等決策樹模型能直觀生動地反映臨床決策過程,能敏感地發(fā)現(xiàn)具有不同特征的群組亞類,有利于風(fēng)險管理和決策,但其穩(wěn)定性問題尚待進一步研究;MLP作為人工智能技術(shù)神經(jīng)網(wǎng)絡(luò)模型的代表,對數(shù)據(jù)和樣本含量的要求均較低,在經(jīng)過充分訓(xùn)練之后,對越是復(fù)雜的數(shù)據(jù),其學(xué)習(xí)和數(shù)據(jù)挖掘能力表現(xiàn)越為突出,并且,在采取適當控制措施并制定“最優(yōu)”模型判斷標準后,MLP也能較好地克服過度擬合問題。但由于“黑箱”原理特質(zhì),目前仍因為模型的可解釋性和泛化性差而尚未被臨床工作者所廣泛接受[49]。恰當?shù)慕y(tǒng)計預(yù)測方法只是暴力風(fēng)險有效評估的重要環(huán)節(jié)之一。正如Yang等[50]在經(jīng)過系列實證研究之后所提出的決定風(fēng)險評估效果最為重要且相互制約的四項因素:良好的預(yù)測因子、特定的同質(zhì)目標人群、足夠區(qū)分度的因變量亞類水平和恰當?shù)慕y(tǒng)計預(yù)測方法。未來風(fēng)險評估可考慮這樣一種發(fā)展模式,多步驟、分階段地完成。
[1]Hanson RK.Twenty years of progress in violence risk assessment[J].J Interpers Violence,2005,20(2):212-217.
[2]Hanley JA,McNeil BJ.The meaning and use of the area under a receiver operating characteristic(ROC)curve[J].Radiology,1982,143(1):29-36.
[3]Nuffield J.Parole decision-making in Canada:Research towards decision guidelines[M].Ottawa:Communication Division,Solicitor General of Canada,1982.
[4]Kirby BC.Parole prediction using multiple correlation[J].American Journal of Sociology,1954,59(6):539-550.
[5]van Alstyne DJ,Gottfredson MR.A multidimensionalcontingencytableanalysisofparoleoutcome:New methods and old problems in criminological prediction[J].Journal of Research in Crime and Delinquency,1978,15(2):172-193.
[6]Borum R.Improving the clinical practice of violence risk assessment.Technology,guidelines,and training[J]. Am Psychol,1996,51(9):945-956.
[7]Cooper BS,Griesel D,Yuille JC.Clinical-forensic risk assessment:The past and current state of affairs[J].J Forensic Psychol Pract,2008,7(4):1-63.
[8]Gottfredson SD,Moriarty LJ.Statistical risk assessment:Old problems and new applications[J].Crime& Delinquency,2006,52(1):178-200.
[9]Hosmer DW,Lemeshow S.Applied logistic regression[M].2nd ed.New York:John Wiley&Sons,2000:1.
[10]Harper PR.A review and comparison of classification algorithms for medical decision making[J].Health Policy,2005,71(3):315-331.
[11]Albert A,Anderson JA.On the existence of maximum likelihood estimates in logistic regression models[J].Biometrika,1984,71(1):1-10.
[12]Gardner W,Lidz CW,Mulvey EP,et al.A comparison of actuarial methods for identifying repetitively violent patients with mental illnesses[J].Law Hum Behav,1996,20(1):35-48.
[13]Thomas S,Leese M,Walsh E,et al.A comparison of statistical models in predicting violence in psychotic illness[J].Compr Psychiatry,2005,46(4):296-303.
[14]Hartvig P,Alfarnes S,Ostberg B,et al.Brief checklists for assessing violence risk among patients discharged from acute psychiatric facilities:A preliminary study[J].Nord J Psychiatry,2006,60(3):243-248.
[15]王小平,楊德森,李凌江,等.精神分裂癥患者攻擊行為的預(yù)測[J].中華精神科雜志,1997,30(1):20-24.
[16]Steadman HJ.From dangerousness to risk assessment of community violence:Taking stock at the turn of the century[J].J Am Acad Psychiatry Law,2000,28(3):265-271.
[17]Morgan JN,Sonquist JA.Problems in the analysis of survey data and a proposal[J].J Am Stat Assoc,1963,58(302):415-434.
[18]Breiman L,F(xiàn)riedman JH,Olshen RA,et al.Classification and regression trees[M].Boca Raton:Chapman&Hall/CRC,1998.
[19]Kass GV.An exploratory technique for investigating large quantities of categorical data[J].Appl Statist,1980,29(2):119-127.
[20]Quinlan JR.C4.5:Programs for machine learning[M]. San Mateo:Morgan KaufmannnPublishers,1993.
[21]Quinlan JR.Improved use of continuous attributes in C4.5[J].J Artif Intell Res,1996,4:77-90.
[22]Loh WY,Shih YS.Split selection methods for classification trees[J].Statistica Sinica,1997,7:815-840.
[23]Friedman JH.Greedy function approximation:A gradient boosting machine[J].The Annals of Statistics,2001,29(5):1189-1232.
[24]Steadman HJ,Mulvey EP,Monahan J,et al.Violence by people discharged from acute psychiatric inpatient facilities and by others in the same neighborhoods[J].Arch Gen Psychiatry,1998,55(5):393-401.
[25]Stalans LJ,Yarnold PR,Seng M,et al.Identifying three types of violent offenders and predicting violent recidivism while on probation:A classification tree analysis[J].Law Hum Behav,2004,28(3):253-271.
[26]Rosenfeld B,Lewis C.Assessing violence risk in stalking cases:A regression tree approach[J].Law Hum Behav,2005,29(3):343-357.
[27]Silver E,Smith WR,Banks S.Constructing actuarial devices for predicting recidivism:A comparison of methods[J].Crim Justice Behav,2000,27(6):733-764.
[28]Silver E,Chow-Martin L.A multiple models approach to assessing recidivism risk:Implications for judicial decision making[J].Crim Justice Behav,2002,29(5):538-568.
[29]Banks S,Robbins PC,Silver E,et al.A multiplemodels approach to violence risk assessment among people with mental disorder[J].Crim Justice Behav,2004,31(3):324-340.
[30]Monahan J,Steadman HJ,Appelbaum PS,et al.Developing a clinically useful actuarial tool for assessing violence risk[J].Br J Psychiatry,2000,176:312-319.
[31]Monahan J,Steadman HJ,Silver E,et al.Rethinking risk assessment:The MacArthur study of mental disorder and violence[M].New York:Oxford University Press,2001.
[32]Monahan J,Steadman HJ,Robbins PC,et al.An actuarial model of violence risk assessment for persons with mental disorders[J].Psychiatr Serv,2005,56(7):810-815.
[33]Monahan J,Steadman HJ,Appelbaum PS,et al.The classification of violence risk[J].Behavioral Sciences &the Law,2006,24(6):721-730.
[34]Cheng B,Titterington DM.Neural networks:A review from a statistical perspective[J].Statistical Science,1994,9(1):2-54.
[35]Palocsay SW,Wang P,Brookshire RG.Predicting criminal recidivism using neural networks[J].Socio-Economic Planning Sciences,2000,34(4):271-284.
[36]Bigi R,Gregori D,Cortigiani L,et al.Artificial neural networks and robust Bayesian classifiers for risk stratification following uncomplicated myocardial infarction[J].Int J Cardiol,2005,101(3):481-487.
[37]Software for predictive modeling and forecasting:Multilayer perceptron neural networks[Z/OL].[2012-08-20].http://www.dtreg.com/mlfn.htm.
[38]Price RK,Spitznagel EL,Downey TJ,et al.Applying artificial neural network models to clinical decisionmaking[J].Psychol Assess,2000,12(1):40-51.
[39]Bishop CM.Neural networks for pattern recognition[M].New York:Oxford University Press,1995.
[40]Model extremely complex functions,neural networks[Z/ OL].[2012-08-20].http://www.statsoft.com/textbook/neural-networks/#multilayera.
[41]Caulkins J,Cohen J,Gorr W,et al.Predicting criminal recidivism:A comparison of neural network models with statistical methods[J].J Crim Justice,1996,24(3):227-240.
[42]Liang T,Chandler JS,Han I,et al.An empirical investigation of some data effects on the classification accuracy of probit,ID3,and neural networks[J]. Contemporary Accounting Research,1992,9(1):306-328.
[43]Sharda R.Neural networks for the MS/OR analyst:An application bibliography[J].Interfaces,1994,24(2):116-130.
[44]Subramanian V,Hung MS,Hu MY.An experimental evaluation of neural networks for classification[J]. Computers&Operations Research,1993,20(7):769-782.
[45]Florio T,Einfeld S,Levy F.Neural networks andpsychiatry:candidate applications in clinical decision making[J].Aust N Z J Psychiatry,1994,28(4):651-666.
[46]Brodzinski JD,Crable EA,Scherer RF.Using artificial intelligence to model juvenile recidivism patterns[J]. Computers in Human Services,1994,10(4):1-18.
[47]Grann M,L?ngstr?m N.Actuarial assessment of violence risk:To weigh or not to weigh?[J]Crim Justice Behav,2007,34(1):22-36.
[48]Liu YY,Yang M,Ramsay M,et al.A comparison of logistic regression,classification and regression tree,and neural networks models in predicting violent re-offending[J].J Quant Criminol,2011,27(4):547-573.
[49]劉元元.暴力再犯風(fēng)險分類預(yù)測方法比較研究及其非平衡數(shù)據(jù)問題探討[D].成都:四川大學(xué)華西公共衛(wèi)生學(xué)院,2010:99.
[50]Yang M,Liu Y,Coid J.Applying Neural Networks and other statistical models to the classification of serious offenders and the prediction of recidivism[R]. Ministry of Justice Research Series 6/10,2010:1-30.
Statistical Prediction Methods in Violence Risk Assessment and Its Application
LIU Yuan-yuan1,2,HU Jun-mei2,3,YANG Min1,4,LI Xiao-song1
(1.Department of Health Statistics,School of Public Health,Sichuan University,Chengdu 610041,China; 2.Key Laboratory of Evidence Science,China University of Political Science and Law,Ministry of Education,Beijing 100088,China;3.Department of Forensic Psychiatry,School of Basic and Forensic Medicine, Sichuan University,Chengdu 610041,China;4.Division of Psychiatry,School of Community Health Sciences,the University of Nottingham,Nottingham NG7 2TU,UK)
It is an urgent global problem how to improve the violence risk assessment.As a necessary part of risk assessment,statistical methods have remarkable impacts and effects.In this study,the predicted methods in violence risk assessment from the point of statistics are reviewed.The application of Logistic regression as the sample of multivariate statistical model,decision tree model as the sample of data mining technique,and neural networks model as the sample of artificial intelligence technology are all reviewed.This study provides data in order to contribute the further research of violence risk assessment.
statistics;violence;review[publication type];risk assessment
DF795.3
A
10.3969/j.issn.1004-5619.2013.03.016
1004-5619(2013)03-0216-06
2012-08-21)
(本文編輯:張欽廷)
國家自然科學(xué)基金資助項目(81072513);證據(jù)科學(xué)教育部重點實驗室開放基金資助項目(2011KFKT02)
劉元元(1979—),女,四川樂山人,講師,博士,主要從事風(fēng)險評估與決策、分類預(yù)測及時間序列預(yù)測等研究;E-mail:y_multi@126.com
李曉松,男,教授,主要從事統(tǒng)計方法與衛(wèi)生決策、統(tǒng)計方法在傳染病流行病學(xué)、藥物臨床試驗的應(yīng)用研究;E-mail:lixiaosong1101@126.com