亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        犯罪人風(fēng)險(xiǎn)行為評(píng)估技術(shù)新進(jìn)展
        ——COMPAS系統(tǒng)評(píng)介

        2022-11-25 23:13:46張振聲
        關(guān)鍵詞:犯罪人量表犯罪

        張振聲

        (中國人民公安大學(xué),北京 100038)

        一、問題的提出

        COMPAS全稱是Correctional Offender Management Profiling for Alternative Sanctions,翻譯成中文為“用于替代制裁的懲教罪犯管理分析系統(tǒng)”(1)MEASUREMENT & TREATMENT IMPLICATIONS OF COMPAS CORE SCALES March 30,2009.Northpointe Institute for Public Management,Inc.。COMPAS是一個(gè)計(jì)算機(jī)化的數(shù)據(jù)庫和分析系統(tǒng),其數(shù)據(jù)系統(tǒng)包括幾個(gè)以下模塊:風(fēng)險(xiǎn)/需求評(píng)估、刑事司法機(jī)構(gòu)決策跟蹤、治療和干預(yù)跟蹤、結(jié)果監(jiān)測、機(jī)構(gòu)完整性和規(guī)劃執(zhí)行監(jiān)測(2)David Farabee,COMPAS VALIDATION STUDY:FIRST ANNUAL REPORT. 2007.12.epic.org/algorithmic-transparency/crim-justice/.。

        COMPAS作為一個(gè)專門用于犯罪人風(fēng)險(xiǎn)行為評(píng)估的專業(yè)系統(tǒng),雖然其產(chǎn)生時(shí)間比較晚,但是其作用和意義已經(jīng)遠(yuǎn)遠(yuǎn)超過了系統(tǒng)本身的價(jià)值。COMPAS原本只是一個(gè)專門用于司法系統(tǒng)的犯罪人風(fēng)險(xiǎn)行為評(píng)估軟件系統(tǒng),令人感到意外的是,它的出現(xiàn)引起了法律理論界、實(shí)務(wù)界乃至整個(gè)社會(huì)的高度重視。一個(gè)尚處于萌芽狀態(tài)的犯罪人風(fēng)險(xiǎn)評(píng)估系統(tǒng)被提升到AI技術(shù)與時(shí)代發(fā)展的高度,參與討論的有法官、商人、犯罪學(xué)家、AI工程師、政府要員等社會(huì)方方面面的人士;爭論的焦點(diǎn)是人工智能參與犯罪人風(fēng)險(xiǎn)行為評(píng)估的最終后果是什么,它會(huì)不會(huì)導(dǎo)致一系列問題,尤其是會(huì)不會(huì)導(dǎo)致不公正現(xiàn)象的出現(xiàn)。很顯然,AI技術(shù)把犯罪人風(fēng)險(xiǎn)評(píng)估復(fù)雜化了,人們關(guān)注的焦點(diǎn)不僅局限于技術(shù)本身,已經(jīng)上升到法律和人權(quán)問題的高度。在這個(gè)問題上,美國威斯康星州的埃里克·盧米斯(Eric Loomis)案件,演變成了對(duì)COMPAS質(zhì)疑的大戰(zhàn)。2017年6月,美國聯(lián)邦最高法院拒絕受理盧米斯的申訴要求,等于維持威斯康星州法院支持原判決有效的裁決,實(shí)際上是默認(rèn)了COMPAS的鑒定結(jié)果。埃里克·盧米斯案件成了引發(fā)這場討論的導(dǎo)火索(3)Wisconsin appeals court urges state’s top court to review use of risk-assessment software at sentencing September 24,2015 SENTENCING LAW AND POLICY.。

        概括來說,目前關(guān)于COMPAS有兩種截然相反的觀點(diǎn)。部分研究人員對(duì)法律人工智能的使用前景持相對(duì)樂觀的態(tài)度,認(rèn)為法律人工智能在當(dāng)下與未來都將獲得更廣泛的使用,但這取決于算法的進(jìn)一步優(yōu)化、計(jì)算機(jī)硬件的進(jìn)一步提升以及更為物美價(jià)廉的法律人工智能服務(wù)的出現(xiàn)。根據(jù)相關(guān)研究得出的結(jié)論,COMPAS使用的客觀評(píng)估方法實(shí)際上優(yōu)于人類的主觀判斷(Grove,Zald,Lebow,Sniz,& Nelson,2000)(4)Grove,W.M.,Zald,D.H.,Lebow,B.S.,Snitz,B.E.,&Nelson,C.(2000)。Clinical versus mechanical prediction:A meta-analysis.Psychological Assessment,12(1),19-30.。

        部分研究人員則對(duì)此不抱樂觀態(tài)度。在他們看來,由于目前能夠獲取的數(shù)據(jù)可能并不可靠、算法標(biāo)準(zhǔn)模糊且未達(dá)到公開透明程度,盲目信任法律人工智能會(huì)產(chǎn)生如隱性歧視等新問題、新沖突。鄭(J.Zeng,B.Ustun,C.Rudin,2017)等人經(jīng)過研究認(rèn)為,COMPAS沒有太多存在的必要,因?yàn)閮H僅需要兩個(gè)評(píng)估指標(biāo)即年齡和以往的犯罪經(jīng)歷,就可以獲得和137個(gè)題目相同的評(píng)估預(yù)測性(5)J.Zeng,B.Ustun,C.Rudin,Interpretable classification models for recidivism prediction.J.R.Stat.Soc.A 180,6894-722(2017).。楊(M.Yang,S.C.Wong,J.Coid,2010)等研究者則認(rèn)為,既然實(shí)踐證明COMPAS所有方法的預(yù)測準(zhǔn)確性都處于中等水平,就可以據(jù)此得出結(jié)論:這些技術(shù)不能應(yīng)用于刑事司法決策特別是預(yù)防性拘留的決策(6)Yang,M.,S.C.P.Wong,andJ.Coid.(2010).The efficacy of violence prediction:A meta-analytic comparison of nine risk assessment tools.Psychological Bulletin 136.5:740-767.。

        國際上的這場爭論很快波及到我國,我國一些學(xué)者也參與了這場大討論。這場討論的主題是COMPAS的人工智能參與問題,但是其實(shí)質(zhì)是主觀評(píng)價(jià)與客觀評(píng)價(jià)的博弈問題。根據(jù)現(xiàn)在掌握的資料,參與這項(xiàng)討論的大多數(shù)是非專業(yè)人士:既不是專業(yè)做風(fēng)險(xiǎn)評(píng)估研究的人員,也不是心理學(xué)家,而是主要以法律工作者為主?!八惴óa(chǎn)生的‘歧視’來自于訓(xùn)練算法的數(shù)據(jù)本身是否正確、完整。同時(shí),如果只考慮大多數(shù)情況,則很難兼顧少數(shù)人群的利益”(7)參見《人工智能會(huì)失控嗎?》載2017年6月2日《經(jīng)濟(jì)日?qǐng)?bào)》第15版。。

        出現(xiàn)這種大討論的根本原因在于大家對(duì)這項(xiàng)技術(shù)并不了解,僅僅從自己的學(xué)術(shù)立場出發(fā)去評(píng)判這項(xiàng)技術(shù),這樣的分析顯然存在明顯的缺陷。道德和法律規(guī)范是討論者首要考慮的問題,其次就是對(duì)技術(shù)的十全十美的“幻想”。從目前掌握的資料來看,我國尚無研究者專門對(duì)COMPAS做全面系統(tǒng)的介紹,一些研究者的討論多少存在“以訛傳訛”之嫌。為了使相關(guān)人員對(duì)這項(xiàng)技術(shù)有一個(gè)詳細(xì)的了解,有必要對(duì)這項(xiàng)技術(shù)進(jìn)行全面系統(tǒng)的介紹,以便使研究者、實(shí)務(wù)界人士乃至社會(huì)公眾對(duì)COMPAS技術(shù)有一個(gè)公正和客觀的評(píng)價(jià),還這項(xiàng)技術(shù)以本來面目。

        二、COMPAS系統(tǒng)起源

        COMPAS的出現(xiàn)是犯罪人風(fēng)險(xiǎn)評(píng)估技術(shù)發(fā)展的必然產(chǎn)物??梢院敛豢鋸埖卣f,COMPAS系統(tǒng)是犯罪人風(fēng)險(xiǎn)評(píng)估技術(shù)30年發(fā)展歷程的一個(gè)縮影。1998年,美國北角公司(NORTHPOINTE)首次對(duì)外公布了COMPAS系統(tǒng),針對(duì)這項(xiàng)技術(shù)的贊揚(yáng)和批評(píng)也由此產(chǎn)生。2004年1月至2005年11月期間,北角公司在美國進(jìn)行了30000多項(xiàng)比較評(píng)估測驗(yàn),并對(duì)更新后的標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行了抽樣調(diào)查。經(jīng)過多年的不斷修訂,最終在2009年確定了最終的使用版本。該系統(tǒng)已經(jīng)在紐約以外的57個(gè)縣獲得使用(8)Sharon Lansing New York State COMPAS-Probation Risk and Needs Assessment Study:Examining the Recidivism Scale’s Effectiveness and Predictive Accuracy Criminal Justice Research Report 2012.。

        在西方的一些研究文獻(xiàn)當(dāng)中,通常把犯罪人風(fēng)險(xiǎn)行為評(píng)估的發(fā)展概括為四個(gè)階段。安德魯斯、邦塔和沃米斯(2006年)將COMPAS評(píng)為最具代表性的第四代犯罪人風(fēng)險(xiǎn)行為評(píng)估方法,有人甚至稱之為“4G系統(tǒng)”(9)Andrews,D.A.,& Bonta,J.(1995).The Level of Service Inventory-Revised.Toronto:Multi-Health Systems.。

        第一代風(fēng)險(xiǎn)評(píng)估方法(1G)被定義為“主觀評(píng)估、專業(yè)判斷、知覺和直覺”(bonta,1996),是基于臨床對(duì)風(fēng)險(xiǎn)的判斷。這種判斷容易出現(xiàn)錯(cuò)誤和偏差,缺乏必要的統(tǒng)計(jì)計(jì)算,而且主觀性特別強(qiáng)(10)Bonta,J.(1996).Risk-needs assessment and treatment.In A.T.Harland(Ed.),Choosing correctional options that work:Defining the demand and evaluating the supply(pp.18-32).Thousand Oaks,CA:Sage.。多項(xiàng)研究結(jié)果表明,與統(tǒng)計(jì)或精算的風(fēng)險(xiǎn)評(píng)估相比,臨床預(yù)測單獨(dú)判斷是不準(zhǔn)確的。

        自20世紀(jì)70年代末以來,經(jīng)驗(yàn)主義、客觀主義和標(biāo)準(zhǔn)化方法已經(jīng)成為評(píng)估犯罪人風(fēng)險(xiǎn)的一種趨勢,第二代測試工具(2G)應(yīng)運(yùn)而生。第二代風(fēng)險(xiǎn)評(píng)估工具強(qiáng)調(diào)預(yù)測風(fēng)險(xiǎn)的客觀性,采用更加標(biāo)準(zhǔn)化的風(fēng)險(xiǎn)評(píng)估工具開展工作。這些線性模型在預(yù)測有效性方面往往出人意料地有效,而且通常超出了專業(yè)判斷或訓(xùn)練有素的專家的意見(Grove&Meehl,1996)(11)Grove,W.M.,Zald,D.H.,Lebow,B.S.,Snitz,B.E.,& Nelson,C.(2000).Clinical versus mechanical prediction:A meta-analysis.Psychological Assessment,12(1),19-30.。但是這種技術(shù)有兩個(gè)致命的弱點(diǎn):一是缺乏必要的理論支撐;二是各種影響風(fēng)險(xiǎn)行為發(fā)生的權(quán)重不是來源于統(tǒng)計(jì)方法,更多的是源自于人們的主觀判斷,其中主要是對(duì)歷史(靜態(tài))項(xiàng)目進(jìn)行的評(píng)估(Brennan ed tal,2009年)(12)Brennan,T.,Dieterich,W.,& Ehret,B.(2009).Evaluating the predictive validity of the compas risk and needs assessment system.Criminal Justice and Behavior,36,21-40.。因?yàn)檫x定的因素和權(quán)重通常是根據(jù)常識(shí)或?qū)I(yè)人士共識(shí)建立而不是根據(jù)標(biāo)準(zhǔn)方法建立的,因此第二代風(fēng)險(xiǎn)評(píng)估技術(shù)受到了人們的懷疑和批評(píng)。

        第三代風(fēng)險(xiǎn)評(píng)估工具(3G)對(duì)第二代工具進(jìn)行了改進(jìn),不僅利用了標(biāo)準(zhǔn)化的、定量的風(fēng)險(xiǎn)計(jì)算,而且還納入了理論驅(qū)動(dòng)因素,特別是那些與社會(huì)學(xué)習(xí)理論有關(guān)的因素(andrews et al.2006)。此外,第三代工具也回應(yīng)了犯罪人的需求問題,了解這些需求成為變革評(píng)估工具的目標(biāo),同時(shí)也作為降低犯罪人風(fēng)險(xiǎn)的手段。盡管如此,第三代工具還是因?yàn)樵诶碚撋线^于狹隘和未能解決性別敏感性等問題而受到批評(píng)(13)Andrews,D.A.,Bonta,J.,& Wormith,J.S.(2006).The recent past and near future of risk and/or needs assessment. Crime& Delinquency,52,7-27.。

        目前被稱為第四代的風(fēng)險(xiǎn)評(píng)估工具(4G),解決了前幾代風(fēng)險(xiǎn)評(píng)估工具存在的一些問題,而且,它們被特別設(shè)計(jì)成不僅集成到風(fēng)險(xiǎn)管理過程中,而且還集成到干預(yù)模式和治療目標(biāo)的選擇以及康復(fù)進(jìn)展評(píng)估中。COMPAS作為第四代犯罪人風(fēng)險(xiǎn)評(píng)估的典型代表,它具有如下一些特點(diǎn):

        (1)更廣泛的基礎(chǔ)理論選擇。把現(xiàn)今和犯罪人風(fēng)險(xiǎn)行為關(guān)系密切的所有研究成果均作為自己的理論基礎(chǔ)。(2)更廣泛的風(fēng)險(xiǎn)和需求因素(內(nèi)容有效性)。COMPAS在評(píng)估風(fēng)險(xiǎn)和需要時(shí),把可能的影響因素都作為評(píng)估的影響因子來對(duì)待。(3)從彈性角度考慮問題。評(píng)估標(biāo)準(zhǔn)會(huì)隨著測試樣本的增加而發(fā)生變化。(4)更先進(jìn)的統(tǒng)計(jì)模型。應(yīng)用ROU技術(shù)更容易辨別預(yù)測的準(zhǔn)確性。(5)需求或風(fēng)險(xiǎn)評(píng)估結(jié)果與相關(guān)機(jī)構(gòu)管理信息系統(tǒng)的無縫整合。(6)與刑事司法數(shù)據(jù)庫相連接,實(shí)施基于網(wǎng)絡(luò)的評(píng)估信息技術(shù)(14)TIM BRENNAN WILLIAM DIETERICH BEATE EHRET :EVALUATING THE PREDICTIVE VALIDITY OF THE COMPAS RISK ANDNEEDS ASSESSMENT SYSTEM Criminal Justice and Behavior 36(1):21-40 January 2009.。

        COMPAS是第四代風(fēng)險(xiǎn)和需求評(píng)估工具最具代表性的系統(tǒng),它以RNR作為自己的理論模式之一,同時(shí)兼顧靜態(tài)和動(dòng)態(tài)兩個(gè)方面的風(fēng)險(xiǎn)因子,有衡量動(dòng)態(tài)風(fēng)險(xiǎn)(犯罪因素)和靜態(tài)危險(xiǎn)(歷史因素)的尺度。COMPAS主要的風(fēng)險(xiǎn)模型有兩種:一般累犯風(fēng)險(xiǎn)和暴力累犯風(fēng)險(xiǎn)。COMPAS以統(tǒng)計(jì)學(xué)為基礎(chǔ)的風(fēng)險(xiǎn)/需求評(píng)估已經(jīng)被接受為組織管理懲教環(huán)境中的犯罪行為關(guān)鍵信息的既定和有效方法(quinsey,harris,rice,& cormier,1998)(15)Quinsey,V.L.,Harris,G.T.,Rice,M.E.,& Cormier,C.A.(1998).Violent offenders:Appraising and managing risk.Washington,DC:American Psychological Association.。許多研究人員得出結(jié)論,客觀的統(tǒng)計(jì)評(píng)估實(shí)際上優(yōu)于主觀的判斷(grove,1996)(16)Grove,W.M.,& Meehl,P.E.(1996).Comparative efficiency of informal(subjective,impressionistic)and formal(mechanical,algorithmic)prediction procedures:The clinical-statistical controversy.Psychology,Public Policy and Law,2,293-323.。COMPAS是一種基于統(tǒng)計(jì)數(shù)據(jù)的風(fēng)險(xiǎn)評(píng)估,專門用于評(píng)估關(guān)鍵風(fēng)險(xiǎn)和需求因素,并提供有關(guān)在社區(qū)安置罪犯的決策支持等信息。

        三、COMPAS的理論基礎(chǔ)

        COMPAS系統(tǒng)綜合運(yùn)用了現(xiàn)今所有可能的理論以及尚未構(gòu)成完整理論的研究成果,構(gòu)建了獨(dú)特的綜合理論基礎(chǔ)。這在其他犯罪人風(fēng)險(xiǎn)行為評(píng)估的系統(tǒng)中是絕無僅有的。綜合使用各種理論和尚未構(gòu)成完整理論的研究成果,無疑為這個(gè)第四代犯罪人風(fēng)險(xiǎn)行為評(píng)估系統(tǒng)提供了一個(gè)看似基礎(chǔ)雄厚的根基,實(shí)際上卻把它變成搖搖欲墜的“大廈”。這種做法的直接結(jié)果是無法形成一個(gè)完整的體系,給人以一種“四不像”的感覺。

        (一)心理學(xué)理論

        COMPAS系統(tǒng)主要以三個(gè)心理學(xué)理論為基礎(chǔ)。一是班杜拉的社會(huì)理論。它強(qiáng)調(diào)探討個(gè)人的認(rèn)知、行為與環(huán)境因素三者及其交互作用對(duì)人類行為的影響,認(rèn)為模仿起著很大的作用,同時(shí)要關(guān)注獎(jiǎng)勵(lì)和懲罰對(duì)行為的影響。其關(guān)鍵因素包括:反社會(huì)的同伴、反社會(huì)的態(tài)度以及反社會(huì)或高犯罪率的社區(qū)等。第二個(gè)理論是心理測量理論,主要用于建立數(shù)學(xué)模型和提供具體的評(píng)估實(shí)施方法。最后一個(gè)是個(gè)性理論,包括態(tài)度、個(gè)性等。以上這些理論在COMPAS的量表中都有明確的體現(xiàn)。雖然COMPAS沒有明確把這三種理論作為其理論基礎(chǔ),但是事實(shí)上它已經(jīng)這么做了。不管COMPAS如何解釋,它仍然不能脫離心理學(xué)的基本理論。例如,心理問卷的編制方法和規(guī)則等在COMPAS中都有所體現(xiàn)。心理測量中有一個(gè)專門用來分析被測試人是否會(huì)說謊的方法,即前后一致性的方法,在COMPAS中多次使用。另外一個(gè)例證就是COMPAS設(shè)計(jì)了專門的用于測量個(gè)性的量表。從這些實(shí)例可以看出,COMPAS是一個(gè)“準(zhǔn)心理學(xué)”的測量工具,因?yàn)樗褂玫男睦韺W(xué)理論和方法手段無不具有心理學(xué)的烙印。很難想象,如果COMPAS不使用心理學(xué)的理論與手段,會(huì)變成什么樣子。

        (二)犯罪學(xué)理論

        COMPAS系統(tǒng)有一個(gè)令人稱奇的地方,就是它把現(xiàn)今所有的犯罪學(xué)理論均作為自己的理論基礎(chǔ),而且還在其使用說明書中明確標(biāo)記出來。犯罪一般理論,這個(gè)理論綜合了反社會(huì)人格的因素(例如沖動(dòng),憤怒),把不穩(wěn)定的家庭和不適當(dāng)?shù)酿B(yǎng)育方式與高風(fēng)險(xiǎn)機(jī)會(huì)的生活方式作為犯罪行為的基本原因(Gottfredson & Hirschi,1990)(17)Gottfredson,M.R.,& Hirschi,T.(1990).A general theory of crime.Stanford,CA:Stanford University Press.。緊張理論,這種理論強(qiáng)調(diào)社會(huì)邊緣化、社會(huì)角色不足、社會(huì)/人力資本低以及應(yīng)對(duì)這種壓力的資源貧乏,關(guān)鍵因素包括學(xué)校教育失敗、工作失敗、社會(huì)抱負(fù)受阻、積極的社會(huì)角色過少、社會(huì)隔離和反社會(huì)態(tài)度等(Agnew,1992)(18)Agnew,R.A.(1992).Foundation for a general strain theory of crime.Criminology,30,84-87.。日?;顒?dòng)理論,認(rèn)為高風(fēng)險(xiǎn)的無組織的生活方式是犯罪的重要誘發(fā)因素,關(guān)鍵因素包括無聊/煩躁不安、很少親社會(huì)的休閑活動(dòng)、失業(yè)/不在學(xué)校,反社會(huì)的同齡人和藥物濫用等(Cohen & Felson,1979)(19)Cohen,L.& Felson,M.(1979).“Social change and rate trends:A routine activity Approach.” American Sociological Review,44,(4),p.588-608.。社會(huì)混亂/亞文化理論,它強(qiáng)調(diào)社會(huì)和物質(zhì)環(huán)境,亞文化中的規(guī)范與主流文化中的規(guī)范不同,某些行為(犯罪、濫用藥物)成為子文化中的文化規(guī)范,包括高犯罪率的社區(qū)、貧窮和不同于主流規(guī)范的亞文化規(guī)范,作為犯罪的重要犯罪學(xué)因素。費(fèi)舍爾對(duì)亞文化的定義是:“一大群具有共同特征的人彼此交往,是與他們共同特征相關(guān)的機(jī)構(gòu)的成員,堅(jiān)持一套獨(dú)特的價(jià)值觀,共享一套文化工具,參與常見的生活方式”??刂?約束理論,這個(gè)理論強(qiáng)調(diào)家庭、學(xué)校、信仰、教會(huì)等社會(huì)關(guān)系的強(qiáng)弱,認(rèn)為這些社會(huì)關(guān)系可能會(huì)抑制人們的反社會(huì)行為,其關(guān)鍵因素包括家庭關(guān)系、親子關(guān)系、婚姻關(guān)系、親社會(huì)信仰/態(tài)度、親社會(huì)關(guān)系等(Agnew & Cullen,2003)(20)Agnew,R.,& Cullen,F(xiàn).T.(2003).Criminological theory,past to present.Los Angeles:Roxbury Publishing Company.。該理論主要說明不同的控制方式對(duì)于人的行為的影響,包括內(nèi)在(與價(jià)值觀、信仰等的聯(lián)系)控制方式,外在(與家庭、朋友、社交網(wǎng)絡(luò)、同事的聯(lián)系)控制方式以及心理(情感依戀、認(rèn)知等)控制方式等。犯罪機(jī)會(huì)理論,即描述和預(yù)測犯罪行為的理論。隨著時(shí)間的推移,個(gè)人因素和環(huán)境因素都會(huì)影響犯罪行為,積極犯罪者在時(shí)間和地點(diǎn)上的趨同性、合適的目標(biāo)以及監(jiān)護(hù)權(quán)的缺失是犯罪行為強(qiáng)有力的預(yù)測因素。犯罪最有可能發(fā)生在一個(gè)合適的目標(biāo)(受害者)和具有犯罪動(dòng)機(jī)的犯罪者身上,以及在沒有抑制因素的地方。

        從COMPAS所列出的犯罪學(xué)基礎(chǔ)理論來看,足見其理論基礎(chǔ)十分“強(qiáng)大”,但是如何在一個(gè)評(píng)估系統(tǒng)里統(tǒng)領(lǐng)這幾個(gè)理論卻成為一個(gè)十分棘手的問題。況且COMPAS沒有根據(jù)這些理論形成一個(gè)相對(duì)完整的系統(tǒng)化的基礎(chǔ)理論。最基礎(chǔ)的問題沒有得到解決,再高明的AI技術(shù)也會(huì)成為空架子。

        (三)人工智能理論

        根德魯?shù)热?Gendreau et al.1996)通過元分析研究得出的8種最主要的危險(xiǎn)因素均包括:(1)反社會(huì)行為史;(2)反社會(huì)人格;(3)反社會(huì)認(rèn)知;(4)反社會(huì)同伴;(5)家庭因素;(6)教育/職業(yè)問題;(7)休閑/娛樂;(8)物質(zhì)濫用(21)Gendreau,P.,Little,T.,& Goggin,C.(1996).A meta-analysis of the predictors of adult offender recidivism:What works!Criminology,34,575-607.。這些因素作為風(fēng)險(xiǎn)評(píng)估的靜態(tài)因素參與到整體的評(píng)估當(dāng)中,與動(dòng)態(tài)因素一起構(gòu)成了COMPAS完整的評(píng)估體系。為了能讓風(fēng)險(xiǎn)評(píng)估更具科學(xué)性和客觀性,COMPAS使用深度學(xué)習(xí)(Deep Learning)的算法,并以此建立自己的數(shù)學(xué)評(píng)估模型。同時(shí)它還向外界宣告,COMPAS積累的樣本越多,其結(jié)果的準(zhǔn)確性就會(huì)越高。為了保證測試結(jié)果的準(zhǔn)確性,COMPSS內(nèi)置了兩種不同的預(yù)防措施,用于識(shí)別說謊、破壞或不連貫反應(yīng)的人員:(1)防御性或“壓力管理”測試,主要用于防范以“偽善”面目出現(xiàn)的扭曲反應(yīng),也就是故意向有利于自己的方面的作答;(2)不一致性/隨機(jī)測試,以發(fā)現(xiàn)可能破壞其內(nèi)部觀點(diǎn)或提供不一致反應(yīng)的罪犯(Brennan & Oliver,2000)(22)Brennan,T.,& Oliver,W.L.(2000).Evaluation of reliability and validity of COMPAS scales:National aggregate sample.Traverse City,MI:Northpointe Institute for Public Management.。深度學(xué)習(xí)既是COMPAS的一個(gè)亮點(diǎn),同時(shí)又為后面的爭論埋下了伏筆??梢钥隙ǖ卣f,使用人工智能技術(shù)是犯罪人風(fēng)險(xiǎn)評(píng)估發(fā)展的必然,雖然存在一定的缺點(diǎn),但是和臨床方法相比,COMPAS具有其絕對(duì)優(yōu)勢的一面。

        四、COMPAS評(píng)估內(nèi)容與方法

        COMPAS系統(tǒng)主要基于如下考慮:預(yù)測性風(fēng)險(xiǎn)評(píng)估工具使用準(zhǔn)確、有效和種族中立的精算預(yù)測方法來預(yù)測多種刑事司法風(fēng)險(xiǎn)結(jié)果,包括暴力累犯、一般累犯、未能出庭、潛逃、監(jiān)禁期間的紀(jì)律行為等。COMPAS主要有兩類量表,一類是風(fēng)險(xiǎn)評(píng)估量表,另一類是需要量表。COMPAS的全部量表共有41個(gè),其中核心量表(男女均可以使用)22個(gè),專門為女性服刑人員準(zhǔn)備的量表16個(gè);全部量表共有測試題目287個(gè),其中男女服刑人員通用題目174個(gè),女服刑人員專用題目113個(gè);男女共用核心測試題目137個(gè)(23)Practitioner’s Guide to COMPAS Core March 19,2015.Northpointe Institute for Public Management,Inc.。下面筆者就核心量表做簡單的介紹。

        (一)風(fēng)險(xiǎn)評(píng)估量表

        1.未出現(xiàn)風(fēng)險(xiǎn)量表

        該量表很大程度上基于以前未出現(xiàn)的歷史、當(dāng)前未出現(xiàn)的指控、以前在社區(qū)安置的累犯、一般的犯罪參與、不穩(wěn)定的和暫時(shí)性居住條件等條件設(shè)計(jì)。得分高的人會(huì)表現(xiàn)出這些特征的多種組合。未出現(xiàn)風(fēng)險(xiǎn)量表共有19個(gè)題目。

        2.重新犯罪風(fēng)險(xiǎn)量表

        它是為了預(yù)測新的犯罪行為而編制的。構(gòu)成這個(gè)量表的主要因素包括以前的犯罪史、犯罪同伙、涉及毒品和青少年犯罪問題的早期跡象。所有這些風(fēng)險(xiǎn)因素都是累犯的預(yù)測因素,其中高分的累犯比低分的累犯更容易受到監(jiān)管機(jī)構(gòu)的關(guān)注,因?yàn)榈头值睦鄯笌缀醪淮嬖陲L(fēng)險(xiǎn)。該量表為綜合性量表,包括犯罪參與量表、職業(yè)/教育量表、毒品問題量表,共25題。

        3.暴力再犯量表

        該量表最初是在大量緩刑和現(xiàn)場調(diào)查案件的核心評(píng)估數(shù)據(jù)中編制的,量表輸入的信息包括暴力史、不服從記錄、職業(yè)/教育問題、入所時(shí)的年齡和被捕時(shí)的年齡。該量表為綜合性量表,包括暴力史量表、違規(guī)史量表、職業(yè)或教育量表等,共25題。

        (二)需要量表

        需要量表共分5個(gè)主題:

        1.犯罪參與

        (1)涉嫌犯罪量表。這個(gè)量表是根據(jù)一個(gè)人參與犯罪的程度來定義的,共有4個(gè)題目。高分表明一個(gè)人有多次被捕、多次定罪的記錄,以及應(yīng)當(dāng)優(yōu)先被監(jiān)禁;低分能識(shí)別出第一次被捕或者以前有輕微犯罪記錄的人。此量表的編制以安德魯?shù)热说难芯砍晒鳛槔碚撘罁?jù)(Andrews & Bonta,1998)(24)Andrews,D.A.,& Bonta,J.(1998).The psychology of criminal conduct(2nd ed.).Cincinnati,OH:Anderson.。

        (2)目前的暴力行為量表。這個(gè)量表中心條目是是否存在攻擊性重罪。其他關(guān)鍵項(xiàng)目包括是否使用武器、是否對(duì)人造成傷害等。共有7個(gè)題目。

        (3)違規(guī)歷史量表。這個(gè)量表關(guān)注的是一個(gè)人在社區(qū)監(jiān)督下緩刑或假釋失敗的次數(shù),共5個(gè)題目。其中心項(xiàng)是因?yàn)檫`反規(guī)定被撤銷緩刑或假釋的次數(shù)。相關(guān)項(xiàng)目包括當(dāng)事人在緩刑期間出現(xiàn)新的指控或遭到逮捕的次數(shù),以及因違反假釋規(guī)定而返回拘留所的次數(shù)。一個(gè)經(jīng)常違反規(guī)定的人,其行為可以成為預(yù)測慣犯的基礎(chǔ)(Stalans,Yarnold,Seng,Olsen,& Repp,2004)(25)Stalans,L.J.,Yarnold,P.R.,Seng,M.,Olsen,D.,& Repp,M.(2004).Identifying three types of violent offenders and pre-dicting their recidivism and performance while on probation:A classification tree analysis.Law and Human Behavior,26,253-271.。

        (4)暴力史量表。這個(gè)量表的目的是反映個(gè)人以往暴力的嚴(yán)重性和程度。共9個(gè)題目。它關(guān)注暴力重罪發(fā)生的頻率、使用武器的頻率以及受害者受傷的頻率。若干特定暴力犯罪的頻率也包括在量表中,如搶劫、兇殺和襲擊性犯罪。研究文獻(xiàn)表明,以前發(fā)生的每一起暴力事件似乎增加了未來發(fā)生暴力的可能(Farrington & West 1991)(26)Farrington,D.P.,& West,D.J.(1993).Criminal,penal,and life histories of chronic offenders:Risk and protective factors and early identification.Criminal Behaviour and Mental Health,3,492-523.。

        2.關(guān)系/生活風(fēng)格

        (1)犯罪同伙量表。這個(gè)量表主要評(píng)估一個(gè)人與其他涉及毒品、犯罪或幫派的人聯(lián)系的程度,并確定他們是否有被逮捕和監(jiān)禁的歷史,一共有7個(gè)題目。其理論基礎(chǔ)為社會(huì)學(xué)習(xí)理論和亞文化理論(Cullen & Agnew,2003)(27)Cullen,F(xiàn).,& Agnew,R.(2003).Criminological theory:Past to present.Los Angeles:Roxbury.。

        (2)閑暇時(shí)間量表。這個(gè)量表評(píng)估的是人們感到無聊、焦躁不安或無法長時(shí)間保持對(duì)某項(xiàng)活動(dòng)的興趣的程度,共5個(gè)題目。該量表有兩個(gè)緊密相連的主題:無聊傾向和缺乏吸引人的休閑活動(dòng),其中占主導(dǎo)地位的因素包括經(jīng)常感到無聊、無事可做、對(duì)當(dāng)前活動(dòng)感到不安、分散注意力。社會(huì)控制理論(Hirschi,1969)和日?;顒?dòng)理論(Osgood et al.1996)是這個(gè)量表的理論基礎(chǔ)(28)Hirschi,T.(1969).Causes of delinquency.Berkeley:University of California Press.(29)Osgood,D.,Wayne,J.K.,Wilson,J.G.,Bachman,P.,O’Malley,G.,& Johnston,L.D.(1996). Routine activities and individual deviant behavior. American Sociological Review,61,635-655.。

        (3)犯罪機(jī)會(huì)量表。這個(gè)量表來自于那些強(qiáng)調(diào)日常生活的重要性以及占據(jù)特定社會(huì)角色(婚姻、養(yǎng)育子女、擔(dān)任雇員)的犯罪學(xué)理論。主要內(nèi)容包括失業(yè)、居住在高犯罪率地區(qū)、有朋友吸毒、沒有正當(dāng)活動(dòng)等,共有14個(gè)題目。

        (4)社會(huì)孤立量表。這個(gè)量表評(píng)估一個(gè)人擁有一個(gè)支持性的社會(huì)網(wǎng)絡(luò)的程度,以及這個(gè)網(wǎng)絡(luò)被接受和融入的程度,共有8個(gè)題目。它包括三個(gè)項(xiàng)目:沒有朋友,感覺被遺忘,沒有親密或最好的朋友。這個(gè)量表出現(xiàn)高分代表缺乏支持以及社會(huì)隔離和孤獨(dú)感的存在。它的理論基礎(chǔ)為社會(huì)控制理論和壓力緩沖理論(Bennett & Morabito,2006)(30)Bennett,R.R.,& Morabito,M.S.(2005,November).Institutional social support and crime:A cross-national investigation.Paper presented at the annual meeting of the American Society of Criminology,Toronto,Canada.。

        (5)藥物濫用量表。已有的研究報(bào)告證實(shí),無論對(duì)于一般的犯罪行為還是嚴(yán)重暴力行為,藥物濫用都是一個(gè)重要的風(fēng)險(xiǎn)因素(Gendreau et al.1996)(31)Gendreau,P.,Little,T.,& Goggin,C.(1996).A meta-analysis of the predictors of adult offender recidivism:What works!Criminology,34,575-607.。該量表共有10個(gè)題目,高分人群表明存在吸毒或酗酒問題,可能需要必要的干預(yù)。

        3.個(gè)性

        (1)認(rèn)知行為量表。該量表包含了犯罪機(jī)會(huì)、犯罪思維、早期社會(huì)化和社會(huì)調(diào)整量表中的概念和項(xiàng)目。當(dāng)一個(gè)人在這個(gè)范圍內(nèi)得到中高分?jǐn)?shù)時(shí),就必須考慮他們的世界觀是否存在問題。該量表為綜合性量表,具體包括犯罪同伙/同伴量表、犯罪機(jī)會(huì)量表、犯罪思維自我報(bào)告量表、社會(huì)化失敗量表和社會(huì)適應(yīng)問題量表。

        (2)犯罪人格量表。包括沖動(dòng)、冒險(xiǎn)、煩躁和無聊、缺乏內(nèi)疚(麻木不仁)、自私和自戀、人際支配、憤怒和敵意,以及利用他人的傾向(Hare,1991)等(32)Hare,R.D.(1991).The Hare Psychopathy Checklist-Revised.Toronto:Multi-Health Systems.。其理論基礎(chǔ)為艾森克和班杜拉的理論,共有13個(gè)題目。

        (3)犯罪思維自我報(bào)告量表。這個(gè)量表包括道德辯護(hù)、拒絕承擔(dān)責(zé)任、指責(zé)受害者,以及最小化他們犯罪行為的嚴(yán)重性和后果的合理化借口,共有10個(gè)題目。

        4.家庭

        (1)社會(huì)化失敗量表。這個(gè)量表綜合了反映家庭問題、早期學(xué)校問題和早期脫離家長管理的項(xiàng)目,所有這些信息都表明了一個(gè)人社會(huì)化失敗的程度,共有13個(gè)題目,目的是通過學(xué)校、少年犯罪和家庭問題的早期指標(biāo)來研究社會(huì)化崩潰。高分代表父母被監(jiān)禁或定罪,或有酗酒或吸毒問題。這個(gè)量表考察了一個(gè)人成長過程中可能對(duì)他/她的世界觀產(chǎn)生重大影響的歷史或途徑,包括信任、對(duì)合理權(quán)威的尊重、他人的價(jià)值觀,以及當(dāng)今活躍的信仰和態(tài)度問題。

        (2)家庭犯罪量表。該量表評(píng)估個(gè)人的家庭成員(母親、父親和兄弟姐妹)參與犯罪活動(dòng)、吸毒或酗酒的程度,共有6個(gè)題目。這些題目包括是否有接受過逮捕的家庭成員以及父母或家長是否有過酗酒或吸毒的歷史。許多實(shí)證研究將青少年犯罪和成人犯罪與反社會(huì)家庭聯(lián)系起來(Farrington,Jolliffe,Loeber,Stouthmer-Loeber,& Kalb,2001)(33)Farrington,D.P.,Jolliffe,D.,Loeber,R.,Stouthamer-Loeber,M.,& Kalb,L.M.(2001).The concentration of offenders infamilies,and family criminality in the prediction of boys’ delinquency.Journal of Adolescence,24,579-596.。

        5.社會(huì)隔離

        (1)金融問題量表。該量表的主要評(píng)估內(nèi)容是一個(gè)人是否擔(dān)心財(cái)務(wù)問題,是否有支付賬單的困難,是否與朋友或家人在金錢上發(fā)生沖突,一共有5個(gè)題目。雖然貧窮和犯罪之間并不存在特別緊密的關(guān)系,但是它仍然是預(yù)測犯罪的因素之一。從理論上講,貧困是一種緊張或社會(huì)邊緣化的關(guān)鍵因素(Cullen & Agnew,2003)(34)Cullen,F(xiàn).,& Agnew,R.(2003).Criminological theory:Past to present.Los Angeles:Roxbury.。

        (2)居住不穩(wěn)定量表。這個(gè)量表主要評(píng)估最近搬家的次數(shù)、無家可歸、沒有可以核實(shí)的住址等,共有10個(gè)題目。社會(huì)控制理論認(rèn)為,不穩(wěn)定的居住條件會(huì)削弱社會(huì)聯(lián)系,不穩(wěn)定的居住條件也會(huì)導(dǎo)致個(gè)人壓力增加,甚至被邊緣化(Marris,1987)(35)Marris,P.(1987).Loss and change.New York:Pantheon.。

        (3)職業(yè)/教育量表。這個(gè)量表主要評(píng)估教育和職業(yè)成功水平,如工作技能、當(dāng)前未就業(yè)、低工資和工作經(jīng)歷等,此外還要關(guān)注父母對(duì)孩子的社會(huì)資本轉(zhuǎn)移程度,共有11個(gè)題目。高分代表資源匱乏,會(huì)出現(xiàn)以下情況:未能完成高中學(xué)業(yè),被學(xué)校停學(xué)或開除學(xué)籍,成績差,沒有工作技能,現(xiàn)在沒有工作,就業(yè)歷史差,從事只能獲得最低工資的工作等等。它的理論基礎(chǔ)源自于社會(huì)學(xué)中的社會(huì)資本理論(Coleman,1990)(36)Coleman,J.S.(1990).Foundations of social theory.Cambridge,MA:Harvard University Press.。

        測謊量表和隨機(jī)回答測試這兩個(gè)項(xiàng)目都是有效性測試,可以提供被測試者的潛在偽善或隨機(jī)反應(yīng)的程度。謊言量表中的43個(gè)問題包括對(duì)選擇感到不快樂或憤怒的問題,其中包括“從不”這樣的答案。既然一個(gè)人從未感到不快樂或生氣的可能性很小,選擇“從不”就意味著他們沒有說實(shí)話,或者他們對(duì)自己的回答很粗心。極端的答案和極端的回答問題模式會(huì)觸發(fā)謊言量表。隨機(jī)回答量表基于37對(duì)高度相關(guān)的復(fù)雜計(jì)量項(xiàng)目,有些條目出現(xiàn)多次。內(nèi)部設(shè)置的評(píng)分是為了檢測可能隨機(jī)提供問卷答案的最高5%的回答者,這樣就可以減少謊言的程度。

        (三)數(shù)據(jù)收集方法與評(píng)分標(biāo)準(zhǔn)

        COMPAS使用多種方法收集數(shù)據(jù),包括三個(gè)數(shù)據(jù)收集部分:官方記錄部分、訪談部分和自我報(bào)告部分。來源文件包括國家存檔的犯罪歷史記錄、相關(guān)機(jī)構(gòu)犯罪行為報(bào)告、警方報(bào)告以及在某些情況下的判決前調(diào)查報(bào)告等,這一部分涵蓋了整個(gè)數(shù)據(jù)的三分之一。

        訪談部分要求所有參與評(píng)估的人員接受必要的訓(xùn)練。培訓(xùn)包括訪談技巧、開放式問題、角色扮演練習(xí)、積極傾聽技巧、釋義、反思、探究,以及通過通訊工具的各個(gè)實(shí)質(zhì)性對(duì)話的技巧。培訓(xùn)還包括澄清所有問題的含義,以確保雙方都能夠理解相關(guān)的問題。培訓(xùn)策略包括如何處理難以應(yīng)對(duì)的被訪談?wù)撸约叭绾卧诋?dāng)面測試過程中消除猜疑、抵制或焦慮的情緒。

        該系統(tǒng)還通過包含“超級(jí)鏈接”或“工具提示”,為面試官提供直接訪問所有問題定義和解釋的機(jī)會(huì)。為了得到這樣的定義,面試官只需在評(píng)估屏幕上滾動(dòng)問題,就可以快速得到問題的下拉式書面定義。在面試結(jié)束的問卷中嵌入了兩個(gè)隱藏的數(shù)據(jù)分析測試(謊言/假裝好和一致性測試),這些測試會(huì)自動(dòng)向面試官發(fā)出警告,以檢查和驗(yàn)證任何出現(xiàn)不一致回答的人,以及防御性和超出應(yīng)答范圍的人。

        自我報(bào)告這個(gè)部分主要集中在生活史、家庭、教育、態(tài)度和其他個(gè)人領(lǐng)域,還包含一些防御性量表項(xiàng)目,用于檢測對(duì)問題的“假裝好”回答。工作人員可以提供相應(yīng)的幫助,以幫助被測試者澄清問題,并確保被測試者的個(gè)人隱私受到保護(hù)。

        評(píng)分指南是基于對(duì)每個(gè)本地站點(diǎn)的大規(guī)模標(biāo)準(zhǔn)化樣本分布的,以建立十等分水平的切點(diǎn),計(jì)算概率分?jǐn)?shù),或者僅僅提供傳統(tǒng)的低、中、高指定值。對(duì)于一些小型機(jī)構(gòu),最初可以使用國家標(biāo)準(zhǔn),直到在當(dāng)?shù)厥占阶銐蚨嗟陌咐?,形成穩(wěn)定的標(biāo)準(zhǔn)得分為止。

        目前有八個(gè)常模組:(1)男性監(jiān)獄/假釋組;(2)男性監(jiān)獄;(3)男性緩刑組;(4)男性綜合組;(5)女性監(jiān)獄/假釋組;(6)女性監(jiān)獄;(7)女性緩刑組;(8)女性綜合組。

        每個(gè)量表的分?jǐn)?shù)分高、中、低三個(gè)部分。低分部分為1-4分,中等分?jǐn)?shù)為5-7分,高分為8-10分。隨著校準(zhǔn)研究和大規(guī)模標(biāo)準(zhǔn)化樣本的匯總,一些單位更喜歡使用概率分?jǐn)?shù)而不是十分位數(shù),即使用40%、30%、20%的數(shù)值。

        五、信度與效度

        許多研究證明了COMPAS是可靠的,其量表的結(jié)構(gòu)效度和一致性效度均比較高,并且其風(fēng)險(xiǎn)量表具有較好預(yù)測性,達(dá)到的準(zhǔn)確度水平一般在0.65到0.75(37)TIM BRENNAN,WILLIAM DIETERICH,BEATE EHRETEVALUATING THE PREDICTIVEVALIDITY OF THE COMPAS RISK ANDNEEDS ASSESSMENT SYSTEMHandbook of Recidivism Risk/Needs Assessment Tools,F(xiàn)irst Edition(pp.49-75),2017.11 sage publications.。

        風(fēng)險(xiǎn)量表旨在預(yù)測累犯的風(fēng)險(xiǎn)行為,需求量表旨在描述犯罪人的基本狀況、制定病案計(jì)劃和確定干預(yù)目標(biāo)等。將風(fēng)險(xiǎn)評(píng)估和需求評(píng)估分開進(jìn)行評(píng)價(jià)的方法,被風(fēng)險(xiǎn)評(píng)估實(shí)踐證明是最佳的方案。COMPAS有兩個(gè)主要的風(fēng)險(xiǎn)模型:一般重新犯罪風(fēng)險(xiǎn)和暴力重新犯罪風(fēng)險(xiǎn)。COMPAS設(shè)計(jì)用于預(yù)測風(fēng)險(xiǎn)的風(fēng)險(xiǎn)量表是動(dòng)態(tài)的(由動(dòng)態(tài)、犯罪需求組成),以便人們可以衡量重新犯罪風(fēng)險(xiǎn)隨時(shí)間推移而發(fā)生改變的規(guī)律。批評(píng)者則認(rèn)為風(fēng)險(xiǎn)模型應(yīng)該由刑事司法信息管理系統(tǒng)中可用的靜態(tài)犯罪歷史因素組成,認(rèn)為這些模型更加客觀、可靠和有效(Barnoski & Drake,2007)(38)Barnoski,R.,& Drake,E.K.(2007).Washington’s Offender Accountability Act:Department of Corrections’ static risk assessment(Tech. Rep.).Olympia,WA:Washington State Institute for Public Policy.。

        為了驗(yàn)證COMPAS的有效性,研究人員從2006年至2008年在美國三個(gè)職能部門進(jìn)行了預(yù)測性驗(yàn)證,參加驗(yàn)證的犯罪人共75886人,最終結(jié)果以AUC面積作為衡量的指標(biāo)。在心理學(xué)和刑事司法領(lǐng)域,AUC是一個(gè)常用的指標(biāo),通常分?jǐn)?shù)越接近1,表明預(yù)測的準(zhǔn)確度越高;0.65到0.69的數(shù)據(jù)表明,預(yù)測的準(zhǔn)確性為中等;AUC在0.70到0.75之間,表明預(yù)測準(zhǔn)確度比較高。在本次的大規(guī)模研究當(dāng)中,AUC平均值達(dá)到0.7018,表明COMPAS的預(yù)測準(zhǔn)確性還是比較高的。法斯(FASS et al.2008)等人的一項(xiàng)獨(dú)立研究檢驗(yàn)了COMPAS風(fēng)險(xiǎn)量表的預(yù)測準(zhǔn)確性,結(jié)論是它的有效性因種族而有很大差異(39)Fass,T.L.,Heilbrun,K.,Dematteo,D.,& Fretz,R.(2008).The LSI-R and the COMPAS:Validation data on two risk-needs tools.Criminal Justice and Behavior,35,1095-1108.。不過法斯的研究結(jié)論遭到了先期研究者的批評(píng),因?yàn)榉ㄋ怪皇褂昧?76個(gè)樣本,而且把其中的少數(shù)民族人員又拆分出來,由此產(chǎn)生的種族特異性子樣本在本質(zhì)上變得太小,無法準(zhǔn)確或可靠地測量預(yù)測效果。例如,個(gè)別的樣本數(shù)只有一個(gè)人,其結(jié)論當(dāng)然值得懷疑,幾乎不能作為決定性或可靠的證據(jù)。為了驗(yàn)證COMPAS的預(yù)測性問題,一些研究者還把其他的相關(guān)工具(VRAG、LSI-R、PCL-R)拿來做比較,結(jié)果發(fā)現(xiàn)這些評(píng)估工具的AUC結(jié)果是有差異的,主要取決于所選取的樣本的差異。

        對(duì)于COMPAS的結(jié)構(gòu)效度的研究,采用測量LSI與COMPAS匹配量表之間的相關(guān)性的方法來進(jìn)行,結(jié)果發(fā)現(xiàn)多數(shù)量表之間具有較高的相關(guān)性。COMPAS中的犯罪卷入和LSI中的犯罪歷史量表的相關(guān)性為0.64(P<0.0001),COMPAS中的物質(zhì)濫用和LSI中的毒品問題量表的相關(guān)性為0.53(p<0.0001)。另一項(xiàng)研究顯示,LSI-R與犯罪參與度(0.64)、職業(yè)/教育(0.51)、犯罪同伙(0.48)、濫用物質(zhì)(0.53)、經(jīng)濟(jì)(0.49)和居住穩(wěn)定度(0.57)之間存在高度的相關(guān)性。

        內(nèi)容信度。LSI包括10個(gè)重要的犯罪因素的量表,這些因素評(píng)估的結(jié)構(gòu)在文獻(xiàn)中得到了很好的支持。法拉比(Farabee et al.2010)等人進(jìn)行的一項(xiàng)研究發(fā)現(xiàn),這10個(gè)LSI量表中有9個(gè)在比較中與COMPAS類似的量表完全匹配。內(nèi)部一致性信度——通常用cronbach的alpha系數(shù)來評(píng)估——是一種廣泛使用的信度方法(40)Farabee,D.,Zhang,S.,Roberts,R.E.,& Yang,J.(2010).COMPAS validation study:Final report(Tech.Rep.).UCLA Integrated Substance Abuse Programs.。在一項(xiàng)對(duì)1077名囚犯的研究中,COMPAS量表中cronbach alpha 的平均值為0.70(Brennan Dieterich & Oliver,2000)(41)Brennan,T.,& Oliver,W.L.(2000).Evaluation of reliability and validity of COMPAS scales:National aggregate sample. Traverse City,MI:Northpointe Institute for Public Management.。另一項(xiàng)針對(duì)1534名緩刑犯的比較研究顯示,平均alpha值為0.73(Brennan Dieterich & Oliver,2006)(42)Brennan,T.,Dieterich,W.,& Oliver,W.(2006).San Bernardino County Probation Department COMPAS psychometric report(Tech.Rep.).Traverse City,MI:Northpointe Institute for Public Management.。法拉比等人還發(fā)現(xiàn),COMPAS復(fù)測信度表現(xiàn)出非常高的水準(zhǔn),相關(guān)系數(shù)在0.70到1.00之間,平均相關(guān)系數(shù)在0.80以上(43)Farabee,D.,Zhang,S.,Roberts,R.E.,& Yang,J.(2010).COMPAS validation study:Final report(Tech.Rep.).UCLA Integrated Substance Abuse Programs.。

        提姆(Tim brennan et al.2017)等人對(duì)2328名犯罪人進(jìn)行了COMPAS系統(tǒng)信度和效度檢驗(yàn),得出以下一些結(jié)論:COMPAS量表大多數(shù)在內(nèi)部一致性和預(yù)測效度方面,在普遍可接受的范圍內(nèi);獨(dú)立的單變量分析表明,大多數(shù)風(fēng)險(xiǎn)量表和需求量表有顯著關(guān)聯(lián);在內(nèi)部一致性方面,大多數(shù)量表的α系數(shù)等于或大于0.70(44)TIM BRENNAN,WILLIAM DIETERICH,BEATE EHRETEVALUATING THE PREDICTIVEVALIDITY OF THE COMPAS RISK ANDNEEDS ASSESSMENT SYSTEM.Handbook of Recidivism Risk/Needs Assessment Tools,F(xiàn)irst Edition(pp.49-75),2017.11 sage publications.。

        六、討論

        COMPAS是時(shí)代發(fā)展的產(chǎn)物,它本身帶有鮮明的時(shí)代特點(diǎn),是現(xiàn)今技術(shù)條件下一次很好的嘗試。COMPAS代表了犯罪人風(fēng)險(xiǎn)行為評(píng)估的發(fā)展方向,用一句話概括,就是優(yōu)勢明顯缺點(diǎn)突出。

        (一)理論基礎(chǔ)問題

        在COMPAS正式誕生之前,相關(guān)的研究人員,如醫(yī)生、典獄長、國家機(jī)構(gòu)行政人員以及其他來自刑事司法領(lǐng)域的專業(yè)人士相聚在北角組成研究團(tuán)隊(duì),吸收了犯罪學(xué)、社會(huì)學(xué)、社會(huì)工作、心理學(xué)、計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)等領(lǐng)域的專業(yè)知識(shí),最終形成了綜合運(yùn)用各種相關(guān)理論作為理論基礎(chǔ)的COMPAS系統(tǒng)。從相關(guān)材料來看,幾乎所有的相關(guān)理論及未形成完整理論的重要研究成果均被視為理論基礎(chǔ),這在科學(xué)研究里可能是一個(gè)特例。這似乎不像是在研究犯罪人的風(fēng)險(xiǎn)行為評(píng)估技術(shù),更像是研究相關(guān)的“哲學(xué)”。這樣的做法表面上看起來十分光鮮,它所依賴的理論足夠強(qiáng)大,等于從理論基礎(chǔ)上阻擋了所有可能的批評(píng)。尤其是對(duì)于“外行”來說,其可信程度足可以打倒其他一切研究。其實(shí)在這種強(qiáng)大的理論支撐背后,蘊(yùn)含著一種天然的危機(jī),那就是一個(gè)科學(xué)研究所依賴的理論基礎(chǔ)不可能是不加思考地把所有的相關(guān)理論統(tǒng)統(tǒng)拿來。因?yàn)槊恳环N理論的誕生都有其深刻的思想內(nèi)涵,不同理論之間可能存在相互交叉和矛盾的問題。COMPAS如何去解決這個(gè)問題,至少在目前還沒有給出相對(duì)明確的答案。還有就是不同的量表依據(jù)的是不同的理論,如果出現(xiàn)兩個(gè)以上的量表得出相反的結(jié)論,COMPAS如何進(jìn)行處理,目前還沒有在使用手冊中找到明確的答案。還有一點(diǎn)值得注意,COMPAS初衷是完成犯罪人的風(fēng)險(xiǎn)行為評(píng)估問題,而在其理論基礎(chǔ)里,沒有看到風(fēng)險(xiǎn)評(píng)估的理論作為支撐。這也許是COMPAS系統(tǒng)最大的理論基礎(chǔ)上的缺陷。沒有風(fēng)險(xiǎn)評(píng)估的理論作為基礎(chǔ)去完成風(fēng)險(xiǎn)行為評(píng)估工作,其理論根基顯然不夠牢固,至少是令人懷疑的。

        (二)“定位”問題

        COMPAS是心理評(píng)估還是風(fēng)險(xiǎn)評(píng)估?這就是一個(gè)定位的問題。從現(xiàn)有的資料來看,COMPAS本身沒有給出一個(gè)確切的答案,似乎人們并不急于給其定位,至少目前還沒有人去思考這一問題。仔細(xì)研讀COMPAS的測試題目,可以發(fā)現(xiàn)相當(dāng)數(shù)量的題目更像是心理評(píng)估,COMPAS甚至將其命名為“需要”測驗(yàn),這顯然是一個(gè)典型的心理測量的題目,核心量表中有19個(gè)是以此命名的。女性量表中17個(gè)是測量犯罪人需要的。從測試形式上來看,也充斥著心理測量的元素。最典型的實(shí)例是,COMPAS采用多種只有心理測量里才使用的測謊的方法,以此來保證犯罪人能夠講真話和實(shí)話。從內(nèi)容到形式,無不顯現(xiàn)出COMPAS是一個(gè)標(biāo)準(zhǔn)的心理評(píng)估工具。但是其結(jié)果又不完全是心理評(píng)估,而是對(duì)犯罪人進(jìn)行的一個(gè)所謂“動(dòng)態(tài)和靜態(tài)的”的綜合評(píng)價(jià),這又和心理測量不一樣了。心理測量的靜態(tài)部分是依靠常模來完成的,COMPAS沒有建立這樣的常模,要靠軟件自身的日積月累。把COMPAS定位于風(fēng)險(xiǎn)評(píng)估也很牽強(qiáng),因?yàn)樵谄淅碚摶A(chǔ)里根本就沒有風(fēng)險(xiǎn)評(píng)估理論的字樣。在科學(xué)研究里,如果不能很好地把自己的研究結(jié)果定位,就有可能導(dǎo)致后面的混亂,甚至其結(jié)果的可靠性都會(huì)受到懷疑。

        (三)謊言問題

        COMPAS的編制者意識(shí)到了謊言對(duì)于風(fēng)險(xiǎn)行為評(píng)估的重要作用。他們在對(duì)外宣傳時(shí)聲稱已經(jīng)解決了說謊的問題,目的是讓人們相信它的結(jié)果的客觀性和準(zhǔn)確性。測謊量表和隨機(jī)回答測試這兩個(gè)項(xiàng)目都是有效性測試,可以發(fā)現(xiàn)被測試者的潛在偽善或隨機(jī)反應(yīng)。但是編制者可能沒有注意到這是一個(gè)有著混亂理論基礎(chǔ)的評(píng)估系統(tǒng),從而導(dǎo)致定位不明確。單純使用心理學(xué)的測謊方法去評(píng)估犯罪人是不合適的。COMPAS使用的方法完全是從心理測量學(xué)中借鑒過來的,殊不知風(fēng)險(xiǎn)評(píng)估和心理測量有著本質(zhì)上的差異,那種使用前后一致性等方法來推測被評(píng)估人員是否說謊言的方法并不一定適合犯罪人風(fēng)險(xiǎn)評(píng)估。因?yàn)樾睦頊y量的假設(shè)前提是被測試人員是正常的人群,基本上不存在謊言問題。但是COMPAS面臨的是犯罪人群,況且測試的內(nèi)容與其自身的利益息息相關(guān),他們講真話的幾率相對(duì)比較低,單純使用心理測量里面的測謊方法無疑是一種善良的愿望而已。在COMPAS系統(tǒng)中,測試題目通常分為兩類。一類是測量已經(jīng)發(fā)生的客觀事實(shí)。例如,在社會(huì)化失敗量表里有這樣的題目:“你是不及格還是留級(jí)了?你在學(xué)校和老師發(fā)生沖突的次數(shù)是多少?你在學(xué)校逃過多少次課?你在學(xué)校時(shí)多久打一次架?”等(45)MEASUREMENT & TREATMENT IMPLICATIONS OF COMPAS CORE SCALES March 30,2009Northpointe Institute for Public Management,Inc.。這樣的題目有一個(gè)最大的問題,就是評(píng)估人員并不掌握每個(gè)犯罪人在學(xué)校中的具體表現(xiàn),只能依靠犯罪人自身的回答。也就是說,評(píng)估人員并無法確定被評(píng)估者是否講了真話;而犯罪人只要智力正常,就一定知道如何回答對(duì)自己最為有利。

        另外一類是測量犯罪人對(duì)某些事物的態(tài)度。例如,在犯罪自我報(bào)告量表里有這樣一些題目:“如果有人做了傷害我朋友或家人的事,我會(huì)毫不猶豫地毆打或威脅他們”;“法律不能幫助普通人”;“有些人就是不值得尊重,應(yīng)該像對(duì)待動(dòng)物一樣對(duì)待”等(46)MEASUREMENT & TREATMENT IMPLICATIONS OF COMPAS CORE SCALES March 30,2009Northpointe Institute for Public Management,Inc.。對(duì)于犯罪人來說,他(或她)一定會(huì)選取對(duì)自己最有利的答案,而評(píng)估人員根本無法通過傳統(tǒng)的心理測量的謊言識(shí)別手段去判定被評(píng)估人員是否在說謊。

        (四)人工智能應(yīng)用問題

        COMPAS系統(tǒng)的最大貢獻(xiàn)好像不是它對(duì)于犯罪人的風(fēng)險(xiǎn)評(píng)估,而是它所引起的有關(guān)人工智能的爭論。COMPAS技術(shù)源自于大數(shù)據(jù)的數(shù)理統(tǒng)計(jì)以及在此基礎(chǔ)上形成的數(shù)學(xué)模型,從相關(guān)報(bào)道來看,目前其樣本數(shù)量已經(jīng)超過了100萬個(gè)犯罪人。這樣的數(shù)量對(duì)于從事普通人群研究的項(xiàng)目來說,也是屬于比較多的數(shù)量類型。對(duì)于從事犯罪人研究的項(xiàng)目來說,這絕對(duì)是非常大的數(shù)量。大量的基礎(chǔ)數(shù)據(jù)成為了COMPAS最重要的基礎(chǔ)。COMPAS是第一個(gè)把AI技術(shù)引入其中的,可以肯定地說這是該領(lǐng)域發(fā)展的一個(gè)方向。正是這項(xiàng)技術(shù)的使用導(dǎo)致了大范圍的爭論,引發(fā)了人們對(duì)AI作用的關(guān)切。其中法律工作者可能是最活躍的一個(gè)群體,包括律師、法官等,他們對(duì)AI技術(shù)在風(fēng)險(xiǎn)評(píng)估中的應(yīng)用抱懷疑甚至是敵視的態(tài)度,爭論的焦點(diǎn)是COMPAS引發(fā)了所謂“不公正”現(xiàn)象的出現(xiàn),諸如種族歧視、性別歧視等。有些人甚至從法律的角度要求公布所有的算法,因?yàn)樽鳛橐粋€(gè)公民應(yīng)當(dāng)具有知情權(quán)。這顯然是一個(gè)門外漢的要求。如果北角公司無法抵擋這一要求,有一天真的把算法公布于眾,那COMPAS系統(tǒng)就完全失去了意義,就相當(dāng)于一個(gè)人參加一次考試,考題連同考試答案一起發(fā)下來了一樣。在公開透明方面,COMPAS實(shí)際上已經(jīng)背離了心理測量和風(fēng)險(xiǎn)評(píng)估的基本原則,早已把風(fēng)險(xiǎn)評(píng)估的題目及各種解釋公布于世,只要會(huì)使用網(wǎng)絡(luò)的人都可以在最短的時(shí)間內(nèi)查到這些內(nèi)容。現(xiàn)在,COMPAS已經(jīng)完全沒有秘密可言。如果再像一些人想象的那樣,把算法拿出來公之于眾,那么這種評(píng)估就會(huì)從根本上喪失其存在的意義。

        AI技術(shù)是COMPAS對(duì)外宣傳的一張王牌,AI既是這項(xiàng)技術(shù)的亮點(diǎn)也是這項(xiàng)技術(shù)備受爭議的地方。人們懷疑工程師在開發(fā)COMPAS之初,就已經(jīng)把人類的偏見帶入了軟件之中。即使使用了某些去除偏見的技術(shù),但是仍然不能從根本上解決這些問題,而軟件的自動(dòng)學(xué)習(xí)也會(huì)不可避免地將這種偏見提議擴(kuò)大化?!捌娺M(jìn),偏見出”,成為人們評(píng)價(jià)COMPAS的口頭禪。

        七、結(jié)論

        COMPAS作為犯罪人風(fēng)險(xiǎn)行為評(píng)估的一項(xiàng)新的方法,它在強(qiáng)調(diào)客觀性和深度學(xué)習(xí)方面表現(xiàn)出了明顯的優(yōu)勢,是一個(gè)實(shí)實(shí)在在新技術(shù)手段的嘗試。它和許多技術(shù)手段一樣,在現(xiàn)階段是不完美的,存在明顯的缺陷與不足。但是與其固有的優(yōu)勢相比,這些缺陷和不足會(huì)顯得遜色許多。

        目前COMPAS系統(tǒng)還不夠完善,還沒有達(dá)到必須爭論其“偏見”問題的地步,因?yàn)樗€有許多致命的問題沒有解決。這些問題如果無法獲得解決,那么這個(gè)系統(tǒng)本身就失去了存在的價(jià)值和意義。我們認(rèn)為,應(yīng)當(dāng)先從技術(shù)的角度將其完善,然后再去討論所謂的“偏見問題”?,F(xiàn)在急需解決的問題有三個(gè)方面。第一,關(guān)于理論基礎(chǔ)問題。也許是因?yàn)镃OMPAS的研究人員眾多,專業(yè)出身不同,才出現(xiàn)了目前的局面。迅速整合相關(guān)理論,形成統(tǒng)一的基礎(chǔ)理論,是目前最重要的工作。第二,關(guān)于“定位”問題。沒有給自己明確的定位,無疑會(huì)帶來一系列的麻煩。定位于以心理評(píng)價(jià)為基礎(chǔ)的風(fēng)險(xiǎn)行為評(píng)估,可能是最準(zhǔn)確的。第三,關(guān)于謊言問題。COMPAS系統(tǒng)所使用的測謊方法不足以阻止和識(shí)別被評(píng)估人員講假話的問題,需要借助測謊儀來實(shí)現(xiàn)識(shí)別謊言的目的。如果不解決謊言問題,即使COMPAS擁有高明的算法,在客觀性面前也會(huì)變得毫無意義。

        至于有人對(duì)COMPAS系統(tǒng)偏見和準(zhǔn)確性的質(zhì)疑,目前可以暫時(shí)不去考慮。但是有一點(diǎn)必須明確,只要是涉及到人的問題的評(píng)價(jià),都會(huì)帶有偏見,不管評(píng)價(jià)者的法律水平和道德水平有多高。此現(xiàn)象會(huì)長期持續(xù)存在下去。追求“絕對(duì)公平”的風(fēng)險(xiǎn)評(píng)估是不可能的,僅僅是一個(gè)“理想”的境界而已。面對(duì)有關(guān)所謂“知情權(quán)”的要求,COMPAS更應(yīng)當(dāng)堅(jiān)守自己的底線。保密才是這個(gè)系統(tǒng)的最重要的價(jià)值。如果迫于壓力,將核心算法公布于眾,不僅COMPAS會(huì)受到影響,其他相關(guān)學(xué)科也相應(yīng)的會(huì)遭遇同樣的命運(yùn),擁有一百多年歷史的心理測量學(xué)也就不復(fù)存在了。

        總之,專業(yè)的事情應(yīng)當(dāng)由專業(yè)人士去做,才能保證一項(xiàng)技術(shù)的健康發(fā)展?!伴T外漢”的想法有時(shí)會(huì)顯得更為合理,甚至更有說服力,但是卻會(huì)扼殺一項(xiàng)新的事物。我國司法領(lǐng)域在開展犯罪人風(fēng)險(xiǎn)評(píng)估時(shí)應(yīng)當(dāng)吸取COMPAS的經(jīng)驗(yàn)教訓(xùn),結(jié)合我國實(shí)際情況,迅速制定出一套客觀、科學(xué)的評(píng)估系統(tǒng),而不是跟在他人的后面亦步亦趨。

        猜你喜歡
        犯罪人量表犯罪
        和諧人際關(guān)系的構(gòu)建與犯罪人的再社會(huì)化
        Televisions
        減刑假釋實(shí)行申請(qǐng)制之倡導(dǎo)
        什么是犯罪?
        未成年犯罪人的刑罰制度分析
        三種抑郁量表應(yīng)用于精神分裂癥后抑郁的分析
        初中生積極心理品質(zhì)量表的編制
        重新檢視犯罪中止
        論未成年犯罪人的矯治
        商(2015年6期)2015-05-30 21:02:25
        中學(xué)生智能手機(jī)依賴量表的初步編制
        久久青草国产精品一区| 24小时日本在线视频资源| 国产精品夜间视频香蕉| 免费看操片| 日韩女优一区二区视频| 国产精品一区二区资源| 国产av区亚洲av毛片| 口爆吞精美臀国产在线| 国产成人自拍视频播放| 国产亚洲精品成人aa片新蒲金| 亚洲∧v久久久无码精品| 天堂av一区二区在线观看| av天堂中文亚洲官网| 欧美性猛交99久久久久99按摩| a人片在线观看苍苍影院| 在线观看精品国产福利片100| 久久精品亚洲成在人线av| 午夜天堂av天堂久久久| 亚洲小说图区综合在线| 香蕉人妻av久久久久天天| 97久久综合区小说区图片区| 国产亚洲精品一区在线| 精品国产av色一区二区深夜久久| 亚洲另类国产综合第一| 久久婷婷国产五月综合色| 亚洲国产熟女精品传媒| 小sao货水好多真紧h无码视频 | 日韩丝袜亚洲国产欧美一区| 一区二区三区日本美女视频| 久久aaaa片一区二区| 人人妻人人澡人人爽人人精品| 久久精品午夜免费看| 海外华人在线免费观看| 国产精品99久久久久久猫咪| 亚洲美女啪啪| 亚洲一区视频中文字幕| 亚洲av永久无码精品一福利 | 一区二区三区精品偷拍| 亚洲大尺度无码无码专区| 国产成人精品日本亚洲| 久久丁香花综合狼人|