亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中國計(jì)算法學(xué)的未來:審思與前瞻

        2022-11-29 13:08:26左衛(wèi)民
        清華法學(xué) 2022年3期
        關(guān)鍵詞:決策樹法學(xué)機(jī)器

        左衛(wèi)民

        近年來,“計(jì)算法學(xué)”逐漸成為法學(xué)界的高頻熱詞。例如,若干法學(xué)院校開設(shè)了計(jì)算法學(xué)課程、法學(xué)與計(jì)算機(jī)的雙學(xué)位專業(yè),甚至開始在計(jì)算法學(xué)相關(guān)領(lǐng)域招收研究生。(1)如2017年西南政法的大學(xué)成立的人工智能法學(xué)院積極開設(shè)計(jì)算法學(xué)、Phython語言等專業(yè)課程,2019年清華大學(xué)法學(xué)院開設(shè)了法律碩士(非法學(xué))的計(jì)算法學(xué)方向?qū)I(yè)課程,四川大學(xué)2021年設(shè)立法學(xué)與網(wǎng)絡(luò)空間安全雙學(xué)士學(xué)位本科專業(yè)。2022年清華法學(xué)博士研究生招生簡章中則開始招收計(jì)算法學(xué)方向“創(chuàng)新領(lǐng)軍工程博士”。參見《西南政法大學(xué)成立人工智能法學(xué)院》,載新華網(wǎng),http://www.xinhuanet.com/2017-12/07/c_1122074344.htm,2021年11月17日訪問。中國計(jì)算機(jī)協(xié)會(CCF)也成立了計(jì)算法學(xué)行業(yè)分會以促進(jìn)計(jì)算法學(xué)的發(fā)展。(2)資料來源:《CCF計(jì)算法學(xué)分會成立大會暨計(jì)算法學(xué)研討會成功舉辦》,載中國計(jì)算機(jī)學(xué)會,https://www.ccf.org.cn/Media_list/cncc/2021-12-30/752430.shtml,2022年1月8日訪問。伴隨數(shù)據(jù)時(shí)代來臨,法律實(shí)踐更容易被數(shù)據(jù)記錄、捕獲,奠定了法律計(jì)算的數(shù)據(jù)基礎(chǔ)。隨機(jī)森林、聚類算法、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法的出現(xiàn),為法律計(jì)算的實(shí)現(xiàn)提供了可能。上述種種,似乎預(yù)示計(jì)算法學(xué)正在興起。然而,關(guān)于計(jì)算法學(xué)的發(fā)展卻存在著兩種聲音:其一,計(jì)算法學(xué)正在興起。在國內(nèi),已有文章開始探討計(jì)算法學(xué)的概念與內(nèi)涵。(3)典型的如季衛(wèi)東:《計(jì)算法學(xué)的疆域》,載《社會科學(xué)輯刊》2021年第3期,第113-126頁;申衛(wèi)星、劉云:《法學(xué)研究新范式:計(jì)算法學(xué)的內(nèi)涵、范疇與方法》,載《法學(xué)研究》2020年第5期,第3-23頁;于曉虹:《計(jì)算法學(xué):展開維度、發(fā)展趨向與視域前瞻》,載《現(xiàn)代法學(xué)》2020年第1期,第158-178頁;等等。計(jì)算法學(xué)似乎正成為一種新的發(fā)展趨勢。其二,計(jì)算法學(xué)并未成為獨(dú)立且成熟的學(xué)科。在部分學(xué)者看來,國內(nèi)尚未有成熟的計(jì)算法學(xué)概念、成果涌現(xiàn),計(jì)算法學(xué)既沒有有效的計(jì)算方法,又缺乏可行的計(jì)算思路,計(jì)算法學(xué)的發(fā)展可能受到諸多質(zhì)疑,似乎難以成為一個(gè)獨(dú)立的學(xué)科。(4)相關(guān)文獻(xiàn)論析參見劉艷紅:《人工智能法學(xué)的“時(shí)代三問”》,載《東方法學(xué)》2021年第5期,第32-42頁。

        筆者認(rèn)為,中國的計(jì)算法學(xué)的前景如何,取決于其是否能夠完整經(jīng)歷從知識醞釀或引介,到概念凝練和學(xué)科構(gòu)建,再到研究方法成熟的過程。對于剛剛走在知識醞釀階段的新學(xué)科而言,其研究前景還有諸多的不確定性。關(guān)于計(jì)算法學(xué)在中國的未來,我們需要討論三點(diǎn):第一,計(jì)算法學(xué)的概念范疇。什么研究才能稱為計(jì)算法學(xué)研究?抑或是計(jì)算法學(xué)的概念與定義是什么?第二,計(jì)算法學(xué)應(yīng)當(dāng)如何計(jì)算??梢杂?jì)算的法律經(jīng)驗(yàn)數(shù)據(jù)是什么?用以法律計(jì)算的方法是什么?第三,計(jì)算法學(xué)的前途。即法律的計(jì)算效果究竟如何?未來的計(jì)算法學(xué)學(xué)科應(yīng)該如何發(fā)展?

        一、計(jì)算法學(xué):概念為何?

        何謂計(jì)算法學(xué)?這是一個(gè)尚未充分明確的問題。在域外,理論界實(shí)際上較少直接使用計(jì)算法學(xué)的稱謂,相鄰概念主要涉及計(jì)算社會科學(xué)(computational social science)、法律計(jì)量學(xué)(jurimetrics)、法律信息學(xué)(legal informatics)等。(5)根據(jù)筆者的相關(guān)檢索,同中文中“計(jì)算法學(xué)“之概念具有文字語義上相同性的英文概念包括:“computational law” “computational jurisprudence” “computing law” “computable law” “computational legal studies”等等,在具體內(nèi)涵上也有一定的內(nèi)容差別,如若采用實(shí)質(zhì)解釋的方法則同計(jì)算法學(xué)相似的概念即包括“computational social science”“jurimetrics”“l(fā)egal informatics”。國內(nèi)文獻(xiàn)也在對計(jì)算法學(xué)內(nèi)容的實(shí)質(zhì)解釋范疇下分析計(jì)算法學(xué)的鄰近概念,相關(guān)文獻(xiàn)論析參見錢寧峰:《走向“計(jì)算法學(xué)”:大數(shù)據(jù)時(shí)代法學(xué)研究的選擇》,載《東南大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版)》2017年第2期,第43-49頁;同前注〔3〕,申衛(wèi)星、劉云文,第7頁;鄧矜婷、張建悅:《計(jì)算法學(xué):作為一種新的法學(xué)研究方法》,載《法學(xué)》2019年第4期,第104-122頁;于曉虹、王翔:《大數(shù)據(jù)時(shí)代計(jì)算法學(xué)興起及其深層問題闡釋》,載《理論探索》2019年第3期,第110-117頁;等等。具體而言,可從以下方面把握域外計(jì)算法學(xué)的相關(guān)概念。

        第二,從量化研究角度把握。法律計(jì)量學(xué)的最早倡導(dǎo)者洛文杰(Loevinger)在《法律計(jì)量學(xué):前進(jìn)的下一步》一文中主張,將量化思維引入法律分析過程,強(qiáng)調(diào)使用概率統(tǒng)計(jì)方法來測量證人、法官與立法者行為。(8)See Lee Loevinger, Jurimetrics: The Next Step Forward, 33 Minnesota Law Review 455, 455-493 (1949).我國有學(xué)者則將其翻譯為“計(jì)量法學(xué)”或“數(shù)量法學(xué)”,所謂“計(jì)量法學(xué)”是一種使用法律實(shí)證分析,以數(shù)據(jù)建模為方法,從事判決預(yù)測與制度評價(jià)的研究。(9)參見屈茂輝、匡凱:《計(jì)量法學(xué)的學(xué)科發(fā)展史研究——兼論我國法學(xué)定量研究的著力點(diǎn)》,載《求是學(xué)刊》2014年第5期,第98-106頁。計(jì)算法學(xué)便應(yīng)當(dāng)從法律量化的角度加以理解。

        第三,從法律信息的角度闡釋。自從香農(nóng)創(chuàng)立信息學(xué)以來,信息就成為計(jì)算機(jī)技術(shù)研究的對象。(10)參見同前注〔3〕,申衛(wèi)星、劉云文,第7頁。法律信息學(xué)開始成為信息學(xué)的分支之一,如根據(jù)美國斯坦福大學(xué)法律信息中心杰內(nèi)塞雷斯(Michael Genesereth)的論斷,計(jì)算法學(xué)是法律信息學(xué)的組成部分,而法律信息學(xué)是法律推理的一種方法,依托現(xiàn)代信息技術(shù)的法律分析可以極大地改變法律行業(yè),提高法律服務(wù)的質(zhì)量和效率,從而提高獲得司法公正的機(jī)會,并改善整個(gè)法律體系。(11)See Michael Genesereth, Computational Law: The Cop in the Backseat, 2015, http://logic.stanford.edu/publications/genesereth/complaw.pdf, last visited on Dec.8th, 2021.據(jù)此,計(jì)算法學(xué)的概念應(yīng)當(dāng)在法律信息學(xué)的范疇內(nèi)理解與把握。然而,法律信息學(xué)的概念似乎還沒有獲得理論界的普遍性認(rèn)可,域外代表性的研究成果尚不多見。

        整體上,具備成熟研究思路和方法的計(jì)算社會科學(xué)(computational social science)已在數(shù)據(jù)與人工智能風(fēng)起云涌的歐美社科界蔚然成風(fēng)。(12)從計(jì)算社會科學(xué)論文的數(shù)量與規(guī)模方面即可一窺計(jì)算社會科學(xué)的發(fā)展現(xiàn)狀。如今,計(jì)算社會科學(xué)的相關(guān)成果,筆者統(tǒng)計(jì)“谷歌學(xué)術(shù)”中以“計(jì)算社會科學(xué)(computational social science)”為主題的SSCI論文,2019年68篇,2020年43篇,2021年18篇。我國近年來已經(jīng)有不少政治學(xué)、社會學(xué)學(xué)者逐步涉獵該領(lǐng)域。根據(jù)筆者的統(tǒng)計(jì)中國知網(wǎng)中以“計(jì)算社會科學(xué)”為題的CSSCI期刊論文2018年有12篇,2019年有11篇,2020年有15篇,2021年有11篇(統(tǒng)計(jì)截至2021年12月7日)??梢?,計(jì)算社會科學(xué)研究在世界范圍內(nèi)的興起。在筆者看來,其原因可能與域外社會科學(xué)界包括法學(xué)界如美國實(shí)證研究已經(jīng)成為主流研究范式有關(guān)。歐美社科界很多研究者具備很強(qiáng)的統(tǒng)計(jì)分析能力,并在多領(lǐng)域開展實(shí)證研究包括法律實(shí)證研究。同時(shí),當(dāng)前域外研究者包括實(shí)證研究者通過長期關(guān)注并不斷吸收機(jī)器學(xué)習(xí)等計(jì)算科學(xué)的方法,展開新的科學(xué)研究包括新的實(shí)證研究,相關(guān)研究成果甚至可能促進(jìn)法學(xué)與人工智能技術(shù)的跨界融合。(13)參見左衛(wèi)民:《從通用化走向?qū)iT化:反思中國司法人工智能的運(yùn)用》,載《法學(xué)論壇》2020年第2期,第23頁。實(shí)際上,我們已經(jīng)見到域外司法人工智能技術(shù)的發(fā)展往往伴隨著法律實(shí)證研究成果的實(shí)踐應(yīng)用,美國COMPAS軟件與法國Predictice軟件對裁判結(jié)果預(yù)測的實(shí)踐應(yīng)用即是最好的例子。(14)如在威斯康星州訴盧米斯一案(Wisconsin v.Loomis)中,美國威斯康星州法院使用“風(fēng)險(xiǎn)評估工具”(Correctional Offender Management Profiling for Alternative Sanctions)智能量刑系統(tǒng)。法國司法系統(tǒng)于2017年在雷恩和杜埃兩家上訴法院進(jìn)行了司法人工智能判決結(jié)果預(yù)測軟件Predictice的試點(diǎn)。相關(guān)論析參見左衛(wèi)民:《熱與冷:中國法律人工智能的再思考》,載《環(huán)球法律評論》2019年第2期,第56-59頁;王祿生:《司法大數(shù)據(jù)應(yīng)用的法理沖突與價(jià)值平衡——從法國司法大數(shù)據(jù)禁令展開》,載《比較法研究》2020年第2期,第133-146頁。以“做實(shí)證研究”來促進(jìn)法律人工智能技術(shù)的發(fā)展,進(jìn)而尋求在重大問題上的研究共識,正在成為美國式法律實(shí)證研究(計(jì)算法學(xué))發(fā)展的新方向。

        與域外不同,計(jì)算法學(xué)在中國的出現(xiàn),可能與新文科的興起,相關(guān)學(xué)術(shù)組織的成立,(15)2019年,由清華大學(xué)法學(xué)院、上海交通大學(xué)凱原法學(xué)院、東南大學(xué)法學(xué)院、四川大學(xué)法學(xué)院、華中科技大學(xué)法學(xué)院和西南政法大學(xué)人工智能法學(xué)院等6所高校共同發(fā)起的中國計(jì)算法學(xué)發(fā)展聯(lián)盟在北京正式成立,成為中國計(jì)算法學(xué)開始的標(biāo)志。參見靳昊:《6所高校發(fā)起成立中國計(jì)算法學(xué)發(fā)展聯(lián)盟》,載光明網(wǎng),https://edu.gmw.cn/2019-09/24/content_33185300.htm,2021年10月13日訪問。以及計(jì)算法學(xué)論文的發(fā)表有關(guān)。具體來看,國內(nèi)對計(jì)算法學(xué)概念的研討,大致可以分為兩種進(jìn)路。第一種進(jìn)路中的計(jì)算法學(xué)是“法律與計(jì)算、科技”的結(jié)合,認(rèn)為使用計(jì)算機(jī)技術(shù)研究傳統(tǒng)法學(xué)問題即是計(jì)算法學(xué)。應(yīng)用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對海量裁判文書中的數(shù)據(jù)提取、要素輸出和準(zhǔn)確率檢查等就是計(jì)算法學(xué)的研究成果。(16)參見同前注〔5〕,鄧矜婷、張建悅文,第104-106頁;同前注〔3〕,申衛(wèi)星、劉云文,第3-23頁。這種理解往往將“計(jì)算法學(xué)”簡單理解為“法律與科技、計(jì)算”的結(jié)合,并進(jìn)一步認(rèn)為,在法律數(shù)據(jù)完備、真實(shí)、精確的前提下,通過計(jì)算方式研究法律數(shù)據(jù),從而設(shè)計(jì)出一系列智能化產(chǎn)品,為立法與司法活動(dòng)提供重要參考。據(jù)此來看,這種進(jìn)路將法律人工智能相關(guān)技術(shù)作為焦點(diǎn),在識別、轉(zhuǎn)換法律文本為法律數(shù)據(jù)方面做了不少努力,如應(yīng)用自然語義識別、裁判文書提取等,但在文字轉(zhuǎn)換成為數(shù)據(jù)之后,如何展開數(shù)據(jù)式研究,卻并未有多少應(yīng)用統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)方式展開的研究,也缺乏在此之上的法律人工智能開發(fā),最常見的僅僅是知識圖譜式的顯示而已。同時(shí),這種定位還將法律與科技的結(jié)合問題,如法律如何規(guī)制大數(shù)據(jù)、人工智能應(yīng)用的相關(guān)問題作為學(xué)術(shù)研究的關(guān)切點(diǎn)。不過,這種學(xué)科定位與發(fā)展模式僅是“科技”與“法律”簡單交叉的研究定位,可能導(dǎo)致計(jì)算法學(xué)與法律人工智能、司法人工智能的研究內(nèi)容重疊。當(dāng)法律人工智能的發(fā)展在技術(shù)層面需要經(jīng)歷漫長過程,技術(shù)應(yīng)用還可能遭受法律倫理質(zhì)疑之時(shí),這恐怕難以支撐“計(jì)算法學(xué)”成為一門充分展開的獨(dú)立學(xué)科。

        第二種路徑認(rèn)為,計(jì)算法學(xué)是一種應(yīng)用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算科學(xué)的相關(guān)知識、方法展開的法律實(shí)證研究。(17)參見同前注〔3〕,于曉虹文,第158-178頁。筆者比較認(rèn)同此種進(jìn)路,但更明確地認(rèn)為:計(jì)算法學(xué)其實(shí)是傳統(tǒng)實(shí)證研究的新階段,它是一種從量的層面研究社會現(xiàn)象的方法與學(xué)科。作為社會現(xiàn)象的一種,法律現(xiàn)象也具有量的屬性,可以從量的方法進(jìn)行觀察和研究。(18)參見左衛(wèi)民:《法學(xué)實(shí)證研究的價(jià)值與未來發(fā)展》,載《法學(xué)研究》2013年第6期,第14頁。根本上,法律實(shí)證研究與計(jì)算法學(xué)的研究對象有著天然共性。如法律實(shí)證研究與計(jì)算法學(xué)都強(qiáng)調(diào)使用統(tǒng)計(jì)學(xué)方法進(jìn)行數(shù)據(jù)的收集、分析,進(jìn)而發(fā)現(xiàn)法律現(xiàn)象的相關(guān)性和因果性。顯然,計(jì)算法學(xué)與法律實(shí)證研究都是一種基于經(jīng)驗(yàn)數(shù)據(jù)的量化研究。至于是否應(yīng)用計(jì)算機(jī)技術(shù)、計(jì)算思維和計(jì)算方法,并不能成為法律實(shí)證研究與計(jì)算法學(xué)的“分水嶺”。當(dāng)前,法律實(shí)證研究成果同樣重視法律大數(shù)據(jù)與計(jì)算機(jī)技術(shù)結(jié)合,主要基于法律現(xiàn)象的經(jīng)驗(yàn)數(shù)據(jù),使用統(tǒng)計(jì)學(xué)與計(jì)算機(jī)科學(xué)的相關(guān)知識來闡釋法律實(shí)踐。例如,王祿生開發(fā)了分段、分詞檢索工具,實(shí)現(xiàn)對303萬份判決書的自然語義挖掘,形成了一系列的法律實(shí)證研究成果。(19)相關(guān)論析參見王祿生:《論刑事訴訟的象征性立法及其后果——基于303萬判決書大數(shù)據(jù)的自然語義挖掘》,載《清華法學(xué)》2018年第6期,第124-147頁;王祿生:《人民陪審改革成效的非均衡困境及其對策——基于刑事判決書的大數(shù)據(jù)挖掘》,載《中國刑事法雜志》2020年第4期,第137-154頁。筆者所著的《刑事辯護(hù)率:差異化及其經(jīng)濟(jì)因素分析》一文,應(yīng)用“爬蟲”軟件對54409份裁判文書進(jìn)行了數(shù)據(jù)挖掘,使用Python語言參與數(shù)據(jù)挖掘和分析工作。(20)參見左衛(wèi)民、張瀲瀚:《刑事辯護(hù)率:差異化及其經(jīng)濟(jì)因素分析——以四川省2015—2016年一審判決書為樣本》,載《法學(xué)研究》2019年第3期,第167-189頁。同時(shí),美國的實(shí)證研究學(xué)者更是已經(jīng)將決策樹、隨機(jī)森林以及神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法應(yīng)用于法律的實(shí)證研究。通過分析法官經(jīng)驗(yàn)和法律決策模式,使用機(jī)器學(xué)習(xí)方法構(gòu)造和模擬出同人類決策類似的決策模型,(21)相關(guān)文獻(xiàn)論析如Jon Kleinberg et al., Human Decisions and Machine Predictions, 133 The Quarterly Journal of Economics 237, 237-293 (2018); Harry Surden, Machine Learning and Law, 89 Washington Law Review 87, 87-115 (2014);等等。并依據(jù)決策模型的研究成果研發(fā)出風(fēng)險(xiǎn)評估和預(yù)測案件裁判結(jié)果的人工智能系統(tǒng)。(22)相關(guān)文獻(xiàn)論析參見左衛(wèi)民:《AI法官的時(shí)代會到來嗎——基于中外司法人工智能的對比與展望》,載《政法論壇》2021年第5期,第3-13頁。

        如圖1所示,科學(xué)意義上的計(jì)算法學(xué)與法律實(shí)證研究呈現(xiàn)“一體兩面”的關(guān)系。計(jì)算法學(xué)與法律實(shí)證研究在研究對象、研究方法和研究領(lǐng)域上相通,其本質(zhì)上是實(shí)證研究在新材料、新方法興起后的應(yīng)用與拓展。計(jì)算法學(xué)處于統(tǒng)計(jì)學(xué)、計(jì)算機(jī)技術(shù)與法學(xué)的交叉領(lǐng)域,并非單純強(qiáng)調(diào)計(jì)算科學(xué)方法與計(jì)算機(jī)技術(shù)在法學(xué)領(lǐng)域內(nèi)的推廣,更不是那種既不使用數(shù)據(jù),也不運(yùn)用統(tǒng)計(jì)學(xué)方法,更沒有決策樹、梯度算法等機(jī)器學(xué)習(xí)方法應(yīng)用,僅簡單將法律問題與科學(xué)技術(shù)簡單組合的“偽”計(jì)算研究。至少計(jì)算法學(xué)研究的其中一種應(yīng)是基于法律經(jīng)驗(yàn)現(xiàn)象的數(shù)據(jù)分析與定量研究,以統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)為主要研究方法,實(shí)質(zhì)上是法律實(shí)證研究的最新表述,可以視為法律實(shí)證研究的衍生或者2.0版本。

        圖1 計(jì)算法學(xué)相關(guān)學(xué)科關(guān)系圖

        二、計(jì)算方法:如何計(jì)算法律?

        如何計(jì)算法律?一方面,法律的計(jì)算需要有成熟的計(jì)算法學(xué),使用機(jī)器學(xué)習(xí)計(jì)算法律實(shí)踐或法律現(xiàn)象或許正在成為法律計(jì)算的一種新方向。另一方面,有了成熟的計(jì)算方法,還需要具備豐富的法律數(shù)據(jù)來源??墒怯?jì)算的法律數(shù)據(jù)則誕生于法律的實(shí)踐,靜態(tài)的法律條文既不可能反映數(shù)量變化情況,更無法自我呈現(xiàn)法律條文背后復(fù)雜的權(quán)力關(guān)系,因此,動(dòng)態(tài)變化的法律實(shí)踐才是法律量化數(shù)據(jù)的重要源泉。下文將從可以計(jì)算的法律量化數(shù)據(jù)特征與計(jì)算法學(xué)如何使用機(jī)器學(xué)習(xí)方法兩個(gè)方面展開分析。

        (一)計(jì)算法律的方法

        計(jì)算法學(xué)的基本方式是什么?這是一個(gè)十分重要但尚未厘清的問題。筆者以為,以統(tǒng)計(jì)學(xué)為根基的機(jī)器學(xué)習(xí)應(yīng)成為法律計(jì)算的主要方式。在美國,已經(jīng)有學(xué)者開始探索、使用機(jī)器學(xué)習(xí)相關(guān)方法研究法律問題。如美國學(xué)者喬恩·克萊因伯格(Jon Kleinberg)等人以此分析了美國15萬余件重罪案件的法官假釋結(jié)果,他們對法律的計(jì)算思路與方法值得關(guān)注,(23)雖然機(jī)器學(xué)習(xí)的具體方法擁有較多種類,但是目前已經(jīng)實(shí)際應(yīng)用于法學(xué)研究的主要是決策樹與隨機(jī)森林。此類方法中Jon Kleinberg等人對法官的審前釋放決定的研究充分使用了決策樹、隨機(jī)森林、梯度提升等機(jī)器學(xué)習(xí)方法,并且通過比較法官?zèng)Q策與機(jī)器預(yù)測之間的差異,進(jìn)而探索形成差異的原因。機(jī)器學(xué)習(xí)算法的基礎(chǔ)即是“決策樹”,其研究思路與研究方法具有對于使用機(jī)器學(xué)習(xí)的法律計(jì)算來說具有一定的典型性與代表意義。參見同前注〔21〕,Jon Kleinberg等文,第237-293頁??蓳?jù)此從計(jì)算法律的設(shè)計(jì)思路,法律決策樹與隨機(jī)森林的組成以及梯度提升算法的應(yīng)用方面把握計(jì)算法律的方式。

        首先,使用機(jī)器學(xué)習(xí)的法律計(jì)算是以概率論、數(shù)理統(tǒng)計(jì)、最優(yōu)化理論等為基礎(chǔ),核心要素是法律數(shù)據(jù)的計(jì)算模型。機(jī)器學(xué)習(xí)的結(jié)果與統(tǒng)計(jì)學(xué)的相關(guān)性分析類似,都是一種法律數(shù)據(jù)擬合度很高的計(jì)算模型,可以實(shí)現(xiàn)通過機(jī)器學(xué)習(xí)方法對法律結(jié)果的預(yù)測。如喬恩·克萊因伯格等人利用美國司法部(1990年至2009年)審前保釋決定的相關(guān)數(shù)據(jù),并將其分為法官?zèng)Q定組與機(jī)器學(xué)習(xí)預(yù)測組,對影響釋放決定的因素,如再犯風(fēng)險(xiǎn)、逃避審判風(fēng)險(xiǎn)、保釋金數(shù)額等決定性要素量化處理。通過決策樹、梯度提升算法等機(jī)器學(xué)習(xí)方法構(gòu)建和訓(xùn)練計(jì)算模型,使用梯度算法提高計(jì)算模型的精確性,通過對比法官?zèng)Q策結(jié)果與機(jī)器學(xué)習(xí)算法預(yù)測結(jié)果的差異,分析影響差異產(chǎn)生的“不具有觀察性”的要素。(24)參見同前注〔21〕,Jon Kleinberg等文,第237-293頁。

        其次,利用法律經(jīng)驗(yàn)數(shù)據(jù)的特征與法律決策分類結(jié)果之間的數(shù)量關(guān)系建構(gòu)出具有分類關(guān)系的決策樹,即讓不同法律關(guān)系特征落入對應(yīng)分類的模型。為避免單一法律特征可能被過度放大,造成不必要的偏差,其隨機(jī)挑選部分法律數(shù)據(jù)特征建構(gòu)多棵決策樹形成隨機(jī)森林。決策樹與隨機(jī)森林是常用的機(jī)器學(xué)習(xí)分類方法,在法律樣本數(shù)據(jù)中,依據(jù)結(jié)果變量與自變量之間的對應(yīng)關(guān)系可以構(gòu)建多棵決策樹組成隨機(jī)森林。(25)決策樹與隨機(jī)森林的原理論析參見[英]漢娜·弗萊:《算法統(tǒng)治世界》,李英松譯,貴州人民出版社2021年版,第62-63頁。如再犯風(fēng)險(xiǎn)、逃避審判可能和保釋金額同審前釋放決定之間的對應(yīng)關(guān)系即可構(gòu)成不同類別的決策樹。獲得一種對同類數(shù)據(jù)相同方法處理的“學(xué)習(xí)分類器”,使得新出現(xiàn)的案例數(shù)據(jù)對應(yīng)預(yù)測分類。例如,在喬恩·克萊因伯格等人的研究中使用決策樹對釋放風(fēng)險(xiǎn)予以評估,將觀察因素(影響決定的因素)映射到結(jié)果(逃避審判風(fēng)險(xiǎn))的函數(shù),建立一系列“二元決策樹”。如決策樹根據(jù)先前是否有犯罪記錄進(jìn)行第一次分叉,直至沒有辦法再找到新的屬性來進(jìn)行節(jié)點(diǎn)分割時(shí)分叉停止,每個(gè)葉節(jié)點(diǎn)都形成對應(yīng)的結(jié)果。上述方法將審前釋放決定與各類影響因素之間構(gòu)成不同的決策樹,并使用由決策樹構(gòu)成的“預(yù)測模型”實(shí)現(xiàn)對同類問題的分類預(yù)測,使得機(jī)器學(xué)習(xí)具備初步的結(jié)果分類預(yù)測功能。(26)參見同前注〔21〕,Jon Kleinberg等文,第237-293頁。

        再次,使用梯度算法提升模型預(yù)測結(jié)果的精確性,對比預(yù)測結(jié)果與法官?zèng)Q定的差異,分析影響人類法官?zèng)Q策的潛在因素。如若構(gòu)建出多個(gè)決策樹模型,讓重要的法律關(guān)系在法律決策的結(jié)果中占有更重要的比重,從而形成精確度更高的決策樹,需要使用梯度提升法。利用梯度提升方法將法律數(shù)據(jù)進(jìn)行迭代,在決策樹的特定分叉中結(jié)合深度學(xué)習(xí)方法應(yīng)用損失函數(shù),減少偏差和方差來提升預(yù)測結(jié)果的精確性。不僅如此,還會不斷使用估計(jì)與評估的相關(guān)算法,避免因使用相同數(shù)集造成過度擬合與標(biāo)簽缺失問題,確保訓(xùn)練樹(輸入值)的數(shù)據(jù)與評估樹的數(shù)據(jù)之間沒有缺漏。(27)參見同上注。如在美國法官的審前釋放決定中,被告人是否出庭相比被告人是否具有前科,對于評估逃避審判責(zé)任的風(fēng)險(xiǎn)可能就是一組更為重要的關(guān)系。將機(jī)器學(xué)習(xí)的輸出結(jié)果與現(xiàn)實(shí)答案(法官釋放結(jié)果)代入損失函數(shù),可以對比出人類法官?zèng)Q策與機(jī)器學(xué)習(xí)預(yù)測之間的差異。此外,在處理選擇性標(biāo)簽與潛在混淆因素問題之后,機(jī)器學(xué)習(xí)預(yù)測的釋放結(jié)果與法官釋放結(jié)果的差異化因素即會被捕獲。喬恩·克萊因伯格等人的研究即發(fā)現(xiàn):“相比機(jī)器學(xué)習(xí)算法,人類法官?zèng)Q策似乎釋放了一些高犯罪率的人群。這似乎表明人類法官可能錯(cuò)誤預(yù)判了部分被告人的釋放風(fēng)險(xiǎn)或者考慮過其它不具備觀察條件的影響因素?!苯Y(jié)合這類差異,進(jìn)一步發(fā)現(xiàn),法官不當(dāng)運(yùn)用“不具有觀察性”因素對釋放風(fēng)險(xiǎn)進(jìn)行了不當(dāng)評估。如被告是否出庭或庭上舉止等因素,使得法官假釋決定可能存在尚未被發(fā)現(xiàn)的系統(tǒng)性偏差,使用機(jī)器學(xué)習(xí)方法得出的解釋決定反而可能有助于減少監(jiān)禁率與犯罪率。(28)參見同上注。

        分析域外文獻(xiàn)中使用機(jī)器學(xué)習(xí)方法計(jì)算法律過程旨在說明,決策樹、隨機(jī)森林、梯度提升算法等機(jī)器學(xué)習(xí)方法已在相關(guān)法律實(shí)證研究與計(jì)算法學(xué)中廣泛應(yīng)用,機(jī)器學(xué)習(xí)的法律計(jì)算具備相當(dāng)?shù)膶?shí)際應(yīng)用價(jià)值。如蘇爾登(Surden)等人的專題文章詳盡介紹機(jī)器學(xué)習(xí)算法在法律實(shí)證研究中的實(shí)踐應(yīng)用,(29)參見同上注,第87-115頁。張永健等人使用聚類算法等機(jī)器學(xué)習(xí)方法分析法律淵源的分類,(30)See Yun-chien Chang, Nuno Garoupa & Martin T.Wells, Drawing the Legal Family Tree: An Empirical Comparative Study of 170 Dimensions of Property Law in 129 Jurisdictions, 13 Journal of Legal Analysis 231, 231-282 (2021).李本(Benjamin Liebma)等人應(yīng)用深度學(xué)習(xí)方法分析中國法官規(guī)避司法責(zé)任的規(guī)律性特征,(31)See Benjamin L.Liebman et al., Mass Digitization of Chinese Court Decisions: How to Use Text as Data in the Field of Chinese Law, 8 Journal of Law and Courts 177, 177-201 (2020).等等皆是如此??梢哉f,計(jì)算法學(xué)(實(shí)證研究的機(jī)器學(xué)習(xí)版)的核心方法即是通過收集真實(shí)、客 觀的法律運(yùn)行數(shù)據(jù),使用logistic回歸、相關(guān)性分析等統(tǒng)計(jì)學(xué)方法,結(jié)合決策樹、隨機(jī)森林、梯度提升算法、聚類算法等典型的機(jī)器學(xué)習(xí)方法對法律實(shí)踐與法學(xué)現(xiàn)象展開研究或進(jìn)行觀察,并總結(jié)、歸納法律運(yùn)行規(guī)律。這些研究方法便是當(dāng)下域外相當(dāng)成功的實(shí)證研究與計(jì)算法律的最新方式,值得我們觀察、借鑒與嘗試運(yùn)用。

        (二)可供計(jì)算的法律數(shù)據(jù)特征

        當(dāng)然,擁有了成熟的計(jì)算方法以后,法律的計(jì)算還需要有大量符合計(jì)算要求的法律數(shù)據(jù)。首先,可以計(jì)算的法律是公開化而非半公開化的法律數(shù)據(jù)。理想的、可計(jì)算的法律數(shù)據(jù)要全景式展現(xiàn)法律規(guī)律(現(xiàn)象)產(chǎn)生、發(fā)展及其運(yùn)作結(jié)果的全過程。實(shí)際上,公開化、完全理想的法律數(shù)據(jù)并不太多。我國裁判文書網(wǎng)公布的裁判文書是可公開獲取的法律數(shù)據(jù),但公開的僅僅是裁判結(jié)果與清單式的證據(jù)材料,而沒有公開裁判形成過程的相關(guān)信息。例如,審判委員會的決策可能對裁判結(jié)果產(chǎn)生實(shí)質(zhì)性影響,但是此類信息往往又不會被裁判文書所完整記載。(32)有關(guān)實(shí)踐中審判委員討論案件的程序、范圍、內(nèi)容及其過程公開性問題,參見左衛(wèi)民:《審判委員會運(yùn)行狀況的實(shí)證研究》,載《法學(xué)研究》2016年第3期,第166-170頁。又如可以影響量刑的法官的價(jià)值取向,主觀偏好、司法潛見等因素似乎也未充分公開。(33)參見白建軍:《法律大數(shù)據(jù)時(shí)代裁判預(yù)測的可能與限度》,載《探索與爭鳴》2017年第10期,第96頁。此外,大量案外(如社會結(jié)構(gòu)、經(jīng)濟(jì)水平和環(huán)境等)因素對司法裁判的影響程度,也未以法律數(shù)據(jù)的形式量化。因此,可以被外界計(jì)算的法律數(shù)據(jù)往往是已被數(shù)據(jù)記錄的、公開化的法律經(jīng)驗(yàn)(現(xiàn)象)數(shù)據(jù),而非尚未被收集的法律數(shù)據(jù),當(dāng)前可以計(jì)算的法律也往往處于法律規(guī)范、法律實(shí)踐的內(nèi)部。

        其次,可以計(jì)算的法律是一種具備普遍性、共通性以及類型化特征的法律量化數(shù)據(jù)。計(jì)算法律的前提是將法律經(jīng)驗(yàn)、法律規(guī)律從法律的文本語言轉(zhuǎn)化為計(jì)算機(jī)可以識別的數(shù)字,其過程實(shí)際上就是法律信息的模式識別,需要對法律信息進(jìn)行劃分和歸類處理。(34)參見白建軍:《法律實(shí)證研究方法》(第二版),北京大學(xué)出版社2014年版,第27頁。目前運(yùn)用較多的方法是“自然語義挖掘”技術(shù)。通過這種技術(shù)可以使得外在表述不同,但內(nèi)涵相對一致的法律文本語言劃分為相同或者相似的類別。(35)例如王祿生及其團(tuán)隊(duì)所研發(fā)的專門工具可以分段、分詞檢索,并識別檢索詞的語義(并非關(guān)鍵詞匹配),以提升檢索精確度。參見同前注〔19〕,王祿生:《論刑事訴訟的象征性立法及其后果——基于303萬判決書大數(shù)據(jù)的自然語義挖掘》,第126頁。換言之,可以計(jì)算的法律經(jīng)驗(yàn)數(shù)據(jù)需要具備一定的類型化特征,具備模式化識別的條件。極為罕見的法律現(xiàn)象、法律經(jīng)驗(yàn)往往可能無法形成有規(guī)模的類型化法律數(shù)據(jù),并且概括的分類必然會失去或忽略那些可能相關(guān)的特征。(36)參見[美]詹姆斯·C.斯科特:《國家的視角:那些試圖改善人類狀況的項(xiàng)目是如何失敗的》(修訂版),王曉毅譯,社會科學(xué)文獻(xiàn)出版社2011年版,第99頁。這可能減損數(shù)據(jù)本身所蘊(yùn)含的信息量。在樣本的數(shù)據(jù)量不足或數(shù)據(jù)失真的情況下,即便存在好的計(jì)算方法,也難以產(chǎn)生可靠的計(jì)算結(jié)果。

        此外,基于法律人法律推理和思維判斷所獲取的主觀性法律經(jīng)驗(yàn)或法律感受往往無法進(jìn)行類型化處理,更難以客觀量化。例如,“排除合理懷疑”作為刑事證明標(biāo)準(zhǔn),往往是法官自由心證之結(jié)果,具有一定法律推理及其主觀經(jīng)驗(yàn)累積判斷的特征,而“合理懷疑”的內(nèi)涵來源又具有豐富的神學(xué)、宗教色彩。(37)參見[美]詹姆士·Q.惠特曼:《合理懷疑的起源——刑事審判的神學(xué)根基》(修訂版),佀化強(qiáng)、李偉譯,吳宏耀校,中國政法大學(xué)出版社2016年版,第202頁。所以,“排除合理懷疑”很難通過數(shù)字指標(biāo)予以類型化分析和量化,更不是具備量化特征的法律關(guān)系。

        再次,可計(jì)算的法律還應(yīng)當(dāng)具備相對確定的數(shù)量關(guān)系特征。建構(gòu)量刑模型即是一種典型的應(yīng)用。刑罰中的刑期作為統(tǒng)計(jì)學(xué)意義上的連續(xù)變量,往往受到犯罪動(dòng)機(jī)、犯罪手段以及認(rèn)罪態(tài)度等因素的影響,前述量刑情節(jié)本身又屬于統(tǒng)計(jì)學(xué)意義上的定性變量。通過分析若干量刑情節(jié)的定性變量對量刑幅度的影響,可以發(fā)現(xiàn)各類量刑情節(jié)對刑期影響程度的大小,進(jìn)而得出量刑實(shí)踐的規(guī)律性特征。換言之,量刑幅度與量刑情節(jié)是具備數(shù)量變化特征的法律關(guān)系,特別在最高法院積極推動(dòng)的量刑規(guī)范化改革影響下,我國量刑程序公開化、透明化程度已經(jīng)取得長足進(jìn)步,由相對確定的法定刑與法官自由裁量權(quán)共同構(gòu)成的量刑程序構(gòu)造,更有利于排除非法律因素的干擾,(38)參見熊秋紅:《中國量刑改革:理論、規(guī)范與經(jīng)驗(yàn)》,載《法學(xué)家》2011年第5期,第41頁。使量刑結(jié)果與量刑情節(jié)之間的數(shù)量關(guān)系特征更為明顯。不過,如果一項(xiàng)判決就是規(guī)則與事實(shí)相結(jié)合的產(chǎn)物,司法人員的工作模式便宛如數(shù)學(xué)公式的計(jì)算,(39)弗蘭克根據(jù)法律規(guī)則的傳統(tǒng)理論認(rèn)為:一項(xiàng)判決即為一條規(guī)則和一個(gè)事實(shí)的產(chǎn)物,法院如何運(yùn)作的傳統(tǒng)理論可以用公式表示:R×F=D,其中R代表法律規(guī)則(rule),F(xiàn)代表案件事實(shí)(facts),D則代表法院關(guān)于某個(gè)案件的判決(decision),參見[美]杰羅姆·弗蘭克:《初審法院——美國司法中的神話與現(xiàn)實(shí)》,趙承壽譯,中國政法大學(xué)出版社2007年版,第15-17頁。這屬于非常理想化的法律計(jì)算過程。實(shí)際上,有研究表明:“只有在尋求的目標(biāo)很簡單、有清晰的定義和可以測量的情況下,效率公式、生產(chǎn)函數(shù)和理性行動(dòng)才能被具體指明?!?40)同前注〔36〕,詹姆斯·C.斯科特書,第413-414頁。然而,不少法律語言都存在模糊不清的“半影地帶”。(41)參見[英]蒂莫西·A.O.恩迪科特:《法律中的模糊性》,程朝陽譯,北京大學(xué)出版社2010年版,第10頁。尤其是我國定罪量刑所依據(jù)的法律條文可能因法律語言的融合和變遷形成語言的復(fù)雜、多元性變化。即使相同的法律條文,在具體適用的場合往往可能產(chǎn)生不同的理解,使用不同的法律解釋方法也可能產(chǎn)生截然相反的結(jié)果。(42)參見張明楷:《實(shí)質(zhì)解釋論的再提倡》,載《中國法學(xué)》2010年第4期,第49-69頁。例如,法律條文中的“認(rèn)罪態(tài)度良好”“犯罪情節(jié)極其惡劣”“手段極其殘忍”等內(nèi)容,雖然文本表述明確,但是相同文字表述可以含有相當(dāng)豐富和多元的內(nèi)容,可能影響數(shù)據(jù)量化的精準(zhǔn)性。因此,量刑幅度與量刑情節(jié)這類相對確定的數(shù)量變化關(guān)系,因相關(guān)量刑情節(jié)在法律概念、法律語言方面的模糊性,也只能得出大致的量刑范圍,而不能得出具體的精確計(jì)算結(jié)果。法律計(jì)算還不能如“自動(dòng)售貨機(jī)”那般輸入案情與法條便得出判決的結(jié)果。(43)參見[德]馬克斯·韋伯:《支配社會學(xué)》,康樂、簡惠美譯,廣西師范大學(xué)出版社2010年版,第52頁。

        最后,計(jì)算法學(xué)所計(jì)算的是具有一定數(shù)據(jù)質(zhì)量要求的全樣本大數(shù)據(jù)或大量數(shù)據(jù),這與傳統(tǒng)實(shí)證研究有所差異。傳統(tǒng)實(shí)證研究所處理的數(shù)據(jù)在代表性方面可能更好,但在數(shù)量與質(zhì)量方面不如計(jì)算法學(xué)所處理的數(shù)據(jù)。不過,兩者之間并沒有一個(gè)非此即彼的區(qū)分。實(shí)際上,傳統(tǒng)法律實(shí)證研究往往也能夠處理較大數(shù)量的有代表性的數(shù)據(jù),但完美的全樣本大數(shù)據(jù)在法律計(jì)算時(shí)并不多見,因而計(jì)算法律的實(shí)踐或許還會遭遇一定的數(shù)據(jù)質(zhì)量難題。

        三、前路漫漫:計(jì)算法學(xué)的春天會到來嗎?

        計(jì)算法學(xué)的出現(xiàn)使得學(xué)界甚至資本都摩拳擦掌,一時(shí)間“計(jì)算法學(xué)”變得炙手可熱,冠以“計(jì)算法學(xué)研究”“計(jì)算法學(xué)方法”“計(jì)算法學(xué)技術(shù)”的成果開始涌現(xiàn)。在筆者看來,此種熱鬧繁榮的景象并非意味著計(jì)算法學(xué)即將步入正軌。恰好相反,計(jì)算法學(xué)還需經(jīng)歷漫長的實(shí)踐探索。雖然機(jī)器學(xué)習(xí)已經(jīng)應(yīng)用于法律計(jì)算和法律實(shí)證研究,機(jī)器學(xué)習(xí)對法律的計(jì)算效果或許具有積極意義,但是也存在一定的局限性。從積極層面而言,使用機(jī)器學(xué)習(xí)方法對法律經(jīng)驗(yàn)數(shù)據(jù)的分析,可以獲得一種數(shù)據(jù)擬合性較高的回歸分析結(jié)果,能夠客觀揭示復(fù)雜法律實(shí)踐之間所蘊(yùn)含的法律運(yùn)行規(guī)律,從而改變了傳統(tǒng)依據(jù)主觀先驗(yàn)式經(jīng)驗(yàn),通過法律邏輯推理并且創(chuàng)造法學(xué)理論的傳統(tǒng)法學(xué)知識生產(chǎn)方式。(44)參見左衛(wèi)民、王嬋媛:《基于裁判文書網(wǎng)的大數(shù)據(jù)法律研究:反思與前瞻》,載《華東政法大學(xué)學(xué)報(bào)》2020年第2期,第64-76頁。這有助于我們發(fā)現(xiàn)立法與實(shí)踐的悖反之處,將法律中的模糊表達(dá)量化為具有客觀參考價(jià)值的法律數(shù)據(jù)。(45)參見張妮、蒲亦非:《計(jì)量法學(xué)、計(jì)算法學(xué)到認(rèn)知法學(xué)的演進(jìn)》,載《四川大學(xué)學(xué)報(bào)(自然科學(xué)版)》2021年第2期,第1-3頁。此外,這種方法還可以揭示從前我們可能無從獲知的某些法律實(shí)踐之間存在事實(shí)上的相關(guān)性與關(guān)聯(lián)程度,(46)通過量化法律數(shù)據(jù)可以進(jìn)行因果推斷的方法包括:實(shí)驗(yàn)、斷點(diǎn)回歸、雙重差分、工具變量、配對、事件研究法。參見張永?。骸读炕蓪?shí)證研究的因果革命》,載《中國法律評論》2019年第2期,第136-141頁。并且在條件相同的情形下,機(jī)器學(xué)習(xí)算法將始終給出相同的答案,從而能夠減少法律系統(tǒng)內(nèi)部所存在的主觀盲目性,遏制法官因行使自由裁量權(quán)導(dǎo)致的錯(cuò)誤。(47)決策樹與隨機(jī)森林的原理論析參見同前注〔25〕,漢娜·弗萊書,第59-63頁。

        然而,機(jī)器學(xué)習(xí)對法律的計(jì)算并不是一種“全方位、無死角”的計(jì)算,使用機(jī)器學(xué)習(xí)的法律計(jì)算存在兩方面的局限性。一方面,機(jī)器學(xué)習(xí)的法律計(jì)算僅僅是一種依托歷史數(shù)據(jù)的“預(yù)測”,僅能發(fā)現(xiàn)法律世界的“相關(guān)性”,難以解釋法律世界中的“因果律”。使用機(jī)器學(xué)習(xí)方法對法律結(jié)果的“預(yù)測”,其作用主要是發(fā)現(xiàn)各類影響因子、作用因素與法律實(shí)踐現(xiàn)象之間的相關(guān)性。當(dāng)然,法官的司法決策過程涉及大前提(法律規(guī)則)、小前提(法律事實(shí))和法律結(jié)果的“三段論”推理過程,此類決策推理是一種“反事實(shí)推理”的過程。即便是法律數(shù)據(jù)擬合度很高的機(jī)器學(xué)習(xí)“模型訓(xùn)練”也僅是一種相關(guān)性分析,對于需要“反事實(shí)推理”得出法律的因果推斷過程,機(jī)器學(xué)習(xí)方法尚處于“知其然,而不知其所以然”的階段。單純的機(jī)器學(xué)習(xí)方法本身可能難以直接發(fā)現(xiàn)因果關(guān)系,揭示現(xiàn)象背后更深層次法律實(shí)踐之“因果律”。

        另一方面,機(jī)器學(xué)習(xí)的法律計(jì)算難以充分把握、模擬人類的思維和意識。法律人的決策推理過程、決策結(jié)果往往與機(jī)器學(xué)習(xí)的法律現(xiàn)象預(yù)測具有明顯差異,這在復(fù)雜案件中更是如此。有研究就指出,“人類區(qū)別于其它靈長類動(dòng)物的典型特征即是擁有意識”。(48)[法]斯坦尼斯拉斯·迪昂:《腦與意識:破解人類思維之迷》,章熠譯,浙江教育出版社2018年版,第293-296頁。由“硅元素”組成 的計(jì)算機(jī)能否如同由“碳基”組成的人類那般擁有意識,像人類那樣思考?這一直是人工智能界與哲學(xué)界爭議不休的話題。(49)相關(guān)爭議問題參見周昌樂、劉江偉:《機(jī)器能否擁有意識——機(jī)器意識研究及其意向性分析》,載《廈門大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版)》2011年第1期,第1-21頁。計(jì)算機(jī)技術(shù)的先驅(qū)阿蘭·麥席森·圖靈在進(jìn)行“圖靈測試”時(shí),也有意或無意地回避機(jī)器是否具備意識的問題。姑且不論前述爭議的結(jié)局如何,法律人的思維推理模式與機(jī)器學(xué)習(xí)的計(jì)算之間始終存在“隔閡”,而這些不同是人類的自然基礎(chǔ)不同于機(jī)器所決定的。如法律人決策與推理的過程往往涉及無罪推定、排除合理懷疑、內(nèi)心確信等帶有人類主觀評價(jià)色彩的復(fù)雜概念,許多無法量化輸入、客觀認(rèn)知的法律知識,恐怕難以被尚不具備人類思考和意識的計(jì)算機(jī)理解。即便理論上使用“強(qiáng)化學(xué)習(xí)”的方法可應(yīng)對沒有歷史數(shù)據(jù)輸入的學(xué)習(xí)場景,但是此類學(xué)習(xí)方法還處于“有多少人工,方有多少智能”的尷尬局面。(50)參見同前注〔13〕,左衛(wèi)民文,第22頁。因此,它自然就難以勝任對主觀性法律概念的理解和把握。

        實(shí)際上,感知領(lǐng)域才是機(jī)器學(xué)習(xí)與人工智能技術(shù)主要突破的方向,圖像識別、語音轉(zhuǎn)化是人工智能技術(shù)的主要應(yīng)用場景,如人臉識別技術(shù)、自動(dòng)駕駛、棋類(AlphaGo)游戲是其主要應(yīng)用成果。(51)參見[法]楊立昆:《科學(xué)之路:人、機(jī)器與未來當(dāng)機(jī)器思考時(shí),人類會怎樣?》,李皓、馬躍譯,中信出版集團(tuán)股份有限公司2021年版,第266-270頁。這在相當(dāng)程度上是一種基于歷史經(jīng)驗(yàn)數(shù)據(jù)、對客觀物體的感知技術(shù)。相比機(jī)器學(xué)習(xí)面對單一客觀關(guān)系的“預(yù)測”結(jié)果,法律人決策面對的更多是未來不確定性的主觀性法律關(guān)系,復(fù)雜的人類法律決策夾雜人類常識、情感與主觀價(jià)值判斷等因素,機(jī)器學(xué)習(xí)等人工智能技術(shù)是一種“站在第三人”視角觀察現(xiàn)象、總結(jié)規(guī)律、建立理論的方法,實(shí)際上難以模仿和學(xué)習(xí)人類常識和主觀性認(rèn)知,更不擅長模擬法律人的決策與內(nèi)心推理過程,(52)參見同上注,第12頁。至少在復(fù)雜案件中難以模擬、超越人的決策機(jī)制的效果。相比人類意識和人類大腦所具備的“自監(jiān)督學(xué)習(xí)”機(jī)制,機(jī)器學(xué)習(xí)方法在法律的預(yù)測能力、學(xué)習(xí)效率、成本收益方面不盡如人意。目前,最先進(jìn)的人工智能系統(tǒng)可能還不如一只貓聰明,貓的大腦有大約7.6億個(gè)神經(jīng)元和1萬億個(gè)突觸,人腦則具有860億個(gè)神經(jīng)元但功耗僅為25瓦。人腦的計(jì)算量大約是每秒可執(zhí)行1.5×1018次計(jì)算,現(xiàn)在一塊GPU每秒可執(zhí)行1013次計(jì)算,功耗約為250瓦。為了達(dá)到人腦的計(jì)算能力,必須將10萬處理器鏈接并且至少消耗25兆瓦的巨型計(jì)算機(jī)才能實(shí)現(xiàn)。前述能耗是人腦消耗的100萬倍。(53)參見同上注,第264頁。即便未來機(jī)器的處理能力變得同人類一般強(qiáng)大,但是機(jī)器是否也具備人類基于生理的共情能力仍然未知。況且,法律人的決策過程實(shí)際上是對未來不確定性法律關(guān)系的評判,而非簡單基于已知法律數(shù)據(jù)的“預(yù)測”,這其中的差異也決定了機(jī)器學(xué)習(xí)方法與當(dāng)前開發(fā)出的人工智能技術(shù)并不擅長模擬人類常識和邏輯推理過程。(54)參見同上注,第271-274頁??傊?,計(jì)算機(jī)難以深度介入與模仿法律人的決策。

        面對法律計(jì)算的上述局限,尚處于學(xué)科凝練與基礎(chǔ)建構(gòu)階段的計(jì)算法學(xué),需要在未來理清學(xué)科發(fā)展脈絡(luò),突破發(fā)展進(jìn)程中的困難與瓶頸。

        第一,結(jié)合我國法律數(shù)據(jù)的“本土資源”,探索可行的法律計(jì)算思路與機(jī)器學(xué)習(xí)方法。當(dāng)前, 我國裁判文書、檢察文書的公開已初具規(guī)模,各類司法文書的電子化與法律運(yùn)作過程的數(shù)據(jù)化正在成為現(xiàn)實(shí)。但是,可公開獲取裁判文書所呈現(xiàn)的內(nèi)容往往只是法官自由心證的結(jié)果及其支撐裁判結(jié)果的材料及理由。這類數(shù)據(jù)可能已受到人類選擇性認(rèn)知的影響,(55)有關(guān)選擇性認(rèn)知影響的相關(guān)論述,參見[美]斯科特·普勞斯:《決策與判斷》,施俊琦、王星譯,人民郵電出版社2004年版,第14頁。難以全面展現(xiàn)裁判結(jié)果形成的完整過程與全部考量因素。真實(shí)法律世界的某些部分包括重要而“隱秘”的部分是可獲得的法律數(shù)據(jù)尚未充分反映的。(56)參見左衛(wèi)民:《實(shí)證研究:中國法學(xué)的范式轉(zhuǎn)型》,法律出版社2019年版,第25-26頁。即便是從司法機(jī)關(guān)內(nèi)部獲取的法律數(shù)據(jù),因其數(shù)據(jù)本身主要滿足訴訟管理之需要,還不能完全呈現(xiàn)司法實(shí)踐的全貌,更難以充分滿足精確計(jì)算法律的需要??偟膩碚f,我國所公開的司法數(shù)據(jù)大多是一種結(jié)果性材料,對于研究一些諸如司法人員推理、決策等過程性問題的作用相當(dāng)有限。據(jù)此,計(jì)算法學(xué)的未來發(fā)展,一方面需要吸收、借鑒域外實(shí)證研究中既有的機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等計(jì)算機(jī)技術(shù)與方法,結(jié)合本土法律數(shù)據(jù),探索有效的法律計(jì)算思路與機(jī)器學(xué)習(xí)方法,促進(jìn)中國計(jì)算法學(xué)的落地實(shí)施;另一方面,需要不斷擴(kuò)寬法律數(shù)據(jù)的來源渠道,客觀記錄司法實(shí)踐的運(yùn)行過程,保障法律數(shù)據(jù)來源渠道、形成過程與經(jīng)驗(yàn)現(xiàn)象產(chǎn)生的真實(shí)性,為計(jì)算法學(xué)的繁榮奠定數(shù)據(jù)基礎(chǔ)。

        第二,計(jì)算法學(xué)應(yīng)致力在更多問題、更廣闊領(lǐng)域內(nèi),探索、應(yīng)用機(jī)器學(xué)習(xí),并與傳統(tǒng)法律實(shí)證研究以及其他研究方法共同揭示法律實(shí)踐規(guī)律與匡正法學(xué)理論。作為法律實(shí)證研究的衍生和拓展,計(jì)算法學(xué)同樣以法律實(shí)踐的經(jīng)驗(yàn)現(xiàn)象作為理論關(guān)切點(diǎn),通過收集、整理、分析和應(yīng)用數(shù)據(jù),嘗試使用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)的相關(guān)知識進(jìn)行相關(guān)研究。(57)參見左衛(wèi)民:《一場新的范式革命?——解讀中國法律實(shí)證研究》,載《清華法學(xué)》2017年第3期,第45-61頁。計(jì)算法學(xué)運(yùn)用機(jī)器學(xué)習(xí)方法進(jìn)行法律結(jié)果“預(yù)測”,是一種數(shù)據(jù)擬合程度較高的相關(guān)性分析,在相當(dāng)程度上也是統(tǒng)計(jì)學(xué)知識與方法的實(shí)踐應(yīng)用。相比傳統(tǒng)的法律實(shí)證研究,充分使用機(jī)器學(xué)習(xí)方法的計(jì)算法學(xué)或者說“未來版的實(shí)證研究”將倡導(dǎo)使用決策樹、隨機(jī)森林、梯度提升算法、神經(jīng)網(wǎng)絡(luò)架構(gòu)等機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法來分析法律關(guān)系,(58)參見張妮、蒲亦非:《計(jì)算法學(xué):一門新興學(xué)科交叉分支》,載《四川大學(xué)學(xué)報(bào)(自然科學(xué)版)》2019年第6期,第1187頁。從而更有利于在大量散亂分布的法律數(shù)據(jù)中發(fā)現(xiàn)零散數(shù)據(jù)之間的相關(guān)性與關(guān)聯(lián)程度,最終發(fā)現(xiàn)司法實(shí)踐或法律事件的發(fā)展或運(yùn)行規(guī)律。同時(shí),為了彌補(bǔ)機(jī)器學(xué)習(xí)方法在“因果推斷”領(lǐng)域的缺憾,歸納法律現(xiàn)象背后的內(nèi)在規(guī)律與成因,還需要?jiǎng)?chuàng)新傳統(tǒng)的實(shí)證研究方法,這主要是使用諸如隨機(jī)實(shí)驗(yàn)、斷點(diǎn)回歸、雙重差分、工具變量等方法,在實(shí)驗(yàn)室條件下或者隨機(jī)田野試驗(yàn)的條件下不斷探索法律規(guī)范、法律政策與法律實(shí)踐之間的“因果律”。如2021年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主書亞·安格里斯特(Joshua D Angrist)和吉多·因本斯(Guido W Imbens)的貢獻(xiàn)即在于對因果關(guān)系分析方法的創(chuàng)新,即使用“自然實(shí)驗(yàn)”來模仿隨機(jī)控制實(shí)驗(yàn),評估反事實(shí)結(jié)果從而推斷經(jīng)濟(jì)變量之間的因果關(guān)系。(59)參見李寶良、郭其友:《因果關(guān)系評估的準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)與實(shí)證經(jīng)濟(jì)學(xué)的可信性革命——2021年度諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主主要經(jīng)濟(jì)理論貢獻(xiàn)述評》,載《外國經(jīng)濟(jì)與管理》2021年第11期,第140-152頁。2019年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)阿比吉特·班納吉(Abhijit V.Banerjee)、埃斯特·迪弗洛(Esther Duflo)、邁克爾·克雷默(Michael Kremer)在“減輕全球貧困方面的實(shí)驗(yàn)性方法”作出了杰出貢獻(xiàn),發(fā)現(xiàn)了全球貧困原理以及各種扶貧政策的因果效用。(60)相關(guān)方法與原理論析參見易紅梅:《減少全球貧困的實(shí)驗(yàn)性方法——2019年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主的貢獻(xiàn)與評析》,載《中央財(cái)經(jīng)大學(xué)學(xué)報(bào)》2019年第12期,第134-140頁。前述方法對于判斷法律規(guī)范與實(shí)踐之間的因果關(guān)系具有啟發(fā)和借鑒意義。因此,未來實(shí)證研究還應(yīng)持續(xù)探索隨機(jī)試驗(yàn)、雙重差分、工具變量等統(tǒng)計(jì)學(xué)的因果推斷方法,從而形成各類揭示“因果關(guān)系”的成熟方法。

        換言之,使用機(jī)器學(xué)習(xí)方法的計(jì)算法學(xué)出現(xiàn)或許將會為我們帶來觀察法律現(xiàn)象的全新方法,但是我們更應(yīng)理性看待其未來發(fā)展:既不能高估機(jī)器學(xué)習(xí)方法所帶來的法律預(yù)測能力,也不能低估不斷發(fā)展的統(tǒng)計(jì)學(xué)理論與方法在主流實(shí)證研究中的獨(dú)特魅力與價(jià)值,更不能忽視結(jié)合統(tǒng)計(jì)和計(jì)算的實(shí)證研究與機(jī)器學(xué)習(xí)在發(fā)現(xiàn)法律實(shí)踐規(guī)律方面的貢獻(xiàn)。無論如何,現(xiàn)階段我們需要更多地夯實(shí)法律研究的“計(jì)算能力”,正確認(rèn)識法律數(shù)據(jù)的欠缺性與機(jī)器學(xué)習(xí)法律計(jì)算的局限性,培養(yǎng)具備交叉學(xué)科背景的法律計(jì)算人才,摸索可應(yīng)用于中國法律數(shù)據(jù)的計(jì)算思路與計(jì)算方法,打造中國計(jì)算法學(xué)的“拳頭產(chǎn)品”。嘗試并推進(jìn)以實(shí)證研究方法為底色的計(jì)算法學(xué)學(xué)科建設(shè),促進(jìn)計(jì)算法學(xué)研究的落地生根,將是未來中國新型法律人的責(zé)任與使命。計(jì)算法學(xué)的春天已經(jīng)來臨了嗎?就讓未來告訴未來吧。

        猜你喜歡
        決策樹法學(xué)機(jī)器
        機(jī)器狗
        機(jī)器狗
        《南大法學(xué)》征稿啟事
        《南大法學(xué)》征稿啟事
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        未來機(jī)器城
        電影(2018年8期)2018-09-21 08:00:06
        基于決策樹的出租車乘客出行目的識別
        法學(xué)
        新校長(2016年5期)2016-02-26 09:28:49
        無敵機(jī)器蛛
        亚洲男同志gay 片可播放| 国产熟女露脸91麻豆| 乱子轮熟睡1区| 亚洲av无码精品色午夜| 白浆出来无码视频在线| 国产三级在线观看高清| 中文字幕一区二区精品视频| 精品久久久久久无码人妻热| 国产黑丝在线| 亚洲国产日韩av一区二区| 亚洲乱码中文字幕视频| 免费人成网站在线观看欧美| 日韩精品成人一区二区三区| 国产亚洲曝欧美不卡精品| 久久中文字幕一区二区| 国产精品久久久久9999吃药| 国产精品麻豆最新AV| 日韩极品视频在线观看| 日韩有码中文字幕在线观看| 亚洲国产成人片在线观看无码| 亚洲欧美中文在线观看4| av在线男人的免费天堂| 日本不卡高字幕在线2019| 18禁裸男晨勃露j毛免费观看| 久久久久久一级毛片免费无遮挡| 亚洲美女一区二区三区三州| 色综合久久中文娱乐网| 97人妻熟女成人免费视频| 97久久成人国产精品免费| av黄色在线免费观看| 久久久久人妻精品一区蜜桃| 日韩国产成人精品视频| 亚洲av日韩精品一区二区| 97精品国产一区二区三区| 亚洲色偷偷色噜噜狠狠99| 国产三级在线观看性色av| 国产精品黑丝高跟在线粉嫩| 天堂а√在线中文在线新版| 亚洲成精品动漫久久精久| 极品美女调教喷水网站| 无码国产福利av私拍|