張瑞祥 趙志梟
摘? ?要:人工智能、大數(shù)據(jù)不僅重塑人類生活,也在重塑學(xué)術(shù)研究。當(dāng)前,計(jì)算社會(huì)科學(xué)、計(jì)算人文以至“計(jì)算X”正在如火如荼展開,計(jì)算法學(xué)由此應(yīng)運(yùn)而生。由于法學(xué)具有較強(qiáng)的實(shí)踐性,與計(jì)算相遇、相融的時(shí)間較早,在經(jīng)歷了計(jì)量法學(xué)、法律信息學(xué)等發(fā)展階段后,學(xué)術(shù)界往來反復(fù)地辯難,計(jì)算法學(xué)的相關(guān)概念逐漸被厘清,近年終于以計(jì)算法學(xué)學(xué)科的創(chuàng)立迎來重大突破。當(dāng)計(jì)算法學(xué)不再需要通過不斷為自己正名而具有學(xué)科支撐后,學(xué)界也將更加關(guān)注其實(shí)踐的有效性。為了呈現(xiàn)我國計(jì)算法學(xué)研究現(xiàn)狀,合理預(yù)測其發(fā)展前景,文章對近年計(jì)算法學(xué)相關(guān)中外論文進(jìn)行聚類分析,最終揭示計(jì)算法學(xué)在數(shù)據(jù)集、算法以及應(yīng)用等領(lǐng)域的重要成就,并闡釋其未來發(fā)展趨勢。
關(guān)鍵詞:計(jì)算法學(xué);人工智能;計(jì)算人文;算法;數(shù)據(jù)集
中圖分類號:D90? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?DOI:10.11968/tsyqb.1003-6938.2023005
Abstract Artificial intelligence and big data are reshaping not only human life but also academic research. Flourishing disciplines like computational social science, computational humanities, and "computational X" demonstrate this phenomenon. Computational Jurisprudence is also on the rise, as law has a strong practical aspect and has been intersecting with computation for a long time, going through various development stages such as Jurimetrics and Legal Informatics, and undergoing repeated debates in the academic community. The relevant concepts of Computational Jurisprudence have gradually been clarified, and with the establishment of the Computational Jurisprudence discipline in recent years, a major breakthrough has been achieved. With the support of a disciplinary foundation, Computational Jurisprudence no longer needs to constantly justify itself, and the academic community can now focus more on its practical effectiveness. To present the current research status of Computational Jurisprudence in China and predict its future prospects, a clustering analysis of recent domestic and foreign papers on Computational Jurisprudence was conducted. Finally, the important achievements of Computational Jurisprudence in the areas of data sets, algorithms, and applications were revealed, and future development trends were discussed.
Key words computational jurisprudence; artificial intelligence; computational humanities; algorithm; data set
隨著人工智能的不斷發(fā)展,人類社會(huì)與人工智能的聯(lián)系越來越緊密,法律作為現(xiàn)代人類社會(huì)治理的重要基石,其與人工智能的結(jié)合已是大勢所趨。將人工智能應(yīng)用到司法實(shí)踐,可以極大提升法律實(shí)施效率,為立法、司法提供參考和決策依據(jù)。而在法學(xué)研究中,隨著人工智能特別是ChatGPT等基于自然語言處理的標(biāo)志性產(chǎn)品推出,計(jì)算法學(xué)作為法學(xué)與計(jì)算跨學(xué)科結(jié)合的新方向和新方法,受到了進(jìn)一步的關(guān)注。計(jì)算法學(xué)也得益于計(jì)算社會(huì)科學(xué)與計(jì)算人文的長足進(jìn)步,“計(jì)算社會(huì)科學(xué)”這一名稱2009年在《科學(xué)》上被系統(tǒng)地提出并作了闡述[1]。在大數(shù)據(jù)迅猛發(fā)展的推動(dòng)下,數(shù)據(jù)驅(qū)動(dòng)、第四范式等研究模式在社會(huì)科學(xué)領(lǐng)域得到廣泛而深入地應(yīng)用。人文學(xué)科與計(jì)算相遇甚早,但是邁出的腳步卻遜于社會(huì)科學(xué),近年來,計(jì)算在人文學(xué)科研究中所扮演的角色越來越重要,主要表現(xiàn)就是“數(shù)字人文”崛起。對于以數(shù)據(jù)驅(qū)動(dòng)、人工智能為突出表現(xiàn)形式的人文社會(huì)科學(xué)新的研究內(nèi)容、領(lǐng)域和方法以及體系,黃水清等從問題定義、數(shù)據(jù)集構(gòu)建、技術(shù)實(shí)現(xiàn)、問題求解、結(jié)果評價(jià)及呈現(xiàn)等五個(gè)方面對這一人文社會(huì)科學(xué)的研究范式進(jìn)行了概括和總結(jié)[2-4]。在社會(huì)科學(xué)、人文科學(xué)與計(jì)算相融合的過程中,涌現(xiàn)出了計(jì)算人文、計(jì)算社會(huì)科學(xué)、數(shù)字人文、人文計(jì)算等相對宏觀而具有概括性的概念。但根據(jù)黃水清對人文社會(huì)科學(xué)與計(jì)算相融合的五個(gè)組成部分來看,“計(jì)算人文”這一概念在大數(shù)據(jù)、人工智能與人文研究融合的背景更加合理科學(xué)。法學(xué)既有人文科學(xué)屬性也有社會(huì)科學(xué)屬性,因此計(jì)算法學(xué)一定意義上也可以納入計(jì)算人文的學(xué)科體系,如針對法哲學(xué)、法律史等問題的計(jì)算人文研究,即是計(jì)算人文與計(jì)算社會(huì)科學(xué)學(xué)科相關(guān)性的具體呈現(xiàn)。不過,據(jù)分析計(jì)算法學(xué)[5]目前主要面向法律文檔的分析與計(jì)量,逐漸形成了包括海量判決書分析、自動(dòng)化法律推理、裁判文書推薦等獨(dú)具特色的研究方向[6-7]。
在人工智能蓬勃發(fā)展的時(shí)代背景下,通過梳理計(jì)算法學(xué)概念界定的過程,本文梳理了計(jì)算法學(xué)相關(guān)研究,并從數(shù)據(jù)、算法和具體應(yīng)用的角度對計(jì)算法學(xué)所取得的成就進(jìn)行總結(jié),進(jìn)而對人工智能視域下的計(jì)算法學(xué)發(fā)展趨勢進(jìn)行初步研判。
1? ?計(jì)算法學(xué)何以可能
在法學(xué)研究和實(shí)踐中使用計(jì)算方法并非新事物,20世紀(jì)40年代,西方計(jì)量法學(xué)(Jurimetrics)、法律信息學(xué)(Legal Informatics)就已經(jīng)出現(xiàn),而被稱之為學(xué)科的“計(jì)算法學(xué)”(Computational Jurisprudence)則是近十年來學(xué)術(shù)界才開始討論的話題,在人工智能、大數(shù)據(jù)技術(shù)興起和我國“新文科”建設(shè)的時(shí)代大背景下,傳統(tǒng)人文社會(huì)科學(xué)都將或主動(dòng)或被動(dòng)地接受數(shù)據(jù)化的洗禮,作為社會(huì)科學(xué)屬性尤為顯著的法學(xué)勢必首當(dāng)其沖。有鑒于此,計(jì)算法學(xué)在我國也迅速成為研究熱點(diǎn),涌現(xiàn)出了一大批成果,其中《計(jì)算法學(xué)導(dǎo)論》首先明確提出了計(jì)算法學(xué)概念[8],并對相關(guān)概念、發(fā)展史、實(shí)踐等做了充分論證。盡管有學(xué)者非常謹(jǐn)慎地承認(rèn)計(jì)算法學(xué)只是一種新的法學(xué)研究方法[5],但并未阻擋計(jì)算法學(xué)快速前進(jìn)的步伐。
從目前的發(fā)展趨勢看,我國法學(xué)界已經(jīng)非常積極主動(dòng)地探究法律實(shí)證研究、計(jì)算法學(xué)等相關(guān)問題。而有關(guān)計(jì)算法學(xué)的討論套用康德式的提法,可以表述為“計(jì)算法學(xué)何以可能”的問題,核心問題包括計(jì)算法學(xué)是什么(What)與計(jì)算法學(xué)如何計(jì)算(How)。
(1)計(jì)算法學(xué)是什么。通常展現(xiàn)為法學(xué)與計(jì)算機(jī)、信息技術(shù)相融合的發(fā)展史,由最初算法驅(qū)動(dòng)、數(shù)據(jù)驅(qū)動(dòng)的計(jì)量法學(xué)逐漸演變?yōu)閿?shù)據(jù)驅(qū)動(dòng)、算法驅(qū)動(dòng)與問題驅(qū)動(dòng)相平衡的新興交叉學(xué)科[9]。從學(xué)科門類看,計(jì)算法學(xué)仍然屬于實(shí)證法學(xué)的范疇,與法律實(shí)證研究一樣都是具有數(shù)據(jù)計(jì)算基礎(chǔ)的量化研究,而且“計(jì)算法學(xué)與法律實(shí)證研究在研究對象、研究方法和研究領(lǐng)域上相通,其本質(zhì)上是實(shí)證研究在新材料、新方法興起后的應(yīng)用與拓展?!鄙踔量梢哉f計(jì)算法學(xué)就是“法律實(shí)證研究的衍生或者2.0版本”[10]。當(dāng)然,計(jì)算法學(xué)并不是以數(shù)據(jù)計(jì)算取代傳統(tǒng)思辨、推理研究,而是借助大數(shù)據(jù)技術(shù)輔助和豐富法學(xué)研究和實(shí)踐。面對人工智能、大數(shù)據(jù)浪潮,沒有人會(huì)視而不見,法學(xué)界在計(jì)算和法學(xué)深度交匯融合的時(shí)代趨勢中,既熱情擁抱數(shù)據(jù)技術(shù)之長也冷靜思考發(fā)展之不足??紤]到我國現(xiàn)實(shí)情況,無論是法學(xué)研究還是實(shí)踐都離不開人的參與,但若只有人參與其中,效率和客觀性可能都得不到保證,相形之下大數(shù)據(jù)參與法學(xué)研究和實(shí)踐都更加高效而客觀。事實(shí)上,我國法學(xué)研究和實(shí)踐也的確具有大數(shù)據(jù)化傾向,可以說走向計(jì)算法學(xué)也將是大勢所趨[11]。
(2)計(jì)算法學(xué)如何計(jì)算。可以展開為三個(gè)問題:主體、對象和制度。首先,計(jì)算法學(xué)的主體并不僅是從事法學(xué)研究和實(shí)踐的人,法律和技術(shù)本身也構(gòu)成主體。計(jì)算法學(xué)的主體之一人要具有計(jì)算思維和跨學(xué)科思維[12],作為融合法學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)等跨學(xué)科研究,只有思維轉(zhuǎn)變才能推動(dòng)研究與實(shí)踐的實(shí)質(zhì)性進(jìn)步[13]。思維轉(zhuǎn)變的核心還包括承認(rèn)技術(shù)的主體地位,人工智能作為技術(shù)引起了學(xué)術(shù)界有關(guān)技術(shù)是否有意識(shí)、情感的哲學(xué)大討論,這個(gè)問題證實(shí)和證偽均有難度,但它對人的沖擊力乃至造成的危機(jī)感卻是實(shí)在的。因此,我們不妨?xí)呵覕R置這一問題,姑且從技術(shù)工具論轉(zhuǎn)向技術(shù)主體論,在實(shí)踐中檢驗(yàn)完善;其次,計(jì)算法學(xué)的對象即是數(shù)據(jù),不同于常規(guī)數(shù)據(jù)庫建設(shè),計(jì)算法學(xué)所需的數(shù)據(jù)是動(dòng)態(tài)變化的[10],而且與純學(xué)術(shù)研究不同,法律直接關(guān)系到國計(jì)民生。因此,計(jì)算法學(xué)數(shù)據(jù)源建設(shè)必然需要政府、研究機(jī)構(gòu)等多方同心同力;最后,計(jì)算法學(xué)的長足發(fā)展還需要頂層設(shè)計(jì)和制度保障,作為學(xué)科進(jìn)行建設(shè)非常有必要,而且計(jì)算法學(xué)作為學(xué)科加快發(fā)展建設(shè)也是順大勢而為,也有助于我國社會(huì)主義事業(yè)建設(shè)[14]。當(dāng)計(jì)算法學(xué)不再需要通過不斷為自己正名而具有學(xué)科支撐后,學(xué)界也將更加關(guān)注其實(shí)踐的有效性。
2? ?計(jì)算法學(xué)的發(fā)展
融合人工智能和法學(xué)的計(jì)算法學(xué)作為一門涉及多學(xué)科知識(shí)的綜合性交叉學(xué)科,其研究不能只看做人工智能與法學(xué)兩個(gè)領(lǐng)域知識(shí)的簡單堆砌,更重要的是人工智能與法學(xué)兩個(gè)學(xué)科的相互融合和促進(jìn)。從計(jì)量法學(xué)到計(jì)算法學(xué),并不是傳統(tǒng)法學(xué)研究的落寞,而是計(jì)算法學(xué)為傳統(tǒng)法學(xué)研究提供更多的道路和方法[15]。當(dāng)然計(jì)算法學(xué)美好廣闊的前景不會(huì)一帆風(fēng)順,其發(fā)展歷程也不是一蹴而就的,在法學(xué)研究和實(shí)踐中引入計(jì)算方法,到最終形成計(jì)算法學(xué)經(jīng)歷了多個(gè)階段。
鑒于法學(xué)的實(shí)踐維度,面對海量法律文書時(shí)人力顯得極其渺小,因此當(dāng)計(jì)算機(jī)出現(xiàn)后,法學(xué)界很快將其引入法律實(shí)踐。通過計(jì)算機(jī)建構(gòu)法律模型輔助法律判案,隨著20世紀(jì)70年代Buchanan和Headrick有關(guān)法律推理模型的可行性探討,標(biāo)志著計(jì)算法學(xué)作為法學(xué)學(xué)科研究分支的誕生[16]。之后越來越多的法學(xué)工作者將計(jì)算方法應(yīng)用到法律實(shí)踐中,用于提升法律案件處理的效率。而計(jì)算方法的大規(guī)模應(yīng)用,確實(shí)在短時(shí)間內(nèi)優(yōu)化了法律實(shí)踐工作,為司法、執(zhí)法、辯護(hù)提供了行之有效的輔助作用。無論是Deedma和Smith以加拿大法律案件為基礎(chǔ)構(gòu)建的專家斷案系統(tǒng)[17],還是Biedermann等使用貝葉斯網(wǎng)絡(luò)針對火災(zāi)事故的法醫(yī)調(diào)查[18-19],亦或是Riesen和Serpen在犯罪數(shù)據(jù)(NCVS)中引入貝葉斯信念網(wǎng)絡(luò)(BBN)以促進(jìn)自動(dòng)分析的方式向非專家表示復(fù)雜的數(shù)據(jù)集[20],均非常優(yōu)秀地使用計(jì)算方法解決法律問題。
在法律實(shí)踐具體層面之外,計(jì)算也為法學(xué)理論研究提供了新方法新思維,法理猶如法哲學(xué)是純思辨性的,但是法理基礎(chǔ)一旦成為共識(shí)進(jìn)而成為法律,那么其運(yùn)作如“依法治國”就要依靠法律進(jìn)行邏輯推理,而邏輯推理正是計(jì)算擅長的領(lǐng)域。在不借助計(jì)算以前,法律實(shí)踐全憑法官、律師個(gè)人的博學(xué)才智,但是法律實(shí)踐的規(guī)則仍然是依靠法條的邏輯推理。正如史學(xué)研究最理想的狀態(tài)是窮盡史料,法學(xué)研究和實(shí)踐同樣如此,因此海量法律文本的數(shù)據(jù)化和計(jì)算分析也逐漸成為法學(xué)研究熱點(diǎn)。Hamann等引入計(jì)算機(jī)輔助法律語言學(xué)作為一種半自動(dòng)化方法,通過系統(tǒng)地分析大量法律文本來“理解”法律話語,使用統(tǒng)計(jì)算法來分析大量文本滿足了律師對經(jīng)驗(yàn)數(shù)據(jù)日益增長的需求[21];Giacalone等基于司法判決評估的web數(shù)據(jù)構(gòu)建調(diào)查系統(tǒng),旨在通過文本挖掘技術(shù)提升法律實(shí)施效率,并進(jìn)一步構(gòu)建關(guān)于事實(shí)和判斷的智能系統(tǒng)[22],均是借助大數(shù)據(jù)計(jì)算方法輔助法律實(shí)踐的代表成果。事實(shí)上,計(jì)算方法不僅促進(jìn)了法律實(shí)踐的進(jìn)步,有研究表明,大數(shù)據(jù)技術(shù)對于處于發(fā)展初級階段的律師事務(wù)所亦有著非常重要的積極影響[23]。
人工智能、大數(shù)據(jù)、云計(jì)算等技術(shù)對于法律信息化的實(shí)施有著極大的推動(dòng)作用,通過現(xiàn)代計(jì)算技術(shù),可以加速推動(dòng)司法系統(tǒng)的完善,從而支持立法者對相關(guān)法律做出調(diào)整。與此同時(shí),人工智能的飛速發(fā)展帶來的法律、倫理道德等影響也成為法學(xué)研究的重要內(nèi)容,對于人工智能的監(jiān)管規(guī)范以及數(shù)據(jù)獲取過程中的信息問題亟待進(jìn)一步解決完善。在時(shí)代的浪潮下,人工智能與法律的融合已是必然,在不斷完善法律人工智能體系的同時(shí),法律對于人工智能的約束也應(yīng)放在重要地位。無論是國內(nèi)外有關(guān)計(jì)算法學(xué)的學(xué)科屬性的探討,還是對計(jì)算大數(shù)據(jù)的法律思考,都指向一個(gè)主題,那就是“為計(jì)算立法”。在計(jì)算法學(xué)發(fā)展的初期,學(xué)界主要關(guān)心甚至擔(dān)心數(shù)據(jù)化、信息化浪潮對于人類社會(huì)的挑戰(zhàn),更希望通過法律約束計(jì)算。正是在此時(shí)代背景下,20世紀(jì)末,周慶山看到社會(huì)信息化帶來的各種信息矛盾,提出了加強(qiáng)信息法學(xué)研究和教育的建議[24];馬海群和喬立春則通過對中國信息法律和信息立法研究的歷史、現(xiàn)狀、主要成果的考察,分析了中國信息法學(xué)的研究基礎(chǔ)、重點(diǎn)領(lǐng)域和研究缺陷,提出要明確信息法學(xué)學(xué)科歸屬,強(qiáng)化信息法學(xué)概念認(rèn)同,以解決綜合性現(xiàn)實(shí)問題為研究目的[25]。不過,隨著人工智能大數(shù)據(jù)的突飛猛進(jìn),尤其是國內(nèi)學(xué)界的認(rèn)知也從“挑戰(zhàn)”演變?yōu)椤皺C(jī)遇”,從警惕信息化的法律風(fēng)險(xiǎn)轉(zhuǎn)變?yōu)榻⒂?jì)算法學(xué)學(xué)科。國內(nèi)眾多學(xué)者[5,11,26-28]均做出了有益的嘗試,而曾赟則更進(jìn)一步,他基于科學(xué)研究的“第四種范式”(數(shù)據(jù)科學(xué))提出了“數(shù)據(jù)法學(xué)”[29]。
可以看到人工智能技術(shù)與法學(xué)研究的相互影響成就了當(dāng)前的計(jì)算法學(xué),計(jì)算法學(xué)的相關(guān)理論已經(jīng)獲得了法學(xué)、人工智能、計(jì)算機(jī)、數(shù)學(xué)等領(lǐng)域的廣泛認(rèn)可,這是計(jì)算社會(huì)科學(xué)的重大突破。與此同時(shí),國內(nèi)的相關(guān)研究則呈現(xiàn)出比較奇特的景象:一者國內(nèi)在計(jì)算法學(xué)的實(shí)踐應(yīng)用上,與國際相比仍然處于較為落后的階段;二者國內(nèi)計(jì)算法學(xué)制度設(shè)計(jì)的探討卻遙遙領(lǐng)先。這也是由我國實(shí)際情況決定的,就學(xué)術(shù)而言,計(jì)算法學(xué)需要法學(xué)領(lǐng)域和人工智能領(lǐng)域?qū)<业纳疃群献鳎挥腥绱瞬拍苷嬲龑?shí)現(xiàn)專業(yè)化突破;而在我國想要更快實(shí)現(xiàn)研究成果轉(zhuǎn)化,改革法律人才培養(yǎng)模式,讓計(jì)算法學(xué)切實(shí)改變法律社會(huì)的運(yùn)行模式,為全面依法治國服務(wù),就需要學(xué)科體制的支撐。所以當(dāng)西方法學(xué)界更多用力于即時(shí)的法律實(shí)踐研究時(shí),我們則更偏重于計(jì)算法學(xué)學(xué)科體制建設(shè)的討論。
當(dāng)然,計(jì)算法學(xué)的發(fā)展并不意味著傳統(tǒng)法學(xué)的落寞,恰恰相反,作為法學(xué)研究的分支,計(jì)算法學(xué)的發(fā)展為傳統(tǒng)法學(xué)開拓了前景,最新的人工智能技術(shù)讓法學(xué)研究能夠更加快捷地處理批量的法律數(shù)據(jù),從而更好地適應(yīng)新的時(shí)代變化。而這一趨勢正隨著國內(nèi)外學(xué)術(shù)交流相互促進(jìn),全球人工智能技術(shù)大會(huì)特設(shè)了“法律人工智能”專題、人工智能與法律國際會(huì)議、計(jì)算法學(xué)國際會(huì)議等均以穩(wěn)定的形式召開。在法律人工智能熱潮下,形而上學(xué)的冷思考也浮出水面,計(jì)算法學(xué)及其相關(guān)的人工智能法律、倫理道德、人類命運(yùn)等問題變得日益緊迫。毫無疑問,當(dāng)前人工智能技術(shù)與計(jì)算法學(xué)仍存在較大局限需要改進(jìn):一方面,現(xiàn)有技術(shù)仍然無法替代人的思考,僅在重復(fù)勞動(dòng)和知識(shí)儲(chǔ)備等方面表現(xiàn)突出,在提升計(jì)算法學(xué)與當(dāng)前社會(huì)兼容性方面的技術(shù)需要較大改進(jìn);另一方面,法律的主體仍然是人,目前來看,計(jì)算法學(xué)可以通過數(shù)據(jù)支持輔助決策,但法律的制定者、執(zhí)行者仍然是主體性的人。如果說計(jì)算法學(xué)的加入為法學(xué)研究增添了更多理性,那么人的參與就讓法學(xué)研究兼有理性與感性色彩,而“感性”恰恰是當(dāng)前人優(yōu)于人工智能的關(guān)鍵所在。
3? ?計(jì)算法學(xué)的數(shù)據(jù)、算法和應(yīng)用
2022年底,ChatGPT的橫空出世,讓人工智能進(jìn)入了一個(gè)新的階段,隨著人工智能的發(fā)展,社會(huì)各界與人工智能的聯(lián)系也越來越緊密,法律作為人類社會(huì)的伴生物,其與人工智能的結(jié)合已是大勢所趨。將人工智能應(yīng)用到司法實(shí)踐,可以極大提升法律實(shí)施效率,為立法者提供立法參考和決策依據(jù)。人工智能下的計(jì)算法學(xué)在法律領(lǐng)域的實(shí)踐主要包括三個(gè)方面:數(shù)據(jù)集的構(gòu)建、智能處理算法的研究、計(jì)算法學(xué)在法學(xué)領(lǐng)域的實(shí)踐應(yīng)用。
3.1? ? 計(jì)算法學(xué)的數(shù)據(jù)集
無論是傳統(tǒng)機(jī)器學(xué)習(xí)還是深度學(xué)習(xí),數(shù)據(jù)質(zhì)量都是影響模型、算法性能的重要因素。法律文本作為專業(yè)性較強(qiáng)的規(guī)范語言,法律文本數(shù)據(jù)集的構(gòu)建往往需要法律專家的參與。在現(xiàn)實(shí)研究中,不同研究團(tuán)隊(duì)的專業(yè)背景和社會(huì)資源不同,所以數(shù)據(jù)集構(gòu)建方法也有所不同。
在純手工標(biāo)注方面,Du等通過人工注釋的方法構(gòu)建了法律領(lǐng)域的第一個(gè)中文問答數(shù)據(jù)集(LawQA),用于評估模型的有效性[30]。Sharafat等基于巴基斯坦法院公開的判決數(shù)據(jù),編寫法律實(shí)體標(biāo)注指南,構(gòu)建了用于提取各種法律實(shí)體的標(biāo)注數(shù)據(jù)集,并使用條件隨機(jī)場(CRF)在數(shù)據(jù)集上進(jìn)行自動(dòng)命名實(shí)體識(shí)別[31]。Duan等提出了一個(gè)中文司法閱讀理解(CJRC)數(shù)據(jù)集,其中包含大約10000個(gè)法律文書和近50000個(gè)帶答案的問題,其中文書來自裁判文書,問題由法律專家批注,在該數(shù)據(jù)集上基于BERT和BiDAF構(gòu)建了兩個(gè)模型[32]。Ma等構(gòu)建了中國法律案例檢索數(shù)據(jù)集(LeCaRD),其中包含107個(gè)查詢案例和超過43,000個(gè)候選案例,查詢和結(jié)果采用中國最高人民法院公布的刑事案例。在相關(guān)性定義方面,提出了一系列判斷標(biāo)準(zhǔn),并由法律專家進(jìn)行相應(yīng)的候選案例標(biāo)注[33]。Urchs等基于德國32個(gè)法院的748131項(xiàng)判決,構(gòu)建了兩個(gè)德語法律文本語料庫,第一個(gè)語料庫為所有判決及其元數(shù)據(jù),第二個(gè)語料庫包含隨機(jī)抽取的200個(gè)判決文本,語料庫由法律專家進(jìn)行人工標(biāo)注[34]。
人工標(biāo)注可以獲得較為準(zhǔn)確的數(shù)據(jù)集,但也會(huì)耗費(fèi)大量的時(shí)間和資源,有一些學(xué)者通過半自動(dòng)化的方式構(gòu)建數(shù)據(jù)集。如Boonchom和Soonthornphisaj開發(fā)了一種蟻群算法用于自動(dòng)擴(kuò)展最初由法律專家創(chuàng)建的種子本體,基于繼承法和家庭法兩個(gè)種子本體,使用最高法院判決作為語料庫進(jìn)行擴(kuò)展,通過向本體中嵌入權(quán)重值,提升了建設(shè)系統(tǒng)的性能[35]。Chen等提出了一種半自動(dòng)化的機(jī)器學(xué)習(xí)框架用于大型數(shù)據(jù)集的數(shù)據(jù)增強(qiáng)和質(zhì)量評估,通過創(chuàng)建小量的初始語料庫,使用生成對抗網(wǎng)絡(luò)(GAN)進(jìn)行數(shù)據(jù)生成和增強(qiáng)[36]。
也有學(xué)者通過對已有信息進(jìn)行自動(dòng)化組織處理,構(gòu)建無標(biāo)注數(shù)據(jù)集,如Dydare和Lampach基于歐盟存續(xù)期間向歐洲法院移交案件的整個(gè)法院的地理坐標(biāo)構(gòu)建了法院地理坐標(biāo)數(shù)據(jù)集(GEOCOURT),用于探索跨時(shí)間、成員國和法院層級的空間差異和集群效應(yīng)[37]。Bradford等引入了兩個(gè)關(guān)于全球競爭法制度的數(shù)據(jù)集——競爭法數(shù)據(jù)集和比較競爭執(zhí)法數(shù)據(jù)集,數(shù)據(jù)涵蓋了1990年-2010年間的競爭法和相關(guān)競爭機(jī)構(gòu)數(shù)據(jù),提供了較為全面的競爭法圖景,為市場監(jiān)管的法律制度實(shí)證研究提供了基礎(chǔ)[38]。
數(shù)據(jù)集構(gòu)建是人工智能應(yīng)用于法律的第一步,在大數(shù)據(jù)時(shí)代下,雖然每天產(chǎn)生的數(shù)據(jù)量非常巨大,但其中大多為非結(jié)構(gòu)化、非專業(yè)化的數(shù)據(jù),難以應(yīng)用到法律領(lǐng)域研究。如何將零散的數(shù)據(jù)結(jié)構(gòu),形成可供研究使用的高質(zhì)量規(guī)范數(shù)據(jù)集,是當(dāng)前人工智能領(lǐng)域需要解決的問題。
3.2? ? 計(jì)算法學(xué)相關(guān)的算法
法律數(shù)據(jù)集的構(gòu)建為人工智能技術(shù)在法學(xué)領(lǐng)域的應(yīng)用提供了基礎(chǔ),由于法律文本的特殊性,往往需要對當(dāng)前的技術(shù)進(jìn)行優(yōu)化,針對不同類型的法律,使用不同的方法,在推動(dòng)法律智能處理技術(shù)發(fā)展的過程中,也完善了法律人工智能體系。
有些學(xué)者將多個(gè)模型進(jìn)行組合以提升模型性能,如周曉輝提出了一個(gè)基于隱式馬爾科夫的法律命名實(shí)體識(shí)別模型,使用多個(gè)HMM模型串聯(lián)對文本進(jìn)行由淺至深的實(shí)體識(shí)別,并利用搜索引擎識(shí)別并消解同義命名實(shí)體,從而完成針對法律文本的命名實(shí)體識(shí)別過程[39]。韓金波以故意殺人案和繼承案為切入點(diǎn),分析了故意殺人案與繼承案在樣本集中的差異,發(fā)現(xiàn)了繼承案樣本分布不均勻、樣本數(shù)量過小的問題,提出一種基于Siamese網(wǎng)絡(luò)和多核CNN模型相結(jié)合的案件判決區(qū)間預(yù)測模型Siamese-CNN[40]。張虎等分析了法律文書的事實(shí)描述和法條的具體司法解釋,提出了基于多模型融合的法條推薦方法,將不同參數(shù)的CNN或RNN通過概率相加的方式進(jìn)行融合,以達(dá)到模型互補(bǔ)的效果,提高法條推薦的準(zhǔn)確性[41]。Pande和Alam基于新西蘭就業(yè)局(NZERA)數(shù)據(jù)集,使用LDA結(jié)合RNN、CNN和CapsNet模型,首次進(jìn)行了就業(yè)相關(guān)的司法案件結(jié)果分析和預(yù)測,研究發(fā)現(xiàn),基于CapsNet的LDA模型具有最高的準(zhǔn)確性和一致性[42]。鄭潔等基于BERT模型,將法律知識(shí)與案情文本拼接,讓模型同時(shí)學(xué)習(xí)法律知識(shí)和文本信息的特征,并使用LSTM網(wǎng)絡(luò)對文本進(jìn)行分段建模,之后,結(jié)合三元組損失和基于對抗的對比損失共同訓(xùn)練模型,提升了相似案例匹配任務(wù)的準(zhǔn)確率[43]。
也有一部分學(xué)者嘗試在已有方法的基礎(chǔ)上,針對特定領(lǐng)域的法律問題進(jìn)行改良優(yōu)化,如楊超群等提出了一個(gè)基于法律事實(shí)的適用法條推薦模型,選取了刑事詐騙罪和民事離婚糾紛兩個(gè)案由的裁判文書數(shù)據(jù)集,使用FastText模型,基于遷移學(xué)習(xí)方法從預(yù)訓(xùn)練的通用詞向量出發(fā)訓(xùn)練法律詞向量,再以此為基礎(chǔ)進(jìn)行文本分類[45]。Vuong等提出了一種新的方法(SM-BERT-CR)用于解決法律案例檢索過程中的長文檔和相似度匹配問題,并提出一種自動(dòng)創(chuàng)建大型弱標(biāo)記數(shù)據(jù)集的方法,用于解決數(shù)據(jù)匱乏問題[45]。Juang等提出一種解決法律文章不平衡問題和判決缺失值問題的智能法律文章預(yù)測方案,通過向量相似度加權(quán)機(jī)制解決判決缺失值問題,通過權(quán)重共享和遷移學(xué)習(xí)解決法律文字不平衡問題[46]。Sovrano等基于法律語言在文本結(jié)構(gòu)和單詞方面的特殊性,將深度學(xué)習(xí)的準(zhǔn)確性與淺層學(xué)習(xí)處理少量數(shù)據(jù)的能力相結(jié)合,提出了一種可以在較小數(shù)據(jù)集上執(zhí)行較為準(zhǔn)確的分類或問答任務(wù)的新技術(shù)(SyntagmTuner)[47]。
過去幾年,基于BERT模型的文本分類和命名實(shí)體識(shí)別技術(shù)受到廣泛的關(guān)注,ChatGPT的誕生或許會(huì)改變自然語言處理的發(fā)展方向,讓更多人投身到文本生成的研究中,法律判決文本、律師辯護(hù)文本的自動(dòng)生成也存在一定的可能性。但有一點(diǎn)是肯定的,無論技術(shù)的發(fā)展方向是什么,其最終目的都要回歸現(xiàn)實(shí),推動(dòng)法律人工智能的發(fā)展,讓人工智能切實(shí)解決現(xiàn)實(shí)生活中的法律問題。
3.3? ? 計(jì)算法學(xué)領(lǐng)域的具體應(yīng)用
相較于針對某一特定任務(wù)的法律自然語言處理技術(shù),人工智能在法學(xué)領(lǐng)域的實(shí)際應(yīng)用要涉及更多的內(nèi)容和工作。其中主要包括:原始數(shù)據(jù)的獲取、數(shù)據(jù)集的構(gòu)建、算法的選擇和優(yōu)化、功能模塊的劃分、前端搭建等等。根據(jù)實(shí)現(xiàn)的功能和目標(biāo)用戶的不同主要可以分為:針對普通人的法律咨詢系統(tǒng)和針對專業(yè)人士的決策輔助系統(tǒng)。
在法律咨詢系統(tǒng)方面,王海亮基于對判決文書的挖掘分析,研究并構(gòu)建了法律咨詢系統(tǒng),基于Word2Vec詞向量技術(shù),提出了一種新型的文本表達(dá)形式(World2Vec_GL),系統(tǒng)還根據(jù)案件的困難指數(shù),提出了一種新的律師推薦方法,律師推薦、關(guān)鍵詞檢索、文書統(tǒng)計(jì)、文書推薦、信息抽取共同組成了該系統(tǒng)[48]。Seeam等探討了針對勞動(dòng)法和就業(yè)法的專家答疑系統(tǒng)的構(gòu)建,該系統(tǒng)基于機(jī)器學(xué)習(xí)技術(shù),通過Web頁面為用戶提供法律答疑,同時(shí),該系統(tǒng)配備的龐大知識(shí)庫使其能夠自行學(xué)習(xí)就業(yè)法相關(guān)知識(shí),可以通過對知識(shí)庫的及時(shí)更新保證系統(tǒng)的時(shí)效性[49]。
針對專業(yè)人士的輔助系統(tǒng)構(gòu)建往往需要法律專業(yè)人士的參與,Barros等基于監(jiān)督機(jī)器學(xué)習(xí)方法,通過文本提取、文本分析、數(shù)據(jù)標(biāo)注、機(jī)器學(xué)習(xí)的模式,將知識(shí)發(fā)現(xiàn)應(yīng)用于司法判決數(shù)據(jù)庫,提供了一個(gè)幫助律師以快速、可視化、探索性的方式獲取信息的應(yīng)用程序[50]。Mokanov介紹了Lexum實(shí)驗(yàn)團(tuán)隊(duì)在法律人工智能方面的優(yōu)勢和成果,Lexum基于CanII數(shù)據(jù)庫中數(shù)百萬份法律數(shù)據(jù)及其元數(shù)據(jù),結(jié)合蒙塔利爾大學(xué)算法研究所團(tuán)隊(duì)的技術(shù)經(jīng)驗(yàn),構(gòu)建了一個(gè)用于將事實(shí)推理到法律的應(yīng)用程序(Facts2Law),該程序可以為任何給定的文本預(yù)測最相關(guān)的法律來源[51]。Fernandes等構(gòu)建了一個(gè)法律判決系統(tǒng)以執(zhí)行上訴法院修改提取任務(wù),該系統(tǒng)基于法律文本信息提取相關(guān)研究,以巴西上訴法院的判決文本為語料庫,嘗試了多種機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法,并使用里約熱內(nèi)盧州上訴法院判例數(shù)據(jù)庫的公開數(shù)據(jù)構(gòu)建了Kauane Junior語料庫用于訓(xùn)練和評估系統(tǒng)[52]。
人工智能在法律實(shí)踐方面的未來是非常廣闊且潛力巨大的。當(dāng)然,完備、時(shí)效性強(qiáng)的數(shù)據(jù)和技術(shù)是人工智能更好地應(yīng)用到法律事件中的基礎(chǔ),在當(dāng)前這個(gè)信息和技術(shù)快速迭代的時(shí)代,系統(tǒng)的構(gòu)建固然重要,對系統(tǒng)的更新、維護(hù)也值得更多關(guān)注。我們也需要明白,在人工智能為律師、法官、個(gè)人提供便捷、高效服務(wù)的同時(shí),倫理、隱私問題也是不可避免的,如何讓人工智能戴著“鐐銬”起舞,需要從法律和人工智能雙重角度進(jìn)行深入探討。
4? ?計(jì)算法學(xué)的發(fā)展趨勢
從法律文本智能處理來看,國內(nèi)研究更加側(cè)重于法律文本分類,國外研究更加側(cè)重于法律文本特征提取。在技術(shù)發(fā)展方面,國外研究已經(jīng)開始重視基于少量樣本的訓(xùn)練方法,隨著研究的不斷發(fā)展,高質(zhì)量的可用數(shù)據(jù)集會(huì)愈加匱乏,確實(shí)有必要開辟一條新的“數(shù)據(jù)之路”;在實(shí)際應(yīng)用方面,國內(nèi)研究更加注重量刑、法律咨詢等案件預(yù)測相關(guān)內(nèi)容,國外研究對于人工智能輔佐數(shù)字取證更感興趣??偟膩碚f,人工智能技術(shù)在法律層面應(yīng)用即計(jì)算法學(xué)的進(jìn)一步發(fā)展離不開以下幾個(gè)方面的支持:
第一,高質(zhì)量、高標(biāo)準(zhǔn)的法律數(shù)據(jù)集。這可以說就是計(jì)算法學(xué)的“語料”,但由于法律既有極強(qiáng)的學(xué)理性,法律事件又需要極高的專業(yè)素養(yǎng),因此高質(zhì)量法律數(shù)據(jù)集的采集建設(shè)就需要法律專業(yè)人士和信息資源管理相關(guān)研究人員的通力合作。而在法律數(shù)據(jù)標(biāo)注層面,可以探索更多半監(jiān)督、弱監(jiān)督的數(shù)據(jù)標(biāo)注方法或者針對較小量樣本的訓(xùn)練模式。借鑒西方經(jīng)驗(yàn)和我國實(shí)際情況,高質(zhì)量法律數(shù)據(jù)集建設(shè)尤其離不開黨和政府的支持,不同于純理論研究,法律的應(yīng)用性較強(qiáng),除了學(xué)術(shù)研究成果外,法律事件中形成的法律數(shù)據(jù)就極其龐大,但這些數(shù)據(jù)各有所屬,其中人民法院、檢察院的法律數(shù)據(jù)尤為豐富,這也將是未來計(jì)算法學(xué)研究的重要素材。而且國內(nèi)除了有普通法還有“黨內(nèi)法規(guī)”[53],也是我黨治國理政的重要組成部分,這類數(shù)據(jù)若沒有黨和政府的支持,也將很難納入研究。
第二,在算法層面針對特定法律案例做出改進(jìn)優(yōu)化。人工智能ChatGPT掀起了生成式語言模型的熱潮,讓我們看到人工智能超乎想象的理解力和創(chuàng)造力,這樣的應(yīng)用也為法律文本的自動(dòng)生成技術(shù)提供了更加廣闊的前景?,F(xiàn)代法律在我國的研究和實(shí)踐時(shí)間還比較短,尤其是普通民眾對于法律的認(rèn)知度、認(rèn)可度還不夠,雖然經(jīng)歷了數(shù)十年的普法宣傳教育,但民眾真正需要法律支持的成本依然較高,這也客觀上阻礙了民眾對于法律的熱情,極不利于“全面依法治國”的推行??梢灶A(yù)見,法律自動(dòng)生成語言模型建設(shè)將極大降低民眾法律學(xué)習(xí)實(shí)踐的成本,也將極大降低司法、執(zhí)法成本。
第三,將理論與實(shí)際結(jié)合,實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn),將法律智能化相關(guān)技術(shù)應(yīng)用到現(xiàn)實(shí)生產(chǎn)生活中,通過在現(xiàn)實(shí)環(huán)境中的表現(xiàn)提出進(jìn)一步的改進(jìn)措施,逐步完善法律人工智能體系。在政府公權(quán)力的監(jiān)督下,還可以引入商業(yè)運(yùn)作模式,由政府、學(xué)者、商業(yè)、民眾等多方參與,在不斷訓(xùn)練的基礎(chǔ)上提高法律智能化水平,也可以讓法律真正起到維護(hù)國家社會(huì)安定、人民幸福安康的作用。
5? ?結(jié)語
高質(zhì)量法律數(shù)據(jù)集建設(shè)不同于相對穩(wěn)定的古籍?dāng)?shù)據(jù)庫,它具有動(dòng)態(tài)特性,既需要處理過往法律數(shù)據(jù),也面向不斷增加的法律數(shù)據(jù)。法律實(shí)踐是“理”與“情”的統(tǒng)一,在司法執(zhí)法過程中因?yàn)殡x不開人的參與,而人的主觀情感總難免摻雜其中。隨著計(jì)算法學(xué)深入研究提供的理論基礎(chǔ)不斷完善,人工智能技術(shù)實(shí)踐日臻成熟可靠,也許在不久的將來人工智能會(huì)在司法裁判中起到必要的輔助作用,從而規(guī)避因?yàn)槿说闹饔^情感帶來的主觀誤判。
但這一過程不是一蹴而就的,計(jì)算法學(xué)尚且處于起步階段。正如學(xué)者一再提醒,目前能做到發(fā)現(xiàn)法律中的“相關(guān)性”而難以解釋法律中的“因果律”。我們也應(yīng)看到人工智能憑借超乎人類想象的學(xué)習(xí)能力,以往觀念認(rèn)為人工智能很難充分掌握或模擬人的思維和意識(shí),但現(xiàn)在看來或許并不難實(shí)現(xiàn)。ChatGPT、百度的ERNIE Bot(文心一言)、復(fù)旦開發(fā)的MOSS等產(chǎn)品不斷刷新人們認(rèn)知,屆時(shí)我們可能最急迫的工作不再是探究人工智能與人的差異,法學(xué)研究和實(shí)踐中是否要或如何應(yīng)用人工智能,反而更需要注意的可能是還有什么是人工智能不能做的,進(jìn)而將進(jìn)一步考慮如何為人工智能立法。
參考文獻(xiàn):
[1]? David Lazer A P,Lada A,Sinan A,et al.Life in the network:the coming age of computational social science[J].Science,2009,323(5915):721-723.
[2]? 黃水清,劉瀏,王東波.計(jì)算人文的發(fā)展及展望[J].科技情報(bào)研究,2021,3(4):1-12.
[3]? 黃水清,劉瀏,王東波.國內(nèi)外數(shù)字人文研究進(jìn)展[J].情報(bào)學(xué)進(jìn)展,2022,14(1):50-84.
[4]? 黃水清.回歸人文:從人文計(jì)算到計(jì)算人文[N].社會(huì)科學(xué)報(bào), 2021-09-09(5).
[5]? 鄧矜婷,張建悅.計(jì)算法學(xué):作為一種新的法學(xué)研究方法[J].法學(xué),2019(4):104-122.
[6]? 申衛(wèi)星,劉云.法學(xué)研究新范式:計(jì)算法學(xué)的內(nèi)涵、范疇與方法[J].法學(xué)研究,2020,42(5):3-23.
[7]? 梁柱,沈思,葉文豪,等.基于結(jié)構(gòu)內(nèi)容特征的裁判文書自動(dòng)推薦研究[J].情報(bào)學(xué)報(bào),2022,41(2):167-175.
[8]? 張妮,蒲亦非.計(jì)算法學(xué)導(dǎo)論[M].成都:四川大學(xué)出版社,2015.
[9]? 于曉虹,王翔.大數(shù)據(jù)時(shí)代計(jì)算法學(xué)興起及其深層問題闡釋[J].現(xiàn)代法學(xué),2019(3):110-117.
[10]? 左衛(wèi)民.中國計(jì)算法學(xué)的未來:審思與前瞻[J].清華法學(xué),2022,16(3):196-208.
[11]? 錢寧峰.走向“計(jì)算法學(xué)”:大數(shù)據(jù)時(shí)代法學(xué)研究的選擇[J].東南大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2017,19(2):43-50,146.
[12]? 張妮,徐靜村.計(jì)算法學(xué):法律與人工智能的交叉研究[J].現(xiàn)代法學(xué),2019,41(6):77-90.
[13]? 辛巧巧.論人工智能時(shí)代的計(jì)算法學(xué)方法[J].人民論壇·學(xué)術(shù)前沿,2020,(18):120-123.
[14]? 于寅虎.加快計(jì)算法學(xué)學(xué)科建設(shè) 助力數(shù)字經(jīng)濟(jì)發(fā)展[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理.2023,42(1):1-3.
[15]? 張妮,蒲亦非.計(jì)量法學(xué)、計(jì)算法學(xué)到認(rèn)知法學(xué)的演進(jìn)[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,58(2):7-12.
[16]? Buchanan BG,Headrick TE.Some speculation about artificial intelligence and legal reasoning[J].Stan L Rev,1970,23:40.
[17]? Deedman C,Smith J.The nervous shock advisor:A legal expert system in case-based law[J].Operational Expert Systems in Canada,1991.
[18]? Biedermann A,Taroni F,Delemont O,et al.The evaluation of evidence in the forensic investigation of fire incidents(Part II):Practical examples of the use of Bayesian networks[J].Forensic Science International,2005,147(1):59-69.
[19]? Biedermann A,Taroni F,Delemont O,et al.The evaluation of evidence in the forensic investigation of fire incidents (Part I):an approach using Bayesian networks[J].Forensic Science International,2005,147(1):49-57.
[20]? Riesen M,Serpen G.Validation of a bayesian belief network representation for posterior probability calculations on national crime victimization survey[J].Artificial Intelligence and Law,2008,16:245-276.
[21]? Hamann H,Vogel F,Gauer I.Computer Assisted Legal Linguistics(CAL(2))[A].Bex F,Villata S.Legal Knowledge and Information Systems:294[C].Amsterdam:Ios Press,2016:195-198.
[22]? Giacalone M,Cusatelli C,Romano A,et al.Big Data and forensics:An innovative approach for a predictable jurisprudence[J].Information Sciences,2018,426:160-170.
[23]? 陳亮,郭佳雯,武建功,等.基于法計(jì)算學(xué)理論的人工智能輔助決策算法研究[J].華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2019(5):85-99.
[24]? 周慶山.面向21世紀(jì)的信息法學(xué)[J].情報(bào)理論與實(shí)踐,1998(1):10-13.
[25]? 馬海群,喬立春.論我國信息法學(xué)的研究基礎(chǔ)與學(xué)科建設(shè)[J].中國圖書館學(xué)報(bào),2001(1):16-20.
[26]? 張妮,蒲亦非.計(jì)算法學(xué):一門新興學(xué)科交叉分支[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,56(6):1187-1192.
[27]? 劉艷紅.人工智能法學(xué)研究的反智化批判[J].東方法學(xué),2019(5):119-126.
[28]? 左衛(wèi)民.熱與冷:中國法律人工智能的再思考[J].環(huán)球法律評論,2019,41(2):53-64.
[29]? 曾赟.第四種法學(xué)知識(shí)新形態(tài)——數(shù)據(jù)法學(xué)的研究定位[J].法制與社會(huì)發(fā)展,2023,29(1):41-59.
[30]? Du W,Li B,Yang M,et al.A Multi-Task Learning Approach for Answer Selection:A Study and a Chinese Law Dataset[A].Thirty-Third Aaai Conference on Artificial Intelligence/Thirty-First Innovative Applications of Artificial Intelligence Conference/Ninth Aaai Symposium on Educational Advances in Artificial Intelligence[C].Palo Alto:Assoc Advancement Artificial Intelligence,2019:9935-9936.
[31]? Sharafat S,Nasar Z,Jaffry SW.Data mining mining for smart legal systems[J].Computers & Electrical Engineering,2019,78:328-342.
[32]? Duan X,Wang B,Wang Z,et al.Cjrc:A reliable human-annotated benchmark dataset for chinese judicial reading comprehension[A].Chinese Computational Linguistics:18th China National Conference,CCL 2019[C].Kunming,China,Proceedings 18.Springer,2019:439-451.
[33]? Ma Y,Shao Y,Wu Y,et al.LeCaRD:A Legal Case Retrieval Dataset for Chinese Law System[A].Sigir21-Proceedings of the 44th International Acm Sigir Conference on Research and Development in Information Retrieval[C].New York:Assoc Computing Machinery,2021:2342-2348.
[34]? Urchs S,Mitrovic J,Granitzer M.Design and Implementation of German Legal Decision Corpora[A].Rocha AP,Steels L,VandenHerik J.Icaart:Proceedings of the 13th International Conference on Agents and Artificial Intelligence-Vol 2[C].Setubal:Scitepress,2021:515-521.
[35]? Boonchom V sit,Soonthornphisaj N.Thai Succession and Family Law Ontology Building Using Ant Colony Algorithm[A].Nakakoji K,Murakami Y,McCready E.New Frontiers in Artificial Intelligence:Vol 6284[C].Berlin:Springer-Verlag Berlin,2010:19-32.
[36]? Chen H,Pieptea LF,Ding J.Construction and Evaluation of a High-Quality Corpus for Legal Intelligence Using Semiautomated Approaches[J].Ieee Transactions on Reliability,2022,71(2):657-673.
[37]? Dyevre A,Lampach N.Subnational disparities in EU law use:exploring the GEOCOURT dataset[J].Journal of European Public Policy,2021,28(4):615-631.
[38]? Bradford A,Chilton AS,Megaw C,et al.Competition Law Gone Global:Introducing the Comparative Competition Law and Enforcement Datasets[J].Journal of Empirical Legal Studies,2019,16(2):411-443.
[39]? 周曉輝.基于隱式馬爾科夫模型的法律命名實(shí)體識(shí)別模型的設(shè)計(jì)與應(yīng)用[D].廣州:華南理工大學(xué),2017.
[40]? 韓金波.Siamese-CNN算法研究及其在法院裁判預(yù)測中的應(yīng)用[D].大連:大連理工大學(xué),2018.
[41]? 張虎,王鑫,王沖,等.面向法律裁判文書的法條推薦方法[J].計(jì)算機(jī)科學(xué),2019,46(9):211-215.
[42]? Pande R,Alam S.Predicting the outcome of judicial cases using semantic analysis[A].2020 Ieee Symposium Series on Computational Intelligence (ssci)[C].New York:Ieee,2020:1757-1761.
[43]? 鄭潔,黃輝,秦永彬.一種融合法律知識(shí)的相似案例匹配模型[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2022,6(7):99-106.
[44]? 楊超群,龐彥燕,嚴(yán)若冰,等.基于遷移學(xué)習(xí)的適用法條推薦模型[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,58(2):13-18.
[45]? Vuong YTH,Bui QM,Nguyen HT,et al.SM-BERT-CR:a deep learning approach for case law retrieval with supporting model[J].Artificial Intelligence and Law,2022.
[46]? Juang TY,Hsu CS,Chen YS,et al.A concurrent prediction of criminal law charge and sentence using twin convolutional neural networks[J].International Journal of Ad Hoc and Ubiquitous Computing,2022,41(1):29-43.
[47]? Sovrano F,Palmirani M,Vitali F.Combining shallow and deep learning approaches against data scarcity in legal domains[J].Government Information Quarterly,2022,39(3):101715.
[48]? 王海亮.基于文本挖掘的法律咨詢系統(tǒng)研究和實(shí)現(xiàn)[D].北京:北京化工大學(xué),2017.
[49]? Seeam P,Teckchandani N,Booneyad H,et al.Employment Law Expert System[A].2018 International Conference on Intelligent and Innovative Computing Applications (iconic)[C].New York:Ieee,2018:358-363.
[50]? Barros R,Peres A,Lorenzi F,et al.Case Law Analysis with Machine Learning in Brazilian Court[A].Mouhoub M,Sadaoui S,Mohamed OA,et al.Recent Trends and Future Technology in Applied Intelligence,Iea/Aie 2018:Vol 10868[C].Cham:Springer International Publishing Ag,2018:857-868.
[51]? Mokanov I.Facts2Law-Using Deep Learning to Provide a Legal Qualification to a Set of Facts[A].Araszkiewicz M,RodriguezDoncel V.Legal Knowledge and Information Systems (jurix 2019):Vol 322[C].Amsterdam:Ios Press,2019:247-250.
[52]? Fernandes WPD,Silva LJS,F(xiàn)rajhof IZ,et al.Appellate Court Modifications Extraction for Portuguese[J].Artificial Intelligence and Law,2020,28(3):327-360.
[53]? 夏錦文,張瑞祥.我國黨內(nèi)法規(guī)研究的文獻(xiàn)數(shù)據(jù)分析(1992-2021年)——基于核心期刊數(shù)據(jù)和內(nèi)容分析法[J].學(xué)海,2021(3):14-21.
作者簡介:張瑞祥,南京師范大學(xué)法學(xué)院博士研究生;趙志梟,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院碩士研究生。