關(guān)鍵詞:生成式人工智能 法律大語言模型 法律大數(shù)據(jù) 司法應(yīng)用 數(shù)據(jù)安全 法律科技
中圖分類號:DF0 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-4039-(2024)05-0057-73
一、問題的提出
法律大語言模型賦能司法,是指面向司法領(lǐng)域的生成式人工智能因其在法律語言理解、法律知識問答、法律預(yù)測和法律文本生成等領(lǐng)域表現(xiàn)突出,從而支持法律人進(jìn)行更高效和精準(zhǔn)的司法決策,為公眾提供智能化的法律咨詢服務(wù)等過程。與通用大語言模型相比,法律大語言模型具備更強(qiáng)大的法律大數(shù)據(jù)分析和處理能力,更專注于解決法律問題。在全球范圍內(nèi),大語言模型已經(jīng)在法律工作中展現(xiàn)出應(yīng)用價值。哥倫比亞法官在審理一起自閉癥兒童醫(yī)保案時使用了ChatGPT,這被認(rèn)為是“全球大語言模型審判第一案”。近期,英國發(fā)布了《人工智能司法人員使用指南》,為法官和書記員等司法人員使用人工智能提供指導(dǎo),該國也已有法官使用ChatGPT輔助生成了一起知識產(chǎn)權(quán)糾紛案件的裁判文書。我國蘇州市中級人民法院在國內(nèi)率先開展了生成式人工智能輔助辦案系統(tǒng)的試點建設(shè)工作。深圳市中級人民法院推出了全國首個司法審判垂直領(lǐng)域大模型。應(yīng)當(dāng)說,在當(dāng)前法律行業(yè)的需求推動下,大語言模型展現(xiàn)出了其在司法領(lǐng)域的強(qiáng)大潛力,使得法律大語言模型迅速成為領(lǐng)域大語言模型研發(fā)的主流方向之一。
然而,大語言模型的興起也引發(fā)了對其能力和適用性的誤解。美國紐約兩名律師向法院提交了六份由ChatGPT生成的司法判決,其中包含錯誤引用和生成不實的內(nèi)容。巴西一位聯(lián)邦法官因使用ChatGPT生成裁判文書出錯而受到國家司法委員會的審查。這類事件反映了大語言模型可能被不當(dāng)使用,導(dǎo)致其作用被過度夸大,造成了公眾期望與實際應(yīng)用效果之間的巨大鴻溝。這種誤解給大語言模型的研發(fā)和應(yīng)用帶來了巨大挑戰(zhàn),反而阻礙了其長遠(yuǎn)發(fā)展。在司法領(lǐng)域,生成式人工智能有廣闊的運用前景,如可用于法律文書的生成,甚至帶來裁判方式的變革。從技術(shù)邏輯來看,法律行業(yè)所強(qiáng)調(diào)的法律自然語言處理與法律內(nèi)容生成能力和大語言模型具有內(nèi)在邏輯的契合性。然而,有觀點認(rèn)為大語言模型的底層運作原理決定了它只是一款運算程序和機(jī)器學(xué)習(xí)模型,并不具有人類的自我意識和自由意志。人類決策是有意識的內(nèi)容生成,在規(guī)則理解、價值判斷和司法經(jīng)驗上反映著人類理性和法治人文精神,而機(jī)器則是依概率猜測的內(nèi)容生成,算法決策很難作出倫理道德善良風(fēng)俗和經(jīng)驗理性等方面的考量。因而,法律大語言模型有其能,亦有其所不能。為厘清大語言模型的功能和局限,需要從其開發(fā)原理著手,審視其技術(shù)優(yōu)勢與不足,由此明確大語言模型的適用場景,同時也辨別其無法勝任的領(lǐng)域。澄清大語言模型的應(yīng)用邊界能夠促進(jìn)其在合理的范圍內(nèi)被正確使用,從而最大限度發(fā)揮它的應(yīng)用潛能。
二、法律大語言模型的訓(xùn)練原理
法律大語言模型是基于通用大語言模型(如ChatGPT或通義千問等)的框架構(gòu)建的垂類大語言模型,它通過對法律大數(shù)據(jù)集(包括法律文書、司法案例和法律法規(guī)等)進(jìn)行二次訓(xùn)練和指令微調(diào)(又稱精調(diào)),并將專門的法律知識融入模型,最終形成了具備解決法律任務(wù)能力的生成式人工智能。通過分析各種開源大語言模型的訓(xùn)練方法,不難歸納出一個共性的模型訓(xùn)練框架。以“智海-錄問”法律大語言模型為例,法律大語言模型的訓(xùn)練過程可以概括為四個步驟。
1.步驟一:二次預(yù)訓(xùn)練
二次預(yù)訓(xùn)練的目標(biāo)是將通用大語言模型訓(xùn)練轉(zhuǎn)化為適用于司法領(lǐng)域的專業(yè)化模型。訓(xùn)練過程始于構(gòu)建包括法律法規(guī)、判例、法律文書等內(nèi)容的法律文本大數(shù)據(jù)。通過嚴(yán)格的數(shù)據(jù)清洗和去重工作,確保訓(xùn)練數(shù)據(jù)集的高度準(zhǔn)確性和一致性。隨后,采用句子嵌入技術(shù)將文本轉(zhuǎn)換為向量格式,以便機(jī)器捕獲語義層面的信息。在此基礎(chǔ)上,通過聚類算法對向量進(jìn)行分析,揭示文本中的模式、主題和關(guān)鍵詞。在預(yù)訓(xùn)練階段,選用深度雙向變換器模型(如Bert)或上下文敏感的詞嵌入模型(如ELMO)等深度學(xué)習(xí)模型,采用無監(jiān)督學(xué)習(xí)方法以增強(qiáng)機(jī)器對復(fù)雜語言結(jié)構(gòu)和術(shù)語的理解能力。二次預(yù)訓(xùn)練的方法提升了模型在司法領(lǐng)域中的性能, 使得模型具備處理專業(yè)法律文本大數(shù)據(jù)的能力,特別是在解析法律文書和案例時,能夠一定程度地理解法言法語。
2.步驟二:指令微調(diào)訓(xùn)練
為提高模型在處理法律任務(wù)時的性能,模型還需要進(jìn)行指令微調(diào)。首先,需要構(gòu)造一個微調(diào)數(shù)據(jù)集,這些數(shù)據(jù)集應(yīng)包含多樣化的法律指令,包括案情摘要、法律適用、罪名預(yù)測和刑期預(yù)測等多類法律任務(wù)。其次,利用二次預(yù)訓(xùn)練后的通用大語言模型來再生成與法律任務(wù)相關(guān)的指令。這一步驟旨在增強(qiáng)模型在不同法律問答場景下的應(yīng)對能力。通過對特定任務(wù)進(jìn)行指令微調(diào),可以有效提高模型在這些任務(wù)上的性能。在微調(diào)階段,需要對模型的關(guān)鍵參數(shù)和結(jié)構(gòu)進(jìn)行精細(xì)調(diào)整,以優(yōu)化模型的學(xué)習(xí)過程,使其適應(yīng)特定的法律問答任務(wù)。這包括調(diào)整學(xué)習(xí)率、選擇適合的優(yōu)化器以及定義合適的損失函數(shù)等。最后,在完成參數(shù)調(diào)整后,模型需繼續(xù)接受針對法律問答數(shù)據(jù)的訓(xùn)練。這一階段的訓(xùn)練將進(jìn)一步提升模型的語言理解能力,并使模型的權(quán)重向更適應(yīng)特定法律任務(wù)的方向轉(zhuǎn)變。
3.步驟三:檢索增強(qiáng)生成(RAG)
為增強(qiáng)輸出結(jié)果的可解釋性,法律大語言模型通常采用檢索增強(qiáng)生成的策略。該策略通過提供先驗知識作為輸入的上下文來增強(qiáng)大型語言模型的輸出。具體而言,檢索增強(qiáng)生成首先從法律知識庫中檢索出與提問相關(guān)的文本片段,然后大語言模型結(jié)合這些檢索到的文本片段生成更準(zhǔn)確和相關(guān)的回答。在這一方法中,構(gòu)建一個高質(zhì)量的法律知識庫至關(guān)重要。法律知識庫通過數(shù)據(jù)處理,將法律大數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一格式,并提取摘要和關(guān)鍵詞等信息,以便快速檢索。這一知識庫為大語言模型提供了必要的案例和法律法規(guī),幫助模型在生成回答時引用相關(guān)的法律知識。此外,為了提升大語言模型在復(fù)雜法律問答場景中的性能,還需要優(yōu)化知識檢索模型。通過機(jī)器學(xué)習(xí)訓(xùn)練檢索模型,可以提高其在關(guān)鍵詞匹配和語義相似度檢索方面的準(zhǔn)確性,從而確保檢索到的信息高相關(guān)且有用。
4.步驟四:多輪對話數(shù)據(jù)生成和測試評估
法律大語言模型訓(xùn)練的最后一步是模擬真實的法律問答場景, 采用人類反饋強(qiáng)化學(xué)習(xí)(RLHF)來增強(qiáng)模型在實際問答中的表現(xiàn)。這種模擬通過神經(jīng)會話模型進(jìn)行多輪對話實驗,以精確重現(xiàn)和測試模型在真實對話環(huán)境中的交互能力。在性能測試階段,模型通過專門設(shè)計的測試集進(jìn)行評估,量化其在案件信息抽取、法律文本摘要、法律檢索等法律任務(wù)中的表現(xiàn),并獲得準(zhǔn)確率和召回率等性能指標(biāo)。專家評估階段由領(lǐng)域?qū)<覝y試模型的輸出,目的是評估模型在實驗中和實際應(yīng)用中的可靠性和有效性,幫助驗證模型在現(xiàn)實情境中的適用性。最后階段是誤差分析,此過程包括識別和分類模型輸出中的錯誤(如邏輯或事實錯誤),并分析這些錯誤的原因,例如數(shù)據(jù)偏見或模型架構(gòu)限制等。誤差分析的目的是深入了解模型的局限,并為其下一步優(yōu)化和改進(jìn)提供指引。
綜上,法律大語言模型的訓(xùn)練過程可以概括如圖1所示。
三、法律大語言模型的技術(shù)優(yōu)缺點
法律大語言模型較傳統(tǒng)的法律人工智能有其技術(shù)優(yōu)缺點,分析它們對于厘清法律大語言模型的邊界有重要作用。大語言模型的優(yōu)點是其能夠勝任法律任務(wù)的直接原因,而缺點則限制了它在處理復(fù)雜法律問題上的能力。
(一)法律大語言模型的優(yōu)勢
1.高級自然語言處理能力
大語言模型通?;谏顚由窠?jīng)網(wǎng)絡(luò)架構(gòu),如Transformer模型,尤其是Bert和GPT深度學(xué)習(xí)架構(gòu)。這些模型通過自注意力機(jī)制,能夠捕捉文本的長距離依賴關(guān)系和復(fù)雜的語言結(jié)構(gòu),從而更有效地理解法律文本。在自然語言處理領(lǐng)域,大語言模型不僅能解碼句子結(jié)構(gòu),還能初步理解法律文本中的微妙語義和統(tǒng)計意義上的邏輯關(guān)系。經(jīng)過大規(guī)模數(shù)據(jù)的訓(xùn)練,這些模型甚至能夠理解法言法語的特征和法律文本的語義結(jié)構(gòu)。
2.超大規(guī)模數(shù)據(jù)處理能力
法律大語言模型需要運用法律大數(shù)據(jù)進(jìn)行二次訓(xùn)練,其因深層神經(jīng)網(wǎng)絡(luò)架構(gòu)而具備超大規(guī)模法律數(shù)據(jù)處理能力。大語言模型利用無監(jiān)督的學(xué)習(xí)方法從法律大數(shù)據(jù)中提取法律語言特征,再通過對特定的法律任務(wù)進(jìn)行微調(diào),從而提高在法律任務(wù)上的性能。大語言模型還被特別訓(xùn)練以適應(yīng)國際上不同法律體系的法律大數(shù)據(jù),以增強(qiáng)在多元法律體系中的通用能力。
3.司法領(lǐng)域的“通用性”能力
法律大語言模型繼承了其基礎(chǔ)大語言模型的“通用性”特點,使其能夠處理基礎(chǔ)模型所能勝任的文本生成任務(wù)。通過使用法律大數(shù)據(jù)進(jìn)行二次訓(xùn)練,大語言模型得以適應(yīng)并執(zhí)行多種法律任務(wù)。這種“通用性”賦予了它在處理新任務(wù)時的強(qiáng)大泛化能力,通過對特定法律數(shù)據(jù)的進(jìn)一步微調(diào)或再訓(xùn)練,模型能夠靈活適應(yīng)不同的法律問題。然而,需要注意的是,這種“通用性”主要適用于常見的法律任務(wù),并不能處理所有類型的法律任務(wù),尤其是復(fù)雜的法律任務(wù)。
4.基于提示詞的個性化問答能力
基于提示詞或指令(prompt)的問答機(jī)制允許使用者以自然語言形式提出問題,而模型則通過理解問題并迅速檢索相關(guān)信息來響應(yīng)。這種方式不僅讓使用者交互更加直觀和友好,還能夠根據(jù)使用者的交互歷史提供個性化體驗,引導(dǎo)使用者成為“提問工程師”。隨著個性化問答的頻次增加,大語言模型通過持續(xù)的學(xué)習(xí)和優(yōu)化,能夠更好地適應(yīng)使用者的個性化需求。
5.基于預(yù)測的文書生成能力
法律大語言模型運用自然語言處理和生成技術(shù)來分析和模仿不同類型法律文本的結(jié)構(gòu)和內(nèi)容。模型通過大規(guī)模的法律文本訓(xùn)練,掌握法律寫作的特定格式和慣用表達(dá)。這種訓(xùn)練涵蓋從基礎(chǔ)的詞匯學(xué)習(xí)到高級的語義理解,通過深入學(xué)習(xí)法律術(shù)語、格式和先例,能夠自動產(chǎn)生符合專業(yè)標(biāo)準(zhǔn)的訴狀、合同和判決書等法律文書。在生成法律文書時,模型會采用特定的策略來確保文本的準(zhǔn)確性和專業(yè)性,包括使用預(yù)先定義的模板,或根據(jù)先前案例和標(biāo)準(zhǔn)格式自動調(diào)整文本結(jié)構(gòu)。
(二)法律大語言模型的缺陷
1.法律知識的深度理解缺陷
bJrY0Noy7N4Mhan5EfpJwg==法律大語言模型善于歸納由法律大數(shù)據(jù)所得到的一般性法律知識, 但仍不能夠深度理解法律知識背后的真正含義。法律知識不僅是描述性的,更是規(guī)范性的。它不僅關(guān)乎法律應(yīng)該是什么,還關(guān)乎法律是如何運行的?!胺芍R表達(dá)的核心問題是法律解釋?!狈审w系包含非常復(fù)雜的知識體系,由法律概念、法律原則、法律規(guī)則、判例以及法律解釋所構(gòu)成。這些元素相互關(guān)聯(lián),構(gòu)成了一個密集的法律知識網(wǎng)絡(luò)。理解法律知識體系需要深入的法學(xué)專業(yè)學(xué)習(xí)和豐富的法律實踐經(jīng)驗。大語言模型擅長為法律人提供知識檢索和專家輔助決策,但是仍無法真正理解法律知識的含義,也難以解釋疑難案件裁判中所蘊含的法律知識?;诜审w系的開放性,法律知識不是靜態(tài)的,而是不斷變化和發(fā)展的。大語言模型的大數(shù)據(jù)學(xué)習(xí)方式顯然存在知識更新的滯后性,因而導(dǎo)致預(yù)測的結(jié)果失準(zhǔn)。
2.解釋和推理能力上的限制
法律大語言模型同樣受到通用大語言模型的可解釋性問題的影響,仍然無法對預(yù)測的結(jié)果作出合理的解釋。人工智能法官更像是一個難以說服的黑匣子權(quán)威,即使它確實通過在其司法“意見”中提供理由來模仿人類。大語言模型的算法模型類似于“黑箱”,其內(nèi)部決策過程對使用者來說不透明,很難確定算法如何以及為何作出特定的決策、建議或預(yù)測。法律問題可能具有高度的復(fù)雜性和模糊性,解決問題需要處理矛盾的證據(jù),評估不同的法律觀點,以及在不完全信息下作出合理的推斷。大語言模型在處理這些復(fù)雜和模糊情況時可能遇到困難,特別是在需要權(quán)衡多個相互沖突的法律原則或解釋含糊的法律條文時。而且,大語言模型的訓(xùn)練依賴于現(xiàn)有的數(shù)據(jù)集,其推斷和解釋主要基于已有數(shù)據(jù),這可能導(dǎo)致模型在處理未覆蓋或偏離訓(xùn)練數(shù)據(jù)集的新問題時,無法提供充分的解釋。
3.檢索增強(qiáng)(RAG)的局限性
法律大語言模型在使用檢索增強(qiáng)方法時存在顯著局限性,其生成結(jié)果高度依賴于檢索到的法律文本片段質(zhì)量。如果法律知識庫中的數(shù)據(jù)不完整、不準(zhǔn)確或不相關(guān),生成答案的質(zhì)量將顯著受影響。此外,不同來源的法律文本在語言風(fēng)格和術(shù)語使用上可能有所差異,模型在處理這些法律文本時,可能會產(chǎn)生混雜表達(dá),導(dǎo)致答案的連貫性問題。盡管檢索增強(qiáng)方法通過獲取外部知識庫中的相關(guān)信息增強(qiáng)了模型對司法領(lǐng)域知識的訪問能力,但這些信息主要用于補充生成模型的知識,而不是用于推理或邏輯分析。因此,檢索增強(qiáng)方法在知識豐富度上有所提升,但在知識推理方面仍有不足。知識庫的構(gòu)建需要高質(zhì)量的語料庫和精細(xì)的索引機(jī)制, 如果知識庫內(nèi)容不夠完善或索引機(jī)制存在問題,會影響檢索的精準(zhǔn)性,直接導(dǎo)致召回率和命中率降低,使模型的回答準(zhǔn)確率下降。
4.法律語境理解的局限性
法律語境在法律判斷中起著關(guān)鍵作用,如社會背景、文化、地域、時間,甚至是當(dāng)事人的心理狀態(tài)等。大語言模型在理解和分析這些多維因素上存在局限,因為模型通常依賴于可量化和明確的數(shù)據(jù),而這些語境因素往往難以被完全量化或明確界定。司法裁判不能忽略法律語境,尤其是在疑難案件中。大語言模型無法深入理解和分析案件中的模糊和非量化因素,如個人經(jīng)歷、心理狀態(tài)、文化信仰和地域特殊性等。司法裁判往往需要深入的洞察和細(xì)致的語境分析,這是當(dāng)前大語言模型難以完成的。只有結(jié)合法律人的專業(yè)知識和經(jīng)驗,才能更準(zhǔn)確地評估和解釋法律語境。
5.內(nèi)容生成的真實性限制
法律大語言模型無法保證生成完全準(zhǔn)確或與現(xiàn)實完全相符的信息,導(dǎo)致生成的內(nèi)容可能是虛構(gòu)或不符合事實的。其一,訓(xùn)練數(shù)據(jù)的不規(guī)范會導(dǎo)致生成內(nèi)容虛假。如果訓(xùn)練數(shù)據(jù)中包含了錯誤或失效的信息,那么模型在生成內(nèi)容時可能會復(fù)制這些錯誤,極可能產(chǎn)生錯誤的案例和法律法規(guī)。其二,偏見會導(dǎo)致生成的內(nèi)容不真實。人工智能會產(chǎn)生偏見,即便程序員沒有設(shè)置任何的偏見。大語言模型因為“涌現(xiàn)”屬性而出現(xiàn)設(shè)計者從未預(yù)料到的行為模式,這種能力會放大偏見所帶來的不真實結(jié)果。其三,創(chuàng)造性生成會引發(fā)“反噬”作用。大語言模型因其生成文本的特點而具備一定的“創(chuàng)造性”,然而,這種“創(chuàng)造性”極可能會創(chuàng)造完全虛構(gòu)的案例、事件或解釋,導(dǎo)致生成的內(nèi)容偏離事實或現(xiàn)實情況,尤其是在沒有足夠相關(guān)數(shù)據(jù)支撐的情況下。
四、法律大語言模型的司法應(yīng)用
法律大語言模型的司法應(yīng)用可以分為四個方面:(1) 法律語言理解是運用大語言模型對法律大數(shù)據(jù)進(jìn)行文本清洗、實體及其關(guān)系抽取、句法分析和語義分析之后,實現(xiàn)案例要素抽取、法律文本摘要、法律文書檢查和法律論證挖掘的應(yīng)用;(2)法律知識問答是運用大語言模型來增強(qiáng)檢索能力,從而回答法律法規(guī)、案件檢索和法律程序等問題的應(yīng)用;(3)法律預(yù)測是運用大語言模型來增強(qiáng)模式識別和結(jié)果預(yù)測的能力,實現(xiàn)判決結(jié)果預(yù)測、量刑預(yù)測和案情分析的應(yīng)用;(4)法律文本生成是運用大語言模型的“創(chuàng)造性”能力,根據(jù)需求輸出不同類型的法律文本。
(一)法律語言理解
1.案件要素抽取
大語言模型通過信息抽取技術(shù)從法律文本中精準(zhǔn)提取案件要素,輔助法律人聚焦案件的關(guān)鍵信息。信息抽取是通過實體識別技術(shù)來識別文本中的命名實體,既包括人物、地點、組織名等實體名稱,也包括證據(jù)識別、法律條款和判決結(jié)果等實質(zhì)信息。接著利用關(guān)系抽取技術(shù)進(jìn)一步抽取這些標(biāo)注實體之間的關(guān)聯(lián),揭示證據(jù)之間的相關(guān)性、雙方的訴辯陳述、案件的關(guān)鍵特征以及爭議焦點等,從而輔助判斷文本中隱含的案件事實。
2.法律文本摘要
法律文本摘要是對法律文本進(jìn)行歸納和總結(jié), 從中提取關(guān)鍵信息并形成精煉、準(zhǔn)確的內(nèi)容摘要。〔34&〕在數(shù)據(jù)預(yù)處理和特征提取階段,從清洗后的數(shù)據(jù)中提取合適的特征,而后選擇合適的深度學(xué)習(xí)模型來訓(xùn)練和優(yōu)化模型。在預(yù)測輸出階段,模型根據(jù)已訓(xùn)練的數(shù)據(jù)對新文本進(jìn)行預(yù)測并生成摘要。這個過程不僅涉及關(guān)鍵詞的提取和排序,還要將提取的信息轉(zhuǎn)化為連貫、簡潔的摘要文本。這樣生成的摘要既要覆蓋法律文書的核心內(nèi)容,同時也要保持原始信息的準(zhǔn)確性和完整性。
3.法律文書檢查
法律文書檢查是在給定文本中自動識別出語法、法律術(shù)語或法律規(guī)范的錯誤,并對錯誤進(jìn)行修正的應(yīng)用。法律文書檢查既檢查文本自身的語法,包括對字詞、句子、標(biāo)點和表述等進(jìn)行正確性和規(guī)范性檢查,對不符合語法規(guī)則的句子進(jìn)行提示和修正;還包含對待審核文本中的法律條款進(jìn)行詳細(xì)校驗,以識別與現(xiàn)行法律法規(guī)的相似性和差異。如果檢測到法律文本中的內(nèi)容與法律法規(guī)相矛盾,那么輸出結(jié)果會提出警示。
4.法律論證挖掘
法律論證挖掘?qū)W⒂趶姆晌谋局凶詣犹崛≌撟C,它包含了證據(jù)推理挖掘。它的主要任務(wù)是通過識別、分類和分析法律話語中的論證來自動檢測和還原文本中的論證結(jié)構(gòu)。法律論證挖掘的過程首先對法律文本中論證的基本單元(前提、結(jié)論和推論關(guān)系等)進(jìn)行精確標(biāo)記,并識別不同類型和結(jié)構(gòu)的法律論證。隨后,挖掘過程聚焦于識別文本中的論辯性成分,包括確定論辯性句子及其在文本中的起始位置。接著,使用神經(jīng)網(wǎng)絡(luò)算法識別論證間的關(guān)系,包括論點間的支持和攻擊關(guān)系。
(二)法律知識問答
1.法律法規(guī)問答
法律法規(guī)問答是一種以法律法規(guī)檢索為目標(biāo)的問答,既包括對法律法規(guī)自身的檢索,也包括對法律法規(guī)適用和解釋的問答。大語言模型首先分析提示詞中的關(guān)鍵詞,提取出問題的核心信息并理解搜索需求。隨后,在法律法規(guī)數(shù)據(jù)庫進(jìn)行全文搜索和關(guān)鍵詞匹配。大語言模型不僅檢索查詢的法律條文,還運用上下文分析技術(shù)理解查詢的深層含義及可能的法律解釋,再根據(jù)相關(guān)性、時效性等多種標(biāo)準(zhǔn)對結(jié)果進(jìn)行精確排序,評估每個檢索結(jié)果與查詢的相關(guān)性。檢索的輸出結(jié)果以法律條文的摘要或相關(guān)條款的解讀形式呈現(xiàn)給使用者。
2.法律程序問答
法律程序問答專注于提供與法律程序及其相關(guān)任務(wù)的解答,包括立案程序、起訴程序、受理程序和審理程序等。大語言模型通過在法律法規(guī)和案例大數(shù)據(jù)庫中的二次訓(xùn)練,具備了精確匹配法律程序相關(guān)法律法規(guī)和先例的能力。當(dāng)使用者發(fā)起關(guān)于法律程序的查詢請求時,大語言模型使用深度學(xué)習(xí)和語義分析算法定位最相關(guān)的法律信息, 并根據(jù)這些信息檢索最相關(guān)的法律程序并生成解決方案。法律程序問答的輸出結(jié)果通常表現(xiàn)為法律程序的流程說明、步驟指導(dǎo)或程序性條款解讀等。
3.類案檢索問答
類案檢索問答是一種面向案例的法律信息檢索方法,在數(shù)據(jù)庫中查找與案例具有法律上或事實上相似性的案例,推送類案的判決結(jié)果與適用的法律規(guī)則。大語言模型首先對使用者的檢索需求問題進(jìn)行分詞、詞性標(biāo)注和句法解析,進(jìn)而識別文本中的關(guān)鍵實體(如案由、當(dāng)事人和法律法規(guī)等)及其關(guān)系。隨后,通過信息檢索技術(shù)來創(chuàng)建對案件標(biāo)題、關(guān)鍵詞、引用法律條款等的索引,再采用布爾搜索或向量搜索等算法在案例數(shù)據(jù)庫中執(zhí)行搜索。大語言模型還可以根據(jù)新的檢索需求,通過提示詞數(shù)據(jù)分析來優(yōu)化搜索算法,提升搜索結(jié)果的精確性。
(三)法律預(yù)測
1.判決結(jié)果預(yù)測
判決結(jié)果預(yù)測是運用大語言模型的大數(shù)據(jù)推斷能力來預(yù)測判決的結(jié)果。大語言模型擅長分析和處理龐大的法律數(shù)據(jù)集,包括案例、法律法規(guī)和訴訟文書等,再通過機(jī)器學(xué)習(xí)算法從這些數(shù)據(jù)中識別模式,從而預(yù)測案件的裁判趨勢。機(jī)器學(xué)習(xí)算法自動檢測有關(guān)過去法律場景的數(shù)據(jù)模式,然后據(jù)此推斷以預(yù)測未來法律情景的結(jié)果。大語言模型從法律大數(shù)據(jù)中提取關(guān)鍵特征,包括案由和適用的法律法規(guī)等。然后,使用大語言模型算法來訓(xùn)練判決結(jié)果的預(yù)測模型,使其學(xué)會識別案件特征與判決結(jié)果之間的關(guān)系,從而為新案件預(yù)測判決結(jié)果。
2.刑期預(yù)測
刑期預(yù)測是刑事案件事實認(rèn)定之后的量刑預(yù)測問題,既可以是檢察機(jī)關(guān)的量刑建議,也可以是法官作出的量刑裁判。刑期預(yù)測不僅需收集犯罪嫌疑人或被告人的基本信息和歷史犯罪記錄等資料,還包括罪名定性、犯罪金額、犯罪情節(jié)以及自首、認(rèn)罪認(rèn)罰等量刑情節(jié)。大語言模型首先通過特征工程提取量刑要素,然后運用大語言模型算法來進(jìn)行特征訓(xùn)練,學(xué)習(xí)先例數(shù)據(jù)中案件特征與刑期之間的關(guān)系。而后基于這種關(guān)系預(yù)測模型,對新案件的刑期進(jìn)行預(yù)測。
3.案情分析
案情分析是對案件信息進(jìn)行深入挖掘,從中發(fā)現(xiàn)隱藏的信息和規(guī)律,并據(jù)此預(yù)測得到合理的結(jié)論。案情分析首先要收集和整理案件信息,包括案件當(dāng)事人的背景資料、主觀動機(jī)、行為方式和案件情節(jié)等各種細(xì)節(jié)。然后,需要對這些信息進(jìn)行分類、篩選和歸納,嘗試構(gòu)建相應(yīng)的假設(shè)和理論框架。而后使用大語言模型對之進(jìn)行測試和檢驗。
(四)法律文本生成
法律文本生成是運用法律信息抽取和法律預(yù)測等技術(shù),結(jié)合自然語言生成技術(shù),生成規(guī)范性法律文書的應(yīng)用。法律文本生成的類型包括裁判文書、起訴書、公訴書、答辯狀、辦案報告等。這些法律文本的結(jié)構(gòu)不同,但是生成的原理相似。首先,大語言模型理解使用者的指令,通過法律信息抽取技術(shù)進(jìn)行分詞(將文本分解成詞匯或短語)和句法分析(理解每個詞匯在句子中的作用),而后利用命名實體識別技術(shù)來識別文本中的實體及其關(guān)系。其次,在模型訓(xùn)練階段,使用神經(jīng)網(wǎng)絡(luò)模型來處理和生成自然語言文本。這個訓(xùn)練過程會結(jié)合法律知識庫進(jìn)行知識增強(qiáng)。在生成法律文本時,需要將抽取的信息與知識庫中的知識進(jìn)行關(guān)聯(lián),通過法律預(yù)測獲取文本的關(guān)鍵dgLSd2cHXYjZKOpAqvZZGBap2LF2pLnQjGyqQh6vIfs=要素,包括案件中的因果關(guān)系和法律適用等。在此基礎(chǔ)上再使用自然語言生成技術(shù)來生成規(guī)范性文本,包括文書的排版、語法結(jié)構(gòu)、法律術(shù)語的使用等,保證文書語言的自然流暢和專業(yè)準(zhǔn)確。最后,法律文本生成不僅需要符合特定的格式規(guī)范,還要在生成內(nèi)容上滿足指令的要求,這就需要對模型進(jìn)行微調(diào),使用特定的指令來調(diào)整模型,以提高模型的預(yù)測準(zhǔn)確性和相關(guān)性。大語言模型還通過人類強(qiáng)化反饋機(jī)制,經(jīng)過多輪次的強(qiáng)化學(xué)習(xí)來不斷改進(jìn)模型,包括錯誤檢測和糾正機(jī)制。
五、法律大語言模型司法應(yīng)用的挑戰(zhàn)
盡管大語言模型在司法領(lǐng)域表現(xiàn)出強(qiáng)勁的應(yīng)用潛力,但在法律推理、司法證明、法律論證以及司法自由裁量等領(lǐng)域仍然面臨極大的挑戰(zhàn)。這些挑戰(zhàn)不僅源于生成式人工智能技術(shù)層面的局限性,還由于法律實踐本身的復(fù)雜性和人類認(rèn)知的獨特性所致。司法決策不僅涉及對文字和語言的處理,更需要對法律概念、原則和規(guī)則的深刻理解,以及在具體司法情境中的靈活HUfMWt0sP7yusNStkxF4Bj2+hCoTtQ/YAivvgp5DMd0=應(yīng)用。
(一)法律推理之所不能
大語言模型擅長法律大數(shù)據(jù)推斷(inference),這是一種基于概率擬合的統(tǒng)計學(xué)推斷,其發(fā)生原理與法律人的法律邏輯推理(reasoning)有本質(zhì)的差別。大語言模型的推斷能力源于其海量數(shù)據(jù)訓(xùn)練和復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu),超大規(guī)模參數(shù)賦予了大語言模型“涌現(xiàn)”的能力。思維鏈(chain-of-thought)方法的引入提升了大語言模型解決復(fù)雜問題的能力,使得模型能夠生成一系列的中間步驟,這類似于人類解決問題時的邏輯思維過程。然而,大語言模型推斷能力背后的生成機(jī)理仍然模糊不清。因此,大語言模型繼承通用大語言模型的邏輯推理能力并不可靠,更無法滿足司法對透明性和可解釋性的要求。比較而言,法律人的邏輯思維與生俱來,經(jīng)過法學(xué)專業(yè)學(xué)習(xí)和法律職業(yè)鍛煉又形成了特有的法律邏輯思維?;魻柲匪拐J(rèn)為法律邏輯思維是法律人的基本素養(yǎng),他在《法律的道路》一書中說道:“法律人的訓(xùn)練,是邏輯的訓(xùn)練。類推、區(qū)別、演繹等方法,都是法律人拿手的絕活。司法判決所使用的語言,主要都是邏輯語言?!痹趥鹘y(tǒng)邏輯的各個分支當(dāng)中,演繹推理最受法學(xué)家的關(guān)注,司法三段論被奉為是法律推理的“圭臬”。類比推理和歸納推理在英美法系國家是判例推理的邏輯基礎(chǔ)。無論是演繹推理還是類比推理或歸納推理,法律邏輯推理的基本特征是可解釋性,即由前提推理得到結(jié)論的過程是可解釋的。如果推理出現(xiàn)錯誤,那么可以追溯找到推理的錯誤所在。
大語言模型還遠(yuǎn)不能夠替代法律人的法律推理。首先,法律專業(yè)人員在處理案件時依賴于對法律原則和規(guī)則的深入理解以及對個案事實的綜合考量。他們不僅分析案件材料,還將法律知識和經(jīng)驗應(yīng)用于具體情境,進(jìn)行更為深入和個案化的分析。其次,大語言模型雖然能夠處理某些邏輯結(jié)構(gòu)(如模式識別或數(shù)據(jù)驅(qū)動的因果關(guān)系等),但在更復(fù)雜的法律推理方面,如包含復(fù)雜證據(jù)和推論的深層次邏輯分析和嚴(yán)密的證明過程,其推理能力有限。大語言模型的“推理”是基于模式匹配和概率推斷,而不是由高階智能產(chǎn)生的邏輯推演。再次,大數(shù)據(jù)推理的邏輯不同于人類推理的思維邏輯,兩者有本質(zhì)上的區(qū)別。以類比推理為例,它是一種擴(kuò)展性推理,這種比較源于人類對相似性的判斷,它是從常識和經(jīng)驗中獲得的。最后,法律人的法律邏輯推理除了形式推理之外還有實質(zhì)推理的因素,法律人的決策往往依賴于過往的經(jīng)驗和直覺來作出判斷,它們是在長期的法律工作中積累的。大語言模型無法從大數(shù)據(jù)視角來理解個案的情境,也無法像法律人那樣通過長期的法律實踐和經(jīng)驗積累來提升法律決策的質(zhì)量。因而,大語言模型仍無法通過抽象的邏輯思維來理解法律概念及其之間的關(guān)系并將其應(yīng)用于新的情境。
(二)司法證明之所不能
“司法證明指事實主張者(一切案件中的當(dāng)事人、公訴人)或反駁者(往往是另外的事實的主張者)在訴訟(特別是庭審)中通過舉出人證和物證的方式,對待證事實(訴爭事實)進(jìn)行證明。”司法證明以證明案件事實為目標(biāo)。對待證事實的證明首先要采納證據(jù),常見的標(biāo)準(zhǔn)包括:關(guān)聯(lián)性標(biāo)準(zhǔn),即證據(jù)的自然屬性是證據(jù)與案件事實之間客觀存在的聯(lián)系;合法性標(biāo)準(zhǔn),即證據(jù)必須在取證的主體、程序、手段以及證據(jù)的形式等方面都符合法律的要求或規(guī)定。證據(jù)還需要進(jìn)一步得到采信,最基礎(chǔ)的標(biāo)準(zhǔn)是真實性標(biāo)準(zhǔn),即證據(jù)經(jīng)過查證屬實才能作為定案的根據(jù)。顯然,對證據(jù)的采納和采信都離不開法律人對證據(jù)的主觀性評估。例如,在評估證據(jù)的關(guān)聯(lián)性時,需要借助經(jīng)驗和對因果關(guān)聯(lián)的判斷來認(rèn)定證據(jù)與事實之間是否有關(guān)聯(lián);又如,真實性標(biāo)準(zhǔn)最終還要依賴人來判斷法律事實是否足夠逼近客觀事實。然而,大語言模型依靠機(jī)器學(xué)習(xí)算法來實現(xiàn)自主學(xué)習(xí)和迭代優(yōu)化的性能,其設(shè)計和運行機(jī)制決定了它只能通過數(shù)據(jù)訓(xùn)練和算法計算來預(yù)測和輔助決策,而不具備像人類一樣去感知、思考和判斷事物的能力。這意味著大語言模型無法通過觀察、分析和比較等方式來感知證據(jù)的存在,同樣也無法確定證據(jù)來源的可靠性、證據(jù)內(nèi)容的完整性、證據(jù)間的矛盾點等更深層次的問題,因而,大語言模型難以處理司法證明中的證據(jù)認(rèn)定。
除了對證據(jù)本身的認(rèn)定,司法證明還需要深入探討證據(jù)與案件事實之間的聯(lián)系。現(xiàn)有司法解釋明確要求裁判者“運用證據(jù)進(jìn)行的推理符合邏輯和經(jīng)驗”。法官需要運用其豐富的法律專業(yè)知識,審判經(jīng)驗以及邏輯思維能力,對控辯雙方提供的證據(jù)進(jìn)行審查和評估,最終確定案件的基本事實。“與存在的客觀性相比,經(jīng)驗性是事實的本質(zhì)特性。事實是人通過感官和思維所把握的真實存在?!卑讣聦嵳J(rèn)定需要遵循一定的程序規(guī)則。法院審理案件通常采用的是“控辯式”模式,即控方負(fù)責(zé)提供證據(jù),辯護(hù)方則有權(quán)提出質(zhì)疑和反駁。因此,法官需要在庭審中聽取雙方的陳述和質(zhì)證,并對證據(jù)進(jìn)行嚴(yán)格的審查和判斷。同時,案件事實認(rèn)定還需要具有說理性。法官需要將自己的內(nèi)心確信轉(zhuǎn)化為釋法說理,使得審判能夠被理解和接受。這種說理性不僅體現(xiàn)在法官的判決書中,還應(yīng)該貫穿整個審判流程中的所有法律文書之中。然而,大語言模型難以準(zhǔn)確識別和處理與案件相關(guān)的復(fù)雜法律問題和細(xì)微的事實差別。同樣,大語言模型也無法避免算法偏見所帶來的歧視問題,甚至?xí)驗樗惴ǖ钠妼?dǎo)致預(yù)測結(jié)果的不公正?!笆聦嵞耸菍Τ尸F(xiàn)于感官之前的事物或現(xiàn)象的某種實際情況的一種斷定或陳述?!比斯ぶ悄苣軌蚪鉀Q語法問題,但尚未逾越語義和語用兩道屏障,因而,人工智能對事實認(rèn)定結(jié)論的表達(dá)目前尚屬一種理想。因此,雖然大語言模型可以在一定程度上輔助司法證明的工作,但最終的判斷還是要依賴于法律人的智慧。
(三)法律解釋之所不能
法無解釋不得適用?!胺山忉屖侵付ㄌ囟ǚ梢?guī)定意義的說明?!睘榱吮苊夥傻臋C(jī)械適用,必須對法律進(jìn)行解釋。法律解釋有利于實現(xiàn)立法目的、統(tǒng)一法律適用、約束法官的自由裁量權(quán),并保障人們對法律安定性的合理預(yù)期。作為一種法律方法,法律解釋衍生出多樣化的理論闡釋。薩維尼將法律解釋方法概括為文義解釋、體系解釋、目的解釋和歷史解釋。例如,文義解釋又被認(rèn)為是法律解釋的最基本方法,具體涵蓋了字面、限縮、擴(kuò)張、法意、合憲、體系、語法和比較等解釋方法。但法律解釋并不能簡單等同于對法律文字本身的解釋。阿列克西的外部證成理論旨在對解釋進(jìn)行證成,解釋的準(zhǔn)則可以分為六組:語義學(xué)解釋、發(fā)生學(xué)解釋、歷史解釋、比較解釋、體系解釋和目的論解釋。蘇力教授還將法律解釋方法歸納為文義解釋、法意解釋和目的解釋、語境解釋和體系解釋等。顯然,大語言模型雖然能進(jìn)行基本的文本分析,但缺乏理解法律文本背后深層含義的能力,包括理解法律條文的目的、法意,及其在特定社會、歷史語境中的意義。大語言模型無法像法律人一樣捕捉法律語言的微妙性和復(fù)雜性,無法進(jìn)行原創(chuàng)性思考和創(chuàng)新解釋,缺少對法律原則的深入理解。因而,大語言模型尚不能夠勝任通過法律解釋來闡釋法律規(guī)定的意義。
法律解釋的最直接含義是法官在法律文義的可能范圍之內(nèi)進(jìn)行解釋。文義解釋是對法律文本的字面含義所進(jìn)行的解釋。通常有兩種理解:一是針對法律文本的字面含義,按照語法結(jié)構(gòu)和語言規(guī)則、通常理解等方法所進(jìn)行的解釋;二是使文本的字面含義具體化,闡釋其字面含義,確定文本的意思。由于文義解釋通常不考慮法條字面以外的因素,因而大語言模型可以在一定程度上對法律概念、法律條款和法律案例進(jìn)行文義解釋,這主要涉及對語言的理解、語法結(jié)構(gòu)的分析以及在一般語境中的常規(guī)理解。然而,對于需要借助法理、復(fù)雜語境和生活經(jīng)驗的文義解釋,大語言模型仍然不能夠勝任。比較而言,大語言模型在復(fù)雜的法律解釋方法上更不盡如人意。以體系解釋為例,體系解釋是通過整體來解釋某一具體法律規(guī)范的含義,它以法律的外在體系為基礎(chǔ)進(jìn)行解釋。換言之,體系解釋就是將法律條文放置在整個法律體系中進(jìn)行解讀,通過考察其與其他條文的關(guān)聯(lián)來進(jìn)行法律解釋。體系解釋依賴于法律人對法律體系的充分了解以及案件本身相關(guān)的法律法規(guī),由此作出合乎邏輯的解釋。大語言模型難以根據(jù)對法律體系的內(nèi)在關(guān)系的理解來進(jìn)行合理的關(guān)聯(lián)性解釋,因而對于這類任務(wù)不能夠給出合理的系統(tǒng)解釋。同理,在當(dāng)然解釋、目的解釋、歷史解釋和社會學(xué)解釋等方面,大語言模型也尚不具備法律解釋的能力。
(四)法律論證之所不能
法律論證是法律人論證命題之正當(dāng)性的法律方法。大語言模型擅長法律論證的挖掘,即將文本中的法律論證以結(jié)構(gòu)化方式再現(xiàn),但是并不能構(gòu)造法律論證。“當(dāng)人工智能法官在制定有說服力的法律論證方面變得非常有效時,就沒有理由更喜歡人類法官了?!狈烧撟C的論題包括規(guī)范基礎(chǔ)的哲學(xué)論題、法律論證結(jié)構(gòu)和可接受性的規(guī)范理論論題、重構(gòu)法律論證的重構(gòu)論題、法律論證的構(gòu)建和評估的經(jīng)驗論題。法律論證理論形成了諸多分析和評估法律論證的方法。圖爾敏受到“法學(xué)的一般化模型”的啟發(fā),提出了一個基于司法程序的新論證模型,后人稱之為“圖爾敏模型”,這種模型不同于形式邏輯評價論證的有效性標(biāo)準(zhǔn),而是強(qiáng)調(diào)了論證評價標(biāo)準(zhǔn)的“領(lǐng)域依賴性”。佩雷爾曼重新激發(fā)亞里士多德的傳統(tǒng)修辭學(xué)的魅力,他系統(tǒng)整理了價值論斷的論證技巧和證成模式,建構(gòu)了以“獲取聽眾認(rèn)同”為主導(dǎo)的新修辭學(xué)理論,并成功將其拓展到法律論證領(lǐng)域。沃爾頓提出了新論辯術(shù)理論,他將對話分為不同目的驅(qū)動的六種類型,并且基于該理論重新詮釋了論證圖式、承諾和謬誤等概念,法律論證被重構(gòu)為一種說服性對話。愛默倫構(gòu)建了語用論辯學(xué),研究批判性討論的分析、比較和評估理論,并給出了相應(yīng)的程序性規(guī)范理論。菲特麗斯將語用論辯學(xué)應(yīng)用于研究法律論證。這些法律論證理論都致力于構(gòu)建法律論證的分析、比較和評估理論,為真實的法律論證實踐提供方法論支持。然而,大語言模型無法理解這些法律論證理論的構(gòu)建原理和思想,因而也不具備采用這些精細(xì)化方法來分析和評估法律論證的能力。
從動態(tài)過程及主體互動等因素考慮,法律論證分為獨白式(monological)和論辯式(dialectical)兩種類型。獨白式的法律論證由法律推理所構(gòu)成,可以解構(gòu)為“大前提+小前提→結(jié)論”的類三段論模式。作為大前提的法律法規(guī)適用又可以分解出固定請求、尋找基礎(chǔ)規(guī)范和分解規(guī)范要件等任務(wù),而作為小前提的案件事實認(rèn)定則包含檢索訴訟主張、整理訴訟爭點、證明要件事實和認(rèn)定要件事實等任務(wù)。法律論證總結(jié)了主要的論據(jù)類型和論證方法,使法律人在實踐中能以最有效的方式提出最有力的論據(jù)。然而,這并不意味著法律論證由前提推出結(jié)論的邏輯機(jī)制是僵化的。法律論證的解釋性功能并非僵化不變的,由于成文法自身的缺陷,法官為了實現(xiàn)社會正義在某些情況下需要“背離”法律條文的規(guī)定,通過在個案中的創(chuàng)造性解釋活動把僵化的成文法變成具有生命力的合法合理的裁判規(guī)范。比較而言,論辯式的法律論證突出法律論證的多主體性、動態(tài)性和論辯性特征。法律論證不僅依賴于法律規(guī)則和邏輯結(jié)構(gòu),還受到特定領(lǐng)域和情境的影響。圖爾敏指出法學(xué)的主要任務(wù)是刻畫法律過程的本質(zhì):提出、爭論和決定法律主張的程序。大語言模型對案件特定情境的適應(yīng)性不足,它缺乏高度專業(yè)化的辯論技巧。因而,大語言模型難以模擬法律論證實踐中的情境依賴性,特別是在解讀法律文本、適應(yīng)法律程序的動態(tài)性、運用修辭學(xué)和語用學(xué)方法等方面。因此,盡管大語言模型能處理一些規(guī)范化的流程性問題,但在需要深度專業(yè)知識、論辯策略和人際交流技巧的法律論證中,則顯得能力有限。
(五)司法自由裁量之所不能
自由裁量權(quán)存在于兩種情況:一是法律沒有任何規(guī)定的情況,但法律沒有規(guī)定未必存在自由裁量權(quán)。二是法律有規(guī)定,但規(guī)定不具體或者不明確。司法自由裁量權(quán)是指法官或者審判組織根據(jù)自己的認(rèn)識、經(jīng)驗、態(tài)度、價值觀以及對法律規(guī)范的理解而選擇司法行為和對案件作出裁判的權(quán)力。司法自由裁量權(quán)是法律賦予的司法權(quán)力,盡管包含了法官的個人主觀因素,但仍然體現(xiàn)的是司法意志,在司法上表現(xiàn)為一種優(yōu)先權(quán)力。計算機(jī)量刑也有自由裁量的問題。一方面,在設(shè)計階段就給了法官一個調(diào)整的系數(shù)空間;另一方面,對情節(jié)、態(tài)度等因素的考慮,根本上還是取決于法官主觀的判斷,這也是自由裁量的表現(xiàn)。司法自由裁量權(quán)可能在不依照現(xiàn)行法律規(guī)定的前提下來優(yōu)先行使,它可能受到法律原則或法律精神的影響。自由裁量尤其出現(xiàn)在司法沒有明確規(guī)定且法律適用困難的情境下,既包括對公序良俗、公共利益、重大利益、嚴(yán)重影響、嚴(yán)重危害、嚴(yán)重違法、從重處罰和情況緊急等不確定法律概念的解釋和判斷,也包括對懲罰方式、賠償額度、量刑區(qū)間進(jìn)行選擇的自由裁量。司法裁判是法官在特定的時間和背景下作出的,其中包含著法律傳統(tǒng)、文化背景和政治制度等多種因素。在司法實踐中,自由裁量的水平取決于法官個人的法律素養(yǎng)、辦案經(jīng)驗和司法能力,甚至與法官的道德水平和價值觀密切相關(guān)。法官進(jìn)行裁判往往需要在政治效果、法律效果和社會效果之間尋求平衡。司法自由裁量是法官巧妙運用自由心證和司法解釋,填補法律漏洞以及應(yīng)對新型和疑難案件的有效手段。
法官的自由裁量是一種復(fù)雜的,依賴個人經(jīng)驗和價值觀的能力,包括對法律精神的深刻理解和對社會倫理的判斷?!叭祟惙ü俚乃季S過程將永遠(yuǎn)是被告量刑的最終仲裁者,人類法官將始終決定對被告的刑罰程度?!倍笳Z言模型目前無法模擬這種復(fù)雜性,特別是在處理模糊性問題,進(jìn)行道德判斷和提供創(chuàng)造性解決方案等方面。(1)大語言模型缺乏法律人的職業(yè)經(jīng)歷和文化背景,無法形成真正的認(rèn)知和價值觀。它的“經(jīng)驗”源于其訓(xùn)練數(shù)據(jù),僅僅依據(jù)輸入的數(shù)據(jù)進(jìn)行計算和推斷,而這些數(shù)據(jù)無法完全捕捉到法律決策的經(jīng)驗性和人類情感的復(fù)雜性。(2)大語言模型雖然可以通過編程來識別特定的法律規(guī)則,但它無法真正理解法律規(guī)則背后的深層意涵,特別是當(dāng)涉及“公序良俗”等法律概念時。(3)大語言模型在處理模糊性和不確定性問題時存在明顯的局限性,它依賴于明確和清晰的指令問題,根據(jù)被定義的參數(shù)和規(guī)則來推斷結(jié)論。但是當(dāng)遇到需要靈活解釋和判斷的情況時,大語言模型可能無法作出與人類法官相似的決策。(4)大語言模型的“濫用”甚至?xí)?dǎo)致司法權(quán)的“嬗變”?!耙坏┬纬伤惴▽V频木置?,法庭辯論、上訴審、專家酌情判斷的意義都會相對化,結(jié)果將導(dǎo)致法官的物象化、司法權(quán)威的削弱、審判系統(tǒng)的解構(gòu),甚至徹底的法律虛無主義?!保?)大語言模型難以提供創(chuàng)新性和適用性強(qiáng)的解決方案,尤其是在法律漏洞填補和新型、疑難案件應(yīng)對方面。因而,大語言模型不能夠,也不應(yīng)該代替法官行使自由裁量的權(quán)力。
(六)疑難案件中道德判斷之所不能
司法裁判需要接受公眾的檢驗,因而法官作出的判決往往蘊含了道德判斷。法官在作出判決之前會根據(jù)法律原則和法律規(guī)則進(jìn)行權(quán)衡和比較,這當(dāng)中不能回避情感和道德因素。法官在審理案件時需要面對各種各樣的道德困境和社會問題,其既需要考慮案件本身的法律判斷,也需要作出受到公眾普遍認(rèn)同的道德判斷。道德判斷不僅僅是對個案的具體情境進(jìn)行分析和評估,還要考慮到社會的整體價值觀和文化背景等因素。當(dāng)法律和道德之間表現(xiàn)出沖突時,法官可能依據(jù)道德原則來調(diào)整原先的法律判斷,這樣的調(diào)整既要消除法律與道德判斷之間的不協(xié)調(diào),而且還要獲得普遍的道德認(rèn)同。道德爭議案件的司法裁決應(yīng)堅持理性主義的倫理學(xué)立場,通過理性的論證贏得大多數(shù)人在道德上能夠接受的解決方案。道德判斷往往包含了受到普遍認(rèn)同的道德或倫理規(guī)則,道德法律化現(xiàn)象也為道德規(guī)則化提供了先天條件。立法手段可以選擇和推動一定道德規(guī)范的普及,即以法律規(guī)范形式確認(rèn)和吸收某些道德標(biāo)準(zhǔn),使之成為法律標(biāo)準(zhǔn),從而推進(jìn)法律目標(biāo)的實現(xiàn)。大語言模型擅長模式識別,通過學(xué)習(xí)包含道德判斷的先例大數(shù)據(jù),可以識別出法律情境中普遍適用的道德和法律規(guī)則,進(jìn)而作出道德判斷。法律原則自身就可以作為道德或倫理規(guī)則的來源,因為法律原則體現(xiàn)了實質(zhì)性的道德判斷并且具備可普遍化的能力。例如,大語言模型學(xué)習(xí)得到“生命優(yōu)于財產(chǎn)”的倫理規(guī)則,對于“因饑餓而搶劫”的案例會充分考慮道德和社會正義的權(quán)衡。因而,大語言模型可以通過機(jī)器學(xué)習(xí)來解決常見或一般的倫理或道德問題,從而具備一定的道德判斷能力。然而,大語言模型仍然不能夠產(chǎn)生情感和道德意識,也就不能真正理解“公平”和“正義”等概念的含義。
疑難案件中的道德判斷涉及非常復(fù)雜的道德權(quán)衡問題。大語言模型缺乏對社會價值和倫理原則的理解,因此難以在復(fù)雜的社會和道德問題上作出合理的判斷。疑難案件中的道德問題往往涉及復(fù)雜的歷史背景、深層次的社會價值觀和特定群體的經(jīng)驗,這類問題要求對文化差異、社會規(guī)范和道德觀念有深刻的理解。瀘州遺贈案中的道德判斷難題就是認(rèn)定遺囑行為是否已經(jīng)從道德要求上升為具體的法律禁止性規(guī)定。顯然,這類疑難案件所包含的道德因素超出了大語言模型的學(xué)習(xí)范疇,大語言模型難以真正理解和應(yīng)用道德準(zhǔn)則,因而難以對疑難案件進(jìn)行道德判斷。此外,大語言模型在處理尚未被廣泛理解和接受的復(fù)雜問題時,缺乏創(chuàng)造性思維,因此難以提出符合道德標(biāo)準(zhǔn)的創(chuàng)新解決方案。例如,假設(shè)一輛自動駕駛汽車發(fā)生了交通事故,造成對行人的傷害。判斷責(zé)任歸屬的問題非常復(fù)雜,涉及制造商、軟件開發(fā)者、車輛所有者以及被害人等多方。在這類案件中,大語言模型難以提供一個全面且創(chuàng)新的解決方案。又如,如果法官使用智能審判系統(tǒng)作出裁判而導(dǎo)致錯案的發(fā)生,在討論如何認(rèn)定責(zé)任時, 大語言模型從傳統(tǒng)的責(zé)任分配說出發(fā)認(rèn)為法官和智能審判系統(tǒng)共同承擔(dān)責(zé)任的觀點,這沒有真正理解法官獨立審判的司法規(guī)律。因而,大語言模型只是實現(xiàn)公平正義的輔助工具,它不能在包含道德判斷的疑難案件中替代法官裁判。
六、法律大語言模型司法應(yīng)用的規(guī)范
為規(guī)范法律大語言模型的司法應(yīng)用,司法機(jī)關(guān)應(yīng)從制度上保證其合理使用。法律大語言模型作為一種法律垂類的生成式人工智能,受到《生成式人工智能服務(wù)管理暫行辦法》的規(guī)制,但由于司法領(lǐng)域的特殊性,在評估機(jī)制、審查機(jī)制、數(shù)據(jù)安全保護(hù)機(jī)制等方面面臨新的挑戰(zhàn)。
(一)法律大語言模型的評估機(jī)制
在司法機(jī)關(guān)引入法律大語言模型之前,應(yīng)建立嚴(yán)格的評估機(jī)制,以確保只有經(jīng)過測試和驗證的模型才能在司法場景中應(yīng)用。為此,司法機(jī)關(guān)應(yīng)成立一個由法律實務(wù)專家、法學(xué)學(xué)者和技術(shù)專家組成的評估資格咨詢委員會,負(fù)責(zé)審查和評估法律大語言模型的使用資質(zhì)。評估過程需要依賴標(biāo)準(zhǔn)化的測試,這要求構(gòu)建科學(xué)的測評體系和方法,重點關(guān)注法律大語言模型的功能、性能和安全性指標(biāo)。
第一,功能性評估主要關(guān)注法律大模型是否具備完成特定法律任務(wù)的能力,包括法律語言理解、法律知識問答、法律預(yù)測和法律文本生成等方面。功能性評估的目標(biāo)是測量和評估法律大語言模型在特定法律任務(wù)中的表現(xiàn)。通過輸入相應(yīng)的任務(wù)提示,評估檢查模型的輸出結(jié)果是否達(dá)到預(yù)期的任務(wù)目標(biāo)。例如,在法律文書生成任務(wù)中,評估的重點是模型是否能夠根據(jù)輸入的法律事實和要求生成符合格式和內(nèi)容標(biāo)準(zhǔn)的法律文書。
第二,性能評估關(guān)注法律大模型在執(zhí)行任務(wù)時的效率和準(zhǔn)確性。具體而言,性能指標(biāo)包括F1值(結(jié)合精確率和召回率)、首字響應(yīng)時間、處理效率、并發(fā)能力、正確性、完整度、相關(guān)度和有效性。例如,F(xiàn)1值通過評估模型對法律文書中錯誤的識別準(zhǔn)確性來計算, 其中精確率表示正確識別的錯誤占所有識別的比例,召回率表示正確識別的錯誤占所有實際存在錯誤的比例。
第三,安全性評估關(guān)注法律大模型在生成內(nèi)容時是否違反法律法規(guī)或道德標(biāo)準(zhǔn),包括評估模型在處理敏感話題、隱私保護(hù)等方面的安全性。安全性指標(biāo)包括敏感話題、排斥成見、非法競爭、權(quán)益侵害、隱私安全、惡意抨擊、違法違紀(jì)、人身危害、心理危害和負(fù)向價值等。評估通過人工標(biāo)記和分析模型輸出內(nèi)容中的禁止項(如出現(xiàn)嚴(yán)重違禁內(nèi)容)和問題項(如涉及敏感話題)來進(jìn)行。安全性指標(biāo)是定性指標(biāo),如果發(fā)現(xiàn)安全性存在問題,模型應(yīng)被否定。
(二)法律大語言模型的審查機(jī)制
法律大語言模型的司法應(yīng)用需要接受全面的審查。
第一, 審查模型的應(yīng)用場景和限制條件,通過嚴(yán)格的準(zhǔn)入機(jī)制確保模型僅用于合適的法律任務(wù)。前述分析,法律大語言模型并非適用于所有法律任務(wù),這需要全面評估模型的功能、性能、安全性和質(zhì)量,并要求開發(fā)者提供透明的測試結(jié)果和數(shù)據(jù)來源。司法機(jī)關(guān)需明確模型的具體應(yīng)用場景,例如在法律文書生成、法律條文檢索、簡單法律咨詢和案情分析中發(fā)揮輔助作用。但在涉及復(fù)雜法律推理、價值判斷及需要深度法律專業(yè)判斷力的任務(wù)中,模型的應(yīng)用應(yīng)受到限制。尤其在處理國家安全、公共秩序和道德倫理的敏感信息時,模型使用必須嚴(yán)格受監(jiān)管。
第二,為防止法律大語言被置于決定性位置,還需要審查法律大語言模型的輔助性地位。司法機(jī)關(guān)必須確保模型僅用作輔助工具,最終的決策權(quán)仍需由法律人掌握。司法機(jī)關(guān)應(yīng)明確規(guī)定,任何由模型生成的建議或結(jié)論必須經(jīng)過法律專業(yè)人員的審查。輔助性地位評估可以通過多方面的措施來實現(xiàn):分析人機(jī)交互記錄和決策鏈,確保司法工作人員在每個決策中都有實際參與和最終確認(rèn);明確責(zé)任歸屬,通過責(zé)任協(xié)議,確保司法工作人員對每項決策負(fù)責(zé);評估模型輸出的依賴度,統(tǒng)計輸出采納率,并鼓勵司法工作人員提供多種方案以驗證人類判斷的獨立性;司法工作人員可以質(zhì)疑輸出結(jié)果,在必要時糾正或拒絕不當(dāng)?shù)慕ㄗh。
第三, 法律大語言模型的生成內(nèi)容需要接受審查,以確保其在法律實踐中的準(zhǔn)確性和合法性。首先,司法機(jī)關(guān)通過建立人機(jī)協(xié)調(diào)審查的機(jī)制,由使用者對生成內(nèi)容進(jìn)行交叉審查,降低個體判斷錯誤的風(fēng)險。對于復(fù)雜或敏感的法律內(nèi)容,應(yīng)當(dāng)組建專家小組進(jìn)行評審,提供多元化的專業(yè)意見。其次,建立標(biāo)準(zhǔn)化測試集,使用涵蓋不同法律任務(wù)的標(biāo)準(zhǔn)化測試集來評估模型生成內(nèi)容的準(zhǔn)確性。還應(yīng)當(dāng)開發(fā)自動化測試工具,快速評估生成內(nèi)容與測試集答案的相符程度,并標(biāo)記潛在問題。最后,建立持續(xù)的性能監(jiān)控機(jī)制和反饋渠道,對大模型的輸出進(jìn)行定期評估,及時糾正反饋的錯誤,確保其在實際應(yīng)用中的表現(xiàn)穩(wěn)定且可靠。
(三)法律大語言模型的數(shù)據(jù)安全保護(hù)機(jī)制
法律大語言模型不僅面臨大語言模型普遍的數(shù)據(jù)安全問題,還存在特有的安全性挑戰(zhàn)。除了基座大語言模型的訓(xùn)練數(shù)據(jù)安全問題外,還涉及二次微調(diào)過程中的數(shù)據(jù)安全以及檢索增強(qiáng)過程中的法律知識庫安全保護(hù)問題。
在二次微調(diào)前,首先需要對法律大數(shù)據(jù)進(jìn)行安全審查和評估。法律大數(shù)據(jù)包括裁判文書、法律法規(guī)、案例分析、合同范本和法律問答等多種形式,當(dāng)中可能包含大量涉及個人隱私的信息,還可能包含敏感的商業(yè)秘密、國家機(jī)密等信息。根據(jù)數(shù)據(jù)敏感性、法律重要性以及用途,對數(shù)據(jù)進(jìn)行分類和分級。例如,將個人隱私數(shù)據(jù)、敏感法律文件和公開法律信息分為不同級別,制定相應(yīng)的保護(hù)措施。司法機(jī)關(guān)還可以引入法律和數(shù)據(jù)安全專家,對數(shù)據(jù)處理方案進(jìn)行審核,評估數(shù)據(jù)處理可能帶來的風(fēng)險,特別是對數(shù)據(jù)主體權(quán)利和數(shù)據(jù)安全的影響。此外,還需要對數(shù)據(jù)源進(jìn)行驗證,確保用于訓(xùn)練和使用的數(shù)據(jù)的準(zhǔn)確性、合法性和完整性,防止不準(zhǔn)確或有害的數(shù)據(jù)進(jìn)入系統(tǒng)。
在模型訓(xùn)練和部署中,需要對訓(xùn)練數(shù)據(jù)進(jìn)行嚴(yán)格保護(hù),防范數(shù)據(jù)安全風(fēng)險。首先,采用數(shù)據(jù)加密和匿名化技術(shù),確保訓(xùn)練數(shù)據(jù)的安全性。對于涉及個人隱私、商業(yè)秘密和國家機(jī)密的信息,使用高級加密技術(shù)保護(hù),并通過數(shù)據(jù)匿名化減少隱私泄露的風(fēng)險。同時確保模型符合法律領(lǐng)域的特定規(guī)范要求,防止數(shù)據(jù)濫用。其次,為確保安全部署和維護(hù),需要將模型部署在具備法律行業(yè)安全標(biāo)準(zhǔn)的受保護(hù)服務(wù)器上,使用防火墻和入侵檢測系統(tǒng)防止惡意攻擊,同時定期更新和維護(hù)模型以修復(fù)任何已發(fā)現(xiàn)的漏洞。最后,建立數(shù)據(jù)主體權(quán)利保障機(jī)制,確保數(shù)據(jù)主體能夠行使其數(shù)據(jù)訪問、數(shù)據(jù)更正和數(shù)據(jù)刪除等權(quán)利。提供法律大數(shù)據(jù)的司法機(jī)關(guān)自身可以作為數(shù)據(jù)主體,需確保數(shù)據(jù)的規(guī)范使用和權(quán)利保障,特別是在法律數(shù)據(jù)的收集、使用和共享方面嚴(yán)格遵循相關(guān)法律法規(guī)。
在模型的檢索增強(qiáng)過程中,需要專門保護(hù)法律知識庫。法律知識庫通常以結(jié)構(gòu)化的方式存儲信息,包括裁判文書、案例分析、法律條文等,并按類別、主題、時間進(jìn)行分類存儲,以便模型能夠快速、準(zhǔn)確地檢索所需信息。由于法律知識庫的構(gòu)建涉及大量原創(chuàng)性貢獻(xiàn),包括信息的收集、整理、驗證和展示,保護(hù)其知識產(chǎn)權(quán)對于防止未經(jīng)授權(quán)的復(fù)制和使用以及保護(hù)創(chuàng)作者的合法權(quán)益至關(guān)重要。為此,法律知識庫的保護(hù)需要建立基于角色的訪問控制系統(tǒng),為不同用戶設(shè)置不同的訪問權(quán)限,確保只有授權(quán)用戶才能訪問和修改特定部分的知識庫。此外,知識庫中應(yīng)附加明確的版權(quán)聲明和使用協(xié)議,以規(guī)定信息的使用范圍和條件。為了防止未經(jīng)授權(quán)的復(fù)制和分發(fā),還可以對知識庫中的關(guān)鍵內(nèi)容應(yīng)用數(shù)字水印,從而識別和追溯信息的來源。
結(jié)語
大語言模型有所能,亦有所不能。法律大語言模型無疑是法律人工智能研究的最前沿技術(shù),它在法律語言理解、法律知識問答、法律預(yù)測以及法律文本生成等領(lǐng)域表現(xiàn)出了卓越的能力,標(biāo)志著法律人工智能研究進(jìn)入了全新時代。然而,也應(yīng)清醒地認(rèn)識到,法律大語言模型在處理法律邏輯推理、司法證明、法律解釋、法律論證以及司法自由裁量等法律任務(wù)時存在明顯的局限性,尤其是在處理需要法律職業(yè)經(jīng)驗和復(fù)雜道德判斷的疑難案件時。大語言模型不具備法律人的直覺和經(jīng)驗,無法像法律人一樣靈活地使用法律方法。這些局限不僅體現(xiàn)了技術(shù)層面的挑戰(zhàn),更凸顯了人工智能在理解法律人的道德、倫理、經(jīng)驗和情感等方面的困境。法律大語言模型的能力還需要精準(zhǔn)的測評,未來需要研究大語言模型的科學(xué)測評方法,從功能、性能、安全和質(zhì)量等方面進(jìn)行測評,推動大語言模型的研發(fā)、評測和應(yīng)用的規(guī)范化。但無論大語言模型發(fā)展到何種階段,它在現(xiàn)有的計算范式下都無法達(dá)到“人類理性”的高度。“‘人類理性’包含亞里士多德式的審慎和智慧。這些能力不是算法性的,因此計算機(jī)能力不能、也不應(yīng)該取代人類理性”。大語言模型應(yīng)當(dāng)在其所能的范圍內(nèi)最大限度地發(fā)揮它的能力,同時避免走入其所不能的誤區(qū)。