亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        司法案例建模方法綜述

        2021-12-17 00:56:48郭小丁張宏莉
        智能計算機與應用 2021年6期
        關鍵詞:案例特征方法

        郭小丁,張宏莉

        (哈爾濱工業(yè)大學 計算機科學與技術學院,哈爾濱 150001)

        0 引言

        司法案例建模方法旨在將司法案例表示為案例相關預測算法能處理的數據結構,該數據結構保留原始數據中的有用信息,去除冗余信息,減少其對后續(xù)預測算法的干擾。司法案例建模方法是上層法律服務的基礎,為其提供數據支撐。簡潔有效的案例描述能有效地提高預測算法的準確率,降低其計算復雜度。

        傳統(tǒng)司法案例建模方法主要基于特征模型和矩陣分解。特征模型利用特征詞典和特征抽取算法將司法案件表示為二維矩陣,如圖1 所示。然而,當特征和案例規(guī)模較大時,特征模型極易發(fā)生數據稀疏和維度爆炸。針對上述問題,基于矩陣分解的司法案例建模方法將特征模型得出的原始矩陣進行分解,并利用得出的矩陣表征案例。當矩陣分解算法與共現(xiàn)矩陣、主題模型相結合時,得出的司法案例表示具有一定的語義信息,如詞匯間相似性、主題與特征間關聯(lián)性。

        圖1 基于特征模型以及矩陣分解的司法案例建模方法Fig.1 Judicial case modeling method based on feature models and matrix decomposition

        基于矩陣分解的司法案例建模方法降低矩陣維度,避免維度爆炸及數據稀疏,有利于提高后續(xù)預測算法的準確率。但這類方法基于特征模型,存在特征模型的天然缺陷,無法從多個層面描述案例,難以捕捉不同案例模塊間的關聯(lián)信息。上述因素不利于提高后續(xù)預測算法的準確率。

        1 基于特征模型的司法案例建模方法

        針對司法案例建模問題,早期的研究主要圍繞特征模型展開,大體分為基于案例推理、本體模型、分類算法的司法案例建模方法。根據大量的法律專家知識和人工標注工作,上述方法利用特征抽取算法從原始案例數據中獲取案例特征,結合案例推理、本體模型與分類算法,依據現(xiàn)有特征預測出新的案例特征,得出基于特征標簽的司法案例模型。

        1.1 基于案例推理的司法案例建模方法

        針對司法案例建模問題,最早期的研究是利用大量的人工標注為案例及案例要素分配索引,進而從結構合理的案例文本中提取案例事實,并將其用于案例摘要分類和案例推理系統(tǒng)中。隨著數據挖掘技術的發(fā)展,研究者提出一種基于信息抽取的司法案例建模方法。結合特定領域的知識,該方法抽取出案例中的事件經過,利用特征抽取技術捕捉個體行為中的動作,并對其進行識別。

        Zeleznikow 一種新的用于信息檢索的司法案例建模方法[1]。該方法擴展傳統(tǒng)案例因素和組件,將每一個因素分解為更加細致的案例要素,同時將所有要素分為主觀要素、客觀要素和天然要素,針對每一個司法案例利用特征挖掘技術匹配案例特征,進而得出案例表征。實驗結果表明,針對信息檢索問題,該方法具有更高的準確率和滿意度,主要因素在于層次特征的使用。

        長期以來,基于法律案例的推理(Legal Case-Based Reasoning,LCBR)一直是AI 和法律感興趣的話題,各種各樣的方法已經發(fā)展。LCBR 的一項重要工作始于HYPO,HYPO 根據法律規(guī)范中的論點與反論點在每個維度對司法案例進行建模,提出一種基于案件要素的建模方法。Kevin 出一系列利用特征模型刻畫司法案例的方法,如CATO 和IBP,并將其用于法律案例推理應用中,根據大量調研和實踐,上述方法構建案例框架,從司法案例中抽取出原告、被告、指控罪名、主觀以及客觀態(tài)度等案例要素,為每一個案例要素設置索引,進而完成案例表征[2]。

        1.2 基于本體模型的司法案例建模方法

        Breuker 提出一種基于法律知識及用例分析的司法案例建模方法[3]。該方法根據專業(yè)人士從法律法規(guī)中獲取的案例要素信息,利用特征挖掘算法從真實案例中抽取出案例要素,根據大量調研,構建結構化論點模型,生成案例本體,進而建立案例要素與案例本體之間的映射,得出司法案例表征。Ashley 提出司法案例中責任與因果關系的發(fā)現(xiàn)方法,在充分考慮當事人責任歸屬的前提下,該方法構建專用的本體模型,并用其表征司法案例[4]。該模型涵蓋法律領域中常見的責任與因果關系,如職位責任、雇傭關系、競爭關系等。根據已有責任劃分和因果關系,該模型利用推理規(guī)則,自動獲取新的因果鏈以及責任歸屬。基于本體的司法案例責任與因果關系發(fā)現(xiàn)方法需要大量的概念知識庫,該知識庫中包含法律規(guī)范、法律概念和術語以及人們日常生活中常識性詞匯表達等。

        在此基礎上,研究者提出一種基于Web 本體語言的司法案例建模方法,以CATO 和LCBR為基礎,構建司法案例本體,確定本體中的關鍵案例要素,利用網絡中案例將本體實例化,進而實現(xiàn)不同案例間的組件共享[5-7]?;贠WL 的司法案例建模方法在案例信息檢索和案例推理方面具有廣泛的應用。

        1.3 基于規(guī)則推理的司法案例建模方法

        Lagos以司法案例中事件為單位,提出一種基于事件抽取的司法案例建模方法[5]。該方法從原始案例數據中抽取出關鍵實體,如案件中當事人、當事人參與的事件以及當事人接觸的其他人物等信息,利用規(guī)則推理技術抽取出實體之間的關系,進而得出實體與關系構成的事件,完成司法案例表征;Henry提出一種基于規(guī)則推理和啟發(fā)式要素搜索的司法案例建模方法,將規(guī)則推理嵌入案例建模過程中,半自動化抽取案例特征,在一定程度上減少了建模過程中的人工工作[6]。針對不同類型的司法案例,該方法依據大量的歷史案例數據庫,將最佳歷史案例作為指導性案例,根據指導性案例中的法律推理規(guī)則及決策結果,提出不同的案例要素推理規(guī)則與裁決方法,并將其用于后續(xù)司法案例的建模過程中。

        1.4 方法簡析

        基于特征模型的司法案例建模方法將司法案例表示為二維矩陣,此類方法主要存在以下不足:

        (1)需要大量的法律專業(yè)知識和人工標注工作。特征模型構建特征詞典,并利用特征挖掘算法抽取出案例特征,進而將其表示為二維矩陣;

        (2)對數據庫中詞匯和語法信息的依賴性強。當新增案例或者案例的特征詞典發(fā)生變化時,特征模型易發(fā)生較強波動,影響后續(xù)預測算法的準確率和穩(wěn)定性;

        (3)極易發(fā)生維度爆炸和數據稀疏。當司法案例數量規(guī)模較大時,特征模型中易出現(xiàn)大量冗余信息,進而導致特征詞典命中率降低,發(fā)生數據稀疏和維度爆炸;

        (4)無法從多個層面描述案例,捕捉不同案例模塊間的關聯(lián)信息。

        2 基于矩陣分解的司法案例建模方法

        當司法案例規(guī)模和案例特征數量較大時,基于特征模型的司法案例建模方法極易發(fā)生數據稀疏和維度爆炸。為了解決上述問題,研究者提出一系列基于矩陣分解的司法案例建模方法。

        2.1 方法綜述

        矩陣分解算法將特征模型得出的代表司法案例的原始矩陣分解為維度更低的矩陣,去除了原始矩陣中冗余信息,有效地提高后續(xù)預測算法的計算復速度和準確率。在以往研究中,矩陣分解算法常與共現(xiàn)矩陣、潛在語義分析相結合(Latent Semantic Analysis,LSA),共同完成司法案例建模。

        當司法案例規(guī)模和特征數量較大時,特征模型極易出現(xiàn)數據稀疏和維度爆炸。為了解決上述問題,矩陣分解算法被廣泛用于主成分抽取和矩陣降維中。矩陣的奇異值分解理論是矩陣理論的重要組成部分,是研究最小兩乘積、廣義逆矩陣等問題的有力工具。目前存在多種矩陣分解算法,如奇異值分解(Singular Value Decomposition,SVD)、非負矩陣分解(Non-negative Matrix Factorization,NMF)。矩陣分解算法旨在將代表司法案例的原始矩陣映射到新的向量空間中。該向量空間由一組新的基構成。原始矩陣集合在新向量空間中的投影更加離散、具有區(qū)分性。矩陣分解算法去除原始矩陣中大量無用信息,保留有效信息,有助于提高后續(xù)預測算法的計算速度和準確率。

        Gui 總結了矩陣分解在文本建模方面的應用,其提出的基于奇異值分解的矩陣分解算法可被用于司法案例建模[7]。該方法建立特征詞詞典,利用特征挖掘技術從原始數據中抽取特征詞匯,將司法案例表示為二維原始矩陣。在此基礎上,該方法利用基于奇異值分解的矩陣分解算法,將原始矩陣分解為維度更小的矩陣,并用其表征司法案例。實驗結果表明,對于司法案例文本類別預測,相較于特征模型,基于奇異值分解的矩陣分解算法更有利于提高預測算法準確率和計算速度。主要原因在于矩陣分解算法去除了原始矩陣中大量無用信息。

        Yin 提出一種基于奇異值分解的司法案例建模方法,并將其用于法律咨詢系統(tǒng)中[8]。該方法利用空間向量模型作為表示方法,借助潛在語義分析理論,通過奇異值分解的降維方法構建一個低維的語義空間,并在語義空間上實現(xiàn)了咨詢問題與解答語句之間的相似度計算。針對司法案例中語句,該方法分別使用分詞、去停用詞、互信息擴展以及潛在語義分析,將咨詢語句映射至主題語義空間中,并利用SVD 分解得出其低維向量表示。

        Symeonidis 提出一種基于聚合矩陣分解的司法案例建模方法[9]。該方法在奇異值分解的基礎上,根據文檔的主題和可讀性,利用余弦相似度或歐氏距離對司法案例進行建模。該方法使用特征模型將司法案例表示為二維矩陣,利用SVD 算法降低原始矩陣的維度,結合當前案例和相似案例的向量表示,獲得當前司法案例的數字化表征。實驗結果表明,相對于矩陣分解算法,聚合矩陣分解更有利于提高后續(xù)預測算法的準確率。

        2.2 方法簡析

        基于矩陣分解的司法案例建模方法在特征模型的基礎上,將得出的代表司法案例的原始矩陣分解為維度更小的矩陣。矩陣分解算法極大地降低原始矩陣維度,減少后續(xù)預測算法的計算復雜度。矩陣分解算法去除了原始矩陣中冗余信息,提高后續(xù)預測算法準確率。然而,基于矩陣分解的司法案例建模方法仍然存在特征模型的天然缺陷,不能從多個層面描述案例,捕捉不同案例模塊之間的關聯(lián)信息。

        3 結束語

        本文針對司法案例建模問題,給出近年來的相關研究成果,將司法案例建模方法劃分為兩類,即基于特征模型的方法和矩陣分解模型的方法,分析了二者的優(yōu)缺點,為研究人員提供參考和指導。

        猜你喜歡
        案例特征方法
        案例4 奔跑吧,少年!
        少先隊活動(2021年2期)2021-03-29 05:40:48
        如何表達“特征”
        隨機變量分布及統(tǒng)計案例拔高卷
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        抓住特征巧觀察
        發(fā)生在你我身邊的那些治超案例
        中國公路(2017年7期)2017-07-24 13:56:38
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        一個模擬案例引發(fā)的多重思考
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        久久伊人精品中文字幕有尤物| 国产精品短视频| 曰本亚洲欧洲色a在线| 亚洲男同免费视频网站| 日本一道综合久久aⅴ免费| 国产专区国产av| 中文精品久久久久中文| 一区二区三区亚洲免费| 92午夜少妇极品福利无码电影| 18禁高潮出水呻吟娇喘蜜芽 | 亚洲AV永久天堂在线观看| 中文字幕一区二区三区四区久久| 色婷婷精品久久二区二区蜜桃| 亚洲h在线播放在线观看h| 最新亚洲人AV日韩一区二区| av网站在线观看二区| 国产亚洲精品久久午夜玫瑰园| 日本免费一区二区三区| 国产九色AV刺激露脸对白| 国产午夜三级精品久久久| 在厨房被c到高潮a毛片奶水| 性欧美大战久久久久久久久| 亚洲精品综合色区二区| 一区二区中文字幕在线观看污污| 免费观看羞羞视频网站| 国产AV无码专区久久精品网站| 亚洲老女人区一区二视频| 伊人久久精品亚洲午夜| 亚洲av成人一区二区三区| 69天堂国产在线精品观看| 日本师生三片在线观看| 亚洲av成人噜噜无码网站| 久久青青热| 一区二区中文字幕蜜桃| 一本色道久久hezyo无码| 国产女女做受ⅹxx高潮| 97碰碰碰人妻视频无码| 日本午夜理论片在线观看| 国产一区二区在线视频| 国产精品一区二区三级| 亚洲一区二区三区免费网站|