亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于分層學(xué)習(xí)的易混淆法條預(yù)測

2020-02-08 07:00:38趙紅燕譚紅葉

計算機工程與設(shè)計 2020年1期

程豪，張虎，崔軍+，趙紅燕,3，譚紅葉，李茹,2

(1.山西大學(xué) 計算機與信息技術(shù)學(xué)院，山西太原 030006；2.山西大學(xué) 計算智能與中文信息處理教育部重點實驗室，山西太原 030006；3.太原科技大學(xué)計算機科學(xué)與技術(shù)學(xué)院，山西太原 030024)

0 引言

隨著人工智能的興起，司法智能化已成為目前司法領(lǐng)域的研究熱點之一，相關(guān)人員提出“智慧法院”的觀點。法條預(yù)測作為法律判決預(yù)測的子任務(wù)，是構(gòu)成“智慧法院”的重要部分。目前大多數(shù)現(xiàn)有工作采用文本分類方法完成法條預(yù)測，但未能較好解決易混淆法條預(yù)測問題。

本文以刑法類文書作為實驗數(shù)據(jù)，輸入刑事案件的事實描述預(yù)測該案件所引用的法條。通過分析案情描述部分內(nèi)容，發(fā)現(xiàn)較多法條區(qū)分性大，易于準(zhǔn)確預(yù)測，但存在部分法條間內(nèi)容較為相似，在法條預(yù)測時極易混淆。據(jù)此針對易混淆法條預(yù)測問題，采用分層學(xué)習(xí)的方法解決。首先按照各法條預(yù)測效果將其分為易區(qū)分法條和易混淆法條兩類；其次結(jié)合法條含義與相應(yīng)事實描述兩部分內(nèi)容將易混淆法條組合為不同的易混淆法條集，并單獨訓(xùn)練各易混淆法條集的分類模型。依據(jù)易混淆法條集的類別情況與易區(qū)分法條類別數(shù)，構(gòu)建基于分層學(xué)習(xí)的易混淆法條預(yù)測數(shù)據(jù)集。根據(jù)分層預(yù)測思想，完成對兩類法條的預(yù)測。本文的研究主要貢獻有：

(1)通過分析刑事文書的事實描述與法條內(nèi)容，將183個刑事法條整理組合為136個易區(qū)分法條和11個易混淆法條集，其中11個易混淆法條集總共包括47個易混淆法條；

(2)針對法條預(yù)測中易混淆法條問題，構(gòu)建基于分層學(xué)習(xí)的易混淆法條預(yù)測模型。

1 相關(guān)工作

早期研究通常采用簡單數(shù)學(xué)模型進行法律判決結(jié)果預(yù)測，研究人員根據(jù)案情事實描述部分進行定量分析，提出法律判決計算公式；利用相關(guān)性分析預(yù)測案例判決結(jié)果；在法律判決預(yù)測中引入數(shù)學(xué)模型，這些方法僅適用于很少類別的小數(shù)據(jù)集。由于機器學(xué)習(xí)在許多領(lǐng)域的成功應(yīng)用，研究人員開始將法律判決預(yù)測作為文本分類問題并利用機器學(xué)習(xí)的方法來解決。通過提取了法律因素標(biāo)簽用于案件分類任務(wù)；Sulea等[1]提出了基于支持向量機的罪名預(yù)測模型，模型以案情事實描述和時間跨度信息作為輸入,輸出罪名信息。

隨著深度學(xué)習(xí)在語音[2-4]、計算機視覺[5-8]上的成功應(yīng)用，研究人員提出許多基于深度學(xué)習(xí)的文本分類模型，為法律判決預(yù)測奠定良好的基礎(chǔ)。Yoon Kim等[9]最早提出將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network，CNN)用于文本分類任務(wù)，其中卷積層濾波器具有局部特征提取的功能，能夠捕捉文本上下文局部相關(guān)性；Xiang Zhang等[10]提出基于字符集的卷積神經(jīng)網(wǎng)絡(luò)文本分類模型，該模型不需要使用預(yù)訓(xùn)練好的詞向量和語法句法結(jié)構(gòu)等信息，并且可很容易的推廣到所有語言；Pengfei Liu等[11]提出將多個任務(wù)聯(lián)合起來，用來直接對網(wǎng)絡(luò)進行改善，基于RNN(recurrent neural network)設(shè)計了3種不同的信息共享機制進行訓(xùn)練，并在4個基準(zhǔn)的文本分類任務(wù)中獲得了較好的效果；Joulin A等[12]提出快速文本分類模型，該模型結(jié)構(gòu)簡單高效，在保持分類效果的同時，大大縮短了訓(xùn)練時間；Zichao Yang等[13]提出了層次注意力網(wǎng)絡(luò)模型(hiera-rchical attention networks，HAN)，該模型針對文本分類問題采用層級注意力與雙向循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法；Conneau A等[14]關(guān)注卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)對分類效果的影響，通過增加層數(shù)抽取更加準(zhǔn)確的文本特征信息。

在參照深度學(xué)習(xí)文本分類的基礎(chǔ)上，羅等[15]提出基于注意力機制的刑事罪名預(yù)測模型，在統(tǒng)一的框架中對罪名預(yù)測任務(wù)和相關(guān)法條提取任務(wù)進行建模，以提取的法條信息作為罪名預(yù)測的依據(jù)；胡等[16]針對法條預(yù)測任務(wù)中低頻罪名問題，引入了法律區(qū)分性屬性來增加罪名預(yù)測的可解釋性。

現(xiàn)有研究中針對法條預(yù)測問題大多采用基于深度學(xué)習(xí)的分類模型，對易混淆法條的預(yù)測效果普遍不太理想。

2 基于分層學(xué)習(xí)的易混淆法條預(yù)測模型

2.1 問題描述

表1是易混淆法條實例，表中法條第347條是走私、販賣、運輸、制造毒品法條，法條第348條是非法持有毒品的法條，通過分析兩個法條的案情事實描述部分，發(fā)現(xiàn)其中包含許多與毒品相關(guān)的詞語，文本語義較為相似，在進行法條預(yù)測時容易相互混淆。

表1 易混淆法條實例

注：加粗字體為與“毒品”相關(guān)的相似或相同詞語。

2.2 篩選與組合

本文提出的模型首先根據(jù)法條預(yù)測中各法條的預(yù)測結(jié)果將法條劃分為易區(qū)分法條和易混淆法條，表2顯示了各法條的預(yù)測實驗結(jié)果。當(dāng)法條預(yù)測的準(zhǔn)確率、召回率、F1值高于法條平均指標(biāo)值，實驗認(rèn)為該法條為易區(qū)分法條，相反低于法條平均指標(biāo)值，則認(rèn)為該法條為易混淆法條。

對于易混淆法條，分析相關(guān)的法條內(nèi)容與對應(yīng)事實描述，將法條內(nèi)容、相應(yīng)事實描述相近的組合為易混淆法條

表2 各法條預(yù)測結(jié)果

集。我們將47個易混淆法條整理組合為11個易混淆法條集，對11個易混淆法條集進行編號。每個易混淆法條集包含法條預(yù)測時相互間容易混淆的多個法條，見表3。

2.3 模型構(gòu)建

實驗數(shù)據(jù)集中共涉及183個刑事法條，篩選組合整理為147個法條類別，其中包括11個易混淆法條集類別與136個易區(qū)分法條類別。易混淆法條預(yù)測模型可通過兩層學(xué)習(xí)機制實現(xiàn)。該模型的整體架構(gòu)如圖1所示，第一層分類學(xué)習(xí)中在易區(qū)分法條和易混淆集法條組建的147個新法條類別上訓(xùn)練分類器模型，第二層分類學(xué)習(xí)中分別訓(xùn)練11個易混淆法條集的分類器模型。我們利用新類別分類器模型完成第一層預(yù)測，預(yù)測結(jié)果為易混淆法條集或易區(qū)分法條。如果結(jié)果為易區(qū)分法條，則完成預(yù)測；如果結(jié)果為易混淆法條集，則調(diào)用相應(yīng)易混淆法條集模型完成第二層預(yù)測，輸出易混淆法條預(yù)測結(jié)果。模型中分類器采用卷積神經(jīng)網(wǎng)絡(luò)文本分類器。

表3 易混淆法條集

圖1 基于分層學(xué)習(xí)的易混淆法條預(yù)測模型

2.4 分類器

2.4.1 編碼

易混淆法條預(yù)測模型中分類器模型包含有輸入層、卷積層、池化層、全連接層、Softmax層。其中卷積層負(fù)責(zé)抽取文本的特征，最大池化層負(fù)責(zé)選擇最主要的特征值，Softmax用于預(yù)測在各個類別上的概率。在輸入層對文本進行向量化表示，通過將文本序列中對應(yīng)位置詞典元素的詞向量拼接起來，就得到整個文本序列的詞向量表示矩陣

x1∶n=x1⊕x2⊕…⊕xn

(1)

其中，⊕是詞向量連接運算符。xi是句子中第i個單詞的詞向量，xi∶i+j指的是xi,xi+1,…,xi+j共j+1個詞的詞向量。卷積操作涉及濾波器w，其應(yīng)用于h個詞的窗口以產(chǎn)生新特征。例如，在單詞xi∶i+h-1Xi∶i+h-1上一個窗口生成特征Ci

ci=f(w·xi∶i+h-1+b)

(2)

其中，b是一個偏置項，f是一個非線性函數(shù)。這個濾波器用于句子 {x1∶h,x2∶h+1,…,xn-h+1∶n} 中，產(chǎn)生一個特征集

c=[c1,c2,…,cn-h+1]

(3)

2.4.2 正則化

y=w·(z°r)+b

(4)

其中，z表示m個濾波器組成的特征集，°表示按元素逐個相乘操作，r表示掩模向量。

2.4.3 優(yōu)化

模型采用交叉熵作為損失函數(shù)。法條預(yù)測損失可以形式化為

(5)

3 實驗

為了驗證本模型在刑事案件預(yù)測中的有效性，本文基于中國裁判文書網(wǎng)的刑事數(shù)據(jù)構(gòu)建了不同規(guī)模的數(shù)據(jù)集，并利用SVM模型、CNN模型與RNN模型和本文的模型(hierarchical learning confusing law prediction model，HLCLPM)進行了比較實驗。

3.1 數(shù)據(jù)集

本文基于“中國裁判文書網(wǎng)”公開的刑事法律文書構(gòu)建Small和Large兩組數(shù)據(jù)集，其中每份數(shù)據(jù)由法律文書中的案情事實部分與引用法條兩部分組成。兩組數(shù)據(jù)集中涉及183個刑事法條，Small包括19.6萬條文書樣例，Large數(shù)據(jù)集包括150萬條文書樣例。在實驗中兩組數(shù)據(jù)集的劃分情況見表4。

3.2 基線

本文采用3種典型的文本分類模型作為實驗基線：

TFIDF+SVM模型：實現(xiàn)了(TFIDF)來提取輸入的文本特征，并采用SVM(support vector machine)作為分類。

表4 兩個數(shù)據(jù)集數(shù)量統(tǒng)計/條

RNN模型：采用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)作為文本分類器。

CNN模型：采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)文本分類器。本文HLCLPM模型的基礎(chǔ)模型，選用該模型作為對比，可以更好地體現(xiàn)出分層學(xué)習(xí)的思想可以幫助易混淆法條的預(yù)測。

3.3 實驗設(shè)置和評價指標(biāo)

本實驗卷積神經(jīng)網(wǎng)絡(luò)模型濾波窗口大小設(shè)置為3,4,5，詞向量維度大小為264維，全連接層神經(jīng)元為128，dropout保留比例為0.5，學(xué)習(xí)率為0.0001，bath_size大小為264。

實驗采用精確率(Precision，P)、召回率(Recall，R)、F1值(F-measure，F(xiàn))作為評價指標(biāo)。計算方式如下

(6)

(7)

(8)

其中，TP是模型將正例預(yù)測成正例的數(shù)目，F(xiàn)P是模型將負(fù)例預(yù)測成正例的個數(shù)，F(xiàn)N是模型將正例預(yù)測成負(fù)例的個數(shù)。

4 結(jié)果及分析

(1)實驗一：不同模型下法條預(yù)測

實驗對比了在兩組數(shù)據(jù)集下本文提出的模型與其它基線模型的預(yù)測結(jié)果。見表5。

表5 兩組數(shù)據(jù)集下各個模型法條預(yù)測的結(jié)果

其中加粗?jǐn)?shù)據(jù)表示最優(yōu)結(jié)果。表5顯示：各模型在Large數(shù)據(jù)集下評價指標(biāo)均優(yōu)于Small數(shù)據(jù)集的評價指標(biāo)，表明數(shù)據(jù)越大越有利于易混淆法條預(yù)測模型的訓(xùn)練。在相同數(shù)據(jù)集下本模型的評價指標(biāo)均取得最優(yōu)，表明基于分層學(xué)習(xí)的易混淆法條預(yù)測模型能較好完成易混淆法條預(yù)測。

(2)實驗二：驗證本模型在易混淆法條預(yù)測的有效性

為進一步驗證本模型能較好解決法條預(yù)測中易混淆法條預(yù)測問題，我們構(gòu)建了兩個易混淆法條數(shù)據(jù)集，Data1和Data2。Data1包括走私類法條、合同詐騙類法條、逃稅漏稅類法條11個易混淆的法條，Data2包括走私類法條、合同詐騙類法條、逃稅漏稅類法條、毒品類法條17個易混淆的法條。見表6。

表6 Data1和Data2統(tǒng)計/條

我們將本模型與在TFIDF+SVM、RNN、CNN這3個分類模型在數(shù)據(jù)集1與數(shù)據(jù)集2上的預(yù)測結(jié)果進行對比，見表7。

表7 模型在Data1和Data2上的預(yù)測結(jié)果

表7顯示，在數(shù)據(jù)集Data1和Data2上本模型的預(yù)測結(jié)果都取得最優(yōu)，表明本模型在處理易混淆法條預(yù)測上的有效性。

5 結(jié)束語

本文根據(jù)刑事案件的案情描述，專注于易混淆法條預(yù)測問題。我們通過分析各個法條預(yù)測結(jié)果并結(jié)合文書案情描述與法條內(nèi)容的相似度，將常用的183個刑事法條分為136個易區(qū)分法條與47個易混淆法條，易混淆法條進一步組合為11個易混淆法條集。針對法條預(yù)測中易混淆法條問題，我們構(gòu)建基于分層學(xué)習(xí)的易混淆法條預(yù)測模型，通過對易混淆法條集單獨訓(xùn)練分類模型，增強對易混淆法條相應(yīng)案情描述特征的學(xué)習(xí)能力。本文沒有將法條內(nèi)容用于易混淆法條預(yù)測之中，同時沒有考慮一個案件引用多個法條的情況。因此接下來我們的研究重點為：如何將法條內(nèi)容運用到法條預(yù)測之中，增加法條預(yù)測的司法可解釋性；如何解決易混淆法條中的一對多問題。