亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于注意力交互機(jī)制的智能司法預(yù)測(cè)方法研究

        2021-06-11 03:12:48譚紅葉王加偉趙紅燕
        關(guān)鍵詞:法條罪名編碼器

        譚紅葉,王加偉,李 茹,張 虎,趙紅燕

        (山西大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,山西 太原 030006)

        0 引 言

        目前,智能司法預(yù)測(cè)受到了法律界與學(xué)術(shù)界的廣泛關(guān)注,其目標(biāo)是提高法律人員的工作效率,促進(jìn)司法公平與公正,提升司法便民服務(wù)水平. 智能司法預(yù)測(cè)的核心任務(wù)包括自動(dòng)定罪與自動(dòng)量刑. 其中,自動(dòng)定罪又稱罪名預(yù)測(cè),是根據(jù)給定犯罪事實(shí)預(yù)測(cè)行為人所犯罪名.

        已有的罪名預(yù)測(cè)方法主要有兩種:統(tǒng)計(jì)分析方法和文本分類方法. 統(tǒng)計(jì)分析方法的主要思想是從大量屬于同一類罪名的歷史案例中提取共同模式,然后構(gòu)造相應(yīng)規(guī)則與統(tǒng)計(jì)算法模擬真實(shí)決策過程[1,2],但這類方法很難擴(kuò)展到不同罪名的案例中. 文本分類方法的主要思想是基于給定訓(xùn)練數(shù)據(jù)(一般由事實(shí)描述及相應(yīng)罪名組成)自動(dòng)學(xué)習(xí)分類模型,如:基于淺層事實(shí)文本表示的k-近鄰模型[3]、 基于深度神經(jīng)網(wǎng)絡(luò)的罪名預(yù)測(cè)模型[4,5]等. 目前,主流的方法主要采用基于深度學(xué)習(xí)的方法,不僅顯著提高了系統(tǒng)預(yù)測(cè)性能,而且不需要人工設(shè)計(jì)復(fù)雜的特征,但這類方法沒有充分利用對(duì)準(zhǔn)確定罪起重要作用的法律條文知識(shí),而且缺乏可解釋性.

        現(xiàn)實(shí)中,法官定罪的基本原則是以事實(shí)為依據(jù)、 以法律為準(zhǔn)繩. 其中,法律條文(簡(jiǎn)稱法條)對(duì)每種罪名的定義、 刑罰種類及刑罰幅度進(jìn)行了規(guī)范描述. 當(dāng)犯罪事實(shí)與某一法條的罪名定義一致時(shí),相應(yīng)罪名成立.

        圖1 給出了“受賄罪”的相關(guān)法條與相關(guān)案例. 可以看出相應(yīng)罪名定義與犯罪事實(shí)具有很強(qiáng)的一致性與關(guān)聯(lián)性. 如:“受賄罪”的法條定義中“國家工作人員、 職務(wù)便利、 收受他人財(cái)物”分別與犯罪事實(shí)中的“村民委員會(huì)主任、 職務(wù)便利、 收受賄送”一一對(duì)應(yīng). 示例中還可看出:法條是對(duì)罪名及其特征的概括性、 區(qū)分性定義,而犯罪事實(shí)是對(duì)犯罪行為的具體描述,因此二者之間是“概括-具體”的關(guān)系. 因此,引入法條并準(zhǔn)確建立罪名定義與犯罪事實(shí)的關(guān)聯(lián)映射,是提升罪名預(yù)測(cè)的準(zhǔn)確率與可解釋性的有效途徑.

        圖1 法條與犯罪事實(shí)對(duì)比示例Fig.1 An example of comparison between the articleand the criminal facts

        本文提出一個(gè)新方法將法條融合到罪名預(yù)測(cè)模型中. 該方法主要特點(diǎn)為:① 通過法條與事實(shí)之間的注意力機(jī)制,計(jì)算每個(gè)事實(shí)句的權(quán)重,并保留相關(guān)事實(shí)句,以獲得更好的犯罪事實(shí)表示; ② 基于事實(shí)-罪名預(yù)測(cè)與法條-罪名預(yù)測(cè)這兩個(gè)預(yù)測(cè)模型構(gòu)建聯(lián)合學(xué)習(xí)框架,從詞、 句子、 篇章3個(gè)層級(jí)準(zhǔn)確構(gòu)建了事實(shí)與法條的語義表示. 在3個(gè)基準(zhǔn)數(shù)據(jù)集上進(jìn)行了相關(guān)實(shí)驗(yàn)與可視化分析,結(jié)果表明,與非預(yù)訓(xùn)練語言模型相比,本文所提方法取得顯著的性能提升; 與BERT預(yù)訓(xùn)練語言模型相比,該方法在準(zhǔn)確率與可解釋性方面也取得了具有競(jìng)爭(zhēng)性的結(jié)果.

        1 相關(guān)工作

        罪名預(yù)測(cè)的研究已經(jīng)開展了幾十年. 從20世紀(jì)50年代開始,研究者們就嘗試采用統(tǒng)計(jì)分析方法預(yù)測(cè)罪名. 他們首先分析大量歷史案例,找到共同模式與規(guī)則,然后構(gòu)建統(tǒng)計(jì)算法來模擬決策過程[1,2,6-8]; 之后,人們又提出基于分類思想利用標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)算法(如K-最近鄰分類器)進(jìn)行罪名預(yù)測(cè)[3,9-11]. 但這些方法大多基于淺層的法律文檔表示,且訓(xùn)練數(shù)據(jù)通常較小,因此預(yù)測(cè)性能較差,不能有效處理復(fù)雜的法律案件.

        近幾年受神經(jīng)網(wǎng)絡(luò)在很多自然語言處理任務(wù)上取得實(shí)質(zhì)進(jìn)展的啟發(fā)[12-15],研究人員嘗試將罪名預(yù)測(cè)任務(wù)形式化為一個(gè)深層神經(jīng)網(wǎng)絡(luò)分類任務(wù)來解決. 如Hu等人[5]提出基于屬性的注意力機(jī)制和多任務(wù)學(xué)習(xí)模型,來提升小樣例易混淆罪名的預(yù)測(cè)準(zhǔn)確率; Zhong等人[16]提出拓?fù)涠嗳蝿?wù)學(xué)習(xí)框架,將法條、 罪名與刑期之間的依賴關(guān)系融合到統(tǒng)一的司法判決框架中,在所有預(yù)測(cè)子任務(wù)上取得了一定的提升; 與Zhong等人[16]類似,為了有效利用法條、 罪名與刑期多個(gè)子任務(wù)間的依賴關(guān)系,Yang等人[17]設(shè)計(jì)了一個(gè)多視角的前向預(yù)測(cè)和后向驗(yàn)證框架,并通過注意機(jī)制將事實(shí)描述的詞語搭配特征整合到模型中,獲得了所有預(yù)測(cè)任務(wù)的改進(jìn); Ye等人[18]從自然語言生成的角度,基于序列到序列模型自動(dòng)生成法院意見; Zhong等人[19]針對(duì)可解釋性不足的問題,提出了一種通過反復(fù)提問和回答的強(qiáng)化學(xué)習(xí)方法,為判斷預(yù)測(cè)提供可解釋的結(jié)果. 此外,也有學(xué)者嘗試從基于外部知識(shí)指導(dǎo)的角度,引入法條等知識(shí)在預(yù)測(cè)過程中增加外部語義信息[4,20,21]. 如Luo等人[4]利用法條增強(qiáng)罪名預(yù)測(cè):首先構(gòu)建基于支持向量機(jī)(SVM)的法條過濾器[22],篩選出top-k相關(guān)法條,然后使用法條注意力模塊選擇支持度最強(qiáng)的法條,最后將事實(shí)和法條表示拼接起來作為罪名預(yù)測(cè)的輸入; Cheng等人[20]提出了一種基于知識(shí)注意的神經(jīng)網(wǎng)絡(luò)模型,引入有關(guān)罪名的法律圖式知識(shí),并利用知識(shí)的層次表示作為區(qū)分易混淆罪名的特征; Xu等人[21]提出一種新的圖形神經(jīng)網(wǎng)絡(luò)來自動(dòng)學(xué)習(xí)易混淆法條之間的細(xì)微差別,并設(shè)計(jì)了一種新的注意機(jī)制,充分利用學(xué)習(xí)到的差別,從事實(shí)描述中提取區(qū)分性特征.

        本文工作受文獻(xiàn)[4]啟發(fā),但與該文獻(xiàn)不同的是:① 文獻(xiàn)[4]基于SVM的法條過濾器是獨(dú)立于罪名預(yù)測(cè)模型訓(xùn)練的,因此,可能會(huì)導(dǎo)致額外的誤差; 本文采用聯(lián)合學(xué)習(xí)框架,不會(huì)引入額外誤差. ② 文獻(xiàn)[4]只是簡(jiǎn)單地將事實(shí)隱向量和法條隱向量直接拼接得到最終表達(dá),缺乏深層次語義交互; 本文通過注意力機(jī)制,對(duì)事實(shí)與法條建立緊密的互動(dòng)機(jī)制,關(guān)注事實(shí)句與法條之間的關(guān)鍵語義交互作用,自動(dòng)調(diào)整事實(shí)句與法條之間的關(guān)聯(lián)度,然后再基于關(guān)聯(lián)度獲得更好的事實(shí)隱表示,因此模型獲得了更好的法條、 事實(shí)的語義表示. 模型在149個(gè)常見罪名(罪名種類比文獻(xiàn)[4]多了將近3倍)的數(shù)據(jù)集上取得了更優(yōu)的性能,表明本文方法更具通用性.

        2 方 法

        本文提出一個(gè)基于事實(shí)-法條注意力交互機(jī)制的罪名預(yù)測(cè)方法, 該方法的總體框架結(jié)構(gòu)如圖2 所示.

        圖2 模型總體框架示意圖Fig.2 Framework of our model

        2.1 事實(shí)編碼器

        本文利用注意力序列編碼器對(duì)事實(shí)進(jìn)行編碼,如圖3 所示,該編碼器包含Bi-GRU (Bi-directional Gated Recurrent Units)[23]和注意力模塊[14]. Bi-GRU是長(zhǎng)短期記憶模型(LSTM)的變體[13],它通過門控機(jī)制優(yōu)化參數(shù)大小,但保留了LSTM長(zhǎng)距離依賴的有效性. 引入Bi-GRU編碼器來融合事實(shí)-法條中詞之間的語義上下文信息. 同時(shí)引入注意力機(jī)制自動(dòng)計(jì)算和分配詞的權(quán)重,從而更精確地捕捉重要顯著的特征.

        圖3 注意力序列編碼器Fig.3 Attentive sequential encoder

        (1)

        (2)

        (3)

        2.2 基于法條-罪名分類器的法條編碼器

        本文構(gòu)建注意力交互機(jī)制的目標(biāo)是希望對(duì)事實(shí)和罪名標(biāo)簽建立直接關(guān)聯(lián),但罪名是類別標(biāo)簽,通常很短,只包含稀疏或有限的語義信息. 由于法條包含對(duì)罪名的詳細(xì)定義或解釋,是罪名的語義擴(kuò)展,因此引入法條對(duì)罪名與事實(shí)之間的相容性進(jìn)行間接建模.

        (4)

        與事實(shí)編碼器不同,法條編碼器額外增加了一個(gè)法條-罪名分類器來實(shí)現(xiàn)法條和事實(shí)的聯(lián)合表示. 由于法條是對(duì)應(yīng)罪名的語義延伸,可能會(huì)帶來一些噪聲,從而影響語義表達(dá)的準(zhǔn)確性. 為了減少由此產(chǎn)生的語義偏差,受自動(dòng)編碼器(Autoencoder,AE)的啟發(fā),采用一個(gè)預(yù)測(cè)器,使法條語義與其對(duì)應(yīng)的罪名標(biāo)簽更加一致.

        分類器以每個(gè)法條的嵌入ak作為輸入,并執(zhí)行罪名預(yù)測(cè)任務(wù). 此外,利用基于法條的損失函數(shù),通過反向傳播對(duì)法條向量進(jìn)行微調(diào),可以使法條的隱表示更快地收斂到一個(gè)固定的精確值. 法條-罪名分類器引起的法條-罪名損失與事實(shí)-罪名損失通過線性組合,實(shí)現(xiàn)聯(lián)合優(yōu)化. 該模塊在圖2中以法條-罪名分類器表示.

        2.3 法條-事實(shí)注意力交互機(jī)制

        通常,事實(shí)描述包含多個(gè)句子,但不是每一句都對(duì)罪名預(yù)測(cè)有用,或都能映射到法條上. 因此,本文設(shè)計(jì)了一個(gè)法條-事實(shí)注意力交互機(jī)制,自動(dòng)為每個(gè)事實(shí)句分配相應(yīng)權(quán)重,去除不相關(guān)句子,獲得更好的事實(shí)表示. 受閱讀理解任務(wù)原文與問題的相互作用機(jī)制[20]的啟發(fā),我們采用相似方法來計(jì)算“句子-法條”的關(guān)聯(lián)度,并將關(guān)聯(lián)度作為句子重要性的衡量標(biāo)準(zhǔn). 句子-法條對(duì)之間的相關(guān)性用式(5)來計(jì)算

        (5)

        該初始關(guān)聯(lián)度僅僅通過事實(shí)和法條的隱層表示直接計(jì)算得到,難以根據(jù)不同上下文動(dòng)態(tài)調(diào)整. 為了基于訓(xùn)練數(shù)據(jù)動(dòng)態(tài)學(xué)習(xí)高階關(guān)聯(lián)度(軟關(guān)聯(lián)值),采用一層感知機(jī)網(wǎng)絡(luò)MLP(Multi-Layer Perceptron)模塊來計(jì)算軟關(guān)聯(lián)值,并將ReLU激活函數(shù)引入非線性,以提升模型擬合能力. 形式上,我們聚合交互特征Ii,:,其中Ii,:代表關(guān)聯(lián)度矩陣I(包含了句子si與法條ak的關(guān)聯(lián)值)的第i行. 軟關(guān)聯(lián)值αsi具體按照式(6)~式(8)計(jì)算

        qi,:=ReLU(WaIi,:+ba),

        (6)

        ui=MaxPooling(qi,:),

        (7)

        (8)

        式中:qi,:為句子-法條關(guān)聯(lián)值的隱層表示; MaxPooling為最大池化操作,用于完成注意力權(quán)重的特征整合; 軟關(guān)聯(lián)值αsi可以被視作基于法條約束的第i個(gè)事實(shí)句子的語義重要程度.

        2.4 訓(xùn)練和優(yōu)化

        (9)

        (10)

        各部分的損失計(jì)算如式(11)、 式(12)

        (11)

        (12)

        式中:b代表每批事實(shí)輸入的批大小(batch-size),c代表法條總數(shù). 將上述兩部分結(jié)合起來,得到最終的總損失函數(shù)

        Ltotal=Lfact+γ·Lart,

        (13)

        式中:γ是法條預(yù)測(cè)損失部分的權(quán)重,具體使用Adam優(yōu)化算法最小化總損失Ltotal.

        3 實(shí)驗(yàn)及分析

        3.1 數(shù)據(jù)集

        本文采用近期罪名預(yù)測(cè)工作中經(jīng)常使用的3個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集,其中的樣例來源于中國裁判文書網(wǎng)公開的電子文書,是Hu等人針對(duì)小樣本和易混淆類罪名預(yù)測(cè)問題所構(gòu)建[5]. 3個(gè)數(shù)據(jù)集分別為Criminal-S, Criminal-M和Criminal-L,主要區(qū)別在于規(guī)模不同,但均包含149個(gè)罪名. 數(shù)據(jù)集具體信息見表 1.

        表 1 數(shù)據(jù)集的劃分情況Tab.1 Splitting of the datasets

        3.2 實(shí)現(xiàn)細(xì)節(jié)

        犯罪事實(shí)經(jīng)常包含數(shù)字特征,如:受賄金額、 毒品重量、 犯罪年齡,這些特征不能直接建模. 為提升模型擴(kuò)展能力,我們構(gòu)建了離散化步驟,基于這些特征的分布將其轉(zhuǎn)化成類別型特征. 如毒品重量分為3類:輕、 中等、 重; 年齡分為成年、 未成年兩類等.

        參數(shù)設(shè)置上,使用skip-gram模型預(yù)訓(xùn)練詞向量[24],維度設(shè)置為256. 基于法條長(zhǎng)度的統(tǒng)計(jì),將法條的輸入序列長(zhǎng)度固定為20. GRU隱狀態(tài)的size設(shè)為128,設(shè)定學(xué)習(xí)率隨著訓(xùn)練的進(jìn)行逐漸衰減,初始學(xué)習(xí)率為0.001,衰減率為0.8. 使用 dropout策略避免過擬合,dropout rate設(shè)為0.5. 優(yōu)化器使用AdamOptimizer[25].

        使用準(zhǔn)確率Acc.與Macro-F1(F1)來評(píng)價(jià)實(shí)驗(yàn)中所有方法.

        3.3 結(jié)果與分析

        本文與6個(gè)強(qiáng)基線系統(tǒng)進(jìn)行了對(duì)比,包括文本分類模型與罪名預(yù)測(cè)模型,其中有5個(gè)是非預(yù)訓(xùn)練語言模型,另一個(gè)是Bert預(yù)訓(xùn)練語言模型[26]. 具體為:① 基于TFIDF表示的SVM分類模型[27]; ② 具有多個(gè)不同卷積與最大池化的CNN事實(shí)編碼器; ③ 具有最大池化層的兩層LSTM編碼器; ④ Luo等人提出的罪名預(yù)測(cè)與法條抽取聯(lián)合建模的Law Att. 模型[4]; ⑤ Hu等人提出的基于屬性的罪名預(yù)測(cè)模型Attribute Att.[5]; ⑥ 專門為罪名預(yù)測(cè)精調(diào)后的Bert模型.

        表 2 與非預(yù)訓(xùn)練語言模型的對(duì)比結(jié)果Tab.2 Comparison results with non pre-trained language model

        表 2 給出了本文模型與5個(gè)非預(yù)訓(xùn)練語言模型的對(duì)比結(jié)果. 可以看出,本文所提方法在3個(gè)數(shù)據(jù)集上的Acc.與F1值均明顯超過其他非預(yù)訓(xùn)練語言模型. 尤其是在Criminal-L數(shù)據(jù)集上,本文方法的F1值比最好的非預(yù)訓(xùn)練語言模型(Attribute Att.)高6%.

        值得指出的是,Hu構(gòu)造3個(gè)數(shù)據(jù)集的主要目標(biāo)是驗(yàn)證模型Attribute Att.在小樣本易混淆案罪名上的有效性. 盡管我們不是面向該類問題,但本文方法無論數(shù)據(jù)集規(guī)模如何,都取得了很好的結(jié)果.

        從表 2 還可看出,本文方法在Criminal-S, Criminal-M, Criminal-L數(shù)據(jù)集上的F1值分別比Law Att.模型高了13.7%, 6.2%和10.7%. 正如相關(guān)工作部分所指出的,盡管Luo等人利用基于淺層文本表示的SVM模型選擇top-k個(gè)相關(guān)法條,但該過程可能會(huì)引入錯(cuò)誤并進(jìn)行錯(cuò)誤傳播. 本文所提方法沒有引入額外的法條抽取步驟,而是關(guān)注每個(gè)事實(shí)句與法條的關(guān)聯(lián)交互. 利用這種新的法條-事實(shí)交互機(jī)制,可以產(chǎn)生相應(yīng)的關(guān)聯(lián)度矩陣賦予事實(shí)相關(guān)部分或不相關(guān)部分以相應(yīng)權(quán)重,從而獲得更好的隱層語義表示. 這一過程很好地模擬了真實(shí)世界中人類法官利用相關(guān)法條核實(shí)事實(shí)描述,并給出相應(yīng)罪名的情況.

        表 3 與BERT模型的實(shí)驗(yàn)結(jié)果對(duì)比Tab.3 Comparison results with BERT

        表 3 顯示了與BERT預(yù)訓(xùn)練語言模型的詳細(xì)比較結(jié)果. 可以發(fā)現(xiàn)本文模型在Acc.上可以達(dá)到與BERT相當(dāng)?shù)慕Y(jié)果. 但是,在Criminal-S 和 Criminal-M數(shù)據(jù)集上的 F1值與Bert相比具有明顯差距. 可能的原因在于:這些不正確罪名出現(xiàn)次數(shù)很少; 事實(shí)與法條對(duì)相同語義的描述差別很大,具體表現(xiàn)為法條用詞很抽象,事實(shí)用詞很具體. 而本文模型不能在小樣本條件下學(xué)習(xí)到準(zhǔn)確的事實(shí)-法條語義關(guān)聯(lián).

        但是,本文模型結(jié)構(gòu)相對(duì)簡(jiǎn)潔,而且通過利用分層注意機(jī)制(如3.6所示)在給定的事實(shí)中選擇出更富含信息量的詞和句子,因此具有更好的可解釋性. 此外,本文模型通過采用法條這種重要的領(lǐng)域知識(shí)進(jìn)行決策,這些知識(shí)提供了另一種形式的可解釋性.

        本文的模型參數(shù)γ是法條-罪名預(yù)測(cè)損失權(quán)重懲罰因子. 通過敏感性分析,發(fā)現(xiàn)該參數(shù)對(duì)模型性能幾乎沒有影響,具體見表 4. 這表明本文模型在聯(lián)合損失優(yōu)化過程中具有良好的魯棒性.

        表 4 不同懲罰因子γ下獲得的實(shí)驗(yàn)結(jié)果Tab.4 Results with different penalty factor(γ) values

        3.4 消融實(shí)驗(yàn)

        本文方法的特點(diǎn)是法條-事實(shí)交互機(jī)制與基于事實(shí)、 法條聯(lián)合嵌入表示的預(yù)測(cè)器的融合. 設(shè)計(jì)了消融實(shí)驗(yàn)來驗(yàn)證這兩個(gè)模塊的有效型. 具體結(jié)果如表 5 所示,其中,w/o Joint表示刪除聯(lián)合表示模塊(即,法條-罪名預(yù)測(cè)器),使得Lart不參與總損失最小化的優(yōu)化過程. 可以觀察到,刪除法條-罪名預(yù)測(cè)器后,性能下降,其中F1值下降了2.8%. w/o Article表示刪除了法條-事實(shí)交互機(jī)制,也就是將模型退化成了初始的Bi-GRU編碼器. 發(fā)現(xiàn)模型性能衰退明顯,F(xiàn)1值在Criminal-L數(shù)據(jù)集上降低了11.6%. 綜上可以看出,兩個(gè)模塊在模型中都起到關(guān)鍵作用,其中事實(shí)-法條注意力交互機(jī)制對(duì)最終的預(yù)測(cè)更為重要.

        表 5 消融實(shí)驗(yàn)結(jié)果Tab.5 Results of ablation

        3.5 可視化分析

        為了表明本文模型的語義表示能力,使用t-SNE算法[28]在二維平面中對(duì)事實(shí)向量進(jìn)行可視化. 如圖4 所示,不同數(shù)字代表不同罪名,每個(gè)點(diǎn)代表一個(gè)犯罪事實(shí)文本.

        圖4 犯罪事實(shí)表示的t-SNE 示意圖Fig.4 Figure of t-SNE of criminal fact representation

        可以觀察到,同類罪名犯罪事實(shí)的語義表示接近,不同罪名的語義表示差異明顯. “引誘、 教唆、 欺騙他人吸毒”等罪名與“走私、 販賣、 運(yùn)輸、 制造毒品”等罪名的空間位置相鄰,而與“過失致人死亡”罪的空間位置較遠(yuǎn),此結(jié)果符合現(xiàn)實(shí)中各罪名的真實(shí)語義.

        圖5 給出一個(gè)被告被判挪用學(xué)校公款的案例. 其中,淺色表示事實(shí)句重要程度,深色表示詞語重要程度. 可以看出,本文模型準(zhǔn)確定位出了“利用” “便利” “挪用” “公款”等關(guān)鍵詞及其相應(yīng)句子. 從圖中還可看出,通過法條-事實(shí)交互機(jī)制獲得的句子權(quán)重可以引導(dǎo)和約束詞-注意力權(quán)重.

        圖5 層次注意力機(jī)制的可視化示例Fig.5 Visualization of the hierarchical attentive mechanism

        3.6 模型可解釋性示例分析

        本文模型不僅比現(xiàn)有的大多數(shù)方法更精確,而且在給定事實(shí)中選擇的相關(guān)詞和相關(guān)句子具有更好的解釋能力. 如圖5所示,將一個(gè)案例可視化,并給出直觀的解釋. 圖中每一行都是一個(gè)句子(太長(zhǎng)的句子只給出一部分示例). 其中,淺色表示句子的權(quán)重,深色表示詞的權(quán)重. 由于本文引入了層次結(jié)構(gòu),可以通過句子權(quán)重來調(diào)整約束詞的權(quán)重,以確保只強(qiáng)調(diào)重要句子中的重要詞.

        圖5 所示為被告人挪用公款罪. 很明顯,我們的模型可以捕捉到“挪用”、 “公款”及其對(duì)應(yīng)的句子. 此外,含有不相關(guān)詞語的句子,則不予考慮. 表明從法條-事實(shí)交互機(jī)制中獲得的句子權(quán)重可以指導(dǎo)和抑制詞的注意權(quán)重.

        4 結(jié) 論

        本文提出了一種新方法將法條和事實(shí)整合到罪名預(yù)測(cè)任務(wù)中. 該方法首先建立了事實(shí)與法條之間的內(nèi)在交互機(jī)制,以衡量事實(shí)句與法條之間的關(guān)聯(lián)度; 然后,基于事實(shí)-罪名預(yù)測(cè)與法條-罪名預(yù)測(cè)這兩個(gè)預(yù)測(cè)模型構(gòu)建聯(lián)合學(xué)習(xí)框架,從詞、 句子、 篇章3個(gè)層級(jí)準(zhǔn)確構(gòu)建了事實(shí)與法條的語義表示. 在3個(gè)基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的非預(yù)訓(xùn)練語言模型相比,本文模型取得的效果顯著提升,并取得了與預(yù)訓(xùn)練語言模型BERT相當(dāng)?shù)慕Y(jié)果. 此外,可視化結(jié)果也顯示了本文模型具有更好的解釋性和有效性.

        猜你喜歡
        法條罪名編碼器
        基于FPGA的同步機(jī)軸角編碼器
        從法條的公司法到實(shí)踐的公司法
        基于PRBS檢測(cè)的8B/IOB編碼器設(shè)計(jì)
        論民法對(duì)人身權(quán)的保護(hù)
        刑法罪名群論綱*
        從法條的公司法到實(shí)踐的公司法
        商(2016年20期)2016-07-04 01:04:28
        重新認(rèn)識(shí)濫用職權(quán)和玩忽職守的關(guān)系*——兼論《刑法》第397條的結(jié)構(gòu)與罪名
        刑法論叢(2016年2期)2016-06-01 12:14:25
        刑法“從業(yè)禁止”法條的法律性質(zhì)及改革方向
        JESD204B接口協(xié)議中的8B10B編碼器設(shè)計(jì)
        電子器件(2015年5期)2015-12-29 08:42:24
        減少死刑的立法路線圖
        老熟妇Av| 极品少妇xxxx精品少妇偷拍| 国产麻豆精品精东影业av网站| 最近中文字幕完整版免费 | 99热爱久久99热爱九九热爱| 国产免费二区三区视频| 一本一道vs无码中文字幕| 国产真实老熟女无套内射| 久久久久国产一级毛片高清版A | 鲁丝一区鲁丝二区鲁丝三区| 国产一区二区三区在线观看蜜桃| 久久婷婷综合激情五月| 强开少妇嫩苞又嫩又紧九色| 亚洲av永久无码国产精品久久| 久久青青草原亚洲AV无码麻豆| 亚洲天堂免费一二三四区| 亚洲第一女人的天堂av| 丰满大爆乳波霸奶| 欧美日韩中文国产一区发布| 白色橄榄树在线免费观看| 国产精品黄色av网站| 男女真人后进式猛烈视频网站 | 国产午夜精品av一区二区三| 亚洲一二三区免费视频| 欧美成人猛交69| 国产主播一区二区三区在线观看| 天堂av无码大芭蕉伊人av孕妇黑人 | 亚洲最好看的中文字幕| 窝窝午夜看片| 国产97色在线 | 免| 亚洲免费av第一区第二区| 亚洲国产精品一区二区毛片| 中文字幕人妻无码一夲道| 97人妻视频妓女网| 少妇一级内射精品免费| 日本一区二区三区视频网站| 亚洲女初尝黑人巨高清| 无码天堂亚洲国产av麻豆| 亚洲精品色播一区二区| 乱码窝窝久久国产无人精品| 粉嫩虎白女毛片人体|