亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        卷積神經(jīng)網(wǎng)絡(luò)在案件分類上的應(yīng)用

        2019-10-08 06:52:16李昊泉史夢凡陳舒楠
        軟件 2019年4期
        關(guān)鍵詞:優(yōu)化算法文本分類卷積神經(jīng)網(wǎng)絡(luò)

        李昊泉 史夢凡 陳舒楠

        摘 ?要: 幾年前,機(jī)器學(xué)習(xí)在司法方面的應(yīng)用被提出并得到迅速發(fā)展。本文通過對判決文書的學(xué)習(xí),將訓(xùn)練出的模型以文本分類的方式,用于協(xié)助辦案人員進(jìn)行罪名預(yù)測:1、在權(quán)威網(wǎng)站爬取大量判決文書,進(jìn)行信息預(yù)處理后,提煉出較為精煉的文本數(shù)據(jù)和罪名標(biāo)簽;2、對文本進(jìn)行分詞、結(jié)構(gòu)化處理、構(gòu)成詞匯表并與相應(yīng)的詞向量進(jìn)行1對1映射;3、應(yīng)用谷歌的Tensorflow搭建卷積神經(jīng)網(wǎng)絡(luò),設(shè)置參數(shù),訓(xùn)練模型并測試;4、反復(fù)調(diào)整參數(shù)后,改進(jìn)優(yōu)化算法,使分類效果理想。最終分類準(zhǔn)確率在95%以上。

        關(guān)鍵詞: 卷積神經(jīng)網(wǎng)絡(luò);文本分類;罪名預(yù)測;分詞;優(yōu)化算法

        中圖分類號: TP183 ? ?文獻(xiàn)標(biāo)識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2019.04.049

        本文著錄格式:李昊泉,史夢凡,陳舒楠,等. 卷積神經(jīng)網(wǎng)絡(luò)在案件分類上的應(yīng)用[J]. 軟件,2019,40(4):222225

        【Abstract】: Several years ago, application of machine learning in judicial field was proposed and developed rapidly. Through judgment documents study, the article applies trained model for assisting case handlers in crime prediction with text categorization: 1. collect a large number of judgment documents on authoritative websites, after preprocessing information, extract refined text data and accusation labels; 2. carry on word segmentation and structural processing of texts to form vocabulary, map with corresponding word vectors 1 to 1; 3. construct convolution neural network with Google's Tensorflow, set parameters, train model and test; 4. after adjusting parameters repeatedly, improve and optimize algorithm to make classification effect ideal, and final classification accuracy is over 95%.

        【Key words】: Convolutional neural network; Text classification; Crime prediction; Word segmentation; Optimization algorithm

        0 ?引言

        近年來,機(jī)器學(xué)習(xí)飛速發(fā)展,尤其在自然語言處理、文本分類方面,人工智能應(yīng)用廣泛。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)不僅在圖像領(lǐng)域取得了很大的成就,近年來在文本分類方向也大放異彩[1]。

        當(dāng)前對案件的定性普遍由人工進(jìn)行,使用機(jī)器學(xué)習(xí)搭建經(jīng)濟(jì)類犯罪案件偵查系統(tǒng)后,有利于增強(qiáng)調(diào)查者的能力,可以有效縮短偵查程序的過程,從而提高案件處理效率。

        我們計劃選取近年來頻發(fā)的經(jīng)濟(jì)類案件作為訓(xùn)練數(shù)據(jù),在中國裁判文書網(wǎng)上爬取判決文書作為訓(xùn)練材料,訓(xùn)練完成的模型可以對輸入的案件陳述進(jìn)行快速分類,達(dá)到罪名預(yù)測的目的。執(zhí)法機(jī)關(guān)可以在案件定性時結(jié)合相關(guān)人員的意見進(jìn)行快速且準(zhǔn)確的判斷。為此,我們將設(shè)想付諸實現(xiàn)。

        1 ?相關(guān)技術(shù)介紹

        1.1 ?中文分詞

        中文分詞在自然語言處理中的重要作用不言而喻,主要包含三個過程:文本預(yù)處理、文本特征提取、分類模型構(gòu)建。判決文書具有嚴(yán)謹(jǐn)、準(zhǔn)確等特征,因此本項目將重點放在文本預(yù)處理上。預(yù)處理過程中最重要的是分詞,我們選擇使用基于統(tǒng)計的分詞方法[2-3]。該方法主要統(tǒng)計上下文中字符與字符相鄰出現(xiàn)的概率,兩字符相鄰出現(xiàn)的概率越高,它們聯(lián)合起來恰好組成一個詞語的概率也越大。中文中組成詞匯的幾個字常一同出現(xiàn),由此來達(dá)到分詞的效果。

        迄今為止,中文分詞已經(jīng)有許多較為成熟的工具包,如jieba、pynlpir、scseg等。本文選取的jieba工具具有多種分詞模式,對案件文書分詞有良好的效果[4]。

        1.2 ?文檔、詞項矩陣

        分詞完成后需將數(shù)據(jù)結(jié)構(gòu)化處理才能進(jìn)行下一步分析,本項目中所采用的結(jié)構(gòu)化處理方式為文檔、詞項矩陣法,即Document-Term Matrix。以項目中的文檔為例,我們在眾多案件類型中選取信用卡詐騙和合同詐騙兩種類型的案件,文本一[經(jīng)濟(jì),犯罪,信用卡,詐騙,調(diào)查],文本二[經(jīng)濟(jì),犯罪,合同詐騙,研究],則基于這兩個文本構(gòu)建出的詞典包含7個不同的特征詞匯,{1:經(jīng)濟(jì),2:犯罪,3:信用卡,4:詐騙,5:調(diào)查,6:合同詐騙。7:研究},經(jīng)過轉(zhuǎn)化即可顯示為(1,1,1,1,1,0,0,)和(1,1,0,0,0,1,1),其中向量元素表示對應(yīng)詞匯出現(xiàn)的次數(shù),兩向量合并則獲得文檔-詞項矩陣。本項目中我們選用的轉(zhuǎn)化庫為scikit-learn庫。

        1.3 ?優(yōu)化算法

        優(yōu)化是指改變 x 以最小化或最大化某個函數(shù) f(x)的任務(wù)。對其進(jìn)行最小化時,也稱為損失函數(shù)。

        猜你喜歡
        優(yōu)化算法文本分類卷積神經(jīng)網(wǎng)絡(luò)
        故障樹計算機(jī)輔助分析優(yōu)化算法研究與應(yīng)用
        基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識別算法
        基于組合分類算法的源代碼注釋質(zhì)量評估方法
        基于貝葉斯分類器的中文文本分類
        混沌優(yōu)化算法在TSP問題的應(yīng)用
        基于蟻群智能算法的研究文本分類
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
        軟件工程(2016年8期)2016-10-25 15:47:34
        文本分類算法在山東女子學(xué)院檔案管理的應(yīng)用
        科技視界(2016年24期)2016-10-11 09:36:57
        再制造閉環(huán)供應(yīng)鏈研究現(xiàn)狀分析
        色综合久久精品中文字幕| 新婚人妻不戴套国产精品| 中文字幕在线日亚洲9| 亚洲日韩欧美国产另类综合| 国产在线视欧美亚综合| 亚洲第一页在线观看视频网站| 精品在线观看一区二区视频| 77777_亚洲午夜久久多人| 久久精品麻豆日日躁夜夜躁| 久久精品国产亚洲av电影| 成年女人片免费视频播放A| av影片手机在线观看免费网址| 日本熟妇人妻xxxx| 丰满人妻av无码一区二区三区| 亚洲男人天堂2017| 亚洲欧美日韩一区在线观看| 国产精品视频白浆免费视频| 乱色欧美激惰| 人妻被黑人粗大的猛烈进出| 精品人伦一区二区三区蜜桃麻豆 | 无遮无挡三级动态图| 日本道免费精品一区二区| 国产一区二区三区中出| 无码av中文一区二区三区桃花岛| 青青草视频免费观看| 亚洲免费一区二区三区视频| 丰满巨臀人妻中文字幕| 国产人成无码视频在线观看| 女人与牲口性恔配视频免费| 放荡的闷骚娇妻h| 亚洲日韩AV无码美腿丝袜 | 日本人妻系列中文字幕| 国产熟妇另类久久久久| 国产中文制服丝袜另类| 国产一区二区三区亚洲精品| 一本色道久久亚洲av红楼| 粗大的内捧猛烈进出少妇| 亚洲国产精品特色大片观看完整版| 甲状腺囊实性结节三级| 国产乱人伦偷精品视频还看的| 色综合久久蜜芽国产精品|