亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于回溯法的中文分詞技術

        2020-01-16 05:57:04周寅黃鋆
        電子技術與軟件工程 2019年21期
        關鍵詞:成詞詞尾剪枝

        文/周寅 黃鋆

        1 引言

        在海量文本數(shù)據(jù)處理的當下,多個領域運用到自然語言處理的技術,在多個任務處理中,任重而道遠的關鍵技術—中文分詞。在中文信息處理中,中文分詞占據(jù)著重要的地位,然而在中文分詞技術中,歧義詞和未登錄詞是該技術的重難點。清華大學的黃昌寧老先生[2],總結出了中文分詞存在的四個重難點:

        (1)漢語切分的規(guī)范問題;

        (2)分詞和理解誰先誰后;

        (3)中文分詞出現(xiàn)的歧義消解;

        (4)識別未登錄詞。

        2 基于回溯法的中文分詞技術的研究

        對文本數(shù)據(jù)的標注大致分為三種:

        2-tag:對中文文本進行標注I,O。I表示詞首;O表示詞尾。

        例如:武漢船舶職業(yè)技術學院。

        武 I 漢 O 船 I 舶 O 職 I 業(yè) O 技 I 術 O 學 I 院 O

        4-tag:對中文文本進行標注S,B,M,E。S表示字單獨成詞;B:表示詞的第一個字;M:表示詞的中間位置的字;E:表示詞的位置位于詞尾。

        例如:武漢船舶職業(yè)技術學院。

        武 B 漢 E 船 B 舶 E 職 B 業(yè) E 技 B 術 E 學 B 院 E 。 S

        6-tag:即對文本中詞語進行S,B,M1,M2,M3,E標注。S:表示文本中的字單獨成詞;B:表示文本中的字所在詞語中的首位;M1:標識詞組首個字符;M2:標識詞組第二個字符;M3:標志文本中詞語的中間位置;E:標志文本詞尾。由于在中文詞典中,詞語的最長極限就是六個字構成的詞語。

        根據(jù)字向量的技術,將文本數(shù)據(jù)中的有用信息進行學習,生成字向量。利用條件隨機場,對文本數(shù)據(jù)中的生成的標簽進行學習,產生最優(yōu)解。

        我們的方法,利用回溯法中的左剪枝法,將詞標注的出現(xiàn)關聯(lián)詞相同的情況,將其剪枝;利用右剪枝法,將單獨成詞的后序文字剪掉,節(jié)省了時間復雜度,因此使得分詞的技術達到最佳?;厮莘P椭形姆衷~如圖1所示。

        實驗結果如圖2。

        根據(jù)圖2而言,在準確率中,調劑隨機場結合詞向量的技術明顯優(yōu)于單純的條件隨機場技術的中文分詞,然而相對于回溯法的中文分詞技術,要明顯的不足。在召回率方面,我們的技術明顯優(yōu)于前兩者,并且F值也是要高于前兩者。詳見表1。

        表1

        圖1:回溯法模型中文分詞

        圖2:搜狗語料庫實驗對比圖

        3 實驗小結

        實驗中我們利用回溯法進行對文本的操作,發(fā)現(xiàn)用我們的回溯法改進的中文分詞技術比傳統(tǒng)的條件隨機場方法中的準確率要高出5.9%,相對條件隨機場與詞向量的合作要高出0.6%。召回率也高出了條件隨機場的3.3%,比條件隨機場和詞向量的要高出0.8%。在F值中也要明顯的優(yōu)于前兩者。

        4 展望與發(fā)展

        今后的學習中,我們將進一步利用基礎的算法分析案例,對中文分詞進行改進與優(yōu)化,使得我們的精確度和召回率都有所提升。

        猜你喜歡
        成詞詞尾剪枝
        人到晚年宜“剪枝”
        基于YOLOv4-Tiny模型剪枝算法
        -CK Sounds
        詞尾與詞綴的區(qū)別研究
        “湊合”成詞及詞義演變考.
        小說月刊(2017年11期)2018-01-03 07:50:55
        先秦形容詞性反義并列詞語成詞規(guī)律考
        再論“睡覺”成詞的時代
        東方教育(2017年14期)2017-09-25 16:53:37
        剪枝
        天津詩人(2017年2期)2017-03-16 03:09:39
        “企業(yè)”的成詞及詞義內涵考釋
        Playing with “g”
        青青草大香蕉视频在线观看| 国产在线精品一区二区三区不卡 | 日韩中文在线视频| 国产360激情盗摄一区在线观看 | 午夜爽爽爽男女免费观看影院| 亚洲国产精品无码专区影院| 丰满女人又爽又紧又丰满| 久久久久久久综合日本| 激情偷拍视频一区二区| 久久黄色国产精品一区视频| 香港aa三级久久三级| 射精专区一区二区朝鲜| 国产美女自慰在线观看| 中文字幕一区二区人妻| 二区久久国产乱子伦免费精品| 日本成人三级视频网站| 亚洲不卡免费观看av一区二区| 亚洲国产精品成人久久| 亚洲精品美女久久久久99| 一二三四在线视频观看社区| 精品久久综合一区二区| 久久久一本精品久久久一本| 日韩中文字幕在线观看一区 | 麻豆果冻传媒在线观看| 无码三级在线看中文字幕完整版| 成年女人永久免费看片| 国产一区二区内射最近人| 亚洲国产一区一区毛片a| 无码人妻久久一区二区三区免费丨 | 亚洲国产精品成人久久久| 精品亚洲一区二区三区在线观看| 91久久久久无码精品露脸| 国产国拍亚洲精品永久不卡| 国产亚洲欧美在线播放网站| 精品国产一区二区av麻豆不卡| 日韩无码专区| 成人三级a视频在线观看| 精品综合久久久久久8888| 色综合久久五十路人妻| 精品天堂色吊丝一区二区| 中文字幕一区二区三区日韩精品|