亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于回溯法的中文分詞技術

        2020-01-16 05:57:04周寅黃鋆
        電子技術與軟件工程 2019年21期
        關鍵詞:成詞詞尾剪枝

        文/周寅 黃鋆

        1 引言

        在海量文本數(shù)據(jù)處理的當下,多個領域運用到自然語言處理的技術,在多個任務處理中,任重而道遠的關鍵技術—中文分詞。在中文信息處理中,中文分詞占據(jù)著重要的地位,然而在中文分詞技術中,歧義詞和未登錄詞是該技術的重難點。清華大學的黃昌寧老先生[2],總結出了中文分詞存在的四個重難點:

        (1)漢語切分的規(guī)范問題;

        (2)分詞和理解誰先誰后;

        (3)中文分詞出現(xiàn)的歧義消解;

        (4)識別未登錄詞。

        2 基于回溯法的中文分詞技術的研究

        對文本數(shù)據(jù)的標注大致分為三種:

        2-tag:對中文文本進行標注I,O。I表示詞首;O表示詞尾。

        例如:武漢船舶職業(yè)技術學院。

        武 I 漢 O 船 I 舶 O 職 I 業(yè) O 技 I 術 O 學 I 院 O

        4-tag:對中文文本進行標注S,B,M,E。S表示字單獨成詞;B:表示詞的第一個字;M:表示詞的中間位置的字;E:表示詞的位置位于詞尾。

        例如:武漢船舶職業(yè)技術學院。

        武 B 漢 E 船 B 舶 E 職 B 業(yè) E 技 B 術 E 學 B 院 E 。 S

        6-tag:即對文本中詞語進行S,B,M1,M2,M3,E標注。S:表示文本中的字單獨成詞;B:表示文本中的字所在詞語中的首位;M1:標識詞組首個字符;M2:標識詞組第二個字符;M3:標志文本中詞語的中間位置;E:標志文本詞尾。由于在中文詞典中,詞語的最長極限就是六個字構成的詞語。

        根據(jù)字向量的技術,將文本數(shù)據(jù)中的有用信息進行學習,生成字向量。利用條件隨機場,對文本數(shù)據(jù)中的生成的標簽進行學習,產生最優(yōu)解。

        我們的方法,利用回溯法中的左剪枝法,將詞標注的出現(xiàn)關聯(lián)詞相同的情況,將其剪枝;利用右剪枝法,將單獨成詞的后序文字剪掉,節(jié)省了時間復雜度,因此使得分詞的技術達到最佳?;厮莘P椭形姆衷~如圖1所示。

        實驗結果如圖2。

        根據(jù)圖2而言,在準確率中,調劑隨機場結合詞向量的技術明顯優(yōu)于單純的條件隨機場技術的中文分詞,然而相對于回溯法的中文分詞技術,要明顯的不足。在召回率方面,我們的技術明顯優(yōu)于前兩者,并且F值也是要高于前兩者。詳見表1。

        表1

        圖1:回溯法模型中文分詞

        圖2:搜狗語料庫實驗對比圖

        3 實驗小結

        實驗中我們利用回溯法進行對文本的操作,發(fā)現(xiàn)用我們的回溯法改進的中文分詞技術比傳統(tǒng)的條件隨機場方法中的準確率要高出5.9%,相對條件隨機場與詞向量的合作要高出0.6%。召回率也高出了條件隨機場的3.3%,比條件隨機場和詞向量的要高出0.8%。在F值中也要明顯的優(yōu)于前兩者。

        4 展望與發(fā)展

        今后的學習中,我們將進一步利用基礎的算法分析案例,對中文分詞進行改進與優(yōu)化,使得我們的精確度和召回率都有所提升。

        猜你喜歡
        成詞詞尾剪枝
        人到晚年宜“剪枝”
        基于YOLOv4-Tiny模型剪枝算法
        -CK Sounds
        詞尾與詞綴的區(qū)別研究
        “湊合”成詞及詞義演變考.
        小說月刊(2017年11期)2018-01-03 07:50:55
        先秦形容詞性反義并列詞語成詞規(guī)律考
        再論“睡覺”成詞的時代
        東方教育(2017年14期)2017-09-25 16:53:37
        剪枝
        天津詩人(2017年2期)2017-03-16 03:09:39
        “企業(yè)”的成詞及詞義內涵考釋
        Playing with “g”
        a在线观看免费网站大全| 激情五月婷婷六月俺也去| 人妻少妇精品视频一区二区三区| 久久精品国产9久久综合| 日本一区二区三区区视频| 久久精品国产91精品亚洲| 精品亚洲成a人片在线观看| 久久国产成人精品国产成人亚洲| 国产一区二区丁香婷婷| 精彩视频在线观看一区二区三区| 国内精品久久久久伊人av| 99国产精品无码| 免费一级毛片麻豆精品| 东京道一本热码加勒比小泽| 中文字幕亚洲一区二区不下| 欧美日韩一区二区三区在线观看视频 | 国产激情视频免费在线观看 | 国产乱码一二三区精品| 国产午夜福利精品| 黄色中文字幕视频网站| 日本女优中文字幕在线播放| 挺进邻居丰满少妇的身体| 少妇厨房愉情理伦片bd在线观看| 欧洲一级无码AV毛片免费| 中文字幕一区久久精品| 岳毛多又紧做起爽| 制服丝袜视频国产一区| 激情综合网缴情五月天| 中文字幕午夜精品久久久| 亚洲国产av玩弄放荡人妇系列| 精品第一页| 国产三级精品三级在线| av网站大全免费在线观看| 激情内射日本一区二区三区| 人妻在线中文字幕| 熟女不卡精品久久av| 黄色av亚洲在线观看| 无码人妻一区二区三区在线视频| 国产三级在线视频播放| 激情在线视频一区二区三区| 亚洲国产果冻传媒av在线观看|