亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于語義規(guī)則的詞義消歧方法的研究

        2017-03-28 09:40:54張婷婷遼寧錦州渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院
        數(shù)碼世界 2017年3期
        關(guān)鍵詞:消歧多義詞知識(shí)庫

        張婷婷 遼寧錦州渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院

        基于語義規(guī)則的詞義消歧方法的研究

        張婷婷 遼寧錦州渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院

        本文基于WordNet現(xiàn)存的詞義結(jié)構(gòu)以及詞義對(duì)用的上下文語義關(guān)系,詞義消歧之后通過語義選擇完成消歧工作。本文最后使用Senseval-3中的全英文文段作為該算法的實(shí)驗(yàn)測(cè)試集,詞義消歧算法使得測(cè)試集中的選擇多義詞最佳語義結(jié)果較好,本文的消歧方法經(jīng)過與其他詞義消歧算法進(jìn)行數(shù)據(jù)比對(duì)分析,能夠有效完成全英文文段單詞的詞義消歧任務(wù)。

        WordNet 語義規(guī)則 多義詞 詞義消歧 Senseval-3

        1 引言

        WordNet作為最常用的英文知識(shí)庫,在WordNet知識(shí)庫中,在單詞與單詞之間、詞語與語義之間存在一定的關(guān)聯(lián)規(guī)則,它作為可以計(jì)算英文知識(shí)庫,在英文知識(shí)庫中將單詞或者詞語分為五大類:名詞或者短語(n)、動(dòng)詞或者短語(v)、介詞或者短語、形容詞(adj)和副詞。WordNet知識(shí)庫中單詞與單詞之間的語義關(guān)系和詞匯關(guān)系。

        2 詞義消歧算法

        目前,存在多種比較優(yōu)秀的詞義消歧方法,詞義消歧方法優(yōu)先選擇基于知識(shí)結(jié)構(gòu)的詞義消歧方法。釋義重疊法在文獻(xiàn)中是查找多義詞詞義重疊釋義,選擇重疊詞義數(shù)最多的幾個(gè)釋義作為多義詞具體語義?;赪ordNet的語義關(guān)系對(duì)多義詞上下文的釋義進(jìn)行擴(kuò)展,針對(duì)多義詞的詞義消歧準(zhǔn)確率由20.1%上升到35.2%。在文獻(xiàn)中提出基于語義相似度的五種詞義消歧方法,通過語義相似度的詞義消歧算法獲取消歧結(jié)果比較明顯,但是,獲取的詞匯分類數(shù)據(jù)非常有限,詞匯的分類數(shù)據(jù)受限必定會(huì)影響詞義消歧效果。文獻(xiàn)提出了基于WordNet構(gòu)建語義關(guān)系圖實(shí)現(xiàn)多義詞的詞義消歧,在此文獻(xiàn)中提出基于無監(jiān)督的詞義消歧方法。

        3 基于語義規(guī)則的詞義消歧方法

        3.1 詞義消歧的語義規(guī)則

        根據(jù)WordNet知識(shí)庫中多義詞的語義關(guān)系和詞的結(jié)構(gòu),再根據(jù)多義詞所在文段的前后的語境關(guān)系,判斷多義詞的詞性再選擇正確的語義關(guān)系,可以實(shí)現(xiàn)基于語義規(guī)則的詞義消歧方法。

        3.1.1 語義關(guān)系中的謂詞定義

        在WordNet英文知識(shí)庫中,在詞與詞之間、詞語與語義之間存在一定的規(guī)則,它是可計(jì)算英文知識(shí)庫,本文將給出單詞與單詞之間的語義關(guān)系定義,假定存在兩種互不相同的語義關(guān)系為X和Y,并且X和Y的語義關(guān)系不等價(jià),X和Y的語義之間的關(guān)系包括下面幾種:

        ①部分與整體語義關(guān)系Part Of Whole(X,Y):存在X∈Y的語義關(guān)系,稱為語義X和Y是部分整體關(guān)系;

        ②全同語義關(guān)系Same Of Whole(X,Y):存在X=Y的語義關(guān)系,稱為語義X和Y是全同關(guān)系;

        ③并列語義關(guān)系A(chǔ)nd Of Whole(X,Y):當(dāng)幾種語義關(guān)系完全獨(dú)立的關(guān)系,稱為語義X和Y是并列關(guān)系;

        ④繼承語義關(guān)系Extend Of Whole(X,Y):當(dāng)幾種語義關(guān)系為子類繼承父類的屬性或者方法,稱為語義X和Y是繼承語義關(guān)系;

        ⑤相似語義關(guān)系Similarity Of Whole(X,Y):當(dāng)幾種語義關(guān)系相似度值在[0-1.0]之間小數(shù)部分,稱為語義X和Y是相似的語義關(guān)系;

        ⑥屬性與值的語義關(guān)系A(chǔ)ttribute Of Whole(X,Y):存在XY兩種語義關(guān)系屬性與鍵值一一對(duì)應(yīng)的關(guān)系,稱為語義X和Y是屬性與值的語義關(guān)系;

        ⑦交叉語義關(guān)系Intersection Of Whole(X,Y):存在XY有共同數(shù)值,稱為語義X和Y是交叉的語義關(guān)系;

        3.1.2 詞義消歧的語義規(guī)則定義

        定義多義詞消歧的語義規(guī)則,根據(jù)本文提供詞義消歧的語義規(guī)則,詞義消需要將名詞、動(dòng)詞、副詞、形容詞進(jìn)行語義規(guī)則定義,假定存在多義詞Si,該多義詞的詞義消歧如下:

        ①名詞的詞義消歧的語義規(guī)則定義如下:

        Part OF Whole(Si,Si(WordNet))→Si(w);Same Of Whole(Si,Si(WordNet))→Si(w);

        Extend OF Whole(Si,Si(WordNet))→Si(w);Attribute OF Whole(Si,Si(WordNet))→Si(w);

        ②形容詞的詞義消歧需要定義的語義規(guī)則定義如下:

        Attribute OF Whole(Si,Si(WordNet))→Si(w);Similarity OF Whole(Si,Si(WordNet))→Si(w);

        ③動(dòng)詞的詞義消歧需要定義的語義規(guī)則定義如下:

        Intersection OF Whole(Si,Si(WordNet))→Si(w);And Of Whole(Si,Si(WordNet))→Si(w);

        其中,該多義詞的詞義消歧語義規(guī)則中,Si表示歧義詞,Si(WordNet)表示W(wǎng)ordNet中的對(duì)應(yīng)的多種語義關(guān)系。

        3.2 基于語義規(guī)則的詞義消歧方法描述

        根據(jù)前文所述,該算法的具體思路是根據(jù)多義詞在WordNet知識(shí)庫中的語義關(guān)系,判斷該多義詞屬于哪種定義語義消岐規(guī)則,該算法描述的詞義消歧算法步驟如下所示:

        ①存在有限文檔數(shù)據(jù)集合,該文檔數(shù)據(jù)集合表示為D,對(duì)文檔數(shù)據(jù)集合D進(jìn)行預(yù)處理操作;

        ②識(shí)別多義詞的詞性類別,判斷多義詞的詞義是否在WordNet中,如果存在唯一的一個(gè)詞性的語義,則直接返回該多義詞在WordNet中的語義,否則跳轉(zhuǎn)到4;

        ③多義詞的詞性消歧處理,詞性判斷為多義詞消歧的重要處理過程,詞性識(shí)別是下一步語義規(guī)則選擇的重要依據(jù),判斷該多義詞是否具有唯一的詞性,是否需要進(jìn)行詞性標(biāo)注操作,如果不需要跳轉(zhuǎn)到4;

        ④根據(jù)多義詞在本文中定義的語義規(guī)則和詞性規(guī)則進(jìn)行判斷,將該語義關(guān)系定義語義消岐規(guī)則;

        ⑤確定屬于哪種語義規(guī)則進(jìn)行語義判斷,根據(jù)該多義詞在本文段中的語境進(jìn)行語義選擇,選擇符合語境的最佳語義,并輸出多義詞的語義。

        3.3 本文算法的詞義消歧實(shí)現(xiàn)過程

        結(jié)合上文的詞義消歧的步驟:算法A描述是如何獲取多義詞所在WordNet中的多種語義關(guān)系,算法B是如何根據(jù)已經(jīng)定義的語義消歧規(guī)則?;谡Z義規(guī)則的詞義消歧方法的實(shí)現(xiàn)如下描述所示,其中算法A是獲取多義詞的詞性和在WordNet中關(guān)聯(lián)數(shù)據(jù)的偽代碼片段,其中:Wi表示在文段中第i個(gè)多義詞,pos表示該多義詞的詞性(名詞、動(dòng)詞或者形容詞等),算法A的描述如下。

        ?

        算法B將多義詞實(shí)現(xiàn)詞義消歧方法,算法中輸入?yún)?shù)為:Wi是多義詞,pos表示該詞的詞性,C表示該多義詞在WordNet中的語義關(guān)系,算法2的作用根據(jù)語義規(guī)則的進(jìn)行詞義消歧,然后在WordNet中選擇符合語境多義詞的語義輸出。

        ?

        4 實(shí)驗(yàn)結(jié)果及分析

        4.1 試驗(yàn)測(cè)試數(shù)據(jù)

        本文提出基于語義規(guī)則的詞義消歧方法的研究,本文詞義消歧數(shù)據(jù)集采用Senseval-3中全英文文段作為語義規(guī)則的詞義消歧算法的實(shí)驗(yàn)測(cè)試集,實(shí)驗(yàn)過程中識(shí)別文段中的多義詞,通過詞義消歧算法實(shí)驗(yàn)結(jié)果數(shù)據(jù)進(jìn)行比較分析結(jié)論。

        4.2 試驗(yàn)結(jié)果分析

        在本文中使用的詞義消歧評(píng)價(jià)指標(biāo)包括:覆蓋率C、準(zhǔn)確率A和召回率R評(píng)估基于語義規(guī)則的詞義消歧算法性能,本文提出方法與其他的詞義消歧算法進(jìn)行比較,表1不同算法實(shí)驗(yàn)數(shù)據(jù)處理結(jié)果。

        表1 不同算法實(shí)驗(yàn)數(shù)據(jù)處理結(jié)果

        由表1實(shí)驗(yàn)消歧數(shù)據(jù)處理結(jié)果可知,不同算法實(shí)驗(yàn)數(shù)據(jù)處理結(jié)果分析可見,通過表1的實(shí)驗(yàn)數(shù)據(jù)比對(duì)結(jié)果很明顯,該算法在實(shí)驗(yàn)數(shù)據(jù)集上測(cè)試的效果獲取的數(shù)據(jù)準(zhǔn)確率有所提高。

        5 結(jié)論與未來研究方向

        針對(duì)于文章中出現(xiàn)的一詞多義現(xiàn)象很多,詞義模糊使得文章語義不清,對(duì)文章的理解造成困難。WordNet作為最常用的英文知識(shí)庫,在WordNet知識(shí)庫中,在詞與詞之間、詞語與語義之間存在一定的規(guī)則,它是可計(jì)算英文知識(shí)庫,通過上文的實(shí)驗(yàn)結(jié)果驗(yàn)證。

        [1]王瑞琴,孔繁勝,潘俊.基于WordNet的無導(dǎo)詞義消歧方法[J].浙江大學(xué)學(xué)報(bào)(Journal of Zhejiang University (Engineering Science)),2010,44(4):1068-1073

        [2]車超,知識(shí)自動(dòng)獲取的詞義消歧義方法[D].博士學(xué)位論文,大連理工大學(xué),2010

        [3]S.Dongen.Graph clustering by flow simulation[D:Ph. D.].Utreeht,The Netherlands:Unlversity of Utrecht,2000

        [4]J.Veonis.HyPerlex:lexical cartography for information retrieval[J].Computer Speeeh&Language,2004,18(3):223-252

        猜你喜歡
        消歧多義詞知識(shí)庫
        基于關(guān)聯(lián)圖和文本相似度的實(shí)體消歧技術(shù)研究*
        多義詞
        基于半監(jiān)督集成學(xué)習(xí)的詞義消歧
        基于TRIZ與知識(shí)庫的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
        藏文歷史文獻(xiàn)識(shí)別過程中藏文自由虛詞的自動(dòng)識(shí)別及消歧算法的研究
        高速公路信息系統(tǒng)維護(hù)知識(shí)庫的建立和應(yīng)用
        淺議多義詞在語境中的隱喻認(rèn)知
        多義詞way的語義認(rèn)知分析及實(shí)證研究
        基于Drupal發(fā)布學(xué)者知識(shí)庫關(guān)聯(lián)數(shù)據(jù)的研究
        圖書館研究(2015年5期)2015-12-07 04:05:48
        基于《知網(wǎng)》的中文信息結(jié)構(gòu)消歧研究
        日韩少妇内射免费播放18禁裸乳| 国产日韩三级| 日韩精品极品视频在线免费| 日韩有码中文字幕在线视频| 国产精品久久久三级18| av永久天堂一区二区三区| 精品久久久噜噜噜久久久| 亚洲精品成人av一区二区| 日本不卡的一区二区三区| 李白姓白白又白类似的套路| 亚洲精品久久激情国产片| 亚洲一本到无码av中文字幕| 国产亚洲精品自在久久77| 国产喷白浆精品一区二区豆腐| 久久精品国产亚洲av性瑜伽| 国产精品国产三级国产专播| 人人狠狠综合久久亚洲| 91青草久久久久久清纯| 亚洲视频观看一区二区| 精品人妻一区三区蜜桃| 黑森林福利视频导航| av大片在线无码免费| 免费国产在线精品三区| 国产精品一区二区熟女不卡| 国模冰莲自慰肥美胞极品人体图 | 91情侣视频| 亚洲色图少妇熟女偷拍自拍| 男女边摸边吃奶边做视频韩国| 最新中文字幕av无码不卡| 天美麻花果冻视频大全英文版| 91亚洲精品久久久蜜桃| 久久热免费最新精品视频网站| 含紧一点h边做边走动免费视频| 国产午夜精品一区二区三区不卡| 久久精品无码一区二区三区不卡| 亚洲精品中文字幕一二| 亚洲va中文字幕无码一二三区| 亚洲av成人无码网站…| 国产精品久久久久免费a∨不卡| 国产91九色免费视频| 色多多性虎精品无码av|