亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法

        2015-11-01 09:18:57伍振興
        中國(guó)科技信息 2015年9期
        關(guān)鍵詞:語(yǔ)義詞匯概念

        伍振興

        基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法

        伍振興

        本文提出了一種基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法,該方法利用WordNet中各詞匯之間的結(jié)構(gòu)關(guān)系,參考其各詞匯間的距離、密度、深度來(lái)計(jì)算各概念間的語(yǔ)義相似度來(lái)反映概念間的語(yǔ)義關(guān)系,然后根據(jù)概念與其他的概念格中的語(yǔ)義相似度來(lái)計(jì)算兩個(gè)概念格間的語(yǔ)義相似度,為以后的研究做準(zhǔn)備。但是這種方法尚不完善,需進(jìn)一步進(jìn)行擴(kuò)展與改進(jìn)。

        概念格具有良好的概念與概念之間的層次結(jié)構(gòu),已經(jīng)被廣泛應(yīng)用于軟件工程、信息檢索、數(shù)據(jù)挖掘等領(lǐng)域。但現(xiàn)如今對(duì)于各概念格之間的相似度計(jì)算和匹配的研究則相對(duì)較少。本文提出了一種基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法,該方法利用WordNet中各詞匯之間的結(jié)構(gòu)關(guān)系,研究?jī)蓚€(gè)概念格之間的語(yǔ)義相似度計(jì)算,為以后概念格間的語(yǔ)義匹配做準(zhǔn)備。

        概念格

        概念格,又稱為Galois格,是德國(guó)數(shù)學(xué)家Wille R.于1982年首次提的。概念格是根據(jù)數(shù)據(jù)集中對(duì)象與屬性之間的二元關(guān)系建立的一種概念層次結(jié)構(gòu),體現(xiàn)了概念之間的泛化和特化關(guān)系。

        定義 稱(U,A,I)為一個(gè)形式背景,其中U={x1,x2,…,xn}為對(duì)象集,每個(gè)xi(i≤n)稱為一個(gè)對(duì)象;A={a1,a2,…,am}為屬性集,每個(gè)ai(i≤m)稱為一個(gè)屬性;I 為U 和A之間的二元關(guān)系,I?U ×A .若(x,a) ∈I ,則說(shuō)x 具有屬性a ,記為xIa 。

        若用1表示(x,a )∈I ,用0表示(x,a)?I ,這樣的形式背景就可以表示為只有0和1的表格。

        對(duì)于形式背景(U,A,I),在對(duì)象集X?U 和屬性集B?A上 分別定義運(yùn)算:

        ?x∈U ,記{x}*為x*;?a∈A, 記{a}*為a*.若?x∈U ,x*≠?,x*≠A, 且?a∈A, a*≠?,a*≠U則稱該形式背景(U,A,I)是正則的。

        定義 2 設(shè)(U,A,I)為形式背景。如果一個(gè)二元組(X,B)滿足X?=B ,且B?=X ,則稱(X,B)是一個(gè)形式概念,簡(jiǎn)稱概念。其中X 稱為概念的外延,B稱為概念的內(nèi)涵。

        概念格的每個(gè)節(jié)點(diǎn)是一個(gè)形式概念,由兩部分組成:外延,即概念所覆蓋的實(shí)例;內(nèi)涵,即該概念所覆蓋實(shí)例的共同特征。概念格可以圖形化形式表示為有標(biāo)號(hào)的線圖,圖中的節(jié)點(diǎn)表示一個(gè)概念,節(jié)點(diǎn)間的連線表示節(jié)點(diǎn)間存在泛化與特化關(guān)系,這種線圖也稱為Hasse圖。它是概念格的可視化表示。

        WordNet簡(jiǎn)介

        WordNet是一個(gè)大型的英語(yǔ)詞匯數(shù)據(jù)庫(kù),它來(lái)源于美國(guó)Princeton大學(xué)GeorgeA.Miller教授所主持的一項(xiàng)知識(shí)工程的項(xiàng)目。WordNet是按照詞匯的語(yǔ)義關(guān)系來(lái)組織詞匯,它使用同義詞集合來(lái)表示概念,而這些概念集合則通過其中的某一特定的關(guān)系或者結(jié)構(gòu)來(lái)相互連接,形成一個(gè)大型的樹形結(jié)構(gòu)。目前WordNet中的詞匯數(shù)量已經(jīng)近20萬(wàn)條,并且每月超千條的速度不斷的增長(zhǎng)。

        WordNet之間存在著兩種關(guān)系:語(yǔ)義關(guān)系和詞匯關(guān)系。其中詞匯關(guān)系指詞形之間所存在的關(guān)系,語(yǔ)義關(guān)系指詞義之間存在的關(guān)系。這些關(guān)系中比較重要的是同義關(guān)系、近似關(guān)系、反義關(guān)系、上下位關(guān)系和部分整體關(guān)系。

        (1)同義關(guān)系是WordNet中最基本的關(guān)系,它屬于詞匯關(guān)系,是形成同義詞集的基礎(chǔ)。在WordNet中,同義關(guān)系并不是說(shuō)兩個(gè)詞匯在任何語(yǔ)境下都可以相互交換的,而是指在某一特定的語(yǔ)境下,這兩個(gè)詞可以交換。

        (2)反義關(guān)系和近似關(guān)系是指形容詞集之間的關(guān)系,它是語(yǔ)義關(guān)系。在WordNet中形容詞集的組織結(jié)構(gòu)主要依靠反義關(guān)系和近似關(guān)系。形容詞集是按簇(Cluster)組織的,每個(gè)簇都包含一個(gè)主節(jié)點(diǎn)(Head Synset),大多數(shù)的主節(jié)點(diǎn)都有一個(gè)或多個(gè)附屬節(jié)點(diǎn)(Satellite Synset),主節(jié)點(diǎn)和附屬節(jié)點(diǎn)間通過近似關(guān)系連接。其中每個(gè)主節(jié)點(diǎn)中至少存在一個(gè)詞和另外一個(gè)簇中的主節(jié)點(diǎn)所包含的詞間存在反義關(guān)系。

        (3)上下位關(guān)系是WordNet中最重要的關(guān)系之一,是屬于語(yǔ)義關(guān)系,指在動(dòng)詞集和名詞集上的關(guān)系,基于這種關(guān)系形成了動(dòng)詞集和名詞集上的層次結(jié)構(gòu)。相對(duì)于下位詞,上位詞是一個(gè)通用術(shù)語(yǔ),它表示由所有實(shí)例構(gòu)成的一個(gè)類的整體;相對(duì)于上位詞,下位詞是一個(gè)具體術(shù)語(yǔ),它表示類中的一個(gè)實(shí)例。

        (4)部分整體關(guān)系是WordNet中另外一種重要的關(guān)系,和上下位關(guān)系一樣同屬語(yǔ)義關(guān)系,是指在名詞集上的關(guān)系。在WordNet中,部分整體關(guān)系通常被分成三類:即對(duì)于任意給定的兩個(gè)名詞集S1和S2,若S1是整體,S2是部分,則S2或者是S1的成員,或者是構(gòu)成S1的材料,或者是S1的組成部分。

        一種基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法

        概念間的語(yǔ)義相似度計(jì)算

        從語(yǔ)義上講,概念格中的概念關(guān)系主要有分為以下四種:(1)part-of關(guān)系,概念間整體與部分的關(guān)系;(2)kind-of關(guān)系,概念間的超概念和子概念的關(guān)系,(3)instance-of關(guān)系,概念中的具體和抽象的關(guān)系,(4)attribute-of關(guān)系;概念與屬性的關(guān)系。但是也有些學(xué)者將概念間的語(yǔ)義關(guān)系拓展到概念間的行為關(guān)系和因果關(guān)系等。

        依據(jù)參照WordNet本體來(lái)判斷概念之間的語(yǔ)義和結(jié)構(gòu)關(guān)系,利用概念間的關(guān)系組成的圖形結(jié)構(gòu),參考概念間的距離、密度、深度來(lái)計(jì)算各概念間的語(yǔ)義相似度來(lái)反映概念間的語(yǔ)義關(guān)系為后期的工作做準(zhǔn)備。概念間的距離越近、深度越深,密度越大,那么相似度越大。同等情況之下,離根遠(yuǎn)的概念間的語(yǔ)義相似度和結(jié)構(gòu)肯定要比離根近的概念要大而且結(jié)構(gòu)越相似。因此本文相似度的計(jì)算將深度、密度和距離作為參考因素之一。

        其中simd表示概念間距離的相似度計(jì)算,參數(shù)dist表示兩個(gè)概念在WordNet中的距離,θ是一個(gè)閾值參數(shù)。距離越大,simd的值就越小,當(dāng)兩個(gè)概念間的距離超過θ時(shí),那么就認(rèn)為相似度為0。

        其中simm表示概念間密度的相似度,NUM表示從當(dāng)前兩個(gè)概念往上找到最近的超概念,然后統(tǒng)計(jì)從超概念到當(dāng)前兩個(gè)概念間的所有概念的個(gè)數(shù)(含當(dāng)前兩個(gè)概念和超概念)。若當(dāng)前兩個(gè)概念與超概念間沒有其他概念,則simm為1。

        其中sims表示概念間深度的相似度計(jì)算,參數(shù)DeepTotal表示在WordNet整棵語(yǔ)義樹中深度,參數(shù)deepth是兩個(gè)概念的深度最深的那個(gè)值。深度越大,sims的值就越大。

        綜合考慮概念間的密度,深度和距離三個(gè)因素,根據(jù)(3)(4)(5)三個(gè)計(jì)算方式,基于WordNet中的兩個(gè)概念的語(yǔ)義相似度為:

        其中α+β+μ=1,α、β、μ分別為距離、密度和深度的權(quán)重。

        概念與另外概念格語(yǔ)義相似度的計(jì)算

        根據(jù)上述公式(3)(4)(5)(6)來(lái)計(jì)算兩個(gè)概念格中的概念基于WordNet的語(yǔ)義相似度計(jì)算方法,本文可以計(jì)算得出概念格L1中的概念Ci到另外一個(gè)概念格L2中所有概念的相似度,找出相似度最大的語(yǔ)義相似度的候選概念結(jié)點(diǎn),根據(jù)概念格的特性,可以找出與其最近的候選概念的子結(jié)點(diǎn),層層迭代,可以得出概念Ci到概念格L2關(guān)系最緊密的一條路徑Ri,那么該概念結(jié)點(diǎn)Ci到概念格L2的相似度計(jì)算如下:

        其中n為路徑Ri上各概念結(jié)點(diǎn)的個(gè)數(shù),θi為路徑Ri上各概念結(jié)點(diǎn)的權(quán)重。越是概念相似度越高的概念,兩結(jié)點(diǎn)之間的語(yǔ)義關(guān)系或詞匯關(guān)系越近,θi的值越大,其中

        概念格間的語(yǔ)義相似度計(jì)算

        本文可以根據(jù)公式(7)得出的概念Ci到另外一個(gè)概念格L2中的相似度計(jì)算度,而后將此計(jì)算方法擴(kuò)展到概念格L1中的所有概念結(jié)點(diǎn),然后選取所有相似度的平均值作為概念格L1和L2的相似度。

        其中n為概念格L1上概念結(jié)點(diǎn)的個(gè)數(shù)。

        結(jié)束語(yǔ)

        本文提出了一種基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法,該方法利用WordNet中各詞匯之間的結(jié)構(gòu)關(guān)系,參考其各詞匯間的距離、密度、深度來(lái)計(jì)算各概念間的語(yǔ)義相似度來(lái)反映概念間的語(yǔ)義關(guān)系,然后根據(jù)概念與其他的概念格中的語(yǔ)義相似度來(lái)計(jì)算兩個(gè)概念格間的語(yǔ)義相似度,為以后的研究做準(zhǔn)備。但是這種方法尚不完善,需進(jìn)一步進(jìn)行擴(kuò)展與改進(jìn)。

        10.3969/j.issn.1001-8972.2015.09.011

        猜你喜歡
        語(yǔ)義詞匯概念
        Birdie Cup Coffee豐盛里概念店
        本刊可直接用縮寫的常用詞匯
        一些常用詞匯可直接用縮寫
        語(yǔ)言與語(yǔ)義
        幾樣概念店
        本刊可直接用縮寫的常用詞匯
        學(xué)習(xí)集合概念『四步走』
        聚焦集合的概念及應(yīng)用
        “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語(yǔ)義模糊
        日韩精品极视频在线观看免费| 青青青爽国产在线视频| 亚洲日产无码中文字幕| 91国内偷拍一区二区三区| 亚洲字幕中文综合久久| 久久超碰97人人做人人爱| 国产亚洲精品自在久久蜜tv| 亚洲成av在线免费不卡| 国产草逼视频免费观看| 国产色在线 | 亚洲| 91视频香蕉| 亚洲一区二区三区在线| 中文字幕女同系列在线看一| 少妇无码av无码一区| 图图国产亚洲综合网站| 久久综合老鸭窝色综合久久| 日出白浆视频在线播放| 人妻少妇久久中文字幕一区二区 | 国产精品视频一区二区久久| 中文无码人妻有码人妻中文字幕 | 手机看片1024精品国产| 国产偷国产偷亚洲清高| 成人国产精品免费网站| 青青草免费手机直播视频| а√天堂资源官网在线资源| 在线观看欧美精品| 亚洲av第一区综合激情久久久 | 亚洲 暴爽 AV人人爽日日碰| 五月婷婷开心五月播五月| 特黄熟妇丰满人妻无码| 免费啪啪视频一区| 亚洲在线视频一区二区| 漂亮人妻洗澡被公强 日日躁| 少妇放荡的呻吟干柴烈火动漫 | 亚洲一区二区三区av色婷婷| 人妖一区二区三区四区| 国产精品久久久久久52avav | 青青草视频在线免费视频| 人妻中文字幕乱人伦在线| 天天干成人网| 成年人视频在线播放视频|