亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多源文本知識(shí)融合算法分析

        2018-06-21 11:46:28閆昱姝雷玉霞
        軟件導(dǎo)刊 2018年5期

        閆昱姝 雷玉霞

        摘 要:知識(shí)融合是知識(shí)管理和知識(shí)工程的重要環(huán)節(jié),從文本中獲取專(zhuān)業(yè)知識(shí)是人們獲取新知識(shí)的首選方式。對(duì)于多源文本知識(shí),由于作者描述的角度和側(cè)重點(diǎn)不同,往往導(dǎo)致文本知識(shí)描述的整體性、知識(shí)粒度和精度有所差異,從而引起知識(shí)的不一致問(wèn)題。為得到粒度小、精度高且完備的文本知識(shí),提出一種基于本體的多源文本知識(shí)融合算法。利用本體概念框架將文本知識(shí)結(jié)構(gòu)化,并將概念框架進(jìn)行融合。實(shí)驗(yàn)結(jié)果表明,該算法有效解決了文本知識(shí)的不一致問(wèn)題,提高了知識(shí)融合效率。

        關(guān)鍵詞:知識(shí)融合;文本知識(shí);知識(shí)不一致;概念框架

        DOI:10.11907/rjdk.172864

        中圖分類(lèi)號(hào):TP312

        文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2018)005-0062-03

        Abstract:Knowledge fusion is an important part of knowledge management and knowledge engineering. Acquiring professional knowledge from text is the preferred way for people to acquire new knowledge. For multi-source text knowledge, different description angles and focuses of the authors, often lead to the differences in integrity of text knowledge description, knowledge granularity and precision and cause the problem inconsistent of knowledge.In order to obtain small-size, high precision and complete text knowledge, this paper proposes a multi-source text knowledge fusion algorithm based on ontology. Text knowledge are structured by ontology conceptual framework and integrated with it. Experimental results show that the presented knowledge fusion algorithm can effectively solve the problem of text knowledge inconsistency and improve the efficiency of knowledge fusion.

        Key Words:knowledge fusion; text knowledge; inconsistent problem of knowledge; conceptual framework

        0 引言

        知識(shí)是人類(lèi)社會(huì)進(jìn)步的重要推動(dòng)力。隨著數(shù)字化、信息化時(shí)代的到來(lái),知識(shí)來(lái)源也變得更加多樣化。其中,文本知識(shí)是人類(lèi)直接獲取所需知識(shí)的有效途徑,因此對(duì)文本知識(shí)的研究顯得尤為重要[1]。知識(shí)融合是知識(shí)管理和知識(shí)工程的重要組成部分,主要研究分布式知識(shí)庫(kù)系統(tǒng)中知識(shí)的轉(zhuǎn)換、集成和融合,并產(chǎn)生新知識(shí),是知識(shí)科學(xué)和信息融合的交叉學(xué)科[2]。通過(guò)融合將多源知識(shí)綜合為新知識(shí),提高知識(shí)的內(nèi)涵、層次和置信度[3],從而進(jìn)一步完善知識(shí)庫(kù),為人類(lèi)提供基于知識(shí)的服務(wù)。目前,知識(shí)融合方法種類(lèi)很多,而基于貝葉斯準(zhǔn)則的知識(shí)融合算法、基于證據(jù)組合理論的知識(shí)融合算法應(yīng)用最為廣泛。由于貝葉斯決策準(zhǔn)則具有最小的分類(lèi)錯(cuò)誤率[4],將貝葉斯理論應(yīng)用于知識(shí)融合中,可將一個(gè)較大問(wèn)題分解成若干個(gè)易解決的小問(wèn)題,然后利用極大后驗(yàn)概率假設(shè),最終得到最佳融合結(jié)果。證據(jù)組合理論D-S是由Dempster[5]于1967年提出,并于1976年由Shafer[6]進(jìn)一步發(fā)展和完善的結(jié)果。D-S定義信任函數(shù)和基本概率分配,并依據(jù)最大支持度準(zhǔn)則進(jìn)行最終融合。在現(xiàn)代社會(huì)中,雖然人們可以從各種媒體中得到所需知識(shí)并拓展視野,但從文本中獲取知識(shí)依舊是人們的第一選擇。動(dòng)物學(xué)是人類(lèi)自然科學(xué)的重點(diǎn)研究方向,對(duì)同一動(dòng)物的描述,由于來(lái)源不同,其內(nèi)容也不盡相同。為解決該問(wèn)題,本文針對(duì)多源文本知識(shí),采用概念框架的知識(shí)表示方法,提出一種基于本體的知識(shí)融合算法。利用概念框架,將領(lǐng)域知識(shí)結(jié)構(gòu)形象化,最大程度地實(shí)現(xiàn)對(duì)知識(shí)庫(kù)本身的進(jìn)一步挖掘,從而提供面向?qū)ο蟮闹R(shí)服務(wù)。

        1 相關(guān)工作

        對(duì)于本文提出的多源文本知識(shí)融合算法,利用本體對(duì)文本知識(shí)進(jìn)行處理,并選擇恰當(dāng)?shù)闹R(shí)表示方法將文本清晰化與結(jié)構(gòu)化。

        1.1 本體知識(shí)

        本體是知識(shí)的一種組織方式,定義了組成某領(lǐng)域詞匯表的基本術(shù)語(yǔ)及其關(guān)系,并結(jié)合這些術(shù)語(yǔ)和關(guān)系定義了詞匯表的外延規(guī)則,反映出事物本質(zhì)特征。本體與知識(shí)實(shí)例的結(jié)合構(gòu)成了知識(shí)庫(kù),成為人們知識(shí)共享和重用的有效工具[7],如圖1所示。

        1.2 知識(shí)表示方法

        知識(shí)表示是人工智能領(lǐng)域的一個(gè)核心問(wèn)題[8]。在知識(shí)工程中,常用的知識(shí)表示方法有謂詞邏輯表示法、產(chǎn)生式表示法、框架表示法、腳本表示法、語(yǔ)義網(wǎng)絡(luò)表示法與面向?qū)ο蟊硎痉ǖ?。從知識(shí)可重用性和可共享性角度出發(fā),基于本體的知識(shí)表示方法逐漸成為研究熱點(diǎn)[9]。本文以基于本體的概念框架形式表示知識(shí),使文本知識(shí)的結(jié)構(gòu)脈絡(luò)更加形象化。

        1.3 不一致類(lèi)型分析

        多源文本知識(shí)存在較強(qiáng)的異構(gòu)性,易引起知識(shí)的不一致,以下是幾種常見(jiàn)的不一致類(lèi)型:

        (1)概念名稱不一致。在不同來(lái)源的文本中,對(duì)同一事物的描述往往存在一定差異。例如:我國(guó)珍惜保護(hù)動(dòng)物大熊貓?jiān)谂_(tái)灣被稱為貓熊,其實(shí)是同一種生物。

        (2)時(shí)間/日期不一致。本文將時(shí)間/日期的不一致類(lèi)型分為兩大類(lèi):古代紀(jì)年類(lèi)型和近現(xiàn)代紀(jì)年類(lèi)型,如圖2所示。

        (3)計(jì)量單位類(lèi)型不一致。常用單位有長(zhǎng)度單位、質(zhì)量單位和時(shí)間單位,而不同文本對(duì)同一事物的測(cè)量標(biāo)準(zhǔn)不同,從而導(dǎo)致單位不一致的情況產(chǎn)生。例如:在描述身高時(shí),既可描述為以厘米為單位,也可描述為以米為單位,均可表示同一人身高。常用單位的具體類(lèi)型如圖3所示。

        2 融合算法

        不同文本對(duì)同一概念的描述往往不同,因此需要找到一種避免由異構(gòu)引起差異的方法。本文提出一種文本知識(shí)融合算法,對(duì)不同來(lái)源的文本知識(shí)進(jìn)行框架處理,當(dāng)所獲得的概念名稱相同而內(nèi)容不同時(shí),將概念屬性進(jìn)行融合,形成新的、完備的概念框架[10]。

        3 實(shí)驗(yàn)分析

        在查閱資料后,從百度百科[11]、維基百科[12]、互動(dòng)百科[13]、《漢語(yǔ)大辭典》[14]、《環(huán)境科學(xué)大詞典》[15]中獲取關(guān)于大熊貓的介紹。F1、F2、F3、F4、F5分別表示來(lái)源于百度百科、維基百科、互動(dòng)百科、漢語(yǔ)大辭典、環(huán)境科學(xué)大詞典的5個(gè)概念框架。其屬性用mi表示,m1~m13分別表示的屬性為:學(xué)名、英文名稱、所屬類(lèi)別、體色、特點(diǎn)、存活時(shí)間、稱號(hào)、主要棲息地、野生數(shù)量、圈養(yǎng)數(shù)量、食物、野生壽命、圈養(yǎng)壽命、別名、現(xiàn)存數(shù)量、體長(zhǎng)。對(duì)概念框架進(jìn)行屬性分析,如圖4、圖5及表1所示。

        通過(guò)將來(lái)源于百度百科、維基百科等的大熊貓文本知識(shí)進(jìn)行融合,得到融合的匹配復(fù)雜度為9.26,框架融合度為0.52,而直接兩兩融合的匹配復(fù)雜度為12.28,框架融合度為0.48。實(shí)驗(yàn)結(jié)果表明,本文提出的融合算法能夠有效提高知識(shí)融合效率。

        4 結(jié)語(yǔ)

        本文首先介紹了與研究?jī)?nèi)容相關(guān)的本體知識(shí)和知識(shí)表示方法的選擇,然后對(duì)知識(shí)不一致類(lèi)型進(jìn)行分析,提出多源文本知識(shí)融合算法,用實(shí)例驗(yàn)證算法的可行性和有效性,最后對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。實(shí)驗(yàn)結(jié)果表明,本文提出的多源文本知識(shí)融合算法有效解決了文本知識(shí)的不一致問(wèn)題,提高了知識(shí)融合效率。下一步工作將繼續(xù)探索在概念名稱不同、內(nèi)容相同的情況下,如何將不同來(lái)源的文本知識(shí)更好地融合在一起。

        參考文獻(xiàn):

        [1] DENG Y, SHI W K. Experts′ knowledge fusion in model-based diagnosis based on Bayes networks [J].Journal of Systems Engineering and Electronics, 2003,14(2):25-30.

        [2] 徐賜軍,李?lèi)?ài)平,劉雪梅.基于本體的知識(shí)融合框架[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2010,22(7):1230-1236.

        [3] 周芳,王鵬波,韓立巖.多源知識(shí)融合處理算法[J].北京航空航天大學(xué)學(xué)報(bào),2013,39(1):109-114.

        [4] 王爽,郭軍海,張艷,等.導(dǎo)彈目標(biāo)識(shí)別的最小貝葉斯風(fēng)險(xiǎn)分類(lèi)器[J].現(xiàn)代防御技術(shù),2012,40(1):60-64.

        [5] DEMPSTER A P. Upper and lower probabilities induced by a multivalued mapping[J]. Annals of Mathematical Statistics, 1967,38(2):325-339.

        [6] SHAFER G. A mathematical theory of evidence[M].Princeton,NJ:Princeton University Press,1976.

        [7] 李娜.基于本體的文本知識(shí)修正與獲取[D].青島:中國(guó)石油大學(xué)(華東),2009.

        [8] 韓永花,雷玉霞,陳娟,等.多框架知識(shí)的不一致性檢測(cè)及其修正算法[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(23):94-97.

        [9] 張德海.NKI國(guó)家和地區(qū)地理知識(shí)的獲取與分析[D].昆明:云南師范大學(xué),2002.

        [10] 雷玉霞,陳娟,韓永花,等.Frame知識(shí)的不一致性分析與修正[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(22):155-158.

        [11] 百度百科[EB/OL].https:∥baike.baidu.com/item/%E5%A4%A7%E7%86%8A%E7%8C% AB/34935.

        [12] 維基百科[EB/OL].https:∥zh.wikipedia.org/wiki/%E5%A4%A7%E7%86%8A%E7%8C%AB.

        [13] 互動(dòng)百科[EB/OL].http:∥www.baike.com/wiki/大熊貓&prd;=so_1_doc.

        [14] 傅玉芳.漢語(yǔ)大詞典 [J].辭書(shū)研究,1994(3):80-81.

        [15] 《環(huán)境科學(xué)大詞典》編委會(huì).環(huán)境科學(xué)大辭典(修訂版)[M].北京:中國(guó)環(huán)境科學(xué)出版社,2008.

        (責(zé)任編輯:黃 ?。?/p>

        91精品人妻一区二区三区水蜜桃| 成人国产在线观看高清不卡| 又嫩又硬又黄又爽的视频| 久久久亚洲av成人网站| 黑色丝袜秘书夹住巨龙摩擦| 久久久天堂国产精品女人| 国产熟女高潮视频| 日本午夜国产精彩| 精品一区二区三区在线视频观看| 国产成人精品一区二免费网站| 国内自拍视频在线观看h| 亚洲高清精品一区二区| 人妻经典中文字幕av| 色婷婷久久亚洲综合看片| 岳丰满多毛的大隂户| 国产农村熟妇videos| 香蕉视频在线精品视频| 放荡的闷骚娇妻h| 美女高潮流白浆视频在线观看| 成人免费丝袜美腿视频| 久久精品人妻一区二三区| 亚洲国产丝袜久久久精品一区二区| 日韩无码专区| 久久97久久97精品免视看| 久久久国产精品免费a片3d| 色妞www精品视频| 吃下面吃胸在线看无码| 亚洲视频在线中文字幕乱码| 日本不卡不二三区在线看| 国产 一二三四五六| 国产精品99精品无码视亚 | 狠狠躁天天躁无码中文字幕图| 亚洲国产日韩欧美综合a| 人妻有码中文字幕| 人妻无码Aⅴ中文系列| 日韩人妻无码精品二专区| 天堂av在线播放观看| 国产自拍视频免费在线观看| 亚洲色图视频在线免费看| 欧美最猛黑人xxxx| 99久久伊人精品综合观看|