丁悅航,于洪濤,黃瑞陽(yáng),李英樂(lè)
?
本體摘要技術(shù)綜述
丁悅航,于洪濤,黃瑞陽(yáng),李英樂(lè)
(國(guó)家數(shù)字交換系統(tǒng)工程技術(shù)研究中心,河南 鄭州 450002)
本體是知識(shí)共享的重要工具,也是知識(shí)圖譜的上層結(jié)構(gòu)。隨著數(shù)據(jù)規(guī)模和本體復(fù)雜性的增長(zhǎng),本體理解與應(yīng)用日益困難。本體摘要作為縮小本體規(guī)模的一項(xiàng)技術(shù),為加速本體理解與應(yīng)用提供了技術(shù)支持。給出了本體摘要的不同定義;對(duì)本體摘要方法進(jìn)行比較分析;介紹了本體摘要評(píng)估的指標(biāo)體系;最后提出本體摘要的進(jìn)一步研究方向。
知識(shí)圖譜;本體;本體摘要;本體評(píng)估
近年來(lái),知識(shí)圖譜作為可推理的結(jié)構(gòu)化數(shù)據(jù)集,已經(jīng)越來(lái)越多地應(yīng)用于智能語(yǔ)義搜索、移動(dòng)個(gè)人助理和深度問(wèn)答系統(tǒng)[1]。本體作為知識(shí)圖譜的上層結(jié)構(gòu),在知識(shí)推理和數(shù)據(jù)層的構(gòu)建中發(fā)揮著重要作用。隨著數(shù)據(jù)規(guī)模和本體復(fù)雜性的飛速增長(zhǎng),本體的理解和應(yīng)用難度日益增大。本體摘要作為生成原本體縮略版本的一種方式,能夠有效降低本體理解的難度,加快本體應(yīng)用的速度,從而有效緩解上述問(wèn)題。
本體摘要的思想源于文本摘要。文本摘要即對(duì)文本中的句子,制定重要性評(píng)估方法,從而選出最重要的若干個(gè)句子作為摘要結(jié)果。本體摘要由Zhang等[2]于2007年提出,其通過(guò)對(duì)RDF(resource defined framework)句子進(jìn)行重要性評(píng)估,選出若干重要的RDF句子作為摘要結(jié)果。隨后,本體摘要根據(jù)目的衍生出用戶導(dǎo)向和任務(wù)導(dǎo)向的本體摘要。用戶導(dǎo)向的本體摘要是讓人更方便地理解本體的內(nèi)涵,從而便于進(jìn)一步重用本體,因此,基于此目的的方法大多抽取本體中的重要概念作為摘要結(jié)果。任務(wù)導(dǎo)向的本體摘要是利用摘要本體完成任務(wù),加快任務(wù)的完成速度,因此,基于此目的的方法大多在不影響應(yīng)用的前提下刪除原本體中冗余的信息。
在本體領(lǐng)域中,與本體摘要功能相似的2個(gè)技術(shù)是本體分割和本體模塊化。本體分割[3]將一個(gè)大本體分割成若干個(gè)子本體,每個(gè)子本體包含原始本體的一個(gè)子主題[4]。本體模塊化[5]用于簡(jiǎn)化本體重用:將原始本體中需要重用的部分模塊化,從而重用本體的一部分而非整個(gè)本體[6]。這2種技術(shù)都能縮小本體規(guī)模,促進(jìn)本體理解,但二者均基于劃分技術(shù),沒(méi)有針對(duì)性地保留重要信息。本體摘要與本體領(lǐng)域其他概念的關(guān)系如圖1所示。
本體摘要可以在保留本體語(yǔ)義的前提下有效解決本體體積過(guò)大導(dǎo)致的查詢效率低、內(nèi)涵難以理解等問(wèn)題。近年來(lái),國(guó)內(nèi)外已有多位學(xué)者對(duì)本體摘要進(jìn)行了研究,然而不同學(xué)者對(duì)本體摘要的理解不盡相同,給出的定義也存在差異。
Zhang等[2]參照文本自動(dòng)摘要的定義[7],首先提出本體摘要的概念:本體摘要是針對(duì)某個(gè)特殊用戶或任務(wù),從本體中提取知識(shí),構(gòu)建原本體縮略版本的過(guò)程。Zhang是最早提出本體摘要這一概念的學(xué)者,指出本體摘要分為用戶驅(qū)動(dòng)和任務(wù)驅(qū)動(dòng)2種形式。本體摘要概念的提出對(duì)其后各領(lǐng)域?qū)W者對(duì)該問(wèn)題的研究提供了參考借鑒。
Li等[8]認(rèn)為,相較于本體的其他抽取技術(shù),本體摘要應(yīng)該保留整個(gè)本體中的重要信息,并且是自動(dòng)生成的。他們參照文本摘要的定義[9]給出了本體摘要的定義:本體摘要是自動(dòng)生成給定本體縮略版本的過(guò)程,用于為用戶提供重要信息??梢?jiàn),Li等的定義更偏重于用戶導(dǎo)向的本體摘要。
圖1 本體摘要與各個(gè)概念的關(guān)系
本體摘要方法按照目的分為用戶驅(qū)動(dòng)和任務(wù)驅(qū)動(dòng)2類。用戶驅(qū)動(dòng)的本體摘要致力于滿足用戶快速理解大規(guī)模本體空間的需要,因此傾向于提取本體中的重要概念和關(guān)系。任務(wù)驅(qū)動(dòng)的本體摘要致力于在盡可能不丟失信息的前提下把本體縮小到滿足問(wèn)答系統(tǒng)任務(wù)的必要大小,因此傾向于刪減本體中的不必要信息。
圖2展示的是一個(gè)示例本體。其中,上半部分用實(shí)線繪制,表示模式層,即概念及其之間的關(guān)系,對(duì)應(yīng)描述邏輯中的TBox;下半部分用虛線繪制,表示數(shù)據(jù)層,即個(gè)體及其之間的關(guān)系,對(duì)應(yīng)描述邏輯中的ABox。TBox即關(guān)于描述領(lǐng)域的概念術(shù)語(yǔ)的斷言,用于定義概念、概念間的關(guān)系、角色間的關(guān)系;ABox即包含應(yīng)用領(lǐng)域外延知識(shí)的知識(shí)庫(kù),包括實(shí)體的概念斷言和關(guān)系斷言[11]。接下來(lái),以示例本體為例,說(shuō)明不同本體摘要方法的具體過(guò)程。
圖2 示例本體
Alani等[12]通過(guò)刪除問(wèn)答系統(tǒng)中沒(méi)有用到的本體信息來(lái)加快問(wèn)答速度。具體地,只保留具有對(duì)應(yīng)實(shí)例的類和屬性,問(wèn)答對(duì)中涉及的類和屬性,以及已有屬性的定義域和值域所在的類。通過(guò)將摘要后的本體用于問(wèn)答系統(tǒng)驗(yàn)證了摘要本體的有效性。然而,這種本體摘要方式僅針對(duì)特定的應(yīng)用,無(wú)法保證摘要本體的語(yǔ)義完整性和一致性。
圖3 Alani等算法摘要后的示例本體模式層
圖3是示例本體經(jīng)過(guò)Alani等算法處理后的摘要,算法針對(duì)模式層進(jìn)行摘要。數(shù)據(jù)層中的Allen和Bob屬于模式層中的概念Man,因此保留模式層中的Man。同理,數(shù)據(jù)層中的Anna和Bella屬于模式層中的概念Woman,因此也保留概念Woman。此外,數(shù)據(jù)層中屬性hasFather的定義域和值域分別為Human和Man,因此保留hasFather屬性和Human概念。此外,圖中匿名節(jié)點(diǎn)的作用在于,限制每個(gè)人有且只有一個(gè)父親,因此也要保留這種限制。Animal這一概念沒(méi)有對(duì)應(yīng)實(shí)體,因此去除Animal這一概念。
圖4 Achille等算法摘要前后的數(shù)據(jù)層
Deng等[10]給出了本體無(wú)損摘要的理論框架。通過(guò)合并概念斷言和關(guān)系斷言減小ABox中斷言的個(gè)數(shù),從而達(dá)到縮小ABox的目的。首先獲取所有實(shí)例集合并查找其中的等價(jià)關(guān)系,然后構(gòu)建并存儲(chǔ)等價(jià)實(shí)例集合,將相互等價(jià)的實(shí)例用一個(gè)新的實(shí)例代替。相對(duì)于其他任務(wù)導(dǎo)向的方法,這種摘要方法在沒(méi)有減少原本體中任何信息的前提下實(shí)現(xiàn)了本體摘要,適用于本體推理、問(wèn)答系統(tǒng)等多種任務(wù)。然而,此方法存在一個(gè)問(wèn)題:當(dāng)原本體發(fā)生變化時(shí),原本相互等價(jià)的概念或?qū)嵗赡懿辉俚葍r(jià)。因此,原本體一旦發(fā)生變化,就需要重新計(jì)算其摘要本體,增加了開(kāi)銷(xiāo)。
圖5 Jun Fang等算法摘要前后的數(shù)據(jù)層
圖6 基于RDF句子的算法摘要的圖結(jié)構(gòu)
然而,單純地將本體轉(zhuǎn)化為圖,用結(jié)構(gòu)參數(shù)生成本體摘要可能會(huì)忽略概念層面的語(yǔ)義信息[17]。
Peroni等[18]抽取核心概念作為本體摘要結(jié)果。該方法將概念看作節(jié)點(diǎn),概念間的類屬關(guān)系(subClassOf)看作連邊,將本體轉(zhuǎn)化為一個(gè)有向圖。針對(duì)每個(gè)節(jié)點(diǎn)定義若干表示其不同特性的參數(shù),線性加權(quán)后作為最終的重要性評(píng)價(jià)指標(biāo),選取重要性最高的若干個(gè)概念作為摘要結(jié)果。方法用到的參數(shù)有:1) 命名簡(jiǎn)潔性[19],參數(shù)偏好標(biāo)簽簡(jiǎn)潔的概念,為核心概念的衡量增添了語(yǔ)義信息;2) 基礎(chǔ)等級(jí)。這一參數(shù)評(píng)估概念在本體分類學(xué)中的中心性;3) 密度,這一參數(shù)偏好具有較多屬性和分類關(guān)系的概念;4) 覆蓋,這一參數(shù)的目的在于不忽視本體的任何一個(gè)重要部分;5) 熱度,這一參數(shù)強(qiáng)調(diào)了最為常用的若干概念。
圖7 Peroni等算法摘要后的模式層
如圖7所示,算法基于粗體部分所示的本體網(wǎng)絡(luò)進(jìn)行重要概念的選取。僅保留本體中的概念和類屬關(guān)系構(gòu)成網(wǎng)絡(luò),并根據(jù)概念標(biāo)簽和復(fù)雜網(wǎng)絡(luò)理論中的各項(xiàng)指標(biāo)完成重要概念的選取。
Zhang等[20]在之前工作[2]的基礎(chǔ)上添加了術(shù)語(yǔ)的語(yǔ)義信息。他們?nèi)匀灰訰DF句子為單位進(jìn)行摘要。與之前不同的是,在評(píng)估句子重要性的過(guò)程中,他們將RDF句子轉(zhuǎn)化為SPO(Subject, Predicate, Object)三元組,構(gòu)造句子?術(shù)語(yǔ)二分圖,并在二分圖上計(jì)算節(jié)點(diǎn)的結(jié)構(gòu)重要性和語(yǔ)義重要性。其中,結(jié)構(gòu)重要性是全球語(yǔ)義網(wǎng)中與當(dāng)前句子中SPO三元組相關(guān)的實(shí)體數(shù)量。語(yǔ)義重要性是當(dāng)前句子對(duì)應(yīng)的SPO三元組在全球語(yǔ)義網(wǎng)中出現(xiàn)次數(shù)的加權(quán)平均。將2種重要性線性加權(quán)后進(jìn)行重排序,得到RDF句子的重要性排序,選取若干個(gè)重要性最高的RDF句子作為本體摘要結(jié)果。
上述方法利用不同的轉(zhuǎn)化方式將本體轉(zhuǎn)化為圖,設(shè)定若干參數(shù)選取重要程度最高的節(jié)點(diǎn)。然而,從本體摘要的定義來(lái)看,其目的是產(chǎn)生相較之前本體規(guī)模更小的子本體。而上述方法輸出的要么是孤立的概念,要么是彼此間可能聯(lián)系并不密切的RDF語(yǔ)句,沒(méi)有輸出可用的子本體。
圖8 基于二分圖的算法摘要的圖結(jié)構(gòu)
Pires等[21]構(gòu)造子本體作為摘要結(jié)果。將本體中的概念看作節(jié)點(diǎn),關(guān)系看作有向邊,首先通過(guò)度中心性和頻繁性的線性加權(quán)選取重要概念節(jié)點(diǎn),然后對(duì)概念節(jié)點(diǎn)進(jìn)行分組,最后通過(guò)添加組間節(jié)點(diǎn)連接各個(gè)組,形成原本體對(duì)應(yīng)的子本體。
Queiroz-sousa等[22]在Pires等工作的基礎(chǔ)上構(gòu)造用戶個(gè)性化子本體作為摘要結(jié)果。將本體中的概念看作節(jié)點(diǎn),關(guān)系看作有向邊,首先通過(guò)度中心性和接近中心性的線性加權(quán)選取重要概念節(jié)點(diǎn),然后通過(guò)拓寬路徑算法選取連接重要節(jié)點(diǎn)的必要節(jié)點(diǎn),進(jìn)而生成若干條經(jīng)過(guò)重要概念節(jié)點(diǎn)的重要路徑,從而生成原本體對(duì)應(yīng)的子本體。
Troullinou等[23]在之前工作[24-25]的基礎(chǔ)上,結(jié)合數(shù)據(jù)層和模式層設(shè)計(jì)了摘要方法。具體地,首先利用數(shù)據(jù)層的數(shù)據(jù)計(jì)算本體中邊的相對(duì)基數(shù);然后根據(jù)模式層中節(jié)點(diǎn)所連邊的類型和相對(duì)基數(shù)計(jì)算節(jié)點(diǎn)的重要程度,從而選取重要概念節(jié)點(diǎn);最后設(shè)計(jì)算法選取盡可能不相交的、連接重要概念節(jié)點(diǎn)的路徑,形成原本體對(duì)應(yīng)的子本體。
上述3種方法的思想都是首先將本體中的概念看作節(jié)點(diǎn),關(guān)系看作邊,將本體轉(zhuǎn)化為圖。然后通過(guò)多種參數(shù)的加權(quán)和計(jì)算節(jié)點(diǎn)重要性,從而篩選出重要節(jié)點(diǎn)。最后通過(guò)算法選取路徑連接重要節(jié)點(diǎn),形成摘要圖。3種方法形成的摘要圖都與圖7形式相同。上述方法的區(qū)別在于,Pires等通過(guò)分組和連接兩步選取路徑,Queiroz-sousa等通過(guò)用戶給定的參數(shù)生成個(gè)性化摘要,Troullinou等在選取重要節(jié)點(diǎn)時(shí)同時(shí)利用了數(shù)據(jù)層和模式層的信息。
Li等[26]參照本體評(píng)估的方式,給出了本體摘要評(píng)估的3種方式:1) 基于應(yīng)用的評(píng)估,摘要的質(zhì)量與利用該摘要應(yīng)用的表現(xiàn)成正比;2) 基于黃金標(biāo)準(zhǔn)的評(píng)估,通過(guò)對(duì)比人工構(gòu)建的標(biāo)準(zhǔn)摘要和機(jī)器生成摘要的相似性進(jìn)行評(píng)估,相似性越高,說(shuō)明機(jī)器的摘要越準(zhǔn)確;3) 基于語(yǔ)料覆蓋度的評(píng)估,根據(jù)摘要對(duì)本體的語(yǔ)義覆蓋度進(jìn)行評(píng)估。其中,面向用戶的摘要大多通過(guò)基于黃金準(zhǔn)則的方法進(jìn)行評(píng)估,具體地,比較用戶和算法對(duì)概念的排序相似度,或?qū)Ρ扔脩魳?gòu)建本體和算法生成本體的相似度。面向任務(wù)的摘要大多通過(guò)基于應(yīng)用的方法進(jìn)行評(píng)估,具體地,基于摘要本體進(jìn)行推理、指導(dǎo)問(wèn)答系統(tǒng)等,通過(guò)運(yùn)行結(jié)果評(píng)價(jià)摘要本體質(zhì)量。由于基于語(yǔ)料覆蓋度的本體摘要評(píng)估僅適用于評(píng)價(jià)手工構(gòu)建的本體[27],因此目前尚無(wú)基于語(yǔ)料覆蓋度的本體摘要評(píng)估。
接下來(lái),詳細(xì)介紹基于應(yīng)用的評(píng)估和基于黃金準(zhǔn)則的評(píng)估。
Alani等[12]將摘要前后的本體分別應(yīng)用于問(wèn)答系統(tǒng),并通過(guò)對(duì)比二者返回答案的一致性判斷本體摘要水平?;谡倔w的問(wèn)答系統(tǒng)返回的答案與原問(wèn)答系統(tǒng)返回的答案越相似,說(shuō)明摘要結(jié)果越好。
曲琛等[28]對(duì)摘要前后的本體進(jìn)行推理一致性檢測(cè),若對(duì)摘要前后的本體進(jìn)行推理的結(jié)果完全相同,說(shuō)明二者在語(yǔ)義上是等價(jià)的。
事實(shí)上,問(wèn)答系統(tǒng)返回答案的過(guò)程也可轉(zhuǎn)化為推理過(guò)程。具體地,將待判斷斷言的否定放入問(wèn)答系統(tǒng)進(jìn)行推理,若得出不一致的結(jié)論,說(shuō)明斷言是正確的。因此,可通過(guò)推理機(jī)[29]完成基于應(yīng)用的評(píng)估。推理機(jī)是對(duì)知識(shí)進(jìn)行解釋的程序,根據(jù)知識(shí)的語(yǔ)義,按一定策略找到的知識(shí)進(jìn)行解釋執(zhí)行[30]。目前常用的本體推理機(jī)及其推理類型如表1所示[31-36]。
表1 典型推理機(jī)及其推理類型
1) 摘要結(jié)果為RDF句子
Zhang等[2]通過(guò)對(duì)比專家選出的RDF句子和算法選出的RDF句子來(lái)評(píng)估摘要。具體地,算法摘要與專家評(píng)估結(jié)果的相似度通過(guò)式(1)計(jì)算。
詞匯重疊度量的計(jì)算公式如下。
2) 摘要結(jié)果為重要概念
Li等[26]從Zhang等[2]算法生成的RDF句子中抽取重要概念,與Peroni等算法的結(jié)果進(jìn)行對(duì)比。結(jié)果表明,雖然2種算法摘要的方法和對(duì)象不同(Zhang等以RDF句子為摘要單元,而Peroni等以概念為摘要單元),但返回的概念結(jié)果相似。然而,Peroni等的算法包含更多名稱簡(jiǎn)潔的概念和更普及的概念。這是因?yàn)?,Zhang等的算法僅考慮了本體的結(jié)構(gòu)信息,而Peroni等還考慮了命名簡(jiǎn)潔性和詞匯普及性。
Queiroz-sousa等[22]利用同樣的方法評(píng)估了自己的算法,并與Li等的評(píng)估結(jié)果進(jìn)行了對(duì)比,對(duì)比結(jié)果如表2[22]所示。原文中對(duì)Zhang等算法在financial本體下的匹配度計(jì)算有誤,表2中已進(jìn)行更正。
表2 3種本體摘要算法對(duì)比
3) 摘要結(jié)果為子本體
Troullinou等通過(guò)本體相似度對(duì)比了Peroni等的算法、Queiroz-sousa等的算法,以及他們之前提出的RDF Digest算法[24],對(duì)比結(jié)果如表3所示。
Zhang等[20]通過(guò)定性評(píng)估的方式將摘要結(jié)果與其之前的方法[2]進(jìn)行對(duì)比。因?yàn)樗惴ㄓ玫搅巳蛘Z(yǔ)義網(wǎng)中的信息,對(duì)專家而言,記住語(yǔ)義網(wǎng)中的所有信息是不現(xiàn)實(shí)的。因此,他們針對(duì)本體信息繪制相應(yīng)的摘要圖進(jìn)行評(píng)估。
Deng等[10]從空間復(fù)雜度和時(shí)間復(fù)雜度兩方面評(píng)估無(wú)損摘要的質(zhì)量??臻g復(fù)雜度即給定一個(gè)本體,摘要算法在保留其語(yǔ)義的前提下能將其縮減到的最小規(guī)模。用壓縮本體中的公理數(shù)量與原本體中的公理數(shù)量作比,來(lái)衡量其空間復(fù)雜度。具體計(jì)算公式如式(5)所示。
時(shí)間復(fù)雜度即尋找本體中等價(jià)關(guān)系花費(fèi)的時(shí)間和壓縮本體花費(fèi)的時(shí)間。
表4給出了本文所述算法的各項(xiàng)性能對(duì)比。
表3 4種本體摘要算法對(duì)比
表4 本體摘要算法及評(píng)估方式對(duì)比
目前,大多數(shù)本體摘要方法為用戶導(dǎo)向的摘要[38],對(duì)任務(wù)導(dǎo)向摘要方法的研究仍處于初步階段。用戶導(dǎo)向的本體摘要旨在輸出更為簡(jiǎn)潔的、便于用戶理解的本體信息,其目前有3種輸出形式:RDF句子、重要概念集合,以及圖形化的子本體。任務(wù)導(dǎo)向的本體摘要旨在提供高效的本體應(yīng)用服務(wù),其目前輸出形式為子本體。本文對(duì)本體摘要的研究現(xiàn)狀進(jìn)行了梳理,總結(jié)了用戶導(dǎo)向和任務(wù)導(dǎo)向的本體摘要方法,分類介紹了摘要質(zhì)量的評(píng)估方法。本體摘要的未來(lái)研究趨勢(shì)主要集中在以下幾個(gè)方面。
1) 目前沒(méi)有統(tǒng)一的本體摘要的評(píng)價(jià)指標(biāo),如何根據(jù)本體的內(nèi)在特性,提出一種統(tǒng)一的本體摘要評(píng)價(jià)標(biāo)準(zhǔn)是該領(lǐng)域發(fā)展的關(guān)鍵點(diǎn)。
2) 現(xiàn)有本體摘要方法都是利用某種規(guī)則,從現(xiàn)有本體中抽取關(guān)鍵信息作為摘要結(jié)果。如何根據(jù)現(xiàn)有的本體信息,抽象出本體中沒(méi)有顯式出現(xiàn)的摘要詞語(yǔ),是一個(gè)新的研究方向。
3) 現(xiàn)有本體摘要方法沒(méi)有利用機(jī)器學(xué)習(xí)算法,可以考慮將機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法與本體摘要結(jié)合,提出新的摘要方法。
[1] 劉嶠, 李楊, 段宏, 等. 知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 計(jì)算機(jī)研究與發(fā)展, 2016, 53(3): 582-600.
LIU Q, LI Y, YIN H, et. al. Knowledge graph construction techniques[J]//Journal of Computer Research and Development. 2016, 53(3): 582-600.
[2] ZHANG X, CHEN G, QU Y Z. Ontology summarization based on RDF sentence graph[C]//International Conference on World Wide Web. ACM, 2007: 707-716.
[3] WANG R, YU X, LI Y, et al. Ontology partition method for semantic query routing[C]//International Conference on Intelligent Pervasive Computing. IEEE, 2008: 86-89.
[4] STUCKENSCHMIDT H, KLEIN M. Structure-based partitioning of large concept hierarchies[C]//International Semantic Web Conference. 2004: 289-303.
[5] D'AQUIN M, SCHLICHT A, STUCKENSCHMIDT H, et al. Ontology modularization for knowledge selection: experiments and evaluations[C]//International Conference Database and Expert Systems Applications. 2007: 874-883.
[6] D’AQUIN M, SCHLICHT A, STUCKENSCHMIDT H, et al. Modular ontologies: concepts, theories and techniques for knowledge modularization[J]. Lecture Notes in Computer Science, 2009, 5445(4): 67-89.
[7] MANI I. Automatic Summarization[M]. John Benjamins Publishing Company, 2001.
[8] LI N, MOTTA E, D'AQUIN M. Ontology summarization: an analysis and an evaluation[J]. International Workshop on Evaluation of Semantic Technologies, 2010.
[9] ERKAN, RADEV, DRAGOMIR R. LexRank: graph-based lexical centrality as salience in text summarization[J]. Journal of Qiqihar Junior Teachers College, 2011, 22:2004.
[10] 鄧玲玉. 基于重要度計(jì)算的語(yǔ)義物聯(lián)網(wǎng)本體摘要方法研究[D]. 大連: 大連海事大學(xué), 2017.
DENG L. Research on method of importance computing based semantic web of things ontology summarization[D]// Dalian : Dalian Maritime University. 2017.
[11] 張靈峰, 夏戰(zhàn)鋒, 彭志平. 基于Tbox和Abox的描述邏輯推理研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2010, 20(11): 122-125.
ZHANG L, XIA Z, PENG Z. Research on description logic's reasoning based on Tbox and Abox[J]//Computer Technology and Development. 2010, 20(11): 122-125.
[12] ALANI H, HARRIS S, O'NEIL B. Winnowing ontologies based on application use[C]//European Conference on the Semantic Web: Research and Applications. 2006: 185-199.
[13] FOKOUE A, KERSHENBAUM A, MA L, et al. The summary ABox: cutting ontologies down to size[C]//The Semantic Web - ISWC 2006. 2006: 343-356.
[14] MIKA P. Social Networks and the Semantic Web[C]//IEEE/WIC/ ACM International Conference on Web Intelligence. 2004: 285-291.
[15] FREEMAN L C. A set of measures of centrality based on betweenness[J]. Sociometry, 1997: 35-41.
[16] ZAFARANI R, ABBASI M A, LIU H. Social media mining: an introduction[M]. Cambridge University Press, 2014.
[17] Ontology selection: ontology evaluation on the real semantic Web.
[18] PERONI S, MOTTA E, D’AQUIN M. identifying key concepts in an ontology, through the integration of cognitive principles with statistical and topological measures[C]//Asian Semantic Web Conference on the Semantic Web. 2008.
[19] ROSCH E. Principles of categorization[J]. Readings in Cognitive Science, 1988:312-322.
[20] ZHANG X, CHENG G, GE W Y, et al. Summarizing vocabularies in the global semantic Web[J]. Journal of Computer Science and Technology, 2009, 24(1):165-174.
[21] PIRES C E, SOUSA P, KEDAD Z, et al. Summarizing ontology-based schemas in PDMS.[J]. Icdew, 2010:239-244.
[22] QUEIROZ-SOUSA P O, SALGADO A C, PIRES C E. A method for building personalized ontology summaries[J]. Journal of Information and Data Management, 2013, 4(3): 236.
[23] TROULLINOU G, KONDYLAKIS H, DASKALAKI E, et al. Ontology understanding without tears: the summarization approach[J]. Semantic Web, 2016, 8(6).
[24] TROULLINOU G, KONDYLAKIS H, DASKALAKI E, et al. RDF digest: efficient summarization of rdf/s kbs[C]//European Semantic Web Conference. 2015: 119-134.
[25] TROULLINOU G, KONDYLAKIS H, DASKALAKI E, et al. RDF digest: ontology exploration using summaries[C]//The ISWC 2015 Posters & Demonstrations Track Co-located with the 14th International Semantic Web Conference (ISWC-2015). 2015.
[26] LI N, Motta E. Evaluations of user-driven ontology summarization[J]. Lecture Notes in Computer Science, 2010, 6317(1): 544-553.
[27] 宋丹輝. 本體評(píng)價(jià)研究綜述[J]//情報(bào)理論與實(shí)踐, 2011, 34(9):118-122.
SONG D. Ontology evaluation and research survey[J]// Information Studies:Theory & Application, 2011, 34(9):118-122.
[28] 曲琛. 語(yǔ)義物聯(lián)網(wǎng)本體的摘要方法研究[D]. 大連海事大學(xué), 2014.
QU C. Research on summarization method of ontology in semantic web of things[D]// Dalian Maritime University. 2014.
[29] SINGH S, KARWAYUN R. A Comparative Study of Inference Engines[C]// International Conference on Information Technology: New Generations. IEEE, 2010:53-57.
[30] 潘超, 古輝. 本體推理機(jī)及應(yīng)用[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2010, 19(9):163-167.
PAN C. GU H. Ontology reasoned and its application[J].//Computer System&Applications, 2010, 19(9):163-167.
[31] FRIEDMAN-HILL E J. JESS, the rule engine for the Java platform[J]. Sandia National Laboratories, 2006, 48(2): 340-354.
[32] CARROLL J J, DICKINSON I, DOLLIN C, et al. Jena: implementing the semantic Web recommendations[C]//International World Wide Web Conference on Alternate Track Papers & Posters. ACM, 2004: 74-83.
[33] SIRIN E, PARSIA B, GRAU B C, et al. Pellet: A practical OWL-DL reasoner[J]. Web Semantics Science Services & Agents on the World Wide Web, 2007, 5(2):51-53.
[34] HAARSLEV V, M?LLER R. Racer: a core inference engine for the semantic Web[J]. EON, 2003(October):27-36.
[35] TSARKOV D, HORROCKS I. FaCT++, description logic reasoner: system description[C]//International Joint Conference on Automated Reasoning. 2006:292-297.
[36] BOBILLO F, STRACCIA U. FuzzyDL: An expressive fuzzy description logic reasoner[C]//IEEE International Conference on Fuzzy Systems. 2008:923-930.
[37] GRAVES A, ADALI S, HENDLER J. A method to rank nodes in an RDF Graph[C]// Poster and Demonstration Session at the, International Semantic Web Conference(DBLP). 2008:309-320.
[38] POURIYEH S, ALLAHYARI M, LIU Q, et al. Graph-based Ontology Summarization: a survey[J]. arXiv:1805.06051, 2018.
Ontologysummarizationtechnologysurvey
DING Yuehang, YU Hongtao, HUANG Ruiyang, LI Yingle
National Digital Switching System Engineering & Technological R & D Center, Zhengzhou 450002, China
Ontology is an important tool for knowledge sharing, while it is also the upper structure of knowledge graph. With the explosion of data and ontology complexity, ontology understanding and application are becoming more and more difficult. As a technique to shrink ontology scale, ontology summarization accelerated ontology understanding and application technologically. Different definitions of ontology summarization were shown, ontology summarization methods were compared and analyzed, ontology summarization evaluation parameter system was introduced, and at last, possible future research area was given.
knowledge graph, ontology, ontology summarization, ontology evaluation
TP393
A
10.11959/j.issn.2096-109x.2018081
丁悅航(1995-),女,山東菏澤人,國(guó)家數(shù)字交換系統(tǒng)工程技術(shù)研究中心碩士生,主要研究方向?yàn)閺?fù)雜網(wǎng)絡(luò)、知識(shí)圖譜。
于洪濤(1970-),男,遼寧丹東人,博士,國(guó)家數(shù)字交換系統(tǒng)工程技術(shù)研究中心研究員,主要研究方向?yàn)榫W(wǎng)絡(luò)大數(shù)據(jù)分析與處理。
黃瑞陽(yáng)(1986-),男,福建漳州人,博士,國(guó)家數(shù)字交換系統(tǒng)工程技術(shù)研究中心助理研究員,主要研究方向?yàn)槲谋就诰?、圖挖掘。
李英樂(lè)(1985-),男,河北衡水人,碩士,國(guó)家數(shù)字交換系統(tǒng)工程技術(shù)研究中心助理研究員,主要研究方向?yàn)榫W(wǎng)絡(luò)大數(shù)據(jù)分析與處理。
2018-08-27;
2018-09-29
丁悅航,739815262@qq.com
國(guó)家自然科學(xué)基金資助項(xiàng)目(No.61521003)
The National Natural Science Foundation of China (No.61521003)