亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        采用雙向個(gè)體標(biāo)注的本體匹配技術(shù)

        2016-10-14 07:15:24薛醒思王金水
        關(guān)鍵詞:度量雙向本體

        薛醒思, 王金水

        (福建工程學(xué)院信息科學(xué)與工程學(xué)院, 福建 福州 350118)

        ?

        采用雙向個(gè)體標(biāo)注的本體匹配技術(shù)

        薛醒思, 王金水

        (福建工程學(xué)院信息科學(xué)與工程學(xué)院, 福建 福州350118)

        針對(duì)現(xiàn)實(shí)本體中缺乏雙向標(biāo)注的個(gè)體而導(dǎo)致的基于個(gè)體的本體匹配技術(shù)難以得到廣泛應(yīng)用這一問題, 提出一種采用雙向個(gè)體標(biāo)注的本體匹配技術(shù). 該技術(shù)通過進(jìn)化算法實(shí)現(xiàn)本體間自動(dòng)化個(gè)體雙向標(biāo)注和概念匹配的過程. 實(shí)驗(yàn)采用OAEI 2012的測(cè)試數(shù)據(jù)集, 結(jié)果表明所提出的方法是有效的.

        雙向個(gè)體標(biāo)注; 進(jìn)化算法; 本體匹配

        0 引言

        語義網(wǎng)是萬維網(wǎng)的一個(gè)重要發(fā)展方向, 它提供了一個(gè)通用框架, 使得數(shù)據(jù)的共享和重用可以跨越應(yīng)用系統(tǒng)、 企業(yè)和社區(qū)的邊界. 在語義網(wǎng)環(huán)境下, 語義層面的交互是所有基于開放知識(shí)的系統(tǒng)和分布式系統(tǒng)的設(shè)計(jì)中所關(guān)注的重要特性, 也是兩個(gè)或多個(gè)信息系統(tǒng)在交互的過程中能夠自動(dòng)地、 準(zhǔn)確地理解彼此通信內(nèi)容的真實(shí)含義的能力. 要實(shí)現(xiàn)語義層面的交互首先要求對(duì)所有數(shù)據(jù)信息的含義進(jìn)行充分的細(xì)節(jié)描述以克服潛在的語義不確定性, 即交互雙方都必須使用一個(gè)共享的、 正式的信息交換參考模型.

        本體作為語義網(wǎng)的關(guān)鍵組件, 是目前最新的信息交換參考模型, 也是迄今為止用于獲取最準(zhǔn)確的語義規(guī)范化描述的技術(shù). 根據(jù)最常用的本體定義, 本體是概念化的明確的規(guī)范說明, 即對(duì)某個(gè)領(lǐng)域中存在的對(duì)象、 概念、 其他實(shí)體以及它們之間關(guān)系的正式的和規(guī)范化描述. 由于語言的快速進(jìn)化(例如舊的術(shù)語可能不斷擁有新的含義), 創(chuàng)建并維護(hù)一個(gè)包羅萬象的、 可以滿足所有應(yīng)用系統(tǒng)要求的本體是一個(gè)不可能的任務(wù). 因此, 目前在不同的系統(tǒng)中使用的都是由不同的團(tuán)體彼此獨(dú)立開發(fā)的本體. 然而, 不同本體設(shè)計(jì)者對(duì)于某個(gè)領(lǐng)域中的相同對(duì)象可能會(huì)有不同的描述方式(例如, 同一個(gè)概念在不同本體中可能會(huì)有不同的名字), 這就會(huì)導(dǎo)致術(shù)語和概念描述不一致的異質(zhì)本體的產(chǎn)生, 而異質(zhì)本體中存在的語義異質(zhì)問題是實(shí)現(xiàn)語義層面交互的最大障礙. 目前, 解決本體異質(zhì)問題的最有效的方法, 是通過執(zhí)行本體匹配過程來檢測(cè)并發(fā)現(xiàn)異質(zhì)本體中在語義上相似的實(shí)體之間的對(duì)應(yīng)關(guān)系, 最終輸出由在語義上相似的實(shí)體對(duì)組成的本體匹配結(jié)果. 由于本體匹配過程在諸如電子商務(wù)、 知識(shí)管理、 信息檢索、 知識(shí)獲取、 醫(yī)學(xué)、 生物信息學(xué)等應(yīng)用領(lǐng)域中具有重大的實(shí)用價(jià)值, 近年來開發(fā)了大量的本體匹配系統(tǒng). 這些本體匹配系統(tǒng)通常將源本體中的每一個(gè)實(shí)體同目標(biāo)本體中的所有實(shí)體進(jìn)行比較, 通過組合不同相似度度量技術(shù)來確定目標(biāo)本體中與其最相似的實(shí)體對(duì)象.

        由于相比其概念的屬性而言, 概念所擁有的個(gè)體可以更好地描述其真實(shí)的語義, 這使得基于個(gè)體的本體匹配技術(shù)引起了廣泛的關(guān)注[1]. 然而, 現(xiàn)實(shí)的本體中缺乏同時(shí)與兩個(gè)本體中的概念都相關(guān)的個(gè)體(即雙向標(biāo)注的個(gè)體), 因此, 基于個(gè)體的本體匹配技術(shù)難以得到廣泛應(yīng)用[2]. 針對(duì)這一問題, 本研究提出一種雙向個(gè)體標(biāo)注的本體匹配技術(shù). 該技術(shù)通過進(jìn)化算法(evolutionary algorithm, EA)實(shí)現(xiàn)待匹配本體中自動(dòng)的個(gè)體的雙向標(biāo)注過程, 并在此基礎(chǔ)上確定本體中概念間的對(duì)應(yīng)關(guān)系. 本研究的貢獻(xiàn)如下: ① 在采用雙向個(gè)體標(biāo)注的本體匹配技術(shù)中通過引入近似度量方法以降低該技術(shù)對(duì)領(lǐng)域?qū)<业囊蕾嚕?② 從雙向個(gè)體標(biāo)注角度為本體匹配問題構(gòu)建單目標(biāo)優(yōu)化模型, 并設(shè)計(jì)了采用雙向個(gè)體標(biāo)注的本體匹配算法以求解該問題; ③ 通過靜態(tài)測(cè)試技術(shù)分析實(shí)驗(yàn)結(jié)果, 驗(yàn)證采用雙向個(gè)體標(biāo)注的本體匹配技術(shù)的有效性.

        1 基本概念

        1.1本體與本體映射

        定義1[3]本體是一個(gè)八元組O=(C, P, I, ≤c, ≤p, φCP, φCI, φPI), 其中: C、 P和I分別指本體中的概念、 屬性和個(gè)體的集合, 三者統(tǒng)稱為本體中的實(shí)體(entity); ≤c是C的偏序集合, 即類的概念體系結(jié)構(gòu); ≤p是P的偏序集合, 即類的屬性體系結(jié)構(gòu); φCP:P→C×C是將屬性p∈P同概念間的關(guān)系關(guān)聯(lián)起來的函數(shù); φCI:C→R(I)是將概念c∈C同概念c的個(gè)體I的子集關(guān)聯(lián)起來的函數(shù); φPI:C→R(I2)是將屬性p∈P同笛卡爾集I×I的自己關(guān)聯(lián)起來的函數(shù), 其中, I×I表示通過屬性p∈P產(chǎn)生關(guān)聯(lián)關(guān)系的個(gè)體對(duì).

        定義2[3]給定兩個(gè)待匹配的本體O1和O2, 本體匹配結(jié)果A是一組k個(gè)映射的集合:

        其中: ei是本體O1的第i個(gè)實(shí)體; ej是本體O2的第j個(gè)實(shí)體; ηl是第l個(gè)映射的可信度值; r是實(shí)體對(duì)ei和ej之間的語義關(guān)系(通常是等價(jià)關(guān)系).

        1.2本體匹配結(jié)果評(píng)價(jià)

        傳統(tǒng)的評(píng)價(jià)度量recall、 precision和f-measure最大的缺陷是需要由專家事先給出標(biāo)準(zhǔn)的本體匹配結(jié)果, 而該結(jié)果在實(shí)際應(yīng)用中往往是不存在的. 為了解決這一問題, 假定所需要的本體匹配結(jié)果是1 ∶1(即本體中的任何概念只能同另一個(gè)本體中的一個(gè)概念對(duì)應(yīng)), 采用如下的3個(gè)近似度量: MatchCover、 MatchRatio和MatchMeasure[4]分別用于近似傳統(tǒng)的recall、 precision和f-measure:

        (1)

        (2)

        (3)

        2 雙向個(gè)體標(biāo)注算法

        對(duì)于本體O1中的某個(gè)個(gè)體insti, 首先要確定在本體O2同insti相似的個(gè)體集合I2, 然后將insti關(guān)聯(lián)到I2中的個(gè)體所直接關(guān)聯(lián)的概念上以實(shí)現(xiàn)insti的雙向標(biāo)注.

        2.1個(gè)體相似度度量技術(shù)

        基于個(gè)體的本體匹配技術(shù)的關(guān)鍵問題之一就是如何度量不同個(gè)體之間的相似度[5]. 根據(jù)文獻(xiàn)[6], 兩個(gè)個(gè)體的相似度可以通過各自屬性值的相似程度來確定. 此外, 考慮到在個(gè)體相關(guān)的背景信息未知的前提下, 通過統(tǒng)計(jì)個(gè)體中屬性間的相似度以進(jìn)一步確定個(gè)體間相似度是目前有效的方法之一. 具體地說, 給定兩個(gè)個(gè)體inst1和inst2, 二者的相似度通過以下公式計(jì)算[7]:

        (4)

        其中:h和k分別是個(gè)體inst1和inst2的屬性集合的基數(shù); inst1i和inst2j分別表示inst1中第i個(gè)屬性和inst2中第j個(gè)屬性; 函數(shù)Sim()用于計(jì)算inst1i和inst2j的屬性值的SMOA距離[8-9].

        通過上述度量方法可獲取兩個(gè)本體O1和O2的個(gè)體相似度矩陣S. S的第i行和第j列分別表示O1中的第i個(gè)個(gè)體和O2中的第j個(gè)個(gè)體, S的元素Sij表示O1中的第i個(gè)個(gè)體和O2中的第j個(gè)個(gè)體的相似度值.

        2.2雙向個(gè)體標(biāo)注算法

        在雙向個(gè)體標(biāo)注算法中, 有兩個(gè)關(guān)鍵參數(shù)需要確定: ① topN表示前N個(gè)同O1中的個(gè)體inst1i最相似的O2中的個(gè)體可以用于產(chǎn)生inst1i的雙向標(biāo)注; ② instanceThreshold表示只有同inst1i相似度值大于instanceThreshold的O2中的個(gè)體可以用于產(chǎn)生inst1i的雙向標(biāo)注. 如何確定這兩個(gè)參數(shù)的值對(duì)最終產(chǎn)生的本體映射結(jié)果有明顯的影響, 關(guān)于這兩個(gè)參數(shù)的討論詳見第4小節(jié).

        給定待匹配本體O1和O2的個(gè)體相似度矩陣S、 參數(shù)topN和instanceThreshold, 雙向個(gè)體標(biāo)注算法的步驟如下: ① 將S中所有小于instanceThreshold的值置0; ② 遍歷S中的所有行, 對(duì)每一行的數(shù)值另行按照降序排列, 對(duì)排號(hào)大于topN的數(shù)值, 將S中相應(yīng)的元素置0; ③ 遍歷S中的所有列, 對(duì)每一列的數(shù)值另行按照降序排列, 對(duì)排號(hào)大于topN的數(shù)值, 將S中相應(yīng)的元素置0; ④ 對(duì)S中非零元素對(duì)應(yīng)的行和列的個(gè)體執(zhí)行雙向標(biāo)注, 例如: S中的元素Sij為非0元素, 則將O1中的個(gè)體inst1i關(guān)聯(lián)到O2的個(gè)體inst2j所關(guān)聯(lián)的概念, 同樣將O2的個(gè)體inst2j關(guān)聯(lián)到O1中的個(gè)體inst1i所關(guān)聯(lián)的概念.

        通過上述算法, 實(shí)現(xiàn)兩個(gè)本體間的個(gè)體雙向標(biāo)注, 之后首先計(jì)算擁有個(gè)體的概念間的相似度, 然后通過上下文將相似度擴(kuò)散到?jīng)]有個(gè)體的概念間.

        3 概念相似度度量技術(shù)

        根據(jù)文獻(xiàn)[10], 改進(jìn)的Jaccard度量可以有效地計(jì)算兩個(gè)擁有個(gè)體的概念間的相似度. 因此, 采用改進(jìn)的Jaccard度量來計(jì)算兩個(gè)擁有個(gè)體的概念間的相似度:

        (5)

        其中:Instc1和Instc2分別是同概念c1和c2直接關(guān)聯(lián)的個(gè)體集合.

        由于本體通常只有葉子節(jié)點(diǎn)的概念有定義個(gè)體集合, 為了獲取本體中沒有定義個(gè)體集合的概念間的相似度, 需要通過以下公式將相似度在相鄰的概念間進(jìn)行傳播: 給定兩個(gè)概念c1、 c2和它們的直接子概念集合Sc1和Sc2, c1和c2間的相似度值通過以下公式來計(jì)算[7]:

        (6)

        4 求解本體匹配問題

        在雙向個(gè)體標(biāo)注算法中,topN較大意味著inst1i可能同更多的O2中的概念直接關(guān)聯(lián), 從而產(chǎn)生較多的本體中概念間的匹配. 而較小的topN意味著inst1i只會(huì)選擇相對(duì)更為相似的個(gè)體來產(chǎn)生雙向標(biāo)注, 從而保證匹配結(jié)果的準(zhǔn)確性. 較低的instanceThreshold使得inst1i可能同更多的O2中的概念直接關(guān)聯(lián), 隨著instanceThreshold的增加, O2中的個(gè)體可以用于產(chǎn)生inst1i的雙向標(biāo)注的選擇性也隨著提升, 產(chǎn)生較少的但是準(zhǔn)確性高的匹配結(jié)果. 這兩個(gè)參數(shù)取值的權(quán)衡問題類似于recall和precision之間的權(quán)衡: 當(dāng)想要獲取更高的precision的時(shí)候, 需要對(duì)結(jié)果有更嚴(yán)格的選擇條件, 這就不可避免地降低了recall的值; 反之亦然, 當(dāng)想要提高recall的值的時(shí)候, 必然要放寬結(jié)果的選擇條件, 這又導(dǎo)致了precision值的降低. 因此, 為了動(dòng)態(tài)地確定最優(yōu)的topN與instanceThreshold以獲取高質(zhì)量的本體匹配結(jié)果, 本研究提出用EA來確定topN與instanceThreshold從而優(yōu)化本體匹配結(jié)果.

        4.1本體匹配問題的優(yōu)化模型

        本研究希望能夠通過確定雙向個(gè)體標(biāo)注算法中的topN和分別用于過濾個(gè)體映射結(jié)果和概念映射結(jié)果的instanceThreshold和conceptThreshold來獲取最優(yōu)的本體匹配結(jié)果. 其中, 本體匹配結(jié)果結(jié)果的質(zhì)量度量方法采用的是公式(3)中的MatchMeasure.MatchMeasure的值越大表示獲取的本體匹配結(jié)果越好. 綜上, 提出的本體匹配問題的優(yōu)化模型如下:

        (7)

        在該模型中,topN與instanceThreshold是雙向個(gè)體標(biāo)注算法中的兩個(gè)關(guān)鍵參數(shù),conceptThreshold是用于過濾本體匹配結(jié)果中的概念映射, 該模型的目標(biāo)是最大化映射結(jié)果的MatchMeasure值.

        表1 進(jìn)化算法偽代碼Tab.1 Pseudocode of evolutionary algorithm

        本體匹配問題是一種十分復(fù)雜(非線性問題且有許多局部最優(yōu)解)和耗時(shí)(計(jì)算數(shù)據(jù)量大)的問題. 尤其當(dāng)本體中的實(shí)體規(guī)模龐大的時(shí)候, 通常會(huì)采用近似的算法來求解本體匹配問題. 從這個(gè)角度來看, EA作為一種魯棒性好且尋優(yōu)能力強(qiáng)的全局優(yōu)化方法, 十分適合用于求解本體匹配問題. 表1給出了EA的偽代碼.

        4.2編碼機(jī)制

        采用實(shí)數(shù)編碼, 種群中的每個(gè)個(gè)體的第1個(gè)染色體代表topN, 其取值范圍從0到10; 第2個(gè)和第3個(gè)染色體分別代表個(gè)體和概念的相似度閾值, 取值范圍從0到1.

        4.3適應(yīng)度函數(shù)

        適應(yīng)度函數(shù)用于評(píng)價(jià)通過種群個(gè)體產(chǎn)生的本體匹配結(jié)果的質(zhì)量. 采用在1.2小節(jié)介紹的近似度量MatchMeasure作為適應(yīng)度函數(shù).

        4.4 遺傳算子

        1) 選擇算子. 采用賭輪盤選擇算子, 該算子為每一個(gè)個(gè)體賦予一個(gè)正比于它們的適應(yīng)度值的選擇概率, 這就使得適應(yīng)度值最高的個(gè)體擁有最高的概率產(chǎn)生下一代個(gè)體, 而適應(yīng)度值不是那么高的個(gè)體也有機(jī)會(huì)產(chǎn)生下一代個(gè)體.

        2) 交叉算子. 采用單點(diǎn)交叉算子, 首先隨機(jī)地選擇父?jìng)€(gè)體中的一個(gè)編碼位作為切割點(diǎn), 切割點(diǎn)將父?jìng)€(gè)體分為左右兩個(gè)部分, 然后通過交換父?jìng)€(gè)體中的右邊的基因來產(chǎn)生新個(gè)體.

        3) 變異算子. 采用位點(diǎn)變異方法, 如果變異的編碼位是第1位, 則將該編碼位上的數(shù)值隨機(jī)加上一個(gè)整數(shù)并取其與10相除后的余數(shù). 如果該變異的編碼位是第2位或是第3位, 按照以下公式進(jìn)行變異:

        其中:cnew和cold分別表示變異前與變異后的值,r和rand分別是兩個(gè)取值范圍在0到1之間的隨機(jī)數(shù).

        5 實(shí)驗(yàn)結(jié)果與分析

        實(shí)驗(yàn)采用OAEI 2012[11]測(cè)試案例集, 其中, 每個(gè)測(cè)試案例由一個(gè)種子本體根據(jù)不同方法修改獲取的目標(biāo)本體和一個(gè)由專家事先給出的參考匹配結(jié)果組成. 表2給出了OAEI 2012測(cè)試案例集的簡(jiǎn)述.

        表2 OAEI 2012測(cè)試案例集簡(jiǎn)述Tab.2 Brief introduction of OAEI 2012 test cases

        實(shí)驗(yàn)中, EA的參數(shù)配置遵循以下原則:

        ① EA以交叉算子為主, 變異算子為輔. 因此, 交叉概率較大而變異概率較小. 如果交叉概率太大, 則會(huì)產(chǎn)生過多的解從而增加了計(jì)算量, 變異概率太大使得算法成為隨機(jī)算法, 結(jié)果無法收斂. 建議的交叉概率的取值區(qū)間為[0.2, 1], 而變異概率的取值區(qū)間為[0.01, 0.05]. 通過實(shí)驗(yàn)發(fā)現(xiàn), 交叉概率0.7和變異概率0.02對(duì)于測(cè)試數(shù)據(jù)集中的各種異質(zhì)問題都能產(chǎn)生可接受的解.

        ② EA的群體規(guī)模以及算法的終止條件取決于問題的規(guī)模, 建議將取值區(qū)間分別設(shè)為[30, 300]和[200, 1000]. 由于所求解的問題規(guī)模不大, 因此, EA法的群體規(guī)模以及算法的終止條件分別設(shè)置為30個(gè)個(gè)體和300次適應(yīng)度評(píng)價(jià).

        綜上, EA算法采用的參數(shù)目的是為了獲取最高的平均匹配結(jié)果質(zhì)量. 通過這種方式獲取的參數(shù)配置對(duì)于OAEI 2012測(cè)試案例集中所有的測(cè)試數(shù)據(jù)是魯棒的, 因此, 也有望對(duì)于現(xiàn)實(shí)世界中常見的異質(zhì)問題是魯棒的. 實(shí)驗(yàn)中, EA的參數(shù)配置如下:

        數(shù)值精度=0.01, 群體規(guī)模=40個(gè)個(gè)體, 交叉概率=0.7, 變異概率=0.02, 最大代數(shù)=300

        為了同前沿的本體匹配系統(tǒng)比較, 將已獲取的本體匹配結(jié)果用傳統(tǒng)的評(píng)價(jià)度量recall、 precision和f-measure重新評(píng)價(jià). 表3中描述了本方法同前沿的本體匹配系統(tǒng)eTuner[12]和GOAL[13]的比較結(jié)果.

        在表3中, 1XX、 2XX和3XX分別代表表2中的編號(hào)以1、 2和3開始的測(cè)試案例集, 符號(hào)R、P和f分別表示recall、 precision和f-measure, 表中的數(shù)值是相應(yīng)的測(cè)試數(shù)據(jù)集匹配結(jié)果評(píng)價(jià)的均值. 本方法的結(jié)果是在30次獨(dú)立運(yùn)行后的平均結(jié)果. 在前沿的本體匹配系統(tǒng)中, 本研究選擇eTuner和GOAL的原因如下: ① eTuner采用自動(dòng)化調(diào)諧參數(shù)的技術(shù), 但它是基于枚舉搜索的策略; ② GOAL同本文提出的方法類似, 是著名的基于EA的本體匹配系統(tǒng). 實(shí)驗(yàn)比較的過程由兩個(gè)步驟組成: ① 通過靜態(tài)測(cè)試技術(shù), 即Friedman測(cè)試[14], 判斷是否比較的系統(tǒng)產(chǎn)生的結(jié)果之間存在差異; ② 如果第一個(gè)步驟判斷出比較的系統(tǒng)間存在差異, 則執(zhí)行后續(xù)的靜態(tài)測(cè)試, 即Holm測(cè)試[15], 以確定性能較優(yōu)的系統(tǒng).

        Friedman測(cè)試是一種無參數(shù)的靜態(tài)測(cè)試過程, 致力于檢測(cè)兩個(gè)或兩個(gè)以上的算法之間是否存在明顯的行為差異. 具體地說, 該測(cè)試假設(shè)所有的算法都是等價(jià)的, 對(duì)這一假定的否決意味著被研究的算法間存在差異. 為了否決Friedman測(cè)試的假設(shè), 計(jì)算的χr的值必須等于或大于在特定級(jí)別的卡方臨界值[16]. 實(shí)驗(yàn)中, 級(jí)別α=0.05. 由于比較的是3個(gè)本體匹配方法, 因此, 分析的過程需要考慮自由度為二的臨界值χ0.05, 該臨界值為5.991. 表3中圓括號(hào)中的數(shù)字是該結(jié)果相應(yīng)的排名. 通過執(zhí)行Friedman測(cè)試, 計(jì)算的χr的值是44.53. 由于χr的值大于χ0.05, Friedman的假設(shè)被否決, 因此, 比較的3個(gè)本體匹配系統(tǒng)之間可能存在明顯的差異.

        根據(jù)這一結(jié)果, 需要執(zhí)行后續(xù)的關(guān)于系統(tǒng)間成對(duì)比較的靜態(tài)測(cè)試. Holm測(cè)試先要選擇一個(gè)控制算法, 并將其同其余的算法進(jìn)行比較. 一般情況下, 控制算法是在Friedman測(cè)試中排名值最低的算法. 從表3中的最后一行的平均值可以看出, 本方法排名值最低.

        表3 本方法同前沿的本體匹配系統(tǒng)的比較Tab.3 Comparison between the state-of-the-art ontology matching systems and our approach

        Holm測(cè)試在比較第i和第j算法的時(shí)候, 指定使用z值來從正態(tài)分布表中確定相關(guān)的概率(即p值), 然后將p值同級(jí)別參數(shù)α(實(shí)驗(yàn)中α=0.05)進(jìn)行比較. Holm測(cè)試的結(jié)果在表4中給出. 通過表4中的數(shù)據(jù), 可以得出以下結(jié)論: 本方法在5%級(jí)別上靜態(tài)優(yōu)于eTuner和GOAL.

        表4 Holm測(cè)試Tab.4 Holm’s test

        6 結(jié)語

        本體匹配是本體工程中的重要步驟, 然而本體匹配過程中仍然有許多問題有待解決. 其中一個(gè)問題是由于現(xiàn)實(shí)的本體中缺乏雙向標(biāo)注的個(gè)體, 使得基于個(gè)體的本體匹配技術(shù)難以得到廣泛的應(yīng)用. 為此, 提出一種雙向個(gè)體標(biāo)注的本體匹配技術(shù), 該技術(shù)通過EA來實(shí)現(xiàn)本體間自動(dòng)化個(gè)體雙向標(biāo)注和概念匹配的過程. 實(shí)驗(yàn)采用OAEI 2012的測(cè)試數(shù)據(jù)集, 同前沿的本體匹配系統(tǒng)的結(jié)果比較表明本方法是有效的.

        由于本研究提出的近似度量MatchCover、 MatchRatio和MatchFmeasure的前提條件是一種非常強(qiáng)的約束(標(biāo)準(zhǔn)匹配結(jié)果是1 ∶1), 該前提使得這些度量不適用于標(biāo)準(zhǔn)匹配結(jié)果是m∶n的應(yīng)用場(chǎng)景. 關(guān)于如何設(shè)計(jì)不依賴標(biāo)準(zhǔn)匹配結(jié)果且具有更好的普適性的本體匹配結(jié)果的質(zhì)量度量方法是未來需要解決的問題.

        [1] WANG Z, LI J, ZHAO Y,etal. A unified approach to matching semantic data on the Web[J]. Knowledge-Based Systems, 2013, 39: 173-184.

        [2] THOR A, KIRSTEN T, RAHM E. Instance-based matching of hierarchical ontologies[C]//BTW. Aachen: [s.n.], 2007: 436-448.

        [3] ACAMPORA G, LOIA V, VITIELLO A. Enhancing ontology alignment through a memetic aggregation of similarity measures[J]. Information Sciences, 2013, 250: 1-20.

        [4] KIRSTEN T, THOR A, RAHM E. Instance-based matching of large life science ontologies[C]//Proceeding of 10th International Conference on Data Integration in the Life Sciences. Philadelphia: [s.n.], 2007: 172-187.

        [5] DUAN S, FOKOUE A, HASSANZADEH O,etal. Instance-based matching of large ontologies using locality-sensitive hashing[M]. Boston: Springer, 2012: 49-64.

        [6] RONG S, NIU X, XIANG E W,etal. A machine learning approach for instance matching based on similarity metrics[M]. Boston: Springer, 2012: 460-475.

        [7] ENGMANN D, MASSMANN S. Instance matching with coma++[C]// BTW. Aachen: [s.n.], 2007: 28-37.

        [8] STOILOS G, STAMOU G, KOLLIAS S. A string metric for ontology alignment[M]. Galway: Springer, 2005: 624-637.

        [9] WINKLER W E. The state of record linkage and current research problems: RR99/04[R]. Washington DC: Statistical Research Division, US Census Bureau, 1999.

        [10] ISAAC A, VAN DER MEIJ L, Schlobach S,etal. An empirical study of instance-based ontology matching[M]. Busan: Springer, 2007: 253-266.

        [11] AGUIRRE J L, GRAU B C, ECKERT K,etal. Results of the ontology alignment evaluation initiative 2012[C]//Proceeding of 7th ISWC Workshop on Ontology Matching. Boston: [s.n.], 2012: 73-115.

        [12] LEE Y, SAYYADIAN M, DOAN A H,etal. eTuner: tuning schema matching software using synthetic scenarios[J]. The VLDB Journal-The International Journal on Very Large Data Bases, 2007, 16(1): 97-122.

        [13] MARTINEZ-GIL J, ALBA E, ALDANA-MONTES J F. Optimizing ontology alignments by using genetic algorithms[C]//Proceedings of The Workshop on Nature Based Reasoning for The Semantic Web. Karlsruhe: [s.n.], 2008: 1-14, .

        [14] GARCIA S, MOLINA D, LOZANO M,etal. A study on the use of non-parametric tests for analyzing the evolutionary algorithms’ behaviour: a case study on the CEC’2005 special session on real parameter optimization[J]. Journal of Heuristics, 2009, 15(6): 617-644.

        [15] HOLM S. A simple sequentially rejective multiple test procedure[J]. Scandinavian Journal of Statistics, 1979 (6): 65-70.

        [16] NASH M S. Handbook of parametric and nonparametric statistical procedures[J]. Technometrics, 2001, 43(3): 374-374.

        (責(zé)任編輯: 沈蕓)

        An ontology matching technology usingdually individual annotation

        XUE Xingsi, WANG Jinshui

        (College of Information Science and Engineering, Fujian University of Technology, Fuzhou, Fujian 350118, China)

        Since individuals can better represent the real semantics of the concept they belong to, individual based ontology matching technology is able to improve the precision of the ontology alignment. However, in the real scenarios, the lack of the dually annotated individuals seriously limits the application of the individual based ontology matching technology. To overcome this shortcoming, in this paper, an ontology matching technology using dually individual annotation is proposed. In particular, our proposal utilizes the evolutionary algorithm (EA) to implement the process of automatic dually individual annotation and concept matching. The experiment uses the OAEI 2012 benchmarks, and the results show the effectiveness of our proposal.

        dually instances annotation; evolutionary algorithm; ontology matching

        10.7631/issn.1000-2243.2016.01.0064

        1000-2243(2016)01-0064-07

        2014-11-14

        薛醒思(1981-), 講師, 主要從事智能計(jì)算與本體匹配技術(shù)研究, jack8375@gmail.com

        國家自然科學(xué)基金資助項(xiàng)目(61503082, 61402108); 福建工程學(xué)院??蒲袉?dòng)基金(GY-Z15007)

        TP182

        A

        猜你喜歡
        度量雙向本體
        有趣的度量
        Abstracts and Key Words
        雙向度的成長(zhǎng)與自我實(shí)現(xiàn)
        出版人(2022年11期)2022-11-15 04:30:18
        模糊度量空間的強(qiáng)嵌入
        對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
        迷向表示分為6個(gè)不可約直和的旗流形上不變愛因斯坦度量
        一種軟開關(guān)的交錯(cuò)并聯(lián)Buck/Boost雙向DC/DC變換器
        《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
        地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
        一種工作頻率可變的雙向DC-DC變換器
        久久久久久无码av成人影院| 国产高清吃奶成免费视频网站 | 白白在线免费观看视频| 国产亚洲一二三区精品| 一本大道道久久综合av| 国产精品h片在线播放| 免费人成网ww555kkk在线| 日日av拍夜夜添久久免费 | 免费人成网ww555kkk在线| 久久久久亚洲av无码专区桃色| 最新精品亚洲成a人在线观看| 亚洲中文欧美日韩在线人| 亚洲自拍愉拍| 久久久国产精品首页免费| 东京热加勒比久久精品| 国色天香社区视频在线| 粗大的内捧猛烈进出视频 | 精品 无码 国产观看| 日产精品一区二区三区免费| 久久99国产精品久久99密桃| 亚洲色图在线免费视频| 亚洲精品久久久久久久蜜桃| 人人摸人人操| 亚洲午夜无码久久yy6080| 吃下面吃胸在线看无码| 日韩一区二区三区天堂| 日韩电影一区二区三区| 日韩国产一区| 亚洲在线一区二区三区| 日本美女在线一区二区| 国产69久久精品成人看| 西西人体444www大胆无码视频| 40岁大乳的熟妇在线观看| 免费av片在线观看网站| 精品一区二区三区久久久| 午夜一区二区三区在线观看| 亚洲精品有码日本久久久 | 青青草狠吊色在线视频| 人妻aⅴ中文字幕| 国产成人啪精品午夜网站| 日本久久精品在线播放|