亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語(yǔ)義Web中本體概念的語(yǔ)義匹配分離方法

        2014-12-20 06:53:42唐鄭熠李均濤
        關(guān)鍵詞:關(guān)聯(lián)語(yǔ)義概念

        唐鄭熠,韋 立,李均濤,萬(wàn) 良

        (1.福建工程學(xué)院 信息科學(xué)與工程學(xué)院,福建 福州350118;2.貴州師范大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,貴州 貴陽(yáng)550001;3.貴州財(cái)經(jīng)大學(xué) 信息學(xué)院,貴州 貴陽(yáng)550004;4.貴州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,貴州 貴陽(yáng)550025)

        0 引 言

        Web服務(wù)是目前最有希望實(shí)現(xiàn)面向服務(wù)的計(jì)算與體系架構(gòu) (SOC&SOA)的技術(shù),但由于服務(wù)之間所存在的“語(yǔ)義鴻溝”[1],使得服務(wù)的功能與內(nèi)涵難以被準(zhǔn)確表示,從而給服務(wù)發(fā)現(xiàn)、匹配、組合、驗(yàn)證等各個(gè)環(huán)節(jié)都帶來(lái)了困難。因此,學(xué)術(shù)界和工業(yè)界提出了一系列包含語(yǔ)義的Web服務(wù)描述標(biāo)準(zhǔn) (OWL-S、WSMO、SWSO 等)。本體是語(yǔ)義Web技術(shù)的基礎(chǔ)與核心,能夠很好地表達(dá)服務(wù)的語(yǔ)義信息。在SOC&SOA 的多個(gè)環(huán)節(jié)中,都是以本體概念的語(yǔ)義匹配為基礎(chǔ)進(jìn)行的。例如,服務(wù)發(fā)現(xiàn)需要匹配發(fā)現(xiàn)請(qǐng)求與候選服務(wù)的輸入輸出;服務(wù)組合需要匹配前驅(qū)服務(wù)與后繼服務(wù)的輸入輸出;服務(wù)驗(yàn)證也需要通過(guò)語(yǔ)義匹配來(lái)判定組合結(jié)果與組合需求的一致性。

        目前認(rèn)可度較高的一類本體概念匹配度定義方法,是基于本體概念之間的等價(jià)和包含關(guān)系的。這種方法能有效提高語(yǔ)義匹配的查準(zhǔn)率和查全率,且易于實(shí)現(xiàn)和集成,因此被許多研究工作采用[2-7]。得益于相關(guān)領(lǐng)域?qū)W者的工作,目前能夠?qū)Ρ倔w進(jìn)行可滿足、包含、等價(jià)和不相交的推理,且有相應(yīng)的推理機(jī) (Pellet、RACER、FaCT++等)實(shí)現(xiàn)推理過(guò)程的自動(dòng)化。通過(guò)推理機(jī)預(yù)留的外部接口,可將其集成到Web服務(wù)組合系統(tǒng)中,承擔(dān)語(yǔ)義匹配的任務(wù)。但是推理機(jī)執(zhí)行推理任務(wù)的時(shí)間代價(jià)較高,會(huì)大大降低那些需要頻繁進(jìn)行語(yǔ)義匹配環(huán)節(jié) (例如服務(wù)發(fā)現(xiàn)和組合)的效率。雖然推理機(jī)的推理算法在不斷改進(jìn),但在短期內(nèi)難以有顯著改善。

        本文的研究工作嘗試從另一個(gè)角度來(lái)解決這個(gè)問(wèn)題:依據(jù)本體概念之間匹配關(guān)系的性質(zhì),得到組織本體概念的方法,提出了公共本體概念庫(kù)的概念,從而能夠通過(guò)編碼保存概念之間的匹配度信息,把語(yǔ)義匹配從其它環(huán)節(jié)中分離出來(lái)。耗時(shí)的語(yǔ)義匹配工作被提前到服務(wù)發(fā)布階段,可以提高其它環(huán)節(jié)的效率,并增強(qiáng)用戶體驗(yàn)。同時(shí)也給出了對(duì)公共本體概念庫(kù)進(jìn)行更新的算法,以滿足本體概念增加、刪除及修改的動(dòng)態(tài)需求?;诠脖倔w概念庫(kù),可以實(shí)現(xiàn)本體概念的交互式注冊(cè),服務(wù)提供者可以在這個(gè)過(guò)程中發(fā)現(xiàn)已存在的等價(jià)或相近概念,從而改進(jìn)本體概念的設(shè)計(jì)。

        1 公共本體概念庫(kù)

        公共本體概念庫(kù)保存了本體概念的記錄,并根據(jù)本體概念間的匹配度進(jìn)行分層組織及編碼。由于編碼保存了本體概念的匹配度信息,可以在需要時(shí)從中快速提取,因此不會(huì)影響到其它環(huán)節(jié)的效率。同時(shí),編碼中的信息也可以有效減少語(yǔ)義匹配的次數(shù)。

        1.1 本體概念的組織結(jié)構(gòu)

        保存匹配度信息的直觀方法是將本體概念間的匹配度作為元素構(gòu)成矩陣[8],但這種方法沒(méi)有利用匹配度之間的關(guān)聯(lián)來(lái)減少匹配次數(shù),也不利于對(duì)本體概念進(jìn)行更改。文獻(xiàn) [6]提出了分層的組織方法,但它只在服務(wù)的層級(jí)上進(jìn)行,不能把語(yǔ)義匹配徹底分離。而文獻(xiàn) [7]提出的方法雖然是在概念層級(jí)上進(jìn)行分層,但沒(méi)有考慮到本體概念等價(jià)的情況,也沒(méi)有給出更新的方法,不適合本體概念的動(dòng)態(tài)性。

        由于等價(jià)與包含關(guān)系具有傳遞性,以此為基礎(chǔ)的匹配度定義也具有傳遞性,例如CMU 的M.Paolucci等人提出的被廣泛使用的四級(jí)匹配度[2]:

        定義1 本體概念的四級(jí)匹配度:對(duì)于本體概念c1和c2:若c1與c2等 價(jià) (記 為c1≡c2),則 匹 配 度Mat(c1,c2)=Exact;若c1為c2的子概念 (c2包含但不等價(jià)于c1,記為c1∝c2),則匹配度Mat(c1,c2)=Plug-in;若c2為c1的子概念 (c1包含但不等價(jià)于c2,記為c2∝c1),則匹配度Mat(c1,c2)=Subsume;若不滿足上述情況,則匹配度Mat(c1,c2)=Fail。且:Exact>Plug-in>Subsume>Fail。

        顯然有:對(duì)于本體概念c1、c2和c3,存在Mat(c1,c2)=Mat (c2,c3)=Exact/Plug-in/Subsume Mat(c1,c3)=Exact/Plug-in/Subsume。

        在樹(shù)形結(jié)構(gòu)中,節(jié)點(diǎn)也有類似的傳遞性:subof(n1,n2)表示n1位于以n2為根節(jié)點(diǎn)的樹(shù)上,則subof(n1,n2)∧ (subof (n2,n3) subof (n1,n3)。因 此,可 以 依 據(jù)這種性質(zhì)將本體概念組織為層次清晰、上下位關(guān)系明確的樹(shù)形結(jié)構(gòu),以保存本體概念間的匹配度信息。該結(jié)構(gòu)的優(yōu)點(diǎn)在于,無(wú)論是構(gòu)建還是更新,都可以通過(guò)傳遞性來(lái)減少語(yǔ)義匹配的次數(shù)。在下一節(jié)的定理1中,將表明這一點(diǎn)。

        1.2 公共本體概念庫(kù)的構(gòu)成

        公共本體概念庫(kù) (public ontology concept depot)由2個(gè)部分組成:概念描述子庫(kù) (concept description depot)和語(yǔ)義關(guān)聯(lián)子庫(kù) (semantic association depot)。前者用于存放本體概念的具體描述及索引信息,而后者則根據(jù)匹配度對(duì)本體概念進(jìn)行分層組織。

        定義2 公共本體概念庫(kù):一個(gè)公共本體概念庫(kù)POCD= (CDD,SAD),其中:CDD 是概念描述子庫(kù),SAD 是語(yǔ)義關(guān)聯(lián)子庫(kù)。

        概念描述子庫(kù)不僅僅是本體概念的具體描述,還包含一些索引信息,概念描述子庫(kù)的定義如下:

        定義3 概念描述子庫(kù):一個(gè)概念描述子庫(kù)CDD={cr= (cd,id,NIDS)},是概念記錄cr的集合,其中:

        (1)cd 是一個(gè)具體的本體概念,每個(gè)本體概念只能在一條概念記錄中出現(xiàn)。

        (2)id 是cd 的唯一標(biāo)識(shí)。

        (3)NIDS是后文所述的語(yǔ)義關(guān)聯(lián)樹(shù)的節(jié)點(diǎn)標(biāo)識(shí)集合,表明這個(gè)概念被包含在哪些節(jié)點(diǎn)中 (可能不止一個(gè))。

        為每個(gè)本體概念賦予唯一標(biāo)識(shí),是為了避免重復(fù)保存本體概念的具體描述,以減小數(shù)據(jù)冗余度;而節(jié)點(diǎn)標(biāo)識(shí)集合則是為了利用節(jié)點(diǎn)的位置編碼,以避免重復(fù)的進(jìn)行概念包含和等價(jià)的判定。

        本文把語(yǔ)義關(guān)聯(lián)子庫(kù)定義為一棵語(yǔ)義關(guān)聯(lián)樹(shù):

        定義4 語(yǔ)義關(guān)聯(lián)子庫(kù):一個(gè)語(yǔ)義關(guān)聯(lián)子庫(kù)SAD=SAT。

        定義5 語(yǔ)義關(guān)聯(lián)樹(shù):一棵語(yǔ)義關(guān)聯(lián)樹(shù)SAT= (NS,root,PCR),其中:

        (1)NS= {(id,ECIDS,CNIDS,locCode)}為節(jié)點(diǎn)集合,節(jié)點(diǎn)是一個(gè)四元組,其中:id 是節(jié)點(diǎn)標(biāo)識(shí);ECIDS是等價(jià)概念標(biāo)識(shí)集合,其元素所對(duì)應(yīng)的概念互相等價(jià);CNIDS是子節(jié)點(diǎn)標(biāo)識(shí)集合;locCode是該節(jié)點(diǎn)的位置編碼,是一個(gè)先進(jìn)先出的整數(shù)隊(duì)列。

        (2)root= (0, {0},CNIDS,<>)∈NS為根節(jié)點(diǎn),即:根節(jié)點(diǎn)的標(biāo)識(shí)為0 (本文使用整數(shù)做節(jié)點(diǎn)標(biāo)識(shí));根節(jié)點(diǎn)只包含一個(gè)元概念 (meta concept),記為mc, 概念c:c∝mc;根節(jié)點(diǎn)的位置編碼是一個(gè)空隊(duì)列。

        (3)PCR= {(n,m)|n,m∈NS}是節(jié)點(diǎn)的父子關(guān)系集合,(n,m)表示節(jié)點(diǎn)n 是節(jié)點(diǎn)m 的父節(jié)點(diǎn)。對(duì)于id∈n。ECIDS對(duì)應(yīng)的概念c,稱節(jié)點(diǎn)n 包含概念c,記為c∈′n。對(duì)于 (n,m), c∈′n和 c′∈′m,滿足c′∝c。

        節(jié)點(diǎn)的位置編碼包含了它的位置信息,可以避免語(yǔ)義包含與等價(jià)的重復(fù)判定。

        定義6 位置編碼:節(jié)點(diǎn)的位置編碼locCode=<m1,m2,…mk>是一個(gè)先入先出的隊(duì)列,是從根節(jié)點(diǎn)到達(dá)該節(jié)點(diǎn)的路徑編碼,隊(duì)列中的每個(gè)值都保存了節(jié)點(diǎn)的一個(gè)祖先節(jié)點(diǎn)的信息。通過(guò)mi的值可以確定節(jié)點(diǎn)在第i 層 (設(shè)根節(jié)點(diǎn)處在第0層)的祖先節(jié)點(diǎn)。

        由包含關(guān)系和等價(jià)關(guān)系的傳遞性,可以得到以下結(jié)論:

        定理1 在一棵語(yǔ)義關(guān)聯(lián)樹(shù)SAT 中,對(duì)于任意本體概念c和c′,及包含c的節(jié)點(diǎn)n (記為c∈′n)和包含c′的節(jié)點(diǎn)n′,存在:subof(n,n′) c∝c′(c是c′的子概念)。

        證明:已知subof(n,n′),則存在一條由節(jié)點(diǎn)構(gòu)成的從n′到達(dá)n 的路徑:<n′,n1,n2,…nk,n>,且滿足(n′,n1)∈SAT.PCR∧(nk,n)∈SAT.PCR∧ 1≤i≤k:(ni,ni+1)∈SAT.PCR。

        又由定義5 可知:對(duì)于 (n,m)∈SAT.PCR,若cn∈′n且cm∈′m,則cm∝cn。

        在<n′,n1,n2,…nk,n>中,取ci∈′ni(1≤i≤k),可得:c1∝c∈∧c2∝c1∧…∧ck∝ck-1∧ck∝ck-1∧c∝ck。

        由于∝關(guān)系滿足傳遞性,則有c∝c′。

        證畢。

        因此,通過(guò)比較本體概念所處節(jié)點(diǎn)的位置,就可判定本體概念間的等價(jià)或包含關(guān)系,從而得到匹配度。而位置比較可以通過(guò)比較節(jié)點(diǎn)的位置編碼在線性時(shí)間內(nèi)完成,對(duì)其它環(huán)節(jié)的效率幾乎沒(méi)有影響。同時(shí),若判定本體概念c是c′的子概念,則c的所有等價(jià)概念及子概念也都是c′的子概念,而不必再一一進(jìn)行判定,因此可有效減少匹配次數(shù)。

        1.3 公共本體概念庫(kù)的創(chuàng)建

        對(duì)于一個(gè)給定的本體概念集合,可以創(chuàng)建一個(gè)對(duì)應(yīng)的公共本體概念庫(kù)。創(chuàng)建過(guò)程分為3個(gè)部分:

        (1)創(chuàng)建一個(gè)初始的概念描述子庫(kù),為每個(gè)概念創(chuàng)建一條概念記錄,并賦予唯一標(biāo)識(shí),但所屬節(jié)點(diǎn)標(biāo)識(shí)集合先置為空 (但元概念可直接確定)。其過(guò)程比較簡(jiǎn)單,本文不贅述。

        (2)根據(jù)初始的概念描述子庫(kù),創(chuàng)建語(yǔ)義關(guān)聯(lián)子庫(kù)(即一棵語(yǔ)義關(guān)聯(lián)樹(shù)),但位置編碼先置為空,由后述的算法1實(shí)現(xiàn)。

        (3)根據(jù)語(yǔ)義關(guān)聯(lián)子庫(kù),計(jì)算每個(gè)節(jié)點(diǎn)的位置編碼,由后述的算法2實(shí)現(xiàn)。

        以下的算法描述中用到了幾個(gè)函數(shù):i2c (id)函數(shù)的作用是根據(jù)概念標(biāo)識(shí)id,返回對(duì)應(yīng)的概念;i2n (id)函數(shù)的作用是根據(jù)節(jié)點(diǎn)標(biāo)識(shí)id,返回對(duì)應(yīng)的節(jié)點(diǎn);len (queue)函數(shù)的作用是返回隊(duì)列queue的長(zhǎng)度。

        算法1:ESAD (establish semantic association depot)

        輸入:An initialized concept description depot CDD。

        輸出:A semantic association depot SAD,a complete concept description CDD。

        算法1用于創(chuàng)建初始的語(yǔ)義關(guān)聯(lián)子庫(kù),實(shí)質(zhì)上是將所有的本體概念依次插入到語(yǔ)義關(guān)聯(lián)樹(shù)的某個(gè)節(jié)點(diǎn)中。每一個(gè)待插入的本體概念cr.cd 都從根節(jié)點(diǎn)開(kāi)始判斷插入位置,節(jié)點(diǎn)隊(duì)列waitVstNode用于存放待訪問(wèn)的節(jié)點(diǎn),初始時(shí)只有根節(jié)點(diǎn)。對(duì)于從waitVstNode中彈出的節(jié)點(diǎn)n,cr.cd 一定是n 所包含概念的子概念,因?yàn)樵谒惴?中只把這類節(jié)點(diǎn)放入waitVstNode中,如下文所述。cr.cd 與n 的子節(jié)點(diǎn)m 所包含的概念有4種可能的關(guān)系:

        (1)cr.cd 與m 所包含的概念等價(jià),則把m 放入集合EqC 中,cr.cd 會(huì)被并入這類子節(jié)點(diǎn)。

        (2)cr.cd 是m 所包含概念的子概念,則把m 放入集合ConC 中,這類子節(jié)點(diǎn)將被放入waitVstNode中,等待進(jìn)一步向下訪問(wèn)。

        (3)m 所包含的概念是cr.cd 的子概念,則把m 放入集合BeConC 中,并且最后將創(chuàng)建一個(gè)包含cr.cd 的新節(jié)點(diǎn)t,插入到n與這類子節(jié)點(diǎn)之間。

        (4)兩者沒(méi)有包含或等價(jià)關(guān)系,則不做任何操作。

        當(dāng)對(duì)n的所有子節(jié)點(diǎn)都進(jìn)行完上述判定后,如果EqC、ConC、BeConC 這3個(gè)集合都為空,則需要?jiǎng)?chuàng)建一個(gè)新的節(jié)點(diǎn)t并包含cr.cd,作為n的一個(gè)新的子節(jié)點(diǎn)。

        算法2:CLC (cmput location code)

        輸入:A semantic association depot SAD,the starting location sn。

        輸出:A semantic association depot SAD with new location code。

        算法2通過(guò)廣度優(yōu)先的策略遍歷語(yǔ)義關(guān)聯(lián)樹(shù),并為每個(gè)節(jié)點(diǎn)進(jìn)行編碼,節(jié)點(diǎn)的位置編碼是數(shù)字隊(duì)列,每一個(gè)節(jié)點(diǎn)的位置編碼,都是在其父節(jié)點(diǎn)的位置編碼尾部增加該節(jié)點(diǎn)自身的數(shù)字編號(hào),但根節(jié)點(diǎn)的位置編碼為空隊(duì)列。為了后續(xù)的更新操作的需要,算法2添加了一個(gè)參數(shù):計(jì)算的起始節(jié)點(diǎn)。因此準(zhǔn)確地說(shuō),算法2是用于計(jì)算以起始節(jié)點(diǎn)為根節(jié)點(diǎn)的子樹(shù)中,除了根節(jié)點(diǎn)以外的所有節(jié)點(diǎn)的位置編碼。如果要計(jì)算整棵樹(shù)的所有節(jié)點(diǎn)的位置編碼,只需要把起始節(jié)點(diǎn)設(shè)為根節(jié)點(diǎn)即可。

        2 公共本體概念庫(kù)的更新

        在公共本體概念庫(kù)建立之后,可能會(huì)因?yàn)殚_(kāi)發(fā)的需求、對(duì)事物認(rèn)識(shí)的改變、外界的新發(fā)現(xiàn)等原因,需要修改、添加和刪除某些概念。在這種情況下,就需要相應(yīng)地更新公共本體概念庫(kù)。由于某個(gè)本體概念被修改后,與其它本體概念的包含及等價(jià)關(guān)系可能會(huì)發(fā)生變化,需要重新判定其在語(yǔ)義關(guān)聯(lián)樹(shù)中的位置,因此對(duì)于本體概念的修改操作,可以通過(guò)將要修改的概念刪除,然后將修改后的概念作為新的概念添加來(lái)實(shí)現(xiàn)。因此,只需要提供2 種更新操作,即本體概念的添加和刪除。

        2.1 本體概念的添加

        本體概念的添加操作分為兩個(gè)部分:①在概念描述子庫(kù)中創(chuàng)建一條新的概念記錄;②將新建概念插入語(yǔ)義關(guān)聯(lián)子庫(kù)中。其中第一部分只是在庫(kù)中新增一條記錄,其過(guò)程比較簡(jiǎn)單。而算法1創(chuàng)建語(yǔ)義關(guān)聯(lián)子庫(kù)的過(guò)程,實(shí)質(zhì)上就是依次向語(yǔ)義關(guān)聯(lián)樹(shù)插入多個(gè)新概念,因此第2部分插入單個(gè)概念的方法可參照算法1進(jìn)行,不再贅述。新概念插入完成后,再使用算法2 更新整棵語(yǔ)義關(guān)聯(lián)樹(shù)節(jié)點(diǎn)的位置編碼。

        更新過(guò)程可進(jìn)行以下優(yōu)化:在插入一個(gè)概念時(shí),如果創(chuàng)建了新節(jié)點(diǎn),則需要更新語(yǔ)義關(guān)聯(lián)樹(shù)節(jié)點(diǎn)的位置編碼,但并不是整棵樹(shù)的所有節(jié)點(diǎn)都需要更新。如圖1(a)所示。當(dāng)插入概念y 時(shí),需要?jiǎng)?chuàng)建一個(gè)新的節(jié)點(diǎn),即圖1 (a)中標(biāo)識(shí)為102 且用虛線框起的節(jié)點(diǎn)。此時(shí),只有以標(biāo)識(shí)為50 的節(jié)點(diǎn)為根節(jié)點(diǎn)的子樹(shù),需要更新位置編碼 (但該子樹(shù)的根節(jié)點(diǎn)不用更新)。所以可以直接使用算法2,以標(biāo)識(shí)為50的節(jié)點(diǎn)作為起始節(jié)點(diǎn),更新計(jì)算位置編碼。因此,插入新概念的算法應(yīng)有一個(gè)返回值:當(dāng)創(chuàng)建了新節(jié)點(diǎn)時(shí),將新節(jié)點(diǎn)的父節(jié)點(diǎn)作為返回值返回,作為算法2的計(jì)算起始節(jié)點(diǎn);否則返回一個(gè)特定的值,說(shuō)明沒(méi)有創(chuàng)建新節(jié)點(diǎn)。

        圖1 添加節(jié)點(diǎn)后的兩種情況

        在某些時(shí)候,用戶會(huì)向公用本體概念庫(kù)中插入多個(gè)概念。如果每插入一個(gè)概念就更新一次語(yǔ)義關(guān)聯(lián)庫(kù),可能會(huì)造成某些節(jié)點(diǎn)的重復(fù)更新。如圖1 (b)所示:如果待更新的兩棵語(yǔ)義關(guān)聯(lián)子樹(shù)的根節(jié)點(diǎn)具有祖孫關(guān)系,則會(huì)造成節(jié)點(diǎn)位置編碼的重復(fù)更新。

        2.2 本體概念的刪除

        本體概念的刪除方法是:首先在概念描述子庫(kù)中找到對(duì)應(yīng)的概念記錄cr,再由cr.NIDS找到包含此概念的節(jié)點(diǎn)n (可能不止一個(gè)),從n 的等價(jià)概念標(biāo)識(shí)集 (n.ECIDS)中刪除此概念的標(biāo)識(shí);最后在概念描述子庫(kù)中刪除對(duì)應(yīng)的概念記錄。其過(guò)程比較簡(jiǎn)單,本文不贅述。

        需要注意的是:當(dāng)從節(jié)點(diǎn)的等價(jià)概念標(biāo)識(shí)集中刪除概念標(biāo)識(shí)后,可能會(huì)使節(jié)點(diǎn)的等價(jià)概念標(biāo)識(shí)集合為空,此時(shí)該節(jié)點(diǎn)已沒(méi)有存在的必要,應(yīng)予以刪除。如圖2所示。

        圖2 刪除節(jié)點(diǎn)

        圖2中刪除概念x 后,62 號(hào)節(jié)點(diǎn)已無(wú)存在的必要,因此可以刪除。刪除后,它的所有子節(jié)點(diǎn)作為61號(hào)節(jié)點(diǎn)的子節(jié)點(diǎn)。但以61號(hào)節(jié)點(diǎn)作為根節(jié)點(diǎn)的子樹(shù)需要重新計(jì)算位置編碼。因此,刪除概念時(shí)若發(fā)生了節(jié)點(diǎn)刪除,應(yīng)使用算法2來(lái)更新語(yǔ)義關(guān)聯(lián)樹(shù)節(jié)點(diǎn)的位置編碼。同樣,當(dāng)一次有多個(gè)節(jié)點(diǎn)被刪除時(shí),也應(yīng)注意避免節(jié)點(diǎn)位置編碼的重復(fù)更新。

        3 本體概念的交互式注冊(cè)

        在SOA 中,包含服務(wù)請(qǐng)求者、服務(wù)提供者和服務(wù)注冊(cè)中心3種角色。服務(wù)提供者將服務(wù)發(fā)布到服務(wù)注冊(cè)中心,服務(wù)請(qǐng)求者從中發(fā)現(xiàn)所需服務(wù),并根據(jù)相應(yīng)的信息與服務(wù)提供者進(jìn)行綁定,從而使用其所提供的服務(wù)[9]。公共本體概念庫(kù)設(shè)置在服務(wù)注冊(cè)中心,與服務(wù)注冊(cè)中心的其它組件互不影響。當(dāng)服務(wù)提供者發(fā)布服務(wù)時(shí),應(yīng)同時(shí)將本體概念注冊(cè)到公共本體概念庫(kù)中 (即本體概念的添加操作)。

        在傳統(tǒng)的服務(wù)發(fā)布模式中,一個(gè)服務(wù)獨(dú)占一組本體概念。因此當(dāng)多個(gè)服務(wù)的輸入輸出出現(xiàn)重合時(shí),會(huì)造成數(shù)據(jù)冗余。同時(shí)由于同一概念可能有多種不同的表達(dá)形式,不同的本體概念也可能是等價(jià)的。由于服務(wù)發(fā)布并不是提供具體的數(shù)據(jù)或資源,而只是公開(kāi)服務(wù)的描述,因此將多個(gè)相同或等價(jià)的本體概念合并,不會(huì)影響服務(wù)發(fā)布的準(zhǔn)確性。但由于服務(wù)開(kāi)發(fā)者的觀念差異等原因,等價(jià)的本體概念未必可以互相取代。因此在公共本體概念庫(kù)的基礎(chǔ)上,將本體概念的注冊(cè)方法改進(jìn)為交互式,如圖3所示。

        圖3 本體概念的交互式注冊(cè)

        交互的過(guò)程如下:

        (1)將待添加的本體概念傳遞給語(yǔ)義關(guān)聯(lián)子庫(kù)。

        (2)如果添加過(guò)程中找到了等價(jià)的本體概念,則返回給服務(wù)提供者,否則完成添加操作 (包括語(yǔ)義關(guān)聯(lián)子庫(kù)和語(yǔ)義描述子庫(kù))。

        (3)如果服務(wù)提供者從等價(jià)概念集合中發(fā)現(xiàn)了合適的等價(jià)概念,則可用該等價(jià)概念來(lái)取代原本的概念,從而避免添加多余的概念;如果服務(wù)提供者認(rèn)為已存在的等價(jià)概念不能代替原本的概念,也可令系統(tǒng)依然將原本的概念添加到公共本體概念庫(kù)中。

        與傳統(tǒng)的服務(wù)發(fā)布模式相比,本體概念的交互式注冊(cè)不僅可以減少數(shù)據(jù)的冗余,而且可以讓服務(wù)發(fā)布者根據(jù)已存在的相似描述,來(lái)改進(jìn)本體概念的設(shè)計(jì)。

        4 實(shí)驗(yàn)及結(jié)果分析

        公共本體概念庫(kù)的主要作用是提高語(yǔ)義匹配的效率,因此可以改進(jìn)任何語(yǔ)義匹配占大比重的技術(shù)環(huán)節(jié)的效率。模擬實(shí)驗(yàn)以服務(wù)匹配作為實(shí)驗(yàn)對(duì)象,它是典型的完全基于語(yǔ)義匹配的環(huán)節(jié),其定義如下[2]:

        定義7 服務(wù)匹配:服務(wù)請(qǐng)求SR= (Ir,Or),服務(wù)S= (I,O),Ir、Or、I、O 都是本體概念集合,t為匹配度閾值。對(duì)于SR 和S,若 i∈I:-i′∈Ir:Mat(i′,i)≥t,且 o′∈Or:-o∈O:Mat(o,o′)≥t,則稱服務(wù)S匹配服務(wù)請(qǐng)求SR,記為SSR。

        模擬實(shí)驗(yàn)運(yùn)行在CPU 主頻2.2G、內(nèi)存2G 的計(jì)算機(jī)上,以C語(yǔ)言作為開(kāi)發(fā)語(yǔ)言。以Ka、People、Wine這3個(gè)規(guī)模不同的本體概念集[10-12]作為候選服務(wù)參數(shù)集,共包含316個(gè)概念,推理機(jī)使用Pellet。服務(wù)與服務(wù)請(qǐng)求從概念集中隨機(jī)選取概念生成,每個(gè)服務(wù)或服務(wù)請(qǐng)求的輸入和輸出參數(shù)都是2~15個(gè)。

        模擬實(shí)驗(yàn)分為5 組,針對(duì)5 個(gè)不同規(guī)模 (分別包含100、500、1000、1500、2000個(gè)服務(wù))的服務(wù)庫(kù),以檢驗(yàn)服務(wù)庫(kù)規(guī)模的擴(kuò)大對(duì)效率的影響。每組實(shí)驗(yàn)都隨機(jī)生成100個(gè)服務(wù)匹配請(qǐng)求,分別用直接使用推理機(jī) (Method_A)的方法與基于公共本體概念庫(kù) (Method_B)的方法進(jìn)行測(cè)試,從匹配效率與匹配性能2個(gè)方法進(jìn)行測(cè)試與比較。

        4.1 匹配效率的測(cè)試與比較

        在進(jìn)行服務(wù)匹配之前,需要先進(jìn)行服務(wù)發(fā)布。Method_A 只需要消耗加載本體的時(shí)間,約耗時(shí)5165ms;而Method_B還需要消耗建庫(kù)的時(shí)間,約耗時(shí)40853 ms。由于服務(wù)發(fā)布過(guò)程是在用戶提交匹配請(qǐng)求之前進(jìn)行的,因此建庫(kù)過(guò)程不會(huì)對(duì)請(qǐng)求響應(yīng)速度產(chǎn)生影響,也不會(huì)降低用戶體驗(yàn)。5組實(shí)驗(yàn)的平均請(qǐng)求響應(yīng)速度如圖4所示。

        圖4 服務(wù)匹配效率比較

        可以看到,基于公共本體概念庫(kù)的方法大幅提高了請(qǐng)求響應(yīng)的速度,并且隨著服務(wù)庫(kù)規(guī)模的擴(kuò)大,請(qǐng)求響應(yīng)速度也沒(méi)有急劇下降,優(yōu)勢(shì)明顯。其原因在于,通過(guò)對(duì)本體概念的分層組織保存了概念之間的匹配度信息,因此在響應(yīng)用戶請(qǐng)求時(shí)無(wú)需進(jìn)行概念匹配,從而能在線性時(shí)間內(nèi)完成響應(yīng)。同時(shí),還有效避免了對(duì)概念的重復(fù)匹配。雖然建立公共本體概念庫(kù)會(huì)導(dǎo)致服務(wù)發(fā)布時(shí)間大幅增加,但這代價(jià)顯然是十分值得的。

        4.2 匹配性能的測(cè)試與比較

        由于服務(wù)匹配的過(guò)程類似于信息檢索,因此采用信息檢索領(lǐng)域的兩個(gè)重要性能指標(biāo):召回率 (recall)和準(zhǔn)確率(precision)來(lái)進(jìn)行測(cè)試與比較。兩者的定義如下[13]:

        定義8 召回率:服務(wù)匹配返回的結(jié)果中,正確匹配的服務(wù)數(shù)量與服務(wù)庫(kù)中滿足匹配請(qǐng)求的服務(wù)數(shù)量的比值。

        定義9 準(zhǔn)確率:服務(wù)匹配返回的結(jié)果中,正確匹配的服務(wù)數(shù)量所占的比值。

        在5組實(shí)驗(yàn)中,取100次匹配結(jié)果的平均值進(jìn)行比較,結(jié)果如圖5和圖6所示。

        圖5 服務(wù)匹配性能 (召回率)比較

        圖6 服務(wù)匹配性能 (準(zhǔn)確率)比較

        從實(shí)驗(yàn)結(jié)果可知,兩種方法在匹配性能上幾乎沒(méi)有差別,這是因?yàn)閮煞N方法采用了相同的匹配規(guī)則。由該結(jié)果可表明,基于公共本體概念庫(kù)的語(yǔ)義匹配方法,不會(huì)對(duì)語(yǔ)義匹配的性能產(chǎn)生影響。

        5 結(jié)束語(yǔ)

        語(yǔ)義匹配是SOC&SOA 的基礎(chǔ)技術(shù)之一,在服務(wù)發(fā)現(xiàn)、匹配、組合及驗(yàn)證等多個(gè)環(huán)節(jié)都會(huì)涉及,并增大了技術(shù)實(shí)現(xiàn)的難度。本文的研究工作從分離語(yǔ)義匹配的角度展開(kāi),通過(guò)對(duì)語(yǔ)義匹配關(guān)系的研究,提出建立公共本體概念庫(kù),保存本體概念及匹配度信息,從而實(shí)現(xiàn)了語(yǔ)義匹配的分離。這種方法不會(huì)因?yàn)轭櫦芭c其它環(huán)節(jié)的融合,而影響語(yǔ)義表達(dá)和匹配的準(zhǔn)確性,同時(shí)也不會(huì)因?yàn)檎Z(yǔ)義匹配的時(shí)間消耗而影響其它環(huán)節(jié)的效率。

        進(jìn)一步的研究工作包括:①研究本體概念之間的可替換性;②通過(guò)理論分析與實(shí)驗(yàn)兩種手段,找尋合適的本體概念推理機(jī)完成建庫(kù)過(guò)程;③研究基于其它理論基礎(chǔ) (如信息論、語(yǔ)義距離)的語(yǔ)義匹配技術(shù)的分離方法。

        [1]Ishikawa F,Katafuchi S,Wagner F,et al.Bridging the gap between semantic Web service composition and common implementation architectures[C]//Proc of the International Conference on Services Computing,2011:152-159.

        [2]Martino BD.Semantic Web Services discovery based on structural ontology matching [J].International Journal of Web and Grid Services,2009,5 (1):46-65.

        [3]Klusch M,Kaufer F.WSMO-MX:A hybrid semantic Web service matchmaker[J].Web Intelligence and Agent Systems,2009,7 (1):23-42.

        [4]Pukkasenung P,Sophatsathit P,Lursinsap C.An efficient semantic Web service discovery using hybrid matching [C]//Proc of the International Conference on Knowledge and Smart Technologies,2010:49-53.

        [5]Mye Sohn,Young Min Kwon,Hyun Jung Lee.Context-based hybrid semantic matching framework for e-mentoring system[C]//Proc of the International Conference on Network-Based Information Systems,2012:691-696.

        [6]YANG Yanping.Research on key technologies of automatic Web services composition [D].Changsha:National University of Defense Technology,2007:30-42 (in Chinese).[楊艷萍.自動(dòng)服務(wù)組合關(guān)鍵技術(shù)研究 [D].長(zhǎng)沙:國(guó)防科技大學(xué),2007:30-42.]

        [7]Xie Lingli,Chen Fuzan,Kou Jisong.Ontology-based semantic Web services clustering [C]//Proc of the International Conference on Industrial Engineering and Engineering Management,2011:2075-2079.

        [8]CHEN Ke,WANG Jiayao,XIE Mingxia,et al.Research on geo spatial Web services classification based on manifold learning[J].Geomatics and Information Science of Wuhan University,2013,38 (8):324-328 (in Chinese). [陳科,王家耀,謝明霞,等.利用流形學(xué)習(xí)進(jìn)行空間信息服務(wù)分類 [J].武漢大學(xué)學(xué)報(bào)信息科學(xué)版,2013,38 (8):324-328.]

        [9]Papazoglou MP.Web service:Principles and technology [M].London:Prentice Hall,2008.

        [10]Stanford Center for Biomedical Informatics Research.OWL concepts file [EB/OL]. [2012-11-16].http://protege.cim3.net/file/pub/ontologies/.

        [11]Sean Bechhofer.OWL concepts file [EB/OL]. [2012-11-16].http://owl.man.ac.uk/2006/07/sssw.

        [12]W3C.OWL concepts file [EB/OL] .[2012-11-16].http://www.w3.org/TR/owl-guide/.

        [13]JIN Yan,WANG Zhihua.Research on semantic Web retrieval model based on reasoning and key technologies [J].Computer Engineering and Design,2013,34 (7):2585-2589 (in Chinese).[金燕,王志華.基于推理的語(yǔ)義網(wǎng)檢索模型及關(guān)鍵技術(shù)研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2013,34 (7):2585-2589.]

        猜你喜歡
        關(guān)聯(lián)語(yǔ)義概念
        Birdie Cup Coffee豐盛里概念店
        “苦”的關(guān)聯(lián)
        語(yǔ)言與語(yǔ)義
        幾樣概念店
        學(xué)習(xí)集合概念『四步走』
        奇趣搭配
        聚焦集合的概念及應(yīng)用
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語(yǔ)義模糊
        少妇被又大又粗又爽毛片久久黑人 | 中文字幕在线乱码亚洲| 无码h黄肉3d动漫在线观看| 久久久精品人妻久久影视| 在线精品无码字幕无码av| 日本老熟欧美老熟妇| 精品午夜一区二区三区久久| 亚洲一区二区在线视频,| 日韩少妇人妻中文字幕| 人妻丰满熟妇av无码区不卡| 亚洲AV电影天堂男人的天堂| 性色av成人精品久久| 日韩精品视频高清在线| 热久久国产欧美一区二区精品| 亚洲一区爱区精品无码| 成人国产一区二区三区精品不卡| 国产黄色三级一区二区三区四区| 无码视频在线观看| 人人看人人做人人爱精品| 亚洲双色视频在线观看| 日韩美女亚洲性一区二区| 巨茎中出肉欲人妻在线视频| 亚洲国产精品线路久久| 少妇人妻偷人中文字幕| 国产小视频在线看不卡| 久久精品国产www456c0m | 四虎影视国产884a精品亚洲| 青青草在线免费观看视频| 久爱www人成免费网站| 午夜无码片在线观看影院| 99热高清亚洲无码| 色久悠悠婷婷综合在线| 帮老师解开蕾丝奶罩吸乳视频| 久久精品无码一区二区三区蜜费| 国产视频一区二区三区在线看| 午夜福利视频合集1000| 香色肉欲色综合| 在线观看av片永久免费| 亚洲暴爽av人人爽日日碰| 水蜜桃一二二视频在线观看免费| 91精品啪在线观九色|