亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于OWL屬性特征的語義檢索研究

        2010-07-13 06:01:56張野
        電子設(shè)計工程 2010年2期
        關(guān)鍵詞:查全率本體檢索

        張野

        (渤海大學(xué) 商學(xué)院,遼寧 錦州 121013)

        本體在軟件工程、人工智能、信息檢索、Web Service[1]等領(lǐng)域中扮演著越來越重要的角色。在概念檢索或者語義查詢系統(tǒng)的實現(xiàn)過程中,領(lǐng)域本體中概念之間的相似度量化計算是檢索詞擴(kuò)展和檢索結(jié)果排序的核心問題?,F(xiàn)關(guān)于本體內(nèi)語義相似度算法研究主要有基于DAML-S描述的匹配算法[2],基于概念語義距離的算法[3],基于屬性的相似度算法[4]以及基于信息理論的算法[5]。這些方法具有明確清晰的邏輯含義,可以直接利用特定于描述語言的通用推理服務(wù)來進(jìn)行匹配,實現(xiàn)較簡單。但它們只是將本體內(nèi)的謂詞直接簡單的作為一種二元關(guān)系來處理,因此會產(chǎn)生明顯的語義矛盾,忽略O(shè)WL本體的眾多其他語義元素。

        本文通過提取OWL本體概念的層次和屬性特征,利用本體概念的并、交、差等運算,可以得到連續(xù)變化、量化相似度的度量結(jié)果,通過對檢索性能指標(biāo)進(jìn)行動態(tài)設(shè)定,可以有效地定制用戶的檢索。本文的實驗結(jié)果對基于本體的分類和聚類方法也有參考意義。

        1 本體描述語言(OWL)

        本體作為一種知識表示模型,包含某個領(lǐng)域內(nèi)的專家或?qū)W者所共同認(rèn)可的詞匯,并將這些詞匯以一種有向無環(huán)圖的形式組織起來,描述概念、屬性和關(guān)系[6]。本體可以有效地組織領(lǐng)域中的知識,更好地共享和重用知識。W3C將本體描述語言O(shè)WL(Web Ontology Language)推薦為語義Web中本體描述語言的標(biāo)準(zhǔn)。OWL通過添加更多用于描述RDF(Resource Description Framework)聲明的語義結(jié)構(gòu)擴(kuò)展RDF。OWL允許聲明額外的約束,如基數(shù)、取值的限制,或可傳遞性等有關(guān)屬性的特征。

        2 基于OWL語義特征的相似度算法

        在現(xiàn)實世界中,人們一般通過比較事物之間的屬性來區(qū)別和聯(lián)系不同事物。如果兩個事物有很多相同的屬性,則說明這兩者很相似,反之則相反。用A∩B表示概念A(yù)和概念B所具有的相同屬性,A∪B表示概念A(yù)和概念B的所有屬性,語義相似度的計算有如下模型:

        相似性模型在人工智能領(lǐng)域影響很大[4]。該模型中,假設(shè)存在兩個概念A(yù)和B,那么相似度計算公式為:

        在該模型中,根據(jù)比較兩個概念間相同的屬性以及不同的屬性來確定二者的相似度,這個算法能夠描述本體內(nèi)概念間的相似性,同時取決于共享特征和差異特征的量的特征。

        本體內(nèi)概念間的相似度不僅取決于A、B之間的相同特征,還需要考慮它們之間的差異特征。這些特征包括概念的層次特征和其屬性特征。由此得到如下定義:

        式中,A-B表示概念A(yù)擁有而概念B沒有的屬性集合;B-A表示概念B擁有而概念A(yù)沒有的屬性集合。α,β是調(diào)節(jié)參數(shù)。相似度算法步驟如下:1)相似度矩陣初始化。構(gòu)建一個本體內(nèi)實體間的相似度矩陣Aij,將所有顯式定義的不相交類和等價類的實體之間的概念元素,對應(yīng)矩陣中的相關(guān)元素賦值為 0和1;2)設(shè)定概念差異的參數(shù);3)計算特征向量的交、并集合的信息量。對于特征向量P=iFeatList和Q=jFeatList,定義特征向量 M=|P-Q|,則定義信息量函數(shù)為 countDiff(P,Q)=Σ(1-M);4)根據(jù)式(3)計算概念相似度;5)過濾掉相似度計算結(jié)果小于閾值的檢索結(jié)果,并按相似度大小排序。

        3 試驗與分析

        3.1 差異屬性指標(biāo)參數(shù)的確定

        本文采用的領(lǐng)域本體以W3C提供的酒本體為例,它較好的體現(xiàn)了OWL的描述能力,采用HP實驗室提供的Jena API對酒本體進(jìn)行解析,并構(gòu)建領(lǐng)域本體檢索原型系統(tǒng),對酒本體進(jìn)行檢索。相似度的計算結(jié)果如圖1所示。

        圖1 WineTaste與其他概念的相似度

        圖1為使用本文的語義相似度算法對WineTaste類與領(lǐng)域本體內(nèi)其他類的相似度統(tǒng)計圖,圖中分別顯示了在α,β分別為0和1的條件下,WineTaste相似度取值情況。從圖1中可以看出,當(dāng)兩個概念完全匹配時,相似度的計算結(jié)果等于1,說明兩個概念之間不存在差異,為同一概念或等價概念,差異參數(shù)不會對相似度計算結(jié)果產(chǎn)生影響。而當(dāng)概念之間存在差異時,隨著差異性比重的增加,對結(jié)果的要求越來越嚴(yán)格,概念的相似度越來越小,越來越多的相似度趨近于零。

        相似度的計算結(jié)果,一方面依賴領(lǐng)域?qū)<叶x的概念層次關(guān)系,如果概念層次發(fā)生調(diào)整,則概念相似度會發(fā)生很大變化;另一方面計算相似度的目的在于得到其他概念和某個概念之間的匹配順序,以取得最佳匹配結(jié)果。領(lǐng)域?qū)<覍τ谝话愀拍畹南嗨菩裕o出的概念匹配順序為:概念本身,父子節(jié)點,兄弟節(jié)點,其他節(jié)點。由圖1可以看出,雖然參數(shù)不同,但是根據(jù)相似度得出的匹配順序是基本一致的。

        3.2 評價指標(biāo)

        檢索性能(Retrieval Effectiveness)指檢索模型檢索結(jié)果的有效程度,反映檢索模型的檢索能力。其中,查準(zhǔn)率(Precision)和查全率(Recall)是最重要和通用的評價指標(biāo),本文從這兩方面進(jìn)行考查。查準(zhǔn)率和查全率的公式如下:查準(zhǔn)率P=(檢索出的相關(guān)文檔數(shù)/檢索出文檔總數(shù))×100% ;查全率C=(檢索出的相關(guān)文檔數(shù)/文檔集中的文檔總數(shù))×100%。

        在檢索系統(tǒng)中,查準(zhǔn)率比查全率更容易統(tǒng)計,因為查全率只有在數(shù)據(jù)量規(guī)模較小的情況下情況下才能統(tǒng)計出來,而對于大規(guī)模海量數(shù)據(jù)往往難以統(tǒng)計。

        3.3 結(jié)果與分析

        語義檢索的結(jié)果按照相似度進(jìn)行排序,實驗系統(tǒng)設(shè)定推薦結(jié)果閾值,設(shè)定語義相似度為50%,不顯示語義相似度低于50%的概念,以提高用戶的檢索效率。查準(zhǔn)率與查全率隨檢索參數(shù)變化而變化的情況如表1所示。

        表1 檢索結(jié)果(%)

        從表1可知,通過對參數(shù)α和β取不同的值,用戶作為服務(wù)請求方可以在同一個服務(wù)條件下返回不同的值,也就是說,可以通過調(diào)整差異參數(shù)的取值來得到不同的結(jié)果集。如果用戶傾向于得到更為準(zhǔn)確的查詢結(jié)果,可以增大參數(shù)α,降低參數(shù)β,但這樣有可能不會獲得任何查詢結(jié)果。如果用戶傾向于獲得更多的結(jié)果,則可以降低參數(shù)α,增大參數(shù)β,既可獲得更多的查詢結(jié)果,為下一步查詢提供參考。

        4 結(jié)論

        概念之間的相似性量化表示是使機器理解概念,從而進(jìn)行智能推理和判斷的重要基礎(chǔ)。本文基于OWL屬性特征計算概念相似度,通過調(diào)節(jié)參數(shù)的取值,得到不同的柔性表達(dá)相似度,從而實現(xiàn)根據(jù)服務(wù)請求者的需求定制相似度結(jié)果集。限于試驗的數(shù)據(jù)量,為得到更精確的統(tǒng)計數(shù)據(jù),不進(jìn)行大規(guī)模試驗。下一步的工作要進(jìn)一步考慮概念屬性的權(quán)重問題,根據(jù)權(quán)重動態(tài)設(shè)定增強語義、差異參數(shù)和相似度閾值,以獲得更為柔性的相似度計算結(jié)果。

        [1]Klein M,Bernstein A.Searching for services on the semantic Web using process ontologies[C].In Proceedings of the First Semantic Web Working Symposium(SWWS-1),2001.

        [2]Paolucci M,Kawawura T.Semantic matching of Web services capabilities[C].In Proceedings of the International Semantic Web Conference,2002.

        [3]LI Kuang, WU Jian,Deng Shuiguang,et al.Exploring semantic technologies in service matchmaking[C].In Proceedings of the Third European Conference on Web Services,2005.

        [4]Tverskey A.Features of similarity[J].Psychological Review.1977,84(4):327.

        [5]Lin D.An information-theoretic definition of similarity[C].In Proceedings of the International Conference on Machine Learning,1998.

        [6]Gruber TR.Toward principals for the design of Ontologies used for knowledge sharing[J].International Journal of Human computer Studies,1995,43(5/6):907.

        猜你喜歡
        查全率本體檢索
        Abstracts and Key Words
        對姜夔自度曲音樂本體的現(xiàn)代解讀
        2019年第4-6期便捷檢索目錄
        海量圖書館檔案信息的快速檢索方法
        基于詞嵌入語義的精準(zhǔn)檢索式構(gòu)建方法
        專利檢索中“語義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
        Care about the virtue moral education
        卷宗(2013年6期)2013-10-21 21:07:52
        中文分詞技術(shù)對中文搜索引擎的查準(zhǔn)率及查全率的影響
        國際標(biāo)準(zhǔn)檢索
        国产精品国产三级在线高清观看| 亚洲欧洲成人精品香蕉网| 无遮挡h肉动漫在线观看| 老熟女多次高潮露脸视频| 欧美性性性性性色大片免费的| 国产精品99久久久精品免费观看| 国产精品又黄又爽又色| 精品亚洲一区二区三区四| 色一情一乱一乱一区99av| 99国产精品久久久蜜芽| AV无码专区亚洲AVL在线观看 | 三年片在线观看免费大全电影 | 久久精品无码免费不卡| 九九精品视频在线观看| 一区二区特别黄色大片| 青青草成人在线播放视频| 巨人精品福利官方导航| 91久久精品国产91久久| 91美女片黄在线观看| 国产主播一区二区三区在线观看| 免费观看a级毛片| 日日碰狠狠丁香久燥| 美女黄频视频免费国产大全| 国产毛片精品一区二区色| 久久综合噜噜激激的五月天| 国产97在线 | 免费| 精品四虎免费观看国产高清| 国产成人精品中文字幕| 免费午夜爽爽爽www视频十八禁| а天堂中文最新一区二区三区| 久久国产A√无码专区亚洲| 国产青青草自拍视频在线播放| 国产精品黑丝高跟在线粉嫩| 亚洲人成电影在线观看天堂色| 国产亚洲精品福利在线| 色婷婷亚洲一区二区三区在线| 免费人成年激情视频在线观看| 国产乱子伦露脸在线| 美腿丝袜中文字幕在线观看| 欧美牲交a欧美牲交aⅴ免费下载 | 精品国产车一区二区三区|