亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于本體的知識庫語義WEB擴展搜索方法研究

        2013-06-13 12:53:14李延香
        電子測試 2013年5期
        關鍵詞:關聯(lián)語義用戶

        袁 輝 李延香

        (1.陜西工業(yè)職業(yè)技術學院,陜西咸陽 712000;2.咸陽師范學院信息工程學院,陜西咸陽 712000)

        目前短查詢法是最為常用的知識庫搜索方法,不過在進行檢索過程中,由于用戶輸入的關鍵詞帶有一定歧義性,再加上文檔權重設置上的影響,很容易造成搜索結果無法完全滿足人們信息檢索需求。作為一種技術手段,查詢擴展是解決這一問題的有效途徑?;诔跏疾樵兓A上的查詢擴展采取有效措施將相關詞添加入其中,從而為判斷文檔相關性提供更多的信息服務。語義擴展查詢的基本原理就是將原始查詢映射至概念,并通過相關技術對查詢語義及與之相關聯(lián)的語義實施提取,進而得到更高精準度的查詢語義,并對知識庫中的文檔進行與之相對應的檢索。包括全局分析、局部分析、基于關聯(lián)規(guī)則和用戶查詢日志的查詢擴展等在內的幾種方法是當下普遍使用的查詢擴展法。其中全文分析的對象為整個文獻集,該方法的系統(tǒng)計算量較為繁重,對海量信息進行檢索時不適合采用該方法。局部分析法則對初檢文檔有相當高的依賴性,初檢文檔與原查詢的相關度會對檢索效果起決定性作用。詞間關聯(lián)規(guī)則質量的高低則會直接影響到基于關聯(lián)規(guī)則的查詢擴展結果的高低。大量用戶查詢日志的存在是實現(xiàn)基于用戶日志的查詢擴展的不可或缺的重要條件。本文從知識庫語義擴展搜索和相關度分析這兩方面為出發(fā)點,提出了一種新的語義擴展搜索方法,即基于本體的知識庫語義WEB擴展搜索方法。

        1 語義擴展搜索

        擴展查詢條件、映射本體知識庫以及相關度分析是構建本文所設計的本體知識庫擴展搜索模型的主要三個部分。具體步驟是:首先,對用戶輸入查詢條件進行采集并通過領域知識詞典對其進行擴展;其次,通過關鍵字匹配法完將擴展查詢條件向知識庫本體實例進行映射;再次,對映射后的本體實例實施相關度分析;最后將擴展查詢結果反饋給用戶。下面就模型重點部分進行詳細說明。

        語義擴展查詢必須建立在完成領域知識詞典的構建基礎上,與此同時,在領域專家的大力配合下構建起本體知識庫。

        1.1 本體構建

        (1)本體的定義

        本體在計算機領域中的定義有好多種,其中“基于組建相關領域詞語的基本術語及其相互關系基礎上對其進行優(yōu)化整合,以便能夠對詞語派生規(guī)則進行規(guī)定的定義[3]”能夠獲得大家普遍認同。

        本體的表示主要包括個體、類、屬性和關系這四個部分。其中個體指的是具體的實例,對知識的抽象概念說明指的是類,個體或類的特征指的是屬性,個體或類之間的關聯(lián)則為關系。

        (2)本體構建方法

        本體構建步驟主要分為三部分:第一,獲得與領域相關的知識實體,同時構建起知識鏈;第二,對知識鏈進行概念化以及對現(xiàn)有本體進行整合并編碼等是建立本體結構化的重要環(huán)節(jié),這些環(huán)節(jié)都是通過中間表達集合實現(xiàn)的;第三,開展本體評估工作。

        1.2 領域知識詞典

        語義知識詞典在包括機器翻譯和詞義消岐等在內的多個領域有著較為廣泛的應用,它的出現(xiàn)能夠使計算機對自然語言有著更為深入的理解,同時也是實現(xiàn)計算機智能化的物質保障。

        (2)領域知識詞典的構建

        作為語義知識詞典的子集,領域知識詞典的構建有著重要意義。在一些特定領域,語義知識詞典無法全部滿足其需求,基于此,必須針對特定領域知識構建起與其相對應的詞典空間。

        構建領域知識詞典必須以領域專家的參與為前提,通過全局分析法對與領域有關的詞進行抽取。構建領域知識詞典的具體步驟為:首先通過全局分析法的關鍵字分離、語義相關詞義集檢索及領域不相關同義詞集剪這三個環(huán)節(jié)對領域文檔中的詞或詞組進行相關分析和處理,其次對處理后的詞或詞組間的關聯(lián)程度進行相關計算;最后以語義知識詞典網(wǎng)狀結構為基礎,完成領域語義詞典的創(chuàng)建任務。

        1.3 擴展查詢條件算法

        擴展查詢的實質就是將與用戶查詢相關聯(lián)的詞添加到原始查詢中,形成比原始查詢更長更精準的的查詢,從而提高查詢效率。其計算方法為:

        (1)對用戶輸入的查詢條件進行接收,并對其進行句法分析和句法語義關聯(lián)分析。

        (2)提取語義關鍵字的同時將聽用詞去除,以便消除歧義,從而獲得集合

        (3)按照語義關聯(lián)規(guī)則對獲得的集合U進行處理,并通過領域知識詞典完成同義詞的擴展任務即f(U)=V′,可獲得集合存在著集合,其中g(ui,vi,j)是用來對ui和vi,j之間的相關度進行計算,β為閾值。V為擴展后的查詢條件集合。

        1.4 相關度分析

        (1)相關度的定義

        相關度指的是兩個對象間存在的關聯(lián)程度[8],其計算公式為:

        在上述公式中,S(PCi,TCj)代表的含義為概念PCi和TCj的相關度,[0,1]是其值域;α代表的含義為可調節(jié)參數(shù);dis代表的含義是整數(shù),采取以下策略進行取值:

        1)當PCi=TCj時,則dis取值為0,此時S(PCi,TCj)的值為1;

        2)當PCi≠TCj,則dis的取值為,當dis=∞的條件下,則S(PCi,TCj) = 0 ,其中wp代表的是路徑權值;

        3)P代表PCi的特征集合,T代表TCj的特征集合,當(P∩T)≠φ的條件下,則可使dis的取值為1,此時相關度的計算公式為:

        在上式中,λ所代表的含義為非公共特征的相對重要程度。

        (2)相關度分析算法

        在進行相關度分析計算過程中,同時加入擴展查詢和映射相關度尤為重要。用戶輸入查詢條件與擴展查詢條件間的關聯(lián)程度即為擴展查詢相關度;擴展查詢條件向本體實例進行映射的關聯(lián)程度則用映射相關度來表示[5]。其計算方法為:

        在上式中,S(ui,vi.j)代表的含義為ui和vi.j之間存在的語義相關聯(lián)程度。

        2)采用最短距離算法在語義知識詞典的網(wǎng)狀結構中,由ui點為出發(fā)點,通過有限步數(shù)到達vi,j點,在此過程中,路徑的權值疊加和可用dis=u∑→vwp進行計算,通過公式(1)可知S(u,v)= α 。為確保擴展i具i,j有較高的合理性,對各個查詢條ii,jdis+α件的相關度作出如下要求:S(ui,vi,j)≥β,其中β代表的是閾值,其取值為0≤ β ≤1[6]。

        3)將擴展查詢條件集合V向本體知識庫f(vi,j)=Ti,j中進行映射后可得到本體實例集合,即Ti,j={ti,jk1≤i,j,k≤n} 。

        4)通過對各個本體實例集的交集進行計算可得T1,j∩T2,j∩…∩Ti?1,j∩Ti,j=T′ ,T′ ={ti′,jk(h)1≤i,j,k,h≤n},其中實例ti′,jk屬于h個互異本體實例集共同擁有。

        5)對各個本體實例的綜合相關度進行計算,其計算公式為:

        在上式中,Q(vi,j,ti,j,k)指的是用來對vi,j映射到ti,j,k的相關度進行計算的函數(shù);μ,δ代表的含義為可變系數(shù);h應大于等于1。

        2 實驗分析

        采用Java編程語言對博物館知識庫系統(tǒng)進行構建,Protege3.1.1為本體構建工具;SQLServer2000為本文進行實驗所采用的數(shù)據(jù)庫;運用Jena2.6.2對本體進行相關操作;支持中文的知網(wǎng)是本次試驗過程中所使用的語義知識詞典。博物館領域知識本體的創(chuàng)建工作是在領域專家的參與下完成的。

        本次實驗內容主要涉及到博物館知識庫的9個方面。其中公式(4)中各參數(shù)取值為 :μ = 0 .005,δ =0.4,β =0.9。表一為用戶輸入“中國”和“兵馬俑”這兩個關鍵詞組后所得到的查詢結果片段。

        表1 實驗數(shù)據(jù)片斷

        通過實驗可知,本文所提出的語義擴展搜索方法能夠使查全率和查準率獲得大幅提升。

        3 結語

        為有效提升檢索效率,滿足人們信息檢索需求,筆者結合語義網(wǎng)本體技術和查詢擴展技術提出了一種新的檢索手段。該方法中所運用的領域知識詞典以及對擴展查詢和映射相關度的計算能夠確保搜索查全率和查準率。但由于各權值的設定會對相關度計算結果造成一定影響,所以還應繼續(xù)進行完善。

        [1]ShihCW,ChenMinyen,ChuHuichuan.EnhancementofDomain OntologyConstructionUsingaCrystallizingApproach[J].ExpertSystemswithApplications,2011,38(6):7544-7557.

        [2]RahmanMM,AntaniSK,ThomaGR.AQueryExpansionFramewor kinImageRetrievalDomainBasedonLocalandGlobalAnaly sis[J].InformationProcessingandManagement,2011,47(5):676-691.

        [3]施雅賢,李璞,肖寶.面向旅游領域的語義查詢擴展方法[J].計算機工程 ,2010,(36)(18):43-45.

        [4]白如江,于曉繁,王效岳.國內外主要本體庫比較分析研究[J].現(xiàn)代圖書情報技術,2011,1(7):3-13.

        猜你喜歡
        關聯(lián)語義用戶
        “苦”的關聯(lián)
        當代陜西(2021年17期)2021-11-06 03:21:36
        語言與語義
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        關注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        “上”與“下”語義的不對稱性及其認知闡釋
        關注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        認知范疇模糊與語義模糊
        如何獲取一億海外用戶
        国产一品二品三品精品在线| 欧美激情国产一区在线不卡| 中文字幕乱码亚洲美女精品一区 | 人妻无码一区二区不卡无码av| 色婷婷欧美在线播放内射| 国产一区二区三区国产精品| 伊人五月亚洲综合在线| 色偷偷888欧美精品久久久 | 毛片色片av色在线观看| 男女18视频免费网站| 国产成人精品123区免费视频| 96精品在线| 日韩中文字幕乱码在线| 国产自拍视频在线观看网站| 男人激烈吮乳吃奶视频免费| 91亚洲国产成人aⅴ毛片大全| 黄片午夜免费观看视频国产| 麻豆91蜜桃传媒在线观看| 亚洲国产精品久久久久婷婷老年 | 色一情一区二区三区四区| 日韩乱码视频| 中文字幕一区二区三区四区久久| av影院在线免费观看不卡| 国产精品久久国产三级国不卡顿| 日韩国产成人精品视频| 中文字幕中文字幕三区| 国产对白国语对白| 老熟妇高潮喷了╳╳╳| 久久精品国产亚洲av热一区| 富婆猛男一区二区三区| 亚洲欧美一区二区三区在线| 精选麻豆国产AV| 大香蕉视频在线青青草| 亚洲国产美女精品久久久久∴| 黄色成人网站免费无码av| 久久精品有码中文字幕1| 国产日产一区二区三区四区五区| 国产操逼视频| 日韩一区二区超清视频| 日本久久大片中文字幕| 亚洲日韩国产欧美一区二区三区|