亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于元數(shù)據(jù)本體計(jì)算的網(wǎng)絡(luò)信息檢索方法*

        2015-07-12 17:16:34
        新技術(shù)新工藝 2015年3期
        關(guān)鍵詞:信息檢索信息管理系統(tǒng)本體

        李 彥

        (西安翻譯學(xué)院,陜西 西安 710105)

        一種基于元數(shù)據(jù)本體計(jì)算的網(wǎng)絡(luò)信息檢索方法*

        李 彥

        (西安翻譯學(xué)院,陜西 西安 710105)

        為了提高Web信息檢索和過(guò)濾的準(zhǔn)確性,提出了一種基于元數(shù)據(jù)本體的網(wǎng)絡(luò)信息檢索方法,引入形式概念分析理論本體計(jì)算算法來(lái)描述本體特征檢索領(lǐng)域的概念和關(guān)系,并通過(guò)構(gòu)建以元數(shù)據(jù)為基礎(chǔ)的信息管理系統(tǒng),實(shí)現(xiàn)對(duì)語(yǔ)義元數(shù)據(jù)的檢索。應(yīng)用結(jié)果證明,采用該方法可有效提高信息檢索的準(zhǔn)確性。

        元數(shù)據(jù);概念相似度;本體;web網(wǎng)頁(yè);檢索

        隨著當(dāng)前網(wǎng)絡(luò)信息量以幾何級(jí)數(shù)的速度增長(zhǎng),傳統(tǒng)的關(guān)鍵字檢索方式不能滿足用戶對(duì)信息檢索的有效需求,其在進(jìn)行語(yǔ)義檢索時(shí)準(zhǔn)確性比較低;因此,如何提高對(duì)網(wǎng)頁(yè)信息檢索的質(zhì)量成為當(dāng)前思考的重要問(wèn)題。當(dāng)前,提高Web信息檢索的技術(shù)方面思考主要為如何從大量的Web資源中附加計(jì)算機(jī)可以理解的內(nèi)容(如元數(shù)據(jù)),以此使計(jì)算機(jī)更好地對(duì)其進(jìn)行自動(dòng)化處理,換句話說(shuō)就是給出一種計(jì)算機(jī)能準(zhǔn)確理解的資源手段,實(shí)現(xiàn)對(duì)異構(gòu)分布信息的有效檢索。解決該問(wèn)題的關(guān)鍵在于:1)通過(guò)引入本體特征進(jìn)行描述,從而提高檢索的準(zhǔn)確性;2)構(gòu)建元數(shù)據(jù)信息管理系統(tǒng),實(shí)現(xiàn)基于本體的元數(shù)據(jù)檢索;3)針對(duì)其中的非元數(shù)據(jù),如何實(shí)現(xiàn)轉(zhuǎn)換。本文針對(duì)上述3個(gè)問(wèn)題進(jìn)行了探討[1]。

        1 本體概念相似度算法

        目前,針對(duì)概念相似度的研究方法主要包括2種。

        (1)

        2)基于語(yǔ)義詞典方法。該方法主要利用語(yǔ)義詞典中的HowNet和WorNet等同義詞所組成的樹(shù)狀層次體系結(jié)構(gòu),通過(guò)計(jì)算語(yǔ)義之間的距離或者是信息熵的方式對(duì)概念相似度進(jìn)行計(jì)算[2]。

        2 基于T-L BACH的改進(jìn)CS0算法

        傳統(tǒng)的T-L BACH算法作為一種對(duì)本體間概念相似度的計(jì)算,與語(yǔ)義相似度算法等相比有著非常重要的特點(diǎn),通過(guò)該算法可實(shí)現(xiàn)對(duì) OWL DL等描述語(yǔ)言內(nèi)涵的充分挖掘,從而得出本體概念以外的潛在的相關(guān)信息;但該算法也存在著很大不足,主要體現(xiàn)在計(jì)算本體概念相似度的時(shí)候,T-L BACH沒(méi)有充分考慮到本體的概念特征間的相關(guān)結(jié)構(gòu)關(guān)系,導(dǎo)致對(duì)相似度計(jì)算精確度不高。因此,為提高概念本體的計(jì)算的準(zhǔn)確度,本文提出從 FCA 概念相似度和 RDF 圖結(jié)構(gòu)相似度兩方面對(duì)其進(jìn)行計(jì)算,其具體的計(jì)算公式為:

        simcso=simfcawfca+simrdf+wrdf

        (2)

        式中,wfca為fca的權(quán)重,wrdf為rdf的權(quán)重,并有wfca+wrdf=1。

        2.1 基于 FCA 的概念相似度計(jì)算

        在FCA中,形式概念和形式為該算法的基礎(chǔ),還要通過(guò)形式反映其背景,因此,需要做以下幾方面的定義。

        定義1:形式背景K=(O,A,R)是由屬性集合A、對(duì)象集合O以及由O和A關(guān)系R所共同組成。

        定義2:假設(shè)E表示其對(duì)象集合O當(dāng)中的一個(gè)自己,則定義E′={n∈A|?m∈E,mRn}為E中所有對(duì)象的共同屬性的集合;同理,定義I作為A當(dāng)中的自己,定義I′={n∈A|?m∈I,mRn}為I當(dāng)中所有對(duì)象的共同屬性。

        定義3:采用二元組(E,I)表示形式背景K:=(O,A,R)的一個(gè)形式概念,有E?O,I?A,且滿足E′=I,I′=E。其中,E表示(E,I)的外延,I表示(E,I)的內(nèi)涵。用δ表示K:=(O,A,R)在背景為K上面所有概念的集合,δ表示背景上的概念格。

        定義4:在概念格中,如果某元素不能被寫(xiě)成其他元素的下確界,則該元素和概念格中上方的元素僅能通過(guò)一條邊進(jìn)行連接,可將該元素稱為是不可約下確界元素;同理,如果某元素不能寫(xiě)為其他元素的上確界,則將該元素稱為不可約上確界元素[3]。

        因此,通過(guò)上述定義,可得到基于FCA的相似度計(jì)算公式為:

        (3)式3中,a(s1,s2)的值為0.5;s1∨s2為概念的上確界;(s1∨s2)∧為概念的上確界的內(nèi)涵中其不可約下確界的元素集;(s1-s2)∧,(s2-s1)∧為在s1中卻不在s2中的不可約下確界元素集,和在s2中而不在s1中的不可約下確界元素集。

        2.2 RDF 圖結(jié)構(gòu)相似度計(jì)算

        傳統(tǒng)的針對(duì)RDF圖結(jié)果相似度的計(jì)算公式為:

        (4)

        但是通過(guò)上述的數(shù)據(jù)可以看出,其充分地描述了RDF結(jié)構(gòu)中的謂詞關(guān)系,對(duì)其中的OWL語(yǔ)言的語(yǔ)義信息卻不能充分表達(dá);因此,在式4中增加了OWL屬性的計(jì)算,將OWL的屬性納入到對(duì)相似度的計(jì)算中得到:

        (5)

        2.3 算法設(shè)計(jì)

        通過(guò)上述分析,將對(duì)概念相似度的計(jì)算設(shè)計(jì)為如圖1所示的算法。

        圖1 CSO 算法框架圖

        3 基于元數(shù)據(jù)和本體的管理系統(tǒng)構(gòu)建

        結(jié)合系統(tǒng)的需求,將該信息管理系統(tǒng)分為3層,并根據(jù)B/S訪問(wèn)模式對(duì)信息系統(tǒng)進(jìn)行建構(gòu),其具體的建構(gòu)如圖2所示。

        圖2 元數(shù)據(jù)信息管理系統(tǒng)平臺(tái)

        構(gòu)建元數(shù)據(jù)管理平臺(tái)其主要的目的是對(duì)不同的業(yè)務(wù)信息進(jìn)行分類,從而為基于本體的概念相似度計(jì)算提供相關(guān)的基礎(chǔ)的素材。通過(guò)該平臺(tái)將其分為3個(gè)不同的服務(wù)層:用戶交互層主要為用戶提供元數(shù)據(jù)管理交互的平臺(tái),包括對(duì)元數(shù)據(jù)的添加、修改、模板建模、查詢、數(shù)據(jù)導(dǎo)入等操作;在登陸之后,通過(guò)基于本體和基于概念對(duì)網(wǎng)絡(luò)信息進(jìn)行搜索,一方面系統(tǒng)通過(guò)算法將用戶提交的信息轉(zhuǎn)換為基于本體領(lǐng)域的語(yǔ)義搜索,另一方面則生成基于本體概念的SPARQL;最后,將上述的信息傳遞給數(shù)據(jù)服務(wù)層,借助數(shù)據(jù)服務(wù)層對(duì)數(shù)據(jù)的處理和修改等完成對(duì)數(shù)據(jù)的搜索。在數(shù)據(jù)庫(kù)中,通過(guò)采用一定的領(lǐng)域規(guī)則,并借助SWRL解析器對(duì)OWL文件進(jìn)行解析,同時(shí)通過(guò)JESS推理引擎實(shí)現(xiàn)將數(shù)據(jù)傳遞給本體知識(shí)庫(kù)。

        4 基于元數(shù)據(jù)的信息搜集

        在語(yǔ)義Web當(dāng)中,最為核心的為 XML、RDF,這些作為解決對(duì)網(wǎng)絡(luò)信息的搜集提供最為基礎(chǔ)的技術(shù)框架;但是,在對(duì)信息的搜集過(guò)程中還存在著很大的問(wèn)題就是當(dāng)前大多數(shù)的網(wǎng)絡(luò)資源其沒(méi)有使用標(biāo)準(zhǔn)的元數(shù)據(jù)對(duì)站點(diǎn)信息進(jìn)行描述,同時(shí)一些相關(guān)的網(wǎng)頁(yè)或者圖像資源也缺乏統(tǒng)一的元數(shù)據(jù)描述。因此,為了更好地解決該問(wèn)題,本文采用了搜集過(guò)濾技術(shù),在這個(gè)過(guò)程中,主動(dòng)完成對(duì)語(yǔ)義元數(shù)據(jù)的搜集,過(guò)程為:1)如果該網(wǎng)絡(luò)資源其本身則為元數(shù)據(jù),則直接對(duì)其進(jìn)行抽??;2)如果沒(méi)有包含元數(shù)據(jù),則首先根據(jù)文本摘要、關(guān)鍵詞抽取和數(shù)據(jù)挖掘等方式將網(wǎng)絡(luò)資源轉(zhuǎn)換為元數(shù)據(jù);3)對(duì)標(biāo)注過(guò)的元數(shù)據(jù)進(jìn)行抽取,抽取的元數(shù)據(jù)和對(duì)本體的描述統(tǒng)一采用RDF模式進(jìn)行描述;4)基于過(guò)濾本體描述的條件表達(dá)式對(duì)網(wǎng)絡(luò)資源所對(duì)應(yīng)的元數(shù)據(jù)進(jìn)行檢索、分析和判別,以此來(lái)更新元數(shù)據(jù)庫(kù)。

        5 檢索實(shí)現(xiàn)

        5.1 實(shí)現(xiàn)工具

        對(duì)于系統(tǒng)的實(shí)現(xiàn),采用美國(guó)斯坦福大學(xué)開(kāi)發(fā)的本體編輯工具Protege工具對(duì)該信息管理系統(tǒng)的領(lǐng)域本體進(jìn)行開(kāi)發(fā),演示用的相關(guān)數(shù)據(jù)全部存放到SQL Server 2008數(shù)據(jù)庫(kù)當(dāng)中。采用Jena API接口對(duì)操作本體進(jìn)行開(kāi)發(fā),最后通過(guò)JSP頁(yè)面展現(xiàn)。

        5.2 結(jié)果比較

        為比較該算法的有效性,本文設(shè)計(jì)了2種方案,一種為現(xiàn)有的算法設(shè)計(jì),另外一種為傳統(tǒng)的關(guān)鍵詞匹配,通過(guò)上述實(shí)現(xiàn),得到的結(jié)果見(jiàn)表1。

        表1 試驗(yàn)結(jié)果比較

        6 結(jié)語(yǔ)

        通過(guò)采用改進(jìn)的CSO算法,加入OWL屬性和引入形成概念,同時(shí)構(gòu)建基于元數(shù)據(jù)的信息管理系統(tǒng),得到了其檢索的結(jié)果要遠(yuǎn)遠(yuǎn)好于傳統(tǒng)關(guān)鍵字的匹配結(jié)果,從而證明了該算法的有效性。通過(guò)對(duì)該算法的改進(jìn),可實(shí)現(xiàn)對(duì)各種網(wǎng)絡(luò)信息資源的搜索,提高搜索的準(zhǔn)確性和實(shí)現(xiàn)語(yǔ)義延伸的搜索。

        [1]王家琴,李仁發(fā). 一種基于本體的概念語(yǔ)義相似度方法的研究[J].計(jì)算機(jī)工程. 2007,33(11):120-126.

        [2]時(shí)維元,林正英.復(fù)雜設(shè)備制造企業(yè)遠(yuǎn)程服務(wù)文檔管理與檢索系統(tǒng)研究[J].新技術(shù)新工藝, 2013(2):41-45.

        [3]李艷芳.多層網(wǎng)絡(luò)中基于資源優(yōu)化的配置方式[J].新技術(shù)新工藝, 2014(9):91-93.

        *陜西高等教育教學(xué)改革研究(重點(diǎn))資助項(xiàng)目(13BZ69)

        責(zé)任編輯李思文

        ANetworkInformationRetrievalMethodbasedontheMetadataOntologyCalculation

        LI Yan

        (Xi′an FanYi University, Xi′an 710105, China)

        A network information retrieval method based on the metadata ontology was proposed to improve the accuracy of Web information retrieval and filtering. It introduced the formal concept analysis theory, calculation algorithm of ontology and describes the concept and relation to the ontology feature retrieval field. Meanwhile, through the establishment of information management system based on metadata, the method can realize the retrieval of semantic metadata. The results showed that the method can improve the accuracy of information retrieval effectively.

        metadata, concept similarity, ontology, Web page, retrieval

        TP 392

        :A

        李彥(1980-),女,講師,碩士,主要從事計(jì)算機(jī)教學(xué)等方面的研究。

        2015-01-05

        猜你喜歡
        信息檢索信息管理系統(tǒng)本體
        Abstracts and Key Words
        三維可視化信息管理系統(tǒng)在選煤生產(chǎn)中的應(yīng)用
        信息管理系統(tǒng)在工程項(xiàng)目管理的應(yīng)用
        對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
        基于三維TGIS的高速公路綜合信息管理系統(tǒng)
        醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
        《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
        河南科技(2014年11期)2014-02-27 14:10:19
        Care about the virtue moral education
        卷宗(2013年6期)2013-10-21 21:07:52
        亚洲色大成网站www永久网站| 免费人妻精品区一区二区三| 久久精品国产熟女亚洲av麻豆| 91久久国产露脸国语对白| 侵犯了美丽丰满人妻中文字幕| 国产色视频一区二区三区qq号| 国产最新进精品视频| 精品少妇爆乳无码aⅴ区| 麻豆三级视频网站在线观看| 国产精品偷窥熟女精品视频| 免费观看性欧美大片无片| 久久人人做人人妻人人玩精| 亚洲性色ai无码| 精品国产黄一区二区三区| 精品国内在视频线2019| 免费一级毛片在线播放不收费| 国产成人午夜av影院| 日本av一级视频在线观看| 中国少妇×xxxx性裸交| 最近免费中文字幕| 天堂Av无码Av一区二区三区| 亚洲av激情一区二区| 国产精品久线在线观看| 亚洲人成电影在线无码| 国产美女69视频免费观看| 日本女优一区二区在线免费观看 | 久久精品亚洲成在人线av乱码| 一本久道综合在线无码人妻| 欧美与黑人午夜性猛交久久久| 高清高速无码一区二区| 五月激情四射开心久久久| 久久97久久97精品免视看| 国产尤物AV尤物在线看| av男人操美女一区二区三区| 国产91精品在线观看| 日本艳妓bbw高潮一19| 91呻吟丰满娇喘国产区| 亚洲色图在线视频免费观看| 亚洲天堂精品一区入口| 亚洲国产精品日韩av不卡在线 | 亚洲av永久久无久之码精|