亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于知識(shí)圖譜的信息查詢系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)研究*

        2021-11-27 03:40:35劉昱甫
        科技與創(chuàng)新 2021年14期
        關(guān)鍵詞:信息檢索功能模塊圖譜

        劉昱甫

        (清華大學(xué),北京100084)

        大數(shù)據(jù)技術(shù)迅速發(fā)展,已經(jīng)在醫(yī)療保健、用戶生成數(shù)據(jù)、互聯(lián)網(wǎng)和金融公司、供應(yīng)鏈系統(tǒng)等行業(yè)領(lǐng)域得到深入應(yīng)用[1],也已經(jīng)在人們的日常生活中展示出不可替代的作用[2]。另一方面,不同類型數(shù)據(jù)量的迅猛增加,增加了信息檢索的難度,降低了信息檢索的效率,為信息查詢帶來(lái)了極大挑戰(zhàn)[3]。本文介紹了一種基于知識(shí)圖譜的信息查詢系統(tǒng)的新方案。

        1 基于知識(shí)圖譜的信息查詢系統(tǒng)的設(shè)計(jì)背景

        傳統(tǒng)的信息查詢系統(tǒng)主要根據(jù)用戶輸入的關(guān)鍵詞進(jìn)行索引匹配,完成信息的檢索與調(diào)取。這種信息查詢與檢索方式在理解用戶查詢需求,展示檢索結(jié)果等方面擴(kuò)展性不強(qiáng)。為了滿足用戶對(duì)于信息查詢快速性、準(zhǔn)確性、智能性的不斷增長(zhǎng)的需求,本文介紹了一種基于知識(shí)圖譜的信息查詢系統(tǒng)的新方案[4]。

        2 基于知識(shí)圖譜的信息查詢系統(tǒng)的關(guān)鍵技術(shù)分析

        2.1 知識(shí)圖譜的概念和主要構(gòu)建技術(shù)

        知識(shí)圖譜是一種語(yǔ)義網(wǎng)絡(luò)。知識(shí)圖譜的構(gòu)建是一個(gè)系統(tǒng)性的工程[5],它包括本體構(gòu)造、知識(shí)抽取和關(guān)系抽取、知識(shí)推理和關(guān)系推理等[6-7]。此外,還需對(duì)知識(shí)抽取的監(jiān)督算法進(jìn)行樣本標(biāo)注,或?qū)ψ詣?dòng)標(biāo)注的樣本進(jìn)行效果確認(rèn)。在知識(shí)抽取的過(guò)程中需要完成實(shí)體抽取、關(guān)系抽取和屬性抽取。

        2.2 信息檢索技術(shù)

        信息檢索技術(shù)主要指信息按一定的方式組織起來(lái),并根據(jù)信息用戶的需要找出有關(guān)的信息的過(guò)程和技術(shù)[8]。常用的信息檢索方式包括手工檢索和機(jī)械檢索(計(jì)算機(jī)檢索、網(wǎng)絡(luò)信息檢索)。本文介紹的基于知識(shí)圖譜的信息查詢系統(tǒng),選用網(wǎng)絡(luò)信息檢索的方式,即依托特定的網(wǎng)絡(luò)檢索工具或?yàn)g覽方式,讓用戶在網(wǎng)絡(luò)終端完成所需信息的查找與獲取。

        3 基于知識(shí)圖譜的信息查詢系統(tǒng)的設(shè)計(jì)方案

        3.1 系統(tǒng)整體邏輯結(jié)構(gòu)的設(shè)計(jì)

        基于知識(shí)圖譜的信息查詢系統(tǒng)的邏輯機(jī)構(gòu)包括查詢應(yīng)用層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)預(yù)處理層、網(wǎng)絡(luò)數(shù)據(jù)獲取層。其中,查詢應(yīng)用層主要包含信息檢索、知識(shí)圖譜展示、智能問(wèn)答。它為用戶提供信息檢索服務(wù),滿足用戶信息查詢與獲取需求。數(shù)據(jù)存儲(chǔ)層主要包括基于數(shù)據(jù)庫(kù)的知識(shí)存儲(chǔ),它能夠把CSV文件格式存儲(chǔ)的實(shí)體及其關(guān)系文件傳遞至Neo4j圖數(shù)據(jù)庫(kù)中管理,實(shí)現(xiàn)知識(shí)信息的存儲(chǔ)。

        數(shù)據(jù)預(yù)處理層主要包括結(jié)構(gòu)化知識(shí)庫(kù)、中文分詞、詞性標(biāo)注、相似度計(jì)算、文本分類、實(shí)體抽取、實(shí)體對(duì)齊、資源庫(kù)等功能模塊。該層在解析器的支持下,完成對(duì)原始數(shù)據(jù)的抽取,并實(shí)現(xiàn)多樣化的數(shù)據(jù)信息預(yù)處理。網(wǎng)絡(luò)數(shù)據(jù)獲取層主要面向各類網(wǎng)站數(shù)據(jù)源主動(dòng)獲取數(shù)據(jù),主要包括網(wǎng)頁(yè)文本資源的提取。

        3.2 系統(tǒng)功能模塊的具體設(shè)計(jì)

        3.2.1 數(shù)據(jù)獲取功能模塊設(shè)計(jì)

        該功能模塊需要針對(duì)不同的數(shù)據(jù)源網(wǎng)站所包含的知識(shí),比如“豆瓣讀書”網(wǎng)站包含的書籍、作者、出版社等,應(yīng)用爬蟲技術(shù)獲取網(wǎng)頁(yè)文本資源,提取和組織知識(shí)信息。

        3.2.2 數(shù)據(jù)預(yù)處理功能模塊設(shè)計(jì)

        該模塊需要實(shí)現(xiàn)中文分詞和詞性標(biāo)注、相似度計(jì)算和文本分類三個(gè)主要功能??梢詰?yīng)用用戶詞典功能等實(shí)現(xiàn)中文分詞和詞性標(biāo)注,基于余弦定理等完成字符串相似度計(jì)算,應(yīng)用KNN鄰近算法等完成文本分類。

        3.2.3 知識(shí)存儲(chǔ)功能模塊設(shè)計(jì)

        可以采用Neo4j圖數(shù)據(jù)庫(kù)完成實(shí)體節(jié)點(diǎn)及其關(guān)聯(lián)關(guān)系的長(zhǎng)效性存儲(chǔ)[9],進(jìn)而基于實(shí)體屬性或者關(guān)聯(lián)關(guān)系實(shí)現(xiàn)知識(shí)檢索。

        3.2.4 圖譜構(gòu)建功能模塊設(shè)計(jì)

        圖譜構(gòu)建功能可以細(xì)化為六個(gè)功能單元,具體包括知識(shí)獲取、知識(shí)融合、知識(shí)存儲(chǔ)、查詢語(yǔ)義理解、知識(shí)檢索、可視化展現(xiàn)[10]。它們共同完成自然語(yǔ)言查詢的語(yǔ)義分析處理、知識(shí)信息匹配、查詢結(jié)果反饋及其可視化展現(xiàn)的完整過(guò)程,幫助用戶迅速、準(zhǔn)確、全面地獲取信息。

        4 基于知識(shí)圖譜的信息查詢系統(tǒng)的應(yīng)用試驗(yàn)

        4.1 試驗(yàn)環(huán)境與數(shù)據(jù)

        為了確定本系統(tǒng)的應(yīng)用效果,展示系統(tǒng)設(shè)計(jì)方案的可行性,以中文小說(shuō)圖書為知識(shí)對(duì)象,搭建了實(shí)驗(yàn)環(huán)境。其中試驗(yàn)數(shù)據(jù)設(shè)置如下:Dbpedia的實(shí)體穩(wěn)定在0.4億,類別設(shè)置為250,事實(shí)設(shè)置為5億條,屬性控制在6 000種;Freebase的實(shí)體穩(wěn)定在2億,主題設(shè)置為2 000,事實(shí)設(shè)置為1億條,屬性控制在4 000種;NELL的實(shí)體穩(wěn)定在300萬(wàn),類別設(shè)置為300,學(xué)習(xí)規(guī)則控制在1 500萬(wàn)條;谷歌知識(shí)圖譜的實(shí)體穩(wěn)定在5億,事實(shí)設(shè)置為35億條。

        4.2 試驗(yàn)流程

        試驗(yàn)步驟如下:①完成系統(tǒng)開發(fā)技術(shù)的設(shè)定。在基于知識(shí)圖譜的信息查詢系統(tǒng)實(shí)現(xiàn)中,使用的技術(shù)主要包括Java語(yǔ)言(編程語(yǔ)言)、Neo4j圖數(shù)據(jù)庫(kù)(數(shù)據(jù)庫(kù)),使用的開發(fā)工具為Eclipse開發(fā)平臺(tái),使用的Web服務(wù)器為Tomcat。②構(gòu)建圖譜。在“豆瓣讀書”網(wǎng)站中展開實(shí)體的抽選,并在CSV實(shí)體文件中保存。實(shí)踐中,主要根據(jù)固定的格式,在CSV實(shí)體關(guān)系文件中保存實(shí)體之間的關(guān)系。隨后,將CSV實(shí)體文件、CSV實(shí)體關(guān)系文件均轉(zhuǎn)移至數(shù)據(jù)庫(kù)中保存,達(dá)到構(gòu)建圖譜的效果。③系統(tǒng)開發(fā)。出于對(duì)基于知識(shí)圖譜的信息查詢系統(tǒng)開發(fā)效率的考量,將開發(fā)架構(gòu)設(shè)定為MVC中的“JSP+Servlet+JavaBean”模式。

        4.3 試驗(yàn)結(jié)果

        該系統(tǒng)可以迅速地響應(yīng)用戶的查詢需求。和之前基于關(guān)鍵詞的書籍和作者信息檢索系統(tǒng)相比,該系統(tǒng)能夠?qū)Σ樵冃枨蟮恼Z(yǔ)義信息進(jìn)行深入分析,為用戶提供更為全面、準(zhǔn)確的信息查詢結(jié)果。比如,針對(duì)用戶輸入的查詢?cè)~為“活著”,系統(tǒng)能夠判斷出其為余華的代表作之一,除了展示本書的相關(guān)信息,還能同時(shí)展示作者余華的生平簡(jiǎn)歷、其他相關(guān)的著作信息、網(wǎng)站購(gòu)書鏈接等。由此可以看出,基于知識(shí)圖譜的信息查詢系統(tǒng)能夠?yàn)橛脩籼峁└鼮樵敿?xì)、全面、精準(zhǔn)的查詢信息,突破了傳統(tǒng)的基于關(guān)鍵詞的檢索能力,有著非常高的應(yīng)用價(jià)值。

        5 總結(jié)

        傳統(tǒng)的信息查詢系統(tǒng)往往依賴關(guān)鍵詞匹配。為了滿足用戶對(duì)于信息查詢的快速性、準(zhǔn)確性、智能性不斷增長(zhǎng)的需求,本文展示了基于知識(shí)圖譜的信息檢索架構(gòu),通過(guò)數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、知識(shí)存儲(chǔ)、圖譜構(gòu)建和可視化展示等功能模塊的緊密集成,實(shí)現(xiàn)了基于知識(shí)圖譜的信息查詢系統(tǒng)的構(gòu)建。以中文小說(shuō)圖書為知識(shí)對(duì)象的應(yīng)用案例表明,這種基于知識(shí)圖譜的信息查詢能夠?yàn)橛脩籼峁└鼮樵敿?xì)、全面、精準(zhǔn)的信息查詢能力,突破了傳統(tǒng)的基于關(guān)鍵詞的檢索能力,有著非常高的應(yīng)用價(jià)值。

        猜你喜歡
        信息檢索功能模塊圖譜
        繪一張成長(zhǎng)圖譜
        補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        基于ASP.NET標(biāo)準(zhǔn)的采購(gòu)管理系統(tǒng)研究
        醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        主動(dòng)對(duì)接你思維的知識(shí)圖譜
        輸電線路附著物測(cè)算系統(tǒng)測(cè)算功能模塊的研究
        基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
        M市石油裝備公服平臺(tái)網(wǎng)站主要功能模塊設(shè)計(jì)與實(shí)現(xiàn)
        功能模塊的設(shè)計(jì)與應(yīng)用研究
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
        河南科技(2014年11期)2014-02-27 14:10:19
        国产v视频| 精品国产一区二区三区免费| 中文字幕美人妻亅u乚一596| 国产精品熟女视频一区二区| a级国产乱理论片在线观看| 色www亚洲| 国产av一区二区三区狼人香蕉| 一区二区中文字幕在线观看污污| 无码中文字幕日韩专区| 亚洲精品午夜无码专区| 正在播放国产多p交换视频| 国产主播无套内射一区| 久久噜噜噜| 国产精品欧美韩国日本久久| 久久午夜一区二区三区| 久久国产劲爆∧v内射| 午夜精品久久久久久久久久久久| 91福利国产在线观一区二区| 国产高清自产拍av在线| 国产精品久久久久久久久电影网| 国产乱xxⅹxx国语对白| 996久久国产精品线观看 | 精品亚洲麻豆1区2区3区| 九九影院理论片私人影院| 日产精品久久久一区二区| 亚洲精品无码永久在线观看你懂的| 欧洲一卡2卡三卡4卡免费网站| 亚洲中文字幕久久精品蜜桃| 欧美日韩国产高清| av在线网站手机播放| av天堂中文亚洲官网| 精品高清免费国产在线| 亚洲欧美v国产一区二区| 免费无码午夜福利片69| 久久中国国产Av秘 入口| 国产av一区二区凹凸精品| 视频一区视频二区自拍偷拍 | 内射夜晚在线观看| 亚州少妇无套内射激情视频| 人妻精品久久中文字幕| 国产精品无码久久久久下载|