全文檢索
- 達(dá)夢數(shù)據(jù)庫全文檢索系統(tǒng)研究
的發(fā)展進(jìn)步。全文檢索作為海量信息數(shù)據(jù)庫中不可缺失的重要檢索技術(shù),不僅幫助用戶在海量信息數(shù)據(jù)庫上建立起全文索引,還可以幫助用戶快速的對文本信息進(jìn)行高效的檢索。達(dá)夢數(shù)據(jù)庫是我國優(yōu)秀的大型高性能數(shù)據(jù)庫管理系統(tǒng)之一,這款具有完全自主知識產(chǎn)權(quán)的數(shù)據(jù)庫系統(tǒng)在高性能、高可用性、高安全性上投入了大量的研究成本。但在此數(shù)據(jù)庫系統(tǒng)上建立全文索引時(shí)仍存在一些問題,如索引膨脹率高,在對索引進(jìn)行填充時(shí)耗時(shí)較長等問題。全文檢索技術(shù)較為復(fù)雜且綜合性較高,它涉及文本預(yù)處理、文檔解析、分詞
數(shù)碼世界 2020年10期2020-11-16
- 眾創(chuàng)資源分享平臺的設(shè)計(jì)與實(shí)現(xiàn)
:資源分享;全文檢索;智能推薦文章編號:2095-2163(2019)04-0216-05 中圖分類號:TP311.13 文獻(xiàn)標(biāo)志碼:A0 引 言信息過載已經(jīng)成為當(dāng)前互聯(lián)網(wǎng)迅猛發(fā)展中不容忽視的一個(gè)重要問題,由此則導(dǎo)致用戶想要精準(zhǔn)獲取資源就顯得尤為困難。在此背景下,本系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)了搜索與推薦兩種資源相關(guān)的服務(wù)。在算法方面,常見的推薦算法主要有基于內(nèi)容的推薦與基于協(xié)同過濾的推薦。而對于協(xié)同過濾推薦算法,又可將其分為3種,即:基于用戶的協(xié)同過濾、基于物品的協(xié)同過
智能計(jì)算機(jī)與應(yīng)用 2019年4期2019-09-12
- 文本大數(shù)據(jù)分析技術(shù)在鐵路行車安全領(lǐng)域的應(yīng)用研究
域文本數(shù)據(jù)的全文檢索、特征提取等文本大數(shù)據(jù)分析關(guān)鍵技術(shù)進(jìn)行研究。最后以某鐵路局集團(tuán)公司的事故故障追蹤報(bào)告為樣本,進(jìn)行事故故障報(bào)告的全文檢索、故障詞云展示及關(guān)聯(lián)性分析,取得了良好效果。關(guān)鍵詞:大數(shù)據(jù);非結(jié)構(gòu)化;行車安全;事故故障;全文檢索;文本挖掘引言隨著鐵路信息化的不斷發(fā)展,已相繼建成車、機(jī)、工、電、輛等各專業(yè)安全監(jiān)測/監(jiān)控系統(tǒng)近60余個(gè),產(chǎn)生和存儲了PB級的文本、圖紙、視頻、圖像、聲音等多種類型的監(jiān)控/監(jiān)測數(shù)據(jù)。鐵路安全領(lǐng)域迎來了大數(shù)據(jù)時(shí)代,由于傳統(tǒng)數(shù)據(jù)
- 企業(yè)網(wǎng)站靜態(tài)頁面生成與全文檢索技術(shù)研究
成技術(shù)和站內(nèi)全文檢索技術(shù)的原理和實(shí)現(xiàn)方式。[關(guān)鍵詞] 企業(yè)網(wǎng)站;靜態(tài)頁面生成;全文檢索doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 03. 053[中圖分類號] TP311? ? [文獻(xiàn)標(biāo)識碼]? A? ? ? [文章編號]? 1673 - 0194(2019)03- 0131- 030? ? ? 引? ? 言企業(yè)網(wǎng)站是用戶了解企業(yè)的一個(gè)重要窗口,它可為企業(yè)提供信息發(fā)布、產(chǎn)品宣傳、數(shù)據(jù)采集以及電子商務(wù)等功
中國管理信息化 2019年3期2019-03-16
- 基于Lucene的全文檢索的研究及實(shí)現(xiàn)
用。關(guān)鍵詞:全文檢索;Lucene;中文分詞;Web實(shí)現(xiàn)中圖分類號:TP311 文獻(xiàn)標(biāo)志碼:A 文章編號:1009-3044(2018)11-0095-03Lucene是一個(gè)開源全文檢索工具包,它具有優(yōu)異的索引結(jié)構(gòu)和良好的系統(tǒng)架構(gòu),提供了靈活的API函數(shù)接口和可以定制的數(shù)據(jù)存儲結(jié)構(gòu),以實(shí)現(xiàn)具體的全文檢索功能。Lucene完全由Java JDK開發(fā)而成,沒有用到任何第三方開發(fā)包,因此,Lucene也具有良好的跨平臺特性。文章對Lucene進(jìn)行了研究和分析,以
電腦知識與技術(shù) 2018年11期2018-07-28
- 基于Lucene的全文檢索的研究及實(shí)現(xiàn)
用。關(guān)鍵詞:全文檢索;Lucene;中文分詞;Web實(shí)現(xiàn)中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)10-0092-03Lucene是一個(gè)開源全文檢索工具包,它具有優(yōu)異的索引結(jié)構(gòu)和良好的系統(tǒng)架構(gòu),提供了靈活的API函數(shù)接口和可以定制的數(shù)據(jù)存儲結(jié)構(gòu),以實(shí)現(xiàn)具體的全文檢索功能。Lucene完全由Java JDK開發(fā)而成,沒有用到任何第三方開發(fā)包,因此,Lucene也具有良好的跨平臺特性。文章對Lucene進(jìn)行了研究和分析,以
電腦知識與技術(shù) 2018年10期2018-06-02
- 實(shí)名制校園安保服務(wù)平臺的設(shè)計(jì)與實(shí)現(xiàn)
名認(rèn)證技術(shù)和全文檢索技術(shù)設(shè)計(jì)實(shí)現(xiàn)了實(shí)名制校園安保服務(wù)平臺。經(jīng)測試,平臺具有對校內(nèi)人員的信息管控、校園保衛(wèi)人員的實(shí)時(shí)調(diào)度、安保工作智能管理等功能,信息檢索響應(yīng)速度快,系統(tǒng)安全性能好,適合數(shù)字化校園安全保衛(wèi)建設(shè)需要。關(guān)鍵詞: 校園安保服務(wù);教育電子身份號(EEID); 實(shí)名認(rèn)證;全文檢索Abstract:Aiming at the problem of the real-name network service requirements and the inf
智能計(jì)算機(jī)與應(yīng)用 2018年2期2018-05-23
- 基于MySQL的中文全文搜索研究
用系統(tǒng)都通過全文檢索技術(shù)來提高系統(tǒng)的檢索效率。MySQL5.7.6之后內(nèi)置了n-gram parser全文檢索插件,用來支持中文分詞,實(shí)現(xiàn)中文全文檢索,能夠支持百萬級數(shù)據(jù)的檢索。該文將針對全文索引創(chuàng)建的注意事項(xiàng)、中文全文檢索的特點(diǎn)和應(yīng)用進(jìn)行簡單的介紹。關(guān)鍵詞:n-gram parser;FULLTEXT INDEX;全文檢索中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)32-0007-02全文搜索通常用于基于WEB的應(yīng)用程
電腦知識與技術(shù) 2017年32期2017-12-15
- 基于Lucene全文檢索技術(shù)的優(yōu)化探討
為優(yōu)秀的開源全文檢索工具已被廣泛應(yīng)用于各種搜索引擎。文章通過對全文檢索原理與Lucene工具架構(gòu)的研究,從優(yōu)化內(nèi)存索引、索引壓縮處理、優(yōu)化磁盤索引等方面探討Lucene檢索效率的優(yōu)化。實(shí)驗(yàn)結(jié)果證明,通過優(yōu)化內(nèi)存索引、索引壓縮處理等方法可以有效地提高全文檢索的效率。關(guān)鍵詞: 全文檢索; Lucene; 倒排索引; 檢索優(yōu)化中圖分類號:TP393.08 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-828(2017)11-16-04Research on the opt
計(jì)算機(jī)時(shí)代 2017年11期2017-11-18
- Oracle數(shù)據(jù)庫全文檢索性能研究
cle數(shù)據(jù)庫全文檢索性能研究龔建華(國防信息學(xué)院,武漢430010)隨著全文檢索應(yīng)用場景越來越多,更加需要了解數(shù)據(jù)庫全文檢索的性能。介紹Oracle數(shù)據(jù)庫全文檢索的設(shè)置方法,然后加載測試數(shù)據(jù),對全文檢索和模糊查詢的性能進(jìn)行比對測試,最后對全文檢索的查全能力和查詢速度進(jìn)行詳細(xì)分析。數(shù)據(jù)庫;全文檢索;模糊查詢0 引言隨著信息社會的不斷發(fā)展,獲取信息比過去任何時(shí)候都變得更加容易,人們在碰到疑難問題時(shí)會主動(dòng)查詢信息,查詢信息的頻率比過去高出了很多倍。生產(chǎn)生活中涌現(xiàn)
現(xiàn)代計(jì)算機(jī) 2016年27期2016-10-29
- 基于公安業(yè)務(wù)的全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
于公安業(yè)務(wù)的全文檢索系統(tǒng)能夠有效地滿足這個(gè)需求。文章首先對全文檢索技術(shù)進(jìn)行簡要的介紹,對業(yè)務(wù)需求進(jìn)行了深入分析,重點(diǎn)進(jìn)行了全文檢索系統(tǒng)的數(shù)據(jù)分析和功能模塊設(shè)計(jì)。關(guān)鍵詞:全文檢索;公安信息化;公安業(yè)務(wù)全文檢索是現(xiàn)代信息檢索技術(shù)的一個(gè)非常重要的分支,它是處理非結(jié)構(gòu)化數(shù)據(jù)的強(qiáng)大工具,也是搜索引擎的核心技術(shù)之一。全文檢索是以文本數(shù)據(jù)為主要處理對象,根據(jù)數(shù)據(jù)資料的內(nèi)容而不是外在特征實(shí)現(xiàn)的信息檢索手段。全文檢索就是指計(jì)算機(jī)索引程序通過掃描文章中的每一個(gè)詞,對每一個(gè)詞建
無線互聯(lián)科技 2015年20期2016-03-05
- 基于World Wind Java的海底電纜管道業(yè)務(wù)管理信息系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)*
理信息平臺;全文檢索海底電纜管道是通信、電力和油氣等資源的重要輸送載體,隨著我國海洋產(chǎn)業(yè)的發(fā)展,海洋電纜管道無論從數(shù)量還是長度上都取得了迅猛的發(fā)展。目前已在渤海、黃海、東海、南海鋪設(shè)大量油氣管線,總長度近萬公里[1]。面對大量的海底管線審批及管理數(shù)據(jù),我國海洋行政主管部門迫切需要一個(gè)業(yè)務(wù)系統(tǒng)來完成數(shù)據(jù)的集成管理以及三維地理信息可視化展示,為管理決策提供支持。本文基于World Wind Java三維地理信息平臺、Wicket Web開發(fā)框架、Lucene全
海岸工程 2015年2期2015-12-21
- 基于Lucene的多種排序方式的實(shí)現(xiàn)
文實(shí)現(xiàn)了其在全文檢索中多種方式的排序應(yīng)用,并在項(xiàng)目開發(fā)中得到了較好的呈現(xiàn)。關(guān)鍵詞:Lucene;Java;全文檢索;排序中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)17-0054-02The Implementation of a Variety of Sorting Methods Based on LuceneHU Hai-bin(Experiment Center, China West Normal Univer
電腦知識與技術(shù) 2015年17期2015-09-11
- 全文檢索引擎Lucene系統(tǒng)模型與應(yīng)用研究
爆炸式增長,全文檢索技術(shù)是提高信息檢索效率的有效方法。Lucene是一個(gè)采用Java編寫的全文搜索引擎框架,它運(yùn)用了面向?qū)ο蟮脑O(shè)計(jì)思想,提供了豐富的API。對Lucene的系統(tǒng)結(jié)構(gòu)、索引流程、索引機(jī)制進(jìn)行了詳細(xì)分析,對應(yīng)用Lucene引擎搭建全文搜索系統(tǒng)的關(guān)鍵問題進(jìn)行了研究。關(guān)鍵詞:全文檢索;Lucene;倒排索引;分詞DOIDOI:10.11907/rjdk.151168中圖分類號:TP319文獻(xiàn)標(biāo)識碼:A 文章編號文章編號:16727800(2015)
軟件導(dǎo)刊 2015年6期2015-06-24
- 基于自然語言理解的在線答疑系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
理算法,基于全文檢索匹配技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)限定領(lǐng)域內(nèi)的在線答疑系統(tǒng)。實(shí)例運(yùn)行結(jié)果表明,系統(tǒng)可靠性較高,且答疑效果較為明顯,達(dá)到了預(yù)期目標(biāo)。關(guān)鍵詞: 自然語言理解; 語義相似度; 全文檢索; 在線答疑系統(tǒng)中圖分類號:TP399 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2015)05-10-03Abstract: The similarity calculation based on natural language understanding is
計(jì)算機(jī)時(shí)代 2015年5期2015-05-30
- 汽車產(chǎn)業(yè)標(biāo)準(zhǔn)化信息管理系統(tǒng)的關(guān)鍵技術(shù)研究
ucene的全文檢索技術(shù),基于JACOB的文檔受控技術(shù)以及基于JBPM的業(yè)務(wù)流程管理技術(shù)。關(guān)鍵詞:汽車產(chǎn)業(yè);標(biāo)準(zhǔn)化信息管理;工作流;全文檢索中圖分類號:TP315 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)07-0152-03Abstract: This paper has analyzed the importance of the standardization of automobile industry. According to t
電腦知識與技術(shù) 2015年7期2015-05-08
- 全文檢索引擎技術(shù)在電子病歷中的應(yīng)用
建立電子病歷全文檢索系統(tǒng)。系統(tǒng)通過實(shí)際數(shù)據(jù)測試表明,該檢索方法準(zhǔn)確率較高、檢索速度快。關(guān)鍵詞:電子病歷 全文檢索 XML中圖分類號:R197.324 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2014)12-0089-021 引言隨著信息化技術(shù)的飛速發(fā)展,計(jì)算機(jī)技術(shù)越來越多地應(yīng)用到了醫(yī)療領(lǐng)域。近年來醫(yī)療行業(yè)大力加強(qiáng)信息化建設(shè),建立和完善以電子病歷為核心的醫(yī)院信息系統(tǒng)。電子病歷作為臨床信息的載體以及醫(yī)院信息系統(tǒng)的核心構(gòu)成了醫(yī)療衛(wèi)生決策等系統(tǒng)的基礎(chǔ)。目前很
數(shù)字技術(shù)與應(yīng)用 2014年12期2015-05-04
- 基于云計(jì)算的知識管理系統(tǒng)
知識重構(gòu) 全文檢索 云計(jì)算 非結(jié)構(gòu)化數(shù)據(jù)庫隨著互聯(lián)網(wǎng)絡(luò)的發(fā)展、人們對知識獲取方式及知識用途的改變。傳統(tǒng)出版方式無法滿足讀者需求,因而相應(yīng)的讀者市場逐漸流失。解決上述問題需要對現(xiàn)有出版行業(yè)進(jìn)行重新整合,并改進(jìn)出版方式。基于云計(jì)算的知識管理系統(tǒng)通過軟件系統(tǒng)將知識出版、知識服務(wù)商進(jìn)行了整合,從而達(dá)到行業(yè)整合,使整個(gè)行業(yè)能緊密合作、急時(shí)響應(yīng)用戶的需求。同時(shí)通過互聯(lián)網(wǎng)及電子閱讀方式,進(jìn)行低成本、快速傳播,滿足人們個(gè)性化、良好閱讀體驗(yàn)、知識資產(chǎn)管理、知識再創(chuàng)造需求。
電子技術(shù)與軟件工程 2014年16期2014-10-29
- 基于雙層PDF和Lucene技術(shù)的全文檢索研究與實(shí)現(xiàn)
、創(chuàng)建索引和全文檢索等實(shí)現(xiàn)過程來闡述相關(guān)技術(shù)的研究和運(yùn)用。以建設(shè)全文數(shù)據(jù)庫為基礎(chǔ),研究結(jié)構(gòu)化信息與非結(jié)構(gòu)化數(shù)據(jù)的合并管理,對目錄數(shù)據(jù)和全文數(shù)據(jù)的同步索引,基于Lucene技術(shù),實(shí)現(xiàn)檔案管理系統(tǒng)的一站式智能化檔案全文檢索,提升檔案查全率?!碴P(guān)鍵詞〕雙層PDF;全文檢索;檔案管理;Lucene〔中圖分類號〕TP391〔文獻(xiàn)標(biāo)識碼〕B〔文章編號〕1008-0821(2014)06-0075-04由于檔案的憑證性、惟一性和不可替代性,導(dǎo)致用戶和檔案行業(yè)更注重查全率
現(xiàn)代情報(bào) 2014年6期2014-08-18
- 基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
KySou的全文檢索系統(tǒng)的分析與優(yōu)化肖捷(東莞理工學(xué)院 計(jì)算機(jī)學(xué)院,廣東東莞 523808)全文檢索是基于Web的信息搜索的關(guān)鍵技術(shù),文章從基于KySou的全文檢索系統(tǒng)的實(shí)現(xiàn)機(jī)制入手,深入分析了全文檢索系統(tǒng)的工作原理、系統(tǒng)組成及API接口設(shè)計(jì),并就全文檢索系統(tǒng)的優(yōu)化進(jìn)行探討,包括索引過程優(yōu)化和搜索過程優(yōu)化。KySou;全文檢索;索引優(yōu)化;搜索優(yōu)化全文檢索是一個(gè)非常有效的信息檢索技術(shù),它極大地提高了從海量數(shù)據(jù)中查找特定信息的效率。隨著Internet的飛速發(fā)
東莞理工學(xué)院學(xué)報(bào) 2014年3期2014-07-12
- 基于Lucene的全文檢索管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
ucene的全文檢索管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)何萍 (成都信息工程學(xué)院圖書館,四川成都 610225)李凡 (成都信息工程學(xué)院計(jì)算機(jī)學(xué)院,四川成都 610225)全文檢索是各種信息系統(tǒng)實(shí)現(xiàn)對各種繁多的電子文檔進(jìn)行分析處理的基礎(chǔ),而依賴于數(shù)據(jù)庫的全文檢索功能存在許多局限性。Lucene是一種基于純Java技術(shù)的輕量級的文本索引和查詢引擎,幾乎適合于任何需要全文檢索的應(yīng)用。設(shè)計(jì)了一個(gè)基于Lucene技術(shù)的全文檢索管理系統(tǒng)(id XMS)。全文檢索管理系統(tǒng)(id XMS
長江大學(xué)學(xué)報(bào)(自科版) 2014年22期2014-06-27
- 全文檢索的原理與實(shí)現(xiàn)探討
文主要在介紹全文檢索的概念和原理的基礎(chǔ)上,論述了全文檢索的幾種主要技術(shù),并給出了逆向最大分詞法的具體實(shí)現(xiàn)。〔關(guān)鍵詞〕全文檢索;搜索引擎;中文分詞〔中圖分類號〕TP31 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2009)07-0138-03Discussion on Principle and Implementation of Full Text SearchMan Peng(Computer Center,Changchun Universit
現(xiàn)代情報(bào) 2009年7期2009-10-13
- 用JSP調(diào)用Lucene包來實(shí)現(xiàn)全文檢索
:介紹了實(shí)現(xiàn)全文檢索的三個(gè)組件(Tomcat、JSP、Lucene)對應(yīng)全文檢索系統(tǒng)結(jié)構(gòu).給出了具體實(shí)現(xiàn)的運(yùn)作流程和主要部分的核心代碼及相應(yīng)說明。關(guān)鍵詞:Tomcat+JSP+Lucene運(yùn)作流程核心代碼說明中圖分類號TP311.56文獻(xiàn)標(biāo)識碼B文章編號:1002-2422(2007)03-0029-021Tomcat+JSP+Lvcene1.1Tomcat的Web服務(wù)器Web服務(wù)器是在網(wǎng)絡(luò)中為實(shí)現(xiàn)信息發(fā)布、資料查詢、數(shù)據(jù)處理等諸多應(yīng)用搭建基本平臺的服務(wù)器
智能計(jì)算機(jī)與應(yīng)用 2007年3期2007-07-05
- 古籍電子化與中國古代文史研究
四部叢刊》;全文檢索;數(shù)據(jù)庫[摘要]古籍電子化對中國古代文史研究具有重要意義,目前已出現(xiàn)了文淵閣《四庫全書》電子版原文及全文檢索版等多家古籍電子化工程及數(shù)據(jù)庫,涉及了中國大陸以及香港、臺灣地區(qū)的多家專業(yè)網(wǎng)站,中國大陸的全文檢索版《四庫全書》和《四部叢刊》乃是當(dāng)今世界中國古籍電子化的制高點(diǎn),代表了古籍電子化發(fā)展的正確方向。[中圖分類號]G252.7[文獻(xiàn)標(biāo)識碼]A[文章編號]1671—511X(2004)02—0111—04