亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        通用企業(yè)文檔管理檢索系統(tǒng)研究

        2016-06-30 19:32:45楊柯張道平
        關(guān)鍵詞:全文檢索檢索系統(tǒng)引擎

        楊柯 張道平

        摘 要:用于溝通和記錄的文檔對于企業(yè)是非常重要的,但是企業(yè)在進行文檔管理的過程中,經(jīng)常會碰到以下的問題:文檔數(shù)量多管理困難、分布零散查找緩慢、文檔安全無法保障、文檔無法有效協(xié)作共享。如何有效的管理和高效的利用已有的文檔已經(jīng)成為一個亟待解決的問題。文章動手打造一套企業(yè)內(nèi)部的文檔全文檢索系統(tǒng),來解決以上問題。

        關(guān)鍵詞:企業(yè)內(nèi)部;全文檢索

        中圖分類號:TP315 文獻標識碼:A 文章編號:1006-8937(2016)15-0078-02

        通用企業(yè)文檔管理檢索系統(tǒng)其核心是對文檔的管理和檢索,將零散大量的文檔像構(gòu)建圖書館一樣分門別類的整合到管理系統(tǒng)中,通過對文檔建立的索引來快速高效的查找文檔。以此打破傳統(tǒng)文檔在協(xié)作與分享時存在的壁壘,讓文檔間的溝通和記錄更加自由、實時、安全和高效。

        1 系統(tǒng)功能描述

        文檔的有效管理是實現(xiàn)文檔高效檢索的前提,一個功能完善的文檔管理系統(tǒng)在企業(yè)內(nèi)部就相當于一個小型的文檔云服務(wù)。

        文檔管理系統(tǒng)的基本功能的就是文檔的存儲、下載和預覽,企業(yè)內(nèi)部通過文檔管理系統(tǒng)的唯一入口將零散的文檔傳遞到文檔存儲服務(wù)器來存儲,在用戶需要時為用戶提供文檔預覽和副本的下載功能。

        出于安全考慮,在文檔上傳到文檔存儲服務(wù)器時,系統(tǒng)會對每個文檔做MD5的校驗并為用戶提供原始校驗值以便用戶在下載文檔后確定文檔的完整性。同時MD5信息也會用于文檔管理系統(tǒng)判定用戶上傳的文檔在管理系統(tǒng)中是否重復,防止大量存儲重復的文檔。

        在多部門多層級的企業(yè)內(nèi)部,文檔權(quán)限管理功能確保用戶在使用文檔管理系統(tǒng)時只能檢索、預覽和下載與當前用戶所具有權(quán)限匹配的文檔,這樣能夠有效保證文檔內(nèi)容的安全,防止機密信息的泄露。不同角色和用戶也成為了文檔的一個重要屬性,在檢索過程中能夠根據(jù)不同角色或用戶來篩選文檔。

        文檔在不斷的使用過程中會持續(xù)的進行迭代,傳統(tǒng)的文檔版本管理僅僅局限于在文檔內(nèi)容中添加文檔版本管理表來進行管理,但文檔前后做出的修改難以詳實記錄。在通用企業(yè)文檔管理檢索系統(tǒng)中通過對文檔的版本管理讓文檔的迭代操作更具有實用性。

        那么如何進行文檔的檢索呢?文檔屬于非結(jié)構(gòu)化數(shù)據(jù)(全文數(shù)據(jù)),不能像結(jié)構(gòu)化數(shù)據(jù)那樣簡單的存儲在數(shù)據(jù)庫中進行查詢,一般的檢索系統(tǒng)只是根據(jù)文檔的標題和一些屬性來搜索與結(jié)果相關(guān)的文檔,而真正高效的檢索文檔就要求不能只根據(jù)文檔標題進行檢索,而是需要得到文檔的內(nèi)部信息通過全文檢索(Full-text Search)技術(shù)來檢索文檔。

        全文檢索是指計算機索引程序通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文檔中出現(xiàn)的次數(shù)和位置,當用戶檢索時,檢索程序就根據(jù)事先建立的索引進行查找,并將查找的結(jié)果反饋給用戶的檢索方式。這個過程類似于通過字典中的檢索字表查字的過程。

        通俗的考慮,通過字典的偏旁部首表查找一個生字總會比盲目的翻看整本字典要快。

        為了更快的實現(xiàn)文檔檢索系統(tǒng)我們選用成熟的開源全文檢索引擎——Lucene全文檢索引擎。Lucene是Apache軟件基金會的一個子項目,是一個開放源代碼的全文檢索引擎工具包,它是一個全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎。

        也就是說,Lucene只是一個發(fā)動機,而要讓文檔檢索系統(tǒng)“跑起來”還需要我們?yōu)槠浯蛟炱渌考?/p>

        在建立索引的過程中首先要將源文檔轉(zhuǎn)換為文本信息,然后對文本信息進行具有語義化的分詞后提供給Lucene存儲為能夠進行文本查找的全文檢索庫。

        這樣我們再通過Lucene進行檢索時,Lucene就能根據(jù)詞出現(xiàn)的頻率以及相關(guān)度來提供給我們與結(jié)果最匹配的文檔信息。這里就不在詳細描述Lucene檢索信息的原理。

        2 系統(tǒng)架構(gòu)設(shè)計

        文檔管理檢索系統(tǒng)的功能設(shè)計的體現(xiàn),如圖1所示。圖中包含了一些提高用戶體驗的模塊,比如文檔評分、評論模塊用來收集用戶對文檔的滿意度,文檔操作日志模塊用于記錄文檔發(fā)生任何變化的相關(guān)信息。

        這個產(chǎn)品架構(gòu)功能簡潔,業(yè)務(wù)劃分明確,方便后續(xù)的產(chǎn)品迭代。

        在系統(tǒng)的架構(gòu)設(shè)計方面,為達到用戶靈活多變的檢索需求,系統(tǒng)要充分考慮數(shù)據(jù)的合理組織,各類數(shù)據(jù)方便、有效的輸入,相關(guān)信息的鏈接和處理,檢索功能的設(shè)計,以及信息的提供類型和方式。

        我們根據(jù)系統(tǒng)要實現(xiàn)的功能和最終目標,設(shè)計出全文檢索系統(tǒng)結(jié)構(gòu),整個系統(tǒng)分為五部分:檢索/管理系統(tǒng)、業(yè)務(wù)接口、索引服務(wù)、文檔服務(wù)和文檔預覽服務(wù)。

        在系統(tǒng)設(shè)計上為了提高系統(tǒng)的可重用性和降低系統(tǒng)耦合度,系統(tǒng)整體采用面向服務(wù)的體系結(jié)構(gòu),完全獨立的開發(fā)部署文檔服務(wù)接口、索引接口并遵循Restful設(shè)計原則以便兼容其他系統(tǒng)。如圖2所示。

        3 系統(tǒng)展示

        前期功能很簡單,但隨著需求的增加我們可以將文檔服務(wù)打造成一個獨立的“文檔云服務(wù)”—能夠?qū)悠髽I(yè)其他系統(tǒng)并提供相應(yīng)的文檔管理服務(wù)。

        文檔檢索方面我們需要在系統(tǒng)的使用中不斷優(yōu)化Lucene全文檢索引擎的分詞與檢索功能,增加文檔的相關(guān)屬性以便縮小檢索范圍檢索結(jié)果更精確。如圖3所示。

        4 結(jié) 語

        本文研究的重點是如何有效的管理和高效的利用已有的文檔,通過構(gòu)建通用企業(yè)文檔管理檢索系統(tǒng)使企業(yè)內(nèi)部成員可以輕松地打破文檔交流的壁壘。在全文檢索技術(shù)的幫助下更加精準的鎖定所需的文檔讓企業(yè)內(nèi)部的文檔在分享中更具有價值。

        參考文獻:

        [1] 張儉恭,陳定權(quán).漢字全文檢索系統(tǒng)的關(guān)鍵技術(shù)與實現(xiàn)[J].現(xiàn)代圖書情 報技術(shù),2001,(2).

        [2] 嚴威,趙政.開發(fā)中文搜索引擎漢語處理的關(guān)鍵技術(shù)[J].計算機工程,

        1999,(25).

        猜你喜歡
        全文檢索檢索系統(tǒng)引擎
        收錄《信號處理》的檢索系統(tǒng)及數(shù)據(jù)庫
        信號處理(2018年1期)2018-09-03 07:53:04
        收錄《信號處理》的檢索系統(tǒng)及數(shù)據(jù)庫
        信號處理(2018年5期)2018-06-28 02:16:02
        本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
        信號處理(2018年4期)2018-06-27 03:34:16
        本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
        信號處理(2018年3期)2018-06-27 03:30:18
        藍谷: “涉藍”新引擎
        商周刊(2017年22期)2017-11-09 05:08:31
        Oracle數(shù)據(jù)庫全文檢索性能研究
        無形的引擎
        河南電力(2015年5期)2015-06-08 06:01:46
        基于Cocos2d引擎的PuzzleGame開發(fā)
        基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
        特色數(shù)據(jù)庫全文檢索系統(tǒng)的設(shè)計
        国产h视频在线观看网站免费| 欧洲美女黑人粗性暴交| 好大好深好猛好爽视频免费| 人妻AV无码一区二区三区奥田咲 | 国产成年无码v片在线| 亚洲国产麻豆综合一区| 亚洲天堂av免费在线| 午夜视频国产在线观看| 国产激情久久久久影院老熟女免费| 欧美三级免费网站| 日韩一二三四区免费观看| 国产一区二区三区在线观看完整版 | 久久亚洲私人国产精品va| A午夜精品福利在线| 网红极品女神精品视频在线| 亚洲精品中文字幕视频色| 亚瑟国产精品久久| 天天综合久久| 亚洲一区二区日韩在线| 日本添下边视频全过程| 久久精品国产亚洲av蜜臀| 日韩av一区二区毛片| 国产丝袜美腿一区二区三区| 免费无码精品黄av电影| 99久热re在线精品99 6热视频| 果冻蜜桃传媒在线观看| 国产自产二区三区精品| 亚洲日韩国产精品乱-久| 深夜国产成人福利在线观看女同| 日本高清人妻一区二区| 老妇高潮潮喷到猛进猛出| 每天更新的免费av片在线观看| 精品国产你懂的在线观看| 国语对白在线观看免费| 精品国产一二三产品区别在哪| 国产在线网址| 日韩亚洲一区二区三区在线 | 狼人精品剧情av在线观看| 免费观看羞羞视频网站| 国产精品公开免费视频| 日本伦理视频一区二区|