亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        通用企業(yè)文檔管理檢索系統(tǒng)研究

        2016-06-30 19:32:45楊柯張道平
        關(guān)鍵詞:全文檢索檢索系統(tǒng)引擎

        楊柯 張道平

        摘 要:用于溝通和記錄的文檔對(duì)于企業(yè)是非常重要的,但是企業(yè)在進(jìn)行文檔管理的過(guò)程中,經(jīng)常會(huì)碰到以下的問(wèn)題:文檔數(shù)量多管理困難、分布零散查找緩慢、文檔安全無(wú)法保障、文檔無(wú)法有效協(xié)作共享。如何有效的管理和高效的利用已有的文檔已經(jīng)成為一個(gè)亟待解決的問(wèn)題。文章動(dòng)手打造一套企業(yè)內(nèi)部的文檔全文檢索系統(tǒng),來(lái)解決以上問(wèn)題。

        關(guān)鍵詞:企業(yè)內(nèi)部;全文檢索

        中圖分類(lèi)號(hào):TP315 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8937(2016)15-0078-02

        通用企業(yè)文檔管理檢索系統(tǒng)其核心是對(duì)文檔的管理和檢索,將零散大量的文檔像構(gòu)建圖書(shū)館一樣分門(mén)別類(lèi)的整合到管理系統(tǒng)中,通過(guò)對(duì)文檔建立的索引來(lái)快速高效的查找文檔。以此打破傳統(tǒng)文檔在協(xié)作與分享時(shí)存在的壁壘,讓文檔間的溝通和記錄更加自由、實(shí)時(shí)、安全和高效。

        1 系統(tǒng)功能描述

        文檔的有效管理是實(shí)現(xiàn)文檔高效檢索的前提,一個(gè)功能完善的文檔管理系統(tǒng)在企業(yè)內(nèi)部就相當(dāng)于一個(gè)小型的文檔云服務(wù)。

        文檔管理系統(tǒng)的基本功能的就是文檔的存儲(chǔ)、下載和預(yù)覽,企業(yè)內(nèi)部通過(guò)文檔管理系統(tǒng)的唯一入口將零散的文檔傳遞到文檔存儲(chǔ)服務(wù)器來(lái)存儲(chǔ),在用戶(hù)需要時(shí)為用戶(hù)提供文檔預(yù)覽和副本的下載功能。

        出于安全考慮,在文檔上傳到文檔存儲(chǔ)服務(wù)器時(shí),系統(tǒng)會(huì)對(duì)每個(gè)文檔做MD5的校驗(yàn)并為用戶(hù)提供原始校驗(yàn)值以便用戶(hù)在下載文檔后確定文檔的完整性。同時(shí)MD5信息也會(huì)用于文檔管理系統(tǒng)判定用戶(hù)上傳的文檔在管理系統(tǒng)中是否重復(fù),防止大量存儲(chǔ)重復(fù)的文檔。

        在多部門(mén)多層級(jí)的企業(yè)內(nèi)部,文檔權(quán)限管理功能確保用戶(hù)在使用文檔管理系統(tǒng)時(shí)只能檢索、預(yù)覽和下載與當(dāng)前用戶(hù)所具有權(quán)限匹配的文檔,這樣能夠有效保證文檔內(nèi)容的安全,防止機(jī)密信息的泄露。不同角色和用戶(hù)也成為了文檔的一個(gè)重要屬性,在檢索過(guò)程中能夠根據(jù)不同角色或用戶(hù)來(lái)篩選文檔。

        文檔在不斷的使用過(guò)程中會(huì)持續(xù)的進(jìn)行迭代,傳統(tǒng)的文檔版本管理僅僅局限于在文檔內(nèi)容中添加文檔版本管理表來(lái)進(jìn)行管理,但文檔前后做出的修改難以詳實(shí)記錄。在通用企業(yè)文檔管理檢索系統(tǒng)中通過(guò)對(duì)文檔的版本管理讓文檔的迭代操作更具有實(shí)用性。

        那么如何進(jìn)行文檔的檢索呢?文檔屬于非結(jié)構(gòu)化數(shù)據(jù)(全文數(shù)據(jù)),不能像結(jié)構(gòu)化數(shù)據(jù)那樣簡(jiǎn)單的存儲(chǔ)在數(shù)據(jù)庫(kù)中進(jìn)行查詢(xún),一般的檢索系統(tǒng)只是根據(jù)文檔的標(biāo)題和一些屬性來(lái)搜索與結(jié)果相關(guān)的文檔,而真正高效的檢索文檔就要求不能只根據(jù)文檔標(biāo)題進(jìn)行檢索,而是需要得到文檔的內(nèi)部信息通過(guò)全文檢索(Full-text Search)技術(shù)來(lái)檢索文檔。

        全文檢索是指計(jì)算機(jī)索引程序通過(guò)掃描文章中的每一個(gè)詞,對(duì)每一個(gè)詞建立一個(gè)索引,指明該詞在文檔中出現(xiàn)的次數(shù)和位置,當(dāng)用戶(hù)檢索時(shí),檢索程序就根據(jù)事先建立的索引進(jìn)行查找,并將查找的結(jié)果反饋給用戶(hù)的檢索方式。這個(gè)過(guò)程類(lèi)似于通過(guò)字典中的檢索字表查字的過(guò)程。

        通俗的考慮,通過(guò)字典的偏旁部首表查找一個(gè)生字總會(huì)比盲目的翻看整本字典要快。

        為了更快的實(shí)現(xiàn)文檔檢索系統(tǒng)我們選用成熟的開(kāi)源全文檢索引擎——Lucene全文檢索引擎。Lucene是Apache軟件基金會(huì)的一個(gè)子項(xiàng)目,是一個(gè)開(kāi)放源代碼的全文檢索引擎工具包,它是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢(xún)引擎和索引引擎,部分文本分析引擎。

        也就是說(shuō),Lucene只是一個(gè)發(fā)動(dòng)機(jī),而要讓文檔檢索系統(tǒng)“跑起來(lái)”還需要我們?yōu)槠浯蛟炱渌考?/p>

        在建立索引的過(guò)程中首先要將源文檔轉(zhuǎn)換為文本信息,然后對(duì)文本信息進(jìn)行具有語(yǔ)義化的分詞后提供給Lucene存儲(chǔ)為能夠進(jìn)行文本查找的全文檢索庫(kù)。

        這樣我們?cè)偻ㄟ^(guò)Lucene進(jìn)行檢索時(shí),Lucene就能根據(jù)詞出現(xiàn)的頻率以及相關(guān)度來(lái)提供給我們與結(jié)果最匹配的文檔信息。這里就不在詳細(xì)描述Lucene檢索信息的原理。

        2 系統(tǒng)架構(gòu)設(shè)計(jì)

        文檔管理檢索系統(tǒng)的功能設(shè)計(jì)的體現(xiàn),如圖1所示。圖中包含了一些提高用戶(hù)體驗(yàn)的模塊,比如文檔評(píng)分、評(píng)論模塊用來(lái)收集用戶(hù)對(duì)文檔的滿(mǎn)意度,文檔操作日志模塊用于記錄文檔發(fā)生任何變化的相關(guān)信息。

        這個(gè)產(chǎn)品架構(gòu)功能簡(jiǎn)潔,業(yè)務(wù)劃分明確,方便后續(xù)的產(chǎn)品迭代。

        在系統(tǒng)的架構(gòu)設(shè)計(jì)方面,為達(dá)到用戶(hù)靈活多變的檢索需求,系統(tǒng)要充分考慮數(shù)據(jù)的合理組織,各類(lèi)數(shù)據(jù)方便、有效的輸入,相關(guān)信息的鏈接和處理,檢索功能的設(shè)計(jì),以及信息的提供類(lèi)型和方式。

        我們根據(jù)系統(tǒng)要實(shí)現(xiàn)的功能和最終目標(biāo),設(shè)計(jì)出全文檢索系統(tǒng)結(jié)構(gòu),整個(gè)系統(tǒng)分為五部分:檢索/管理系統(tǒng)、業(yè)務(wù)接口、索引服務(wù)、文檔服務(wù)和文檔預(yù)覽服務(wù)。

        在系統(tǒng)設(shè)計(jì)上為了提高系統(tǒng)的可重用性和降低系統(tǒng)耦合度,系統(tǒng)整體采用面向服務(wù)的體系結(jié)構(gòu),完全獨(dú)立的開(kāi)發(fā)部署文檔服務(wù)接口、索引接口并遵循Restful設(shè)計(jì)原則以便兼容其他系統(tǒng)。如圖2所示。

        3 系統(tǒng)展示

        前期功能很簡(jiǎn)單,但隨著需求的增加我們可以將文檔服務(wù)打造成一個(gè)獨(dú)立的“文檔云服務(wù)”—能夠?qū)悠髽I(yè)其他系統(tǒng)并提供相應(yīng)的文檔管理服務(wù)。

        文檔檢索方面我們需要在系統(tǒng)的使用中不斷優(yōu)化Lucene全文檢索引擎的分詞與檢索功能,增加文檔的相關(guān)屬性以便縮小檢索范圍檢索結(jié)果更精確。如圖3所示。

        4 結(jié) 語(yǔ)

        本文研究的重點(diǎn)是如何有效的管理和高效的利用已有的文檔,通過(guò)構(gòu)建通用企業(yè)文檔管理檢索系統(tǒng)使企業(yè)內(nèi)部成員可以輕松地打破文檔交流的壁壘。在全文檢索技術(shù)的幫助下更加精準(zhǔn)的鎖定所需的文檔讓企業(yè)內(nèi)部的文檔在分享中更具有價(jià)值。

        參考文獻(xiàn):

        [1] 張儉恭,陳定權(quán).漢字全文檢索系統(tǒng)的關(guān)鍵技術(shù)與實(shí)現(xiàn)[J].現(xiàn)代圖書(shū)情 報(bào)技術(shù),2001,(2).

        [2] 嚴(yán)威,趙政.開(kāi)發(fā)中文搜索引擎漢語(yǔ)處理的關(guān)鍵技術(shù)[J].計(jì)算機(jī)工程,

        1999,(25).

        猜你喜歡
        全文檢索檢索系統(tǒng)引擎
        收錄《信號(hào)處理》的檢索系統(tǒng)及數(shù)據(jù)庫(kù)
        收錄《信號(hào)處理》的檢索系統(tǒng)及數(shù)據(jù)庫(kù)
        本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫(kù)收錄
        本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫(kù)收錄
        藍(lán)谷: “涉藍(lán)”新引擎
        商周刊(2017年22期)2017-11-09 05:08:31
        Oracle數(shù)據(jù)庫(kù)全文檢索性能研究
        無(wú)形的引擎
        河南電力(2015年5期)2015-06-08 06:01:46
        基于Cocos2d引擎的PuzzleGame開(kāi)發(fā)
        基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
        特色數(shù)據(jù)庫(kù)全文檢索系統(tǒng)的設(shè)計(jì)
        国产成人小视频| 亚洲国产成人av第一二三区| 丝袜美腿亚洲综合在线播放| 欧美性生交大片免费看app麻豆| 国产二级一片内射视频插放| 青青视频一区| 蜜桃av夺取一区二区三区| 91一区二区三区在线观看视频| 超碰97人人射妻| 国产微拍精品一区二区| 国产欧美久久久精品影院| 日韩一二三四区在线观看| 国产免码va在线观看免费| 精品国产乱码久久久软件下载 | 91精彩视频在线观看| 中文字幕av人妻一区二区| 亚洲一区二区三区中文字幕网| 亚洲精品国产美女久久久| 国产精品片211在线观看| 国产一区二区三区视频了| 国产精品国产三级国产av18| 亚洲av无码一区二区乱孑伦as| 亚洲国产一区二区三区网| 中文字幕一区二区三区精品在线| 亚洲女人毛茸茸粉红大阴户传播| 亚洲成av人片一区二区| 久久国产综合精品欧美| 亚洲日本中文字幕乱码| 女人被男人爽到呻吟的视频| 成人片黄网站色大片免费观看app 亚洲av无码专区亚洲av | 国产午夜成人av在线播放| 日韩毛片在线看| 久久天堂精品一区专区av| 成人免费播放视频777777| a级国产乱理论片在线观看| 538亚洲欧美国产日韩在线精品| 国产三级精品三级在线专区2| 国产在线 | 中文| 午夜亚洲AV成人无码国产| 中文字幕亚洲高清精品一区在线| 亚洲av成人无遮挡网站在线观看|