亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于配置管理與Lucene 全文檢索的企業(yè)知識(shí)系統(tǒng)應(yīng)用研究

        2020-07-07 06:07:52趙慧杰魏永啟姜進(jìn)成
        山東煤炭科技 2020年6期
        關(guān)鍵詞:全文檢索資料庫(kù)煤業(yè)

        趙慧杰 魏永啟 姜進(jìn)成

        (1.兗州煤業(yè)股份有限公司,山東 濟(jì)寧 273500;2.兗礦集團(tuán)有限公司信息化中心,山東 濟(jì)寧 273500)

        1 技術(shù)資料管理現(xiàn)狀

        1.1 礦企信息化程度不高

        煤礦企業(yè)管理者沒(méi)有掌握豐富的信息化理論,企業(yè)內(nèi)缺乏先進(jìn)的信息化設(shè)備,信息化設(shè)備的應(yīng)用還停留在初級(jí)階段。煤礦企業(yè)的辦公室內(nèi)并未實(shí)現(xiàn)人手一臺(tái)電腦,資料的整理和存儲(chǔ)多通過(guò)資料柜來(lái)實(shí)現(xiàn),大量堆放的資料導(dǎo)致文件不方便查閱,加劇了企業(yè)的管理難度,各個(gè)煤礦的信息化建設(shè)嚴(yán)重受阻。

        1.2 技術(shù)資料“孤島”現(xiàn)象

        在煤業(yè)公司日常管理中不難發(fā)現(xiàn),下屬煤礦企業(yè)各大部門(mén)尚未制定出科學(xué)的資料管理機(jī)制,在各項(xiàng)業(yè)務(wù)的開(kāi)展中使用了不同的信息系統(tǒng),由于銜接性不強(qiáng)以致于辦公效率不高,且增加了整個(gè)煤礦的運(yùn)營(yíng)成本。

        1.3 檢索手段單一

        在當(dāng)前所創(chuàng)建與實(shí)施的文件系統(tǒng)中,檢索指的是文件的名稱。在檢索的過(guò)程中一些制式文件的命名都會(huì)被批次量地檢索出來(lái),在實(shí)際的查閱過(guò)程中是極不方便的。盡管大部分系統(tǒng)都設(shè)置了檢索要求,如創(chuàng)作者、建立的時(shí)間等,但是也無(wú)法從根本上提升檢索的效率。

        2 以LUCENE 技術(shù)實(shí)現(xiàn)企業(yè)文檔全文檢索技術(shù)

        Lucene 并非是一個(gè)全文檢索引擎,而是一個(gè)開(kāi)放源代碼的全文檢索引擎工具包,是由Apache 軟件基金會(huì)創(chuàng)建的子項(xiàng)目,具備索引和查詢等功能。Lucene 提供的這個(gè)實(shí)用性較強(qiáng)的工具包,主要是便于目標(biāo)系統(tǒng)發(fā)揮全文檢索的功能。Lucene 所提供的應(yīng)用程式接口,具有強(qiáng)大的搜尋功能。在開(kāi)發(fā)Java的過(guò)程中,Lucene 這一工具的開(kāi)源代碼并不收費(fèi)。

        google,baidu 等搜索引擎所建立的索引庫(kù)主要使用的是超鏈分析技術(shù)、關(guān)鍵詞檢索技術(shù)等,與煤礦生產(chǎn)標(biāo)準(zhǔn)相比這些技術(shù)并不達(dá)標(biāo)。所以,要在結(jié)合上述技術(shù)的基礎(chǔ)上,綜合聯(lián)系煤業(yè)公司的行業(yè)性質(zhì)及文檔中檢索技術(shù)的使用狀況,從而深入地研究聯(lián)想、查找或拆分關(guān)鍵詞的相關(guān)方法,最終實(shí)現(xiàn)公司內(nèi)部檢索技術(shù)的優(yōu)化與升級(jí)。

        2000 年,Doug Cutting 在結(jié)合Java 的基礎(chǔ)上正式開(kāi)發(fā)了Lucene 這種信息搜索庫(kù),其性能卓越,伸縮性強(qiáng)。

        Lucene 以倒排表為參考依據(jù),能夠在較短的時(shí)間內(nèi)快速地找到文本。在底層通過(guò)分段式存儲(chǔ),可讓其在讀寫(xiě)的過(guò)程中避免鎖的產(chǎn)生,優(yōu)化了讀寫(xiě)的功能。

        (1)Lucene 的底層存儲(chǔ)格式

        Lucene 的底層存儲(chǔ)格式如下圖1 所示,其是由兩大部分構(gòu)成,具體是:詞典、倒排序。前者為T(mén)erm 的集合,而后者則是詞典中的 Term 指向的文檔鏈表的集合。對(duì)于 Lucene 來(lái)說(shuō),這兩大數(shù)據(jù)結(jié)構(gòu)具有十分重要的作用,是實(shí)現(xiàn)高效檢索的前提條件。

        詞典和倒排表的存儲(chǔ)并非是一起的,而是分開(kāi)進(jìn)行。在倒排表中所存儲(chǔ)的信息內(nèi)容包括文件名、文件的位置等。

        在詞典中只要找到Term,Lucene 的查找就成功了一半,之后結(jié)合 Term 可得到文檔鏈表,而按照查詢要求操作鏈表,能夠獲得所需的內(nèi)容。

        圖1 Lucene 的底層存儲(chǔ)格式示意圖

        (2)Lucene 讀寫(xiě)流程

        圖2 為L(zhǎng)ucene 讀寫(xiě)流程示意圖,虛線箭頭代表的是寫(xiě)索引的流程,實(shí)線箭頭代表查詢的流程。

        圖2 Lucene 讀寫(xiě)流程示意圖

        3 基于配置管理與Lucene 全文檢索的企業(yè)知識(shí)系統(tǒng)

        (1)集中的文檔存儲(chǔ)

        煤業(yè)公司為職員提供一個(gè)統(tǒng)一的文檔存儲(chǔ)庫(kù),以實(shí)現(xiàn)對(duì)文檔的分類(lèi)整理和備份。平臺(tái)的文件管理系統(tǒng)還可以為其他業(yè)務(wù)系統(tǒng)的合并提供重要的支撐,同時(shí)還可統(tǒng)一管理煤業(yè)公司其他業(yè)務(wù)系統(tǒng)所產(chǎn)生的數(shù)據(jù)。

        (2)靈活的技術(shù)文檔修訂與審批流程

        在編輯好技術(shù)文檔以后,需結(jié)合兗礦的管理制度要求來(lái)簽收、審核與保存。文檔需現(xiàn)在持有者發(fā)起會(huì)簽,之后由相關(guān)人員來(lái)進(jìn)行審批。文檔管理系統(tǒng)可自動(dòng)使用IM,以高效地展開(kāi)具體業(yè)務(wù)。

        (3)文檔歸檔

        在編寫(xiě)文檔和修訂文檔的工作完成以后,煤業(yè)公司員工可結(jié)合相關(guān)要求或原則對(duì)其進(jìn)行歸檔處理。文件歸檔即針對(duì)文檔中的不同內(nèi)容,如設(shè)計(jì)指標(biāo)、正文的內(nèi)容、記錄的日志等都設(shè)置為合理有效的歸檔格式。該格式準(zhǔn)許員工們查看文檔的數(shù)據(jù)信息等。而在與其他檔案管理系統(tǒng)完全對(duì)接后,各員工能夠在自己的權(quán)限范圍內(nèi)對(duì)文檔進(jìn)行相關(guān)操作。

        (4)方便的文檔分類(lèi)、瀏覽、查詢

        在統(tǒng)一的文檔存儲(chǔ)系統(tǒng)被成功創(chuàng)建之后,系統(tǒng)依照不同的要求或標(biāo)準(zhǔn),如文檔建立的時(shí)間、企業(yè)的框構(gòu)、文件的種類(lèi)等來(lái)詳細(xì)具體地劃分每個(gè)文檔的類(lèi)型。當(dāng)煤業(yè)公司儲(chǔ)存了豐富的文檔之后,要想提升信息的質(zhì)量與價(jià)值,最為關(guān)鍵的是如何能夠讓公司員工在最短的時(shí)間內(nèi)找到所需的文件。平臺(tái)可以讓公司員工特別是對(duì)技術(shù)文檔需求頻繁的技術(shù)人員借助檢索功能來(lái)搜索不同類(lèi)型的文檔,如:Office、PDF 等類(lèi)別文檔,可大大縮短文檔搜索的時(shí)間,也可為公司員工帶來(lái)良好的體驗(yàn)感。

        (5)版本管理

        在歸檔工作結(jié)束之前,每份文檔都會(huì)被修訂,每次修訂完成后的文檔都會(huì)覆蓋住上一個(gè)文檔。為了讓公司員工看到上一次的修改內(nèi)容,避免修改不當(dāng)而帶來(lái)不必要的損失,文檔管理系統(tǒng)會(huì)將不同版本的文檔內(nèi)容進(jìn)行自行保存。在員工對(duì)文檔的內(nèi)容予以修改時(shí),系統(tǒng)會(huì)自動(dòng)存儲(chǔ),而不是直接將原來(lái)的版本從電腦中刪除,這主要是為了方便后期的查閱。

        (6)文檔權(quán)限保護(hù)(正式發(fā)布簽入以后,詢問(wèn)權(quán)限,并將共享的范圍明確出來(lái))

        煤業(yè)公司信息安全建設(shè)中,最關(guān)鍵的部分則為防范尚未通過(guò)授權(quán)的用戶訪問(wèn)敏感內(nèi)容。在文檔管理系統(tǒng)中,賦予了對(duì)應(yīng)操作權(quán)限的員工可對(duì)文檔進(jìn)行閱讀、修改、審批、刪除等,同時(shí)負(fù)責(zé)管理的技術(shù)人員借助預(yù)先設(shè)置的權(quán)限模板,能夠?yàn)槟澄臋n在使用的過(guò)程中賦予對(duì)應(yīng)的權(quán)限。除了避免尚未通過(guò)權(quán)限審核的員工閱讀文檔內(nèi)容,對(duì)文檔的保護(hù)還應(yīng)進(jìn)行的操作有禁止復(fù)印、修改等,除此以外,還可使文檔具有閱讀時(shí)間限制。

        (7)鎖定機(jī)制

        在統(tǒng)一的文檔存儲(chǔ)中心保存企業(yè)的文檔資料后,必然會(huì)出現(xiàn)在同一時(shí)間內(nèi)不同員工對(duì)相同一篇文檔進(jìn)行編輯、修改等,而該種操作會(huì)帶來(lái)的不良影響是:增加了文檔丟失的風(fēng)險(xiǎn)性;極易損害文檔內(nèi)容的完整性。為了保證文檔的質(zhì)量,對(duì)于不同員工同時(shí)編輯同一篇文檔的現(xiàn)象要進(jìn)行有效的規(guī)避。若當(dāng)前文檔已經(jīng)由某個(gè)技術(shù)人員在編輯,那么其他員工則不得進(jìn)行其他方面的操作,此時(shí)其權(quán)限僅局限于文檔的打開(kāi)和閱讀。

        (8)完整的文檔操作日志

        煤業(yè)公司員工在操作文檔資料的過(guò)程中,如查閱文檔、修改資料、審核文檔中的部分內(nèi)容、刪除沒(méi)有價(jià)值的信息等,都需管理系統(tǒng)將操作的文檔完整地記錄下來(lái)。文檔系統(tǒng)管理人員可隨時(shí)查閱到所有文檔的記錄情況。

        (9)全文檢索

        煤業(yè)公司內(nèi)很多有利用價(jià)值的信息資源基本都被存儲(chǔ)在不同的文檔中,當(dāng)然還有部分被放在之前建成的各信息化系統(tǒng)的數(shù)據(jù)庫(kù)內(nèi),可以說(shuō)該類(lèi)資源體現(xiàn)了煤業(yè)公司的管理方式、財(cái)務(wù)運(yùn)行狀況及其商業(yè)策略等。為了使其得到最大程度的利用,則需進(jìn)行科學(xué)、合理的管理,并在此基礎(chǔ)上為公司構(gòu)建成熟、先進(jìn)的數(shù)據(jù)搜索系統(tǒng),從而將存放在不同應(yīng)用系統(tǒng)中的信息得到充分的挖掘與開(kāi)發(fā)。借助該信息系統(tǒng),文件的掃描工作可自行操作完成,之后便可對(duì)關(guān)鍵詞進(jìn)行拆分與檢索結(jié)果的排列,有助于企業(yè)快速地查閱文件,提升整體的技術(shù)管理水平,避免了信息資源的浪費(fèi),降低了公司的運(yùn)營(yíng)成本,實(shí)現(xiàn)了多方系統(tǒng)的有效整合。檢索系統(tǒng)在實(shí)際使用中應(yīng)支持的功能具體歸納為以下幾點(diǎn):

        ① 關(guān)鍵字檢索

        在文本框內(nèi)直接輸入關(guān)鍵詞即可檢索到相應(yīng)的文檔。

        ② 自然語(yǔ)言檢索

        針對(duì)查詢條件,用戶以常用語(yǔ)進(jìn)行概述,一句話、一個(gè)大的段落,搜索引擎檢索后呈現(xiàn)出有關(guān)內(nèi)容。

        4 兗礦煤業(yè)公司各級(jí)技術(shù)資料庫(kù)的應(yīng)用

        (1)共用資料庫(kù)

        可服務(wù)整個(gè)礦上的技術(shù)員,結(jié)合關(guān)鍵詞進(jìn)行檢索,系統(tǒng)會(huì)為使用者匹配對(duì)應(yīng)的文檔。

        (2)煤業(yè)公司級(jí)資料庫(kù)

        服務(wù)公司不同部門(mén),可查閱內(nèi)部的技術(shù)資料。

        (3)煤礦級(jí)資料庫(kù)

        以礦為單位實(shí)現(xiàn)技術(shù)資料的共享,礦內(nèi)不同機(jī)構(gòu)或職員可翻閱。

        (4)部門(mén)級(jí)資料庫(kù)

        按部門(mén)來(lái)實(shí)現(xiàn)資料共享。

        (5)項(xiàng)目級(jí)資料庫(kù)

        可跨越不同的組織亦或是不同的技術(shù)專(zhuān)長(zhǎng)來(lái)統(tǒng)一構(gòu)建資料共享庫(kù),對(duì)于群里的成員,可交由負(fù)責(zé)人進(jìn)行嚴(yán)格的監(jiān)督與管理,在此基礎(chǔ)上,為其明確地劃分權(quán)限與職責(zé)。在整個(gè)項(xiàng)目的任務(wù)完成以后,可依照分類(lèi)原則將其詳細(xì)地劃分,并歸集到各部門(mén)的資料庫(kù)中。如煤礦在設(shè)計(jì)作業(yè)流程的過(guò)程中,主管人員可在群組內(nèi)添加其他專(zhuān)業(yè)的人員,且在明確劃分不同任務(wù)的情況下本著相互合作的理念共同完成工作目標(biāo)。

        (6)個(gè)人資料庫(kù)

        技術(shù)人員可對(duì)自身的知識(shí)分類(lèi)進(jìn)行保護(hù),同時(shí)可關(guān)注其他方面的內(nèi)容。系統(tǒng)主要分兩個(gè)端口,包括手機(jī)端和電腦端,為攜帶技術(shù)資料帶來(lái)了諸多的便利,另外也有效地避免了資料的外泄。

        5 結(jié) 語(yǔ)

        Lucien 全文檢索的企業(yè)知識(shí)信息系統(tǒng)在煤礦企業(yè)中與生產(chǎn)技術(shù)有效地銜接在一起,借助信息共享,提升整個(gè)技術(shù)管理水平,實(shí)現(xiàn)不同信息內(nèi)容的全面共享。從2018 年1 月,煤礦企業(yè)正式將該系統(tǒng)投入到實(shí)際應(yīng)用中,該年內(nèi)部資料、科研成果、公共資料等分別為6870 條、807 條、604 條等,不僅減少了紙張的使用量,節(jié)約了資源與經(jīng)營(yíng)的成本,而且還提升了信息技術(shù)的創(chuàng)新水平。

        猜你喜歡
        全文檢索資料庫(kù)煤業(yè)
        基于內(nèi)容與協(xié)同過(guò)濾的GitHub學(xué)習(xí)資料庫(kù)推薦
        河南平寶煤業(yè)有限公司
        國(guó)家社科基金重大項(xiàng)目“‘古今字’資料庫(kù)建設(shè)與相關(guān)專(zhuān)題研究”成果鑒定會(huì)順利召開(kāi)
        施工企業(yè)技術(shù)資料庫(kù)的建立與完善
        天津科技(2020年5期)2020-01-08 12:27:35
        Oracle數(shù)據(jù)庫(kù)全文檢索性能研究
        新形勢(shì)下對(duì)煤業(yè)安全管理工作的思考
        基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
        華亭煤業(yè)超前支護(hù)液壓支架投用
        均壓技術(shù)在新安煤業(yè)有限公司的實(shí)踐應(yīng)用
        河南科技(2014年19期)2014-02-27 14:15:31
        特色數(shù)據(jù)庫(kù)全文檢索系統(tǒng)的設(shè)計(jì)
        一区两区三区视频在线观看| 国产专区亚洲专区久久| 亚洲日本一区二区三区四区| 国产精品免费无遮挡无码永久视频| 97在线观看| 精品亚洲午夜久久久久| 色佬易精品视频免费在线观看| 国产一区二区三区四色av| 一区二区三区国产| 国产高清无码在线| 婷婷色在线视频中文字幕| 亚洲一区二区三区中文字幕网| 亚洲国产日韩精品一区二区三区| 国产精品6| 成人国产自拍在线播放| 在线观看国产成人自拍视频| 国产男女免费完整视频| 日本a天堂| 国模一区二区三区白浆| 久久精品人妻少妇一二三区| 亚洲人成网址在线播放| 亚洲成av人片无码不卡播放器| 成人免费播放片高清在线观看| 国产自拍精品一区在线观看| 国产精品无码成人午夜电影 | 日本乱偷人妻中文字幕| 国内少妇自拍区免费视频| 青青草国内视频在线观看| 所有视频在线观看免费| 成人综合婷婷国产精品久久蜜臀| 亚洲精品亚洲人成在线下载| 国产91九色免费视频| 国产无套粉嫩白浆在线| 国产真人无遮挡作爱免费视频 | 久久人妻av一区二区软件| 好大好硬好爽免费视频| 久久久2019精品视频中文字幕| 成人大片免费观看视频| 日韩欧群交p片内射中文| 久久中文字幕日韩无码视频| 日本av不卡一区二区三区|