亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于知識(shí)工程的文檔服務(wù)創(chuàng)新探索

        2022-03-31 01:21:40詹超銘李锘雯
        中國(guó)核電 2022年6期

        詹超銘,李锘雯

        (中核國(guó)電漳州能源有限公司,福建 漳州 363300)

        2021年7月6日, 習(xí)近平總書記對(duì)檔案工作作出了“四好”“兩服務(wù)”的重要批示。筆者作為核電從業(yè)者, 10余年深耕核電檔案工作, 深以為“四好”是基礎(chǔ),“兩服務(wù)”是目的,新時(shí)代的文檔服務(wù)不僅要能發(fā)揮檔案的憑證作用,更要發(fā)揮檔案的參考作用,給組織和個(gè)人呈現(xiàn)文檔中的內(nèi)容、 提供文檔中的知識(shí),更好的服務(wù)于公司發(fā)展和人才培養(yǎng),使檔案工作真正的“存史資政育人”。

        1 文檔服務(wù)現(xiàn)狀調(diào)查和創(chuàng)新分析

        1.1 文檔服務(wù)現(xiàn)狀調(diào)查

        通常來(lái)說(shuō),各行各業(yè)文檔部門的主要職責(zé)都是做好業(yè)務(wù)形成文檔的收、管、存、用,但實(shí)際上,大多數(shù)行業(yè)的文檔部門只做好了文檔的收、管、存,沒(méi)做好文檔的用,主要是因?yàn)閭鹘y(tǒng)的文檔服務(wù)是一個(gè)從文檔管理端到文檔服務(wù)端的過(guò)程,文檔部門在進(jìn)行文檔管理系統(tǒng)開(kāi)發(fā)時(shí)關(guān)注重點(diǎn)在于如何做好文檔管理,沒(méi)有充分考慮用戶的需求,沒(méi)有從頂層的規(guī)劃、場(chǎng)景的需求、應(yīng)用的方式和服務(wù)的成效進(jìn)行系統(tǒng)性思考,從而導(dǎo)致文檔服務(wù)的能力不足、水平不高,如圖1所示。

        究其根本原因,主要有以下兩方面因素:

        (1)文檔管理和業(yè)務(wù)活動(dòng)相互隔離

        在各行各業(yè)的業(yè)務(wù)活動(dòng)中,文檔業(yè)務(wù)環(huán)節(jié)基本上都處于業(yè)務(wù)流程的末端,業(yè)務(wù)部門和文檔部門職責(zé)邊界比較清晰,文檔部門很少提前介入業(yè)務(wù)過(guò)程。

        圖1 傳統(tǒng)文檔服務(wù)的困境Fig.1 The dilemma of traditional document service

        (2)文檔管理和服務(wù)主客觀不統(tǒng)一

        文檔管理的主體是文檔人員,而文檔服務(wù)的對(duì)象是業(yè)務(wù)人員,在這種情況下,文檔人員很容易陷入主客觀不統(tǒng)一的陷阱,僅從文檔管理的角度思考后續(xù)的文檔服務(wù)。

        1.2 文檔服務(wù)創(chuàng)新分析

        近些年,中核集團(tuán)持續(xù)推進(jìn)系統(tǒng)工程理論學(xué)習(xí)與研討,核電文檔管理不應(yīng)在局限于竣工資料管理、設(shè)備檔案管理以及相關(guān)的驗(yàn)收活動(dòng)中,而應(yīng)運(yùn)用系統(tǒng)思維,以核電大數(shù)據(jù)為主,深入挖掘信息資源,靈活運(yùn)用信息技術(shù)來(lái)彌補(bǔ)以往文檔工作中數(shù)據(jù)缺失的不足和弊端,從而提升文檔管理工作效率和質(zhì)量[1]。因此,文檔部門在開(kāi)發(fā)文檔管理系統(tǒng)時(shí)應(yīng)進(jìn)行系統(tǒng)性思考,摒棄主觀思維,通過(guò)分析用戶產(chǎn)生需求的客觀場(chǎng)景,見(jiàn)表1,應(yīng)用信息技術(shù)設(shè)計(jì)滿足用戶需求的目標(biāo)場(chǎng)景,從而構(gòu)建客觀場(chǎng)景到目標(biāo)場(chǎng)景的價(jià)值實(shí)現(xiàn)以及目標(biāo)場(chǎng)景到客觀場(chǎng)景的價(jià)值反饋的良性循環(huán),持續(xù)改進(jìn)和提升文檔服務(wù)能力和水平。

        表1 案例客觀場(chǎng)景分析

        通過(guò)這兩個(gè)案例的客觀場(chǎng)景分析,可以總結(jié)出一個(gè)業(yè)務(wù)邏輯:用戶想要通過(guò)文檔管理系統(tǒng)查詢所需內(nèi)容,通常需要通過(guò)四個(gè)步驟:確定關(guān)鍵詞和文件類型、進(jìn)行檢索、尋找目標(biāo)文件、查找所需內(nèi)容。

        對(duì)這兩個(gè)案例的目標(biāo)場(chǎng)景進(jìn)行分析見(jiàn)表2。

        表2 案例目標(biāo)場(chǎng)景分析Table 2 Case target scenario analysis

        通過(guò)這兩個(gè)案例的目標(biāo)場(chǎng)景分析,可以推理出一個(gè)文檔服務(wù)概念(如圖2所示):用戶想要通過(guò)文檔管理系統(tǒng)查詢文檔中某一個(gè)知識(shí)點(diǎn),文檔管理系統(tǒng)應(yīng)直接告知用戶該知識(shí)點(diǎn)的內(nèi)容。

        圖2 客觀場(chǎng)景與目標(biāo)場(chǎng)景的價(jià)值循環(huán)Fig.2 Value cycle between objective and target scenarios

        通過(guò)以上兩個(gè)案例分析客觀場(chǎng)景和目標(biāo)場(chǎng)景的差異,不難得到一個(gè)結(jié)論:知識(shí)型文檔服務(wù)可以有效減少用戶查詢步驟、提高文檔服務(wù)效率。因此,知識(shí)型文檔服務(wù)是新時(shí)代文檔服務(wù)的一個(gè)創(chuàng)新方向,文檔部門可以將知識(shí)工程理論體系與文檔管理進(jìn)行融合,通過(guò)文檔知識(shí)工程指導(dǎo)文檔服務(wù)的創(chuàng)新和實(shí)踐,從而實(shí)現(xiàn)客觀場(chǎng)景到目標(biāo)場(chǎng)景的場(chǎng)景轉(zhuǎn)變。

        2 知識(shí)工程理論體系的應(yīng)用

        核電廠的文檔部門存有海量的文檔資源,這些文檔資源中隱含著大量零碎的知識(shí),可以應(yīng)用知識(shí)工程的理論將這些零碎的知識(shí)進(jìn)行整合并用專業(yè)的語(yǔ)言表述出來(lái),讓用戶能夠更容易地進(jìn)行查詢利用。

        知識(shí)工程是以知識(shí)為處理對(duì)象,借用工程化的思想,利用人工智能的原理、方法和技術(shù),設(shè)計(jì)、構(gòu)造和維護(hù)知識(shí)型系統(tǒng)的一門學(xué)科,人們一般認(rèn)為知識(shí)工程是人工智能的一個(gè)應(yīng)用分支。知識(shí)工程包括知識(shí)獲取、知識(shí)表示與知識(shí)利用三大過(guò)程[2]。文檔作為最典型的顯性知識(shí),應(yīng)結(jié)合文檔本身的特性在知識(shí)工程三大過(guò)程的基礎(chǔ)上進(jìn)行“一增”“一強(qiáng)”,“一增”是在知識(shí)表示后增加一個(gè)知識(shí)組織過(guò)程,“一強(qiáng)”是強(qiáng)化知識(shí)利用的過(guò)程,因此,文檔知識(shí)工程應(yīng)包括文檔知識(shí)獲取、文檔知識(shí)表示、文檔知識(shí)組織和文檔知識(shí)利用四大過(guò)程。

        (1)文檔知識(shí)獲取

        目前,大多數(shù)核電企業(yè)文檔管理系統(tǒng)所能夠支持的管理對(duì)象是文件,同時(shí)在系統(tǒng)中填寫元數(shù)據(jù)對(duì)文件進(jìn)行補(bǔ)充描述,但是補(bǔ)充元數(shù)據(jù)并不能改變系統(tǒng)的管理對(duì)象,文件中的內(nèi)容及其隱含的知識(shí)并沒(méi)有進(jìn)行處理。因此,文檔知識(shí)工程的第一步就是要獲取文檔中的內(nèi)容,將非結(jié)構(gòu)化的文本進(jìn)行內(nèi)容解析識(shí)別為一條條結(jié)構(gòu)化的數(shù)據(jù)。

        (2)文檔知識(shí)表示

        文檔知識(shí)獲取只能支撐文檔管理系統(tǒng)實(shí)現(xiàn)全文檢索,因?yàn)橛?jì)算機(jī)并不知道這些文檔內(nèi)容所表達(dá)的意思,所以文檔知識(shí)工程的第二步就是要告訴計(jì)算機(jī)這些文檔內(nèi)容是什么意思。即將一條條結(jié)構(gòu)化的數(shù)據(jù)賦予語(yǔ)義的過(guò)程,如定義“反應(yīng)堆控制系統(tǒng)”是“系統(tǒng)名稱”,定義“控制反應(yīng)堆系統(tǒng)壓力變化”是“系統(tǒng)的作用”,通過(guò)文檔知識(shí)表示讓無(wú)意義的數(shù)據(jù)代表語(yǔ)義。

        (3)文檔知識(shí)組織

        計(jì)算機(jī)知道文檔內(nèi)容中的每條數(shù)據(jù)及其代表的語(yǔ)義后仍不能實(shí)現(xiàn)知識(shí)型文檔服務(wù),因?yàn)橛?jì)算機(jī)仍不理解數(shù)據(jù)與數(shù)據(jù)之間有什么內(nèi)在的關(guān)聯(lián)關(guān)系,以及語(yǔ)義與語(yǔ)義之間到底是如何互相作用和影響的,所以,文檔知識(shí)工程的第三步就是要對(duì)語(yǔ)義進(jìn)行重新排列組合,告訴計(jì)算機(jī)這是什么系統(tǒng)、系統(tǒng)的功能是什么、系統(tǒng)中有哪些設(shè)備以及每個(gè)設(shè)備的作用是什么等,將文檔內(nèi)容中隱含的“系統(tǒng)-功能”和“系統(tǒng)-設(shè)備-作用”邏輯關(guān)系給梳理出來(lái)。這個(gè)數(shù)據(jù)之間的邏輯關(guān)系就是文檔中隱含的知識(shí)。實(shí)際上,文檔知識(shí)組織就是表達(dá)文檔中隱含的業(yè)務(wù)及其邏輯的過(guò)程。

        (4)文檔知識(shí)利用

        經(jīng)過(guò)文檔內(nèi)容獲取、文檔知識(shí)表示和文檔知識(shí)組織后,系統(tǒng)就基本具備了提供知識(shí)型文檔服務(wù)的條件,但要達(dá)成“提出問(wèn)題-得到答案”兩個(gè)步驟的目標(biāo)場(chǎng)景,系統(tǒng)的檢索引擎必須應(yīng)用語(yǔ)義分析、分詞等信息技術(shù)進(jìn)行功能開(kāi)發(fā),此外,為了更好的展示知識(shí)以及知識(shí)之間的關(guān)聯(lián)關(guān)系,還需要通過(guò)知識(shí)圖譜的技術(shù)實(shí)現(xiàn)知識(shí)的可視化。

        在文檔知識(shí)工程的四個(gè)過(guò)程中,其中最為關(guān)鍵的是文檔知識(shí)獲取。文檔知識(shí)獲取的方式主要有三種:非自動(dòng)知識(shí)獲取、機(jī)器學(xué)習(xí)和知識(shí)抽取。

        1)非自動(dòng)知識(shí)獲取是通過(guò)培訓(xùn)、閱讀或與專家交流等方式獲取原始知識(shí)并進(jìn)一步歸納總結(jié)形成文檔輸入到系統(tǒng)中;

        2)機(jī)器學(xué)習(xí)是機(jī)器憑借人工智能通過(guò)其視覺(jué)、聽(tīng)覺(jué)等途徑直接閱讀理解文檔中的知識(shí),或在系統(tǒng)運(yùn)行過(guò)程中,結(jié)合已有的知識(shí)和實(shí)例推演、歸納總結(jié)出新知識(shí)補(bǔ)充到系統(tǒng)中;

        3)知識(shí)抽取是通過(guò)構(gòu)建機(jī)器學(xué)習(xí)規(guī)則和知識(shí)庫(kù),對(duì)隱含在文檔中的知識(shí)進(jìn)行識(shí)別、理解、篩選、格式化,在解析文檔過(guò)程中不斷改進(jìn)規(guī)則和算法,邊分析邊抽取,邊抽取邊校正,邊校正邊學(xué)習(xí),把文檔中的知識(shí)點(diǎn)都抽取出來(lái),以一定形式存入系統(tǒng)中。

        非自動(dòng)知識(shí)獲取效率較低,很難滿足自動(dòng)化需要;機(jī)器學(xué)習(xí)難度太大,需要結(jié)合分詞、語(yǔ)義分析和人工智能等技術(shù)進(jìn)一步研究和探索,也很難進(jìn)行自動(dòng)化實(shí)施;知識(shí)抽取是最符合現(xiàn)狀的文檔知識(shí)獲取方式。

        3 知識(shí)型文檔服務(wù)的實(shí)踐分析

        結(jié)合知識(shí)工程的理論應(yīng)用研究,知識(shí)型文檔服務(wù)可以在遵循和參考文檔知識(shí)工程理論和方法的基礎(chǔ)上,從業(yè)務(wù)、數(shù)據(jù)和技術(shù)三個(gè)實(shí)踐方向進(jìn)行研究分析。

        (1)以業(yè)務(wù)為導(dǎo)向

        對(duì)于文檔管理而言,傳統(tǒng)的載體比如紙張、照片、膠片等如今已基本形成了數(shù)字化副本,同時(shí)也產(chǎn)生了原生的電子文件,文檔管理的對(duì)象已從物理實(shí)體變?yōu)榱藬?shù)字化實(shí)體,雖然提高了工作效率,但從業(yè)務(wù)邏輯來(lái)說(shuō)并沒(méi)有改變。未來(lái)的文檔服務(wù)應(yīng)該是通過(guò)數(shù)據(jù)和業(yè)務(wù)進(jìn)行雙向互動(dòng)和驅(qū)動(dòng),將文檔服務(wù)延伸到前端,延伸到核心業(yè)務(wù)線,在核心工作開(kāi)展的初期,文檔部門就要緊跟業(yè)務(wù)部門,為業(yè)務(wù)流程做好服務(wù)配套,支撐并優(yōu)化核心業(yè)務(wù)流程。通過(guò)審視業(yè)務(wù)過(guò)程找到業(yè)務(wù)痛點(diǎn),也就是分析業(yè)務(wù)需求,制定解決方案,再應(yīng)用信息技術(shù)去實(shí)現(xiàn)和促進(jìn)業(yè)務(wù)流程,將業(yè)務(wù)整體進(jìn)行升級(jí)。數(shù)據(jù)要成為知識(shí)從而優(yōu)化業(yè)務(wù)流程,業(yè)務(wù)流程要更好地為數(shù)據(jù)保存和知識(shí)利用創(chuàng)造條件,他們之間雙向互動(dòng)的這種工作模式不僅僅是提升效率,也能讓業(yè)務(wù)人員真真切切感受到知識(shí)型文檔服務(wù)的價(jià)值。

        (2)以數(shù)據(jù)為導(dǎo)向

        核電企業(yè)的信息化起點(diǎn)和平均水平比較高,基本上都實(shí)現(xiàn)了業(yè)務(wù)流程電子化,因此,業(yè)務(wù)形成的文檔也從紙質(zhì)介質(zhì)轉(zhuǎn)變?yōu)閿?shù)字載體。實(shí)際上就是文檔管理對(duì)象發(fā)生了轉(zhuǎn)變,目前核電工程項(xiàng)目檔案執(zhí)行的是雙軌單套制,這個(gè)單套制指的就是要?dú)w檔一套紙質(zhì)檔案,但是在實(shí)際工作中基本上很少會(huì)去檔案庫(kù)房找紙質(zhì)檔案,只有財(cái)會(huì)檔案采用這種利用方式,其余大多數(shù)文檔都是在業(yè)務(wù)系統(tǒng)中直接形成數(shù)字載體文件。也就是說(shuō),原來(lái)在庫(kù)房中管理的檔案經(jīng)過(guò)數(shù)字化存儲(chǔ)在了服務(wù)器和磁盤上,但整個(gè)管理流程,業(yè)務(wù)邏輯沒(méi)有發(fā)生本質(zhì)改變,為了適應(yīng)或滿足其他業(yè)務(wù)的需要,文檔工作就不能僅僅局限于保管,要向開(kāi)發(fā)利用進(jìn)行轉(zhuǎn)變,要對(duì)文檔進(jìn)行更深層次的分析和數(shù)據(jù)采集,得到的數(shù)據(jù)越精細(xì),獲取的知識(shí)越準(zhǔn)確,才有助于開(kāi)展分析和歸納總結(jié),形成更多的知識(shí)成果。

        (3)以技術(shù)為導(dǎo)向

        文檔的載體已經(jīng)從紙質(zhì)轉(zhuǎn)向了數(shù)字,這是不可逆的趨勢(shì),文檔技術(shù)的研究和應(yīng)用上也應(yīng)從實(shí)體保管技術(shù)、保護(hù)技術(shù)和數(shù)字化技術(shù)向以數(shù)據(jù)和內(nèi)容為主的數(shù)據(jù)載體可信技術(shù)、數(shù)據(jù)內(nèi)容開(kāi)發(fā)技術(shù)和文檔知識(shí)服務(wù)技術(shù)轉(zhuǎn)型。但是,基于數(shù)據(jù)的通性或者說(shuō)是數(shù)據(jù)的特性,僅憑單個(gè)技術(shù)或單個(gè)算法是無(wú)法真正實(shí)現(xiàn)知識(shí)服務(wù)的,一定是一種體系化的技術(shù),集成化的技術(shù),技術(shù)之間有交互、有關(guān)聯(lián),實(shí)現(xiàn)新技術(shù)應(yīng)用1+1>2的效果,這就需要把技術(shù)的應(yīng)用點(diǎn)和應(yīng)用邏輯講清楚。首先是單文檔的智能分析技術(shù),知識(shí)工程第一步就是知識(shí)獲取,要通過(guò)智能分析的技術(shù)對(duì)單份文件中的內(nèi)容和數(shù)據(jù)抽取出來(lái)。抽取第二份、第三份文件里面的內(nèi)容時(shí),就需要對(duì)內(nèi)容中相同的數(shù)據(jù)進(jìn)行關(guān)聯(lián),所以第二個(gè)技術(shù)就是多資源的數(shù)據(jù)連接。當(dāng)關(guān)聯(lián)的數(shù)據(jù)越來(lái)越多,數(shù)據(jù)就變得很亂,為了更好地去利用這些數(shù)據(jù),就需要第三個(gè)技術(shù),對(duì)數(shù)據(jù)進(jìn)行知識(shí)化的組織。形成知識(shí)以后要進(jìn)行利用,所以最后一個(gè)應(yīng)用的技術(shù)就是全概念的結(jié)構(gòu)化展示技術(shù)。因此,知識(shí)型的文檔服務(wù)就需要把這些技術(shù)點(diǎn)連成技術(shù)線,如果技術(shù)點(diǎn)應(yīng)用得不好,就很可能會(huì)得到一個(gè)1+1<2的結(jié)果,產(chǎn)生很多的內(nèi)耗造成資源的浪費(fèi)。

        4 結(jié)束語(yǔ)

        信息技術(shù)的高速發(fā)展引領(lǐng)了各行各業(yè)的業(yè)務(wù)變革,同時(shí)也給各行各業(yè)帶來(lái)了很多理論和生產(chǎn)要素的變革文檔工作已從傳統(tǒng)制度化的1.0模式向文檔一體化的2.0模式轉(zhuǎn)變,現(xiàn)在正在向文檔智能化的3.0模式發(fā)展。文檔部門存有海量的文檔資源,坐擁最大的數(shù)據(jù)資產(chǎn)。文檔人員如何保管好、利用好這些數(shù)據(jù)資產(chǎn),需要進(jìn)一步研究和探索。作為“華龍一號(hào)”建設(shè)者,作為核電文檔工作者,要以“四好”“兩服務(wù)”為指引,留存好、記錄好這段奮斗歷史,講好這段紅色故事,實(shí)現(xiàn)傳統(tǒng)文檔服務(wù)向智慧知識(shí)服務(wù)轉(zhuǎn)型。

        色综合视频一区中文字幕| 中文字幕在线看精品乱码| 色综合久久久无码中文字幕| 麻豆久久久9性大片| YW亚洲AV无码乱码在线观看| 久久国产精品国产精品久久 | 蜜桃麻豆www久久囤产精品| 91香蕉视频网| 性一交一乱一乱一视频亚洲熟妇| 中文字幕漂亮人妻在线| 18禁真人抽搐一进一出在线| 97成人精品| 亚洲黄片av在线免费观看| 日本人妻伦理在线播放| 性色av闺蜜一区二区三区| 2021国产最新在线视频一区| 亚洲av午夜福利一区二区国产| 女人无遮挡裸交性做爰| 欧美精品中文字幕亚洲专区| 无码一区久久久久久久绯色AV| 在线观看一区二区三区视频| 亚洲av色欲色欲www| 亚洲精品一区二区三区大桥未久| 亚洲欧美在线视频| 国产av剧情精品麻豆| 在线播放真实国产乱子伦| 国产免费一区二区三区在线观看| 国产aⅴ丝袜旗袍无码麻豆| 精品国产中文字幕久久久| 97人人模人人爽人人少妇| 午夜短视频日韩免费| 91麻豆精品久久久影院| 欧美性生交活xxxxxdddd| 亚洲暴爽av人人爽日日碰| 精品亚洲不卡一区二区| 日韩三级一区二区三区| a级大胆欧美人体大胆666| 日韩av二区三区一区| 国产精品成人一区二区在线不卡 | 无码av天堂一区二区三区| 精品亚洲午夜久久久久|