亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)架構(gòu)研究

        2021-02-24 03:02:36孫雨生
        中國科技資源導(dǎo)刊 2021年1期
        關(guān)鍵詞:語義資源用戶

        袁 芳 孫雨生

        (1.中國科學(xué)技術(shù)信息研究所,北京 100038;2.湖北工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院,湖北武漢 430068)

        0 引言

        大數(shù)據(jù)、人工智能、社交媒體、數(shù)字人文等新理念和技術(shù)的興起加速了知識(shí)驅(qū)動(dòng)下各行各業(yè)智能化、智慧化變革[1]和知識(shí)社會(huì)[2]到來,知識(shí)管理、知識(shí)服務(wù)已大勢所趨[1]。在這種形勢下,檔案領(lǐng)域積極探索靈活化、系統(tǒng)化、個(gè)性化[3]檔案知識(shí)服務(wù)模式并取得了一定成效:在檔案館公共服務(wù)領(lǐng)域,國家檔案館的公共知識(shí)服務(wù)管理知識(shí)庫實(shí)踐探索了更加便捷、優(yōu)質(zhì)檔案館知識(shí)服務(wù)發(fā)展途徑;在軍工檔案領(lǐng)域,中國艦船研究設(shè)計(jì)中心基于集中、集成、集智的總體發(fā)展思路,策劃并構(gòu)建了知識(shí)服務(wù)型科技檔案管理系統(tǒng),于2014年在全中心推廣使用[4]。

        而隨著數(shù)字檔案資源量的急劇增長,與用戶有限認(rèn)知及處理能力間矛盾日益加劇,如何借助基于新型IT技術(shù)的知識(shí)服務(wù)系統(tǒng)有效描述、處理、存儲(chǔ)、分析和利用海量異構(gòu)數(shù)字檔案資源,實(shí)現(xiàn)電子文件與數(shù)字檔案一體化管理[2],進(jìn)而個(gè)性化、智能化提供數(shù)字檔案知識(shí)服務(wù)成為亟待解決的問題。傳統(tǒng)數(shù)字檔案知識(shí)服務(wù)系統(tǒng)[5]雖然能夠基于用戶信息、行為等部分預(yù)測其興趣及需求并利用單一服務(wù)機(jī)制[6]提供數(shù)字檔案及其隱含知識(shí)檢索、知識(shí)瀏覽、知識(shí)推薦、知識(shí)問答等服務(wù),但是由于缺乏語義技術(shù)支持,存在著檔案知識(shí)利用率低、服務(wù)針對性弱、異構(gòu)檔案資源難以機(jī)讀化[6]存儲(chǔ)和共享等缺陷[5],反饋評(píng)價(jià)機(jī)制的缺失[2]也嚴(yán)重影響了數(shù)字檔案知識(shí)服務(wù)質(zhì)量及用戶體驗(yàn)[6],降低了決策效率[2]。在這種形勢下,基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)應(yīng)運(yùn)而生。其依托本體技術(shù)語義關(guān)聯(lián)數(shù)字檔案知識(shí)單元構(gòu)建并可視化檔案知識(shí)網(wǎng)絡(luò),降低用戶認(rèn)知負(fù)荷,再依托本體推理機(jī)制深挖用戶潛在興趣,以精確獲取、形式化描述、動(dòng)態(tài)進(jìn)化[6]用戶個(gè)性檔案需求,利用本體特性描述、組織數(shù)字檔案知識(shí)進(jìn)而構(gòu)建知識(shí)服務(wù)系統(tǒng)及交互式服務(wù)模式、策略[7],以智能匹配、整合知識(shí)服務(wù)機(jī)制。其基于本體描述數(shù)字檔案資源以有效解決檔案資源語義歧義、異構(gòu)問題并充分發(fā)揮其價(jià)值,基于數(shù)字檔案本體知識(shí)庫及數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)推理隱性知識(shí)實(shí)現(xiàn)數(shù)字檔案知識(shí)增值并推動(dòng)用戶知識(shí)創(chuàng)新[8],最終提升數(shù)字檔案知識(shí)服務(wù)易用性、針對性、共享性、集成性、智能性[5],并服務(wù)于創(chuàng)新活動(dòng)。因此,研究基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)具有現(xiàn)實(shí)意義。

        本文將從體系結(jié)構(gòu)、功能模塊、運(yùn)行機(jī)理3個(gè)方面設(shè)計(jì)基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)架構(gòu),以供相關(guān)的研究者與系統(tǒng)實(shí)踐者參考。

        1 數(shù)字檔案知識(shí)服務(wù)系統(tǒng)與本體技術(shù)

        1.1 數(shù)字檔案知識(shí)服務(wù)系統(tǒng)

        目前,數(shù)字檔案知識(shí)服務(wù)系統(tǒng)定義、內(nèi)涵尚未達(dá)成共識(shí)。分析現(xiàn)有數(shù)字檔案知識(shí)服務(wù)、知識(shí)服務(wù)系統(tǒng)文獻(xiàn),筆者認(rèn)為,數(shù)字檔案知識(shí)服務(wù)系統(tǒng)是基于數(shù)字化知識(shí)管理和檔案后保管范式[1]、人本管理[8]等理論和檔案的知識(shí)、服務(wù)價(jià)值取向[3],面向數(shù)字檔案領(lǐng)域,以檔案知識(shí)資源為對象,以檔案機(jī)構(gòu)、電子文件為中心,以檔案業(yè)務(wù)部門工作及用戶獲取特定問題解決方法[9]需求為導(dǎo)向,以知識(shí)服務(wù)流程為核心,以實(shí)現(xiàn)文檔一體化管理[2]、挖掘和發(fā)揮檔案部門及檔案資源智力支撐作用為目標(biāo),遵循面向用戶、輔助決策、注重全時(shí)空[2]服務(wù)[1]、嚴(yán)格執(zhí)行標(biāo)準(zhǔn)規(guī)范、保障檔案資源安全、動(dòng)態(tài)擴(kuò)展知識(shí)服務(wù)[2]的原則,基于數(shù)字檔案知識(shí)庫、數(shù)字檔案門戶[8]、數(shù)字檔案管理規(guī)范及標(biāo)準(zhǔn)(包括技術(shù)領(lǐng)域各項(xiàng)參數(shù)指標(biāo)、信息處理環(huán)節(jié)制度標(biāo)準(zhǔn)及相應(yīng)評(píng)估體系[3])、數(shù)字檔案硬件設(shè)備及裝備(涉及常規(guī)設(shè)備、檔案處理設(shè)備、網(wǎng)絡(luò)設(shè)備[3]),充分利用新型IT技術(shù)(用戶畫像、本體、語義網(wǎng)、關(guān)聯(lián)數(shù)據(jù)[2]、知識(shí)推薦、知識(shí)挖掘、知識(shí)地圖[8]、信息安全[9]等)以及檔案著錄標(biāo)引、檔案數(shù)據(jù)庫、檔案數(shù)字化、檔案發(fā)布、檔案信息安全[3]等專業(yè)技術(shù)整合數(shù)字檔案顯性知識(shí)并分析挖掘數(shù)字檔案知識(shí)資源隱性知識(shí)[9],形成新的知識(shí)創(chuàng)造,并通過智能化方法、新型運(yùn)作模式[3]和服務(wù)理念、服務(wù)方式(知識(shí)檢索、知識(shí)咨詢、知識(shí)推薦等[10])、服務(wù)機(jī)制、服務(wù)思維[1]以及檔案工作者智慧分析、診斷、解決特定問題并重構(gòu)服務(wù)流程[3],進(jìn)而提供深層次、高質(zhì)量數(shù)字檔案知識(shí)或知識(shí)產(chǎn)品、知識(shí)結(jié)構(gòu)[9]、新型檔案利用形式[3],并能夠深度挖掘檔案價(jià)值、按用戶反饋及相關(guān)評(píng)估動(dòng)態(tài)調(diào)整[3]的集成性知識(shí)服務(wù)系統(tǒng)。

        就內(nèi)涵而言,數(shù)字檔案知識(shí)服務(wù)系統(tǒng)基于檔案知識(shí)采集、組織、分析、重組、可視化等過程和數(shù)字檔案規(guī)范,根據(jù)用戶問題和環(huán)境將檔案知識(shí)融入用戶解決問題的全過程[7],實(shí)現(xiàn)檔案增值并降低用戶認(rèn)知負(fù)荷。數(shù)字檔案知識(shí)服務(wù)系統(tǒng)主要由信息采集、知識(shí)抽取、知識(shí)組織、知識(shí)存儲(chǔ)、知識(shí)推理、知識(shí)服務(wù)等功能模塊組成,基于本體、知識(shí)地圖、知識(shí)推薦、知識(shí)引擎、知識(shí)可視化等技術(shù)構(gòu)建數(shù)字檔案知識(shí)網(wǎng)絡(luò)以集成數(shù)字檔案領(lǐng)域內(nèi)概念、主題、機(jī)構(gòu)、事件、地點(diǎn)、人員、實(shí)物、關(guān)系等知識(shí)對象,并結(jié)合知識(shí)服務(wù)策略與機(jī)制為用戶提供知識(shí)服務(wù),以構(gòu)建連接知識(shí)提供者與用戶的知識(shí)供應(yīng)鏈,促進(jìn)數(shù)字檔案知識(shí)生產(chǎn)、存儲(chǔ)、加工、傳播、交流、學(xué)習(xí)、應(yīng)用、共享、評(píng)估及創(chuàng)新,進(jìn)而使數(shù)字檔案知識(shí)效用最大化。

        1.2 本體技術(shù)

        作為知識(shí)表示和分析手段[7]、語義網(wǎng)基礎(chǔ)[11]的本體技術(shù)最早是哲學(xué)術(shù)語,是關(guān)于事物存在及其本質(zhì)和規(guī)律的理論。計(jì)算機(jī)科學(xué)、人工智能領(lǐng)域本體是領(lǐng)域概念的結(jié)構(gòu)化規(guī)范和形式,定義領(lǐng)域內(nèi)概念間關(guān)系,可以在人及信息系統(tǒng)間形成對領(lǐng)域概念的共享和共同理解,實(shí)現(xiàn)知識(shí)共享和重用[7]。本體通用概念是Gruber于1993年提出,并經(jīng)Borst完善、Studer系統(tǒng)化的“共享概念模型的明確的形式化規(guī)范說明”。其中,概念模型是指抽象客觀世界現(xiàn)象相關(guān)概念所得模型;明確是指所用概念及其使用約束都有清楚的定義;形式化是指計(jì)算機(jī)可處理;共享是指體現(xiàn)共同認(rèn)可知識(shí),揭示相關(guān)領(lǐng)域中公認(rèn)概念集[12]。本體常常被作為通用知識(shí)庫支持信息資源及服務(wù)的語義化表示及智能整合、知識(shí)推理以提升知識(shí)服務(wù)質(zhì)量及用戶體驗(yàn)。

        1.3 基于本體的數(shù)字檔案知識(shí)服務(wù)

        基于本體的數(shù)字檔案知識(shí)服務(wù)是網(wǎng)絡(luò)環(huán)境下面向用戶特定實(shí)踐應(yīng)用及問題[7]、旨在形成解決方案、動(dòng)態(tài)增值的智能化、一體化(涉及知識(shí)采集、表示、析取/分析、組織/重組、創(chuàng)新、存儲(chǔ)、集成到應(yīng)用等過程[7]并服務(wù)于用戶解決問題全程以實(shí)現(xiàn)知識(shí)個(gè)人化,支持知識(shí)協(xié)作、知識(shí)創(chuàng)新)交互式服務(wù)。其通過在檔案知識(shí)體系中引入本體形式化描述、關(guān)聯(lián)數(shù)字檔案單元間知識(shí)關(guān)聯(lián)關(guān)系,界定檔案主題框架及主題間等級(jí)、上下位和語義等關(guān)系,以滿足用戶多元化需求,其將用戶、數(shù)字檔案資源統(tǒng)一在虛擬語義環(huán)境中以便計(jì)算機(jī)處理[10];通過推理機(jī)制調(diào)用知識(shí)庫中規(guī)則及約束以支持智能決策[12];通過知識(shí)可視化、知識(shí)映射等技術(shù)挖掘、分析、構(gòu)建、繪制和顯式圖形化表達(dá)數(shù)字檔案知識(shí)內(nèi)在結(jié)構(gòu)關(guān)系,進(jìn)而創(chuàng)造知識(shí)共享環(huán)境以實(shí)現(xiàn)數(shù)字檔案知識(shí)交流和深化。

        具體而言,基于檔案本體知識(shí)庫、本體知識(shí)表示機(jī)制、本體映射機(jī)制構(gòu)建用戶本體,結(jié)合用戶基本信息及行為、偏好信息構(gòu)建并動(dòng)態(tài)進(jìn)化語義用戶興趣模型,以形式化精準(zhǔn)表示用戶需求,并基于本體語義表示、邏輯推理特性智能拓展用戶潛在知識(shí)需求;基于本體語義描述數(shù)字檔案知識(shí)服務(wù)機(jī)制,根據(jù)語義用戶興趣模型智能匹配、動(dòng)態(tài)集成所需數(shù)字檔案知識(shí)服務(wù)機(jī)制,以合適的渠道、方式[12]為用戶提供最優(yōu)數(shù)字檔案知識(shí)解決方案[9]及相應(yīng)知識(shí)資源并融入其解決問題全程;用本體形式化描述檔案領(lǐng)域知識(shí)體系、結(jié)構(gòu)化采集檔案領(lǐng)域知識(shí)資源,基于語義標(biāo)注關(guān)聯(lián)本體與檔案領(lǐng)域知識(shí)資源以高效采集、精準(zhǔn)表示、智能發(fā)現(xiàn)、動(dòng)態(tài)集成數(shù)字檔案知識(shí)資源,最終高效協(xié)同用戶、服務(wù)機(jī)制、數(shù)字檔案資源、IT技術(shù)及信息裝備、專家資源[9]實(shí)現(xiàn)數(shù)字檔案用戶體驗(yàn)、服務(wù)質(zhì)量及性能、知識(shí)資源配置及管理最優(yōu)化[6],智能輔助用戶決策以提升用戶解決問題能力、數(shù)字檔案價(jià)值,實(shí)現(xiàn)系統(tǒng)集成、業(yè)務(wù)集成、功能集成[8]、服務(wù)集成和團(tuán)隊(duì)協(xié)同[9],同時(shí)提高用戶學(xué)習(xí)和工作效率(語義化分布式原始資料形成系統(tǒng)知識(shí)結(jié)構(gòu),將領(lǐng)域本體深化成知識(shí)產(chǎn)品直接提供用戶所需知識(shí)和資源)[13]。

        2 基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)架構(gòu)的總體設(shè)計(jì)

        構(gòu)建基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)就是用本體、語義檢索[13]、知識(shí)導(dǎo)航、知識(shí)推薦等技術(shù)和方法構(gòu)建數(shù)字檔案知識(shí)庫、數(shù)字檔案本體庫,用本體重組、整合數(shù)字檔案所含知識(shí)單元,以機(jī)讀模式組織、存儲(chǔ)、檢索數(shù)字檔案信息,通過資源語義關(guān)聯(lián)及知識(shí)導(dǎo)航能夠更加精細(xì)化、規(guī)范化、自動(dòng)化地揭示數(shù)字檔案資源,并根據(jù)用戶習(xí)慣采集用戶行為和知識(shí)偏好,推斷用戶需求,構(gòu)建用戶服務(wù)匹配和知識(shí)發(fā)現(xiàn)機(jī)制,結(jié)合本體映射技術(shù)分析相關(guān)知識(shí)[7],實(shí)現(xiàn)數(shù)字檔案知識(shí)跨資源類型、跨庫檢索及推薦,提供個(gè)性化、全方位知識(shí)服務(wù),追蹤用戶需求變化進(jìn)行服務(wù)優(yōu)化[11]?;诒倔w的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)總體架構(gòu)如圖1所示。

        2.1 體系結(jié)構(gòu)

        基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)體系結(jié)構(gòu)分為表示層、應(yīng)用層、業(yè)務(wù)層、數(shù)據(jù)層,且各層次業(yè)務(wù)聯(lián)系緊密、構(gòu)建邏輯相對獨(dú)立[2,5],基于功能模塊調(diào)用進(jìn)行層間交互,基于本體操作接口(支持?jǐn)?shù)字檔案專家構(gòu)建、維護(hù)本體)、用戶操作接口(向用戶反饋數(shù)字檔案知識(shí)服務(wù)系統(tǒng)所推薦知識(shí)并接受反饋)傳遞數(shù)字檔案知識(shí)及資源[5]。具體如圖2所示。

        2.1.1 表示層

        表示層又稱用戶界面層,通常體現(xiàn)為檔案知識(shí)門戶(為用戶獲取和輸出信息接口,集成多種接入方式以便用戶與系統(tǒng)交互[10])、知識(shí)社區(qū)(支持問題中心、專家問答、知識(shí)論壇等)、專家黃頁(以列表形式揭示專家知識(shí)、技能和專長[8])、個(gè)人知識(shí)中心、平臺(tái)管理(監(jiān)控知識(shí)服務(wù)系統(tǒng)以操作知識(shí)庫及數(shù)據(jù)庫[11])等,充當(dāng)數(shù)字檔案知識(shí)服務(wù)系統(tǒng)界面呈現(xiàn)載體及用戶界面邏輯角色,通過在Web頁面中編寫用戶界面控制邏輯代碼(用于讀取、設(shè)置服務(wù)器控件及知識(shí)服務(wù)事件處理等)并結(jié)合業(yè)務(wù)層知識(shí)服務(wù)機(jī)制實(shí)現(xiàn)服務(wù)器控件與數(shù)字檔案知識(shí)綁定,支持用戶訪問(包括注冊登錄、知識(shí)瀏覽、知識(shí)檢索、反饋評(píng)價(jià)等)[5]及其知識(shí)需求學(xué)習(xí)(基于知識(shí)使用情況、業(yè)務(wù)等動(dòng)態(tài)進(jìn)化用戶興趣模型、用戶本體)、知識(shí)服務(wù)展示[5]。

        圖1 基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)總體架構(gòu)

        圖2 基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)體系結(jié)構(gòu)

        2.1.2 應(yīng)用層

        應(yīng)用又稱知識(shí)服務(wù)層[13]、功能層,提供基于本體的數(shù)字檔案知識(shí)服務(wù)引擎[12],基于大數(shù)據(jù)處理分析、人工智能(AI)、知識(shí)可視化、知識(shí)圖譜等技術(shù),通過用戶需求分析和本體推理實(shí)現(xiàn)應(yīng)用管理模塊中系統(tǒng)功能,主要包括知識(shí)服務(wù)應(yīng)用[2],如專題知識(shí)庫、知識(shí)導(dǎo)航[11]、知識(shí)檢索[13]、知識(shí)發(fā)現(xiàn)、知識(shí)推薦、知識(shí)地圖、知識(shí)問答、參考咨詢服務(wù)、智庫情報(bào)服務(wù)[2]、(統(tǒng)計(jì))數(shù)據(jù)產(chǎn)品[13]等,并應(yīng)用解析接口預(yù)分類、細(xì)化和分析用戶請求[2],調(diào)用知識(shí)服務(wù)程序與業(yè)務(wù)層交互,將知識(shí)服務(wù)結(jié)果反饋給表示層,再由其通過人機(jī)界面顯示給用戶。

        2.1.3 業(yè)務(wù)層

        業(yè)務(wù)層又稱業(yè)務(wù)邏輯層,通常接收應(yīng)用層轉(zhuǎn)交的用戶請求,基于元數(shù)據(jù)收割、信息抽取、Mashup等技術(shù)[2],與數(shù)據(jù)層交互處理數(shù)字檔案業(yè)務(wù)并反饋結(jié)果給應(yīng)用層[5],實(shí)現(xiàn)數(shù)字檔案知識(shí)服務(wù)系統(tǒng)所需通用業(yè)務(wù)過程,如知識(shí)檢索、知識(shí)過濾(按用戶檢索請求進(jìn)行語義匹配、需求分析、語義推理后篩選檔案)、知識(shí)推薦(基于推薦策略、用戶需求本體和用戶資料庫,用推薦算法、情景推理[11]篩選檔案資源及知識(shí))、知識(shí)集成(采集數(shù)字檔案資源,基于本體規(guī)則層次化、有序化數(shù)字檔案知識(shí)元素以構(gòu)建知識(shí)網(wǎng)絡(luò)、揭示檔案知識(shí)脈絡(luò)[13])、知識(shí)抽取、知識(shí)標(biāo)注(分析數(shù)據(jù)內(nèi)容、關(guān)聯(lián)特點(diǎn),基于領(lǐng)域本體、本體推理對數(shù)字檔案知識(shí)庫中信息進(jìn)行標(biāo)注[11])、語義索引[13]、知識(shí)發(fā)現(xiàn)、知識(shí)組織(依托多維知識(shí)體系[8],關(guān)聯(lián)形成相關(guān)主題的關(guān)聯(lián)數(shù)據(jù)、推理規(guī)則、專家智慧等知識(shí)[2])、知識(shí)推理(涉及推理規(guī)則、推理約束[11])等,業(yè)務(wù)層專注數(shù)字檔案知識(shí)服務(wù)業(yè)務(wù)邏輯算法實(shí)現(xiàn),包括對數(shù)字檔案業(yè)務(wù)實(shí)體建模的對象模型及表達(dá)用戶知識(shí)服務(wù)策略和需求的業(yè)務(wù)規(guī)則,處理流程涉及用戶興趣建模、知識(shí)需求建模、知識(shí)檢索、知識(shí)推薦[5]等。

        2.1.4 數(shù)據(jù)層

        數(shù)據(jù)層又稱數(shù)據(jù)存儲(chǔ)層、知識(shí)資源層,與數(shù)據(jù)庫相連并響應(yīng)業(yè)務(wù)請求[10],通?;跀?shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、信息抽取、元數(shù)據(jù)收割、自然語言處理、信息聚類、圖像識(shí)別、分布式存儲(chǔ)、云計(jì)算等技術(shù)[2],利用數(shù)字檔案標(biāo)準(zhǔn)規(guī)范和信息裝備為數(shù)字檔案提供元數(shù)據(jù)收割、編目及維護(hù)、密級(jí)管理、權(quán)限設(shè)定、XML封裝等,形成數(shù)字檔案知識(shí)元、構(gòu)建領(lǐng)域知識(shí)架構(gòu)[13],實(shí)現(xiàn)數(shù)據(jù)持久化功能。通常按照業(yè)務(wù)層請求通過統(tǒng)一數(shù)據(jù)訪問引擎[2]存取檔案數(shù)據(jù),包括事務(wù)處理、并發(fā)控制等,主要涉及數(shù)字檔案知識(shí)庫(用本體庫的元知識(shí)標(biāo)注從數(shù)字檔案數(shù)據(jù)庫、作者及其機(jī)構(gòu)主頁采集[11]的數(shù)字檔案及相關(guān)信息,并以XML文檔[12]存為數(shù)字檔案資料庫[11]),為領(lǐng)域本體庫構(gòu)建(提取易理解、共識(shí)性檔案知識(shí)元素并以機(jī)讀模式組織、存儲(chǔ)、查詢數(shù)據(jù)得到概念特征集并與領(lǐng)域本體映射以關(guān)聯(lián)數(shù)字檔案知識(shí)與領(lǐng)域知識(shí)[11])及知識(shí)檢索、知識(shí)推薦等服務(wù)提供數(shù)據(jù)保障。存儲(chǔ)對數(shù)字檔案資源進(jìn)行知識(shí)采集所得的數(shù)字檔案相關(guān)信息(用本體形式化經(jīng)語義標(biāo)注、擴(kuò)展、合成的結(jié)果并通過語義推理挖掘隱含語義[11]),以便高效檢索[11]用戶需求[11]本體庫(存儲(chǔ)用戶基本信息、需求、興趣偏好、操作行為[2]如日志流[11]、設(shè)備使用信息等,經(jīng)概念特征提取[11]、本體映射構(gòu)建)、數(shù)字檔案本體庫(基于數(shù)據(jù)倉庫、AI、RDF、本體建模、本體語言等技術(shù)[2,13]和數(shù)字檔案標(biāo)準(zhǔn)規(guī)范、資源特性,經(jīng)機(jī)讀采集數(shù)字檔案知識(shí)資源、處理數(shù)字檔案、標(biāo)注語義[5]、知識(shí)推理和演化[2]等構(gòu)建,存儲(chǔ)應(yīng)用本體描述數(shù)字檔案知識(shí)內(nèi)容的概念及其關(guān)系集[12])、領(lǐng)域本體庫(輔助表示領(lǐng)域性數(shù)字檔案資源中語義關(guān)系且概念層次結(jié)構(gòu)良好、支持邏輯推理以語義化數(shù)字檔案、方便檔案知識(shí)組織與檢索)、推理規(guī)則庫(存儲(chǔ)數(shù)字檔案知識(shí)推理規(guī)則和約束條件以支持語義推理[5]、本體智能拓展和管理[2])、關(guān)系數(shù)據(jù)庫[5](存儲(chǔ)數(shù)字檔案資源、自建專題檔案數(shù)據(jù)等[2])、專家?guī)?、電子文件中心、容?zāi)備份中心[2]等。

        2.2 功能模塊

        基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)就是基于數(shù)字檔案知識(shí)語義表示、智能關(guān)聯(lián)滿足檔案管理員應(yīng)用和智能管理檔案知識(shí)需求,滿足系統(tǒng)管理員管理數(shù)字檔案知識(shí)服務(wù)系統(tǒng)運(yùn)行維護(hù)需求,滿足普通用戶智能獲取數(shù)字檔案知識(shí)及資源需求,最終知識(shí)化管理數(shù)字檔案。主要包括應(yīng)用管理、知識(shí)庫管理、知識(shí)源管理、文檔一體化管理、系統(tǒng)維護(hù)管理等模塊。

        2.2.1 應(yīng)用管理模塊

        應(yīng)用管理模塊又稱知識(shí)服務(wù)平臺(tái)及接口[10],通?;谥R(shí)門戶圍繞服務(wù)目標(biāo)與用戶直接接觸,支持知識(shí)服務(wù)應(yīng)用可視化顯示、評(píng)價(jià)、反饋[5]。其主要涉及基于Web發(fā)布常規(guī)信息、檔案資源,專題知識(shí)庫(圍繞專題重組、整合各部門檔案資源建設(shè)或完善的專題數(shù)據(jù)庫以提升知識(shí)服務(wù)深度和用戶體驗(yàn)),語義(知識(shí))檢索(基于本體實(shí)現(xiàn)概念匹配和知識(shí)推理),數(shù)據(jù)挖掘(包括提供數(shù)據(jù)統(tǒng)計(jì)、關(guān)聯(lián)分析、報(bào)(圖)表輸出、工具共享等),知識(shí)地圖(包括可視化知識(shí)跨域?qū)Ш健⒅R(shí)圖譜等),個(gè)人知識(shí)中心(包括吸引用戶參與系統(tǒng)開發(fā)、參考咨詢服務(wù)提供等,激勵(lì)用戶參與檔案標(biāo)注和更新,構(gòu)建用戶社區(qū)和個(gè)人主頁以根據(jù)用戶訂閱收藏、歷史瀏覽、社交好友等構(gòu)建用戶本體進(jìn)而推薦知識(shí)),參考咨詢服務(wù)(包括推薦服務(wù)無法滿足用戶需求時(shí)由專業(yè)人員借助平臺(tái)提供咨詢服務(wù)),智庫情報(bào)服務(wù)(包括基于決策支持系統(tǒng)挖掘檔案資源隱性知識(shí),提供情報(bào)和輔助決策建議[2]),檔案管理專家系統(tǒng)以及檔案生產(chǎn)加工指導(dǎo)服務(wù)、用戶興趣建模、知識(shí)推薦[5]等。

        2.2.2 知識(shí)庫管理模塊

        知識(shí)庫管理模塊支持其他模塊[10],其水準(zhǔn)的高低決定了整個(gè)系統(tǒng)知識(shí)服務(wù)能力的大小[2],通常針對問題求解需求,提取數(shù)字檔案蘊(yùn)含知識(shí)并歸納成有用知識(shí)[2]、梳理數(shù)字檔案知識(shí)單元關(guān)系[5],進(jìn)而按專題或系列構(gòu)建基于特定知識(shí)表示方式的關(guān)聯(lián)知識(shí)集[8],涉及用戶需求本體庫、本體庫、數(shù)據(jù)庫[10],功能主要包括知識(shí)條目維護(hù)和管理、一致性檢驗(yàn)、知識(shí)元關(guān)聯(lián)和推理規(guī)則管理、知識(shí)分類編碼等元數(shù)據(jù)管理、本體構(gòu)建和管理等[2]。

        2.2.3 知識(shí)源管理模塊

        知識(shí)源管理模塊整合各檔案部門資源,提供設(shè)計(jì)各系統(tǒng)檔案資源集成接口、檔案資源收集和注冊、分類管理、密級(jí)管理(保障檔案資源公開且安全,常用強(qiáng)化ID登錄管理、版權(quán)隱私聲明等防止信息泄露、版權(quán)竊取、惡意篡改等)、XML封裝功能等[2],涉及數(shù)字檔案解析(支持DOC、PDF、XML等格式檔案)、數(shù)字檔案語義索引(基于分詞器預(yù)處理并用高頻主題詞集標(biāo)引數(shù)字檔案)、數(shù)字檔案檢索[13]、數(shù)字檔案知識(shí)加工、數(shù)字檔案知識(shí)審核、數(shù)字檔案知識(shí)標(biāo)注[5]。

        2.2.4 文檔一體化管理模塊

        文檔一體化管理模塊按前端控制思想設(shè)計(jì)在線歸檔檔案部門尚未歸檔的文件、電子公文等,功能包括構(gòu)建電子文件中心、設(shè)計(jì)與OA系統(tǒng)接口、自動(dòng)采集數(shù)字檔案及元數(shù)據(jù)、自動(dòng)匹配紙質(zhì)檔案與數(shù)字檔案、自動(dòng)分配(合成)檔案號(hào)、在線移交檔案、接收和歸檔管理檔案等[2]。

        2.2.5 系統(tǒng)維護(hù)管理模塊

        系統(tǒng)維護(hù)管理模塊完成檔案機(jī)構(gòu)管理、用戶賬戶與用戶組管理、檔案密級(jí)及公開權(quán)限管理、門戶后臺(tái)管理、檔案容災(zāi)備份[2]、報(bào)表模板管理、檔案知識(shí)體系管理、檔案知識(shí)采集模板管理、結(jié)構(gòu)化檔案模板管理、知識(shí)庫管理[8]、日志管理、菜單管理、檔案門類管理等[2]。

        2.3 運(yùn)行機(jī)理

        基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)服務(wù)流程:首先,構(gòu)建數(shù)字檔案知識(shí)庫。通過數(shù)字檔案知識(shí)資源采集、數(shù)字檔案處理(用自然語言處理工具[7]對數(shù)字檔案進(jìn)行過濾、分詞、特征詞及關(guān)系提取并映射為領(lǐng)域本體,進(jìn)行概念推理獲取相關(guān)知識(shí)[7])、語義標(biāo)注、語義索引構(gòu)建結(jié)構(gòu)化、機(jī)讀式[13]的數(shù)字檔案知識(shí)庫[5],進(jìn)而基于面向知識(shí)服務(wù)的信息資源組織方法[13]結(jié)合數(shù)字檔案本體[5]按知識(shí)結(jié)構(gòu)和語義特征[13]集成[5]數(shù)字檔案資源(分析數(shù)字檔案知識(shí)結(jié)構(gòu)及異構(gòu)知識(shí)源[5],用本體描述數(shù)字檔案知識(shí)并語義關(guān)聯(lián)以集成數(shù)字檔案知識(shí)并存入數(shù)字檔案知識(shí)庫[5],形成面向多類應(yīng)用需求及層次、較豐富完善的數(shù)字檔案知識(shí)產(chǎn)品[13])并關(guān)聯(lián)本體層與數(shù)字檔案知識(shí)。其次,構(gòu)建語義用戶興趣模型。提取挖掘用戶興趣、行為特征存入用戶本體庫,基于本體[10]構(gòu)建語義用戶興趣模型。然后,處理數(shù)字檔案知識(shí)并展示結(jié)果,基于用戶本體庫[5]、本體解析工具、語義擴(kuò)展算法[13]分析用戶知識(shí)檢索請求、歷史需求[2]、用戶興趣模型,以精準(zhǔn)獲取、推理其知識(shí)需求,并據(jù)此檢索知識(shí)庫、調(diào)用本體獲取相關(guān)知識(shí)、制定服務(wù)策略[2]、處理檢索結(jié)果(匹配、分類[2]、排序),生成個(gè)性化檢索、推薦列表[5],知識(shí)地圖及相關(guān)知識(shí)語義鏈接、相關(guān)分析工具[2]展示給用戶并動(dòng)態(tài)跟蹤其應(yīng)用情況。最后,優(yōu)化數(shù)字檔案知識(shí)服務(wù)。動(dòng)態(tài)收集反饋信息(如系統(tǒng)使用情況[2])并存儲(chǔ)數(shù)字檔案知識(shí)服務(wù)準(zhǔn)確率不高、不完善的信息,進(jìn)化數(shù)字檔案領(lǐng)域本體和用戶興趣模型及知識(shí)需求模型[5]。

        3 結(jié)語

        綜上所述,本文從體系結(jié)構(gòu)、功能模塊、運(yùn)行機(jī)理3 個(gè)方面研究了基于本體的數(shù)字檔案知識(shí)服務(wù)系統(tǒng)架構(gòu),旨在基于數(shù)字檔案規(guī)范、數(shù)字檔案知識(shí)庫、數(shù)字檔案本體庫、語義技術(shù)、信息裝備來深度揭示、有機(jī)鏈接異構(gòu)數(shù)字檔案信息資源,挖掘數(shù)字檔案知識(shí)間邏輯關(guān)系及隱性知識(shí)以解決檔案信息分散封閉問題,實(shí)現(xiàn)數(shù)字檔案資源高度精細(xì)化、深度結(jié)構(gòu)化和廣泛語義化,支持更高效、智能數(shù)字檔案知識(shí)服務(wù)。具體而言,體系結(jié)構(gòu)分表示層、應(yīng)用層、業(yè)務(wù)層、數(shù)據(jù)層;功能模塊分應(yīng)用管理、知識(shí)庫管理、知識(shí)源管理、文檔一體化管理、系統(tǒng)維護(hù)管理模塊;運(yùn)行機(jī)理是構(gòu)建數(shù)字檔案知識(shí)庫以集成數(shù)字檔案并關(guān)聯(lián)本體與數(shù)字檔案資源、構(gòu)建語義用戶興趣模型、處理數(shù)字檔案知識(shí)并展示結(jié)果、優(yōu)化數(shù)字檔案知識(shí)服務(wù)。今后,筆者將進(jìn)一步系統(tǒng)分析基于本體的數(shù)字檔案知識(shí)服務(wù)模式及實(shí)現(xiàn)路徑,繼續(xù)開展數(shù)字檔案知識(shí)服務(wù)系統(tǒng)的研究,為相關(guān)研究與實(shí)踐提供參考。

        猜你喜歡
        語義資源用戶
        基礎(chǔ)教育資源展示
        一樣的資源,不一樣的收獲
        語言與語義
        資源回收
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        認(rèn)知范疇模糊與語義模糊
        亚洲成av人在线观看无堂无码 | 日韩一区二区,亚洲一区二区视频| 久久精品女人天堂av麻| 亚洲av日韩专区在线观看| av影片在线免费观看| 亚洲精品无码专区在线在线播放| 18禁无遮拦无码国产在线播放| 亚洲精品92内射| 免费毛片在线视频| 精品亚亚洲成av人片在线观看| 人妻在线有码中文字幕| 亚洲av午夜一区二区三| 亚洲av永久无码天堂网小说区| 亚洲综合国产一区二区三区| 亚洲乱码日产精品bd在线观看| 精品人妻VA出轨中文字幕| 久久亚洲aⅴ精品网站婷婷| 亚洲国产一区二区精品| 国产不卡视频在线观看| 欧美性xxxxx极品老少| 亚洲av高清在线一区二区三区| 久久人人爽人人爽人人av东京热 | 国产乱人伦av在线a麻豆| 无码不卡av东京热毛片| 在线亚洲人成电影网站色www| 手机看片福利盒子久久青| 日韩av中出在线免费播放网站| 中文字幕亚洲精品一二三区| 国产精品视频白浆免费视频| 人人妻人人澡人人爽人人dvd| 内射少妇36p亚洲区| 亚洲第一成人网站| 精品国产成人一区二区不卡在线| 久久天堂精品一区专区av| 亚洲国产av一区二区三区天堂| 中文人妻av久久人妻水蜜桃| 亚洲第一se情网站| 国产精品亚洲午夜不卡| 91蜜桃精品一区二区三区毛片| 激情久久黄色免费网站| 三年片免费观看影视大全视频|