亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于本體理論的紅色檔案知識服務探索

        2023-06-16 03:01:12黃永勤楊安蓮平碩國防大學政治學院軍事信息與網(wǎng)絡輿論系
        浙江檔案 2023年5期
        關(guān)鍵詞:知識庫本體圖譜

        黃永勤 楊安蓮 平碩/國防大學政治學院軍事信息與網(wǎng)絡輿論系

        紅色檔案指中國共產(chǎn)黨成立以來,領(lǐng)導機關(guān)組織[1]和帶領(lǐng)廣大人民群眾在革命戰(zhàn)爭、社會主義建設(shè)、改革開放、新時代等各階段[2]矢志奮斗實現(xiàn)中華民族偉大復興進程中形成的能體現(xiàn)黨的初心使命并且具有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄。紅色檔案具有客觀原始史料、內(nèi)容信息豐富、紅色價值導向、教育意義深刻、情感走心共鳴等特點,是傳承紅色基因和賡續(xù)紅色血脈的重要載體。深度開發(fā)紅色檔案,開展知識服務能更好地滿足社會公眾多元化、個性化、知識化、深度化、智能化的利用需求,更好地服務社會經(jīng)濟建設(shè)、弘揚革命傳統(tǒng)文化、強化主流價值引導、抵制歷史虛無主義、提高政治教育實效。

        從紅色檔案開發(fā)與知識服務的理論研究看。檔案知識服務的研究重點包括:一是從理論研究維度探討相關(guān)概念、方法、機制等;二是從技術(shù)實踐維度討論檔案資源整合、館際資源利用、服務模式等[3]。目前相關(guān)研究多聚焦紅色檔案的生成機理、價值意蘊、開發(fā)路徑等,從知識服務的視角探索紅色檔案利用的成果很少,應用“本體”開展“檔案知識服務”的研究也較少。

        從紅色檔案開發(fā)與知識服務的應用實踐看,還存在以下不足:一是紅色檔案資源整合不足。檔案館一般局限于本單位的資源開發(fā)紅色檔案,缺乏跨館、互聯(lián)網(wǎng)等資源的整合,資源建設(shè)方面存在“擁而難用、匯而不慧”的現(xiàn)象。二是紅色檔案開發(fā)深度欠缺,目前紅色檔案的開發(fā)主要以傳統(tǒng)的編研和檢索利用為主,已愈發(fā)難以滿足用戶對精準化/精細化數(shù)據(jù)分析、智慧搜索、自動問答、個性化推薦等知識性、深層次、智能化的信息需求。三是紅色檔案服務模式單一,有研究指出紅色檔案“敘事碎片化[4]”的問題,其根源還是紅色檔案的知識服務能力欠缺。

        知識服務是解決紅色檔案開發(fā)利用與檔案用戶信息需求不匹配矛盾的重要途徑,而“本體”是實現(xiàn)該目標的最佳方案之一,本文試圖引入本體理論,探索其在紅色檔案知識服務的應用,以期為實踐提供有益參考。

        1 基于本體的紅色檔案知識服務理論框架

        本體(Ontology)源于西方哲學領(lǐng)域的“存在論”,是共享概念模型明確的形式化規(guī)范說明[5],相關(guān)國際標準[6-7]進一步指出本體是規(guī)定知識域中具體或抽象事物及其關(guān)系的規(guī)范。有學者[8]將本體在信息行業(yè)的作用概括為:支持標引、檢索、組織與瀏覽,以及充當知識庫,提供知識服務?;诒倔w的紅色檔案知識服務是在用戶興趣模型和紅色檔案知識庫的基礎(chǔ)之上構(gòu)建用戶(需求)本體和知識本體,并基于本體映射機制、語義表示、邏輯推理等特性開展的相關(guān)知識服務應用。具體而言,主要包含以下內(nèi)容:

        1.1 服務模型

        依據(jù)前述定義,基于本體的紅色檔案知識服務模型如圖1所示,主要包括以下部分:

        圖1 基于本體的紅色檔案知識服務模型

        1.1.1 從需求視角看。通過分析檔案用戶基本信息、行為信息等歸納并構(gòu)建基于(需求)本體的用戶興趣模型。一是用戶興趣模型,旨在精確全面描述檔案用戶個性化需求,具體包括模型表示、模型初始化、模型進化等內(nèi)容[9]。模型基于本體語義表示、知識推理等,其在結(jié)構(gòu)化形式、興趣信息采集、智能處理、動態(tài)進化等方面優(yōu)勢顯著。二是需求本體,基于概念層次結(jié)構(gòu)和推理分析,一方面可實現(xiàn)將用戶自然語言轉(zhuǎn)換為形式化、概念化、層次化、機器可讀的檔案用戶需求,實現(xiàn)與知識本體的映射;另一方面也可實現(xiàn)用戶需求語義化、結(jié)構(gòu)化存儲和表示,挖掘用戶潛在需求,優(yōu)化用戶興趣模型。

        1.1.2 從資源視角看。一是信息采集,用本體轉(zhuǎn)換非結(jié)構(gòu)化、半結(jié)構(gòu)化檔案信息資源為結(jié)構(gòu)化存儲知識,并精確描述知識內(nèi)容及其關(guān)聯(lián),解決紅色檔案資源類型多的問題。二是知識表示,用本體描述語言序化、結(jié)構(gòu)化異源異構(gòu)檔案信息,將其轉(zhuǎn)換為可共享、互操作的形式化知識,解決紅色檔案資源的信息集成問題。三是知識組織,基于本體映射機制、語義標注等方法組織和集成相關(guān)檔案資源并導入本體知識庫,解決紅色檔案資源的信息組織問題。四是知識存儲,構(gòu)建紅色檔案領(lǐng)域本體和知識庫。五是知識更新,關(guān)聯(lián)、更新紅色檔案領(lǐng)域本體、知識庫等。

        1.1.3 從服務視角看。一是服務機制,將用戶瀏覽、提問、交互、檢索行為等需求通過用戶興趣模型調(diào)用需求本體,并通過映射機制關(guān)聯(lián)到知識本體,爾后知識本體調(diào)用知識庫資源為用戶提供服務。二是服務方式,目前常提供知識圖譜分析、個性化定制、知識導航、知識問答、知識推薦、知識檢索等。三是服務反饋,服務與評價形成閉環(huán)管理,便于優(yōu)化服務方式、用戶興趣模型和本體庫。

        1.2 本體構(gòu)建

        1.2.1描述語言。一是基于Web本體描述語言,如SGML、SHOE、XML、RDF、RDF(s)、DAML、OIL、OWL、XOL等。二是基于謂詞邏輯本體描述語言,如KIF、Ontolingua、Loom、Flogic、Cycl、OCML等。三是基于圖本體描述語言,如概念圖、WordNet語義網(wǎng)絡等。其中XML、OWL、RDF和RDF(s)等在檔案領(lǐng)域本體構(gòu)建過程中廣受青睞。

        1.2.2 構(gòu)建原則。最具影響力的是Gruber[10]提出的五條標準,即清晰性、完整性、一致性、可擴展性和最小約束性?,F(xiàn)實情況中一般多靈活選擇,檔案領(lǐng)域可采用國際標準ISO 21127:2014(E)《信息與文獻——文化遺產(chǎn)信息交換參考本體》提出的建模原則:單調(diào)(推理)性、(本體)最小化、(屬性)簡便性、(類)不相交性、類型關(guān)聯(lián)性、動態(tài)擴展性、內(nèi)容完整性[11]。

        1.2.3 構(gòu)建工具。一是基于Web本體描述語言的工具,如Protégé、OILEd、OntoEdit等。二是基于謂詞邏輯本體描述語言的工具,如Ontolingua、WebOnto等[12]。其中斯坦福大學開發(fā)的開源軟件Protégé是國內(nèi)檔案領(lǐng)域本體構(gòu)建最常用的工具,其支持XML、RDF(s)、OWL、Flogic等多種描述語言。

        1.2.4 構(gòu)建方法。常用的方法包括TOVE法、骨架法、METHONTOLOGY法、DEFS法、KACTUS法、SENSUS法、IDEF5法、七步法等。不同方法各有優(yōu)劣,實際中多依據(jù)具體項目、領(lǐng)域特點等進行選擇,其中“七步法”是國內(nèi)檔案領(lǐng)域本體構(gòu)建最常用的方法。

        1.3 架構(gòu)體系

        1.3.1 體系結(jié)構(gòu)。一是B/S體系結(jié)構(gòu),其靈活易維護,但服務器負荷重且安全性一般,一般包含數(shù)據(jù)層、業(yè)務層、應用層,并有相應接口完成層間交互。二是C/S體系結(jié)構(gòu),其數(shù)據(jù)管理透明,但維護成本較高,一般包含客戶端和服務器端,對客戶端要求較高。三是聯(lián)合存儲,為保證知識服務效率,一般在數(shù)據(jù)層基礎(chǔ)之上采取本體庫、知識庫、用戶模型庫的聯(lián)合存儲模式。

        1.3.2 功能模塊。一是知識輸入模塊,主要采集領(lǐng)域知識、用戶興趣和行為信息等。二是業(yè)務處理模塊,包括用戶需求建模、知識管理、檔案檢索、知識推理等。三是服務輸出模塊,包括結(jié)果顯示、評價反饋等。

        1.3.3 架構(gòu)流程。一是構(gòu)建知識庫,通過對知識資源進行收集、處理,完成語義標注,構(gòu)建紅色檔案領(lǐng)域本體知識庫。二是構(gòu)建用戶興趣模型,基于用戶行為抽取信息偏好、特征存入用戶(需求)本體庫。三是服務應用,處理用戶檢索請求、檢索知識、匹配結(jié)果等。四是服務優(yōu)化,收集顯性和隱性的反饋信息,修正紅色檔案領(lǐng)域本體和用戶需求模型。

        2 基于本體的紅色檔案知識服務應用實現(xiàn)

        “抗美援朝精神”是中央宣傳部梳理的第一批中國共產(chǎn)黨人精神譜系的偉大精神,2020年習近平總書記在紀念中國人民志愿軍抗美援朝出國作戰(zhàn)70周年大會講話指出:“偉大抗美援朝精神跨越時空、歷久彌新,必須永續(xù)傳承、世代發(fā)揚”?!翱姑涝瘧?zhàn)爭”紅色檔案是銘記歷史、弘揚精神和資政育人的珍貴資源,調(diào)研發(fā)現(xiàn)黨政機關(guān)、黨史研究、思政教育等領(lǐng)域?qū)Υ擞袕娏业臋n案利用和知識服務需求。基于前文闡述的服務模型、本體構(gòu)建和架構(gòu)體系,本研究以共產(chǎn)黨員網(wǎng)《抗美援朝大事記》、抗美援朝紀念館館藏檔案等數(shù)據(jù)為例,探索紅色檔案知識服務的應用場景。

        2.1 知識管理

        一是本體設(shè)計。知識表示描述語言選擇OWL,構(gòu)建方法選擇“七步法”,構(gòu)建工具選擇Protégé。以RiC-CM和CIDOC-CRM本體概念框架作為主要標準,提煉出“時間”“地點”“參戰(zhàn)部隊”“參戰(zhàn)人員”“戰(zhàn)役”等核心概念集作為“抗美援朝戰(zhàn)爭”紅色檔案領(lǐng)域本體的頂層概念和規(guī)則,爾后進一步細化描述和實例化。本體概念模型如圖2所示,主要包含概念層、實例層、內(nèi)容層三個方面。二是知識采集?;凇翱姑涝瘧?zhàn)爭”紅色檔案領(lǐng)域本體,采集和轉(zhuǎn)換非結(jié)構(gòu)化的檔案信息為結(jié)構(gòu)化存儲知識并精準描述知識內(nèi)容及上下文關(guān)聯(lián),如圖2內(nèi)容層所示,主要關(guān)聯(lián)到具體的檔案資源,包括照片檔案(作戰(zhàn)場景)、實物檔案(繳獲的“北極熊團”團旗)、文書檔案(電報、戰(zhàn)斗經(jīng)驗總結(jié)等)、專業(yè)檔案(作戰(zhàn)態(tài)勢圖等)。三是知識組織。利用本體映射規(guī)則、語義標注方法等構(gòu)建知識鏈接關(guān)系,如圖2實例層所示,提煉并組織檔案信息中的知識及關(guān)系,圖中描述了“新興里進攻戰(zhàn)斗”的相關(guān)實例,包括參戰(zhàn)部隊“志愿軍第27軍”和“美第31團級戰(zhàn)斗隊”、參戰(zhàn)人員“彭德清”和“麥克里安”等。

        圖2 “抗美援朝戰(zhàn)爭”紅色檔案領(lǐng)域本體概念模型示意圖

        2.2 檢索服務

        查詢檢索是基于本體的紅色檔案知識服務最為重要的應用場景,可實現(xiàn)以下服務:一是知識檢索。如圖2所示,以“新興里進攻戰(zhàn)斗”為例,借助Protégé工具中的OntoGraf插件可實現(xiàn)知識的拓展檢索,如檢索“彭德清”,可以得到與其相關(guān)的人物,其實例周邊有“參戰(zhàn)人員”類,有“中國人民志愿軍”“第9兵團”“第27軍”“新興里進攻戰(zhàn)斗”等實例,且每個類或?qū)嵗加袔Ъ^的實線或虛線相連接。二是擴展檢索。展開“第9兵團”與“第27軍”、“第27軍”與“新興里進攻戰(zhàn)斗”的實例可以發(fā)現(xiàn)二者之間的隸屬和參與關(guān)系,同時可以逆向推理出其領(lǐng)導關(guān)系和涉及關(guān)系,由此實現(xiàn)本體概念模型的推理功能和擴展檢索。三是用戶畫像。依據(jù)檔案用戶檢索行為,可進一步更新優(yōu)化用戶興趣模型,并結(jié)合需求本體構(gòu)建用戶畫像,當前主要采用基于概念標簽的用戶畫像方法,后續(xù)可深化為基于深度學習的用戶畫像模型,以解決當前紅色檔案利用服務停留在基于檔案用戶共性需求普適化層面,無法關(guān)聯(lián)用戶行為特點、精準滿足新媒體環(huán)境下用戶個性化和差異化需求的困境。四是評價反饋。主要思路為通過檔案用戶提交的檢索行為和系統(tǒng)反饋的檔案知識,進一步計算需求本體和知識本體的相似度,具體包括本體概念相似度和本體關(guān)系相似度兩個維度的計算[13],相似度計算結(jié)果越高表明兩個本體越相似,也表明“資源視角”輸出的紅色檔案知識產(chǎn)品越符合“需求視角”中的檔案用戶興趣,反之則可以進一步優(yōu)化用戶興趣模型和紅色檔案知識庫的資源管理,以更好響應檔案用戶的需求。

        2.3 知識圖譜

        本體作為知識圖譜生命周期中“知識框架”的基礎(chǔ),亦是知識圖譜構(gòu)建的核心。本研究在“抗美援朝戰(zhàn)爭”紅色檔案領(lǐng)域本體的基礎(chǔ)上,進一步完成知識融合、圖譜存儲、圖譜索引等環(huán)節(jié),形成了“抗美援朝戰(zhàn)爭”紅色檔案知識圖譜,并開發(fā)了原型服務系統(tǒng)。初步實現(xiàn)了以下服務應用:一是知識導航。以可視化的方式展示知識的分布與關(guān)聯(lián),圖中實體檢索“毛澤東”,其中之一的檢索結(jié)果展示了“毛澤東致電關(guān)系”的知識圖譜片段,可發(fā)現(xiàn)“彭德懷”“宋時輪”“高崗”等與“毛澤東”存在致電關(guān)系,同時圖譜中每個節(jié)點可以作為新的檢索點,進一步導航知識片段。二是資源鏈接。檢索結(jié)果不僅能展示相關(guān)實體,還可點擊鏈接,關(guān)聯(lián)與該實體對應的相關(guān)文檔、圖片、音視頻等素材,方便用戶直接瀏覽原始檔案,圖中展示了“彭德懷”實體對應的原始照片檔案。三是知識問答。區(qū)別于傳統(tǒng)以“關(guān)鍵詞”為主要字段的檔案檢索,知識圖譜服務系統(tǒng)能夠基于本體的推理,完成自然語言形式的問答互動,圖中展示了用戶通過自然語言提問“毛澤東都跟誰致過電”和系統(tǒng)智能回答:“賀晉年、陶勇、宋時輪……”;進一步追問“毛澤東致電周恩來說了什么內(nèi)容”,系統(tǒng)會通過需求本體映射知識本體,進而調(diào)用知識庫中的檔案知識,回答通話的具體內(nèi)容:“指示要及時補充兵力連續(xù)作戰(zhàn)……”。四是知識推薦。依據(jù)檔案用戶的提問和檢索行為,系統(tǒng)可依據(jù)前文所述的用戶模型和用戶畫像,推薦相關(guān)個性化知識服務,如圖中所示,系統(tǒng)自動向用戶推薦“想了解:毛澤東與彭德懷通話內(nèi)容嗎”,若用戶需要可點擊該問題鏈接,系統(tǒng)會通過需求本體和知識本體調(diào)用檔案知識庫并自動回答。

        3 結(jié)語

        大數(shù)據(jù)時代,信息爆炸式增長與用戶有限資源處理能力的矛盾愈發(fā)突出,“認知過載”“知識迷航”的現(xiàn)象日益普遍,傳統(tǒng)的檔案信息服務已愈發(fā)難以滿足用戶多元化、精細化、知識化、智能化的需求。人工智能、元宇宙等新技術(shù)和新理念正加速各行各業(yè)向“數(shù)智”的變革升級,知識管理替代信息管理、知識服務替代信息服務已成大勢所趨?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》便提出:積極探索知識管理、人工智能、數(shù)字人文等技術(shù)在檔案信息深層加工和利用中的應用。本體是知識管理的基石,也是解決個性化、智能化、精準化知識服務的最佳方案之一,本文創(chuàng)新性地提出了構(gòu)建基于本體的紅色檔案知識服務模型,并以“抗美援朝戰(zhàn)爭”紅色檔案為例進行了相關(guān)開發(fā)利用的探索。后續(xù)研究可進一步關(guān)注以下幾個方向:一是融入知識圖譜構(gòu)建鏈條,知識圖譜強大的深度知識推理和逐步擴展認知的能力,已成為助推紅色檔案信息資源深度開發(fā)的關(guān)鍵技術(shù),而本體作為知識圖譜構(gòu)建的重要環(huán)節(jié),可進一步整合檔案領(lǐng)域的知識本體,積極向知識圖譜應用轉(zhuǎn)化。二是支撐檔案數(shù)字人文研究,紅色檔案應重視“非物質(zhì)”特征的活態(tài)傳承,但目前紅色檔案資源還處在整合、開發(fā)和利用程度較低的層次,本體理論可支撐數(shù)字人文視角下紅色檔案元數(shù)據(jù)、采集方法、數(shù)據(jù)治理、呈現(xiàn)方式等領(lǐng)域的研究。三是探索人工智能技術(shù)應用,本體是機器學習和人工智能技術(shù)的重要理論根基,未來可關(guān)注利用人工智能技術(shù)探索檔案數(shù)據(jù)的自動分類組織、檔案本體的智能構(gòu)建、檔案知識庫與用戶模型的自主更新等。

        本文系國家社科基金軍事學青年項目“聯(lián)合作戰(zhàn)中開源軍事情報保障研究”(2019-SKJJ-C-064);國家社科基金青年項目“‘互聯(lián)網(wǎng)+’背景下多媒體檔案知識發(fā)現(xiàn)研究”(19CTQ033)階段性成果之一

        猜你喜歡
        知識庫本體圖譜
        Abstracts and Key Words
        哲學分析(2023年4期)2023-12-21 05:30:27
        繪一張成長圖譜
        對姜夔自度曲音樂本體的現(xiàn)代解讀
        中國音樂學(2020年4期)2020-12-25 02:58:06
        基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機設(shè)計中的應用
        補腎強身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        高速公路信息系統(tǒng)維護知識庫的建立和應用
        主動對接你思維的知識圖譜
        《我應該感到自豪才對》的本體性教學內(nèi)容及啟示
        文學教育(2016年27期)2016-02-28 02:35:15
        基于Drupal發(fā)布學者知識庫關(guān)聯(lián)數(shù)據(jù)的研究
        圖書館研究(2015年5期)2015-12-07 04:05:48
        Care about the virtue moral education
        卷宗(2013年6期)2013-10-21 21:07:52
        亚洲av无码成人精品区在线观看| 免费在线观看视频播放| 青青青爽在线视频观看| 两个人看的www高清视频中文| A亚洲VA欧美VA国产综合| 精品精品国产一区二区性色av| 国产成人无码a区在线观看导航| 久久99精品国产麻豆| 亚洲地区一区二区三区| 国产91精品自拍视频| 胸大美女又黄的网站| 无码人妻丰满熟妇啪啪7774| 精品高清国产乱子伦| 亚洲一区二区三区日韩在线观看| 天天摸夜夜摸夜夜狠狠摸| 亚洲一区二区三区偷拍女厕| 国产亚洲一区二区三区夜夜骚| 男奸女永久免费视频网站| 国产福利精品一区二区| 国产精品青草视频免费播放| 国产精品黄色av网站| 中文字幕av伊人av无码av| 中文字幕熟妇人妻在线视频| 久久久高清免费视频| 黄色一区二区三区大全观看| 国产精品久久人妻无码| 人妻丰满多毛熟妇免费区| 日本一区二区三区精品不卡| 激情内射人妻1区2区3区| 性一乱一搞一交一伦一性 | 国产美女自拍国语对白| av色一区二区三区精品| 羞羞视频在线观看| 在线观看日本一区二区| 久久国产精品美女厕所尿尿av| 国产人妻人伦精品1国产| 一国产区在线观看| 免费黄网站永久地址进入| 国产又色又爽无遮挡免费软件| 亚洲最新偷拍网站| 免费高清日本一区二区|