亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高校檔案知識圖譜構(gòu)建及系統(tǒng)實現(xiàn)探析

        2023-09-10 18:23:27張雯君
        蘭臺內(nèi)外 2023年22期
        關(guān)鍵詞:高校檔案知識圖譜

        張雯君

        摘 要:隨著數(shù)字化進程的深入,智慧校園的廣泛建設(shè),產(chǎn)生大量形式異構(gòu)、內(nèi)容繁雜的高校數(shù)字資源。高校數(shù)字資源在收集、檢索查詢上的功能缺失,導(dǎo)致檔案關(guān)聯(lián)度差,無法深度開發(fā)資源和信息共享。構(gòu)建一種基于知識圖譜的檔案管理系統(tǒng),解決高校檔案管理過程中知識關(guān)聯(lián)弱,檔案價值挖掘程度低等問題,為高校檔案智能管理提供新的思路。

        關(guān)鍵詞:高校檔案;知識圖譜;檔案系統(tǒng)

        知識圖譜這一概念起源于Google公司提出的“Google Knowledge Graph”,目的是優(yōu)化搜索引擎,用來提供更復(fù)雜的關(guān)聯(lián)信息查找,從語義層面解析用戶的意愿,從而給出更加具有針對性的搜索結(jié)果。高校檔案記錄了學(xué)校在教學(xué)、科研過程中發(fā)生的多種活動,對于學(xué)校的管理和建設(shè)起著重要的作用。將知識圖譜技術(shù)與高校檔案相結(jié)合,有效開發(fā)和利用多種形式的高校檔案資源,從高校檔案數(shù)據(jù)中構(gòu)建高校檔案本體關(guān)聯(lián)知識圖譜,以可視化的形式展示高校檔案,并基于知識圖譜展開有效的知識推理和語義檢索,實現(xiàn)高校檔案價值增值。

        一、檔案知識圖譜研究應(yīng)用

        隨著人工智能的快速發(fā)展,知識圖譜在檔案學(xué)探索中的運用逐漸增多并不斷發(fā)展。參考現(xiàn)有的知識圖譜在檔案學(xué)中的應(yīng)用,可以得到啟發(fā)。例如,利用知識圖譜做關(guān)鍵詞共現(xiàn)分析,得到所有檔案中共同出現(xiàn)的關(guān)鍵詞詞頻,以此研究檔案的熱點內(nèi)容、共同特征等;繪制檔案關(guān)鍵詞共現(xiàn)的時間序列圖譜,展示不同時間段的檔案的熱點或共同特點;利用突現(xiàn)詞探測法了解檔案中出現(xiàn)的新內(nèi)容,還可以結(jié)合時區(qū)圖得到一段時間內(nèi)的檔案熱點內(nèi)容,知識圖譜除了應(yīng)用于語義搜索,還被應(yīng)用于推薦系統(tǒng)、輔助決策等方面。

        二、高校檔案知識圖譜構(gòu)建的可行性

        知識圖譜作為大數(shù)據(jù)時代一種可以揭示實體之間關(guān)系的技術(shù),在知識的推理和語義檢索等方面展示了巨大的能量。能夠?qū)n案信息重新整合,將關(guān)系抽取出來,并利用可視化圖譜展現(xiàn)其系統(tǒng)化、有序化的知識組織。將知識圖譜運用在高校檔案管理系統(tǒng)中具有以下優(yōu)勢:

        1.知識圖譜可以實現(xiàn)信息共享,揭示數(shù)據(jù)之間的關(guān)聯(lián)性

        高校檔案具有數(shù)據(jù)量大、內(nèi)容豐富的特點,為了快速挖掘檔案資源信息,知識圖譜可以將相關(guān)聯(lián)的數(shù)據(jù)重新組織成一個網(wǎng)絡(luò)數(shù)據(jù)群,以可視化圖譜的方式展示其知識脈絡(luò)。這樣不僅可以實現(xiàn)不同資源之間的快速連接,還能夠讓需求者快速獲得檔案信息,使得資源共享服務(wù)得到最大化。

        2.知識圖譜可以提升檔案利用效率

        知識圖譜通過挖掘碎片化的信息、重新組合以及描述發(fā)展進程,了解實物之間的完整關(guān)系。因此,相比于傳統(tǒng)的檔案管理系統(tǒng),知識圖譜可以提高檔案之間的利用率,實現(xiàn)查詢、檢索自動化,全面展示該領(lǐng)域中各要素的關(guān)聯(lián)情況、發(fā)展情況等。

        3.知識圖譜可以展示檔案數(shù)據(jù)的動態(tài)特征

        高校檔案隨著不同階段的加工往往會表現(xiàn)出動態(tài)的變化特征,知識圖譜的加入可以實現(xiàn)檔案數(shù)據(jù)的實時更新,對其開展動態(tài)調(diào)整從而保障檔案的完整性與準(zhǔn)確性。

        相較于其他內(nèi)容的大數(shù)據(jù),高校檔案數(shù)據(jù)記錄真實的教學(xué)活動和管理建設(shè)工作,經(jīng)過嚴(yán)格的分類,其內(nèi)容的表達也有嚴(yán)格的規(guī)范,有著較為完整的檔案元數(shù)據(jù)標(biāo)準(zhǔn),為基于知識圖譜的檔案管理系統(tǒng)打下良好的數(shù)據(jù)基礎(chǔ)。目前,從高校檔案管理現(xiàn)狀以及系統(tǒng)需求分析,結(jié)合知識圖譜構(gòu)建過程,以山東建筑大學(xué)檔案為數(shù)據(jù)源,開發(fā)具有智能采集與歸檔、碎片化加工、增強高校檔案資源間關(guān)聯(lián)關(guān)系性能等系統(tǒng),提升高校檔案管理水平,并解決其管理過程中知識關(guān)聯(lián)弱,檔案價值挖掘程度低等問題。

        三、高校知識圖譜構(gòu)建方式和流程

        1.高校知識圖譜構(gòu)建方式

        知識圖譜普遍存在兩種構(gòu)建方式:一是自頂向下的構(gòu)建方式,首要建立圖譜模型,構(gòu)建知識圖譜本體,隨后將實體及屬性匹配設(shè)計到模式層本體中。自頂向下的方式,是垂直領(lǐng)域知識圖譜常用方式,因難度技術(shù)較低,需要依靠分類體系確定性高的結(jié)構(gòu)化知識庫;二是自底向上的構(gòu)建方式,利用公開的數(shù)據(jù),運用知識提取出知識,選擇高質(zhì)量的知識導(dǎo)入知識庫中,并加以組織。自底向上的方式,體系更加完備,具有較高的智能化,適用于非結(jié)構(gòu)化的知識庫。高校檔案知識庫存在大量異構(gòu)數(shù)據(jù),較適用于自底向上的構(gòu)建方式。

        2.高校檔案知識圖譜構(gòu)建流程

        運用信息技術(shù)抽取非結(jié)構(gòu)化、半結(jié)構(gòu)化以及結(jié)構(gòu)化數(shù)據(jù)的有效信息形成知識網(wǎng)絡(luò)是高校知識圖譜構(gòu)建的基礎(chǔ)。高校知識圖譜的構(gòu)建過程有三個階段,即知識抽取、知識融合與知識計算。知識抽取,即從高校原始數(shù)據(jù)中提煉出實體、屬性以及實體之間的關(guān)系;知識融合是指在完成知識抽取后,對新知識中相同的實體進行整合,或消除具有矛盾和歧義的知識;知識計算的過程就是對新獲取的知識展開篩選評估的過程,經(jīng)過評估合格后的知識補充到知識庫中。

        (1)知識抽取。 知識抽取是高校檔案知識圖譜構(gòu)建的第一步,通過自動化或半自動化的知識抽取技術(shù),從高校檔案原始數(shù)據(jù)中獲得實體、關(guān)系及屬性等可用知識單元,為高校檔案知識圖譜的構(gòu)建提供知識基礎(chǔ)。

        (2)知識融合。由結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)等多源異構(gòu)數(shù)據(jù)源抽取的知識存在冗余、語義沖突和知識重疊等問題。為了能夠更有效地構(gòu)建知識圖譜,要應(yīng)用知識合并技術(shù)從數(shù)據(jù)模式層融合和數(shù)據(jù)層融合兩方面實行融合,對知識實行實體消歧、沖突檢測、共指消解和實體整合處理。實體鏈接為知識融合的關(guān)鍵技術(shù),主要包含實體消歧和共指消解。分別用于解決一詞多義以及指向同一實體有不同表述的問題。目前,實體消歧主要采用聚類法,而共指消解可以使用分類的方法和聚類的方法求解。

        (3)知識計算。經(jīng)過知識抽技術(shù)得到的知識,經(jīng)過知識融合后,生成初步表達。然而,為了得到結(jié)構(gòu)化、網(wǎng)絡(luò)化的知識網(wǎng)絡(luò),產(chǎn)生更精準(zhǔn)的模型,還需要展開知識計算。首先,知識計算需要構(gòu)建本體,也就是通過人工編輯的方法或由數(shù)據(jù)驅(qū)動機器的方法構(gòu)建特定領(lǐng)域的本體。其次,開展知識推理,運用推理技術(shù)從現(xiàn)有數(shù)據(jù)中獲取新關(guān)聯(lián),完成新知識的補充。知識推理的知識開展質(zhì)量評估,實現(xiàn)知識可信度的量化,保障知識庫的質(zhì)量。

        四、基于高校檔案知識圖譜的檔案管理系統(tǒng)設(shè)計路徑

        1.國內(nèi)高校檔案管理現(xiàn)狀分析

        通過國內(nèi)外高校檔案管理研究綜述,并調(diào)研山東大學(xué)、濟南大學(xué)以及山東交通學(xué)院等山東省內(nèi)高校檔案管理現(xiàn)狀,在充分了解高校檔案資源專業(yè)性、綜合性等特點的基礎(chǔ)上,在研究中發(fā)現(xiàn)高校檔案管理經(jīng)過近幾年的發(fā)展,信息化水平有所提升。但在高校檔案管理模式、檔案收集、加工以及存儲與利用、信息共享等方面還存在諸多問題。

        (1)高校檔案管理模式。目前,國內(nèi)高校仍以紙質(zhì)檔案管理為主,相關(guān)檔案管理制度主要適用于傳統(tǒng)檔案管理。檔案信息化制度建設(shè)和技術(shù)建設(shè)方面成果較少。部分高校因信息化管理意識欠缺、經(jīng)費不足以及技術(shù)能力薄弱、專業(yè)人員缺乏等問題,尚未開展紙質(zhì)檔案數(shù)字化工作。對于已開展數(shù)字化工作的高校,仍有一半以上數(shù)據(jù)檢索需要靠人工完成,學(xué)生通過自行前往檔案館查閱,信息化還處于較低水平。

        (2)檔案內(nèi)容的完整性。高校檔案管理的第一步是檔案收集,檔案收集的完整性、可靠性和準(zhǔn)確性決定了檔案利用價值。目前,高校檔案收集工作普遍存在檔案收集不當(dāng)、內(nèi)容缺失的問題。主要涉及三個原因,一是檔案收集制度不完善,缺乏有效的監(jiān)督機制使得檔案未能及時歸檔;二是檔案的來源比較廣泛,分散于各個部門,加大了檔案收集的難度;三是檔案收集流程不規(guī)范,未做到應(yīng)收盡收,存在缺少附件、日期不明確和內(nèi)容缺失等問題。

        (3)檔案的存儲與共享利用。一般來說,高校檔案分散存儲在不同部門,且各部門之間無法相互訪問,各部門之間缺少溝通與聯(lián)系,高校檔案管理存在著分散和多重管理的問題。解決這一問題,需要各類單位、機構(gòu)、部門建立共享機制,實現(xiàn)資源共享。此外,由于檔案存儲不當(dāng),存儲流程細(xì)節(jié)不夠具體,極易造成檔案丟失。電子檔案的存儲會因為具有一定的開放性而遭到泄露和入侵。目前,各高校的檔案系統(tǒng)還未實現(xiàn)專業(yè)化與數(shù)字化,檔案之間的調(diào)用與查閱過于煩瑣,無法直接利用。因此,構(gòu)建一個科學(xué)、系統(tǒng)的高校檔案管理系統(tǒng)是必不可少的。

        2.系統(tǒng)技術(shù)支持及框架設(shè)計

        面對海量的異構(gòu)數(shù)據(jù),高校管理者需要從管理軟件中解決檔案的智慧化收集和歸檔等問題。運用知識圖譜技術(shù),匯集高校行政、人事、科研、資產(chǎn)和學(xué)生等各類的檔案,從而使之產(chǎn)生關(guān)聯(lián),為高校高質(zhì)量發(fā)展提供檔案數(shù)據(jù)支撐。

        基于知識圖譜構(gòu)建方式的利弊,選擇自下而上的構(gòu)建方式,構(gòu)建高校檔案管理系統(tǒng)。總體架構(gòu)自下而上劃分為數(shù)據(jù)解析層、智能識別層、語義關(guān)聯(lián)層和智能管理層。

        (1)數(shù)據(jù)分析層。數(shù)據(jù)分析層為高校檔案管理系統(tǒng)提供數(shù)據(jù)與收集規(guī)則。由于高校檔案資源分散于各個部門管理,且類型各異,有儲存在數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù),也有以圖片、文本形式存在的非結(jié)構(gòu)化數(shù)據(jù)。這些檔案沒有經(jīng)過系統(tǒng)處理,加大后期檔案的識別與加工難度,因此,需要在數(shù)據(jù)解析層設(shè)計檔案收集規(guī)則。針對不同格式的數(shù)據(jù)源分別開發(fā)對應(yīng)的解析工具,使用ETL引擎對來源數(shù)據(jù)實行解析、抽取和結(jié)構(gòu)化處理,保證從各數(shù)據(jù)源采集的數(shù)據(jù)可以統(tǒng)一清洗、規(guī)范、管理和使用,并嚴(yán)格按照統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)實行存儲。

        (2)知識抽取層。在智能識別層主要提取檔案中不同類型的實體、關(guān)系與屬性值,并用三元組的表示方式揭示各檔案數(shù)據(jù)之間的關(guān)聯(lián)。例如,從結(jié)構(gòu)化數(shù)據(jù)中生成檔案、人員、時間和具體發(fā)生的事情等實體,并獲取對應(yīng)的屬性值。由于高校檔案數(shù)據(jù)量過大,可利用機器學(xué)習(xí)方法完成檔案資源關(guān)系的抽取,按照知識圖譜中知識抽取的步驟將這些內(nèi)容存儲在數(shù)據(jù)庫中,并轉(zhuǎn)化為RDF三元組的形式,方便后續(xù)的管理與應(yīng)用。

        (3)知識關(guān)聯(lián)層。語義關(guān)聯(lián)層對抽取出來的信息實行知識融合和語義豐富化。從多個來源獲取檔案數(shù)據(jù)后,由于某些實體可能存在多種表達方式,因此,需要消除矛盾和歧義,并補充其屬性信息。在知識圖譜中,可視化直接提供了高校檔案的直接分析。根據(jù)建立的知識圖譜系統(tǒng)原型,使用相關(guān)的推理引擎對高校檔案中的關(guān)聯(lián)關(guān)系作出合理推理,以便后續(xù)的更新與管理。此外,可以利用文本相似度等方法對檔案中的內(nèi)容作出相似度分析,豐富圖譜中檔案的關(guān)聯(lián)程度和數(shù)據(jù)信息。

        (4)智能管理層。根據(jù)已經(jīng)構(gòu)建好的基于知識圖譜的高校檔案管理系統(tǒng),在智能管理層融合數(shù)據(jù)解析模塊、語義識別模塊和語義推理模塊等。利用檔案數(shù)據(jù)的特性,對知識圖譜中的數(shù)據(jù)開展知識挖掘,形成高校檔案和其他數(shù)據(jù)庫的新關(guān)聯(lián)。此外,在可視化功能上,使用者利用檢索功能對想要查詢的檔案資源進行調(diào)動,通過系統(tǒng)內(nèi)部的解析形成個人的檔案知識圖譜。

        3.系統(tǒng)核心功能

        (1)智能化采集與歸檔。目前,高校檔案資源主要包含紙質(zhì)資源與電子資源兩種。其中,紙質(zhì)檔案要利用掃描設(shè)備實現(xiàn)數(shù)字化。對于不同來源的信息數(shù)據(jù)利用智能化技術(shù)對檔案資源所包含的內(nèi)容展開智能識別、采集,排除無效信息,滿足用戶的查詢需求。

        (2)自動抽取與關(guān)聯(lián)。高校檔案種類多且繁雜,需要運用知識圖譜技術(shù)開展知識抽取。通過構(gòu)建實體、關(guān)系、屬性的RDF三元組,利用實體抽取辨別實例數(shù)據(jù)是否被定義,利用關(guān)系抽取分析實體關(guān)聯(lián)程度,利用屬性抽取采集特定實體信息。

        (3)語義增強。在傳統(tǒng)的檔案系統(tǒng)中,檔案之間的利用率極低,限制了檔案中真正有價值的信息流動。而基于知識圖譜的高校檔案管理系統(tǒng)可以利用語義技術(shù)促進檔案數(shù)據(jù)的關(guān)聯(lián)與利用,將檔案實行多元化語義關(guān)聯(lián),方便系統(tǒng)管理員智能化組織檔案資源,以增強檔案資源語義性,形成高質(zhì)量的高校檔案知識圖譜,提升檔案管理效率。

        五、高校檔案知識圖譜構(gòu)建思考

        通過開展高校檔案知識圖譜應(yīng)用研究,旨在推動高校檔案管理模式向語義關(guān)聯(lián)化與智能化發(fā)展。構(gòu)建高校檔案知識圖譜及開發(fā)高校檔案系統(tǒng)時,還需要考慮幾個問題:(1)由于現(xiàn)有的知識圖譜繪制軟件較多,選擇合適的繪圖軟件變得很有必要。已有學(xué)者對使用率較高的幾個知識圖譜軟件的功能、優(yōu)勢和缺陷進行了對比分析,使用者在選擇時仍要充分了解不同軟件的特性,充分理解其應(yīng)用的主題,并做出最合適的選擇。(2)知識圖譜繪制軟件多數(shù)對中文數(shù)據(jù)的兼容性不強,通常需要對中文數(shù)據(jù)展開格式轉(zhuǎn)化。

        參考文獻:

        [1]董 偉,朱小梅,徐少同.基于知識圖譜的近10年國際電子政務(wù)研究進展分析[J]. 圖書情報工作,2012(13):19-25.

        [2]張 璇,蘇 楠,楊紅崗,等.2000-2011年國際電子政務(wù)的知識圖譜研究——基于Citespace和VOSviewer的計量分析[J].情報雜志,2012,31(12):51-57

        [3]趙范心.基于知識圖譜的檔案知識服務(wù)模式思考[J].辦公室業(yè)務(wù),2022,(13):64-66.

        (作者單位:山東建筑大學(xué))

        猜你喜歡
        高校檔案知識圖譜
        探討高校檔案管理工作的創(chuàng)新策略
        商情(2016年42期)2016-12-23 15:07:57
        淺談信息化背景下的高校檔案服務(wù)
        國內(nèi)圖書館嵌入式服務(wù)研究主題分析
        國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
        高校檔案信息化建設(shè)存在的問題及有效策略
        以用戶需求為導(dǎo)向的高校檔案利用研究
        青年時代(2016年20期)2016-12-08 17:50:05
        近十五年我國小學(xué)英語教學(xué)研究的熱點、問題及對策
        基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
        智富時代(2016年12期)2016-12-01 16:28:41
        新形勢下高校檔案管理人員素質(zhì)要求
        基于知識圖譜的智慧教育研究熱點與趨勢分析
        国产精品久久人妻无码| 手机在线播放成人av| 人妻少妇中文字幕久久 | 日韩欧美亚洲综合久久影院ds| 香蕉久久夜色精品国产2020| 91色婷婷成人精品亚洲| 草逼视频免费观看网站| 国产精品美女久久久久av福利| 国内少妇偷人精品视频免费| 亚洲AV无码中文AV日韩A| 国产精品熟女少妇不卡| 女女女女女裸体处开bbb| 一本色道久久99一综合| 一区二区高清视频在线观看| 亚洲午夜精品一区二区麻豆av| 成人国产精品一区二区视频| 日韩精品久久久一区| 日本人妻系列一区二区| 亚洲黄色天堂网站在线观看禁18| 久久久久久久岛国免费观看| 久久成人永久免费播放| 在线视频自拍视频激情| 夹得好湿真拔不出来了动态图| 成年女人毛片免费视频| 天堂岛国精品在线观看一区二区| 亚洲精品女同一区二区三区| 国产成人亚洲精品无码av大片| 福利一区视频| 自拍偷拍一区二区三区四区| 亚洲成av人片在线观看| 少女高清影视在线观看动漫| 在线无码精品秘 在线观看| 亚洲精品天堂av免费看| 青青草是针对华人绿色超碰| 欧美老熟妇乱子| 亚洲最大日夜无码中文字幕| 搡老女人老妇女老熟妇69| 色婷婷久久亚洲综合看片| 中国凸偷窥xxxx自由视频妇科| 亚欧免费视频一区二区三区| 中文字幕亚洲入口久久|