亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        古籍中人物史料的關聯(lián)組織研究
        ——以《漢書·藝文志》中西漢經學家群體為例

        2023-03-12 09:14:16程結晶王璞鈺
        圖書館論壇 2023年3期
        關鍵詞:藝文志西漢本體

        程結晶,王璞鈺

        0 引言

        經學泛指先秦各家的學術要義,其作為古代傳統(tǒng)學術思想的主體,對古代文化乃至現今社會的傳統(tǒng)道德理念都起著不可或缺的作用,而經學家則是指闡釋、注解、研究與宣傳先秦各家學術要義與經典的學者。由于秦始皇“焚書”以及漢初上層統(tǒng)治集團對儒生經學的鄙夷,特別是漢高祖劉邦本人對儒生經學持“諸客冠儒冠來者,沛公輒解其冠,溲溺其中”的態(tài)度,因此西漢初年經學家及經學思想勢力普遍較弱[1]。自西漢武帝“罷黜百家,獨尊儒術”以來,經學便成為漢代統(tǒng)治階級的官方思想,得到了快速的發(fā)展,經學家也從民間走向官方,紛紛由“避世”走向“出仕”,研究西漢時期的經學家群體能很好地觀察這一時期經學的發(fā)展以及經學派內部學術思想的交流、沖突與融合[2]。

        本文引入關聯(lián)數據對原始數據分散的知識元素進行有序化組織,使其不再純粹依靠文本考證進行知識研究,而是將含有人物知識元素的史料資源轉化為數據資源,在此基礎上實現知識關聯(lián),以此推動西漢經學家史料挖掘的廣度與深度。所謂的古籍人物知識關聯(lián),便是指基于數字化的史籍資料與碎片化的人物數據,且有一定數據組織方式與體系的,核心實體記載于同一古籍中,具有相似特性的歷史人物描述性信息的語義化網絡開放數據集。此數據集最大的意義在于將原先分散在同一古籍中不同章節(jié)的相關知識元素匯聚到一起,以方便他人的使用,且可通過數據導出來進行社會網絡分析、統(tǒng)計分析或地理空間分析等深入的數據挖掘[3-4]?,F今,如何挖掘古籍資料中的歷史文化知識內容,已成為新文科背景下古籍數字化研究的重要內容。

        為方便數據收集與關系抽取,本文以《漢書·藝文志》(以下簡稱《藝文志》)中所記載的西漢經學家為例進行研究?!端囄闹尽纷鳛楝F存最早的歷史編年史目錄文獻,位列《漢書》十志之一[5-6],兼具文獻學、歷史學、文學、思想學以及圖書館學等多重學科研究價值。清代史學大家王鳴盛認為《藝文志》乃學問之眉目,著述之門戶[7]?!端囄闹尽纷鳛闈h代最具有代表性的史志書目,記載的各家學者均具時期代表性,具有人物研究價值,能直觀反映西漢時期各家學術的淵源、發(fā)展走向?!端囄闹尽匪涊d的人物甚多,僅《六藝略》中就記有人物110多個,既包括孔子、漢武帝、司馬相如等高度知名人物,也包括張禹、王同、大小夏侯等不知名卻有一定學術研究價值的人物。為切合研究主題以及便于數據收集工作,筆者將以《藝文志》中記載的經學家群體為研究對象,構建知識關聯(lián)的組織框架,旨在通過聚合重構知識元素來方便相關用戶群體與社會大眾的利用,同時也為其他古籍中人物群體史料的語義化知識組織研究提供參考借鑒[8]。

        1 相關研究

        截至2021年7月31日,在知網、維普、萬方等文獻檢索平臺所檢索得到的《藝文志》西漢經學家相關研究成果較少。因此,為擴大參考文獻資料來源,提高研究的科學性,資料收集與文獻梳理工作將圍繞西漢經學家與歷史文化領域的知識關聯(lián)、語義化知識組織等方面展開。西漢經學家作為西漢時期一個重要的士人群體,其學術思想具有較高的研究價值。此外,西漢經學家也可視為一個專有的歷史人物群體,歷代也不乏這類人物群體,如明清的進士群體、民國初年的上海女醫(yī)生群體等。諸多學者從不同研究視角,以不同的研究重心,對西漢經學家與歷史文化領域的知識關聯(lián)進行細致的研究與剖析,為本次研究提供了參考價值極高的文獻資料。對歷史人物群體人文知識的深入了解是進行史料資源知識關聯(lián)組織的重要前提,其他領域研究知識關聯(lián)、知識組織的文獻資料對本研究也具有重要的借鑒價值。

        1.1 西漢經學家人物群體研究

        西漢經學家群體作為此次研究的主要對象,在進行數據化前,需要盡可能地了解該群體的歷史變遷、生活環(huán)境、社會活動等相關人文知識。近年來,諸多學者進行了相關領域的研究??赚F紅通過展示西漢經學家從西漢初年至西漢末年人生道路選擇的變化過程,引出經學在西漢一朝的盛衰起伏趨勢,從而揭示經學地位與經學家命運之間的關聯(lián)[9]。胡建軍則對西漢知名經學家族——韋賢家族進行研究,通過家族世系的考證與詮釋,引出西漢韋賢家族的形成演變,進而指出韋賢家族在西漢經學發(fā)展中的地位,以此促進西漢經學研究的進步[10]?,F階段,學界關于西漢經學家研究已有較多的理論成果,促進了筆者對西漢經學家及其歷史變遷、社會活動等方面的了解,但在研究方法上仍以傳統(tǒng)意義上的文本考證為主,極少用到數據分析、統(tǒng)計分析等新文科所倡導的社會科學計算手段。

        1.2 歷史文化領域的知識關聯(lián)研究

        中國是一個擁有幾千年優(yōu)秀傳統(tǒng)文化的大國,有無數的歷史人物和歷史文化知識承載著中華優(yōu)秀傳統(tǒng)文化。諸多學者以不同的研究視角,對歷史人物和歷史文化知識進行重構、聚合、關聯(lián)。賈君枝等從發(fā)展的視角出發(fā),構建以SKOS模型化、RDF關聯(lián)化、關聯(lián)數據發(fā)布為主的知識組織框架,并系統(tǒng)概括了這一知識關聯(lián)對傳統(tǒng)文化知識的應用價值[11];在歷史文化領域的知識關聯(lián)研究中,部分學者將重點放在知識關聯(lián)的資源關聯(lián)與服務功能的研究上,李永卉等為構建地方詩詞資源的關聯(lián)組織,基于Drupal平臺,結合XAMPP集成包實現地方詩詞資源關聯(lián)數據平臺的搭建,使其可以進行可視化展示與語義推理服務[12];徐晨飛等構建了《方志物產》語義化知識組織的框架,并以此系統(tǒng)探討了實體識別、實體關聯(lián)、可視化展示等方志物產關聯(lián)數據發(fā)布的全過程[13]?,F階段知識關聯(lián)在人文學科中的應用研究,仍以“物”為主,“人”的研究較少,但眾多從不同視角和維度探討歷史文化知識資源語義化組織的研究,已經為后人研究歷史人物知識的關聯(lián)組織提供了參考價值極高的研究方法與視角。為實現《藝文志》西漢經學家人物知識資源的價值最大化,需要對其進行語義組織化,在完成實體屬性分析、詞表構建、本體模型確定的基礎上,完成知識組織框架的最終確定。

        知識關聯(lián)在歷史文化研究中已有較多的研究成果,盡管歷史人物方面研究成果較少,但已有部分學者逐步涉足歷史人物的知識關聯(lián)研究?,F階段,基于關聯(lián)組織的歷史人物史料方面也有一定的實踐成果,如中國歷代人物傳記資料庫平臺、上海圖書館家譜知識服務平臺等,為此次研究提供價值豐富的實例參考?;谏鲜鰧W者研究成果與國內實踐成果,本文將構建基于關聯(lián)數據的《藝文志》歷史人物史料語義化知識組織框架。

        2 《藝文志》西漢經學家人物知識的實體屬性與本體構建

        2.1 數據分類

        本次研究所采用的《藝文志》西漢經學家人物數據,不僅包含《藝文志》西漢經學家人物信息,還囊括《藝文志》西漢經學家相關事件信息、地理信息等諸多相關知識要素。基于數據類型、來源與表達方式的不同對數據進行梳理,梳理后的數據可歸納為4類,即《藝文志》西漢經學家人物對象數據、事件數據、地點數據、著述數據。

        (1)《藝文志》西漢經學家人物對象數據:指含有人物相關信息的數據集,包括來自經古籍考證的人名詞條的網絡文本數據、班固所著的《漢書·儒林傳》與司馬遷所著的《史記·儒林列傳》等關于西漢經學家的數字化文本。

        (2)《藝文志》西漢經學家相關事件數據:該數據集以含有《藝文志》西漢經學家相關事件要素的各類型數據為主,主要為來自經古籍考證的事件詞條的網絡文本數據、葉長青的《漢書·藝文志問答》與徐建委的《漢書·藝文志·六藝略箋證》等書籍的數字化文本。

        (3)《藝文志》西漢經學家相關地點數據:此類數據囊括含有相關地點信息的各類數據,以中國歷史地理信息平臺、中國歷史地理GIS數據庫等查找到的時空地名錄、相關古代地理數據、經緯數據等為主[14]。

        (4)《藝文志》西漢經學家相關著述數據:此類數據涵蓋《藝文志》西漢經學家相關著述的信息內容,數據主要來自上海圖書館開放數據平臺中文古籍聯(lián)合目錄及循證目錄所檢索的館藏著述數據、版本數據等。

        2.2 實體屬性

        本文所研究的《藝文志》西漢經學家人物知識主要強調特定時期與學術群體等屬性特征,即將時間限制于西漢,將學術群體限制于《藝文志》所記的經學家,將基礎文本限制于《藝文志》,其最大的意義在于可通過社會計量分析、統(tǒng)計分析或地理空間分析來進行深入的知識挖掘。該知識集合的分類表達基于上文的數據來源分析進行延伸,分別是人物、事件、地點、著述,且各類知識的數據來源在上文數據來源分析皆對應表述清楚,在此不做贅述。人物為知識中的主體內容與基礎,是知識的核心,本質上是對人物的描述性內容,方便對人物的進一步了解,是事件、著述的生成者,也是地點的觸發(fā)者。該集合可包括人物介紹、姓、異名、字、仕途、生年、卒年等;事件、著述是該知識的重要組成,一個事件中經常會關聯(lián)到不同的人物、地點,著述也是如此,事件可包括時間、事件影響等,而著述則包含作者、標題、內容、體裁、版本、創(chuàng)作時間、時代背景等,事件主要指的是該學者所經歷的重要事件,著述則是該學者一生所做的學術作品;地點則是該知識的重要補充內容,可包括地點名稱、別名、介紹、經緯等,地點是學者一生所經歷的重要地點?;谥R分析得出的具體實體屬性如圖1所示。

        圖1 《藝文志》西漢經學家人物知識的實體屬性

        2.3 本體模型

        本體可視為特定領域之中某套知識概念以及其相互之間關系形式化表達的抽象模型,常用于形容特定領域中的知識,其定義為共享概念模型的明確的形式化規(guī)范說明[15]?,F階段本體構建在文史知識工程中得到廣泛的應用。本體構建涉及特定領域中知識的開放共享,結合圖1中的實體屬性,本研究的知識劃分為人物、事件、地點、著述4個部分。為貼合該知識多本體的特點,本文將選擇多本體型構建方式構建本體。在本文已有本體模型理論與國內相關學者本體模型研究成果的基礎上,對本體服務中心(ONTHUB.NET)提供的本體進行選擇性復用。本體服務中心作為一個開放的本體數據庫,既可為用戶提供國內外諸多知名本體(如上海圖書館家譜知識庫本體、中國歷代人物傳記資料庫關聯(lián)數據系統(tǒng)本體、EMR本體等),也可為用戶提供本體的校驗功能。綜合多方因素,構建了《藝文志》西漢經學家人物知識的本體模型。

        根據本研究的知識關聯(lián)特點,遵循復用原則,選擇FOAF、SHLNames、LOV、DC、EVENT、GeoNames等國內外詞表進行復用,結合實際情況引入額外構建詞表(Character Knowledge Resources,CKR)。FOAF是一個致力于使用網絡連接人和信息的項目,可視為一種基于W3C框架與RDF技術的命名屬性和類的詞典,主要用于描述人物與學術關系內容;SHLNames基于FOAF項目的屬性描述,對人物本體類和屬性間的關系做了很大程度上的補充;LOV(Linked Open Vocabularies)即關聯(lián)開放詞表,是一個專為可用詞表而設計的詞表庫,對各領域、行業(yè)、類型的本體及其屬性進行了描述;DC(Dublin Core Metadata Initiative)即都柏林核心元數據計劃,主要指包括屬性、詞匯編碼模式、語法編碼模式和類在內的用于描述數字文獻的元數據術語的最新規(guī)范;EVENT(The Event Ontology)則是專用于描述事件概念的本體,該本體僅有6個一級類;GeoNames(The Geonames Ontology)主要針對GeoNames.org數據庫中定義的地理屬性進行描述,該本體常被用于地理區(qū)域本體的復用中。然而,盡管本文盡可能復用詞表,但在實際構建時復用的本體詞表往往無法滿足實際需要,因此需要根據研究的實踐需求構建CKR,以對《藝文志》西漢經學家人物知識的實體屬性做進一步補充與完善,完成本體模型屬性的確定。通過各本體間屬性的相互映射,實現本體間的關聯(lián)[16]。

        《藝文志》西漢經學家人物知識的4類核心實體在本體模型中均以類(class)來表示,即人物類(ckr:Person)、事件類(ckr:Event)、地點類(ckr:Place)、著述類(ckr:Work),且均按照自身特點與復用的詞表進行屬性內容的補充。人物類為本體中的核心、主體內容與基礎,其本質是對人物的介紹性描述,其知識書寫模式應敘述人名并作簡要文字描述且不等同于小傳,不做介紹;介紹則作為屬性來描述,即小傳(shl:brief-Biography),該類主要參照FOAF、SHLNames詞表來對《藝文志》西漢經學家人物屬性進行描述,并對人物類中的關聯(lián)數據標注屬性標簽即生地(shl:birthplace)、卒地(shl:deathplace)、創(chuàng)作著述(ckr:creatorOf)等,使其與其他實體內容相關聯(lián)。著述、事件類則是本體的重要構成者,主要復用了SHLNames、DC、EVENT,并利用自建詞表進行屬性內容的補充與完善;著述類、事件類的知識書寫模式均無介紹性文字僅敘述著述名、事件名,其時間屬性則與外部數據平臺實體關聯(lián),知識書寫模式將表示為“朝代+年號”。以上兩種類的信息描述均體現了知識的特殊性;地點類是本體的重要內容補充,地名屬性將與中國歷史地理信息平臺、中國歷史地理GIS數據庫等外部數據平臺鏈接,將地理的現今地名映射為古代地名,且附上對應朝代。該實體使用的主要是GeoNames與自建詞表(CKR),以此來對完成屬性內容的描述,由此體現知識的創(chuàng)新性[17]。最終確定的本體類及其屬性如表1所示。

        表1 《藝文志》西漢經學家人物知識的本體類及其屬性

        基于本體詞表的設定與相關屬性概念的定義說明,并借鑒李永卉等[12]《地方詩詞資源的關聯(lián)組織研究——以蘇軾鎮(zhèn)江詩詞為例》一文中的本體模型構建思路,最終確定知識本體模型(如圖2所示),以此描述《藝文志》西漢經學家人物知識的基本屬性特征,且該模型具備一定的可延伸性與復用性。對知識的數據分析、實體屬性分析、詞表構建以及本體模型確定,為《藝文志》西漢經學家知識關聯(lián)的組織框架構建做好基礎工作。

        圖2 《藝文志》西漢經學家人物知識本體模型

        3 《藝文志》西漢經學家人物知識關聯(lián)的組織框架

        知識關聯(lián)最大的優(yōu)勢是將原始資料集中分散的知識元素進行深度序化組織,關聯(lián)外部異構知識源,從而形成一個具備強大擴展性、共享性、復用性和聚合性的有機整體。通過對國內相關文獻的分析,結合上文提出的實體屬性分析、自建詞表以及本體模型構建,所構建的《藝文志》西漢經學家人物知識關聯(lián)的組織框架將涵蓋源數據層的數據收集與處理、數據轉換層的RDF數據生成、數據關聯(lián)層的實體關聯(lián)與關聯(lián)發(fā)布以及知識應用層的服務與利用等4個層次,如圖3所示。為提高研究的真實性與科學性,將以《藝文志》中《易》部分為基礎數據集,代入知識關聯(lián)組織框架的各步驟以開展實證研究。

        圖3 《藝文志》西漢經學家人物知識關聯(lián)組織框架

        3.1 源數據層

        源數據層的主要任務是收集作為知識關聯(lián)基礎的數據資料,以數字化的《藝文志》西漢經學家文獻資料集為基礎,結合領域的相關數據資料盡可能進行補充完善。因此,源數據層收集的數據資料呈多層級、異構化的特點,數據資料來源見上文的數據分類部分。為提高源數據質量,減少冗余、雜亂、過時、缺失甚至錯誤等問題的發(fā)生,通過深度學習的方式來對源數據進行分類、去重,即訓練計算機學習樣本數據的內在規(guī)律與表示層次,使其可識別文本數據集,并進行自動識別處理[18]。

        在諸多深度學習模型中,堆疊降噪自動編碼器(SDAs)可基于單個類別的組合來進行多項類別的人物識別與關系抽取,組合性強、靈活度高?,F階段,西藏大學計算機科學系珠杰[16]便以SDAs為基礎設計了人物關系抽取方法,并對類似于本文研究文本的人物關系語料進行了人物特征與關系抽取。為驗證SDAs應用于多層神經網絡的可行性,珠杰等進行了網絡深度實驗,實驗結果顯示一至四層神經網絡的召回率(Recall)與F值(F-Measure)一直處于疊增狀態(tài),由此可知,相較于單層神經網絡,多層神經網絡對SDAs的適用性更強,應對關系抽取、實體識別、實體抽取等復雜問題的能力也更突出[16]。此外,Bi-LSTM-CRF+BERT模型也適用于相應實體的識別工作,并通過人工校對的方式提高實體識別工作的質量。

        《藝文志》中《易》部分文本語料主要包括《藝文志》原文、經古籍考證的人名詞條數據以及數字化的相關文獻。由于現階段《藝文志》經學家資料分布呈分散化的態(tài)勢,難以收集,因此所用的TXT文本語料內容層級還較為薄弱,其主要目的是用于測試命名實體識別模型的功效。本次研究實際使用的命名實體識別模型為Bi-LSTM-CRF+BERT模型,主要任務是將每一行文本中的人名實體抽取出來,經過處理從2萬余字共284條文本數據中抽取出539個人名實體,識別結果(取兩位小數)如表2所示。由于文言文文本語料較難識別,因此尚存在部分文本語料識別錯誤或是識別不出的問題,實例如圖4所示,圖中對一條文本數據進行識別,所抽取出的人名“杜陵田”“王孫”存在錯誤,應通過文本語料的上下文語境以及古籍佐證將其重新規(guī)范標注為“田何”與“周王孫”。因此,需要投入大量的人力與時間對識別結果進行人工校對與重新標注,去除重復與無關人名實體。經此數據預處理,提取出人物、著述、事件、地點等一系列的命名實體數據,并形成人物、著述、事件及地點數據表存儲于關系型數據庫(RDB)中,形成一個基于關系模型、具有多層級結構的數據庫。該層作為關聯(lián)組織中的基礎層,決定了知識關聯(lián)的質量。

        圖4 人名實體識別示例

        表2 識別結果統(tǒng)計

        3.2 數據轉換層

        數據抽取層的主要任務是通過相應的本體模型將源數據層形成的關系型數據庫進行實體抽取,以轉換為RDF數據格式并存儲于相應數據庫中。RDF數據作為一般關聯(lián)數據所采用的數據模型,常以“實體—屬性—值”三元組的形式描述。通過上文構建的知識本體模型與自建詞表,本文所研究的《藝文志》西漢經學家人物知識的各類實體對象均已得到規(guī)范描述。為進一步凸顯本研究的科學性與嚴謹性,在進行RDF數據格式轉換前,需要進行屬性的構建,并需要借助庫中內置模塊進行內容類型與節(jié)點的設計。參照上文本體模型的設計,將內容類型設計為4類,即人物、地點、事件、著述,并以事件內容為例,對屬性的字段類型進行了添加,如field_agent代表事件介紹,field_product代表事件影響,field_releventWork代表相關著述。為進行內部數據關聯(lián),將相關著述、相關人物、發(fā)生地點及子事件等設置為Note Reference字段來關聯(lián)相關數據,以事件部分為實例的內容節(jié)點設置如表3所示。本研究的內容節(jié)點類型可包括文本、長文本、長文本和摘要、節(jié)點模塊元素以及Node Reference等,內容節(jié)點總計39個,其中節(jié)點模塊要素4個,文本9個,長文本9個,長文本和摘要4個,Node Reference共13個。

        表3 《藝文志》西漢經學家人物知識的內容節(jié)點設置(事件部分)

        為將存放于關系型數據庫的數據資源抽取、轉換、映射為RDF數據,本文將采用RDB2RDF進行直接映射。Direct Mapping映射語言可將關系型數據庫的結構直接映射為RDF詞表,并將關系型數據庫中的數據表轉換為RDF類(class),字段轉換RDF屬性(property),且遵循一對一對應原則[19-20]。關系型數據庫中的4個表所對應本體中的類及其數據屬性,在上文本體模型與詞表構建中已有詳細闡述,在此不做贅述。由于D2RQ第三方RDF轉化工具應用靈活性強、適用于市面上的大部分主流關系型數據庫,且支持Direct Mapping映射語言,更適用于本次研究[21]。經實體抽取、關系抽取、屬性抽取等處理生成的三元組數據將以XML格式存儲于Graph DB數據庫中,該數據庫內置的“前向鏈”(forwardchaining)推理機,能夠對導出知識進行同步推理更新,以此對知識進行動態(tài)存儲,為下一步知識關聯(lián)做好準備。

        3.3 數據關聯(lián)層

        數據關聯(lián)層的主要任務是數據的實體關聯(lián)與關聯(lián)發(fā)布,是語義化知識組織框架的核心。實體關聯(lián)的技術特點在于與外部數據集進行語義鏈接,以擴充西漢經學家人物知識的廣度,從而進一步完善領域知識內容。本文可通過多個開放數據平臺來進行關聯(lián),如上海圖書館開放數據平臺“人名規(guī)范庫”與“中國歷史紀年表”以及北京大學中國古代史研究中心“中國歷代人物傳記資料庫(CBDB)項目”等。以上海圖書館開放數據平臺“中國歷史紀年表”為例,“中國歷史紀年表”包括上古至今各個時期的朝代君王、君王姓名、君王年號、年號名稱、年號開始及結束時間等屬性。通過上海圖書館“中國歷史紀年表”對應條目SPARQL語句的在線查詢,并設置對象屬性與實體關系,由此將檢索得的資源URI(即“http://...”的形式)與人物實體進行關聯(lián),如表4所示。以《藝文志》中經學家京房的生卒年份“-77”“-37”為關鍵詞進行檢索,可得到相關URI及其中的朝代君王、君王名稱及年號屬性,“-77”檢索結果為西漢昭帝劉弗陵元鳳四年,“-37”檢索結果為西漢元帝劉奭建昭二年。京房其人于公元前45年方才舉孝廉出仕,檢索得其在西漢元帝劉奭初元二年出仕,結合其生卒年及本人將陰陽學說與政治相勾連的治學從政思想,因此可推理出這位經學大師的主要活動在西漢元帝劉奭時期。

        表4 京房生卒年年份與上海圖書館“中國歷史紀年表”的匹配[13]

        除京房外,其他西漢經學家人物的生卒年也可獲得相對應的中國歷史紀年與君王年號等信息。為進一步佐證實體關聯(lián)的可靠性,將人物實體“京房”,地點實體“長安”,事件實體“奏考功課吏法”,著述實體“《京房易傳》”代入本體模型進行驗證。如圖5所示,通過該實例進一步表明了實體關聯(lián)的可靠性與可行性。在完成實體關聯(lián)后,可通過配置服務器并遵循關聯(lián)數據發(fā)布四原則向社會大眾進行知識關聯(lián)發(fā)布。該原則在2006年由Tim Berners Lee提出,內容包括所有事物需對應賦予一個URI,使用HTTP URIs便于人們訪問資源,通過標準RDF為人們查找HTTP URIs提供信息等。由此進行對外的關聯(lián)數據發(fā)布,為知識應用提供一個可靠的開放數據平臺。

        圖5 《藝文志》西漢經學家人物知識實體關聯(lián)實例

        3.4 知識應用層

        知識應用層的主要任務是為用戶提供《藝文志》西漢經學家人物知識的利用服務,是知識關聯(lián)的最終目的?;跀祿P聯(lián)層形成的開放服務平臺,為用戶提供知識的語義檢索與瀏覽、知識挖掘、知識推薦、知識檢索、專題服務、知識推理、可視化分析、知識圖譜等服務,核心在于提升用戶的體驗,優(yōu)化知識共享。

        本文所構建的《藝文志》西漢經學家人物知識關聯(lián)的組織框架包括源數據層、數據轉換層、數據關聯(lián)層、知識應用層。從基礎的數據收集與預處理到數據轉換層的本體構建、實體抽取及RDF轉換,再到數據關聯(lián)層的實體關聯(lián)與關聯(lián)發(fā)布,最后到基于開放數據平臺的知識應用,形成一個結構嚴密、流程完整的知識關聯(lián)語義化組織框架。

        4 《藝文志》西漢經學家人物知識關聯(lián)組織的實踐價值

        4.1 提供參考借鑒與實踐探索路徑

        綜上,《藝文志》西漢經學家人物知識的實體屬性、本體模型以及知識關聯(lián)的組織框架可廣泛應用于人文社科領域的相關研究中。本文圖1中實體屬性不僅可對本文知識進行屬性定義,也可為檔案學領域中的家譜檔案、作家檔案、名人檔案等涉及人物主題的知識圖譜構建提供屬性定義的復用,圖3中源數據層的數據資料收集工作也可為文學領域中的名著人物關系圖譜構建、人物影響力分析等研究提供參考借鑒。此外,本文圖2中本體模型及表1的本體類及其屬性均可為數字人文領域中古籍本體與詞表構建提供復用功能,歷史人文研究領域中歷史文化知識資源的語義化組織研究也可復用圖3中的知識關聯(lián)框架。以上對實體屬性、本體模型及知識關聯(lián)的組織框架及其相關要素的復用的最大好處是減少研究人員在精力、時間上的浪費,推動知識的共享與傳播,同時也加快科研領域的探索。

        4.2 加快新技術理念與傳統(tǒng)歷史文化工作領域的深度融合

        數字人文作為一門數字技術與傳統(tǒng)人文學科相交叉的新型學科,最初被稱為人文計算,即通過計算機的高速計算功能輔助并解決人文學科的問題,然而隨著時間的發(fā)展與自身在人文學科領域的全方位滲透,現如今只要是涉及計算機和數字化的人文學科研究,均可被認為是數字人文[22]。本文在此次研究中利用到知識關聯(lián)、本體構建、數據發(fā)布等常見的信息技術及相關的信息研究方法。本文所構建的知識關聯(lián)組織框架,其各層均體現了數字技術與傳統(tǒng)文化工作相結合的理念,圖3中數據關聯(lián)層基于實體關聯(lián)的分類來擴充傳統(tǒng)文化知識內容,體現了數字技術與傳統(tǒng)文化工作的深度融合。通過將數字領域的技術、方法與理念應用于傳統(tǒng)文化工作中,拓寬了傳統(tǒng)歷史文化工作領域的研究路徑與思路。

        4.3 推動傳統(tǒng)歷史文化知識弘揚、傳播與擴散

        數字人文這一概念的提出,在為傳統(tǒng)文化工作提供新的理念、技術和方法的同時,也促進了傳統(tǒng)歷史文化知識的傳播與擴散。本文圖3中數據關聯(lián)層在優(yōu)化知識結構與內容的同時,也方便了用戶的知識檢索、發(fā)現與獲取[23]。此外,圖3中知識應用層也進一步推動傳統(tǒng)歷史人物文化知識的共享,如其中的知識推薦便是基于大數據相關思維,通過開放數據平臺來向相關群體提供所需要的歷史人物知識,或是借助網站內置的知識推薦系統(tǒng)向感興趣的用戶提供知識信息。此外,也可借助多媒體軟件來進行動態(tài)的歷史人物知識展示,以此提高受眾群體的接受滿意度,進一步推動知識的傳播與共享。

        5 總結與展望

        中華傳統(tǒng)文化作為中華民族數千年歷史沉淀下來的精華,是民族賴以生存和發(fā)展的根基,是民族興旺發(fā)達的精神支柱。歷史人物作為傳統(tǒng)文化的重要倡導者,對歷史文化的發(fā)展起著推動作用。然而,只對個別歷史人物進行研究,勢必會夸大個人的作用,進而否定歷史發(fā)展規(guī)律。因此,在對歷史人物進行研究時,要關注歷史人物的社會活動,將歷史人物與社會活動、歷史環(huán)境與他人關聯(lián)在一起,避免人物個體與社會產生割裂。經學作為中國古代學術思想的主體[24],蘊含了豐富的人文價值。西漢經學家們闡釋、注解、研究與宣傳經學,對中國古代經學的發(fā)展起到了不可或缺的作用,而《藝文志》所記載的西漢經學家更具代表性。研究其相關知識,觀察其社會活動,有利于對西漢經學發(fā)展史進行知識挖掘。早前,由于技術、時代、年代等因素,西漢經學家的人物知識難以進行聚合,影響到對知識的整理與挖掘。筆者在本文中根據《藝文志》西漢經學家人物數據來源分析,結合相關領域學者的研究思路,設計了《藝文志》西漢經學家人物知識的實體屬性與本體模型,并通過本體詞表進行描述。在此基礎上,設計了《藝文志》西漢經學家人物知識關聯(lián)的語義化知識組織框架,并對源數據層、數據轉換層、數據關聯(lián)層、知識應用層等自下而上的各層級進行闡述,由此探討了《藝文志》西漢經學家人物知識關聯(lián)的實踐價值。

        本文也存在較多的不足之處:其一,西漢一朝經學家人物眾多,但筆者為方便研究,僅選擇《藝文志》中所記載且知識內容較為完整的人物進行研究,而對于一些信息殘缺的人物并沒有利用知識推理來進行完善,以將其作為研究對象,若條件允許,殘缺或佚失人物也應當納入研究對象中。其二,受制于技術條件,在進行數據關聯(lián)層描述時,未利用開放數據平臺對其進行可視化展示等。其三,由于筆者知識領域有限,詞表構建時除去詞表中的復用部分,部分自建詞表的真實性及可用性有待檢驗。另外,由于各大開放歷史人文數據庫中的西漢經學家相關記載較少,且本框架仍處于本體驗證階段,因此未能對本文提出的知識關聯(lián)的語義化知識組織框架做進一步的實證分析。

        猜你喜歡
        藝文志西漢本體
        Abstracts and Key Words
        哲學分析(2023年4期)2023-12-21 05:30:27
        走馬樓西漢簡所見赦令初探
        對姜夔自度曲音樂本體的現代解讀
        中國音樂學(2020年4期)2020-12-25 02:58:06
        《明史·藝文志》史部地理類訂誤十一則
        天一閣文叢(2020年0期)2020-11-05 08:28:30
        西漢
        西漢玉器的鑒定
        文物天地(2019年6期)2019-07-12 09:17:26
        《我應該感到自豪才對》的本體性教學內容及啟示
        文學教育(2016年27期)2016-02-28 02:35:15
        《南明史·藝文志》經部著錄標準商榷
        天一閣文叢(2014年1期)2014-10-13 08:00:06
        《漢書·藝文志》“輯而論篹”句釋說——“論語”二字話
        魏源對西漢四家詩的評說
        亚洲国产色婷婷久久精品| 欧美自拍丝袜亚洲| 精品无码国产自产野外拍在线| 欧美成人免费观看国产| 二区三区视频在线观看| 日本一区二区三区人妻| 欧美颜射内射中出口爆在线| 精品国产一区二区三区av性色 | 老师粉嫩小泬喷水视频90| 国产91网址| 蜜桃视频在线免费观看一区二区| 日韩高清不卡一区二区三区| 97久久婷婷五月综合色d啪蜜芽 | 中文毛片无遮挡高潮| 久久久亚洲精品蜜臀av| 国产视频一区2区三区| 99国产精品99久久久久久| 久久精品国产精品| 久久久精品久久波多野结衣av | 国产精品美女久久久久久2018 | 风流少妇一区二区三区| 毛茸茸的女性外淫小视频| 人妻少妇精品久久久久久| 日韩好片一区二区在线看| 亚洲小说图区综合在线| 国产精品国产三级国产av主| 精品人妻69一区二区三区蜜桃| 在线天堂www中文| 精品国产一级毛片大全| 国产特黄1区2区3区4区| 国产美女主播视频一二三区| 欧美一区二区三区视频在线观看| 国产午夜精品久久久久免费视| 亚洲男人堂色偷偷一区| 国产女人精品一区二区三区 | 久久精品国产亚洲av久五月天 | 国语自产偷拍在线观看| 婷婷五月综合丁香在线| 男女好痛好深好爽视频一区 | 日本午夜理论片在线观看| 精品国产一区av天美传媒|