周笑盈(國家圖書館)
在智慧圖書館的運(yùn)行和發(fā)展過程中,知識資源是智慧圖書館建設(shè)的基礎(chǔ),具有數(shù)字化、網(wǎng)絡(luò)化、智能化、多維融合、泛在互聯(lián)、情境感知、高效協(xié)同、精準(zhǔn)增值、以人為本等特點(diǎn)。隨著智慧圖書館時(shí)代的到來,知識資源的闡釋與挖掘面臨著新的課題。
從整體看,智慧圖書館具有場所泛在化、空間虛擬化、手段智能化、內(nèi)容知識化、體驗(yàn)滿意化等特點(diǎn)。本文基于全國智慧圖書館體系的視角探究知識資源建設(shè)的內(nèi)涵與要素,提出以解構(gòu)抽取、融合重構(gòu)、人文呈現(xiàn)為主線的知識資源建設(shè)方法論模型,從數(shù)據(jù)層、組織層和消費(fèi)層探索全國智慧圖書館體系下知識資源的建設(shè)策略。
關(guān)于智慧圖書館的理論研究,一般從新基建、數(shù)字孿生、全程智能、用戶體驗(yàn)、數(shù)據(jù)驅(qū)動(dòng)、泛在網(wǎng)絡(luò)環(huán)境、協(xié)同理論、信息生態(tài)理論等視角論述。智慧圖書館的定義主要從哲學(xué)、技術(shù)、服務(wù)、空間、學(xué)科五個(gè)角度展開。劉煒等提出了智慧圖書館是“無人+ 自助+自動(dòng)感知+精準(zhǔn)高質(zhì)量”的科技型圖書館[1],唐燕等認(rèn)為智慧圖書館是“數(shù)字人文咨詢+ 數(shù)據(jù)管理+ 社交協(xié)作+ 創(chuàng)意制作+ 勞動(dòng)力孵化+ 數(shù)字人文素養(yǎng)培養(yǎng)”的綜合服務(wù)體[2]。關(guān)于智慧圖書館的構(gòu)成要素,有學(xué)者認(rèn)為是“人+物”[3],有學(xué)者認(rèn)為是“技術(shù)+資源+服務(wù)+館員+用戶”的協(xié)同體[4]。可見,智慧圖書館的關(guān)注熱點(diǎn)在宏觀層面表現(xiàn)為戰(zhàn)略規(guī)劃與體系管理,在微觀層面表現(xiàn)為知識服務(wù)、用戶服務(wù)與技術(shù)應(yīng)用。
智慧圖書館技術(shù)應(yīng)用研究主要從技術(shù)發(fā)展趨勢和建設(shè)項(xiàng)目探索兩個(gè)方面展開。相關(guān)技術(shù)包括:3R(AR、VR、MR)技術(shù)、標(biāo)識技術(shù)、協(xié)同計(jì)算技術(shù)、模擬仿真技術(shù)、深度學(xué)習(xí)技術(shù)、神經(jīng)網(wǎng)絡(luò)、人臉識別、深度學(xué)習(xí)、RFID、微服務(wù)平臺建設(shè)、人工智能、數(shù)據(jù)挖掘、區(qū)塊鏈等。建設(shè)內(nèi)容涉及:用戶場景庫、用戶畫像庫、知識資源庫,主要目標(biāo)是為讀者提供無感借閱、直播互動(dòng)、智慧場館、精準(zhǔn)推送、智慧書房等服務(wù)。吳丹等認(rèn)為,智慧圖書館服務(wù)有數(shù)據(jù)來源更加廣泛、數(shù)據(jù)融合更加全面、服務(wù)更加精準(zhǔn)化、更加注重?cái)?shù)據(jù)隱私和安全等 4 個(gè)發(fā)展趨勢[5]。
國家圖書館“十四五”發(fā)展規(guī)劃提出建設(shè)“全國智慧圖書館體系”[6],將總體架構(gòu)歸納為“1+3+N”:“1”指智慧圖書館的云基礎(chǔ)設(shè)施,“3”指搭載于其上的全國智慧圖書館管理系統(tǒng)、全網(wǎng)知識內(nèi)容集成倉儲和多維融合知識服務(wù)平臺,“N”指在全國各級圖書館及其基層服務(wù)點(diǎn)普遍建立線下智慧服務(wù)空間。我國圖書館中已有應(yīng)用現(xiàn)代信息技術(shù)積極推動(dòng)資源、服務(wù)、設(shè)施、管理等領(lǐng)域轉(zhuǎn)型創(chuàng)新的案例,為智能技術(shù)在圖書館的一些業(yè)務(wù)環(huán)節(jié)、服務(wù)領(lǐng)域的落地應(yīng)用提供解決方案。如:在大數(shù)據(jù)領(lǐng)域,上海交通大學(xué)建設(shè)了覆蓋圖書館主要業(yè)務(wù)的一站式統(tǒng)計(jì)平臺;在人工智能領(lǐng)域,武漢大學(xué)圖書館建設(shè)了“百度大腦”應(yīng)用;在物聯(lián)網(wǎng)領(lǐng)域,深圳圖書館支持圖書智能盤點(diǎn)、定位、防盜及街區(qū)自助圖書館;在情境感知領(lǐng)域,國家圖書館、福州圖書館、上海交通大學(xué)圖書館建設(shè)了 VR、AR 閱讀體驗(yàn)區(qū)[7]。
伴隨知識化處理技術(shù)的提升與圖書館用戶服務(wù)水平的發(fā)展,下一代智慧圖書館的知識資源建設(shè)將充分融合圖書館的資源數(shù)據(jù)、用戶數(shù)據(jù)、機(jī)構(gòu)數(shù)據(jù)和空間數(shù)據(jù),利用智能標(biāo)引、文本挖掘、多源異構(gòu)融合、泛在互聯(lián)、量化分析、多維可視化展示等技術(shù),促進(jìn)細(xì)顆粒度資源挖掘、跨領(lǐng)域數(shù)據(jù)關(guān)聯(lián)、多維度計(jì)量分析和可視化故事表達(dá),實(shí)現(xiàn)科學(xué)性數(shù)據(jù)決策、場景化閱讀感知和交互式知識發(fā)現(xiàn),進(jìn)而促進(jìn)知識資源的智慧流轉(zhuǎn)和知識服務(wù)的價(jià)值再造。智慧圖書館知識資源建設(shè)涉及的要素很多,本文從數(shù)據(jù)要素、技術(shù)要素、場景要素和功能要素四個(gè)維度入手進(jìn)行分析。其中,數(shù)據(jù)要素是基礎(chǔ),技術(shù)要素是關(guān)鍵,場景要素是目標(biāo),功能要素是價(jià)值體現(xiàn)。
知識資源建設(shè)的基礎(chǔ)是圖書館豐富的數(shù)據(jù)要素。圖書館是資源的集散地,長期致力于資源采集加工、知識組織和傳播傳承,傳統(tǒng)圖書館的數(shù)據(jù)通常包括資源數(shù)據(jù)、用戶數(shù)據(jù)和機(jī)構(gòu)數(shù)據(jù),這些數(shù)據(jù)廣泛存在于管理系統(tǒng)中。資源數(shù)據(jù)規(guī)模大,具有跨領(lǐng)域、多種類、來源不同、粒度不一、格式迥異、缺乏關(guān)聯(lián)的特點(diǎn),跨機(jī)構(gòu)的共建與資源共享為知識資源建設(shè)奠定了一定的數(shù)據(jù)基礎(chǔ)。智慧圖書館語境下知識資源的數(shù)據(jù)要素應(yīng)從全方位、立體化、資產(chǎn)化的角度考慮建設(shè)綜合性的數(shù)據(jù)生態(tài),在傳統(tǒng)的以文獻(xiàn)為基礎(chǔ)的對象數(shù)據(jù)和元數(shù)據(jù)建設(shè)的基礎(chǔ)上,還應(yīng)新增本體數(shù)據(jù)、三維立體資源和數(shù)據(jù)集資源。用戶數(shù)據(jù)不僅包括用戶的基本信息數(shù)據(jù),還應(yīng)增加用戶行為數(shù)據(jù)、行業(yè)監(jiān)測數(shù)據(jù)。機(jī)構(gòu)數(shù)據(jù)在充分梳理各成員機(jī)構(gòu)的管理數(shù)據(jù)和服務(wù)數(shù)據(jù)的基礎(chǔ)上,應(yīng)向時(shí)空角度延伸,新增空間數(shù)據(jù)和業(yè)務(wù)流程數(shù)據(jù)。
知識資源建設(shè)的條件是可被廣泛應(yīng)用的新型智能技術(shù),如智能標(biāo)引、文本挖掘、量化分析、關(guān)聯(lián)數(shù)據(jù)、知識圖譜和區(qū)塊鏈等技術(shù),它們?yōu)橹R資源建設(shè)提供了路徑和解決方案。如:利用本體技術(shù)從高層視角實(shí)現(xiàn)對隱性知識的顯性表示,將異構(gòu)資源納入統(tǒng)一的知識模型中;利用知識圖譜技術(shù)建立抽象的知識共享模型,達(dá)到統(tǒng)一的知識建模和知識表示,進(jìn)而提供語義分析和個(gè)性化的知識發(fā)現(xiàn)服務(wù)。
智慧圖書館背景下的知識資源服務(wù)場景可總結(jié)為空間體驗(yàn)服務(wù)、泛在閱讀服務(wù)、情境閱讀服務(wù)、虛擬參考咨詢服務(wù)、虛擬在線教育服務(wù)、用戶互動(dòng)與反饋服務(wù)。從總體來看,知識服務(wù)是知識資源建設(shè)的根本目標(biāo),智慧圖書館的建設(shè)應(yīng)該更好地整合、組織和定位資源,以幫助用戶更容易、更快速、更高效地利用圖書館的資源,支持用戶自主知識發(fā)現(xiàn)。如:為研究者提供大數(shù)據(jù)分析工具和語義檢索、關(guān)系發(fā)現(xiàn)、自主專題生成等個(gè)性化的知識定制服務(wù),幫助用戶自主知識發(fā)現(xiàn);通過智慧服務(wù)設(shè)備和智慧服務(wù)空間(如RFID、智能書架、智能門禁與人臉識別、智能展覽、智能監(jiān)控、智能機(jī)器人等)實(shí)現(xiàn)智慧服務(wù)場景的嵌入與融合;基于已有平臺優(yōu)勢為用戶提供增值服務(wù),包括用戶的個(gè)人活動(dòng)管理、用戶評價(jià)、閱讀報(bào)告、學(xué)科分析、自動(dòng)查新與科技報(bào)告等。
知識資源建設(shè)的價(jià)值是依靠功能要素實(shí)現(xiàn)的,傳統(tǒng)圖書館的功能包括社會記憶功能、知識管理功能、文化教育功能和文明傳承與發(fā)展功能。智慧圖書館在新時(shí)代也承擔(dān)了新的智慧服務(wù)理念和價(jià)值觀,強(qiáng)調(diào)在具體的服務(wù)過程中,全面捕捉、記錄和分析讀者行為和偏好,從而融通資源優(yōu)勢,建立多維的服務(wù)體系和形式,其目標(biāo)是促進(jìn)資源挖掘從“事實(shí)—信息—智力—知識—智慧”的功能進(jìn)階(見圖1)。
圖1 知識獲取模型框架
根據(jù)數(shù)據(jù)生命周期和圖書館資源開發(fā)利用的基本模式及其理論基礎(chǔ),結(jié)合智慧圖書館數(shù)據(jù)類型和特點(diǎn),本研究構(gòu)建了“解構(gòu)抽取—融合重構(gòu)—人文呈現(xiàn)”的知識資源建設(shè)方法論模型(見圖 2)。
圖2 知識資源建設(shè)方法論模型
傳統(tǒng)的書目著錄往往以資源種類或篇章作為最小單元,無法充分揭示資源內(nèi)容特征和發(fā)揮文獻(xiàn)整合利用的功能,在知識元、關(guān)聯(lián)數(shù)據(jù)等概念提出后,傳統(tǒng)的文獻(xiàn)著錄單元讓位于知識單元。
知識資源的聚合是解構(gòu)抽取的基礎(chǔ),即通過文獻(xiàn)整合、聯(lián)盟性整合及跨學(xué)科互操作等方式建立大型的知識庫群,匯聚海量網(wǎng)絡(luò)信息資源、各類數(shù)字文獻(xiàn)資源和特色館藏自建資源,將資源的聚合視角從傳統(tǒng)的載體形式擴(kuò)展到內(nèi)容、時(shí)空和知識體系。在智慧圖書館建設(shè)背景下,知識資源建設(shè)的關(guān)注點(diǎn)從單件文獻(xiàn)的數(shù)字化保存與著錄轉(zhuǎn)向?qū)χR內(nèi)容的解構(gòu)和知識單元的建設(shè),利用語義網(wǎng)、知識圖譜、大數(shù)據(jù)、智能計(jì)算等技術(shù),開展對知識資源的細(xì)顆粒度內(nèi)容標(biāo)識、關(guān)鍵知識點(diǎn)的標(biāo)簽和標(biāo)引建設(shè),在對文獻(xiàn)的形式結(jié)構(gòu)和邏輯結(jié)構(gòu)分析的基礎(chǔ)上,構(gòu)建細(xì)顆粒著錄的數(shù)據(jù)框架[8],并根據(jù)不同層級的細(xì)顆粒度知識單元設(shè)置著錄字段,最終的著錄成果為XML 格式的數(shù)據(jù)信息,為資源的精細(xì)化揭示和知識化、專題化服務(wù)奠定基礎(chǔ)。
本研究提出知識資源解構(gòu)抽取的兩個(gè)維度:基于知識結(jié)構(gòu)的文獻(xiàn)著錄和基于文獻(xiàn)內(nèi)容的知識標(biāo)引。基于知識結(jié)構(gòu)的文獻(xiàn)著錄以文獻(xiàn)的最小單元為加工單位,拆分各組成要素,得到由文獻(xiàn)層、節(jié)段單元層和知識單元層組成的細(xì)粒度描述單元。在此基礎(chǔ)上開展知識內(nèi)容標(biāo)引,標(biāo)引對象一般從文獻(xiàn)內(nèi)容出發(fā),以人物、機(jī)構(gòu)、地理名稱、事件或其他具有標(biāo)目意義的關(guān)鍵詞為標(biāo)引單元,各個(gè)知識實(shí)體均具有屬性值。如:人的屬性包括姓名、性別、出生日期、國籍、所屬機(jī)構(gòu)、親屬關(guān)系、作品等;事件的屬性包括事件名稱、重要人物、主要地點(diǎn)、過程、結(jié)果等;地理名稱的屬性包括地名、年代、沿革、隸屬、地理位置等;書目資源的屬性包括標(biāo)題、名稱、出版社、責(zé)任者、語言、版權(quán)、標(biāo)識號、來源等。
針對解構(gòu)抽取環(huán)節(jié)提煉出了細(xì)顆粒度的知識單位,利用知識本體、語義知識圖譜等技術(shù),按照特定的邏輯進(jìn)行關(guān)聯(lián),以形成特定主題下規(guī)范有序的知識網(wǎng)絡(luò)。泛在互聯(lián)下的多維度組織通過自上而下的知識組織形式抽象出獨(dú)立于領(lǐng)域且與資源的載體和格式無關(guān)的高層互操作層,是對知識的整理、加工、揭示、控制及有序化操作。
融合重構(gòu)的核心是構(gòu)建知識組織本體和搭建知識圖譜。構(gòu)建知識組織本體一方面包括需要復(fù)用已有的領(lǐng)域本體,并在此基礎(chǔ)上補(bǔ)充相關(guān)元素加以改進(jìn),另一方面則需要自建本體,篩選本領(lǐng)域相關(guān)的元數(shù)據(jù)標(biāo)準(zhǔn),構(gòu)建術(shù)語詞表,定義類和屬性,完成本體模型的設(shè)計(jì)和轉(zhuǎn)換。知識圖譜是充分利用和有效呈現(xiàn)細(xì)粒度標(biāo)引資源的關(guān)鍵方法,為深層次的資源知識發(fā)現(xiàn)提供了可能,知識圖譜的構(gòu)建主要通過語義關(guān)聯(lián)和系統(tǒng)構(gòu)建兩個(gè)步驟。語義關(guān)聯(lián)是指基于細(xì)顆粒度標(biāo)引的知識實(shí)體屬性信息,構(gòu)建知識實(shí)體之間、屬性之間、知識實(shí)體與屬性之間的關(guān)系,通過元數(shù)據(jù)框架完成書目關(guān)系和字段的映射擴(kuò)展;系統(tǒng)構(gòu)建是通過知識獲取、知識存儲、知識建模和知識發(fā)布與服務(wù)四個(gè)流程完成知識圖譜的運(yùn)維和操作。知識圖譜技術(shù)可以利用先進(jìn)的挖掘算法分析圖譜關(guān)聯(lián)路徑,對資源相關(guān)的人、事、地、時(shí)等基礎(chǔ)要素潛藏關(guān)系進(jìn)行挖掘[9],并以可視化的方式完成展示,如針對“人”的社會網(wǎng)絡(luò)關(guān)系構(gòu)建和時(shí)空軌跡構(gòu)建,針對“事”的歷史線索串聯(lián)等。
圖3 知識資源融合重構(gòu)架構(gòu)
人文呈現(xiàn)是大數(shù)據(jù)時(shí)代的新課題,傳統(tǒng)圖書館往往更關(guān)注數(shù)據(jù)建模、數(shù)據(jù)整合等數(shù)據(jù)處理業(yè)務(wù),但有一項(xiàng)關(guān)鍵技能經(jīng)常被忽視:清晰有效地表達(dá)數(shù)據(jù)結(jié)果的能力,即數(shù)據(jù)的人文呈現(xiàn)能力。數(shù)據(jù)的人文呈現(xiàn)是數(shù)據(jù)科學(xué)的“最后一公里”問題[10],其重點(diǎn)是將數(shù)據(jù)中的價(jià)值內(nèi)容傳遞出去,智慧圖書館的知識資源呈現(xiàn)更需要將數(shù)據(jù)洞察力轉(zhuǎn)換為數(shù)據(jù)行動(dòng)力,完成數(shù)據(jù)可視化產(chǎn)品和數(shù)據(jù)故事化產(chǎn)品的開發(fā)。
本研究認(rèn)為,知識資源的人文呈現(xiàn)主要涉及兩方面內(nèi)容:數(shù)據(jù)可視化與故事化表達(dá)。數(shù)據(jù)可視化強(qiáng)調(diào)易于理解、易于感知和易于洞察,而故事化表達(dá)則強(qiáng)調(diào)易于記憶、易于認(rèn)知和易于體驗(yàn)。知識資源的人文呈現(xiàn)分為兩個(gè)基本步驟:從數(shù)據(jù)到可視化模型(通過可視化建模)以及從可視化模型到故事化表達(dá)(通過故事化敘事)。數(shù)據(jù)呈現(xiàn)涉及時(shí)空維度、目的維度、場景維度:時(shí)空維度以帶有空間坐標(biāo)或時(shí)間信息的數(shù)據(jù)的可視化為重點(diǎn);目的維度包括說明型數(shù)據(jù)呈現(xiàn)、解釋型數(shù)據(jù)呈現(xiàn)、陳述型數(shù)據(jù)呈現(xiàn)和預(yù)測型數(shù)據(jù)呈現(xiàn);場景維度包括虛擬教育服務(wù)、專題特色資源推介、立體資源整合、文化遺產(chǎn)實(shí)物數(shù)字化延展、空間智能導(dǎo)航、用戶信息分析等角度。
圖4 知識資源的人文呈現(xiàn)模型
綜上所述,智慧圖書館知識資源建設(shè)的本質(zhì)是立體化的數(shù)據(jù)收集、智能化的數(shù)據(jù)解構(gòu)、泛在化的知識組織和全方位的知識呈現(xiàn),通過知識解構(gòu)、知識組織和知識呈現(xiàn),達(dá)到知識融通的目的。
智慧圖書館中知識資源建設(shè)對公共圖書館館藏資源的挖掘、展示、重構(gòu)與傳承具有重要的意義。本文在提出“解構(gòu)抽取—融合重構(gòu)—人文呈現(xiàn)”的知識資源建設(shè)路徑的基礎(chǔ)上,從數(shù)據(jù)層、組織層和消費(fèi)層總結(jié)了知識資源建設(shè)的策略選擇。
知識資源解構(gòu)的核心是構(gòu)建單元層級的細(xì)顆粒度加工框架,細(xì)顆粒度加工框架是文獻(xiàn)資源全部數(shù)據(jù)描述信息的集合,分為文獻(xiàn)層、片段單元層、知識單元層等三個(gè)層級。
4.1.1 文獻(xiàn)層
文獻(xiàn)層描述文獻(xiàn)的基本元數(shù)據(jù)信息,書目數(shù)據(jù)內(nèi)容包含題名、責(zé)任者、出版信息、主題詞、分類號等字段。
4.1.2 片段單元層
片段單元層依據(jù)加工對象的文獻(xiàn)形態(tài)、邏輯結(jié)構(gòu)、服務(wù)需求等確定知識資源的加工粒度,標(biāo)引的對象一般按照文獻(xiàn)結(jié)構(gòu)的最小單元?jiǎng)澐郑纾簣D書類資源的文獻(xiàn)結(jié)構(gòu)單元一般包括:封面、題詞頁、書名頁、出版說明、版權(quán)頁、序、前言、凡例、目次、正文篇章、圖表、參考文獻(xiàn)、附錄、索引、插頁、后記(跋)、封底等;報(bào)紙一般以單篇文章(單個(gè)廣告)作為著錄單元;古籍文獻(xiàn)結(jié)構(gòu)單元一般包括:封面、版權(quán)頁、題名頁、牌記、序、凡例、正文各卷、跋、簽條、封底等。片段單元層的著錄內(nèi)容包括基本信息著錄、內(nèi)容著錄和連接著錄?;拘畔影?biāo)識符、結(jié)構(gòu)類型、語種、名稱、創(chuàng)建者、著錄對象的起止頁、總頁數(shù)、摘要等;內(nèi)容著錄涉及內(nèi)容層面的信息標(biāo)引,包括分類號、關(guān)鍵詞、個(gè)人名稱、機(jī)構(gòu)名稱、地理名稱、事件名稱等,標(biāo)引詞盡量復(fù)用受控詞表,在無特定受控詞表的情況下,可選擇自由詞或依據(jù)主題設(shè)計(jì)分類標(biāo)簽體系;連接著錄通過唯一標(biāo)識符信息關(guān)聯(lián)文獻(xiàn)層和圖表層,著錄來源文獻(xiàn)ID、參考文獻(xiàn)、圖表ID 等。
4.1.3 知識單元層
知識單元層在語篇和句群結(jié)構(gòu)分析的基礎(chǔ)上對知識內(nèi)容的語義功能進(jìn)行描述,知識單元的體量與維度并非固定的,可能存在于同一個(gè)語句中,也可能是多個(gè)語段、篇章的集合。
在劃分不同層級的細(xì)粒度片段單元后,針對片段單元中抽取的人物、機(jī)構(gòu)、事件、地理名稱等其他具有標(biāo)目意義的關(guān)鍵詞作為標(biāo)目開展知識標(biāo)引,參照文獻(xiàn)著錄規(guī)則完成知識單元著錄。如:針對人物知識單元的標(biāo)引,除了對人物名稱、性別、時(shí)代、生卒年、籍貫、職官等進(jìn)行著錄外,同時(shí)標(biāo)引關(guān)系人物、關(guān)系事件和關(guān)系機(jī)構(gòu);針對特色知識單位的專題標(biāo)引,例如對古籍鈐印的印文、印章、印主等內(nèi)容進(jìn)行標(biāo)引。
最終借助知識定位技術(shù)及單元層關(guān)聯(lián)技術(shù),在文獻(xiàn)層、片段單元層、知識單元層之間按照聚合單元層級組織相互關(guān)聯(lián)的數(shù)據(jù)ID 形成知識體系。
圖5 不同層級的信息組織框架
本研究在總結(jié)知識資源融合重構(gòu)的方法論模型的基礎(chǔ)上,從學(xué)科建設(shè)、文獻(xiàn)內(nèi)容建設(shè)和知識圖譜服務(wù)三個(gè)角度提出了知識資源組織與揭示的建設(shè)方向。
4.2.1 基于圖書情報(bào)學(xué)的領(lǐng)域本體模型
在學(xué)科建設(shè)方面,本文以圖書情報(bào)學(xué)為例展開論述,利用已有的學(xué)術(shù)專著梳理出圖書情報(bào)學(xué)的學(xué)科體系結(jié)構(gòu),以此為基礎(chǔ)對領(lǐng)域本體的概念集進(jìn)行第一次分類,然后對每一個(gè)大類進(jìn)行二次分類,再選擇部分二級類目進(jìn)行更細(xì)致的分類,所得類目即為核心概念集。根據(jù)權(quán)威圖書情報(bào)學(xué)教材《圖書館學(xué)概論》《圖書情報(bào)學(xué)發(fā)展導(dǎo)覽》《圖書館學(xué)研究概論》將圖書情報(bào)學(xué)的領(lǐng)域知識劃分為4 個(gè)大類,分別為圖書情報(bào)學(xué)、圖書情報(bào)學(xué)研究代表人物、圖書館以及文獻(xiàn)。
(1) 圖書情報(bào)學(xué)類。該類下設(shè)3 個(gè)子類:① 圖書情報(bào)學(xué)基礎(chǔ)理論,主要研究和闡明圖書情報(bào)學(xué)的研究對象、學(xué)科性質(zhì)、社會職能等;② 圖書情報(bào)學(xué)研究方法,主要研究圖書情報(bào)學(xué)常用的研究方法,如文獻(xiàn)研究法、訪問研究法、調(diào)查研究法、實(shí)驗(yàn)研究法、統(tǒng)計(jì)分析法、歷史研究法、文獻(xiàn)計(jì)量法等;③ 圖書情報(bào)學(xué)應(yīng)用技術(shù),主要研究文獻(xiàn)保護(hù)、縮微、計(jì)算機(jī)管理等新技術(shù)如何應(yīng)用于圖書館學(xué)研究。
(2)圖書情報(bào)學(xué)研究代表人物類。該類下設(shè)子類:國內(nèi)圖書情報(bào)學(xué)者、國外圖書情報(bào)學(xué)者。
(3)圖書館類。該類下設(shè)4 個(gè)子類:① 圖書館事業(yè),主要研究圖書館歷史、圖書館事業(yè)結(jié)構(gòu)、圖書館聯(lián)盟和圖書館法;② 圖書館業(yè)務(wù),主要研究圖書館業(yè)務(wù)機(jī)構(gòu)設(shè)置,包括文獻(xiàn)資源建設(shè)、用戶服務(wù)、特色館藏建設(shè)、自動(dòng)化管理等;③ 圖書館管理,主要研究圖書館規(guī)章制度設(shè)計(jì)、圖書館統(tǒng)計(jì)、圖書館工作評價(jià)與圖書館評估等;④ 數(shù)字圖書館,主要研究虛擬圖書館、智慧圖書館等。
(4)文獻(xiàn)類。文獻(xiàn)的子類則分別按時(shí)間、內(nèi)容和載體等進(jìn)行劃分,在完成圖書情報(bào)學(xué)領(lǐng)域本體框架構(gòu)建后,基于對每個(gè)類的分析,可為每個(gè)類設(shè)定屬性集,定義類目概念之間的相互關(guān)系,并創(chuàng)建若干類的實(shí)例。
4.2.2 基于文獻(xiàn)內(nèi)容的本體關(guān)系模型
采用本體建模方法,構(gòu)建人物類、時(shí)間類、地點(diǎn)類、事件類、機(jī)構(gòu)類、實(shí)物類、作品類,并設(shè)計(jì)類間關(guān)系描述模型。
人物類可細(xì)分為責(zé)任者和內(nèi)容人物,同時(shí)可按性別、職業(yè)、家庭關(guān)系、社會地位等進(jìn)行屬性描述;機(jī)構(gòu)類可細(xì)分為內(nèi)容組織、責(zé)任者單位和出版單位;事件類可按軍事活動(dòng)、文化活動(dòng)、政治活動(dòng)、宗教活動(dòng)、經(jīng)濟(jì)活動(dòng)、心理活動(dòng)、自然活動(dòng)細(xì)分;時(shí)間類可細(xì)分為創(chuàng)作時(shí)間和出版時(shí)間;地點(diǎn)類可細(xì)分為創(chuàng)作地點(diǎn)和內(nèi)容地點(diǎn)。
在各類知識實(shí)體細(xì)分的基礎(chǔ)上,以文獻(xiàn)的知識單元為父節(jié)點(diǎn),定義不同知識單元間的關(guān)系,關(guān)系屬性可以通過繼承機(jī)制進(jìn)行擴(kuò)展和衍生,從而勾畫出文獻(xiàn)資源中的重要人物、組織機(jī)構(gòu)和事件之間的關(guān)系,建立起知識單元網(wǎng)絡(luò)。關(guān)系類別一般從內(nèi)容特征角度進(jìn)行描述,如表1 列出了部分人物、機(jī)構(gòu)、時(shí)間、空間、作品等知識單元之間的關(guān)聯(lián)關(guān)系。
表1 知識單元間語義關(guān)系定義
4.2.3 強(qiáng)化數(shù)據(jù)感知的知識圖譜
知識圖譜能夠?qū)⒅R及知識間的關(guān)系轉(zhuǎn)化為可理解的視覺表達(dá)形式,特別是在瀏覽、研究大規(guī)模數(shù)據(jù)時(shí),有助于發(fā)現(xiàn)隱藏特征和規(guī)律。本研究提出知識圖譜服務(wù)的兩種應(yīng)用場景:關(guān)聯(lián)關(guān)系知識圖譜和發(fā)展變化知識圖譜。
(1)關(guān)聯(lián)關(guān)系知識圖譜的建設(shè)對象一般為文獻(xiàn)資源、敘詞表或知識條目信息,建設(shè)內(nèi)容包括資源語義網(wǎng)絡(luò)、主題敘詞表思維導(dǎo)圖或知識條目關(guān)聯(lián)圖譜,一般采用旭日圖、元堆圖、樹狀圖、氣泡圖、結(jié)構(gòu)圖、熱力圖、標(biāo)簽云、網(wǎng)絡(luò)圖等可視化呈現(xiàn)形態(tài)將知識及知識間的關(guān)系轉(zhuǎn)化為可理解的視覺表達(dá),對數(shù)據(jù)中的人、事、物等構(gòu)建社會網(wǎng)絡(luò),理清社會關(guān)系,將用戶與資源密切關(guān)聯(lián),重點(diǎn)關(guān)注高頻出現(xiàn)的資源與用戶信息,實(shí)現(xiàn)知識資源的多重關(guān)系發(fā)現(xiàn)。
(2)發(fā)展變化知識圖譜建立在知識計(jì)算的基礎(chǔ)上,通過文本分析、社會網(wǎng)絡(luò)分析、知識挖掘等技術(shù)方法,揭示資源集合中內(nèi)在結(jié)構(gòu)特征,發(fā)現(xiàn)海量數(shù)字化對象中隱藏的知識脈絡(luò)與演化規(guī)律。如:通過詞頻統(tǒng)計(jì)、詞匯共現(xiàn)、時(shí)空演化技術(shù)分析資源內(nèi)容特征與演化趨勢;通過跨文本比對、知識片段比對的方式展示知識流變歷程;通過提供文本分析工具和開放數(shù)據(jù)形式幫助用戶自主完成知識發(fā)現(xiàn),實(shí)現(xiàn)跨領(lǐng)域共建共治共享;通過時(shí)空敘事圖譜、地圖、時(shí)間軸等方式展示資源內(nèi)容或社會記憶的發(fā)展變遷。
新型數(shù)字資源是指運(yùn)用VR、AR、MR 多種數(shù)字創(chuàng)意技術(shù),將原始紙質(zhì)文獻(xiàn)的物理形態(tài)在三維立體空間中形象地還原初始風(fēng)貌,并進(jìn)行故事化解讀,為讀者提供交互性、立體化和沉浸式的多維度閱讀體驗(yàn)。新型數(shù)字資源具有虛擬性、交互性、臨場感、沉浸性特征,強(qiáng)調(diào)為讀者創(chuàng)設(shè)一種視覺、聽覺、觸覺的三維立體感受,營造虛實(shí)場景深度融合效果,產(chǎn)生身臨其境之感。其加工對象既包括文化遺產(chǎn)等重要實(shí)物資源,又包括古籍特藏等傳統(tǒng)文獻(xiàn)內(nèi)容。
4.3.1 新型數(shù)字資源的應(yīng)用場景
一是主題閱讀推廣,遴選適用于閱讀推廣的內(nèi)容,讓用戶充分了解主題資源的知識背景,完成知識解讀,引導(dǎo)深度閱讀。建設(shè)主題包括:教育、科幻、藝術(shù)、音樂、旅游、民俗、中華優(yōu)秀傳統(tǒng)文化。二是文化遺產(chǎn)的數(shù)字化保護(hù)與傳承,針對稀缺資源,通過虛擬現(xiàn)實(shí)等技術(shù)創(chuàng)建立體影像,構(gòu)筑三維立體展示空間,有效保存和傳承文化遺產(chǎn)資源,為圖書館資源開發(fā)注入活力。建設(shè)主題包括:古籍、善本、手稿、膠片等特殊類型文獻(xiàn)。三是圖書館館藏特色資源推介,通過對館藏特色資源的加工整理,構(gòu)建三維影像,融合語音、圖片、文字、文獻(xiàn)鏈接等信息,串聯(lián)人物、時(shí)間、事件、地理人文等要素,將文本、書籍、圖片、人文地理和音視頻等不同資源類型進(jìn)行立體呈現(xiàn),為用戶提供系統(tǒng)、全面的主題化資源推介服務(wù)。建設(shè)主題包括:地域特藏文獻(xiàn)、古籍(民國)特藏、名人大家特藏、專題領(lǐng)域特藏。四是紅色文化資源開發(fā),充分挖掘紅色文化資源的豐富內(nèi)涵,利用實(shí)物史料創(chuàng)作虛擬場景,增強(qiáng)紅色教育的生動(dòng)性。建設(shè)主題包括:紅色文獻(xiàn)、革命傳統(tǒng)資源、警示教育資源、廉政文化資源。五是虛擬教育課程的開發(fā),融合虛擬現(xiàn)實(shí)技術(shù)和MOOC 優(yōu)勢,借助多媒體、仿真、虛擬現(xiàn)實(shí)等技術(shù),設(shè)計(jì)教學(xué)任務(wù)、課程、過程和細(xì)節(jié),建設(shè)線上新型教育課程,讓學(xué)習(xí)者產(chǎn)生沉浸式學(xué)習(xí)體驗(yàn)。建設(shè)主題包括:思政類、醫(yī)學(xué)類、藝體類、地理類、建筑類、消防安全教育等。除此之外,還可以從立體資源整合、智能導(dǎo)航、游戲體驗(yàn)服務(wù)等角度開展新型數(shù)字資源建設(shè)。
4.3.2 新型數(shù)字資源的建設(shè)路徑
一是VR 虛擬現(xiàn)實(shí)全景視頻內(nèi)容制作,利用虛擬現(xiàn)實(shí)技術(shù)挖掘圖書館特色資源,推動(dòng)現(xiàn)有館藏特色文本數(shù)據(jù)向虛擬現(xiàn)實(shí)內(nèi)容轉(zhuǎn)移,推進(jìn)古籍等特色資源的深度利用。二是AR 增強(qiáng)現(xiàn)實(shí)場景可讀服務(wù),利用AR 掃描、實(shí)景拍攝、3D 建模等技術(shù)助推文旅融合,串聯(lián)線下文旅資源,鏈接館藏檢索系統(tǒng),動(dòng)態(tài)展示相關(guān)的背景知識和館藏狀態(tài)。三是MR 混合現(xiàn)實(shí)內(nèi)容制作,將虛擬場景和現(xiàn)實(shí)場景相結(jié)合,突破傳統(tǒng)空間呈現(xiàn)形態(tài),產(chǎn)生隔空互動(dòng)的效果。四是虛擬漫游導(dǎo)航系統(tǒng),對場館進(jìn)行高精度還原,將圖書館藏品以720°形態(tài)呈現(xiàn)在觀眾面前。五是歷史文化時(shí)空地圖,將地方重大歷史文化事件與地圖結(jié)合,通過時(shí)空地圖方式快速瀏覽歷史文化變遷。六是文旅知識圖譜應(yīng)用,采用圖譜等不同知識可視化形態(tài),將重要?dú)v史人物、文獻(xiàn)、歷史事件等百科內(nèi)容全景式呈現(xiàn)給讀者。七是其他發(fā)展創(chuàng)新服務(wù),從虛擬教育服務(wù)、館藏資源推介、立體資源整合、智能導(dǎo)航、文獻(xiàn)評價(jià)、遠(yuǎn)程服務(wù)等角度開展新型數(shù)字資源建設(shè),創(chuàng)新服務(wù)方式,增強(qiáng)服務(wù)效果,實(shí)現(xiàn)資料、實(shí)物、場景的深度揭示、關(guān)聯(lián)、展現(xiàn),乃至沉浸式體驗(yàn)和應(yīng)用。
知識資源是智慧圖書館建設(shè)的核心智慧,智慧圖書館知識資源的構(gòu)成主要包括數(shù)據(jù)要素、技術(shù)要素、場景要素和功能要素四個(gè)部分。本文提出了“解構(gòu)抽取-融合重構(gòu)-人文呈現(xiàn)”的知識資源建設(shè)的方法論模型,“解構(gòu)抽取”包括基于知識結(jié)構(gòu)的文獻(xiàn)著錄和基于文獻(xiàn)內(nèi)容的知識標(biāo)引,核心是構(gòu)建單元層級的細(xì)顆粒度加工框架,分為文獻(xiàn)層、片段單元層、知識單元層等三個(gè)層級;“融合重構(gòu)”的核心是構(gòu)建知識組織本體和搭建知識圖譜,本文提出了圖書情報(bào)學(xué)的領(lǐng)域本體模型、基于文獻(xiàn)內(nèi)容的本體關(guān)系模型和知識圖譜可視化的建設(shè)方向;“人文呈現(xiàn)”主要涉及數(shù)據(jù)可視化與故事化表達(dá)兩方面內(nèi)容,本文提出了智慧圖書館背景下新型數(shù)字資源的應(yīng)用場景和建設(shè)路徑,希望這些有關(guān)知識資源建設(shè)的內(nèi)涵、路徑和策略方法的研究能對全國智慧圖書館體系構(gòu)建有所助益。