摘 要:數(shù)字資源是公共圖書館高質(zhì)量發(fā)展的源泉,也是公共圖書館管理最重要、最核心的內(nèi)容。當(dāng)前,公共圖書館數(shù)字資源建設(shè)面臨數(shù)據(jù)不全面、資源信息過載、暗數(shù)據(jù)泛在化、數(shù)據(jù)應(yīng)用困難、長期保存模式滯后等諸多現(xiàn)實痛點,亟須從啟動數(shù)據(jù)基礎(chǔ)工程、升級智能推薦算法、強化數(shù)據(jù)分類治理、成立數(shù)字保存聯(lián)盟等方面出發(fā),探索數(shù)據(jù)化引領(lǐng)公共圖書館數(shù)字資源高質(zhì)量建設(shè)與轉(zhuǎn)型的創(chuàng)新思路。
關(guān)鍵詞:數(shù)據(jù)化;公共圖書館;數(shù)字資源建設(shè);長期保存
中圖分類號:G258.2 文獻(xiàn)標(biāo)識碼:A 文章編號:1003-1588(2024)09-0014-03
近年來,從智能空間管理、數(shù)字人文研究與實踐,到智能書庫、智慧門戶、送書機器人及虛擬館員應(yīng)用,均反映了公共圖書館由數(shù)字圖書館向智慧圖書館的不斷進(jìn)階,推進(jìn)數(shù)據(jù)化發(fā)展是引領(lǐng)智慧圖書館建設(shè)取得實質(zhì)性突破的關(guān)鍵。資源建設(shè)是公共圖書館工作的核心內(nèi)容,如何以數(shù)據(jù)化引領(lǐng)數(shù)字資源建設(shè)是當(dāng)前公共圖書館資源建設(shè)的重要任務(wù)。
1 從數(shù)字化到數(shù)據(jù)化:公共圖書館的轉(zhuǎn)型趨向
數(shù)智時代,各種數(shù)據(jù)呈指數(shù)級增長,逐步將科學(xué)研究推向了通過數(shù)據(jù)分析尋求相關(guān)性規(guī)律的“第四范式”。隨著數(shù)字圖書館向智慧圖書館的轉(zhuǎn)型發(fā)展,公共圖書館的信息資源處在由數(shù)字化向數(shù)據(jù)化變革的關(guān)鍵階段。信息的數(shù)據(jù)化與數(shù)字化既有區(qū)別又密切關(guān)聯(lián),數(shù)字化改變了信息的載體形式,為數(shù)據(jù)化奠定了基礎(chǔ),而數(shù)據(jù)化描述了將數(shù)字資源轉(zhuǎn)化為在線量化數(shù)據(jù)的技術(shù)趨勢[1],如:圖書館將數(shù)字資源、用戶信息、業(yè)務(wù)信息等轉(zhuǎn)化為可供閱讀、可量化分析的知識資源數(shù)據(jù)、用戶數(shù)據(jù)及業(yè)務(wù)流程數(shù)據(jù),通過直接數(shù)據(jù)及關(guān)聯(lián)數(shù)據(jù)的集成與融合,對圖書館數(shù)字資源和用戶服務(wù)進(jìn)行優(yōu)化調(diào)配,構(gòu)建基于大數(shù)據(jù)挖掘的智慧管理、運營與服務(wù)模型,從而實現(xiàn)公共圖書館的智慧服務(wù)與智慧治理。
當(dāng)前,公共圖書館主要有三類數(shù)據(jù):書目數(shù)據(jù)、數(shù)字資源、用戶數(shù)據(jù),其中數(shù)字資源涉及館藏數(shù)字化、商業(yè)學(xué)術(shù)數(shù)據(jù)庫等。雖然公共圖書館擁有豐富的數(shù)字資源,但面對數(shù)據(jù)驅(qū)動時代愈加顯著的“數(shù)字鴻溝”問題,既有的資源知識組織方式已無法滿足跨學(xué)科知識服務(wù)的需求,公共圖書館亟須優(yōu)化數(shù)字資源結(jié)構(gòu),對數(shù)字資源的概念關(guān)系、主題脈絡(luò)、知識網(wǎng)絡(luò)等進(jìn)行全面梳理和呈現(xiàn),推動傳統(tǒng)文獻(xiàn)單元服務(wù)方式向基于數(shù)據(jù)單元的服務(wù)方式轉(zhuǎn)變,不斷提升場景感知與計算能力,滿足用戶多變的信息需求,向智慧圖書館轉(zhuǎn)型和躍升。
2 數(shù)據(jù)化視域下公共圖書館數(shù)字資源建設(shè)與長期保存的痛點
2.1 多源異構(gòu)數(shù)據(jù)快速增長與碎片化問題加大數(shù)字資源建設(shè)難度
公共圖書館作為文化傳遞中心與知識交流中心,始終走在技術(shù)應(yīng)用的前沿。隨著技術(shù)的更新迭代,公共圖書館傳統(tǒng)的知識存儲與資源獲取方式產(chǎn)生了巨大變化,同時也積累了海量數(shù)據(jù),除文獻(xiàn)數(shù)據(jù)外,還涉及用戶數(shù)據(jù)、機構(gòu)數(shù)據(jù)等,其中很多數(shù)據(jù)因其不可見性或其他原因不易被訪問,加之公共圖書館的智慧化應(yīng)用過程往往伴隨多源異構(gòu)數(shù)據(jù)的深度融合,使數(shù)據(jù)的復(fù)雜程度呈指數(shù)級上升,以致很多數(shù)據(jù)難以得到及時有效的開發(fā)和利用[2]。此外,為充分發(fā)揮數(shù)據(jù)對數(shù)字資源建設(shè)的支持作用,公共圖書館只有對海量數(shù)據(jù)進(jìn)行細(xì)致的分類管理和有效融合,才能實現(xiàn)數(shù)據(jù)的體系化建設(shè),但當(dāng)前我國公共圖書館關(guān)于數(shù)據(jù)化的研究和實踐仍處于碎片化階段,缺乏系統(tǒng)規(guī)劃及完整框架。
2.2 數(shù)字資源信息過載與過濾問題降低知識發(fā)現(xiàn)獲取能力
在技術(shù)的高效賦能下,我國公共圖書館已基本完成資源的數(shù)字化建設(shè),有效拓展了服務(wù)功能,極大地提高了資源利用率。然而,在數(shù)字資源極大豐富的同時,信息過載問題也愈加突出。一方面,很多數(shù)字閱讀產(chǎn)品及在線平臺充斥著大量無用甚至有害信息,數(shù)字信息質(zhì)量良莠不齊,用戶很難從浩如煙海的資源中精準(zhǔn)獲取所需內(nèi)容,從而降低其知識發(fā)現(xiàn)與獲取能力;另一方面,公共圖書館針對信息過載問題缺乏具有廣泛適用性的數(shù)字資源信息過濾算法及信息資源精準(zhǔn)推薦系統(tǒng),雖然有部分公共圖書館建立了面向用戶和資源的協(xié)同過濾方法,但主要是通過提取用戶評價的關(guān)鍵詞進(jìn)行計算和推薦,一旦用戶評價項目不足或系統(tǒng)打分稀疏,就會影響資源推薦的準(zhǔn)確率,此外該方法也受制于新用戶的信息匱乏[3]。
2.3 暗數(shù)據(jù)泛在化與挖掘能力不足阻滯資源服務(wù)內(nèi)容拓展
當(dāng)前,我國圖書館界關(guān)于大數(shù)據(jù)的研究和實踐開展得如火如荼,但較少提及小數(shù)據(jù)和暗數(shù)據(jù)。公共圖書館的暗數(shù)據(jù)多為未經(jīng)組織或編目的資源數(shù)據(jù),或是已存檔但不再使用的業(yè)務(wù)數(shù)據(jù)以及因缺乏元數(shù)據(jù)而難以定位的非結(jié)構(gòu)化數(shù)據(jù)等。雖然這些數(shù)據(jù)是可靠信息的潛在豐富來源,可能非常有價值,但由于相關(guān)理論研究的缺失以及圖書館對其應(yīng)用價值的忽視,此類數(shù)據(jù)往往未被完整索引和存儲,致使其缺乏內(nèi)在關(guān)聯(lián)性分析,往往不被用戶看到,逐漸被遺忘直至最終丟失。當(dāng)前,公共圖書館挖掘和利用暗數(shù)據(jù)的挑戰(zhàn)主要來自技術(shù)層面,由于針對數(shù)據(jù)特征和格式差異需要采用不同的數(shù)據(jù)采集、存儲及分析技術(shù),因此對軟硬件設(shè)備要求較高,一般公共圖書館很難滿足,加之公共圖書館缺乏兼具數(shù)據(jù)分析與軟件開發(fā)能力的人才,導(dǎo)致其空有海量數(shù)據(jù)資源卻難以提供全面深入的資源服務(wù)[4]。
2.4 數(shù)字資源長期保存面臨諸多風(fēng)險影響資源持續(xù)利用
數(shù)字資源是公共圖書館提供服務(wù)的基礎(chǔ),特別是具有較高技術(shù)依賴性的原生數(shù)字資源與特藏資源,其一旦丟失將會造成災(zāi)難性的后果。數(shù)字資源在長期保存過程中會受各種風(fēng)險影響從而造成丟失或損害,如:數(shù)字資源長期保存機構(gòu)可能出現(xiàn)合并、重組或解散等情況,變動過程中若機構(gòu)忽視數(shù)字資源,就會造成資源保存工作中斷及資源流失[5];負(fù)責(zé)數(shù)字資源長期保存的專職人員一旦離職,如退休或調(diào)動,新接手人員不熟悉相關(guān)業(yè)務(wù)可能出現(xiàn)管理疏漏或資源浪費等情況。此外,隨著時間的推移和科技的進(jìn)步,數(shù)字資源長期保存所使用的文件格式和技術(shù)可能過時,不再被新設(shè)備支持,從而導(dǎo)致部分?jǐn)?shù)字資源無法被訪問或讀取,也有不同系統(tǒng)平臺之間因格式轉(zhuǎn)換導(dǎo)致數(shù)據(jù)丟失或損壞[6],上述問題都使數(shù)字資源長期保存面臨較大風(fēng)險。
3 數(shù)據(jù)化視域下公共圖書館數(shù)字資源建設(shè)的路徑
3.1 啟動數(shù)據(jù)基礎(chǔ)工程,推動全數(shù)據(jù)體系建設(shè)
數(shù)據(jù)體系化管理是公共圖書館數(shù)字資源建設(shè)和長期保存的基礎(chǔ),也是圖書館轉(zhuǎn)型發(fā)展的必經(jīng)過程。公共圖書館要加快啟動數(shù)據(jù)基礎(chǔ)工程,從頂層設(shè)計出發(fā),制訂數(shù)據(jù)管理整體方案以及支撐數(shù)字資源建設(shè)和智慧服務(wù)的完整數(shù)據(jù)架構(gòu)和管理方案,推動全數(shù)據(jù)體系建設(shè)。公共圖書館一方面要以實現(xiàn)精準(zhǔn)化、個性化、人性化、主動化智慧服務(wù)為目標(biāo),系統(tǒng)分析各類數(shù)據(jù)的來源與特征,包括文獻(xiàn)元數(shù)據(jù)、文獻(xiàn)內(nèi)容數(shù)據(jù)化數(shù)據(jù)、信息管理系統(tǒng)運行數(shù)據(jù)、用戶行為數(shù)據(jù)、知識庫等,結(jié)合資源建設(shè)實際分層次開展數(shù)據(jù)收集和構(gòu)建工作,建立分布式數(shù)據(jù)管理平臺,形成完整的全數(shù)據(jù)體系;另一方面要成立數(shù)字資源數(shù)據(jù)中心、運行數(shù)據(jù)中心等,設(shè)立規(guī)范、統(tǒng)一的數(shù)據(jù)管理流程,既要推進(jìn)數(shù)字資源的深度標(biāo)引與識別,形成數(shù)字資源關(guān)于全文知識點的再組織與利用,又要將分散于各業(yè)務(wù)板塊的數(shù)據(jù)收集歸類,根據(jù)應(yīng)用場景和業(yè)務(wù)新需求對數(shù)據(jù)進(jìn)行多元交互與整合,優(yōu)化數(shù)字資源建設(shè)與服務(wù)決策[7]。
3.2 升級智能推薦算法,加速知識聚合與發(fā)現(xiàn)
針對數(shù)字資源信息過載問題,公共圖書館需要主動關(guān)注前沿技術(shù),結(jié)合既有過濾方法的優(yōu)勢持續(xù)升級智能推薦算法,同時過濾不良信息加速知識聚合與發(fā)現(xiàn),打造清朗的數(shù)字閱讀環(huán)境,為用戶提供便捷安全的數(shù)字資源服務(wù)。一方面,公共圖書館要基于用戶的檢索、下載、借閱、收藏等行為數(shù)據(jù)分析其資源偏好,并據(jù)此梳理數(shù)據(jù)構(gòu)成及權(quán)重,構(gòu)建算法模型規(guī)范,清理冗余數(shù)據(jù),并進(jìn)行知識聚合,提供精準(zhǔn)可信的知識服務(wù)資源儲備;另一方面,公共圖書館要利用大數(shù)據(jù)技術(shù)深挖用戶的數(shù)字資源利用行為和習(xí)慣,通過機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等技術(shù)構(gòu)建智能成長型推薦系統(tǒng),依據(jù)用戶實時行為和反饋更新相關(guān)興趣模型和推薦列表,通過關(guān)聯(lián)與聚類分析為用戶提供其可能感興趣的資源,甚至是提供定制化的推薦服務(wù),如學(xué)科前沿推送、個性化閱讀計劃等。
3.3 強化數(shù)據(jù)分類治理,促進(jìn)暗數(shù)據(jù)價值增值
數(shù)據(jù)時代,如何將數(shù)據(jù)潛力轉(zhuǎn)化為服務(wù)的現(xiàn)實能力,以服務(wù)推進(jìn)數(shù)字資源的有效利用是公共圖書館數(shù)字資源建設(shè)的要點。針對當(dāng)前暗數(shù)據(jù)泛在化問題,公共圖書館要增強對暗數(shù)據(jù)的理論認(rèn)知與實踐應(yīng)用,強化數(shù)據(jù)分類治理,通過前沿技術(shù)深度挖掘暗數(shù)據(jù)價值,為數(shù)字資源建設(shè)和拓展信息服務(wù)廣度及深度提供決策依據(jù)。公共圖書館要組建數(shù)字資源數(shù)據(jù)中心,引入智能化工具對全數(shù)據(jù)體系中的暗數(shù)據(jù)進(jìn)行充分組織,同時加快推進(jìn)語義模型與信息資源服務(wù)目錄建設(shè),將元數(shù)據(jù)管理作為重點,利用不同的元數(shù)據(jù)規(guī)范對不同類型的數(shù)據(jù)進(jìn)行標(biāo)引,為不同業(yè)務(wù)系統(tǒng)中暗數(shù)據(jù)的關(guān)聯(lián)整合奠定基礎(chǔ)。此外,公共圖書館還要依托智能化數(shù)據(jù)提取技術(shù),從數(shù)據(jù)源中識別、分類、整合所需數(shù)據(jù),并通過質(zhì)量安全管理確保數(shù)據(jù)信息得到合理存儲和利用。例如,美國芝加哥圖書館將原生數(shù)據(jù)檔案、研究數(shù)據(jù)等暗數(shù)據(jù)全面納入數(shù)字資源建設(shè)體系,通過暗數(shù)據(jù)挖掘,將開放存取知識庫中的文獻(xiàn)類型從文本格式拓展為軟件、音視頻、數(shù)據(jù)集、源代碼等多元資源類型,極大地強化了資源服務(wù)能力[8]。
3.4 成立數(shù)字保存聯(lián)盟,共建開源存儲庫平臺
公共圖書館僅靠自身力量很難完成數(shù)字資源的長期保存工作,與其他圖書館或機構(gòu)成立數(shù)字保存聯(lián)盟,通過共建開源存儲庫平臺方式能夠有效實現(xiàn)合作保存、資源共享、風(fēng)險共擔(dān)。公共圖書館要聯(lián)合其他圖書館、保存機構(gòu)、資源生產(chǎn)和利用方、版權(quán)所有方、技術(shù)開發(fā)機構(gòu)等多方利益相關(guān)者,通過構(gòu)建協(xié)調(diào)統(tǒng)一的組織機制、分工明確的權(quán)責(zé)體系建立跨界融合的數(shù)字保存聯(lián)盟,聯(lián)盟協(xié)作既可利用圖情機構(gòu)的資源優(yōu)勢研發(fā)元數(shù)據(jù)標(biāo)準(zhǔn),又可通過科技公司開發(fā)數(shù)據(jù)存儲、格式轉(zhuǎn)換等軟件,解決技術(shù)難題[9]。同時,公共圖書館還要協(xié)同聯(lián)盟中的其他機構(gòu)開發(fā)開源軟件存儲庫系統(tǒng),推進(jìn)區(qū)域數(shù)字保存體系構(gòu)建及分布式協(xié)作保存網(wǎng)絡(luò)建設(shè),通過相關(guān)的數(shù)據(jù)規(guī)范、模型及認(rèn)證,實現(xiàn)互聯(lián)互通、開放共享的知識服務(wù)體系[10],同時積極建設(shè)本地存儲庫,不斷尋求替代存儲庫方案,如云存儲、DNA與玻璃存儲等,持續(xù)探索暗保存、生態(tài)保存、開放保存等多元保存模式,為數(shù)字資源的長期保存提供有力支持。
4 結(jié)語
隨著時代的發(fā)展,我國智慧圖書館建設(shè)已初具規(guī)模,但資源建設(shè)與服務(wù)的全面智慧化格局尚未形成。數(shù)據(jù)是智慧圖書館發(fā)展的基石,公共圖書館要將數(shù)據(jù)化作為發(fā)展新方向,積極面對技術(shù)加速迭代背景下的數(shù)字資源建設(shè)工作,持續(xù)探索數(shù)字資源建設(shè)與長期保存的新生長點,不斷拓展資源服務(wù)范圍,促進(jìn)資源價值增值。
參考文獻(xiàn):
[1] 金勝勇,張琪.論我國圖書館學(xué)發(fā)展的數(shù)據(jù)化趨勢[J].情報資料工作,2021(1):42-49.
[2] 郭宇,于文倩,劉夢婷,等.基于KANO模型的智慧圖書館用戶數(shù)據(jù)資源需求研究[J].情報科學(xué),2023(12):57-64.
[3] 郭篤凌,閆長青.數(shù)字資源的信息過濾與精準(zhǔn)推薦算法[J].印刷與數(shù)字媒體技術(shù)研究,2024(1):113-121.
[4] 董京祥.暗數(shù)據(jù)視角下高校圖書館數(shù)據(jù)治理策略研究[J].圖書館,2024(4):40-46.
[5] 別立謙,張乃帥,章琳.國家戰(zhàn)略視角下高校數(shù)字資源長期保存的實踐與思考[J].圖書情報工作,2023(11):39-47.
[6] 宋歌笙,蔡丹丹,蔡文杰.Web 3.0環(huán)境下去中心化存儲的數(shù)字資源長期保存[J].圖書館建設(shè),2023(4):29-35.
[7] 楊新涯,文佩丹,卓應(yīng)忠.智慧圖書館的全數(shù)據(jù)體系研究[J].圖書情報工作,2023(13):29-35.
[8] 黃紅華,曹亞紅.轉(zhuǎn)型視角下研究型圖書館文獻(xiàn)資源建設(shè)重點內(nèi)容與發(fā)展趨勢[J/OL].圖書館,1-11[2024-07-23].http://kns.cnki.net/kcms/detail/43.1031.G2.20240528.0723.024.html.
[9] 劉堯,胡吉穎,劉先瑞,等.國外數(shù)字保存聯(lián)盟發(fā)展的經(jīng)驗與教訓(xùn)分析[J].圖書情報工作,2024(10):24-34.
[10] 張毅.世界一流大學(xué)數(shù)字資源長期保存的調(diào)查與啟示[J].圖書館學(xué)研究,2023(11):51-61.