徐 婷
(廣西壯族自治區(qū)桂林圖書館,廣西 桂林 541100)
2021年9月,《國家圖書館“十四五”發(fā)展規(guī)劃》正式發(fā)布,明確提出圖書館“智慧轉(zhuǎn)型”的戰(zhàn)略任務(wù)和建設(shè)全國智慧圖書館體系的總體構(gòu)想。智慧圖書館是以現(xiàn)代信息技術(shù)驅(qū)動,以知識內(nèi)容生產(chǎn)、組織、傳播和保存為核心,以業(yè)務(wù)流程與管理智慧化為基礎(chǔ),以服務(wù)空間與服務(wù)形式高度知識化、智能化、融合化為特點的新型圖書館發(fā)展形態(tài)。在國家圖書館提出的“1+3+N”智慧圖書館體系總體框架中,打造知識資源集成倉儲、開發(fā)構(gòu)建智慧圖書館管理系統(tǒng)和多維融合知識服務(wù)平臺是智慧圖書館的主體部分。其中,加強(qiáng)知識資源組織加工,提升數(shù)字資源管理與服務(wù)的信息組織工作將為智慧圖書館建設(shè)提供必備的基石。因此,積極探討圖書館信息組織工作如何應(yīng)對智慧化轉(zhuǎn)型的挑戰(zhàn),有助于促進(jìn)智慧圖書館由概念構(gòu)建走向?qū)嵺`探索。
廣義的信息組織指的是人類社會信息活動中產(chǎn)生的信息、信息生產(chǎn)者、信息技術(shù)等信息活動要素的集合,狹義的信息組織則是指人類社會經(jīng)濟(jì)活動中經(jīng)過加工處理有序化并大量積累起來的有用信息集合。戴維民認(rèn)為“信息組織是為了方便人們檢索、獲取信息而將龐雜無序的信息進(jìn)行系統(tǒng)化和有序化的過程”。儲節(jié)旺等認(rèn)為“所謂信息組織,就是人們根據(jù)信息本身的特點,運(yùn)用各種工具和方法,依據(jù)一定的標(biāo)準(zhǔn),對其進(jìn)行加工整理、排列與組合,使之有序化、系統(tǒng)化、規(guī)律化、高級化,增強(qiáng)信息對象的表現(xiàn)效能和運(yùn)用效能,以滿足人們信息需求的過程和活動”。一般來說,圖書館信息組織工作主要是針對已經(jīng)組織好的信息資源(一次文獻(xiàn))進(jìn)行再組織(二次文獻(xiàn)、三次文獻(xiàn)等),包括信息搜集與選擇、信息分析與揭示、信息描述與加工、信息整理與存儲、為用戶提供信息咨詢服務(wù)等。
1.2.1 傳統(tǒng)圖書館信息組織模式。早期傳統(tǒng)圖書館的信息資源以紙質(zhì)印刷體為主,信息組織模式以手工操作為主,根據(jù)分類法和主題詞表對文獻(xiàn)信息進(jìn)行標(biāo)引、描述和排序,以卡片式形成館藏目錄。信息組織的價值是通過信息的采集、加工、存儲向信息傳播、共享、創(chuàng)新這樣環(huán)環(huán)相扣的價值鏈(見圖1)來實現(xiàn)的。隨著20世紀(jì)60年代計算機(jī)技術(shù)應(yīng)用于圖書館,產(chǎn)生了以機(jī)讀目錄(MARC)為標(biāo)志的圖書館信息組織自動化階段,信息環(huán)境、信息需求和信息利用模式都發(fā)生了改變,圖書館信息組織的對象經(jīng)歷了從文獻(xiàn)信息向情報信息再向網(wǎng)絡(luò)信息的迭代演化,從而引發(fā)了信息組織價值鏈各個環(huán)節(jié)的改變,為信息組織變革做準(zhǔn)備。
圖1 信息組織價值鏈
1.2.2 數(shù)字圖書館信息組織模式。數(shù)字圖書館的誕生從20世紀(jì)40年代“Memex”概念雛形,到80年代虛擬圖書館的構(gòu)想,再到90年代國際圖聯(lián)(IFLA)大會提出“數(shù)字圖書館”理念,經(jīng)歷了里程碑式的發(fā)展。2000年,中國數(shù)字圖書館工程的實施標(biāo)志著我國正式邁入數(shù)字圖書館行列。經(jīng)過20年的建設(shè)和發(fā)展,我國已建成以國家數(shù)字圖書館為龍頭的數(shù)字圖書館體系,截至2017年,數(shù)字圖書館推廣工程覆蓋全國41 家省級圖書館、486家地市級圖書館,服務(wù)輻射 2 900 多個縣級圖書館,覆蓋全國公共圖書館的數(shù)字圖書館網(wǎng)絡(luò)體系全面連通。數(shù)字圖書館的信息組織范式更為復(fù)雜,對紙質(zhì)書刊、光盤、磁帶、膠片、膠卷等原始文獻(xiàn)進(jìn)行數(shù)字化存儲和網(wǎng)絡(luò)化組織,在資源描述方式上利用元數(shù)據(jù)、XML語言等使之成為數(shù)字圖書館可使用的數(shù)據(jù)。此外,依托公共數(shù)字文化工程,近年來全國各省級公共圖書館大力開展資源庫建設(shè),已建成一大批諸如地方特色文化專題資源、地方革命文化專題資源、圖書館公開課、地方文獻(xiàn)數(shù)字化、地方特色音視頻資源等數(shù)字文化專題資源庫。
1.2.3 智慧圖書館信息組織模式。當(dāng)網(wǎng)絡(luò)信息組織時代蓬勃興盛的同時,大數(shù)據(jù)分析、云計算、物聯(lián)網(wǎng)、區(qū)塊鏈、人工智能等新的信息技術(shù)不斷融入,推動著新一輪的信息革命縱深發(fā)展,這些新技術(shù)正在給圖書館賦能,孵化出智慧圖書館的未來圖景。目前已有深圳、佛山、東莞、廣州等地公共圖書館將智慧圖書館納入“十四五”規(guī)劃。智慧圖書館信息組織模式不再停留在信息加工和服務(wù)層面,而是以知識組織為核心,受“知識組織價值鏈”(見圖2)所驅(qū)動,將數(shù)字圖書館的服務(wù)上升到知識服務(wù)和智慧服務(wù)層面。知識組織系統(tǒng)在知識的發(fā)掘、揭示、關(guān)聯(lián),以及價值評估、智能創(chuàng)造等環(huán)節(jié)發(fā)揮著特別作用。總體來說,未來智慧圖書館的信息組織將會更趨向于朝語義化、數(shù)據(jù)化、一體化、交互性等方面發(fā)展,信息知識組織系統(tǒng)的智能化重構(gòu)將大大增強(qiáng)圖書館的應(yīng)用功能和服務(wù)水平。
圖2 知識組織價值鏈
順應(yīng)時代的發(fā)展,由科技進(jìn)步和人民群眾日益增長的精神文化需求所推動的圖書館智慧化轉(zhuǎn)型使圖書館信息組織模式仍在日新月異地演化進(jìn)行中,而信息組織的核心要素早已發(fā)生改變(見表1),主要表現(xiàn)為以下幾個方面。
表1 圖書館信息組織工作的變化對比
傳統(tǒng)圖書館信息組織對象最主要的載體形式是圖書、報紙、期刊以及地方古籍等紙質(zhì)印刷館藏,隨著信息時代的發(fā)展,電子載體越來越多,數(shù)字圖書館的信息組織對象是以自建地方特色數(shù)字資源庫及外購或獲得許可使用的數(shù)據(jù)庫等數(shù)字館藏信息形式所呈現(xiàn)。未來智慧圖書館的信息組織對象則是以知識資源為核心的數(shù)據(jù)館藏,包括語義化詞表等基礎(chǔ)知識資源、各類文獻(xiàn)細(xì)顆粒度標(biāo)引的知識元、用戶使用行為數(shù)據(jù)、用戶知識交互及評價等數(shù)據(jù)。
過去的數(shù)字圖書館是為了便于長期儲存大量文獻(xiàn)的需要,運(yùn)用數(shù)據(jù)庫、元數(shù)據(jù)、搜索引擎等技術(shù)手段對文獻(xiàn)資源作數(shù)字化和可視化處理,但信息組織方式大多呈現(xiàn)為線性結(jié)構(gòu),即采用分類法和主題法進(jìn)行信息內(nèi)容編排,按照資源類型、數(shù)據(jù)庫列表等形成數(shù)字圖書館目錄,用戶通過查詢檢索仍是源于數(shù)字文獻(xiàn)資源獲取信息。智慧圖書館則是對數(shù)字化的文獻(xiàn)資源深入做數(shù)據(jù)化的知識元加工處理,通過對知識元(如地名、人物、事件等細(xì)顆粒度標(biāo)簽標(biāo)引)的揭示、重組與關(guān)聯(lián)構(gòu)建出一個多維互聯(lián)的信息系統(tǒng),從而實現(xiàn)大數(shù)據(jù)網(wǎng)絡(luò)合作下的知識轉(zhuǎn)化、交換和傳播以及融合效應(yīng),用戶可直接源于信息獲取知識,獲得真正的知識智能服務(wù)。
傳統(tǒng)圖書館信息組織有相對封閉且獨(dú)立的文獻(xiàn)壁壘,館際間的資源共享礙于地域、時間等因素難以實現(xiàn)。而網(wǎng)絡(luò)技術(shù)的發(fā)展促使現(xiàn)代圖書館的改革建設(shè),信息組織由封閉轉(zhuǎn)變?yōu)殚_放。在數(shù)據(jù)開放的環(huán)境下,通過技術(shù)手段為公眾提供一站式“文化信息資源的聚合和展示”,從而實現(xiàn)信息資源的共享。例如,國家公共服務(wù)云平臺將各省級公共圖書館和地方數(shù)字圖書館的公共文化資源匯聚、整合到全國公共文化數(shù)據(jù)中心統(tǒng)一的云目錄中,同時,省級圖書館數(shù)據(jù)管理平臺也可以接收和獲取國家公共服務(wù)云平臺的相關(guān)資源與服務(wù)數(shù)據(jù)。在這個龐大的信息組織網(wǎng)絡(luò)系統(tǒng)中,圖書館的館藏資源及其他信息資源都可以通過關(guān)聯(lián)數(shù)據(jù)發(fā)布,各館不再是一個個信息孤島,而是成為關(guān)聯(lián)信息的樞紐,從而實現(xiàn)館際智能聯(lián)合檢索和信息組織的互聯(lián)互通。
傳統(tǒng)圖書館信息資源獲取渠道單一,且屬于被動服務(wù),用戶獲取信息的時間與成本相對較高。為適應(yīng)網(wǎng)絡(luò)時代公眾獲取資訊方式的變化,目前,我國一些公共圖書館在積極探索“互聯(lián)網(wǎng)+公共文化”信息服務(wù)模式,如江蘇省建設(shè)和完善中的公共圖書館大數(shù)據(jù)服務(wù)平臺,其目標(biāo)就是對全省公共圖書館及大部分基層點的業(yè)務(wù)數(shù)據(jù)、館情數(shù)據(jù)的采集、加工和整理,并通過大數(shù)據(jù)分析,為全省用戶提供一站式網(wǎng)絡(luò)數(shù)字化的資源展示和應(yīng)用服務(wù)。中國國家圖書館在智慧圖書館體系下計劃構(gòu)建的多維融合知識服務(wù)平臺則是將知識生產(chǎn)全產(chǎn)業(yè)鏈協(xié)同貫通,建立標(biāo)準(zhǔn)統(tǒng)一、多元參與的“知識淘寶”,將信息服務(wù)變被動為主動,為用戶提供全渠道、多終端、個性化、智能化、專業(yè)化的信息服務(wù),極大提升信息服務(wù)效能。
雖然我國在公共數(shù)字文化建設(shè)方面取得了階段性的進(jìn)展,全國公共圖書館的數(shù)字資源庫群初具規(guī)模,數(shù)字服務(wù)網(wǎng)絡(luò)基本成型,但距離“智慧化”尚有較大差距,主要表現(xiàn)在以下幾個方面。
3.1.1 館藏資源數(shù)字化不完整,數(shù)字資源版權(quán)待完善。許多公共圖書館在進(jìn)行數(shù)字資源建設(shè)的過程中,外購的數(shù)字資源庫、在線數(shù)據(jù)庫占比較大,自建館藏數(shù)字資源較少,容易出現(xiàn)同質(zhì)化、類型單一、針對性不強(qiáng)、易用性不高等弊端。還有一些已經(jīng)數(shù)字化的自建資源沒有徹底解決好版權(quán)許可問題,在服務(wù)邊界方面缺乏法律確權(quán)和技術(shù)保障,尤其是2021年6月1日新修訂的《著作權(quán)法》正式實施后擴(kuò)大了保護(hù)作品的范圍,對“合理使用”有了更嚴(yán)格的限定,并對著作權(quán)人的權(quán)利內(nèi)容與權(quán)利歸屬作出進(jìn)一步的修正,使得圖書館數(shù)字資源建設(shè)也要隨之完善和改變。
3.1.2 各類數(shù)字資源基于知識內(nèi)容的描述、揭示度不高,缺乏關(guān)聯(lián)性。數(shù)字圖書館信息組織方式正處在以文獻(xiàn)作為基本著錄單元的階段,因此仍然屬于粗粒度的信息表達(dá),而基于元數(shù)據(jù)的知識表示方式不能完全解決語義異構(gòu)問題,更不能系統(tǒng)揭示知識之間的語義關(guān)系,難以形成具有關(guān)聯(lián)性的知識圖譜,不利于用戶對知識資源的全面掌握和深度挖掘。
3.1.3 資源利用向服務(wù)能力轉(zhuǎn)化不足。由于公共數(shù)字文化服務(wù)是新時代的產(chǎn)物,很多公共圖書館存在“重建設(shè)、輕服務(wù)”的現(xiàn)象,對如何利用本館海量的數(shù)字文化資源并進(jìn)行有效的推廣與傳播缺乏經(jīng)驗。而且,信息服務(wù)平臺采取的是自上而下而不是以用戶需求為導(dǎo)向的資源供給模式,跟不上當(dāng)前公眾知識需求的變化速度,導(dǎo)致資源訪問和獲取率不高,數(shù)字化服務(wù)就難以產(chǎn)生大規(guī)模的用戶群體。
信息組織數(shù)據(jù)化就是把信息中包含的有意義的知識元轉(zhuǎn)化為計算機(jī)可識別、計算、分析、重組的結(jié)構(gòu)化數(shù)據(jù)的過程。它是建設(shè)智慧圖書館的核心內(nèi)容,為圖書館的智慧管理和智慧服務(wù)提供堅實的數(shù)據(jù)基礎(chǔ)。智慧圖書館對數(shù)據(jù)進(jìn)行有效的聚合和關(guān)聯(lián),是實現(xiàn)圖書館“物物相聯(lián)”“人人相聯(lián)”“人物相聯(lián)”的重要支撐。
3.2.1 在資源管理上形成知識關(guān)聯(lián)的館藏資源體系。智慧型信息組織可以利用知識內(nèi)容內(nèi)在的邏輯機(jī)理,依靠大數(shù)據(jù)技術(shù)分析各個知識元之間的相關(guān)屬性,深入挖掘知識內(nèi)涵,建立諸如同義關(guān)聯(lián)、類目關(guān)聯(lián)、關(guān)鍵詞關(guān)聯(lián)、檢索關(guān)聯(lián)等知識關(guān)聯(lián)方式,將各類知識組織聯(lián)通起來,加以整合利用。因此,知識標(biāo)引建設(shè)與數(shù)字資源建設(shè)必須相輔相成。圖書館應(yīng)利用語義網(wǎng)、大數(shù)據(jù)、智能計算等技術(shù),對已數(shù)字化的地方特色文獻(xiàn)、古籍、公開課、專題片等館藏資源進(jìn)行細(xì)粒度內(nèi)容標(biāo)識、關(guān)鍵知識點的標(biāo)簽標(biāo)引建設(shè),完成館藏資源的語義標(biāo)注及聚合,構(gòu)建內(nèi)容精細(xì)化揭示,多維度、多層次、多粒度的館藏資源體系,實現(xiàn)對資源價值的深度挖掘及智能化,從而為用戶提供信息資源的知識化、專題化服務(wù)。
3.2.2 在信息服務(wù)上建成一體化的知識圖譜服務(wù)體系。如何為用戶提供準(zhǔn)確的、個性化的知識服務(wù)是未來智慧圖書館信息組織工作的目標(biāo)。在大數(shù)據(jù)時代,數(shù)據(jù)服務(wù)模式將因信息顆粒度細(xì)化而產(chǎn)生更加智能化的知識圖譜服務(wù)。知識圖譜的應(yīng)用價值不僅局限于由關(guān)聯(lián)數(shù)據(jù)模型構(gòu)建而成的網(wǎng)狀知識庫,還能夠提供與實體交互的智能問答、決策分析、常識推理等智能化應(yīng)用。通過對館藏數(shù)字資源和更多動態(tài)性異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)資源進(jìn)行面向知識圖譜的深層次標(biāo)引,實現(xiàn)智能度更高的知識推送和知識應(yīng)用,能夠有針對性地為用戶提供其所需要的“知識干貨”,最大限度地滿足用戶對知識的全面感知。一體化、智能化的知識圖譜服務(wù)體系還將打破單向輸出的知識屏障,體現(xiàn)出用戶參與式架構(gòu),進(jìn)行知識協(xié)同共享交互、用戶間的知識分享等,在人機(jī)協(xié)同的大數(shù)據(jù)智慧機(jī)制中建立人與資源、資源與資源、人與人之間的知識鏈接,實現(xiàn)智慧情境下的知識服務(wù)功能。
智慧圖書館信息組織數(shù)據(jù)化是一項量級龐大的工作(見圖3),必須建立在數(shù)字資源的基礎(chǔ)上。圖書館應(yīng)構(gòu)建統(tǒng)一規(guī)范的數(shù)字資源體系,對數(shù)字資源內(nèi)容進(jìn)行管理,拓寬數(shù)字資源的來源渠道,圍繞圖書、期刊、報紙、古籍、音視頻等多種類型數(shù)字資源開展知識資源精細(xì)化標(biāo)引、知識組織與新型數(shù)字資源建設(shè)工作。而“千里之行,始于足下”,地方圖書館首先要有針對性地挖掘地方特色文獻(xiàn)及文化資源,分主題或以專題性數(shù)據(jù)庫的形式確定數(shù)據(jù)加工的范圍,并加強(qiáng)版權(quán)管理意識,積極解決版權(quán)遺留問題,優(yōu)先選擇已經(jīng)獲得版權(quán)許可的數(shù)字資源。
圖3 智慧圖書館信息組織工作流程框架設(shè)計
智慧化的信息組織是利用知識關(guān)聯(lián)方法建立起的知識元集成信息組織系統(tǒng)。由于進(jìn)行精細(xì)化標(biāo)引的基礎(chǔ)文獻(xiàn)中存在的知識元數(shù)量龐雜、分散,且具有跨學(xué)科和交叉領(lǐng)域的特點,知識加工整理應(yīng)遵循以下步驟:1)基于人工智能綜合分析加工對象的文獻(xiàn)形態(tài)、內(nèi)容結(jié)構(gòu)和服務(wù)需求,采取科學(xué)合理的分類和詳細(xì)的標(biāo)引措施。2)基于深度學(xué)習(xí)在自然語言處理、文本挖掘領(lǐng)域的定制化需求,確立知識抽取規(guī)范和抽取辦法,形成知識抽取模型。3)利用信息語義分析工具、數(shù)據(jù)模型等知識抽取技術(shù)完成集約化的知識元標(biāo)引,在技術(shù)的應(yīng)用過程中需加強(qiáng)人工干預(yù)進(jìn)行質(zhì)量審核監(jiān)控,以保證獲得高質(zhì)量的知識抽取數(shù)據(jù)。4)碎片化知識資源體系重組。利用知識內(nèi)容內(nèi)在的邏輯機(jī)理,依靠大數(shù)據(jù)技術(shù)識別各個知識元之間的相關(guān)屬性,解析知識數(shù)據(jù)的內(nèi)涵信息,建立諸如同義關(guān)聯(lián)、類目關(guān)聯(lián)、關(guān)鍵詞關(guān)聯(lián)、檢索關(guān)聯(lián)等知識關(guān)聯(lián)方式,將各類知識數(shù)據(jù)聯(lián)通起來,形成知識圖譜。
智慧圖書館信息組織的數(shù)據(jù)管理包括數(shù)據(jù)分類、數(shù)據(jù)聚類、詞表建模、本體建模、知識建庫、數(shù)據(jù)封裝、數(shù)據(jù)存儲等。管理對象則分為元數(shù)據(jù)庫、全文數(shù)據(jù)庫、知識資源庫、本體模型庫、詞表庫、電子圖像庫等。其中,元數(shù)據(jù)作為“描述數(shù)據(jù)的數(shù)據(jù)”,在圖書館信息組織中發(fā)揮著重要作用。智慧圖書館應(yīng)支持不同類型資源元數(shù)據(jù)的一體化、全周期的建設(shè)與管理,使元數(shù)據(jù)具有良好的互操作性及可重用性,滿足“一次生產(chǎn)多次利用”的使用需求。為保證日后數(shù)據(jù)使用的延續(xù)性和知識更新的迭代性,還應(yīng)采用一定的數(shù)據(jù)識別機(jī)制對不同來源、不同格式的元數(shù)據(jù)進(jìn)行去重、補(bǔ)充、整合及語義關(guān)聯(lián),帶動深層次的智慧協(xié)同開發(fā)與利用,實現(xiàn)對數(shù)據(jù)管理業(yè)務(wù)流程和系統(tǒng)功能的整合。
智慧圖書館將為用戶提供基于知識圖譜的信息服務(wù),主要包括:實現(xiàn)語義搜索,使Web從網(wǎng)頁鏈接向概念鏈接轉(zhuǎn)變;支持內(nèi)容聚合、精確定位與可視化檢索,不同文獻(xiàn)類型實現(xiàn)細(xì)分的垂直場景檢索功能;利用分布式全文檢索技術(shù)對內(nèi)容進(jìn)行高效的全文檢索,確保信息的檢全性與檢準(zhǔn)性;支持智能問答系統(tǒng),以準(zhǔn)確的自然語言為用戶提供咨詢解答;支持全終端無障礙閱讀,并在嚴(yán)格的權(quán)限控制體系下實現(xiàn)數(shù)據(jù)安全保護(hù);基于文獻(xiàn)數(shù)字資源、多源異構(gòu)數(shù)據(jù)的融合、業(yè)務(wù)管理數(shù)據(jù)、資源利用數(shù)據(jù)、用戶行為及偏好等海量數(shù)據(jù),進(jìn)行多維化的大數(shù)據(jù)統(tǒng)計分析與決策,為用戶做出精準(zhǔn)的智能推薦,使用戶獲得更有深度與廣度的信息資源等。這些都對圖書館信息服務(wù)平臺的智慧化升級提出了更高的技術(shù)要求,是我們下一步要努力實現(xiàn)的目標(biāo)。
在全國大力推動圖書館智慧化轉(zhuǎn)型的形勢下,圖書館信息組織工作經(jīng)歷著從數(shù)字化向數(shù)據(jù)化升級的變遷,面臨的既是困難和挑戰(zhàn),也是巨大的發(fā)展契機(jī)。盡管“智慧圖書館”目前尚沒有標(biāo)準(zhǔn)的實體對象作為參照,但我們要充分利用大數(shù)據(jù)時代下的新技術(shù),探索圖書館信息組織工作未來發(fā)展路徑,為公眾提供高質(zhì)量、個性化、實用便捷的知識服務(wù),助推我國智慧圖書館事業(yè)不斷向前發(fā)展。