(湖南工程學(xué)院圖書館湘潭411104)
【摘要】數(shù)字圖書館信息體系結(jié)構(gòu)的主要構(gòu)件是數(shù)字對(duì)象、句柄和倉(cāng)儲(chǔ)。數(shù)字圖書館由
數(shù)字對(duì)象構(gòu)成,對(duì)象存儲(chǔ)在倉(cāng)儲(chǔ)中并用句柄來(lái)標(biāo)識(shí)。數(shù)字圖書館提供包括名錄服務(wù)、索引服務(wù)、倉(cāng)儲(chǔ)服務(wù)和館藏服務(wù)在內(nèi)的一組核心服務(wù)。
【關(guān)鍵詞】數(shù)字圖書館;體系結(jié)構(gòu);數(shù)字對(duì)象;句柄;倉(cāng)儲(chǔ)
【分類號(hào)】G250
數(shù)字圖書館的基本目標(biāo)是創(chuàng)造一個(gè)良好的信息環(huán)境,通過(guò)互聯(lián)網(wǎng)提供對(duì)分布式存儲(chǔ)信息
的知識(shí)化組織、智能化訪問(wèn)和服務(wù)。但這些分散存儲(chǔ)而又各自獨(dú)立的信息倉(cāng)儲(chǔ)具有各自不同的組織、描述和檢索方式。網(wǎng)絡(luò)環(huán)境下跨倉(cāng)儲(chǔ)的、統(tǒng)一的、高效的訪問(wèn)和利用工具,以及高質(zhì)量信息的生成、組織和提取成為數(shù)字圖書館的研究重點(diǎn)。如果把Intemet看成是一個(gè)巨大的無(wú)墻圖書館,數(shù)字圖書館的目標(biāo)就是要優(yōu)化Intemet的信息存儲(chǔ)結(jié)構(gòu),提供一致的檢索接口,使整個(gè)網(wǎng)絡(luò)成為一個(gè)虛擬的、單一的、有組織、有結(jié)構(gòu)的信息集合,實(shí)現(xiàn)跨倉(cāng)儲(chǔ)的無(wú)縫檢索。要實(shí)現(xiàn)這一目標(biāo)有以下兩個(gè)方面問(wèn)題,它們也是廣義數(shù)字圖書館的信息體系結(jié)構(gòu)所研究的主要問(wèn)題。
第一,數(shù)字對(duì)象的組織結(jié)構(gòu)。數(shù)字對(duì)象是數(shù)字倉(cāng)儲(chǔ)中表示信息的基本邏輯單位,如一篇文章、一張圖片、一部音樂(lè)作品或是一段影像。數(shù)字對(duì)象的信息結(jié)構(gòu)是數(shù)字圖書館的基本問(wèn)題,它決定著進(jìn)一步的信息組織、處理和利用方式。
第二,分布式信息倉(cāng)儲(chǔ)的組織結(jié)構(gòu)。數(shù)字圖書館的收藏可以特指本地的信息倉(cāng)儲(chǔ),也可以是互連的信息倉(cāng)儲(chǔ)的集合。數(shù)字圖書館應(yīng)建立一個(gè)統(tǒng)一的、互操作的、可擴(kuò)展的組織框架.
將分布互連的信息倉(cāng)儲(chǔ)集成為一個(gè)整體,在此基礎(chǔ)上提供高質(zhì)量的信息服務(wù),如屏蔽各倉(cāng)儲(chǔ)的差異,提供統(tǒng)一的服務(wù)接口、語(yǔ)義化檢索、智能代理等。
1. 數(shù)字圖書館信息的體系結(jié)構(gòu)框架
按照Carl Lagoze和Sandra Payette的定義:數(shù)字圖書館是由數(shù)字對(duì)象構(gòu)成的館藏(內(nèi)容)和與數(shù)字對(duì)象的存儲(chǔ)、發(fā)現(xiàn)、檢索和保存有關(guān)的服務(wù)(功能)。數(shù)字圖書館具有開(kāi)放的體系結(jié)構(gòu)(0pen architecture),其含義是指將數(shù)字圖書館的整個(gè)功能劃分為一組定義明確的服務(wù),每一種服務(wù)都通過(guò)一種定義明確的協(xié)議來(lái)訪問(wèn)。數(shù)字圖書館的體系結(jié)構(gòu)為數(shù)字圖書館提供了其必須具備的基本功能,即一組核心服務(wù)。數(shù)字圖書館核心服務(wù)具有如下主要特征:(1)數(shù)字圖書館基礎(chǔ)結(jié)構(gòu)中的內(nèi)容以數(shù)字對(duì)象的形式存儲(chǔ)。(2)數(shù)字對(duì)象通過(guò)永久性的全局惟一的名稱(URN)進(jìn)行識(shí)別,URN(統(tǒng)一資源名稱)由命名服務(wù)器注冊(cè)。一個(gè)獨(dú)立的名錄服務(wù)器能將URN解析一個(gè)或多個(gè)由URN標(biāo)識(shí)的數(shù)字對(duì)象位置。(3)倉(cāng)儲(chǔ)服務(wù)系統(tǒng)提供數(shù)字對(duì)象的存儲(chǔ)和訪問(wèn)機(jī)制。倉(cāng)儲(chǔ)包含數(shù)字對(duì)象。如果一個(gè)數(shù)字對(duì)象的URN。。解析成相應(yīng)的倉(cāng)儲(chǔ),則認(rèn)為該數(shù)字對(duì)象包含在此倉(cāng)儲(chǔ)中,從而只有通過(guò)向相應(yīng)的倉(cāng)儲(chǔ)發(fā)送服務(wù)請(qǐng)汞才能訪問(wèn)該數(shù)字對(duì)象。(4)索引服務(wù)系統(tǒng)提供數(shù)字對(duì)象的發(fā)現(xiàn)機(jī)制,由索引服務(wù)器對(duì)數(shù)字對(duì)象組的信息進(jìn)行索引。向索引服務(wù)器提交查詢式可返回含有與查詢式匹配的數(shù)字對(duì)象的URN的結(jié)果集,客戶或代理然后將這些URN提交至名錄服務(wù)器以訪問(wèn)相應(yīng)的數(shù)字對(duì)象。(5)館藏服務(wù)系統(tǒng)提供將數(shù)字對(duì)象組匯聚成有用館藏的機(jī)制。館藏服務(wù)器按下列方式創(chuàng)建館藏:掃描一組索引服務(wù),讀取其元數(shù)據(jù)并應(yīng)用館藏定義標(biāo)準(zhǔn)來(lái)決定索引服務(wù)器標(biāo)引的哪些數(shù)字對(duì)象可以作為館藏元素。(6)用戶接口網(wǎng)關(guān)提供數(shù)字圖書館以人為中心的入口。每個(gè)用戶接口網(wǎng)關(guān)使用由館藏服務(wù)器提供的信息來(lái)檢索和訪問(wèn)這些館藏中的數(shù)字對(duì)象。用戶接El網(wǎng)關(guān)也使用館藏服務(wù)器和索引服務(wù)器提供的信息來(lái)制定檢索策略。
2數(shù)字對(duì)象系統(tǒng)
數(shù)字圖書館信息體系結(jié)構(gòu)的主要構(gòu)件是數(shù)字對(duì)象、句柄和倉(cāng)儲(chǔ)。數(shù)字圖書館由數(shù)字對(duì)象
構(gòu)成,它們存儲(chǔ)在倉(cāng)儲(chǔ)中,用句柄來(lái)標(biāo)識(shí);存儲(chǔ)在數(shù)字對(duì)象中的信息稱為內(nèi)容,內(nèi)容被分成數(shù)據(jù),關(guān)于數(shù)據(jù)的信息叫做屬性或稱為元數(shù)據(jù)。在數(shù)字圖書館中,信息以數(shù)字對(duì)象作為基本實(shí)體進(jìn)行存儲(chǔ)、訪問(wèn)、發(fā)送和管理。分布式數(shù)字對(duì)象服務(wù)框架按照一定的命名規(guī)則來(lái)標(biāo)識(shí)和定位數(shù)字對(duì)象、提供使用數(shù)字對(duì)象名字來(lái)定位和發(fā)送對(duì)象的服務(wù),并提供有關(guān)的訪問(wèn)協(xié)議。在分布式數(shù)字對(duì)象系統(tǒng)的體系結(jié)構(gòu)中,一個(gè)擁有數(shù)字材料的用戶要使該材料供系統(tǒng)使用,首先應(yīng)將材料放入數(shù)字對(duì)象。一個(gè)數(shù)字對(duì)象是一個(gè)數(shù)據(jù)結(jié)構(gòu),它主要包括:數(shù)字材料(或數(shù)據(jù)),以及句柄它是該材料的惟一標(biāo)識(shí)符。用戶請(qǐng)求從授權(quán)的句柄生成器獲得一個(gè)句柄,隨后,將數(shù)字對(duì)象存入一個(gè)或多個(gè)倉(cāng)儲(chǔ)中,從而該數(shù)字對(duì)象可為他人所用。把數(shù)字對(duì)象存入倉(cāng)儲(chǔ)時(shí),應(yīng)將其句柄和倉(cāng)儲(chǔ)名向一個(gè)全局的句柄注冊(cè)系統(tǒng)注冊(cè)。以后,用戶向句柄服務(wù)器提交一個(gè)句柄可獲得存放相應(yīng)數(shù)字對(duì)象的網(wǎng)絡(luò)名或倉(cāng)儲(chǔ)地址。
3倉(cāng)儲(chǔ)服務(wù)系統(tǒng)
倉(cāng)儲(chǔ)是一種可通過(guò)網(wǎng)絡(luò)訪問(wèn)的存儲(chǔ)系統(tǒng),其中存儲(chǔ)的數(shù)字對(duì)象可被存取和檢索。倉(cāng)儲(chǔ)除了包含數(shù)字對(duì)象,也包含了其他相關(guān)信息、服務(wù)和管理信息。倉(cāng)儲(chǔ)具有一個(gè)正式的、惟一的名稱,由一個(gè)全局命名授權(quán)(Global Naming Authority)分配和批準(zhǔn)。倉(cāng)儲(chǔ)的實(shí)現(xiàn)采用三層結(jié)構(gòu)。第1層:倉(cāng)儲(chǔ)外殼。它是倉(cāng)儲(chǔ)與外界的接口部分,它實(shí)現(xiàn)了倉(cāng)儲(chǔ)訪問(wèn)協(xié)議(RAP),實(shí)現(xiàn)了數(shù)字對(duì)象的內(nèi)外格式轉(zhuǎn)換,并管理用戶權(quán)限和訪問(wèn)許可。第2層:對(duì)象管理層。它在永久存儲(chǔ)層所提供的服務(wù)和倉(cāng)儲(chǔ)外殼層所要求的面向?qū)ο蠊δ苤g提供一種接口,并提供數(shù)字對(duì)象及其所在位置之間的映射。第3層永久存儲(chǔ)層。倉(cāng)儲(chǔ)中的信息保存在永久存儲(chǔ)層。永久存儲(chǔ)層的實(shí)現(xiàn)對(duì)外界是完全透明的。倉(cāng)儲(chǔ)外殼的設(shè)計(jì)可適應(yīng)各種永久存儲(chǔ)層。倉(cāng)儲(chǔ)訪問(wèn)協(xié)議是每個(gè)倉(cāng)儲(chǔ)都必須支持的。目前RAP支持存放數(shù)字對(duì)象,通過(guò)句柄訪問(wèn)數(shù)字對(duì)象并提供下列倉(cāng)儲(chǔ)服務(wù):在一個(gè)倉(cāng)儲(chǔ)中存入一個(gè)數(shù)字對(duì)象;從一個(gè)倉(cāng)儲(chǔ)中刪除一個(gè)數(shù)字對(duì)象;確認(rèn)倉(cāng)儲(chǔ)中已存有一個(gè)帶有特定句柄的數(shù)字對(duì)象;訪問(wèn)一個(gè)倉(cāng)儲(chǔ)的數(shù)字對(duì)象;訪問(wèn)一個(gè)指定數(shù)字對(duì)象的元數(shù)據(jù);修改倉(cāng)儲(chǔ)中的一個(gè)數(shù)字對(duì)象的元數(shù)據(jù);修改倉(cāng)儲(chǔ)中的一個(gè)數(shù)字對(duì)象的數(shù)據(jù);確認(rèn)一個(gè)句柄已在句柄系統(tǒng)中注冊(cè);訪問(wèn)倉(cāng)
儲(chǔ)元數(shù)據(jù)(Access Repo Meta)。
4名錄服務(wù)系統(tǒng)
名字是數(shù)字對(duì)象的重要替代信息。名錄服務(wù)系統(tǒng)的功能是負(fù)責(zé)數(shù)字對(duì)象名字的創(chuàng)建、解
析和管理。名錄服務(wù)系統(tǒng)包括開(kāi)放的句柄協(xié)議、名字空間和句柄協(xié)議的具體實(shí)現(xiàn)。分布式的
計(jì)算機(jī)管理系統(tǒng)可以存儲(chǔ)數(shù)字資源的名字即句柄通過(guò)句柄協(xié)議可以將句柄解析成數(shù)字資
源所在倉(cāng)儲(chǔ)的位置,從而使用戶或代理可以通過(guò)句柄訪問(wèn)和使用這些資源。資源的位置發(fā)生
改變時(shí),句柄不改變,因而資源的名字是永久性的。句柄系統(tǒng)即名錄服務(wù)系統(tǒng)采用層次服務(wù)模型。項(xiàng)層是一個(gè)全局句柄注冊(cè)系統(tǒng),底層是多個(gè)句柄服務(wù)系統(tǒng),它們共同構(gòu)成名錄服務(wù)系統(tǒng)負(fù)責(zé)句柄的創(chuàng)建、解析和刪除。全局句柄注冊(cè)系統(tǒng)用于管理句柄命名的名字空間,是一個(gè)集中管理的注冊(cè)服務(wù)。所有的命名授權(quán)必須用全局句柄注冊(cè)系統(tǒng)注冊(cè)。局部句柄服務(wù)系統(tǒng)管理在其命名授權(quán)下的所有旬柄,為這些局部名字提供解析和管理服務(wù)。局部句柄服務(wù)系統(tǒng)與多個(gè)倉(cāng)儲(chǔ)相關(guān)聯(lián),實(shí)現(xiàn)倉(cāng)儲(chǔ)與名錄服務(wù)系統(tǒng)的交互。
5索引服務(wù)系統(tǒng)
索引服務(wù)系統(tǒng)是數(shù)字圖書館信息基礎(chǔ)結(jié)構(gòu)的一個(gè)重要組成部分,其任務(wù)是進(jìn)行資源發(fā)現(xiàn),從而使用戶能夠方便地從館藏中尋找和發(fā)現(xiàn)所需的對(duì)象。索引服務(wù)系統(tǒng)的工作原理是:索引服務(wù)器收集關(guān)于數(shù)字對(duì)象的信息,這些信息可以是數(shù)字對(duì)象的替代信息如傳統(tǒng)圖書館的編目記錄,或者是對(duì)象的全部?jī)?nèi)容如全文搜索引擎使用的全文信息。這些替代信息被組織成結(jié)構(gòu)化的索引,使搜索引擎在響應(yīng)查詢請(qǐng)求時(shí)能保證查準(zhǔn)率、查全率和檢索效率。查詢請(qǐng)求的響應(yīng)是一個(gè)結(jié)果集,結(jié)果集中的每一條檢索結(jié)果都是與查詢請(qǐng)求相匹配的數(shù)字對(duì)象的替代信息,替代信息的簡(jiǎn)略形式是數(shù)字對(duì)象的惟一標(biāo)識(shí)符;通過(guò)名錄服務(wù)系統(tǒng)解析該標(biāo)識(shí),就可以訪問(wèn)相應(yīng)的數(shù)字對(duì)象。未來(lái)的中國(guó)數(shù)字圖書館應(yīng)是一個(gè)聯(lián)邦數(shù)字圖書館,其成員館具有各自不同的館藏內(nèi)容和服務(wù),具有各自不同的信息組織和描述方式。以上闡述的數(shù)字圖書館的信息體系結(jié)構(gòu)為解決異構(gòu)數(shù)據(jù)庫(kù)的檢索、實(shí)現(xiàn)跨庫(kù)無(wú)縫檢索提供了一種有效途徑。
參考文獻(xiàn):
1唐世渭,楊冬青等.?dāng)?shù)字圖書館的體系結(jié)構(gòu).計(jì)算機(jī)世界
2王軍.?dāng)?shù)字圖書館體系結(jié)構(gòu)比較研究.大學(xué)圖書館學(xué)報(bào)
3劉煒,張亮.?dāng)?shù)字圖書館的體系結(jié)構(gòu)與元數(shù)據(jù)方案.情報(bào)學(xué)報(bào)
作者簡(jiǎn)介:謝芳紅,女,1968.8生,湖南工程學(xué)院圖書館,助理館員,研究方向:信息資源管理,