[摘 要] 鑒于數(shù)字圖書館在非物質(zhì)文化保護(hù)中的重要作用,在分析數(shù)字圖書館的定義 、 功能和實(shí)現(xiàn)標(biāo)準(zhǔn)的基礎(chǔ)上,提出了一種基于XML/Metadata框架的非物質(zhì)文化數(shù)字圖書館架構(gòu), 并且 給出了該架構(gòu)的組成以及各組成部分的功能劃分,描繪了實(shí)現(xiàn)各部分功能的關(guān)鍵技術(shù)。
[關(guān)鍵詞]數(shù)字圖書館;資源描述;非物質(zhì)文化;XML/Metadata
[中圖分類號(hào)]G250.76[文獻(xiàn)標(biāo)志碼]A[文章編號(hào)]1005-6041(2010)03-0004-03
1 引 言
非物質(zhì)文化遺產(chǎn)指各族人民世代相承的、與群眾生活密切相關(guān)的各種傳統(tǒng)文化表現(xiàn)形式 (如民俗活動(dòng)、表演藝術(shù)、傳統(tǒng)知識(shí)和技能以及與之相關(guān)的器具、實(shí)物、手工制品等)和 文化空間[1]。保護(hù)非物質(zhì)文化遺產(chǎn)對(duì)于弘揚(yáng)和發(fā)展我國(guó)各民族悠久、燦爛的文化 有著積極 的現(xiàn)實(shí)意義。針對(duì)非物質(zhì)文化遺產(chǎn)的保護(hù),國(guó)內(nèi)圖書情報(bào)學(xué)界 也從本學(xué)科的角度對(duì)其進(jìn)行了各種探討。如韓旭、曹永存等人主張“ 構(gòu)建一個(gè)基于Web 的非物質(zhì)文化遺產(chǎn)多媒體資源庫(kù),力求通過該資源庫(kù)的構(gòu)建探索一種新 的保護(hù)非物質(zhì)文化遺產(chǎn)的途徑及具體方法”[2];彭毅認(rèn)為,利用數(shù)字信息化手 段對(duì)在搶 救和保護(hù)工作中形成的非物質(zhì)文化遺產(chǎn)檔案進(jìn)行保護(hù),是非常重要而且必要的[3]; 也有人提 出,隨著信息科學(xué)技術(shù)的迅速發(fā)展,在現(xiàn)代技術(shù)手段的支持下,圖書館用音頻 、視頻、文字等多種記錄手段使活態(tài)文化轉(zhuǎn)化、凝化成為顯性知識(shí),使得非物質(zhì)文化遺產(chǎn)在 圖 書館的保存成為可能[4-5]。數(shù)字圖書館由于具備海量存儲(chǔ),良好的網(wǎng)絡(luò)應(yīng)用環(huán)境 , 強(qiáng)大的信息傳播、發(fā)布服務(wù)模式等優(yōu)勢(shì)為其在非物質(zhì)文化保護(hù)方面提供了一種全新的路徑和 方法。
2 數(shù)字圖書館及其技術(shù)標(biāo)準(zhǔn)
2.1 關(guān)于數(shù)字圖書館的定義
目前,數(shù)字圖書館作為現(xiàn)代社會(huì)信息化進(jìn)程的產(chǎn)物,學(xué)術(shù)界尚無(wú)完整的定義。本文采用美國(guó) 著 名 學(xué)者、北卡羅萊納大學(xué)信息與圖書館學(xué)院教授Gary Marchionini的觀點(diǎn),即“數(shù)字圖書館是 一個(gè)管理結(jié)構(gòu)化的多媒體數(shù)據(jù)的新型分布式數(shù)據(jù)庫(kù)服務(wù)設(shè)施”[6]。他認(rèn)為,數(shù)字 圖書館領(lǐng)域牽涉到增加人類文明的問題,這是通過將數(shù)字技術(shù)應(yīng)用到圖書館、博物館、學(xué)校 、出版社及其他信息機(jī)構(gòu)所強(qiáng)調(diào)的信息問題來(lái)達(dá)到的,通過綜合各種服務(wù),有效消除界面、 地理位置、 時(shí)間、語(yǔ)言、系統(tǒng)等因素的影響,更好地為人類服務(wù)[7]。
2.2 數(shù)字圖書館的功能
從理論上來(lái)說,數(shù)字圖書館是一種應(yīng)用數(shù)字化的物理信息對(duì)象的方法。它的功能主要有以下 6項(xiàng):①各種信息載體的數(shù)字化;②海量多媒體信息的存儲(chǔ)和管理;③提供對(duì)數(shù)據(jù)有效的在 線訪問和查詢;④數(shù)字化信息的網(wǎng)上發(fā)布和傳送;⑤系統(tǒng)管理和版權(quán)保護(hù);⑥系統(tǒng)集成。這 些功能既是組成數(shù)字圖書館的體系構(gòu)架,又是推進(jìn)數(shù)字圖書館實(shí)用化的關(guān)鍵。
2.3 數(shù)字圖書館的技術(shù)標(biāo)準(zhǔn)
數(shù)字圖書館的實(shí)現(xiàn),需要考慮到不同系統(tǒng)間的相互操作和數(shù)據(jù)交換的可能性。對(duì)于如何滿足 這 種需要,西方學(xué)者進(jìn)行了大量的討論和實(shí)踐,具體來(lái)說數(shù)字圖書館應(yīng)采用的標(biāo)準(zhǔn)主要有:[8-10]1) 資源表述與處理語(yǔ)言。主要包括標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言(SGML)、拓展標(biāo)記語(yǔ)言(XM L)、資源描述框架(RDF)和句法、應(yīng)用服務(wù)定義與協(xié)議(主要是Z39.50標(biāo)Z39.50—1995和 Z 39.50協(xié)議第二版、第三版)以及編碼字符(UNICODE)。 2)元數(shù)據(jù)格式。元數(shù)據(jù)是實(shí)現(xiàn)數(shù)字圖書館網(wǎng)絡(luò)服務(wù)的技術(shù)關(guān)鍵,主要包括MARC家 族 (USMARC、UNIMARC、CNMARC)、都柏林元核心元數(shù)據(jù)(Dublin Core)以及視覺資料核心類 目元數(shù)據(jù)(VRA Core)。
3 基于XML/Metadata框架的非物質(zhì)文化數(shù)字圖書館架構(gòu)
3.1 非物質(zhì)文化遺產(chǎn)資源描述: XML/Metadata框架簡(jiǎn)介
非物質(zhì)文化遺產(chǎn)是在悠久的歷史中不斷孕育、相承并豐富起來(lái)的。非物質(zhì)文化遺產(chǎn)具體表現(xiàn) 為:①口頭傳統(tǒng),包括作為非物質(zhì)文化遺產(chǎn)媒介的語(yǔ)言,例如梁祝傳說、格薩爾史詩(shī);②傳 統(tǒng)表演藝術(shù)(含戲曲、音樂、舞蹈、曲藝、雜技等);③民俗活動(dòng)、禮儀、節(jié)慶;④有關(guān)自 然界和宇宙的民間傳統(tǒng)知識(shí)和實(shí)踐;⑤傳統(tǒng)的手工藝技能;⑥與上述表現(xiàn)形式相關(guān)的文化空 間。對(duì)于非物質(zhì)文化遺產(chǎn)的資源描述是非物質(zhì)文化數(shù)字圖書館建設(shè)的關(guān)鍵問題,本文將從XM L/Metadata角度探討如何建立對(duì)非物質(zhì)文化遺產(chǎn)的資源描述機(jī)制。
目前,超文本標(biāo)記語(yǔ)言(HTML)是網(wǎng)絡(luò)構(gòu)建的基礎(chǔ),但是HTML作為標(biāo)記語(yǔ)言的局限性已經(jīng)暴 露,漸漸不能滿足人們的需要。這種情況使得可擴(kuò)展標(biāo)記語(yǔ)言(XML)應(yīng)運(yùn)而生。比 之SGML與HTML,XML具有明顯的優(yōu)勢(shì):[11]首先,XML是可擴(kuò)展的,標(biāo)記不再 是 固定 的,允許 定義數(shù)量不限的標(biāo)記來(lái)描述文檔中的資料,允許嵌套信息結(jié)構(gòu)的存在;其次,XML作為一種 “ 元語(yǔ)言”(Metalanguage),是一系列定義文檔元數(shù)據(jù)的規(guī)則集合,具有專用的、與用戶關(guān) 注的信息相匹配的一些標(biāo)記,可以更快導(dǎo)向用戶所需的信息數(shù)據(jù);再次,與SGML相比,XML 保留了其強(qiáng)大的可擴(kuò)展性和實(shí)用性,卻不需要昂貴的軟件支持,結(jié)構(gòu)也大大簡(jiǎn)化。
利用XML可以生成各種用于不同目的的元數(shù)據(jù),例如導(dǎo)航圖(Sitemaps)、內(nèi)容評(píng)價(jià)(Conte nt Rating)、流路徑(Stream Channel)、定義(Definition)、規(guī)范(Authoring)等。 同時(shí),XML由于其具備的強(qiáng)大功能和靈活性,實(shí)際上已經(jīng)成為了一些元數(shù)據(jù)的基礎(chǔ),例如由W 3C提出 的資源描述框架(Resource Description Framework,RDF)就是XML的一項(xiàng)重要應(yīng)用,RD F采用XML句法表達(dá)語(yǔ)義,可以描述內(nèi)容及內(nèi)容的關(guān)系,易實(shí)現(xiàn)資源共享和交換;在RDF框架 中,內(nèi)容可以按照不同的用戶進(jìn)行分級(jí)保護(hù),將大大方便網(wǎng)絡(luò)信息資源的組織與管理。這 對(duì)于數(shù)字圖書館的開發(fā)具有重要的意義。
3.2 基于XML/Metadata框架的非物質(zhì)文化數(shù)字圖書館模型
數(shù)字圖書館從技術(shù)角度常常被看做是一種基于Web的信息資源組織體系,其應(yīng)用需求 和體 系框架跟其他的組織體系有共通之處,較為著名的有OASIS:SOA1.0參考模型、書目記錄功能 需求(FRBR)模型等。但是國(guó)內(nèi)有學(xué)者認(rèn)為,數(shù)字圖書館作為一個(gè)應(yīng)用領(lǐng)域并不存在固定的 模式,其共性是非常難以把握的,因而要建立公認(rèn)的模型幾乎是不可能的[12]。
筆者認(rèn)為,不論具體資源內(nèi)容和服務(wù)對(duì)象是什么,從簡(jiǎn)化數(shù)字圖書館的開發(fā)過程和促進(jìn)數(shù)字 圖書館建設(shè)的角度來(lái)看,還是有必要將具體的需求和體系構(gòu)建抽象出來(lái),作為一種方法論體 系, 在服務(wù)應(yīng)用實(shí)踐的同時(shí)不斷重用和改進(jìn)。在國(guó)外,圖書情報(bào)界已經(jīng)有較為成熟的看法, 其中首推Edward A. Fox等人的5S模型,F(xiàn)ox回避了數(shù)字圖書館的具體概念,著眼于數(shù)字圖 書館存在和運(yùn)行的要素(element),構(gòu)成了一個(gè)獨(dú)特的數(shù)字圖書館模型——5S模型;Fox等 人認(rèn)為,與數(shù)字圖書館相關(guān)的所有實(shí)體都可以歸入5項(xiàng)要素:流體性要素(Streams)、結(jié)構(gòu) 性要素(Structures)、空間性要素(Spaces)、情境性要素(Scenarios)以及社會(huì)性要 素(Societies)[13]。難能可貴的是,經(jīng)過Fox等學(xué)者的長(zhǎng)時(shí)間努力,5S并未停留 在理論探討層面,而是在實(shí)踐方面不斷地進(jìn)行了豐富和完善。到目前為止,已形成了包括5S L 、5SGraph、5SGen等在內(nèi)的一套完整的建模和代碼生成開發(fā)工具。同時(shí),比起FEDORA、DSPA CE、Green Stone等體系來(lái)講,5S理論在系統(tǒng)的可移植性、擴(kuò)展性和互操作性上具有無(wú)可比 擬的優(yōu)越性。
5S模型封裝了各種復(fù)雜的實(shí)體關(guān)系,并對(duì)其進(jìn)行了高度的抽象,進(jìn)而大大簡(jiǎn)化了數(shù)字圖書館 建設(shè)過程中的復(fù)雜性。本文借鑒5S模型思路,提出非物質(zhì)文化數(shù)字圖書館5層系統(tǒng)模型(見圖 1) 。
對(duì)上述層次模型進(jìn)行展開細(xì)化,進(jìn)而得到基于XML/Metadata的非物質(zhì)文化數(shù)字圖書 館架構(gòu)(見圖2)。
3.3 系統(tǒng)各部分功能的實(shí)現(xiàn)及其關(guān)鍵技術(shù)
從整體功能定位來(lái)看,非物質(zhì)文化數(shù)字圖書館屬于特種館藏型模式,可它并不排除具有服務(wù) 主導(dǎo)型模式以及商用文獻(xiàn)型模式的某些特點(diǎn)。作為當(dāng)今的主流模式之一,特種館藏型數(shù)字 圖 書館的功能主要是將自己的珍藏(包括善本、古籍等)以及特種館藏(包括圖片、音頻 、視頻等各種信息載體)的資料進(jìn)行數(shù)字化,在網(wǎng)絡(luò)上共享和提供檢索。例如美國(guó)國(guó) 會(huì)圖書館的“美國(guó)記憶”[14]。
因此,本文提出的架構(gòu)的主要功能是提供對(duì)非物質(zhì)文化資源的描述、存儲(chǔ)與訪問,這些功能 的實(shí)現(xiàn)要依賴于一組相互獨(dú)立的服務(wù)與功能組件,即知識(shí)門戶、中介服務(wù)、聚集服務(wù)、索引 服務(wù)、知識(shí)文檔集服務(wù)、索引生成器、索引查詢器及元知識(shí)生成器。
(1)資源描述層,描述非物質(zhì)文化信息載體的屬性。例如文本資料的編碼語(yǔ)言或者多媒體 數(shù) 據(jù)的格式,舉例與非物質(zhì)文化相關(guān)的文本、視頻、音頻、圖像等。
(2)功能層,非物質(zhì)文化數(shù)字圖書館的組織特性描述與規(guī)定。如資源集合、目錄、超媒體 、 文件以及元數(shù)據(jù)。
(3)組件層,數(shù)字圖書館各組件的邏輯組合以及用戶視圖。如數(shù)據(jù)的度量、數(shù)量、拓?fù)浣Y(jié) 構(gòu) 、矢量、概率值的計(jì)算。
(4)應(yīng)用層,非物質(zhì)文化數(shù)字圖書館服務(wù)的行為細(xì)節(jié)。如訪問、查詢、瀏覽、推送(推薦 ) 等。
(5)服務(wù)目標(biāo)層,數(shù)字圖書館各環(huán)節(jié)、各類角色的分擔(dān)。例如服務(wù)的管理員、學(xué)生 、 教師、 科 研人員等。
4 結(jié) 語(yǔ)
伴隨著信息基礎(chǔ)設(shè)施(NII)的不斷發(fā)展,數(shù)字圖書館對(duì)科學(xué)、教育、商業(yè)乃至社會(huì)文化的 各個(gè)方面都產(chǎn)生了深遠(yuǎn)的影響,借助它我們得以更好地開發(fā)、傳播、利用現(xiàn)代社會(huì)的寶貴資 源——信息來(lái)為我們的生產(chǎn)和生活服務(wù)。
作為一個(gè)急速變化和發(fā)展的領(lǐng)域,DLI到目前為止還是圖書情報(bào)學(xué)中一個(gè)極其模 糊的領(lǐng)域[15],但這并不妨礙我們利用數(shù)字圖書館的理論與技術(shù)來(lái)解決我們所面臨 的現(xiàn)實(shí)問 題,本文所論述的便是一個(gè)將其應(yīng)用于社會(huì)經(jīng)濟(jì)文化實(shí)踐的具體例子。然而,如何進(jìn)一步將DLI這種新生事物更好地應(yīng)用到紛繁復(fù)雜的非物質(zhì)文化寶庫(kù)的保護(hù) 、開發(fā)和利用中去,還有很多工作需要做。
[參考文獻(xiàn)]
[1] 國(guó)務(wù)院辦公廳.國(guó)務(wù)院辦公廳關(guān)于加強(qiáng)我國(guó)非物質(zhì)文化遺產(chǎn)保護(hù)工作的意見[EB/OL ].[2009-09-06].http://www.gov.cn/zwgk/2005-08/15/content_21681.htm.
[2] 韓 旭,曹永存等.構(gòu)建基于Web的非物質(zhì)文化遺產(chǎn)多媒體資源庫(kù)[J].情報(bào)雜志,200 9(5):189—191.
[3] 彭 毅.非物質(zhì)文化遺產(chǎn)檔案的數(shù)字化保護(hù)[J]. 檔案與建設(shè),2009(1):46—48.
[4] 關(guān)葵葵.圖書館與非物質(zhì)文化遺產(chǎn)的保護(hù)[J].情報(bào)探索,2007(12):19—20.
[5] 彭 燕.非物質(zhì)文化遺產(chǎn)與圖書館特色文獻(xiàn)建設(shè)[J].大學(xué)圖書情報(bào)學(xué)刊,2008(5):48 —50.
[6] Marchionini G. Research and Development in Digital Libraries[EB/OL]. [2009-10-12].http://ils.unc.edu/%7Emarch/ digital_library_R_and_D.html.
[7] Marchionini G, Fox E. Toward a worldwide digital library[J]. InformationProcessing and Management (Album Introduction) ,1999, 35(3):219—225.
[8] Fox E, et al.Digital libraries[J]. Communications of the ACM,1995,38 (4):23—96.
[9] W3C.Issues Recommendation for Resource Description Framework[EB/OL].[2 0 09-10-15].http://www.w3.org/press/1999/RDF-REC.
[10] Hinnebusch M.Report to the CIC on the state of Z39.50 [EB/OL].[2009- 06- 03].http://nova.cic.uiuc.edu/cic/cli/z3950narr.html.
[11] 趙慧勤.元數(shù)據(jù)研究[G]∥張力治.情報(bào)學(xué)進(jìn)展:第4卷(2000-2001年度評(píng)論).北京 :國(guó)防工業(yè)出版社,2001:242.
[12] 劉 煒.數(shù)字圖書館:在賽百基礎(chǔ)結(jié)構(gòu)中的重新定位[G]∥王忠軍.情報(bào)學(xué)進(jìn)展:第 6卷(2004-2005年度評(píng)論).北京:國(guó)防工業(yè)出版社,2006:59.
[13] Marcos André Gonalves,F(xiàn)ox E A. Streams, structures, spaces, scen ar ios, societies (5s): A formal model for digital libraries [J] .ACM Transaction s on Information Systems (TOIS), 2004, 22 (2):270—312.
[14] The Library of Congress.American Memory Home[EB/OL]. [2009-11-05].htt p://memory.loc.gov/ammem/index.html.
[15] 博格曼. 從古登堡到全球信息基礎(chǔ)設(shè)施[M]. 北京:中信出版社,2003:41.
[收稿時(shí)間]2010-01-28
[作者簡(jiǎn)介] 吳林娟(1980—),女,碩士,編輯,南京工程學(xué)院學(xué)報(bào)編輯部;瞿 輝(198 0—),男,碩士,講師,重慶文理學(xué)院文傳學(xué)院。