〔摘要〕元數(shù)據(jù)可以實(shí)現(xiàn)對(duì)龐大數(shù)字文化資源的描述、管理和有效檢索。本文首先介紹了數(shù)字文化資源的特點(diǎn)和應(yīng)用中對(duì)元數(shù)據(jù)的實(shí)際需求,并重點(diǎn)分析了數(shù)字文化資源的元數(shù)據(jù)格式。之后,通過(guò)對(duì)目前國(guó)內(nèi)外已有元數(shù)據(jù)格式的分析和歸納,本文提出了以VRA Core(Visual Resources Association)作為核心格式,CDWA(The Categories for Description of Works of Art)部分元素作為擴(kuò)展元素的數(shù)字文化資源的元數(shù)據(jù)格式。最后通過(guò)實(shí)例來(lái)分析所提出元數(shù)據(jù)格式在數(shù)字文化資源應(yīng)用中的可行性。
〔關(guān)鍵詞〕數(shù)字文化資源;元數(shù)據(jù);VAR Core;CDWA
〔中圖分類號(hào)〕TP311.13〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2013)08-0061-04
文化資源是人類在社會(huì)發(fā)展過(guò)程中創(chuàng)造并借以進(jìn)一步從事文化生產(chǎn)和文化活動(dòng)的物質(zhì)成果和精神成果的總和。廣義的文化資源難以給出具體的界定,只要能體現(xiàn)人類追求和滿足人類精神需求的產(chǎn)品或活動(dòng),都應(yīng)屬于文化資源的范疇。我國(guó)歷史悠久,民族風(fēng)俗各異,民俗風(fēng)情資源相當(dāng)豐富,同時(shí)目前各文化領(lǐng)域也不斷涌現(xiàn)出各種各樣的文化資源,為了保護(hù)與保存、傳承、傳播、交流共享這些文化資源,我們需要對(duì)文化資源進(jìn)行數(shù)字化處理。
文化資源種類繁多、數(shù)據(jù)龐大,而且增長(zhǎng)速度也非??欤瑸榱朔奖愦_認(rèn)、檢索、管理這些文化資源,人們提出了數(shù)字文化資源的元數(shù)據(jù)概念。所謂元數(shù)據(jù),是描述數(shù)據(jù)的數(shù)據(jù)或信息的信息。元數(shù)據(jù)的使用領(lǐng)域非常廣泛,不同領(lǐng)域(甚至同一領(lǐng)域)往往存在著多個(gè)不同的元數(shù)據(jù)格式。在數(shù)字文化資源領(lǐng)域中,元數(shù)據(jù)格式的選擇不僅要根據(jù)其數(shù)據(jù)特點(diǎn)和應(yīng)用需要,同時(shí)還需要盡量考慮元數(shù)據(jù)格式的兼容性以及后續(xù)的可擴(kuò)展性。首先本文將介紹一些相關(guān)概念,并總結(jié)歸納幾種經(jīng)典的元數(shù)據(jù)格式,其次分析合適數(shù)字文化資源的元數(shù)據(jù)格式并以一實(shí)例分析其可行性,最后對(duì)本文進(jìn)行總結(jié)和展望。
1元數(shù)據(jù)與數(shù)字文化資源
1.1元數(shù)據(jù)簡(jiǎn)介
元數(shù)據(jù)是“用來(lái)描述數(shù)字化信息資源并確保這些數(shù)字化信息資源能夠被計(jì)算機(jī)自動(dòng)辨析、分解、提取和分析歸納的一種框架或一套編碼體系”[1]。在不同的領(lǐng)域元數(shù)據(jù)的具體定義不盡相同。在圖書館與信息界,元數(shù)據(jù)被定義為“提供關(guān)于信息資源或數(shù)據(jù)的一種結(jié)構(gòu)化的數(shù)據(jù),是對(duì)信息資源的結(jié)構(gòu)化的描述”[2]。但它的本質(zhì)則是描述數(shù)據(jù)的數(shù)據(jù)(data about data),它是信息共享和交換的基礎(chǔ)和前提。元數(shù)據(jù)的使用目的在于:(1)識(shí)別資源;(2)評(píng)價(jià)資源;(3)跟蹤資源;(4)實(shí)現(xiàn)信息資源的保存與保護(hù)、發(fā)現(xiàn)、查找以及對(duì)信息資源的有效管理等。
元數(shù)據(jù)格式涉及的內(nèi)容有元數(shù)據(jù)內(nèi)容格式、元數(shù)據(jù)應(yīng)用規(guī)范和元數(shù)據(jù)格式語(yǔ)言[3]。其中元數(shù)據(jù)內(nèi)容格式一般由標(biāo)題、創(chuàng)作者、主題、日期等元素或其子元素組成。而應(yīng)用規(guī)范是應(yīng)用系統(tǒng)在使用元數(shù)據(jù)格式進(jìn)行實(shí)際描述數(shù)據(jù)時(shí)的具體規(guī)范,涉及元素選擇方式,元素內(nèi)容詳細(xì)界定,內(nèi)容描述方式等內(nèi)容。所謂元數(shù)據(jù)格式語(yǔ)言,是指定義、標(biāo)記、封裝、交換傳遞元數(shù)據(jù)時(shí)所用到的語(yǔ)言。目前在不同領(lǐng)域和不同應(yīng)用項(xiàng)目中已存在多種不同的元數(shù)據(jù)格式。
元數(shù)據(jù)的應(yīng)用范圍非常廣,Susanne Boll等專家認(rèn)為元數(shù)據(jù)可應(yīng)用于圖像、聲頻和視頻的檢索和導(dǎo)航,結(jié)構(gòu)化的文獻(xiàn)管理,地理和環(huán)境信息系統(tǒng),數(shù)字圖書館,混合多媒體等[4]。隨著數(shù)字化信息的發(fā)展,元數(shù)據(jù)也正在被用于數(shù)字圖書館、醫(yī)學(xué)信息資源等更多的領(lǐng)域中。
1.2數(shù)字文化資源簡(jiǎn)介
數(shù)字文化資源是文化資源數(shù)字化后的產(chǎn)物。文化資源的數(shù)字化是利用數(shù)字技術(shù)對(duì)文化資源進(jìn)行加工處理。數(shù)字文化資源的時(shí)效性強(qiáng),并且不受時(shí)間、地域的限制。文化資源種類眾多,分類方式也很多。一般意義上的數(shù)字文化資源非常廣泛,目前國(guó)際上還未形成可用數(shù)字文化資源描述的統(tǒng)一元數(shù)據(jù)格式。針對(duì)不同種類的數(shù)字文化資源形成適合該種類的數(shù)字文化資源的元數(shù)據(jù)格式更具現(xiàn)實(shí)意義。
數(shù)字文化資源的元數(shù)據(jù)格式是根據(jù)其數(shù)據(jù)特點(diǎn)和應(yīng)用需求而確定的。在數(shù)字文化資源領(lǐng)域,元數(shù)據(jù)主要用于對(duì)數(shù)字文化資源的管理、保護(hù)與長(zhǎng)期保存、描述、確認(rèn)和檢索、知識(shí)產(chǎn)權(quán)的辨認(rèn)、跟蹤和管理等。因此數(shù)字文化資源的元數(shù)據(jù)除了具有其他一般元數(shù)據(jù)的元素外(比如主題、創(chuàng)作者、來(lái)源等),還應(yīng)元數(shù)據(jù)內(nèi)容上體現(xiàn)技術(shù)、材料、位置、風(fēng)格/時(shí)期等元素。此外,在功能上一定要滿足著錄描述、確認(rèn)和檢索、保護(hù)與保存、管理。
2元數(shù)據(jù)格式分析
隨著元數(shù)據(jù)重要性日益突出,許多國(guó)家、國(guó)際學(xué)術(shù)團(tuán)體和公司都在研究制定與其密切相關(guān)的元數(shù)據(jù)格式。下面將介紹幾種目前國(guó)內(nèi)外比較經(jīng)典的元數(shù)據(jù)格式。
2.1國(guó)外常用的幾種元數(shù)據(jù)格式
2.1.1DC
都柏林核心元數(shù)據(jù)(Dublin Core,DC)[5]是由計(jì)算機(jī)專家、網(wǎng)絡(luò)專家和圖書館專家等人員所組成的一個(gè)非正式小組于1995年在美國(guó)俄亥俄州都柏林開發(fā)的元數(shù)據(jù)元素集。DC由15個(gè)基本元素組成,包括標(biāo)題、創(chuàng)作者、主題、摘要等。DC簡(jiǎn)單易用,并主要用于網(wǎng)絡(luò)資源的著錄和發(fā)現(xiàn)。隨著DC的發(fā)展,DC與其它多種元數(shù)據(jù)格式建立了映射關(guān)系,通常還被作為各種元數(shù)據(jù)格式轉(zhuǎn)換的媒介。DC元數(shù)據(jù)應(yīng)用于各學(xué)科各領(lǐng)域,如澳大利亞政府定位器服務(wù),丹麥國(guó)家圖書館等。
2.2.2中國(guó)科學(xué)院科學(xué)數(shù)據(jù)庫(kù)核心元數(shù)據(jù)格式
中國(guó)科學(xué)院科學(xué)數(shù)據(jù)庫(kù)核心元數(shù)據(jù)格式是由中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心主持,聯(lián)合中科院各單位共同研究制定,主要用于科學(xué)數(shù)據(jù)庫(kù)資源的建設(shè)、管理、共享和服務(wù)等[7]。其元數(shù)據(jù)由數(shù)據(jù)集元數(shù)據(jù)、服務(wù)元數(shù)據(jù)兩部分組成。該元數(shù)據(jù)格式是開放式的,用戶可基于該方案開發(fā)滿足特定需求的元數(shù)據(jù)。
3元數(shù)據(jù)與數(shù)字文化資源
4結(jié)論
我國(guó)的文化資源非常豐富且增長(zhǎng)迅速,對(duì)文化資源的數(shù)字化處理可以在很大程度上解決資源保護(hù)、傳承、交流共享等問(wèn)題。本文首先分析了數(shù)字文化資源的特點(diǎn)和應(yīng)用需求,并對(duì)目前國(guó)內(nèi)外已有的元數(shù)據(jù)格式進(jìn)行分析和歸納,提出了一種以VRA Core作為核心格式,CDWA中部分元素作為擴(kuò)展元素的元數(shù)據(jù)格式,并以一個(gè)雕像作品為例,多個(gè)不同元素從不同角度對(duì)雕塑內(nèi)容、知識(shí)產(chǎn)權(quán)、文化特點(diǎn)等方面進(jìn)行詳細(xì)介紹。我們可以根據(jù)這些元素來(lái)描述、確定和檢索、保護(hù)與長(zhǎng)期保存和管理數(shù)字文化資源。
本文目前只是考慮數(shù)字文化資源的應(yīng)用特點(diǎn),及數(shù)字文化資源元數(shù)據(jù)定義與目前已有元數(shù)據(jù)格式的兼容性,但隨著應(yīng)用的展開,部分格式還需要進(jìn)一步完善,如核心元素是否需要擴(kuò)展,核心子元素的確定等。在后續(xù)工作中,我們要對(duì)所提格式進(jìn)行完善修改,同時(shí)還應(yīng)考慮元數(shù)據(jù)格式的兼容性及后續(xù)的擴(kuò)展性等問(wèn)題。
參考文獻(xiàn)
[1]徐久齡,肖慧玲.元數(shù)據(jù)的研究[J].信息系統(tǒng),2003,(2):163-166.
[2]趙慧勤.網(wǎng)絡(luò)信息資源組織——元數(shù)據(jù)[J].現(xiàn)代圖書情報(bào)技術(shù),2000,(1):102-105.
[3]張曉林.元數(shù)據(jù)研究與應(yīng)用[M].北京:北京圖書館出版社,2002.
[4]劉嘉.元數(shù)據(jù)導(dǎo)論[M].北京:華藝出版社,2002.
[5]張敏,張曉林.元數(shù)據(jù)(Metadata)的發(fā)展和相關(guān)格式[J].四川圖書館學(xué)報(bào),2000,(2):63-70.
[6]馮項(xiàng)云,肖瓏,廖三三,等.國(guó)外常用元數(shù)據(jù)標(biāo)準(zhǔn)比較研究[J].大學(xué)圖書館學(xué)報(bào),2001,(4):15-21.
[7]陳彩紅.國(guó)內(nèi)外元數(shù)據(jù)格式宏觀比較研究[J].河北科技圖苑,2011,24(1):65-67.
[8]中國(guó)國(guó)家圖書館.中文元數(shù)據(jù)方案[R].2002.
(本文責(zé)任編輯:孫國(guó)雷)