在網(wǎng)絡(luò)教學(xué)資源建設(shè)中,元數(shù)據(jù)互操作作為解決網(wǎng)絡(luò)教學(xué)資源整合問題的有效方案,受到了人們的普遍關(guān)注。為了提高元數(shù)據(jù)互操作的精度,我們必須對(duì)網(wǎng)絡(luò)教學(xué)資源中的各種元數(shù)據(jù)有一個(gè)清晰的認(rèn)識(shí),必須對(duì)各種元數(shù)據(jù)的元素或字段設(shè)置、數(shù)據(jù)結(jié)構(gòu)以及語義界定等方面進(jìn)行比較分析。目前網(wǎng)絡(luò)教學(xué)資源中的主流元數(shù)據(jù)主要有Dublin Core、LOM和MARC三種,其他元數(shù)據(jù)大多是在這三種的基礎(chǔ)上或復(fù)用、或擴(kuò)展而形成的。LOM是學(xué)習(xí)對(duì)象元數(shù)據(jù);MARC是圖書館機(jī)讀目錄,是一種文獻(xiàn)書目元數(shù)據(jù),由于圖書館豐富的館藏?cái)?shù)字化信息資源是網(wǎng)絡(luò)教學(xué)資源建設(shè)中(尤其在高校)不可或缺的重要組成部分,因此MARC元數(shù)據(jù)也是網(wǎng)絡(luò)教育技術(shù)研究的對(duì)象;Dublin Core則是一種描述、組織和檢索網(wǎng)絡(luò)資源的元數(shù)據(jù),正在成為網(wǎng)絡(luò)教學(xué)資源和數(shù)字圖書館的主流元數(shù)據(jù)。
1 Dublin Core、LOM和MARC簡述
1.1 Dublin Core
Dublin Core(都柏林核心,簡稱DC)是美國OCLC的DCMI(都柏林核心元數(shù)據(jù)首創(chuàng)計(jì)劃)為標(biāo)識(shí)數(shù)字化信息資源、支持網(wǎng)絡(luò)檢索而創(chuàng)建的目錄模式的元數(shù)據(jù)格式,通過國際性合作逐步完善,現(xiàn)已成為InternetRFC2413和美國國家信息標(biāo)準(zhǔn)Z39.85[1]。它分為簡單DC和復(fù)雜DC。簡單DC由15個(gè)元素組成,復(fù)雜DC則是在簡單DC的基礎(chǔ)上輔以DC修飾詞,對(duì)元素語義提供進(jìn)一步的限定和修飾。這15個(gè)元素依據(jù)其所描述內(nèi)容的類別和范圍可分為三組:
(1) 對(duì)資源內(nèi)容的描述。包括Title(題名)、Subject(主題)、Description(描述)、Source(來源)、Language(語種)、Relation(關(guān)聯(lián))、Coverage(覆蓋范圍)。
(2)對(duì)知識(shí)產(chǎn)權(quán)的描述。包括Creator(創(chuàng)建者)、Publisher(出版者)、Contributor(貢獻(xiàn)者)、Rights(權(quán)限管理)。
(3)對(duì)外部屬性的描述。包括Date(日期)、Type (類型)、Format(格式)、Identifier(標(biāo)識(shí))。
DC-Education是DC元數(shù)據(jù)在教育領(lǐng)域內(nèi)的擴(kuò)展集。DC-Education是美國OCLC的DCMI(都柏林核心元數(shù)據(jù)首創(chuàng)計(jì)劃)教育資源工作組直接將Dublin Core元數(shù)據(jù)集復(fù)用到DCED命名域上而形成的一個(gè)DCED元數(shù)據(jù)集,并作了如下擴(kuò)展:
(1)補(bǔ)充兩個(gè)新元素,即audience(受眾)和standard(標(biāo)準(zhǔn))。前者指使用資源的用戶種類,后者指與資源相關(guān)的教育或訓(xùn)練標(biāo)準(zhǔn)。
(2)為DC.relation擴(kuò)展一個(gè)限制屬性conforms to,指資源所遵循的標(biāo)準(zhǔn)。
(3)復(fù)用IEEE LOM的三個(gè)元素:Interactivity Type(交互類型)、Interactivity Type Level(交互程度)和Typical Learning Time(通常學(xué)習(xí)時(shí)間)。
1.2 IEEE LOM
IEEE LOM(IEEE Learning Object Metadata,學(xué)習(xí)對(duì)象元數(shù)據(jù))由IEEE學(xué)習(xí)技術(shù)標(biāo)準(zhǔn)委員會(huì)P1484.12學(xué)習(xí)對(duì)象元數(shù)據(jù)工作組建立,用以完整、充分地揭示包括多媒體內(nèi)容、教育內(nèi)容、教育軟件和工具、參考資料等學(xué)習(xí)對(duì)象的屬性特征,如類型、作者、所有者、發(fā)行類型、格式、應(yīng)用環(huán)境、教學(xué)要求等[2]。
LOM規(guī)范所建立的數(shù)據(jù)模型是學(xué)習(xí)對(duì)象屬性的一個(gè)最小集合,包括General (通用)、Lifecycle(生命周期)、Meta-Metadata(宏元數(shù)據(jù))、Technical(技術(shù))、Educational(教育)、Rights(權(quán)利)、Relation(關(guān)系)、Annotation(注解)、Classification(分類)九大基本類別,每個(gè)類別下設(shè)置有若干元素,總共60個(gè)元素,每個(gè)元素定義了名稱、解釋、多值性、域、類型、附注和示例,許多元素可自動(dòng)生成或通過模板生成。利用LOM數(shù)據(jù)模型可以對(duì)學(xué)習(xí)對(duì)象的一些公用屬性進(jìn)行描述。同時(shí),對(duì)于某些數(shù)據(jù)元素,LOM規(guī)范直接給出了推薦的取值集合(稱為詞匯表),以獲得更好的數(shù)據(jù)互換性。我國的《學(xué)習(xí)對(duì)象元數(shù)據(jù)規(guī)范(CELTS-3)》是IEEE LOM模型的譯稿,并根據(jù)元素的通用性確定了必需數(shù)據(jù)元素和可選數(shù)據(jù)元素。
LOM規(guī)范為學(xué)習(xí)對(duì)象的屬性描述還提供了一個(gè)語義模型,用于支持信息的交換。但它并不涉及任何的實(shí)現(xiàn)問題,包括編碼綁定、API綁定、用戶界面以及學(xué)習(xí)對(duì)象如何使用等等。這樣做的目的在于通過建立一個(gè)通用的數(shù)據(jù)模型,保證語義模型的獨(dú)立性與綁定的分離,并使元數(shù)據(jù)的不同綁定有較好的語義互操作性。
1.3 MARC
長期以來,圖書館界使用MARC(Machine Readable Cataloging,機(jī)讀目錄)來著錄、描述和管理文獻(xiàn)資料,已經(jīng)逐步發(fā)展為成熟、復(fù)雜的元數(shù)據(jù)標(biāo)準(zhǔn)。各國在ISBD的基礎(chǔ)上發(fā)展了各自的MARC國家標(biāo)準(zhǔn),我國的CNMARC是在國際通用的UNIMARC基礎(chǔ)上發(fā)展起來的。MARC數(shù)據(jù)結(jié)構(gòu)嚴(yán)密,MARC記錄遵循ISO2709標(biāo)準(zhǔn),由記錄頭標(biāo)區(qū)、記錄目次區(qū)、記錄數(shù)據(jù)區(qū)和記錄分隔符四個(gè)部分構(gòu)成。頭標(biāo)區(qū)描述整個(gè)記錄的基本參數(shù)、固定長度;目次區(qū)由若干個(gè)目次項(xiàng)和末尾一個(gè)字段分隔符組成,總長為12N+l(N為目次項(xiàng)的個(gè)數(shù));數(shù)據(jù)區(qū)由多個(gè)數(shù)據(jù)字段組成,實(shí)際記載著錄數(shù)據(jù)。數(shù)據(jù)字段可能是定長或者變長的,數(shù)據(jù)字段可以包含指示符和若干子字段,許多數(shù)據(jù)字段可選,有些數(shù)據(jù)字段可重復(fù)。
為了適應(yīng)電子資源的增長和網(wǎng)絡(luò)技術(shù)的發(fā)展,MARC 格式也在進(jìn)行改變。尤其是“856電子資源定位與存取”字段的增補(bǔ),使MARC可以對(duì)電子資源的地址信息及存取該數(shù)據(jù)所要求的條件等進(jìn)行描述。1999年由美國國會(huì)圖書館和加拿大國家圖書館聯(lián)合推出的MARC2l,對(duì)網(wǎng)絡(luò)信息資源的編目問題給予了更充分的考慮[3]。編制者甚至己考慮到MARC21與其它元數(shù)據(jù)格式之間的映射關(guān)系,如與Dublin Core、GILS、Digital Geospatial Metadata以及USMARC到Universal Character Set的映射等。正是因?yàn)镸ARC一直在升級(jí)與完善,目前絕大多數(shù)集成化圖書館系統(tǒng)都已開始利用MARC支持網(wǎng)絡(luò)資源發(fā)現(xiàn)和檢索功能。CNMARC中有關(guān)網(wǎng)絡(luò)資源編目的條文尚為面世,但國內(nèi)圖書館完全可以套用UNIMARC中的有關(guān)規(guī)定來開展這方面的工作,并在不斷的實(shí)踐中為相關(guān)正式條文的出臺(tái)奠定基礎(chǔ)。
2 Dublin Core、LOM和MARC的差異與相關(guān)
盡管網(wǎng)絡(luò)教學(xué)資源與圖書館數(shù)字資源具有不同的資源特性和應(yīng)用需求,但是它們本質(zhì)上都是數(shù)字化信息資源,而且在應(yīng)用層面上有著相互整合、共享的趨勢。因此,Dublin Core、LOM和MARC三種元數(shù)據(jù)之間既有差異性,也存在著一定的相關(guān)性。大體而言,它們的差異與相關(guān)主要體現(xiàn)在以下幾個(gè)方面:
2.1 描述對(duì)象
DC是為網(wǎng)絡(luò)資源或者說是數(shù)字資源的描述而制定的,旨在揭示各類型電子文獻(xiàn)的內(nèi)容和其他特性,進(jìn)而達(dá)到網(wǎng)絡(luò)資源的組織、分類、索引等目的。
LOM是為揭示計(jì)算機(jī)輔助教學(xué)、網(wǎng)絡(luò)教學(xué)中的學(xué)習(xí)對(duì)象的屬性特征而制定的,目的在于使用最小屬性集完成對(duì)多媒體內(nèi)容、教育內(nèi)容、教育軟件和工具、參考資料等學(xué)習(xí)對(duì)象的管理、檢索和評(píng)估。
MARC格式比較適用于印刷型文獻(xiàn)信息資源,但隨著“856電子資源定位與存取”字段的增補(bǔ)以及MARC21的推出,MARC格式也可描述電子資源,并成為數(shù)字圖書館建設(shè)中的主流元數(shù)據(jù)。
2.2 元素設(shè)置及結(jié)構(gòu)
由于研究重點(diǎn)各自不同,Dublin Core、LOM和MARC在元素的設(shè)置及結(jié)構(gòu)上有著各自不同的關(guān)注點(diǎn)。Dublin Core和MARC主要關(guān)注如何準(zhǔn)確、完整地揭示描述對(duì)象的客觀屬性,例如對(duì)Title、Creator、Subject 、Description、Source、Language、Publisher、Type、Format等信息單元進(jìn)行了比較完備的元素(或字段)設(shè)置,但是對(duì)資源利用的目的性則不可能做過多考慮;而LOM必須關(guān)注教育過程中資源利用的目的、交互和效應(yīng),有關(guān)描述對(duì)象的客觀屬性則服從于教育目的來進(jìn)行元素設(shè)置。在LOM中,General、Lifecycle、Meta-Metadata、Technical等類別主要是基于描述對(duì)象的客觀屬性,而Educational、Rights、Annotation等類別主要?jiǎng)t是基于教育目的。
同時(shí),Dublin Core、LOM和MARC在元素的設(shè)置及結(jié)構(gòu)上還存在著較大的交叉面和共性。Dublin Core被稱為“MARC格式的網(wǎng)絡(luò)縮微版”,在元素設(shè)置上沿用了MARC的字段設(shè)置,并使描述格式相對(duì)簡化;DC-Education基于教學(xué)資源的特性,在Dublin Core的基礎(chǔ)上補(bǔ)充了audience和standard兩個(gè)新元素,并復(fù)用了LOM中的Interactivity Type、Interactivity Type Level和Typical Learning Time三個(gè)元素;LOM與MARC分別屬于教育和圖書館兩個(gè)不同專業(yè)系統(tǒng),差別較大,但是將LOM中有關(guān)客觀屬性的元素與MARC字段進(jìn)行比較,我們依然可以發(fā)現(xiàn)它們之間的交叉面和共性。總之,這些元數(shù)據(jù)的交叉面和共性為網(wǎng)絡(luò)教學(xué)資源之間的互操作提供了資源描述、數(shù)據(jù)庫設(shè)計(jì)、軟件開發(fā)、網(wǎng)絡(luò)編程等技術(shù)層面上的可行性。