段苗瑩
(陜西省圖書館 陜西 西安 710061)
淺談圖書館元數(shù)據(jù)的應(yīng)用
段苗瑩
(陜西省圖書館 陜西 西安 710061)
當(dāng)今社會信息化飛速發(fā)展,科技發(fā)展日新月異。社會環(huán)境給圖書館事業(yè)帶來了巨大的沖擊和全新的機(jī)遇,電子資源已逐步代替紙質(zhì)書目成為新興的閱讀方式。本文簡單介紹了元數(shù)據(jù)、對象數(shù)據(jù)、國家圖書館元數(shù)據(jù)標(biāo)準(zhǔn)、國家圖書館元數(shù)據(jù)倉儲項(xiàng)目和文津檢索平臺等概念,在了解元數(shù)據(jù)與對象數(shù)據(jù)對應(yīng)關(guān)系的基礎(chǔ)上,結(jié)合國家圖書館2014年元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,將陜西省圖書館自建電子資源等對象數(shù)據(jù)按國家圖書館元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行元數(shù)據(jù)標(biāo)引,提交國家圖書館,并利用國家圖書館元數(shù)據(jù)倉儲數(shù)據(jù)庫和文津檢索平臺整合陜西省圖書館自建資源和購買的數(shù)據(jù)庫資源,實(shí)現(xiàn)資源的一站式查詢與獲取。在數(shù)字化建設(shè)一日萬里蓬勃發(fā)展的今天,力求為讀者提供更快速更便利更全面的閱讀體驗(yàn)。
元數(shù)據(jù);對象數(shù)據(jù);元數(shù)據(jù)標(biāo)準(zhǔn);國家圖書館元數(shù)據(jù)標(biāo)準(zhǔn);國家圖書館元數(shù)據(jù)倉儲項(xiàng)目
(一)元數(shù)據(jù)
是與對象相關(guān)的數(shù)據(jù),英文名為Metadata。在圖書館中元數(shù)據(jù)被定義為:一種面向某種特定應(yīng)用的用于描述資源屬性的機(jī)器可理解的信息,提供關(guān)于信息資源與圖書館書籍或數(shù)據(jù)的一種結(jié)構(gòu)化的數(shù)據(jù),是對信息資源的結(jié)構(gòu)化的描述。用來刻畫信息資源或
數(shù)據(jù)本身的特征和屬性,規(guī)定數(shù)字化信息的組織,具有定位、發(fā)現(xiàn)、證明、評估、選擇等功能。通過規(guī)范的語法結(jié)構(gòu)和語義結(jié)構(gòu),使機(jī)器能夠無二義地表現(xiàn)和獲取信息。
簡而言之它是關(guān)于數(shù)據(jù)的數(shù)據(jù)。是對對象數(shù)據(jù)進(jìn)行定義和描述的數(shù)據(jù)。
(二)對象數(shù)據(jù)
相對于元數(shù)據(jù)而言,對象數(shù)據(jù)指的是被元數(shù)據(jù)描述形容定義的對象。在圖書館的信息化建設(shè)中,對象數(shù)據(jù)可以是完整的數(shù)據(jù)庫,也可以是數(shù)據(jù)庫中的數(shù)據(jù)、圖書、論文、圖片、歌曲、網(wǎng)頁等。
(三)元數(shù)據(jù)與對象數(shù)據(jù)的關(guān)系
元數(shù)據(jù)與對象數(shù)據(jù)是描述與被描述的關(guān)系,元數(shù)據(jù)通過元素字段對對象數(shù)據(jù)的特征進(jìn)行形象的表述和定義。
舉一個(gè)簡單的例子。一本書書名是《白鹿原》,作者是陳忠實(shí),出版社是江蘇文藝出版社。如果把這本書當(dāng)作一個(gè)對象數(shù)據(jù),正題名=《白鹿原》,責(zé)任者名稱=陳忠實(shí),出版者名稱=江蘇文藝出版社。此類信息就是該對象數(shù)據(jù)(這本書)的元數(shù)據(jù)描述。其中正題名,責(zé)任者名稱,出版者名稱就是元數(shù)據(jù)的元素字段。
當(dāng)運(yùn)用元數(shù)據(jù)完成對《白鹿原》這本書的定義和描述后,我們可以不通過對象數(shù)據(jù),單憑元數(shù)據(jù)中的元素字段就可以大致了解這本書的基本情況。
數(shù)據(jù)的標(biāo)準(zhǔn)化和規(guī)范化是實(shí)現(xiàn)數(shù)據(jù)共享的重要基礎(chǔ)和有力保障,為了更加便捷的整合各級圖書館所做出的缺乏統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)信息,制定統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范對于取得數(shù)據(jù)的控制權(quán)有著重要的作用和意義。目前各國陸續(xù)提出符合自己國情的元數(shù)據(jù)標(biāo)準(zhǔn)。MARC(機(jī)器可讀編目)元數(shù)據(jù)標(biāo)準(zhǔn),DC(都柏林核心元數(shù)據(jù))元數(shù)據(jù)標(biāo)準(zhǔn)都是世界知名和權(quán)威的元數(shù)據(jù)標(biāo)準(zhǔn)。
國家圖書館元數(shù)據(jù)標(biāo)準(zhǔn)。為了加強(qiáng)我國公共圖書館對數(shù)字資源的組織揭示能力,同時(shí)為了更好的整合利用分布于全國各級公
共圖書館的自建數(shù)字資源,實(shí)現(xiàn)數(shù)字資源的同知同享,共用共惠,中國國家圖書館參考世界知名元數(shù)據(jù)標(biāo)準(zhǔn)并根據(jù)圖書館的性質(zhì)和特點(diǎn)制定出了自己的元數(shù)據(jù)標(biāo)準(zhǔn)。同時(shí)各基層圖書館按照國家圖書館元數(shù)據(jù)標(biāo)準(zhǔn)制作并提交館內(nèi)自建資源的元數(shù)據(jù),共同開展元數(shù)據(jù)倉儲的建設(shè)。
表1為國家圖書館2014年所提出的元數(shù)據(jù)標(biāo)準(zhǔn),一共有23個(gè)頂級元數(shù)據(jù)元素,同時(shí)每個(gè)頂級元數(shù)據(jù)元素定義了一個(gè)或多個(gè)修飾詞,包含了圖像、古籍、圖書、影音、數(shù)據(jù)庫、網(wǎng)頁等多種對象數(shù)字資源。因?yàn)橘Y源類型的不同,有些修飾詞可能僅用于某類數(shù)據(jù)資源。
根據(jù)國家圖書館元數(shù)據(jù)標(biāo)準(zhǔn),按照規(guī)范的修飾詞,各級圖書館就可對其自建數(shù)據(jù)庫、電子文本等對象數(shù)據(jù)按部標(biāo)引,做出符合國家圖書館標(biāo)準(zhǔn)的元數(shù)據(jù)來。
隨著圖書館數(shù)字化和數(shù)字圖書館的建設(shè)發(fā)展,各級公共圖書館自建數(shù)字資源和購買的數(shù)據(jù)資源日益豐富,由于開發(fā)軟件的不同和各資源開發(fā)商出于商業(yè)目的考慮等原因,不同資源的異構(gòu)性和資源重合等問題也日趨嚴(yán)重。各自為政的數(shù)字資源建設(shè)和各數(shù)據(jù)資源沒有統(tǒng)一檢索模式的缺點(diǎn)也逐步暴露顯現(xiàn)出來。多次檢索多重查找費(fèi)時(shí)費(fèi)力,檢索結(jié)果重復(fù)率高利用率低。針對這種情況,國家圖書館提出了元數(shù)據(jù)倉儲項(xiàng)目。
國家圖書館元數(shù)據(jù)倉儲項(xiàng)目基于TRSWCM7.0內(nèi)容協(xié)作平臺,通過TRSWCM系統(tǒng)的元數(shù)據(jù)模塊定義制作出符合國家圖書館標(biāo)準(zhǔn)的元數(shù)據(jù)結(jié)構(gòu),創(chuàng)建元數(shù)據(jù)倉儲數(shù)據(jù)庫,將各省市地區(qū)公共圖書館提交的元數(shù)據(jù)加工,整合,剔除,優(yōu)化后錄入庫中。同時(shí)搭配國家圖書館的新型檢索系統(tǒng)“文津搜索系統(tǒng)平臺”來檢索調(diào)用庫內(nèi)元數(shù)據(jù),實(shí)現(xiàn)各地方數(shù)字資源的統(tǒng)一檢索,統(tǒng)一查看,統(tǒng)一揭示和統(tǒng)一服務(wù)。
元數(shù)據(jù)倉儲項(xiàng)目利用數(shù)據(jù)庫存儲各級圖書館自建資源的元數(shù)據(jù),為文津檢索系統(tǒng)平臺提供數(shù)據(jù)支持。讀者通過關(guān)鍵詞并利用文津檢索系統(tǒng)前臺檢索功能可查找出與關(guān)鍵詞對應(yīng)的元數(shù)據(jù),進(jìn)而瀏覽相應(yīng)的對象數(shù)據(jù)。通過一次查詢即可高效,準(zhǔn)確,全面的檢索并查看各級圖書館自建和購買的數(shù)字資源。
由上文,各級圖書館的自建數(shù)字資源和購買資源先按照國家圖書館元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行元數(shù)據(jù)表述標(biāo)引,再將標(biāo)引制作完成的元數(shù)據(jù)提交到國家圖書館,導(dǎo)入國家圖書館元數(shù)據(jù)倉儲數(shù)據(jù)庫中,讀者即可通過文津搜索平臺瀏覽查看各級圖書館的數(shù)字資源。
本文以陜西省圖書館為例,簡單介紹一下元數(shù)據(jù)標(biāo)引的流程。
陜西省圖書館自建特色數(shù)據(jù)庫“西安事變”從事變簡介、人物志、大事記、紀(jì)念舊址、檔案史料、歷史圖庫、追憶廣角、歷史評價(jià)、研究論著、機(jī)構(gòu)學(xué)者、今日報(bào)道、影視文藝等方面整合該事件的相關(guān)文獻(xiàn)資料。重點(diǎn)通過人物、史料、研究論著、視頻等欄目多方位、多層次地揭示“西安事變”的始末及其對近代中國歷史產(chǎn)生的重大影響。
對“西安事變”可進(jìn)行如下的元數(shù)據(jù)元素標(biāo)引:
正題名=西安事變特色數(shù)據(jù)庫
四庫分類=史
摘要=從事變簡介、人物志、大事記、紀(jì)念舊址、檔案史料、歷史圖庫、追憶廣角、歷史評價(jià)、研究論著、機(jī)構(gòu)學(xué)者、今日報(bào)道、影視文藝等方面整合該事件的相關(guān)文獻(xiàn)資料。重點(diǎn)通過人物、史料、研究論著、視頻等欄目多方位、多層次地揭示“西安事變”的始末及其對近代中國歷史產(chǎn)生的重大影響。
出版者名稱=陜西省圖書館
出版地=西安
創(chuàng)建日期=2009-10-19(格式字段必須為YYYY-MM-DD)
發(fā)布日期=2010-09-11(格式字段必須為YYYY-MM-DD)
更新頻率=不定期更新
內(nèi)容形式=文本
媒體類型=電子
學(xué)科類型=人文與社會科學(xué)
運(yùn)行環(huán)境=Windows系統(tǒng)
文字語種=chi
訪問方式=互聯(lián)網(wǎng)訪問(取值字段填寫內(nèi)容:互聯(lián)網(wǎng)訪問;局域網(wǎng)訪問)
適用對象=普通用戶(取值字段填寫內(nèi)容為:普通用戶;少年兒童;殘障人士)
發(fā)布地址=http://www.snwh.gov.cn:8080/sxlib/xianshibian/index.htm
數(shù)據(jù)提交單位=陜西省圖書館
數(shù)據(jù)提交日期=2015-01-07(格式字段必須為YYYY-MM-DD)
CDOI=(此為唯一標(biāo)識符字段,數(shù)據(jù)庫必備字段,因“西安事變”現(xiàn)階段沒有做唯一標(biāo)識符認(rèn)證,所以未填寫)
數(shù)據(jù)庫中的圖像字段為其元數(shù)據(jù)標(biāo)引的必備字段,填寫內(nèi)容為其數(shù)據(jù)庫發(fā)布頁面。
至此我們完成了對“西安事變”數(shù)據(jù)庫的元數(shù)據(jù)元素字段描述。
同理我們可以對其他類型數(shù)字資源進(jìn)行元數(shù)據(jù)標(biāo)引。利用WCM可導(dǎo)入EXCEL表格的功能,將多個(gè)數(shù)字資源的元數(shù)據(jù)標(biāo)引放入EXCEL表中,并批量導(dǎo)入到WCM的元數(shù)據(jù)倉儲庫。如圖1所示。
在數(shù)字圖書館蓬勃發(fā)展的今天,根據(jù)國家圖書館元數(shù)據(jù)標(biāo)準(zhǔn)整合加工各級圖書館的數(shù)字資源,建立元數(shù)據(jù)倉儲數(shù)據(jù)庫勢在必行。國家圖書館元數(shù)據(jù)倉儲和文津檢索平臺是數(shù)字圖書館推廣工程的核心項(xiàng)目,各省市圖書館的元數(shù)據(jù)標(biāo)引更是項(xiàng)目的核心組成部分。數(shù)據(jù)倉儲目前尚處于起步階段,但相信通過各級圖書館的不懈努力,倉儲數(shù)據(jù)庫內(nèi)容會不斷增加,成為數(shù)字圖書館事業(yè)成功的堅(jiān)定基石和強(qiáng)力保障,為讀者提供更加便利全面的閱讀體驗(yàn)。
[1]郭瑞華.圖書館信息資源整合及元數(shù)據(jù)應(yīng)用[J].圖書情報(bào)工作,2006(10):100—103.
=西安事變;張學(xué)良;楊虎城;蔣介石;雙十二事變(不同的關(guān)鍵詞用分號隔開)
或