黃如花 邱春艷
(武漢大學(xué)信息管理學(xué)院 湖北武漢 430072)
·圖書館與圖書館事業(yè)·
圖書館參與科學(xué)數(shù)據(jù)管理中的元數(shù)據(jù)應(yīng)用實踐研究*
黃如花 邱春艷
(武漢大學(xué)信息管理學(xué)院 湖北武漢 430072)
元數(shù)據(jù)是圖書館參與科學(xué)數(shù)據(jù)管理的必備工具,圖書館在科學(xué)數(shù)據(jù)管理的基礎(chǔ)服務(wù)中多為科研人員提供元數(shù)據(jù)標(biāo)準(zhǔn)和元素的選擇與推薦,在自建的數(shù)據(jù)倉儲中圖書館通過整套元數(shù)據(jù)方案的設(shè)計保證數(shù)據(jù)倉儲服務(wù)于科學(xué)數(shù)據(jù)管理工作,而元數(shù)據(jù)在公共數(shù)據(jù)倉儲、科學(xué)數(shù)據(jù)管理系統(tǒng)軟件以及合作項目中都有不同深度的應(yīng)用。此外,圖書館領(lǐng)域還重視科學(xué)數(shù)據(jù)館員的元數(shù)據(jù)技能培訓(xùn)。
數(shù)據(jù)管理元數(shù)據(jù)圖書館應(yīng)用
隨著科學(xué)數(shù)據(jù)作為重要學(xué)術(shù)資源的廣泛認可,眾多圖書館紛紛參與科學(xué)數(shù)據(jù)管理工作,力求在科學(xué)數(shù)據(jù)管理的發(fā)展潮流中謀求一席之地。元數(shù)據(jù)是科學(xué)數(shù)據(jù)管理的重要工具和技術(shù)保障,微軟公司Jim Gray認為科學(xué)數(shù)據(jù)的元數(shù)據(jù)記錄對于科學(xué)發(fā)展的前景至關(guān)重要,元數(shù)據(jù)為科研人員理解和獲取科學(xué)數(shù)據(jù)提供可能。元數(shù)據(jù)成為科學(xué)數(shù)據(jù)管理實踐和研究中廣為關(guān)注的問題,而圖書館在其傳統(tǒng)服務(wù)中積累了元數(shù)據(jù)方面的豐富經(jīng)驗。圖書館領(lǐng)域在其開展的科學(xué)數(shù)據(jù)管理實踐領(lǐng)域中不斷研究、夯實并拓展元數(shù)據(jù)的應(yīng)用。本文以此為基礎(chǔ),分析圖書館科學(xué)數(shù)據(jù)管理服務(wù)實踐中元數(shù)據(jù)的應(yīng)用現(xiàn)狀,探究現(xiàn)有實踐的特點、不足和發(fā)展方向,為我國圖書館開展科學(xué)數(shù)據(jù)管理的元數(shù)據(jù)實踐提供借鑒。
隨著數(shù)字化資源和服務(wù)的發(fā)展,圖書館的服務(wù)內(nèi)容已經(jīng)不僅僅局限于文本類館藏,科學(xué)數(shù)據(jù)逐漸成為圖書館的重要資源,圖書館在科學(xué)數(shù)據(jù)管理和科學(xué)數(shù)據(jù)服務(wù)方面的角色和職責(zé)逐漸顯現(xiàn)出來,而元數(shù)據(jù)是圖書館開展科學(xué)數(shù)據(jù)管理和科學(xué)數(shù)據(jù)服務(wù)的重要內(nèi)容和工具。沒有標(biāo)準(zhǔn)化的元數(shù)據(jù),科學(xué)數(shù)據(jù)難以與圖書館的傳統(tǒng)資源所融合,建立在幾十年甚至幾百年實踐基礎(chǔ)之上的編目和元數(shù)據(jù)生成工作是圖書館服務(wù)的核心。OCLC于2010年召開了“圖書館科學(xué)數(shù)據(jù)管理職責(zé)”研討會,元數(shù)據(jù)被作為圖書館開展科學(xué)數(shù)據(jù)管理的重要工具和技能。美國研究與大學(xué)圖書館協(xié)會(the Association of College and Research Libraries,ACRL)則設(shè)立了數(shù)字化管理興趣小組,旨在開展科學(xué)數(shù)據(jù)管理趨勢和相關(guān)技術(shù)的培訓(xùn),而元數(shù)據(jù)是重要內(nèi)容。歐洲研究圖書館協(xié)會(Ligue des Bibliotheques Europeennes de Recherche,LIBER)發(fā)布的《圖書館開始從事科學(xué)數(shù)據(jù)管理的十條建議》中指出,圖書館應(yīng)當(dāng)參與元數(shù)據(jù)和相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)的建設(shè),同時應(yīng)當(dāng)提供科學(xué)數(shù)據(jù)相關(guān)的元數(shù)據(jù)服務(wù)。當(dāng)前,圖書館開展了深度層次不同的科學(xué)數(shù)據(jù)管理服務(wù),元數(shù)據(jù)的應(yīng)用也呈現(xiàn)出不同的功能和特點。
圖書館逐漸參與到科學(xué)數(shù)據(jù)管理的服務(wù)中,其現(xiàn)有的科學(xué)數(shù)據(jù)管理服務(wù)以科學(xué)數(shù)據(jù)管理咨詢、管理計劃的協(xié)助起草、科學(xué)數(shù)據(jù)的組織與存儲、工具與系統(tǒng)的開發(fā)與使用等為主要服務(wù)內(nèi)容。
2.1 元數(shù)據(jù)管理計劃中的元數(shù)據(jù)相關(guān)規(guī)定
美國NSF在其科學(xué)數(shù)據(jù)管理的相關(guān)規(guī)定中指出,數(shù)據(jù)管理計劃應(yīng)當(dāng)包括用于數(shù)據(jù)和元數(shù)據(jù)的格式與內(nèi)容的相關(guān)標(biāo)準(zhǔn),英國ESRC在其數(shù)據(jù)管理計劃指南中指出,數(shù)據(jù)管理計劃需要對數(shù)據(jù)和元數(shù)據(jù)生成與存儲進行規(guī)劃和設(shè)計,BBSRC在要求將數(shù)據(jù)共享聲明作為附件類型的數(shù)據(jù)管理計劃,而數(shù)據(jù)共享計劃應(yīng)當(dāng)包括標(biāo)準(zhǔn)和元數(shù)據(jù),需詳細闡釋用于數(shù)據(jù)收集、管理的標(biāo)準(zhǔn)和方法以及選擇該標(biāo)準(zhǔn)和方法的原因,澳大利亞國家數(shù)據(jù)服務(wù)中心(Australian National Data Service,ANDS)認為元數(shù)據(jù)自動化、持久的DOI識別、元數(shù)據(jù)受控詞表等是貫穿在整個數(shù)據(jù)管理計劃中必不可少的元素。因而多數(shù)圖書館在提供科學(xué)數(shù)據(jù)管理計劃協(xié)助起草的服務(wù)中,明確提出協(xié)助科研人員和科研團隊選擇恰當(dāng)?shù)目茖W(xué)數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn),以保證科學(xué)數(shù)據(jù)有序化、標(biāo)準(zhǔn)化的組織。
2.2 高校圖書館元數(shù)據(jù)標(biāo)準(zhǔn)選擇與推薦服務(wù)
根據(jù)對美國部分高校圖書館科學(xué)數(shù)據(jù)管理相關(guān)網(wǎng)站的調(diào)查(見表1),發(fā)現(xiàn)高校圖書館在整個科學(xué)數(shù)據(jù)管理實踐中,包含元數(shù)據(jù)的相關(guān)工作主要集中在科學(xué)數(shù)據(jù)管理整個周期的幾個階段,包括計劃制定中的元數(shù)據(jù)標(biāo)準(zhǔn)和元素推薦;科學(xué)數(shù)據(jù)描述與組織時的元數(shù)據(jù)標(biāo)準(zhǔn)選擇;科學(xué)數(shù)據(jù)存儲中的數(shù)據(jù)文檔命名與格式規(guī)范等方面。由此可見,在科學(xué)數(shù)據(jù)管理中,圖書館開展的元數(shù)據(jù)實踐以科學(xué)數(shù)據(jù)相關(guān)的元數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)和相關(guān)元素的選擇與推薦為最主要的工作內(nèi)容,開展元數(shù)據(jù)描述與組織工作的具體實施的圖書館較少。
圖書館參與科學(xué)數(shù)據(jù)管理多是從協(xié)助制定數(shù)據(jù)管理計劃、協(xié)助數(shù)據(jù)組織和存儲等基礎(chǔ)工作起步,因此上述標(biāo)準(zhǔn)推薦、元素選擇等淺層次的元數(shù)據(jù)服務(wù)較為普遍。
對于參與科學(xué)數(shù)據(jù)管理的圖書館或其他機構(gòu),其負責(zé)的科學(xué)數(shù)據(jù)管理對象的科學(xué)數(shù)據(jù)最終存儲和保存多有兩種去向:該圖書館或該機構(gòu)自建機構(gòu)庫、學(xué)科庫或者專門的科學(xué)數(shù)據(jù)庫,以提供科學(xué)數(shù)據(jù)的存儲;另一類則是選擇與科學(xué)數(shù)據(jù)內(nèi)容、學(xué)科或其它要求相契合的公共數(shù)據(jù)倉儲。對于自建的機構(gòu)庫、學(xué)科庫或科學(xué)數(shù)據(jù)庫而言,其元數(shù)據(jù)的實施多考慮幾方面的需求:其選擇的系統(tǒng)軟件如DSpace的系統(tǒng)需求、科學(xué)數(shù)據(jù)管理的目標(biāo)需求以及科學(xué)數(shù)據(jù)本身的特點特別是學(xué)科屬性等。
表1 美國部分高校圖書館科學(xué)數(shù)據(jù)管理中的元數(shù)據(jù)實踐
3.1 DataStaR的元數(shù)據(jù)創(chuàng)新實踐
為實現(xiàn)本機構(gòu)科學(xué)數(shù)據(jù)的管理并提供較為完整的系統(tǒng)服務(wù),康奈爾大學(xué)圖書館以機構(gòu)庫為基礎(chǔ),構(gòu)建了數(shù)據(jù)階段型存儲庫(Data Staging Repository,DataStaR),由圖書館協(xié)助科研人員實現(xiàn)科學(xué)數(shù)據(jù)與元數(shù)據(jù)記錄的長期保存和復(fù)用。DataStaR的元數(shù)據(jù)實踐旨在不增加科研人員和圖書館員額外工作的前提下,支持科學(xué)數(shù)據(jù)的共享、出版??紤]到多學(xué)科科學(xué)數(shù)據(jù)的現(xiàn)狀,DataStaR繼承了多領(lǐng)域、學(xué)科的元數(shù)據(jù)標(biāo)準(zhǔn),以滿足不同學(xué)科領(lǐng)域研究人員的需求,彈性的元數(shù)據(jù)實踐、便利的用戶接口為大規(guī)模的數(shù)據(jù)共享、出版乃至元數(shù)據(jù)復(fù)用提供了可能。在DataStaR中,僅有“數(shù)據(jù)集標(biāo)題”、“數(shù)據(jù)集擁有者”、“元數(shù)據(jù)和數(shù)據(jù)獲取許可”、“出版物目標(biāo)存儲倉儲”四個元數(shù)據(jù)元素必須鍵入或進行選擇,其他均可自動生成或默認。DataStaR嘗試對現(xiàn)有的元數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)進行精簡之后融入DataStaR系統(tǒng)中的本體集中,從而將離散的元數(shù)據(jù)標(biāo)準(zhǔn)融合在一起,方便數(shù)據(jù)提交者重復(fù)、組合使用元數(shù)據(jù)標(biāo)準(zhǔn)以生成元數(shù)據(jù)記錄,無需重復(fù)鍵入信息。由于DataStaR融合了盡可能多樣化的元數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn),因此用戶可以方便的生成符合不同元數(shù)據(jù)標(biāo)準(zhǔn)格式規(guī)定的元數(shù)據(jù)記錄。
DataStaR還重視將語義網(wǎng)的原則和技術(shù)運用到其元數(shù)據(jù)實踐中,以實現(xiàn)良好的互操作和機器處理。DataStaR的元數(shù)據(jù)實踐融合了語義網(wǎng)技術(shù),實現(xiàn)XML與OWL的交互,集成了基于網(wǎng)絡(luò)的RDF圖表編輯、通過語義映射將現(xiàn)有的元數(shù)據(jù)標(biāo)準(zhǔn)、關(guān)聯(lián)數(shù)據(jù)等進行集成,從而在實現(xiàn)本機構(gòu)科學(xué)數(shù)據(jù)管理的良好運作的基礎(chǔ)上,實現(xiàn)了用戶最小負擔(dān)和與其他數(shù)據(jù)倉儲的最大交互的目標(biāo)。
3.2 PURR的元數(shù)據(jù)標(biāo)準(zhǔn)融合方案
普渡大學(xué)是通過機構(gòu)庫來實現(xiàn)科學(xué)數(shù)據(jù)管理的機構(gòu)典型。普渡大學(xué)圖書館在HUBzero系統(tǒng)基礎(chǔ)上搭建了普渡大學(xué)科研倉儲(Purdue University Research Repository,PURR)系統(tǒng),將數(shù)據(jù)管理轉(zhuǎn)化為機構(gòu)知識庫內(nèi)嵌的基于科研過程的數(shù)據(jù)管理流程模塊,從而成為項目組的科研管理平臺。PURR針對科學(xué)數(shù)據(jù)的描述、管理與保存的需求,在對現(xiàn)有元數(shù)據(jù)標(biāo)準(zhǔn)進行綜合考慮與評估的基礎(chǔ)之上選擇合適的元數(shù)據(jù)標(biāo)準(zhǔn)形成了一套針對科學(xué)數(shù)據(jù)的元數(shù)據(jù)實施方案。本著描述數(shù)據(jù)集、識別數(shù)據(jù)擁有者和獲取條件、生成穩(wěn)健的長期保存元數(shù)據(jù)的目的和原則,PURR采用元數(shù)據(jù)編碼與轉(zhuǎn)換標(biāo)準(zhǔn)(Metadata Encoding and Transmission Standard,METS)作為封裝標(biāo)準(zhǔn),以都柏林核心元數(shù)據(jù)(DCMIMetadata Terms)作為描述元數(shù)據(jù),以元數(shù)據(jù)對象描述機制(Metadata Object Description Schema,MODS)對數(shù)據(jù)擁有者、獲取權(quán)限等進行描述,以PREMIS作為其保存元數(shù)據(jù)標(biāo)準(zhǔn),從而形成了面向數(shù)據(jù)生成、描述與組織、數(shù)據(jù)使用到長期保存的元數(shù)據(jù)描述框架。多數(shù)描述元數(shù)據(jù)元素通過作者在提交數(shù)據(jù)時填寫在線表單獲取,主題館員對提交信息的正確性進行檢查,進行確認后,生成的元數(shù)據(jù)記錄保存在PURR的數(shù)據(jù)庫中。數(shù)據(jù)保存和出版確認將觸發(fā)存檔信息包(Archival Information Package,AIP)創(chuàng)建工具,綜合PREMIS保存元數(shù)據(jù)、MODS標(biāo)準(zhǔn)以及BagIT格式等,實現(xiàn)PURR元數(shù)據(jù)記錄的封裝與保存。
DataStaR和PURR都是自建系統(tǒng)和平臺以實現(xiàn)科學(xué)數(shù)據(jù)管理,但兩者在元數(shù)據(jù)實踐方面有所不同,DataStaR容納盡可能多的元數(shù)據(jù)標(biāo)準(zhǔn),以適應(yīng)不同學(xué)科數(shù)據(jù)的需求,同時嘗試語義網(wǎng)技術(shù)的應(yīng)用和創(chuàng)新,PURR則是通過選擇較為普適性的描述元數(shù)據(jù)標(biāo)準(zhǔn)和適用于各種功能需求的管理性元數(shù)據(jù),從而形成較為固定的元數(shù)據(jù)描述方案。
4.1 公共數(shù)據(jù)倉儲
公共數(shù)據(jù)倉儲是除自建數(shù)據(jù)倉儲之外最主要的科學(xué)數(shù)據(jù)存儲媒介。對于為進行機構(gòu)庫或數(shù)據(jù)倉儲建設(shè)的圖書館而言,公共數(shù)據(jù)倉儲是其參與科學(xué)數(shù)據(jù)管理的必要第三方,其科學(xué)數(shù)據(jù)管理各個環(huán)節(jié)的開展多以第三方數(shù)據(jù)倉儲為基礎(chǔ)。公共數(shù)據(jù)倉儲的元數(shù)據(jù)方案就成為該圖書館開展科學(xué)數(shù)據(jù)管理元數(shù)據(jù)實踐的基準(zhǔn)。雖然部分圖書館為科研人員進行了學(xué)科領(lǐng)域元數(shù)據(jù)標(biāo)準(zhǔn)、元數(shù)據(jù)元素的推薦,但針對數(shù)據(jù)存儲于第三方數(shù)據(jù)倉儲的情況,以數(shù)據(jù)倉儲的元數(shù)據(jù)標(biāo)準(zhǔn)為標(biāo)準(zhǔn)進行描述和組織,才能最高效率的實現(xiàn)數(shù)據(jù)的最終存儲。如Dryad數(shù)據(jù)倉儲為數(shù)據(jù)的存儲和獲取等設(shè)計了以DC元數(shù)據(jù)為主的元數(shù)據(jù)方案,同時提供簡便的元數(shù)據(jù)生成,為科學(xué)數(shù)據(jù)存儲提供了便利。
4.2 通用科學(xué)數(shù)據(jù)管理軟件平臺
采用開源軟件平臺作為數(shù)據(jù)倉儲乃至數(shù)據(jù)管理的基礎(chǔ),是圖書館開展科學(xué)數(shù)據(jù)倉儲建設(shè)以及參與科學(xué)數(shù)據(jù)管理采用的較為普遍的方法。一種是采用作為機構(gòu)庫構(gòu)建軟件如DSpace和FedoraCommons等,英國愛丁堡大學(xué)數(shù)據(jù)共享中心采用了Dspace作為數(shù)據(jù)平臺基礎(chǔ)軟件,美國約翰霍普金斯大學(xué)的Data Conservancy以及英國牛津大學(xué)的嵌入式機構(gòu)數(shù)據(jù)管理服務(wù)(Embedding Institutional Data Curation Services In Research,EIDCSR)等則采用Fedora來構(gòu)建共享平臺。Dspace和Fedora采用DC元數(shù)據(jù)作為其元數(shù)據(jù)標(biāo)準(zhǔn)。另外一種則是采用專門用于科學(xué)數(shù)據(jù)管理的系統(tǒng)軟件,如哈佛大學(xué)定量社會科學(xué)研究所(Institute for Quantitative Social Science,IQSS)與哈佛大學(xué)圖書館、檔案館、信息服務(wù)部門共同搭建的Dataverse、英國數(shù)據(jù)檔案館和挪威社會科學(xué)數(shù)據(jù)服務(wù)局共同開發(fā)的Nesstar等。Dataverse和Nesstar均采用DDI作為元數(shù)據(jù)標(biāo)準(zhǔn),哈佛大學(xué)、麻省理工學(xué)院等高校圖書館采用Dataverse作為科學(xué)數(shù)據(jù)管理平臺,而Dataverse自身具備針對科學(xué)數(shù)據(jù)發(fā)布、出版、存儲和共享的元數(shù)據(jù)方案。
4.3 合作項目
針對科學(xué)數(shù)據(jù)的共享、交換、整合等需求,部分圖書館和科研機構(gòu)開展了相關(guān)領(lǐng)域的合作項目,如新墨西哥大學(xué)圖書館主持的關(guān)注地球影像數(shù)據(jù)的地球數(shù)據(jù)觀測網(wǎng)(Data Observation Network for Earth,DataONE)項目,約翰·霍普金斯大學(xué)圖書館主持圍繞天文學(xué)、地球科學(xué)、生命科學(xué)和社會科學(xué)領(lǐng)域數(shù)據(jù)的保存、共享、發(fā)現(xiàn)和再利用項目Data Conservancy等。在合作項目中,元數(shù)據(jù)的設(shè)計與實施以項目的功能需求和建設(shè)目標(biāo)為依據(jù)。DataONE是聯(lián)盟式的科學(xué)數(shù)據(jù)網(wǎng)絡(luò),建立在多樣化的數(shù)據(jù)倉儲基礎(chǔ)之上,旨在地球與生命科學(xué)數(shù)據(jù)的保存和共享,因此其元數(shù)據(jù)工作的主要內(nèi)容在于不同數(shù)據(jù)倉儲之間元數(shù)據(jù)記錄的互操作以及保存元數(shù)據(jù)的設(shè)計與實施。DataONE通過系統(tǒng)元數(shù)據(jù)(system metadata)和特定編碼系統(tǒng)的設(shè)計(Coordinating Nodes),實現(xiàn)對不同數(shù)據(jù)倉儲之間的互操作和共享。同時DataONE以PREMIS為基礎(chǔ),以METS、開放歸檔初始計劃的對象復(fù)用和交換(Open Archives Initiative's Object Reuse and Exchange,OAI-ORE)、BagIt文檔封裝格式等作為封裝的參考,形成了DataONE的保存元數(shù)據(jù)方案。
Lyon、Lewis、Cox等學(xué)者研究了圖書館員開展科學(xué)數(shù)據(jù)管理的多重職責(zé),認為元數(shù)據(jù)技能是圖書館員從事科學(xué)數(shù)據(jù)資源編目、數(shù)據(jù)館藏建設(shè)等工作的基礎(chǔ)技能。越來越多的圖書館開始設(shè)立科學(xué)數(shù)據(jù)館員(data curation specialist/librarian),專門從事圖書館的科學(xué)數(shù)據(jù)管理相關(guān)工作,元數(shù)據(jù)知識與技能的掌握是該職業(yè)領(lǐng)域的必要技能。澳大利亞國家科學(xué)數(shù)據(jù)服務(wù)(Australian NationalData Service,ANDS)中心認為數(shù)據(jù)館員的職責(zé)包括數(shù)據(jù)管理、元數(shù)據(jù)管理和數(shù)據(jù)利用,而元數(shù)據(jù)管理則包括元數(shù)據(jù)的生成與維護、元數(shù)據(jù)標(biāo)準(zhǔn)的建立和應(yīng)用等。圖書館和圖情教育領(lǐng)域針對科學(xué)數(shù)據(jù)管理職業(yè)需求開展了一系列的教育和培訓(xùn)項目,并開設(shè)了針對科學(xué)數(shù)據(jù)管理的元數(shù)據(jù)技能培訓(xùn)。2011年10月,CURATEcamp與數(shù)字圖書館聯(lián)盟(Digital Library Federation,DLF)論壇共同開展了“編目員與編碼員”的論壇,該論壇集合了元數(shù)據(jù)領(lǐng)域和關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的專家。
元數(shù)據(jù)在科學(xué)數(shù)據(jù)管理計劃制定、數(shù)據(jù)倉儲的設(shè)計與運作、科學(xué)數(shù)據(jù)的出版與共享等方面都承擔(dān)著重要的職能,現(xiàn)有的圖書館科學(xué)數(shù)據(jù)管理中元數(shù)據(jù)應(yīng)用呈現(xiàn)出覆蓋范圍廣、應(yīng)用深度不一的特征。從協(xié)助科學(xué)數(shù)據(jù)管理計劃制定到數(shù)據(jù)管理平臺和系統(tǒng)的開發(fā)、從科學(xué)數(shù)據(jù)的組織標(biāo)準(zhǔn)推薦到科學(xué)數(shù)據(jù)倉儲的建設(shè),圖書館的科學(xué)數(shù)據(jù)管理服務(wù)深入程度各不相同,但都提供了相應(yīng)的元數(shù)據(jù)服務(wù)。圖書館在開展科學(xué)數(shù)據(jù)管理服務(wù)實踐的過程中,隨著工作內(nèi)容的深入,其元數(shù)據(jù)實踐也逐漸深入,從基本的元數(shù)據(jù)標(biāo)準(zhǔn)與元素推薦拓展到面向科學(xué)數(shù)據(jù)管理各流程的元數(shù)據(jù)整體方案的設(shè)計與實施。
從科學(xué)數(shù)據(jù)管理的未來發(fā)展看,科學(xué)數(shù)據(jù)的組織、存儲和共享等方面的實踐以及相應(yīng)平臺的建設(shè)都將成為圖書館在科學(xué)數(shù)據(jù)管理方面的重要發(fā)展方向,因此圖書館科學(xué)數(shù)據(jù)管理的元數(shù)據(jù)實踐也應(yīng)從其科學(xué)數(shù)據(jù)管理的整體設(shè)計和工作流程出發(fā),進行適應(yīng)性的選擇與規(guī)劃,為本機構(gòu)科學(xué)數(shù)據(jù)管理工作的良好發(fā)展奠定基礎(chǔ),與此同時,應(yīng)當(dāng)充分考慮元數(shù)據(jù)相關(guān)技術(shù)如本體技術(shù)、關(guān)聯(lián)數(shù)據(jù)技術(shù)等在科學(xué)數(shù)據(jù)元數(shù)據(jù)描述和組織方面的發(fā)展與應(yīng)用,將適合科學(xué)數(shù)據(jù)組織和整體環(huán)境發(fā)展的技術(shù)進行結(jié)合應(yīng)用,為圖書館開展深入科學(xué)數(shù)據(jù)管理服務(wù)提供技術(shù)保障。
[1]Corrall S.Roles and responsibilities:Libraries,librarians and data[J].Managing research data,2012:105-133.
[2]Gabridge T.The lastmile:Liaison roles in curating science and engineering research data[J].Research Library Issues:A Bimonthly Report from ARL,CNI,and SPARC,2009,265:15.
[3]Gray J,Liu D T,Nieto-Santisteban M,et al.Scientific datamanagement in the coming decade[J].ACM SIGMOD Record,2005,34(4):34-41.
[4]Anna Gold.Cyberinfrastructure,Data,and Libraries,Part 2:Libraries and the Data Challenge:Roles and Actions for Libraries[J].D-Lib Magazine,2007,13(9/10).
[5]Mayernik M S.Metadata tensions:A case study of library principles vs.everyday scientific data practices[J]. Proceedings of the American Society for Information Science and Technology,2010,47(1):1-2.
[6]Managing Research Data—from Goals to Reality[EB/ OL].[2014-08-22].http://oclc.org/content/dam/research/ events/2010/06-09dc.ppt.
[7]Digital Curation Interest Group[EB/OL].[2014-08-22]. http://www.ala.org/acrl/aboutacrl/directoryofleadership/int erestgroups/acr-igdc.
[8]Ten recommendation for libraries to get started with research datamanagement[EB/OL].[2014-08-23].http:// libereurope.eu/wp-content/uploads/The%20research% 20data%20group%202012%20v7%20final.pdf.
[9]Grants.gov Application Guide[EB/OL].[2014-07-03]. http://www.nsf.gov/pubs/policydocs/grantsgovguide0113.pdf.
[10]Data management planning for ESRC researchers[EB/ OL].[2014-07-02].http://ukdataservice.ac.uk/manage -data/plan/dmp-esrc.aspx.
[11]BBSRC-Specific Requirements[EB/OL].[2014-07-20]. http://je-s.rcuk.ac.uk/Handbook/pages/Guidanceon CompletingaStandardG/CaseforSupportandAttachments/ BBSRCSpecificRequirements.htm.
[12]Data Management Planning[EB/OL].[2014-07-20].http://www.ands.org.au/resource/data-management-planning. htm l.
[13]Khan H,Caruso B,Corson-Rikert J,et al.DataStaR:Using the semantic web approach for data curation[J]. International Journal of Digital Curation,2011,6(2):209-221.
[14]Steinhart G.DataStaR:an institutional approach to research data curation[J].IASSISTQuarterly,2007,31(3-4):34-39.
[15]Bermudez L,Piasecki M.Metadata community profiles for the semantic web[J].Geoinformatica,2006,10(2):159-176.
[16]Lowe B.Datastar:Bridging XML and OWL in science metadata management[M].//Metadata and Semantic Research.Springer Berlin Heidelberg,2009:141-150.
[17]張曉林.機構(gòu)知識庫的發(fā)展趨勢與挑戰(zhàn)[J].現(xiàn)代圖書情報技術(shù),2014,30(2):1-7.
[18]Dearborn C C,Barton A J,Harmeyer N A.The Purdue University Research Repository:HUBzero customization for dataset publication and digital preservation[J]. OCLC Systems&Services,2014,30(1):15-27.
[19]殷沈琴,張計龍,張瑩,等.社會科學(xué)數(shù)據(jù)管理服務(wù)平臺系統(tǒng)選型研究——以復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺為例[J].圖書情報工作,2013,57(19):92-96.
[20]DataONE[EB/OL].[2014-07-19].http://www.dataone.org/.
[21]Data Conservancy[EB/OL].[2014-07-19].http://dataconservancy.org/.
[22]Michener W,Vieglais D,Vision T,et al.DataONE:Data Observation Network for Earth—Preserving data and enabling innovation in the biological and environmental sciences[J].D-Lib Magazine,2011,17(1/2):12.
[23]Gunia B,Sandusky R J.Designingmetadata for long‐term data preservation:DataONE case study[J].Proceedings of the American Society for Information Science and Technology,2010,47(1):1-2.
[24]Lyon L.The informatics transform:Re-engineering libraries for the data decade[J].International Journal of Digital Curation,2012,7(1):126-138.
[25]Lewis,M.Libraries and the management of research data[EB/OL].[2014-08-23].http://core.kmi.open.ac.uk /download/pdf/12441.pdf.
[26]Cox A,Verbaan E,Sen B.Upskilling liaison librarians for research datamanagement[J].Ariadne,2012,70.
[27][EB/OL].[2014-08-23].http://www.diglib.org/community/groups/digcuration/.
[28]Information specialists and data librarians[EB/OL].[2014-07-20].http://www.ands.org.au/guides/dmframe work/dmskills-information.html.
[29]Keralis SD C.Data curation education:A snapshot[J]. L.Jahnke,A.Asher,&SDC Keralis.The problem of data,2012:32-43.
[30]Welcome to CURATEcamp:Catalogers+Coders[EB/ OL].[2014-07-07].http://curatecamp.org/content/welcome-curatecamp-catalogers-coders.
Research on Metadata App lication Practices of Library Participating in Data Curation
M etadata is a prerequisite tool for library to participate in data curation services.In the base services of data curation,librarians select and recommend metadata standards and elements for researchers.Librarians design a complete set of plan ofmetadata for self-built data repository which aimed at serving data curation.Besides,metadata was applied w ith different depth to public data repositories,data curation system software,and cooperative projects.In addition,the library also attached great importance tometadata skills training of data librarians.
data curation;metadata;library application
G254
:A
:1003-6938(2014)05-0065-05
黃如花(1968-),女,武漢大學(xué)信息管理學(xué)院教授;邱春艷(1987-),女,武漢大學(xué)信息管理學(xué)院圖書館學(xué)博士研究生。
*本文系2014-2015年度中信所院校合作項目“數(shù)字信息資源的長期保存”之子課題“科學(xué)數(shù)據(jù)保存與共享的元數(shù)據(jù)復(fù)用研究”研究成果之一。
2014-08-28;責(zé)任編輯:劉全根