邸弘陽(yáng),耿騫,黃國(guó)彬,屈亞杰
(北京師范大學(xué)政府管理學(xué)院,北京 100875)
科學(xué)數(shù)據(jù)引用規(guī)范的內(nèi)容特點(diǎn)分析*
邸弘陽(yáng),耿騫,黃國(guó)彬,屈亞杰
(北京師范大學(xué)政府管理學(xué)院,北京 100875)
本文選取科學(xué)數(shù)據(jù)組織機(jī)構(gòu)所擬定的、面向科學(xué)數(shù)據(jù)引用的規(guī)范性文本為研究對(duì)象,從科學(xué)數(shù)據(jù)引用對(duì)象、科學(xué)數(shù)據(jù)引用元素、科學(xué)數(shù)據(jù)引用格式、科學(xué)數(shù)據(jù)引用的標(biāo)識(shí)符等方面,分析科學(xué)數(shù)據(jù)引用規(guī)范的內(nèi)容特點(diǎn)。研究發(fā)現(xiàn),現(xiàn)有科學(xué)數(shù)據(jù)引用規(guī)范內(nèi)容多遵循科學(xué)數(shù)據(jù)引用原則,且受傳統(tǒng)規(guī)范影響較大,但在引用對(duì)象、引用元素與引用格式等方面存在差異。
科學(xué)數(shù)據(jù);引用;規(guī)范
隨著科學(xué)數(shù)據(jù)對(duì)科學(xué)發(fā)現(xiàn)的驅(qū)動(dòng)作用逐漸增強(qiáng),科研人員對(duì)科學(xué)數(shù)據(jù)的重視程度日益加深,以收集、存儲(chǔ)、管理與出版科學(xué)數(shù)據(jù)為服務(wù)功能的科學(xué)數(shù)據(jù)倉(cāng)儲(chǔ)、科學(xué)數(shù)據(jù)期刊大量涌現(xiàn)。科學(xué)數(shù)據(jù)作為科學(xué)研究的基礎(chǔ)與重要產(chǎn)出,其開(kāi)放獲取與重復(fù)利用成為科學(xué)研究管理與資助單位關(guān)注的話(huà)題。如知名學(xué)術(shù)期刊Science的審稿規(guī)定,任一理解、評(píng)價(jià)與延展投稿結(jié)論所需數(shù)據(jù),以及生產(chǎn)與分析數(shù)據(jù)所涉全部計(jì)算機(jī)代碼均需向該期刊的全體讀者公開(kāi)[1]??蒲腥藛T在線(xiàn)發(fā)現(xiàn)、獲取與利用科學(xué)數(shù)據(jù)的屏障逐漸消失,科學(xué)數(shù)據(jù)的規(guī)范引用逐漸成為科研人員面臨的現(xiàn)實(shí)問(wèn)題。對(duì)科研人員而言,規(guī)范引用科學(xué)數(shù)據(jù),既是對(duì)科研人員辛勤勞動(dòng)的尊重,也是對(duì)科研成果進(jìn)行重復(fù)驗(yàn)證的保障,對(duì)推動(dòng)科學(xué)數(shù)據(jù)開(kāi)放獲取與重復(fù)利用具有重要意義。為規(guī)范科研人員對(duì)科學(xué)數(shù)據(jù)的引用行為,科學(xué)數(shù)據(jù)的生產(chǎn)者、管理者、使用者及科學(xué)研究的資助者制定、選用或推薦了不同的科學(xué)數(shù)據(jù)引用規(guī)范。以不同的科學(xué)數(shù)據(jù)引用規(guī)范為研究對(duì)象,有助于把握科學(xué)數(shù)據(jù)引用規(guī)范的內(nèi)容特點(diǎn),為多學(xué)科科學(xué)數(shù)據(jù)引用規(guī)范的制定提供參考。
制定、選用或推薦科學(xué)數(shù)據(jù)引用規(guī)范的主體包括科學(xué)數(shù)據(jù)組織、科學(xué)研究機(jī)構(gòu)、科學(xué)數(shù)據(jù)出版機(jī)構(gòu)、科學(xué)研究資助機(jī)構(gòu)和為科學(xué)研究提供信息與服務(wù)支持的圖書(shū)館等,不同主體所制定、選用或推薦的科學(xué)數(shù)據(jù)引用規(guī)范亦不相同,部分主體雖對(duì)科學(xué)數(shù)據(jù)引用提出要求,但尚未形成可正式發(fā)布的規(guī)范性文本。DataCite作為非營(yíng)利性的科學(xué)數(shù)據(jù)國(guó)際組織,致力于幫助科研人員有效地查找、獲取與引用科學(xué)數(shù)據(jù),明確地規(guī)范了科學(xué)數(shù)據(jù)的引用元素與引用格式,對(duì)不同主體制定、選用或推薦科學(xué)數(shù)據(jù)引用規(guī)范具有重要影響。為適應(yīng)現(xiàn)實(shí)發(fā)展變化,DataCite持續(xù)更新其科學(xué)數(shù)據(jù)引用規(guī)范,截至2017年3月,其科學(xué)數(shù)據(jù)引用規(guī)范共更新6次,最新版本為面向科學(xué)數(shù)據(jù)出版與引用的元數(shù)據(jù)架構(gòu)4.0版[2]。DCC(Digital Curation Centre)可為科學(xué)研究機(jī)構(gòu)存儲(chǔ)、管理、保護(hù)與共享科學(xué)數(shù)據(jù)提供專(zhuān)業(yè)建議與實(shí)際幫助,除為科學(xué)數(shù)據(jù)的相關(guān)政策制定提供咨詢(xún)外,還從科學(xué)數(shù)據(jù)的引用原則、面向科研人員的科學(xué)數(shù)據(jù)引用、面向科學(xué)數(shù)據(jù)倉(cāng)儲(chǔ)的科學(xué)數(shù)據(jù)引用等方面對(duì)科學(xué)數(shù)據(jù)的引用元素、引用格式、引用粒度等加以規(guī)范[3]。
在不同科學(xué)數(shù)據(jù)相關(guān)主體共同參與的同時(shí),以科學(xué)數(shù)據(jù)引用規(guī)范為主題的理論研究也已經(jīng)歷較長(zhǎng)時(shí)間的發(fā)展。Dodd指出在較長(zhǎng)時(shí)間內(nèi),社會(huì)科學(xué)領(lǐng)域產(chǎn)生的大量數(shù)字型科學(xué)數(shù)據(jù)與相對(duì)薄弱的管理手段存在矛盾,并探索科學(xué)數(shù)據(jù)的規(guī)范描述與引用[4]。Altman等在文獻(xiàn)引用規(guī)范基礎(chǔ)上,提出與其相似的、定量數(shù)據(jù)引用規(guī)范的6項(xiàng)必備元素,包括作者、出版時(shí)間、名稱(chēng)、全局唯一標(biāo)識(shí)符,以及通用數(shù)字指紋與可被任意瀏覽器識(shí)別的統(tǒng)一資源定位符(Uniform Resource Locator,URL)橋接服務(wù);并對(duì)定量數(shù)據(jù)引用規(guī)范的可選元素,以及定量數(shù)據(jù)集合子集的“深度引用”等進(jìn)行深入討論[5],這對(duì)后續(xù)科學(xué)數(shù)據(jù)引用規(guī)范的理論與實(shí)踐探索產(chǎn)生深遠(yuǎn)影響。Green指出科學(xué)數(shù)據(jù)的引用失范問(wèn)題,并介紹了經(jīng)濟(jì)合作與發(fā)展組織(Organisation for Economic Co-operation and Development,OECD)在規(guī)范數(shù)據(jù)集合引用行為方面的探索[6]。近年來(lái),以科學(xué)數(shù)據(jù)引用規(guī)范為主題的理論研究在國(guó)內(nèi)逐漸升溫。張靜蓓等系統(tǒng)梳理了科學(xué)數(shù)據(jù)引用規(guī)范的理論與實(shí)踐發(fā)展現(xiàn)狀,并從引用對(duì)象、引用元素、引用位置、關(guān)鍵問(wèn)題與解決方案等方面進(jìn)行分析,指出不同科學(xué)數(shù)據(jù)引用規(guī)范間互不兼容的關(guān)鍵問(wèn)題[7-8];黃如花等從引用原則、引用元素、引用格式、引用對(duì)象與相關(guān)主體等方面分析科學(xué)數(shù)據(jù)引用規(guī)范,指出其對(duì)我國(guó)科學(xué)數(shù)據(jù)引用規(guī)范發(fā)展完善的重要啟示[9]。
為了解不同科學(xué)數(shù)據(jù)引用規(guī)范對(duì)科學(xué)數(shù)據(jù)引用行為的具體約束,以及為多學(xué)科科學(xué)數(shù)據(jù)引用規(guī)范的制定提供參考,本文選取以科學(xué)數(shù)據(jù)管理與服務(wù)為主要職能的組織機(jī)構(gòu)所擬定的、面向科學(xué)數(shù)據(jù)引用的規(guī)范性文本為研究對(duì)象,從科學(xué)數(shù)據(jù)引用的對(duì)象、科學(xué)數(shù)據(jù)引用的元素、科學(xué)數(shù)據(jù)引用的格式與科學(xué)數(shù)據(jù)引用的標(biāo)識(shí)符方面,分析科學(xué)數(shù)據(jù)引用規(guī)范的內(nèi)容特點(diǎn)。
科學(xué)數(shù)據(jù)引用規(guī)范的內(nèi)容包括科學(xué)數(shù)據(jù)引用規(guī)范的制定、科學(xué)數(shù)據(jù)引用對(duì)象、科學(xué)數(shù)據(jù)引用元素、科學(xué)數(shù)據(jù)引用格式等。分析科學(xué)數(shù)據(jù)引用規(guī)范的內(nèi)容,可把握不同科學(xué)數(shù)據(jù)引用規(guī)范在引用對(duì)象、引用元素、引用格式等方面的異同。
3.1 科學(xué)數(shù)據(jù)引用規(guī)范的基本信息
本文所涉及的科學(xué)數(shù)據(jù)引用規(guī)范包括OECD[6]、ESIP(Earth Science Information Partners)[10]、GBIF(Global Biodiversity Information Facility)[11]、DCC[3]、DataCite[2]與ANDS(Australian National Data Service)[12]所制定的面向科學(xué)數(shù)據(jù)引用的規(guī)范性文本,各規(guī)范性文本的具體信息如表1所示。
表1 面向科學(xué)數(shù)據(jù)引用的規(guī)范性文本信息
OECD的科學(xué)數(shù)據(jù)引用規(guī)范由Green起草,于2009年4月20日發(fā)布;2009年6月,規(guī)范中元數(shù)據(jù)標(biāo)準(zhǔn)被應(yīng)用于OECD的出版平臺(tái)OECD iLibrary,本文選用2010年2月發(fā)布的最新版本。ESIP是由NASA、NOAA和USGS等資助,由多方共同組成的開(kāi)放網(wǎng)絡(luò)社區(qū);其數(shù)據(jù)引用指南于2011年8月17日提交至全體ESIP成員進(jìn)行審議,2012年1月5日正式審議通過(guò);此外,ESIP還專(zhuān)門(mén)針對(duì)期刊編輯與評(píng)審人員發(fā)布相應(yīng)數(shù)據(jù)引用指南,為期刊政策、作者指南、編輯指南與評(píng)審指南中有關(guān)科學(xué)數(shù)據(jù)引用的部分提供具體示例[13]。GBIF是由政府資助的國(guó)際組織,旨在建設(shè)生物多樣性信息,鼓勵(lì)與幫助科學(xué)研究機(jī)構(gòu)遵循常見(jiàn)標(biāo)準(zhǔn)出版生物多樣性數(shù)據(jù),并使數(shù)據(jù)可被公開(kāi)地訪問(wèn)與獲取。2008年9月4日,GBIF發(fā)布白皮書(shū)論述引用行為對(duì)科學(xué)研究的重要意義、網(wǎng)絡(luò)環(huán)境與分布式數(shù)據(jù)庫(kù)所引發(fā)的數(shù)據(jù)引用挑戰(zhàn),以及面向生產(chǎn)者、提供者與使用者提供數(shù)據(jù)引用功能的現(xiàn)實(shí)需求[14];2012年5月11日,GBIF發(fā)布網(wǎng)絡(luò)出版數(shù)據(jù)1.0版,對(duì)引用由GBIF網(wǎng)絡(luò)出版的生物多樣性數(shù)據(jù)提供建議。
3.2 科學(xué)數(shù)據(jù)引用對(duì)象
科學(xué)數(shù)據(jù)引用對(duì)象指產(chǎn)生于科學(xué)研究且已經(jīng)正式出版的、對(duì)科研人員的科學(xué)研究具有直接或間接幫助的數(shù)據(jù)。ANDS在其科學(xué)數(shù)據(jù)引用規(guī)范中特別強(qiáng)調(diào)了作為引用對(duì)象的科學(xué)數(shù)據(jù)集合與原始研究論文的關(guān)聯(lián);DataCite也在其科學(xué)數(shù)據(jù)引用規(guī)范中規(guī)定,適用的引用對(duì)象為廣義的科學(xué)數(shù)據(jù)集合,即不局限于數(shù)字型數(shù)據(jù),而是涵蓋更多類(lèi)型的數(shù)據(jù);OECD則在其科學(xué)數(shù)據(jù)引用規(guī)范中規(guī)定其所適用的引用對(duì)象包括科學(xué)數(shù)據(jù)集合與單獨(dú)的科學(xué)數(shù)據(jù)表格;此外,ESIP與上述科學(xué)數(shù)據(jù)引用規(guī)范所適用的引用對(duì)象不同,其以地球科學(xué)數(shù)據(jù)為引用對(duì)象;GBIF以生物多樣性數(shù)據(jù)為引用對(duì)象。
動(dòng)態(tài)科學(xué)數(shù)據(jù)集合也是科學(xué)數(shù)據(jù)引用規(guī)范所涉及的引用對(duì)象。OECD認(rèn)為科學(xué)數(shù)據(jù)集合的動(dòng)態(tài)更新不同于版本更新,版本更新支持讀者追溯早期版本,而科學(xué)數(shù)據(jù)集合的動(dòng)態(tài)更新內(nèi)容較多、頻率較高,難以通過(guò)追溯早期版本的方式幫助讀者獲取引用行為發(fā)生時(shí)的科學(xué)數(shù)據(jù)集合。然而,無(wú)論是新數(shù)據(jù)的加入,還是舊數(shù)據(jù)的更新,任意科學(xué)數(shù)據(jù)集合的變化均可通過(guò)描述科學(xué)數(shù)據(jù)自身的元數(shù)據(jù),而非描述科學(xué)數(shù)據(jù)集合的元數(shù)據(jù)詳細(xì)記錄。因此,OECD擬利用數(shù)字對(duì)象唯一標(biāo)識(shí)符(Digital Object Identification,DOI)引導(dǎo)讀者訪問(wèn)描述科學(xué)數(shù)據(jù)集合的元數(shù)據(jù),以判斷科學(xué)數(shù)據(jù)集合是否動(dòng)態(tài)更新,并通過(guò)訪問(wèn)描述科學(xué)數(shù)據(jù)自身的元數(shù)據(jù)查找動(dòng)態(tài)科學(xué)數(shù)據(jù)集合的更新內(nèi)容[6]。DataCite提出動(dòng)態(tài)科學(xué)數(shù)據(jù)集合的3種引用方案:(1)引用特定部分,即在特定時(shí)間內(nèi)對(duì)動(dòng)態(tài)科學(xué)數(shù)據(jù)集合的更新,或者對(duì)動(dòng)態(tài)科學(xué)數(shù)據(jù)集合內(nèi)特定范圍數(shù)據(jù)的更新;(2)引用特定“快照”,即在特定時(shí)間節(jié)點(diǎn)生成的動(dòng)態(tài)科學(xué)數(shù)據(jù)集合的副本;(3)引用動(dòng)態(tài)更新的科學(xué)數(shù)據(jù)集合,需要在引用標(biāo)識(shí)中注明訪問(wèn)時(shí)間。其中,引用特定部分與引用特定快照方案產(chǎn)生的動(dòng)態(tài)科學(xué)數(shù)據(jù)集合的新版本,需要添加標(biāo)識(shí)符。而引用動(dòng)態(tài)科學(xué)數(shù)據(jù)集合的方案,因無(wú)法有效幫助讀者獲取引用行為發(fā)生時(shí)的科學(xué)數(shù)據(jù)集合,而存在一定爭(zhēng)議[2]。
3.3 科學(xué)數(shù)據(jù)引用元素
科學(xué)數(shù)據(jù)引用元素指用于描述科學(xué)數(shù)據(jù)引用對(duì)象的數(shù)據(jù)項(xiàng)。科學(xué)數(shù)據(jù)引用規(guī)范選取的引用元素在充分反映引用對(duì)象特征的同時(shí),還需考慮引用元素是否易于科研人員理解與獲取。
DCC的科學(xué)數(shù)據(jù)引用元素來(lái)源于4篇科學(xué)數(shù)據(jù)引用相關(guān)研究論文,其選取的引用元素包括:作者,指科學(xué)數(shù)據(jù)集合的創(chuàng)建者;出版時(shí)間,是為確保科學(xué)數(shù)據(jù)質(zhì)量而進(jìn)行的全部程序結(jié)束時(shí)間與限制出版狀態(tài)結(jié)束時(shí)間中較晚的時(shí)間;名稱(chēng),即引用數(shù)據(jù)集合的名稱(chēng),包括相關(guān)設(shè)施名稱(chēng)、主要來(lái)源數(shù)據(jù)集下主子集的主標(biāo)題,以及主要來(lái)源數(shù)據(jù)集下子集的主標(biāo)題;編輯版本,用來(lái)說(shuō)明數(shù)據(jù)加工程度或階段,其可揭示數(shù)據(jù)的原始或細(xì)化程度;出版版本,其隨著數(shù)據(jù)節(jié)點(diǎn)的增加或重復(fù)推導(dǎo)而不斷變更;特征名與統(tǒng)一資源標(biāo)識(shí)符(Uniform Resource Identifier,URI),特征指對(duì)現(xiàn)實(shí)世界現(xiàn)象的抽象描述,URI指標(biāo)識(shí)特征的標(biāo)準(zhǔn)名稱(chēng),用于選取數(shù)據(jù)集合的子集;資源類(lèi)型;出版者,為負(fù)責(zé)存儲(chǔ)與管理數(shù)據(jù),或?yàn)閿?shù)據(jù)提供質(zhì)量保證的組織/機(jī)構(gòu);數(shù)字指紋,用于確保數(shù)據(jù)自被引用以來(lái)未被修改;標(biāo)識(shí)符,指根據(jù)永久性方案生成的數(shù)據(jù)標(biāo)識(shí);位置,即可訪問(wèn)與獲取數(shù)據(jù)集合的永久性URL,部分標(biāo)識(shí)符可通過(guò)標(biāo)識(shí)符解析服務(wù)提供位置信息[3]。DCC的科學(xué)數(shù)據(jù)引用元素與4篇研究論文選取關(guān)系如表2所示。
表2 DCC的科學(xué)數(shù)據(jù)引用元素的選取來(lái)源
DataCite將科學(xué)數(shù)據(jù)引用的元素分為必備元素與可選元素,必備元素包括作者、出版時(shí)間、名稱(chēng)、出版者與標(biāo)識(shí)符,可選元素包括出版版本與資源類(lèi)型[2]。
與DataCite相似,ESIP推薦科學(xué)數(shù)據(jù)引用的必備元素包括作者、出版時(shí)間、名稱(chēng)、存儲(chǔ)者或分發(fā)者、位置、標(biāo)識(shí)符或分發(fā)渠道、出版版本與訪問(wèn)時(shí)間;可選元素包括所使用子集、編輯者或其他重要人員、出版地、分發(fā)機(jī)構(gòu)、存儲(chǔ)機(jī)構(gòu)或其他相關(guān)機(jī)構(gòu),以及被引用的科學(xué)數(shù)據(jù)集。ESIP特別明確了位置與標(biāo)識(shí)符的區(qū)別,認(rèn)為位置元素不應(yīng)直接指向科學(xué)數(shù)據(jù),而應(yīng)指向提供科學(xué)數(shù)據(jù)描述信息、版本信息與訪問(wèn)機(jī)制等的網(wǎng)頁(yè),且該網(wǎng)頁(yè)應(yīng)隨科學(xué)數(shù)據(jù)更新而更新,理想狀態(tài)下,該網(wǎng)頁(yè)應(yīng)支持機(jī)器讀取[10]。
OECD提出科學(xué)數(shù)據(jù)集合的引用元素包括作者、出版時(shí)間、主要來(lái)源數(shù)據(jù)集下子集的主標(biāo)題、數(shù)據(jù)集合名稱(chēng)、數(shù)據(jù)集合副題名、主要來(lái)源數(shù)據(jù)集下主子集的主標(biāo)題、數(shù)據(jù)庫(kù)、DOI、DOI鏈接與訪問(wèn)時(shí)間;其科學(xué)數(shù)據(jù)表格的引用元素包括作者、出版時(shí)間、表格序號(hào)、表格名稱(chēng)、表格副題名、表格集合名稱(chēng)、出版物名稱(chēng)、出版物副題名、出版者、DOI、DOI鏈接與訪問(wèn)時(shí)間[6]。
GBIF提出基于出版者的科學(xué)數(shù)據(jù)引用與基于查詢(xún)的科學(xué)數(shù)據(jù)引用。引用元素包括出版者、出版時(shí)間、名稱(chēng)、數(shù)據(jù)集合的記錄數(shù)(動(dòng)態(tài)數(shù)據(jù)集合可記錄最近發(fā)布或最新版本的記錄數(shù))、出版模式(如在線(xiàn)出版或以CDROM、DVD等非在線(xiàn)形式出版)、主要訪問(wèn)接口、發(fā)布時(shí)間、標(biāo)識(shí)符、版本序號(hào),以及最近更新或發(fā)布時(shí)間與貢獻(xiàn)者?;诓樵?xún)的科學(xué)數(shù)據(jù)引用面向未來(lái),引用元素除基于出版者的科學(xué)數(shù)據(jù)引用的元素外,還包括訪問(wèn)接口URI、檢索語(yǔ)句、檢索時(shí)間、檢索結(jié)果數(shù)量、相關(guān)數(shù)據(jù)集合數(shù)量,以及分配給結(jié)果數(shù)據(jù)集合的標(biāo)識(shí)符與相關(guān)數(shù)據(jù)集合的標(biāo)識(shí)符[11]。
3.4 科學(xué)數(shù)據(jù)引用格式
科學(xué)數(shù)據(jù)引用格式指科學(xué)數(shù)據(jù)引用元素在引用標(biāo)識(shí)中的排列順序與排列結(jié)構(gòu)??茖W(xué)數(shù)據(jù)引用規(guī)范在確保引用格式為科研人員所理解與使用的同時(shí),還需考慮引用標(biāo)識(shí)是否便于機(jī)器讀取等問(wèn)題。
DataCite考慮到用戶(hù)來(lái)自于不同學(xué)科領(lǐng)域,故推薦用戶(hù)使用“作者(出版時(shí)間):名稱(chēng). 出版者. 標(biāo)識(shí)符”,或包括可選元素的“作者(出版時(shí)間):名稱(chēng). 出版版本.出版者. 資源類(lèi)型. 標(biāo)識(shí)符”的科學(xué)數(shù)據(jù)引用格式[2]。
OECD提出科學(xué)數(shù)據(jù)集合的引用格式:
作者 (出版時(shí)間), “主要來(lái)源數(shù)據(jù)集下子集的主標(biāo)題”, 數(shù)據(jù)集合的名稱(chēng): 數(shù)據(jù)集合的副題名, 主要來(lái)源數(shù)據(jù)集下主子集的主標(biāo)題 (數(shù)據(jù)庫(kù)). DOI
DOI鏈接
(Accessed on 訪問(wèn)時(shí)間)
圖書(shū)等出版物中科學(xué)數(shù)據(jù)表格的引用格式:
作者 (出版時(shí)間), “表格序號(hào). 表格名稱(chēng):表格副題名”, in 出版物名稱(chēng): 出版物副題名, 出版者 DOI
DOI鏈接
獨(dú)立科學(xué)數(shù)據(jù)表格集合(非出版物)的引用格式[6]:
作者(出版時(shí)間), “表格名稱(chēng):表格副題名”, 表格集合名稱(chēng), No. 表格序號(hào) DOI
DOI鏈接
(Accessed on 訪問(wèn)時(shí)間)
GBIF針對(duì)科學(xué)數(shù)據(jù)引用的主體特點(diǎn),提出6種科學(xué)數(shù)據(jù)引用格式,每種引用格式包括完整形式與簡(jiǎn)單形式;同時(shí),從所查詢(xún)的科學(xué)數(shù)據(jù)來(lái)源角度,按照結(jié)果數(shù)據(jù)集是否來(lái)自單一數(shù)據(jù)平臺(tái),提出2種引用格式,每種引用格式同樣包括完整形式與簡(jiǎn)單形式[11]。
3.5 科學(xué)數(shù)據(jù)引用的標(biāo)識(shí)符
科學(xué)數(shù)據(jù)引用的標(biāo)識(shí)符可標(biāo)識(shí)實(shí)體或非實(shí)體對(duì)象,一般由數(shù)字、字母、符號(hào)等組成。標(biāo)識(shí)符僅用來(lái)標(biāo)識(shí)科學(xué)數(shù)據(jù)或科學(xué)數(shù)據(jù)的作者。
僅用于標(biāo)識(shí)科學(xué)數(shù)據(jù)集合,并指向特定網(wǎng)絡(luò)位置的標(biāo)識(shí)符,包括ARK(Archival Resource Key)、PURL(Persistent Uniform Resource Locator)與DOI等。ARK旨在向長(zhǎng)期訪問(wèn)信息對(duì)象提供URL,其支持標(biāo)識(shí)的信息對(duì)象包括數(shù)字對(duì)象、物理對(duì)象、有機(jī)生物、無(wú)形對(duì)象[17-18]。PURL為面向數(shù)字資源的命名與解析服務(wù),其與URL相似,但指向解析服務(wù),而非數(shù)字資源的實(shí)際位置[19]。DOI可為任意數(shù)字對(duì)象提供唯一標(biāo)識(shí),即使數(shù)字對(duì)象的網(wǎng)絡(luò)位置發(fā)生改變,其DOI也保持不變[20]。每個(gè)DOI由一個(gè)字符串組成,包括前綴、后綴兩部分,中間用“/”隔開(kāi),并且前綴以“.”再分為兩部分。前綴由國(guó)際數(shù)字對(duì)象識(shí)別號(hào)基金會(huì)確定,后綴部分由資源發(fā)布者自行指定,用于區(qū)分一個(gè)單獨(dú)的數(shù)字資料,使其具有唯一性,如“10.2438/j.mcm.2005.05.028”。前綴中的“10.”為DOI特定代碼,“2438”表示出版機(jī)構(gòu)代碼,由DOI注冊(cè)代理機(jī)構(gòu)分配;后綴由出版機(jī)構(gòu)提供,規(guī)則不限,只要在相同的前綴中具有唯一性即可。
在科學(xué)數(shù)據(jù)個(gè)人作者的唯一標(biāo)識(shí)方面,DCC指出個(gè)人作者單位變化、姓名重復(fù)等為個(gè)人作者的唯一標(biāo)識(shí)帶來(lái)一定阻礙,據(jù)此推薦兩種可唯一標(biāo)識(shí)科學(xué)數(shù)據(jù)個(gè)人作者的方案:(1)ORCID(Open Researcher and Contributor Identifier),可為個(gè)人作者免費(fèi)提供唯一的永久性標(biāo)識(shí),并建立個(gè)人作者與其作品、所獲資助等的鏈接,ORCID由16位數(shù)字組成[21];(2)ISNI(International Standard Name Identifier),是ISO認(rèn)證的國(guó)際標(biāo)準(zhǔn)(ISO 27729),可為個(gè)人作者或組織/機(jī)構(gòu)提供唯一標(biāo)識(shí),標(biāo)識(shí)由16位數(shù)字組成,其中末尾為校驗(yàn)位(可能為“X”)[22]。
科學(xué)數(shù)據(jù)引用規(guī)范的內(nèi)容特點(diǎn)包括多遵循科學(xué)數(shù)據(jù)引用原則,受傳統(tǒng)規(guī)范影響較大,在引用對(duì)象、引用元素與引用格式等方面存在差異。
4.1 科學(xué)數(shù)據(jù)引用規(guī)范多遵循科學(xué)數(shù)據(jù)引用原則
科學(xué)數(shù)據(jù)引用原則通常指2014年科學(xué)數(shù)據(jù)引用原則聯(lián)合聲明中提出的8項(xiàng)原則,包括重要性、信用與屬性、證據(jù)性、唯一標(biāo)識(shí)、訪問(wèn)獲取、持續(xù)性、明確性與可驗(yàn)證性、互操作性與靈活性[23]。在該引用原則發(fā)布前,許多科學(xué)數(shù)據(jù)的生產(chǎn)者、管理者與使用者已經(jīng)針對(duì)科學(xué)數(shù)據(jù)引用進(jìn)行了積極探索,但其所擬定的科學(xué)數(shù)據(jù)引用規(guī)范間存在較大差異。2013年,數(shù)據(jù)引用綜合工作組成立,旨在綜合已有科學(xué)數(shù)據(jù)引用相關(guān)建議,為科學(xué)數(shù)據(jù)的出版機(jī)構(gòu)、期刊編輯、科學(xué)資助機(jī)構(gòu)等提供一般性建議。其中,數(shù)據(jù)引用綜合工作組重構(gòu)CODATA、Amsterdam Manifesto與DataCite等的科學(xué)數(shù)據(jù)引用原則,參考超過(guò)25個(gè)組織機(jī)構(gòu)的意見(jiàn),最終發(fā)布《科學(xué)數(shù)據(jù)引用原則聯(lián)合聲明征求意見(jiàn)稿》,面向公眾征求意見(jiàn)。2014年1月,數(shù)據(jù)引用綜合工作組根據(jù)征求意見(jiàn)對(duì)聯(lián)合聲明征求意見(jiàn)稿進(jìn)行修改,隨后正式發(fā)布《科學(xué)數(shù)據(jù)引用原則聯(lián)合聲明》[3,24]。
《科學(xué)數(shù)據(jù)引用原則聯(lián)合聲明》發(fā)布以來(lái),得到眾多科學(xué)數(shù)據(jù)相關(guān)主體的支持,包括ESIP、GBIF、DCC、DataCite、ANDS等。例如,DCC在其科學(xué)數(shù)據(jù)引用規(guī)范中強(qiáng)調(diào)聯(lián)合聲明提出的科學(xué)數(shù)據(jù)引用原則,以及各原則的具體含義。ESIP公開(kāi)表示,科學(xué)數(shù)據(jù)引用規(guī)范所蘊(yùn)含的科學(xué)數(shù)據(jù)引用原則與聯(lián)合聲明所提出的完全一致,承認(rèn)可訪問(wèn)、可信賴(lài)的科學(xué)數(shù)據(jù)對(duì)于可靠的、可重復(fù)的科學(xué)研究的重要意義,并為地球科學(xué)數(shù)據(jù)引用提供具體指導(dǎo)[25]。
4.2 科學(xué)數(shù)據(jù)引用規(guī)范受傳統(tǒng)規(guī)范影響較大
以APA Style、MLA Style與Chicago Style等為代表的傳統(tǒng)規(guī)范對(duì)科學(xué)數(shù)據(jù)引用規(guī)范內(nèi)容的擬定具有深遠(yuǎn)影響。如APA Style是面向社會(huì)科學(xué)信息資源的引用規(guī)范,對(duì)學(xué)術(shù)論文文內(nèi)引用、尾注腳注、參考文獻(xiàn)的格式等進(jìn)行規(guī)范并提供示例,目前已更新至第6版。APA Style要求數(shù)據(jù)集合的引用格式為“作者/權(quán)利所有者.(出版年). 名稱(chēng)(出版版本)[形式描述信息]. 位置:出版者.”或“作者/權(quán)利所有者. (出版年). 名稱(chēng)(出版版本)[形式描述信息]. Retrieved from http://”,規(guī)范圖表數(shù)據(jù)的引用格式為“作者.(出版年). [數(shù)據(jù)類(lèi)型與形式描述信息].項(xiàng)目名稱(chēng). Retrieved from http://”[26]。這些引用格式及其所涉及的引用元素為科學(xué)數(shù)據(jù)引用規(guī)范內(nèi)容的擬定提供權(quán)威參考,以APA Style、MLA Style與Chicago Style等為代表的傳統(tǒng)規(guī)范引用格式與引用示例已被密歇根州立大學(xué)圖書(shū)館等納入科學(xué)數(shù)據(jù)引用指南,為在校師生規(guī)范引用科學(xué)數(shù)據(jù)提供參考[27]。
4.3 在引用對(duì)象、引用元素與引用格式等方面存在差異
不同科學(xué)數(shù)據(jù)引用規(guī)范在引用對(duì)象、引用元素與引用格式等方面存在差異。在引用對(duì)象方面,既有面向非特定學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)的引用規(guī)范,也有面向特定學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)的引用規(guī)范;既有僅面向科學(xué)數(shù)據(jù)集合的引用規(guī)范,也有同時(shí)面向科學(xué)數(shù)據(jù)集合與科學(xué)數(shù)據(jù)表格的引用規(guī)范。在引用元素方面,不同引用規(guī)范所選取的元素存在很大差異。同時(shí),部分引用規(guī)范將引用元素分為必備元素與可選元素。其中,作者、出版時(shí)間、名稱(chēng)、出版者與標(biāo)識(shí)符為絕大多數(shù)引用規(guī)范的共有引用元素;標(biāo)識(shí)符元素在唯一標(biāo)識(shí)引用對(duì)象的同時(shí),多以支持讀者訪問(wèn)并獲取被引科學(xué)數(shù)據(jù)的URL形式呈現(xiàn)。在引用格式方面,不同引用規(guī)范一般以作者元素開(kāi)始,標(biāo)識(shí)符元素結(jié)尾,以單行文本形式呈現(xiàn),各引用元素間以英文符號(hào)“.”間隔,但引用元素在引用標(biāo)識(shí)中的排列順序與排列結(jié)構(gòu)存在差異。
科學(xué)數(shù)據(jù)對(duì)科學(xué)成果的可重復(fù)驗(yàn)證、科研資源的共享利用具有重要價(jià)值。制定科學(xué)數(shù)據(jù)引用規(guī)范,倡導(dǎo)科學(xué)數(shù)據(jù)引用者使用科研數(shù)據(jù)引用規(guī)范,以此規(guī)范科學(xué)數(shù)據(jù)的引用行為,既可以讓科研人員方便地定位、獲取擬引用的科學(xué)數(shù)據(jù),促進(jìn)科學(xué)數(shù)據(jù)在更大范圍內(nèi)的共享與重用,也有利于信息計(jì)量學(xué)者對(duì)規(guī)范化的科學(xué)數(shù)據(jù)引用,開(kāi)展基于科學(xué)數(shù)據(jù)的計(jì)量分析,揭示科學(xué)數(shù)據(jù)引用的特點(diǎn),探討科學(xué)研究的發(fā)展趨勢(shì)與基本規(guī)律。從當(dāng)前發(fā)展現(xiàn)狀來(lái)看,科學(xué)數(shù)據(jù)引用規(guī)范的內(nèi)容主要包括引用對(duì)象的屬性分析、引用的基本元素、引用的形式要求和唯一標(biāo)識(shí)符的應(yīng)用等內(nèi)容。從整體內(nèi)容來(lái)看,科研數(shù)據(jù)引用的元素與傳統(tǒng)基于科技文獻(xiàn)引用的內(nèi)容模塊具有相似性,但又因科學(xué)數(shù)據(jù)獨(dú)特的屬性而不完全相同。從引用范圍來(lái)看,雖然不同科學(xué)數(shù)據(jù)引用規(guī)范在引用對(duì)象、引用元素與引用格式等方面存在差異,但已經(jīng)發(fā)生的科學(xué)數(shù)據(jù)引用行為,其引用主體從開(kāi)始就注重對(duì)引用規(guī)范的應(yīng)用,體現(xiàn)了較高的科研素養(yǎng)。這也為制定面向更大范圍的、統(tǒng)一的科學(xué)數(shù)據(jù)引用規(guī)范奠定了良好基礎(chǔ)。
[1]American Association for the Advancement of Science.Science:editorial policies[EB/OL].[2017-03-15].http://www.sciencemag.org/authors/science-editorial-policies.
[2]DataCite Metadata Working Group.DataCite metadata schema documentation for the publication and citation of research data[EB/OL].[2017-03-15].https://schema.datacite.org/meta/kernel-4.0/doc/DataCite-MetadataKernel_v4.0.pdf.
[3]BALL A,DUKE M.How to cite datasets and link to publications[EB/OL].[2017-03-15].http://www.dcc.ac.uk/resources/how-guides/cite-datasets.
[4]DODD S A.Bibliographic references for numeric social science data files:suggested guidelines[J].Journal of the Association for Information Science and Technology,1979,30(2):77-82.
[5]ALTMAN M,KING G.A proposed standard for the scholarly citation of quantitative data[J/OL].[2017-06-10].http://dlib.org/dlib/march07/altman/03altman.html.
[6]GREEN T.We need publishing standards for datasets and data tables[R/OL].[2017-03-15].http://dx.doi.org/10.1787/787355886123.
[7]張靜蓓,呂俊生,田野.國(guó)外科學(xué)數(shù)據(jù)引用研究進(jìn)展[J].圖書(shū)情報(bào)工作,2014(8):91-95,138.
[8]張靜蓓,田野,呂俊生.科學(xué)數(shù)據(jù)引用規(guī)范研究進(jìn)展[J].圖書(shū)與情報(bào),2014(5):100-104.
[9]黃如花,李楠.國(guó)外科學(xué)數(shù)據(jù)引用規(guī)范調(diào)查分析與啟示[J].圖書(shū)館學(xué)研究,2016(10):2-9.
[10]ESIP.Data citation guidelines for data providers and archives[EB/OL].[2017-03-15].http://wiki.esipfed.org/index.php/Interagency_Data_Stewardship/Citations/provider_guidelines.
[11]GBIF.Recommended practices for citation of the data published through the GBIF network[EB/OL].[2017-03-15].http://links.gbif.org/gbif_best_practice_data_citation_en_v1.
[12]ANDS.Data citation[EB/OL].(2017-01-19)[2017-03-15].http://www.ands.org.au/__data/assets/pdf_file/0005/724334/Datacitation.pdf.
[13]ESIP.Data citation guidelines for journal editors and reviewers[EB/OL].[2017-03-15]. http://wiki.esipfed.org/index.php/Inter agency_Data_Stewardship/Citations/editor_reviewer_guidelines.
[14]LANEM.Data citation in the electronic environment,a white paper commissioned by GBIF[R/OL].[2017-03-15].http://www.gbif.org/orc/?doc_id=4884.
[15]LAWRENCE B,JONES C,MATTHEWS B,et al.Citation and peer review of data:moving towards formal data publication[J].International Journal of Digital Curation,2011,6(2):4-37.
[16]STARR J,GASTL A.IsCitedBy:a metadata scheme for DataCite[J/OL].[2017-06-10].http://dlib.org/dlib/january11/starr/01starr.print.html.
[17]WILLETT P.ARK(Archival Resource Key)identifiers[EB/OL].(2017-05-16)[2017-05-17].https://confluence.ucop.edu/display/Curation/ARK.
[18]IFLA.Archival Resource Key(ARK)[EB/OL].(2014-08-12)[2017-03-15].https://www.ifla.org/best-practice-for-nationalbibliographic-agencies-in-a-digital-age/node/8793.
[19]IFLA.Persistent URL(PURL)[EB/OL].(2014-07-21)[2017-03-15].https://www.ifla.org/best-practice-for-national-bibliographicagencies-in-a-digital-age/node/8790.
[20]International DOI Foundation.DOI handbook: Introduction[EB/OL].(2015-10-17)[2017-03-15].https://www.doi.org/doi_handbook/1_Introduction.html.
[21]ORCID.What is ORCID[EB/OL].[2017-03-15].https://orcid.org/about/what-is-orcid/mission.
[22]ISNI.FAQ[EB/OL]. [2017-03-15].http://www.isni.org/content/faq.
[23]Data Citation Synthesis Group. Joint declaration of datacitation principles-final[EB/OL].[2017-03-15].https://www.force11.org/group/joint-declaration-data-citation-principles-final.
[24]ALTMAN M,CROSAS M.The evolution of data citation:from principles to implementation[J].IAssist Quarterly,2013,37(1/4): 62-70.
[25]ESIP.Endorsing the joint declaration of data citation principles[EB/OL].[2017-03-15].http://wiki.esipfed.org/index.php/Endorsing_the_Joint_Declaration_of_Data_Citation_Principles.
[26]Purdue Online Writing Lab.APA formatting and style guide[EB/OL].[2017-03-15].https://owl.english.purdue.edu/owl/resource/560/1/.
[27]MSU Libraries.How to cite data:general info[EB/OL].[2017-03-15].http://libguides.lib.msu.edu/citedata.
Analysis of Content of Scientific Data Citation Standards
DI HongYang, GENG Qian, HUANG GuoBin, QU YaJie
(School of Government, Beijing Normal University, Beijing 100875, China)
Taking data citation standards proposed by scientific data organizations as the object, the study analyzed the content characteristics of scientific data citation standards, from the aspects of citation units, citation elements, citation styles, and identifier application. It is found that most current data citation standards endorse the joint declaration of data citation principles, and are influenced by common citation styles, but different in citation units, citation elements and citation styles.
Scientific Data; Citation; Standards
G358
10.3772/j.issn.1673-2286.2017.06.002
邸弘陽(yáng),男,1991年生,碩士研究生,研究方向:信息資源管理,E-mail:dhy20100915@126.com。
耿騫,男,1965年生,博士,教授,研究方向:政府信息管理、知識(shí)組織,E-mail:gengqian@bnu.edu.cn。
黃國(guó)彬,男,1979年生,博士,副教授,碩士生導(dǎo)師,研究方向:信息法學(xué)、信息分析,E-mail:huanggb@bnu.edu.cn。
屈亞杰,女,1991年生,碩士研究生,研究方向:科學(xué)數(shù)據(jù)管理,E-mail:819468068@qq.com。
2017-04-13)
* 本研究得到國(guó)家社會(huì)科學(xué)基金項(xiàng)目“云計(jì)算環(huán)境下圖書(shū)館信息資源安全政策法律研究”(編號(hào):11CTQ004)資助。