摘 要 論文選取英國10家具有代表性的圖書館為調(diào)查對象,通過網(wǎng)絡(luò)調(diào)研法,在政策性文件、數(shù)據(jù)管理計(jì)劃、數(shù)據(jù)存儲(chǔ)與備份、數(shù)據(jù)共享、數(shù)據(jù)組織教育培訓(xùn)等方面進(jìn)行比較分析。我國圖書館界應(yīng)學(xué)習(xí)其在科研數(shù)據(jù)管理方面的做法,明確圖書館及各部門在科研數(shù)據(jù)管理中的角色和責(zé)任,加強(qiáng)相關(guān)基礎(chǔ)設(shè)施建設(shè),推動(dòng)圖書館和科研機(jī)構(gòu)聯(lián)合制定科研數(shù)據(jù)管理共享平臺(tái),加強(qiáng)宣傳教育推廣,使科研數(shù)據(jù)管理服務(wù)在各科研項(xiàng)目中得以普及和實(shí)施。
關(guān)鍵詞 英國 圖書館 科研數(shù)據(jù)管理 數(shù)據(jù)管理計(jì)劃 數(shù)據(jù)共享
分類號(hào) G252.7
DOI 10.16810/j.cnki.1672-514X.2020.11.013
Investigation and Analysis of Scientific Research Data Management Services in British Libraries
Wang Youzhuan
Abstract Ten representative libraries in the United Kingdom are selected as the research objects in this paper. Through the network research method, the policy documents, data management plan, data storage and backup, data sharing, data organization, education and training are compared and analyzed. The library field in China should learn from its practice in scientific research data management, clarify the roles and responsibilities of libraries and departments in scientific research data management, strengthen the construction of relevant infrastructure, promote the joint development of scientific research data management and sharing platform between libraries and scientific research institutions, and strengthen publicity, education and promotion, so as to make scientific research data management service in various scientific research projects popularized and implemented.
Keywords The United Kingdom. Library. Research data management. Data management plan. Data sharing.
0 引言
科研數(shù)據(jù)管理是指機(jī)構(gòu)或組織為了避免數(shù)據(jù)丟失、驗(yàn)證科研成果、提升科研成果的曝光度和影響力、實(shí)現(xiàn)科研數(shù)據(jù)共享、提高科研效率等目的,對科研數(shù)據(jù)進(jìn)行計(jì)劃、組織、分析、存儲(chǔ)、獲取、分享、再利用的一系列活動(dòng) [1]。英國是科研數(shù)據(jù)管理的先行者,其政府部門和相關(guān)機(jī)構(gòu)對科研數(shù)據(jù)管理與數(shù)據(jù)共享非常重視,發(fā)布了若干科研數(shù)據(jù)管理辦法及其計(jì)劃,在科研數(shù)據(jù)管理和數(shù)據(jù)共享等服務(wù)方面取得了不少實(shí)踐經(jīng)驗(yàn),例如英國研究理事會(huì)(RCUK)發(fā)布《RCUK數(shù)據(jù)政策共同原則》,明確規(guī)定了數(shù)據(jù)管理的使用政策,在鼓勵(lì)科研人員完成科研項(xiàng)目后及時(shí)公開科研數(shù)據(jù)[2]方面促進(jìn)了高質(zhì)量研究和創(chuàng)新。英國研究理事會(huì)下設(shè)的工程和物理科學(xué)研究理事會(huì)(EPSRC)著重對研究機(jī)構(gòu)提出了數(shù)據(jù)共享責(zé)任,要求它們在全部數(shù)據(jù)生命周期上至少提供十年的數(shù)據(jù)管理服務(wù)[3]。圖書館作為數(shù)據(jù)管理服務(wù)提供方,具有豐富的文獻(xiàn)資源和管理經(jīng)驗(yàn),在科研數(shù)據(jù)管理服務(wù)中發(fā)揮著重要作用。英國圖書館開展科研數(shù)據(jù)管理服務(wù)的時(shí)間較早,服務(wù)相對成熟,內(nèi)容也較豐富。因此,本文選取英國10家具有代表性的圖書館為調(diào)查對象,其中9家為研究型大學(xué)圖書館,1家為專業(yè)圖書館。通過網(wǎng)絡(luò)調(diào)研法,在政策性文件、數(shù)據(jù)管理計(jì)劃、數(shù)據(jù)存儲(chǔ)與備份、數(shù)據(jù)共享、數(shù)據(jù)組織、數(shù)據(jù)引用和教育培訓(xùn)等7個(gè)方面進(jìn)行比較分析,梳理英國圖書館在科研數(shù)據(jù)管理方面的經(jīng)驗(yàn),以期為我國圖書館開展科研數(shù)據(jù)管理服務(wù)提供借鑒和啟示。
1 英國圖書館科研數(shù)據(jù)管理政策及其計(jì)劃
1.1 政策性文件
科研數(shù)據(jù)管理政策性文件是圖書館開展科研數(shù)據(jù)管理的基礎(chǔ)和保證。英國的科研資助機(jī)構(gòu)大都制定了科研數(shù)據(jù)管理政策,要求被資助的研究者更好地管理科研數(shù)據(jù),從而推動(dòng)了英國圖書館對科研數(shù)據(jù)管理政策的制定[4]。
英國圖書館近幾年對科研數(shù)據(jù)管理的重視程度越來越高。10家圖書館中,除大英圖書館參照資助機(jī)構(gòu)的科研數(shù)據(jù)管理政策,布里斯托大學(xué)圖書館和華威大學(xué)圖書館未表明外,其余7所高校圖書館均發(fā)布了本??蒲袛?shù)據(jù)管理政策,見表1。從政策內(nèi)容來看,除了政策頒布的背景、目的外,都有一項(xiàng)共性內(nèi)容,就是對各方的職責(zé)進(jìn)行了詳細(xì)的規(guī)定。職責(zé)涉及數(shù)據(jù)收集、數(shù)據(jù)管理、數(shù)據(jù)保存、數(shù)據(jù)保護(hù)、信息安全、數(shù)據(jù)共享等方面。就政策發(fā)布時(shí)間和版本更新情況來看,除了愛丁堡大學(xué)圖書館一直延用2011年發(fā)布的政策外,其他6所圖書館均采用了更新版。其中,倫敦大學(xué)圖書館和牛津大學(xué)圖書館現(xiàn)用版本更新于2018年12月,倫敦帝國理工學(xué)院、劍橋大學(xué)圖書館、曼徹斯特大學(xué)圖書館和倫敦國王學(xué)院更新于2019年。
除了科研數(shù)據(jù)管理政策外,一些圖書館還發(fā)布了與科研數(shù)據(jù)相關(guān)配套輔助政策,如牛津大學(xué)圖書館將新版科研數(shù)據(jù)管理政策改名為《數(shù)據(jù)支持科研成果管理政策》,曼徹斯特大學(xué)發(fā)布了《曼徹斯特大學(xué)檔案管理政策》 《曼徹斯特大學(xué)數(shù)據(jù)保護(hù)政策》《曼徹斯特大學(xué)知識(shí)產(chǎn)權(quán)政策》等。
1.2 科研數(shù)據(jù)管理計(jì)劃
數(shù)據(jù)管理計(jì)劃(DMP)概述了研究項(xiàng)目在研究期間和項(xiàng)目完成后將如何管理數(shù)據(jù)。制定DMP具有以下好處:(1)節(jié)省時(shí)間和資源;(2)可以更輕松地查找和理解數(shù)據(jù);(3)有助于避免或管理風(fēng)險(xiǎn)(例如數(shù)據(jù)丟失,意外或惡意泄露敏感數(shù)據(jù));(4)確定需要提前計(jì)劃的任務(wù)和職責(zé)(例如管理道德和法律義務(wù));(5)預(yù)先確定進(jìn)行數(shù)據(jù)管理活動(dòng)所需的額外成本和資源。在英國,越來越多的資助機(jī)構(gòu)要求其資助者在投標(biāo)準(zhǔn)備階段和資金獲得后制定和維護(hù)DMP,也可稱為“數(shù)據(jù)共享計(jì)劃”(NIH)或“技術(shù)計(jì)劃”(AHRC)。
調(diào)查的10家圖書館均鼓勵(lì)科研人員在項(xiàng)目開始到項(xiàng)目結(jié)束時(shí)編寫DMP,見表2。其中,倫敦大學(xué)圖書館、牛津大學(xué)圖書館、曼徹斯特大學(xué)圖書館、布里斯托大學(xué)圖書館和華威大學(xué)圖書館的DMP編寫以英國數(shù)據(jù)監(jiān)管中心(DCC)創(chuàng)建的免費(fèi)工具DMP online為主,編寫內(nèi)容在DCC提供的清單中,包括基本信息、數(shù)據(jù)收集、文檔和元數(shù)據(jù)、道德與法律合規(guī)、數(shù)據(jù)保存與備份、數(shù)據(jù)選擇與保護(hù)、數(shù)據(jù)共享、責(zé)任與資源等。大英圖書館根據(jù)資助機(jī)構(gòu)提供的模版來編寫數(shù)據(jù)管理計(jì)劃。倫敦帝國理工學(xué)院圖書館依據(jù)資助機(jī)構(gòu)的模版,若資助機(jī)構(gòu)未規(guī)定,則用圖書館提供的通用模版(通常包含數(shù)據(jù)類型、數(shù)據(jù)創(chuàng)建、數(shù)據(jù)保存、數(shù)據(jù)共享、數(shù)據(jù)安全等)。劍橋大學(xué)圖書館采用DMP online工具或本圖書館提供的模版。愛丁堡大學(xué)圖書館和倫敦國王學(xué)院采用DMP online工具或資助機(jī)構(gòu)提供的模板。由于DMP在科研項(xiàng)目的實(shí)施過程中非常重要,應(yīng)根據(jù)項(xiàng)目而作出相應(yīng)調(diào)整,因此,一些圖書館還要求定期檢查DMP,并根據(jù)需要進(jìn)行修改或更新。
2 英國圖書館數(shù)據(jù)管理內(nèi)容及其服務(wù)
2.1 數(shù)據(jù)存儲(chǔ)與備份
數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)備份都是數(shù)據(jù)保存的方式,數(shù)據(jù)備份用于應(yīng)對數(shù)據(jù)丟失、損壞等問題,而數(shù)據(jù)存儲(chǔ)用于解決數(shù)據(jù)存放和讀取問題。選擇存儲(chǔ)時(shí),應(yīng)考慮備份數(shù)據(jù)的位置、時(shí)間和次數(shù),數(shù)據(jù)安全性和訪問控制,還要考慮是否需要在項(xiàng)目結(jié)束時(shí)存檔數(shù)據(jù)。
10家圖書館中,除了華威大學(xué)圖書館未提供數(shù)據(jù)存儲(chǔ)和備份服務(wù)外,其他9家圖書館均提供了相關(guān)服務(wù),見表3。其中,倫敦大學(xué)圖書館、牛津大學(xué)圖書館、曼徹斯特大學(xué)圖書館、倫敦國王學(xué)院圖書館和布里斯托大學(xué)圖書館針對不同類型的數(shù)據(jù)提供了兩項(xiàng)以上的數(shù)據(jù)存儲(chǔ)服務(wù)。不同項(xiàng)目的科研人員可根據(jù)數(shù)據(jù)本身需求,選擇適合的數(shù)據(jù)存儲(chǔ)服務(wù)。倫敦大學(xué)圖書館、倫敦帝國理工學(xué)院、劍橋大學(xué)圖書館和布里斯托大學(xué)圖書館專門提供長期數(shù)據(jù)存儲(chǔ)服務(wù),存儲(chǔ)年限有10年以上和20年以上。不同的存儲(chǔ)服務(wù)提供的免費(fèi)數(shù)據(jù)存儲(chǔ)容量不同。如布里斯托大學(xué)圖書館提供的科研數(shù)據(jù)庫服務(wù),目前對數(shù)據(jù)存儲(chǔ)容量不設(shè)限制;牛津大學(xué)圖書館的HFS(分層文件服務(wù)器)備份服務(wù)可接受最高50TB的容量;倫敦國王學(xué)院圖書館的SharePoint Online服務(wù)提供25TB的存儲(chǔ)容量,但其Personal File服務(wù)僅提供2GB的存儲(chǔ)容量。
2.2 數(shù)據(jù)共享
共享數(shù)據(jù)可以使科研人員不必重新創(chuàng)建和收集相同的數(shù)據(jù),就能開辟新的研究和查詢渠道。數(shù)據(jù)共享的好處包括:(1)防止數(shù)據(jù)重復(fù);(2)減少數(shù)據(jù)丟失的風(fēng)險(xiǎn);(3)加強(qiáng)對已發(fā)表研究的審查;(4)協(xié)作研究和數(shù)據(jù)重用;(5)提高科研數(shù)據(jù)和相關(guān)出版物的知名度。因此許多主要的研究資助者和學(xué)術(shù)出版商呼吁共享科研數(shù)據(jù),并以“數(shù)據(jù)訪問聲明”的形式發(fā)布訪問信息。例如,由英國研究與創(chuàng)新局(UKRI)資助的科研人員將在“默認(rèn)情況下”提供科研數(shù)據(jù),而英國國家醫(yī)療服務(wù)體系(NHS)道德審查程序則鼓勵(lì)科研人員“確定樣品或數(shù)據(jù)是否可用于現(xiàn)有的生物庫或數(shù)據(jù)共享庫”。
調(diào)查的10家圖書館均表明了數(shù)據(jù)共享的可能,并對在何時(shí)共享、如何共享作了相關(guān)說明。凡是建立了存儲(chǔ)數(shù)據(jù)庫或是提供存儲(chǔ)服務(wù)的圖書館,均可通過存儲(chǔ)服務(wù)提供數(shù)據(jù)共享服務(wù)。如倫敦大學(xué)圖書館在項(xiàng)目完成后,要求科研人員根據(jù)資助機(jī)構(gòu)的要求確定項(xiàng)目數(shù)據(jù)的存儲(chǔ)位置、開放程度和共享的時(shí)間范圍。大英圖書館制定了《2015—2018年館藏元數(shù)據(jù)戰(zhàn)略》,強(qiáng)調(diào)通過館藏元數(shù)據(jù)的對外開放讓館藏資源與社會(huì)信息資源相關(guān)聯(lián),形成社會(huì)廣泛認(rèn)可的二次利用數(shù)據(jù)[12]。牛津大學(xué)圖書館建立了機(jī)構(gòu)知識(shí)庫ORA-Data,用于數(shù)據(jù)保存與共享。愛丁堡大學(xué)的研究人員可以使用其自建的數(shù)據(jù)存儲(chǔ)庫DataShare上傳、共享和許可自己的數(shù)據(jù)資源,以供他人在線查找和重用。倫敦帝國理工學(xué)院要求科研人員確??晒蚕淼目蒲袛?shù)據(jù)在出版后的10年內(nèi)保持公開。而未提供數(shù)據(jù)存儲(chǔ)服務(wù)的華威大學(xué)圖書館,也明確表示科研人員需根據(jù)資助機(jī)構(gòu)的要求共享科研數(shù)據(jù)。
2.3 數(shù)據(jù)組織
數(shù)據(jù)組織包含對數(shù)據(jù)文件的構(gòu)建和相關(guān)規(guī)則標(biāo)準(zhǔn)的描述,如文件組織規(guī)則、文件命名規(guī)則、元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)格式要求等。在創(chuàng)建、收集和處理數(shù)據(jù)的時(shí)候,如果不能很好地組織數(shù)據(jù),則會(huì)出現(xiàn)數(shù)據(jù)混亂、容易丟失等風(fēng)險(xiǎn)。因此,圖書館會(huì)要求研究人員在文件/文件夾命名、文件格式以及文檔和元數(shù)據(jù)等方面遵循一定的規(guī)則。
調(diào)查的10家圖書館中,牛津大學(xué)圖書館、劍橋大學(xué)圖書館、曼徹斯特大學(xué)圖書館、倫敦國王學(xué)院圖書館和華威大學(xué)圖書館對數(shù)據(jù)組織提供了相關(guān)建議,涉及文件/文件夾命名、文件格式、文件夾結(jié)構(gòu)、文檔和元數(shù)據(jù)、參考文獻(xiàn)管理、電子郵件整理、版本控制等內(nèi)容。
在數(shù)據(jù)組織的具體建議上,可歸納為:(1)文件/文件夾命名:文件夾命名應(yīng)簡單明了,可在不打開文件的情況下知道文件的內(nèi)容;項(xiàng)目組成員應(yīng)該在文件命名上保持一致性,方便文件查找;文件命名時(shí)可按日期、作者或者主題等規(guī)則進(jìn)行,方便排序;建立文件訪問系統(tǒng),確保可以備份數(shù)據(jù)和避免數(shù)據(jù)重復(fù);將已完成工作的文件夾和正在進(jìn)行工作的文件夾分開,以免混淆;定期將不再使用的文件移動(dòng)到其他文件夾或位置;定期或在項(xiàng)目結(jié)束時(shí)評(píng)價(jià)文件的重要性,刪除不必要的文件等。(2)文件格式:選擇適當(dāng)?shù)奈募袷剑?biāo)準(zhǔn)形式、未加密、未壓縮、適用于提取和查看的數(shù)據(jù)、易于使用元數(shù)據(jù)進(jìn)行注釋的數(shù)據(jù)等),確保科研數(shù)據(jù)可用和可訪問。(3)文件夾結(jié)構(gòu):主推使用分層文件夾結(jié)構(gòu),并在文件的深度和廣度之間取得平衡,即不要使文件夾的類別太大,不必單擊很多文件夾來查找文件。英國數(shù)據(jù)服務(wù)公司建議將文件夾級(jí)別限制為三到四個(gè),并且每個(gè)列表中的項(xiàng)目不要超過十個(gè);為每個(gè)文件分配一個(gè)或多個(gè)標(biāo)簽,可更容易區(qū)分重疊類別,并可以同時(shí)以多種方式對文件進(jìn)行分類;不定時(shí)重新評(píng)估文件夾或標(biāo)簽結(jié)構(gòu),以免文件混亂。(4)文檔和元數(shù)據(jù):在研究項(xiàng)目開始時(shí)記錄數(shù)據(jù),在項(xiàng)目進(jìn)行過程中繼續(xù)添加信息,在DMP中包含文檔編制過程;通過嵌入式文檔、支持文檔等方式將文檔添加到數(shù)據(jù)中;采用開源ISA元數(shù)據(jù)跟蹤工具提供實(shí)驗(yàn)元數(shù)據(jù)的豐富描述,從而使所得數(shù)據(jù)可發(fā)現(xiàn)和重用。(5)參考文獻(xiàn)管理:使用參考文獻(xiàn)管理軟件,在研究中存儲(chǔ)使用的所有論文、書籍和其他資源的詳細(xì)信息,并自動(dòng)生成書面作品中的引用。(6)電子郵件整理:刪除不需要的電子郵件;定期(最好是每天)從收件箱和已發(fā)送郵件中刪除所有瑣碎或過時(shí)的郵件;使用文件夾存儲(chǔ)郵件;按主題、活動(dòng)或項(xiàng)目建立結(jié)構(gòu)化的文件目錄。(7)版本控制:針對同一文件修改的不同版本,可在文件命名時(shí)增加版本號(hào)進(jìn)行區(qū)別,如v01、v02等。
4 結(jié)語
科技創(chuàng)新越來越依賴于大量、系統(tǒng)、高可信度的科學(xué)數(shù)據(jù),我國在科學(xué)數(shù)據(jù)開發(fā)利用、開放共享和安全保護(hù)等方面還有很大改進(jìn)空間。我們應(yīng)吸取國外從政府部門到各機(jī)構(gòu)在科研數(shù)據(jù)管理方面的做法,明確圖書館及各部門在科研數(shù)據(jù)管理中的角色和責(zé)任,加強(qiáng)相關(guān)基礎(chǔ)設(shè)施的建設(shè),推動(dòng)圖書館和科研機(jī)構(gòu)聯(lián)合制定科研數(shù)據(jù)管理共享平臺(tái),從各個(gè)層面提升科研數(shù)據(jù)管理意識(shí)、加強(qiáng)宣傳教育推廣,使科研數(shù)據(jù)管理服務(wù)在各科研項(xiàng)目中得以普及和實(shí)施。
參考文獻(xiàn):
韓金鳳.加拿大高校圖書館科研數(shù)據(jù)管理服務(wù)調(diào)研及啟示[J].國家圖書館學(xué)刊,2017,26(1):38-46.
UK research and innovation. common principles on data policy[EB/OL].(2017-08-10)[2019-10-08]. https://www.ukri.org/funding/information-for-award-holders/data-policy/common-principles-on-data-policy/.
Clarifications of EPSRC expectations on research data management[EB/OL].(2014-10-09)[2019-10-10].https://epsrc.ukri.org/about/standards/researchdata/expectations/.
HIGMAN R, PINFIELD S. Research data management and openness: the role of data sharing in developing institutional policies and practices[J]. Program,2015,49(4):364-381.
UCL research information and IT services group(RIISG)[EB/OL].(2018-12-12)[2019-10-13]. https://www.ucl.ac.uk/isd/sites/isd/files/uclresearchdatapolicy_2018.pdf.
Policy on the management of data supporting research outputs[EB/OL].(2018-12-08)[2019-11-13].http://researchdata.ox.ac.uk/wp-content/uploads/sites/126/2018/12/Policy-on-the-Management-of-Data-Supporting-Research-Outputs.pdf.
Research data management policy[EB/OL].(2019-12-15)[2019-12-17].https://www.imperial.ac.uk/media/imperial-college/research-and-innovation/research-office/public/Imperial-College-RDM-Policy.pdf.
University of cambridge research data management policy framework[EB/OL]. (2019-12-04)[2019-12-18].https://www.data.cam.ac.uk/university-policy.
Research data management policy[EB/OL].(2019-02-01)[2019-12-19]. http://documents.manchester.ac.uk/display.aspx?DocID=33802.
Research data management policy[EB/OL].(2011-05-16)[2019-12-20]. https://www.ed.ac.uk/information-services/about/policies-and-regulations/research-data-policy.
Research data management policy[EB/OL].(2019-05-09)[2019-12-21]. https://www.kcl.ac.uk/governancezone/assets/research/research-data-management-policy.pdf.
侯茹.大英圖書館館藏元數(shù)據(jù)戰(zhàn)略報(bào)告研究[J].圖書館學(xué)研究,2016(5):75-79.
李丹丹,吳振新.研究數(shù)據(jù)引用研究[J].圖書館雜志,2013,32(5):65-71.
項(xiàng)英,賴劍菲,丁寧.高校圖書館科學(xué)數(shù)據(jù)管理服務(wù)實(shí)踐探索:以武漢大學(xué)社會(huì)科學(xué)數(shù)據(jù)管理為例[J].情報(bào)理論與實(shí)踐,2013,36(12):89-93.
張計(jì)龍,殷沈琴,張用,等.社會(huì)科學(xué)數(shù)據(jù)的共享與服務(wù):以復(fù)旦大學(xué)社會(huì)科學(xué)數(shù)據(jù)共享平臺(tái)為例[J].大學(xué)圖書館學(xué)報(bào),2015,33(01):74-79.
邢文明. 我國科研數(shù)據(jù)管理與共享政策保障研究[D].武漢:武漢大學(xué),2014.
王友轉(zhuǎn) 廣東省科技圖書館(廣東省科技信息與發(fā)展戰(zhàn)略研究所)館員。 廣東廣州,510070。
(收稿日期:2020-04-29 編校:陳安琪,劉 明)
*本文系廣東省科學(xué)院建設(shè)國內(nèi)一流研究機(jī)構(gòu)行動(dòng)專項(xiàng)資金項(xiàng)目“圖書館科研數(shù)據(jù)管理需求與服務(wù)模式研究”(項(xiàng)目編號(hào):2019GDASYL-0105080)、廣東省省級(jí)科技計(jì)劃項(xiàng)目“粵港澳大灣區(qū)城市群創(chuàng)新要素流動(dòng)、集聚及其配置優(yōu)化策略研究——基于空間測度、社會(huì)網(wǎng)絡(luò)與政策分析方法”(項(xiàng)目編號(hào):2019A101002039)的研究成果。