龐淑杰
(吉林大學(xué),長(zhǎng)春 130012)
?
國(guó)外圖書(shū)館在數(shù)據(jù)共享時(shí)代的角色分析
龐淑杰
(吉林大學(xué),長(zhǎng)春 130012)
文章對(duì)科研數(shù)據(jù)共享的意義、發(fā)展趨勢(shì)及其作用進(jìn)行了剖析,認(rèn)為科研數(shù)據(jù)通過(guò)共享公有、自由訪問(wèn),可以被同行同步利用或跨領(lǐng)域使用,從而利用科學(xué)交叉地帶出成果。因此,圖書(shū)館應(yīng)承擔(dān)起研究數(shù)據(jù)綜合管理的歷史責(zé)任,圖書(shū)館員在知識(shí)結(jié)構(gòu)、專(zhuān)業(yè)能力方面應(yīng)進(jìn)行相應(yīng)的提升。
數(shù)據(jù)共享;數(shù)據(jù)管理;新角色;科研數(shù)據(jù);數(shù)據(jù)公開(kāi);數(shù)據(jù)保存;國(guó)外圖書(shū)館
2013年5月,GRC(Global Research Council,全球科研委員會(huì) )制定了一項(xiàng)“數(shù)據(jù)公開(kāi)訪問(wèn)推進(jìn)計(jì)劃”,對(duì)相關(guān)政策的制定發(fā)揮了很大影響。2013年6月G8(八國(guó)首腦峰會(huì))簽署了“數(shù)據(jù)公開(kāi)訪問(wèn)推進(jìn)憲章”;同時(shí),在G8的科技部長(zhǎng)會(huì)議上達(dá)成了實(shí)施“公開(kāi)、共享科技數(shù)據(jù)”的共識(shí)。2015年年末,OECD(經(jīng)濟(jì)合作與發(fā)展組織)對(duì)“數(shù)據(jù)公開(kāi)訪問(wèn)事業(yè)”進(jìn)行調(diào)查后發(fā)布了新版報(bào)告(2012年發(fā)布初版報(bào)告),在附錄里按照國(guó)別對(duì)全球主要國(guó)家出臺(tái)的“數(shù)據(jù)公開(kāi)訪問(wèn)政策”作了總結(jié)歸納:截至2015年4月,已經(jīng)有近60個(gè)國(guó)家頒布了推進(jìn)數(shù)據(jù)公開(kāi)訪問(wèn)的政策。 “道客巴巴(ROARMAP)”提供的資料——《OECD STI Outlook》(The OECD Science, Technology and Industry Outlook,經(jīng)濟(jì)合作與發(fā)展組織的科學(xué)、技術(shù)和產(chǎn)業(yè)展望 )顯示,已經(jīng)有20多個(gè)國(guó)家將“論文或者科研數(shù)據(jù)公開(kāi)訪問(wèn)”上升為國(guó)家層次的科技戰(zhàn)略。
早在2011年,歐洲就已經(jīng)開(kāi)始了被稱為“EUDAT”的“共筑科研數(shù)據(jù)共享基礎(chǔ)計(jì)劃”。2015年,該計(jì)劃以“FUAT2000”的名義,再次啟動(dòng)。2015年8月, PASTEUR4OA計(jì)劃(Open Access Policy Alignment Strategies for European Union Research)為促進(jìn)歐盟科研事業(yè)而實(shí)施“對(duì)數(shù)據(jù)公開(kāi)政策”的戰(zhàn)略調(diào)整發(fā)布了一份報(bào)告,名為《評(píng)估歐洲“實(shí)施數(shù)據(jù)公開(kāi)存取政策”的準(zhǔn)備情況》(Assessing Readiness for Open Access Policy Implementation across Europe),對(duì)各國(guó)的相關(guān)情況作了介紹與總結(jié)。一直以來(lái),在天文學(xué)、地球科學(xué)、基因組計(jì)劃、粒子物理學(xué)等領(lǐng)域收集獲取各種研究數(shù)據(jù)的成本都非常高。所以,世界各國(guó)的科研工作者都致力于數(shù)據(jù)的共享(數(shù)據(jù)公開(kāi)訪問(wèn)),努力解決科研領(lǐng)域所面臨的問(wèn)題,并且取得了顯著成果。近年來(lái),由于科研成果可信性的提高以及資源公開(kāi)訪問(wèn)原則的確立,推動(dòng)了數(shù)據(jù)共享事業(yè)的大規(guī)模拓展,而且,今后科研資助機(jī)構(gòu)將數(shù)據(jù)公開(kāi)變?yōu)楸毁Y助者應(yīng)盡義務(wù)。在上述背景下,歐美學(xué)術(shù)型圖書(shū)館推進(jìn)的科研數(shù)據(jù)共有共享進(jìn)程也成績(jī)斐然。[1]
2.1 提高科研的效率與可信度
數(shù)據(jù)共享(Data Sharing)的成功范例,應(yīng)該是破解人類(lèi)全部基因排序的人類(lèi)基因組計(jì)劃。根據(jù)百慕大原則,世界各國(guó)所有的科研人員應(yīng)該在24小時(shí)之內(nèi)將自己破解的基因序列向公眾領(lǐng)域公開(kāi)。這一目標(biāo)在計(jì)劃開(kāi)始的第13年就已經(jīng)實(shí)現(xiàn),比最初的預(yù)定提前了2年。這以后,在生命科學(xué)領(lǐng)域,數(shù)據(jù)共享與二次利用方興未艾,并且不斷產(chǎn)生新的成果。[2]
篡改研究數(shù)據(jù)進(jìn)行論文造假,是國(guó)際科研領(lǐng)域積習(xí)難改的老問(wèn)題。業(yè)界普遍期待的是,公開(kāi)研究數(shù)據(jù),使實(shí)驗(yàn)可以重復(fù),使成果能夠重現(xiàn),以提高科研項(xiàng)目的透明度。特別是醫(yī)學(xué)臨床試驗(yàn)數(shù)據(jù),因涉及個(gè)人隱私與企業(yè)商業(yè)利益的保護(hù)問(wèn)題,普遍被視為攻克數(shù)據(jù)公開(kāi)的難關(guān)。不過(guò),情況也在不斷變化。2013年11月,日本東京大學(xué)醫(yī)學(xué)部附屬醫(yī)院的醫(yī)學(xué)信息網(wǎng)絡(luò)研究中心,開(kāi)通運(yùn)行了可供所有科研人員利用的病歷數(shù)據(jù)官方網(wǎng)站“LIMINI-ICDR”。
2.2 科研數(shù)據(jù)公開(kāi)成為科研機(jī)構(gòu)的義務(wù)
資源公開(kāi)訪問(wèn)的大趨勢(shì),對(duì)數(shù)據(jù)共享事業(yè)的發(fā)展產(chǎn)生了影響。經(jīng)濟(jì)開(kāi)發(fā)合作組織(IECD)、美國(guó)白宮科技政策局(OSTP)、歐洲議會(huì)等,都倡導(dǎo)將研究數(shù)據(jù)像科研論文等出版物那樣向公眾公開(kāi),以使政府資金資助的研究成果能為廣大公眾所利用。[3]之后,有越來(lái)越多的科研資助機(jī)構(gòu)對(duì)自然人與科研單位提出要求,規(guī)定在申請(qǐng)資助資金時(shí),相關(guān)人員、科研機(jī)構(gòu)有義務(wù)提出“數(shù)據(jù)管理計(jì)劃”,就“如何保存所獲得的數(shù)據(jù),如何共有共享”等做出承諾。這也為圖書(shū)館扶持?jǐn)?shù)據(jù)共享事業(yè)提供了契機(jī)。比如,歐美一些大學(xué)圖書(shū)館負(fù)責(zé)健康科學(xué)領(lǐng)域的學(xué)科館員被賦予了新的任務(wù),即在科研資金的申領(lǐng)過(guò)程中提供專(zhuān)業(yè)支持,使申請(qǐng)者的申報(bào)符合資助機(jī)構(gòu)在數(shù)據(jù)管理方面提出的條件;幫助制定數(shù)據(jù)管理計(jì)劃,為計(jì)劃的實(shí)施提供幫助。類(lèi)似的事情還有不少。
在日本,尚沒(méi)有將數(shù)據(jù)公開(kāi)作為科研機(jī)構(gòu)的義務(wù)來(lái)要求,但一部分研究項(xiàng)目是接受過(guò)文化科學(xué)部、福祉勞動(dòng)部,科學(xué)技術(shù)振興機(jī)構(gòu)資助的。對(duì)這類(lèi)研究,學(xué)術(shù)界以往也對(duì)其研究數(shù)據(jù)進(jìn)行過(guò)公開(kāi)征集,供給需要者免費(fèi)使用。現(xiàn)在,社會(huì)各界正在大力呼吁科研機(jī)構(gòu)提供合作,將工作向前推進(jìn)一步,徹底實(shí)現(xiàn)數(shù)據(jù)共享。這樣也有助于提高科研效率,節(jié)約資助金額。
2.3 跨學(xué)科領(lǐng)域?qū)?shù)據(jù)加以利用、引用,并評(píng)估影響力
跨學(xué)科領(lǐng)域推廣利用研究數(shù)據(jù)以產(chǎn)生新的研究成果,這種旨在推動(dòng)交叉學(xué)科研究的國(guó)際性浪潮正在蓬勃展開(kāi)。已經(jīng)有57個(gè)成員國(guó)的“研究數(shù)據(jù)同盟” (Research Data Alliance)正在倡導(dǎo)“無(wú)障礙數(shù)據(jù)共享”,并努力構(gòu)建無(wú)障礙數(shù)據(jù)的技術(shù)標(biāo)準(zhǔn)(技術(shù)層面的基礎(chǔ)條件)及通用共享的原則(社會(huì)意義層面的基礎(chǔ)條件)。[4]大英圖書(shū)館“數(shù)據(jù)引用”(Data Cite)與“研究數(shù)據(jù)同盟”合作,為收集到的數(shù)據(jù)附上永久的DOI(數(shù)字對(duì)象標(biāo)識(shí)符),以便于測(cè)定數(shù)據(jù)被發(fā)現(xiàn)、引用、追蹤的頻率及其影響力的強(qiáng)弱。
湯姆森路透社在2012年11月公開(kāi)上線了“數(shù)據(jù)引用索引”(Data Citation Index),提供收錄于Web of Science(當(dāng)時(shí)公開(kāi)的名稱是Web of Knowledge)中的論文與各種數(shù)據(jù)的鏈接以及引用情況的統(tǒng)計(jì)。調(diào)查表明,研究數(shù)據(jù)的公開(kāi),使論文被引用的次數(shù)大為增加。2013年1月開(kāi)始,美國(guó)科學(xué)財(cái)團(tuán)(NSF)對(duì)援助資金的資助原則進(jìn)行了修改,其中有關(guān)申請(qǐng)所要求的業(yè)績(jī)條件要素,原來(lái)是“出版物”(publication),現(xiàn)在改稱“產(chǎn)出成果”(products),研究性數(shù)據(jù)被提升至與論文同等的地位。2014年5月“自然出版集團(tuán)”(Nature Publishing Group)出版發(fā)行可公開(kāi)訪問(wèn)的電子雜志《科學(xué)數(shù)據(jù)》,該雜志收錄有大量科研數(shù)據(jù)。
打破特定學(xué)科的局限而拓展到多個(gè)領(lǐng)域去利用研究數(shù)據(jù),將數(shù)據(jù)本身視為科學(xué)研究成果而進(jìn)行評(píng)價(jià),這一整套制度正逐步建立與完善。這樣也產(chǎn)生了某種強(qiáng)制性影響,激勵(lì)科研人員走上資源共享的道路,相應(yīng)地,各種類(lèi)型圖書(shū)館必然會(huì)致力于科研數(shù)據(jù)的收集與整理。
3.1 數(shù)據(jù)管理的三要素
隨著科研數(shù)據(jù)共有共享規(guī)模的不斷擴(kuò)大,圖書(shū)館被社會(huì)各界賦予了新的使命,希望其發(fā)揮以往不曾擁有的作用。一項(xiàng)對(duì)1329名美國(guó)科研人員的調(diào)查顯示,能夠做到讓自身獲取的數(shù)據(jù)被其他科研人員方便訪問(wèn)的,只占到被調(diào)查人員總數(shù)的36.2%。為什么大多數(shù)人做不到這點(diǎn)呢?理由有以下幾點(diǎn):沒(méi)有充足的時(shí)間(53.6%),資金緊張(39.6%),找不到數(shù)據(jù)上傳的登錄地址(23.5%)。研究人員愿意公開(kāi)自己的數(shù)據(jù),或者有義務(wù)必須公布數(shù)據(jù),卻不能實(shí)現(xiàn),在這種情況之下,圖書(shū)館就有責(zé)任為學(xué)者提供相應(yīng)的支持。[5]
圖書(shū)館提供的研究數(shù)據(jù)共有共享服務(wù),稱之為 “研究數(shù)據(jù)管理”(Research Data Management,以下簡(jiǎn)稱RDM )。根據(jù)DCC(Digital Curation Centre ,英國(guó)數(shù)據(jù)綜合處理中心)所制定的《RDM構(gòu)建指南》,RDM包括以下要素:(1)確立“公開(kāi)所在科研機(jī)構(gòu)上傳全部科研數(shù)據(jù)的官方網(wǎng)站并提供服務(wù)”的實(shí)施計(jì)劃;(2)為數(shù)據(jù)的長(zhǎng)期保存于公開(kāi)訪問(wèn)網(wǎng)站提供支持;(3)為科研人員提供輔導(dǎo)、培訓(xùn)、進(jìn)修的機(jī)會(huì)。
3.2 制定數(shù)據(jù)對(duì)策與實(shí)施服務(wù)的計(jì)劃
大學(xué)、科研機(jī)關(guān)的RDM服務(wù),從諸如“制定對(duì)策與戰(zhàn)略、核算實(shí)施成本、訂立年度計(jì)劃”等工作開(kāi)始。根據(jù)2012年在英國(guó)進(jìn)行的調(diào)查,制定了正式數(shù)據(jù)管理政策的大學(xué)占高??倲?shù)的30.9%,準(zhǔn)備在2013年制定明確的相關(guān)政策的大學(xué)占43.2%。總的看來(lái),英國(guó)有7成的高校正在致力于數(shù)據(jù)管理政策的制定與實(shí)施。各高校與科研機(jī)構(gòu)的相關(guān)政策被綜合歸納整理為DCC的“英國(guó)科研數(shù)據(jù)政策”( UK Institutional data policies),還有“數(shù)據(jù)研究”(Data Res,由諾斯德克薩斯大學(xué)圖書(shū)館及信息學(xué)院、圖書(shū)館信息資源整理財(cái)團(tuán)聯(lián)合組建運(yùn)行的科技情報(bào)提供組織),出臺(tái)了(美國(guó))“大學(xué)數(shù)據(jù)管理政策”(University Data Management Policies)。
愛(ài)丁堡大學(xué)2011年5月在英國(guó)開(kāi)始制定RDM政策,還制訂了2012年8月至2014年的實(shí)施路線圖,并予以公布。該對(duì)策包括諸如“新提出的科研項(xiàng)目申請(qǐng),必須附有研究數(shù)據(jù)管理計(jì)劃”等10項(xiàng)條款;路線圖中規(guī)定了“數(shù)據(jù)管理計(jì)劃、基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)管理責(zé)任、數(shù)據(jù)管理支持部門(mén)的目標(biāo)”等,并將設(shè)想的成果按0、1、2等三個(gè)等級(jí)階段加以記載。[6]
2013年8月,媒體對(duì)DCC、愛(ài)丁堡大學(xué)進(jìn)行了采訪。相關(guān)負(fù)責(zé)人表示,在制定機(jī)構(gòu)整體的數(shù)據(jù)管理政策、戰(zhàn)略、實(shí)施計(jì)劃之際,圖書(shū)館發(fā)揮了主導(dǎo)作用。另外,來(lái)自學(xué)科領(lǐng)域以及專(zhuān)家學(xué)者尋求支持的需求日益多樣化,圖書(shū)館與需要者的充分溝通就顯得十分必要。
3.3 數(shù)據(jù)管理
圖書(shū)館的第二個(gè)全新角色,就是為了實(shí)現(xiàn)研究數(shù)據(jù)共享而對(duì)科研數(shù)據(jù)實(shí)施管理。數(shù)據(jù)管理的定義有多種,一般是指為了實(shí)現(xiàn)科研數(shù)據(jù)的公開(kāi)訪問(wèn)、二次利用而對(duì)相關(guān)數(shù)據(jù)加以設(shè)計(jì)、選擇、組織、長(zhǎng)期保存等一系列工程的實(shí)施過(guò)程。首先是根據(jù)科研資助機(jī)構(gòu)、學(xué)術(shù)期刊的相關(guān)政策規(guī)定,制定有關(guān)數(shù)據(jù)登陸地址、登陸方法、保存期限等管理計(jì)劃。登陸地址有:基因數(shù)據(jù)庫(kù)(GenBank )等領(lǐng)域的官網(wǎng)、學(xué)術(shù)期刊出版社的服務(wù)器網(wǎng)址、科研資助機(jī)構(gòu)的官網(wǎng),F(xiàn)igshare(一種分享開(kāi)放科研數(shù)據(jù)的模式)平臺(tái)等。
另外,作為制定“數(shù)據(jù)管理計(jì)劃”的輔助工具,有一些公開(kāi)發(fā)表的資料可供參考,包括加利福尼亞大學(xué)數(shù)字信息中心(UC3)的DNPTool、巴斯大學(xué)“全方位360度探索”(Research360)開(kāi)發(fā)的模版、 DCA開(kāi)發(fā)的檢查列表、支助機(jī)構(gòu)一覽表等。
英國(guó)負(fù)責(zé)收集社會(huì)學(xué)、經(jīng)濟(jì)學(xué)領(lǐng)域數(shù)據(jù)的“全英數(shù)據(jù)檔案”(UK Data Archive),對(duì)數(shù)據(jù)綜合處理作了說(shuō)明,將其分為9個(gè)步驟:(1)數(shù)據(jù)傳輸;(2)確定按不同標(biāo)準(zhǔn)處理的各類(lèi)數(shù)據(jù)的數(shù)量;(3)數(shù)據(jù)的處理;(4)數(shù)據(jù)附屬文件的處理;(5)元數(shù)據(jù)的制作;(6)追加用戶信息(指形成閱讀文件;)(7)公開(kāi)數(shù)據(jù)目錄;(8)以下載方式實(shí)行數(shù)據(jù)傳遞;(9)數(shù)據(jù)保存。
為了實(shí)現(xiàn)長(zhǎng)期保存、廣泛訪問(wèn)以及二次開(kāi)發(fā)利用的目的,在進(jìn)行上述第3個(gè)步驟的過(guò)程中,要將數(shù)據(jù)轉(zhuǎn)變?yōu)槟撤N適當(dāng)?shù)男问?;?duì)于第5點(diǎn),需要盡量選擇標(biāo)準(zhǔn)化的框架以備數(shù)據(jù)收割;對(duì)第7點(diǎn)數(shù)據(jù)公開(kāi),要著重實(shí)施標(biāo)注“能夠反映引用評(píng)價(jià)情況”的DOI(數(shù)字對(duì)象標(biāo)識(shí)符),為論文建立原文鏈接,還要注重著作權(quán)所要求的許可、學(xué)術(shù)倫理所規(guī)定的禁忌等。
以上模式的服務(wù)需要以下人員的合作進(jìn)行:主題庫(kù)管理館員、數(shù)據(jù)管理館員、官網(wǎng)運(yùn)行責(zé)任人、IT服務(wù)責(zé)任人、調(diào)查管理負(fù)責(zé)人。[7]
3.4 對(duì)研究人員的培訓(xùn)與支持服務(wù)
圖書(shū)館在RDM中的第三個(gè)使命,就是對(duì)科研人員、研究生提供培訓(xùn)服務(wù)與輔導(dǎo)咨詢。國(guó)外各圖書(shū)館都積極開(kāi)設(shè)相關(guān)的Web網(wǎng)站,組織研究進(jìn)修,提供咨詢服務(wù)。
在RDM網(wǎng)站,可以看到經(jīng)過(guò)整理后發(fā)布的各種內(nèi)容:數(shù)據(jù)管理機(jī)構(gòu)對(duì)相關(guān)政策規(guī)定的闡述;有關(guān)元數(shù)據(jù)著作權(quán)的說(shuō)明;有關(guān)數(shù)據(jù)引用方面的解釋?zhuān)挥嘘P(guān)科研支持機(jī)構(gòu)的政策解釋?zhuān)魂P(guān)于制定“數(shù)據(jù)管理計(jì)劃”的建議;相關(guān)研討會(huì)的各種事宜;培訓(xùn)進(jìn)修活動(dòng)的指南等。
英國(guó)劍橋大學(xué)、美國(guó)麻省理工學(xué)院、美國(guó)加州大學(xué)洛杉磯分校都開(kāi)設(shè)了RDM網(wǎng)頁(yè),就專(zhuān)門(mén)領(lǐng)域話題所做的探討,對(duì)其他大學(xué)的研究人員也多有補(bǔ)益。
圖書(shū)館為科研人員、研究生等參加相關(guān)進(jìn)修而編纂的教材也公開(kāi)發(fā)行?!坝?guó)數(shù)據(jù)檔案”項(xiàng)目就提供了教材,其中就“計(jì)劃制定、數(shù)據(jù)形式、累積存儲(chǔ)”等話題做了充分的論述,包括如何使用PowerPoint(演示文稿制作軟件)制作幻燈片,解說(shuō)者如何熟練地播映演示等,還收有練習(xí)題、測(cè)試題等。
在馬薩諸塞大學(xué)的“新英格蘭協(xié)作數(shù)據(jù)管理課程體系”(New England Collaborative Data Management Curriculum)中,提供了面向健康科技領(lǐng)域的學(xué)生、研究者等教授數(shù)據(jù)管理的7種模型和教材。
美國(guó)明尼蘇達(dá)大學(xué)圖書(shū)館開(kāi)展的數(shù)字管理服務(wù)也是成績(jī)斐然。據(jù)統(tǒng)計(jì),從2010—2013年秋,有47862名讀者訪問(wèn)了該校RDM網(wǎng)站,先后有360名師生參加了專(zhuān)為教職員提供培訓(xùn)的“數(shù)據(jù)管理計(jì)劃”的研究討論。圖書(shū)館還開(kāi)設(shè)了面向研究生的網(wǎng)絡(luò)在線課程“數(shù)據(jù)管理”(不分單元),從2012年秋到2013年春,共進(jìn)行了兩輪課程,總共有58人修完整個(gè)過(guò)程。[8]
另外,根據(jù)一份發(fā)表于2013年以9國(guó)30所大學(xué)為對(duì)象的一份調(diào)查報(bào)告,可以了解到,各國(guó)配備有負(fù)責(zé)數(shù)據(jù)管理的專(zhuān)職館員或招聘的專(zhuān)責(zé)人員的大學(xué)圖書(shū)館,占所有被調(diào)查對(duì)象的56%;為教職員提供相關(guān)培訓(xùn)的大學(xué)占46.7%; 向科研資助經(jīng)費(fèi)申請(qǐng)者提供有關(guān)數(shù)據(jù)管理計(jì)劃的建議與意見(jiàn)的大學(xué)圖書(shū)館,占調(diào)查總數(shù)的63.3%。
經(jīng)過(guò)對(duì)北美國(guó)家圖書(shū)館2011年10月到2012年4月發(fā)布的137條數(shù)據(jù)管理人才招聘啟事所列條件進(jìn)行分析,不難看出,圖書(shū)館所需新型人才要求具備以下一些主要素質(zhì)或條件:(1)與著作版權(quán)擁有機(jī)構(gòu)或自然法人進(jìn)行交流溝通的能力;(2)對(duì)科研數(shù)據(jù)內(nèi)容進(jìn)行綜合處理與保存的能力;(3)對(duì)數(shù)據(jù)進(jìn)行管理(設(shè)計(jì)、甄選與重組)的能力;(4)制定數(shù)據(jù)公開(kāi)項(xiàng)目相關(guān)計(jì)劃的能力;(5)對(duì)數(shù)據(jù)進(jìn)行價(jià)值評(píng)價(jià)的能力;(6)對(duì)數(shù)據(jù)公開(kāi)利用系統(tǒng)(網(wǎng)絡(luò)訪問(wèn)系統(tǒng))進(jìn)行管理維護(hù)的能力。為應(yīng)對(duì)這種需求的新變化,國(guó)外各大學(xué)研究生院圖書(shū)情報(bào)專(zhuān)業(yè)、各類(lèi)信息情報(bào)學(xué)校紛紛開(kāi)設(shè)了與科研數(shù)據(jù)管理相關(guān)的課程或培訓(xùn)項(xiàng)目。例如美國(guó)伊利諾伊大學(xué)的圖書(shū)情報(bào)專(zhuān)業(yè)研究生課程,就設(shè)置了數(shù)據(jù)綜合處理課程,其中除了元數(shù)據(jù)建立、數(shù)據(jù)保存這樣的必修課外,還設(shè)立有如何構(gòu)建數(shù)據(jù)圖書(shū)館這樣的科目。
各國(guó)業(yè)界還普遍為現(xiàn)任在職圖書(shū)館員開(kāi)設(shè)了相關(guān)的進(jìn)修課程,組織召開(kāi)專(zhuān)題研討班。在CLIR提交的名為“論數(shù)據(jù)問(wèn)題”( The Problem of Data)的報(bào)告中,列舉了以下一些培訓(xùn)課程:北卡羅來(lái)納大學(xué)所屬教堂山分校的“數(shù)據(jù)綜合管理課程系列II ——專(zhuān)題研究 ”( DigCCurr II Professional Institute);美國(guó)圖書(shū)館(LC)的“數(shù)據(jù)保存延展與教育“(Digital Preservation Outreach and Education),DCC的“數(shù)據(jù)綜合處理”( Data Curation)等。不過(guò),這些課程修完后不發(fā)結(jié)業(yè)證,一定程度上影響了在職人員的積極性。
對(duì)在職者來(lái)說(shuō),在線研討會(huì)、網(wǎng)絡(luò)課程更加方便利用。歐美各國(guó)教育機(jī)構(gòu)、專(zhuān)業(yè)社團(tuán)都開(kāi)設(shè)網(wǎng)上公開(kāi)課程,任何人都可以免費(fèi)參加,資料與視頻全部公開(kāi)。[9]在DCC的“有關(guān)數(shù)據(jù)管理與綜合處理的相關(guān)教育與進(jìn)修”的網(wǎng)頁(yè)上,可以檢索到歐美大學(xué)或相關(guān)機(jī)構(gòu)開(kāi)設(shè)的課程與進(jìn)修項(xiàng)目。伊利諾伊大學(xué)網(wǎng)頁(yè)上“數(shù)據(jù)綜合處理課程搜索”一欄中,可以查找到美國(guó)各高校開(kāi)設(shè)的相關(guān)課程及輔導(dǎo)項(xiàng)目。
2013年9月UKSG(英國(guó)連續(xù)出版物集團(tuán))舉行了題為“何為數(shù)據(jù)管理,圖書(shū)館在其中應(yīng)發(fā)揮的作用”的網(wǎng)絡(luò)研討會(huì),主要面向新近從事相關(guān)工作的人士。主講人是謝菲爾德大學(xué)所屬信息情報(bào)學(xué)院的安德魯·考克斯(Andrew Cox),他提出“伯明翰大學(xué)的研究數(shù)據(jù)已積累到約10億個(gè)文件夾”。結(jié)合具體例證,他闡釋了在研究數(shù)據(jù)管理受到高度重視的大背景下,科研人員所面臨的難點(diǎn),圖書(shū)館所承擔(dān)的新角色定位等問(wèn)題。報(bào)告時(shí)間不長(zhǎng),只有45分鐘,提問(wèn)踴躍??伎怂菇淌谧詈髮⒅匾擖c(diǎn)進(jìn)行了精煉歸納,反復(fù)加以強(qiáng)調(diào)。講演內(nèi)容很充實(shí),在海內(nèi)外引起很大反響。
現(xiàn)在國(guó)際上較為著名的面向圖書(shū)館員自學(xué)之用的線上教材有:第一數(shù)據(jù)“(DataONE)”的“教育模型”( Education Modules)、謝菲爾德大學(xué)的“數(shù)據(jù)管理文化”( RDMRose)等。在著名的文獻(xiàn)管理工具M(jìn)endeley(免費(fèi)的跨平臺(tái)文獻(xiàn)管理軟件及在線學(xué)術(shù)社交網(wǎng)絡(luò)平臺(tái))中,有一款“館員如何進(jìn)行數(shù)據(jù)管理”( Data Management for Librarians )的文件庫(kù),附有不少相關(guān)主體的論文。
以上這些專(zhuān)為RDM服務(wù)而開(kāi)發(fā)的情報(bào)信息、教程視頻,都是十分適用的工具,與研究數(shù)據(jù)一道向業(yè)界公開(kāi),令各國(guó)科研人員、圖書(shū)館員不分國(guó)籍,皆可共有共享。在格拉斯哥大學(xué),負(fù)責(zé)RDM的工作人員僅有幾名,卻實(shí)現(xiàn)了使公開(kāi)的數(shù)據(jù)資料的利用最大化,為該校師生提供了極有效率的服務(wù),在海內(nèi)外大學(xué)館中引起強(qiáng)烈反響。[10]
數(shù)據(jù)共享工程是科研生命周期生態(tài)循環(huán)系統(tǒng)不可或缺的一環(huán)。其重要性已被業(yè)界充分認(rèn)識(shí),但要真正變成現(xiàn)實(shí),還面臨諸多的技術(shù)、制度、法律、倫理、財(cái)力方面的問(wèn)題與壁壘。在這種環(huán)境中,圖書(shū)館為數(shù)據(jù)共享事業(yè)提供支持的諸多工作,也面臨不少困難,在實(shí)踐中也難免出現(xiàn)一些失誤。為了提高圖書(shū)館在文化建設(shè)、科學(xué)發(fā)展中的現(xiàn)實(shí)與歷史地位,惟一的途徑就是使圖書(shū)館成為科學(xué)研究活動(dòng)的忠實(shí)伙伴。從先行者的經(jīng)驗(yàn)教訓(xùn)中吸收營(yíng)養(yǎng),承擔(dān)起數(shù)據(jù)共享的歷史責(zé)任與現(xiàn)實(shí)角色,才能實(shí)現(xiàn)圖書(shū)館人的理想。正如日本情報(bào)學(xué)專(zhuān)家在一篇文章中指出的那樣:“關(guān)鍵的一點(diǎn)就是,圖書(shū)館必須與所屬大學(xué)或者科研院所的管理經(jīng)營(yíng)層進(jìn)行溝通,每個(gè)圖書(shū)館開(kāi)展的業(yè)務(wù),都要密切配合所服務(wù)的科研機(jī)構(gòu)與教學(xué)組織所進(jìn)行的以教育科研為中心的相關(guān)項(xiàng)目?!本褪钦f(shuō),圖書(shū)館必須在科教機(jī)構(gòu)所實(shí)行的教學(xué)科研工作戰(zhàn)略中,構(gòu)筑確定本身活動(dòng)的目的與位置。圖書(shū)館需要將“知識(shí)構(gòu)建與傳播”的相關(guān)工作,從根本上采用全新的形式進(jìn)行二次組織,從而塑造未來(lái)圖書(shū)館的的形象,在科研工作戰(zhàn)略中將圖書(shū)館的服務(wù)變成不可或缺的要素。那么,圍繞數(shù)據(jù)公開(kāi)訪問(wèn)政策的落實(shí),圖書(shū)情報(bào)工作的切入點(diǎn)在哪里呢?那就是:未來(lái)圖書(shū)館與大學(xué)及科研機(jī)構(gòu)進(jìn)行的工作與活動(dòng),要參與教育、科學(xué)、文化的發(fā)展計(jì)劃(這是有學(xué)術(shù)價(jià)值的知識(shí)生產(chǎn)活動(dòng)),為振興各類(lèi)產(chǎn)業(yè),活躍并推進(jìn)創(chuàng)新發(fā)明活動(dòng),批量培養(yǎng)富于創(chuàng)造性的創(chuàng)新人才等發(fā)揮獨(dú)特而重要的作用,并且使相關(guān)計(jì)劃具有可持續(xù)性。 推進(jìn)數(shù)據(jù)公開(kāi)訪問(wèn),同時(shí)保持該項(xiàng)事業(yè)的持續(xù)性,并且達(dá)成預(yù)期目標(biāo) ,圖書(shū)館被寄予很大的希望。
[1] Fienberg, S.E.et al [eds.].Sharing research data.National Academies Press.1983, 234p.Hey, Tony et al.The Fourth Paradigm: Data-Intensive Scientific Discovery.1st ed., Microsoft Research, 2009, 284 [EB/OL].[ 2014-06-30].http://research.microsoft.com/en-us/collaboration/fourthparadigm/.
[2] 高祖歩美.生命科學(xué)分野におけるデータの共有の現(xiàn)狀と課題[J].情報(bào)管理,2013(5):294-301.
[3] Wadman, Meredith.NIH mulls rules for validating key results[J].Nature,2013(5):14-15.
[4] Swoger, Bonnie.Reference: ereviews: Thomson Reuters Data Citation Index.Library Journal.2012-12-27.[EB/OL].[ 2014-06-30].http:// reviews.libraryjournal.com/ 2012/12/ reference /ereviews /reference-ereviews-december-1-2012/.
[5] Jones, Sarah.et al.How to Develop Research Data Management Services - a guide for HEIs.DCC.2013, 22p.[EB/OL].[ 2015-03-30].http://www.dcc.ac.uk/sites/default/files/documents/publications/How-to-develop-RDM-services_finalMay2013rev.pdf.
[6] Research Data Management Policy.University of Edinburgh.[EBOL].[ 2014-12-10].http://www.ed.ac.uk/schools-departments/information-services/about/policies-and-regulations/research-data-policy.
[7] University of California Curation Center of the California Digital Library.DMPTool.[EB/OL].[ 2015-02-20].https://dmp.cdlib.org/.
[8] Support for Managing Research Data.University of Cambridge.[EB/OL].[ 2015-04-12].http://www.lib.cam.ac.uk/dataman/.
[9] Johnson, Lisa.“Academic Libraries Get Ready: Big data is here and it needs a (caring) home”.NISO Webinar: Research Data Curation Part 2: E-Science Librarianship.2013-09-18.[EB/OL].[ 2015-05-30].http://www.niso.org/news/events/2013/webinars/data_curation/ .
[10] 池內(nèi)有為.研究データ共有時(shí)代における図書(shū)館の新たな役割:研究データマネジメントとデータキュレーション.カレントアウェアネス.2014, (319), CA1818, p.21-26.[EB/OL].[ 2015-04-30].http://current.ndl.go.jp/ca1818.
(責(zé)任編輯:朱愛(ài)瑜)
The Role of Foreign Libraries in the Era of Data Sharing
PANG Shu-jie
(Jilin University, Changchun 130012, China)
This paper analyzes the significance, the trend of the development and the functions of the scientific data sharing.It thinks that the scientific data can be used synchronous by counterparts or interdisciplinary, by sharing and free access.Then the achievement is produced by using the scientific crossing belt.Therefore, the libraries should undertake the historical responsibility of the integrated management of research data, and the librarians should be improved in the knowledge structure and the professional capacity.
data sharing; data management; new role; scientific research data; data disclosure; data storage; foreign libraries
G250.19
A
1006-1525(2016)05-0116-05
龐淑杰,女,副研究館員。
2016-03-02