, , ,
在大規(guī)模生產(chǎn)、分享及應(yīng)用數(shù)據(jù)的新時(shí)代,越來越多的科研人員認(rèn)識(shí)到數(shù)據(jù)和數(shù)據(jù)分析對(duì)數(shù)據(jù)密集型科學(xué)和工程領(lǐng)域的研究及教育的發(fā)展至關(guān)重要[1]。2012年3 月 29 日美國政府推出的“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”更是將大數(shù)據(jù)提升到全球性戰(zhàn)略發(fā)展的高度。許多IT 巨頭都已投入到大數(shù)據(jù)軟硬件技術(shù)整合、大數(shù)據(jù)信息處理等技術(shù)研發(fā)之中,力求在新一輪的信息競(jìng)爭(zhēng)中搶得戰(zhàn)略先機(jī)與技術(shù)制高點(diǎn)[2]。擁有海量文獻(xiàn)資源和數(shù)據(jù)的圖書館也在悄然發(fā)生變化[3]。美國國家科學(xué)基金會(huì)提出,研究型圖書館應(yīng)該在數(shù)據(jù)監(jiān)護(hù)方面給予科研機(jī)構(gòu)業(yè)務(wù)和技術(shù)支持,為他們提供相應(yīng)的數(shù)據(jù)服務(wù)[4]。美國、英國、澳大利亞等國家的一些高校圖書館已把科研數(shù)據(jù)管理作為一項(xiàng)服務(wù)[5],并由此催生了數(shù)據(jù)館員。
近年來,在信息與網(wǎng)絡(luò)技術(shù)迅猛發(fā)展的推動(dòng)下,從宏觀到微觀、從自然到社會(huì)的觀察、感知、計(jì)算、仿真、傳播等活動(dòng)都產(chǎn)生了大量科學(xué)數(shù)據(jù)[6]??茖W(xué)家通過對(duì)這些數(shù)據(jù)實(shí)時(shí)、動(dòng)態(tài)的監(jiān)測(cè)與分析解決原來難以解決或不可觸及的科學(xué)問題,也可以把數(shù)據(jù)作為科學(xué)研究的對(duì)象和工具,基于數(shù)據(jù)來思考、設(shè)計(jì)和實(shí)施科學(xué)研究[7]??茖W(xué)數(shù)據(jù)逐步成為“制數(shù)據(jù)權(quán)”的戰(zhàn)略資源,因而科學(xué)數(shù)據(jù)管理受到科學(xué)界的重視。
2009年12月,來自10個(gè)國家的15個(gè)機(jī)構(gòu)共同成立了DataCite國際聯(lián)盟[8]。2011年,美國國家醫(yī)學(xué)圖書館(NLM)開始為接受美國國立衛(wèi)生研究院(NIH)基金資助的研究團(tuán)隊(duì)提供學(xué)科館員服務(wù)補(bǔ)充基金[9]。2013年的《美國學(xué)術(shù)圖書館的發(fā)展和未來趨勢(shì)》[10]指出,數(shù)據(jù)研究管理已成為圖書館一大發(fā)展方向。美國航空航天局(NASA)、疾病控制與預(yù)防中心(CDC)、英國研究理事會(huì)及其下屬的7個(gè)研究理事會(huì)以及維康信托基金會(huì)、澳大利亞研究理事會(huì)(ARC)等,相繼制定了科研數(shù)據(jù)管理政策[11]。蓬勃發(fā)展的科研數(shù)據(jù)管理工作催生了新的工作崗位,即數(shù)據(jù)館員[12]。美國的耶魯大學(xué)圖書館、英國的愛丁堡大學(xué)圖書館、澳大利亞墨爾本大學(xué)圖書館和加拿大多倫多大學(xué)圖書館等都設(shè)立了專門的數(shù)據(jù)館員崗位,國內(nèi)學(xué)者也紛紛開展相關(guān)研究。
科學(xué)研究完成前的所有過程數(shù)據(jù)、半成品以及科學(xué)研究完成后的成果皆為科學(xué)數(shù)據(jù)管理的對(duì)象,包括手稿、視頻、音頻、圖片出版物、繪畫、設(shè)計(jì)圖紙、過程手稿、圖形、工作流圖、設(shè)備、數(shù)據(jù)文檔、數(shù)據(jù)處理或計(jì)算機(jī)程序(軟件)、研究數(shù)據(jù)統(tǒng)計(jì)記錄等[13]。
科學(xué)數(shù)據(jù)管理(Research Data Management,RDM)是指對(duì)在科學(xué)研究活動(dòng)中產(chǎn)生的科學(xué)數(shù)據(jù)進(jìn)行統(tǒng)籌協(xié)調(diào)、科學(xué)配置、整合管理,涉及對(duì)各類型科學(xué)數(shù)據(jù)進(jìn)行采集、分類、標(biāo)準(zhǔn)化、發(fā)布及共享,以形成管理科學(xué)數(shù)據(jù)的理念、政策、規(guī)范、環(huán)境、措施與體系,發(fā)揮科學(xué)研究數(shù)據(jù)資源的最大效益[14]。
不同學(xué)者對(duì)數(shù)據(jù)館員有不同的理解和定義。Read認(rèn)為數(shù)據(jù)館員(data librarian)或數(shù)據(jù)服務(wù)館員(data service librarian)就是提供數(shù)據(jù)服務(wù)的圖書館員[15];蔣麗麗等認(rèn)為數(shù)據(jù)館員是在數(shù)據(jù)管理、保存、存儲(chǔ)等方面經(jīng)過系統(tǒng)和專業(yè)訓(xùn)練,并具有行業(yè)資格的人員[16];魏來等認(rèn)為數(shù)據(jù)館員是數(shù)據(jù)創(chuàng)造者、數(shù)據(jù)專家和數(shù)據(jù)主管[17];孟祥保等則認(rèn)為數(shù)據(jù)館員是指在數(shù)據(jù)管理、保存和存儲(chǔ)方面經(jīng)過系統(tǒng)專門的訓(xùn)練,并具有行業(yè)資質(zhì)的人員[18]。綜上所述,數(shù)據(jù)館員是指為了更好持久地利用科研數(shù)據(jù),運(yùn)用相應(yīng)的技術(shù)(主要是計(jì)算機(jī)技術(shù))和相關(guān)學(xué)科知識(shí),科學(xué)地管理科研數(shù)據(jù)的圖書館員。數(shù)據(jù)館員應(yīng)發(fā)揮自己的優(yōu)勢(shì),利用圖書館這一科研數(shù)據(jù)密集的主要平臺(tái)實(shí)施科學(xué)數(shù)據(jù)管理。
隨著越來越多的科研人員逐漸認(rèn)識(shí)到科研數(shù)據(jù)的重要價(jià)值,數(shù)據(jù)館員的作用也愈發(fā)突顯。針對(duì)美國研究型圖書館協(xié)會(huì)館員的一項(xiàng)調(diào)查表明,他們已意識(shí)到研究數(shù)據(jù)管理對(duì)于科學(xué)研究與圖書館發(fā)展的重要性,且大多數(shù)館員認(rèn)為自己能勝任數(shù)據(jù)館員崗位。國內(nèi)圖書館業(yè)界也開始意識(shí)到研究數(shù)據(jù)管理的重要性并行動(dòng)起來。2012年11月在北京大學(xué)圖書館召開的國際學(xué)術(shù)討論會(huì)上,“數(shù)據(jù)管理與數(shù)據(jù)服務(wù)”成為分主題之一。CALIS三期建設(shè)項(xiàng)目已經(jīng)設(shè)立“科學(xué)數(shù)據(jù)管理預(yù)研項(xiàng)目”,開展了高??茖W(xué)數(shù)據(jù)管理相關(guān)問題的研究。
數(shù)據(jù)館員進(jìn)行科學(xué)數(shù)據(jù)管理的意義主要體現(xiàn)在以下幾個(gè)方面。首先,科學(xué)數(shù)據(jù)完全基于客觀事實(shí),是實(shí)際試驗(yàn)的記錄,沒有摻雜科研人員的主觀思維影響,或許能給我們的科研提供更多的發(fā)展方向。第二,科學(xué)數(shù)據(jù)的應(yīng)用具有多向性,根據(jù)一組科學(xué)數(shù)據(jù)可以向潛在的多種可能性推演發(fā)展,使其他人利用現(xiàn)有數(shù)據(jù)提出新的科學(xué)問題[19]。第三,通過有效的科學(xué)數(shù)據(jù)管理,實(shí)現(xiàn)科學(xué)數(shù)據(jù)共享,促進(jìn)科研人員的研究工作,提高科研成果的產(chǎn)生速度和科學(xué)數(shù)據(jù)的價(jià)值[20]。第四,長(zhǎng)期保存科學(xué)數(shù)據(jù),保證科學(xué)研究的完整性,可以增強(qiáng)數(shù)據(jù)再利用效益。但是總體而言,目前國內(nèi)科學(xué)數(shù)據(jù)管理工作做得還不夠系統(tǒng)和深入,其重要原因之一是缺乏相應(yīng)的數(shù)據(jù)管理政策和對(duì)數(shù)據(jù)館員的作用缺乏足夠認(rèn)識(shí)[18]。
數(shù)據(jù)管理與服務(wù)領(lǐng)域影響最大的國際組織是國際社會(huì)科學(xué)信息服務(wù)與技術(shù)協(xié)會(huì)(International Association for Social Science Information Services & Technology, IASSIST)。根據(jù)IASSIST調(diào)查和各大高校官網(wǎng)信息,很多高校已經(jīng)開展了科研數(shù)據(jù)管理工作,主要管理部門多為圖書館,其他部門予以支持,尤其是技術(shù)部門,但是具體的服務(wù)方式和內(nèi)容因?qū)W校和具體部門不同而存在較大差異(表1)。
圖書館在數(shù)據(jù)管理方面具有得天獨(dú)厚的優(yōu)勢(shì)。圖書館可以依托各種商業(yè)數(shù)據(jù)庫的科學(xué)數(shù)據(jù)和圖書館資源平臺(tái),開設(shè)專門的數(shù)據(jù)平臺(tái),結(jié)合機(jī)構(gòu)自身需要,添加相應(yīng)的國際組織數(shù)據(jù)(如聯(lián)合國下設(shè)的世界衛(wèi)生組織)、各國政府部門及統(tǒng)計(jì)機(jī)構(gòu)(如美國食品藥品監(jiān)督管理局、中國衛(wèi)生和計(jì)劃生育委員會(huì))的數(shù)據(jù)、專業(yè)數(shù)據(jù)協(xié)會(huì)及數(shù)據(jù)聯(lián)盟(如密歇根大學(xué)的政治和社會(huì)研究方面的校際聯(lián)盟)[27]等組織的開放數(shù)據(jù)。但是在我國,科研數(shù)據(jù)管理和服務(wù)還是新鮮事物,其發(fā)展面臨著制度保障缺位、人員配備不足、平臺(tái)支撐欠缺等方面的突出問題,亟待解決。
序號(hào) 研究所成立時(shí)間/年所長(zhǎng)數(shù)/位平均任職年限/年1斯克里普斯研究所19288112冷泉港實(shí)驗(yàn)室18987173薩克研究所1960964懷特黑德研究所1982485Broad研究所20031126杰克遜實(shí)驗(yàn)室19297127斯托瓦斯醫(yī)學(xué)研究所2000288拉霍亞過敏和免疫學(xué)研究所1988399Gladstone研究所197931210Sanford-Burnham研究所197648
國外已經(jīng)建立了數(shù)據(jù)館員崗位制度,如普渡大學(xué)圖書館設(shè)置了副館長(zhǎng)負(fù)責(zé)支撐研究的服務(wù)工作,并下設(shè)數(shù)據(jù)服務(wù)專家、跨學(xué)科研究館員和分布式數(shù)據(jù)管理中心;俄勒崗州立大學(xué)設(shè)立了數(shù)字學(xué)術(shù)與服務(wù)中心,其中一項(xiàng)重要業(yè)務(wù)工作就是科研數(shù)據(jù)管理,主要任務(wù)包括幫助研究人員按照美國國家科學(xué)基金會(huì)(NSF)和NIH的要求制定數(shù)據(jù)管理計(jì)劃和資源統(tǒng)一標(biāo)識(shí)符(如DOI)等[18];愛丁堡大學(xué)、康奈爾大學(xué)圖書館和哥倫比亞大學(xué)圖書館也有先例。
在我國數(shù)據(jù)館員還鮮有聽聞。究其原因,首先是國家科技管理層尚未充分認(rèn)識(shí)到科學(xué)數(shù)據(jù)管理的重要意義,更沒有提出科學(xué)數(shù)據(jù)管理的硬性要求;其次是科研機(jī)構(gòu)和科研人員也沒有提出數(shù)據(jù)管理的實(shí)際需求,數(shù)據(jù)管理工作尚未有效開展起來。宏觀科研數(shù)據(jù)管理政策缺位和科研人員不重視對(duì)科學(xué)數(shù)據(jù)的系統(tǒng)管理,皆導(dǎo)致處于數(shù)據(jù)管理執(zhí)行層面的圖書館沒有明確導(dǎo)向,數(shù)據(jù)管理工作只能在摸索中前進(jìn)。
要想破除僵局,圖書館必須積極推動(dòng)相關(guān)科技政策的出臺(tái),加快數(shù)據(jù)館員制度的建立。首先要了解學(xué)習(xí)國外的數(shù)據(jù)管理政策,同時(shí)嘗試開展數(shù)據(jù)管理和服務(wù),做好科研數(shù)據(jù)管理工作,適應(yīng)數(shù)據(jù)密集型科研模式對(duì)圖書館的要求,并用圖書館員和科研人員的行動(dòng)推進(jìn)科研數(shù)據(jù)相關(guān)政策的落實(shí)執(zhí)行,建立數(shù)據(jù)館員制度,設(shè)立專門崗位??偠灾?,在科研數(shù)據(jù)管理政策和科研數(shù)據(jù)管理實(shí)踐兩方面著手推進(jìn)數(shù)據(jù)管理工作。
在設(shè)立數(shù)據(jù)館員崗位時(shí),可以先選擇有一定數(shù)據(jù)知識(shí)基礎(chǔ)的館員兼職數(shù)據(jù)館員,從科研數(shù)據(jù)管理相關(guān)支持服務(wù)中的數(shù)據(jù)管理需求調(diào)研、國內(nèi)外基金政策、數(shù)據(jù)模板、數(shù)據(jù)管理計(jì)劃的工具、OA數(shù)據(jù)、引用標(biāo)準(zhǔn)、分析大量數(shù)據(jù)的工具等工作中積累經(jīng)驗(yàn),待工作開展一段時(shí)間后,再依具體需求設(shè)立部分專職數(shù)據(jù)館員。這種從兼職到專職數(shù)據(jù)館員過渡的模式,不會(huì)帶來過大的轉(zhuǎn)型風(fēng)險(xiǎn)和壓力,也有利于科研用戶逐漸熟悉和適應(yīng)科研數(shù)據(jù)管理的過程,使科研數(shù)據(jù)管理工作更容易開展。
數(shù)據(jù)館員應(yīng)該具有開展數(shù)據(jù)素養(yǎng)教育、數(shù)據(jù)管理計(jì)劃咨詢、數(shù)據(jù)管理服務(wù)咨詢的能力,對(duì)科研或數(shù)據(jù)政策、科學(xué)研究流程有一定了解,能夠利用一定的工具分析科研數(shù)據(jù),如統(tǒng)計(jì)分析軟件SPSS、SAS等[22]。傳統(tǒng)圖書館員的職能任務(wù)主要是讀者服務(wù)、資源建設(shè)和信息咨詢。由于我國圖書館還沒有專門從事過數(shù)據(jù)管理工作的館員(包括數(shù)據(jù)館員和從事數(shù)據(jù)服務(wù)的學(xué)科館員),因此只能選拔一批具有計(jì)算機(jī)及相關(guān)背景的館員,通過培養(yǎng)和實(shí)踐鍛煉,使之成為合格的數(shù)據(jù)館員。具有計(jì)算機(jī)相關(guān)背景的館員,熟悉元數(shù)據(jù)配置、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)復(fù)用等專業(yè)領(lǐng)域知識(shí),可能具備開發(fā)數(shù)據(jù)管理軟件的能力、熟悉數(shù)據(jù)的標(biāo)準(zhǔn)格式和生命周期、對(duì)機(jī)構(gòu)知識(shí)庫很了解,還可能寫過課題及基金申請(qǐng)書,熟悉科技管理政策,如NSF對(duì)科研項(xiàng)目資助中數(shù)據(jù)管理計(jì)劃的要求,具備一定的版權(quán)知識(shí),是數(shù)據(jù)館員潛在的候選人。
圖書館應(yīng)該鼓勵(lì)和推動(dòng)這些預(yù)備數(shù)據(jù)館員自主學(xué)習(xí)數(shù)據(jù)管理的知識(shí),并組織內(nèi)部的交流探討,推廣分享數(shù)據(jù)管理知識(shí)。此外,數(shù)據(jù)館員還應(yīng)該多參加圖書館業(yè)界舉辦的各種數(shù)據(jù)管理培訓(xùn)班和研討會(huì),以提升業(yè)務(wù)能力和開闊視野[5]。如英國數(shù)字保管中心(Digital Curation Centre, DDC)不定期開設(shè)短期數(shù)據(jù)管理培訓(xùn)課程,并將培訓(xùn)資料發(fā)布在網(wǎng)上免費(fèi)共享[28];DCC每隔半年面向科研人員、數(shù)字資源庫管理者、圖書館員、信息研究組織、數(shù)據(jù)管理員、數(shù)據(jù)科學(xué)家及基金會(huì)等舉辦一次研究數(shù)據(jù)管理論壇;美國雪城大學(xué)在NSF的資助下開設(shè)科學(xué)數(shù)據(jù)素養(yǎng)教程,為未來從事科學(xué)數(shù)據(jù)管理的人員和科學(xué)圖書館員提供主修課程[29];國際社會(huì)科學(xué)信息服務(wù)和技術(shù)協(xié)會(huì)(IASSIST)、公共數(shù)據(jù)用戶協(xié)會(huì)(APDU)、美國校際社會(huì)科學(xué)研究聯(lián)盟(ICPSR)等組織也每年或每?jī)赡昱e辦一次的學(xué)術(shù)會(huì)議[27];加拿大研究圖書館學(xué)會(huì)數(shù)據(jù)管理咨詢分會(huì)專門開設(shè)研究數(shù)據(jù)管理服務(wù)在線課程,推進(jìn)數(shù)據(jù)管理教育,提升館員專業(yè)能力[13]。數(shù)據(jù)館員應(yīng)該充分利用這些學(xué)術(shù)研討會(huì)和培訓(xùn)班,掌握數(shù)據(jù)管理相關(guān)技術(shù),提高數(shù)據(jù)管理能力,從而順利地開展科研數(shù)據(jù)管理工作。
支撐平臺(tái)也是數(shù)據(jù)管理的一個(gè)必要條件。圖書館應(yīng)依據(jù)自身預(yù)計(jì)提供的數(shù)據(jù)服務(wù)范圍和內(nèi)容,以及前臺(tái)用戶的體驗(yàn)和后臺(tái)的管理方便和安全性,思考需要什么樣的平臺(tái)或設(shè)備,是重新建立一個(gè)數(shù)據(jù)管理平臺(tái),還是在原有的圖書館網(wǎng)站或已有的機(jī)構(gòu)知識(shí)庫中增建一個(gè)數(shù)據(jù)管理平臺(tái),平臺(tái)是自建還是與外部合作[20],是否可以利用開源軟件建設(shè)機(jī)構(gòu)自用的平臺(tái)等一系列問題。
對(duì)于平臺(tái)建設(shè)框架,如果整合于機(jī)構(gòu)知識(shí)庫平臺(tái)的數(shù)據(jù)管理平臺(tái)不能充分發(fā)揮其應(yīng)有的作用,而且整改成本較高時(shí)就應(yīng)構(gòu)架獨(dú)立的數(shù)據(jù)管理平臺(tái)。從節(jié)約費(fèi)用的角度,應(yīng)盡可能利用開源軟件和工具,在已有開放軟件接口上構(gòu)建自己的數(shù)據(jù)管理服務(wù)平臺(tái)。從集中力量做好數(shù)據(jù)服務(wù)的角度考慮,可以把與數(shù)據(jù)管理與服務(wù)這一核心工作不直接相關(guān)的平臺(tái)開發(fā)外包出去,與專門的軟件公司合作完成。建立數(shù)據(jù)管理平臺(tái)之后,數(shù)據(jù)館員可以根據(jù)數(shù)據(jù)管理流程,從擬定數(shù)據(jù)管理計(jì)劃開始,提供數(shù)據(jù)存儲(chǔ)格式與標(biāo)準(zhǔn)、數(shù)據(jù)共享政策與模式、數(shù)據(jù)評(píng)估分析方法、數(shù)據(jù)引用方式等,完善科研數(shù)據(jù)管理與服務(wù)流程[30]。
數(shù)據(jù)館員和科學(xué)數(shù)據(jù)管理在實(shí)踐過程中必然會(huì)遇到諸多問題和困難。以上對(duì)制度、人員、平臺(tái)等方面的考慮或許可以提供一點(diǎn)解決的思路。另外,我們還要跟蹤了解國外科學(xué)數(shù)據(jù)管理的進(jìn)展,借鑒國外的成熟經(jīng)驗(yàn),更好地開展科學(xué)數(shù)據(jù)管理工作。