亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        國外科研數(shù)據(jù)管理研究進(jìn)展*
        ——基于CiteSpace和VOSviewer的可視化分析

        2016-06-05 15:01:42劉桂鋒
        圖書情報(bào)研究 2016年4期
        關(guān)鍵詞:分類

        劉桂鋒 李 杰

        (1.江蘇大學(xué)科技信息研究所鎮(zhèn)江212013;2.上海海事大學(xué)安全科學(xué)與工程系上海201306;3.上海海事大學(xué)科學(xué)技術(shù)情報(bào)研究所上海201306)

        國外科研數(shù)據(jù)管理研究進(jìn)展*
        ——基于CiteSpace和VOSviewer的可視化分析

        劉桂鋒1李 杰2,3

        (1.江蘇大學(xué)科技信息研究所鎮(zhèn)江212013;2.上海海事大學(xué)安全科學(xué)與工程系上海201306;3.上海海事大學(xué)科學(xué)技術(shù)情報(bào)研究所上海201306)

        從文獻(xiàn)的學(xué)科分布、國家分布、機(jī)構(gòu)分布、作者分布等外在特征、知識基礎(chǔ)和研究前沿三個方面,利用CiteSpace和VOSviewer信息可視化分析軟件對Web of Science數(shù)據(jù)庫中關(guān)于科研數(shù)據(jù)管理研究的2 849篇論文進(jìn)行分析。研究結(jié)果發(fā)現(xiàn),國外科研數(shù)據(jù)管理研究大體可分為20世紀(jì)90年代的萌芽階段、2000~2008年的形成階段、2009~2016年的發(fā)展階段。最后系統(tǒng)總結(jié)和梳理出國外圖書情報(bào)學(xué)科科研數(shù)據(jù)管理研究的三大研究熱點(diǎn):科研數(shù)據(jù)管理理論、科研數(shù)據(jù)管理服務(wù)和科研數(shù)據(jù)管理案例,以期對我國科研數(shù)據(jù)管理研究和實(shí)踐提供指引與借鑒。

        數(shù)據(jù)科學(xué)科研數(shù)據(jù)管理科研數(shù)據(jù)數(shù)據(jù)服務(wù)信息可視化知識圖譜

        1 引言

        科研數(shù)據(jù)是指任何以數(shù)字形式存儲的信息,包括文本、數(shù)字、圖像、視頻或電影、音頻、軟件、算法、方程、動畫、模型、模擬等,這些數(shù)據(jù)可以通過觀察、計(jì)算或?qū)嶒?yàn)等手段產(chǎn)生[1]。國際上通常稱之為“科研數(shù)據(jù)”(scientific data)或“研究數(shù)據(jù)”(research data),在我國習(xí)慣叫做“科學(xué)數(shù)據(jù)”。但是科學(xué)數(shù)據(jù)的概念更寬泛一些,一般包括科研數(shù)據(jù)和政府?dāng)?shù)據(jù)[2]。

        我國科學(xué)數(shù)據(jù)管理與共享的探索已有10多年的時(shí)間,大體分為兩個方面,一是政府部門、高??蒲性核雠_了一些科學(xué)數(shù)據(jù)管理規(guī)范或標(biāo)準(zhǔn),為科學(xué)數(shù)據(jù)管理與共享活動營造氛圍和提供原則。2002年科技部提出我國將實(shí)施科學(xué)數(shù)據(jù)共享工程[3],拉開了我國科學(xué)數(shù)據(jù)管理的大幕。2005年科技部[4]制定了《國家科學(xué)數(shù)據(jù)中心建設(shè)技術(shù)規(guī)范》,用來指導(dǎo)國家科學(xué)數(shù)據(jù)中心的建設(shè),以滿足科學(xué)數(shù)據(jù)共享工程技術(shù)平臺總體設(shè)計(jì)的要求,確保各國科學(xué)數(shù)據(jù)中心之間的互聯(lián)互通和數(shù)據(jù)共享。2006年科技部出臺了《國家科技計(jì)劃項(xiàng)目科學(xué)數(shù)據(jù)匯交暫行辦法(草案)》[5],用來規(guī)范國家科技計(jì)劃項(xiàng)目科學(xué)數(shù)據(jù)的匯交工作,加強(qiáng)對科學(xué)數(shù)據(jù)的管理。2009年中國科學(xué)院制定了《科學(xué)數(shù)據(jù)分類規(guī)范與分類詞表》[6]標(biāo)準(zhǔn),規(guī)定了科學(xué)數(shù)據(jù)分類的標(biāo)準(zhǔn)和編碼的規(guī)則,用以保證科學(xué)數(shù)據(jù)組織、存儲和交換的一致性。2012年7月,國務(wù)院在《“十二五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》[7]中明確提出支持海量數(shù)據(jù)存儲、處理技術(shù)的研發(fā)和產(chǎn)業(yè)化。2013年5月,國務(wù)院在關(guān)于印發(fā)《“十二五”國家自主創(chuàng)新能力建設(shè)規(guī)劃》[8]的通知中提出加快科學(xué)數(shù)據(jù)平臺建設(shè),構(gòu)建科技資源從數(shù)據(jù)獲取、存儲、處理、挖掘到開放共享的完整信息服務(wù)鏈。建設(shè)集中與分散相結(jié)合的國家科學(xué)數(shù)據(jù)中心群,形成國家科學(xué)數(shù)據(jù)分級分類共享服務(wù)體系。2015年9月,國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》[9],提出大力推動政府部門數(shù)據(jù)共享、穩(wěn)步推動公共數(shù)據(jù)資源開放和統(tǒng)籌規(guī)劃大數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。2015年11月閉幕的黨的十八屆五中全會公報(bào)提出要實(shí)施“國家大數(shù)據(jù)戰(zhàn)略”[10],標(biāo)志著大數(shù)據(jù)戰(zhàn)略正式上升為國家戰(zhàn)略。

        二是各級政府以及高??蒲性核_通運(yùn)營了等若干科學(xué)數(shù)據(jù)共享平臺,為科學(xué)數(shù)據(jù)管理與共享活動提供技術(shù)保障和系統(tǒng)支撐。如科技部的國家科技基礎(chǔ)條件平臺[11],包括林業(yè)科學(xué)數(shù)據(jù)共享平臺、地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺、人口與健康科學(xué)數(shù)據(jù)共享平臺、農(nóng)業(yè)科學(xué)數(shù)據(jù)共享平臺、地震科學(xué)數(shù)據(jù)共享平臺、氣象科學(xué)數(shù)據(jù)共享中心等。陜西省科學(xué)數(shù)據(jù)共享平臺[12]主要由陜西科技管理數(shù)據(jù)中心、陜西氣象數(shù)據(jù)中心、陜西測繪數(shù)據(jù)中心、陜西水文數(shù)據(jù)中心、陜西地震數(shù)據(jù)中心等基礎(chǔ)科學(xué)數(shù)據(jù)群組成。中國科學(xué)院的科學(xué)數(shù)據(jù)中心[13],負(fù)責(zé)信息化環(huán)境存儲設(shè)施的建設(shè)和運(yùn)行服務(wù),以及全院的數(shù)據(jù)資源存儲備份。高校方面,比較有代表性的有復(fù)旦大學(xué)、武漢大學(xué)和北京大學(xué)。復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺[14],主要收集、整理和開發(fā)中國社會經(jīng)濟(jì)發(fā)展數(shù)據(jù),為學(xué)者提供最具競爭力的研究條件和數(shù)據(jù)服務(wù)。武漢大學(xué)的高??茖W(xué)數(shù)據(jù)共享平臺[15],旨在研究科學(xué)數(shù)據(jù)平臺建設(shè)流程、方法及科學(xué)數(shù)據(jù)管理的各類標(biāo)準(zhǔn)規(guī)范。北京大學(xué)開發(fā)的研究數(shù)據(jù)平臺[16]主要包括北京大學(xué)中國調(diào)查數(shù)據(jù)資料庫、北京大學(xué)健康老齡與發(fā)展研究中心、北京大學(xué)可視化與可視分析研究組、北京大學(xué)生命科學(xué)學(xué)院生物信息學(xué)中心等跨學(xué)科的開放數(shù)據(jù)??傊?,近十五年來,我國政府部門、高校院所開展了一系列與科學(xué)數(shù)據(jù)管理相關(guān)的實(shí)踐探索活動,有力的推動了數(shù)據(jù)管理、數(shù)據(jù)共享、數(shù)據(jù)利用在我國各行各業(yè)的研究與開展。

        為全面了解和總結(jié)國際學(xué)術(shù)界在科研數(shù)據(jù)管理方面取得的理論成果和實(shí)踐成果,本文利用CiteSpace和VOSviewer知識圖譜工具對Web of Science數(shù)據(jù)庫核心集中有關(guān)“科研數(shù)據(jù)管理”的論文進(jìn)行可視化分析,以期推動我國科研數(shù)據(jù)管理理論研究和實(shí)踐探索的蓬勃開展。

        2 數(shù)據(jù)來源與研究方法

        論文數(shù)據(jù)來自于Web of ScienceTM(WOS)核心集中的Science Citation Index Expanded(SCIEXPANDED)、Social Sciences Citation Index(SSCI)、Conference Proceedings Citation Index-Science(CPCI-S)等數(shù)據(jù)庫。檢索式為:標(biāo)題=“research data”O(jiān)R“scientific data”O(jiān)R“data management”O(jiān)R“data curation”O(jiān)R“digital cu ration”O(jiān)R“digital management”,不限時(shí)間跨度。檢索日期為2016年6月3日,共獲得檢索結(jié)果2 849條,其中有193條數(shù)據(jù)屬于圖書情報(bào)學(xué)科(Library and Information Science)。

        研究主要采用CiteSpace(Version 4.0.R5 SE(32-bit))和VOSviewer(version 1.6.4)軟件。CiteSpace是由美國德雷塞爾大學(xué)陳超美博士開發(fā)的一款極具代表性的知識圖譜可視化分析工具,能夠展示一個學(xué)科或知識域在一定時(shí)期發(fā)展的趨勢與動態(tài),形成若干研究前沿領(lǐng)域的演進(jìn)歷程[17]。CiteSpace主要的分析字段有國家共現(xiàn)、機(jī)構(gòu)共現(xiàn)、作者共現(xiàn)、關(guān)鍵詞共現(xiàn)等,以及針對文獻(xiàn)集合參考文獻(xiàn)的期刊共被引、作者共被引和文獻(xiàn)共被引等。VOSviewer是由荷蘭萊頓大學(xué)的Nees Jan van Eck和Ludo Waltman于2009年開發(fā)的用以繪制各個領(lǐng)域科學(xué)知識圖譜的文獻(xiàn)計(jì)量分析軟件[18]。VOSviewer主要的分析字段有國家共現(xiàn)、機(jī)構(gòu)共現(xiàn)、作者共現(xiàn)、作者共被引和文獻(xiàn)共被引等,以四種圖形方式展示:標(biāo)簽視圖(The label view)、密度視圖(The density view)、聚類密度視圖(The cluster density view)和散點(diǎn)視圖(The scatter view)。

        圖1 CiteSpace學(xué)科共現(xiàn)知識圖譜

        圖2 CiteSpace國家/地區(qū)共現(xiàn)知識圖譜

        3 研究結(jié)果分析

        3.1 外在特征

        3.1.1 學(xué)科分布圖1為采用CiteSpace繪制的學(xué)科共現(xiàn)知識圖譜,共含有159個學(xué)科,這些學(xué)科之間有802次共現(xiàn)關(guān)系。由圖1可知,科研數(shù)據(jù)管理研究的學(xué)科領(lǐng)域廣泛,分布非常不平衡。計(jì)算機(jī)科學(xué)尤為突出,高達(dá)1 193篇,約占整個研究的40%,是科研數(shù)據(jù)管理研究的主要學(xué)科,工程學(xué)以567篇排在第二位,圖書情報(bào)學(xué)(193篇)、生物化學(xué)與分子生物學(xué)(117篇)、電信(103篇)這3個學(xué)科的發(fā)文量在101~199篇之間。51~100篇之間的學(xué)科有19個,11~50篇之間的學(xué)科有72個,10篇及以下的學(xué)科有64個。

        圖3 CiteSpace機(jī)構(gòu)共現(xiàn)知識圖譜

        圖4 VOSviewer作者共現(xiàn)密度視圖

        3.1.2 國家分布圖2反映出科研數(shù)據(jù)管理的研究力量來自全球約90個國家與地區(qū),共現(xiàn)頻次為134次。由圖2可以看出,各國研究力量分布不均勻,美國遙遙領(lǐng)先,高達(dá)896篇,屬于第一集團(tuán)。排在第二集團(tuán)的是中國(283篇)、德國(234篇)和英國(156篇),論文數(shù)量在150到300篇之間,且實(shí)力相當(dāng)。第三集團(tuán)的論文數(shù)量在50~ 100篇之間,共有9個國家,分別是法國(96篇)、意大利(90篇)、加拿大(80篇)、韓國(73篇)、瑞士(67篇)、澳大利亞(63篇)、西班牙(58篇)、日本(52篇)和荷蘭(50篇)。第四集團(tuán)共有19個國家,論文數(shù)量在10~49篇之間,其余國家的論文數(shù)量在9篇及以下,最低的為1篇,約有30個國家與地區(qū)。

        3.1.3 機(jī)構(gòu)分布科研數(shù)據(jù)管理的研究機(jī)構(gòu)分布見圖3,共有708個研究機(jī)構(gòu),這些研究機(jī)構(gòu)之間有119次合作。論文數(shù)量20篇以上的只有3個機(jī)構(gòu),最多的是25篇;10~19篇之間的有22個機(jī)構(gòu);9篇以下的研究機(jī)構(gòu)數(shù)量眾多,最少的為1篇。論文數(shù)量前25位的機(jī)構(gòu)中,排在首位的是位于瑞士的歐洲核子研究組織(CERN)。美國的機(jī)構(gòu)數(shù)量最多,共18個,如華盛頓大學(xué)(20篇)、伊利諾伊大學(xué)(19篇)、北卡羅來納大學(xué)(17篇)、馬里蘭大學(xué)(16篇)、美國國家海洋和大氣管理局(NOAA,14篇)等。中國有4個機(jī)構(gòu),中國科學(xué)院以23篇排在第2位,還有清華大學(xué)、武漢大學(xué)和北京航空航天大學(xué)。新加坡有1個,新加坡國立大學(xué)以15篇的數(shù)量排在第7位。英國有1個,牛津大學(xué)以11篇的數(shù)量排在第16位。意大利有1個,米蘭理工大學(xué)以10篇的數(shù)量排在第25位。

        圖5 CiteSpace文獻(xiàn)共被引時(shí)間線圖譜

        3.1.4 作者分布科研數(shù)據(jù)管理研究的作者分布如圖4所示,共有8 964位作者,圖中只顯示論文數(shù)量在2篇以上的1 103位作者,作者相對分散,尚未形成核心作者群。論文數(shù)量在10篇及以上的只有4位作者,他們是來自德國伍珀塔爾大學(xué)(Univ Wuppertal)的Garonne V(14篇)、Lassnig M(12篇)、Beermann T(10篇)和Serfon C(10篇),全部是會議論文。發(fā)表9篇論文的作者有25位,如Balch CM、Klasky S等,8篇的有10位,如Li J、Zhang J等,7篇的有8位,6篇的有10位,其余作者的論文數(shù)量在5篇以下。

        3.2 知識基礎(chǔ)

        圖5為科研數(shù)據(jù)管理研究的文獻(xiàn)共被引時(shí)間線圖譜,共有1 225篇參考文獻(xiàn),之間有5 297次共被引關(guān)系,分散在33個聚類當(dāng)中。共被引頻次在10次以上的共有29篇參考文獻(xiàn),其中20次以上的只有3篇,最高的22次,主要分布在#27、#0和#10聚類。#27聚類共有11篇文獻(xiàn),被引頻次在17次至22次之間,聚類標(biāo)簽是與版權(quán)(right)有關(guān)的。#0聚類的文獻(xiàn)數(shù)量非常多,共有108篇,被引頻次在10次至22次之間的只有10篇文獻(xiàn),聚類標(biāo)簽是與衛(wèi)生與健康科研數(shù)據(jù)(health research data)有關(guān)的。#10聚類有22篇文獻(xiàn),只有2篇文獻(xiàn)的被引頻次為13次,其余的均在10次以下,聚類標(biāo)簽是與傳感器網(wǎng)格增強(qiáng)(sensor grid enhancement)有關(guān)的。從突顯度來看,共有16篇論文,4篇發(fā)表在PLOS ONE,1篇發(fā)表在Science,1篇發(fā)表在J AM SOC INF SCI TEC(美國信息科學(xué)與技術(shù)學(xué)會雜志),其余是一些專業(yè)期刊。被引頻次前10位的文獻(xiàn)中,無論是被引頻次還是突顯度,Tenopir[19]發(fā)表在PLOS ONE有關(guān)“科研人員數(shù)據(jù)共享實(shí)踐與認(rèn)識”的論文排在首位,本文通過對1 329名科研人員進(jìn)行問卷調(diào)查,發(fā)現(xiàn)沒有充足的時(shí)間和缺少資助是阻礙數(shù)據(jù)共享的主要因素,大部分人對目前的短期數(shù)據(jù)保存比較滿意,而對長期存儲不滿意。其余Brazma A(2001)、Blumenthal D(1997)、Dean J(2008)、Bodenheimer T(2000)、Angell M(2000)等9篇文獻(xiàn)均為醫(yī)學(xué)、基因、癌癥等專業(yè)內(nèi)容的論文。被引頻次在10次以上且與科研數(shù)據(jù)管理有密切關(guān)系的代表性文獻(xiàn)有:Savage[20]對發(fā)表在PLOS ONE系列期刊上的10位作者進(jìn)行一項(xiàng)數(shù)據(jù)共享實(shí)證研究,結(jié)果顯示,2位作者郵箱無效,8位郵箱正常的作者中,4位拒絕共享,3位沒有回復(fù),只有1位愿意共享并且發(fā)送數(shù)據(jù)。Piwowar[21]選取85篇癌癥微陣列臨床試驗(yàn)出版物,對科研數(shù)據(jù)共享與論文引用率的相關(guān)性進(jìn)行研究,線性回歸分析表明公開數(shù)據(jù)的論文增加了69%的引用,而與期刊影響因子、出版日期、作者國籍無關(guān)。Nelson[22]探討了科研人員不愿意進(jìn)行數(shù)據(jù)共享的原因,諸如缺少規(guī)劃、缺乏管理,以及與數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)分析等相關(guān)的數(shù)據(jù)質(zhì)量和數(shù)量等現(xiàn)實(shí)問題。Liu[23]對基于網(wǎng)絡(luò)的產(chǎn)品數(shù)據(jù)管理(PDM)系統(tǒng)進(jìn)行綜述,重點(diǎn)是探討PDM方法與Web架構(gòu)的整合,以及這個新系統(tǒng)是如何提升傳統(tǒng)PDM系統(tǒng)性能的。Alsheikhali[24]選取50本具有較高影響因子期刊的500篇論文就數(shù)據(jù)共享政策進(jìn)行分析,結(jié)果表明有44本期刊有明顯的數(shù)據(jù)共享聲明,并且共享的范圍與力度存在差異。

        圖6 VOSviewer文獻(xiàn)共被引標(biāo)簽視圖

        圖7 CiteSpace關(guān)鍵詞共現(xiàn)時(shí)區(qū)圖譜

        圖6為采用VOSviewer軟件制作的科研數(shù)據(jù)管理研究的文獻(xiàn)共被引標(biāo)簽視圖,圖中只顯示被引頻次在6次以上的文獻(xiàn),共計(jì)100篇左右。圖譜中每個點(diǎn)的顏色取決于該點(diǎn)的所屬聚類,相同顏色的點(diǎn)屬于同一個聚類。圓形大小反映了文獻(xiàn)被引頻次的高低,如圖6所示,中間區(qū)域的文獻(xiàn)的被引頻次較高,圍繞該部分向外延伸,文獻(xiàn)的被引頻次逐漸降低,最外層形成一個半環(huán)形結(jié)構(gòu)。文獻(xiàn)的被引頻次與圖5的結(jié)果一致,區(qū)別是結(jié)果的圖譜呈現(xiàn)方式不同,圖5是按照文獻(xiàn)共被引時(shí)間線進(jìn)行聚類,圖6是文獻(xiàn)共被引標(biāo)簽視圖。

        3.3 研究前沿

        圖7為利用CiteSpace軟件制作的關(guān)鍵詞共現(xiàn)時(shí)區(qū)圖譜,共有605個關(guān)鍵詞分布在1991~2016年的26個年份。從共現(xiàn)頻次看,data management以220次排在首位,50~100次之間的只有3個,主要與數(shù)據(jù)庫系統(tǒng)與模型相關(guān),如system(90次)、database(74次)和model(52次)。20~49次之間的有22個,主要與元數(shù)據(jù)、數(shù)據(jù)共享、數(shù)據(jù)收集、大數(shù)據(jù)相關(guān),如metadata(41次)、data sharing(37次)、data collection(27次)、big data(26次)、data integration(22次)等。10~19次之間的有69個,主要與科研數(shù)據(jù)管理系統(tǒng)、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)倉儲相關(guān),代表性的有product data management(19次)、scientific data(19次)、research data management(19次)、data analysis(18次)、research data(18次)、data curation(18次)、data mining(17次)、data management system(17次)、data model(15次)、data grid(12次)、data warehouse(10次)等。共現(xiàn)頻次在9次以下的數(shù)量最多,高達(dá)511個。從突顯度看,共有8個關(guān)鍵詞,突顯度最高的是industry(10.2),其余的按照突顯度大小依次是2013年的大數(shù)據(jù)(big data)與科研數(shù)據(jù)管理(research data management)、1992年的科學(xué)(science)、2008年的網(wǎng)絡(luò)服務(wù)(web service)、2009年的云計(jì)算(cloud computing)、2005年的數(shù)據(jù)網(wǎng)格(data grid)和2000年的重癥監(jiān)護(hù)(intensive care)。

        共現(xiàn)時(shí)區(qū)圖譜能夠揭示每個年度的研究熱點(diǎn)以及隨年度變化的熱點(diǎn)演進(jìn)趨勢。由圖7可以看出,20世紀(jì)90年代是科研數(shù)據(jù)管理的萌芽階段,主要側(cè)重醫(yī)學(xué)數(shù)據(jù)的數(shù)據(jù)庫管理,關(guān)鍵詞數(shù)量相對較少,平均不到10個,個別年份沒有突出的研究熱點(diǎn),如1993、1995和1997年,分別只有2個、3個、8個關(guān)鍵詞。1991年有13個關(guān)鍵詞,主要與臨床試驗(yàn)、乳腺癌、醫(yī)學(xué)檢測相關(guān)。1992年有18個關(guān)鍵詞,研究熱點(diǎn)有科學(xué)、設(shè)計(jì)、數(shù)據(jù)模式、預(yù)測等。1994年有25個關(guān)鍵詞,研究熱點(diǎn)有數(shù)據(jù)管理、系統(tǒng)、信息、數(shù)據(jù)質(zhì)量等。1996年有14個關(guān)鍵詞,研究熱點(diǎn)有數(shù)據(jù)庫管理系統(tǒng)、信息技術(shù)等。1998年有36個關(guān)鍵詞,研究熱點(diǎn)有數(shù)據(jù)庫管理、分類、鑒別等。

        2000~2008年是科研數(shù)據(jù)管理的形成階段,信息系統(tǒng)、網(wǎng)絡(luò)網(wǎng)頁、數(shù)據(jù)歸檔、數(shù)據(jù)網(wǎng)格、元數(shù)據(jù)、數(shù)據(jù)挖掘等技術(shù)為科研數(shù)據(jù)管理的數(shù)據(jù)獲取、數(shù)據(jù)組織、數(shù)據(jù)分析、數(shù)據(jù)整合、數(shù)據(jù)共享、數(shù)據(jù)服務(wù)奠定重要基礎(chǔ),這一階段的關(guān)鍵詞數(shù)量在30~40個之間,每個年份的研究熱點(diǎn)非常顯著。2000年有36個關(guān)鍵詞,研究熱點(diǎn)有數(shù)據(jù)庫、數(shù)據(jù)收集、算法、網(wǎng)絡(luò)、數(shù)據(jù)獲取、數(shù)據(jù)倉儲、分布式系統(tǒng)等。2001年有43個關(guān)鍵詞,研究熱點(diǎn)有信息系統(tǒng)、軟件、工具、臨床數(shù)據(jù)管理等。2002年有41個關(guān)鍵詞,研究熱點(diǎn)有工業(yè)、模式、性能、生物信息學(xué)、質(zhì)量控制等。2003年有39個關(guān)鍵詞,研究熱點(diǎn)有數(shù)據(jù)分析、檔案、護(hù)理、自動化等。2004年有37個關(guān)鍵詞,研究熱點(diǎn)有可視化、xml、網(wǎng)頁、技術(shù)等。2005年有38個關(guān)鍵詞,研究熱點(diǎn)有數(shù)據(jù)網(wǎng)格、數(shù)據(jù)整合、管理、癌癥、藥物發(fā)現(xiàn)等。2006年有31個關(guān)鍵詞,研究熱點(diǎn)有元數(shù)據(jù)、標(biāo)準(zhǔn)、本體、映射等。2007年有36個關(guān)鍵詞,研究熱點(diǎn)有模擬、數(shù)據(jù)挖掘、隱私、環(huán)境、教育等。2008年有27個關(guān)鍵詞,研究熱點(diǎn)有網(wǎng)絡(luò)服務(wù)、數(shù)據(jù)共享、產(chǎn)品數(shù)據(jù)管理、科研數(shù)據(jù)、數(shù)據(jù)管理系統(tǒng)、網(wǎng)格計(jì)算、查詢處理等。

        2009~2016年是科研數(shù)據(jù)管理的發(fā)展階段,關(guān)鍵詞數(shù)量比上一階段有所下降,基本保持在10~20個之間,但2016年接近30個。云計(jì)算、傳感器網(wǎng)絡(luò)、mapreduce、數(shù)字表示、大數(shù)據(jù)、開放獲取、數(shù)據(jù)發(fā)布、科學(xué)計(jì)算等新技術(shù)與新理念對數(shù)據(jù)管理的發(fā)展起到了推波助瀾的作用。2009年有17個關(guān)鍵詞,研究熱點(diǎn)有云計(jì)算、數(shù)據(jù)管護(hù)、無線傳感器網(wǎng)絡(luò)、主數(shù)據(jù)管理、分布式數(shù)據(jù)管理等。2010年有19個關(guān)鍵詞,研究熱點(diǎn)有科學(xué)數(shù)據(jù)、知識、生態(tài)、疾病、數(shù)據(jù)存儲、基礎(chǔ)設(shè)施等。2011年有19個關(guān)鍵詞,研究熱點(diǎn)有mapreduce、數(shù)據(jù)捕捉、數(shù)據(jù)服務(wù)等。2012年有11個關(guān)鍵詞,研究熱點(diǎn)有語義網(wǎng)、傳感網(wǎng)、數(shù)字表示、數(shù)據(jù)可視化、眾包等。2013年有13個關(guān)鍵詞,研究熱點(diǎn)有大數(shù)據(jù)、科研數(shù)據(jù)管理、數(shù)據(jù)儲存等。2014年有13個關(guān)鍵詞,研究熱點(diǎn)有開放獲取、互操作性、高校圖書館、機(jī)構(gòu)知識庫等。2015年有12個關(guān)鍵詞,研究熱點(diǎn)有公共健康、倫理道德、系統(tǒng)結(jié)構(gòu)、數(shù)據(jù)發(fā)布等。2016年有28個關(guān)鍵詞,研究熱點(diǎn)有信息檢索、典藏、元分析、大數(shù)據(jù)管理、虛擬數(shù)據(jù)空間、科學(xué)計(jì)算等。

        圖8為利用VOSviewer軟件從論文的題目和摘要中提取的關(guān)鍵詞形成的共現(xiàn)標(biāo)簽視圖。使用圓圈和標(biāo)簽來代表一個關(guān)鍵詞,圓圈大小代表關(guān)鍵詞 的出現(xiàn)次數(shù)。圖中呈現(xiàn)的是502個關(guān)鍵詞形成的5個聚類,分別是#1聚類、#2聚類、#3聚類、#4聚類和#5聚類。

        圖8 VOSviewer關(guān)鍵詞共現(xiàn)標(biāo)簽視圖

        #1聚類主要是科學(xué)數(shù)據(jù)的產(chǎn)權(quán)以及用戶的權(quán)利與義務(wù)等,包含3個關(guān)鍵詞,scientific data、right和investigators responsibility。誰擁有科學(xué)數(shù)據(jù)?知識產(chǎn)權(quán)對科技出版產(chǎn)生怎樣的影響?Elliott[25]從專利、版權(quán)和數(shù)據(jù)庫三個角度回答了上述問題,并且認(rèn)為具有濃重商業(yè)利益的知識產(chǎn)權(quán)立法阻礙了科學(xué)數(shù)據(jù)的傳播及使用,這會對蓬勃發(fā)展的科研過程中的信息自由流動帶來巨大威脅,并且呼吁科學(xué)家必須意識到擁有的權(quán)利,合理使用。Polk[26]從期刊編輯的視角認(rèn)為作者對臨床試驗(yàn)有足夠的責(zé)任,開放數(shù)據(jù)讓其他人員進(jìn)行必要的分析,對數(shù)據(jù)出版擁有控制權(quán);并且呼吁從事基礎(chǔ)研究和臨床研究的學(xué)者,在臨床試驗(yàn)過程、數(shù)據(jù)收集與分析以及論文提交過程中盡量詳細(xì)披露負(fù)責(zé)人和調(diào)查者更多的細(xì)節(jié)。

        #2聚類主要是科研數(shù)據(jù)的基礎(chǔ)理論,如數(shù)據(jù)歸檔、數(shù)據(jù)分析、數(shù)據(jù)組織、數(shù)據(jù)計(jì)算、數(shù)據(jù)查詢等,包括211個關(guān)鍵詞,如architecture、performance、visualization、file、xml、data model、simulation、scalability、query、operation、annotation、algorithm等。Miller[27]采用嚴(yán)格的數(shù)學(xué)數(shù)據(jù)建模原理開發(fā)了Sets and Fields(SAF)科學(xué)數(shù)據(jù)建模(data model)系統(tǒng),能夠運(yùn)用在高性能互操作的科學(xué)計(jì)算領(lǐng)域。Michel[28]描述了用于重癥監(jiān)護(hù)病人的數(shù)據(jù)管理系統(tǒng)中藥物治療文檔模塊的數(shù)據(jù)模型)(data model)設(shè)計(jì)原理,能夠?qū)⒎墙Y(jié)構(gòu)化文本轉(zhuǎn)換成詳細(xì)的結(jié)構(gòu)化模式,實(shí)現(xiàn)藥物管理中治療行為的詳細(xì)統(tǒng)計(jì)分析。

        #3聚類主要是用戶的科研數(shù)據(jù)需求調(diào)研與圖書館的科研數(shù)據(jù)管理服務(wù)基礎(chǔ)設(shè)施與服務(wù)內(nèi)容等,含有123個關(guān)鍵詞,如research data、researcher、article、research data management、survey、preservation、data service、data sharing、policy、repository、plan等。Aydinoglu[29]調(diào)查了天體生物學(xué)界,特別是美國國家航空和宇宙航行局天體生物學(xué)研究所科研人員的數(shù)據(jù)管理實(shí)踐,研究表明與其他科研人員一樣,天體生物學(xué)界與數(shù)據(jù)共享持有同樣的擔(dān)憂,大家都能理解數(shù)據(jù)共享的好處,數(shù)據(jù)共享的障礙依然存在,如認(rèn)可、引用、時(shí)間和機(jī)構(gòu)獎勵等方面。Antell[30]調(diào)研了美國研究圖書館協(xié)會附屬的116家高校圖書館507名自然科學(xué)圖書館員,關(guān)于機(jī)構(gòu)知識庫、數(shù)據(jù)存儲庫以及數(shù)據(jù)管理服務(wù)的認(rèn)知與參與程度、角色和責(zé)任、以及滿足用戶數(shù)據(jù)管理工作要求的必備技能。研究結(jié)果表明,數(shù)據(jù)管理為圖書館員的職業(yè)發(fā)展帶來巨大發(fā)展機(jī)遇,同時(shí)也對其技能與角色提出了挑戰(zhàn)性的要求。

        #4聚類主要是科研數(shù)據(jù)管理在臨床醫(yī)學(xué)、生命健康領(lǐng)域的理論與實(shí)踐,包含122個關(guān)鍵詞,如clinical data management、diagnosis、disease、health、hospital、human、life、patientdata、physician、safety、treatment、care等。Fraccaro[31]提出了利用電子健康記錄(Electronic Health Records)與電子數(shù)據(jù)采集系統(tǒng)(Electronic Data Capture)結(jié)合的優(yōu)勢,借助網(wǎng)絡(luò)平臺開發(fā)臨床數(shù)據(jù)管理(clini-cal data management)系統(tǒng),核心思想是設(shè)計(jì)成一個具有較高的數(shù)據(jù)結(jié)構(gòu)特點(diǎn)和利用生物醫(yī)學(xué)受控詞匯表的關(guān)系型數(shù)據(jù)庫。Omollo[32]利用開源工具STATA,并結(jié)合知識共享,開發(fā)出了由查詢?nèi)蝿?wù)模塊、數(shù)據(jù)校正的查詢分辨率模塊和數(shù)據(jù)解析模塊組成的高質(zhì)量的臨床數(shù)據(jù)管理(clinical data management)系統(tǒng),包括為OpenClinica用戶設(shè)計(jì)的離線模式和允許多個用戶訪問的自動查詢管理系統(tǒng)。

        圖9 CiteSpace圖書情報(bào)學(xué)科關(guān)鍵詞共現(xiàn)圖譜

        圖10 VOSviewer圖書情報(bào)學(xué)科關(guān)鍵詞共現(xiàn)標(biāo)簽視圖

        #5聚類主要是科研數(shù)據(jù)管理在產(chǎn)品研發(fā)、設(shè)計(jì)、生成與銷售領(lǐng)域全過程的理論與實(shí)踐,包括211個關(guān)鍵詞,如business、product data management、enterprise、customer、company、market、exchange、data warehouse、manufacturing、design process、supply chain等。Thames[33]設(shè)計(jì)了一個基于語義文件系統(tǒng)的產(chǎn)品數(shù)據(jù)管理(product data management)的語義關(guān)聯(lián)硬件加速系統(tǒng),本系統(tǒng)的目標(biāo)是在計(jì)算平臺的設(shè)計(jì)和工程應(yīng)用范圍內(nèi)提高領(lǐng)域的異構(gòu)計(jì)算水平。Qiu[34]借助百度云計(jì)算平臺基于產(chǎn)品數(shù)據(jù)管理(productdata management)設(shè)計(jì)開發(fā)了項(xiàng)目管理系統(tǒng),包括任務(wù)模塊、用戶模塊、產(chǎn)品模塊和功能模塊,該系統(tǒng)能夠進(jìn)行項(xiàng)目管理、組織管理、資源管理、查詢與統(tǒng)計(jì)。3.4研究熱點(diǎn)

        圖書情報(bào)學(xué)科科研數(shù)據(jù)管理研究的關(guān)鍵詞共現(xiàn)圖譜(圖9)和共現(xiàn)標(biāo)簽視圖(圖10)分別是使用Citespace和VOSviewer軟件制作的,大約有300個關(guān)鍵詞,其中圖9包含297個關(guān)鍵詞以及323次共現(xiàn)關(guān)系,圖10顯示的308個關(guān)鍵詞是VOSviewer軟件從論文的題目中自動抽取的,歸屬于72個聚類。

        由圖9可知,高頻關(guān)鍵詞有科研數(shù)據(jù)管理(research data management)、數(shù)據(jù)管理(data management)、科研數(shù)據(jù)(research data)、數(shù)據(jù)管護(hù)(data curation)、機(jī)構(gòu)知識庫(institutionalrepositories)、數(shù)據(jù)共享(data sharing)、高校圖書館(aca-demic libraries)、數(shù)字保存(digitalpreservation)等。由圖10可知,高頻關(guān)鍵詞有科研數(shù)據(jù)管理(research data management)、科研數(shù)據(jù)服務(wù)(research data service)、科研數(shù)據(jù)(scientific research data)、醫(yī)學(xué)科研數(shù)據(jù)管理(medical research data)、科研數(shù)據(jù)共享(scientific data sharing)、數(shù)據(jù)管理系統(tǒng)(data management system)、衛(wèi)生保健科研數(shù)據(jù)(healthcare research data)等。通過對圖9和圖10的關(guān)鍵詞以及該領(lǐng)域的193篇文獻(xiàn)內(nèi)容進(jìn)行分析,發(fā)現(xiàn)可分為3個知識域(即研究熱點(diǎn)):科研數(shù)據(jù)管理理論研究、科研數(shù)據(jù)管理服務(wù)研究和科研數(shù)據(jù)管理案例研究。

        3.4.1 科研數(shù)據(jù)管理理論研究科研數(shù)據(jù)管理理論是圖書館開展科研數(shù)據(jù)管理服務(wù)與實(shí)踐的根基、基礎(chǔ)和前提,有關(guān)的關(guān)鍵詞有政策(policy)、數(shù)據(jù)收集(data collection)、數(shù)據(jù)存儲(digital preservation)、數(shù)據(jù)保存(digital storage)、元數(shù)據(jù)(metadata)、數(shù)據(jù)共享(data sharing)等??蒲袛?shù)據(jù)管理政策是科研數(shù)據(jù)管理與共享的直接驅(qū)動力,許多國家政府、科研資助機(jī)構(gòu)/科技期刊、甚至高校均制定了數(shù)據(jù)管理與保存政策,學(xué)者大多采用網(wǎng)絡(luò)調(diào)查法和內(nèi)容分析法了解政策現(xiàn)狀、分析政策內(nèi)容以及總結(jié)特點(diǎn)與規(guī)律。例如Sturges[35]調(diào)查了目前期刊數(shù)據(jù)共享政策的現(xiàn)狀以及利益相關(guān)者對數(shù)據(jù)共享的看法和做法,發(fā)現(xiàn)大部分期刊沒有數(shù)據(jù)共享政策,即使有也存在不一致的現(xiàn)象,結(jié)合已有期刊政策的定量分析和利益相關(guān)者調(diào)查結(jié)果的定性分析,提出了期刊數(shù)據(jù)共享政策模型框架。

        根據(jù)數(shù)據(jù)生命周期理論和科研活動過程,科研數(shù)據(jù)管理一般分為數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)組織、數(shù)據(jù)共享、數(shù)據(jù)分析、數(shù)據(jù)再利用等幾個階段。目前國外學(xué)者的研究主要集中在數(shù)據(jù)存儲、數(shù)據(jù)組織與數(shù)據(jù)共享三個方面,而且大多數(shù)采用網(wǎng)絡(luò)調(diào)查的案例與實(shí)證研究方法。

        數(shù)據(jù)存儲[36]是指利用大型存儲設(shè)備、高性能服務(wù)器和軟件系統(tǒng)對數(shù)據(jù)進(jìn)行保存和存儲管理,大體分為三種方式,一是圖書館參與建設(shè)的校內(nèi)基礎(chǔ)設(shè)施,如機(jī)構(gòu)知識庫;二是圖書館參與建設(shè)的校外基礎(chǔ)設(shè)施;三是校外機(jī)構(gòu)第三方的基礎(chǔ)設(shè)施,如學(xué)科存儲庫、數(shù)據(jù)存儲庫等。例如,Marcial[37]采用網(wǎng)絡(luò)調(diào)查法對100個科學(xué)數(shù)據(jù)存儲庫進(jìn)行調(diào)查,利用聚類分析與邏輯回歸相結(jié)合的方法進(jìn)行分組,并總結(jié)出總體特征、業(yè)務(wù)特征、數(shù)據(jù)細(xì)節(jié)/政策3大類17項(xiàng)特征,最后從文獻(xiàn)綜述的角度,從容量管理、處理程序、來源、進(jìn)化階段等10個方面比較了機(jī)構(gòu)知識庫和科學(xué)數(shù)據(jù)存儲庫的異同。Naum[38]介紹了阿德萊德大學(xué)2011~2012年開展的科研數(shù)據(jù)存儲和管理項(xiàng)目,讓圖書館服務(wù)走出圖書館,走進(jìn)科研院系,融入科研過程,目的是收集科研數(shù)據(jù),利用科研數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行描述,并通過對百名科研人員進(jìn)行訪談,進(jìn)一步明確科研人員對數(shù)據(jù)存儲庫和元數(shù)據(jù)存儲有著強(qiáng)烈需求。

        數(shù)據(jù)組織一般包括文件命名與重命名、文件格式、文件管理、版本控制與數(shù)據(jù)文檔(元數(shù)據(jù)標(biāo)準(zhǔn))等,其中元數(shù)據(jù)是研究的重點(diǎn)。例如,Mayernik[39]采用“體制”為核心理念探討數(shù)據(jù)和元數(shù)據(jù)實(shí)踐的變異性,提出了包含5類“體制載體”的數(shù)據(jù)實(shí)踐:(a)規(guī)范及符號、(b)中介者、(c)例行程序、(d)標(biāo)準(zhǔn)和(e)材料對象,對理解科學(xué)數(shù)據(jù)和元數(shù)據(jù)的實(shí)踐產(chǎn)生、鞏固、發(fā)展和轉(zhuǎn)移至關(guān)重要。Willis[40]采用混合內(nèi)容分析方法和Greenberg的MODAL框架來確定元數(shù)據(jù)方案的目標(biāo)、原則、領(lǐng)域以及在科學(xué)數(shù)據(jù)存儲庫中使用的九種元數(shù)據(jù)方案的復(fù)雜性,從元數(shù)據(jù)方案的文本內(nèi)容中得出了22項(xiàng)元數(shù)據(jù)目標(biāo)。Chao[41]提出了適用于科研數(shù)據(jù)實(shí)踐、數(shù)據(jù)類型、管理活動與角色的功能性詞匯——數(shù)據(jù)實(shí)踐和管理詞匯(Data Practices and Curation Vocabulary,DPCVocab),包括3種類型:科研數(shù)據(jù)實(shí)踐、數(shù)據(jù)和管理。它作為一個共享術(shù)語或通用語言支持?jǐn)?shù)據(jù)管理人員、數(shù)據(jù)生產(chǎn)者、系統(tǒng)開發(fā)商以及與數(shù)據(jù)基礎(chǔ)設(shè)施和服務(wù)相關(guān)的其他利益相關(guān)者之間的交互與合作。

        數(shù)據(jù)共享研究內(nèi)容大體分為兩個方面,一是數(shù)據(jù)共享實(shí)踐研究,如Douglass[42]采用網(wǎng)絡(luò)調(diào)查法對在政府機(jī)構(gòu)工作的科學(xué)家目前的數(shù)據(jù)管理實(shí)踐、管理數(shù)據(jù)的工具和政策通過DataONE平臺進(jìn)行在線調(diào)查,政府機(jī)構(gòu)主要是在自己的網(wǎng)站上發(fā)布數(shù)據(jù),而不是在可以促進(jìn)共享的數(shù)據(jù)門戶網(wǎng)站。盡管存在非技術(shù)方面的限制,科學(xué)家擁有一些數(shù)據(jù)自主決策權(quán)利,如數(shù)據(jù)文檔、數(shù)據(jù)共享等。二是數(shù)據(jù)共享績效評價(jià)研究,如Si[43]根據(jù)數(shù)據(jù)資源、功能、服務(wù)效果和用戶滿意度建立了科學(xué)數(shù)據(jù)共享平臺性能的三級評價(jià)指標(biāo)體系,采用層次分析法設(shè)置指標(biāo)權(quán)重和專家評分法計(jì)算評分結(jié)果,最后從政策與規(guī)范、數(shù)據(jù)描述與組織標(biāo)準(zhǔn)、數(shù)據(jù)可獲得性、服務(wù)內(nèi)容與效率等方面指出存在的問題。

        3.4.2 科研數(shù)據(jù)管理服務(wù)研究科研數(shù)據(jù)管理服務(wù)是溝通圖書館員與科研人員之間的橋梁,是一個雙向信息交流的過程,有關(guān)的關(guān)鍵詞有科研數(shù)據(jù)服務(wù)(research data services)、大學(xué)圖書館(university libraries)、社區(qū)(community)、圖書館員(librarians)、調(diào)查(national-survey)等。網(wǎng)絡(luò)調(diào)查法是了解高校圖書館開展數(shù)據(jù)管理服務(wù)的現(xiàn)狀與問題,并在此基礎(chǔ)上提出對策與建議的主要方法之一??蒲袛?shù)據(jù)管理服務(wù)是圖書館新興的服務(wù),Corrall[44]對澳大利亞、新西蘭、愛爾蘭和英國140家圖書館的文獻(xiàn)計(jì)量和科研數(shù)據(jù)管理服務(wù)進(jìn)行調(diào)查,調(diào)查內(nèi)容包括當(dāng)前和計(jì)劃的服務(wù)、目標(biāo)受眾,服務(wù)范圍、員工培訓(xùn)需求,結(jié)果表明在目前各個國家數(shù)據(jù)管理的服務(wù)水平均低于文獻(xiàn)計(jì)量,但未來預(yù)期多數(shù)會打算參與數(shù)據(jù)管理服務(wù),尤其是在技術(shù)支持、數(shù)據(jù)存儲和政策制定方面。Si[45]通過網(wǎng)絡(luò)調(diào)查和訪談的方法調(diào)查全球排名前87位高校的科研數(shù)據(jù)管理服務(wù)現(xiàn)狀,發(fā)現(xiàn)50所高校開展此類服務(wù),服務(wù)內(nèi)容包括科研數(shù)據(jù)介紹、數(shù)據(jù)管理指南、數(shù)據(jù)管理和存儲服務(wù)、數(shù)據(jù)管理培訓(xùn)、數(shù)據(jù)管理參考和資源推薦等6個方面。

        學(xué)者對科研數(shù)據(jù)管理服務(wù)的調(diào)查基本上分為兩個視角,一是從圖書館與圖書館員的角度出發(fā),探索科研數(shù)據(jù)管理在圖書館的定位、圖書館員對科研數(shù)據(jù)管理服務(wù)的認(rèn)知、圖書館和信息專業(yè)人員在服務(wù)中發(fā)揮的作用等。如Cox[46]在2012年底對81名英國高校圖書館員調(diào)查顯示,圖書館提供有限的數(shù)據(jù)管理服務(wù),當(dāng)前的內(nèi)容有:開放獲取及政策、版權(quán)、數(shù)據(jù)引用、資源再利用的意識、外部數(shù)據(jù)源等,而未來三年優(yōu)先開展的服務(wù)有:開放獲取及政策、咨詢服務(wù)、早期的職業(yè)意識、數(shù)據(jù)倉庫、資源再利用的意識等。圖書館目前正在參與數(shù)據(jù)管理政策制定和服務(wù)設(shè)計(jì),并作為將來優(yōu)先開展的重要組成部分,數(shù)據(jù)管理咨詢和培訓(xùn)正在興起。Tenopir[47]對美國和加拿大223家圖書館的調(diào)查表明,部分圖書館提供數(shù)據(jù)管理服務(wù),更多的是在規(guī)劃階段。這些服務(wù)是原有的傳統(tǒng)信息咨詢服務(wù)的拓展和升華,只有少數(shù)圖書館參與到數(shù)據(jù)管理計(jì)劃、科研數(shù)據(jù)存儲等數(shù)據(jù)管理活動,圖書館員可以通過校內(nèi)外的學(xué)術(shù)研討會或?qū)I(yè)會議等計(jì)劃來提升自己的服務(wù)能力。高校圖書館[48]在數(shù)字?jǐn)?shù)據(jù)創(chuàng)造、數(shù)據(jù)收集和數(shù)據(jù)管理過程中發(fā)揮重要作用,信息專業(yè)人員將會嵌入在科研過程中,不僅僅是作為圖書館員的身份,而是作為科學(xué)文獻(xiàn)、數(shù)據(jù)、信息、知識專家,幫助科研人員構(gòu)建基礎(chǔ)設(shè)施和滿足數(shù)據(jù)管理需求。二是從教師與科研人員的角度出發(fā),了解科研人員對數(shù)據(jù)管理活動的認(rèn)知與擔(dān)憂、使用行為、實(shí)踐現(xiàn)狀、服務(wù)需求等。Whitmire[49]對美國俄勒岡州立大學(xué)教師通過郵件進(jìn)行在線調(diào)查,共分為5個方面:教師生成的數(shù)據(jù)類型、數(shù)據(jù)數(shù)量、數(shù)據(jù)存儲習(xí)慣、各種數(shù)據(jù)相關(guān)任務(wù)的角色和職責(zé)、元數(shù)據(jù)。調(diào)查結(jié)果表明:科研人員產(chǎn)生了大量的數(shù)據(jù)類型,并且不同學(xué)科有所差異;科研數(shù)據(jù)存儲在自己的服務(wù)器,而不選用全校范圍的存儲設(shè)施;科研助理人員完成各種數(shù)據(jù)相關(guān)任務(wù):數(shù)據(jù)采集、元數(shù)據(jù)創(chuàng)建、質(zhì)量控制、數(shù)據(jù)存儲、數(shù)據(jù)組織和數(shù)據(jù)備份,而與負(fù)責(zé)人一起完成共享數(shù)據(jù)分析和數(shù)據(jù)歸檔,而負(fù)責(zé)人在數(shù)據(jù)共享中的作用更為顯著;科研人員生成了大量的元數(shù)據(jù),他們需要元數(shù)據(jù)產(chǎn)生和發(fā)現(xiàn)標(biāo)準(zhǔn)的服務(wù)。Perry[50]對獲得加拿大社會科學(xué)與人文科學(xué)研究委員會資助的175名高??蒲腥藛T進(jìn)行問卷調(diào)查,結(jié)果表明:加拿大社會科學(xué)與人文科學(xué)研究委員會數(shù)據(jù)歸檔政策要求與科研人員滿足此要求的行動和能力存在巨大差距。科研人員獲取歸檔的科研數(shù)據(jù)是一個非常有爭議的問題,他們非常擔(dān)心數(shù)據(jù)保密和倫理問題。Diekema[51]對3 150名高校教師、177名基金項(xiàng)目管理人員和120位基金項(xiàng)目管理人員進(jìn)行調(diào)查,結(jié)果顯示:教師有強(qiáng)烈的數(shù)據(jù)分享愿望,但是缺乏有效分享的技能;基金項(xiàng)目管理人員和科研項(xiàng)目管理人員經(jīng)常提供必要的基礎(chǔ)設(shè)施和知識,但是這些資源并沒有有效的傳遞給教師;最后提出了高校圖書館為科研人員進(jìn)行數(shù)據(jù)管理服務(wù)的有效措施:提供數(shù)據(jù)共享的工具,協(xié)助描述、發(fā)現(xiàn)或獲取科研數(shù)據(jù),提供與數(shù)據(jù)集相關(guān)的版權(quán)和所有權(quán)信息,并協(xié)助編寫數(shù)據(jù)管理計(jì)劃。Scaramozzino[52]對教學(xué)型大學(xué)教師科研數(shù)據(jù)管理的數(shù)據(jù)存儲、數(shù)據(jù)共享和培訓(xùn)需要三方面問題進(jìn)行調(diào)查,結(jié)果表明:教師還沒有形成數(shù)據(jù)管理的最佳實(shí)踐,他們并沒有把圖書館作為數(shù)據(jù)管理的專業(yè)機(jī)構(gòu),或者作為存儲科研數(shù)據(jù)的最佳場所;圖書館員和科研人員共同合作使圖書館在科學(xué)創(chuàng)造和科學(xué)共享工作流程、學(xué)術(shù)交流模式以及基礎(chǔ)設(shè)施建設(shè)方面發(fā)揮重要作用。綜上可知,科研數(shù)據(jù)管理服務(wù)在圖書館剛剛起步,無論是圖書館員還是科研人員還存在認(rèn)知的問題,尚未形成有效的服務(wù)模式和最佳實(shí)踐,圖書館員需要通過多種途徑了解科研人員的需求,潛入科研一線過程開展針對性的服務(wù)。

        3.4.3 科研數(shù)據(jù)管理案例研究科研數(shù)據(jù)管理案例研究是科研數(shù)據(jù)管理理論或服務(wù)在高校的具體實(shí)踐探索,有關(guān)的關(guān)鍵詞有機(jī)構(gòu)知識庫(institutional repositories)、學(xué)術(shù)圖書館(academic libraries)、大學(xué)圖書館(university libraries)、數(shù)據(jù)管理(data curation)、數(shù)據(jù)管理服務(wù)(data managementservices)、案例研究(case study)等。機(jī)構(gòu)知識庫是研究型機(jī)構(gòu)的公開成果庫和內(nèi)部資料庫,如期刊論文、會議論文、專著、專利等公開成果和實(shí)驗(yàn)數(shù)據(jù)、講座資料、過程文件等內(nèi)部資料。大部分高校在機(jī)構(gòu)知識庫的公開成果保存與利用方面已經(jīng)積累了豐富的經(jīng)驗(yàn),正在打算和嘗試作為數(shù)據(jù)管理基礎(chǔ)設(shè)施的重要組成部分,如美國的約翰霍普金斯大學(xué)、中國的香港科技大學(xué)、英國的布里斯托大學(xué)以及印度高校等。約翰霍普金斯大學(xué)[53]數(shù)據(jù)管理的探索始于Sheridan圖書館與美國天文學(xué)會的出版機(jī)構(gòu)合作開發(fā)能夠連接電子文檔和電子出版系統(tǒng)的數(shù)據(jù)管理原型系統(tǒng)。機(jī)構(gòu)知識庫是用戶數(shù)據(jù)長期保存的數(shù)字圖書館基礎(chǔ)設(shè)施的重要組成部分。除此之外,約翰霍普金斯大學(xué)正在開發(fā)圖書館和學(xué)術(shù)界之間新的角色,即“數(shù)據(jù)科學(xué)家”或“數(shù)據(jù)社會科學(xué)家”。布里斯托大學(xué)[54]的科研數(shù)據(jù)管理實(shí)踐從data.bris項(xiàng)目開始,旨在構(gòu)建數(shù)據(jù)管理服務(wù)和機(jī)構(gòu)知識庫,并且在藝術(shù)學(xué)院進(jìn)行試點(diǎn)服務(wù),提出延伸服務(wù)與嵌入服務(wù)的成熟規(guī)劃模型。Wong[55]通過調(diào)查高校機(jī)構(gòu)知識庫用于科研數(shù)據(jù)存檔的方式與做法,并以香港科技大學(xué)為案例,旨在解決3個問題:數(shù)據(jù)類型、數(shù)據(jù)如何與機(jī)構(gòu)庫軟件兼容、提高數(shù)據(jù)可獲得性、可使用性和可發(fā)現(xiàn)性的有效措施。Mohammad[56]調(diào)查了印度高校機(jī)構(gòu)知識庫中科研數(shù)據(jù)的類型,結(jié)果發(fā)現(xiàn)期刊論文最多,其次是會議論文與學(xué)位論文,預(yù)印本、工作論文、教學(xué)資源和專利比較少,建議高校采取必要措施來鼓勵作者提交預(yù)印本以及更多的研究資料。除了利用已有的機(jī)構(gòu)知識庫外,有些高校自主開發(fā)數(shù)據(jù)管理與共享模型,如約翰霍普金斯大學(xué)[57]開發(fā)了由“保存層-歸檔層-存儲層-管護(hù)層”組成的用戶數(shù)據(jù)管理與共享的Data Archive服務(wù)模型,并提出了模型演化與實(shí)施面臨的機(jī)遇、挑戰(zhàn)與成功要素。

        目前高??蒲袛?shù)據(jù)管理的案例研究大多停留在理論探索層次上,正在為實(shí)踐應(yīng)用做基礎(chǔ)鋪墊。如英國高校[58]在聯(lián)合信息系統(tǒng)委員會和數(shù)字保存中心的幫助與資助下,在提供數(shù)據(jù)管理服務(wù)與支持系統(tǒng)方面取得了良好的進(jìn)展,如了解基金資助機(jī)構(gòu)的政策、與高校一起共同迎接數(shù)據(jù)管理服務(wù)的機(jī)遇與挑戰(zhàn)、拓展數(shù)據(jù)管理技能、支持?jǐn)?shù)據(jù)管理規(guī)劃等。美國明尼蘇達(dá)大學(xué)圖書館[59]調(diào)查了全校范圍內(nèi)的數(shù)據(jù)管理活動實(shí)踐:數(shù)據(jù)館員隊(duì)伍壯大、科研人員需求及行為調(diào)研、學(xué)校數(shù)字保護(hù)項(xiàng)目的實(shí)施、圖書館參與學(xué)校信息化基礎(chǔ)設(shè)施聯(lián)盟以及發(fā)起數(shù)字科學(xué)與數(shù)據(jù)服務(wù)合作倡議。在進(jìn)行科研數(shù)據(jù)管理服務(wù)的過程中,人的因素起到了重要的作用,包括圖書館員對數(shù)據(jù)管理的看法、服務(wù)能力以及科研人員的數(shù)據(jù)管理需求兩個方面。如格里菲斯大學(xué)[60]已經(jīng)意識到科研人員和圖書館員在管理數(shù)據(jù)和提供數(shù)據(jù)服務(wù)方面技能拓展與提升方面的重要性,拓展這些能力已被證明是非常具有長期性和挑戰(zhàn)性的工作。盡管挑戰(zhàn)很大,格里菲斯大學(xué)仍然為科研數(shù)據(jù)服務(wù)正在奠定堅(jiān)實(shí)的基礎(chǔ)。Kahn[61]探討了南非圖書館員對快速變化的數(shù)據(jù)管理的看法,并且考慮如何適應(yīng)這些變化進(jìn)一步開展數(shù)據(jù)管理工作。Lage[62]選取科羅拉多大學(xué)博爾德分校8位能夠代表某一類研究人員群體屬性的人物角色,分析總結(jié)出影響圖書館參與科學(xué)數(shù)據(jù)管理的積極因素和消極因素。該項(xiàng)研究提供了一種了解數(shù)據(jù)、科學(xué)家,以及這些人物角色工作的學(xué)科與院系文化特征的戰(zhàn)略方法。綜上可知,圖書館開展科研數(shù)據(jù)管理服務(wù),需要解決數(shù)據(jù)存儲庫等硬件問題以及科研人員數(shù)據(jù)管理需求和圖書館員服務(wù)能力等軟件問題。

        4 結(jié)論

        本文主要采用CiteSpace和VOSviewer可視化知識圖譜分析軟件,對Web of Science數(shù)據(jù)庫核心集中有關(guān)“科研數(shù)據(jù)管理”的2 849篇論文的學(xué)科分布、國家分布、機(jī)構(gòu)分布、作者分布等外在特征,以及知識基礎(chǔ)與研究前沿進(jìn)行分析,并重點(diǎn)對圖書情報(bào)學(xué)科的193篇論文的研究熱點(diǎn)進(jìn)行深入剖析,得出如下結(jié)論:

        4.1 國外科研數(shù)據(jù)管理研究的外在特征

        ①學(xué)科領(lǐng)域廣泛,分布非常不均勻。計(jì)算機(jī)科學(xué)非?;钴S,其次是工程學(xué),圖書情報(bào)學(xué)、生物化學(xué)與分子生物學(xué)、電信、化學(xué)等學(xué)科基本相當(dāng)。②研究力量分布不平衡,美國遙遙領(lǐng)先,中德英三國實(shí)力相差不大。③研究機(jī)構(gòu)中歐洲核子研究組織排在首位,其余主要以高校為主體,美國高校表現(xiàn)突出,中國科學(xué)院排在第2位。④作者相對分散,尚未形成核心作者群。

        4.2 國外科研數(shù)據(jù)管理研究的知識基礎(chǔ)

        采用Citespace制作的文獻(xiàn)共被引時(shí)間線圖譜與采用VOSviewer軟件制作的文獻(xiàn)共被引標(biāo)簽視圖得出一致的結(jié)果,只是結(jié)果顯示的方式不同。文獻(xiàn)共被引時(shí)間線圖譜優(yōu)勢相對明顯,得到文獻(xiàn)的聚類標(biāo)簽以及聚類中文獻(xiàn)的數(shù)量。國外科研數(shù)據(jù)管理研究的參考文獻(xiàn)共有33個聚類,共被引頻次比較高的文獻(xiàn)主要分布在#27、#0和#10聚類。#27聚類與版權(quán)有關(guān),#0聚類與衛(wèi)生與健康科研數(shù)據(jù)有關(guān),#10聚類與傳感器網(wǎng)格增強(qiáng)有關(guān)。

        4.3 國外科研數(shù)據(jù)管理研究的研究前沿

        采用Citespace軟件制作的關(guān)鍵詞共現(xiàn)時(shí)區(qū)圖譜能夠揭示研究熱點(diǎn)以及隨年度變化的熱點(diǎn)演進(jìn)趨勢。國外科研數(shù)據(jù)管理研究主要分為三個階段:20世紀(jì)90年代的萌芽階段、2000~2008年的形成階段、2009~2016年的發(fā)展階段。VOSviewer軟件制作的關(guān)鍵詞共現(xiàn)標(biāo)簽視圖能夠顯示5個聚類:科學(xué)數(shù)據(jù)的產(chǎn)權(quán)以及用戶的權(quán)利與義務(wù)的#1聚類;包含數(shù)據(jù)歸檔、數(shù)據(jù)分析、數(shù)據(jù)組織、數(shù)據(jù)計(jì)算、數(shù)據(jù)查詢等科研數(shù)據(jù)基礎(chǔ)理論的#2聚類;用戶的科研數(shù)據(jù)需求調(diào)研與圖書館的科研數(shù)據(jù)管理服務(wù)基礎(chǔ)設(shè)施與服務(wù)內(nèi)容的#3聚類;科研數(shù)據(jù)管理在臨床醫(yī)學(xué)、生命健康領(lǐng)域的理論與實(shí)踐的#4聚類;科研數(shù)據(jù)管理在產(chǎn)品研發(fā)、設(shè)計(jì)、生成與銷售領(lǐng)域全過程的理論與實(shí)踐的#5聚類。

        4.4 國外圖書情報(bào)學(xué)科科研數(shù)據(jù)管理研究熱點(diǎn)

        關(guān)鍵詞 共現(xiàn)圖譜和共現(xiàn)標(biāo)簽視圖的結(jié)果顯示,國外圖書情報(bào)學(xué)科科研數(shù)據(jù)管理研究的熱點(diǎn)主要分為三個知識域。①科研數(shù)據(jù)管理理論研究,主要集中在數(shù)據(jù)政策、數(shù)據(jù)存儲、數(shù)據(jù)組織、數(shù)據(jù)共享四個方面。②科研數(shù)據(jù)管理服務(wù)研究,主要通過網(wǎng)絡(luò)調(diào)查法了解高校圖書館開展數(shù)據(jù)管理服務(wù)的現(xiàn)狀與問題,基本上分為兩個視角,一是從圖書館與圖書館員的角度出發(fā),探索科研數(shù)據(jù)管理在圖書館的定位、圖書館員的認(rèn)知和發(fā)揮的作用;二是從教師與科研人員的角度出發(fā),了解科研人員對數(shù)據(jù)管理活動的認(rèn)知、行為、需求等。③科研數(shù)據(jù)管理案例研究,大多停留在理論探索層次上,如數(shù)據(jù)存儲庫、科研人員的需求和圖書館員服務(wù)能力等,機(jī)構(gòu)知識庫則是數(shù)據(jù)管理的切入點(diǎn)和突破口。

        [1]National Science Board.Long-lived digital data collections:Enabling research and education in the 21stcentury(Draft)[R/OL].[2016-07-14].http://www.nsf.gov/nsb/documents/ 2005/LLDDC_report.pdf.

        [2]司莉,邢文明.國外科學(xué)數(shù)據(jù)管理與共享政策調(diào)查及對我國的啟示[J].情報(bào)資料工作,2013(1):61-66.

        [3]科技部:我國將實(shí)施科學(xué)數(shù)據(jù)共享工程[EB/OL].[2016-07-14].http://news.xinhuanet.com/zhengfu/2002-11/29/content_644161.htm.

        [4]國家科學(xué)數(shù)據(jù)中心建設(shè)技術(shù)規(guī)范[OL].[2016-07-14]. http://www.doc88.com/p-203229695148.html.

        [5]國家科技計(jì)劃項(xiàng)目科學(xué)數(shù)據(jù)匯交暫行辦法(草案)[OL].[2016-07-15].http://wenku.baidu.com/link?url=DusTYd_4 dgXuIS_G88sIwkAzGc5oM3CRzwx0EZcEWeiOtBh9Va2Xywzm_jhdeYkJVf-C97OnaLjBYJ-rma-H-5MnHuXYTap5E-bAXT0VwvVC.

        [6]科學(xué)數(shù)據(jù)分類規(guī)范與分類詞表[OL].[2016-07-15].http://www.docin.com/p-114236396.html.

        [7]國務(wù)院關(guān)于印發(fā)“十二五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃的通知[EB/OL].[2016-07-15].http://www.gov.cn/zwgk/2012-07/20/content_2187770.htm.

        [8]國務(wù)院關(guān)于印發(fā)“十二五”國家自主創(chuàng)新能力建設(shè)規(guī)劃的通知[EB/OL].[2016-07-15].http://www.gov.cn/zwgk/2013-05/29/content_2414100.htm.

        [9]國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動綱要的通知[EB/OL].[2016-07-15].http://www.gov.cn/zhengce/content/2015-09/05/ content_10137.htm.

        [10]五中全會,大數(shù)據(jù)戰(zhàn)略上升為國家戰(zhàn)略[EB/OL].[2016-07-15].http://www.cssn.cn/zx/bwyc/201511/t20151106_25 62302.shtml.

        [11]國家科技基礎(chǔ)條件平臺[OL].[2016-07-15].http://www. nstic.gov.cn/.

        [12]陜西省科學(xué)數(shù)據(jù)共享平[OL].[2016-07-15].http://www. snsd.gov.cn/Portal/index.jsp.

        [13]中國科學(xué)院數(shù)據(jù)云[OL].[2016-07-15].http://www.csdb. cn/.

        [14]復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺[OL].[2016-07-15].http:// dvn.fudan.edu.cn/dvn/.

        [15]高??茖W(xué)數(shù)據(jù)共享平臺[OL].[2016-07-15].http://sdm. lib.whu.edu.cn/jspui/.

        [16]北京大學(xué)開發(fā)研究數(shù)據(jù)平臺[OL].[2016-07-15].http:// opendata.pku.edu.cn/.

        [17]CiteSpace:Visualizing Patterns and Trends in Scientific Literature[EB/OL].[2016-06-15].http://cluster.cis.drexel.edu/~cchen/citespace/.

        [18]VOSviewer:Visualizing Scientific Landscapes[EB/OL].[2016-06-17].http://www.vosviewer.com/.

        [19]Tenopir C,Allard S,Douglass K,et al.Data Sharing by Scientists:Practices and Perceptions[J].PLOS ONE,2011,(6):e21101.

        [20]Savage C J,Vickers A J.Empirical Study of Data Sharing by Authors Publishing in PLoS Journals[J].PLOS ONE,2009,4(9):e7078.

        [21]Piwowar H A,Day R,F(xiàn)ridsma D B,et al.Sharing Detailed Research Data Is Associated with Increased Citation Rate[J].PLOS ONE,2007,2(3):e0308

        [22]Nelson B.Data sharing:Empty archives[J].Nature,2009,461(2761):160-163.

        [23]Liu D T,Xu X W.A review of web-based productdata managementsystems[J].Comput Ind 2001,44(3):251-262.

        [24]Alsheikhali A A,Qureshi W,Almallah M,et al.Public Availability of Published Research Data in High-Impact Journals[J].PLOS ONE,2011,6(9):e24357.

        [25]Elliott R.Who owns scientific data?The impact of intellectual property rights on the scientific publication chain[J]. Learned Publishing,2005,18(2):91-94.

        [26]Polk H C,Bowden T A,Rikkers L F,et al.Scientific data from clinical trials:investigators'responsibilities and rights[J].World Journal of Surgery,2002,26(6):637-638.

        [27]Miller M C,Reus J F,Matzke R P,et al.Enabling Interoperation of High Performance,Scientific Computing Applications:Modeling Scientific Data with the Sets&Fields(SAF)Modeling System[C]//International Conference on Conceptual Structures,2001:158-167.

        [28]Michel A,Junger A,Benson M,et al.A data model for managing drug therapy within a patient data management system for intensive care units[J].Computer Methods and Programs in Biomedicine,2003,70(1):71-79.

        [29]Aydinoglu A U,Suomela T,Malone J,et al.Data management in astrobiology:challenges and opportunities for an interdisciplinary community[J].Astrobiology,2014,14(6):451-461.

        [30]Antell K,F(xiàn)oote J B,Turner J,et al.Dealing with Data:Science Librarians’Participation in Data Management at Association of Research Libraries Institutions[J].College& Research Libraries,2014,75(4):557-574.

        [31]Fraccaro P,Dentone C,F(xiàn)enoglio D,et al.Multicentre clinical trials'data management:a hybrid solution to exploit the strengths of electronic data capture and electronic health records systems[J].Informatics for Health&Social Care,2013,38(4):313-329.

        [32]Omollo R,Ochieng M,Mutinda B,et al.Innovative Approaches to Clinical Data Management in Resource Limited Settings Using Open-Source Technologies[J].PLOS Neglected Tropical Diseases,2014,8(9):e3134.

        [33]Thames J L,Eck O,Schaefer D,et al.A Semantic Association Hardware Acceleration System for Integrated Product Data Management[J].Journal of Computing and Information Science in Engineering,2012,12(3):031009.

        [34]Qiu S Wang Y,Jin W,et al.Design and Implementation of a Project Management System Based on Product Data Management on the Baidu Cloud Computing Platform[C]//National Conference on Big Data Technology and Applications. Singapore:Springer Singapore,2015:144-154.

        [35]Sturges P,Bamkin M,Anders J H S,et al.Research data sharing:Developing a stakeholder-driven model for journal policies[J].Journal of the Association for Information Science and Technology,2015,66(12):2445-2455.

        [36]劉桂鋒,盧章平,阮煉.美國高校圖書館研究數(shù)據(jù)管理服務(wù)體系構(gòu)建及策略研究[J].大學(xué)圖書館學(xué)報(bào),2016(3):16-22.

        [37]Marcial L H,Hemminger B M.Scientific data repositories on the Web:An initial survey[J].Journal of the American Society for Information Science and Technology,2010,61(10):2029-2048.

        [38]Naum A.Research data storage and management:library staff participation in showcasing research data at the University of Adelaide[J].Australian Library Journal,2014,63(1):35-44.

        [39]Willis C,Greenberg J,White H.Analysis and synthesis of metadata goals for scientific data[J].Journal of the American Society for Information Science and Technology,2012,63(8):1505-1520.

        [40]Chao T C,Cragin M H,Palmer C L.Data Practices and Curation Vocabulary(DPCVocab):An empirically derived framework of scientific data practices and curatorial processes[J].Journal of the Association for Information Science and Technology,2015,66(3):616-633.

        [41]Mayernik M S.Research data and metadata curation as institutional issues[J].Journal of the Association for Informa-tion Science and Technology,2015,67(4):973-993.

        [42]Douglass K,Allard S,Tenopir C,et al.Managing scientific data as public assets:Data sharing practices and policies among full-time government employees[J].Journal of the Association for Information Science and Technology,2014,65(2):251-262.

        [43]Si L,Li Y,Zhuang X,et al.An empirical study on the performance evaluation of scientific data sharing platforms in China[J].Library Hi Tech,2015,33(2):211-229.

        [44]Corrall S,Kennan M A,Afzal W.Bibliometrics and research data management services:Emerging trends in library support for research[J].Library Trends,2013,61(3):636-674.

        [45]Si L,Xing W,Zhuang X,et al.Investigation and analysis of research data services in university libraries[J].The Electronic Library,2015,33(3):417-449.

        [46]Cox A M,Pinfield S.Research data management and libraries:Current activities and future priorities[J].Journal of Librarianship and Information Science,2014,46(4):299-316.

        [47]Tenopir C,Sandusky R J,Allard S,et al.Research data management services in academic research libraries and perceptions of librarians[J].Library&Information Science Research,2014,36(2):84-90.

        [48]J rn Nielsen H,Hj rland B.Curating research data:The potential roles of libraries and information professionals[J]. Journal of Documentation,2014,70(2):221-240.

        [49]Scaramozzino J M,Ramirez M,Mcgaughey K,et al.A Study of Faculty Data Curation Behaviors and Attitudes at a Teaching-Centered University[J].College&Research Libraries,2012,73(4):349-365.

        [50]Diekema A R,Wesolek A,Walters C D.The NSF/NIH effect:Surveying the effect of data management requirements on faculty,sponsored programs,and institutional repositories[J].The Journal of Academic Librarianship,2014,40(3):322-331.

        [51]Perry C M.Archiving of publicly funded research data:A survey of Canadian researchers[J].Government Information Quarterly,2008,25(1):133-148.

        [52]Whitmire A L,Boock M,Sutton S C,et al.Variability in academic research data management practices:implications for data services development from a faculty survey[J]. Program:Electronic Library and Information Systems,2015,49(4):382-407.

        [53]Choudhury G S.Case study in data curation at Johns Hopkins University[J].Library Trends,2008,57(2):211-220.

        [54]Hiom D,F(xiàn)ripp D,Gray S,et al.Research data management at the University of Bristol[J].Program:Electronic Library and Information Systems,2015,49(4):475-493

        [55]Wong G K W.Exploring research data hosting at the HKUST institutional repository[J].Serials Review,2009,35(3):125-132.

        [56]Mohammad H B.Exploring research data in Indian institutional repositories[J].Program:Electronic Library and Information Systems,2014,48(2):206-216.

        [57]Shen Y,Varvel V E.Developing data management services atthe Johns Hopkins University[J].The Journalof Academic Librarianship,2013,39(6):552-557.

        [58]Davidson J,Jones S,Molloy L,et al.Emerging good practice in managing research data and research information within UK Universities[J].Procedia Computer Science,2014:215-222.

        [59]Delserone L M.At the watershed:preparing for research data management and stewardship at the University of Minnesota Libraries[J].Library Trends,2008,57(2):202-210.

        [60]Kahn M,Higgs R,Davidson J,et al.Research Data Management in South Africa:How We Shape Up[J].Australian Academic&Research Libraries,2014,5(4):296-308.

        [61]Searle S,Wolski M,Simons N,et al.Librarians as partners in research data service development at Griffith University[J].Program:Electronic Library and Information Systems,2015,49(4):440-460.

        [62]Lage K,Losoff B,Maness J,et al.Receptivity to Library Involvement in Scientific Data Curation:A Case Study at the University of Colorado Boulder[J].Portal:Libraries and the Academy,2011,11(4):915-937.

        (責(zé)任編校田麗麗)

        Progress in Research Abroad on Research Data Management:Visualization Analysis Based on CiteSpace and VOSviewer

        Liu Guifeng1,Li Jie2,3
        1.Institute of Science and Technology Information,Jiangsu University, Zhenjiang 212013,China;2.Department of Safety Science and Engineering,Shanghai Maritime University, Shanghai 201306,China;3.Institute of Science&Technical Information,Shanghai Maritime University, Shanghai 201306,China

        Two thousand eight hundred and forty-nine papers on research data management included in Web of Science were studied with the information visualization analysis software of CiteSpace and VOSviewer from three aspects,namely the external characteristics of literature such as subjectdistribution,state distribution,institution distribution and author distribution,the knowledge base and the research frontier.Results show that the research abroad on research data management can be divided into three stages:embryonic stage(before the 1990s),formative stage(from 2000 to 2008)and development stage(from 2009 to 2016).Finally,we summarize three hot spots of research data management in library and informationscience in foreign countries,namely the theory of research data management,services of research data management and case study,in hope of providing guidance and reference for the research and practice ofresearch data managementin China.

        data science;research data management;research data;data service;information visualization;knowledge mapping

        G250

        劉桂鋒,男,1980年生,博士,副研究館員,碩士生導(dǎo)師,副所長,發(fā)表論文20余篇,主編教材1部;李杰,男,1987年生,博士,講師,發(fā)表論文50余篇,編著圖書3部。

        *本文系江蘇省博士后科研資助計(jì)劃項(xiàng)目“大數(shù)據(jù)輪動的圖書館學(xué)科服務(wù)創(chuàng)新研究”(項(xiàng)目編號:1402106C)的研究成果之一

        猜你喜歡
        分類
        2021年本刊分類總目錄
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        星星的分類
        我給資源分分類
        垃圾分類,你準(zhǔn)備好了嗎
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        按需分類
        教你一招:數(shù)的分類
        亚洲高清在线不卡中文字幕网| 亚洲国产成人久久三区| 欧美日韩不卡合集视频| 亚洲产在线精品亚洲第一站一| av网址大全在线播放| 亚洲av无一区二区三区| 国产成人精品白浆久久69| 中文字幕亚洲欧美日韩在线不卡| 国产精品亚洲专区无码不卡| 中文乱码字幕在线亚洲av| 在教室伦流澡到高潮hgl动漫| 女人夜夜春高潮爽a∨片| 国内精品视频成人一区二区| 国产精品自拍盗摄自拍| 国产精品av在线| 四虎影视一区二区精品| 精品国产福利一区二区三区| 日本午夜剧场日本东京热| 18黑白丝水手服自慰喷水网站| 在线中文字幕有码中文| 日韩精品一区二区三区四区视频| 精品国内日本一区二区| 果冻传媒2021精品一区 | 国产精品高清视亚洲乱码有限公司 | 国产美女在线精品免费观看| 亚洲电影一区二区三区 | 无码人妻精品一区二区三区夜夜嗨| 在线观看国产成人av片| 国产精品自线在线播放| 二区视频在线免费观看| 免费网站看v片在线18禁无码| 久久精品国产丝袜| 国产女主播在线免费看| 日本污ww视频网站| 2019年92午夜视频福利| 国产精品爽爽VA吃奶在线观看| 蜜桃a人妻精品一区二区三区| 亚洲精品乱码久久久久久蜜桃不卡| 国产国拍亚洲精品午夜不卡17| 国产三级不卡在线观看视频| 午夜免费视频|