傅天珍,鄭江平
國外面向科研人員的科學(xué)數(shù)據(jù)共享探析*
傅天珍,鄭江平
分析國外面向科研人員的科學(xué)數(shù)據(jù)共享研究現(xiàn)狀,得出科學(xué)數(shù)據(jù)共享意愿和行為具有四大特征:數(shù)據(jù)共享意愿和行為因研究背景而異,數(shù)據(jù)共享意愿與實(shí)際行為存在差距,數(shù)據(jù)再利用經(jīng)驗(yàn)與共享傾向相關(guān),數(shù)據(jù)共享途徑多樣化。闡述影響科研人員共享科學(xué)數(shù)據(jù)的五個(gè)因素,包括個(gè)人利益權(quán)衡、開放獲取的壓力、技術(shù)與標(biāo)準(zhǔn)問題、文化和法律因素、利他心理因素。提出圖書館應(yīng)參與科學(xué)數(shù)據(jù)管理,提供數(shù)據(jù)素養(yǎng)培訓(xùn)和技術(shù)支持。
科研人員 科學(xué)數(shù)據(jù)共享 開放獲取 圖書館
科學(xué)研究正步入數(shù)據(jù)密集型發(fā)現(xiàn)和合作共贏時(shí)代??茖W(xué)數(shù)據(jù)不再是純粹的研究結(jié)果,成為科學(xué)活動(dòng)的原料和動(dòng)力??茖W(xué)數(shù)據(jù)的共享和再利用被認(rèn)為是科技創(chuàng)新和知識發(fā)現(xiàn)的一個(gè)重要驅(qū)動(dòng)因素。然而“科學(xué)數(shù)據(jù)正在快速丟失,20年后80%的數(shù)據(jù)將不能獲取和使用”[1]??茖W(xué)數(shù)據(jù)的采集、保存、管理和共享已成為當(dāng)下緊迫和復(fù)雜的問題。本文通過對國外資料的分析,闡述科學(xué)數(shù)據(jù)管理和共享現(xiàn)狀、科研人員對科學(xué)數(shù)據(jù)共享的認(rèn)知和意愿及其影響因素,以期探索制約科學(xué)數(shù)據(jù)共享的關(guān)鍵性問題,找到解決問題的途徑。
國外對科研人員的科學(xué)數(shù)據(jù)共享態(tài)度的研究始于上世紀(jì)80年代。1982年Science雜志發(fā)表了對擴(kuò)大數(shù)據(jù)訪問權(quán)利、促進(jìn)科學(xué)思想自由交流的文章,引發(fā)人們對研究領(lǐng)域競爭性權(quán)益保護(hù)和傳統(tǒng)科學(xué)數(shù)據(jù)保密機(jī)制的反思[2]。1988年Ceci較系統(tǒng)地面向3所美國大學(xué)和美國國立衛(wèi)生研究院(NIH)的科研人員進(jìn)行跨學(xué)科、跨機(jī)構(gòu)的數(shù)據(jù)共享意愿調(diào)研,發(fā)現(xiàn)科研人員普遍愿意共享已出版成果的科學(xué)數(shù)據(jù),但大部分人表示難以獲取同行的數(shù)據(jù)[3]。真正面向科研人員科學(xué)數(shù)據(jù)共享問題的深入研究集中在近10年。歐美的信息或數(shù)據(jù)研究機(jī)構(gòu)、圖書館、社會(huì)政策研究所以及計(jì)算機(jī)、生物、心理等學(xué)科領(lǐng)域的專家合作,圍繞科研人員展開了深層次、多角度的調(diào)研。研究范圍涵蓋多學(xué)科、不同人群的全球性橫向調(diào)研,也有著眼于特定學(xué)科和研究團(tuán)隊(duì),貫穿整個(gè)研究生命周期的縱向分析。研究方法以問卷調(diào)查和用戶訪談為主,通過各類問題設(shè)計(jì),引導(dǎo)科研人員描述其科學(xué)數(shù)據(jù)管理和共享現(xiàn)狀、對共享的認(rèn)知和意愿、影響共享的因素以及希望得到的支持等[4-7],具體內(nèi)容如表1。其中不乏基于文獻(xiàn)計(jì)量的案頭調(diào)研。Wicherts等就對發(fā)表在美國心理學(xué)會(huì)(APA)的2個(gè)主要期刊上,且作者不愿共享原始數(shù)據(jù)的49篇論文中的1148個(gè)統(tǒng)計(jì)學(xué)結(jié)果進(jìn)行再分析,發(fā)現(xiàn)科研人員的共享意愿與數(shù)據(jù)質(zhì)量相關(guān)[8]。Piwowar則通過數(shù)據(jù)庫和網(wǎng)絡(luò)檢索“基因表達(dá)微陣列”相關(guān)原始數(shù)據(jù)的公開情況,并采用多元回歸法分析了影響作者數(shù)據(jù)共享的15項(xiàng)因素[9]。
表1 國外面向科研人員的主要調(diào)研內(nèi)容
2.1 數(shù)據(jù)共享意愿和行為因研究背景而異
科研人員的數(shù)據(jù)共享意愿和行為與特定的研究背景有關(guān),包括學(xué)科、年齡、研究生涯的不同階段等。目前氣候、生物、生態(tài)等學(xué)科領(lǐng)域擁有覆蓋整個(gè)數(shù)據(jù)生命周期的較完善的科學(xué)數(shù)據(jù)共享方式,因此科研人員對數(shù)據(jù)共享的認(rèn)同率非常高。而在醫(yī)學(xué)和社會(huì)科學(xué)領(lǐng)域,數(shù)據(jù)共享進(jìn)展緩慢。Tenopir等對全球不同學(xué)科的調(diào)查表明,90%的氣候?qū)W科研人員愿意在個(gè)人、機(jī)構(gòu)或全球性網(wǎng)絡(luò)共享數(shù)據(jù);86%的生物學(xué)和81%的環(huán)境、生態(tài)學(xué)人員則對科學(xué)數(shù)據(jù)的收集過程最為滿意;而僅17%的醫(yī)學(xué)和32%的社會(huì)科學(xué)人員同意將一部分?jǐn)?shù)據(jù)無條件存儲(chǔ)到數(shù)據(jù)倉儲(chǔ)庫[10]。醫(yī)學(xué)研究人員,特別是癌癥和人體實(shí)驗(yàn)研究領(lǐng)域還有越來越不愿共享數(shù)據(jù)的特征與趨勢[11]。
在年齡方面,年輕人更不愿無條件共享數(shù)據(jù),除擔(dān)心數(shù)據(jù)共享可能影響未來研究和成果發(fā)表外,他們也意識到科學(xué)進(jìn)步有賴于數(shù)據(jù)共享,但更傾向于數(shù)據(jù)的公平交換,希望增強(qiáng)數(shù)據(jù)再利用的知情權(quán),且給予適當(dāng)?shù)膱?bào)酬[12]。從研究生涯看,處于早期階段的研究人員更熱衷于共享數(shù)據(jù),希望自己的成果盡早被他人驗(yàn)證,以增強(qiáng)學(xué)術(shù)影響力。而經(jīng)驗(yàn)豐富的科研人員不愿過早公布數(shù)據(jù),以支撐后續(xù)研究之用[13]。
2.2 數(shù)據(jù)共享意愿與實(shí)際行為存在差距
科研人員對數(shù)據(jù)管理和共享普遍抱積極態(tài)度,而數(shù)據(jù)共享實(shí)踐卻不理想。Cragin等對生命科學(xué)領(lǐng)域20位專家進(jìn)行調(diào)研,發(fā)現(xiàn)只有5位曾把數(shù)據(jù)存儲(chǔ)到GeneBank上[14]。普渡大學(xué)水體質(zhì)量野外監(jiān)測站的科研人員則迫切希望公開科學(xué)數(shù)據(jù),然而因缺乏政策支持、數(shù)據(jù)管理標(biāo)準(zhǔn)不完善、不了解共享途徑等原因,可公開獲取的科學(xué)數(shù)據(jù)非常有限[15]。而主張數(shù)據(jù)共享的計(jì)算學(xué)、基因組學(xué)領(lǐng)域的科研人員則深為難以獲取他人數(shù)據(jù)所困擾。
盡管一些期刊和資助機(jī)構(gòu)推出強(qiáng)制性存繳政策,但科學(xué)數(shù)據(jù)共享仍差強(qiáng)人意。APA要求下屬刊物發(fā)表的論文必須共享科學(xué)數(shù)據(jù),然而即使多次保證所請求的數(shù)據(jù)不會(huì)用于公開發(fā)表或再利用,仍難以說服141位中的103個(gè)遞交原始數(shù)據(jù)[16]。Savage對PLos Medicine和PLoS Clinical Trials雜志論文中的科學(xué)數(shù)據(jù)公開情況進(jìn)行統(tǒng)計(jì),則發(fā)現(xiàn)問題更為糟糕[17]。
2.3 數(shù)據(jù)再利用經(jīng)驗(yàn)與共享傾向相關(guān)
研究人員利用他人數(shù)據(jù)的頻率與其數(shù)據(jù)共享意愿互為影響。多項(xiàng)調(diào)查顯示,相比曾經(jīng)使用他人數(shù)據(jù)的科研人員,無再利用經(jīng)驗(yàn)者的科學(xué)數(shù)據(jù)共享率更低。Piwowar在對影響基因表達(dá)微陣列數(shù)據(jù)共享因子分析中表示,有共享或再利用經(jīng)驗(yàn)的作者更可能共享數(shù)據(jù)[18]。Enke則對美國、歐盟和加拿大各國的生物多樣性領(lǐng)域進(jìn)行調(diào)研,發(fā)現(xiàn)愿意共享數(shù)據(jù)的科研人員中有63%曾有數(shù)據(jù)再利用經(jīng)驗(yàn),而不愿共享數(shù)據(jù)者中僅40%曾利用他人數(shù)據(jù)[19]。與數(shù)據(jù)共享類似,科研人員在利用他人數(shù)據(jù)時(shí)也存諸多顧慮,主要涉及數(shù)據(jù)質(zhì)量、數(shù)據(jù)采集方法、是否有同行評議、獲取渠道。其中年輕的科研人員和成就較大的科學(xué)家在利用他人數(shù)據(jù)時(shí)最為困難[20],這可能是他們不愿共享數(shù)據(jù)的原因之一。相反,共享經(jīng)驗(yàn)?zāi)艽龠M(jìn)數(shù)據(jù)再利用,但總體而言,科研人員更傾向于使用他人數(shù)據(jù)。
2.4 科學(xué)數(shù)據(jù)共享途徑多樣化
科研人員的科學(xué)數(shù)據(jù)共享途徑大致可以分成5類:公共數(shù)據(jù)倉儲(chǔ)庫、機(jī)構(gòu)知識庫、出版社網(wǎng)站、個(gè)人或團(tuán)隊(duì)網(wǎng)站、個(gè)人索取。公共數(shù)據(jù)倉儲(chǔ)庫功能相對完善,但僅限于一些學(xué)科,如基因序列數(shù)據(jù)庫GenBank、醫(yī)藥科學(xué)的Dryad、地理環(huán)境科學(xué)的Pangaea以及綜合性數(shù)據(jù)自由發(fā)布平臺Figshare等。這些數(shù)據(jù)倉儲(chǔ)庫為科學(xué)數(shù)據(jù)提供數(shù)字唯一標(biāo)識符(DOI),注重隱私保護(hù),且部分遵循創(chuàng)作共用許可協(xié)議,科研人員能夠長期、可信賴地保存科學(xué)數(shù)據(jù)。機(jī)構(gòu)知識庫則僅保存本機(jī)構(gòu)的科學(xué)數(shù)據(jù),其管理方式、數(shù)據(jù)引用規(guī)范、保存期限以及開放程度參差不齊。另外,也有少數(shù)專門為特定期刊建立的科學(xué)數(shù)據(jù)庫,如Ecological Archive[21],專門存儲(chǔ)美國生態(tài)學(xué)會(huì)所創(chuàng)辦期刊上發(fā)表的學(xué)術(shù)論文的相關(guān)科學(xué)數(shù)據(jù)。
相比獨(dú)立的數(shù)據(jù)倉儲(chǔ)或機(jī)構(gòu)庫,一些研究人員表示更喜歡隨同學(xué)術(shù)論文,以補(bǔ)充文件形式在出版社網(wǎng)站發(fā)表或鏈接的數(shù)據(jù)集。一些沒有公共數(shù)據(jù)倉儲(chǔ)庫的學(xué)科或者團(tuán)隊(duì)內(nèi)部的交流,則通過個(gè)人網(wǎng)站、實(shí)驗(yàn)室數(shù)據(jù)庫或Email、Ftp服務(wù)器等方式共享科學(xué)數(shù)據(jù)。在數(shù)據(jù)類型方面,生物、生態(tài)、環(huán)境工程等學(xué)科偏向于共享原始數(shù)據(jù),化學(xué)、物理、農(nóng)業(yè)等學(xué)科則偏向共享經(jīng)過處理的數(shù)據(jù)[22]。
3.1 個(gè)人利益權(quán)衡
3.1.1 預(yù)期效益驅(qū)動(dòng)
科研人員在共享科學(xué)數(shù)據(jù)之前,會(huì)權(quán)衡共享帶來的利弊。一些科研人員相信,共享自己的科學(xué)數(shù)據(jù)能夠提升工作效率和個(gè)人學(xué)術(shù)影響力[23],具體包括:證明自己研究數(shù)據(jù)的質(zhì)量,提高個(gè)人科研水平的可見度;他人的驗(yàn)證、比較或引用,能提高個(gè)人及所在研究機(jī)構(gòu)的聲譽(yù);促進(jìn)與其他科研人員的交流和合作,吸引更多的科研資助者及合作伙伴;更有效地管理數(shù)據(jù),確保長期保存并保證數(shù)據(jù)的完整性;更方便、快捷地利用原始數(shù)據(jù),為后續(xù)研究節(jié)省時(shí)間和精力等。密歇根州立大學(xué)基因組學(xué)的助理教授Brown希望自己所有的數(shù)據(jù)可公開獲取。在接受同行評審前,他便公開軟件源代碼并預(yù)發(fā)表論文,結(jié)果很快吸引了一批科研資助者和學(xué)生[24]。
3.1.2 風(fēng)險(xiǎn)和成本顧慮
感知風(fēng)險(xiǎn)和成本問題一直阻礙著科研人員與他人分享數(shù)據(jù)。Ceci在1988年便發(fā)現(xiàn)無論生物還是社會(huì)科學(xué)領(lǐng)域,科研人員都擔(dān)心共享會(huì)減少或失去成果的發(fā)表機(jī)會(huì)[25]。隨后,諸多研究分析了科研人員不愿共享的因素,從個(gè)人利益來看,主要有如下考慮:(1)擔(dān)心減少或失去出版機(jī)會(huì)。科研人員在收集數(shù)據(jù)上花費(fèi)了大量時(shí)間和精力,希望保持?jǐn)?shù)據(jù)的獨(dú)有性,并盡可能多地出版成果;(2)擔(dān)心數(shù)據(jù)被盜用或后續(xù)研究的思路被發(fā)現(xiàn)。大部分科研人員只愿意在成果發(fā)表或后續(xù)研究完成一段時(shí)間后發(fā)布數(shù)據(jù);(3)擔(dān)心數(shù)據(jù)被曲解和誤用。由于缺乏專業(yè)知識、收集方法注釋缺失等問題,很容易造成對數(shù)據(jù)點(diǎn)的選擇性提取或誤讀;(4)擔(dān)心數(shù)據(jù)的質(zhì)量問題,害怕分析結(jié)果引起爭議;(5)因缺乏科學(xué)數(shù)據(jù)引用的相關(guān)評價(jià)機(jī)制,擔(dān)心數(shù)據(jù)共享無法得到回報(bào);(6)時(shí)間、人力、經(jīng)費(fèi)的缺乏;(7)數(shù)據(jù)具有潛在經(jīng)濟(jì)價(jià)值,希望用于商業(yè)運(yùn)作。
3.2 開放獲取的壓力
隨著開放獲取運(yùn)動(dòng)的興起,科研人員也受到來自資助機(jī)構(gòu)、期刊出版社、私人基金組織以及開放獲取先驅(qū)者等各方面的壓力,通過強(qiáng)制或鼓勵(lì)性政策要求數(shù)據(jù)共享,支持公共資助的研究結(jié)果為公眾所用。NIH自2003年以來就要求科研人員遞交科學(xué)數(shù)據(jù)共享計(jì)劃。隨后,美國國家科學(xué)基金會(huì)(NSF)、英國研究理事會(huì)(RCUK)等均要求共享其資助項(xiàng)目的科學(xué)數(shù)據(jù)。2013年3月美國、澳大利亞政府和歐洲聯(lián)盟委員會(huì)共同組織創(chuàng)建了研究數(shù)據(jù)聯(lián)盟(RDA),以加快國際數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)新和發(fā)現(xiàn)。即使在最不愿共享的臨床醫(yī)學(xué)領(lǐng)域,一些研究基金、醫(yī)藥監(jiān)管機(jī)構(gòu)和公司也推出了一系列共享政策,如歐洲藥品局、比爾及梅林達(dá)·蓋茨基金會(huì)等[26]。越來越多的科技期刊制定了詳細(xì)并嚴(yán)格的數(shù)據(jù)存繳政策。Physiological Genomics雜志還曾公布作者對基因表達(dá)微陣列數(shù)據(jù)的共享態(tài)度和經(jīng)驗(yàn)評估報(bào)告,從而一定程度上提高了科學(xué)數(shù)據(jù)的共享率[27]。隨著科學(xué)界同行數(shù)據(jù)共享經(jīng)驗(yàn)的增加,利用他人數(shù)據(jù)的期望相應(yīng)增強(qiáng),這促使科研人員之間相互督促和模仿。機(jī)構(gòu)領(lǐng)導(dǎo)人的開放獲取意識也成為科學(xué)數(shù)據(jù)共享的重要推動(dòng)力。一些研究者甚至將數(shù)據(jù)共享作為他們職業(yè)生涯的重要使命之一。
3.3 技術(shù)和標(biāo)準(zhǔn)問題
良好并規(guī)范的元數(shù)據(jù)描述標(biāo)準(zhǔn)、數(shù)據(jù)組織和標(biāo)注流程、數(shù)據(jù)倉儲(chǔ)的可用性等被認(rèn)為是科學(xué)數(shù)據(jù)管理和共享的基礎(chǔ)條件。然而,目前大部分學(xué)科都缺乏結(jié)構(gòu)化、規(guī)范的數(shù)據(jù)管理和保存框架,數(shù)據(jù)共享局限于小范圍的非正式途徑。即使在部分已經(jīng)建立較完善數(shù)據(jù)倉儲(chǔ)庫的生物、化學(xué)領(lǐng)域,科研人員也面臨數(shù)據(jù)標(biāo)準(zhǔn)的困境[28]。不同機(jī)構(gòu)或數(shù)據(jù)庫都遵從各自的標(biāo)準(zhǔn),科技期刊的數(shù)據(jù)存繳政策則大多缺少元數(shù)據(jù)標(biāo)準(zhǔn)、長期保存格式要求,導(dǎo)致科學(xué)數(shù)據(jù)難以理解或再利用。2012年,在牛津大學(xué)和哈佛干細(xì)胞研究所的帶領(lǐng)下,全球超過30個(gè)科學(xué)組織的50余名成員達(dá)成共同制定數(shù)據(jù)標(biāo)準(zhǔn)的意識,期望對不同領(lǐng)域完全不同的數(shù)據(jù)進(jìn)行一致描述[29]。
科研人員的個(gè)人IT素養(yǎng)以及網(wǎng)絡(luò)基礎(chǔ)設(shè)施也在數(shù)據(jù)共享方面發(fā)揮重要作用。科研人員期望能夠在功能強(qiáng)大、界面友好、操作便捷并能安全存儲(chǔ)的數(shù)據(jù)平臺上保存數(shù)據(jù)。Enke調(diào)研發(fā)現(xiàn),大部分生物多樣性領(lǐng)域的科研人員希望平臺提供規(guī)范、詳細(xì)的數(shù)據(jù)再利用指南,顯示數(shù)據(jù)使用歷史、實(shí)時(shí)通知作者數(shù)據(jù)瀏覽或使用情況等。他們還提出數(shù)據(jù)門戶的優(yōu)化建議,希望提供大型數(shù)據(jù)集的計(jì)算統(tǒng)計(jì)及在線工作功能[30]。
3.4 文化和法律因素
科學(xué)數(shù)據(jù)共享的壁壘還體現(xiàn)在數(shù)據(jù)的法律狀態(tài)以及科研人員的法律意識、倫理考量和文化背景方面。一些私人和政府資助機(jī)構(gòu)明確限制其專項(xiàng)經(jīng)費(fèi)下產(chǎn)生數(shù)據(jù)的共享,將數(shù)據(jù)確定為機(jī)密級情報(bào),如制藥公司和軍事研究機(jī)構(gòu)[31]。在工程領(lǐng)域,當(dāng)數(shù)據(jù)涉及商業(yè)利益或?qū)@芯?,?shù)據(jù)的獲取也受嚴(yán)格限制。心理學(xué)、人類疾病研究等則涉及倫理道德,未經(jīng)研究對象的同意,不能公開科學(xué)數(shù)據(jù)。同時(shí),科研人員所處的國家、地域以及機(jī)構(gòu)文化也深深影響其數(shù)據(jù)管理行為和共享意愿。美國科研領(lǐng)域最早呼吁開放獲取,聯(lián)邦法不再保護(hù)政府機(jī)構(gòu)產(chǎn)生數(shù)據(jù)的版權(quán)。歐洲政府產(chǎn)生的數(shù)據(jù)一般不納入公眾領(lǐng)域,且數(shù)據(jù)庫法的限制也更多[32]。鑒于此種情況,美國科研人員也顯示出比歐盟國家更積極的共享態(tài)度。此外,大部分科研人員都習(xí)慣于沿襲機(jī)構(gòu)或?qū)嶒?yàn)室的傳統(tǒng)文化,數(shù)據(jù)管理和共享最佳實(shí)踐的開展也顯得緩慢。
3.5 利他心理因素
臨床應(yīng)用單光子發(fā)射計(jì)算機(jī)化斷層顯像(SPECT)對T2DM患者的腦血流研究發(fā)現(xiàn),其腦血流減低主要存在于額葉,頂葉以及顳葉的部分區(qū)域,相關(guān)分析顯示認(rèn)知損害主要與判斷力以及記憶力有關(guān)。T2DM患者在磁共振影像學(xué)檢查和韋氏量表檢測認(rèn)知功能正常正常的情況下,正電子發(fā)射計(jì)算機(jī)斷層顯像(PET)檢查可見部分腦區(qū)葡萄糖利用率的降低,主要分布于額,顳葉[5]。而在鏈脲佐菌素(STZ)誘導(dǎo)的糖尿病大鼠在出現(xiàn)認(rèn)知功能障礙后,PET檢查顯示其在海馬區(qū)的腦血流量減少較健康對照組約30%,而在下丘腦區(qū)減少達(dá)到37%[6]。
科學(xué)數(shù)據(jù)關(guān)乎研究成果的發(fā)表和個(gè)人榮譽(yù)的提升,幾乎所有的科研人員在準(zhǔn)備共享數(shù)據(jù)前都會(huì)權(quán)衡其中的利弊得失。然而Kim發(fā)現(xiàn),利他心理因素也很大程度上驅(qū)動(dòng)著科學(xué)數(shù)據(jù)的共享[33]。一些科研人員期望在科學(xué)界形成“合作競爭”“利他競爭”的良性學(xué)術(shù)交流和傳播。他們相信,共享科學(xué)數(shù)據(jù)能夠避免重復(fù)研究,綜合利用他人數(shù)據(jù)能加快科學(xué)發(fā)現(xiàn)和創(chuàng)新,有利于研究能力的提升和科學(xué)的發(fā)展。同時(shí),科研人員也能通過共享帶來實(shí)現(xiàn)自我價(jià)值的滿足感。研究還發(fā)現(xiàn),除了一些倡導(dǎo)開放獲取的先驅(qū)者,成就越高的科研人員利他心越大。
數(shù)據(jù)驅(qū)動(dòng)學(xué)術(shù)的時(shí)代,促使圖書館重新思考和定位其角色與責(zé)任。2006年美國研究圖書館協(xié)會(huì)(ARL)舉辦主題為“新的合作關(guān)系:學(xué)術(shù)圖書館在數(shù)字?jǐn)?shù)據(jù)宇宙中的作用”的研討會(huì),觸發(fā)圖書館界對參與數(shù)據(jù)管理和共享新角色的討論[34]。如今越來越多的國內(nèi)外圖書館開始關(guān)注,并通過現(xiàn)狀調(diào)研、政策指引以及角色探索等提供相應(yīng)數(shù)據(jù)服務(wù)。同時(shí)科研人員本身也對圖書館提出了科學(xué)數(shù)據(jù)服務(wù)的新要求。
(1)提供數(shù)據(jù)素養(yǎng)教育和技能指南,增強(qiáng)科研人員的科學(xué)數(shù)據(jù)共享意識和能力。大量調(diào)查表明,科研人員缺乏系統(tǒng)的科學(xué)數(shù)據(jù)管理、共享和再利用知識,對科學(xué)數(shù)據(jù)獲取和共享渠道、數(shù)據(jù)管理規(guī)范以及法律狀態(tài)模棱兩可。圖書館擁有信息組織和管理的優(yōu)勢,可以提供數(shù)據(jù)發(fā)現(xiàn)和獲取、數(shù)據(jù)管理和組織、元數(shù)據(jù)描述、數(shù)據(jù)保存和互操作、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)可視化和再利用等技能的數(shù)據(jù)素養(yǎng)教育,包括個(gè)別輔導(dǎo)、講座和研討會(huì)以及嵌入整個(gè)數(shù)據(jù)生命周期的咨詢和指導(dǎo)。麻省理工學(xué)院、威斯康星大學(xué)麥迪遜分校、愛丁堡大學(xué)等則建立導(dǎo)引網(wǎng)站,提供各種數(shù)據(jù)管理和發(fā)布相關(guān)的自助指南,幫助科研人員尤其是研究生、博士后等年輕科研工作者學(xué)習(xí)數(shù)據(jù)管理、獲取和發(fā)布的方法,減輕研究團(tuán)隊(duì)的培訓(xùn)壓力[35]。
(2)提供數(shù)據(jù)管理和存檔服務(wù),希望建立數(shù)據(jù)服務(wù)系統(tǒng)。大部分科研人員為管理和共享科學(xué)數(shù)據(jù)所需耗費(fèi)的精力和時(shí)間所困擾。伊利諾伊大學(xué)的幾位作物學(xué)家指出,科學(xué)數(shù)據(jù)庫的選擇、數(shù)據(jù)上傳格式和方法的學(xué)習(xí)、對學(xué)生上傳數(shù)據(jù)的審核等面臨挑戰(zhàn),希望圖書館或其他部門能發(fā)揮數(shù)據(jù)上傳、質(zhì)量把關(guān)和數(shù)據(jù)維護(hù)的職能。他們認(rèn)為,由圖書館替代科研人員管理和維護(hù)科學(xué)數(shù)據(jù)將體現(xiàn)“顯著優(yōu)勢”,不僅能節(jié)省科研人員的時(shí)間和精力,還能鼓勵(lì)不愿共享的學(xué)科進(jìn)行數(shù)據(jù)共享,資助機(jī)構(gòu)也將更信任存檔數(shù)據(jù)的質(zhì)量,同時(shí)方便科研團(tuán)隊(duì)進(jìn)行自檢和統(tǒng)計(jì)[36]。此外,針對很多學(xué)科沒有相應(yīng)的數(shù)據(jù)倉儲(chǔ)庫,或出版商不支持補(bǔ)充文件的發(fā)布,科研人員希望圖書館能提供功能完善的科學(xué)數(shù)據(jù)系統(tǒng)。一些大學(xué)積極拓展機(jī)構(gòu)知識庫的功能,并通過開辟存儲(chǔ)空間、提供協(xié)作工具等方式為該??蒲腥藛T提供數(shù)據(jù)長期保存、訪問和引用服務(wù),如賓夕法尼亞州立大學(xué)的Scholar-Sphere和普渡大學(xué)學(xué)術(shù)典藏(PURR)[37]。
隨著數(shù)據(jù)洪流時(shí)代到來,科學(xué)數(shù)據(jù)共享備受推崇,也飽受爭議。雖然各類鼓勵(lì)或強(qiáng)制性政策激增,但生產(chǎn)數(shù)據(jù)的科研人員的認(rèn)知、意愿和行為依然是共享科學(xué)數(shù)據(jù)的關(guān)鍵所在。國外通過面向科研人員的廣泛調(diào)研和分析,共享數(shù)據(jù)的動(dòng)機(jī)和障礙逐步清晰,然而主體認(rèn)知隨環(huán)境的變化、不同學(xué)科的最佳共享實(shí)踐、適合的數(shù)據(jù)服務(wù)模式以及政策法規(guī)的制定等方面仍有待深入探討。
參考文獻(xiàn)
[1]Elizabeth Gibney,Richard Van Noorden.Scientists losing data at a rapid rate[EB/OL].[2014-06-03].http://www.nature.com/news/scientists-losing-data-ata-rapid-rate-1.14416.
[2]Dorothy Nelkin.Intellectual Property:The Control of Scientific Informations[J].Science,1982,216:704-708.
[3][25]Stephen J.Ceci.Scientists'Attitudes toward Data Sharing[J].Science,Technology&Human Values,1988,13(1/2):45-52.
[4][10][12]Carol Tenopir,Suzie Allard,Kimberly Douglass,et al.Data Sharing by Scientists:Practices and Perceptions[J].PLoSOne,2011,6(6):e21101.
[5][15]Jake Carlson,Marianne Stowell-Bracke.Data Management and Sharing from the Perspective of Graduate Students:An Examination ofthe Culture and Practice at the Water Quality Field Station[J].Libraries and the A-cademy,2013,13(4):343-361.
[6][19][30]Neela Enke,Anne Thessen,Kerstin Bach,et al. The user's view on biodiversity data sharing—Investigating facts of acceptance and requirements to realize a sustainable use of research data[J].Ecological Informatics,2012,11:25-33.
[7][36]Sarah C.Williams.Data Sharing Interviews with Crop Sciences Faculty:Why They Share Data and How the Library Can Help[EB/OL].[2014-05-12].http:// www.istl.org/13-spring/refereed2.html.
[8]Jelte M.Wicherts,Marjan Bakker,Dylan Molenaar. Willingness to Share Research Data Is Related to the Strength of the Evidence and the Quality of Reporting of Statistical Results[J].PLoS One,2011,6(11):e26828.
[9][18][27]Heather A.Piwowar.Who Shares?Who Doesn’t?Factors Associated with Openly Archiving Raw Research Data[J].PLoS One,2011,6(7):e18657.
[11][20][24]Victoria Schlesinger.Scientists threatened by demands to share data[EB/OL].[2014-05-12].http:// america.aljazeera.com/articles/2013/10/10/scientiststhreatenedbydemandstosharedata.html.
[13]Howard Amos,Maude Frances,Tom Ruthven.A study into how researchers at the University of New South Wales use an d share research data[EB/OL]. [2014-05-12].http://docs.lib.purdue.edu/iatul2010/ conf/day1/1/.
[14]MelissaH.Cragin,Carole L.Palmer,Jacob R.Carlson. Data sharing,small science and institutional repositories [J].Philosophical Transactions of the Royal Society A,2010,368:4023-4038.
[16]Wicherts Jelte M,Borsboom Denny,Kats Judith,et al. The poor availability of psychological research data for reanalysis[J].American Psychologist,2006,61(7):726.
[17]Caroline J.Savage,Andrew J.Vickers.Empirical study of data sharing by authors publishing in PLoS journals[J]. PloSone.2009,4(9):e7078.
[21]Ecological Archives[EB/OL].[2014-06-02].http:// esapubs.org/archive.
[22][31][33]Youngseek Kim,Jeffrey M.Stanton.Institutional and Individual Influences on Scientists’Data Sharing Practices[J].Journal of Computational Science Education,2012,3(1):47-56.
[23]Adrian Mulligan,Michael Mabe.The effect of the internet on researcher motivations,behaviour and attitudes[J].Journal of Documentation,2011,67(2):290-311.
[26][34][35]Jeonghyun Kim.Data sharing and its implications for academic libraries[J].New Library World,2013,114(11/12):494-506.
[28]Susanna-Assunta Sansone,Philippe Rocca-Serra,Dawn Field,et al.Toward interoperable bioscience data [J].NatGenet,2012,44(2):121-126.
[29]Oxford,Harvard Scientists Lead Data-Sharing Effort:ISA Commons and BioSharing[EB/OL].[2014-05-20]. http://blog.biosharing.org/2012/01/oxford-harvardscientists-lead-data.html.
[32]Christine L.Borgman.The Conundrum of Sharing Research Data[J].Journal of the American Society for Information Science and Technology,2012,63(6):1059-1078.
[37]Carly C.Dearborn,Amy J.Barton,Neal A.Harmeyer. The Purdue University Research Repository[J].OCLC Systems&Services,2014,30(1):15-27.
Probing into Scientific Data Sharing Problems Oriented to Researchers Abroad
FU Tian-zhen,ZHENG Jiang-ping
Based on the review of studies on scientific data sharing oriented to researchers abroad,some characteristics of researchers’willingness and behavior toward scientific data sharing are found as follows:data sharing willingness and behavior varies due to different research backgrounds,a gap exists between data sharing willingness and actual behavior,and data reuse experiences are related to the sharing preference,data sharing ways are various.Meanwhile,the factors influencing data sharing are introduced from five perspectives,including personal interests,the pressure of open access,technology and standards issues,cultural and legal factors and altruism.Libraries can play a role in scientific data management,data literacy training and technical supporting.
researcher;scientific data sharing;open access;library
格式 傅天珍,鄭江平.國外面向科研人員的科學(xué)數(shù)據(jù)共享探析[J].圖書館論壇,2015(2):76-81.
傅天珍(1982-),女,碩士,浙江大學(xué)圖書館館員;鄭江平(1966-),女,浙江大學(xué)圖書館副研究館員。
2014-07-25
*本文系浙江省科技計(jì)劃項(xiàng)目“科學(xué)數(shù)據(jù)開放共享機(jī)制與政策保障研究”(項(xiàng)目編號:2013C35009)研究成果之一