孔曄晗 張瀟月 李宜展
(1.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所 北京 100081)
(2.北京大學(xué)信息管理系 北京 100871)
(3.中國科學(xué)院文獻情報中心 北京 100190)
(4.中國科學(xué)院大學(xué)經(jīng)濟與管理學(xué)院信息資源管理系 北京 100190)
開放科研數(shù)據(jù)的發(fā)展,促進可用的科研數(shù)據(jù)體量增多??蒲腥藛T在數(shù)據(jù)重用時面臨高質(zhì)量數(shù)據(jù)獲取難、數(shù)據(jù)重用可靠性評估難、重用規(guī)范不了解、重用技術(shù)匱乏等困難。這些困難嚴(yán)重阻礙了開放科研數(shù)據(jù)的可持續(xù)發(fā)展。高校圖書館在推進數(shù)據(jù)開放共享方面發(fā)揮了重要作用,國外科研實力較具優(yōu)勢的高校圖書館已著手面向數(shù)據(jù)重用實踐開展全流程服務(wù)。我國在科學(xué)數(shù)據(jù)管理服務(wù)方面也取得了一些進展,但在提供數(shù)據(jù)重用服務(wù)方面仍面臨巨大挑戰(zhàn)。為有效促進我國開放科研數(shù)據(jù)實踐可持續(xù)推進,充分釋放科研數(shù)據(jù)價值,有必要通過系統(tǒng)性梳理國外高校圖書館典型數(shù)據(jù)重用服務(wù)進展,為我國高校圖書館數(shù)據(jù)重用服務(wù)推行提供參考。
科研數(shù)據(jù)重用即數(shù)據(jù)重復(fù)利用或稱二次使用,是指科研人員對既有數(shù)據(jù)除原始創(chuàng)建/采集目的以外的使用活動。數(shù)據(jù)的再利用、重組與融合有助于驗證實驗結(jié)果,支持新的知識發(fā)現(xiàn),是創(chuàng)新發(fā)現(xiàn)的重要源泉。國際上,美、英、澳等國家較早開展科研數(shù)據(jù)管理,其科研資助機構(gòu)均提出了科研數(shù)據(jù)管理政策。國內(nèi)主要從行業(yè)和部委角度統(tǒng)一組織科學(xué)數(shù)據(jù)管理與共享[1]。我國于2018 年3 月發(fā)布《科學(xué)數(shù)據(jù)管理辦法》,確立政府預(yù)算資金資助形成的科學(xué)數(shù)據(jù)“開放為常態(tài)、不開放為例外”的總體原則,為我國開展科研數(shù)據(jù)重用活動提供數(shù)據(jù)內(nèi)容資源[2]。但實踐中,我國高校圖書館界仍存在數(shù)據(jù)重用政策、配套服務(wù)發(fā)展進度較緩、各高校間發(fā)展不均衡的現(xiàn)狀,難以滿足當(dāng)前數(shù)據(jù)重用實踐發(fā)展的現(xiàn)實需求。
隨著科研數(shù)據(jù)的規(guī)模大幅提升、種類日益豐富,科研人員迫切需要有關(guān)科研數(shù)據(jù)重用的指導(dǎo)。《開放數(shù)據(jù)報告(2022 年)》對全球超過5400 名受訪者的調(diào)查顯示,55%的受訪者希望獲得關(guān)于數(shù)據(jù)訪問、分享和重用政策的培訓(xùn)或信息,52%的受訪者希望提高長期存儲和數(shù)據(jù)管理技能[3]。從國內(nèi)外實踐來看,科研數(shù)據(jù)管理和服務(wù)是高校圖書館的主要任務(wù)之一[4],但我國高校圖書館提供科研數(shù)據(jù)管理(Research Data Management,RDM)服務(wù)起步較晚,且發(fā)展速度待提升。聯(lián)合國教科文組織《開放科學(xué)倡議書》中著重提及開放數(shù)據(jù)需以方便用戶、人機可讀和可操作的格式提供,輔以定期管護。再次確認(rèn)數(shù)據(jù)重用在整個開放數(shù)據(jù)中的關(guān)鍵地位以及數(shù)據(jù)重用服務(wù)的作用。數(shù)據(jù)重用服務(wù)主要包括幫助查找外部數(shù)據(jù)知識庫(或提供數(shù)據(jù)存儲服務(wù))、創(chuàng)建高質(zhì)量配套元數(shù)據(jù)、提供引用數(shù)據(jù)的指南服務(wù)[5]、提供數(shù)據(jù)質(zhì)量控制的相關(guān)培訓(xùn)與指南服務(wù)[6]、提供數(shù)據(jù)版權(quán)和合理使用的咨詢服務(wù)等??傮w來看,國外高校圖書館已經(jīng)通過多種渠道對開放科學(xué)理念和數(shù)據(jù)服務(wù)進行推廣,并建立相關(guān)社團[7]。目前國內(nèi)雖已有相關(guān)研究對國外高校圖書館的RDM 服務(wù)進行調(diào)研,但結(jié)果表明,提供數(shù)據(jù)存儲最多,其次是數(shù)據(jù)共享,再次是數(shù)據(jù)組織、數(shù)據(jù)引用,涉及數(shù)據(jù)重用最少。
在國內(nèi)外科研數(shù)據(jù)中心如火如荼建設(shè)的背景下,研究人員面臨著獲取高質(zhì)量的數(shù)據(jù)(數(shù)據(jù)重用的可靠性)、評估重用數(shù)據(jù)的質(zhì)量和價值、遵循重用規(guī)范與掌握數(shù)據(jù)重用技術(shù)方面的挑戰(zhàn)。國內(nèi)對數(shù)據(jù)重用的需求日益高漲,但目前僅有零星且缺乏體系化的服務(wù)方式介紹,難以有效將“數(shù)據(jù)重用”“數(shù)字學(xué)術(shù)”“開放科學(xué)”相關(guān)主題下的內(nèi)容整合在科研生命周期的范圍內(nèi)。過去幾年,國內(nèi)學(xué)者對美國、澳大利亞、加拿大、英國、荷蘭、德國等國家的高校圖書館RDM 服務(wù)進行了調(diào)研,已有調(diào)研發(fā)現(xiàn)2015 年以后國外發(fā)達(dá)國家的高校圖書館已開始著手在科研數(shù)據(jù)管理服務(wù)中布局?jǐn)?shù)據(jù)重用的系列服務(wù)內(nèi)容[8]。這種現(xiàn)象的產(chǎn)生,不乏對科研數(shù)據(jù)管理領(lǐng)域中具有標(biāo)志性事件的響應(yīng)。如2016 年較為有標(biāo)志性的事件——開展規(guī)模較大的(國際)“愛數(shù)據(jù)周(Love data week)”,科學(xué)數(shù)據(jù)管理FAIR 原則的正式確立,并將用戶和機器可讀數(shù)據(jù)的可重用性作為其中一項重要內(nèi)容[9-10]。為有效地配合我國高等教育機構(gòu)培養(yǎng)“數(shù)字學(xué)術(shù)”“數(shù)據(jù)科學(xué)”環(huán)境適應(yīng)人才的趨勢,進一步推進“開放科學(xué)”的發(fā)展理念落地,我國高校圖書館提供數(shù)據(jù)重用服務(wù)勢在必行。
通過綜合比較,當(dāng)前美國高校圖書館在參與科研數(shù)據(jù)管理、促進知識資源開放共享、建立標(biāo)準(zhǔn)化科研數(shù)據(jù)管理模式方面已有良好實踐,相關(guān)機制較為完善。為此,本文通過調(diào)研美國高校圖書館的科研數(shù)據(jù)重用服務(wù),總結(jié)其提高科研數(shù)據(jù)重用的有效服務(wù)途徑和策略,以期為國內(nèi)高校圖書館促進數(shù)據(jù)開放共享和重用提供參考。
現(xiàn)有文獻多次對U.S.News 排名前50 所的美國高校圖書館進行調(diào)研,圖書館個案研究也多有覆蓋,但研究主要集中于科學(xué)數(shù)據(jù)管理、數(shù)據(jù)權(quán)益管理等主題,鮮有研究從全流程視角梳理數(shù)據(jù)重用服務(wù)。因此,本文面向U.S.News(2022-2023 年版)排名前50 所的美國高校圖書館,搜索其網(wǎng)站中關(guān)于數(shù)據(jù)重用的服務(wù)介紹,調(diào)研內(nèi)容包括數(shù)據(jù)重用服務(wù)內(nèi)容和服務(wù)方式。基于數(shù)據(jù)生命周期模型和已有研究中對數(shù)據(jù)重用過程框架的梳理[11-12],將服務(wù)內(nèi)容梳理為如下幾個階段:數(shù)據(jù)獲取、數(shù)據(jù)分析、數(shù)據(jù)存儲、數(shù)據(jù)出版與數(shù)據(jù)重用激勵(各階段的主要描述見表1)。
表1 美國高校圖書館數(shù)據(jù)重用服務(wù)調(diào)研框架
隨著科研數(shù)據(jù)管理的政策、服務(wù),以及相關(guān)區(qū)域性數(shù)據(jù)監(jiān)管協(xié)作網(wǎng)絡(luò)[14]的建立,美國高校圖書館開展的數(shù)據(jù)重用服務(wù)也在逐漸深化與豐富,內(nèi)嵌于整個科研生命周期。通過網(wǎng)絡(luò)調(diào)研將美國高校圖書館數(shù)據(jù)重用服務(wù)按照發(fā)展實踐環(huán)節(jié)呈述視角進行梳理,以下詳述。
調(diào)研對象中絕大多數(shù)都提供專題形式資源列表,如華盛頓大學(xué)西雅圖分校提供健康、GIS 等領(lǐng)域數(shù)據(jù)資源[15];且為更好地滿足科研人員的需求甚至提供應(yīng)用數(shù)據(jù)接口。還有部分圖書館提供數(shù)據(jù)資源的檢索服務(wù),有的提供了專題性一站式數(shù)據(jù)資源檢索平臺的外部鏈接,如加州理工大學(xué)圖書館提供NCBI 和SciFinder Discovery Platform[16]。絕大部分高校均提供有關(guān)數(shù)據(jù)發(fā)現(xiàn)渠道事宜的人工參考咨詢服務(wù),有的還開發(fā)了包括用戶指南、視頻資源、研討會、人工咨詢等多樣化服務(wù)矩陣。值得一提的是,部分高校館還會為數(shù)據(jù)積累和數(shù)據(jù)發(fā)現(xiàn)提供專門的數(shù)據(jù)采集工具,如約翰斯霍普金斯大學(xué)圖書館提供的REDCap、Qualtrics[17]。
3.2.1 提供指南與工具
調(diào)研發(fā)現(xiàn)多數(shù)高校圖書館均提供數(shù)據(jù)處理、分析工具列表與示例,如加州大學(xué)圣克魯茲分校還提供編程、可視化工具平臺列表[18],也有圖書館提供相關(guān)研究方法文獻[19]和可供練習(xí)的數(shù)據(jù)集[20]。此外,還有高校館提供算力方面支持,如加州大學(xué)伯克利分校圖書館提供的Savio 環(huán)境用于處理高通量計算數(shù)據(jù)[21],斯坦福大學(xué)圖書館創(chuàng)立了data farm 數(shù)據(jù)分析環(huán)境[22]。另有高校拓展了其他渠道,如德克薩斯大學(xué)達(dá)拉斯分校西南醫(yī)學(xué)中心圖書館的數(shù)據(jù)知識庫中配置有可視化處理工具,可分析部分格式的數(shù)據(jù),并提供相關(guān)操作指南[23]。
3.2.2 建立服務(wù)組織
多數(shù)美國排名前50 所的高校圖書館都有類似數(shù)字學(xué)術(shù)計劃的項目,以便從數(shù)據(jù)科學(xué)層面統(tǒng)籌數(shù)據(jù)資源,如弗吉尼亞大學(xué)圖書館成立的圖書館統(tǒng)計實驗室。也有圖書館基于研究過程視角提供更完整的科研數(shù)據(jù)全生命周期服務(wù),如布朗大學(xué)圖書館的數(shù)字學(xué)術(shù)中心,提供研究方法、項目開發(fā)、出版方面的資源服務(wù)[24]。也有針對具體學(xué)科實踐開展的服務(wù),如馬里蘭大學(xué)帕克分校圖書館針對地理空間數(shù)據(jù),提供軟件、咨詢、專門實驗室等數(shù)據(jù)免費服務(wù)[25]。
調(diào)研顯示,很多高校館的服務(wù)組織會針對不同重用階段的需求開展培訓(xùn),如加州理工大學(xué)的author carpentry 工作坊,幫助用戶從寫作、永久標(biāo)識符、版權(quán)等方面了解包含數(shù)據(jù)集出版在內(nèi)的全流程內(nèi)容[26]。部分圖書館會提供數(shù)據(jù)科學(xué)方法和數(shù)據(jù)可視化的培訓(xùn),如哈佛大學(xué)有專門針對質(zhì)性數(shù)據(jù)分析的工具、咨詢、預(yù)處理服務(wù)[27],亞利桑那大學(xué)、佛羅里達(dá)大學(xué)圖書館提供可修學(xué)分的相關(guān)課程,并提供開源數(shù)據(jù)分析資源列表。
3.3.1 數(shù)據(jù)內(nèi)容存儲服務(wù)
在科研數(shù)據(jù)資源存儲方面,絕大多數(shù)TOP50美國高校圖書館均擁有自己的數(shù)據(jù)知識庫(data repository),可存儲數(shù)據(jù)類型包括但不限于數(shù)據(jù)集、代碼、仿真數(shù)據(jù)等。部分學(xué)校建立針對特定數(shù)據(jù)類型的系列存儲服務(wù),也有高校館在數(shù)據(jù)基礎(chǔ)設(shè)施中開辟相應(yīng)的基礎(chǔ)數(shù)據(jù)設(shè)施空間。部分圖書館還提供典型數(shù)據(jù)知識庫的查找服務(wù)和當(dāng)前主流數(shù)據(jù)知識庫的多維度測評指南。同時,絕大部分?jǐn)?shù)據(jù)知識庫的存儲內(nèi)容均可納入主流搜索引擎搜索范圍,便于提升數(shù)據(jù)集的可發(fā)現(xiàn)和可獲得性。
相比在學(xué)校內(nèi)部存儲和分享數(shù)據(jù),學(xué)校外部的數(shù)據(jù)知識庫更利于擴大分享,增加數(shù)據(jù)使用。如哈佛大學(xué)、哥倫比亞大學(xué)等高校圖書館提供外部數(shù)據(jù)庫導(dǎo)航服務(wù),一方面把數(shù)據(jù)管理相關(guān)內(nèi)容集成到一個系統(tǒng)內(nèi),便于數(shù)據(jù)獲取,促進關(guān)聯(lián)知識發(fā)現(xiàn);另一方面研究人員可將數(shù)據(jù)存儲到外部數(shù)據(jù)庫中,擴大研究的影響力。
3.3.2 數(shù)據(jù)監(jiān)管與質(zhì)量控制服務(wù)
美國TOP50 高校圖書館中的數(shù)據(jù)監(jiān)管服務(wù)主要包括:數(shù)據(jù)重用資源組織、數(shù)據(jù)質(zhì)量審核、數(shù)據(jù)監(jiān)管團隊建設(shè)、數(shù)據(jù)監(jiān)管指南構(gòu)建和數(shù)據(jù)監(jiān)管咨詢服務(wù)。
(1)重用資源組織方面,已有高校按主題對數(shù)據(jù)集/數(shù)據(jù)庫進行組織,形成不同專題的開放數(shù)據(jù)集列表,并通過人工服務(wù)機制進一步強化共享數(shù)據(jù)集質(zhì)量,并保障數(shù)據(jù)開放者和重用者的權(quán)益。也有的在進行專題組織同時,對部分領(lǐng)域(語言學(xué))軟件和數(shù)據(jù)進行歸檔,確保其長期可訪問(如亞利桑那大學(xué) 圖書 館)[28]。
許多圖書館還開展了元數(shù)據(jù)描述方面的服務(wù):一是提供數(shù)據(jù)管理實踐的介紹。內(nèi)容涉及版本控制和備份數(shù)據(jù)、元數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)情景化,存檔與傳播、影響力計量與追蹤等,如布朗大學(xué)圖書館,密歇根州立大學(xué)圖書館、佛羅里達(dá)大學(xué)圖書館等[29]。部分圖書館還提供數(shù)據(jù)文檔的最佳實踐案例和具體細(xì)則;二是提供數(shù)據(jù)描述的相關(guān)服務(wù)。包括提供關(guān)鍵詞受控詞表,以及數(shù)據(jù)描述相關(guān)咨詢工作,如芝加哥大學(xué)圖書館、伊利諾伊大學(xué)香檳分校圖書館。佛羅里達(dá)大學(xué)圖書館提供相應(yīng)的培訓(xùn)和內(nèi)容合規(guī)性審查服務(wù),對維護數(shù)據(jù)集質(zhì)量很有裨益。
(2)數(shù)據(jù)質(zhì)量審核方面,各高校圖書館在數(shù)據(jù)知識庫級別、數(shù)據(jù)集級別,乃至項目級別中均開展了數(shù)據(jù)監(jiān)管實踐。如賓州州立大學(xué)基于FAIR 原則審核相關(guān)知識庫資質(zhì)[30];伊利諾伊大學(xué)香檳分校圖書館圍繞數(shù)據(jù)生命周期開展數(shù)據(jù)集級別的審核[31];明尼蘇達(dá)大學(xué)雙城分校圖書館數(shù)據(jù)級別的審核涉及是否采用標(biāo)準(zhǔn)化元數(shù)據(jù)模板,文件與代碼運行、具體字段含義等[32];杜克大學(xué)圖書館提供數(shù)據(jù)包具體檢查條目,如不包含敏感或受限信息、描述數(shù)據(jù)屬性和內(nèi)容、研究過程背景(即數(shù)據(jù)源、程序等)的文檔等[33]。另有高校圖書館項目級別的數(shù)據(jù)監(jiān)管明確了項目PI 在數(shù)據(jù)監(jiān)管中的若干原則,如確保保留足夠的記錄,以說明數(shù)據(jù)收集的方法和準(zhǔn)確性以及數(shù)據(jù)解釋的方法和準(zhǔn)確性等內(nèi)容[34]。
(3)數(shù)據(jù)監(jiān)管團隊建設(shè)方面,多校圖書館均構(gòu)建了專門的用戶科研數(shù)據(jù)管理團隊,從事科研數(shù)據(jù)管理規(guī)劃、數(shù)據(jù)采集、共享與長期保存等項目,如加州大學(xué)歐文分校等。同時相關(guān)高校還結(jié)成數(shù)據(jù)監(jiān)管網(wǎng)絡(luò),開展數(shù)據(jù)監(jiān)管協(xié)作,提升服務(wù)能力。
(4)數(shù)據(jù)監(jiān)管指南構(gòu)建方面,首先須確定數(shù)據(jù)存儲的敏感程度與安全權(quán)限,為敏感數(shù)據(jù)管理提供相應(yīng)策略、工具和相關(guān)資料等(如加州大學(xué)伯克利分校、加州理工大學(xué)圖書館和MIT 圖書館)。還有部分高校館提供數(shù)據(jù)分級分類的指南,如耶魯大學(xué)在2018 年發(fā)布數(shù)據(jù)分類政策,以規(guī)范數(shù)據(jù)的管理工作。該政策的內(nèi)容主要由數(shù)據(jù)分類、最小化數(shù)據(jù)安全(Minimum Security Standards)、對所有數(shù)據(jù)用戶負(fù)責(zé)、執(zhí)行和學(xué)科(Enforcement and Discipline)四部分組成。根據(jù)耶魯數(shù)據(jù)的重要性(Importance)、敏感性(Sensitivity)和被濫用的可能性(Potential for misuse)分為三種類型:分別為高、中、低三個風(fēng)險等級[35]。
(5)數(shù)據(jù)監(jiān)管咨詢服務(wù)方面,調(diào)研顯示有許多高校在數(shù)據(jù)監(jiān)管“咨詢-定制”式服務(wù)中提供針對數(shù)據(jù)重用相關(guān)服務(wù)。如南加州大學(xué)圖書館的元數(shù)據(jù)館員提供數(shù)據(jù)管理與元數(shù)據(jù)的優(yōu)化策略;德克薩斯大學(xué)奧斯汀分校圖書館幫助確定有效的科研數(shù)據(jù)管理過程的工具與策略;斯坦福大學(xué)圖書館進一步提供數(shù)據(jù)安全咨詢服務(wù)。
3.4.1 數(shù)據(jù)引用格式工具/ 服務(wù)
大多數(shù)高校圖書館在數(shù)據(jù)知識庫中提供數(shù)字對象標(biāo)識符(DOI),便于數(shù)據(jù)集引用。如提供數(shù)據(jù)引用一般規(guī)則指南:列出數(shù)據(jù)應(yīng)用格式的基本元素、順序,提供相關(guān)數(shù)據(jù)集引用的示例(如密歇根州立大學(xué)),并提供標(biāo)準(zhǔn)化的數(shù)據(jù)應(yīng)用格式參考(如亞利桑那大學(xué)圖書館)。也有高校提供相關(guān)機構(gòu)或具體學(xué)科領(lǐng)域數(shù)據(jù)引用指南,如賓州州立大學(xué)提供具體學(xué)科領(lǐng)域引用規(guī)則。紐約大學(xué)圖書館提供數(shù)據(jù)引用格式選擇的具體策略。如使用出版商或會議(如IEEE 或ACM)的樣式手冊格式;使用作者或存儲庫在下載數(shù)據(jù)頁面上列出的首選引文格式。也有高校直接提供指向DataCite 機構(gòu)的外部鏈接,便于用戶全面了解數(shù)據(jù)引用的內(nèi)容。
3.4.2 數(shù)據(jù)出版相關(guān)政策指導(dǎo)
在數(shù)據(jù)共享和數(shù)據(jù)使用階段,強調(diào)資助機構(gòu)、本單位數(shù)據(jù)共享政策和與知識產(chǎn)權(quán)相關(guān)的法律問題。有關(guān)數(shù)據(jù)利用的政策旨在實現(xiàn)數(shù)據(jù)共享,發(fā)揮數(shù)據(jù)價值,具體內(nèi)容包括數(shù)據(jù)引用、隱私保護、數(shù)據(jù)歸屬等內(nèi)容,圖書館具有妥善處理數(shù)據(jù)獲取邊界的作用,能夠支持科研教育機構(gòu)在數(shù)據(jù)獲取上的政策實現(xiàn),包括審理和總結(jié)關(guān)于隱私和機密性等問題的解決方案和良好實踐等。
除了存儲和分享數(shù)據(jù),數(shù)據(jù)出版和數(shù)據(jù)引用也能促進數(shù)據(jù)重用。數(shù)據(jù)出版提供足夠的信息(或元數(shù)據(jù)),允許其他研究人員能夠正確理解和再利用數(shù)據(jù)。數(shù)據(jù)引用則可增加研究的可見性,提高學(xué)術(shù)影響力和對數(shù)據(jù)的再利用。調(diào)研發(fā)現(xiàn)相關(guān)高校圖書館提供數(shù)據(jù)出版的條目清單,如UC 圣地亞哥分校提供數(shù)據(jù)出版的步驟和開放共享的選項;亞利桑那大學(xué)圖書館要求用戶寫明數(shù)據(jù)類型、格式、數(shù)據(jù)指代對象說明,數(shù)據(jù)字段含義、采集與獲取方式等[36]。針對一些特殊的數(shù)據(jù)出版,如數(shù)據(jù)論文,圖書館還提供出版工具與接收期刊、版權(quán)解析和開放數(shù)據(jù)原則[37]。
另外,圖書館還提供資助方與出版方數(shù)據(jù)訪問政策、推薦數(shù)據(jù)重用許可類型、推薦數(shù)據(jù)出版存放位置等內(nèi)容。另提供外部知識庫發(fā)布數(shù)據(jù)集的要求,提供數(shù)據(jù)知識庫選擇標(biāo)準(zhǔn),包括知識庫列表與具體功能對比。
3.5.1 數(shù)據(jù)重用場景開發(fā)
總體上,數(shù)據(jù)重用場景開發(fā)服務(wù)項目多樣,主要包括但不限于:實施數(shù)字學(xué)術(shù)研究項目、提供數(shù)據(jù)管理教育活動、提供日常練習(xí)與學(xué)習(xí)使用的數(shù)據(jù)資源、舉辦相關(guān)數(shù)據(jù)競賽活動、數(shù)據(jù)社群運營、提供策展類服務(wù)。在數(shù)字學(xué)術(shù)研究項目方面,眾多高校開展一系列數(shù)字學(xué)術(shù)活動促進校級數(shù)字學(xué)術(shù)發(fā)展,圖書館也是主要參與方。這些活動的作用主要在于提升全校師生的數(shù)據(jù)分析能力與素養(yǎng),開發(fā)本校特色資源,與相應(yīng)院系課程建立連接,從而更好地匹配日常教學(xué)數(shù)據(jù)需求、建立“校企”間廣泛合作等方面(典型活動見表2)。
表2 美國top50 高校圖書館數(shù)據(jù)重用場景開發(fā)典型活動(排名不分先后)
在數(shù)據(jù)管理相關(guān)教育活動方面,高校圖書館更側(cè)重提供用戶自主掌握進度的學(xué)習(xí)資源,動手能力較強的重用最佳實踐分享與工作坊。服務(wù)的對象既有本校教職工,也有圖書館館員(具體活動見表3)。
表3 美國top50 高校圖書館典型數(shù)據(jù)管理相關(guān)教育活動
在特定類型數(shù)據(jù)集開放方面,亞利桑那大學(xué)圖書館提供地理空間數(shù)據(jù)支持服務(wù),包括相關(guān)數(shù)據(jù)資源和培訓(xùn)課程。加州理工大學(xué)圖書館提供的互聯(lián)網(wǎng)檔案館中有關(guān)本館網(wǎng)頁的相關(guān)記錄,在某種程度上是網(wǎng)頁數(shù)據(jù)資源的重用場景開發(fā),有利于研究人員回溯相關(guān)資源。約翰斯霍普金斯大學(xué)圖書館提供專項資助“JHU LIBRARIES DATA GRANT”為相應(yīng)機構(gòu)成員對數(shù)據(jù)集的購買提供幫助。
在舉辦相關(guān)數(shù)據(jù)競賽活動方面,活動的側(cè)重點略有不同,有專注于編程技術(shù)開發(fā)的黑客馬拉松活動,也有針對數(shù)據(jù)重用應(yīng)用的系列服務(wù)。如佛羅里達(dá)大學(xué)圖書館提供的hackathon 為研究人員進行GPU 程序優(yōu)化;俄亥俄大學(xué)圖書館通過ArcGIS Online,幫助用戶在俄亥俄州立大學(xué)研究和教學(xué)中的潛在用途指南。
在其他較為小眾化的數(shù)據(jù)重用場景開發(fā)方面,如哥倫比亞大學(xué)圖書館創(chuàng)立“數(shù)據(jù)俱樂部”,定期舉辦會議,并創(chuàng)立github 上的討論群組,提供python 和R 語言的相關(guān)數(shù)據(jù)資源[44];斯坦福大學(xué)圖書館提供系列數(shù)字資源策展活動,如承辦慶?!?023 國際愛數(shù)據(jù)周”(由ICPSR 美國校際政治學(xué)與社會科學(xué)數(shù)據(jù)中心主辦)系列活動。
3.5.2 數(shù)據(jù)重用影響力評估與貢獻確認(rèn)
目前,美國高校圖書館對數(shù)據(jù)重用影響力的評估實踐尚處起步階段。相關(guān)政策停留在如何幫助科研人員通過開放數(shù)據(jù)集或數(shù)據(jù)出版方式擴展影響力,而非從科研評估政策角度提供相關(guān)指導(dǎo)。如杜克大學(xué)提供追蹤研究數(shù)據(jù)影響相關(guān)指標(biāo)的使用指南;哈佛大學(xué)圖書館Dataverse 數(shù)據(jù)知識庫也提供數(shù)據(jù)影響力追蹤的相關(guān)服務(wù)。一些高校在完善替代計量方面進行了有益探索,如加州大學(xué)伯克利分校使用替代計量計算研究影響力,計量的內(nèi)容包括代碼、數(shù)據(jù)集、演示文稿、博客等內(nèi)容。
萌芽與起步,始于“數(shù)據(jù)獲取”與配套服務(wù)。在2015 年前,鮮有高校圖書館開展數(shù)據(jù)重用服務(wù),原因可能在于開放科研數(shù)據(jù)處于起步階段,尚缺乏結(jié)構(gòu)完整、質(zhì)量較高的數(shù)據(jù)集,能夠供科研人員使用。彼時,科研人員重用數(shù)據(jù)的途徑包括開放網(wǎng)絡(luò)(如政府網(wǎng)站)、學(xué)科數(shù)據(jù)知識庫(如Figshare 和Dryad)、學(xué)校機構(gòu)知識庫以及其他科研人員或者科研團隊分享的作為論文或項目附屬資源的數(shù)據(jù)。該時期圖書館的數(shù)據(jù)重用服務(wù)更注重“數(shù)據(jù)發(fā)現(xiàn)”,幫助研究人員數(shù)據(jù)再利用之前進行數(shù)據(jù)清洗、數(shù)據(jù)理解,并且防止數(shù)據(jù)不全帶來的損失。
快速布局與擴展,關(guān)注數(shù)字學(xué)術(shù)背景下的“科研數(shù)據(jù)重用生態(tài)營造”。隨著2015 年前后科研數(shù)據(jù)管理生命周期模型的不斷涌現(xiàn),以及FAIR 原則的確立[4],美國高校圖書館快速布局科研數(shù)據(jù)管理服務(wù),形成“存、取、用”一體的內(nèi)容布局。現(xiàn)階段,美國排名TOP50 高校圖書館進一步突破局限于“在館言館”的理念,大多較為注重在數(shù)字學(xué)術(shù)建設(shè)的大背景下進行數(shù)據(jù)重用服務(wù)的整體設(shè)計。這種設(shè)計表現(xiàn)為:數(shù)據(jù)重用生態(tài)的營造、數(shù)據(jù)重用場景的開發(fā)、數(shù)據(jù)重用影響力的評估、用戶數(shù)據(jù)科學(xué)與開放科學(xué)背景下數(shù)據(jù)出版素養(yǎng)的培育?;A(chǔ)設(shè)施建設(shè)與服務(wù)流程完善并舉,質(zhì)量控制與監(jiān)管服務(wù)“雙管齊下”。這種服務(wù)布局更好地體現(xiàn)了高校圖書館在促進高等教育創(chuàng)新發(fā)展中的作用。
現(xiàn)階段服務(wù)項目呈“多元立體化”特征。絕大部分高校在數(shù)據(jù)重用相關(guān)政策方面,已覆蓋到數(shù)據(jù)開放共享的資源建設(shè)、權(quán)益與許可政策說明、數(shù)據(jù)重用技能培訓(xùn)與最佳實踐案例呈現(xiàn)。相較于2015 年前后的調(diào)研結(jié)果,在數(shù)據(jù)可開放程度方面具有明顯提升,且隨著FAIR[3]、TRUST[45]等系列科研數(shù)據(jù)質(zhì)量評價原則的出現(xiàn),數(shù)據(jù)存儲和監(jiān)管服務(wù)過程也在進一步完善。同時,相關(guān)高校已開始在數(shù)據(jù)引用標(biāo)準(zhǔn)化與自動化、數(shù)據(jù)出版政策、數(shù)據(jù)重用貢獻確認(rèn)、數(shù)據(jù)社群運營方面有了進一步發(fā)展。數(shù)據(jù)重用生態(tài)營造的基本要素均已涉及并逐步完善。
基于實證調(diào)研結(jié)果,可以將美國TOP50 高校圖書館數(shù)據(jù)重用實踐的立足點總結(jié)為基礎(chǔ)設(shè)施(硬件條件)、政策內(nèi)容(軟件條件)、服務(wù)抓手(具體內(nèi)容)三個方面。
4.2.1 平臺促進數(shù)據(jù)重用服務(wù)集成化發(fā)展
數(shù)據(jù)重用服務(wù)平臺是科研數(shù)據(jù)管理服務(wù)的重要基礎(chǔ)設(shè)施,美國高校圖書館通過“自助-半自助-人工”方式形成數(shù)據(jù)服務(wù)鏈條,涵蓋“獲取-分析/重用-發(fā)布-出版(再開放)-激勵”這一完整數(shù)據(jù)重用循環(huán)。
美國高校圖書館的服務(wù)實踐目前已初步覆蓋了數(shù)據(jù)重用循環(huán)周期,將更加全面地促進數(shù)據(jù)開放與重用相互促進的生態(tài)發(fā)展,具體表現(xiàn)為:(1)數(shù)據(jù)獲取階段,美國高校圖書館按照內(nèi)容專題、數(shù)據(jù)類型等多種方式進行數(shù)據(jù)發(fā)現(xiàn)來源的組織,部分高校圖書館給出供教學(xué)科研使用的數(shù)據(jù)集、軟件代碼等資源;同時能夠就科研人員在數(shù)據(jù)發(fā)現(xiàn)中的具體疑問提供咨詢;(2)當(dāng)用戶決定重用數(shù)據(jù)時,部分高校圖書館還提供相關(guān)數(shù)據(jù)重用許可協(xié)議的使用聲明、數(shù)據(jù)安全說明等文檔。不過目前仍面向用戶在開放共享階段,滿足資助政策或出版政策時對版權(quán)許可、可用性等方面的要求,并非專門面向重用實踐;(3)研究項目初期與數(shù)據(jù)探索(分析)階段。提供DMP 制定的規(guī)則、工具、模板、最佳實踐、政策要求。同時,提供諸多數(shù)據(jù)采集、處理與清洗的軟件/工具、方法與重用實踐講座、工作坊、可視化相應(yīng)咨詢指導(dǎo)等諸多內(nèi)容維度的服務(wù)方式;(4)數(shù)據(jù)出版(開放)階段。研究發(fā)現(xiàn),不僅超半數(shù)被調(diào)查美國高校圖書館具備自建或制定的數(shù)據(jù)知識庫幫助進行數(shù)據(jù)存儲,而且在諸多維度提供數(shù)據(jù)知識庫的評估,幫助用戶選擇適當(dāng)存儲位置。且建立了資助機構(gòu)和出版商推薦的數(shù)據(jù)存儲庫位置,便于用戶查找與選擇。當(dāng)用戶存儲數(shù)據(jù)時,這些平臺還會提供元數(shù)據(jù)的詳細(xì)填寫說明與checklist,部分高校提供人工審核機制,幫助進行數(shù)據(jù)質(zhì)量控制。
4.2.2 數(shù)據(jù)重用政策立足數(shù)字學(xué)術(shù)理念
數(shù)據(jù)重用服務(wù)的理念發(fā)展與方式擴充。在2015年-2016 年,圖書館數(shù)據(jù)使用(重用)服務(wù)強調(diào)的是資助機構(gòu)、本單位的數(shù)據(jù)共享政策和與知識產(chǎn)權(quán)相關(guān)的法律問題,提醒研究人員利用數(shù)據(jù)時注意合理引用,避免知識產(chǎn)權(quán)風(fēng)險[46]。調(diào)研發(fā)現(xiàn),美國TOP50高校館在數(shù)據(jù)重用方面的相關(guān)政策與開放科學(xué)/學(xué)術(shù)交流模塊相承接,超過半數(shù)的高校圖書館在DMP制定、數(shù)據(jù)監(jiān)管、數(shù)據(jù)出版的相關(guān)服務(wù)模塊中,提供了數(shù)據(jù)重用權(quán)益管理相關(guān)內(nèi)容,且對數(shù)據(jù)共享的相關(guān)要求,不限于科研資助機構(gòu),已擴展至出版商、數(shù)據(jù)知識庫功能、校級數(shù)據(jù)管理與保護政策等。特別是在Data Citation IndexTM(DCI,數(shù)據(jù)引文索引)[47]發(fā)布十年后的今天,半數(shù)以上的被調(diào)研圖書館中有關(guān)數(shù)據(jù)引用方面的具體要素、引用規(guī)則、格式加工工具、最佳實踐案例,甚至基于數(shù)據(jù)引用的影響力判斷等相關(guān)內(nèi)容上線。這些指南、研討會、工作坊的相關(guān)學(xué)習(xí)資源形式多樣,既有自主建設(shè)和維護的內(nèi)容,又有直接利用既有較為成熟指南的方式。換言之,被調(diào)研高校已開始發(fā)揮“數(shù)字學(xué)術(shù)+開放科學(xué)”雙向合力,從而更好地滿足數(shù)據(jù)生產(chǎn)和流轉(zhuǎn)中科研人員的需求。
4.2.3 數(shù)據(jù)科學(xué)能力與數(shù)據(jù)重用場景拓展
科研人員是數(shù)據(jù)貢獻者與重用者,其數(shù)據(jù)科學(xué)能力和數(shù)據(jù)出版相關(guān)素養(yǎng),決定了數(shù)據(jù)重用實踐的可持續(xù)發(fā)展。美國高校圖書館均已在不同程度上提供數(shù)據(jù)重用的增值服務(wù),還有進一步提供云上或?qū)嶓w的算力資源,幫助用戶進行大規(guī)模數(shù)據(jù)集的運算。同時這些高校針對數(shù)據(jù)生命周期各部分的內(nèi)容體量,還開展了數(shù)據(jù)采集、數(shù)據(jù)可視化、文本挖掘、編程等方面的工作坊、carpentry 等培訓(xùn),提供圍繞數(shù)據(jù)生命周期的數(shù)據(jù)管理軟件,提供數(shù)據(jù)收集工具或定制化服務(wù)。國內(nèi)目前已有的研究主要集中在能力培訓(xùn)方面。
在數(shù)據(jù)重用場景擴展方面,主要以分散式的數(shù)據(jù)競賽為主。美國高校圖書館的數(shù)據(jù)重用相關(guān)競賽總體上包括兩種類別:一是專注于技術(shù)發(fā)展的hackathon;二是專注于創(chuàng)新應(yīng)用。除此之外,還開始著手通過培訓(xùn)方式宣傳不同領(lǐng)域中數(shù)據(jù)重用的最佳實踐案例,如數(shù)字人文、GIS。其服務(wù)亮點是社群運營,包括社群本身的日?;顒?、定期研討、學(xué)習(xí)資源共享、答疑、促進社群內(nèi)用戶的對話與討論,還包括參與數(shù)據(jù)科學(xué)聯(lián)盟類機構(gòu)的活動,如“國際愛數(shù)據(jù)周”,或基于相關(guān)資源的實體或虛擬數(shù)據(jù)可視化展覽等。
前期調(diào)研認(rèn)為,數(shù)據(jù)重用文化還未形成,國外的研究者已對數(shù)據(jù)重用文化開展了理論與實踐方面的探索,包括概念、培育方式、宏觀與微觀場景間的配合等[48]。美國高校圖書館已著手重用規(guī)則與激勵政策并行,促進重用文化形成:(1)數(shù)據(jù)集貢獻確認(rèn)尚處探索階段,未大規(guī)模應(yīng)用相關(guān)突破性數(shù)據(jù)級別計量指標(biāo);(2)不同知識庫中的數(shù)據(jù)引用方式標(biāo)準(zhǔn)化程度有待提升;(3)初步涉及了研究數(shù)據(jù)的分級分類問題,較好地承接了科研信息管理階段的信息安全議題,并在數(shù)據(jù)全流程管理背景下進一步明確數(shù)據(jù)敏感性和安全性的內(nèi)容細(xì)目。但國內(nèi)對該議題的探討尚處在政策內(nèi)容完善中,并未進一步討論服務(wù)實踐中系統(tǒng)的方式、路徑與針對性策略。
縱觀國內(nèi)外具體服務(wù)項的發(fā)展情況,本文提出“理念-服務(wù)-創(chuàng)新”為核心內(nèi)容的數(shù)據(jù)重用服務(wù)設(shè)計示意圖(見圖1)。首先,需圍繞數(shù)據(jù)重用周期,從諸多具體環(huán)節(jié)中落實數(shù)據(jù)重用的發(fā)展目標(biāo)理念,即開放數(shù)據(jù)和數(shù)字學(xué)術(shù)的總體發(fā)展目標(biāo);其次,數(shù)據(jù)重用服務(wù)支持服務(wù)(服務(wù)層)需覆蓋從數(shù)據(jù)發(fā)現(xiàn)到數(shù)據(jù)出版,再到新的數(shù)據(jù)重用周期的全流程;第三,通過數(shù)據(jù)重用場景的開發(fā)(創(chuàng)新層),進一步鞏固該服務(wù)流程并創(chuàng)新性應(yīng)用,以此培育良好的支持環(huán)境、基礎(chǔ)設(shè)施、開拓型應(yīng)用理念,進一步促進科研數(shù)據(jù)的創(chuàng)新性重用。
圖1 我國高校圖書館數(shù)據(jù)重用服務(wù)設(shè)計示意圖
美國高校圖書館的數(shù)據(jù)重用服務(wù)通過對“數(shù)字學(xué)術(shù)”的回應(yīng),建立起完整的“收集-處理-分析-結(jié)果闡釋”全流程服務(wù),結(jié)合有效整合統(tǒng)計學(xué)、編程的主題內(nèi)容;又通過對在數(shù)據(jù)發(fā)布/出版環(huán)節(jié),結(jié)合“開放科學(xué)”在數(shù)據(jù)發(fā)現(xiàn)(開放數(shù)據(jù)知識庫作為重要數(shù)據(jù)來源,數(shù)據(jù)論文成為獨特補充資源)、出版(引用、許可)、權(quán)益管理、貢獻確認(rèn)與影響力評價方面的內(nèi)容,更加完整地形成了“數(shù)據(jù)重用-開放-重用”的良性循環(huán)。
從美國高校圖書館在RDM 服務(wù)層的實踐布局理念來看,首先,國內(nèi)數(shù)據(jù)重用服務(wù)在發(fā)展早期應(yīng)加強主題的教育類服務(wù)。以便深入了解科研數(shù)據(jù)的產(chǎn)生機制、重用途徑和保存?zhèn)鞑シ绞降?,從而提高科研?shù)據(jù)使用效率,起到推動科學(xué)研究的作用。研究建議“教育類服務(wù)”的主題除涉及數(shù)字學(xué)術(shù)或數(shù)據(jù)科學(xué)的議題外,還應(yīng)該包括開放科學(xué),即加強數(shù)據(jù)開放共享方面培訓(xùn)內(nèi)容的完整性,包括科研過程文檔組織規(guī)則、科研數(shù)據(jù)分級分類管理、可用性聲明、數(shù)據(jù)使用許可聲明,數(shù)據(jù)描述文檔的具體內(nèi)容、數(shù)據(jù)倫理,并為數(shù)據(jù)引用提供可實踐轉(zhuǎn)化的規(guī)則或直接提供相應(yīng)導(dǎo)出工具;其次,國內(nèi)數(shù)據(jù)重用服務(wù)在中長期規(guī)劃應(yīng)注意與統(tǒng)計、數(shù)據(jù)科學(xué)等進一步結(jié)合,并在數(shù)據(jù)可視化、數(shù)字資源策展方面深入探索,提供更有針對性的代碼指導(dǎo)。同時進一步完善服務(wù)矩陣中的服務(wù)方式,如開展carpentry 性質(zhì)工作坊、積極開展多種形式的數(shù)據(jù)對話(如午餐會、研討會),進一步吸引潛在用戶參與到數(shù)據(jù)重用實踐中。運用已有教育資源或提供成熟的指南、案例的鏈接,幫助用戶解決迫切需求。
從數(shù)據(jù)重用實踐的循環(huán)周期來看,我國高校圖書館應(yīng)推薦數(shù)據(jù)獲取路徑、共享與引用方式、出版模式等,也可根據(jù)科研用戶的實際需求和高校學(xué)科資源特色,開展諸如學(xué)科數(shù)據(jù)分析、學(xué)科數(shù)據(jù)發(fā)現(xiàn)與發(fā)布等深層次的特色服務(wù)[49]。調(diào)動館員和用戶兩方積極性,既面向不同受教育階段的用戶,開展梯級策略,還要加強館員自身服務(wù)能力建設(shè),豐富培訓(xùn)方式,包括靜態(tài)鏈接網(wǎng)絡(luò)資源、開通交流平臺、專題視頻點播等,也有動態(tài)的參考咨詢、研討會、嵌入科研過程等。此外,還可利用歐美高校圖書館諸如科研數(shù)據(jù)管理教學(xué)資源、工具和指南等現(xiàn)有的優(yōu)質(zhì)外部資源,提高科研服務(wù)效率。
本質(zhì)上,服務(wù)生態(tài)構(gòu)建意味著全流程嵌入與科研數(shù)據(jù)流的有效循環(huán)。因此,在服務(wù)能力構(gòu)建中應(yīng)注意識別我國科教興國戰(zhàn)略背景下的數(shù)據(jù)重用實踐流程環(huán)節(jié)要求,發(fā)揮高校圖書館在支持高等教育機構(gòu)創(chuàng)新發(fā)展中的支持作用,并能夠通過協(xié)作形式建立專門性的服務(wù)支持網(wǎng)絡(luò)。
從數(shù)據(jù)重用實踐的發(fā)展流程來看,我國高校圖書館亦需面向整個數(shù)據(jù)重用循環(huán),推出“服務(wù)方式矩陣”的系列服務(wù)內(nèi)容。(1)整體架構(gòu)上提供的橫向主題服務(wù)包括:數(shù)據(jù)管理計劃、數(shù)據(jù)存儲、數(shù)據(jù)共享。縱向服務(wù)方式包括:輔助創(chuàng)立數(shù)據(jù)管理計劃、咨詢服務(wù)(面向特定研究人員、實驗室的特殊需求)、工作坊(系列課程列表-已完結(jié)課程提供相應(yīng)的PDF 或視頻教學(xué)資源,既涉及快速上手的數(shù)據(jù)清洗教程、RDM基本策略,又涉及DMP 管理工具、數(shù)據(jù)內(nèi)容組織、相關(guān)法律工具、代碼管理、資料備份、可用性說明和版本控制相關(guān)內(nèi)容),通過將數(shù)據(jù)存儲至數(shù)據(jù)知識庫提供相關(guān)成果的DOI 服務(wù);(2)內(nèi)容主題上可提供涵蓋數(shù)據(jù)生命周期的在線培訓(xùn),包含如何更好地落實資助機構(gòu)的相關(guān)政策、如何落實FAIR 原則、如何清洗數(shù)據(jù)、數(shù)據(jù)使用協(xié)議、數(shù)據(jù)敏感性問題等議題。還可提供研究數(shù)據(jù)工具包、指南,旨在幫助研究人員編寫數(shù)據(jù)管理計劃,更好地了解數(shù)據(jù)管理流程、機構(gòu)對數(shù)據(jù)管理計劃的要求,并查找校園內(nèi)可用于數(shù)據(jù)管理各個方面的服務(wù),包括機構(gòu)要求、評估數(shù)據(jù)需求、模板/示例、選擇存儲庫、訓(xùn)練、工具幾個部分。
從高校圖書館在其教學(xué)、科研中發(fā)揮的作用來看,應(yīng)充分“激活”高校圖書館在高校創(chuàng)新中的生態(tài)位。建議多開展數(shù)據(jù)重用的展覽、講座、最佳實踐案例分享、培訓(xùn)活動,還可與學(xué)校級別科研評價機構(gòu)共同制定適用于數(shù)據(jù)開放共享與重用的altermetrics評價指標(biāo),一方面促進開放科研數(shù)據(jù)的進程,另一方面,通過多種方式和渠道,收集、宣傳相關(guān)成果/數(shù)據(jù)敘事作品,給予創(chuàng)作者團隊相應(yīng)的激勵措施。
從超越所屬高等教育機構(gòu)的范圍來看,可考慮(區(qū)域)服務(wù)協(xié)作網(wǎng)絡(luò)建設(shè)。歐洲學(xué)術(shù)研究圖書館(LIBER)將數(shù)據(jù)管理服務(wù)分為咨詢類RDS 和技術(shù)類RDS。咨詢類RDS 指的是館員幫助客戶找到元數(shù)據(jù)或數(shù)據(jù)標(biāo)準(zhǔn)相關(guān)信息,技術(shù)類RDS 指的是館員直接標(biāo)識數(shù)據(jù)、創(chuàng)建或轉(zhuǎn)移元數(shù)據(jù)及數(shù)據(jù)刪除等[50-51]。目前國內(nèi)圖書館注重發(fā)展技術(shù)類RDS,發(fā)揮平臺的功能,不夠重視咨詢類RDS。調(diào)研發(fā)現(xiàn)高校圖書館應(yīng)關(guān)注咨詢類RDS,為普及數(shù)據(jù)重用知識,解除研究人員對于數(shù)據(jù)重用的疑惑提供指導(dǎo)。建議在某些專項咨詢領(lǐng)域進一步設(shè)置專業(yè)的數(shù)據(jù)館員,如元數(shù)據(jù)、數(shù)據(jù)可視化、數(shù)據(jù)權(quán)益管理方面。另外建立全國或區(qū)域試點性質(zhì)的“數(shù)據(jù)監(jiān)管服務(wù)網(wǎng)絡(luò)”,有助于規(guī)范數(shù)據(jù)監(jiān)管網(wǎng)絡(luò)中的服務(wù)內(nèi)容,提供清晰化監(jiān)管項目,更好地培訓(xùn)數(shù)據(jù)監(jiān)管人才,以發(fā)揮數(shù)據(jù)監(jiān)管網(wǎng)絡(luò)中的協(xié)作功能,輔助科研人員安全合理重用開放數(shù)據(jù)進行科學(xué)研究。
科研人員的數(shù)據(jù)意識在整個科研數(shù)據(jù)管理過程中發(fā)揮著決定性作用。如何讓科研人員在“按要求”提供數(shù)據(jù)的同時,還能主動進行科研數(shù)據(jù)開放共享,是圖書館提供數(shù)據(jù)重用服務(wù)的目標(biāo)之一,這需要增強科研人員數(shù)據(jù)開放共享與重用的意識。應(yīng)用場景是數(shù)據(jù)重用的重要發(fā)展環(huán)境,在實踐中可考慮遵循自上而下和自下而上雙重數(shù)據(jù)重用文化培育路徑[48]。
在自上而下培育方面,圖書館對科學(xué)數(shù)據(jù)重用服務(wù)宣傳不足或現(xiàn)有服務(wù)不能完全滿足用戶的重用需求,導(dǎo)致用戶對科研數(shù)據(jù)管理的主動參與意識嚴(yán)重缺失。我國高校圖書館應(yīng)促進數(shù)據(jù)共享利用的文化建設(shè),可引入carpentry 這一工作坊形式進行數(shù)據(jù)重用場景開發(fā),更好地鼓勵科研人員上手操作,參與數(shù)據(jù)重用的資源、軟件查找、數(shù)據(jù)發(fā)布過程,從而吸引科研人員了解數(shù)據(jù)重用的益處,激發(fā)其參與熱情。同時,從配套的資源建設(shè)端來看,開放科研數(shù)據(jù)資源是數(shù)據(jù)重用的實踐基礎(chǔ),有助于開放數(shù)據(jù)價值的貢獻認(rèn)可與影響力評估,促進數(shù)據(jù)重用資源池的豐富。另外,絕大多數(shù)調(diào)研范圍內(nèi)的美國高校圖書館在數(shù)據(jù)管理計劃方面,均提供了撰寫指導(dǎo)與最佳實踐示例、科研資助機構(gòu)與出版商對DMP 撰寫說明,以及相關(guān)咨詢、工作坊等需人工實時參與的服務(wù)。且部分高校還涉及到了軟件管理計劃的示例與指南,這都為我國提供了很好的借鑒。
在自下而上培育方面,通過提供數(shù)據(jù)重用最佳實踐、專題工作坊、相關(guān)資源,更好地發(fā)揮社群活躍用戶的帶頭與吸引作用。通過保障數(shù)據(jù)社群的有序運營,如活動組織、答疑參與、午餐會,并開發(fā)出多種數(shù)據(jù)可視化的活動,吸引用戶主動參與,促進作品的傳播。
數(shù)據(jù)重用是開放科研數(shù)據(jù)可持續(xù)發(fā)展的必要條件,科研人員是科研數(shù)據(jù)重用的主體[52],有效保障科研人員參與科研數(shù)據(jù)重用實踐,是高校圖書館開展數(shù)據(jù)重用服務(wù)的重要目標(biāo)。國內(nèi)外開放科研數(shù)據(jù)原則、標(biāo)準(zhǔn)的制定、數(shù)據(jù)中心的建設(shè)等系列措施,為數(shù)據(jù)重用提供了基礎(chǔ)性可用數(shù)據(jù)資源。國外高校圖書館已開始著手推進數(shù)據(jù)重用服務(wù)并取得系列成果,尤以美國最具代表性;但國內(nèi)相關(guān)服務(wù)內(nèi)容數(shù)量少而零散,鮮有從科研數(shù)據(jù)重用與開放相互促進的生態(tài)系統(tǒng)視角設(shè)計與建構(gòu)完整的數(shù)據(jù)重用服務(wù)體系。
本文通過系統(tǒng)性調(diào)研U.S.News 排行榜(2022-2023 版)內(nèi)美國TOP50 高校圖書館的數(shù)據(jù)重用服務(wù)項目,按照數(shù)據(jù)重用的過程框架進行梳理,通過關(guān)鍵時間節(jié)點后國內(nèi)外數(shù)據(jù)重用服務(wù)發(fā)展情況的對比,發(fā)現(xiàn)美國高校圖書館數(shù)據(jù)重用服務(wù)呈現(xiàn)如下特點:一是以平臺化促進數(shù)據(jù)重用服務(wù)集成化發(fā)展;二是重用政策制定立足數(shù)字學(xué)術(shù)理念;三是注重拓展用戶數(shù)據(jù)科學(xué)能力與數(shù)據(jù)重用服務(wù)場景。據(jù)此,提出我國高校圖書館數(shù)據(jù)重用實踐發(fā)展的相關(guān)建議。未來研究將從數(shù)據(jù)重用場景入手,關(guān)注科研數(shù)據(jù)重用文化建構(gòu),進一步關(guān)注高校圖書館從數(shù)據(jù)文化建構(gòu)視角參與高?!皵?shù)字學(xué)術(shù)”的總體發(fā)展布局。