周 雷 楊 萍 燕 娜 吳晨生
(1. 北京市科學(xué)技術(shù)情報研究所 北京 100044;2.北京科技戰(zhàn)略決策咨詢中心 北京 100044)
科研數(shù)據(jù)是科學(xué)技術(shù)研究、試驗開發(fā)等研究過程中產(chǎn)生的原始及其衍生數(shù)據(jù),是支撐研究論文和科研項目的重要依據(jù)。隨著科學(xué)研究“第四范式”的到來,科研數(shù)據(jù)已成為信息化時代推動科技發(fā)展、社會進步的重要戰(zhàn)略資源。目前各國科研機構(gòu)都圍繞這一戰(zhàn)略資源開展了從基礎(chǔ)設(shè)施建設(shè)到數(shù)據(jù)管理服務(wù)的研究與實踐。檢索re3data[1](檢索時間:2020年9月21日),注冊數(shù)據(jù)知識庫的最多的國家是美國,已達1086個,排名第二的就是德國,共423個,并大幅領(lǐng)先于第三名的英國288個,表明在國際科研數(shù)據(jù)管理領(lǐng)域德國占有重要地位。因此,分析德國高??蒲袛?shù)據(jù)管理的現(xiàn)狀對于我國相關(guān)機構(gòu)開展科研數(shù)據(jù)管理服務(wù)具有重要參考價值。
由于國外機構(gòu),特別是國外大學(xué)圖書館在科研數(shù)據(jù)管理服務(wù)領(lǐng)域開展的比較早,所以國內(nèi)對這方面的研究較多。李曉輝[2]基于國外高校圖書館開展科研數(shù)據(jù)管理服務(wù)實踐認為,圖書館應(yīng)從技術(shù)支撐、科研數(shù)據(jù)組織、科研數(shù)據(jù)服務(wù)、用戶信息素養(yǎng)教育等方面進行科研數(shù)據(jù)管理服務(wù)。此后眾多學(xué)者從整體服務(wù)內(nèi)容或是某項單獨服務(wù)能力兩方面進行了大量研究。王婉[3]調(diào)研了澳大利亞三所高校圖書館的科研數(shù)據(jù)管理服務(wù),并從服務(wù)機構(gòu)、數(shù)據(jù)類型及服務(wù)內(nèi)容進行分析;劉桂鋒等[4]采用網(wǎng)絡(luò)調(diào)查的方法對美國50所高校圖書館的科研數(shù)據(jù)管理服務(wù)進行了內(nèi)容比較和特征總結(jié);張萍[5]針對英國高??蒲袛?shù)據(jù)管理服務(wù)在專業(yè)指導(dǎo)、實施辦法、技術(shù)工具和合作機制等方面進行了總結(jié);閻婷婷[6]、韓金鳳[7]分析了加拿大高校圖書館在數(shù)據(jù)管理計劃、數(shù)據(jù)組織、數(shù)據(jù)備份與存儲、數(shù)據(jù)獲取與共享、數(shù)據(jù)出版等科研數(shù)據(jù)管理服務(wù)的經(jīng)驗;劉莉[8]、崔濤[9]則分別針對新西蘭和荷蘭的部分高校也進行了服務(wù)介紹和經(jīng)驗特定總結(jié)。而具有代表性的專題研究有:陳大慶[10]從數(shù)據(jù)訪問、數(shù)據(jù)保存、數(shù)據(jù)共享、數(shù)據(jù)管理政策執(zhí)行和監(jiān)督等方面分析英國主要科研資助機構(gòu)數(shù)據(jù)管理與共享政策;丁培[11]簡述美國、澳大利亞、英國等國高??蒲袛?shù)據(jù)管理政策的制定實踐和策略;胡卉等[12]從英美等國20所高校開展的科研數(shù)據(jù)管理培訓(xùn)和相關(guān)素養(yǎng)教育出發(fā),分析其特點總結(jié)其經(jīng)驗;孟祥保等[13]通過對荷蘭3TU.Datacentrum的建設(shè)模型分析了構(gòu)建數(shù)據(jù)聯(lián)盟的經(jīng)驗;顧立平等[14]分析了國外機構(gòu)對于科研數(shù)據(jù)的獎勵機制;崔濤等[15]分析了在科研數(shù)據(jù)管理服務(wù)中的激勵因素及作用機制,促進科研數(shù)據(jù)的績效提升。從以上研究不難看出,一方面從數(shù)據(jù)來源看,我國目前科研數(shù)據(jù)管理服務(wù)的借鑒研究還主要來自英語國家,雖然也有部分如荷蘭等非英語國家的研究,但畢竟科研體量不大。另一方面從借鑒內(nèi)容看,主要集中于政策角度和服務(wù)內(nèi)容角度,往往對一些基礎(chǔ)能力、基礎(chǔ)工具的研究還有所欠缺。而德國2011 年就開始了國家級科研數(shù)據(jù)基礎(chǔ)實施的框架項目“Radieschen”,在機構(gòu)層面,比勒菲爾德大學(xué)、柏林洪堡大學(xué)等德國高校自2013年也逐漸開始科研數(shù)據(jù)管理服務(wù),積累了較為豐富的實踐經(jīng)驗。經(jīng)過多年發(fā)展,德國在re3data注冊的科研數(shù)據(jù)知識庫位居全球第二,因此,分析德國高??蒲袛?shù)據(jù)管理的現(xiàn)狀和發(fā)展趨勢具有重要現(xiàn)實意義。
機構(gòu)科研數(shù)據(jù)管理服務(wù)主要包括3個層面的建設(shè)。機構(gòu)策略、組織運營和服務(wù)內(nèi)容。首先,從服務(wù)項目來說,科研數(shù)據(jù)管理服務(wù)具有較為清晰的內(nèi)容,研究也較為充分[2,9,16,17],基本都是從數(shù)據(jù)生命周期的角度開展相關(guān)服務(wù),如數(shù)據(jù)管理計劃的制定、數(shù)據(jù)的收集、數(shù)據(jù)的分析、數(shù)據(jù)的保存、數(shù)據(jù)的發(fā)布和數(shù)據(jù)的歸檔等。其次,科研數(shù)據(jù)管理策略、組織運營是機構(gòu)從事科研數(shù)據(jù)服務(wù)能力的重要指標(biāo)。德國RISE-DE模型是評估機構(gòu)執(zhí)行科研數(shù)據(jù)管理運行能力的重要框架,相比現(xiàn)有的雪城大學(xué)研究數(shù)據(jù)管理能力成熟度模型(SDM-CMM)、英國巴斯大學(xué)社區(qū)成熟度模型框架等,更加關(guān)注機構(gòu)數(shù)據(jù)戰(zhàn)略規(guī)范、運行組織效率等管理方面內(nèi)容[18]。因此,用該模型分析機構(gòu)策略和組織運營更為合適。RISE-DE認為機構(gòu)策略主要包括戰(zhàn)略發(fā)展規(guī)劃、責(zé)任和激勵和數(shù)據(jù)政策等;而組織運營則主要包括機構(gòu)人員組成、財務(wù)概算、公共關(guān)系等[19]。整體分析框架如圖1所示。
圖1 本研究分析框架
本研究的樣本來自德國比勒菲爾德大學(xué)、哥廷根大學(xué)、柏林洪堡大學(xué)、海德堡大學(xué)、基爾大學(xué)等8所高校。這8所高校中,比勒菲爾德大學(xué)、哥廷根大學(xué)、柏林洪堡大學(xué)、海德堡大學(xué)、基爾大學(xué)在2012、2013年左右開始實施科研數(shù)據(jù)管理服務(wù),是德國第一批提供該服務(wù)的高校,而卡爾斯魯厄工業(yè)大學(xué)、亞琛工業(yè)大學(xué)、馬爾堡大學(xué)是德國工業(yè)大學(xué)和文理大學(xué)的典型代表,而且開展科研數(shù)據(jù)管理服務(wù)也有近5年的歷史,因此也納入本研究樣本中。
通過訪問這8所高校的官方網(wǎng)站,查找科研數(shù)據(jù)管理服務(wù)的導(dǎo)航設(shè)置,發(fā)現(xiàn)8所高校都有單獨設(shè)置的科研數(shù)據(jù)管理服務(wù)主題網(wǎng)頁。同時,除哥廷根大學(xué)的科研數(shù)據(jù)管理服務(wù)列入eResearch Alliance(e科研聯(lián)盟)外,其余7所高校開展的服務(wù)都以“forschungsdaten/科研數(shù)據(jù)或Forschungsdaten management/科研數(shù)據(jù)管理”命名,具體如表1所示。
表1 德國高??蒲袛?shù)據(jù)管理服務(wù)欄目設(shè)置
4.1機構(gòu)數(shù)據(jù)策略
4.1.1 機構(gòu)戰(zhàn)略發(fā)展 德國高校的科研數(shù)據(jù)管理策略較為類似(見表2)。在發(fā)展戰(zhàn)略層面,8所高校都認為,良好的科研規(guī)范是科研數(shù)據(jù)發(fā)展的內(nèi)在驅(qū)動機制,這和德國高校的科研數(shù)據(jù)管理歷史有關(guān)。德國科學(xué)基金會(DFG)1998 年出臺了《確保良好科學(xué)實踐的建議》,認為科研數(shù)據(jù)管理是保證科學(xué)研究嚴謹和規(guī)范的重要手段。之后隨著科技的發(fā)展和信息時代的到來,科研數(shù)據(jù)有了更多用途,因此,DFG在2013 年又發(fā)布了《確保良好科學(xué)實踐的建議》補充版,文件中解釋了什么是良好的科學(xué)實踐,并規(guī)定了對科研數(shù)據(jù)的要求[20]。此外,基爾大學(xué)和馬爾堡大學(xué)分別組建了戰(zhàn)略管理機構(gòu),從建立目的上看,也是加深優(yōu)良的科學(xué)數(shù)據(jù)管理是良好科學(xué)實踐保障這一戰(zhàn)略。以馬爾堡大學(xué)的Kommission Forschung und Verantwortung(研究和責(zé)任委員會)為例,該委員會由教師代表(每個學(xué)院/系一名教授)、科研人員代表(非教授的普通科研人員)、學(xué)生代表和管理人員代表組成,其主旨就是明確“研究過程的每個階段都要意識到研究人員的責(zé)任,特別是在研究的過程中,加深所有參與人員對此責(zé)任感的認識”。
表2 德國高??蒲袛?shù)據(jù)管理戰(zhàn)略、政策和激勵機制
4.1.2 機構(gòu)數(shù)據(jù)管理政策和責(zé)任激勵機制 由于科研項目依來源、學(xué)科的不同,數(shù)據(jù)管理要求、共享匯交都不同,所以,德國高??蒲袛?shù)據(jù)管理政策并未強調(diào)數(shù)據(jù)的共享、收集辦法等細則,而是與責(zé)任激勵機制合二為一,就是明確在管理過程中的責(zé)任,而且也較為類似。本研究以亞琛工業(yè)大學(xué)(RWTH Aachen)科研數(shù)據(jù)管理政策為例詳細說明。首先高校有責(zé)任提供科研數(shù)據(jù)管理的支撐服務(wù),而科研人員有義務(wù)執(zhí)行良好科研規(guī)范。圍繞科研數(shù)據(jù)的生命周期,學(xué)校支持科研人員制訂數(shù)據(jù)管理計劃(DMP),學(xué)校的研究信息基礎(chǔ)設(shè)施和IT-中心有責(zé)任為科研人員提供(內(nèi)部或外部)數(shù)據(jù)保存/歸檔服務(wù),并提供全程培訓(xùn)。由于這種職責(zé)劃分,使得德國高校在科研數(shù)據(jù)管理中處于監(jiān)督和服務(wù)的地位,其自身并沒有相關(guān)的獎勵機制。德國科研數(shù)據(jù)獎勵主要來自科研資助方,如Open Data Impact Award(開放數(shù)據(jù)影響力獎金)由德國基金會協(xié)會頒發(fā),獎勵公開高質(zhì)量數(shù)據(jù)的科研人員。而對于院系級的專門科研數(shù)據(jù)政策,主要圍繞一些具有特定性、綜合性的特色學(xué)科而制定。如基爾大學(xué)位于德國北部港口城市,該校KMS(基爾海洋科學(xué)中心)、KLS(基爾生命科學(xué)中心)等4個綜合性研究中心有更加細分的科研數(shù)據(jù)政策。
由于政策規(guī)范性較強,德國洪堡大學(xué)基于德國教研部(BMBF)的國家級科研數(shù)據(jù)管理項目FDMentor,聯(lián)合地區(qū)內(nèi)高校聯(lián)合開發(fā)了科研數(shù)據(jù)政策工具(forschungsdaten-Policy-Schema)。該工具將科研數(shù)據(jù)政策分為總則、適用范圍、法律、數(shù)據(jù)處理、相關(guān)責(zé)任和有效期等6個部分,設(shè)置相應(yīng)的文本模塊,使用者可以較為便利的根據(jù)自身情況采用搭積木的方式形成自身機構(gòu)的科研數(shù)據(jù)政策。
4.2數(shù)據(jù)管理服務(wù)的組織運營科研數(shù)據(jù)管理服務(wù)的組織運營主要包括機構(gòu)人員組成、財務(wù)概算、公共關(guān)系等(見表3)。首先,治理和組織發(fā)展上,德國高校都建立專門的科研數(shù)據(jù)管理服務(wù)機構(gòu),雖然名字各不相同,但是從組成上看,基本由圖書館和計算中心為組成核心。有些高校如亞琛工業(yè)大學(xué)、馬爾堡大學(xué)還有校級管理辦公室的介入,有些高校如卡爾斯魯厄工業(yè)大學(xué)有校檔案館的加入。從人員上看,也和組織相對應(yīng),基本由數(shù)據(jù)管理人員、IT-技術(shù)人員和協(xié)調(diào)人員為主,部分機構(gòu)有專業(yè)人員和法律人員的加入。這主要是因為,科研數(shù)據(jù)管理需要不同機構(gòu)的不同能力,如圖書館信息組織能力,計算中心的軟、硬件支撐技術(shù),而服務(wù)之中還可能涉及數(shù)據(jù)的產(chǎn)權(quán)、隱私包含等法律問題等,如果由多部門聯(lián)合執(zhí)行,協(xié)調(diào)成本會較高,因此,聯(lián)合不同人員組成工作專班可以有效避免溝通協(xié)調(diào)成本,提高辦事效率。
表3 德國高??蒲袛?shù)據(jù)管理組織與運營
其次,在運營資金方面,目前還沒有檢索到各機構(gòu)的賬務(wù)情況,因此很難說建設(shè)以來的人力、物力投入和常規(guī)運營費用。當(dāng)然資金概算只有將科研數(shù)據(jù)管理服務(wù)所需配置齊全之后,計算才有意義,否則只是進行數(shù)據(jù)管理的某一部分或者服務(wù)程度不一,也使得資金投入產(chǎn)出邊界績效計算意義不大。哥廷根大學(xué)e研究聯(lián)盟是為科研人員搭建一個整體的e科研平臺,不僅涉及科研數(shù)據(jù),還包括如Endnote、Reference Manager等文獻管理工具、LimeSurvey開放問卷工具、Projectmanagemen-Service項目管理軟件、Statistik Programme統(tǒng)計工具集等50余種開放軟件的使用等,因此,目前承擔(dān)涉及科研數(shù)據(jù)管理資金投入概算的項目,依托該項目將構(gòu)建一個與數(shù)據(jù)量、投入人力、數(shù)據(jù)管理經(jīng)驗、數(shù)據(jù)質(zhì)量、數(shù)據(jù)異質(zhì)性、自動化程度、計算能力等相關(guān)因素資金投入模型。
最后,在公共關(guān)系領(lǐng)域,調(diào)研中的大部分德國高校主要還是通過傳統(tǒng)的咨詢和課程宣傳科研數(shù)據(jù)管理服務(wù)。其中,授課對象一般區(qū)分研究人員的層級,因為不同職級的研究人員在整個科研過程中扮演的角色不同。而形式上多種多樣,包括講座、研討課、路演、工作坊和在線課程等。值得注意的是,比勒菲爾德大學(xué)開設(shè)的數(shù)據(jù)管理課程經(jīng)過PEP認證。從教學(xué)材料上看更加注重知識的普及性、全面性和規(guī)范性,在媒介上注意網(wǎng)絡(luò)資源的應(yīng)用。如海德堡大學(xué)聯(lián)合州其他院校開發(fā)出德國科研數(shù)據(jù)知識百科網(wǎng)站forschungsdaten.info,編寫并對網(wǎng)絡(luò)上眾多培訓(xùn)材料、資料進行規(guī)整,供科研人員自學(xué)使用。洪堡大學(xué)開發(fā)E-Learning教學(xué)視頻。馬爾堡大學(xué)聯(lián)合州內(nèi)高校承擔(dān)了科研數(shù)據(jù)培訓(xùn)教材編制項目FOKUS,該項目由德國教研部(BMBF)資助,開發(fā)特定學(xué)科主題的模塊化科研數(shù)據(jù)培訓(xùn)單元。作為試點,目前已經(jīng)開發(fā)了經(jīng)濟學(xué)、德語研究和教育科學(xué)模塊,具體包括如學(xué)科領(lǐng)域內(nèi)良好數(shù)據(jù)管理實踐、數(shù)據(jù)管理計劃、元數(shù)據(jù)和元數(shù)據(jù)標(biāo)準、FAIR原則、數(shù)據(jù)質(zhì)量、數(shù)據(jù)組織、數(shù)據(jù)存儲、備份和存檔、數(shù)據(jù)保護和版權(quán)等。
4.3數(shù)據(jù)管理服務(wù)內(nèi)容科研數(shù)據(jù)生命周期指數(shù)據(jù)從收集、加工、保存、傳播、檢索、存取和利用,到數(shù)據(jù)歸檔的全過程[21]。本研究從數(shù)據(jù)生命周期角度調(diào)研這8所德國高校開展的相關(guān)服務(wù),具體如表4所示。發(fā)現(xiàn)各高校開展的服務(wù)較為齊備,項目也較為類似,同時,一方面,不同高校在服務(wù)中使用的部分工具較為統(tǒng)一,另一方面,各自高校還在服務(wù)中積極開發(fā)相關(guān)技術(shù)工具,提升服務(wù)質(zhì)量。因此,本研究在這部分以海德堡大學(xué)為主線簡述德國高??蒲袛?shù)據(jù)管理服務(wù)的基本流程,具體如圖2所示。同時,如上節(jié)所述,德國高校對于“軟件”技術(shù)的投入較大,所以,在介紹各服務(wù)的同時還將介紹部分特色工具和技術(shù)。
表4 德國高??蒲袛?shù)據(jù)管理服務(wù)內(nèi)容一覽表
4.3.1 項目啟動階段 海德堡大學(xué)的科研數(shù)據(jù)管理服務(wù)由學(xué)校組建的科研數(shù)據(jù)能力中心組織實施。在項目的開始階段,德國高校針對科研數(shù)據(jù)管理的服務(wù)核心主要就是數(shù)據(jù)管理計劃(DMP)。數(shù)據(jù)管理計劃不僅包括如何收集、分析、保存和發(fā)布數(shù)據(jù),還包含數(shù)據(jù)管理中的法律道德、敏感隱私數(shù)據(jù)的處理。與一般DMP制定使用DMP-Tool或者DMPonline不同,德國高校普遍使用卡爾斯魯厄工業(yè)大學(xué)主導(dǎo)開發(fā)的數(shù)據(jù)管理工具RDMO依資助方或研究機構(gòu)要求制定計劃。一方面可以防止由于原有工具集中式部署可能帶來的科研信息外泄,另一方面RDMO并非按照傳統(tǒng)資助方要求模板進行數(shù)據(jù)管理計劃的制定,而是將數(shù)據(jù)全生命周期中所有該考慮的因素,以問卷的形式引導(dǎo)科研人員回答,之后通過實體關(guān)系映射到資助機構(gòu)的模板之中。通過該軟件德國高校在項目之初就明確了數(shù)據(jù)管理各部分的責(zé)任人和時間。同時,RDMO具有兩種操作模式,科研人員在編寫的過程中,數(shù)據(jù)管理人員也可以進行參與,以便對計劃進行審查,并及時向科研人員進行反饋。
圖2 海德堡大學(xué)科研數(shù)據(jù)能力中心服務(wù)結(jié)構(gòu)流程圖
4.3.2 項目執(zhí)行階段
a.數(shù)據(jù)的發(fā)現(xiàn)。項目執(zhí)行階段的首要問題是確定所需數(shù)據(jù)是否存在或有類似數(shù)據(jù)可以重用。德國高校圖書館一般以提供科研數(shù)據(jù)庫門戶網(wǎng)站的方式來幫助研究人員收集與發(fā)現(xiàn)數(shù)據(jù)。海德堡大學(xué)建有HeiBIB機構(gòu)數(shù)據(jù)知識庫網(wǎng)站,科研人員一方面可以檢索本機構(gòu)的相關(guān)研究,另一方面由于數(shù)據(jù)知識庫注冊系統(tǒng)re3data.org本身是德國科學(xué)基金會資助建設(shè),德國大部分研究機構(gòu)的數(shù)據(jù)知識庫都在上面注冊,因此,通過該平臺還是可以查找其他相關(guān)科研數(shù)據(jù)。
b.數(shù)據(jù)的存儲。在項目開展過程中,德國高校為科研人員提供多種數(shù)據(jù)存儲方案。海德堡大學(xué)為科研人員在文件備份上提供由計算中心支持的本地heiBOX,以及州存儲服務(wù)器bwFile Storage,這些存儲服務(wù)大多對外不共享,主要用于保存較大文件和數(shù)據(jù)主副本。而對于一些重要、關(guān)鍵數(shù)據(jù),大學(xué)則提供SDS@hd服務(wù)器,該服務(wù)是州政府提供的存儲基礎(chǔ)設(shè)施,專門存儲所謂的熱點數(shù)據(jù)(“hot data”),提供較高的安全等級。同時,大學(xué)提供了bwSync&Share、Filetransfer等數(shù)據(jù)同步工具、文件傳輸工具等,方便科研人員進行內(nèi)部數(shù)據(jù)共享和傳遞。
c.數(shù)據(jù)的記錄分析。元數(shù)據(jù)標(biāo)準化是項目分析利用的重要環(huán)節(jié)。在數(shù)據(jù)描述、合并分析過程中,標(biāo)準化的元數(shù)據(jù)既有助于科研人員理解不同學(xué)科領(lǐng)域的數(shù)據(jù)含義,方便數(shù)據(jù)重用,也有利于自身數(shù)據(jù)的規(guī)范描述,從而提升自產(chǎn)數(shù)據(jù)的價值。海德堡大學(xué)主要是通過咨詢服務(wù)為科研人員提供元數(shù)據(jù)方案的支持服務(wù)。其實,在元數(shù)據(jù)領(lǐng)域,大量學(xué)科現(xiàn)在還沒有較為成熟的元數(shù)據(jù)方案,因此,德國高校普遍開展學(xué)科元數(shù)據(jù)的研究,如亞琛工業(yè)大學(xué)圖書館參與NFDI4Cat、NFDI4Chem等催化領(lǐng)域、化工領(lǐng)域國家科研數(shù)據(jù)基礎(chǔ)設(shè)施項目的建設(shè),建設(shè)內(nèi)容中學(xué)科元數(shù)據(jù)標(biāo)準就是核心任務(wù)之一。斯圖加特大學(xué)建有德國高性能計算中心,該校圖書館就開發(fā)出計算科學(xué)領(lǐng)域的元數(shù)據(jù)方案EngMeta,其由描述性元數(shù)據(jù)、學(xué)科特定元數(shù)據(jù)、過程元數(shù)據(jù)、技術(shù)性元數(shù)據(jù)等4部分組成,元素上又大量參考整合如:DataCite、ExptML、PROV/ProvOne等多個現(xiàn)有元數(shù)據(jù)方案,以實現(xiàn)較好的元數(shù)據(jù)互操作特性。
在數(shù)據(jù)分析方面,海德堡大學(xué)為科研人員提供heiCloud系統(tǒng),即IaaS(基礎(chǔ)設(shè)施即服務(wù)),包括處理CPU、內(nèi)存、存儲、網(wǎng)絡(luò)和其它基本的計算資源,用戶能夠部署和運行,包括操作系統(tǒng)和應(yīng)用程序在內(nèi)的任意軟件。
4.3.3 項目結(jié)束階段
a.數(shù)據(jù)合規(guī)、隱私保護。在項目結(jié)束階段,科研數(shù)據(jù)管理的主要工作是出版發(fā)布和長期歸檔。但首要面臨的問題是數(shù)據(jù)的合規(guī)性、敏感隱私等涉及法律法規(guī)的問題。科研數(shù)據(jù)的法律問題較為復(fù)雜,不同階段涉及的法律問題又不一樣。德國德累斯頓工業(yè)大學(xué)承接聯(lián)邦教研部相關(guān)課題DataJus,開發(fā)出科研數(shù)據(jù)管理法律框架條件決策樹工具,將數(shù)據(jù)內(nèi)容與眾多法律條目相關(guān)聯(lián),便于服務(wù)時找出數(shù)據(jù)可能涉及的法律條款以及相關(guān)的解決方案。
b.數(shù)據(jù)發(fā)布和歸檔。在數(shù)據(jù)出版時,海德堡大學(xué)為原始數(shù)據(jù)按照數(shù)據(jù)類型的不同分別存儲在HeiData和HeidlCON中。其中HeiData主要存儲和歸檔科研數(shù)據(jù),同時添加如DOI永久標(biāo)識符等,為了便于再利用,還支持規(guī)范字典的使用。HeidlCON則主要存儲圖像、圖片等多媒體文件。當(dāng)然海德堡大學(xué)也提供數(shù)據(jù)在其他專業(yè)領(lǐng)域數(shù)據(jù)知識庫發(fā)布的服務(wù)。而數(shù)據(jù)所對應(yīng)的出版物可以發(fā)布在如HeiDok、學(xué)校開放期刊系統(tǒng)Open Journal Sys里,對于發(fā)表于商業(yè)期刊的數(shù)據(jù)、文獻,海德堡大學(xué)建有OA出版基金,提供標(biāo)準化的APC費用支持服務(wù)。HeiDok中的論文和HeiData等數(shù)據(jù)知識庫建有鏈接,同時,這些數(shù)據(jù)以及由本校發(fā)表在其他專業(yè)數(shù)據(jù)知識庫的元數(shù)據(jù)收集到大學(xué)HeiBIB中,并建立索引供查詢。而這個知識庫又在如re3data中注冊,也被WoS 的Data Citation Index、Google Dataset Search檢索,供第三方使用,亦可提高影響力。
在其他高校中,比勒菲爾德大學(xué)圖書館在數(shù)據(jù)發(fā)布出版階段開發(fā)了CONQUAIRE工具,采用持續(xù)集成(Continuous Integration)的辦法實現(xiàn)科研數(shù)據(jù)可再現(xiàn)性的質(zhì)量控制。該工具既可以針對數(shù)據(jù)格式、數(shù)據(jù)缺失等進行一般性測試,也可以借助XML文件核查幫助監(jiān)測人員理解科研系統(tǒng)I(nput)/O(utput),從而實現(xiàn)結(jié)果的可再現(xiàn)性。而通過核查的數(shù)據(jù)給予相應(yīng)可信任徽章,提給傳播影響力,提升服務(wù)價值。
5.1數(shù)據(jù)政策強調(diào)科研規(guī)范和明細的職責(zé)劃分從戰(zhàn)略和政策文本上看,德國高??蒲袛?shù)據(jù)管理的激勵機制在外部更加強調(diào)科研的規(guī)范性,而內(nèi)部則體現(xiàn)明確的責(zé)任劃分。調(diào)研的8所高校都認為良好的科研規(guī)范是各自科研數(shù)據(jù)管理的戰(zhàn)略指導(dǎo),而高校和科研人員則應(yīng)當(dāng)承擔(dān)各自的基本義務(wù)。其中,高校為科研人員提供良好的數(shù)據(jù)管理支持,8所高校都基本以圖書館和計算中心為主要組成,單獨建立相關(guān)責(zé)任部門進行科研數(shù)據(jù)管理,并針對技術(shù)、管理問題開展科研項目。而科研人員則要保證科研過程的良好規(guī)范,并在數(shù)據(jù)的產(chǎn)生、使用、保存中實施。
5.2科研數(shù)據(jù)管理硬件配置齊全從科研數(shù)據(jù)管理服務(wù)的基礎(chǔ)設(shè)施配置上看,德國高校為數(shù)據(jù)全生命周期提供了多元的硬件支持。首先在項目申請階段,布置了分布式數(shù)據(jù)管理計劃工具RDMO。在項目執(zhí)行階段,不同學(xué)校都利用不同類型的存儲設(shè)備和輔助工具為科研人員提供包括科研數(shù)據(jù)文件的保存、同步、傳輸?shù)缺U?。在項目結(jié)束階段,搭建出版發(fā)布服務(wù)系統(tǒng),并匹配相關(guān)基金予以資助。同時,構(gòu)建與內(nèi)外部數(shù)據(jù)、出版物相關(guān)鏈接的檢索系統(tǒng),建立注冊機制,提升數(shù)據(jù)影響力。
5.3科研數(shù)據(jù)管理研究投入大,知識外溢明顯德國高校普遍承擔(dān)國家級科研數(shù)據(jù)管理項目,開發(fā)相關(guān)工具和軟件,如上文提及的E-Learning教學(xué)視頻、數(shù)據(jù)管理知識bwFDM-Info、RDMO數(shù)據(jù)管理計劃、數(shù)據(jù)管理培訓(xùn)課程FOKUS、可再現(xiàn)性驗證工具CONQUAIRE等。而在項目執(zhí)行之后,這些工具和軟件都形成了全德國高校開展科研數(shù)據(jù)管理有力“幫手”,bwFDM-info項目成果forschungsdaten.info、FDMP-Werkzeug項目成果RDMO等都已經(jīng)廣泛使用。國家級科研項目在科研數(shù)據(jù)理論到實踐過程中發(fā)揮了重要作用,知識外溢效果顯著。
5.4高校協(xié)作開展技術(shù)研發(fā)德國高校開展科研數(shù)據(jù)管理相關(guān)技術(shù)的研發(fā)主要采用合作的模式進行。比如FOKUS項目,由馬爾堡大學(xué)牽頭,聯(lián)合州內(nèi)其他4所高校聯(lián)合完成;bwFDM-Info則由卡爾斯魯厄大學(xué)負責(zé),聯(lián)合巴符州內(nèi)海德堡大學(xué)、斯圖加特大學(xué)等高校實施。而2019年剛剛啟動的國家科研數(shù)據(jù)基礎(chǔ)設(shè)施項目NFDI,更是由圖書館/信息機構(gòu)聯(lián)合專業(yè)學(xué)科,從國家層面不同研究機構(gòu)聯(lián)合承擔(dān),開發(fā)出不同學(xué)科的如數(shù)據(jù)質(zhì)量、元數(shù)據(jù)標(biāo)準等基礎(chǔ)性技術(shù)。同時,不難看出,不同類型的技術(shù)多為單一項目開展,如包含科研數(shù)據(jù)管理資金投入績效的項目GRAcE就由基礎(chǔ)設(shè)施較為全備的哥廷根大學(xué)承擔(dān),其他高校不再實施。因此,科研數(shù)據(jù)管理項目規(guī)劃重復(fù)性小,有效利用公益性項目,最大發(fā)揮知識溢出效應(yīng),減少了資金浪費。
目前,我國科研數(shù)據(jù)管理在研究層面,有了較為廣泛的開展,論文數(shù)量大幅增加,管理內(nèi)容和范圍也逐漸清晰,提供全面的數(shù)據(jù)分析、數(shù)據(jù)保存服務(wù)和科研數(shù)據(jù)管理平臺建設(shè)將成為機構(gòu)實施的重點[22]。但在執(zhí)行層面,除了國家科學(xué)數(shù)據(jù)平臺和個別高校外,絕大部分機構(gòu)還未開展實質(zhì)工作,數(shù)據(jù)還主要存在于項目組或個人手中。即便是現(xiàn)有平臺也存在重建輕用、標(biāo)準不一等問題,致使科研數(shù)據(jù)價值提升有限。所以,參考德國高校科研數(shù)據(jù)管理服務(wù)對我國相關(guān)機構(gòu)開展數(shù)據(jù)服務(wù)具有重要參考價值。
6.1加強科研數(shù)據(jù)管理的激勵機制建設(shè)2018年國務(wù)院辦公廳印發(fā) 《科學(xué)數(shù)據(jù)管理辦法》后,國家層面有了頂層設(shè)計,但機構(gòu)層面自主性科研數(shù)據(jù)管理政策還不多。目前,科學(xué)數(shù)據(jù)政策法規(guī)導(dǎo)向日趨溫和,自上而下“一刀切”的行政命令作用往往較為有限。所以,激勵機制建設(shè)是科研數(shù)據(jù)管理的基礎(chǔ)。科研數(shù)據(jù)管理的激勵機制建設(shè)主要包括兩個方面:1.強化科研人員的學(xué)術(shù)規(guī)范化教育;2.建立權(quán)責(zé)分明的科研數(shù)據(jù)政策。德國在科研數(shù)據(jù)實施戰(zhàn)略中也只是強調(diào)良好的科研規(guī)范是科研數(shù)據(jù)管理的戰(zhàn)略目標(biāo)。因此,圖書館/信息機構(gòu)可以將自身打造為科學(xué)規(guī)范教育的普及者,加大對于學(xué)術(shù)規(guī)范的教育,重視公開關(guān)系建設(shè),利用不同媒介和形式宣傳開放科學(xué)、科研數(shù)據(jù)管理。其次,機構(gòu)的科研數(shù)據(jù)管理政策是具體服務(wù)工作的指導(dǎo)文件。權(quán)力、責(zé)任和利益是一切過程中實施管理的“三要素”,缺一不可。其中責(zé)任是傳導(dǎo)層,也是關(guān)鍵環(huán)節(jié)。離開了責(zé)任,權(quán)力就會落空,當(dāng)然利益也就喪失了。因此,權(quán)責(zé)分明是工作能夠運行,組織協(xié)調(diào)推進的核心關(guān)鍵。德國高校科研數(shù)據(jù)政策都較為簡單,大多只有一頁,其核心就是說明各方的權(quán)力、義務(wù)和享受的服務(wù)。同時,還應(yīng)注意權(quán)責(zé)分明要與相應(yīng)管理者的能力相匹配,因此,德國高校都是組建單獨機構(gòu)進行科研數(shù)據(jù)管理服務(wù)。在具體工作中,圖書館/信息機構(gòu)應(yīng)聯(lián)合相關(guān)部門組建科研數(shù)據(jù)管理機構(gòu),發(fā)揮自身在信息組織上的優(yōu)勢,主導(dǎo)科研數(shù)據(jù)管理服務(wù)的開展。
6.2全生命周期建設(shè)增值科研數(shù)據(jù)管理服務(wù)目前,國內(nèi)高校開展科研數(shù)據(jù)管理服務(wù)主要依托數(shù)據(jù)平臺建設(shè),往往沒有將科研數(shù)據(jù)管理服務(wù)嵌入到科研過程之中,往往只是關(guān)注了存儲功能和平臺建設(shè),從而普遍造成重建輕用,形成大量“靜態(tài)”平臺,其核心問題就是未形成有效的服務(wù)增值。而增值的首要問題就是提高科研人員效率,降低科研數(shù)據(jù)管理的工作量。Peters C等在調(diào)查休斯頓大學(xué)科研數(shù)據(jù)管理時就發(fā)現(xiàn),科研人員對數(shù)據(jù)管理實際上需要的不僅是物理存儲能力,還有資助機構(gòu)的數(shù)據(jù)管理要求、學(xué)??赡苡杏玫臄?shù)據(jù)管理相關(guān)服務(wù)、出版支持等全方位服務(wù)[23]。而一體化的服務(wù)可以提升服務(wù)的投入產(chǎn)出已經(jīng)是普遍的公理。德國高校進行科研數(shù)據(jù)管理服務(wù)時,提供全方位的軟硬件服務(wù),特別是哥廷根大學(xué),整合了所有與學(xué)術(shù)研究相關(guān)的開放或者商業(yè)資源,打造一體化的e科研平臺,既提升科研效率,又降低數(shù)據(jù)管理難度。因此,圖書館/信息管理機構(gòu)在進行科研數(shù)據(jù)服務(wù)時,要構(gòu)建內(nèi)容包括數(shù)據(jù)管理計劃、數(shù)據(jù)的收集、存儲、分析、發(fā)布、出版,形式從咨詢到應(yīng)用的一整套服務(wù),才能吸引科研人員參與科研數(shù)據(jù)管理,實現(xiàn)科研工作過程的規(guī)范,加快數(shù)據(jù)共享進程。
6.3科研數(shù)據(jù)管理增值重在“軟件”建設(shè)科研數(shù)據(jù)服務(wù)的增值和最終目標(biāo)在于數(shù)據(jù)的復(fù)用。數(shù)據(jù)的高質(zhì)量、數(shù)據(jù)間的互操作、數(shù)據(jù)的可靠性、數(shù)據(jù)論文的關(guān)聯(lián)都有效提升數(shù)據(jù)價值的手段,而這些都需要技術(shù)能力為保障。因此,科學(xué)數(shù)據(jù)管理的成功核心是“軟件”建設(shè)。“軟件”建設(shè)微觀上包括科研數(shù)據(jù)管理培訓(xùn)、元數(shù)據(jù)規(guī)范、軟件工具,宏觀上包括數(shù)據(jù)管理聯(lián)盟和國家科研數(shù)據(jù)基礎(chǔ)設(shè)施的建設(shè)。主要由于科研數(shù)據(jù)資源與傳統(tǒng)文獻資源相比,首先,資源來源方式不同??蒲袛?shù)據(jù)大多掌握在科研人員的手里;其次,資源屬性和形式各異。不同學(xué)科之間數(shù)據(jù)資源從規(guī)模到格式差異明顯;最后,資源價值提升途徑復(fù)雜。需要不同數(shù)據(jù)、不同類型資源的有效關(guān)聯(lián)。而同時“軟件”的缺失還導(dǎo)致科研數(shù)據(jù)管理平臺和用戶之間缺少有效插件和接口,無法發(fā)揮應(yīng)有作用,服務(wù)人員也無從下手。德國高校在進行科研數(shù)據(jù)管理時,非常重視“軟件”建設(shè),從實體的數(shù)據(jù)管理工具、規(guī)范的培訓(xùn)教材,再到信息組織技術(shù)、數(shù)據(jù)知識網(wǎng)站,都有較為系統(tǒng)的開發(fā)。同時,科研數(shù)據(jù)從管理到利用仍有大部分研究空白,因此,我國相關(guān)機構(gòu)也應(yīng)從自身使用出發(fā),開展科研數(shù)據(jù)管理的相關(guān)主題研究,才能真正提升自身服務(wù)的吸引力,適應(yīng)開放科學(xué)的大趨勢。
6.4科研數(shù)據(jù)管理需要大范圍的協(xié)同科研數(shù)據(jù)管理雖然從硬件角度看,基本需要各個高校單獨進行建設(shè)或部分條件較好的高校為中心,以地區(qū)聯(lián)盟的形式構(gòu)建。但從整個科研數(shù)據(jù)管理建設(shè)而言,特別是“軟件”建設(shè),仍然需要大范圍的協(xié)同發(fā)展。而大范圍的協(xié)同應(yīng)具有兩層含義:一是技術(shù)上要廣泛布局,不同機構(gòu)依照自身特點和實力,開發(fā)科研數(shù)據(jù)管理中所需要的產(chǎn)品,進而通過產(chǎn)品推廣實現(xiàn)知識外溢;二是整體上又要協(xié)同合作,盡量在一個統(tǒng)一的框架中完成。這主要是因為,科研數(shù)據(jù)管理涉及的方面眾多,數(shù)字化標(biāo)準、數(shù)值質(zhì)量、研究工具、元數(shù)據(jù)標(biāo)準、專用術(shù)語等技術(shù)眾多,又涉及不同學(xué)科不同專業(yè)技術(shù)繁復(fù),同時,還又有如數(shù)據(jù)的法律和版權(quán)、道德和隱私,以及數(shù)據(jù)治理領(lǐng)域,如數(shù)據(jù)文化、獎勵機制、出版資助等具有廣泛共性的框架問題。具體工作中,可以參考重大專項設(shè)立科研管理科研項目基金,讓有資質(zhì)、有意愿的圖書館、信息機構(gòu)進行申請,開發(fā)科研數(shù)據(jù)管理中的重要技術(shù),解決實際工作中遇到的問題,在國際交流中也可以顯示科研數(shù)據(jù)管理中的中國元素。