何思源
摘? 要:本文章提出科研檔案和科學數據協(xié)同治理的構想,重點從三個層面分析協(xié)同治理的內部動力和外部推力。在概念層面,科研檔案和科學數據互有交叉且漸趨融合;在管理層面,兩項工作在目標理念層面具有一致性,在業(yè)務內容層面具有互補性;在風險收益層面,協(xié)同治理能加強資源管控、資源聯動、部門協(xié)作和專業(yè)合作,降低科研資產流失、資源重復投入、信息無法統(tǒng)一利用、資源分配失衡的風險。
關鍵詞:科研檔案;科學數據;科研信息資源;協(xié)同治理
Abstract: This paper puts forward the idea of cooperative governance of scientific records and scientific data,and focuses on analyzing the internal and external motivation of cooperative governance from three aspects. From the perspective of concept,scientific records and scientific data intersect each other and tend to merge. From the perspective of management,they are consistent at the level of goals and ideas,and complementary at the level of business process. From the perspective of risk and benefits,cooperative governance can strengthen resources management and control,resource linkage,department collaboration and professional cooperation,and reduce the risks of scientific research assets loss,repeated investment of resources,inability to use information uniformly,and unbalanced resource allocation.
Keywords: Scientific data; Scientific records; Scientific information resources; Cooperative governance
大數據時代,數據驅動的科研第四范式逐漸興起,科學數據成為科研活動的關鍵基礎設施,受到國際科學界的廣泛關注和高度重視。目前,部分學者開始關注科學數據實踐對科研檔案管理的啟示[1][2]或將檔案管理的原則與方法引入科學數據管理實踐[3][4][5]但鮮有學者同時探討兩者的雙向互動。
基于此,筆者提出科研檔案和科學數據協(xié)同治理的構想。本文將初步展開探索性研究,聚焦協(xié)同治理的內部動力和外部推力,分析推動兩者協(xié)同的深層動因。
1 概念層面:科研檔案和科學數據互有交叉且漸趨融合
1.1 基于政策的關系推導:交集。科研檔案作為“對科研活動及與之相關的科研管理活動的真實記錄”,其涉及面非常廣泛。[6][7][8]
科學數據是指“在自然科學、工程技術科學等領域,通過基礎研究、應用研究、試驗開發(fā)等產生的數據,以及通過觀測監(jiān)測、考察調查、檢驗檢測等方式取得并用于科學研究活動的原始數據及其衍生數據”。[9]具體來說,科學數據包括“研究者自身形成的數據”和“研究者、項目組或實驗室收集的數據”。[10]其中,前者是指研究者在各類科研實踐中通過觀測、實驗、調查、建?;蚰M等方式生成的數據和數據產品;后者是指收集而來的各類數據,包括政府部門長期采集和管理的業(yè)務數據(如水文、地質、氣象等相關領域的數據)、購買的數據等??梢姡蒲袡n案與科學數據之間存在交叉關系。
有些數據對于科學研究有著重要的支撐性作用,屬于科學數據的范疇,但卻不屬于科研檔案的范疇??蒲袡n案強調“具有保存價值”,是經過價值鑒定形成的,即只有對后續(xù)的科研和相關業(yè)務活動有價值的科學數據才能構成科研檔案。科研檔案同時涉及科研活動和科研管理活動,而科學數據不涉及科研管理活動。因此,經價值鑒定后確定具有保存價值的項目數據是兩者的交集部分。
1.2 基于實踐的關系推導:包含。在工作實踐中,科學數據有狹義和廣義兩種理解。狹義的科學數據是指探測器等數據采集設備自動采集的數據,如觀測數據;而廣義的科學數據泛指科研活動中產生的所有數據,即被收集起來且被視為推理、討論或計算基礎的所有信息,特別是事實或數字。
若采用廣義理解,則科學數據不僅包括通過觀測、實驗、調查、模擬、處理、分析、重建等方式獲得的數據和數據產品,還包括整個科研活動產生的設計文檔、進展文檔、成果、專利等。科學數據不再局限于科研活動本身,還涉及科研管理活動中形成的各類文檔材料?;谶@種理解,科學數據包含科研檔案。
同理,科研檔案也有狹義和廣義之分。狹義的科研檔案是指科研項目檔案;而廣義的科研檔案是指“在科學研究與科研管理活動中形成的具有憑證、依據價值的重要信息及其載體”。[11]
科學數據能夠起到驗證科研成果的作用,具有重要的憑證和參考價值,若采用“泛檔案”的視角,基于廣義的科研檔案理解,則可得出科研檔案包括科學數據的結論。
美國國家航空航天局就將其科學數據稱為數據檔案,而保存科學數據的部門稱為檔案館。其中,保存地球科學數據的是分布式現行數據存檔中心群,保存空間科學數據的是空間科學數據協(xié)調檔案館。
2 管理層面:兩項工作兼具一致性和互補性
2.1 目標和理念的一致性。科學數據管理和科研檔案管理的目標具有一致性,均以支撐科學研究、技術創(chuàng)新和經濟社會發(fā)展為核心。
在聯合國教科文組織、世界經濟合作與發(fā)展組織等國際組織發(fā)布的科學數據相關政策中,大多將開放共享作為著力點和突破口,歐盟于2017年發(fā)布的《地平線2020框架下的科學出版物與研究數據開放獲取指南》更是明確將科學數據開放獲取的目的闡述為“基于前人的研究成果,提高成果質量;鼓勵合作,避免重復勞動,提高效率;加快創(chuàng)新,更快的市場化意味著更快的增長;涉及公民和社會,有助于提高科學進程的透明度”。[12]
與之類似,科研檔案管理的目的亦是服務科研創(chuàng)新。20世紀50年代,蘇聯專家撤離中國時帶走大量技術資料,嚴重影響了我國的生產經營與科學研究活動。為此,于1959年召開了技術檔案工作大連現場會議并討論通過《技術檔案室工作暫行通則》,明確了技術檔案的重要性,即“生產、建設和科學技術研究工作中大量地利用了技術檔案和技術資料,避免了許多不必要的重復勞動,為國家節(jié)省了大量的人力、物力、財力,并大大地加快了生產、建設和科學技術研究的速度”。[13]
科研檔案作為科技檔案的重要組成部分,在支撐科研、服務創(chuàng)新、推動社會主義現代化建設進程中發(fā)揮著至關重要的作用。
由于管理目標的吻合,兩者都提倡管理活動與科研活動相互融合的理念,即將管理活動納入科研過程??茖W數據管理和科研檔案管理部門均將自己定位為輔助角色、服務部門,強調將數據管理意識和檔案意識融入科研人員的思想之中,使數據和檔案的管理真正成為科研活動的組成部分。
在科學數據管理領域,出現了“數據館員”的概念,各高校圖書館積極為科研人員提供制定數據管理計劃、進行數據組織、保存與共享的相關工具和服務。同時,科研機構檔案部門也在借助單軌制推廣的有利時機,積極嘗試優(yōu)化歸檔流程,實現科研活動到檔案工作的“無縫銜接”,通過“一鍵歸檔”的方式盡可能減少科研人員在歸檔過程中的工作量,為科研活動提供更優(yōu)質便捷的服務。
2.2 業(yè)務工作內容的互補性。在業(yè)務流程上,科學數據管理和科研檔案管理都遵循生命周期管理模型,如圖1所示。通過對比分析可發(fā)現,“采集生成”和“形成”“加工處理”和“分類編目”“匯交”和“歸檔”“保存”和“保管”以及“共享利用”和“開發(fā)利用”基本呈現一一對應的關系,科研檔案“鑒定”中的“密級鑒定”與科學數據“共享”中的限制條件存在相似之處。
圖1 科學數據管理和科研檔案管理生命周期對應關系示意圖
但具體到某一環(huán)節(jié),兩者又存在一定的差異,具有互補性。需要注意,這種差異和側重不是絕對的,而是相對的,科研檔案管理側重歸檔保存并不意味著對開發(fā)利用的否認。
第一,在采集生成階段,除數據的來源與質量(包括內容的可信和信息的可用)外,科學數據管理還需考慮“信息是否符合科學需求”,[14]而科研檔案管理則需更多地考慮其真實性和完整性。
第二,在信息轉移階段,科學數據管理采用的是“匯交”,而科研檔案管理采用的是科研機構內部的科研管理部門及項目組與檔案部門之間的“歸檔/移交”。
第三,在組織階段,科學數據加工處理以“用”為目標,而科研檔案則依據來源原則進行整理。
第四,在保存階段,與科學數據相比,科研檔案長期保存還涉及真實性保障,可用性有著更高的要求,較少關注知識產權、隱私權等權益類問題。
第五,在利用階段,科學數據管理關注科研價值、經濟價值以及社會價值等現實價值,而科研檔案管理則更注重憑證、證據、歷史與記憶等價值。
最后,科研檔案管理還涉及鑒定與處置,但多數科學數據中心(數據倉儲)在接收數據時,除必要的質量檢查外,并未系統(tǒng)衡量科學數據的價值、劃定保管期限,也并未開展數據的處置(尤其是銷毀)活動。這種差異性是推動兩者相互借鑒、取長補短、互利共贏的重要驅動力。
3 風險收益層面:規(guī)避風險與增加收益
3.1 加強資源管控,降低科研資產流失、資源重復投入的風險。在資源層面,科研檔案和科學數據割裂管理主要存在兩種類型的風險。
一是科研資產流失風險??萍疾炕A研究司副司長郭志偉在《新時期的科學數據管理》[15]中提到:通過對我國科研人員的問卷調查,90%的受訪者所在科研團隊/課題組并未對生產和收集的科學數據進行歸檔或以理想方式長期保存,而是散落在科研人員手中,成為“暗數據”。
二是資源重復投入風險。如果不能從宏觀層面進行統(tǒng)籌規(guī)劃,就會造成部分科學數據既在數據管理部門管理,又在檔案部門管理,增加管理成本、造成資源浪費。
3.2 加強資源聯動,降低信息無法統(tǒng)一利用的風險。近年來,在科學數據管理過程中,人們逐漸意識到資源聯動對于促進知識發(fā)現與獲取的重要意義,科學數據與科技文獻(尤其是期刊文獻)的關聯服務受到越來越多的關注與重視。
國際社會科學信息服務與技術協(xié)會2013年召開的第39屆年會以“數據創(chuàng)新:不斷提升的可獲取性、可見度和可持續(xù)性”為主題,其中研究期刊與科學數據之間的關聯成為重要議題之一。[16]
國際數據委員會(CODATA)中國全國委員會2019年主辦的第六屆中國科學數據大會以“科學數據與文獻資源關聯與整合服務”為主題設置分會場探討相關問題。[17]
但多數科研檔案仍未實現與科學數據的有效關聯,通過科研檔案無法獲取相應的數據資源,通過科學數據也無法獲取相應的檔案資源,阻礙了科研信息資源的集成服務與利用。
因此,亟須通過科研檔案和科學數據的協(xié)同治理,建立資源之間的關聯,提高信息的可見度,促進信息獲取與知識發(fā)現,降低信息無法統(tǒng)一利用的風險。
3.3 加強部門協(xié)作,降低資源分配失衡的風險。在科研檔案和科學數據的割裂管理模式中,數據管理部門和檔案部門之間存在資源分布不均的情況。
根據筆者的調研,由于科學數據發(fā)揮價值的速度較快,其價值往往更容易為科研人員感知,因此來自國家和科研機構的經費、技術、人財物等各類保障資源較多。而科研檔案的價值發(fā)揮具有一定的滯后性,且存在“重管輕用”的現象,其價值不易為科研人員感知。與科學數據管理相比,用以支撐科研檔案管理的資源相對較少。
3.4 加強專業(yè)合作,擴大科研信息資源管理的共同體。科研檔案和科學數據的管理協(xié)同,有助于加強兩個領域的交流、溝通與合作,擴大科研信息資源管理的共同體,協(xié)同應對面臨的共同難題和挑戰(zhàn)。科學數據管理國際組織研究數據聯盟中的研究數據管理檔案與文件專業(yè)興趣組和國際檔案理事會下設的大學與研究機構檔案處科學與研究數據委員會就是很好的例證。
通過這種專業(yè)合作的方式,檔案管理專家與科學數據管理專家取長補短、相互借鑒能夠切實有效地改善當前管理現狀,提高共享服務和開發(fā)利用水平。
4 結語
本文提出了協(xié)同治理的構想,重點探討了協(xié)同治理的動因,包括協(xié)同治理的內部動力和外部推力。科研檔案和科學數據的協(xié)同治理框架和協(xié)同治理機制將成為新的重要研究課題。
* 本文系中國科學院檔案館委托項目“國內外檔案工作情況調研”(項目編號:2019K20323)研究成果之一。
參考文獻:
[1]楊文娜,張斌,李子林.國外科研記錄與數據管理實踐對我國科研項目檔案管理的啟示[J].檔案學研究,2019(02): 122-128.
[2]王英.社會科學數據檔案館的發(fā)展、問題及啟示[J].檔案學研究,2019(02): 77-80.
[3]閆鵬.利益相關者視角下檔案部門參與科學數據管理的分析[J].檔案天地,2019(03): 47-49.
[4]Evans J, Reed B, Linger H, etc. Winds of change: a recordkee
ping informatics approach to information management needs in
data-driven research environments[J].Records Management Jo
urnal,2014,24(03):205-233.
[5]Childs S, McLeod J, Lomas E, etc. Opening research data: issues and opportunities[J].Records Management Journal,2014,24(02): 142-162.
[6]科學技術研究檔案管理暫行規(guī)定[J].檔案工作,1987(06): 13-15.
[7]涂立超,梅方竹.試論高??蒲泄芾碇械目蒲袡n案規(guī)范化建設問題[J].科技管理研究,2006(05): 115-116+120.
[8]國家檔案局、科技部發(fā)布《科學技術研究檔案管理規(guī)定(征求意見稿)》.[EB/OL].[2020-07-03]. http://www.saac.gov.cn/daj/qydagz/201812/8a997c0494b9425594c33c2bd40fe973.shtml.
[9]國務院辦公廳.科學數據管理辦法[EB/OL]. (2018-03-17)[2020-07-03]. http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.
[10]Maday C, Moysan M. Records management for scientific data[J].Archives and Manuscripts,2014,42(02): 190-192.
[11]安小米.我國科技計劃項目檔案管理研究[J].山西檔案,2007(04): 14-17.
[12]European Commission. Guidelines on open access to scientific publications and research data in Horizon 2020[EB/OL]. (2017-03-21)[2020-07-03]. https://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf.
[13]國家檔案局關于技術檔案工作大連現場會議的報告[J].檔案工作,1960(03): 3-4.
[14]Gamble M ,Goble C. Quality, trust, and utility of scientific data on the web: towards a joint model[C].International Web Science Conference.ACM,2011.
[15]科學技術部基礎研究司副司長郭志偉在第六屆中國科學數據大會上作的題為《新時期的科學數據管理》的主旨報告.
[16]Marieke Guy. IASSIST, Research Journals and Data Linkages[EB/OL]. (2013-06-05)[2020-07-03]. http://www.dcc.ac.uk/blog/iassist-research-journals-and-data-linkages.
[17]第六屆中國科學數據大會分會日程[EB/OL].[2020-07-03].http://dc2019.codata.cn/dct/page/70018.
(作者單位:數據工程與知識工程教育部重點實驗室,中國人民大學信息資源管理學院,中國人民大學電子文件管理研究中心,來稿日期:2020-07-28)