張計(jì)龍(復(fù)旦大學(xué)圖書館副館長)
21世紀(jì)迎來了 “數(shù)據(jù)爆炸”的大數(shù)據(jù)時(shí)代, 2011年世界經(jīng)濟(jì)論壇稱大數(shù)據(jù)為新財(cái)富;2012年美國政府認(rèn)為大數(shù)據(jù)關(guān)系到國家經(jīng)濟(jì)結(jié)構(gòu)調(diào)整和產(chǎn)業(yè)升級, 是“未來的新石油”;2013年經(jīng)濟(jì)合作與發(fā)展組織報(bào)告指出,數(shù)據(jù)已經(jīng)成為科研活動的核心和科技創(chuàng)新發(fā)展的核心驅(qū)動要素。作為數(shù)字化革命的引擎,“大數(shù)據(jù)”為眾多科學(xué)研究帶來新機(jī)遇,科學(xué)范式開始從模型驅(qū)動向數(shù)據(jù)驅(qū)動轉(zhuǎn)變,開啟了以數(shù)據(jù)為中心思考、設(shè)計(jì)和實(shí)施科學(xué)研究的新研究范式。
在大數(shù)據(jù)時(shí)代, 誰掌握了數(shù)據(jù),誰就站到了大數(shù)據(jù)研究的戰(zhàn)略制高點(diǎn),因此,對數(shù)據(jù)資源的爭奪是大數(shù)據(jù)研究的必然階段。然而,擁有數(shù)據(jù)這一重要的戰(zhàn)略資源是不夠的,保證使用者拿到大數(shù)據(jù)資源,并能夠?qū)ζ溥M(jìn)行有效的分析研究、挖掘使用,才能充分發(fā)揮其戰(zhàn)略資源的作用。因此,數(shù)據(jù)資源的整合、開放、共享是實(shí)施好大數(shù)據(jù)發(fā)展戰(zhàn)略中極為重要的一個(gè)環(huán)節(jié)。這些也同樣面臨著來自技術(shù)、基礎(chǔ)設(shè)施、政策和法律、數(shù)據(jù)人才等各方面的挑戰(zhàn)。
科學(xué)數(shù)據(jù)管理與服務(wù)具有二個(gè)層面的含義。首先是科學(xué)數(shù)據(jù)的管理,涉及的對象既包括研究者個(gè)人如何合理地做科學(xué)數(shù)據(jù)管理規(guī)劃,也包含研究機(jī)構(gòu)如何制定機(jī)構(gòu)層面的科學(xué)數(shù)據(jù)管理與服務(wù)政策,搭建機(jī)構(gòu)科學(xué)數(shù)據(jù)管理與服務(wù)平臺,既實(shí)現(xiàn)機(jī)構(gòu)科學(xué)數(shù)據(jù)的有效管理,又能進(jìn)行科學(xué)數(shù)據(jù)的共享利用,實(shí)現(xiàn)科學(xué)數(shù)據(jù)的增值服務(wù)。其次是科學(xué)數(shù)據(jù)的共享服務(wù),在機(jī)構(gòu)或者研究者個(gè)人有效管理科學(xué)數(shù)據(jù)的基礎(chǔ)上,通過科學(xué)數(shù)據(jù)交換共享協(xié)議,利用科學(xué)數(shù)據(jù)共享服務(wù)平臺實(shí)現(xiàn)數(shù)據(jù)共享服務(wù)??茖W(xué)數(shù)據(jù)管理與服務(wù)對于科研人員和研究機(jī)構(gòu)而言都有著重要的作用與意義。
科研數(shù)據(jù)管理過程具有明顯的周期性和階段性特征,基于科研活動不同階段的數(shù)據(jù)形態(tài)和數(shù)據(jù)處理活動,形成關(guān)于科研數(shù)據(jù)管理的相關(guān)生命周期理論。重點(diǎn)介紹了ICPSR社會科學(xué)數(shù)據(jù)存檔生命周期管理模型。
科學(xué)數(shù)據(jù)管理與共享政策有待于政府機(jī)構(gòu)和資助主體的積極推進(jìn)。
歐盟委員會提出的“FAIR 原則”(Findable、Accessible、Interoperable、Reusable,即可發(fā)現(xiàn)、可訪問、可交互、可重用) 正成為科學(xué)數(shù)據(jù)管理、監(jiān)管與出版的最新通用原則。2016年7月26日,歐盟委員會公布《Horizon 2020框架下的FAIR數(shù)據(jù)管理指南》,提出所有受Horizon 2020資助且參與“開放研究數(shù)據(jù)試行計(jì)劃”的項(xiàng)目必須提交數(shù)據(jù)管理計(jì)劃(Data Management Plan,DMP)。
美國國立衛(wèi)生研究院(National Institutes of Health,NIH) 也正在進(jìn)一步發(fā)展數(shù)據(jù)管理、共享和引用策略,其新目標(biāo)是希望通過一系列數(shù)據(jù)管理措施來保證數(shù)據(jù)的公平出版。
我國于2018 年3 月17 日由國務(wù)院辦公廳印發(fā)了《科學(xué)數(shù)據(jù)管理辦法》(以下簡稱《辦法》),從職責(zé)、科學(xué)數(shù)據(jù)采集、匯交與保存、共享與利用、保密與安全等方面對科學(xué)數(shù)據(jù)管理與共享進(jìn)行了規(guī)范。其中,第四章主要對科學(xué)數(shù)據(jù)的共享與利用進(jìn)行了規(guī)范?!犊茖W(xué)數(shù)據(jù)管理辦法》解讀可從科技部基礎(chǔ)研究司司長葉玉江和國家科技基礎(chǔ)條件平臺中心副主任王瑞丹對《辦法》提出的具體措施中體現(xiàn)?!掇k法》第十九條、二十條、二十一條、二十二條、二十三、二十四條等對科學(xué)數(shù)據(jù)的共享利用相關(guān)問題進(jìn)行了規(guī)定。
為加強(qiáng)科技創(chuàng)新基礎(chǔ)能力建設(shè),推動我國科技資源整合共享與高效利用,打破科技信息滯留和數(shù)據(jù)壟斷格局,“十一五”以來,我國科技部、財(cái)政部組織開展國家科技基礎(chǔ)條件平臺建設(shè)工作,目前科學(xué)數(shù)據(jù)共享領(lǐng)域已經(jīng)建成。數(shù)據(jù)開放政策落實(shí)中也面臨來自科研激勵(lì)機(jī)制、知識產(chǎn)權(quán)問題、國家安全、機(jī)密和隱私保護(hù)、成本問題、個(gè)體心理和組織文化問題、技術(shù)和基礎(chǔ)設(shè)施等多方面的阻礙。
國外數(shù)據(jù)中心,走訪了芝加哥大學(xué)NORC與GSS(綜合社會調(diào)查項(xiàng)目)、密西根大學(xué)ISR與ICPSR(校際社會科學(xué)數(shù)據(jù)共享聯(lián)盟)。哈佛大學(xué)IQSS、HMDC,HMDC是一個(gè)由哈佛大學(xué)和麻省理工學(xué)院聯(lián)合創(chuàng)建的數(shù)據(jù)中心,是定量社會科學(xué)研究所(IQSS)的一個(gè)成員。加州伯克利大學(xué)數(shù)據(jù)中心的D-Lab主要為伯克利的師生和研究人員提供一些社會科學(xué)數(shù)據(jù)的服務(wù)和支持,以促進(jìn)數(shù)據(jù)密集型社會科學(xué)數(shù)據(jù)的研究。另外還走訪了Google 和 Facebook總部、美國人口普查局總部、英國信息系統(tǒng)聯(lián)合委員會(JISC)、澳大利亞科學(xué)數(shù)據(jù)管理Australian code、莫納什大學(xué)的科學(xué)數(shù)據(jù)管理計(jì)劃。
國內(nèi)主要調(diào)研了中國地球與地質(zhì)物理數(shù)據(jù)共享子平臺、上海研發(fā)公共服務(wù)平臺(SGST)、北京大學(xué)中國社會科學(xué)調(diào)查中心(ISSS)、中國綜合社會調(diào)查(CGSS)。
國外知名的社會科學(xué)數(shù)據(jù)中心至今已有五十余年的發(fā)展歷史,已構(gòu)建了比較成熟的數(shù)據(jù)交換共享平臺。反觀國內(nèi),社會科學(xué)數(shù)據(jù)中心起步較晚,針對科研機(jī)構(gòu)產(chǎn)生的社會科學(xué)數(shù)據(jù)的長期保存和共享利用雖有嘗試,但仍處于初級階段,亟待發(fā)展。
復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)中心(FISR)制定了《復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺管理?xiàng)l例》,拓展數(shù)據(jù)資源與服務(wù)模式,并在交流合作中尋求新發(fā)展。如中國高校研究數(shù)據(jù)管理推進(jìn)工作組依托大數(shù)據(jù)學(xué)院與大數(shù)據(jù)研究院的技術(shù)力量、先進(jìn)設(shè)施和成果轉(zhuǎn)化服務(wù)能力,充分發(fā)揮復(fù)旦大學(xué)人文社會科學(xué)的學(xué)科優(yōu)勢,構(gòu)建人文社科科學(xué)大數(shù)據(jù)共享服務(wù)平臺和服務(wù)體系,包括復(fù)旦大學(xué)人文社科數(shù)據(jù)平臺的數(shù)據(jù)資源、數(shù)據(jù)可視化、數(shù)據(jù)工具、合作探索數(shù)據(jù)出版以及數(shù)據(jù)教學(xué)科研平臺的建設(shè)與推廣等。
科學(xué)數(shù)據(jù)的價(jià)值及數(shù)據(jù)管理與共享開放的意義更加明晰,政策導(dǎo)向更加清晰。數(shù)據(jù)管理與數(shù)據(jù)開放的理念逐步落地,新興技術(shù)提供持續(xù)助力,推動更好發(fā)展。數(shù)據(jù)權(quán)益和數(shù)據(jù)安全依然是多方關(guān)注的焦點(diǎn),合作與共贏是不變的發(fā)展之道。不論科研領(lǐng)域,不論利益群體,不論地區(qū)機(jī)構(gòu),未來更大的發(fā)展需要多方為了共同的目標(biāo),不忘初心,砥礪前行。