亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        我國科學(xué)數(shù)據(jù)開放共享模式、標(biāo)準(zhǔn)與影響因素研究

        2021-01-07 21:23:30溫亮明
        圖書情報研究 2021年1期
        關(guān)鍵詞:科學(xué)

        溫亮明 李 洋

        (1.中國科學(xué)院計算機網(wǎng)絡(luò)信息中心 北京 100190;2.中國科學(xué)院大學(xué) 北京 100049;3.成都體育學(xué)院圖書館 成都 610041)

        1 引言

        隨著數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)處理等技術(shù)的不斷發(fā)展,技術(shù)創(chuàng)新和科學(xué)研究也走向了以數(shù)據(jù)為資產(chǎn)的科學(xué)大數(shù)據(jù)時代,數(shù)據(jù)密集型科學(xué)與發(fā)現(xiàn)成為新的研究范式,也順勢出現(xiàn)了一批以數(shù)據(jù)為基礎(chǔ)的新興交叉學(xué)科[1],科學(xué)數(shù)據(jù)的概念逐步被提及??茖W(xué)數(shù)據(jù)是在領(lǐng)域或?qū)W科知識指導(dǎo)下,在科學(xué)研究過程中對研究對象進(jìn)行抽象和概念化后所形成的、以科學(xué)證據(jù)形式存在的基本數(shù)據(jù)、資料以及經(jīng)系統(tǒng)加工而成的數(shù)據(jù)產(chǎn)品和相關(guān)信息[2-4]??茖W(xué)數(shù)據(jù)被認(rèn)為是證實或者證偽科學(xué)發(fā)現(xiàn)或科學(xué)觀點的事實、證據(jù)或者論證推理的基礎(chǔ)[5],既是科學(xué)研究不可或缺的重要組成部分,又是科技創(chuàng)新活動中最基本的要素,還是科技創(chuàng)新、經(jīng)濟(jì)發(fā)展和國家安全的重要對象與基礎(chǔ)條件,具有很大的潛在價值和開發(fā)價值,是信息時代最基本、最活躍且影響面最寬的基礎(chǔ)性和戰(zhàn)略性科技資源,對國家科技發(fā)展具有重要意義[6]。

        盡管科學(xué)數(shù)據(jù)儲量大、價值高,但傳統(tǒng)的“自給自足”式科研理念已經(jīng)不足以完全支撐當(dāng)前科研活動的需求[7]:一方面數(shù)據(jù)生產(chǎn)者不知如何使用所掌握的大量數(shù)據(jù)資源,另一方面以數(shù)據(jù)為原材料的科學(xué)研究無法獲得可供分析的數(shù)據(jù)。此困境的緣由之一即是科學(xué)數(shù)據(jù)未在數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)使用者之間進(jìn)行有效的開放共享。因此,推動科學(xué)數(shù)據(jù)開放共享已成為現(xiàn)代科學(xué)研究的必然訴求[8]。一些組織機構(gòu)開始呼吁或要求數(shù)據(jù)生產(chǎn)者將所擁有的科學(xué)數(shù)據(jù)以標(biāo)準(zhǔn)、規(guī)范的形式對科學(xué)共同體開放,以供他人獲取和重用??茖W(xué)數(shù)據(jù)之所以需要被開放共享有一定的理論依據(jù)[9]:其一,任何個人或單個組織的能力是十分有限的,為了適應(yīng)當(dāng)前基于海量科學(xué)數(shù)據(jù)的科研發(fā)展趨勢,必須借助其他相關(guān)領(lǐng)域的科學(xué)數(shù)據(jù);其二,科學(xué)數(shù)據(jù)是科技活動長期積累的一種科技資源,其具有特殊的排他屬性,具有很大的潛在價值并且可以在應(yīng)用中不斷增值;其三,國家投資所產(chǎn)生的科學(xué)數(shù)據(jù)對外共享是對納稅人納稅義務(wù)的一種補償,信息公開是政府應(yīng)當(dāng)對公眾承擔(dān)的一項法定職責(zé)。此外,還有學(xué)者提出了科學(xué)數(shù)據(jù)共享的4個理由[10]:便于證明或證偽現(xiàn)有結(jié)果、使公共資助產(chǎn)生的結(jié)果實現(xiàn)效用最大化、使其他人利用現(xiàn)有數(shù)據(jù)提出新的科學(xué)問題、提升研究水平和創(chuàng)新能力。

        目前,已有眾多專家學(xué)者從不同層面對我國科學(xué)數(shù)據(jù)開放共享實踐及其理論研究的相關(guān)問題進(jìn)行了有益探索,如科學(xué)數(shù)據(jù)開放共享政策調(diào)查、科學(xué)數(shù)據(jù)共享行為分析、科學(xué)數(shù)據(jù)平臺/中心案例分析、科學(xué)數(shù)據(jù)開放共享路徑探索、科學(xué)數(shù)據(jù)共享平臺構(gòu)建、國外科學(xué)數(shù)據(jù)共享經(jīng)驗推介等,但關(guān)于共享模式、標(biāo)準(zhǔn)規(guī)范、影響因素三個主題的研究較少。共享模式和標(biāo)準(zhǔn)規(guī)范的形成說明科學(xué)數(shù)據(jù)共享已經(jīng)存在成熟的運行機制,準(zhǔn)確識別影響因素可為后續(xù)優(yōu)化科學(xué)數(shù)據(jù)共享服務(wù)策略提供參考借鑒,因此本文將歸納總結(jié)以上三個主題現(xiàn)有研究成果的核心觀點,以期對現(xiàn)有研究成果內(nèi)容體系進(jìn)行補充和完善。

        2 科學(xué)數(shù)據(jù)開放共享的模式選擇

        科學(xué)數(shù)據(jù)開放共享在實踐中逐步形成了適合當(dāng)前共享工作需要的普遍范式,按照不同的分類標(biāo)準(zhǔn)可以劃分出不同的共享模式[11]。目前國內(nèi)研究大多以數(shù)據(jù)所依托的組織機構(gòu)形式對科學(xué)數(shù)據(jù)共享模式進(jìn)行分類,如政策驅(qū)動模式、部門交互模式、企業(yè)驅(qū)動模式、國際合作模式等[12-14],本文從數(shù)據(jù)依附關(guān)系角度,將科學(xué)數(shù)據(jù)共享的模式歸納為以下科學(xué)儀器共享、數(shù)據(jù)平臺共享、數(shù)據(jù)出版共享、眾包處理共享、數(shù)據(jù)交易共享五種。

        2.1 科學(xué)儀器共享模式

        科學(xué)儀器是進(jìn)行科學(xué)研究實現(xiàn)科學(xué)發(fā)現(xiàn)的重要基礎(chǔ)之一,其在多個領(lǐng)域?qū)崟r的、持續(xù)的產(chǎn)生著大量的科學(xué)數(shù)據(jù)。按照科學(xué)儀器的類型/用途可以將科學(xué)儀器共享模式劃分為兩類:(1)科學(xué)裝置模式,以500 米口徑球面射電望遠(yuǎn)鏡(FAST)、北京正負(fù)電子對撞機(BEPC)、中國散列中子源(CSNS)等為代表的大型儀器設(shè)備及工程,源源不斷生產(chǎn)和捕獲超大規(guī)模數(shù)據(jù)資源以支持長期持續(xù)的科學(xué)技術(shù)活動[15]。根據(jù)科學(xué)裝置中數(shù)據(jù)生產(chǎn)周期,又可以將其數(shù)據(jù)共享分為即時共享和延時共享兩種類型[16]:①即時共享型,所生產(chǎn)的數(shù)據(jù)僅經(jīng)過必要的標(biāo)準(zhǔn)化處理后即提供給數(shù)據(jù)用戶;②延時共享型,所產(chǎn)生的數(shù)據(jù)必須首先滿足項目組內(nèi)部成員的科研需求,經(jīng)過數(shù)據(jù)分級后再有選擇、有目的、有計劃的向社會公眾與科研機構(gòu)逐步開放。(2)監(jiān)測網(wǎng)絡(luò)模式,以國家生態(tài)系統(tǒng)觀測研究網(wǎng)絡(luò)(CNERN)為例,該網(wǎng)絡(luò)建立了分布式的“野外臺站——綜合中心”二級服務(wù)體系[17],資源服務(wù)網(wǎng)站展示了各野外臺站、綜合中心的資源信息、資源實體,針對不同類型的資源提供不同的服務(wù)方式,實物資源實行在線申請、在線審批、線下服務(wù)的服務(wù)模式,數(shù)據(jù)資源實行在線下載、在線訂單申請、在線訂單跟蹤、在線傳送數(shù)據(jù)的服務(wù)模式,專題服務(wù)、示范模式在網(wǎng)站上均作了介紹和宣傳,各野外臺站、綜合中心也公布了自己的資源共享目錄和聯(lián)系方式等。

        2.2 數(shù)據(jù)平臺共享模式

        科學(xué)數(shù)據(jù)共享平臺以數(shù)據(jù)源單位為主體,通過集成、整合、引進(jìn)、交換等方式聚合國內(nèi)外的科學(xué)數(shù)據(jù)資源[18],并對其進(jìn)行規(guī)范化加工處理、分類存儲,形成覆蓋全國、聯(lián)結(jié)世界,可提供科學(xué)數(shù)據(jù)共享服務(wù)的網(wǎng)絡(luò)體系[19-20]。按照科學(xué)數(shù)據(jù)平臺收錄數(shù)據(jù)的學(xué)科領(lǐng)域范圍可將數(shù)據(jù)平臺共享模式劃分為兩種:(1)垂直模式,垂直模式是針對某一個學(xué)科領(lǐng)域或行業(yè)的數(shù)據(jù)共享平臺,是對某學(xué)科領(lǐng)域?qū)iT的科學(xué)數(shù)據(jù)進(jìn)行集成整合、加工處理,進(jìn)而向特定的相關(guān)專業(yè)或?qū)W科領(lǐng)域需求者提供有一定價值的科學(xué)數(shù)據(jù)服務(wù),該模式具有明顯的領(lǐng)域特色與行業(yè)色彩,專、深、精是其特點,以組學(xué)原始數(shù)據(jù)歸檔庫(GSA)為例,作為組學(xué)原始數(shù)據(jù)匯交、存儲、管理與共享系統(tǒng),其是國內(nèi)首個被國際期刊認(rèn)可的組學(xué)數(shù)據(jù)發(fā)布與共享平臺,自2016年2月建成以來已獲得包含PNAS、Cell、Cell Research等國際知名期刊60余種的認(rèn)可,允許其作為本刊所發(fā)表論文支撐數(shù)據(jù)的存儲與共享平臺[21],已支持文章總數(shù)百余篇。(2)綜合模式,綜合模式是面向多學(xué)科或跨領(lǐng)域的科學(xué)數(shù)據(jù)共享平臺,用戶可以通過統(tǒng)一的訪問界面對分布在不同節(jié)點的多個不同的數(shù)據(jù)平臺進(jìn)行聯(lián)合檢索,進(jìn)而滿足自己對科學(xué)數(shù)據(jù)的多元化、綜合化、復(fù)雜化、高效化的需求,以中國科學(xué)院數(shù)據(jù)云(Data Cloud of CAS)為例,該平臺已匯聚化學(xué)、天文、空間、地球科學(xué)、生物、農(nóng)田水利、材料科學(xué)、信息技術(shù)等多個學(xué)科的1 100 多個數(shù)據(jù)集,配合科學(xué)數(shù)據(jù)存儲庫(Science DB),中國科學(xué)院數(shù)據(jù)云面向期刊、機構(gòu)、項目、個人提供數(shù)據(jù)發(fā)布和獲取服務(wù)[22]。

        2.3 數(shù)據(jù)出版共享模式

        數(shù)據(jù)出版不是對數(shù)據(jù)進(jìn)行分析總結(jié),而是強調(diào)在數(shù)據(jù)發(fā)布過程中遵循數(shù)據(jù)質(zhì)量管理和控制流程而出版數(shù)據(jù)[23],使數(shù)據(jù)達(dá)到可發(fā)現(xiàn)、可獲取、可理解、互操作、可重用的狀態(tài),從而實現(xiàn)數(shù)據(jù)增值[24],為科學(xué)數(shù)據(jù)開放管理提供了新的途徑。國內(nèi)已經(jīng)出現(xiàn)了《全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)》、《中國數(shù)據(jù)科學(xué)》等多種數(shù)據(jù)期刊,它們用人類可讀的結(jié)構(gòu)性描述數(shù)據(jù),為學(xué)術(shù)界提供了一種具有公信力的出版物[25]。按照數(shù)據(jù)與論文的關(guān)系可以將數(shù)據(jù)出版劃分為兩種模式[26]:(1)數(shù)據(jù)集成出版模式,將研究數(shù)據(jù)作為論文的附件與論文集成出版,在這種模式下,數(shù)據(jù)并不獨立,而是與已經(jīng)發(fā)表的期刊論文密切相關(guān)。依據(jù)數(shù)據(jù)存儲的位置該模式又可細(xì)分為期刊自存儲自行出版和期刊與公共數(shù)據(jù)存儲庫合作共同出版兩種形式,如《數(shù)據(jù)分析與知識發(fā)現(xiàn)》要求所有投稿論文必須提供支撐論文結(jié)論的內(nèi)在數(shù)據(jù)和附加數(shù)據(jù),數(shù)據(jù)可交由編輯部存儲或作者自存儲;(2)數(shù)據(jù)獨立出版模式,依托出版渠道將科學(xué)數(shù)據(jù)以獨立的研究成果形式出版,根據(jù)出版流程可細(xì)分為數(shù)據(jù)知識庫出版和數(shù)據(jù)期刊出版兩種形式,如《中國數(shù)據(jù)科學(xué)》和《全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)》就是通過發(fā)表多領(lǐng)域的科學(xué)數(shù)據(jù)論文來推動科學(xué)數(shù)據(jù)的開放共享與規(guī)范引用。此外,還有部分期刊如《圖書館雜志》以混合出版的形式不定期收錄一定數(shù)量的本學(xué)科領(lǐng)域的數(shù)據(jù)論文,以促進(jìn)科學(xué)數(shù)據(jù)的開放共享。

        2.4 眾包處理共享模式

        基于集群或平臺的科學(xué)工作流方式已經(jīng)很難滿足結(jié)構(gòu)復(fù)雜的科學(xué)大數(shù)據(jù)的處理需求,眾包模式由于可以整合大眾資源來完成機器單獨難以完成的任務(wù),因此被開始用于科學(xué)數(shù)據(jù)處理的各個環(huán)節(jié)[27]。眾包的工作流程可以概括為[28]:任務(wù)請求人設(shè)計任務(wù)并在線發(fā)布——任務(wù)領(lǐng)取人查找、接收、回答并提交任務(wù)——任務(wù)請求人接收、整理答案。眾包的本質(zhì)是大眾創(chuàng)新[29],根據(jù)大眾參與形式,科學(xué)數(shù)據(jù)眾包處理可以分為三種形式[30]:(1)協(xié)助集成模式,將科學(xué)數(shù)據(jù)處理任務(wù)分解成簡單任務(wù)后對外公布,公眾僅需具備基本科學(xué)素養(yǎng)即可參與;(2)競爭選擇模式,將科學(xué)數(shù)據(jù)處理任務(wù)在線發(fā)布,發(fā)布方對公眾提交的解決方案進(jìn)行評估,擇優(yōu)選取并付予一定報酬;(3)微任務(wù)市場模式,將科學(xué)數(shù)據(jù)處理大任務(wù)分解為若干小任務(wù)后基于第三方平臺分配給不同的公眾處理。中國科學(xué)院計算網(wǎng)絡(luò)信息中心相關(guān)團(tuán)隊從2015年5月開始,基于地理空間數(shù)據(jù)云平臺(http://www.gscloud.cn/)累計發(fā)布并完成了53個遙感影像解譯、專題圖制作、數(shù)據(jù)預(yù)處理等任務(wù),均取得了良好的實踐效果[31]:在任務(wù)分發(fā)時,提出詳細(xì)的任務(wù)需求并規(guī)定數(shù)據(jù)處理方法;專家按要求對任務(wù)領(lǐng)取人提交的數(shù)據(jù)處理結(jié)果進(jìn)行質(zhì)量評估,根據(jù)評估結(jié)果發(fā)放報酬;任務(wù)領(lǐng)取人的完成結(jié)果記錄在數(shù)據(jù)眾包人才庫中,成為未來任務(wù)分配的主要參考依據(jù)。

        2.5 數(shù)據(jù)交易共享模式

        科學(xué)數(shù)據(jù)已經(jīng)體現(xiàn)出強大的應(yīng)用價值,而要想讓科學(xué)數(shù)據(jù)持續(xù)推進(jìn)社會發(fā)展,則還必須讓其具有經(jīng)濟(jì)價值[32],數(shù)據(jù)交易平臺則為數(shù)據(jù)經(jīng)濟(jì)價值的實現(xiàn)提供了場所。根據(jù)交易內(nèi)容,可以將數(shù)據(jù)交易平臺分為三種模式:(1)數(shù)據(jù)產(chǎn)品交易模式,如專注于人工智能數(shù)據(jù)服務(wù)的數(shù)據(jù)堂主要出售基礎(chǔ)數(shù)據(jù),其有兩種主要的出售方式,一是根據(jù)需求方要求對采集的數(shù)據(jù)處理后出售,二是與其他數(shù)據(jù)擁有者合作開發(fā)數(shù)據(jù)產(chǎn)品而后出售;(2)大數(shù)據(jù)分析結(jié)果交易模式,如貴陽大數(shù)據(jù)交易所不進(jìn)行數(shù)據(jù)交易,而是根據(jù)需求方要求對數(shù)據(jù)進(jìn)行加工處理后再出售;(3)交易中介模式,如中關(guān)村數(shù)海大數(shù)據(jù)交易平臺以第三方網(wǎng)上商城的形式存在,其本身不存儲和分析數(shù)據(jù),而是為數(shù)據(jù)需求者提供調(diào)用交易渠道。此外,根據(jù)數(shù)據(jù)所有者的組織形式,數(shù)據(jù)交易平臺又可以分為數(shù)據(jù)專賣店和數(shù)據(jù)集市兩種,數(shù)據(jù)專賣店是指由集成化、統(tǒng)一化的單一主體提供單領(lǐng)域數(shù)據(jù),如遙感集市(遙感數(shù)據(jù))、錢塘大數(shù)據(jù)交易中心(工業(yè)數(shù)據(jù))、百度APIStore(API 接口數(shù)據(jù))等數(shù)據(jù)交易平臺;數(shù)據(jù)集市則為供需雙方提供了交易場所,用戶自主進(jìn)行交互共享,如發(fā)源地、數(shù)糧等數(shù)據(jù)交易平臺。

        除了以上提出的幾種科學(xué)數(shù)據(jù)共享模式外,還有學(xué)者梳理出其他共享模式[33],如以數(shù)據(jù)來源、組織形態(tài)、技術(shù)應(yīng)用等為分類基準(zhǔn)的一般共享模式,以學(xué)科/專業(yè)領(lǐng)域為分類基準(zhǔn)的特定領(lǐng)域共享模式等??茖W(xué)數(shù)據(jù)共享實踐通常是多種模式自治的綜合體,以上所列的模式之間勢必會存在一定交叉重疊。當(dāng)然,科學(xué)數(shù)據(jù)共享模式也在不斷發(fā)展完善,不同學(xué)科領(lǐng)域、組織機構(gòu)或國家的模式選擇均不盡相同,不同的共享模式意味著不同的驅(qū)動機制、權(quán)責(zé)關(guān)系以及不同的管理方式與質(zhì)量績效等。科學(xué)數(shù)據(jù)共享實踐會受制于科學(xué)共同體的既有框架,共享模式的變革會更傾向于一種循序漸進(jìn)式的溫和路線,它們將互相補充,共同推動科學(xué)數(shù)據(jù)共享。

        3 科學(xué)數(shù)據(jù)開放共享的標(biāo)準(zhǔn)規(guī)范

        標(biāo)準(zhǔn)化是為了在某一領(lǐng)域內(nèi)獲得最佳秩序,對現(xiàn)實問題或潛在問題制定共同遵守與重復(fù)使用規(guī)則的活動[34]。從目前的實踐工作來看,我國科學(xué)數(shù)據(jù)相關(guān)的標(biāo)準(zhǔn)規(guī)范主要有描述標(biāo)準(zhǔn)、發(fā)布標(biāo)準(zhǔn)、引用標(biāo)準(zhǔn)和評價標(biāo)準(zhǔn),四項標(biāo)準(zhǔn)層層遞進(jìn),共同促進(jìn)科學(xué)數(shù)據(jù)開放共享的效率和質(zhì)量。

        3.1 科學(xué)數(shù)據(jù)描述標(biāo)準(zhǔn)

        科學(xué)數(shù)據(jù)共享的首要前提是數(shù)據(jù)能夠被用戶及時發(fā)現(xiàn),特定的標(biāo)簽符號能準(zhǔn)確詳細(xì)地展現(xiàn)數(shù)據(jù)資源的內(nèi)外部屬性,便于需求者檢索到所需數(shù)據(jù)資源,這為后續(xù)數(shù)據(jù)訪問、操作和重用提供了條件。劉峰等提出了一種包含33項元素的通用型科研元數(shù)據(jù)標(biāo)準(zhǔn)框架[35],涵蓋了元數(shù)據(jù)的標(biāo)識、時空要素、數(shù)據(jù)歸檔、主體職責(zé)、主題范圍、派生分類等方面的內(nèi)容。2017年11月1日,國家標(biāo)準(zhǔn)化管理委員會官方網(wǎng)站發(fā)布了《中華人民共和國國家標(biāo)準(zhǔn)公告(2017年第29號)》,由中國科學(xué)院計算機網(wǎng)絡(luò)信息中心(CNIC)主持研制的《信息技術(shù) 數(shù)據(jù)溯源描述模型》(GB/T 34945-2017)國家標(biāo)準(zhǔn)位列其中[36],該標(biāo)準(zhǔn)確定了數(shù)據(jù)溯源的主要元素、各元素之間的關(guān)聯(lián)關(guān)系、語法規(guī)則以及模型結(jié)構(gòu)圖等。此外,《信息技術(shù) 大數(shù)據(jù) 術(shù)語》(GB/T 35295-2017)國家標(biāo)準(zhǔn)也于2017年12月29日發(fā)布,對信息技術(shù)大數(shù)據(jù)領(lǐng)域中的常用術(shù)語和定義做出了規(guī)范說明,這有助于在國內(nèi)統(tǒng)一大數(shù)據(jù)的相關(guān)概念和術(shù)語,為科學(xué)數(shù)據(jù)研究的術(shù)語規(guī)范化提供了依據(jù)。

        3.2 科學(xué)數(shù)據(jù)發(fā)布標(biāo)準(zhǔn)

        開放共享并非無限制地自由共享,明確數(shù)據(jù)產(chǎn)品的發(fā)布標(biāo)準(zhǔn),為不同層級、不同類型的數(shù)據(jù)資源限定共享范圍、共享方式、共享程度,是保障數(shù)據(jù)所有者合法權(quán)益和維護(hù)國家數(shù)據(jù)安全的必要手段。國家地震科學(xué)數(shù)據(jù)共享中心編制的《地震科學(xué)數(shù)據(jù) 數(shù)據(jù)發(fā)布規(guī)范》包括數(shù)據(jù)分級、發(fā)布要求、發(fā)布對象、發(fā)布方式等內(nèi)容[37],其中對各級別的數(shù)據(jù)發(fā)布范圍作了明確的要求:一級數(shù)據(jù)可向社會公眾開放、二級數(shù)據(jù)能夠向國內(nèi)外用戶提供、三級數(shù)據(jù)只向國內(nèi)用戶提供、四級數(shù)據(jù)僅面向特定范圍的用戶,對數(shù)據(jù)的發(fā)布方式也有明確規(guī)定即一至三級數(shù)據(jù)通過網(wǎng)站查詢、瀏覽、下載等在線方式發(fā)布,面向特定范圍用戶的四級數(shù)據(jù)則通過光盤、紙質(zhì)媒介等離線方式發(fā)布。中國科學(xué)院微生物研究所微生物資源與大數(shù)據(jù)中心聯(lián)合世界微生物數(shù)據(jù)中心(WDCM)通過與國際標(biāo)準(zhǔn)化組織生物技術(shù)委員會(ISO/TC276)的合作,于2017年7月制定了《微生物資源中心數(shù)據(jù)管理和數(shù)據(jù)發(fā)布標(biāo)準(zhǔn)(草案)》,預(yù)計經(jīng)過論證、反饋、修正之后該國際標(biāo)準(zhǔn)將在2020年內(nèi)正式頒布實施,屆時這將是微生物資源數(shù)據(jù)領(lǐng)域的第一個ISO 國際標(biāo)準(zhǔn)[38],該標(biāo)準(zhǔn)的研究、制定與實施將有助于規(guī)范全球范圍內(nèi)微生物領(lǐng)域科學(xué)家的數(shù)據(jù)發(fā)布行為,保證微生物學(xué)領(lǐng)域資源數(shù)據(jù)開放共享的效果與質(zhì)量,并提高各國微生物學(xué)領(lǐng)域數(shù)據(jù)的兼容性和互操作性,進(jìn)而為高效的數(shù)據(jù)共享和大數(shù)據(jù)分析提供基礎(chǔ)。

        3.3 科學(xué)數(shù)據(jù)引用標(biāo)準(zhǔn)

        目前,越來越多的學(xué)者和學(xué)術(shù)機構(gòu)認(rèn)為科學(xué)數(shù)據(jù)與學(xué)術(shù)論文同等重要。2020年4月9日發(fā)布的《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》中,數(shù)據(jù)作為一種新型生產(chǎn)要素出現(xiàn)在官方文件中[39],合理規(guī)范的引用標(biāo)準(zhǔn)有助于科學(xué)數(shù)據(jù)被更廣泛的科學(xué)共同體參考引用。CNIC 一直在積極探索如何有效地引用科學(xué)數(shù)據(jù):2012年,CNIC 制定的《科學(xué)數(shù)據(jù)引用規(guī)范》發(fā)布,提出科學(xué)數(shù)據(jù)引用分為必選元素式引用和全選元素式引用兩種格式,八個必選要素包括作者、名稱、發(fā)布機構(gòu)、發(fā)布年份、傳播機構(gòu)、傳播時間、唯一標(biāo)識符和解析地址,版本為可選要素。2017年12月29日,CNIC 主持研制的《信息技術(shù) 科學(xué)數(shù)據(jù)引用》(GB/T 35294-2017)正式發(fā)布[40],該標(biāo)準(zhǔn)規(guī)定了科學(xué)數(shù)據(jù)引用元素描述方法、引用元素詳細(xì)說明、引用格式等方面的內(nèi)容,科學(xué)數(shù)據(jù)傳播機構(gòu)可根據(jù)該標(biāo)準(zhǔn)設(shè)計數(shù)據(jù)引用系統(tǒng)并聲明數(shù)據(jù)引用規(guī)則,數(shù)據(jù)使用者可根據(jù)該標(biāo)準(zhǔn)著錄科學(xué)數(shù)據(jù)引用信息[41]?!犊茖W(xué)數(shù)據(jù)引用》國家標(biāo)準(zhǔn)已于2018年7月1日起正式實施,該標(biāo)準(zhǔn)的正式發(fā)布,標(biāo)志著科學(xué)數(shù)據(jù)可以像學(xué)術(shù)論文一樣被學(xué)術(shù)同行標(biāo)準(zhǔn)化引用[42],這必然在一定程度上促進(jìn)科學(xué)數(shù)據(jù)的開放共享,進(jìn)而促進(jìn)科學(xué)交流的水平和質(zhì)量。

        3.4 科學(xué)數(shù)據(jù)評價標(biāo)準(zhǔn)

        當(dāng)一次完整的科學(xué)數(shù)據(jù)共享活動完成時,需要對數(shù)據(jù)產(chǎn)品和服務(wù)質(zhì)量進(jìn)行評價及時回顧總結(jié)共享過程的不足之處,數(shù)據(jù)評價標(biāo)準(zhǔn)一方面有助于數(shù)據(jù)質(zhì)量控制,另一方面為數(shù)據(jù)價值鑒定和數(shù)據(jù)貢獻(xiàn)程度量化提供了參考依據(jù)。2011年4月,CNIC 發(fā)布了《數(shù)據(jù)質(zhì)量評測方法與指標(biāo)體系》,總結(jié)出數(shù)據(jù)質(zhì)量評測的方法包括定性方法(第三方評測法、用戶反饋法、專家評議法)、定量方法(訪問量統(tǒng)計、計算機輔助檢查)和綜合方法(層次分析法、缺陷扣分法),構(gòu)建了包括基本層、準(zhǔn)則層、指標(biāo)選取要求、指標(biāo)權(quán)重、沖突處理原則的數(shù)據(jù)質(zhì)量評價指標(biāo)體系。司莉等提出了一種科學(xué)數(shù)據(jù)價值鑒定的通用標(biāo)準(zhǔn)[43],包含價值標(biāo)準(zhǔn)(如科學(xué)價值、歷史價值、經(jīng)濟(jì)價值)、質(zhì)量標(biāo)準(zhǔn)(如準(zhǔn)確可靠、非冗余、數(shù)據(jù)完整、內(nèi)容有效)、成本效益標(biāo)準(zhǔn)(如保存成本、潛在成本)、法律限制性(如有無知識產(chǎn)權(quán)糾紛、合法性、保密性)、相對價值等要素(如與保存機構(gòu)的相關(guān)性、數(shù)據(jù)相對完整性)。

        4 影響科學(xué)數(shù)據(jù)開放共享的關(guān)鍵因素

        科學(xué)數(shù)據(jù)開放共享是一項包含人、數(shù)據(jù)、設(shè)備、制度等的系統(tǒng)化工程,涉及到眾多利益相關(guān)方,眾多學(xué)者從不同角度分析了科學(xué)數(shù)據(jù)開放共享的影響因素。依據(jù)現(xiàn)有研究成果,本文將影響科學(xué)數(shù)據(jù)開放共享的因素總結(jié)為政策制度因素、技術(shù)平臺因素、個人主體因素以及其他因素等。

        4.1 政策制度因素

        Stanley 等認(rèn)為,數(shù)據(jù)共享不僅是一種自愿行為,更是一種科學(xué)責(zé)任的體現(xiàn),資助管理機構(gòu)的政策有助于監(jiān)督數(shù)據(jù)共享職責(zé)的履行[44]。任何性質(zhì)活動的開展均離不開與之相適應(yīng)的制度的推動、引導(dǎo)與鼓勵,在當(dāng)前科學(xué)數(shù)據(jù)擁有主體仍然存在不愿或不敢共享現(xiàn)象的階段,則更需要政策制定的積極推動,因為完善的機制體制可在科研數(shù)據(jù)環(huán)境中發(fā)揮積極作用,相關(guān)政策文件的出臺、法律法規(guī)的制定則有利于促進(jìn)科學(xué)數(shù)據(jù)的共享[45],制度與規(guī)范制定的不完善、政策與機制激勵的不充分是制約我國科學(xué)數(shù)據(jù)開放共享的主要因素之一。目前科學(xué)數(shù)據(jù)開放共享的政策主要來自于政府部門、管理部門、資助部門、服務(wù)部門和使用部門等。因此,各級政府部門應(yīng)該制定自上而下的法律法規(guī)與數(shù)據(jù)管理政策,鼓勵和引導(dǎo)科學(xué)工作者將數(shù)據(jù)以合理、合規(guī)的方式共享出來,發(fā)揮數(shù)據(jù)價值、促進(jìn)科學(xué)交流。管理部門要盡可能的實現(xiàn)對科學(xué)數(shù)據(jù)的全生命周期管理,制定針對各個周期或階段特征的規(guī)范與政策,使科學(xué)數(shù)據(jù)在采集、存儲、發(fā)布、共享、重用、歸檔等整個過程中有據(jù)可循,依規(guī)做到井井有條、層次清晰,進(jìn)而便于科學(xué)數(shù)據(jù)的管理及其價值利用的最大化。資助部門作為科學(xué)研究活動所需經(jīng)費的提供者,可以將科學(xué)數(shù)據(jù)開放共享作為資助的條件之一,在對涉密數(shù)據(jù)、重點數(shù)據(jù)、隱私數(shù)據(jù)等敏感科學(xué)數(shù)據(jù)進(jìn)行保護(hù)的基礎(chǔ)上要求將受資助科研項目產(chǎn)出的科學(xué)數(shù)據(jù)進(jìn)行有益的開放共享,由企業(yè)資助的可在不影響企業(yè)利益的前提下要求開放共享。服務(wù)部門要對獲得知識產(chǎn)權(quán)的數(shù)據(jù)進(jìn)行規(guī)范化處理,做到結(jié)構(gòu)化存儲,研究制定數(shù)據(jù)服務(wù)政策,主動探索數(shù)據(jù)服務(wù)流程,做到數(shù)據(jù)服務(wù)過程的程序化、服務(wù)方式的規(guī)范化,積極提供數(shù)據(jù)管理服務(wù)、數(shù)據(jù)檢索服務(wù)、數(shù)據(jù)咨詢服務(wù)、數(shù)據(jù)分析服務(wù)、數(shù)據(jù)出版服務(wù)、數(shù)據(jù)評價服務(wù)、學(xué)科數(shù)據(jù)服務(wù)、數(shù)據(jù)知識產(chǎn)權(quán)服務(wù)、個性化數(shù)據(jù)服務(wù)等相關(guān)服務(wù)。使用部門應(yīng)該制定相應(yīng)的科學(xué)數(shù)據(jù)使用規(guī)范,約束使用者對共享數(shù)據(jù)的處理行為,保證數(shù)據(jù)能夠被合理、合規(guī)、合法的使用,盡可能打消數(shù)據(jù)擁有主體對數(shù)據(jù)濫用的顧慮與擔(dān)心,從而促進(jìn)數(shù)據(jù)的開放共享。

        4.2 技術(shù)平臺因素

        技術(shù)是影響科學(xué)數(shù)據(jù)開放共享的關(guān)鍵因素之一,技術(shù)的可操作性、易用性、有用性等均會對科學(xué)數(shù)據(jù)的開放共享產(chǎn)生一定的影響[46]。國家的繁榮發(fā)展帶動了技術(shù)的日新月異,技術(shù)作為科學(xué)數(shù)據(jù)發(fā)揮效用的支撐與保障,在科學(xué)數(shù)據(jù)全生命周期的每個階段均非常重要,其中在數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)共享三個關(guān)鍵階段,技術(shù)的重要作用則更為明顯。各個學(xué)科領(lǐng)域的科學(xué)數(shù)據(jù)均有其鮮明的行業(yè)特征,因此在數(shù)據(jù)采集階段要針對不同的學(xué)科領(lǐng)域選擇合適的采集設(shè)備并使用不同的采集技術(shù),做到數(shù)據(jù)資源的精準(zhǔn)識別,盡可能全面且有效的做到數(shù)據(jù)采集的完整性與多元性,保證數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)采集的效率。數(shù)據(jù)共享平臺/中心作為科學(xué)工作者存儲科學(xué)數(shù)據(jù)的主要工具,對數(shù)據(jù)保存與共享起著至關(guān)重要的作用,其友好性、有用性、安全性等均會對用戶科學(xué)數(shù)據(jù)開放共享的意愿與行為產(chǎn)生一定的影響,進(jìn)而影響科學(xué)數(shù)據(jù)開放共享的成效,如何將相近行業(yè)領(lǐng)域的異構(gòu)數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)按照相應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn)存儲為可易被統(tǒng)一檢索利用的結(jié)構(gòu)化數(shù)據(jù)以保證數(shù)據(jù)的互聯(lián)互通也值得思考。對于科學(xué)工作者來講,必須掌握相應(yīng)的科學(xué)數(shù)據(jù)共享技術(shù),否則即使其有共享意愿也無法對所擁有的數(shù)據(jù)進(jìn)行有效共享,相關(guān)數(shù)據(jù)分享平臺/中心、數(shù)據(jù)期刊等必須對其接收數(shù)據(jù)分享的操作流程、標(biāo)準(zhǔn)規(guī)范、格式要素、元素描述及其使用、引用、重用等方法與規(guī)定進(jìn)行充分的解釋與說明,有條件的還可定期做用戶培訓(xùn),使其盡可能地掌握數(shù)據(jù)共享方面的技術(shù),促進(jìn)科學(xué)數(shù)據(jù)的開放共享,同時也要與時俱進(jìn)創(chuàng)新數(shù)據(jù)共享的技術(shù)與方法,保證數(shù)據(jù)共享技術(shù)的可用性與易用性,盡量減輕用戶的認(rèn)知負(fù)擔(dān)??茖W(xué)數(shù)據(jù)開放共享的目的是盡可能地將其價值最大化,充分發(fā)揮其效用以促進(jìn)科學(xué)交流與科學(xué)發(fā)展,因此數(shù)據(jù)的個性化服務(wù)、定制化服務(wù)、推薦服務(wù)等數(shù)據(jù)服務(wù)方面技術(shù)的開發(fā)與應(yīng)用應(yīng)該值得重視。此外,針對自然科學(xué)領(lǐng)域尤其是天文學(xué)、高能物理、生物醫(yī)藥等數(shù)據(jù)密集型領(lǐng)域,如何實現(xiàn)超高數(shù)量數(shù)據(jù)的實時保存和處理、關(guān)聯(lián)數(shù)據(jù)集的瞬間發(fā)現(xiàn)與過濾,數(shù)據(jù)的自動化流轉(zhuǎn)與加工等也是應(yīng)該思考的問題。而且,要加強社會科學(xué)領(lǐng)域數(shù)據(jù)共享平臺/中心的建設(shè)力度,并著力提升其影響力與吸引力,創(chuàng)新數(shù)據(jù)采集、存儲、共享等方面技術(shù)也至關(guān)重要。

        4.3 個人主體因素

        雖然相關(guān)制度與政策正在逐漸的建立健全,也促進(jìn)了科學(xué)數(shù)據(jù)的有效開放共享,但其效果還不盡人意,依然存在由于當(dāng)前相關(guān)制度的不完善、激勵措施的不充分、政策機制的不合理等問題而導(dǎo)致的科學(xué)數(shù)據(jù)開放共享效果不理想,有相當(dāng)一批科學(xué)工作者不愿意將自己擁有的科學(xué)數(shù)據(jù)共享出來[47],一方面其私有觀念認(rèn)為數(shù)據(jù)共享后會威脅自己的利益失去數(shù)據(jù)給自己帶來的競爭優(yōu)勢[48],另一方面?zhèn)€人隱私、知識產(chǎn)權(quán)、科學(xué)倫理等問題會造成其心理上的不安全,進(jìn)而影響數(shù)據(jù)共享??茖W(xué)數(shù)據(jù)共享需要以時間、精力等一定的成本作為支撐,如果沒有相應(yīng)的激勵措施或制度的強制性要求,科研人員很難主動將自己的數(shù)據(jù)共享出來,還有部分共享意愿較為強烈的數(shù)據(jù)擁有者,由于其開放共享的能力不夠或知識技能欠缺而無法參與到數(shù)據(jù)共享的過程中來,進(jìn)而導(dǎo)致數(shù)據(jù)無法共享。此外,科學(xué)工作者個人的背景因素及其是否認(rèn)同科學(xué)數(shù)據(jù)開放共享理念也會對數(shù)據(jù)的開放共享產(chǎn)生一定的影響??蒲谐晒某霭孀鳛檠芯空邉趧痈冻龅幕貓蠛兔u的保證早已成為共識,而科學(xué)數(shù)據(jù)的共享則需要思考建立何種機制來評價科研工作者的工作成效,采取何種方式來保證對數(shù)據(jù)共享者的回報以及激發(fā)他們共享科學(xué)數(shù)據(jù)的積極性[49],如何保證其數(shù)據(jù)開放共享的預(yù)期收益也值得思考。

        4.4 其他相關(guān)因素

        除上文述及的政策制度、平臺技術(shù)、個人主體對科學(xué)數(shù)據(jù)開放共享的影響因素外,科學(xué)工作者所處的工作環(huán)境、文化氛圍、機構(gòu)內(nèi)部的激勵措施等組織因素,科研項目所處的研究階段、同行之間學(xué)術(shù)優(yōu)先權(quán)的爭奪等學(xué)術(shù)因素,數(shù)據(jù)資源的質(zhì)量評價、數(shù)據(jù)價值的鑒定判斷、數(shù)據(jù)時效性的把握、數(shù)據(jù)安全與產(chǎn)權(quán)的保障、異構(gòu)數(shù)據(jù)的統(tǒng)一化處理等資源因素,也會對科學(xué)數(shù)據(jù)的開放共享產(chǎn)生一定的影響。

        5 結(jié)語

        隨著科學(xué)數(shù)據(jù)開放共享理論研究與實踐探索的不斷深入,用戶的數(shù)據(jù)共享意識與效果均有顯著提升,以此為基礎(chǔ)而產(chǎn)生的一系列積極效應(yīng)也在逐漸凸顯,科學(xué)數(shù)據(jù)的開放共享促進(jìn)了科學(xué)交流向更精準(zhǔn)、更詳盡、更深刻、更全面的方向發(fā)展。成績固然顯著,但問題也日益突出。我們應(yīng)該注意到科學(xué)數(shù)據(jù)共享面臨著越來越多的新問題[50],在科學(xué)數(shù)據(jù)管理的進(jìn)一步研究中必須針對這些問題進(jìn)行專門探討,要在厘清數(shù)據(jù)權(quán)責(zé)、保護(hù)數(shù)據(jù)隱私、治理數(shù)據(jù)污染、縮小數(shù)據(jù)鴻溝等方面進(jìn)行深入研究。此外,數(shù)據(jù)論文發(fā)表于國外數(shù)據(jù)期刊、數(shù)據(jù)集合存儲于國外數(shù)據(jù)平臺、重點/涉密數(shù)據(jù)違規(guī)出境等科學(xué)數(shù)據(jù)外流現(xiàn)象也應(yīng)該引起科學(xué)共同體關(guān)注[51]。

        科學(xué)數(shù)據(jù)開放共享是一個長期的系統(tǒng)化過程,在共享前需要準(zhǔn)確回答什么數(shù)據(jù)應(yīng)該被共享、被誰共享、和誰共享、在什么條件下共享、為什么共享以及要做什么努力等問題[52],共享時需要聚力多方資源協(xié)同操作,共享后要加強服務(wù)效益監(jiān)管。相信隨著各利益相關(guān)方對科學(xué)數(shù)據(jù)共享重要性認(rèn)識的不斷加深、各國在政策管理機制上的不斷完善以及共享技術(shù)的不斷升級,積極溫和的共享趨勢仍將占據(jù)主流,數(shù)據(jù)公私權(quán)力的爭論也將會持續(xù)激烈[53]。未來的科學(xué)數(shù)據(jù)共享活動將不僅圍繞“共享”這一單一環(huán)節(jié),而是圍繞科學(xué)數(shù)據(jù)全生命周期管理的需求,形成聚合數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)分發(fā)、計算分析、服務(wù)應(yīng)用等多種功能于一體的融合型、智能化、FAIR 化數(shù)據(jù)共享生態(tài)體系[54]。

        猜你喜歡
        科學(xué)
        點擊科學(xué)
        走進(jìn)科學(xué)
        走進(jìn)科學(xué)
        點擊科學(xué)
        點擊科學(xué)
        點擊科學(xué)
        走進(jìn)科學(xué)
        科學(xué)大爆炸
        科學(xué)
        科學(xué)怪咖
        精品人妻av区二区三区| 最近日本免费观看高清视频| 双乳被一左一右吃着动态图| 国产69口爆吞精在线视频喝尿| 日本大胆人体亚裔一区二区| 国产视频激情视频在线观看| 蜜桃视频一区二区在线观看| 久久综合狠狠色综合伊人| 色94色欧美sute亚洲线路二| 中文字幕亚洲精品人妻| 毛茸茸的女性外淫小视频| 精品天堂色吊丝一区二区| 国产乱国产乱老熟300部视频| 巨熟乳波霸若妻在线播放 | 亚洲AV秘 无套一区二区三区| 亚洲情久久久精品黄色| 真实夫妻露脸爱视频九色网 | 九九精品无码专区免费| 亚洲精品日本久久久中文字幕| 日本一区二区在线播放视频 | 蜜桃视频一区视频二区| 天天做天天爱夜夜夜爽毛片 | 亚洲av无码专区在线电影| 久久91精品国产91久| 亚洲综合无码一区二区三区| 国产91在线|亚洲| 国产精品后入内射日本在线观看| 亚洲av成人精品一区二区三区 | 欧美性猛交xxxx乱大交丰满| 亚洲αv在线精品糸列| 亚洲av日韩综合一区尤物| 欧美老熟妇乱子| 少妇脱了内裤让我添| 香蕉亚洲欧洲在线一区| 亚洲天码一区二区三区| 欧美 日韩 人妻 高清 中文| 内射中出无码护士在线| 亚洲国产一区二区三区在观看 | 午夜无码熟熟妇丰满人妻| 看国产亚洲美女黄色一级片 | 一本色道加勒比精品一区二区|