胡良霖 鄭曉歡 朱艷華 高瑜蔚 周園春
(1.中國科學(xué)院計算機網(wǎng)絡(luò)信息中心 北京 100190;2. 中國科學(xué)院辦公廳 北京 100864)
科學(xué)數(shù)據(jù)主要包括在自然科學(xué)、工程技術(shù)科學(xué)等領(lǐng)域,通過基礎(chǔ)研究、應(yīng)用研究、試驗開發(fā)等產(chǎn)生的數(shù)據(jù),以及通過觀測監(jiān)測、考察調(diào)查、檢驗檢測等方式取得并用于科學(xué)研究活動的原始數(shù)據(jù)及其衍生數(shù)據(jù)[1]。大數(shù)據(jù)時代,科學(xué)數(shù)據(jù)的獲取和利用是促進(jìn)科研創(chuàng)新的前提和保障。當(dāng)前科技創(chuàng)新對科學(xué)數(shù)據(jù)的需求日益迫切,我國科學(xué)數(shù)據(jù)的管理與應(yīng)用仍然存在明顯不足,特別是有許多高價值的科學(xué)數(shù)據(jù)并未在國內(nèi)得到充分的共享和使用,中國在科學(xué)數(shù)據(jù)開發(fā)利用、開放共享和安全保護(hù)等方面還有很大的改進(jìn)空間[2]。
2018 年3 月17 日,國務(wù)院辦公廳正式發(fā)布《科學(xué)數(shù)據(jù)管理辦法》(以下簡稱《辦法》)?!掇k法》明確規(guī)定“法人單位及科學(xué)數(shù)據(jù)生產(chǎn)者要按照相關(guān)標(biāo)準(zhǔn)規(guī)范組織開展科學(xué)數(shù)據(jù)采集生產(chǎn)和加工整理?!薄掇k法》發(fā)布以后,社會各界反響熱烈。截至目前,黑龍江省、甘肅省、陜西省、云南省、昆明市等多個省市先后出臺了科學(xué)數(shù)據(jù)管理實施細(xì)則。中國科學(xué)院(以下簡稱中科院)于2019 年2 月11 日正式發(fā)布了《中國科學(xué)院科學(xué)數(shù)據(jù)管理與開放共享辦法(試行)》,指導(dǎo)全院的科學(xué)數(shù)據(jù)共享,是中科院實施國家大數(shù)據(jù)戰(zhàn)略的重要舉措[3]。在各省市和中科院發(fā)布的《辦法》實施細(xì)則類文件中,都強調(diào)了對科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)的研制和遵從。
科學(xué)數(shù)據(jù)資源建設(shè)和服務(wù)是一項龐大且復(fù)雜的系統(tǒng)工程,其標(biāo)準(zhǔn)化也涉及科學(xué)數(shù)據(jù)全生命周期的眾多關(guān)鍵業(yè)務(wù)點。中科院自1986 年啟動科學(xué)數(shù)據(jù)工作以來,一直高度重視科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)工作,并逐漸形成了較為完善的科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系[4]。本文全面梳理了30 多年來,特別是2000 年以來,中科院在科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范方面的發(fā)展歷程和取得的主要成果,以期為社會各界落實國家《辦法》提供參考借鑒和解決方案。
中科院科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)工作的系統(tǒng)化開展始于“十五”期間,自此以來中科院立足實際需求,面向應(yīng)用實效,扎實推進(jìn)標(biāo)準(zhǔn)的研制和推廣應(yīng)用工作。從“十五”面向分布式異構(gòu)數(shù)據(jù)資源的規(guī)范化統(tǒng)一服務(wù),到“十一五”數(shù)據(jù)資源及其應(yīng)用環(huán)境(含國家科學(xué)數(shù)據(jù)共享工程項目“基礎(chǔ)科學(xué)數(shù)據(jù)共享服務(wù)平臺”)建設(shè)和服務(wù)的標(biāo)準(zhǔn)體系形成,再到“十二五”響應(yīng)“海-云”環(huán)境和“十三五”適應(yīng)大數(shù)據(jù)環(huán)境下科研模式變革的標(biāo)準(zhǔn)體系完善,科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)的研制和應(yīng)用與時俱進(jìn)。中科院科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)發(fā)展主要經(jīng)歷了以下四個關(guān)鍵階段。
“十五”期間,標(biāo)準(zhǔn)規(guī)范研發(fā)團隊面向科學(xué)數(shù)據(jù)庫建設(shè)與服務(wù)的切實需要,開始有規(guī)劃、有組織地開展標(biāo)準(zhǔn)規(guī)范建設(shè),同時聯(lián)合各建庫單位系統(tǒng)地研究和制定了21 項規(guī)范,基本覆蓋科學(xué)數(shù)據(jù)庫建設(shè)的全過程,具體包括數(shù)據(jù)庫建設(shè)過程與文檔規(guī)范、技術(shù)規(guī)范、元數(shù)據(jù)標(biāo)準(zhǔn)框架、核心元數(shù)據(jù)標(biāo)準(zhǔn)等。此外,標(biāo)準(zhǔn)規(guī)范研發(fā)團隊還重點深入到地球科學(xué)、化學(xué)、生物學(xué)等領(lǐng)域,發(fā)動和組織學(xué)科領(lǐng)域?qū)<页闪㈩I(lǐng)域標(biāo)準(zhǔn)工作組,研究和制定了多個學(xué)科領(lǐng)域的專用規(guī)范,如學(xué)科領(lǐng)域元數(shù)據(jù)規(guī)范、數(shù)據(jù)共享服務(wù)規(guī)范、數(shù)據(jù)質(zhì)量規(guī)范等,直接應(yīng)用于學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)庫的建設(shè)與共享[5]。
“十一五”期間,科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系基本形成,內(nèi)容覆蓋了科學(xué)數(shù)據(jù)庫的建設(shè)和服務(wù)的基本內(nèi)容,指導(dǎo)數(shù)據(jù)庫從需求分析、設(shè)計實現(xiàn)到服務(wù)全過程關(guān)鍵內(nèi)容的實現(xiàn),并在應(yīng)用中取得了良好的效果。標(biāo)準(zhǔn)規(guī)范研發(fā)團隊結(jié)合項目實際需求,完成了三項數(shù)據(jù)政策(科學(xué)數(shù)據(jù)共享辦法、數(shù)據(jù)托管存儲管理辦法、科學(xué)數(shù)據(jù)加工增值管理辦法),以及數(shù)據(jù)加工與建庫、元數(shù)據(jù)、質(zhì)量管理、集成與服務(wù)四個系列的24 項標(biāo)準(zhǔn)規(guī)范的研制。其中專業(yè)數(shù)據(jù)庫建設(shè)規(guī)范、建庫技術(shù)指導(dǎo)規(guī)范、數(shù)據(jù)庫服務(wù)網(wǎng)站建設(shè)指導(dǎo)規(guī)范、數(shù)據(jù)應(yīng)用環(huán)境建設(shè)與服務(wù)標(biāo)準(zhǔn)規(guī)范框架四項標(biāo)準(zhǔn)是在項目進(jìn)展過程中,根據(jù)實際需要,超額完成標(biāo)準(zhǔn)研制項目任務(wù)指標(biāo)的內(nèi)容。
立足“海-云”環(huán)境下科研模式的新特點和新需求,標(biāo)準(zhǔn)規(guī)范研發(fā)團隊面向中科院數(shù)據(jù)云服務(wù)體系的海量科學(xué)數(shù)據(jù)存儲基礎(chǔ)設(shè)施,研究制定基礎(chǔ)設(shè)施建設(shè)、運行和服務(wù)的技術(shù)規(guī)范和服務(wù)標(biāo)準(zhǔn),完成了基礎(chǔ)設(shè)施協(xié)同運行技術(shù)規(guī)范和協(xié)同運行服務(wù)規(guī)范等兩項管理規(guī)范;面向云環(huán)境中數(shù)據(jù)庫自助管理與共享服務(wù)軟件平臺、科研人員組織數(shù)據(jù)交換與共享云平臺,完成了用戶統(tǒng)一認(rèn)證接口、互操作接口和科學(xué)數(shù)據(jù)服務(wù)效果評測系統(tǒng)相關(guān)接口規(guī)范等三項技術(shù)規(guī)范;面向“海-云”環(huán)境下科學(xué)數(shù)據(jù)資源集成和應(yīng)用服務(wù)的新特點,完成了語義查詢擴展規(guī)范、基于用戶行為的相關(guān)度修正、本體適用性評估規(guī)范、科學(xué)數(shù)據(jù)引用規(guī)范和數(shù)據(jù)溯源表達(dá)模型等五項服務(wù)規(guī)范。
“十三五”期間,標(biāo)準(zhǔn)規(guī)范研發(fā)團隊面向大數(shù)據(jù)開放、融合和創(chuàng)新等對基礎(chǔ)環(huán)境、資源匯聚融合、大數(shù)據(jù)技術(shù)開發(fā)以及管理運行模式等關(guān)鍵環(huán)節(jié)的新需求,制定面向開放、可擴展的大數(shù)據(jù)資源集成接口、大數(shù)據(jù)資源整合與服務(wù)等方面的標(biāo)準(zhǔn)規(guī)范。研發(fā)團隊目前已經(jīng)研制了包括規(guī)定數(shù)據(jù)服務(wù)語法互操作要求的數(shù)據(jù)互操作規(guī)范;滿足科學(xué)大數(shù)據(jù)工程項目數(shù)據(jù)標(biāo)識服務(wù)平臺與大數(shù)據(jù)平臺接口要求的科學(xué)數(shù)據(jù)標(biāo)識接口規(guī)范以及發(fā)現(xiàn)元數(shù)據(jù)、數(shù)據(jù)對象元數(shù)據(jù)等多個數(shù)據(jù)規(guī)范等。
中科院科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)研制主要遵循以下6 個基本原則。
我們在充分調(diào)研國內(nèi)外相關(guān)標(biāo)準(zhǔn)適用范圍的基礎(chǔ)上,遵循科學(xué)數(shù)據(jù)領(lǐng)域已經(jīng)發(fā)布的相關(guān)國家標(biāo)準(zhǔn)和國際標(biāo)準(zhǔn),并根據(jù)實際工作需要進(jìn)行擴展和調(diào)整。如在標(biāo)準(zhǔn)編寫方面遵循《標(biāo)準(zhǔn)編寫規(guī)則》(GB/T 20001)、《標(biāo)準(zhǔn)體系構(gòu)建原則和要求》(GB/T 13016)等;元數(shù)據(jù)撰寫方面遵循《元數(shù)據(jù)注冊系統(tǒng)》(GB/T 18391)、《地理信息元數(shù)據(jù)》(ISO 19115)等;數(shù)據(jù)標(biāo)識方面遵循《科技資源標(biāo)識》(GB/T 32843 )等有關(guān)的規(guī)定和要求。
科學(xué)數(shù)據(jù)資源管理活動的每個環(huán)節(jié)都離不開標(biāo)準(zhǔn)規(guī)范,在數(shù)據(jù)資源集成整合、共享建設(shè)、應(yīng)用服務(wù)等過程中均需要建立相應(yīng)的長效工作機制和規(guī)范要求??茖W(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范研制力爭做到有現(xiàn)實需求,能解決具體問題;有共性特征,能解決通用問題;有配套實現(xiàn),能解決應(yīng)用問題。
除了滿足數(shù)據(jù)項目建設(shè)需求之外,標(biāo)準(zhǔn)研制還兼顧科學(xué)數(shù)據(jù)發(fā)展的前沿問題和熱點問題。如針對異構(gòu)數(shù)據(jù)的語義集成、數(shù)據(jù)規(guī)范化引用和數(shù)據(jù)溯源等問題,研發(fā)團隊率先研制出《本體適用性評估標(biāo)準(zhǔn)》《數(shù)據(jù)引用規(guī)范》和《數(shù)據(jù)溯源表達(dá)模型》等標(biāo)準(zhǔn)內(nèi)容,其中后兩項標(biāo)準(zhǔn)已經(jīng)作為國家標(biāo)準(zhǔn)正式發(fā)布。
針對科學(xué)數(shù)據(jù)學(xué)科領(lǐng)域廣泛的特點,信息技術(shù)人員和中科院地理所、土壤所、山地所、動物所、空間中心、金屬所等領(lǐng)域?qū)<页闪⒘硕鄠€標(biāo)準(zhǔn)工作組,持續(xù)推進(jìn)學(xué)科領(lǐng)域標(biāo)準(zhǔn)規(guī)范研制工作。我們一方面利用中科院計算機網(wǎng)絡(luò)信息中心在計算機信息領(lǐng)域的技術(shù)優(yōu)勢,另一方面充分發(fā)揮專業(yè)領(lǐng)域的學(xué)科優(yōu)勢,力爭做到專業(yè)上各司其職,強強聯(lián)合。
科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系作為一個開放的、可擴展的系統(tǒng),在遵循數(shù)據(jù)相關(guān)國家標(biāo)準(zhǔn)的基礎(chǔ)上,著眼于現(xiàn)狀和未來,兼顧近期需求和長期目標(biāo),經(jīng)歷“十五”“十一五”“十二五”和“十三五”等關(guān)鍵發(fā)展階段,不斷進(jìn)行更新和完善。在科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系研制過程中,既要考慮已有數(shù)據(jù)資源建設(shè)和服務(wù)的成熟技術(shù),強調(diào)標(biāo)準(zhǔn)體系框架的相對穩(wěn)定性,又要兼顧關(guān)鍵領(lǐng)域標(biāo)準(zhǔn)和技術(shù)標(biāo)準(zhǔn)的新進(jìn)展和新趨勢。
在實際工作中,標(biāo)準(zhǔn)規(guī)范研發(fā)團隊還與院內(nèi)外科研機構(gòu)建立了良好的關(guān)系,共同致力于將具有廣泛應(yīng)用價值的項目標(biāo)準(zhǔn)謹(jǐn)慎地提升為國家標(biāo)準(zhǔn)和國際標(biāo)準(zhǔn),至今主持或參與研制的國家標(biāo)準(zhǔn)和國際標(biāo)準(zhǔn)達(dá)到12 項。特別是2015年年底,全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會大數(shù)據(jù)標(biāo)準(zhǔn)工作組成立,確認(rèn)了12 項大數(shù)據(jù)國家標(biāo)準(zhǔn)研制任務(wù),其中《科學(xué)數(shù)據(jù)引用》和《數(shù)據(jù)溯源描述模型》兩項國標(biāo)由中科院計算機網(wǎng)絡(luò)信息中心牽頭完成并正式發(fā)布。
在中科院科學(xué)數(shù)據(jù)庫項目和基礎(chǔ)科學(xué)數(shù)據(jù)共享服務(wù)平臺項目的支持下,歷經(jīng)“十五”的探索、“十一五”的建設(shè)、“十二五”和“十三五”的完善和再發(fā)展,我們已經(jīng)建成了較為完整的科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系。標(biāo)準(zhǔn)規(guī)范研發(fā)團隊在國家現(xiàn)有標(biāo)準(zhǔn)的指導(dǎo)下,嚴(yán)格參照國家標(biāo)準(zhǔn)“三稿二審”的工作模式,編寫項目標(biāo)準(zhǔn)規(guī)范,保質(zhì)保量。已建成的科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系在統(tǒng)一的架構(gòu)下,彼此協(xié)調(diào)一致,內(nèi)容覆蓋了科學(xué)數(shù)據(jù)建設(shè)和服務(wù)的基本內(nèi)容,能夠指導(dǎo)數(shù)據(jù)庫從需求分析、設(shè)計實現(xiàn)到共享服務(wù)的全過程關(guān)鍵節(jié)點,并在應(yīng)用中取得了良好的效果。
如圖1 所示,科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系主要包括“專用標(biāo)準(zhǔn)”和“指導(dǎo)標(biāo)準(zhǔn)”兩大類。其中,專用標(biāo)準(zhǔn)針對科學(xué)數(shù)據(jù)資源建設(shè)中涉及的采集與整理、元數(shù)據(jù)與數(shù)據(jù)模型、數(shù)據(jù)處理與增值服務(wù)、系統(tǒng)與接口、管理與技術(shù)、應(yīng)用與服務(wù)等方面進(jìn)行了明確且細(xì)致的規(guī)定。指導(dǎo)標(biāo)準(zhǔn)則基于專用標(biāo)準(zhǔn),滿足實際項目中具體數(shù)據(jù)庫建設(shè)的應(yīng)用需求,全面指導(dǎo)該類數(shù)據(jù)庫的建設(shè)和服務(wù)。
圖1…………科學(xué)數(shù)據(jù)庫標(biāo)準(zhǔn)規(guī)范體系模型
專用標(biāo)準(zhǔn)共有41 項,具體包括:采集與整理標(biāo)準(zhǔn)13 項、元數(shù)據(jù)與元模型標(biāo)準(zhǔn)4 項、系統(tǒng)與接口標(biāo)準(zhǔn)5 項、數(shù)據(jù)管理標(biāo)準(zhǔn)10 項、數(shù)據(jù)質(zhì)量3 項以及數(shù)據(jù)服務(wù)標(biāo)準(zhǔn)6 項。詳見表1。
表1…………科學(xué)數(shù)據(jù)專用標(biāo)準(zhǔn)
五項指導(dǎo)標(biāo)準(zhǔn)主要是結(jié)合了中科院數(shù)據(jù)庫項目的實際需求,即《主題數(shù)據(jù)庫建設(shè)規(guī)范》《專題數(shù)據(jù)庫建設(shè)規(guī)范》《參考型數(shù)據(jù)庫建設(shè)規(guī)范》《所級數(shù)據(jù)庫建設(shè)規(guī)范》和《專業(yè)數(shù)據(jù)庫建設(shè)規(guī)范》?!笆晃濉逼陂g,中科院從信息化戰(zhàn)略資源高度系統(tǒng)地規(guī)劃科學(xué)數(shù)據(jù)資源體系,根據(jù)學(xué)科領(lǐng)域的數(shù)據(jù)整合需求,規(guī)劃建設(shè)參考型數(shù)據(jù)庫、主題數(shù)據(jù)庫、專題數(shù)據(jù)庫和專業(yè)數(shù)據(jù)庫。其中,專業(yè)數(shù)據(jù)庫由具體研究所承擔(dān)建設(shè),主題、專題和參考型數(shù)據(jù)庫則通過組織相關(guān)研究所進(jìn)行跨所聯(lián)合建設(shè)[6]?!笆濉逼陂g增設(shè)了研究所級數(shù)據(jù)庫類型。每類數(shù)據(jù)庫的確立都凝聚了老一輩數(shù)據(jù)科學(xué)家的智慧和心血。指導(dǎo)規(guī)范規(guī)定了每類數(shù)據(jù)庫在內(nèi)容組織、技術(shù)實現(xiàn)、運行維護(hù)和共享服務(wù)等方面需要完成的工作和具體的要求,這些內(nèi)容都來自前述專用標(biāo)準(zhǔn)。
對于能夠通過軟件工具支撐實現(xiàn)的規(guī)范,標(biāo)準(zhǔn)規(guī)范技術(shù)團隊還開發(fā)了配套軟件工具,盡可能把標(biāo)準(zhǔn)規(guī)范中可以固定的內(nèi)容固化到軟件中,以軟件帶動標(biāo)準(zhǔn)的貫徹落實,提升其效果和質(zhì)量。已經(jīng)開發(fā)完成的元數(shù)據(jù)收割工具、數(shù)據(jù)完整性檢測與評價工具、資源與服務(wù)注冊系統(tǒng)、數(shù)據(jù)資源關(guān)聯(lián)與發(fā)現(xiàn)工具、科學(xué)數(shù)據(jù)服務(wù)效果評測系統(tǒng)、數(shù)據(jù)門戶平臺集成系統(tǒng)等,都采用相關(guān)標(biāo)準(zhǔn)實現(xiàn)了項目層面的部署和應(yīng)用。詳見表2 。
表2…………支撐標(biāo)準(zhǔn)規(guī)范實施的軟件工具
在項目實施周期內(nèi),標(biāo)準(zhǔn)規(guī)范研發(fā)團隊參加了歷次科學(xué)數(shù)據(jù)庫的技術(shù)培訓(xùn),藉此向建庫單位進(jìn)行了全面的標(biāo)準(zhǔn)規(guī)范宣貫,保證標(biāo)準(zhǔn)規(guī)范在項目內(nèi)的實施和應(yīng)用。在標(biāo)準(zhǔn)規(guī)范的支持下,科學(xué)數(shù)據(jù)庫參建單位參照各項標(biāo)準(zhǔn)規(guī)范,推進(jìn)了各自數(shù)據(jù)庫的建設(shè),以統(tǒng)一的形象為用戶提供數(shù)據(jù)應(yīng)用服務(wù)。
經(jīng)過十余年的努力,中科院科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)工作已經(jīng)逐步形成了“有需求,多合作,要實用,慎提升”的特點。中科院計算機網(wǎng)絡(luò)信息中心是其科學(xué)數(shù)據(jù)中心體系建設(shè)的總體牽頭單位,先后作為第一責(zé)任單位完成了《生態(tài)科學(xué)數(shù)據(jù)元數(shù)據(jù)(GB/T 20533—2006)》《信息技術(shù) 數(shù)據(jù)溯源描述模型(GB/T 34945—2017)》《信息技術(shù) 科學(xué)數(shù)據(jù)引用(GB/T 35294—2017)》和CODATA 國際標(biāo)準(zhǔn)《天然氣水合物描述語言(Gas Hydrate Markup Language)》,以第二責(zé)任單位完成了《檢測資源信息共享體系建設(shè)指南(GB/Z 27414—2012)》和《土壤科學(xué)數(shù)據(jù)元數(shù)據(jù)(GB/T 32739—2016)》。詳見表3。
表3…………參與完成的國家標(biāo)準(zhǔn)列表
自“十一五”項目結(jié)束以來,在線發(fā)布的標(biāo)準(zhǔn)建設(shè)成果已被訪問下載17 萬次之多,配套工具軟件已經(jīng)在項目內(nèi)全面推廣使用,部分成果(如數(shù)據(jù)自主管理與發(fā)布工具、數(shù)據(jù)網(wǎng)絡(luò)服務(wù)與訪問監(jiān)控統(tǒng)計系統(tǒng)等)還廣泛應(yīng)用到項目之外。中科院科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系在中科院信息化數(shù)據(jù)庫、國家基礎(chǔ)科學(xué)數(shù)據(jù)共享服務(wù)平臺等項目中得到應(yīng)用和實施,此外,還將標(biāo)準(zhǔn)規(guī)范成果推廣至新華社、煙草研究院等院外單位。
2014 年8 月,標(biāo)準(zhǔn)規(guī)范研制團隊承擔(dān)了新華社云平臺項目標(biāo)準(zhǔn)規(guī)范制定課題。標(biāo)準(zhǔn)規(guī)范的建設(shè)既要滿足當(dāng)前已有的云計算平臺的運行需求,也要保障計算虛擬化平臺、云存儲平臺、PaaS 平臺、大數(shù)據(jù)及應(yīng)用開發(fā)平臺等眾多平臺的建設(shè)和實施工作,從資源申請工作流程和設(shè)備接入、管理、應(yīng)用、服務(wù)、接口標(biāo)準(zhǔn)、服務(wù)目錄標(biāo)準(zhǔn)、架構(gòu)治理標(biāo)準(zhǔn)、隱私與安全等方面推進(jìn)標(biāo)準(zhǔn)規(guī)范的建設(shè)工作,完成了計算虛擬化平臺整體標(biāo)準(zhǔn)規(guī)范、云存儲平臺整體標(biāo)準(zhǔn)規(guī)范、PaaS 平臺整體標(biāo)準(zhǔn)規(guī)范、大數(shù)據(jù)及應(yīng)用開發(fā)整體標(biāo)準(zhǔn)規(guī)范等,并將其作為新華社企業(yè)技術(shù)標(biāo)準(zhǔn)發(fā)布。
2018 年,團隊承擔(dān)了中國煙草總公司科技重大專項煙草科研大數(shù)據(jù)標(biāo)準(zhǔn)體系研究課題。標(biāo)準(zhǔn)規(guī)范研制團隊通過借鑒國內(nèi)外大數(shù)據(jù)標(biāo)準(zhǔn)體系現(xiàn)有研究成果,充分結(jié)合煙草科研活動的特點和煙草資源體系的特征,研制了包括基礎(chǔ)標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、業(yè)務(wù)標(biāo)準(zhǔn)和管理辦法等在內(nèi)的煙草科研大數(shù)據(jù)標(biāo)準(zhǔn)體系;同時,根據(jù)實際業(yè)務(wù)需求,分階段完成其中的基礎(chǔ)標(biāo)準(zhǔn)和技術(shù)標(biāo)準(zhǔn)研制工作。
中科院科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系覆蓋了數(shù)據(jù)資源從建設(shè)到應(yīng)用及效果評估全生命周期的規(guī)范化管理內(nèi)容,完成了包括數(shù)據(jù)采集與整理、元數(shù)據(jù)與元模型、系統(tǒng)與接口、數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量、數(shù)據(jù)服務(wù)等在內(nèi)的40 余項專用標(biāo)準(zhǔn),并根據(jù)項目需求將其集成到5 項指導(dǎo)標(biāo)準(zhǔn)中。經(jīng)過十余年的努力,標(biāo)準(zhǔn)規(guī)范研制團隊還參與了12 項國家標(biāo)準(zhǔn)和國際標(biāo)準(zhǔn)的研制。科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范在中科院科學(xué)數(shù)據(jù)資源建設(shè)和應(yīng)用服務(wù)工作中發(fā)揮了重要的助推作用,提升了科學(xué)數(shù)據(jù)規(guī)范化建設(shè)和服務(wù)的能力。大數(shù)據(jù)時代,面向中科院大數(shù)據(jù)資源深化發(fā)展的需求及大數(shù)據(jù)驅(qū)動科研發(fā)現(xiàn)的應(yīng)用要求,我們的科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系還將持續(xù)更新,不斷完善。
致謝:中科院科學(xué)數(shù)據(jù)庫項目始于1986年,十五期間,標(biāo)準(zhǔn)規(guī)范建設(shè)開始有規(guī)劃、系統(tǒng)地開展。科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系的研制一直得到有關(guān)領(lǐng)導(dǎo)、數(shù)據(jù)科學(xué)家、領(lǐng)域?qū)<液鸵痪€科研工作者的指導(dǎo)和幫助,謹(jǐn)此一并致謝。