亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于元數(shù)據(jù)的計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)研究

        2022-04-18 08:04:46趙正宜韓德隆楊一凡張加濤王亭亭劉宇東盧祝華
        中國科技資源導(dǎo)刊 2022年2期
        關(guān)鍵詞:科學(xué)系統(tǒng)管理

        陶 毅 蘇 爽 趙正宜 田 鋒 韓德隆 楊一凡 張加濤 王亭亭 劉宇東 盧祝華

        (1. 中國計(jì)量科學(xué)研究院國家計(jì)量科學(xué)數(shù)據(jù)中心,北京 100029;2. 中國計(jì)量科學(xué)研究院,北京 100029;3. 山東省計(jì)算中心(國家超級計(jì)算濟(jì)南中心),山東濟(jì)南 250014)

        0 引言

        科學(xué)數(shù)據(jù)是科學(xué)研究的重要產(chǎn)物。隨著信息技術(shù)的發(fā)展,在數(shù)據(jù)中心、物聯(lián)網(wǎng)等信息基礎(chǔ)設(shè)施的支持下,科學(xué)數(shù)據(jù)的管理共享、價(jià)值挖掘逐漸成為科學(xué)研究的重要環(huán)節(jié)。作為最基本、最活躍的一類科技資源,科學(xué)數(shù)據(jù)具有客觀性、多結(jié)構(gòu)性、分散性、時效性、共享性、易傳遞性和再創(chuàng)造性等特點(diǎn),貫穿于科研活動的全過程。2009年,圖靈獎獲得者Jim Gray提出科學(xué)研究第四范式,即數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn),進(jìn)一步突顯了科學(xué)數(shù)據(jù)在科研活動中的重要性[1]。目前,科學(xué)數(shù)據(jù)在科學(xué)研究過程中的重要作用和在知識創(chuàng)新中的戰(zhàn)略地位已經(jīng)得到越來越多的認(rèn)同,正逐步成為支撐國家科技創(chuàng)新的重要資源[2]??茖W(xué)數(shù)據(jù)的匯交管理、長期保存和共享應(yīng)用是解決科學(xué)數(shù)據(jù)分散重復(fù)問題,促進(jìn)科學(xué)數(shù)據(jù)流轉(zhuǎn)、利用和增值的有效路徑,對于推動科學(xué)研究和科技成果產(chǎn)出,更好地發(fā)揮國家科研投入產(chǎn)出效益,提高我國科技創(chuàng)新水平具有重要意義[3]。本文將在分析國內(nèi)外科學(xué)數(shù)據(jù)管理現(xiàn)狀的基礎(chǔ)上,概述我國計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)匯交和計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng),對今后科學(xué)數(shù)據(jù)匯交工作提出建議。

        1 國內(nèi)外科學(xué)數(shù)據(jù)管理現(xiàn)狀

        1.1 國外科學(xué)數(shù)據(jù)管理現(xiàn)狀

        隨著科學(xué)數(shù)據(jù)價(jià)值的日益凸顯,越來越多的國際組織開始關(guān)注科學(xué)數(shù)據(jù)可實(shí)現(xiàn)的價(jià)值、知識產(chǎn)權(quán)保護(hù)及數(shù)據(jù)共享參與各方的權(quán)利和責(zé)任等方面,以多種形式制定了不同領(lǐng)域的數(shù)據(jù)開放指南、標(biāo)準(zhǔn)規(guī)范等。如《北極數(shù)據(jù)管理原則與實(shí)踐聲明》鼓勵聲明范圍內(nèi)科學(xué)數(shù)據(jù)的開放,同時明確了數(shù)據(jù)共享的倫理要求[4];《發(fā)展中國家數(shù)據(jù)共享原則》對數(shù)據(jù)的共享提出了持續(xù)性要求,有效提升了數(shù)據(jù)的可獲取性,促進(jìn)了發(fā)展中國家開展或者參與更多科學(xué)研究[5]。

        作為全球科學(xué)數(shù)據(jù)共享工作的開拓者,美國于20世紀(jì)90年代開始提供全球變化研究數(shù)據(jù)的共享服務(wù)[6];2013年,白宮出臺《提高聯(lián)邦資助科學(xué)研究成果獲取》備忘錄,要求政府資助科研項(xiàng)目所取得的成果對外免費(fèi)開放[7]。英國出臺了《開放科研數(shù)據(jù)協(xié)議》,提出科研數(shù)據(jù)在被提供給其他人員使用分析前,其形式不僅要符合法律和道德的規(guī)范要求,還應(yīng)符合所處學(xué)科和監(jiān)管的規(guī)范要求[8]。此外,法國、日本等國家均公布了促進(jìn)科學(xué)數(shù)據(jù)開放的政策法規(guī),可見科學(xué)數(shù)據(jù)的管理和開放已成為發(fā)達(dá)國家進(jìn)一步提升科技水平的重要舉措。

        目前,國外已建設(shè)了大量成熟的科技平臺,如DataStaR、DataCite、GBIF等,為科學(xué)數(shù)據(jù)的開放共享提供了有效保障。在科學(xué)數(shù)據(jù)倉儲方面,美國、英國和加拿大等國家的數(shù)據(jù)倉儲設(shè)施建設(shè)較多,且主要隸屬于政府和機(jī)構(gòu),在學(xué)科分布上數(shù)量占比較高的學(xué)科為生物、環(huán)境、地球科學(xué)、多學(xué)科科學(xué)等[9]。元數(shù)據(jù)是數(shù)據(jù)倉儲的重要組成部分,其作用類似數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)字典,保存了邏輯數(shù)據(jù)結(jié)構(gòu)、文件、地址和索引等信息。以康奈爾大學(xué)的DataStaR為例,該系統(tǒng)主要由數(shù)據(jù)集存儲庫、語義元數(shù)據(jù)存儲庫、開源工具和內(nèi)容轉(zhuǎn)移協(xié)議組成,其必備元數(shù)據(jù)元素包括所有者、創(chuàng)建者、題名、識別符、元數(shù)據(jù)與數(shù)據(jù)獲取許可、文件級元數(shù)據(jù)等;可選元素包括聯(lián)系人員、與研究小組的關(guān)系、與其他資源的關(guān)系、時間范圍等,DataStaR元數(shù)據(jù)方案中需用戶輸入或選擇的元素較少,支持信息資源的自動發(fā)現(xiàn)和互操作[10]。在平臺結(jié)構(gòu)方面,以英美社會科學(xué)領(lǐng)域數(shù)據(jù)管理與共享服務(wù)平臺為例,其結(jié)構(gòu)在邏輯上主要由數(shù)據(jù)庫、元數(shù)據(jù)庫、平臺網(wǎng)站、后臺管理4個部分組成,如圖1所示[11]。

        圖1 英美科學(xué)數(shù)據(jù)管理與共享服務(wù)平臺整體架構(gòu)

        盡管目前科學(xué)數(shù)據(jù)倉儲、管理平臺建設(shè)較為廣泛,但是科研人員仍是科學(xué)數(shù)據(jù)匯交、共享的重要主體。有研究指出,目前科研人員對數(shù)據(jù)的共享積極性仍不高,如Federer等[12]對2014—2016年間發(fā)表在PLOS ONE期刊上的47 593篇論文進(jìn)行了分析,發(fā)現(xiàn)只有約20%的論文公開了相關(guān)數(shù)據(jù)??蒲腥藛T共享數(shù)據(jù)積極性較差的原因是多方面的,Pierce等[13]認(rèn)為共享數(shù)據(jù)的回報(bào)與期望值之間的差距是阻礙科研人員共享數(shù)據(jù)的主要因素之一。

        1.2 國內(nèi)科學(xué)數(shù)據(jù)管理現(xiàn)狀

        我國政府高度重視科學(xué)數(shù)據(jù)對科技發(fā)展的作用,相關(guān)政策環(huán)境不斷完善。2007年修訂的《中華人民共和國科學(xué)技術(shù)進(jìn)步法》明確提出,利用財(cái)政性資金設(shè)立的科學(xué)技術(shù)研究開發(fā)機(jī)構(gòu),應(yīng)當(dāng)建立有利于科學(xué)技術(shù)資源共享的機(jī)制,促進(jìn)科學(xué)技術(shù)資源的有效利用。在此之后,氣象、海洋、地震科學(xué)等領(lǐng)域相繼出臺了指導(dǎo)本領(lǐng)域信息、數(shù)據(jù)管理的辦法、標(biāo)準(zhǔn)。為進(jìn)一步加強(qiáng)和規(guī)范科學(xué)數(shù)據(jù)管理,2018年出臺的《科學(xué)數(shù)據(jù)管理辦法》提出堅(jiān)持“開放為常態(tài),不開放為例外”的基本原則,明確要求政府預(yù)算資金資助的各級科技計(jì)劃(專項(xiàng)、基金等)項(xiàng)目科學(xué)數(shù)據(jù)向科學(xué)數(shù)據(jù)中心匯交。同年,科技部、財(cái)政部聯(lián)合印發(fā)了《國家科技資源共享服務(wù)平臺管理辦法》,將承接科技計(jì)劃項(xiàng)目實(shí)施所形成的科學(xué)數(shù)據(jù)的匯交、整理和保存作為國家科學(xué)數(shù)據(jù)中心重點(diǎn)任務(wù)之一。近年來,我國科研投入持續(xù)增長,大量科研項(xiàng)目的開展加速了科研數(shù)據(jù)的積累。據(jù)不完全統(tǒng)計(jì),截至2017年年底,我國有效管理與保存的科學(xué)數(shù)據(jù)約為83.72 PB,覆蓋地球與環(huán)境科學(xué)、天文與空間科學(xué)等領(lǐng)域[14]。目前,我國已建設(shè)了包括國家計(jì)量科學(xué)數(shù)據(jù)中心在內(nèi)的20個國家科學(xué)數(shù)據(jù)中心,具體如表1所示。同時,我國還建成了30個國家生物種質(zhì)與實(shí)驗(yàn)材料資源庫。這些數(shù)據(jù)中心和資源庫已成為促進(jìn)各領(lǐng)域科技創(chuàng)新的重要動力源泉。

        表1 我國已建成的國家科學(xué)數(shù)據(jù)中心

        我國科學(xué)數(shù)據(jù)匯交流程較為完備。針對科技計(jì)劃項(xiàng)目形成的科學(xué)數(shù)據(jù),國家科技基礎(chǔ)條件平臺中心制定了數(shù)據(jù)匯交的基本流程,包括科學(xué)數(shù)據(jù)匯交計(jì)劃制定、科學(xué)數(shù)據(jù)制備、科學(xué)數(shù)據(jù)提交、科學(xué)數(shù)據(jù)審核、科學(xué)數(shù)據(jù)匯總、科學(xué)數(shù)據(jù)發(fā)布與共享,以及科學(xué)數(shù)據(jù)使用與維護(hù)更新等,如圖2所示[15]。

        圖2 我國科學(xué)數(shù)據(jù)匯交流程

        為了進(jìn)一步規(guī)范科學(xué)數(shù)據(jù)的匯交、共享等流程,提高科學(xué)數(shù)據(jù)管理成效,我國出臺了一系列國家標(biāo)準(zhǔn),如表2所示,有效規(guī)范了科學(xué)數(shù)據(jù)管理工作。在數(shù)據(jù)匯交方面,根據(jù)《科技計(jì)劃項(xiàng)目形成的科學(xué)數(shù)據(jù)匯交 技術(shù)與管理規(guī)范》要求,科學(xué)數(shù)據(jù)匯交內(nèi)容包括科技項(xiàng)目執(zhí)行過程中產(chǎn)生的科學(xué)數(shù)據(jù)實(shí)體、科學(xué)數(shù)據(jù)描述信息和科學(xué)數(shù)據(jù)輔助工具軟件,其中科學(xué)數(shù)據(jù)輔助工具軟件是指科技計(jì)劃形成的用于科學(xué)數(shù)據(jù)處理、加工和分析的專門輔助軟件工具等。項(xiàng)目實(shí)施中采購的工具軟件可不必匯交,但需提供與匯交數(shù)據(jù)處理相關(guān)的工具軟件使用說明;提交的科學(xué)數(shù)據(jù)輔助工具軟件包括軟件工具本身或網(wǎng)絡(luò)調(diào)用接口和屬性信息,應(yīng)符合相關(guān)軟件安全規(guī)定。屬性信息主要包括軟件名稱、用途、開發(fā)工具、運(yùn)行環(huán)境、開發(fā)單位、版本號、使用手冊等[16]??蒲袛?shù)據(jù)的處理依賴于各種輔助軟件工具,標(biāo)準(zhǔn)對數(shù)據(jù)匯交中應(yīng)提供的輔助工具軟件信息進(jìn)行了詳細(xì)要求,有效避免了軟件差異所導(dǎo)致的數(shù)據(jù)分析誤差。

        表2 科學(xué)數(shù)據(jù)管理領(lǐng)域國家標(biāo)準(zhǔn)

        我國在科學(xué)數(shù)據(jù)管理政策制度、平臺建設(shè)、標(biāo)準(zhǔn)規(guī)范等方面已開展了大量工作,取得了一定成效。以國家基礎(chǔ)科學(xué)數(shù)據(jù)共享服務(wù)平臺為例,其數(shù)據(jù)累計(jì)下載總量已超過2 290.42 TB,但是,與我國科學(xué)研究整體規(guī)模相比,當(dāng)前科學(xué)數(shù)據(jù)的匯交、共享水平仍有較大提升空間。目前,國內(nèi)科研人員與同事或合作者私下共享數(shù)據(jù)的情況更為普遍,公開共享數(shù)據(jù)意愿較低[17]。研究顯示,數(shù)據(jù)共享態(tài)度、主觀規(guī)范是影響科研人員共享數(shù)據(jù)的直接因素,感知行為控制、感知風(fēng)險(xiǎn)、感知有用性等為間接影響因素[18]??蒲腥藛T之間信任程度的高低對科學(xué)數(shù)據(jù)共享的實(shí)現(xiàn)具有重要影響,多數(shù)研究者能夠充分認(rèn)識到科學(xué)數(shù)據(jù)對科研活動的重要性,但是在共享自身數(shù)據(jù)時存在較多顧慮,如對數(shù)據(jù)錯用、濫用、保密等方面的擔(dān)憂等[19]。

        為提升我國科學(xué)數(shù)據(jù)匯交、共享水平,除了進(jìn)一步完善政策環(huán)境和管理機(jī)制,還應(yīng)加強(qiáng)科學(xué)數(shù)據(jù)匯交、管理平臺建設(shè),通過功能完備、穩(wěn)定可靠、方便易用的平臺系統(tǒng)助力培育科學(xué)數(shù)據(jù)素養(yǎng),引導(dǎo)科研人員開展數(shù)據(jù)共享,為我國科研水平的進(jìn)一步提升提供堅(jiān)實(shí)數(shù)據(jù)支撐。

        2 計(jì)量科學(xué)數(shù)據(jù)的匯交

        國家計(jì)量科學(xué)數(shù)據(jù)中心(以下簡稱“中心”)是承擔(dān)計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)匯集、管理、開放共享和保存的重要基礎(chǔ)設(shè)施。中心負(fù)責(zé)管理的計(jì)量科學(xué)數(shù)據(jù)資源主要包含標(biāo)準(zhǔn)參考數(shù)據(jù)、計(jì)量科研數(shù)據(jù)、計(jì)量基標(biāo)準(zhǔn)數(shù)據(jù)、計(jì)量檢測數(shù)據(jù)和計(jì)量信息數(shù)據(jù)等五類[20]。與其他科研領(lǐng)域相比,計(jì)量領(lǐng)域的科研項(xiàng)目重點(diǎn)關(guān)注計(jì)量基標(biāo)準(zhǔn)裝置建立、國家標(biāo)準(zhǔn)物質(zhì)研制、國際比對實(shí)現(xiàn)等效及測量和校準(zhǔn)能力實(shí)現(xiàn)國際互認(rèn)等方面。計(jì)量領(lǐng)域科研項(xiàng)目的成果類型包括實(shí)驗(yàn)裝置、標(biāo)準(zhǔn)物質(zhì)、科技文獻(xiàn)、新技術(shù)新方法、數(shù)據(jù)庫及各類報(bào)告、標(biāo)準(zhǔn)、規(guī)程規(guī)范等,在成果形成過程中會產(chǎn)生大量科學(xué)數(shù)據(jù),這些數(shù)據(jù)將成為計(jì)量科學(xué)數(shù)據(jù)實(shí)體的重要組成部分。

        為落實(shí)《科學(xué)數(shù)據(jù)管理辦法》和《國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目綜合績效評價(jià)工作規(guī)范(試行)》相關(guān)要求,進(jìn)一步規(guī)范計(jì)量領(lǐng)域國家科技計(jì)劃項(xiàng)目科學(xué)數(shù)據(jù)匯交,提高科學(xué)數(shù)據(jù)共享開放水平,中心自主研發(fā)了計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)(以下簡稱“系統(tǒng)”)。作為計(jì)量科學(xué)數(shù)據(jù)向中心匯交的唯一端口,系統(tǒng)是為科研項(xiàng)目承擔(dān)單位、項(xiàng)目負(fù)責(zé)人、課題負(fù)責(zé)人、專家、國家計(jì)量科學(xué)數(shù)據(jù)中心以及國家科技計(jì)劃項(xiàng)目管理專業(yè)機(jī)構(gòu)等各角色提供服務(wù)的統(tǒng)一信息化系統(tǒng)平臺,可提供科學(xué)數(shù)據(jù)分類編目與標(biāo)識、加工整理和管理維護(hù)等功能。系統(tǒng)所管理的國家科技計(jì)劃項(xiàng)目(以下簡稱“項(xiàng)目”)是指以中央財(cái)政投入為主的國家自然科學(xué)基金、國家科技重大專項(xiàng)、國家重點(diǎn)研發(fā)計(jì)劃、技術(shù)創(chuàng)新引導(dǎo)專項(xiàng)(基金)、基地和人才專項(xiàng)等科技計(jì)劃(專項(xiàng)、基金)項(xiàng)目[21]。系統(tǒng)所管理的科學(xué)數(shù)據(jù)是指項(xiàng)目實(shí)施過程中產(chǎn)生的計(jì)量科學(xué)數(shù)據(jù)。具體包括通過基礎(chǔ)研究、應(yīng)用研究、試驗(yàn)開發(fā)等產(chǎn)生的數(shù)據(jù),以及通過觀測監(jiān)測、考察調(diào)查、檢驗(yàn)檢測等方式取得并可用于科學(xué)研究活動的原始數(shù)據(jù)及其衍生數(shù)據(jù)。在信息化不斷向各行業(yè)領(lǐng)域滲透的背景下,系統(tǒng)實(shí)現(xiàn)了計(jì)量科學(xué)數(shù)據(jù)匯交的數(shù)字化,建立了集科學(xué)數(shù)據(jù)采集接入、交換匯聚、共享融合、管理運(yùn)維等功能于一體的數(shù)據(jù)服務(wù)平臺,為計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)匯交、管理和共享提供了面向業(yè)務(wù)應(yīng)用和共享服務(wù)支撐的底座能力。

        3 計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)的構(gòu)建

        3.1 元數(shù)據(jù)理念

        元數(shù)據(jù)(Metadata)是描述數(shù)據(jù)及其環(huán)境的數(shù)據(jù),可用于數(shù)據(jù)的發(fā)現(xiàn)、互操作、質(zhì)量控制等[22]??茖W(xué)數(shù)據(jù)的元數(shù)據(jù)是以科學(xué)數(shù)據(jù)為描述對象的元數(shù)據(jù),是對科學(xué)數(shù)據(jù)開展描述、組織、出版等工作的重要工具,可以幫助用戶快速搜索發(fā)現(xiàn)并了解數(shù)據(jù)集基本情況,對于促進(jìn)科學(xué)數(shù)據(jù)共享有著重要的意義[23]。根據(jù)《科技平臺 資源核心元數(shù)據(jù)》,元數(shù)據(jù)元素(Metadata Element)是元數(shù)據(jù)的基本單元,如科研項(xiàng)目名稱是定義科研項(xiàng)目的一個元數(shù)據(jù)元素。元數(shù)據(jù)實(shí)體(Metadata Entity)則是一組說明數(shù)據(jù)相同特性的元數(shù)據(jù)元素或?qū)嶓w的集合,如科研項(xiàng)目是由科研項(xiàng)目名稱、科研項(xiàng)目編碼、項(xiàng)目負(fù)責(zé)人等元素或?qū)嶓w的集合[24]。

        元數(shù)據(jù)的應(yīng)用和管理貫穿科學(xué)數(shù)據(jù)匯交業(yè)務(wù)、運(yùn)行管理、標(biāo)準(zhǔn)規(guī)范、安全和數(shù)據(jù)質(zhì)量等方面。作為系統(tǒng)的基礎(chǔ)之一,元數(shù)據(jù)實(shí)體設(shè)計(jì)的質(zhì)量直接影響到整個系統(tǒng)的質(zhì)量,必須最大限度地規(guī)避冗余、遞歸、重復(fù)等問題。以科研項(xiàng)目為例,首先對科研項(xiàng)目實(shí)體從定義、描述、中文名等進(jìn)行定義,然后對元數(shù)據(jù)實(shí)體所包含的元數(shù)據(jù)元素或?qū)嶓w通過標(biāo)識、中文名、英文名等進(jìn)行定義。對于需要使用專用軟件查看的科學(xué)數(shù)據(jù),系統(tǒng)設(shè)計(jì)了軟件元數(shù)據(jù)實(shí)體,包含軟件所屬科學(xué)數(shù)據(jù)、軟件名稱、開發(fā)單位、運(yùn)行環(huán)境、開發(fā)工具、用途等要素。表3所示為系統(tǒng)元數(shù)據(jù)實(shí)體設(shè)計(jì)的要素,其中項(xiàng)目負(fù)責(zé)人、項(xiàng)目承擔(dān)單位等元數(shù)據(jù)實(shí)體都是獨(dú)立定義的單位。

        表3 科研項(xiàng)目元數(shù)據(jù)實(shí)體

        3.2 系統(tǒng)結(jié)構(gòu)框架

        系統(tǒng)基于計(jì)量科學(xué)數(shù)據(jù)運(yùn)行管理體系、標(biāo)準(zhǔn)規(guī)范體系、安全保障體系和質(zhì)量保證體系構(gòu)建,系統(tǒng)邏輯架構(gòu)可分為云基礎(chǔ)服務(wù)層(包含基礎(chǔ)設(shè)施、數(shù)據(jù)系統(tǒng)和商用基礎(chǔ)系統(tǒng)軟件)、服務(wù)層、應(yīng)用層和展示層,如圖3所示。其中,系統(tǒng)最底層為基礎(chǔ)設(shè)施層,其次是數(shù)據(jù)系統(tǒng)層和商用基礎(chǔ)系統(tǒng)軟件層。這3層充分利用了中心建設(shè)的私有云設(shè)施構(gòu)建,也可統(tǒng)稱為云基礎(chǔ)服務(wù)層。

        圖3 系統(tǒng)架構(gòu)

        服務(wù)層是系統(tǒng)的關(guān)鍵部分,其所包含的數(shù)據(jù)管理平臺不僅是服務(wù)層的核心,也是系統(tǒng)的核心。數(shù)據(jù)管理平臺貫穿科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)治理管理、元數(shù)據(jù)管理、數(shù)據(jù)安全管理和數(shù)據(jù)生命周期管理,具有計(jì)量科學(xué)數(shù)據(jù)匯聚、數(shù)據(jù)融合、數(shù)據(jù)組織、數(shù)據(jù)服務(wù)等功能和服務(wù)能力。智能服務(wù)平臺是使用數(shù)據(jù)挖掘技術(shù)、傳統(tǒng)AI或創(chuàng)新的學(xué)習(xí)型模型,通過標(biāo)準(zhǔn)化的統(tǒng)一接口提供服務(wù)。數(shù)據(jù)即服務(wù)(Data as a Service,DaaS)是指在運(yùn)行管理、標(biāo)準(zhǔn)規(guī)范、安全保障以及質(zhì)量保證等體系規(guī)范下,對科研數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)等實(shí)現(xiàn)統(tǒng)一的數(shù)據(jù)即服務(wù),數(shù)據(jù)挖掘、分析以及人工智能等應(yīng)用產(chǎn)生的數(shù)據(jù)成果,同樣以DaaS的業(yè)務(wù)模式提供服務(wù)。工作流引擎同樣位于服務(wù)層,為科學(xué)數(shù)據(jù)匯交各流程提供工作流技術(shù)支撐。

        在運(yùn)行管理、標(biāo)準(zhǔn)規(guī)范、安全保障以及質(zhì)量保證體系下,針對計(jì)量科學(xué)數(shù)據(jù)的特點(diǎn),構(gòu)建以數(shù)據(jù)管理平臺為核心、分層架構(gòu)的系統(tǒng)框架,可以有效支撐計(jì)量科學(xué)數(shù)據(jù)匯交業(yè)務(wù)的在線運(yùn)行,在提升數(shù)據(jù)匯交、管理水平的基礎(chǔ)上,進(jìn)一步實(shí)現(xiàn)計(jì)量科學(xué)數(shù)據(jù)的增值和安全共享。

        3.3 系統(tǒng)角色及用例

        根據(jù)科學(xué)數(shù)據(jù)匯交要求,系統(tǒng)的主要角色有系統(tǒng)管理員、科學(xué)數(shù)據(jù)管理員、科學(xué)數(shù)據(jù)主管、數(shù)據(jù)中心主任、項(xiàng)目承擔(dān)單位等10個。各角色的簡要說明如表4所示。

        系統(tǒng)各角色之間的關(guān)系及其相關(guān)用例如圖4所示。以下主要是6個用例的具體功能。

        圖4 系統(tǒng)用例圖

        (1)匯交計(jì)劃制定和評審。由項(xiàng)目負(fù)責(zé)人制定匯交計(jì)劃,然后由專家評審計(jì)劃,匯交計(jì)劃及專家評審結(jié)果交由項(xiàng)目承擔(dān)單位、科學(xué)數(shù)據(jù)管理員進(jìn)行形式審查,審查通過后報(bào)送項(xiàng)目管理機(jī)構(gòu)審核。

        (2)匯交方案制定和評審。其相關(guān)流程與匯交計(jì)劃制定和評審用例基本相同。

        (3)科學(xué)數(shù)據(jù)匯交和審核。包含項(xiàng)目目標(biāo)/成果/考核指標(biāo)的信息管理,以及課題信息管理、指標(biāo)映射管理、數(shù)據(jù)集管理、數(shù)據(jù)提交和各級審核。

        (4)科學(xué)數(shù)據(jù)管理。主要包含元數(shù)據(jù)管理、科學(xué)數(shù)據(jù)架構(gòu)和模型管理、科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)管理、科學(xué)數(shù)據(jù)質(zhì)量管理、科學(xué)數(shù)據(jù)安全管理等功能。

        (5)統(tǒng)計(jì)分析。面向主題,通過數(shù)據(jù)選取、數(shù)據(jù)清洗、數(shù)據(jù)加載、數(shù)據(jù)加工計(jì)算處理等過程,使用報(bào)表工具展示統(tǒng)計(jì)分析結(jié)果。該用例可引入人工智能、數(shù)據(jù)挖掘等技術(shù),一方面通過智能化模型挖掘計(jì)量科學(xué)數(shù)據(jù)的隱含價(jià)值,另一方面通過知識積累和智能場景化學(xué)習(xí)的結(jié)合感知客戶需求,提供智能化統(tǒng)計(jì)分析服務(wù)。

        (6)數(shù)據(jù)共享管理。根據(jù)數(shù)據(jù)的安全級別提供科學(xué)數(shù)據(jù)共享服務(wù),部分統(tǒng)計(jì)分析結(jié)果將共享到門戶網(wǎng)站。

        3.4 科學(xué)數(shù)據(jù)匯交技術(shù)流程

        在計(jì)量科學(xué)數(shù)據(jù)匯交業(yè)務(wù)流程中,參與角色較多的主要流程為匯交計(jì)劃審核、匯交方案審核、匯交數(shù)據(jù)審核及匯交憑證審批。所有流程都是基于工作流引擎實(shí)現(xiàn)的,可滿足定制化需求,系統(tǒng)在提供以上功能的同時,重點(diǎn)關(guān)注、優(yōu)化科學(xué)數(shù)據(jù)在系統(tǒng)內(nèi)的流轉(zhuǎn)、管理。在業(yè)務(wù)流程的基礎(chǔ)上,技術(shù)流程可分為數(shù)據(jù)接口、數(shù)據(jù)安全管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、科學(xué)數(shù)據(jù)管理、計(jì)量科學(xué)數(shù)據(jù)匯交門戶5個部分,如圖5所示。

        圖5 計(jì)量科學(xué)數(shù)據(jù)匯交技術(shù)流程

        在技術(shù)流程中,數(shù)據(jù)接口、數(shù)據(jù)安全管理、數(shù)據(jù)標(biāo)準(zhǔn)管理和科學(xué)數(shù)據(jù)管理在系統(tǒng)運(yùn)行中起到了重要作用。

        (1)數(shù)據(jù)接口。通過數(shù)據(jù)接口可獲取元數(shù)據(jù)查詢服務(wù);科研人員在用戶界面錄入的數(shù)據(jù)、上傳的文件通過數(shù)據(jù)接口進(jìn)入系統(tǒng);線下匯交的科研數(shù)據(jù)通過數(shù)據(jù)接口的“其他來源”進(jìn)入系統(tǒng);建有科研項(xiàng)目管理系統(tǒng)的單位可直接調(diào)用本系統(tǒng)接口,實(shí)現(xiàn)科研數(shù)據(jù)的在線匯交。

        (2)數(shù)據(jù)安全管理。由元數(shù)據(jù)算法管理、秘鑰版本管理、保密策略管理等子模塊組成,根據(jù)密級對數(shù)據(jù)進(jìn)行分級管理。

        (3)數(shù)據(jù)標(biāo)準(zhǔn)管理。在數(shù)據(jù)標(biāo)準(zhǔn)方面,經(jīng)過標(biāo)準(zhǔn)發(fā)布、執(zhí)行、監(jiān)控和集合等過程形成數(shù)據(jù)標(biāo)準(zhǔn),最終由該模塊統(tǒng)一管理。

        (4)科學(xué)數(shù)據(jù)管理。在邏輯類型方面,經(jīng)過數(shù)據(jù)注冊、發(fā)布、運(yùn)營和評估等過程形成邏輯模型,最終由該模塊統(tǒng)一管理。

        4 計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)的應(yīng)用及成效

        4.1 科學(xué)數(shù)據(jù)共享

        系統(tǒng)匯交數(shù)據(jù)共享技術(shù)架構(gòu)如圖6所示。對科學(xué)數(shù)據(jù)進(jìn)行分類、編目、標(biāo)識、保存、加工、整理及管理與維護(hù),形成科學(xué)數(shù)據(jù)及其目錄,通過門戶網(wǎng)站對外公布,推動科學(xué)數(shù)據(jù)的共享、再利用。在數(shù)據(jù)共享方式方面,目前數(shù)據(jù)匯交系統(tǒng)提供了完全開放共享、協(xié)議共享、不予共享3種數(shù)據(jù)共享方式。完全開放共享數(shù)據(jù)指提供給國家計(jì)量科學(xué)數(shù)據(jù)中心且無附加共享利用條件約束的科學(xué)數(shù)據(jù)資源;協(xié)議共享數(shù)據(jù)指按約定的協(xié)議條件共享利用的科學(xué)數(shù)據(jù)資源;不予共享數(shù)據(jù)指不宜共享利用的科學(xué)數(shù)據(jù)資源。此外,對于涉密數(shù)據(jù),項(xiàng)目承擔(dān)單位負(fù)責(zé)按照相應(yīng)程序定密,經(jīng)國家科技計(jì)劃專業(yè)機(jī)構(gòu)審批后,按照相應(yīng)的保密要求進(jìn)行管理。對于項(xiàng)目承擔(dān)單位申請保護(hù)的科學(xué)數(shù)據(jù),在保護(hù)期滿后,系統(tǒng)將根據(jù)其開放條件、開放對象和審核程序等對外公開并提供共享與服務(wù)。

        圖6 計(jì)量科學(xué)數(shù)據(jù)共享模式技術(shù)架構(gòu)

        從數(shù)據(jù)共享的角度來看,計(jì)量科學(xué)數(shù)據(jù)匯交入庫后,在邏輯上處于數(shù)據(jù)層,可進(jìn)一步分為非結(jié)構(gòu)化的科學(xué)數(shù)據(jù)、非結(jié)構(gòu)化的云存儲、傳統(tǒng)數(shù)倉、人工智能數(shù)倉以及云數(shù)據(jù)倉庫等。為了提供高質(zhì)量的開放共享服務(wù),系統(tǒng)構(gòu)建了共享微服務(wù)層,更高層的Web交互查詢、目錄服務(wù)、數(shù)據(jù)可視化等,可以通過Restful API,也可以直接通過JDBC等驅(qū)動直接訪問數(shù)據(jù),為科學(xué)數(shù)據(jù)的進(jìn)一步開放共享提供技術(shù)保障。

        隨著系統(tǒng)中科學(xué)數(shù)據(jù)總量的不斷增加,數(shù)據(jù)量將超過用戶可以接受的程度,導(dǎo)致用戶難以在海量數(shù)據(jù)中定位所需信息,出現(xiàn)“信息過載”的問題,阻礙數(shù)據(jù)的共享、再利用。針對這一可能出現(xiàn)的問題,中心正在基于知識圖譜、人工智能開發(fā)數(shù)據(jù)推薦技術(shù),通過對用戶研究領(lǐng)域、瀏覽記錄等進(jìn)行分析,為用戶推薦可能感興趣的科學(xué)數(shù)據(jù)、科研項(xiàng)目等信息,從而促進(jìn)科學(xué)數(shù)據(jù)的共享、再利用。

        4.2 平臺應(yīng)用效果

        計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)已于2021年6月投入運(yùn)行,系統(tǒng)截圖如圖7所示。截至2021年9月,系統(tǒng)已登記注冊機(jī)構(gòu)350家、機(jī)構(gòu)管理員113名、用戶107名,實(shí)現(xiàn)了對計(jì)量領(lǐng)域192個項(xiàng)目/課題科學(xué)數(shù)據(jù)的匯交,極大地提升了計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)管理水平。

        圖7 計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)截圖

        通過對系統(tǒng)已有數(shù)據(jù)的分析可以發(fā)現(xiàn),目前系統(tǒng)匯交的計(jì)量科學(xué)數(shù)據(jù)中60%以上為儀器制造類數(shù)據(jù),包括測試數(shù)據(jù)、比對數(shù)據(jù)、論文、專利、測試報(bào)告等。在科學(xué)數(shù)據(jù)共享服務(wù)方面,目前系統(tǒng)服務(wù)對象主要為項(xiàng)目組成員、計(jì)量領(lǐng)域/跨領(lǐng)域科研人員以及計(jì)量領(lǐng)域第三方實(shí)驗(yàn)室,并根據(jù)三類服務(wù)對象的不同需求,系統(tǒng)提供了不同的共享服務(wù)方案。

        (1)項(xiàng)目組成員。主要需求為項(xiàng)目數(shù)據(jù)的系統(tǒng)存儲和整理加工,以便后續(xù)開展成果轉(zhuǎn)化和推廣應(yīng)用。針對這一需求,中心將基于匯交系統(tǒng)將深入分析每個匯交項(xiàng)目,與項(xiàng)目組建立密切聯(lián)系,根據(jù)需求為其提供定制化的信息推送服務(wù)。

        (2)計(jì)量領(lǐng)域/跨領(lǐng)域科研人員。主要需求為特定科學(xué)數(shù)據(jù)的獲取及分析。這一需求可由匯交系統(tǒng)自身的數(shù)據(jù)檢索功能實(shí)現(xiàn),此外中心還將基于匯交數(shù)據(jù)定期編制計(jì)量領(lǐng)域各細(xì)分方向的研究報(bào)告,為用戶提供數(shù)據(jù)共享、分析服務(wù)。

        (3)計(jì)量領(lǐng)域第三方實(shí)驗(yàn)室。主要需求為計(jì)量行業(yè)發(fā)展趨勢、細(xì)分領(lǐng)域的技術(shù)指標(biāo)及市場需求分析。針對這一需求,中心將通過匯交系統(tǒng)開展數(shù)據(jù)分析,為用戶提供定制化的分析報(bào)告。

        5 對科學(xué)數(shù)據(jù)匯交工作的建議

        5.1 堅(jiān)持標(biāo)準(zhǔn)先行

        基于數(shù)據(jù)生命周期管理角度,圍繞科學(xué)數(shù)據(jù)產(chǎn)生、匯交、管理、應(yīng)用等各環(huán)節(jié),在現(xiàn)有科學(xué)數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)體系基礎(chǔ)上,細(xì)化制定適合計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)管理的標(biāo)準(zhǔn),實(shí)現(xiàn)對計(jì)量科學(xué)數(shù)據(jù)更加規(guī)范、統(tǒng)一、高效的管理。

        5.2 強(qiáng)化技術(shù)支撐

        提高科學(xué)數(shù)據(jù)共享平臺的管理水平,通過數(shù)據(jù)標(biāo)簽等手段對科學(xué)數(shù)據(jù)實(shí)行分級分類管理,運(yùn)用數(shù)據(jù)認(rèn)證技術(shù)加強(qiáng)對數(shù)據(jù)完整性的核驗(yàn),在實(shí)現(xiàn)對科學(xué)數(shù)據(jù)合理管控的同時保證數(shù)據(jù)的可用性。強(qiáng)化平臺數(shù)據(jù)處理能力,為科研人員提供在線數(shù)據(jù)分析服務(wù)。嘗試引入?yún)^(qū)塊鏈技術(shù),憑借其不可篡改、可追溯的特點(diǎn),強(qiáng)化科學(xué)數(shù)據(jù)保護(hù)能力,減少學(xué)術(shù)不端、侵犯知識產(chǎn)權(quán)等事件的發(fā)生,提升科研人員共享科研數(shù)據(jù)的意愿。

        5.3 培育數(shù)據(jù)共享生態(tài)

        圍繞科學(xué)數(shù)據(jù)的共享和應(yīng)用,舉辦科學(xué)數(shù)據(jù)大會、科學(xué)數(shù)據(jù)應(yīng)用大賽等活動,為科研人員提供交流科學(xué)數(shù)據(jù)共享、應(yīng)用經(jīng)驗(yàn)的平臺,營造良好的科學(xué)數(shù)據(jù)共享、應(yīng)用氛圍。此外,以科學(xué)數(shù)據(jù)為中心,通過知識圖譜、人工智能等技術(shù)進(jìn)一步分析科研機(jī)構(gòu)、科研人員之間的聯(lián)系,發(fā)現(xiàn)潛在合作機(jī)會,推動同一研究領(lǐng)域的科研人員、機(jī)構(gòu)之間形成高度互信的合作關(guān)系,在此基礎(chǔ)上逐步培育數(shù)據(jù)提供者、數(shù)據(jù)管理者、數(shù)據(jù)使用者密切協(xié)作的科學(xué)數(shù)據(jù)共享生態(tài)。

        5.4 推動科學(xué)數(shù)據(jù)市場化配置

        強(qiáng)調(diào)需求導(dǎo)向,完善科學(xué)數(shù)據(jù)供需對接相關(guān)功能,暢通科研人員尋求、獲取科學(xué)數(shù)據(jù)的渠道,通過需求帶動數(shù)據(jù)共享。研究根據(jù)數(shù)據(jù)性質(zhì)完善產(chǎn)權(quán)性質(zhì),探索建立規(guī)范化數(shù)據(jù)交易平臺,如對于政府資金支持下產(chǎn)生的科學(xué)數(shù)據(jù),其交易收入可用于支持平臺運(yùn)作;對于非政府資金支持科研項(xiàng)目所取得的數(shù)據(jù),其收益歸數(shù)據(jù)生產(chǎn)者,以此進(jìn)一步激發(fā)科研人員和科研機(jī)構(gòu)創(chuàng)造、共享科研數(shù)據(jù)的積極性。

        6 結(jié)語

        本文對我國計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)匯交和計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)及其數(shù)據(jù)共享與應(yīng)用進(jìn)行闡釋,并且計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)的總體框架和基于元數(shù)據(jù)的開發(fā)理念在系統(tǒng)建設(shè)過程中得到了充分的驗(yàn)證,系統(tǒng)技術(shù)思路和架構(gòu)滿足了計(jì)量科學(xué)數(shù)據(jù)匯交需求。目前,系統(tǒng)已部署上線,成功完成了多個計(jì)量科研項(xiàng)目的科學(xué)數(shù)據(jù)匯交工作。隨著計(jì)量科學(xué)數(shù)據(jù)匯交工作的進(jìn)一步深入,國家計(jì)量科學(xué)數(shù)據(jù)中心將繼續(xù)探索區(qū)塊鏈、人工智能等新一代信息技術(shù)在科學(xué)數(shù)據(jù)匯交領(lǐng)域的應(yīng)用,提升計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)管理水平,為計(jì)量科學(xué)數(shù)據(jù)的開放共享和價(jià)值挖掘提供有力支撐。

        猜你喜歡
        科學(xué)系統(tǒng)管理
        棗前期管理再好,后期管不好,前功盡棄
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無人機(jī)系統(tǒng)
        ZC系列無人機(jī)遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        科學(xué)大爆炸
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        科學(xué)
        “這下管理創(chuàng)新了!等7則
        雜文月刊(2016年1期)2016-02-11 10:35:51
        科學(xué)拔牙
        人本管理在我國國企中的應(yīng)用
        久久精品国产69国产精品亚洲| 91久久青青草原线免费| 国产在线拍偷自拍偷精品| 日韩精品免费观看在线| 久久综合伊人77777麻豆| 国产激情久久久久影院老熟女| 久久AV中文一区二区三区| av免费看网站在线观看| 亚洲国产一区二区三区| 色吊丝中文字幕| 四虎永久在线精品免费观看地址| 日韩有码中文字幕第一页| 一区二区三区国产黄色| 久久久无码人妻精品无码| 国产精品无码专区视频| 国产精品人成在线765| 亚洲天堂一区av在线| 青草视频在线播放| 熟女人妻丰满熟妇啪啪| 日本在线一区二区三区视频| 久久精品国产亚洲av无码偷窥 | 无码精品一区二区三区超碰| 美国又粗又长久久性黄大片| 伊人情人色综合网站| 亚洲av无码一区二区三区四区| 亚洲天天综合色制服丝袜在线| 国产精品麻豆一区二区三区| 曰韩无码无遮挡a级毛片| 国产精品亚洲五月天高清| 性感人妻中文字幕在线| 青青草狠吊色在线视频| 香蕉久久福利院| 99久久亚洲国产高清观看| 无人视频在线播放免费| 人人妻人人狠人人爽| 国产a级午夜毛片| 精品国产精品久久一区免费| 久久精品国产亚洲av麻豆长发| 亚洲国产理论片在线播放| 亚洲精彩视频一区二区| 人妻少妇偷人精品久久性色av |