亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科學(xué)大數(shù)據(jù)的發(fā)展態(tài)勢及建議*

        2016-02-14 20:00:43陳明奇黎建輝鄭曉歡房俊民楊子輝
        中國教育信息化 2016年21期
        關(guān)鍵詞:科學(xué)

        陳明奇,黎建輝,鄭曉歡,房俊民,楊子輝

        (1.中國科學(xué)院 條件保障與財務(wù)局信息化工作處,北京100864;2.中國科學(xué)院 計算機網(wǎng)絡(luò)信息中心,北京100190;3.中國科學(xué)院成都文獻情報中心,四川 成都610041;4.中國科學(xué)院 核能安全技術(shù)研究所,安徽合肥230031)

        科學(xué)大數(shù)據(jù)的發(fā)展態(tài)勢及建議*

        陳明奇1,黎建輝2,鄭曉歡1,房俊民3,楊子輝4

        (1.中國科學(xué)院 條件保障與財務(wù)局信息化工作處,北京100864;2.中國科學(xué)院 計算機網(wǎng)絡(luò)信息中心,北京100190;3.中國科學(xué)院成都文獻情報中心,四川 成都610041;4.中國科學(xué)院 核能安全技術(shù)研究所,安徽合肥230031)

        科學(xué)大數(shù)據(jù)已成為科學(xué)發(fā)展的新型戰(zhàn)略資源,“數(shù)據(jù)密集型科學(xué)”科研范式正在快速興起。本文就科學(xué)大數(shù)據(jù)的發(fā)展態(tài)勢進行了深入的分析與探討,科學(xué)大數(shù)據(jù)驅(qū)動科技創(chuàng)新的時代已經(jīng)到來,結(jié)合我國科學(xué)大數(shù)據(jù)發(fā)展現(xiàn)狀,針對數(shù)據(jù)共享和分析挖掘存在的突出問題與挑戰(zhàn),從國家層面的發(fā)展戰(zhàn)略與政策、科技基礎(chǔ)設(shè)施建設(shè)、核心技術(shù)研發(fā)、人才培養(yǎng)等方面建言獻策,力求把握大數(shù)據(jù)所帶來的機遇,推動盡早建立良性的科研數(shù)據(jù)生態(tài)系統(tǒng),促進科研大數(shù)據(jù)共享和開發(fā)利用。

        科學(xué)大數(shù)據(jù);數(shù)據(jù)出版;數(shù)據(jù)共享;大數(shù)據(jù)應(yīng)用

        一、前言

        2013年7月,習(xí)近平總書記視察中國科學(xué)院時提到大數(shù)據(jù)猶如工業(yè)社會的“石油”資源,誰掌握了數(shù)據(jù),誰就掌握了主動權(quán)。

        科研數(shù)據(jù)是人類社會在科技活動中產(chǎn)生的各類數(shù)據(jù)資料,是信息資源的重要內(nèi)涵;長期采集和積累的科研數(shù)據(jù)已經(jīng)成為支撐國家創(chuàng)新發(fā)展的珍貴資產(chǎn)和戰(zhàn)略資源,也是經(jīng)濟社會發(fā)展決策的重要科學(xué)依據(jù);人類的知識,無不是來源于所掌握的數(shù)據(jù)和信息的分析。進入21世紀以來,源于人類觀察、記錄、分析和認識世界的渴望,信息技術(shù)持續(xù)飛速發(fā)展并被廣泛應(yīng)用,導(dǎo)致從宏觀到微觀、從自然到社會的觀察、計算、傳播等儀器設(shè)備和活動正在越來越快速地產(chǎn)生出海量且多樣的數(shù)據(jù),形成被稱為“大數(shù)據(jù)”的數(shù)據(jù)爆炸現(xiàn)象。科研數(shù)據(jù)的急劇增長及其集成和共享將不僅對科學(xué)研究能力的提高、新的科學(xué)方法的產(chǎn)生、研究成果向產(chǎn)品和服務(wù)的轉(zhuǎn)化發(fā)揮重要的作用,而且已開始引導(dǎo)科學(xué)研究的深度發(fā)展,促進更多的原始性創(chuàng)新成果??茖W(xué)研究、政府決策、產(chǎn)業(yè)發(fā)展越來越依賴于科學(xué)數(shù)據(jù)及對其分析的能力。

        不斷增加的科學(xué)數(shù)據(jù)引發(fā)了人們思維和行為模式的變革,也使得科研大數(shù)據(jù)驅(qū)動創(chuàng)新發(fā)展的模式正在發(fā)生極大的改變。因為當(dāng)所能利用的數(shù)據(jù)規(guī)模增大時,人們將可以做很多在小規(guī)模數(shù)據(jù)基礎(chǔ)上無法完成的事情,基于對大數(shù)據(jù)的分析能更好地理解世界,解決從前難以解決的或甚至不可能解決的很多大科學(xué)問題,產(chǎn)生意料之外的科學(xué)發(fā)現(xiàn)。這種創(chuàng)新發(fā)展的新模式具有以下特征:(1)基于全樣本的研究模式,從局部性向整體性的轉(zhuǎn)變;(2)基于相關(guān)性的研究模式,注重映射關(guān)系;(3)基于全局性的研究模式,從階段性、個體性向全流程、群體性、公眾性的轉(zhuǎn)變;(4)基于價值持續(xù)性的研究模式,從靜態(tài)性向動態(tài)性、持續(xù)性、累積性發(fā)展。

        二、科學(xué)大數(shù)據(jù)的發(fā)展態(tài)勢

        大數(shù)據(jù)是國家新型戰(zhàn)略資源,科學(xué)大數(shù)據(jù)已成為科學(xué)發(fā)展的新型戰(zhàn)略資源,是驅(qū)動創(chuàng)新的重要因素。

        1.科學(xué)大數(shù)據(jù)納入國家戰(zhàn)略并部署實施

        為了占據(jù)科學(xué)大數(shù)據(jù)制高點,世界主要大國已把科學(xué)大數(shù)據(jù)納入到國家戰(zhàn)略并開始重點部署實施。2012年美國總統(tǒng)奧巴馬宣布啟動“大數(shù)據(jù)研究與開發(fā)計劃”,旨在改進現(xiàn)有人們從海量和復(fù)雜的數(shù)據(jù)中獲取知識的能力,加速美國在科學(xué)與工程領(lǐng)域發(fā)明的步伐,推進相關(guān)研究機構(gòu)進一步進行科學(xué)發(fā)現(xiàn)和創(chuàng)新研究,增強國家安全,轉(zhuǎn)變現(xiàn)有的教學(xué)和學(xué)習(xí)方式。2015年美國商務(wù)部宣布啟動國家海洋與大氣管理局 (NOAA)的大數(shù)據(jù)項目。NOAA每天收集的數(shù)據(jù)量超過20Tb,是美國國會圖書館所有印刷藏本數(shù)據(jù)量的兩倍有余。這些環(huán)境數(shù)據(jù)來自包括多普勒雷達系統(tǒng)、氣候衛(wèi)星、浮標網(wǎng)絡(luò)和浮標站、驗潮儀、實時氣候站、船只和飛機等多種數(shù)據(jù)源。隨著數(shù)據(jù)需求度的提升,迫切需要新方法以使決策者和行業(yè)人員快速、有效地獲取到相關(guān)數(shù)據(jù)。NOAA大數(shù)據(jù)項目的合作機構(gòu)將創(chuàng)建開放平臺,以使私有行業(yè)、學(xué)術(shù)界和個體創(chuàng)新者通過云訪問到前所未有的大規(guī)模數(shù)據(jù)。亞馬遜、谷歌、IBM、微軟以及開放云聯(lián)盟將共同探索方法以挖掘NOAA環(huán)境數(shù)據(jù)的巨大價值,支撐數(shù)據(jù)驅(qū)動的經(jīng)濟發(fā)展[1]。

        歐盟繼第七框架計劃資助的GRDI 2020項目、“地平線2020”(Horizon2020)科研和創(chuàng)新計劃之后,正在研究制定《數(shù)據(jù)價值鏈戰(zhàn)略計劃》,包括開放數(shù)據(jù)、云計算、高性能計算和科學(xué)知識開放獲取四大戰(zhàn)略,研究數(shù)據(jù)價值鏈戰(zhàn)略因素,開發(fā)新型信息化基礎(chǔ)設(shè)施(科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施),即管理數(shù)字化的、聯(lián)網(wǎng)的科學(xué)數(shù)據(jù)環(huán)境,促進公共資助科研實驗成果和數(shù)據(jù)的使用及再利用等內(nèi)容,以實現(xiàn)科研數(shù)據(jù)的最大價值。英國發(fā)布《英國數(shù)據(jù)能力發(fā)展戰(zhàn)略規(guī)劃》[2],成立了信息經(jīng)濟委員會,作為一個跨學(xué)術(shù)界、企業(yè)界和政府的合作部門,保障規(guī)劃的實施和促進數(shù)據(jù)能力戰(zhàn)略方針制定,充分利用數(shù)據(jù),緊抓數(shù)據(jù)機遇,使英國成為大數(shù)據(jù)分析的世界領(lǐng)跑者。日本強調(diào)“提升日本競爭力,大數(shù)據(jù)應(yīng)用不可或缺”,正式公布了新IT戰(zhàn)略 《創(chuàng)建最尖端IT國家宣言》,全面闡述了2013~2020年期間以發(fā)展開放公共數(shù)據(jù)和大數(shù)據(jù)為核心的日本新IT國家戰(zhàn)略,提出要把日本建設(shè)成為一個具有“世界最高水準的廣泛運用信息產(chǎn)業(yè)技術(shù)的社會”。

        我國“十三五”規(guī)劃(2016-2020年)中提出:“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”。大數(shù)據(jù)戰(zhàn)略作為國家“十三五”十四大戰(zhàn)略之一。2015年8月國務(wù)院發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》中,強調(diào)了發(fā)展科學(xué)大數(shù)據(jù),積極推動由國家公共財政支持的公益性科研活動獲取和產(chǎn)生的科學(xué)數(shù)據(jù)逐步開放共享,構(gòu)建科學(xué)大數(shù)據(jù)國家重大基礎(chǔ)設(shè)施,實現(xiàn)對國家重要科技數(shù)據(jù)的權(quán)威匯集、長期 保存、集成管理和全面共享。面向經(jīng)濟社會發(fā)展需求,發(fā)展科學(xué)大數(shù)據(jù)應(yīng)用服務(wù)中心,支持解決經(jīng)濟社會發(fā)展和國家安全重大問題。

        2.著力推動科學(xué)數(shù)據(jù)共享及數(shù)據(jù)開放

        一些國際性組織和國家制定和發(fā)布了與數(shù)據(jù)共享或數(shù)據(jù)開放有關(guān)的政策。1959年,包括美國、英國、蘇聯(lián)、法國、日本、阿根廷、南非等在內(nèi)的12個國家簽署了《南極條約》,其中明確規(guī)定了各國的南極科學(xué)考察和成果數(shù)據(jù)對條約成員國共享的政策?!边€有《生物多樣性公約》、《奧爾胡斯公約》等不同學(xué)科領(lǐng)域一些類似條款的國際條約。1996年,國際人類基因組計劃的科學(xué)家和他們的資助機構(gòu)共同提出了“百慕大原則”(也稱為“百慕大協(xié)議”)。根據(jù)此原則,所有參與此計劃的實驗室或中心都應(yīng)把長度在1KB以上的堿基對片段在產(chǎn)生后的24小時內(nèi)發(fā)布出來,完成注釋后的基因測序數(shù)據(jù)也必須立即公布,這些數(shù)據(jù)都要提交到公共的基因數(shù)據(jù)庫,確保公眾出于研發(fā)目的能夠免費地獲取這些數(shù)據(jù),從而保證社會最大限度地受益。作為地球觀測領(lǐng)域最大和最權(quán)威的政府間國際組織,GEO(Group on Earth Observations)制定并通過了一個建立全球地球綜合觀測系統(tǒng)(Global Earth Observation System of Systems,GEOSS)的十年執(zhí)行計劃。2003年,在德國馬普學(xué)會發(fā)起并召開的柏林會議上制定并發(fā)布了《關(guān)于自然科學(xué)與人文科學(xué)知識的開放存取柏林宣言》,此宣言中規(guī)定開放獲取的對象包括科研論文、支持科研成果的原始數(shù)據(jù)及其元數(shù)據(jù)等。世界經(jīng)濟合作與發(fā)展組織(Organization for Economic Cooperationand Development,OECD)認為政府和研究機構(gòu)應(yīng)該對數(shù)據(jù)、信息和知識的獲取條件予以更多的關(guān)注;2004 年OECD的成員國簽署和發(fā)布了一個宣言,提出要建立公共資金資助的研究數(shù)據(jù)的獲取機制;為了指導(dǎo)成員國制定、完善科學(xué)數(shù)據(jù)共享政策,OECD于2006年頒布了 《關(guān)于公共資金資助的研究數(shù)據(jù)獲取的原則與指南》。

        1996年,美國行政管理和預(yù)算局發(fā)布的A-130通告(名稱為Managementof Federal Information Resources)確立了數(shù)據(jù)共享政策的總體框架。據(jù)此,聯(lián)邦政府各科研資助機構(gòu)(例如NASA、NIH、NSF等)分別制定了要求資助項目開放數(shù)據(jù)的具體政策。2013年5月9日,為了進一步推動數(shù)據(jù)開放并提升其水平,白宮又頒布了《開放數(shù)據(jù)政策——將信息作為資產(chǎn)管理》,在上述相關(guān)政策與法規(guī)的指導(dǎo)下,美國建立了由多個數(shù)據(jù)中心(例如:NASA為其資助產(chǎn)生的科學(xué)數(shù)據(jù)支持建立的“分布式、活動的數(shù)據(jù)中心群”、NIH支持建設(shè)的蛋白質(zhì)數(shù)據(jù)庫、NSF資助建設(shè)的DataNet Partners等)聯(lián)合形成的國家級數(shù)據(jù)基礎(chǔ)設(shè)施。

        歐洲國家也認識到了數(shù)據(jù)共享的重要性。2012年3月,歐盟發(fā)布《全球科研數(shù)據(jù)基礎(chǔ)設(shè)施:大數(shù)據(jù)的挑戰(zhàn)》報告,在全球科研數(shù)據(jù)基礎(chǔ)設(shè)施(GRDI2020)提出“科學(xué)是一項全球性事業(yè),而科研數(shù)據(jù)是全球的資產(chǎn)。因此,需要全球科研數(shù)據(jù)基礎(chǔ)設(shè)施來克服語言、政策和社會的障礙,并減少地理時空和國家間的壁壘,從而使發(fā)現(xiàn)、訪問和利用數(shù)據(jù)更加方便”。英國研究理事會(Research Councils UK,RCUK)作為為學(xué)術(shù)研究和研究生培養(yǎng)提供資金的公共機構(gòu),于2011年4月發(fā)布了其數(shù)據(jù)政策的一般原則,目前RCUK下的七個理事會均已更新或發(fā)布了遵循這些一般原則的數(shù)據(jù)管理與共享政策;2011年12月,英國商業(yè)、創(chuàng)新與技能部(Business,Innovation& Skills,BIS)還發(fā)布了《促進增長的創(chuàng)新和科研戰(zhàn)略》,該戰(zhàn)略中強調(diào)了開放數(shù)據(jù)的重要性,指出英國將通過開放公共部門所擁有的數(shù)據(jù)、信息和研究成果來激勵創(chuàng)新,使這些數(shù)據(jù)的價值最大化;同時實施“開放數(shù)據(jù)”項目,建立“數(shù)據(jù)英國”網(wǎng)站用于數(shù)據(jù)公開;利用和挖掘公開數(shù)據(jù)的商業(yè)潛力,為英國公共部門、學(xué)術(shù)機構(gòu)等方面的創(chuàng)新發(fā)展提供“孵化環(huán)境”。

        我國政府和科研人員也意識到數(shù)據(jù)共享的重要性。科技部、財政部設(shè)立平臺建設(shè)專項,將科學(xué)數(shù)據(jù)共享納入國家科技基礎(chǔ)條件平臺。中國科學(xué)院1982年率先啟動科學(xué)數(shù)據(jù)庫的項目并持續(xù)建設(shè)和共享服務(wù)至今,到“十二五”信息化專項明確提出“科技數(shù)據(jù)資源整合與共享工程”。為了應(yīng)對大數(shù)據(jù)時代下相關(guān)挑戰(zhàn),國家發(fā)展改革委員會和中國科學(xué)院聯(lián)合啟動“基礎(chǔ)研究大數(shù)據(jù)服務(wù)平臺應(yīng)用示范”項目,探索科研數(shù)據(jù)的共享模式、突破數(shù)據(jù)分析與處理的關(guān)鍵技術(shù)、形成支持創(chuàng)新大數(shù)據(jù)服務(wù)平臺,并以天文和材料基因組進行示范。

        3.科學(xué)數(shù)據(jù)出版成為共識和趨勢

        隨著數(shù)據(jù)引用技術(shù)的發(fā)展,期刊出版政策的一個發(fā)展趨勢是除了要求有關(guān)數(shù)據(jù)的開放共享外,還強調(diào)在論文和支持論文中研究結(jié)果的數(shù)據(jù)之間建立起類似于文獻引用關(guān)系的連接。例如,英國皇家學(xué)會目前的出版政策要求支持論文中結(jié)果的數(shù)據(jù)應(yīng)存到恰當(dāng)?shù)?、可訪問的數(shù)據(jù)庫中(在沒有特定的機構(gòu)或?qū)W科數(shù)據(jù)庫的情況下,作者應(yīng)將他們的數(shù)據(jù)集存在一個通用的公共數(shù)據(jù)庫中。2008年《自然》雜志,率先出版了大數(shù)據(jù)???,2014年5月推出在線出版的開放獲取雜志 “科學(xué)數(shù)據(jù)”(Scientific Data),結(jié)合傳統(tǒng)期刊論文內(nèi)容和結(jié)構(gòu)化描述模式,采用同行評審、開放獲取的新模式,發(fā)表具有科學(xué)價值的數(shù)據(jù)集描述,解決使研究數(shù)據(jù)可獲得、可引用、可發(fā)現(xiàn)、可解釋、可再利用和可重現(xiàn)的日益增長需求,實現(xiàn)開放數(shù)據(jù)共享和可重復(fù)研究結(jié)果的目標。Ecological archives、Earth System Science Data、Biodiversity Data Journal等期刊的數(shù)據(jù)出版成功實踐,數(shù)據(jù)論文的廣泛引用,充分說明了國內(nèi)外學(xué)術(shù)界同仁對數(shù)據(jù)論文的高度認可,科學(xué)數(shù)據(jù)出版成為科學(xué)大數(shù)據(jù)發(fā)展趨勢[2]。

        結(jié)合我國科學(xué)數(shù)據(jù)開放共享的進展及制約因素,我國以數(shù)據(jù)論文(Data paper)的方式出版科學(xué)數(shù)據(jù)的實踐,明確出版流程、建立標準體系、構(gòu)建出版系統(tǒng)、創(chuàng)立數(shù)據(jù)存儲庫,成功主辦了國家網(wǎng)絡(luò)連續(xù)型出版物的首批試點刊物《中國科學(xué)數(shù)據(jù)》(China Scientific Data,國內(nèi)統(tǒng)一連續(xù)出版物號CN116035/N),建設(shè)數(shù)據(jù)出版平臺和科學(xué)數(shù)據(jù)存儲庫,面向未來數(shù)據(jù)出版全面發(fā)展深度思考了數(shù)據(jù)出版生態(tài)系統(tǒng)的建設(shè),推動我國科學(xué)數(shù)據(jù)出版的健康發(fā)展。

        三、科學(xué)大數(shù)據(jù)應(yīng)用

        科學(xué)大數(shù)據(jù)時代已經(jīng)興起,科學(xué)大數(shù)據(jù)驅(qū)動各學(xué)科新發(fā)現(xiàn)的研究模式和引導(dǎo)案例正在探索之中。

        國際重大科技基礎(chǔ)設(shè)施在科研活動信息化方面投入巨大,也產(chǎn)生了良好的效果。2016年美國激光干涉引力波觀測臺(Laser Interferometer Gravitational-Wave Observatory,簡稱LIGO)宣布直接觀測到引力波,驗證愛因斯坦百年預(yù)言,其中數(shù)據(jù)和計算系統(tǒng)(Data and Computing Systems,DSC)作為LIGO探測器由10個子系統(tǒng)之一,負責(zé)LIGO探測數(shù)據(jù)的采集、分配和計算,LIGO設(shè)計的網(wǎng)絡(luò)與采集控制通道超過30萬個,其中大約3000個快速通道。獲取的數(shù)據(jù)不但包括激光干涉儀引力波探測器輸出的數(shù)據(jù),還包括了各種獨立的對引力波探測器的環(huán)境和設(shè)備狀態(tài)進行監(jiān)控的探測器、記錄儀等,對諸如溫度﹑氣壓﹑風(fēng)力﹑大雨﹑冰雹﹑地表震動﹑聲響﹑電場﹑磁場等環(huán)境條件進行監(jiān)測的數(shù)據(jù),LIGO公布的GW150914事件,在線觸發(fā)延遲是大約3min,用了5個離線分析流水線,消耗的CPU時間大約是5千萬小時。為有效處理如此巨大的數(shù)據(jù)量,LIGO采用了專用計算、機動計算、分配式計算、自愿者計算四種模式來構(gòu)建計算資源體系,以滿足科學(xué)家對高通量計算資源的不同需求。

        美國宇航局Armstrong飛行研究中心在開展太空探索、太空作戰(zhàn)、科學(xué)發(fā)現(xiàn)和航空研究與發(fā)展中發(fā)揮著至關(guān)重要的作用。Armstrong飛行研究中心地球科學(xué)數(shù)據(jù)和信息服務(wù)部分布式存檔中心(GESDISCDAAC,Goddard Earth Sciences Data and Information Services Center Distributed Active Achieved Data Center)通過提供數(shù)據(jù)以及相關(guān)服務(wù)來使用戶能夠全面了解全球氣候資料的科學(xué)性、教育性及應(yīng)用潛力,負責(zé)高層大氣、大氣動力學(xué)、全球降水、全球生物圈、海洋生物圈、海洋動力、太陽輻射等方面的數(shù)據(jù)接收、處理、存檔、共享和服務(wù)。

        在高能物理領(lǐng)域,大數(shù)據(jù)幫助科研人員在高能物理試驗中發(fā)現(xiàn)新的粒子或驗證新的模型,大亞灣中微子實驗項目研究人員對實驗第一階段產(chǎn)生的15TB海量數(shù)據(jù)進行刻度、修正和數(shù)據(jù)分析,發(fā)現(xiàn)了一種新的中微子振蕩模式,并精確測量到其振蕩幾率,被《科學(xué)》雜志評選為2012年度十大科學(xué)突破。

        在核能及核技術(shù)應(yīng)用領(lǐng)域,科學(xué)大數(shù)據(jù)在先進核能系統(tǒng)設(shè)計和現(xiàn)有核電站運維中提供全生命周期的數(shù)據(jù)支持。如中科院核能安全技術(shù)研究所圍繞先進核能系統(tǒng)設(shè)計建成了世界首個綜合性核能領(lǐng)域數(shù)據(jù)庫[3],提供核設(shè)計、材料性能預(yù)測、可靠性分析等數(shù)據(jù)資源及二十余種在線分析與定制服務(wù),結(jié)合其自主研發(fā)的超級蒙特卡羅核計算仿真軟件系統(tǒng)SuperMC[4]和可靠性/概率安全評價系統(tǒng)RiskA,在國際熱核聚變實驗堆ITER和中國鉛基反應(yīng)堆CLEAR物理和工程設(shè)計中發(fā)揮重要作用。美國能源部支持的CASL計劃中,為對現(xiàn)有二代壓水堆核電站進行延壽和提升功率,基于全堆芯模擬數(shù)據(jù)和30多年的電站運維數(shù)據(jù),利用超級計算機Titan對反應(yīng)堆性能進行預(yù)測分析,近70%的機組現(xiàn)已通過美國核管會的審批。中核集團利用核電站海量運維數(shù)據(jù),建立了核電站運維部件可靠性預(yù)測大數(shù)據(jù)平臺;中廣核集團與清華大學(xué)簽訂了《核電大數(shù)據(jù)治理體系框架》,旨在推動核電全生命周期數(shù)據(jù)的模型化、標準化和智能化。

        在全球變化領(lǐng)域,其數(shù)據(jù)類型多種多樣,時間序列超長,并且是地球科學(xué)、環(huán)境科學(xué)、生命科學(xué)、社會科學(xué)和計算科學(xué)等多學(xué)科交叉的研究,預(yù)計到2020年,基于地球系統(tǒng)數(shù)值模式的全球變化預(yù)測資料的數(shù)據(jù)量將達到50PB,遙感衛(wèi)星數(shù)據(jù)也將達到50PB,其他類型數(shù)據(jù)將達到2PB,到2030年將分別上升為185PB、150PB和5PB;這些海量跨領(lǐng)域的數(shù)據(jù)為理解氣候系統(tǒng)行為和發(fā)展、評價地球系統(tǒng)模式、探尋極端天氣事件成因以及理解氣候長期變化趨勢原因提供了基礎(chǔ),也會激發(fā)全球氣候變化中許多新發(fā)現(xiàn)和對機理的新認識。

        在地球科學(xué)領(lǐng)域,數(shù)字地球作為利用海量、多分辨率、多時相、多類型對地觀測數(shù)據(jù)和社會經(jīng)濟數(shù)據(jù)及其分析算法和模型構(gòu)建的虛擬地球,正在其詮釋、理解、預(yù)測全球變化的趨勢、驅(qū)動力、過程及其相互作用,為全球可持續(xù)發(fā)展提供知識支撐,在此過程中涉及的數(shù)據(jù)規(guī)模已達EB級,類型包含圖像、視頻、文檔、地理位置信息以及對地觀測、科學(xué)模型、社會、經(jīng)濟等。

        在生命科學(xué)領(lǐng)域,隨著千人基因組計劃、癌癥基因組圖譜研究等項目的不斷實施以及新一代測序技術(shù)的成熟發(fā)展,產(chǎn)生了海量的“高維災(zāi)難性數(shù)據(jù)”,科研人員等可利用海量的生物數(shù)據(jù)發(fā)現(xiàn)生命運行的機制,比如說癌癥基因組圖譜對所有100種癌癥的基因組測序,并匯出腫瘤基因圖譜,以逐一解開所有癌癥的基因密碼,提供個性化治療方案,因此可說生命科學(xué)研究逐步轉(zhuǎn)向數(shù)據(jù)驅(qū)動的科學(xué)發(fā)現(xiàn)模式。

        2015年11月,由美國約翰·霍普金斯大學(xué)領(lǐng)導(dǎo)的多學(xué)科研究團隊利用大數(shù)據(jù)進行慢性病的個性化管理研究,并且取得突破性成果。研究人員通過設(shè)計統(tǒng)計規(guī)則系統(tǒng)來實現(xiàn)計算機分析大量病案以及識別有相似病情的患者群體。此外,通過學(xué)習(xí)能夠預(yù)測疾病好轉(zhuǎn)或惡化特定模式的病癥和治療方案,該研究成果能夠幫助醫(yī)生選取正確的個性化診療方案、更迅速準確地診斷、治療如紅斑性狼瘡、類風(fēng)濕性關(guān)節(jié)炎等慢性疾病。

        研究人員通過設(shè)計統(tǒng)計規(guī)則系統(tǒng)來實現(xiàn)計算機分析大量病案以及識別有相似病情的患者群體。此外,通過學(xué)習(xí)能夠預(yù)測疾病好轉(zhuǎn)或惡化特定模式的病癥和治療方案,該系統(tǒng)能夠幫助醫(yī)生選取正確的個性化診療方案。然后,醫(yī)生根據(jù)計算機提供的具有相似癥狀的其他患者的信息,可以將類似治療過程應(yīng)用于新患者。

        德國卡爾斯魯厄理工學(xué)院(KIT)的研究人員通過對大量的鳥類基因數(shù)據(jù)分析,設(shè)計出了鳥類進化綜合分析的算法,繪制出迄今為止最可靠、全面的鳥類“生命之樹”。研究發(fā)現(xiàn),在恐龍滅絕后的1500萬年出現(xiàn)了鳥類進化大爆炸式發(fā)展,形成了今天的物種多樣性。

        在天文學(xué)領(lǐng)域,英國研究機構(gòu)啟動星系動物園Galaxy Zoo研究平臺,使得天文分類學(xué)科學(xué)研究正從小型、獨立的學(xué)術(shù)行會形態(tài)轉(zhuǎn)移到大規(guī)模、更加開明和互聯(lián)的科學(xué)家與天文愛好者群體中,該計劃吸引了來自世界各地超過10萬的天文愛好者,為上百萬個星系在線上進行分類,使星系分類工作達到了前所未有的速度。

        四、科學(xué)大數(shù)據(jù)發(fā)展的挑戰(zhàn)及思考

        盡管我國已經(jīng)擁有豐富的科學(xué)數(shù)據(jù)資源,但是在這種創(chuàng)新驅(qū)動的新模式下,數(shù)據(jù)共享和分析挖掘的問題與挑戰(zhàn)仍然十分突出。首先,在從數(shù)據(jù)中創(chuàng)造價值工作的各階段都造成阻礙,關(guān)鍵的技術(shù)挑戰(zhàn)包括如何更好、更高效地傳輸、存儲、長期保存、組織、發(fā)現(xiàn)和訪問、集成、融合、分析、挖掘和可視化這些數(shù)據(jù)。其次,為了探索利用海量異構(gòu)數(shù)據(jù)資源,數(shù)據(jù)基礎(chǔ)設(shè)施必須是易使用、開放及可擴展的,必須支持科學(xué)數(shù)據(jù)的整個生命周期,支持數(shù)據(jù)的整合和跨學(xué)科轉(zhuǎn)移,支持數(shù)據(jù)驅(qū)動的創(chuàng)新發(fā)展新模式。第三,在保障隱私及國家安全的前提下最大限度地促進數(shù)據(jù)的流動性和可獲取性的數(shù)據(jù)開放政策至關(guān)重要。最后,需要解決掌握科研大數(shù)據(jù)開發(fā)利用技術(shù)和數(shù)據(jù)驅(qū)動的創(chuàng)新發(fā)展模式和方法人才不足的挑戰(zhàn)。

        一個國家的科學(xué)研究和創(chuàng)新發(fā)展在國際上的地位將取決于其在科研數(shù)據(jù)的優(yōu)勢上及將數(shù)據(jù)轉(zhuǎn)換為信息和知識的能力。為了加快我國科技創(chuàng)新的步伐,建議我國政府也從國家戰(zhàn)略的高度對此加以重視,推動建立起良性的科研數(shù)據(jù)生態(tài)系統(tǒng),促進科研數(shù)據(jù)共享和開發(fā)利用:

        (1)制定國家科學(xué)大數(shù)據(jù)發(fā)展戰(zhàn)略。統(tǒng)籌規(guī)劃,從國家層面推進科學(xué)大數(shù)據(jù)中長期規(guī)劃和政策的實施,進行學(xué)科布局的頂層設(shè)計。成立科學(xué)大數(shù)據(jù)國家專家委員會和科學(xué)大數(shù)據(jù)工作組。

        (2)研究和制定配套的科技立法和政策。制定科技資源分類、分級的立法體系、政策和條例,政策通過推動科研資助模式、科研成果發(fā)表和評審機制、科研人員和科研機構(gòu)激勵機制等的變革,促進科學(xué)數(shù)據(jù)的共享和重用,促使開放科學(xué)和開放數(shù)據(jù)的原則被廣泛接受。

        (3)建設(shè)和發(fā)展新型國家級科學(xué)大數(shù)據(jù)設(shè)施。新型國家級科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施由若干可互操作的國家級科學(xué)數(shù)據(jù)中心、數(shù)據(jù)檔案館、數(shù)字圖書館等組成,應(yīng)能支持科研數(shù)據(jù)的整個生命周期,支持大數(shù)據(jù)科學(xué)研究和多學(xué)科研究,支持數(shù)據(jù)的跨學(xué)科轉(zhuǎn)移和開放鏈接的數(shù)據(jù)空間,以及支持科學(xué)數(shù)據(jù)與文獻的互操作;促進科研創(chuàng)新成果不斷向企業(yè)轉(zhuǎn)移轉(zhuǎn)化,帶動國家和地方產(chǎn)業(yè)發(fā)展,形成科學(xué)大數(shù)據(jù)設(shè)施的運行和可持續(xù)發(fā)展機制。

        (4)發(fā)展大數(shù)據(jù)存儲、傳輸、管理、分析和共享所需要的核心技術(shù)。需要重點投資的技術(shù)方向包括大數(shù)據(jù)存儲技術(shù)、大規(guī)模數(shù)據(jù)傳輸技術(shù)、數(shù)據(jù)集成技術(shù)、工作流技術(shù)、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)處理技術(shù)、大數(shù)據(jù)挖掘技術(shù)、大規(guī)模數(shù)據(jù)可視化技術(shù)、數(shù)據(jù)長期保存技術(shù)等等。

        (5)積極培養(yǎng)新的專業(yè)人才及支持數(shù)據(jù)科學(xué)的發(fā)展。培養(yǎng)包括數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師與數(shù)據(jù)工程師、數(shù)據(jù)管理員、數(shù)據(jù)檔案員等在內(nèi)的專業(yè)人才,他們對于科學(xué)數(shù)據(jù)的成功管理和利用起著關(guān)鍵作用。支持建立數(shù)據(jù)科學(xué)研究機構(gòu)、開設(shè)數(shù)據(jù)科學(xué)相關(guān)專業(yè)和課程,以促進數(shù)據(jù)科學(xué)基礎(chǔ)理論的發(fā)展及數(shù)據(jù)技術(shù)的研發(fā)。

        (6)引導(dǎo)相關(guān)學(xué)科對新的科研方法進行探索與利用。通過應(yīng)用示范的方式,引導(dǎo)相關(guān)學(xué)科科研人員對大數(shù)據(jù)科學(xué)研究新方法和新模式進行探索和利用,加快相關(guān)學(xué)科領(lǐng)域科研模式轉(zhuǎn)變。同時應(yīng)加強對新類型研究團體如何組建和運轉(zhuǎn)的探索。

        [1]譚鐵牛,曹凝,陳明奇等.中國科研信息化藍皮書2015[M].北京:科學(xué)出版社,2016.

        [2]中國科學(xué)院條件保障與財務(wù)局,中國科學(xué)院成都文獻中心.信息化研究與應(yīng)用動態(tài)[DB/OL].http://www. cnic.cn/qkbg/xxhgzdt/.

        [3]吳宜燦,胡麗琴,龍鵬程等.中國科研信息化藍皮書2015(核能信息化與虛擬核電站應(yīng)用實踐)[M].北京:科學(xué)出版社,2016:169-178.

        [4]Y.Wu,Song J,Zheng H,et al.CAD-based Monte Carlo program for integrated simulation of nuclear system SuperMC[J].AnnalsofNuclear Energy,2015(82):161-168.

        (編輯:王曉明)

        TP393

        A

        1673-8454(2016)21-0005-05

        *支持項目:中國科學(xué)院“十二五”信息化專項科技數(shù)據(jù)資源整合與共享工程(XXH 12304)。

        猜你喜歡
        科學(xué)
        點擊科學(xué)
        走進科學(xué)
        走進科學(xué)
        點擊科學(xué)
        點擊科學(xué)
        點擊科學(xué)
        走進科學(xué)
        科學(xué)大爆炸
        科學(xué)
        科學(xué)怪咖
        国产女主播在线免费看| 亚洲自偷自拍熟女另类| 中文无码成人免费视频在线观看| 国产视频不卡在线| 国产毛片视频一区二区三区在线 | 亚洲欧洲精品成人久久曰影片| 极品少妇被后入内射视| 在线观看 国产一区二区三区| 亚洲精品久久一区二区三区777| 好爽…又高潮了毛片免费看 | 亚洲av有码精品天堂| 亚洲一区二区三区99| 少妇粉嫩小泬喷水视频www| 欧美日韩在线观看免费| 女人一级特黄大片国产精品| 国产精品国三级国产a| 成人区人妻精品一区二区不卡网站| 99国产精品视频无码免费| 亚洲天堂免费成人av| 天堂一区二区三区在线观看视频| 中文成人无码精品久久久不卡| 2021年最新久久久视精品爱| 视频一区二区免费在线观看| 色欲色香天天天综合vvv| 精品国精品无码自拍自在线| 国产成年无码AⅤ片日日爱| 日韩中文字幕不卡在线| 亚洲av永久无码精品放毛片| 国产污污视频| 精品国产污黄网站在线观看| 99久久久无码国产精品性| 日日碰狠狠丁香久燥| 亚洲日韩精品AⅤ片无码富二代| 熟女人妻在线中文字幕| 亚洲精品国产av天美传媒| 国产熟女亚洲精品麻豆| 亚洲精品中文字幕一二三| 国产国产人免费人成免费视频 | 一区二区丝袜美腿视频| 日本一区二区三区视频免费观看 | 丰满女人又爽又紧又丰满|