文 郭華東
2013年7月17日,習(xí)近平總書記指出:“浩瀚的數(shù)據(jù)海洋就如同工業(yè)社會(huì)的石油資源,蘊(yùn)含著巨大生產(chǎn)力和商機(jī)。誰掌握了大數(shù)據(jù)技術(shù),誰就掌握了發(fā)展的資源和主動(dòng)權(quán)。”大數(shù)據(jù)已成為信息主權(quán)的一種表現(xiàn)形式,將是繼邊防、海防、空防之后大國博弈的另一個(gè)空間。大數(shù)據(jù)正在改變?nèi)祟惿詈蛯κ澜绲纳顚永斫狻?/p>
第二次工業(yè)革命的爆發(fā),導(dǎo)致以文字為載體的數(shù)據(jù)量約每10年翻一番;從工業(yè)化時(shí)代進(jìn)入信息化時(shí)代,數(shù)據(jù)量每3年翻一番。當(dāng)前,新一輪信息技術(shù)革命與人類社會(huì)活動(dòng)交匯融合,半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的大量涌現(xiàn),數(shù)據(jù)的產(chǎn)生已不受時(shí)間和空間的限制,引發(fā)了數(shù)據(jù)爆炸式增長,數(shù)據(jù)類型繁多且復(fù)雜,已經(jīng)超越了傳統(tǒng)數(shù)據(jù)管理系統(tǒng)和處理模式的能力范圍,人類正在開啟大數(shù)據(jù)時(shí)代新航程。據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的2017年大數(shù)據(jù)白皮書預(yù)測,2025年全球大數(shù)據(jù)規(guī)模將增長至163ZB,相當(dāng)于2016年的10倍,大數(shù)據(jù)繼續(xù)表現(xiàn)出更為強(qiáng)健的增長態(tài)勢。中國擁有的數(shù)據(jù)在國際上舉足輕重,截至2012年,已占全球的13%,預(yù)計(jì)到2020年將產(chǎn)生全球20%的數(shù)據(jù)。
從大數(shù)據(jù)搜索熱度數(shù)據(jù)可清晰看出近年來全球?qū)Υ髷?shù)據(jù)的關(guān)注程度。國際上對大數(shù)據(jù)的關(guān)注度在2012年之前處于較低水平,2012—2015年對大數(shù)據(jù)的關(guān)注度飛速增長,2016年至今保持接近100的關(guān)注度。
國際上,從聯(lián)合國到各國政府競相重視大數(shù)據(jù)發(fā)展;在我國,大數(shù)據(jù)被列為國家戰(zhàn)略后發(fā)展迅猛。全球大數(shù)據(jù)的發(fā)展方興未艾,大數(shù)據(jù)已經(jīng)開始顯著地影響全球的生產(chǎn)、流通、分配和消費(fèi)方式,它正在改變?nèi)祟惖纳a(chǎn)方式、生活方式、經(jīng)濟(jì)運(yùn)行機(jī)制和國家治理模式,它是知識驅(qū)動(dòng)下經(jīng)濟(jì)時(shí)代的戰(zhàn)略制高點(diǎn),是國家和人類的新型戰(zhàn)略資源。
作為大數(shù)據(jù)的一個(gè)分支,科學(xué)大數(shù)據(jù)正在成為科學(xué)發(fā)現(xiàn)的新型驅(qū)動(dòng)力,引起有關(guān)國家和科技界的高度重視。歐盟提出“科學(xué)是一項(xiàng)全球性事業(yè),而科研數(shù)據(jù)是全球的資產(chǎn)”的理念。美國的“從大數(shù)據(jù)到知識”計(jì)劃、歐盟的“數(shù)據(jù)價(jià)值鏈戰(zhàn)略計(jì)劃”、英國的“科研數(shù)據(jù)之春”計(jì)劃、澳大利亞的“大數(shù)據(jù)知識發(fā)現(xiàn)”項(xiàng)目、歐洲“地平線2020”計(jì)劃的“數(shù)據(jù)驅(qū)動(dòng)型創(chuàng)新”課題,均聚焦于從海量和復(fù)雜的數(shù)據(jù)中獲取知識的能力,深入研究基于大數(shù)據(jù)價(jià)值鏈的創(chuàng)新機(jī)制,倡導(dǎo)大數(shù)據(jù)驅(qū)動(dòng)的科學(xué)發(fā)現(xiàn)模式。大數(shù)據(jù)的影響已觸及自然科學(xué)、社會(huì)科學(xué)、人文科學(xué)和工程科學(xué)的各個(gè)研究領(lǐng)域,不同領(lǐng)域的大數(shù)據(jù)研究中心陸續(xù)成立。我國部署了一系列大數(shù)據(jù)科技項(xiàng)目,組建了不同研究方向的大數(shù)據(jù)實(shí)驗(yàn)室,中國科學(xué)院推出了“科學(xué)大數(shù)據(jù)工程”計(jì)劃。
科學(xué)大數(shù)據(jù)具有數(shù)據(jù)密集型范式的特點(diǎn),它具有數(shù)據(jù)的不可重復(fù)性、數(shù)據(jù)的高度不確定性、數(shù)據(jù)的高維特性、數(shù)據(jù)分析的高度計(jì)算復(fù)雜性等特征。利用大量數(shù)據(jù)的相關(guān)性可取代因果關(guān)系和理論與模型,基于數(shù)據(jù)間的相關(guān)性能夠獲得新知識、新發(fā)現(xiàn)。比如,早在1609年,第谷·布拉赫的助手約翰尼斯·開普勒從布拉赫對天體運(yùn)動(dòng)的系數(shù)觀察記錄中發(fā)現(xiàn)了行星運(yùn)動(dòng)定律,并發(fā)表了偉大的著作《新天文學(xué)》;又如,歐洲大型強(qiáng)子對撞機(jī)幫助物理學(xué)家檢驗(yàn)關(guān)于不同粒子物理和高能物理理論的猜想,并且確定了希格斯玻色子的存在;再如,大數(shù)據(jù)使基因組學(xué)的科學(xué)發(fā)現(xiàn)成為可能;還如,時(shí)空大數(shù)據(jù)在全球環(huán)境研究變化中正發(fā)揮重大作用。
越來越多的科學(xué)發(fā)現(xiàn)證明,大科學(xué)裝置是人類認(rèn)識自然世界的重要手段。對地觀測衛(wèi)星、大型望遠(yuǎn)鏡、大型強(qiáng)子對撞機(jī)、高通量科學(xué)儀器、傳感器網(wǎng)絡(luò)等一系列大裝置的成功運(yùn)行,使得科學(xué)大數(shù)據(jù)與大裝置和大科學(xué)間的關(guān)系越發(fā)密切。近年來,我國的大裝置諸如500m口徑球面射電望遠(yuǎn)鏡、系列空間科學(xué)衛(wèi)星等的問世,為通過科學(xué)大數(shù)據(jù)認(rèn)知大自然提供了強(qiáng)大的基礎(chǔ)。為滿足龐大且日益快速增長的科學(xué)大數(shù)據(jù)的應(yīng)用需求,迫切需要建立一些能夠共享數(shù)據(jù)、算法、模型的開放系統(tǒng),以此實(shí)現(xiàn)對已有數(shù)據(jù)的科學(xué)分析和集成應(yīng)用。一個(gè)典型的例子是,2017年10月,歐洲航天局“哨兵-5P”衛(wèi)星發(fā)射后,每天獲取近2000萬條空氣污染物及氣體的觀測數(shù)據(jù),其數(shù)據(jù)獲取量是前期任務(wù)的10倍以上。按照目前的處理速度,一臺計(jì)算機(jī)需要1200年才能處理完300萬景全球衛(wèi)星影像。而基于云計(jì)算設(shè)施,可在45天內(nèi)完成相同處理任務(wù),足見重大基礎(chǔ)設(shè)施的重要性。
真正實(shí)現(xiàn)科學(xué)大數(shù)據(jù)的大價(jià)值尚面臨著一系列技術(shù)挑戰(zhàn)。在數(shù)據(jù)規(guī)模、數(shù)據(jù)增速、數(shù)據(jù)類型、數(shù)據(jù)質(zhì)量、數(shù)據(jù)價(jià)值等方面給科學(xué)大數(shù)據(jù)處理技術(shù)與方法提出了新的科學(xué)技術(shù)問題和方向。
以上主要體現(xiàn)在5個(gè)方面:
數(shù)據(jù)存儲管理方面??茖W(xué)大數(shù)據(jù)本身固有的特征亟待面向海量、非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)高效存儲管理的數(shù)據(jù)庫。
數(shù)據(jù)分析方法方面。數(shù)據(jù)產(chǎn)生和數(shù)據(jù)分析過程的分離使得數(shù)據(jù)噪聲增多,問題驅(qū)動(dòng)的研究方式逐漸被數(shù)據(jù)驅(qū)動(dòng)的研究方式所代替。
模型和算法方面。隨著半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)比重的逐漸增多,針對該類數(shù)據(jù)的特征學(xué)習(xí)方法逐漸超越并取代傳統(tǒng)的數(shù)據(jù)模型和算法。
計(jì)算體系結(jié)構(gòu)方面。新型存儲器件和計(jì)算器件不斷涌現(xiàn),使得通用處理器和單一體系結(jié)構(gòu)的單機(jī)逐漸過渡為專用處理器、多核和分布式大規(guī)模異構(gòu)集群。
計(jì)算和服務(wù)方面。以互聯(lián)網(wǎng)為媒介的云計(jì)算模式和分布式高性能數(shù)據(jù)中心逐漸成為大數(shù)據(jù)處理的新型模式。
中國科學(xué)院正在開展科學(xué)大數(shù)據(jù)研究的一些實(shí)踐。如正在進(jìn)行的中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(A類)“地球大數(shù)據(jù)科學(xué)工程”,地球大數(shù)據(jù)是一種典型的科學(xué)大數(shù)據(jù),是具有空間屬性的地球科學(xué)大數(shù)據(jù)。該專項(xiàng)力求突破超大規(guī)??缬蚍植际劫Y源技術(shù)瓶頸問題,有效推動(dòng)地球大數(shù)據(jù)技術(shù)創(chuàng)新、聚合多時(shí)空數(shù)據(jù)管理與關(guān)聯(lián)融合以及問題導(dǎo)向數(shù)據(jù)挖掘與分析,以達(dá)到只要有終端和互聯(lián)網(wǎng),任何人在任何地點(diǎn)都可以享受到地球大數(shù)據(jù)提供的多樣服務(wù),實(shí)現(xiàn)重大科學(xué)發(fā)現(xiàn)和一站式全方位宏觀決策支持服務(wù)的目的。
又如基于科學(xué)大數(shù)據(jù)的國際科學(xué)計(jì)劃。我們于2016年發(fā)起的“數(shù)字絲路”(DBAR)國際計(jì)劃,就是要實(shí)現(xiàn)大數(shù)據(jù)匯集、大數(shù)據(jù)服務(wù)、大數(shù)據(jù)分析和大數(shù)據(jù)呈現(xiàn)支撐,形成“一帶一路”科學(xué)大數(shù)據(jù)平臺。這個(gè)為期10年的科學(xué)計(jì)劃,將為“一帶一路”可持續(xù)發(fā)展、糧食安全、生態(tài)環(huán)境保護(hù)、氣候變化監(jiān)測、災(zāi)害風(fēng)險(xiǎn)應(yīng)對,以及文化—自然遺產(chǎn)保護(hù)與發(fā)展等提供科學(xué)決策。
科學(xué)大數(shù)據(jù)與大裝置和大科學(xué)間的關(guān)系越發(fā)密切
再如基于科學(xué)大數(shù)據(jù)的研究項(xiàng)目。聯(lián)合國設(shè)立了一項(xiàng)名為“全球脈動(dòng)”的計(jì)劃,其使命之一是用大數(shù)據(jù)應(yīng)對氣候挑戰(zhàn)。2014年,在聯(lián)合國氣候變化峰會(huì)召開之際,來自46個(gè)國家的大數(shù)據(jù)應(yīng)對氣候變化項(xiàng)目參加了獎(jiǎng)項(xiàng)競爭“挑戰(zhàn)”,最終9個(gè)項(xiàng)目獲得不同的獎(jiǎng)勵(lì)。我們的“對地觀測大數(shù)據(jù)應(yīng)對全球變化”研究項(xiàng)目入選其中,顯示了空間對地觀測大數(shù)據(jù)在氣候變化研究中的作用和價(jià)值。
科學(xué)大數(shù)據(jù)正深刻改變傳統(tǒng)的科研模式,正驅(qū)動(dòng)現(xiàn)代科學(xué)研究的迅猛發(fā)展??茖W(xué)大數(shù)據(jù)正在為科技創(chuàng)新帶來大機(jī)遇。作為少量依賴因果關(guān)系,而主要依靠相關(guān)性發(fā)現(xiàn)新知識的新模式,科學(xué)大數(shù)據(jù)已成為繼經(jīng)驗(yàn)、理論和計(jì)算模式之后的數(shù)據(jù)密集型科學(xué)范式的典型代表。
隨著數(shù)據(jù)積累和計(jì)算能力的提升,直接從大數(shù)據(jù)中獲取知識已經(jīng)成為可能。2013年9月,筆者及團(tuán)隊(duì)提出“科學(xué)大數(shù)據(jù)”概念,并于2014年1月以“科學(xué)大數(shù)據(jù)與數(shù)字地球”為題發(fā)表于《科學(xué)通報(bào)》。我們認(rèn)為,科學(xué)大數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)、商業(yè)大數(shù)據(jù)等存在本質(zhì)屬性和特點(diǎn)上的區(qū)別,具有自己獨(dú)特的科學(xué)內(nèi)涵和特點(diǎn)。
大數(shù)據(jù)已經(jīng)開始顯著地影響全球的生產(chǎn)、流通、分配和消費(fèi)方式。
整體看來,科學(xué)大數(shù)據(jù)具有如下外部特征:從數(shù)據(jù)內(nèi)容來講,科學(xué)大數(shù)據(jù)一般表征自然客觀對象和變化過程;從數(shù)據(jù)體量來講,科學(xué)大數(shù)據(jù)在不同學(xué)科中存在較大的差異;從數(shù)據(jù)增長速率來講,科學(xué)大數(shù)據(jù)依學(xué)科不同其數(shù)據(jù)增長速率也變化較大;從數(shù)據(jù)獲取手段來講,科學(xué)大數(shù)據(jù)一般來自觀測和實(shí)驗(yàn)的記錄以及后續(xù)加工;從數(shù)據(jù)分析手段來講,科學(xué)大數(shù)據(jù)的知識發(fā)現(xiàn)一般需要借助科學(xué)原理模型。
通過歸納科學(xué)大數(shù)據(jù)的外部特征,其內(nèi)部特征也變得相對清晰,主要概括為:
數(shù)據(jù)內(nèi)容的不可重復(fù)性。正如哲學(xué)家赫拉克利特的名言,“人不能兩次踏進(jìn)同一條河流”,對于一般自然與物理的客觀過程的觀測具有一定的不可重復(fù)性。
數(shù)據(jù)的高度不確定性。由于采用的直接或非直接觀測方式、采樣手段和記錄技術(shù),往往引入系統(tǒng)觀測誤差及數(shù)據(jù)記錄誤差。
數(shù)據(jù)的高維特性。由于觀測對象和采樣方法本身的時(shí)間、空間屬性以及觀測傳感器的多通道特征,科學(xué)大數(shù)據(jù)往往具有時(shí)空連續(xù)性和譜段多維性,導(dǎo)致維數(shù)災(zāi)難。
數(shù)據(jù)分析的高度計(jì)算復(fù)雜性。數(shù)據(jù)的高度不確定性、高維特性,以及與科學(xué)數(shù)據(jù)分析相伴隨的原理模型的復(fù)雜性,導(dǎo)致了科學(xué)數(shù)據(jù)處理分析的計(jì)算復(fù)雜性。總之,科學(xué)大數(shù)據(jù)具有不同于一般大數(shù)據(jù)的特征,其內(nèi)在機(jī)理及如何應(yīng)用于知識發(fā)現(xiàn)需深入研究。
2014年6月,在我們的倡議和主持下,“國際科學(xué)計(jì)劃大數(shù)據(jù)研討會(huì):挑戰(zhàn)與機(jī)遇”在北京召開。該會(huì)議由國際科學(xué)和技術(shù)數(shù)據(jù)委員會(huì)(CODATA)主辦,7個(gè)國際組織共同主辦。會(huì)議發(fā)表的聲明強(qiáng)調(diào)科學(xué)研究要加強(qiáng)對大數(shù)據(jù)的理解,通過發(fā)展與大數(shù)據(jù)有關(guān)的研究、政策和框架來強(qiáng)化國際大數(shù)據(jù)科學(xué)合作,促進(jìn)社會(huì)發(fā)展。盡管這在當(dāng)時(shí)只是一個(gè)起點(diǎn),但這份聲明是人們關(guān)注大數(shù)據(jù)潛力邁出的實(shí)質(zhì)性一步。聲明要點(diǎn)包括:響應(yīng)大數(shù)據(jù)對國際科學(xué)計(jì)劃的重要性;開發(fā)大數(shù)據(jù)為社會(huì)服務(wù)的潛力;通過國際合作來增進(jìn)對大數(shù)據(jù)的理解;通過全球研究基礎(chǔ)設(shè)施促進(jìn)大數(shù)據(jù)的普及;探索和應(yīng)對大數(shù)據(jù)管理工作帶來的挑戰(zhàn);鼓勵(lì)大數(shù)據(jù)科學(xué)能力建設(shè);促進(jìn)政策制定,最大限度地利用大數(shù)據(jù)。
自那時(shí)起,我們主辦或共同主辦了一系列關(guān)于科學(xué)大數(shù)據(jù)的會(huì)議,其中包括“科學(xué)大數(shù)據(jù)前沿香山科學(xué)會(huì)議”“中國科學(xué)院學(xué)部空間地球大數(shù)據(jù)科學(xué)與技術(shù)前沿論壇”“自然科學(xué)與人文科學(xué)大數(shù)據(jù)前沿探索圓桌會(huì)議”“地球大數(shù)據(jù)香山科學(xué)會(huì)議”等。有關(guān)部門和單位相繼組織召開了不同的與科學(xué)大數(shù)據(jù)有關(guān)的會(huì)議,進(jìn)行深入研討。
特別重要的是,在中國科學(xué)院的組織下,我們提出發(fā)展“科學(xué)大數(shù)據(jù)”的建議,上報(bào)后受到政府的重視。2015年《國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》中把科學(xué)大數(shù)據(jù)作為綱要的一部分,提出“發(fā)展科學(xué)大數(shù)據(jù):積極推動(dòng)由國家公共財(cái)政支持的公益性科研活動(dòng)獲取和產(chǎn)生的科學(xué)數(shù)據(jù)逐步開放共享,構(gòu)建科學(xué)大數(shù)據(jù)國家重大基礎(chǔ)設(shè)施,實(shí)現(xiàn)對國家重要科技數(shù)據(jù)的權(quán)威匯集、長期保存、集成管理和全面共享。面向經(jīng)濟(jì)社會(huì)發(fā)展需求,發(fā)展科學(xué)大數(shù)據(jù)應(yīng)用服務(wù)中心,支持解決經(jīng)濟(jì)社會(huì)發(fā)展和國家安全重大問題”。
科學(xué)大數(shù)據(jù)是國家大數(shù)據(jù)戰(zhàn)略的有機(jī)組成,這使得深入開展科學(xué)大數(shù)據(jù)的研究具備了良好的政策支撐和理論基礎(chǔ)??茖W(xué)大數(shù)據(jù)是國家大數(shù)據(jù)戰(zhàn)略的基石,科技界和科學(xué)家肩負(fù)重大的使命——推進(jìn)科學(xué)大數(shù)據(jù)的全面系統(tǒng)發(fā)展。
全球范圍內(nèi)大數(shù)據(jù)蓬勃發(fā)展,我國正在實(shí)施國家大數(shù)據(jù)戰(zhàn)略,科學(xué)大數(shù)據(jù)已成為大數(shù)據(jù)國家戰(zhàn)略的重要組成部分。在習(xí)近平總書記對實(shí)施國家大數(shù)據(jù)戰(zhàn)略提出更高要求的大背景下,國務(wù)院辦公廳2018年3月又發(fā)布了《科學(xué)數(shù)據(jù)管理辦法》。我們迎來了發(fā)展科學(xué)大數(shù)據(jù)的重要的歷史機(jī)遇。為更好地推動(dòng)科學(xué)大數(shù)據(jù)發(fā)展,有以下4點(diǎn)建議。
一、科學(xué)認(rèn)知大數(shù)據(jù)世界的科學(xué)大數(shù)據(jù)。大數(shù)據(jù)世界的科學(xué)大數(shù)據(jù)具有獨(dú)到的特點(diǎn),科學(xué)大數(shù)據(jù)提供了創(chuàng)新的科研方法論,科學(xué)大數(shù)據(jù)是驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)的新引擎,科學(xué)大數(shù)據(jù)是占領(lǐng)未來科學(xué)制高點(diǎn)的前沿領(lǐng)域,科學(xué)大數(shù)據(jù)為人類認(rèn)識世界提供了全新的思維,科學(xué)大數(shù)據(jù)是孕育新型科學(xué)家的搖籃。目前,我國的計(jì)算機(jī)用戶數(shù)全球第一,互聯(lián)網(wǎng)用戶數(shù)全球第一,移動(dòng)互聯(lián)網(wǎng)用戶數(shù)全球第一,我國擁有的數(shù)據(jù)量未來幾年有可能達(dá)到20%,我國發(fā)表的大數(shù)據(jù)論文數(shù)目前國際排名第二。我國政府對大數(shù)據(jù)高度重視,我國的大數(shù)據(jù)在國際上有較高的話語權(quán),為在此基礎(chǔ)上開展的科學(xué)大數(shù)據(jù)研究走向國際前沿奠定了堅(jiān)實(shí)基礎(chǔ)。
二、建設(shè)科學(xué)大數(shù)據(jù)國家重大基礎(chǔ)設(shè)施。大裝置產(chǎn)出大數(shù)據(jù),大數(shù)據(jù)孕育大科學(xué),大科學(xué)驅(qū)動(dòng)大發(fā)現(xiàn),國家統(tǒng)一布局建設(shè)科學(xué)大數(shù)據(jù)國家重大基礎(chǔ)設(shè)施十分重要。其意義包括保證科學(xué)大數(shù)據(jù)的獲取與更新、權(quán)威匯集與高效處理,實(shí)現(xiàn)對重要科技數(shù)據(jù)的長期保存和集成管理。同時(shí),科研活動(dòng)過程中產(chǎn)生的海量科學(xué)數(shù)據(jù)需要通過網(wǎng)絡(luò)給科學(xué)家們進(jìn)行分析和處理,但海量數(shù)據(jù)的共享和傳輸過程,在當(dāng)前的網(wǎng)絡(luò)信息安全環(huán)境和條件下,導(dǎo)致科研數(shù)據(jù)傳輸?shù)男实拖?,影響科學(xué)發(fā)現(xiàn)的質(zhì)量。進(jìn)行科學(xué)大數(shù)據(jù)的收集、存儲、維護(hù)、管理、分析和共享等核心技術(shù)需要重大基礎(chǔ)設(shè)施的支撐。
三、建立國家科學(xué)大數(shù)據(jù)研究中心。我國目前有數(shù)十個(gè)大科學(xué)裝置、數(shù)百個(gè)國家重點(diǎn)實(shí)驗(yàn)室、大量的部門重點(diǎn)實(shí)驗(yàn)室,正在建設(shè)國家實(shí)驗(yàn)室。這些應(yīng)是科學(xué)大數(shù)據(jù)首先“發(fā)力”的地方。建立科學(xué)大數(shù)據(jù)中心,服務(wù)于不同領(lǐng)域科研機(jī)構(gòu)。可設(shè)立不同科學(xué)領(lǐng)域中心,如生命大數(shù)據(jù)中心、地球大數(shù)據(jù)中心、天文大數(shù)據(jù)中心等,開拓諸如生物信息學(xué)、地球信息學(xué)、天文信息學(xué)等相應(yīng)的學(xué)科領(lǐng)域;也可設(shè)立不同區(qū)域科學(xué)大數(shù)據(jù)中心。考慮到中國科學(xué)院的國家定位,建議依托中國科學(xué)院建立國家科學(xué)大數(shù)據(jù)研究中心。同時(shí),科學(xué)大數(shù)據(jù)能否順利發(fā)展的關(guān)鍵之一是數(shù)據(jù)共享,應(yīng)實(shí)施可持續(xù)發(fā)展的科學(xué)數(shù)據(jù)共享,包括重視科學(xué)數(shù)據(jù)出版這種新的數(shù)據(jù)集成與開放共享機(jī)制。
四、發(fā)起科學(xué)大數(shù)據(jù)國際論壇與國際聯(lián)盟。提高科學(xué)大數(shù)據(jù)在實(shí)踐應(yīng)用中的方法論、理論基礎(chǔ)和技術(shù)研究,開展雙邊或多邊的國際交流與合作是提高科學(xué)大數(shù)據(jù)研究水平的重要途徑之一。國際科學(xué)論壇是保障以上實(shí)施的重要平臺,有利于開展前沿理論的探討,有利于加強(qiáng)與國際科技組織及國際科學(xué)計(jì)劃的協(xié)作,以匯集更多領(lǐng)域、更多學(xué)科的專家力量,保持優(yōu)良的國際科技合作環(huán)境。同時(shí),應(yīng)考慮建立國際科學(xué)大數(shù)據(jù)聯(lián)盟。例如,面向“一帶一路”倡議,構(gòu)建大數(shù)據(jù)聯(lián)盟。以科學(xué)大數(shù)據(jù)為抓手,讓大數(shù)據(jù)成為“一帶一路”建設(shè)的一個(gè)引擎,讓大數(shù)據(jù)成為各國共建的和平使者,讓大數(shù)據(jù)之光普照現(xiàn)在和未來。