楊遠(yuǎn)征, 徐超, 唐世林,2, 李莎
1. 中國科學(xué)院南海海洋研究所, 廣東 廣州 510301;
2. 南方海洋科學(xué)與工程廣東省實(shí)驗(yàn)室(廣州), 廣東 廣州 511458
科學(xué)數(shù)據(jù)是指人類社會科技活動所產(chǎn)生的基本科學(xué)技術(shù)數(shù)據(jù)、資料及其衍生數(shù)據(jù)(孫九林 等,2009), 是繼物質(zhì)和能量之后的第三類資源, 也是支撐和保障科技創(chuàng)新、經(jīng)濟(jì)發(fā)展和相關(guān)決策的國家戰(zhàn)略資源(王卷樂 等, 2019)。近年來, 越來越多的國家政府意識到科學(xué)數(shù)據(jù)的重要性, 相繼在國家層面上制定了科學(xué)數(shù)據(jù)管理和共享政策。美國國立衛(wèi)生研究院為了促進(jìn)科學(xué)數(shù)據(jù)開放共享, 在2003 年發(fā)布了科學(xué)數(shù)據(jù)共享政策(National Institute of Health,2020)。2011 年, 美國國家科學(xué)基金會也發(fā)布了科學(xué)數(shù)據(jù)共享政策, 以促使科研人員共享在該基金資助下的科研過程中產(chǎn)生的科學(xué)數(shù)據(jù)(National Science Foundation, 2020)。2013 年, 白宮科技政策辦公室通過出臺《增強(qiáng)對聯(lián)邦資助科學(xué)研究成果的獲取》指令來促進(jìn)科研數(shù)據(jù)和文獻(xiàn)成果的開放獲取(U.S.Agency for International Development, 2016)。澳大利亞為了規(guī)范管理科學(xué)數(shù)據(jù), 早在2007 年就通過國家層面的政策文件《澳大利亞責(zé)任研究行為守則》, 明確規(guī)定了機(jī)構(gòu)和科研人員在科學(xué)數(shù)據(jù)管理的相關(guān)責(zé)任和義務(wù)(Australian Government, 2007)。英國研究理事會在2011 年發(fā)布了《數(shù)據(jù)政策通用原則》, 英國皇家學(xué)會在2012 年也頒發(fā)了《科學(xué)作為開放事業(yè)》有關(guān)科學(xué)數(shù)據(jù)管理的政策文件(The Royal Society Science Policy Centre, 2012; UK Research and Innovation, 2020), 有力地促進(jìn)了科學(xué)數(shù)據(jù)的開放共享。盡管我國一直重視科學(xué)數(shù)據(jù)的管理和共享,但相較于發(fā)達(dá)國家, 在科學(xué)數(shù)據(jù)管理政策的制定方面相對滯后。2015 年9 月, 國務(wù)院發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》, 明確提出了“積極推動由國家公共財政支持的公益性科研活動獲取和產(chǎn)生的科學(xué)數(shù)據(jù)逐步開放共享”(中華人民共和國國務(wù)院, 2015)。我國首次在國家層面出臺的科學(xué)數(shù)據(jù)管理政策是在2018 年3 月, 國務(wù)院辦公廳頒發(fā)了《科學(xué)數(shù)據(jù)管理辦法》, 為我國科學(xué)數(shù)據(jù)的采集、整合、開放和共享等各個環(huán)節(jié)的工作提供了國家層面的制度保障(中華人民共和國國務(wù)院辦公廳, 2018)。
科學(xué)研究已經(jīng)進(jìn)入了數(shù)據(jù)密集型的新科研模式(張柏春, 2012), 意味著科學(xué)數(shù)據(jù)在科學(xué)研究中具有重要的地位, 是科學(xué)研究持續(xù)發(fā)展的基礎(chǔ)。海洋科學(xué)是典型的數(shù)據(jù)密集型學(xué)科(陳戈 等, 2019), 一方面, 海洋觀測監(jiān)測等海洋相關(guān)科研活動能夠產(chǎn)生大量的科學(xué)數(shù)據(jù), 其獲取一般需要通過儀器設(shè)備在特定的、復(fù)雜的海洋現(xiàn)場觀測環(huán)境下進(jìn)行, 成本巨大且現(xiàn)場觀測數(shù)據(jù)具有唯一性; 另一方面,海洋科學(xué)問題的解決, 以及科研成果的驗(yàn)證都離不開相關(guān)科學(xué)數(shù)據(jù)的佐證。因此, 海洋科學(xué)數(shù)據(jù)具有重要的存儲、開放共享和利用價值。在海洋科學(xué)數(shù)據(jù)建設(shè)和發(fā)展方面, 發(fā)達(dá)國家較早在國家層面加大對科學(xué)數(shù)據(jù)中心的建設(shè)。美國國家航空航天局在1989 年首次提出“在國家層面上構(gòu)建數(shù)據(jù)共享框架和實(shí)現(xiàn)數(shù)據(jù)共享”計劃后, 從1990 年代表美國從國家層面開始建設(shè)由9 個數(shù)據(jù)中心構(gòu)成的國家級科學(xué)數(shù)據(jù)中心群——分布式最活躍數(shù)據(jù)檔案中心群, 涵蓋海洋、生物、大氣等領(lǐng)域(劉闖 等, 2002)。英國也較早開展了海洋數(shù)據(jù)管理和共享的工作, 在英國自然環(huán)境研究首輪理事會后就積極加入了經(jīng)濟(jì)合作與發(fā)展組織(Organization for Economic Co-operation and Development, OECD)的國家科學(xué)數(shù)據(jù)共享計劃, 并建立了英國海洋數(shù)據(jù)中心等5 個國家級環(huán)境科學(xué)領(lǐng)域的科學(xué)數(shù)據(jù)中心, 開放共享的數(shù)據(jù)內(nèi)容涵蓋陸地、海洋、氣候、極地等自然環(huán)境領(lǐng)域(姜穎, 2018)。日本通過國家海洋數(shù)據(jù)中心的建設(shè), 持續(xù)整合并共享了覆蓋全球的海溫、海流、鹽度、水深、潮流等要素的海洋水文數(shù)據(jù)。韓國海洋數(shù)據(jù)中心不斷整合和開放了1921 年以來的沿海海洋觀測數(shù)據(jù), 并開放了海洋環(huán)境監(jiān)測數(shù)據(jù)、海洋漁業(yè)數(shù)據(jù)、海洋生物數(shù)據(jù)、海洋災(zāi)害數(shù)據(jù)等(王漢雨, 2016)。
我國方面, 中國科學(xué)院早在1987 年就開始建設(shè)中國科學(xué)院科學(xué)數(shù)據(jù)庫及其信息系統(tǒng), 并在中國科學(xué)院信息化專項(xiàng)持續(xù)支持建設(shè)下, 建成了國內(nèi)較大規(guī)模的綜合科技數(shù)據(jù)基礎(chǔ)資源共享與服務(wù)平臺(黎建輝 等, 2017)。國家自然科學(xué)基金委在2003 年啟動建設(shè)了“國家自然科學(xué)基金青島海洋科學(xué)資料共享服務(wù)中心”, 設(shè)計了青島海洋資料共享服務(wù)系統(tǒng),從而實(shí)現(xiàn)了國家自然科學(xué)基金海洋科學(xué)數(shù)據(jù)資料、研究成果、報告、標(biāo)準(zhǔn)、文獻(xiàn)、產(chǎn)品和其他相關(guān)信息的網(wǎng)絡(luò)化管理和共享(李朗, 2008; 劉海行 等,2008)。國家海洋局(現(xiàn)為自然資源部)在2006 年啟動了我國首個大型海洋信息系統(tǒng)工程項(xiàng)目“數(shù)字海洋”,通過構(gòu)建“數(shù)字海洋”數(shù)據(jù)共享服務(wù)平臺整合了分布在11 個沿海省(自治區(qū)、直轄市)海洋行政主管部門的海洋信息資源, 并實(shí)現(xiàn)了海洋信息資源分布式管理與共享(蔣冰 等, 2018)。然而, 盡管我國構(gòu)建了不少海洋科學(xué)數(shù)據(jù)共享平臺, 并在一定程度上促進(jìn)了海洋科學(xué)數(shù)據(jù)的開放共享, 但由于這些平臺是各個部門或地區(qū)根據(jù)各自的需求進(jìn)行建設(shè)的, 難免會存在各自為政、部門封閉、數(shù)據(jù)壟斷和重復(fù)建設(shè)等問題, 嚴(yán)重阻礙了我國海洋科學(xué)數(shù)據(jù)開放共享的進(jìn)一步發(fā)展。鑒于此, 科技部、財政部借鑒國際經(jīng)驗(yàn), 在2019 年將原有科學(xué)數(shù)據(jù)類國家科技資源共享服務(wù)平臺優(yōu)化調(diào)整為“國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心”等20 個國家科學(xué)數(shù)據(jù)中心(中華人民共和國科學(xué)技術(shù)部 等,2019), 旨在加強(qiáng)在國家層面上提升科學(xué)數(shù)據(jù)資源的統(tǒng)一匯聚、整合和開放共享能力, 提升科學(xué)數(shù)據(jù)分析挖掘能力和水平, 并在此基礎(chǔ)上加強(qiáng)開展數(shù)據(jù)增值服務(wù)的能力建設(shè), 以支撐和保障國家科技創(chuàng)新、經(jīng)濟(jì)社會發(fā)展和相關(guān)決策活動。
南海是我國最大的跨越熱帶和亞熱帶的邊緣海,毗鄰粵港澳大灣區(qū)等中國經(jīng)濟(jì)活力最強(qiáng)的區(qū)域, 是21 世紀(jì)海上絲綢之路的重要通道, 擁有豐富的油氣能源和生物資源等。南海在國際政治、經(jīng)濟(jì)、科技、軍事領(lǐng)域中具有重要的戰(zhàn)略地位, 特別是在當(dāng)前國家實(shí)施海洋強(qiáng)國和21 世紀(jì)海上絲綢之路等國家海洋戰(zhàn)略的背景下, 南海海洋資源、能源、氣候、環(huán)境和生態(tài)等成為了目前國內(nèi)外關(guān)注的焦點(diǎn)。作為國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心的分中心之一, 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心緊跟國家海洋戰(zhàn)略的步伐, 以國家重大戰(zhàn)略需求為導(dǎo)向, 在中國科學(xué)院科學(xué)數(shù)據(jù)庫前期工作的基礎(chǔ)上, 從2011 年開始建設(shè), 旨在匯聚、組織、描述、搶救和存儲海洋科學(xué)數(shù)據(jù)資源, 并持續(xù)整合和共享了1985 年以來的南海水文、氣象、生態(tài)、地質(zhì)等多學(xué)科、多要素、多尺度的海洋科學(xué)數(shù)據(jù)資源, 實(shí)現(xiàn)了我國南海海洋科學(xué)考察數(shù)據(jù)的在線共享從無到有的創(chuàng)新發(fā)展。南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心的建設(shè)不僅能為海洋科技創(chuàng)新、國家有效管理與海洋環(huán)境保護(hù)、合理開發(fā)利用南海海洋資源和海洋經(jīng)濟(jì)可持續(xù)發(fā)展提供數(shù)據(jù)支撐, 而且可助力國家實(shí)施海洋強(qiáng)國和“一帶一路”倡議等國家海洋戰(zhàn)略, 也可為國際相關(guān)活動中掌握南海海洋環(huán)境事務(wù)方面的主導(dǎo)權(quán), 以及捍衛(wèi)我國南海海洋權(quán)益提供數(shù)據(jù)支持。本文重點(diǎn)闡述了南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心的海洋科學(xué)數(shù)據(jù)資源建設(shè)情況, 主要包括標(biāo)準(zhǔn)規(guī)范、數(shù)據(jù)資源建設(shè)、特色數(shù)據(jù)庫, 共享成效等。
標(biāo)準(zhǔn)規(guī)范是保障數(shù)據(jù)中心科學(xué)規(guī)范地整合、集成和開放共享的基礎(chǔ)。由于南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心是國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心的分中心, 因此在數(shù)據(jù)匯聚、組織、描述、共享和服務(wù)等建設(shè)過程中, 一方面依據(jù)國家地球系統(tǒng)科學(xué)數(shù)據(jù)總中心制定的元數(shù)據(jù)標(biāo)準(zhǔn)等19 項(xiàng)數(shù)據(jù)管理類、數(shù)據(jù)匯交方案等13 項(xiàng)數(shù)據(jù)匯交類, 以及平臺共享服務(wù)規(guī)范等2 項(xiàng)共享服務(wù)類的標(biāo)準(zhǔn)規(guī)范(楊雅萍 等, 2019); 另一方面根據(jù)中國科學(xué)院南海海洋研究所海洋科學(xué)數(shù)據(jù)管理的實(shí)際需求, 制定了《中國科學(xué)院南海海洋研究所數(shù)據(jù)管理辦法》。這些標(biāo)準(zhǔn)規(guī)范為南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心資源建設(shè)提供了科學(xué)、規(guī)范和可持續(xù)發(fā)展的保障。此外, 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心數(shù)據(jù)共享主要通過軟件平臺實(shí)施, 而軟件平臺開發(fā)的主要依據(jù)是數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的有關(guān)規(guī)定, 并在軟件平臺中實(shí)現(xiàn)了數(shù)據(jù)共享的相關(guān)功能。因此, 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心的數(shù)據(jù)標(biāo)準(zhǔn)體系與軟件編碼體系之間有著緊密的聯(lián)系。
針對海洋科學(xué)數(shù)據(jù)具有數(shù)據(jù)體量大、數(shù)據(jù)范圍廣、數(shù)據(jù)內(nèi)容豐富的特點(diǎn)(白亭穎 等, 2020), 為了能給不同用戶提供高質(zhì)量的數(shù)據(jù)服務(wù)和決策支持, 中心采用“學(xué)科分類-主題要素-數(shù)據(jù)集”三級目錄的數(shù)據(jù)資源建設(shè)體系, 建成了在學(xué)科范圍上涵蓋物理海洋、海洋氣象、海洋生物、海洋化學(xué)、海洋生態(tài)、海洋地質(zhì), 在空間尺度上涵蓋全球、國家、區(qū)域、站點(diǎn), 在時間尺度上實(shí)現(xiàn)年度、月度、日度、實(shí)時和未來的綜合性海洋科學(xué)數(shù)據(jù)共享服務(wù)平臺, 在國內(nèi)形成了一定的影響力。已建設(shè)的主要數(shù)據(jù)資源如表1 所示。
表1 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心主要數(shù)據(jù)資源整合情況Tab. 1 Major data resources of South China Sea and Its Adjacent Seas Data Center
另外, 為了能規(guī)范化整合集成數(shù)據(jù)資源, 使用戶能全面快速地了解數(shù)據(jù)資源的元數(shù)據(jù)、數(shù)據(jù)質(zhì)量和數(shù)據(jù)實(shí)體等信息, 中心按照數(shù)據(jù)實(shí)體、數(shù)據(jù)說明文檔、數(shù)據(jù)縮略圖、數(shù)據(jù)樣例、數(shù)據(jù)分類和元數(shù)據(jù)表的數(shù)據(jù)描述、組織和集成策略, 即“六位一體”的數(shù)據(jù)資源整合集成策略, 滿足用戶快速檢索、認(rèn)識、下載和使用數(shù)據(jù)的需求。
南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心資源建設(shè)主要包括海洋科學(xué)數(shù)據(jù)集的元數(shù)據(jù)建設(shè), 以及海洋科學(xué)數(shù)據(jù)集的數(shù)據(jù)實(shí)體建設(shè)。
數(shù)據(jù)實(shí)體建設(shè)主要包括數(shù)據(jù)的采集、加工、質(zhì)量控制和入庫, 如圖1 所示。南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心的數(shù)據(jù)資源的采集主要是通過地(西沙觀測臺站、南沙觀測臺站等)、海(“實(shí)驗(yàn)1”號、“實(shí)驗(yàn)2”號、“實(shí)驗(yàn)3”號調(diào)查船和海上浮標(biāo)以及潛標(biāo)等)、天(Landsat、MODIS 等衛(wèi)星遙感)、空(GPS 探空等)等全方位的海洋觀測體系進(jìn)行采樣, 采集的主要數(shù)據(jù)資源內(nèi)容包括如下幾個方面。
圖1 數(shù)據(jù)實(shí)體建設(shè)體系Fig. 1 Data construction system
1) 海洋物理資料內(nèi)容:深度、溫度、鹽度、密度、海流、波浪等水文資料; 氣壓、海面空氣溫度、相對濕度、風(fēng)、降水量等氣象資料;
2) 海洋化學(xué)資料內(nèi)容:海洋化學(xué)要素、同位素化學(xué)要素、沉積物化學(xué)要素等資料;
3) 海洋生態(tài)資料內(nèi)容:浮游植物、浮游動物、底棲生物、葉綠素a、初級生產(chǎn)力等資料;
4) 海洋底質(zhì)資料內(nèi)容:地形、地層、沉積物、黏土礦物、珊瑚礁等資料。
在數(shù)據(jù)的加工方面, 海洋科學(xué)數(shù)據(jù)具有種類豐富、格式各異、時空變化大等特點(diǎn), 在直接應(yīng)用上有一定的困難。因此, 依靠信息技術(shù)對海洋科學(xué)數(shù)據(jù)進(jìn)行加工處理, 就成為海洋科學(xué)領(lǐng)域必不可少的關(guān)鍵環(huán)節(jié), 也一直是該領(lǐng)域致力解決的難題。南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心針對不同海洋學(xué)科數(shù)據(jù)資源采取不同的加工處理技術(shù), 主要包括多源數(shù)據(jù)融合、遙感反演、信息提取和數(shù)據(jù)同化等加工技術(shù)。其中, 南海SeaWiFS 月平均葉綠素二級產(chǎn)品數(shù)據(jù)集(1999—2001)利用第二代海洋水色傳感器SeaWiFS探測到的南海海域海水輻亮度, 采用幾何糾正和大氣校正的處理技術(shù), 并通過SeaDAS 軟件提取葉綠素濃度遙感信息(陳楚群 等, 2001); 南海海洋再分析產(chǎn)品數(shù)據(jù)集利用海表高度、海表溫度、海表鹽度、海表流及溫鹽剖面資料等不同類型的海洋觀測數(shù)據(jù),采用數(shù)據(jù)同化技術(shù), 產(chǎn)生了一套1999—2011 年高分辨率格點(diǎn)化的南海及其鄰近海區(qū)海表高度和三維溫鹽流數(shù)據(jù)集(Zeng et al, 2014); 南海海洋預(yù)報數(shù)據(jù)集是利用南海海溫、鹽度和海流等海洋環(huán)境觀測要素,采用海洋數(shù)值模擬技術(shù), 預(yù)測了起報時刻起120h 內(nèi)的南海海洋溫鹽流預(yù)報數(shù)據(jù)。
在數(shù)據(jù)質(zhì)量控制方面, 數(shù)據(jù)質(zhì)量實(shí)質(zhì)上是數(shù)據(jù)對應(yīng)用的適用性(Shankaranarayanan et al, 2000)。海洋數(shù)據(jù)質(zhì)量控制主要是基于海洋數(shù)據(jù)的多種來源、多種類型、多維度、不同時空尺度等特性, 對海洋數(shù)據(jù)進(jìn)行非法碼檢驗(yàn)、合理性檢驗(yàn)、范圍檢驗(yàn)和連續(xù)性檢驗(yàn)等常規(guī)檢驗(yàn), 以及海洋數(shù)據(jù)中的重要參數(shù)的反演、校正和改正等質(zhì)量控制, 目的是在實(shí)際應(yīng)用時保持?jǐn)?shù)據(jù)的時效性、精確性、完整性和可信性,最終實(shí)現(xiàn)數(shù)據(jù)的可用性。比如, 在處理2009—2012年南海海洋斷面科學(xué)考察走航ADCP 海流觀測數(shù)據(jù)集時, 除了范圍檢驗(yàn)、非法碼檢驗(yàn)和連續(xù)性檢驗(yàn)等常規(guī)質(zhì)控外, 還對該數(shù)據(jù)集的兩個參數(shù)(速率和方向)的誤差進(jìn)行了修正(楊遠(yuǎn)征 等, 2019), 確保數(shù)據(jù)的精確性和可信性。
在數(shù)據(jù)入庫方面, 將已統(tǒng)一規(guī)范后的元數(shù)據(jù)、數(shù)據(jù)文檔、數(shù)據(jù)樣例和數(shù)據(jù)實(shí)體導(dǎo)入到數(shù)據(jù)庫中進(jìn)行存儲、管理和發(fā)布, 并通過以下安全認(rèn)證設(shè)置相應(yīng)的數(shù)據(jù)資源下載權(quán)限:1)郵箱認(rèn)證:用戶完善郵箱等資料后, 才能申請下載相應(yīng)權(quán)限的數(shù)據(jù)資源;2)手機(jī)認(rèn)證:需用戶綁定手機(jī), 才能提升到相應(yīng)的數(shù)據(jù)資源權(quán)限; 3)實(shí)名認(rèn)證:用戶進(jìn)行實(shí)名認(rèn)證后,將擁有更多數(shù)據(jù)資源申請權(quán)限; 4)課題認(rèn)證:用戶通過課題認(rèn)證, 將有資格獲得與研究課題相關(guān)的精品數(shù)據(jù)。
元數(shù)據(jù)是描述數(shù)據(jù)特征和屬性方面的數(shù)據(jù)(楊文暉 等, 2015), 元數(shù)據(jù)建設(shè)主要是對數(shù)據(jù)資源的特征和屬性進(jìn)行清晰、詳細(xì)和全面的描述, 幫助用戶更好地發(fā)現(xiàn)、獲取、理解和利用數(shù)據(jù)集。南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心元數(shù)據(jù)建設(shè)的依據(jù)是國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心制定的元數(shù)據(jù)標(biāo)準(zhǔn), 建設(shè)內(nèi)容包括數(shù)據(jù)核心描述信息、數(shù)據(jù)貢獻(xiàn)者和數(shù)據(jù)負(fù)責(zé)單位及聯(lián)系人。其中數(shù)據(jù)核心描述信息是為用戶提供數(shù)據(jù)的最主要信息(數(shù)據(jù)標(biāo)題、數(shù)據(jù)時間、空間位置、數(shù)據(jù)類型和數(shù)據(jù)詳細(xì)描述等), 從而用戶能夠方便快捷地發(fā)現(xiàn)、檢索和理解數(shù)據(jù)。海洋科學(xué)數(shù)據(jù)元數(shù)據(jù)的數(shù)據(jù)核心描述信息如表2 所示。
表2 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心元數(shù)據(jù)的數(shù)據(jù)核心描述信息Tab. 2 The core information of metadata at South China Sea and Its Adjacent Seas Data Center
根據(jù)實(shí)際需要和采集到的數(shù)據(jù)類型, 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心還建設(shè)了以下4 個特色數(shù)據(jù)庫,為相應(yīng)領(lǐng)域的研究提供個性化的數(shù)據(jù)支撐。
1) 南沙及鄰近海區(qū)綜合考察數(shù)據(jù)庫。南沙及鄰近海區(qū)綜合考察是20 世紀(jì)80 年代中國科學(xué)院南海海洋研究所組織實(shí)施的大規(guī)模的南沙群島及鄰近海域的科學(xué)考察(趙煥庭 等, 2017)。該庫收錄了1984年至2007 年間, 南沙群島綜合科學(xué)考察航次在南沙群島及其鄰近海區(qū)的現(xiàn)場觀測數(shù)據(jù), 包括海底地形、地貌、沉積物及海洋水文氣象、海水光學(xué)特性、海洋化學(xué)、海洋生物等方面的寶貴資料。
2) 南海北部海洋觀測開放航次數(shù)據(jù)庫。2004年起, 南海北部海洋觀測開放航次開始由中國科學(xué)院南海海洋研究所“實(shí)驗(yàn)3”號科學(xué)考察船實(shí)施(曾麗麗 等, 2015)。該庫收集整理了自2004 年以來南海北部海洋觀測開放航次在南海北部海區(qū)及西部局部海區(qū)的現(xiàn)場觀測數(shù)據(jù), 包括物理海洋學(xué)、海洋生物學(xué)、海洋地質(zhì)學(xué)和海洋化學(xué)數(shù)據(jù)等多個海洋學(xué)科數(shù)據(jù)。
3) 南海海洋斷面科學(xué)考察數(shù)據(jù)庫。中國科學(xué)院南海海洋研究所“實(shí)驗(yàn)3”號科學(xué)考察船2009—2012年在南海18°N、10°N、6°N 斷面和113°E 子午向斷面實(shí)施的南海海洋斷面科學(xué)考察航次(徐超 等,2016)。該庫收集整合了2009 年春季航次, 2010 年秋季航次, 2011 年冬季航次, 2012 年夏季航次共約75個站位的海洋觀測數(shù)據(jù), 包括經(jīng)度、緯度、流速、溫度、密度、鹽度、營養(yǎng)鹽、浮游植物等多個要素數(shù)據(jù)。
4) 印度洋海域綜合考察航次數(shù)據(jù)庫。印度洋海域綜合考察航次是自2010 年起, 在中國科學(xué)院和國務(wù)院各部委的大力支持下, 中國科學(xué)院南海海洋研究所“實(shí)驗(yàn)1”號科學(xué)考察船開始實(shí)施的東印度洋海洋學(xué)綜合科學(xué)考察, 調(diào)查海域是在 80°E—105°E,10°S—10°N 范圍內(nèi)(梁湛林 等, 2018), 該庫整合了該航次自2010 年以來獲取的溫度、鹽度、密度等海洋環(huán)境要素的數(shù)據(jù), 以及海底表層樣品、海水生化樣品等資料。
數(shù)據(jù)共享是指通過政策規(guī)定和共享技術(shù), 讓更多的用戶能夠使用具有可訪問性的數(shù)據(jù)(Borgman等, 2013)。南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心在數(shù)據(jù)共享方面遵照《科學(xué)數(shù)據(jù)管理辦法》等有關(guān)國家科學(xué)數(shù)據(jù)政策規(guī)定, 并通過國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享關(guān)鍵技術(shù)(楊雅萍 等, 2019)等共享技術(shù), 初步改善了海洋科學(xué)數(shù)據(jù)分散、封閉、滯留和低效狀況, 有效促進(jìn)了海洋科學(xué)數(shù)據(jù)的開放共享。在用戶服務(wù)方面, 建立了以用戶需求為導(dǎo)向的服務(wù)理念, 不斷探索用戶的需要, 不斷提升用戶的服務(wù)水準(zhǔn), 留住了一批數(shù)據(jù)用戶群, 真正讓更多不同需求的用戶能夠訪問利用到數(shù)據(jù)。具體而言, 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心共享服務(wù)主要聚焦在:一方面服務(wù)國家重大戰(zhàn)略需求, 為21 世紀(jì)海上絲綢之路、粵港澳大灣區(qū)生態(tài)可持續(xù)發(fā)展等國家戰(zhàn)略提供海洋科學(xué)數(shù)據(jù)基礎(chǔ)支撐; 另一方面支撐海洋科技熱點(diǎn)研究, 為國家和地方重大項(xiàng)目/工程項(xiàng)目、海洋科技創(chuàng)新提供數(shù)據(jù)支撐服務(wù)和技術(shù)服務(wù), 其中已為國家科技基礎(chǔ)性項(xiàng)目“南海海洋斷面科學(xué)考察”提供了數(shù)據(jù)管理和共享服務(wù)(徐超 等, 2016); 為“973”項(xiàng)目“南海海氣相互作用與海洋環(huán)流和渦旋演變規(guī)律”提供數(shù)據(jù)整合與匯交服務(wù); 為南海風(fēng)暴潮研究(Ye et al, 2017; Li et al,2019)、西沙群島島嶼尾跡研究(Zhao et al, 2019)和南海北部陸坡研究(Guo et al, 2020)等提供了基礎(chǔ)數(shù)據(jù)支撐。
經(jīng)過多年的建設(shè)和發(fā)展, 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心緊跟時代的步伐, 圍繞國家重大戰(zhàn)略需求,合理布局, 持續(xù)開展了海洋科學(xué)數(shù)據(jù)資源的采集、整理、加工、存儲和共享, 承擔(dān)科研項(xiàng)目所產(chǎn)生的科學(xué)數(shù)據(jù)資源的匯交和整編任務(wù), 構(gòu)建了一個具有數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)分析及數(shù)據(jù)可視化的海洋科學(xué)數(shù)據(jù)全生命周期管理與共享服務(wù)平臺, 為國家科技創(chuàng)新提供了支撐, 并提升了我國海洋科學(xué)數(shù)據(jù)資源的開放共享水平和應(yīng)用服務(wù)水平。
展望未來, 隨著信息技術(shù)和海洋科學(xué)的不斷發(fā)展, 海洋科技創(chuàng)新出現(xiàn)了新趨勢和新需求, 無人船、自主水下機(jī)器人等智能化的海洋數(shù)據(jù)獲取手段越來越普及, 海洋數(shù)據(jù)資源的數(shù)量越來越多, 類型也越來越復(fù)雜, 用戶的個性化需求也越來越多樣化, 這勢必對數(shù)據(jù)中心在海洋數(shù)據(jù)資源的遴選、采集、匯聚、組織、描述、關(guān)聯(lián)和存儲, 以及相應(yīng)的揭示、發(fā)現(xiàn)、精準(zhǔn)推送等方面提出了新的挑戰(zhàn)。因此, 海洋科學(xué)數(shù)據(jù)中心應(yīng)從海洋科學(xué)數(shù)據(jù)的內(nèi)涵和數(shù)據(jù)價值產(chǎn)生的機(jī)理等方面科學(xué)認(rèn)識海洋數(shù)據(jù), 準(zhǔn)確把握海洋科學(xué)數(shù)據(jù)發(fā)展規(guī)律, 突破海洋數(shù)據(jù)采集、處理、分析和應(yīng)用等方面的技術(shù)瓶頸, 促進(jìn)形成以用戶為導(dǎo)向的高效便捷的數(shù)據(jù)服務(wù)體系, 不斷滿足用戶日益增長的個性化、多樣化需求, 建立自主可控的海洋數(shù)據(jù)安全體系, 切實(shí)保障國家海洋數(shù)據(jù)安全, 推動云計算、大數(shù)據(jù)、人工智能等新一代信息技術(shù)同海洋科學(xué)數(shù)據(jù)全生命周期管理的深度融合, 從而更好地支撐國家在海洋事業(yè)方面的科技創(chuàng)新, 促進(jìn)經(jīng)濟(jì)社會發(fā)展, 并保障國家安全。
關(guān)于南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心未來的資源建設(shè), 本文提出以下幾條建議。
1) 持續(xù)研發(fā)海洋信息提取技術(shù)。海洋數(shù)據(jù)量已經(jīng)邁入了PB 級別(錢程程 等, 2018), 并隨著海洋數(shù)據(jù)獲取手段的不斷豐富, 將繼續(xù)產(chǎn)生大量的、不完全的、有噪聲的、模糊的、隨機(jī)的各種海洋數(shù)據(jù), 因此需要不斷加強(qiáng)數(shù)據(jù)挖掘等信息提取技術(shù)的研發(fā),才能提取出隱含的、事先未知的、潛在有價值的海洋信息, 從而發(fā)揮它們潛在的海洋信息價值, 最終促進(jìn)海洋數(shù)據(jù)資源的高效利用。
2) 注重標(biāo)準(zhǔn)規(guī)范體系建設(shè)。標(biāo)準(zhǔn)規(guī)范體系具有引領(lǐng)和指導(dǎo)作用, 在很大程度上決定著科學(xué)數(shù)據(jù)中心的發(fā)展水平。因此, 數(shù)據(jù)中心不僅要執(zhí)行好現(xiàn)有的標(biāo)準(zhǔn)規(guī)范, 而且要結(jié)合實(shí)際應(yīng)用情況, 不斷地完善和修正標(biāo)準(zhǔn)規(guī)范體系, 借鑒國內(nèi)外同行先進(jìn)的標(biāo)準(zhǔn)規(guī)范, 研究建立系統(tǒng)完整的標(biāo)準(zhǔn)規(guī)范體系, 真正發(fā)揮標(biāo)準(zhǔn)規(guī)范的引領(lǐng)和指導(dǎo)作用, 有效地支撐科學(xué)數(shù)據(jù)中心的資源建設(shè)。
3) 加強(qiáng)海岸帶數(shù)據(jù)資源管理體系建設(shè)。海岸帶是海洋系統(tǒng)與陸地系統(tǒng)復(fù)合交叉、相互作用的地理單元(伊飛 等, 2011), 因此海岸帶數(shù)據(jù)包括了海洋、陸地和空間數(shù)據(jù)。目前, 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心僅管理了有關(guān)海洋方面的數(shù)據(jù)資源, 尚未開展建設(shè)海岸帶數(shù)據(jù)管理體系。黨的十九大報告已明確提出了“堅(jiān)持陸海統(tǒng)籌, 加快建設(shè)海洋強(qiáng)國”, 而陸海統(tǒng)籌被認(rèn)為是海岸帶綜合管理中最重要的組成部分(文超祥 等, 2019)。因此, 未來數(shù)據(jù)中心資源建設(shè)應(yīng)加強(qiáng)開展海岸帶數(shù)據(jù)資源管理體系建設(shè), 為海岸帶綜合管理提供基礎(chǔ)數(shù)據(jù)支撐, 進(jìn)而為國家陸海統(tǒng)籌的戰(zhàn)略提供參考。
4) 加快建設(shè)智能的海洋數(shù)據(jù)管理體系。每一次海洋數(shù)據(jù)或海洋信息領(lǐng)域的跨越式發(fā)展幾乎都依靠信息技術(shù)的發(fā)展。當(dāng)前, 南海及鄰近海區(qū)科學(xué)數(shù)據(jù)中心利用數(shù)字化、互聯(lián)網(wǎng)等信息技術(shù), 實(shí)現(xiàn)了海洋數(shù)據(jù)的數(shù)字化和網(wǎng)絡(luò)化。隨著信息技術(shù)的不斷發(fā)展,特別是大數(shù)據(jù)、人工智能和物聯(lián)網(wǎng)等新一代信息技術(shù)的飛速發(fā)展, 應(yīng)用逐步融合到海洋領(lǐng)域, 人們認(rèn)識海洋的平臺和手段將會迎來根本性的變革。因此,科學(xué)數(shù)據(jù)中心應(yīng)加大力度研究新一代信息技術(shù), 致力于海洋數(shù)據(jù)全生命周期管理體系與新一代信息技術(shù)的融合發(fā)展。利用物聯(lián)網(wǎng)、人工智能等新一代信息技術(shù), 加快開展海洋數(shù)據(jù)或海洋信息的全面感知等智能采集、實(shí)時傳輸以及機(jī)器學(xué)習(xí)和模糊識別等智能處理, 從而實(shí)現(xiàn)海洋數(shù)據(jù)的智能服務(wù)。