文/國(guó)家海洋局東海信息中心 張春艷 孫杰 蔡夢(mèng)凡
計(jì)算機(jī)技術(shù)革命性地改變世界,全面融入社會(huì)生活,帶來(lái)的信息積累的速度和信息量爆炸式增長(zhǎng)引發(fā)新的變革。“大數(shù)據(jù)”,順勢(shì)而生,它是具有更強(qiáng)的決策力、洞察力、流程優(yōu)化能力、高增長(zhǎng)率和多樣化的信息資產(chǎn),同時(shí)具有容量大、多樣、快速、價(jià)值密度相對(duì)較低的特點(diǎn)。大數(shù)據(jù)技術(shù)在海洋領(lǐng)域的戰(zhàn)略意義不在于掌握的數(shù)據(jù)信息的數(shù)量,而是在于對(duì)這些有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理體現(xiàn)其價(jià)值。比如我們可以通過(guò)收集、分析歷年的海洋災(zāi)情數(shù)據(jù),包括臺(tái)風(fēng)風(fēng)暴潮、海浪災(zāi)害等,并對(duì)數(shù)據(jù)進(jìn)行比較分析,建立一個(gè)特定的數(shù)學(xué)模型,深入研究海洋災(zāi)害歷史性影響范圍,為海洋防災(zāi)減災(zāi)提供輔助決策支撐。
(一)傳統(tǒng)海洋檔案來(lái)源有限。傳統(tǒng)的海洋檔案數(shù)據(jù)來(lái)源基本靠延遲歸檔的海洋檔案資料。這些資料主要來(lái)自日常的海洋行政管理和海洋業(yè)務(wù)工作包括海洋臺(tái)站觀測(cè)、船舶設(shè)備管理、船舶測(cè)報(bào)、海洋專(zhuān)題調(diào)查、海洋斷面調(diào)查、基本建設(shè)等。
(二)傳統(tǒng)海洋檔案載體單一。從國(guó)家海洋局兩次歷史檔案進(jìn)館內(nèi)容來(lái)看,紙質(zhì)檔案占主導(dǎo)。東海區(qū)移交至中國(guó)海洋檔案館1965-2000年檔案中紙質(zhì)檔案7500余卷。其中第一次移交進(jìn)館的1965-1982年產(chǎn)生的檔案3400余卷,均為紙質(zhì)檔案材料。第二次移交進(jìn)館1983-2000年歷史檔案,紙質(zhì)檔案約4100余卷,僅有少量的照片檔案,聲像檔案、史料檔案。
(三)海洋檔案類(lèi)型固定。海洋檔案主要是在履行業(yè)務(wù)職能和承擔(dān)各類(lèi)項(xiàng)目等活動(dòng)中形成的科技檔案,以及在管理工作中形成的機(jī)關(guān)文書(shū)檔案。1965-2000年間產(chǎn)生的檔案多為海洋科技檔案。這些科技檔案中多數(shù)為海洋臺(tái)站觀測(cè)記錄,類(lèi)型和格式都相對(duì)固定。
(四)傳統(tǒng)檔案數(shù)量增長(zhǎng)穩(wěn)定。通過(guò)國(guó)家海洋局東海分局(以下簡(jiǎn)稱(chēng)東海分局)兩次歷史檔案進(jìn)館分析過(guò)去30年海洋檔案的增長(zhǎng)速度:第一次檔案進(jìn)館檔案海濱觀測(cè)和東海標(biāo)準(zhǔn)斷面調(diào)查分別為1779卷、230卷,與第二次進(jìn)館數(shù)量對(duì)比2029卷、274卷相差不大,見(jiàn)“圖1”。
圖1 兩次歷史檔案進(jìn)館卷數(shù)比較
21世紀(jì)是海洋世紀(jì),為了實(shí)現(xiàn)我國(guó)的“海洋強(qiáng)國(guó)”戰(zhàn)略,海洋科技實(shí)力不斷提高,海洋檔案作為各類(lèi)海洋活動(dòng)記錄載體也發(fā)生了歷史性的變革。
(一)與傳統(tǒng)檔案的對(duì)比。1.海洋檔案數(shù)據(jù)來(lái)源多頭、載體多樣。隨著海洋業(yè)務(wù)的擴(kuò)展和先進(jìn)的海洋儀器的大量采用,數(shù)據(jù)來(lái)源越來(lái)越廣,數(shù)據(jù)量越來(lái)越大。業(yè)務(wù)系統(tǒng)傳輸數(shù)據(jù)、業(yè)務(wù)系統(tǒng)的加工數(shù)據(jù)、收集資料等都納入了海洋檔案歸檔范圍中。同時(shí),海洋檔案的外延不斷延伸,檔案載體和形式也千姿百態(tài)?,F(xiàn)代海洋檔案涵蓋了紙質(zhì)(含照片和圖件)、錄音帶、錄像帶、磁盤(pán)、光盤(pán)、硬盤(pán)、底片、膠片、幻燈片和實(shí)物等不同的載體形式。2.海洋檔案類(lèi)型及屬性更復(fù)雜。在海洋業(yè)務(wù)中,進(jìn)行海洋地質(zhì)勘探、水下地形測(cè)量、海洋環(huán)境監(jiān)測(cè)、水動(dòng)力要素觀測(cè)、氣象要素觀測(cè)、生物種類(lèi)鑒定、放化殘毒分析、海洋環(huán)境要素預(yù)報(bào)、海洋災(zāi)害預(yù)測(cè)預(yù)報(bào)等活動(dòng)過(guò)程中形成了大量的檔案文獻(xiàn)、專(zhuān)業(yè)基礎(chǔ)數(shù)據(jù)等資料。在實(shí)際的實(shí)施上,由于有多個(gè)系統(tǒng)記錄的海洋信息的各種數(shù)據(jù),形成了非常密集的記錄。這些記錄所涵蓋的信息包羅萬(wàn)象,既有時(shí)間維度,也有地理維度,同時(shí)還有頻率維度、區(qū)域維度、站點(diǎn)維度等等。3.現(xiàn)代海洋檔案數(shù)據(jù)量增長(zhǎng)快。隨著聲光電等高科技手段在海洋業(yè)務(wù)中的應(yīng)用、數(shù)字信息及載體的迅猛發(fā)展、現(xiàn)代智能技術(shù)和信息技術(shù)與海洋裝備和海洋活動(dòng)相結(jié)合,07年開(kāi)始東海區(qū)部分臺(tái)站數(shù)據(jù)電子化,到09年基本所有臺(tái)站都實(shí)現(xiàn)自動(dòng)化觀測(cè),在日常運(yùn)營(yíng)中生成、海洋實(shí)時(shí)傳輸中產(chǎn)生的數(shù)據(jù)以每分MB的速度累積。4.海洋檔案需求多樣性呈現(xiàn)個(gè)性化趨勢(shì)。隨著海洋業(yè)務(wù)的擴(kuò)展,使海洋科技檔案和資料工作不斷發(fā)揮作用,這就對(duì)海洋檔案的利用提出了新的更高要求,更快,更準(zhǔn)、更全。傳統(tǒng)的海洋檔案服務(wù)是比較狹隘和單一的,一般情況是在知道某個(gè)明確需求(某份文件)下,檔案人員為此提供一對(duì)一的服務(wù)。在傳統(tǒng)的檔案信息化技術(shù)下,通過(guò)數(shù)字化手段和數(shù)字檔案館的建設(shè)檔案服務(wù)水平得到一些提升,但同樣是面臨服務(wù)單一的問(wèn)題。一是嚴(yán)重依賴(lài)于檔案管理水平,比如著錄的準(zhǔn)確度、詳細(xì)度。二是在跨類(lèi)別、跨庫(kù)檢索上會(huì)有缺陷。大數(shù)據(jù)時(shí)代背景下,為滿(mǎn)足業(yè)務(wù)需求,海洋檔案服務(wù)向多元化發(fā)展,以提供海洋檔案信息服務(wù)(憑證參考作用)、電子信息利用服務(wù)(文檔類(lèi))、數(shù)據(jù)資料服務(wù)(電子資料)、數(shù)據(jù)產(chǎn)品服務(wù)這四類(lèi)為主。
圖2 1965-2010年?yáng)|海分局發(fā)展歷程
(二)發(fā)展變革原因。1.海洋業(yè)務(wù)的擴(kuò)展。1965-2000年,海洋局的職能歷經(jīng)8次調(diào)整,經(jīng)歷了艱苦創(chuàng)業(yè)時(shí)期、改革發(fā)展時(shí)期、依法管海時(shí)期3個(gè)階段。海洋檔案依托于海洋事業(yè)的發(fā)展,不同的海洋活動(dòng)產(chǎn)生不同的資料,隨著業(yè)務(wù)的發(fā)展海洋檔案類(lèi)型不斷新增,見(jiàn)“圖2”。以海濱觀測(cè)為例,觀測(cè)臺(tái)站由最初的20個(gè)臺(tái)站,發(fā)展到現(xiàn)在50多個(gè),其中近半數(shù)為現(xiàn)代自動(dòng)化觀測(cè)站。隨著海濱觀測(cè)業(yè)務(wù)的不斷發(fā)展完善,1958-2006年海濱觀測(cè)規(guī)范,經(jīng)歷了6個(gè)版本的變遷,在觀測(cè)要素、觀測(cè)方法、記錄方式等方面做了許多調(diào)整和改動(dòng)。2.海洋科學(xué)技術(shù)發(fā)展。隨著時(shí)代的進(jìn)步與科學(xué)技術(shù)的發(fā)展,海洋事業(yè)實(shí)現(xiàn)了前所未有的飛躍。高科技多媒體的聲光電技術(shù),成為現(xiàn)代化海洋科技發(fā)展中不可缺少的輔助手段之一,其應(yīng)用越來(lái)越廣泛,并且隨著技術(shù)的提高與種類(lèi)的多樣化,越來(lái)越起著拓寬海洋業(yè)務(wù)手段和范圍的作用。地波雷達(dá)、海上大型浮標(biāo)的布設(shè)、船用測(cè)量?jī)x器、聲學(xué)儀器、以及GPS技術(shù)等其他高精尖手段廣泛應(yīng)用于日常的海洋觀監(jiān)測(cè)、勘察、調(diào)查等科學(xué)研究過(guò)程中。海洋物探、水文調(diào)查、地形地貌調(diào)查、觀測(cè)預(yù)報(bào)、測(cè)繪等工作的數(shù)字化產(chǎn)生,海洋科技檔案也隨之從傳統(tǒng)的紙質(zhì)檔案逐漸轉(zhuǎn)變?yōu)殡娮訖n案。3.新時(shí)代要求。與全球性的海洋開(kāi)發(fā)利用熱潮相適應(yīng),海洋信息化進(jìn)程不斷加快,中國(guó)近?!皵?shù)字海洋”信息基礎(chǔ)框架建設(shè)完成,各海洋專(zhuān)題服務(wù)網(wǎng)站建設(shè)不斷完善,海洋綜合管理信息系統(tǒng)建設(shè)得到深化拓展。同時(shí),“智慧海洋”也要求將各類(lèi)海洋信息資源整合在一起,海洋檔案作為重要的海洋信息資源,探索大數(shù)據(jù)技術(shù)在海洋檔案方面的應(yīng)用是“智慧海洋”的內(nèi)在要求。
(三)大數(shù)據(jù)技術(shù)應(yīng)用。在大數(shù)據(jù)時(shí)代,利用大數(shù)據(jù)技術(shù)從大量的電子化和數(shù)字化海洋檔案文獻(xiàn)、專(zhuān)業(yè)基礎(chǔ)數(shù)據(jù)中實(shí)現(xiàn)智能化檢索檔案,探索非結(jié)構(gòu)化檔案文獻(xiàn)的關(guān)系、災(zāi)害趨勢(shì)預(yù)測(cè)、災(zāi)害處置預(yù)案推薦分析、觀測(cè)數(shù)據(jù)的挖掘分析等。在節(jié)約人力和物力的同時(shí)能夠高效實(shí)現(xiàn)檔案文獻(xiàn)分類(lèi)整理檢索、專(zhuān)業(yè)基礎(chǔ)數(shù)據(jù)挖掘分析,給用戶(hù)呈現(xiàn)精細(xì)化、直觀的、動(dòng)態(tài)的、趨勢(shì)的專(zhuān)業(yè)數(shù)據(jù)分析結(jié)果。1.與傳統(tǒng)海洋數(shù)據(jù)分析對(duì)比。傳統(tǒng)意義上的數(shù)據(jù)是賦值的數(shù)字,大數(shù)據(jù)時(shí)代的數(shù)據(jù)內(nèi)涵和概念擴(kuò)展為數(shù)字和信息的統(tǒng)稱(chēng)。現(xiàn)在的海洋業(yè)務(wù)中大數(shù)據(jù)分析,跟傳統(tǒng)意義的分析有一個(gè)本質(zhì)區(qū)別,就是傳統(tǒng)的分析是基于結(jié)構(gòu)化、關(guān)系型的數(shù)據(jù),而且往往是取一個(gè)很小的數(shù)據(jù)集,來(lái)對(duì)整個(gè)海洋數(shù)據(jù)進(jìn)行預(yù)測(cè)和判斷。但現(xiàn)在是大數(shù)據(jù)時(shí)代,理念已完全改變,現(xiàn)在的海洋大數(shù)據(jù)分析是對(duì)整個(gè)數(shù)據(jù)全集直接進(jìn)行存儲(chǔ)和管理分析。2.大數(shù)據(jù)分析技術(shù)在海洋檔案中的應(yīng)用。大數(shù)據(jù)分析采用的模式識(shí)別技術(shù)、圖文轉(zhuǎn)換技術(shù)、語(yǔ)義分析技術(shù)、地理信息技術(shù)等成為關(guān)鍵技術(shù)。通過(guò)對(duì)涉海海洋檔案、文獻(xiàn),海洋活動(dòng)數(shù)據(jù)充分獲取,應(yīng)用大數(shù)據(jù)的方法和技術(shù)處理(ETL),收集、過(guò)濾、加工、分析、展現(xiàn)并提供開(kāi)放的信息訪問(wèn)接口。用戶(hù)通過(guò)訪問(wèn)數(shù)據(jù)接口,提供數(shù)據(jù)處理的展示平臺(tái),也可以進(jìn)一步為各類(lèi)用戶(hù)、系統(tǒng)開(kāi)發(fā)所需的個(gè)性化數(shù)據(jù)服務(wù)。大數(shù)據(jù)分析的工具從長(zhǎng)期來(lái)說(shuō)可以提高工作效率,優(yōu)化人力資源分配,促進(jìn)海洋各項(xiàng)工作的進(jìn)展。目前國(guó)家海洋局東海信息中心正在探索建設(shè)的東海檔案數(shù)據(jù)庫(kù)管理系統(tǒng)就是大數(shù)據(jù)技術(shù)在海洋檔案方面應(yīng)用的典型?;趯?duì)檔案文獻(xiàn)和專(zhuān)業(yè)數(shù)據(jù)等數(shù)據(jù)清洗、整理、轉(zhuǎn)換、展現(xiàn)應(yīng)用計(jì)算機(jī)模型建立海洋檔案智能檢索及專(zhuān)業(yè)數(shù)據(jù)分析系統(tǒng)平臺(tái),從多個(gè)視角、多個(gè)層次、多個(gè)維度碎片化檔案文獻(xiàn)數(shù)據(jù)、刻畫(huà)海洋觀測(cè)、監(jiān)測(cè)的高清數(shù)據(jù)畫(huà)像,進(jìn)一步分析檔案數(shù)據(jù)、實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),為更好地管理和利用海洋提供數(shù)字支持。
當(dāng)代海洋檔案發(fā)展,既要有較高的學(xué)術(shù)和價(jià)值定位,又要符合大數(shù)據(jù)的時(shí)代背景。同時(shí),還要不斷地利用現(xiàn)代信息化手段,讓海洋檔案資料充分應(yīng)用和投入到海洋生產(chǎn)、再生產(chǎn)等實(shí)踐過(guò)程中,為海洋業(yè)務(wù)決策提供相應(yīng)的數(shù)據(jù)、信息支撐,優(yōu)化決策,造福于民。