張巍,金鵬,李瑞強(qiáng),何燕飛
(1.內(nèi)蒙古生態(tài)環(huán)境大數(shù)據(jù)有限公司,內(nèi)蒙古 呼和浩特 010011;2.內(nèi)蒙古自治區(qū)生態(tài)環(huán)境綜合行政執(zhí)法總隊(duì),內(nèi)蒙古 呼和浩特 010011;3.內(nèi)蒙古自治區(qū)環(huán)境在線(xiàn)監(jiān)控中心,內(nèi)蒙古 呼和浩特010011;4.北京思路創(chuàng)新科技有限公司,北京 100000)
環(huán)境信息資源是指生態(tài)環(huán)境部門(mén)在履行職責(zé)過(guò)程中制作或獲取的,以一定形式記錄、保存的文件、資料、圖表和數(shù)據(jù)等各類(lèi)數(shù)據(jù)資源。黨中央、國(guó)務(wù)院高度重視信息資源整合共享工作,習(xí)近平總書(shū)記強(qiáng)調(diào)要強(qiáng)化信息資源深度整合,構(gòu)建全國(guó)信息資源共享體系,打通經(jīng)濟(jì)社會(huì)發(fā)展的信息“大動(dòng)脈”,以信息化推進(jìn)國(guó)家治理體系和治理能力現(xiàn)代化。2017年,國(guó)家發(fā)改委下發(fā)《政務(wù)信息資源目錄編制指南(試行)》(發(fā)改高技〔2017〕1272 號(hào))[1],明確了政務(wù)信息資源的分類(lèi)、元數(shù)據(jù)、編制要求等內(nèi)容,為信息資源目錄建設(shè)提供了更為具體的方法和依據(jù)。2017 年底,由生態(tài)環(huán)境部牽頭編制了《生態(tài)環(huán)境保護(hù)信息化工程數(shù)據(jù)分類(lèi)與編碼標(biāo)準(zhǔn)》《生態(tài)環(huán)境信息共享服務(wù)注冊(cè)規(guī)范》《生態(tài)環(huán)境信息共享資源發(fā)布和使用規(guī)范》。內(nèi)蒙古自治區(qū)生態(tài)環(huán)境保護(hù)工作起步較早、發(fā)展較快,積累了大量的數(shù)據(jù)。在數(shù)據(jù)整合工作中,我們發(fā)現(xiàn),由于業(yè)務(wù)系統(tǒng)建設(shè)沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),數(shù)據(jù)質(zhì)量參差不齊,“數(shù)據(jù)孤島”“數(shù)據(jù)煙囪”現(xiàn)象普遍存在。為推動(dòng)全區(qū)生態(tài)環(huán)境數(shù)據(jù)的整合共享,強(qiáng)化數(shù)據(jù)資源的高效統(tǒng)一管理,研究制定環(huán)境信息資源目錄體系勢(shì)在必行。
選取內(nèi)蒙古自治區(qū)為研究區(qū)域。內(nèi)蒙古自治區(qū)從2016 年起實(shí)施生態(tài)環(huán)境大數(shù)據(jù)建設(shè)項(xiàng)目,具有良好的環(huán)境信息資源目錄編制基礎(chǔ):一是通過(guò)數(shù)據(jù)資源規(guī)劃,初步摸清了生態(tài)環(huán)境大數(shù)據(jù)資源“家底”,使分散的、標(biāo)準(zhǔn)不一的數(shù)據(jù)實(shí)現(xiàn)由數(shù)據(jù)到信息的轉(zhuǎn)化,規(guī)范數(shù)據(jù)庫(kù)及業(yè)務(wù)系統(tǒng)建設(shè),為環(huán)境資源共享夯實(shí)基礎(chǔ);二是針對(duì)不同粒度和層次的信息資源建立數(shù)據(jù)庫(kù)體系,以滿(mǎn)足生態(tài)環(huán)境數(shù)據(jù)分類(lèi)存儲(chǔ)及分析需求,數(shù)據(jù)庫(kù)體系主要由關(guān)系型數(shù)據(jù)庫(kù)、時(shí)序數(shù)據(jù)庫(kù)、半結(jié)構(gòu)化數(shù)據(jù)庫(kù)、非結(jié)構(gòu)化數(shù)據(jù)庫(kù)組成;三是建立了數(shù)據(jù)資源數(shù)據(jù)庫(kù),從數(shù)據(jù)庫(kù)設(shè)計(jì)方法、數(shù)據(jù)庫(kù)體系總體結(jié)構(gòu)、元數(shù)據(jù)庫(kù)設(shè)計(jì)、業(yè)務(wù)數(shù)據(jù)庫(kù)設(shè)計(jì)等方面,形成基礎(chǔ)數(shù)據(jù)庫(kù)、主數(shù)據(jù)庫(kù)、元數(shù)據(jù)庫(kù)、主題數(shù)據(jù)庫(kù)、指標(biāo)庫(kù)和公共代碼庫(kù)。
本研究數(shù)據(jù)來(lái)源于內(nèi)蒙古自治區(qū)生態(tài)環(huán)境大數(shù)據(jù)資源中心,該中心收錄生態(tài)環(huán)境數(shù)據(jù)約36.7 億條,數(shù)據(jù)容量約30.1T。本研究依托內(nèi)蒙古自治區(qū)現(xiàn)有生態(tài)環(huán)境數(shù)據(jù)基礎(chǔ),圍繞生態(tài)環(huán)境領(lǐng)域數(shù)據(jù),通過(guò)對(duì)環(huán)境質(zhì)量、生態(tài)環(huán)境、污染源等信息的分類(lèi)以及對(duì)應(yīng)業(yè)務(wù)數(shù)據(jù)、環(huán)境質(zhì)量數(shù)據(jù)、環(huán)境要素等數(shù)據(jù)信息梳理,確定資源目錄規(guī)范結(jié)構(gòu),建立數(shù)據(jù)資源體系,規(guī)范資源目錄內(nèi)容,實(shí)現(xiàn)對(duì)環(huán)境質(zhì)量信息相關(guān)源數(shù)據(jù)及元數(shù)據(jù)的有效分類(lèi)、管理。
采用實(shí)地調(diào)研、文獻(xiàn)調(diào)研、專(zhuān)家調(diào)研等方法研究不同來(lái)源的內(nèi)蒙古自治區(qū)生態(tài)環(huán)境數(shù)據(jù)的現(xiàn)狀,摸清數(shù)據(jù)家底。建立“一橫一縱”生態(tài)環(huán)境數(shù)據(jù)梳理機(jī)制,縱向貫穿部、省、市縣、排污單位等生態(tài)環(huán)境管理節(jié)點(diǎn)內(nèi)部數(shù)據(jù),橫向整合其他委辦廳局及互聯(lián)網(wǎng)數(shù)據(jù)??v向依據(jù)生態(tài)環(huán)境各業(yè)務(wù)部門(mén)現(xiàn)有的職能職責(zé),梳理出各部門(mén)涉及數(shù)據(jù),依據(jù)數(shù)據(jù)所涉及的環(huán)境管理要素再進(jìn)行二次分類(lèi),最終形成數(shù)據(jù)資源基本情況調(diào)查表,見(jiàn)表1。橫向梳理出其他委辦廳局及互聯(lián)網(wǎng)上涉及的數(shù)據(jù),將對(duì)應(yīng)數(shù)據(jù)類(lèi)型按照環(huán)境管理要素添加至表1中。
表1 數(shù)據(jù)資源基本情況調(diào)查表
環(huán)境信息特別是內(nèi)蒙古自治區(qū)內(nèi)各級(jí)生態(tài)環(huán)境管理部門(mén)使用的環(huán)境管理及相關(guān)信息,具有層次分明、隸屬關(guān)系明確等特點(diǎn),宜采用線(xiàn)方法進(jìn)行分類(lèi)。對(duì)于一些特殊類(lèi)別的環(huán)境信息,宜采用面分類(lèi)方法。本分類(lèi)采用以線(xiàn)分類(lèi)法為主、面分類(lèi)法為補(bǔ)充的混合分類(lèi)法。
一、二級(jí)分類(lèi)采用線(xiàn)分類(lèi)方法按照生態(tài)環(huán)境管理要素分類(lèi),一級(jí)類(lèi)目包含目前環(huán)境管理業(yè)務(wù)涉及要素,包括環(huán)境質(zhì)量信息、自然生態(tài)、污染源等大類(lèi);二級(jí)類(lèi)目對(duì)管理要素進(jìn)行再分類(lèi),如環(huán)境質(zhì)量信息下再分大氣環(huán)境質(zhì)量、水環(huán)境質(zhì)量、聲環(huán)境質(zhì)量等;三級(jí)至五級(jí)類(lèi)目采用面分類(lèi)方法,按照每類(lèi)要素包含的數(shù)據(jù)屬性進(jìn)行分類(lèi)。類(lèi)目層次目前暫時(shí)分到五級(jí),將來(lái)可根據(jù)數(shù)據(jù)類(lèi)別擴(kuò)展需要增加。
類(lèi)目的分類(lèi)編碼規(guī)則沿用《環(huán)境信息分類(lèi)與代碼》中的分類(lèi)代碼,分類(lèi)代碼用阿拉伯?dāng)?shù)字表示,每層代碼均采用2位阿拉伯?dāng)?shù)字表示,即01-99。一級(jí)類(lèi)目代碼由第一層代碼組成,二級(jí)以上類(lèi)目代碼由上級(jí)類(lèi)目代碼加本層代碼組成。
代碼結(jié)構(gòu)組成如圖所示:
圖1 代碼結(jié)構(gòu)組成圖
表2 環(huán)境信息資源代碼表(節(jié)選)
表3 環(huán)境信息資源核心元數(shù)據(jù)說(shuō)明(節(jié)選)
通過(guò)本項(xiàng)目研究,最終形成環(huán)境信息資源一級(jí)目錄9 項(xiàng),包括環(huán)境質(zhì)量信息、自然生態(tài)、污染源、核與輻射、環(huán)境風(fēng)險(xiǎn)與應(yīng)急、環(huán)境政策法規(guī)標(biāo)準(zhǔn)、環(huán)??萍寂c產(chǎn)業(yè)、政務(wù)信息、環(huán)境保護(hù)相關(guān)信息等;二級(jí)目錄32 項(xiàng),包括大氣、水、土壤、自然生態(tài)環(huán)境質(zhì)量等;三級(jí)目錄80項(xiàng),包括空氣質(zhì)量監(jiān)測(cè)、降塵、降水、沙塵等;四級(jí)目錄82 項(xiàng),包括空氣自動(dòng)常規(guī)監(jiān)測(cè)、空氣超級(jí)站監(jiān)測(cè)等;五級(jí)目錄54 項(xiàng),包括國(guó)控空氣自動(dòng)常規(guī)監(jiān)測(cè)、區(qū)控空氣自動(dòng)常規(guī)監(jiān)測(cè)等。
環(huán)境信息元數(shù)據(jù)是描述環(huán)境數(shù)據(jù)資源特征的數(shù)據(jù)。其中核心元數(shù)據(jù)是描述數(shù)據(jù)基本屬性與特征的最小集合,一般包括環(huán)境信息資源的名稱(chēng)、內(nèi)容摘要、提供方、發(fā)布日期等。利用元數(shù)據(jù)來(lái)描述信息資源后,可以快速發(fā)現(xiàn)和確認(rèn)信息資源、為信息檢索提供關(guān)鍵詞,可以在不同系統(tǒng)之間進(jìn)行數(shù)據(jù)交換。環(huán)境信息資源核心元數(shù)據(jù)包括環(huán)境信息資源分類(lèi)、環(huán)境信息資源名稱(chēng)、代碼、提供方、提供方代碼、摘要、格式、信息項(xiàng)信息、共享屬性、開(kāi)放屬性、更新周期、發(fā)布日期、關(guān)聯(lián)資源代碼等13項(xiàng)。
內(nèi)蒙古自治區(qū)生態(tài)環(huán)境保護(hù)工作起步較早、發(fā)展較快,積累了大量的數(shù)據(jù)。近年來(lái),通過(guò)環(huán)境信息系統(tǒng)的配套建設(shè),大部分?jǐn)?shù)據(jù)實(shí)現(xiàn)了紙質(zhì)化向電子化的轉(zhuǎn)變。2016年,內(nèi)蒙古自治區(qū)生態(tài)環(huán)境廳啟動(dòng)大數(shù)據(jù)建設(shè)項(xiàng)目,推動(dòng)涉及環(huán)境監(jiān)測(cè)、環(huán)境執(zhí)法、環(huán)境統(tǒng)計(jì)、污染源普查等環(huán)保業(yè)務(wù)數(shù)據(jù)的整合共享。經(jīng)過(guò)多年的項(xiàng)目建設(shè)與實(shí)施,我們發(fā)現(xiàn)數(shù)據(jù)資源整合中存在以下幾方面問(wèn)題:一是信息系統(tǒng)建設(shè)缺乏頂層規(guī)劃、統(tǒng)一標(biāo)準(zhǔn),造成大量“數(shù)據(jù)孤島”;二是業(yè)務(wù)數(shù)據(jù)標(biāo)準(zhǔn)不一,數(shù)據(jù)質(zhì)量層次不齊,難以交換和共享;三是數(shù)據(jù)資源開(kāi)發(fā)利用程度不高,為環(huán)境形勢(shì)預(yù)警預(yù)測(cè)、環(huán)境管理宏觀決策等方面發(fā)揮作用有限[2]。
本研究編制的環(huán)境信息資源目錄,通過(guò)建立各類(lèi)環(huán)境信息資源的分類(lèi)方法,規(guī)范資源排序和編碼,推進(jìn)數(shù)據(jù)整合和共享,促進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一,實(shí)現(xiàn)對(duì)各業(yè)務(wù)數(shù)據(jù)資源特征的準(zhǔn)確描述。環(huán)境信息資源目錄建立起數(shù)據(jù)使用者和業(yè)務(wù)部門(mén)的橋梁紐帶,方便人們對(duì)環(huán)境數(shù)據(jù)資源的檢索、定位和獲取,推動(dòng)了數(shù)據(jù)共享應(yīng)用,提升了數(shù)據(jù)的環(huán)境管理決策支撐能力。
本研究基于內(nèi)蒙古自治區(qū)生態(tài)環(huán)境大數(shù)據(jù)項(xiàng)目的建設(shè)經(jīng)驗(yàn),環(huán)境信息資源目錄體系已成功應(yīng)用于內(nèi)蒙古自治區(qū)生態(tài)環(huán)境大數(shù)據(jù)五期工程。研究成果適用于內(nèi)蒙古自治區(qū)各級(jí)生態(tài)環(huán)境信息化項(xiàng)目實(shí)施過(guò)程中,環(huán)境信息資源目錄的建設(shè)和管理,為生態(tài)環(huán)境數(shù)據(jù)治理、數(shù)據(jù)管理、數(shù)據(jù)共享等工作提供標(biāo)準(zhǔn)統(tǒng)一的編碼規(guī)則,推進(jìn)全區(qū)生態(tài)環(huán)境數(shù)據(jù)的交換共享。
本研究基本建立起內(nèi)蒙古自治區(qū)生態(tài)環(huán)境五級(jí)信息資源目錄體系,形成了內(nèi)蒙古自治區(qū)環(huán)境信息資源分類(lèi)原則與代碼規(guī)則、環(huán)境信息資源核心元數(shù)據(jù)。該目錄體系具有可擴(kuò)展性,后續(xù)可根據(jù)生態(tài)環(huán)境管理業(yè)務(wù)需求,不斷完善和更新,通過(guò)目錄使用過(guò)程中的意見(jiàn)反饋,不斷優(yōu)化分類(lèi)和元數(shù)據(jù)。環(huán)境信息資源目錄體系的建立有利于推動(dòng)生態(tài)環(huán)境信息資源的整合和共享,強(qiáng)化數(shù)據(jù)資源的高效統(tǒng)一管理,推進(jìn)數(shù)據(jù)應(yīng)用,挖掘數(shù)據(jù)潛在價(jià)值,為生態(tài)環(huán)境質(zhì)量改善提供強(qiáng)有力的數(shù)據(jù)支持服務(wù)。