沈 喆,巫慧林,伍 濤,景 康,鄧錦山
(1.四川省都江堰水利發(fā)展中心東風(fēng)渠管理處,成都,610081;2.四川省水利科學(xué)研究院,成都,610072)
水利在國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展中發(fā)揮著重要作用,是大數(shù)據(jù)產(chǎn)生和應(yīng)用的重要領(lǐng)域之一。水利數(shù)據(jù)資源共享是水利大數(shù)據(jù)發(fā)展和應(yīng)用的基礎(chǔ)。隨著水利業(yè)務(wù)和信息技術(shù)的發(fā)展,國(guó)家高度重視水利信息資源整合與共享,并對(duì)水利信息資源整合共享建設(shè)提出了新的要求[1-3]。2015年,水利部印發(fā)了?水利信息化資源整合共享頂層設(shè)計(jì)?,提出實(shí)現(xiàn)水利信息“統(tǒng)一技術(shù)標(biāo)準(zhǔn)、統(tǒng)一運(yùn)行環(huán)境、統(tǒng)一安全保障、統(tǒng)一數(shù)據(jù)中心和統(tǒng)一門(mén)戶”的目標(biāo)[4]。2017年,水利部網(wǎng)信辦下發(fā)了?關(guān)于推進(jìn)水利大數(shù)據(jù)發(fā)展的指導(dǎo)意見(jiàn)?,意見(jiàn)中明確指出要充分發(fā)揮大數(shù)據(jù)在水利改革發(fā)展中的重要作用,促進(jìn)水利大數(shù)據(jù)發(fā)展,有力支撐和服務(wù)水利信息化[5]。
“十四五”期間,四川省智慧水利建設(shè)進(jìn)入新的階段,需要對(duì)數(shù)據(jù)信息資源、業(yè)務(wù)系統(tǒng)資源、硬件資源等進(jìn)行整合、治理,為智慧水利業(yè)務(wù)協(xié)同打下堅(jiān)實(shí)基礎(chǔ)。利用云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)、大數(shù)據(jù)、區(qū)塊鏈等新技術(shù),建設(shè)四川省水利數(shù)據(jù)資源整合與共享平臺(tái),加快推進(jìn)四川省水利數(shù)據(jù)資源共享與交換,是“十四五”時(shí)期四川省水利信息化建設(shè)的重點(diǎn)內(nèi)容之一。通過(guò)對(duì)四川省水利信息化系統(tǒng)現(xiàn)狀進(jìn)行調(diào)研,發(fā)現(xiàn)當(dāng)前業(yè)務(wù)系統(tǒng)存在建設(shè)主體較多、業(yè)務(wù)系統(tǒng)分散、數(shù)據(jù)孤島等問(wèn)題,導(dǎo)致數(shù)據(jù)資源無(wú)法進(jìn)行有效整合。目前,四川省暫無(wú)統(tǒng)一的水利數(shù)據(jù)組織模型,建設(shè)新系統(tǒng)時(shí)往往需要重新梳理水利信息數(shù)據(jù),造成數(shù)據(jù)資源重復(fù)建設(shè),降低了數(shù)據(jù)資源的復(fù)用率。在此背景下,亟需對(duì)水利數(shù)據(jù)進(jìn)行梳理,構(gòu)建統(tǒng)一的數(shù)據(jù)模型,形成可共享的標(biāo)準(zhǔn)數(shù)據(jù)資源。以數(shù)據(jù)模型為基礎(chǔ)對(duì)各類水利數(shù)據(jù)資源進(jìn)行整編,經(jīng)數(shù)據(jù)與對(duì)象以及對(duì)象間多方關(guān)聯(lián),有助于建立水利數(shù)據(jù)體系。水文是水利業(yè)務(wù)重要的一環(huán),為此,以水文數(shù)據(jù)為例,建立統(tǒng)一的數(shù)據(jù)模型,逐步實(shí)現(xiàn)水利數(shù)據(jù)的“一數(shù)一源”[6]。
本文在水利對(duì)象模型的基礎(chǔ)上,采用面向?qū)ο蟮睦碚摲椒ǎ崂硪延兴臄?shù)據(jù)資源,并針對(duì)數(shù)據(jù)模型不統(tǒng)一,數(shù)據(jù)模型設(shè)計(jì)缺失的問(wèn)題,按照水文數(shù)據(jù)資源的范圍,借助PowerDesigner工具,設(shè)計(jì)一套適用于水文數(shù)據(jù)組織的數(shù)據(jù)模型。該模型可科學(xué)化構(gòu)建數(shù)據(jù)間關(guān)系,打通業(yè)務(wù)線與數(shù)據(jù)的聯(lián)系,并能較好地支撐水文業(yè)務(wù)與其他業(yè)務(wù)對(duì)數(shù)據(jù)共享的要求。
數(shù)據(jù)模型是數(shù)據(jù)庫(kù)設(shè)計(jì)中用來(lái)對(duì)現(xiàn)實(shí)世界進(jìn)行抽象的工具,是數(shù)據(jù)庫(kù)中用于提供信息表示和操作手段的形式構(gòu)架,也是數(shù)據(jù)庫(kù)系統(tǒng)的核心和基礎(chǔ)。數(shù)據(jù)模型所描述的內(nèi)容包括三個(gè)部分:數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作、數(shù)據(jù)約束。數(shù)據(jù)模型按不同的應(yīng)用層次分成三種類型:概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型、物理數(shù)據(jù)模型。
概念模型為業(yè)務(wù)人員提供了不考慮實(shí)現(xiàn)方式,專注于業(yè)務(wù)流程、實(shí)體對(duì)象及其關(guān)系的有效數(shù)據(jù)關(guān)聯(lián)方式。邏輯模型和物理模型可由專業(yè)數(shù)據(jù)庫(kù)管理人員根據(jù)概念模型進(jìn)行深化。對(duì)于水利專業(yè)人員,概念模型較為貼近實(shí)際數(shù)據(jù)建模深度,能讓業(yè)務(wù)人員專注于數(shù)據(jù)本體的關(guān)系組織。
圖1 數(shù)據(jù)模型深度
數(shù)據(jù)資源整合共享是一項(xiàng)龐大而復(fù)雜的系統(tǒng)工程,2015年水利部發(fā)布?水利信息化資源整合共享頂層設(shè)計(jì)?。其中,數(shù)據(jù)資源的整合共享就作為整個(gè)水利信息化建設(shè)的一項(xiàng)基礎(chǔ)工程被提出來(lái)。數(shù)據(jù)的整合應(yīng)按照統(tǒng)一數(shù)據(jù)模型、統(tǒng)一數(shù)據(jù)目錄、統(tǒng)一基礎(chǔ)數(shù)據(jù)、統(tǒng)一應(yīng)用共享數(shù)據(jù)幾個(gè)層面開(kāi)展。水文數(shù)據(jù)整合的實(shí)現(xiàn),首先應(yīng)開(kāi)展統(tǒng)一數(shù)據(jù)模型的構(gòu)建,同步開(kāi)展水文數(shù)據(jù)目錄、水文數(shù)據(jù)庫(kù)、水文數(shù)據(jù)共享三方面工作,最終有機(jī)融合,實(shí)現(xiàn)數(shù)據(jù)整合共享。
數(shù)據(jù)模型是數(shù)據(jù)資源管理的基礎(chǔ),它定義了數(shù)據(jù)資源的整體結(jié)構(gòu)、分類及數(shù)據(jù)間的層次關(guān)聯(lián)關(guān)系。通過(guò)對(duì)比層次模型、網(wǎng)狀模型、關(guān)系模型、面向?qū)ο竽P偷奶攸c(diǎn),發(fā)現(xiàn)水利數(shù)據(jù)與其他結(jié)構(gòu)化較好的行業(yè)數(shù)據(jù)存在重大差異。隨著水利管理業(yè)務(wù)的深入發(fā)展,水利對(duì)象的維度特征會(huì)不斷增加,且不同類型水利對(duì)象的特征又存在巨大差異[7]。為此,采用面向?qū)ο蟮睦碚摲椒?,以?duì)象的方式組織水利數(shù)據(jù),對(duì)涉水?dāng)?shù)據(jù)資源進(jìn)行梳理和分析,梳理水利業(yè)務(wù)系統(tǒng)中的各類水利對(duì)象,并采取統(tǒng)一口徑對(duì)水利對(duì)象進(jìn)行定義和命名,實(shí)現(xiàn)水利對(duì)象空間特征和非空間屬性,以及他們之間空間關(guān)系和業(yè)務(wù)管理關(guān)系的統(tǒng)一管理。為減少數(shù)據(jù)冗余,提高結(jié)構(gòu)靈活性和數(shù)據(jù)間的易關(guān)聯(lián)能力,從標(biāo)識(shí)和屬性2個(gè)方面描述水利對(duì)象,其中對(duì)象標(biāo)識(shí)僅表達(dá)本體的存在性和唯一性;屬性則是該本體有可能存在的相關(guān)特征信息,水利對(duì)象的屬性包括基礎(chǔ)屬性、業(yè)務(wù)屬性、空間屬性和時(shí)相屬性[6],通過(guò)基礎(chǔ)、業(yè)務(wù)、空間等多維度標(biāo)識(shí),實(shí)現(xiàn)水利對(duì)象數(shù)據(jù)進(jìn)行科學(xué)合理歸類。
水利對(duì)象模型對(duì)獨(dú)立的每類水利對(duì)象提供了詳細(xì)的層次劃分,為水文數(shù)據(jù)組織模型的構(gòu)建提供了可靠的基本粒子,同時(shí)也為水文數(shù)據(jù)分類組織提供劃分依據(jù)。
通過(guò)對(duì)四川省水文數(shù)據(jù)的梳理,形成了已有水文數(shù)據(jù)。水文數(shù)據(jù)是水文數(shù)據(jù)模型構(gòu)建的對(duì)象,按照水文業(yè)務(wù)的范圍,同時(shí)參考水利信息化標(biāo)準(zhǔn)規(guī)范體系中數(shù)據(jù)交換類標(biāo)準(zhǔn)?水文數(shù)據(jù)目錄服務(wù)規(guī)范?(SL 736-2016)對(duì)水文數(shù)據(jù)的類目劃分,將水文數(shù)據(jù)劃分為基礎(chǔ)數(shù)據(jù)(即站網(wǎng)數(shù)據(jù))、監(jiān)測(cè)數(shù)據(jù)(即測(cè)驗(yàn)數(shù)據(jù))、業(yè)務(wù)數(shù)據(jù)(及整編數(shù)據(jù))及其他數(shù)據(jù)。
2.1.1 基礎(chǔ)數(shù)據(jù)
根據(jù)四川省水文數(shù)據(jù)調(diào)研情況,已有水文基礎(chǔ)數(shù)據(jù)包括流域、水文測(cè)站(含雨量站、蒸發(fā)站、水位站、流量站、泥沙站等)、水事影像監(jiān)測(cè)點(diǎn)、水井、水閘、泵站、供取水量監(jiān)測(cè)點(diǎn)、水資源分區(qū)、水功能區(qū)、水源地、取水口、取用水戶等水文基礎(chǔ)對(duì)象及其屬性數(shù)據(jù)、空間數(shù)據(jù)。
2.1.2 監(jiān)測(cè)數(shù)據(jù)
水文監(jiān)測(cè)以水文測(cè)站為載體,圍繞水文要素進(jìn)行監(jiān)測(cè)。按照水文業(yè)務(wù)所需,對(duì)降水量、水位、流量、水面蒸發(fā)量等16項(xiàng)水文監(jiān)測(cè)要素進(jìn)行監(jiān)測(cè),水文要素反映水文對(duì)象的動(dòng)態(tài)變化特征。通過(guò)調(diào)研,當(dāng)前監(jiān)測(cè)數(shù)據(jù)主要由水雨情監(jiān)測(cè)系統(tǒng)(含水文監(jiān)測(cè)數(shù)據(jù))、地下水監(jiān)測(cè)系統(tǒng)(含地下水監(jiān)測(cè)數(shù)據(jù))、國(guó)家水資源監(jiān)控能力建設(shè)系統(tǒng)(含供取水量監(jiān)測(cè)數(shù)據(jù))提供。
2.1.3 業(yè)務(wù)數(shù)據(jù)
業(yè)務(wù)數(shù)據(jù)包括河流徑流量統(tǒng)計(jì)數(shù)據(jù)、水文整編數(shù)據(jù)、大江大河洪水預(yù)報(bào)數(shù)據(jù)等。水文業(yè)務(wù)數(shù)據(jù)圍繞地表水、地下水、土壤墑情、水質(zhì)等具體業(yè)務(wù)線條展開(kāi)。
水文數(shù)據(jù)是從實(shí)地調(diào)查、觀測(cè)及計(jì)算研究所得與水文有關(guān)的各項(xiàng)資料,包括降水量、蒸發(fā)量、水位、流量、含沙量等各種水文要素類型。水文數(shù)據(jù)與一般的科學(xué)數(shù)據(jù)相比具有以下特點(diǎn)[8]:
(1)空間特性。水文數(shù)據(jù)覆蓋了流域、河湖等水文基本單元,且以測(cè)站為單位測(cè)得。因此,水文數(shù)據(jù)具有地理空間上的分布性。
(2)時(shí)間特性。水文數(shù)據(jù)是從水文測(cè)站設(shè)站以來(lái)測(cè)得的一系列的具有時(shí)間序列的數(shù)據(jù),水文數(shù)據(jù)具有時(shí)間維上的有效性。
(3)數(shù)據(jù)要素多。水文數(shù)據(jù)包含了地表水、地下水、土壤墑情等多種類型的數(shù)據(jù),這些數(shù)據(jù)各自包含著不同的水文要素,水文數(shù)據(jù)具有數(shù)據(jù)要素多的特點(diǎn)。
(4)聯(lián)系性強(qiáng)。各類型的水文數(shù)據(jù)不是孤立地存在,而是相互聯(lián)系的,以水文測(cè)站為水文數(shù)據(jù)采集的核心,水文測(cè)站關(guān)聯(lián)水文要素,水文要素關(guān)聯(lián)水文監(jiān)測(cè)數(shù)據(jù),數(shù)據(jù)間聯(lián)系密切。
根據(jù)水文數(shù)據(jù)的特點(diǎn),構(gòu)建關(guān)系模型時(shí),考慮以水文測(cè)站為核心,將水文基礎(chǔ)對(duì)象和水文要素連通,由對(duì)水文要素?cái)?shù)據(jù)的監(jiān)測(cè),派生出水文監(jiān)測(cè)數(shù)據(jù),再由各水利專題,將水文監(jiān)測(cè)數(shù)據(jù)組織起來(lái),形成專題數(shù)據(jù)。可實(shí)現(xiàn)數(shù)據(jù)“基礎(chǔ)—監(jiān)測(cè)—業(yè)務(wù)(專題)”的組織方式,數(shù)據(jù)對(duì)象間關(guān)聯(lián)關(guān)系表示較為流暢。數(shù)據(jù)組織方式如圖2所示。
圖2 水文數(shù)據(jù)組織方式示意
本次數(shù)據(jù)模型構(gòu)建采用PowerDesigner,該工具優(yōu)勢(shì)在于可以完整實(shí)現(xiàn)“概念模型—邏輯模型—物理模型”的建模流程,打通從數(shù)據(jù)關(guān)系組織到數(shù)據(jù)庫(kù)導(dǎo)入導(dǎo)出,形成的數(shù)據(jù)模型可應(yīng)用于數(shù)據(jù)資源整合共享中,可對(duì)接元數(shù)據(jù)管理平臺(tái),實(shí)現(xiàn)從最小粒度數(shù)據(jù)資源到大型數(shù)據(jù)資源組織[9]。
按照本文提出的水文數(shù)據(jù)組織方式,在PowerDesigner中進(jìn)行數(shù)據(jù)關(guān)系建模。概念模型以水文基礎(chǔ)對(duì)象數(shù)據(jù)為例,進(jìn)行建模。圖3中對(duì)水文測(cè)站、水庫(kù)、河流、流域等9類涉及水文業(yè)務(wù)的水利對(duì)象進(jìn)行關(guān)系模型構(gòu)建,基于對(duì)象間的空間關(guān)系及非空間關(guān)系,該關(guān)系模型實(shí)現(xiàn)了對(duì)9類對(duì)象的實(shí)體及關(guān)系構(gòu)建。該概念模型可擴(kuò)展對(duì)象的屬性及標(biāo)識(shí),轉(zhuǎn)化為邏輯模型和物理模型,實(shí)現(xiàn)水文基礎(chǔ)對(duì)象數(shù)據(jù)的模型建立。
圖3 水文基礎(chǔ)對(duì)象數(shù)據(jù)概念模型
在圖3中,以面向?qū)ο蟮姆绞?,描述了水文?shí)體對(duì)象與其互相之間的關(guān)系。矩形框代表實(shí)體水文對(duì)象,曲線框代表實(shí)體間關(guān)系。首先,構(gòu)建獨(dú)立的實(shí)體對(duì)象,如水庫(kù)、河流、水文測(cè)站等,每個(gè)實(shí)體對(duì)象具備唯一標(biāo)識(shí)和屬性,唯一標(biāo)識(shí)即實(shí)體對(duì)象的ID,用以區(qū)分同一類別不同對(duì)象;屬性即實(shí)體對(duì)象所附帶的特征,如水庫(kù),庫(kù)容、建設(shè)年代等信息是其屬性。唯一標(biāo)識(shí)和屬性信息不作為概念模型的重點(diǎn),可在邏輯模型階段進(jìn)一步深化。實(shí)體間關(guān)系即實(shí)體對(duì)象間通過(guò)空間關(guān)聯(lián)或非空間關(guān)聯(lián)所形成的關(guān)聯(lián)關(guān)系。如水庫(kù)對(duì)象與河流對(duì)象,在空間上存在“水庫(kù)位于河流上”的關(guān)系,在面向?qū)ο笾袑?duì)象間的關(guān)系也可以表示為一個(gè)對(duì)象,可構(gòu)建“水庫(kù)—河流”對(duì)象,如圖4?!八畮?kù)—河流”關(guān)系對(duì)象的表示,依靠水庫(kù)和河流的唯一標(biāo)識(shí),該信息可在邏輯模型階段進(jìn)一步深化。通過(guò)這種方式,可以對(duì)水文實(shí)體及其關(guān)系進(jìn)行較為完備的梳理。
圖4 水文實(shí)體及其關(guān)系在概念模型中的表示
在基礎(chǔ)對(duì)象構(gòu)建的基礎(chǔ)上,可進(jìn)一步按照本文3.1節(jié)中提出的水文數(shù)據(jù)組織方式,進(jìn)一步對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行梳理。單一業(yè)務(wù)線亦可按照面向?qū)ο蠓绞?,通過(guò)所需監(jiān)測(cè)水文要素關(guān)聯(lián)水文要素對(duì)象、水文監(jiān)測(cè)數(shù)據(jù)對(duì)象、水文基礎(chǔ)對(duì)象的方式進(jìn)行模型構(gòu)建。在單一業(yè)務(wù)線的基礎(chǔ)上,梳理業(yè)務(wù)線間的關(guān)系,構(gòu)建并形成針對(duì)地表水、地下水等業(yè)務(wù)主題的數(shù)據(jù)模型。圖5為基于水文、氣溫、降水量多要素業(yè)務(wù)數(shù)據(jù)模型。
圖5 水溫、氣溫、降水量多要素業(yè)務(wù)數(shù)據(jù)模型示意
構(gòu)建統(tǒng)一的水文數(shù)據(jù)模型為解決水文數(shù)據(jù)資源整合共享打下基礎(chǔ),后期可按水文數(shù)據(jù)組織思路,對(duì)其他水利數(shù)據(jù)進(jìn)行建模,實(shí)現(xiàn)整個(gè)水利數(shù)據(jù)資源的梳理與整合。下一步可在構(gòu)建水利數(shù)據(jù)模型的基礎(chǔ)上,開(kāi)展水利數(shù)據(jù)資源目錄的梳理及水利數(shù)據(jù)共享交換管理平臺(tái)的建設(shè),實(shí)現(xiàn)從數(shù)據(jù)的生產(chǎn)、組織、管理、交換、共享的全流程治理,為業(yè)務(wù)系統(tǒng)開(kāi)發(fā)和協(xié)同提供基礎(chǔ)。