李 楊,劉 軍,徐柏楊,齊昱涵,李晨昱
(西安理工大學(xué),陜西 西安 710048)
?
綜合集成平臺(tái)下多源水利信息的主題可視化實(shí)例
李 楊,劉 軍,徐柏楊,齊昱涵,李晨昱
(西安理工大學(xué),陜西 西安 710048)
摘 要:針對(duì)數(shù)據(jù)集成的傳統(tǒng)研究流程(搜集、下載和分析整理數(shù)據(jù))中存在的影響研究工作效率、數(shù)據(jù)本身不能滿足研究人員對(duì)信息及知識(shí)的需求等不足,提出主題式多源信息的實(shí)時(shí)篩選、綜合及加工,與可視化分析的方法。以綜合集成平臺(tái)為基礎(chǔ),水利行業(yè)的主題、空間數(shù)據(jù)為例,結(jié)合數(shù)字地球技術(shù),運(yùn)用在線主題式應(yīng)用的思想,探討面向服務(wù)的多源水利信息集成,以此達(dá)到對(duì)信息、知識(shí)的主題式獲取,即在獲取信息的同時(shí)針對(duì)業(yè)務(wù)需求對(duì)其進(jìn)行加工。在提高數(shù)據(jù)集成效率的同時(shí)加強(qiáng)應(yīng)用的適用性,同時(shí)針對(duì)水利信息的特點(diǎn)進(jìn)行邏輯流程和應(yīng)用結(jié)果的可視化。
關(guān)鍵詞:綜合集成平臺(tái);多源數(shù)據(jù)集成;水利信息;主題式;可視化;面向服務(wù);數(shù)字地球
眾所周知,信息時(shí)代最基本的資源是科學(xué)數(shù)據(jù),越來(lái)越多的研究組織和國(guó)家政府開(kāi)始重視科學(xué)數(shù)據(jù)。面對(duì)巨大的水利信息資源和持續(xù)不斷的數(shù)據(jù)采集工作,對(duì)科技人員及有關(guān)部門的管理人員來(lái)說(shuō),如何直接在多源的水利信息中獲取和挖掘知識(shí)與信息,如何有效、有針對(duì)性地提高相關(guān)部門決策和科研的效率,成為當(dāng)下迫切的需求。所以,知識(shí)挖掘便成了一門學(xué)科,得到很高的關(guān)注度[1],互聯(lián)網(wǎng)(Web)等技術(shù)提供了知識(shí)挖掘應(yīng)用的廣闊信息環(huán)境[2]。目前對(duì)于水利信息而言,數(shù)據(jù)資源龐大而復(fù)雜,但數(shù)據(jù)的來(lái)源較為分散,缺少有規(guī)范的數(shù)據(jù)管理辦法,導(dǎo)致現(xiàn)在的研究工作集中在數(shù)據(jù)的管理規(guī)范和共享方法等方面[3-5]。雖然已有部分研究采用了面向服務(wù)的技術(shù)和思想,但是此類研究依然集中于服務(wù)的發(fā)布方面[6-9]。對(duì)于服務(wù)集成,特別是對(duì)于屬性、地圖和影像等服務(wù)的集成,以及在線分析的技術(shù)方面探討較少,使得相關(guān)人員在使用時(shí),仍然要通過(guò)“數(shù)據(jù)搜集、下載數(shù)據(jù)、整理并分析數(shù)據(jù)”這一流程,影響了研究工作的效率與產(chǎn)出。并且,當(dāng)?shù)卣鸬韧话l(fā)事件發(fā)生時(shí),這種處理數(shù)據(jù)的流程由于計(jì)算速度慢,會(huì)嚴(yán)重影響到相關(guān)部門的決策。
根據(jù)目前水利信息的共享形式,要實(shí)現(xiàn)主題式數(shù)據(jù)共享的環(huán)境構(gòu)建,同時(shí)在數(shù)據(jù)的服務(wù)基礎(chǔ)上,實(shí)現(xiàn)多數(shù)據(jù)源的綜合集成與在線的可視化處理,為地理信息化研究環(huán)境的構(gòu)建打下基礎(chǔ)[10]。為此提出面向研究的主題,開(kāi)展分布式的建設(shè)與開(kāi)發(fā)的流程。對(duì)于相同的主題內(nèi)容,對(duì)多源水利信息使用虛擬整合與同步分析的研究方法,構(gòu)建由數(shù)據(jù)到知識(shí)的分析方法,以達(dá)到高速的知識(shí)獲取與可視化的表達(dá)。意義在于經(jīng)過(guò)研究主題式共享服務(wù)的方式,實(shí)現(xiàn)數(shù)據(jù)共享到服務(wù)共享的轉(zhuǎn)化,在服務(wù)共享的方式中,對(duì)多源服務(wù)的集成方法進(jìn)行研究。通過(guò)實(shí)時(shí)虛擬集成多源服務(wù),在線同步數(shù)據(jù)分析和可視化表達(dá)得以實(shí)現(xiàn),從而實(shí)現(xiàn)快速生成數(shù)據(jù)和信息的需求,提高研究和相關(guān)部門決策的效率。
自從面向服務(wù)的體系出現(xiàn),特別是 2008年SOA(面向服務(wù)的體系結(jié)構(gòu))變成了軟件工程主流方法,推動(dòng)了 GIS 技術(shù)的革命與創(chuàng)新,成為了多源數(shù)據(jù)融合到知識(shí)的便利工具,同時(shí)也使資源共享的方式發(fā)生了轉(zhuǎn)變[11-12]。在服務(wù)共享的模式中,能夠輕松地開(kāi)展對(duì)多源服務(wù)的集成處理與同步分析,例如,可以直接從互聯(lián)網(wǎng)上得到 Google Map 服務(wù),ESRI 和 Virtual Earth 的全球影像的服務(wù),還有天氣預(yù)報(bào)等 Web 服務(wù)?,F(xiàn)在僅僅通過(guò)服務(wù)地址,便能方便地將這類服務(wù)集成進(jìn)各類應(yīng)用中??梢韵胂?,以后資源都會(huì)通過(guò)服務(wù)的方式發(fā)布,從而構(gòu)建起服務(wù)共享的方式。而水資源評(píng)價(jià)和規(guī)劃中涉及大量的空間信息,如行政區(qū)劃、河流水系、地形地貌、水利工程分布、水文站控制斷面位置,以及人口、實(shí)測(cè)水文數(shù)據(jù)等屬性數(shù)據(jù),GIS 可以支持這些具有明顯的時(shí)維性數(shù)據(jù)的獲取、管理、分析、模擬及顯示。這些技術(shù)和軟件大大促進(jìn)了水利信息的共享和表達(dá),推動(dòng)了水利工程向數(shù)字化、可視化和智能化方向的發(fā)展。
1.1空間數(shù)據(jù)服務(wù)的發(fā)布與訪問(wèn)
空間地圖和影像數(shù)據(jù)共同構(gòu)成了空間數(shù)據(jù),當(dāng)今多數(shù)的 GIS 軟件,例如:Super-Map iServer 和ArcGIS Server 等商業(yè)軟件,以及開(kāi)源軟件 World Wide,都能提供地圖與影像數(shù)據(jù)的服務(wù)與發(fā)布方法。Google,ESRI,Microsoft 等公司還有免費(fèi)的全球影像與地圖服務(wù)。因此可以輕松地使地圖服務(wù)與全球影像服務(wù)集成,同時(shí)對(duì)其進(jìn)行聯(lián)合操作。
1.2屬性數(shù)據(jù)服務(wù)的發(fā)布與訪問(wèn)
Web 技術(shù)中對(duì)于屬性數(shù)據(jù)服務(wù)的發(fā)布方案多種多樣,運(yùn)用 WSDL(Web 服務(wù)描述語(yǔ)言)技術(shù)發(fā)布服務(wù)是時(shí)下比較流行的方式,是采用一種動(dòng)態(tài)的腳本語(yǔ)言開(kāi)發(fā)動(dòng)態(tài)的網(wǎng)站。WSDL 是一種 XML 格式的文檔,被用來(lái)描述 Web 服務(wù)的公共接口。使用WSDL 定義一個(gè)通用的接口,就可以直接訪問(wèn)并獲取到數(shù)據(jù)庫(kù)里的屬性數(shù)據(jù)。
2.1多源數(shù)據(jù)集成的類型
多源數(shù)據(jù)集成包括以下 3 種集成類型:
1)多源空間數(shù)據(jù)集成。多源空間數(shù)據(jù)的集成,關(guān)鍵在于空間地理坐標(biāo)和投影是否統(tǒng)一。只要加載的多源服務(wù)有統(tǒng)一的空間地理坐標(biāo)和投影,那么,空間數(shù)據(jù)的集成是系統(tǒng)自動(dòng)實(shí)現(xiàn)的。
2)多源屬性數(shù)據(jù)集成。多源屬性數(shù)據(jù)的集成,實(shí)現(xiàn)的基礎(chǔ)是確定多個(gè)屬性表之間的關(guān)聯(lián)字段。每個(gè)可能關(guān)聯(lián)的表必須至少有 1 個(gè)相關(guān)聯(lián)的字段,這要求每個(gè)由服務(wù)形式被發(fā)布的屬性表必須對(duì)應(yīng) 1 個(gè)元數(shù)據(jù)信息的服務(wù),不然用戶將不能調(diào)用。在實(shí)際操作過(guò)程中,首先要使用關(guān)鍵字,以便用戶能夠檢索出可能需要的屬性數(shù)據(jù)服務(wù)的列表,然后再通過(guò)元數(shù)據(jù)信息服務(wù),幫助用戶選擇查詢屬性表和字段,同時(shí)運(yùn)用交互的方式使用戶確定列表之間相互關(guān)聯(lián)的字段。經(jīng)過(guò)設(shè)定后,就可以進(jìn)行多源屬性數(shù)據(jù)的集成。在集成的過(guò)程中,通過(guò)對(duì)訪問(wèn)接口時(shí)所需的數(shù)據(jù)信息加以整合,得到 1 個(gè)新的數(shù)據(jù)表,所以這種方式并沒(méi)有改變數(shù)據(jù)庫(kù)原本的結(jié)構(gòu)。
3)多源空間數(shù)據(jù)與屬性數(shù)據(jù)的集成。多源空間數(shù)據(jù)與屬性數(shù)據(jù)的整合需通過(guò)較復(fù)雜的操作,應(yīng)當(dāng)是虛擬整合之后的空間數(shù)據(jù)與屬性數(shù)據(jù)的集成。首先,確定被整合的數(shù)據(jù)屬性的關(guān)聯(lián)字段;其次,選擇需要的空間圖層進(jìn)行綁定;最后,根據(jù)綁定的圖層確定圖層的關(guān)聯(lián)字段。將整合的數(shù)據(jù)和圖層數(shù)據(jù)集關(guān)聯(lián)后,就可對(duì)屬性數(shù)據(jù)進(jìn)行空間化與可視化了。
當(dāng)今,對(duì)于單純的空間與屬性數(shù)據(jù)而言,有很多的服務(wù)發(fā)布案例,但對(duì)于屬性服務(wù)和地圖服務(wù)的共享集成與應(yīng)用的研究卻比較少,這成為阻礙從數(shù)據(jù)到知識(shí)轉(zhuǎn)化效率的原因之一。
2.2多源異構(gòu)數(shù)據(jù)服務(wù)的發(fā)布和集成
知識(shí)圖平臺(tái)是一種綜合集成平臺(tái),構(gòu)建時(shí)包括對(duì)知識(shí)的識(shí)別、組織、分級(jí)、關(guān)聯(lián)和展現(xiàn),同時(shí)在知識(shí)圖構(gòu)建的動(dòng)態(tài)過(guò)程中會(huì)不斷產(chǎn)生新的知識(shí)來(lái)更新原本的知識(shí)圖。知識(shí)圖最大的優(yōu)點(diǎn)是能夠很好地把用戶的隱性知識(shí)顯性化地表達(dá)出來(lái),只需明確用戶的主題就可以繪制出面向特定服務(wù)的知識(shí)圖[13]。
中間件是一種獨(dú)立的系統(tǒng)軟件或服務(wù)程序的接口,作用在于能提供數(shù)據(jù)庫(kù)與應(yīng)用程序的連通性,使得在開(kāi)發(fā)應(yīng)用的過(guò)程中不受來(lái)自操作系統(tǒng)、通信協(xié)議的影響。因?yàn)橹虚g件具備標(biāo)準(zhǔn)的接口與協(xié)議,所以能夠在不同的平臺(tái)上開(kāi)展數(shù)據(jù)操作和共享。按照所完成功能的不同,中間件可分為數(shù)據(jù)可訪問(wèn)、基于消息、交易及面向?qū)ο蟮闹虚g件等 4 類。
多源水利信息的主題可視化由綜合集成平臺(tái)與數(shù)據(jù)集成中間件聯(lián)合完成。中間件可以針對(duì)多元數(shù)據(jù)進(jìn)行綜合、篩選和加工,綜合集成平臺(tái)能夠針對(duì)需求進(jìn)行主題式定制應(yīng)用組件。通過(guò)定制的組件控制數(shù)據(jù)集成中間件,可達(dá)到主體化的信息服務(wù),提高信息獲取的效率,加深數(shù)據(jù)的挖掘。
2.3主題式的多源數(shù)據(jù)虛擬整合與可視化分析
水利行業(yè)中涉及大量的空間信息,如行政區(qū)劃、河流水系、地形地貌、水利工程的分布、水文站控制斷面的位置、人口、實(shí)測(cè)水文數(shù)據(jù)等屬性數(shù)據(jù),GIS 可以支持這些具有明顯的時(shí)維性數(shù)據(jù)的獲取、管理、分析、模擬及顯示,這些特點(diǎn)都很適合進(jìn)行信息的可視化展現(xiàn),技術(shù)路線圖如圖 1 所示。
圖1 技術(shù)路線圖
這樣,基于綜合集成平臺(tái)和數(shù)據(jù)集成中間件對(duì)信息定向加工后,通過(guò) GIS 平臺(tái)便可實(shí)現(xiàn)對(duì)所需信息的展現(xiàn),數(shù)據(jù)發(fā)布方案如圖 2 所示。
圖2 數(shù)據(jù)發(fā)布方案
2.4多源數(shù)據(jù)集成和虛擬整合的應(yīng)用實(shí)例
本實(shí)例來(lái)自于新疆哈密建設(shè)兵團(tuán)十三師水務(wù)局綜合集成水務(wù)平臺(tái),按照分析的技術(shù)流程,采用World Wind 作為地圖服務(wù)發(fā)布引擎,結(jié)合數(shù)據(jù)集成中間件,開(kāi)發(fā)了基于綜合集成平臺(tái)的水利多源數(shù)據(jù)集成系統(tǒng)。該系統(tǒng)能夠集成互聯(lián)網(wǎng)上已經(jīng)發(fā)布的地圖和影像服務(wù)。
應(yīng)用時(shí),首先打開(kāi)綜合集成平臺(tái),繪制服務(wù)所需的知識(shí)圖,應(yīng)用界面如圖 3 所示;根據(jù)需要在各節(jié)點(diǎn)進(jìn)行設(shè)置,包括通過(guò)中間件對(duì)多源數(shù)據(jù)源的添加,達(dá)到多源數(shù)據(jù)的融合,如圖 4 所示;根據(jù)服務(wù)添加定制的組件,實(shí)現(xiàn)對(duì)數(shù)據(jù)的定向加工,如圖 5所示;在設(shè)置好前面節(jié)點(diǎn)后,點(diǎn)擊展示,進(jìn)行在數(shù)字地球平臺(tái)上的可視化展示,如圖 6 所示。
圖3 水利信息主題可視化應(yīng)用界面
圖4 添加數(shù)據(jù)源
圖5 選擇定制組件
圖6 GIS展示
從實(shí)例可以看出,在綜合集成平臺(tái)下,針對(duì)服務(wù)進(jìn)行主題式的組件定制,可通過(guò)控制數(shù)據(jù)集成中間件獲取數(shù)據(jù),最后通過(guò) GIS 展示信息??梢葬槍?duì)不同的業(yè)務(wù)繪制不同的知識(shí)圖,添加不同的組件,實(shí)現(xiàn)面向不同的服務(wù)。在獲取信息的同時(shí)對(duì)數(shù)據(jù)進(jìn)行符合業(yè)務(wù)需求的定向加工,大大提高了信息集成的效率,加強(qiáng)了應(yīng)用的實(shí)用性,使得有關(guān)人員對(duì)信息的需求進(jìn)一步得到滿足。信息處理后的結(jié)果被很好地展示的同時(shí),業(yè)務(wù)的邏輯流程也能夠通過(guò)知識(shí)圖被展示。
選擇水利行業(yè)的數(shù)據(jù),通過(guò)使用主題式的面向服務(wù)技術(shù)處理多源數(shù)據(jù)集成的問(wèn)題,同時(shí)實(shí)現(xiàn)將整合后的數(shù)據(jù)集成分析與可視化,達(dá)到對(duì)數(shù)據(jù)搜集、整合、分析的目的。結(jié)果顯示,數(shù)據(jù)的分散異構(gòu)問(wèn)題在主題式的多源數(shù)據(jù)集成研究方法下得到了很好的解決。不僅優(yōu)化了“搜集數(shù)據(jù),下載數(shù)據(jù),整理分析數(shù)據(jù)”的傳統(tǒng)研究流程,而且相較于傳統(tǒng)的數(shù)據(jù)共享模式有著顯著的優(yōu)勢(shì)。由于面向服務(wù)的組織架構(gòu)具有相對(duì)開(kāi)放的數(shù)據(jù)接口及統(tǒng)一的發(fā)布規(guī)范,所以能夠方便多源數(shù)據(jù)的集成、直接的在線分析和數(shù)據(jù)的可視化。由此可見(jiàn),基于主題的服務(wù)共享模式,會(huì)成為未來(lái)數(shù)據(jù)共享模式的發(fā)展方向。在開(kāi)發(fā)基于服務(wù)架構(gòu)的應(yīng)用時(shí),首先應(yīng)當(dāng)對(duì)具有相同主題的數(shù)據(jù)進(jìn)行服務(wù)發(fā)布和集成應(yīng)用,然后按照主題的分布開(kāi)展工作,在進(jìn)行服務(wù)的同時(shí)構(gòu)建相應(yīng)的主題應(yīng)用。
通過(guò)系統(tǒng)應(yīng)用的開(kāi)發(fā),可以得到以下結(jié)論:
1)每一個(gè)數(shù)據(jù)服務(wù)的應(yīng)用、元數(shù)據(jù)信息都必須有一定的規(guī)范且要填寫完整。如果元數(shù)據(jù)信息不夠詳細(xì),在數(shù)據(jù)源相對(duì)復(fù)雜時(shí),會(huì)嚴(yán)重影響數(shù)據(jù)集成的工作效率。
2)從面向服務(wù)的多源數(shù)據(jù)集成應(yīng)用來(lái)看,雖然在技術(shù)上都已解決,但是操作過(guò)程較為復(fù)雜,對(duì)于沒(méi)有經(jīng)過(guò)專門培訓(xùn)的人員,使用時(shí)存在一定的困難。因此主題式的多源數(shù)據(jù)集成是一項(xiàng)長(zhǎng)期的研究工作,廣泛的應(yīng)用不但需要技術(shù)的支撐,更需要友好和智能的操作界面。
參考文獻(xiàn):
[1] 孫吉紅,焦玉英. 知識(shí)發(fā)現(xiàn)及其發(fā)展趨勢(shì)研究[J]. 情報(bào)理論與實(shí)踐,2006,29 (5): 528-531.
[2] 龐景安. Web 知識(shí)發(fā)現(xiàn)的理論研究及其應(yīng)用[J]. 情報(bào)雜志,2008 (1): 65-67.
[3] 諸云強(qiáng),孫九林,廖順寶,等. 地球系統(tǒng)科學(xué)數(shù)據(jù)共享研究與實(shí)踐[J]. 地球信息科學(xué)學(xué)報(bào),2010,12 (1): 1-8.
[4] 賈文玨,張子平,吳洪橋. 國(guó)土資源數(shù)據(jù)共享技術(shù)構(gòu)架與應(yīng)用模式研究[J]. 地理信息世界,2010 (1): 43-47.
[5] ZHA Zongxiang,JIA Wenjue. Design and Implementation of Information Sharing Platform of Land and Resources[C]// The International Archives of the Photogrammetry,Remote Sensing and Spatial Information Sciences. Beijing,2008: 1047-1049.
[6] Frehner M,Brandli M. Virtual Database: Spatial Analysis in a Web-based Data Management System for Distributed Ecological Data[J].Environmental Modeling&Software,2006,21 (11): 1544-1554.
[7] Scholl T,Bauer B,Gufler B,et al. Scalable Community Driven Data Sharing in E-science Grids[J]. Future Generation Computer Systems,2009,25 (3): 290-300.
[8] Piwowa HA,Chapman WW. Public Sharing of Research Data sets: A Pilot Study of Associations[J]. Journal of Informetrics,2010,4 (2): 148-156.
[9] Comito C,Gounaris A,Sakellariou R,et al. A Service-oriented System for Distributed Data Queryingand Integration on Grids[J]. Future Generation Computer Systems,2009,25 (5): 511-524.
[10] 諸云強(qiáng),孫九林. 面向 e-GeoSeienee 的地學(xué)數(shù)據(jù)共享研究進(jìn)展[J]. 地球科學(xué)進(jìn)展,2006,21 (3): 286-290.
[11] 曾洋,張艷梅. 面向服務(wù)的體系結(jié)構(gòu)[J]. 軟件導(dǎo)刊,2008,7 (4): 77-78.
[12] 羅春. 地理信息系統(tǒng)發(fā)展的新趨勢(shì):面向服務(wù)的體系結(jié)構(gòu)[J]. 地理信息世界,2006 (5): 67-69.
[13] 解建倉(cāng),羅軍剛. 水利信息化綜合集成服務(wù)平臺(tái)及應(yīng)用模式[J]. 水利信息化,2010 (5): 18-21.
Theme Visualization Application of Multi-Source Water Information under Integration Platform
LI Yang,LIU Jun,XU Baiyang,QI Yuhan,LI Chenyu
(Xi' an University of Technology,Xi' an 710048,China)
Abstract:Aiming at impacting studies efficiency and that data do not meet the needs of information and knowledge for researchers in the process of data integration for traditional research process (data collecting,downloading,organizing and analyzing),the article proposes methods of real-time screening synthesis and processing,analysis and visualization of themed multi-source information. Based on comprehensive integration platform,with water industry topics and spatial data as an example,combining with digital earth technology,using the idea of online thematic applications,it discusses service-oriented multi-source water conservancy information integration,in order to achieve the acquisition of subject-type information knowledge. It accesses information and carries on the processing in view of needs of the business also. Improving the efficiency of data integration and strengthening the applicability of application at the same time,it does the visualization of logical process and application results according to the characteristic of water conservancy information simultaneously.
Key words:comprehensive integration platform;multi-source data integration;water information;theme style;visualization;service-oriented;GIS
中圖分類號(hào):TV39
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1674-9405(2016)03-0001-05
DOI:10.19364/j.1674-9405.2016.03.001
收稿日期:2015-11-15
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(51479160);陜西省科技攻關(guān)項(xiàng)目(2012-16)
作者簡(jiǎn)介:李 楊(1988-),男,山西忻州人,博士研究生,主要研究方向?yàn)?GIS、水利信息化。