福建省基礎(chǔ)地理信息中心 吳飛
應(yīng)急地理信息數(shù)據(jù)共享關(guān)鍵技術(shù)研究*
福建省基礎(chǔ)地理信息中心 吳飛
異構(gòu)數(shù)據(jù)的共享是應(yīng)急地理信息服務(wù)平臺(tái)需要重點(diǎn)解決的關(guān)鍵技術(shù)之一。該文從共享模式、集成技術(shù)、數(shù)據(jù)組織等三個(gè)方面對(duì)應(yīng)急地理信息數(shù)據(jù)共享進(jìn)行研究探討,選擇了基于Web服務(wù)的數(shù)據(jù)共享模式、虛擬數(shù)據(jù)庫(kù)法的集成技術(shù),并結(jié)合地理空間數(shù)據(jù)的結(jié)構(gòu)特征和使用特點(diǎn)設(shè)計(jì)了數(shù)據(jù)組織方式,最后結(jié)合地震應(yīng)急案例,建設(shè)了用于地震應(yīng)急的輔助決策綜合庫(kù),可為地震應(yīng)急指揮提供輔助決策支持。
異構(gòu)數(shù)據(jù) 共享模式 數(shù)據(jù)集成技術(shù) 應(yīng)急地理信息服務(wù)
開(kāi)展省級(jí)應(yīng)急平臺(tái)的技術(shù)研究是當(dāng)前國(guó)家應(yīng)急指揮系統(tǒng)建設(shè)重要而迫切的任務(wù)之一。在應(yīng)急信息管理和分析的過(guò)程中,應(yīng)急地理信息服務(wù)平臺(tái)起到基礎(chǔ)作用,它與應(yīng)急平臺(tái)中其它系統(tǒng)密切相關(guān),并融合于聯(lián)動(dòng)處理的各個(gè)環(huán)節(jié),隨時(shí)為應(yīng)急指揮提供空間基礎(chǔ)地理信息服務(wù),因此應(yīng)急地理信息服務(wù)平臺(tái)的設(shè)計(jì)顯得尤為重要[1]。由于應(yīng)急處理往往需要多個(gè)部門(mén)聯(lián)合參與,不同部門(mén)間的空間數(shù)據(jù)往往建立在不同時(shí)期、不同系統(tǒng)、適用于不同部門(mén),會(huì)存在較大的差異,這也是通常所說(shuō)的數(shù)據(jù)異構(gòu)性,如何高效解決異構(gòu)數(shù)據(jù)共享的難題,是應(yīng)急地理信息服務(wù)平臺(tái)實(shí)現(xiàn)數(shù)據(jù)之間共享的難點(diǎn)。
要解決異構(gòu)數(shù)據(jù)共享,需要重點(diǎn)解決三個(gè)關(guān)鍵問(wèn)題[2]:第一,如何進(jìn)行數(shù)據(jù)的共享,數(shù)據(jù)的共享模式是什么?第二,面對(duì)來(lái)源眾多、格式不一的異構(gòu)空間數(shù)據(jù),如何對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換和集成?第三,如何異構(gòu)數(shù)據(jù)進(jìn)行組織,設(shè)計(jì)出合理的存儲(chǔ)邏輯結(jié)構(gòu)?基于此,本文從以下幾個(gè)方面進(jìn)行研究和設(shè)計(jì)。
2.1 數(shù)據(jù)共享模式設(shè)計(jì)
目前,解決異構(gòu)地理信息系統(tǒng)數(shù)據(jù)共享的常用方法有三種[3]:
(1)統(tǒng)一軟件平臺(tái)的方式:應(yīng)用部門(mén)與基礎(chǔ)地理信息提供部門(mén)使用相同的GIS平臺(tái)或數(shù)據(jù)管理軟件。這種方式要求不同部門(mén)之間在軟件配置層面絕對(duì)統(tǒng)一,既不經(jīng)濟(jì)也不現(xiàn)實(shí),可操作性極低,在實(shí)際中幾乎不能實(shí)現(xiàn)。
(2)共享底圖數(shù)據(jù)的方式:地理空間數(shù)據(jù)配置成地圖后,通過(guò)工具軟件按照一定的網(wǎng)格切分生成多級(jí)圖片,并采用金字塔結(jié)構(gòu)存儲(chǔ)在服務(wù)器上,通過(guò)Web服務(wù)向客戶(hù)端發(fā)布。這種方式實(shí)現(xiàn)了簡(jiǎn)單的底圖服務(wù)的輸出,但不能有效滿(mǎn)足異構(gòu)數(shù)據(jù)真正的共享要求。
(3)基于Web服務(wù)的方式:采用基于Web服務(wù)的地理信息共享技術(shù),以SOAP(簡(jiǎn)單對(duì)象訪(fǎng)問(wèn)協(xié)議)的形式封裝服務(wù)器端與客戶(hù)端之間的服務(wù)請(qǐng)求和數(shù)據(jù)結(jié)果,以HTTP的形式實(shí)現(xiàn)基于網(wǎng)絡(luò)的傳輸,實(shí)現(xiàn)異構(gòu)GIS的互操作以及異構(gòu)數(shù)據(jù)的共享。
本平臺(tái)采用第三種共享方式,開(kāi)發(fā)包括地理信息服務(wù)描述、發(fā)布和調(diào)用的接口,與省級(jí)地理信息公共平臺(tái)對(duì)接,實(shí)現(xiàn)跨地區(qū)和跨部門(mén)的地理信息資源的松耦集成與動(dòng)態(tài)裝配,提供分布式地理信息共享與應(yīng)用開(kāi)發(fā)環(huán)境。根據(jù)平臺(tái)的建設(shè)目標(biāo),在數(shù)據(jù)共享層面依據(jù)統(tǒng)一技術(shù)規(guī)范構(gòu)建一體化的應(yīng)急地理空間信息資源體系,按照數(shù)據(jù)中心模式和分布式遠(yuǎn)程調(diào)用模式建設(shè)應(yīng)急資源數(shù)據(jù)中心。
2.1.1 分布式遠(yuǎn)程調(diào)用模式
該模式邏輯上分為數(shù)據(jù)層、服務(wù)層和表示層三層架構(gòu),見(jiàn)圖1。其中,數(shù)據(jù)層主要是為業(yè)務(wù)服務(wù)層提供數(shù)據(jù),不同部門(mén)的空間數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化改造并各自發(fā)布為符合標(biāo)準(zhǔn)的地理信息網(wǎng)絡(luò)服務(wù)。在服務(wù)層通過(guò)集成和使用發(fā)布在不同服務(wù)器上的地理信息Web服務(wù),實(shí)現(xiàn)分布式的WebGIS邏輯,服務(wù)層是客戶(hù)端和數(shù)據(jù)層的橋梁,負(fù)責(zé)接收客戶(hù)端請(qǐng)求,進(jìn)行邏輯處理,調(diào)取相應(yīng)的數(shù)據(jù),并將處理結(jié)果返回給客戶(hù)端。表示層一般是瀏覽器或者是基于其他客戶(hù)端的應(yīng)用程序??蛻?hù)請(qǐng)求通過(guò)表示層提交給Web服務(wù)器和應(yīng)用服務(wù)器,由Web服務(wù)器和應(yīng)用服務(wù)器調(diào)用相關(guān)服務(wù),將結(jié)果返回給客戶(hù)。
圖1 分布式遠(yuǎn)程調(diào)用模式
2.1.2 數(shù)據(jù)中心模式
基于數(shù)據(jù)中心的共享模式也分為數(shù)據(jù)層、服務(wù)層和表示層三層架構(gòu),見(jiàn)圖2。在表示層和服務(wù)層,與分布式遠(yuǎn)程調(diào)用模式類(lèi)似,數(shù)據(jù)層則采用數(shù)據(jù)中心模式,將各個(gè)部門(mén)的異構(gòu)空間數(shù)據(jù)通過(guò)空間數(shù)據(jù)交換工具抽取到數(shù)據(jù)中心。在中心數(shù)據(jù)庫(kù)基礎(chǔ)上,統(tǒng)一發(fā)布地理信息網(wǎng)絡(luò)服務(wù),集中供其他部門(mén)共享。這種模式實(shí)現(xiàn)地理信息數(shù)據(jù)統(tǒng)一管理,統(tǒng)一發(fā)布,能夠有效減少數(shù)據(jù)冗余,實(shí)現(xiàn)部門(mén)間信息互通。
圖2 數(shù)據(jù)中心模式
在本平臺(tái)中,對(duì)于實(shí)時(shí)動(dòng)態(tài)變化的數(shù)據(jù)采用遠(yuǎn)程調(diào)用模式,如氣象預(yù)報(bào)與實(shí)時(shí)交通等;對(duì)于變化頻率慢、相對(duì)比較固定的數(shù)據(jù),采用共享、匯交、交換等方式集中到統(tǒng)一的應(yīng)急數(shù)據(jù)庫(kù)中,二者形成統(tǒng)一的應(yīng)急地理信息數(shù)據(jù)資源池。
2.2 數(shù)據(jù)集成設(shè)計(jì)
目前,關(guān)于數(shù)據(jù)集成方案的研究很多,各不相同,但就其基本方法來(lái)說(shuō),大體上可歸為如下三類(lèi):
聯(lián)邦數(shù)據(jù)庫(kù)法[4]是異構(gòu)數(shù)據(jù)集成中最簡(jiǎn)單的一種方式。它的構(gòu)成方法是將所有數(shù)據(jù)源通過(guò)數(shù)據(jù)交互接口進(jìn)行一對(duì)一的連接。各個(gè)數(shù)據(jù)源之間使用數(shù)據(jù)交互接口互相訪(fǎng)問(wèn),通過(guò)這種方法,一個(gè)數(shù)據(jù)源就能夠訪(fǎng)問(wèn)任何其它數(shù)據(jù)源的數(shù)據(jù)。數(shù)據(jù)交互接口太多是聯(lián)邦數(shù)據(jù)庫(kù)法的弱點(diǎn),如果有n個(gè)異構(gòu)數(shù)據(jù)源,那么就需要n(n-1)個(gè)數(shù)據(jù)交互接口。一般來(lái)說(shuō)這種方法實(shí)際中很少使用。
數(shù)據(jù)倉(cāng)庫(kù)法[5]是一種異構(gòu)數(shù)據(jù)集成方式。它將來(lái)自幾個(gè)異構(gòu)數(shù)據(jù)源的數(shù)據(jù)抽取出來(lái),按照全局模式的要求存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中。用戶(hù)使用時(shí),就像使用一個(gè)本地?cái)?shù)據(jù)庫(kù)一樣。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)不能得到實(shí)時(shí)地更新是該方法的弱點(diǎn)。這就有可能導(dǎo)致某一時(shí)段,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)與異構(gòu)數(shù)據(jù)源的數(shù)據(jù)不一致。
虛擬數(shù)據(jù)庫(kù)法[6]是一種重要的數(shù)據(jù)集成方式。它與數(shù)據(jù)倉(cāng)庫(kù)法不一樣,能夠?qū)崟r(shí)反映異構(gòu)數(shù)據(jù)源中所更新的數(shù)據(jù)。在虛擬數(shù)據(jù)庫(kù)法中,用戶(hù)查詢(xún)將分解成對(duì)各個(gè)異構(gòu)數(shù)據(jù)源的子查詢(xún)。所有子查詢(xún)的結(jié)果在它們的局部模式被映射成全局模式后集成在一起,并以虛擬視圖的方式呈現(xiàn)在用戶(hù)面前。這樣,系統(tǒng)無(wú)須保存數(shù)據(jù)源的數(shù)據(jù),并能保證查詢(xún)的數(shù)據(jù)是實(shí)時(shí)的。
目前應(yīng)用較多的是數(shù)據(jù)倉(cāng)庫(kù)法和虛擬數(shù)據(jù)庫(kù)法,前者采用的技術(shù)更多涉及到查詢(xún)上的代數(shù)操作;后者采用的技術(shù)大部分集中在查詢(xún)計(jì)算以及與存儲(chǔ)有關(guān)的問(wèn)題上(如數(shù)據(jù)的聚類(lèi)、索引等)。根據(jù)對(duì)以上兩種集成方案的分析,綜合考慮數(shù)據(jù)倉(cāng)庫(kù)和虛擬法方式的優(yōu)缺點(diǎn)[7],結(jié)合目前狀況和需求,本文采用虛擬數(shù)據(jù)庫(kù)法進(jìn)行。該方法安全性好,靈活度高,性能穩(wěn)定,對(duì)系統(tǒng)資源的要求也更低,能夠從根本上解決其他兩種方式在實(shí)際應(yīng)用中的不足,有較高的實(shí)用價(jià)值。
該方法實(shí)現(xiàn)的技術(shù)路線(xiàn)如圖3所示,包括三層架構(gòu):用戶(hù)信息抽取層、中介層和應(yīng)用層。信息抽取層包括各異構(gòu)數(shù)據(jù)源;中介層包括查詢(xún)引擎、數(shù)據(jù)清洗、中間數(shù)據(jù)庫(kù)和XML文檔;用戶(hù)層主要是用戶(hù)提出查詢(xún)。這樣,通過(guò)中介層以XML的中間格式將匯集分布在各個(gè)異構(gòu)信息抽取層的信息進(jìn)行清洗、轉(zhuǎn)換和加載;用戶(hù)通過(guò)網(wǎng)絡(luò)連接到系統(tǒng)中,即進(jìn)行查詢(xún)操作。
圖3 虛擬數(shù)據(jù)庫(kù)法
2.3 數(shù)據(jù)組織設(shè)計(jì)
遵照國(guó)家和地方應(yīng)急地理信息系統(tǒng)建設(shè)的相關(guān)標(biāo)準(zhǔn)規(guī)范,本文結(jié)合福建省實(shí)際,建立全省應(yīng)急基礎(chǔ)空間數(shù)據(jù)庫(kù),數(shù)據(jù)內(nèi)容包括基礎(chǔ)地理信息數(shù)據(jù)和應(yīng)急專(zhuān)題信息數(shù)據(jù),其中,基礎(chǔ)地理信息數(shù)據(jù)包括電子地圖、實(shí)體數(shù)據(jù)、地名數(shù)據(jù)等;應(yīng)急專(zhuān)題數(shù)據(jù)根據(jù)應(yīng)急實(shí)際需求,集成加油站、學(xué)校、公安、消防、醫(yī)院等專(zhuān)題數(shù)據(jù),并分類(lèi)整理出重點(diǎn)防護(hù)目標(biāo)、危險(xiǎn)源、公眾聚集場(chǎng)所、救援資源等專(zhuān)題數(shù)據(jù)。除此之外,平臺(tái)還應(yīng)包括國(guó)民經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)、文本、影像、多媒體、專(zhuān)業(yè)圖形等非空間的輔助決策類(lèi)的數(shù)據(jù)。
根據(jù)地理空間數(shù)據(jù)的結(jié)構(gòu)特征和使用特點(diǎn),在數(shù)據(jù)組織上采用如下方法[1]:
(1)基礎(chǔ)地理信息數(shù)據(jù)以及與空間相關(guān)的應(yīng)急專(zhuān)題數(shù)據(jù),統(tǒng)一采用大型關(guān)系數(shù)據(jù)庫(kù)(如Oracle、Sqlserver等)存儲(chǔ)。采用政府部門(mén)應(yīng)用的數(shù)據(jù)模型,實(shí)現(xiàn)多尺度海量空間數(shù)據(jù)和多類(lèi)型關(guān)聯(lián)數(shù)據(jù)的管理。在此基礎(chǔ)上,以現(xiàn)有基礎(chǔ)地理信息數(shù)據(jù)為基礎(chǔ),對(duì)應(yīng)急專(zhuān)題數(shù)據(jù)進(jìn)行實(shí)體化、分層細(xì)化、簡(jiǎn)潔化等處理,設(shè)計(jì)和加工制作出能滿(mǎn)足應(yīng)急指揮用戶(hù)基本需求的多尺度地理信息數(shù)據(jù)[8]。
(2)非空間數(shù)據(jù)庫(kù)具有全局性、綜合性、實(shí)時(shí)性等特點(diǎn),因此宜采用非關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ),這些存儲(chǔ)在不同數(shù)據(jù)庫(kù)中不同類(lèi)型的數(shù)據(jù)存在時(shí)態(tài)差異、不同的數(shù)據(jù)編碼體系、不同的地圖投影,以及不同的空間抽象程度,因此需要對(duì)這些數(shù)據(jù)進(jìn)行協(xié)調(diào)處理與集成,通過(guò)地理編碼建立索引,使其與空間數(shù)據(jù)在一定程度上相關(guān)接。
(3)采用分布與集中相結(jié)合的數(shù)據(jù)存儲(chǔ)方式,在每層數(shù)據(jù)庫(kù)服務(wù)器中存放本地?cái)?shù)據(jù),同時(shí)將本地區(qū)的數(shù)據(jù)上傳到上級(jí)單位。這種存儲(chǔ)方式可以體現(xiàn)專(zhuān)業(yè)部門(mén)的自主性,減少網(wǎng)絡(luò)流量,提高系統(tǒng)響應(yīng)能力,同時(shí)由于數(shù)據(jù)冗余存儲(chǔ)保證數(shù)據(jù)的安全性。
目前,福建省地震局正在構(gòu)建基于“地震預(yù)警與烈度速報(bào)產(chǎn)出結(jié)果系統(tǒng)”的地震輔助決策管理體系,按計(jì)劃需要建成“一庫(kù)一服務(wù)兩系統(tǒng)”,其中“一庫(kù)”指的是建設(shè)一個(gè)用于地震應(yīng)急的輔助決策綜合庫(kù),包含基礎(chǔ)地理信息數(shù)據(jù)、輔助決策數(shù)據(jù)等以及包含預(yù)警與烈度速報(bào)產(chǎn)出庫(kù)、災(zāi)情上報(bào)庫(kù)、震災(zāi)預(yù)測(cè)庫(kù)在內(nèi)的地震應(yīng)急專(zhuān)題數(shù)據(jù)以及輔助決策數(shù)據(jù)等??紤]到地震應(yīng)急是全省應(yīng)急平臺(tái)重要的組成部分,因此在數(shù)據(jù)設(shè)計(jì)時(shí)應(yīng)盡量考慮到異構(gòu)數(shù)據(jù)共享以及與應(yīng)急地理信息服務(wù)平臺(tái)實(shí)現(xiàn)對(duì)接。具體建設(shè)內(nèi)容見(jiàn)圖4。其中地震輔助決策庫(kù)包含交通數(shù)據(jù)、重大生命線(xiàn)工程數(shù)據(jù)、應(yīng)急人員及水庫(kù)水系等數(shù)據(jù),預(yù)警與烈度速報(bào)產(chǎn)出庫(kù)包含地震三要素、預(yù)警信息、儀器烈度、PGA/PGV/PGD、反應(yīng)譜0.3/1.0/3.0等數(shù)據(jù),災(zāi)情上報(bào)庫(kù)來(lái)自輔助決策移動(dòng)終端采集的數(shù)據(jù),包含照片、短片及災(zāi)情簡(jiǎn)要描述等數(shù)據(jù),震災(zāi)預(yù)測(cè)庫(kù)包含由損失快速評(píng)估服務(wù)計(jì)算得出的人員傷亡、房屋倒毀、經(jīng)濟(jì)損失等數(shù)據(jù)。
圖4 地震應(yīng)急數(shù)據(jù)內(nèi)容
按照上文的設(shè)計(jì)思路,這些數(shù)據(jù)中,應(yīng)急公共數(shù)據(jù)應(yīng)以數(shù)據(jù)中心模式由應(yīng)急地理信息平臺(tái)集中存儲(chǔ)管理和發(fā)布服務(wù),這些數(shù)據(jù)都通過(guò)Oracle數(shù)據(jù)進(jìn)行管理。而其他專(zhuān)題數(shù)據(jù)則以分布式遠(yuǎn)程調(diào)用模式進(jìn)行管理。建成的地震應(yīng)急數(shù)據(jù)庫(kù)數(shù)據(jù)層結(jié)構(gòu)如圖5所示。
圖5 數(shù)據(jù)層結(jié)構(gòu)圖
當(dāng)?shù)卣饝?yīng)急數(shù)據(jù)和應(yīng)急地理信息服務(wù)平臺(tái)集成共享之后,在發(fā)生地震時(shí),以應(yīng)急地理信息服務(wù)平臺(tái)為支撐的高度智能化的地震應(yīng)急指揮輔助決策支持系統(tǒng)能夠在基礎(chǔ)數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)的支持下,迅速判斷災(zāi)情規(guī)模、影響范圍、損失評(píng)估,并結(jié)合現(xiàn)狀提出一系列科學(xué)的救災(zāi)方案和調(diào)度方案,協(xié)助指揮人員實(shí)施各種地震救災(zāi)行為。
本文介紹了基于Web服務(wù)的方式,按照數(shù)據(jù)中心模式和分布式遠(yuǎn)程調(diào)用模式,建設(shè)應(yīng)急資源數(shù)據(jù)中心的應(yīng)急地理空間信息資源體系的技術(shù)路線(xiàn),將分散在全省各應(yīng)急相關(guān)部門(mén)的應(yīng)急專(zhuān)題空間資源有效整合,形成了“集中+分布”的應(yīng)急地理信息數(shù)據(jù)庫(kù),實(shí)現(xiàn)了以空間信息為基礎(chǔ)的數(shù)據(jù)共享,可為福建省應(yīng)急地理信息公共平臺(tái)的建成提供強(qiáng)有力的數(shù)據(jù)支撐。
[1]劉斌,劉正軍,辛海強(qiáng),等.省級(jí)應(yīng)急平臺(tái)體系基礎(chǔ)地理信息平臺(tái)的設(shè)計(jì)研究[C].中國(guó)地理信息產(chǎn)業(yè)發(fā)展論壇暨中國(guó)GIS協(xié)會(huì)年會(huì),2008.
[2]王康.地理信息共享平臺(tái)及其關(guān)鍵技術(shù)的研究與應(yīng)用[D].廣州:廣東工業(yè)大學(xué),2011.
[3]席楠.面向服務(wù)的地震應(yīng)急數(shù)據(jù)與服務(wù)共享的研究[D].北京:中國(guó)地震局地震預(yù)測(cè)研究所,2010.
[4]李冠宇,劉軍,張俊.分布式異構(gòu)數(shù)據(jù)集成系統(tǒng)的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用研究,2004,21(3):96-98.
[5]梁利姣,吳國(guó)平.一種基于XML的異構(gòu)數(shù)據(jù)源集成方案[J].現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版),2004(3):27-29.
[6]馬曉艷,曹寶香.一種基于XML的數(shù)據(jù)集成方案及其關(guān)鍵技術(shù)[J].計(jì)算機(jī)與現(xiàn)代化,2006(3):70-73.
[7]袁景凌,徐麗麗,苗連超.基于XML的虛擬法異構(gòu)數(shù)據(jù)集成方法研究[J].計(jì)算機(jī)應(yīng)用研究,2009,26(1):172-174.
[8]陳軍,蔣捷,周旭,等.地理信息公共服務(wù)平臺(tái)的總體技術(shù)設(shè)計(jì)研究[J].地理信息世界,2009,7(3):7-11.
福建省工業(yè)引導(dǎo)性(重點(diǎn))項(xiàng)目(編號(hào):2014H0011)。