楊 燦,汪齊松
(1. 湖南科技職業(yè)學院,湖南 長沙 410004; 2. 湖南省國土資源信息中心,湖南 長沙 410004)
2017年1月,湖南省人民政府發(fā)布《湖南省地理空間數(shù)據(jù)管理辦法》,規(guī)定了地理空間數(shù)據(jù)匯集整理和共享使用的內(nèi)容及參與各方的職責分工。為了充分發(fā)揮地理空間數(shù)據(jù)在經(jīng)濟建設(shè)和社會發(fā)展中的作用,迫切需要將不同來源、不同格式、不同部門獲取的地理空間數(shù)據(jù)進行匯集與融合,實現(xiàn)地理空間數(shù)據(jù)共享與社會化服務(wù)。針對多源地理空間數(shù)據(jù)集成與融合的實際需求,湖南省自然資源廳正式立項了多源地理空間數(shù)據(jù)融合研究課題,擬通過對多源地理空間數(shù)據(jù)融合研究,為多源異構(gòu)空間數(shù)據(jù)共享與應(yīng)用提供一套解決方法。本文在對多源地理空間數(shù)據(jù)的融合進行分析與研究的基礎(chǔ)上,構(gòu)建了數(shù)據(jù)庫模式融合與數(shù)據(jù)庫實例融合為一體的數(shù)據(jù)融合流程與方法,并以基礎(chǔ)地理信息、地理國情普查等實例數(shù)據(jù)進行了試驗分析。
多源矢量空間數(shù)據(jù)融合屬于地球空間數(shù)據(jù)融合的范疇。自20世紀60年代以來,伴隨著地理信息系統(tǒng)的出現(xiàn)和應(yīng)用,多源矢量空間數(shù)據(jù)融合得到了廣泛關(guān)注[1],其研究主要集中在幾何特征融合處理與屬性特征融合兩方面[2]。
幾何特征融合是多源矢量空間數(shù)據(jù)集成融合的核心內(nèi)容,旨在解決同名地物在不同數(shù)據(jù)庫中地理位置不一致性的問題,通常包括同名實體匹配和不一致性處理兩個過程。同名實體匹配利用相同地理實體在幾何特征、拓撲關(guān)系和語義信息等方面的相似性,識別不同數(shù)據(jù)庫中的同一地物。主要方法包括:基于幾何特征的方法[3]、基于拓撲特征的方法[4]及基于屬性特征的方法[5]。不一致性處理是對匹配后多源數(shù)據(jù)進行選取、化簡、更新、關(guān)系協(xié)調(diào)等操作,使空間數(shù)據(jù)內(nèi)容和質(zhì)量準確可靠。主要方法包括:基于同名點三角剖分的地物調(diào)整方法[6]、基于拓撲關(guān)系的合并變換算法[7]、基于平差原理的地物調(diào)整方法[8]及基于多評價因素的調(diào)整變換算法[9]。
多源矢量空間數(shù)據(jù)屬性特征融合是在幾何特征匹配和不一致性處理的基礎(chǔ)上,發(fā)現(xiàn)或計算不同來源數(shù)據(jù)的語義映射關(guān)系或相似度,解決不同語義之間的匹配問題,當前的主要方法包括基于映射轉(zhuǎn)換規(guī)則的屬性融合[10]與基于地理本體的屬性融合方法[11]等。基于映射轉(zhuǎn)換規(guī)則的屬性融合方法主要通過建立不同源數(shù)據(jù)間的要素分類分級映射規(guī)則和屬性特征項轉(zhuǎn)換規(guī)則,實現(xiàn)語義層次上的屬性特征關(guān)系映射和源數(shù)據(jù)集到目標數(shù)據(jù)集的屬性特征項轉(zhuǎn)換,進而完成數(shù)據(jù)屬性融合[12]?;诘乩肀倔w的屬性融合方法,旨在通過地理本體來實現(xiàn)不同來源的結(jié)構(gòu)化地理信息間的語義映射及異構(gòu)性消除,主要包括單一本體、多本體和混合本體等方式[13-15]。
如圖1所示,在研究過程中,本文將多源矢量空間數(shù)據(jù)融合問題分解為兩個方面,即數(shù)據(jù)庫模式融合與數(shù)據(jù)庫實例融合。數(shù)據(jù)庫模式融合首先對多源矢量空間數(shù)據(jù)的數(shù)學基礎(chǔ)、可融合數(shù)據(jù)判別、數(shù)據(jù)分類分層、屬性結(jié)構(gòu)規(guī)整、屬性編碼統(tǒng)一等方面進行規(guī)范,從總體上對融合數(shù)據(jù)的組織和管理進行約束。數(shù)據(jù)庫模式融合主要包括:融合數(shù)據(jù)選擇與預(yù)處理、數(shù)學基礎(chǔ)統(tǒng)一、數(shù)據(jù)分層與分類及屬性結(jié)構(gòu)規(guī)整與編碼統(tǒng)一。數(shù)據(jù)庫實例融合主要分別針對每種矢量空間數(shù)據(jù)實例(點、線、面)遵循先幾何匹配再屬性融合的原則,分步驟實現(xiàn)要素實例在幾何和屬性兩方面的充分融合。數(shù)據(jù)庫實例融合主要包括:要素匹配關(guān)系建立、基礎(chǔ)要素融合和融合數(shù)據(jù)質(zhì)量檢查。
(1) 要素匹配關(guān)系建立:建立待融合數(shù)據(jù)源之間的要素匹配關(guān)系,分為1∶0或0∶1、1∶1、1∶M(一對多)或M∶1(多對一)、M∶N(多對多)4種基本匹配類型。
(2) 基礎(chǔ)要素融合:首先確定要素優(yōu)先級,再確定要素融合基準數(shù)據(jù)標準,進而對融合要素空間不一致性處理進行規(guī)定,最后指定屬性更新操作規(guī)范。
(3) 融合數(shù)據(jù)質(zhì)量檢查:具體包括數(shù)學基礎(chǔ)正確、屬性表的字段名、長度正確與內(nèi)容填寫規(guī)范,屬性精度應(yīng)符合要求、完整性、數(shù)據(jù)邏輯一致、數(shù)據(jù)空間關(guān)系正確。
針對上述方法流程,采取基礎(chǔ)地理信息數(shù)據(jù)與地理國情普查數(shù)據(jù)作為試驗數(shù)據(jù)進行融合驗證。兩類數(shù)據(jù)的數(shù)學基礎(chǔ)(坐標系統(tǒng)、高程基礎(chǔ)、地圖分幅和投影)已經(jīng)統(tǒng)一且比例尺相同,但是二者建庫標準不一、屬性內(nèi)容、采集精度和時效性存在差異。這兩種數(shù)據(jù)進行融合時,先對要素進行整理,確定融合后要素包括境界、水系、交通、居民地及設(shè)施、土質(zhì)與植被。
首先分別以基礎(chǔ)地理信息中境界、水系、交通、居民地及設(shè)施、土質(zhì)與植被要素分類分層為基準,依據(jù)語義相似性,建立地理國情數(shù)據(jù)中相應(yīng)分類分層與基礎(chǔ)地理要素中境界要素分類分層關(guān)系,如圖2所示(以水系為例)。然后通過對比基礎(chǔ)地理信息和地理國情數(shù)據(jù)中境界、水系、交通、居民地及設(shè)施、土質(zhì)與植被要素的屬性表,將相同屬性項合并,增加地理國情普查數(shù)據(jù)中的專有屬性項,達到豐富屬性表的目的,如圖3所示要素屬性統(tǒng)一(以水系為例)。
以水系要素融合為例,將基礎(chǔ)地理信息水系要素與地理國情水域要素融合時,會出現(xiàn)一對多或多對多的匹配情況,如基礎(chǔ)地理信息數(shù)據(jù)中池塘實體和地理國情普查數(shù)據(jù)中坑塘實體要素融合時,出現(xiàn)了幾何屬性的不一致問題,對于這種不一致,可以進行要素的增補以盡可能保留詳細信息,如圖4所示。再如,將地理國情普查的地面支渠實體和基礎(chǔ)地理信息的地面河流要素融合時,出現(xiàn)拓撲關(guān)系不一致的情況,可采用空間移位進行處理,如圖5所示。
對數(shù)據(jù)分類分層統(tǒng)一、屬性表統(tǒng)一、要素匹配與不一致性處理后,可以針對具體要素對象進行屬性更新,通過質(zhì)量檢查要求后即可入庫形成最終的融合成果。
針對地理空間數(shù)據(jù)多源、異構(gòu)、不一致性的現(xiàn)狀及特點,本文構(gòu)建了以數(shù)據(jù)庫模式融合與數(shù)據(jù)庫實例融合為研究思路的多源地理空間數(shù)據(jù)融合基本流程與技術(shù)要求,并結(jié)合實例數(shù)據(jù)進行了驗證分析,得出幾點結(jié)論:
(1) 基于層次化思想,將幾何特征融合與屬性特征融合充分融合,提出了先從整體上進行數(shù)據(jù)庫模式融合,再針對具體融合要素指定由幾何到屬性的數(shù)據(jù)融合操作流程。
(2) 在融合規(guī)范中需要制定不同要素類型、不同數(shù)據(jù)質(zhì)量指標間的優(yōu)先級別,應(yīng)考慮同種要素與不同種要素間融合的不一致性處理問題,可有效提高多源矢量數(shù)據(jù)融合的可操作性。
(3) 數(shù)據(jù)融合有利于打通不同部門間空間數(shù)據(jù)共享與互操作間的壁壘,提高地理信息技術(shù)公眾服務(wù)的水平和質(zhì)量。