劉 杰
(1.上海市測(cè)繪院,上海200063)
面向地理國情監(jiān)測(cè)的地理要素變化檢測(cè)方法
劉 杰1
(1.上海市測(cè)繪院,上海200063)
地理要素是地理國情監(jiān)測(cè)的重要組成部分,特別是在城市地區(qū),其具有種類多、數(shù)據(jù)量大、格式多樣、變化頻繁等特點(diǎn)。提出并設(shè)計(jì)了一種基于不同時(shí)態(tài)同源參考數(shù)據(jù)的地理要素變化檢測(cè)技術(shù)方法。經(jīng)應(yīng)用實(shí)踐證明,該技術(shù)方法適用于工程化應(yīng)用的地理要素變化信息提取,可為常態(tài)化地理國情監(jiān)測(cè)提供參考。
地理要素;變化檢測(cè);FME
地理國情監(jiān)測(cè)是在普查數(shù)據(jù)成果的基礎(chǔ)上,對(duì)自然和人文地理要素的空間分布、特征及其相互關(guān)系[1]進(jìn)行定量、空間化的監(jiān)測(cè),從而獲取地表覆蓋和國情要素的變化信息。近年來,基于高分辨率遙感影像和數(shù)字地表模型(DSM)的地表覆蓋信息提取[2-3]以及變化檢測(cè)[4]已得到廣泛應(yīng)用,地理國情要素的變化檢測(cè)逐漸成為研究重點(diǎn)[5-7]并已取得部分理論成果。上海市作為特大型城市的典型代表,市域內(nèi)社會(huì)、人文、資源等各類地理要素高度集中,通過定期收集基礎(chǔ)地理信息數(shù)據(jù)庫、公開版地圖數(shù)據(jù)庫、各委辦局行業(yè)專題資料等參考數(shù)據(jù),在滿足國家國情監(jiān)測(cè)要求的基礎(chǔ)上,拓展監(jiān)測(cè)了幾十種市情專題,共同構(gòu)成了綜合反映城市地區(qū)特征的數(shù)據(jù)資源,具有重要的理論研究和社會(huì)應(yīng)用價(jià)值。然而,地理要素具有種類多、數(shù)據(jù)量大、格式多樣、變化頻率相對(duì)較快等特點(diǎn),如何快速高效地整理和獲取有價(jià)值的數(shù)據(jù),一直是研究的熱點(diǎn)問題。本文在技術(shù)分析的基礎(chǔ)上,提出了一種在工程化應(yīng)用中可行的地理要素變化信息提取方法;并通過FME實(shí)現(xiàn)了變化信息自動(dòng)提取,為地理國情監(jiān)測(cè)的地理要素變化信息提取提供參考。
地理要素實(shí)體[8]主要包括點(diǎn)要素、線要素和面要素。變化檢測(cè)主要體現(xiàn)為對(duì)地理要素的空間變化和屬性變化的檢測(cè),從空間角度出發(fā),對(duì)地理要素的空間位置和幾何形狀作定量和定性分析,比較其間的相似程度以尋找同名實(shí)體[9]。本文對(duì)于點(diǎn)要素的空間變化采用歐氏距離進(jìn)行判讀;線要素的空間變化限定在空間位置和走向變化(節(jié)點(diǎn)的增刪或差異不考慮),采用長(zhǎng)度重疊度和Hausdorff 距離進(jìn)行判讀;面要素的空間變化限定在空間位置和形狀變化(節(jié)點(diǎn)的增刪或差異不考慮),采用面積重疊度進(jìn)行判讀;屬性變化采用Levenshtein算法對(duì)同一屬性項(xiàng)進(jìn)行相似度判讀。
以兩個(gè)不同時(shí)態(tài)的同一專題要素為例,本文設(shè)計(jì)的地理要素變化檢測(cè)流程如圖1所示。
圖1 地理要素變化檢測(cè)流程圖
1.1 數(shù)據(jù)預(yù)處理
將矢量空間數(shù)據(jù)的坐標(biāo)系統(tǒng)和投影系統(tǒng)、數(shù)據(jù)存儲(chǔ)格式、空間數(shù)據(jù)精度、屬性字段類型進(jìn)行統(tǒng)一,形成空間參考與屬性類型一致的同源數(shù)據(jù)。
1.2 空間變化檢測(cè)
1)點(diǎn)要素的空間變化檢測(cè)采用歐氏距離:
以基態(tài)點(diǎn)要素為圓心,搜索位置相同或歐氏距離在一定閾值范圍內(nèi)的最新時(shí)態(tài)點(diǎn)要素。閾值的設(shè)定可參考地理要素采集精度,閾值過小,難以找到同名點(diǎn);閾值太大,會(huì)導(dǎo)致過多一點(diǎn)匹配多點(diǎn)的情況
2)線要素的空間變化檢測(cè)采用長(zhǎng)度重疊度和Hausdorff 距離:
長(zhǎng)度重疊度是基態(tài)線要素的分布與最新時(shí)態(tài)線要素的分布相重疊的部分占二者總體分布的比率;基于一定的閾值對(duì)新舊時(shí)態(tài)線狀要素作線線疊加計(jì)算長(zhǎng)度重疊度。Hausdorff 距離用以比較兩個(gè)線要素的總體差異;其中線要素的點(diǎn)集簡(jiǎn)化為起點(diǎn)、終點(diǎn)、中心點(diǎn)以及若干其他按長(zhǎng)度百分比在線上取得的點(diǎn),基于上述點(diǎn)集計(jì)算新舊時(shí)態(tài)線要素Hausdorff 距離。
3)面要素的空間變化檢測(cè)采用面積重疊度:
面積重疊度是基態(tài)面要素的分布與最新時(shí)態(tài)面要素的分布相重疊的部分占二者總體分布的比率;基于一定的閾值對(duì)新舊時(shí)態(tài)面狀要素作面面疊加計(jì)算面積重疊度。
1.3 屬性變化檢測(cè)
Levenshtein距離又稱編輯距離,是兩個(gè)字符串之間,由一個(gè)轉(zhuǎn)換成另一個(gè)所需的最少編輯操作次數(shù)。許可的編輯操作包括替換、插入和刪除,Levenshtein算法一般給每個(gè)操作相同的權(quán)重,也可定義不同操作的代價(jià)。地理要素的屬性變化采用Levenshtein算法對(duì)同一屬性項(xiàng)進(jìn)行相似度判讀。
FME是Safe Software公司開發(fā)的空間與非空間數(shù)據(jù)分析、處理、轉(zhuǎn)換、共享的完整ETL平臺(tái)。本文基于上述方法與流程,利用FME實(shí)現(xiàn)了地理要素變化檢測(cè)和變化信息的自動(dòng)提取。
2.1 數(shù)據(jù)輸入
地理要素變化檢測(cè)雖涉及幾十種要素,但主要以點(diǎn)、線、面來表示,因此數(shù)據(jù)輸入只需保證兩個(gè)時(shí)態(tài)的要素類型一致。FME支持動(dòng)態(tài)讀取同一格式的不同數(shù)據(jù)源,然后根據(jù)數(shù)據(jù)源的結(jié)構(gòu)動(dòng)態(tài)生成目標(biāo)表,主要通過讀取模塊的合并要素類實(shí)現(xiàn)。輸入的數(shù)據(jù)源分為基態(tài)數(shù)據(jù)和最新時(shí)態(tài)數(shù)據(jù),二者都通過Geometry Filter轉(zhuǎn)換器分成點(diǎn)、線、面3種幾何要素,用于后續(xù)點(diǎn)、線、面分要素類的變化檢測(cè)。
2.2 變化檢測(cè)
地理要素變化檢測(cè)主要步驟包括時(shí)態(tài)標(biāo)識(shí)、數(shù)據(jù)過濾、空間匹配、屬性匹配等,如圖2所示。
圖2 基于FME實(shí)現(xiàn)地理要素變化檢測(cè)流程圖
點(diǎn)要素的空間匹配通過NeighborFinder查找歐式距離在閾值范圍內(nèi)的鄰近點(diǎn),并把該范圍內(nèi)所有鄰近點(diǎn)的信息存放在該點(diǎn)的列表屬性中。在屬性變化檢測(cè)時(shí)調(diào)用Levenshtein算法,計(jì)算該點(diǎn)與列表中所有鄰近點(diǎn)的文本相似度,然后對(duì)點(diǎn)的相似度進(jìn)行排序,提取最優(yōu)值并判斷屬性是否發(fā)生變化。
線要素的空間匹配通過Snapper和LineOnLine Overlay對(duì)新舊時(shí)態(tài)線狀要素作線線疊加計(jì)算長(zhǎng)度重疊度;通過Snipper、NeighborFinder和StatisticsCalculator提取點(diǎn)集,計(jì)算點(diǎn)到線最近距離以及統(tǒng)計(jì)Hausdorff 距離。
面要素的空間匹配通過Snapper和AreaOnArea Overlay對(duì)新舊時(shí)態(tài)面狀要素作面面疊加計(jì)算面積重疊度。線要素和面要素一般根據(jù)重疊度直接提取最優(yōu)值,在屬性變化檢測(cè)時(shí)調(diào)用Levenshtein算法判斷屬性是否發(fā)生變化。
在實(shí)現(xiàn)過程中,對(duì)于空間不能匹配的要素,不再進(jìn)行屬性相似度判斷,而是簡(jiǎn)化為直接判斷屬性是否完全一致,再根據(jù)數(shù)據(jù)時(shí)態(tài)作進(jìn)一步判斷。
2.3 變化信息輸出
空間上能夠匹配但屬性不能匹配的,輸出為屬性變化要素;空間上不能匹配但屬性上完全一致的,輸出為空間變化要素;空間和屬性均不能匹配的,根據(jù)數(shù)據(jù)時(shí)態(tài)標(biāo)識(shí),輸出為新增或刪除要素。根據(jù)輸出的變化信息還可以分要素統(tǒng)計(jì)變化數(shù)量、變化長(zhǎng)度、變化面積和更新比例等信息。
本文技術(shù)方法已成功應(yīng)用于2015年上海市地理國情標(biāo)準(zhǔn)時(shí)點(diǎn)核準(zhǔn)和2016年基礎(chǔ)性地理國情監(jiān)測(cè)中?,F(xiàn)以公開版地圖數(shù)據(jù)庫不同時(shí)態(tài)的學(xué)校(點(diǎn))、道路(線)和公園綠地(面)數(shù)據(jù)為例,通過設(shè)置輸入和輸出路徑,即可得到屬性變化要素、新增要素、刪除要素和位置變化要素,如圖3所示(擴(kuò)大圖為迪士尼周邊的變化情況),通過對(duì)變化信息提取結(jié)果的比較可知提取結(jié)果是正確的。
圖3 地理要素變化檢測(cè)結(jié)果
地理要素時(shí)空數(shù)據(jù)變化檢測(cè)技術(shù)在與地理信息有關(guān)的領(lǐng)域有著廣泛的應(yīng)用前景,特別是對(duì)于時(shí)空數(shù)據(jù)庫的管理具有重要意義。本文設(shè)計(jì)的地理要素變化檢測(cè)方法,已經(jīng)成功應(yīng)用于2015年上海市地理國情標(biāo)準(zhǔn)時(shí)點(diǎn)核準(zhǔn)和2016年基礎(chǔ)性地理國情監(jiān)測(cè)的生產(chǎn)實(shí)踐和質(zhì)量檢查中。經(jīng)過實(shí)踐證明,該方法可有效提高國情監(jiān)測(cè)地理要素變化檢測(cè)的效率,對(duì)實(shí)際生產(chǎn)和質(zhì)量控制有較大的幫助;也可進(jìn)一步擴(kuò)展到基礎(chǔ)地理信息數(shù)據(jù)庫的現(xiàn)勢(shì)性更新、質(zhì)量控制等方面,從而形成增量式基礎(chǔ)地理數(shù)據(jù)庫,構(gòu)建多要素多時(shí)空的地理信息數(shù)據(jù),更加有利于對(duì)地理信息進(jìn)行地理變遷、地理現(xiàn)象變化規(guī)律等的研究。但該方法還存在局限性,對(duì)檢測(cè)數(shù)據(jù)有一定的要求,即更新前后數(shù)據(jù)必須是一致的,對(duì)于不同來源的數(shù)據(jù)目前還不適用,在以后的工作中需要繼續(xù)研究與改進(jìn)。
[1] 陳俊勇.關(guān)于地理國情普查的思考[J].地理空間信息,2014, 12(2):1-3
[2] 程滔,周旭,劉若梅.面向地理國情監(jiān)測(cè)的地表覆蓋信息提取方法[J].測(cè)繪通報(bào),2013(8):84-86
[3] 余詠勝,羅名海,吳克友,等.基于FME的地理國情覆蓋要素提取技術(shù)探討[J].地理空間信息,2014,12(5):1-3
[4] 郭容寰.基于DSM和DOM特征的城市變化檢測(cè)[J].測(cè)繪通報(bào),2012(增刊):414-416
[5] 王懷,高小明,樊文峰,等.地理國情要素時(shí)空變化檢測(cè)技術(shù)研究[J].測(cè)繪通報(bào),2014(11):84-87,119
[6] 張偉.矢量更新的變化信息提取與統(tǒng)計(jì)方法研究[J].測(cè)繪與空間地理信息,2012,35(11):91-93
[7] 任家鋒,馬衛(wèi)春,木林.地理國情普查矢量數(shù)據(jù)變化量提取方法[J].地理空間信息,2015,13(5):6-9
[8] 陳愛軍,李琦,徐光祐.地理空間信息共享理論基礎(chǔ)及其解決方案[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,42(10):1 405-1 409 [9] 郭黎,崔鐵軍,王豪,等.基于面狀要素拓?fù)潢P(guān)系的數(shù)據(jù)匹配技術(shù)研究[J].測(cè)繪科學(xué),2010(1):130-132
[10] GB/T 13923-2006.基礎(chǔ)地理信息要素 分類與代碼[S].北京:中國標(biāo)準(zhǔn)出版社,2006:1-2
P208
B
1672-4623(2017)05-0032-03
10.3969/j.issn.1672-4623.2017.0051.0
劉杰,碩士,工程師,從事地圖制圖學(xué)與地理信息工程方面的工作和研究。
2016-08-19。
項(xiàng)目來源:現(xiàn)代工程測(cè)量國家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室開放課題資助項(xiàng)目(TJES1308)。