藍(lán)振家,郭慶勝,劉紀(jì)平,王 勇
(1.武漢大學(xué) 資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079;2.中國(guó)測(cè)繪科學(xué)研究院,北京 100830)
多尺度面實(shí)體的匹配方法研究
藍(lán)振家1,郭慶勝1,劉紀(jì)平2,王 勇2
(1.武漢大學(xué) 資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079;2.中國(guó)測(cè)繪科學(xué)研究院,北京 100830)
從多尺度面實(shí)體匹配的需要出發(fā),分析地圖綜合所引起的一對(duì)多、多對(duì)多匹配關(guān)系,以及不同地圖綜合算子給同名實(shí)體所造成的差異,將一對(duì)一匹配關(guān)系的幾何相似性度量模型和非一對(duì)一匹配關(guān)系的基于重疊度的面實(shí)體匹配方法相結(jié)合,采用指標(biāo)閾值自動(dòng)確定方法,建立一種新的適用多尺度變化的面實(shí)體匹配方法。最后以多個(gè)比例尺的居民地為實(shí)驗(yàn)對(duì)象,驗(yàn)證本方法的可行性和有效性。
面實(shí)體;多尺度;匹配;幾何相似性;地圖綜合
同名實(shí)體匹配已經(jīng)成為空間數(shù)據(jù)集成、空間數(shù)據(jù)自動(dòng)更新、位置服務(wù)等空間數(shù)據(jù)處理的關(guān)鍵技術(shù),是目前國(guó)內(nèi)外學(xué)者研究的一個(gè)熱點(diǎn)問(wèn)題,例如,居民地、湖泊等面狀地物的匹配[1-3]。已有的面實(shí)體匹配方法主要適用于相近比例尺的一對(duì)一關(guān)系匹配,大致有3類方法:①?gòu)膯蝹€(gè)面實(shí)體的幾何特征出發(fā),通過(guò)計(jì)算位置、形狀、大小、方向等多特征的幾何相似性來(lái)確定匹配實(shí)體[2,4-6];②利用降維技術(shù),通過(guò)提取二維面實(shí)體骨架線,將二維面匹配問(wèn)題轉(zhuǎn)化為一維線匹配問(wèn)題[7-8];③通過(guò)提取面實(shí)體空白區(qū)域骨架線,將面實(shí)體的匹配轉(zhuǎn)換為空白區(qū)域骨架線網(wǎng)眼匹配[9]。在多尺度空間目標(biāo)匹配方面,郭黎研究了基于面狀拓?fù)湟仃P(guān)系的數(shù)據(jù)匹配技術(shù)[10],翟仁建研究了基于全局一致性評(píng)價(jià)的多尺度矢量空間數(shù)據(jù)匹配方法[1]。然而,當(dāng)數(shù)據(jù)源的比例尺差異較大時(shí),地圖面狀目標(biāo)匹配受地圖綜合的影響比較大,同名實(shí)體以一對(duì)多、多對(duì)多匹配關(guān)系為主,并且有少量其它的匹配關(guān)系。因此,本文從多尺度面實(shí)體匹配的需要出發(fā),分析了不同地圖綜合算子給同名實(shí)體所造成的差異,將幾何相似性度量模型和基于重疊度的面實(shí)體匹配方法相結(jié)合,建立了一種顧及地圖綜合因素的能適應(yīng)多尺度面實(shí)體匹配的新方法。
不同地圖空間的同名實(shí)體之間有差異原因:地圖綜合、實(shí)際變化以及數(shù)據(jù)誤差[11],其中,地圖綜合是不同比例尺地圖空間的同名實(shí)體有差異的主要原因[1]。地圖綜合算子在地理空間數(shù)據(jù)的綜合包括目標(biāo)選取、目標(biāo)簡(jiǎn)化、多目標(biāo)的合并、移位、夸大以及典型化[12-14,15]。不同地圖綜合算子造成的同名實(shí)體差異也會(huì)不同,簡(jiǎn)化、夸大算子會(huì)造成同名實(shí)體在形狀、大小等方面的差異;選取算子會(huì)造成實(shí)體的刪除;移位算子會(huì)產(chǎn)生空間位置的差異;合并算子和典型化算子會(huì)造成同名實(shí)體多方面的差異。多尺度地圖空間中面實(shí)體之間的匹配可細(xì)分為一對(duì)零(即1∶0或0∶1)、一對(duì)一(即1∶1)、一對(duì)多(即1∶N或M∶1,N>1,M>1)和多對(duì)多四種不同的匹配關(guān)系[1,11]。不同地圖綜合算子造成的同名實(shí)體的差異以及對(duì)應(yīng)的匹配關(guān)系如表1所示。
表1 不同地圖綜合算子造成同名實(shí)體的差異以及對(duì)應(yīng)的匹配關(guān)系
2.1 幾何相似度模型原理
面實(shí)體幾何相似度模型是以單個(gè)面實(shí)體的形狀、大小和位置三個(gè)幾何特征量作為匹配的依據(jù),將形狀、大小和位置的相似度進(jìn)行加權(quán)求和,綜合性相似度最大的兩個(gè)實(shí)體可以匹配。假設(shè):待匹配實(shí)體為A和B,其綜合性相似度指標(biāo)由向量[a1,a2,a3]T和[b1,b2,b3]T組成,其中的分量代表大小、位置、形狀;g(A,B)表示A與B之間的差異度;sim(A,B)表示A與B之間的相似度,見(jiàn)式(1)。若采用加權(quán)的歐氏距離度量g(A,B),式(1)可以轉(zhuǎn)化為式(2)。
(1)
(2)
(3)
式中:AreaA,AreaB分別為面實(shí)體A,B的面積;Max(AreaA,AreaB)為面實(shí)體A和B面積的最大值。
(4)
式中:(XA,YA)和(XB,YB)分別為面實(shí)體A和B的中心點(diǎn);dmax(A,B)為面實(shí)體A邊界上任意一個(gè)點(diǎn)與面實(shí)體B任意邊界上任意一個(gè)點(diǎn)之間的最大距離。
2.2 匹配的過(guò)程
設(shè)有2個(gè)面實(shí)體集合,大比例尺面實(shí)體集合A={a0,a1,…,am},小比例尺面實(shí)體集合B={b0,b1,…,bn},這兩個(gè)集合的面實(shí)體匹配步驟:
1)采用文獻(xiàn)[4]的方法確定匹配參數(shù)閾值。從兩個(gè)集合中人工選取認(rèn)為可以匹配的若干實(shí)體目標(biāo)對(duì),作為樣本,計(jì)算樣本中每一個(gè)實(shí)體對(duì)的距離差異度、形狀差異度和大小差異度三個(gè)分量,并對(duì)每一個(gè)分量的標(biāo)準(zhǔn)差進(jìn)行倒數(shù)歸一化,得到各個(gè)分量的權(quán)重w1,w2和w3。根據(jù)分量權(quán)重和每個(gè)實(shí)體對(duì)的各個(gè)分量,求取實(shí)體對(duì)的綜合性相似度。然后,根據(jù)綜合性相似度均值S以及標(biāo)準(zhǔn)差δ,計(jì)算出綜合性相似度閾值:S-3δ。
2)對(duì)A和B建立固定格網(wǎng)空間索引,計(jì)算A和B中每個(gè)面實(shí)體所經(jīng)過(guò)的格網(wǎng)和每個(gè)格網(wǎng)所包含的面實(shí)體。
3)讀取A中實(shí)體ai(i=1,2,…,m)在空間索引中的格網(wǎng)位置,以一個(gè)格網(wǎng)為距離單位,找到這些格網(wǎng)的BUFFER區(qū)域,隨后以這個(gè)區(qū)域內(nèi)的格網(wǎng)為范圍,檢索出B中的面實(shí)體子集合,作為ai候選匹配集。
4)在實(shí)體ai和與候選匹配集中每個(gè)實(shí)體之間計(jì)算位置差異度、大小差異度和形狀差異度3個(gè)分量。計(jì)算實(shí)體ai與候選匹配集中每個(gè)實(shí)體之間的綜合性相似度,若綜合性相似度最大并且大于閾值,那么實(shí)體ai在候選匹配集中有匹配實(shí)體。
5)若A中實(shí)體都已經(jīng)被匹配,則結(jié)束;否則回到第(3)步。
設(shè)大比例尺面實(shí)體集合A={a0,a1,…,am},小比例尺面實(shí)體集合B={b0,b1,…,bn},具體的匹配過(guò)程如下:
1)依據(jù)前文所提到的閾值計(jì)算方法,人工選取一定數(shù)量的正例樣本,確定重疊度閾值(Mlimit),而現(xiàn)有的方法需要人工設(shè)置重疊度閾值。設(shè)dmin為最小可分辨距離,并按照地圖比例尺轉(zhuǎn)換為數(shù)據(jù)庫(kù)的長(zhǎng)度單位。
2)遍歷集合A中的m個(gè)面實(shí)體元素ai,針對(duì)每個(gè)元素(面實(shí)體),檢索出與其最短距離小于dmin的所有實(shí)體,設(shè)這些面實(shí)體組成一個(gè)集合ACi,對(duì)于集合A而言,形成了一個(gè)由m個(gè)集合組成的集合群AC。
3)遍歷集合B中的n個(gè)面實(shí)體元素bj,針對(duì)每個(gè)元素(面實(shí)體),在集合A中檢索出與其相交的所有面實(shí)體,設(shè)這些面實(shí)體組成一個(gè)集合BCi,對(duì)于集合B而言,就形成了一個(gè)由n個(gè)集合組成的集合群BC。
4)集合ACi和集合BCj中的元素都是來(lái)源于集合A,也可能為空,因?yàn)榭赡茉诩螦中沒(méi)有檢索到符合條件的面實(shí)體。若BCj的元素個(gè)數(shù)大于1,則計(jì)算BCj中每一個(gè)面實(shí)體ai與BCj對(duì)應(yīng)的面實(shí)體bj的重疊度M。把M>Mlimit的面實(shí)體組成一個(gè)集合Qj,就從BCj得到一個(gè)與bj有匹配關(guān)系的面實(shí)體集合,其元素都是來(lái)源于集合A。
(5)
其中,sc為ai與bj的重疊面積;sai代表ai的面積;sbj為bj的面積。
5)從集合Qj中遍歷所有的元素(面實(shí)體ai),若ai對(duì)應(yīng)的集合ACi中的元素(面實(shí)體ak)也是集合BCj中的元素,則面實(shí)體ak也加入集合Qj中,形成一個(gè)新的集合群Q。
6)從集合Qj中分析面實(shí)體的匹配關(guān)系:若Qj的元素個(gè)數(shù)大于1,并且Qj中的某個(gè)面實(shí)體(ai)在整個(gè)集合群Q中具有唯一性,則匹配關(guān)系為一對(duì)多(bj與Qj中的面實(shí)體之間的匹配關(guān)系),否則相關(guān)的面實(shí)體(包含元素ai的集合Qj中的所有面實(shí)體和bj)之間的匹配關(guān)系為多對(duì)多。
4.1 數(shù)據(jù)匹配總體流程
設(shè)有2個(gè)數(shù)據(jù)集,大比例尺面實(shí)體集合A,小比例尺面實(shí)體集合B,依據(jù)前文所設(shè)計(jì)的算法,面實(shí)體匹配的主要流程如下:
1)坐標(biāo)變換。兩種數(shù)據(jù)源之間坐標(biāo)變換有兩個(gè)目的[10]:一是統(tǒng)一兩幅圖的投影系統(tǒng)和坐標(biāo)系統(tǒng);二是消除兩幅圖之間可能存在的系統(tǒng)偏差。
2)建立面實(shí)體空間格網(wǎng)索引。索引的建立有2個(gè)好處:一是在匹配過(guò)程中,減少了不必要的搜索時(shí)間,提高了算法的效率;二是在確定匹配候選集時(shí),縮小了匹配候選對(duì)象的范圍。
3)匹配過(guò)程。若比例尺相近(倍數(shù)小于2.5),則采用幾何相似度模型進(jìn)行匹配;否則采用改進(jìn)的非一對(duì)一匹配方法。
4)輸出匹配關(guān)系。若比例尺相近,則輸出的匹配關(guān)系有一對(duì)零和一對(duì)一;否則輸出的匹配關(guān)系包括一對(duì)零,一對(duì)一,一對(duì)多和多對(duì)多。
4.2 匹配實(shí)驗(yàn)
實(shí)驗(yàn)1采用武漢周邊某區(qū)域1∶1萬(wàn)和1∶2.5萬(wàn)的居民地?cái)?shù)據(jù),如圖1所示,淺灰色為1∶1萬(wàn)居民地,有270個(gè)面,黑色為1∶2.5萬(wàn)的居民地,有84個(gè)面。
圖1 1∶1萬(wàn)與1∶2.5萬(wàn)居民地重疊圖
匹配開始之前,人工隨機(jī)選擇6對(duì)已經(jīng)確定匹配的正例樣本(盡量選擇位置誤差較大的實(shí)體對(duì)),計(jì)算樣本對(duì)中面實(shí)體幾何特征的各個(gè)分量的差異度,見(jiàn)表2。
對(duì)距離差異度、形狀差異度和大小差異度等分別計(jì)算標(biāo)準(zhǔn)差,然后對(duì)標(biāo)準(zhǔn)差進(jìn)行倒數(shù)歸一化,則距離權(quán)重是0.101 1,形狀權(quán)重是0.690 7,大小權(quán)重是0.208 2;根據(jù)權(quán)重值求得各對(duì)樣本的綜合性相似度,相似度的均值是0.972 4,標(biāo)準(zhǔn)差是0.01,則綜合性相似度閾值為0.942 3,同理可得重疊度均值0.847 4和標(biāo)準(zhǔn)差0.096 6,則重疊度閾值為0.557 4。設(shè)居民地面實(shí)體間的圖上最小可分辨距離為0.5 mm[18],匹配結(jié)果的統(tǒng)計(jì)如表3所示。
實(shí)驗(yàn)2采用同一區(qū)域的1∶1萬(wàn)和1∶5萬(wàn)比例尺的居民地?cái)?shù)據(jù),如圖2所示,淺灰色為1∶1萬(wàn)居民地,有270個(gè)面,黑色為1∶2.5萬(wàn)的居民地,有11個(gè)面。匹配結(jié)果的統(tǒng)計(jì)如表4所示。
表2 樣本特征分量、總相似度以及重疊度
表3 1∶1萬(wàn)與1∶2.5萬(wàn)居民地匹配實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果
圖2 1∶1萬(wàn)與1∶5萬(wàn)居民地重疊圖
表4 1∶1萬(wàn)與1∶5萬(wàn)居民地匹配實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果
本文將面實(shí)體的形狀、位置和大小三個(gè)幾何特征量作為構(gòu)建幾何相似度模型的因素,匹配方法中指標(biāo)閾值能自動(dòng)確定,由表3和表4可知,多個(gè)比例尺的匹配實(shí)驗(yàn)都得到了正確的匹配結(jié)果,證明了該方法適應(yīng)于多尺度面實(shí)體的匹配,相對(duì)于文獻(xiàn)[10]的方法,本方法更加科學(xué)。
[1] 翟仁健. 基于全局一致性評(píng)價(jià)的多尺度矢量空間數(shù)據(jù)匹配方法研究[D]. 鄭州:信息工程大學(xué), 2011.
[2] 郝燕玲, 唐文靜, 趙玉新,等. 基于空間相似性的面實(shí)體匹配算法研究[J]. 測(cè)繪學(xué)報(bào), 2008, 37(4):501-506.
[3] 張橋平, 李德仁, 龔健雅. 城市地圖數(shù)據(jù)庫(kù)面實(shí)體匹配技術(shù)[J]. 遙感學(xué)報(bào), 2004, 8(2):107-112.
[4] 安曉亞, 孫群, 肖強(qiáng),等. 一種形狀多級(jí)描述方法及在多尺度空間數(shù)據(jù)幾何相似性度量中的應(yīng)用[J]. 測(cè)繪學(xué)報(bào), 2011(4):495-501.
[5] 付仲良,逯躍鋒.利用彎曲度半徑復(fù)函數(shù)構(gòu)建綜合面實(shí)體相似度模型[J].測(cè)繪學(xué)報(bào),2013,42(1):145-151.
[6] 郭黎, 崔鐵軍, 鄭海鷹,等. 基于空間方向相似性的面狀矢量空間數(shù)據(jù)匹配算法[J]. 測(cè)繪科學(xué)技術(shù)學(xué)報(bào), 2008, 25(5):380-382.
[7] 黃智深, 錢海忠, 郭敏,等. 面狀居民地匹配骨架線傅里葉變化方法[J]. 測(cè)繪學(xué)報(bào), 2013, 42(6):913-921.
[8] 黃智深, 錢海忠, 王驍,等. 基于降維技術(shù)的面狀居民地匹配方法[J]. 測(cè)繪科學(xué)技術(shù)學(xué)報(bào), 2012, 29(1):75-78.
[9] 王驍, 錢海忠, 何海威,等. 利用空白區(qū)域骨架線網(wǎng)眼匹配多源面狀居民地[J]. 測(cè)繪學(xué)報(bào), 2015, 44(8):927-935.
[10] 郭黎, 崔鐵軍, 王豪,等. 基于面狀要素拓?fù)潢P(guān)系的數(shù)據(jù)匹配技術(shù)研究[J]. 測(cè)繪科學(xué), 2010, 35(1):130-132.
[11] 趙彬彬.多尺度矢量地圖空間目標(biāo)匹配方法及其應(yīng)用研究[D].長(zhǎng)沙:中南大學(xué),2011.
[12] 郭慶勝.地圖自動(dòng)綜合理論與方法[M].北京:測(cè)繪出版社,2002.
[13] 楊杰, 楊敏華. 基于信息熵的面狀要素在地圖綜合中的量測(cè)方法分析[J]. 測(cè)繪工程, 2012, 21(2):54-56.
[14] 武芳, 王家耀. 地圖自動(dòng)綜合概念框架分析與研究[J]. 測(cè)繪工程, 2002, 11(2):18-20.
[15] 張清林,林泉,周偉.基于多尺度公開版地圖數(shù)據(jù)庫(kù)的制圖綜合指標(biāo)與模型的建立研究[J].測(cè)繪與空間地理信息,2016,39(4):102-104,109.
[16] 王斌, 舒華忠, 施朝健,等. 一種基于輪廓線的形狀描述與匹配方法[J]. 電子與信息學(xué)報(bào), 2008, 30(4):949-952.
[17] 藍(lán)秋萍.地圖數(shù)據(jù)多尺度級(jí)聯(lián)更新方法研究[D].武漢: 武漢大學(xué),2010.
[18] LI Z L, YAN H, AI T, et al. Automated Building Generalization Based on Urban Morphology and Gestalt Theory[J]. International Journal of Geographical Information Science, 2004, 18(5):513-534.
[責(zé)任編輯:李銘娜]
Research on the method of multi-scale areal feature matching
LAN Zhenjia1, GUO Qingsheng1, LIU Jiping2, WANG Yong2
(1.School of Resource and Environment Science,Wuhan University,Wuhan 430079,China; 2. Chinese Academy of Surveying and Mapping, Beijing 100830,China)
The existing methods of areal feature matching mainly focus on the similar scale. According to the need of multi-scale areal feature matching, the reasons of causing 1∶M and M∶N matching relationships in map generalization and the differences between same entities caused by different map generalization operators are analyzed in this paper. Combining geometrical similarity model for 1∶1 matching relationship of areal features with the matching method based on overlap which is suitable for not 1∶1 matching relationship, the thresholds of indices can be determined automatically. A new adaptive method is proposed for multi-scale areal features matching. At last, the multi-scale residential data are taken as the experimental object to verify the feasibility and effectiveness of this method.
areal feature;multi-scale;matching;geometrical similarity;map generalization
著錄:藍(lán)振家,郭慶勝,劉紀(jì)平,等.多尺度面實(shí)體的匹配方法研究[J].測(cè)繪工程,2017,26(11):28-31.
10.19349/j.cnki.issn1006-7949.2017.11.006
2016-08-17
國(guó)家自然科學(xué)基金資助項(xiàng)目(41471384);公益性科研專項(xiàng)基金資助項(xiàng)目(201512032)
藍(lán)振家(1991-),男,碩士研究生.
TP75
A
1006-7949(2017)11-0028-04