聞 俏 蔡紅玥 逯躍鋒,3*
(1、山東理工大學(xué) 建筑工程學(xué)院工程學(xué)院,山東 淄博255049 2、中國交通通信信息中心,北京100011 3、中國科學(xué)院地理科學(xué)與資源研究所 資源與環(huán)境信息系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,北京100101)
對現(xiàn)實(shí)世界中地理實(shí)體以空間數(shù)據(jù)對其進(jìn)行表達(dá)時,由于觀測尺度、應(yīng)用需求等不同,導(dǎo)致產(chǎn)生不同比例尺的空間數(shù)據(jù)[1],匹配技術(shù)成為數(shù)據(jù)融合的主要途徑,是目前研究的難點(diǎn)[2]??臻g數(shù)據(jù)匹配就是通過分析空間實(shí)體的差異和相似性識別出不同來源圖中表達(dá)現(xiàn)實(shí)世界同一地物或地物集(即同名實(shí)體)的過程[3]。
目前所采用的匹配方法中,采用的特征指標(biāo)主要有長度、面積、方向、形狀、距離等[4-5],文獻(xiàn)[6]所用方法利用數(shù)據(jù)的語義關(guān)系進(jìn)行識別和融合。本文基于幾何特征提出基于最小凸包的形狀描述子,結(jié)合方向、長度、節(jié)點(diǎn)度、Hausdorff 距離等相似度度量指標(biāo)構(gòu)建綜合空間相似度度量模型,將此模型與其他指標(biāo)構(gòu)建的空間相似度模型進(jìn)行比較以驗(yàn)證本文方法的有效性。
圖1 線實(shí)體最小凸包構(gòu)造原理
其中,T1和T2分別是PL1、PL2有序點(diǎn)集構(gòu)建的最小凸包,D1和D2為PL1、PL2的長度。
將線狀矢量對象的方位角、長度、節(jié)點(diǎn)度、Hausdorff 距離與基于最小凸包的形狀描述子等相似度度量以向量組的形式加權(quán)綜合構(gòu)建綜合空間相似度度量模型。各度量指標(biāo)如下:
長度:一種常用的線實(shí)體線實(shí)體PL1、PL2的長度之差C2。
方向:線實(shí)體首尾節(jié)點(diǎn)所連直線的方位角。線實(shí)體PL1、PL2的方向之差為C3。
距離:本文采用Hausdorff 距離表示線實(shí)體間的距離,設(shè)有線實(shí)體PL1、PL2距離計算公式如下:
設(shè)已知兩個線狀矢量數(shù)據(jù)集分別A 和B,且以A 為參考數(shù)據(jù)集、B 為目標(biāo)數(shù)據(jù)集。根據(jù)綜合相似度模型的具體匹配步驟為:
3.2.1 數(shù)據(jù)預(yù)處理。對來自不同尺度下數(shù)據(jù)集統(tǒng)一坐標(biāo)系,使各個空間對象之間的關(guān)系一致。
3.2.2 通過等間距距離插值方法對線實(shí)體來均勻增加線實(shí)體特征點(diǎn)數(shù)。
3.2.3 根據(jù)參考數(shù)據(jù)集生成線實(shí)體泰森多邊形確定候選匹配集。
在上述公式中,TP 是正確的匹配對數(shù)量,F(xiàn)P 是錯誤匹配的匹配對數(shù)量,F(xiàn)N 是漏匹配的匹配對數(shù)量。
本文實(shí)驗(yàn)數(shù)據(jù)采用某縣級市的1:50 000 和1:250 000 的不同比例尺的數(shù)據(jù)集。通過對已匹配實(shí)體進(jìn)行隨機(jī)取樣,獲得正例樣本,計算各樣本差異度和綜合相似度,得到各指標(biāo)的權(quán)值和綜合相似度閾值0.75,表1 為各指標(biāo)的權(quán)重值。根據(jù)3.2 節(jié)中數(shù)據(jù)處理、匹配步驟以及5 個描述子提取計算,對兩數(shù)據(jù)集進(jìn)行匹配試驗(yàn)。
表1 指標(biāo)的權(quán)重
本文將1:250 000 道路數(shù)據(jù)作為參考數(shù)據(jù)集,將1:50 000道路數(shù)據(jù)作為目標(biāo)數(shù)據(jù)集(待匹配數(shù)據(jù)集)。通過生成路段泰森多邊形構(gòu)建參考路段道路匹配單元,與待匹配數(shù)據(jù)集進(jìn)行空間相交,得到匹配候選集,最后遍歷匹配單元與匹配候選集中路段完成相似度評價。
圖2 算法匹配精度
表2 為添加本文所提描述子前后的對比結(jié)果,從中可以看出,本文方法相比僅采用其余4 種描述子的匹配方法,減少了誤匹配和漏匹配,且正確匹配對數(shù)由36 增加到40。由圖2 可知,通過在匹配過程中增加基于最小凸包的形狀描述子,查準(zhǔn)率和查全率分別提高2.5%、6.5%,相應(yīng)的,F(xiàn)-score 值從87.6%提高到了92.3%,該匹配精度結(jié)果說明了增加本文所提出的形狀描述子的算法正確率更高,有效提高了多尺度線實(shí)體匹配精度。
通過對某縣級市道路矢量數(shù)據(jù)集進(jìn)行匹配試驗(yàn),經(jīng)添加基于最小凸包的形狀描述子,與長度、方向、節(jié)點(diǎn)度、Hausdorff 距離所構(gòu)建的基于5 種指標(biāo)的綜合相似度模型,能夠增加描述矢量數(shù)據(jù)實(shí)體的形狀細(xì)節(jié)特征,提高了實(shí)體匹配相似度,減少漏匹配與誤匹配,相較于4 種指標(biāo)的匹配算法F-score 值提高了4.7%。表明本文所提綜合相似度模型能夠在不同尺度、不同時相下的數(shù)據(jù)集中有效,并且具有較高的匹配質(zhì)量和準(zhǔn)確率。