溫 伯 威,馬 京 振,馬 超
(信息工程大學(xué),河南 鄭州 450052)
小比例尺多尺度居民地面/面目標(biāo)幾何不一致性探測方法
溫 伯 威,馬 京 振,馬 超
(信息工程大學(xué),河南 鄭州 450052)
不一致性探測是多源空間數(shù)據(jù)集成與融合、空間數(shù)據(jù)變化檢測與更新、多尺度地理信息數(shù)據(jù)一致性維護(hù)的重要環(huán)節(jié)。居民地作為現(xiàn)實世界中變化最活躍的地理要素之一,其在多尺度地理信息數(shù)據(jù)庫中表現(xiàn)出來的幾何不一致性問題十分突出。在分析多尺度居民地面/面目標(biāo)幾何不一致性根源的基礎(chǔ)上,將多尺度居民地面/面目標(biāo)幾何不一致分為實體表達(dá)狀態(tài)不一致和實體表達(dá)形態(tài)不一致。提出了利用實體表達(dá)狀態(tài)差異、空間位置差異、形狀差異、大小差異以及面積疊置率探測多尺度同名面狀居民地幾何不一致性的方法,并給出了具體的實驗步驟。實驗結(jié)果表明,該方法能夠識別出不同尺度數(shù)據(jù)中存在幾何不一致性的同名面狀居民地,不一致性探測結(jié)果可以作為多尺度居民地面/面目標(biāo)幾何一致性處理的依據(jù)。
多尺度居民地;同名實體匹配;幾何不一致性;空間位置差異;形狀差異;大小差異
一致性作為評價空間數(shù)據(jù)質(zhì)量的重要指標(biāo)[1],自20世紀(jì)90年代以來就吸引了學(xué)者的廣泛關(guān)注[2-4]??臻g數(shù)據(jù)的不一致性主要包括:幾何不一致性、語義不一致性及空間關(guān)系不一致性??臻g關(guān)系不一致性又分為方向關(guān)系不一致性、距離關(guān)系不一致性及拓?fù)潢P(guān)系不一致性[5,6]。目前,空間數(shù)據(jù)不一致性研究的對象多為相同尺度或者相近尺度的數(shù)據(jù)[7,8],研究成果主要集中在拓?fù)潢P(guān)系不一致性[9-11],多尺度地理信息數(shù)據(jù)的幾何不一致性研究相對薄弱。
長期以來,受制圖綜合與數(shù)據(jù)模型等因素的制約,不同尺度空間數(shù)據(jù)的生產(chǎn)、存儲、管理以及更新相互獨立,同一地理實體在不同尺度數(shù)據(jù)中的表達(dá)之間缺乏有機(jī)聯(lián)系,直接導(dǎo)致了多尺度地理信息數(shù)據(jù)的不一致性問題。多尺度地理信息數(shù)據(jù)之間的不一致性問題不僅嚴(yán)重影響著用戶的空間認(rèn)知,而且會造成地理信息應(yīng)用的混亂。
不一致性探測是進(jìn)行多尺度地理信息數(shù)據(jù)一致性處理的基礎(chǔ)和前提,可以為多尺度數(shù)據(jù)一致性處理提供科學(xué)依據(jù)。作為現(xiàn)實世界中變化最活躍的地理要素之一,居民地要素在多尺度地理信息數(shù)據(jù)庫中表現(xiàn)出來的幾何不一致性問題十分突出。本文以居民地面/面目標(biāo)為例研究了多尺度地理信息數(shù)據(jù)的幾何不一致性問題,提出了多尺度居民地面/面目標(biāo)的幾何不一致性探測方法。
1.1 多尺度地理信息數(shù)據(jù)幾何不一致性
尺度是空間數(shù)據(jù)的重要特征,反映了數(shù)據(jù)模擬真實世界的詳細(xì)程度。對于單一尺度的空間數(shù)據(jù),其不一致性是指由于數(shù)據(jù)表達(dá)違背某些約束引起的地理對象之間的矛盾和沖突問題[12]。多尺度地理信息數(shù)據(jù)幾何不一致性是指同一地理實體的幾何特征在不同尺度空間數(shù)據(jù)中的表達(dá)之間存在著邏輯矛盾[13]。例如,現(xiàn)實世界中名稱為靈井鎮(zhèn)的同一居民地在不同尺度空間數(shù)據(jù)中呈現(xiàn)出明顯的幾何不一致性(圖1)。多尺度地理信息數(shù)據(jù)之間的幾何不一致性問題不僅嚴(yán)重影響著用戶的空間認(rèn)知,而且會造成地理信息應(yīng)用的混亂。因此,如何發(fā)現(xiàn)多尺度地理信息數(shù)據(jù)之間的不一致性并進(jìn)行處理一直是數(shù)據(jù)生產(chǎn)者面臨的核心問題。
圖1 多尺度面狀居民地幾何不一致性示意
1.2 多尺度居民地面/面目標(biāo)幾何不一致性的根源
居民地在現(xiàn)實世界中發(fā)生的真實變化、作業(yè)員的經(jīng)驗和水平、資料來源差異、制圖綜合等因素都可能造成多尺度居民地面/面目標(biāo)之間的幾何不一致性問題。按成因的不同,多尺度居民地面/面目標(biāo)幾何不一致性的根源可以歸納為以下5類:
(2)人類認(rèn)知能力的局限性。空間數(shù)據(jù)描述現(xiàn)實世界的準(zhǔn)確性受到人類認(rèn)知能力的制約,盡管當(dāng)今最先進(jìn)測量儀器的精度可以達(dá)到毫米級別,但人們還是不能獲得居民地邊界的真值,而不同尺度的居民地數(shù)據(jù)是在不同的人類認(rèn)知水平下生產(chǎn)與更新的。
(3)生產(chǎn)與更新資料來源差異。生產(chǎn)與更新不同尺度居民地數(shù)據(jù)通常采用多種來源的資料,這些資料中的居民地數(shù)據(jù)在幾何精度、現(xiàn)勢性等方面存在著較大差異,這些差異是造成多尺度居民地面/面目標(biāo)幾何不一致性的重要原因之一。
(4)制圖綜合因素。不同尺度空間數(shù)據(jù)對居民地表達(dá)的詳細(xì)程度不同,在尺度變換中需要對居民地要素進(jìn)行綜合?;?、合并、概括、位移等制圖綜合操作都會在某種程度上改變面狀居民地的幾何特征,造成同一面狀居民地在不同尺度空間數(shù)據(jù)表達(dá)中存在幾何不一致性。
(5)誤差因素。在居民地數(shù)據(jù)獲取、采集、處理、使用的各個環(huán)節(jié)都可能產(chǎn)生誤差,而且誤差還具有傳播性。由于誤差因素的存在,同一居民地的幾何特征在不同空間數(shù)據(jù)表達(dá)中必然存在偏差。
1.3 多尺度居民地面/面目標(biāo)幾何不一致性分類
依據(jù)表現(xiàn)形式的不同,多尺度居民地面/面目標(biāo)的幾何不一致性可以分為以下兩類:1)實體表達(dá)狀態(tài)不一致,是指同一居民地在不同尺度空間數(shù)據(jù)中沒有同時表達(dá)。例如,某面狀居民地在較小比例尺空間數(shù)據(jù)中存在,在較大比例尺空間數(shù)據(jù)中消失,這種情況通常是由數(shù)據(jù)現(xiàn)勢性不同造成的。同時,制圖綜合也會造成實體表達(dá)狀態(tài)不一致,即面狀居民地在較大比例尺空間數(shù)據(jù)中存在,在較小比例尺空間數(shù)據(jù)中不存在。2)實體表達(dá)形態(tài)不一致,是指同一居民地的空間位置、面積、周長、形狀等幾何特征在不同尺度空間數(shù)據(jù)表達(dá)中存在著邏輯矛盾。實體表達(dá)狀態(tài)不一致又可以進(jìn)一步細(xì)分為:實體表達(dá)空間位置不一致、實體表達(dá)大小不一致、實體表達(dá)形狀不一致。生產(chǎn)與更新資料來源差異、制圖綜合因素、誤差因素等都可能造成多尺度同名面狀居民地的表達(dá)狀態(tài)不一致。
通過上述分析,制圖綜合是造成多尺度同名面狀居民地幾何不一致性的主要因素之一。由于制圖綜合造成的幾何不一致性符合數(shù)據(jù)生產(chǎn)要求和規(guī)范,不影響用戶的空間認(rèn)知,不需要處理。因此,本文所指的幾何不一致性是非制圖綜合造成的不一致,即重點探測真實變化、誤差等因素導(dǎo)致的多尺度居民地面/面目標(biāo)幾何不一致性。
本研究納入單純慢阻肺患者508例,慢阻肺來源ACO 295例,其中ACO錯失早期診斷時間為3(1,9)年,相比單純慢阻肺3(0.5,8)年,兩者無明顯差異(Z=-1.86,P=0.063)。單純慢阻肺肺功能FEV1%為53.8%±22.1%,ACO為53.1%±19.9%,兩組無統(tǒng)計學(xué)差異(t=0.376,P=0.707)。
2.1 多尺度居民地面/面目標(biāo)幾何不一致性探測思路
多尺度居民地面/面目標(biāo)幾何不一致性探測的研究對象為同名面狀居民地,旨在發(fā)現(xiàn)非制圖綜合因素造成的幾何不一致性。多尺度居民地面/面目標(biāo)幾何不一致性探測的思路為:利用實體表達(dá)狀態(tài)差異、空間位置差異、形狀差異、大小差異、面積疊置率5個指標(biāo)檢測存在幾何不一致性的同名面狀居民地。
2.2 多尺度居民地面/面目標(biāo)幾何不一致性探測指標(biāo)
2.2.1 實體表達(dá)狀態(tài)差異 實體表達(dá)狀態(tài)差異主要用來描述多尺度同名面狀居民在實體表達(dá)狀態(tài)方面的不一致性。面狀居民地在現(xiàn)實世界的出現(xiàn)、消失以及尺度變換都會引起居民地在多尺度地理信息數(shù)據(jù)庫中表達(dá)狀態(tài)的變化,真實變化與尺度變換造成的實體表達(dá)狀態(tài)差異在本質(zhì)上是不同的,尺度變換引起的實體表達(dá)狀態(tài)差異是合理的。因此,多尺度居民地面/面目標(biāo)實體表達(dá)狀態(tài)不一致探測的重點是發(fā)現(xiàn)真實變化造成的差異。多尺度居民地面/面目標(biāo)的表達(dá)狀態(tài)差異可以通過匹配模式判定,如1∶0與0∶1(大比例尺居民地在前)這兩類匹配模式下面狀居民地的表達(dá)狀態(tài)顯然是不同的。
2.2.2 空間位置差異 重心、質(zhì)心、邏輯中心等都可以反映面狀居民地的空間位置。鑒于質(zhì)心具有不受尺度變換影響等特點,本文采用質(zhì)心描述面狀居民地的空間位置。設(shè)P和Q分別為大比例尺和小比例尺面狀居民地,如圖2所示,Op和OQ分別為P和Q的質(zhì)心,DPQ為OP和OQ之間的距離,aP與aQ分別為P和Q外接矩形(MBR)的長軸,τD為P和Q的空間位置差異,則τD可表達(dá)為:
(1)
當(dāng)OP與OQ重合時,DPQ等于零,τD等于零,P與Q不存在空間位置差異;DPQ越大,τD越大,P與Q之間的空間位置差異越大。
圖2 空間位置差異的計算
2.2.3 形狀差異 形狀是面目標(biāo)的本質(zhì)特征之一,是多尺度居民地面/面目標(biāo)實體表達(dá)形態(tài)不一致性探測的重要指標(biāo)。不變矩是面目標(biāo)的全局形狀描述子,具有不隨幾何變換(旋轉(zhuǎn)、縮放、平移)變化的特點,是一種理想的形狀描述子[14]。設(shè)m1、m2、m3、m4、m5、m6、m7為面狀居民地P的7個矩不變量,n1、n2、n3、n4、n5、n6、n7為面狀居民地Q的7個矩不變量,τM為P和Q的形狀差異,采用文獻(xiàn)[15]中的方法計算矩不變量,則τM可表達(dá)為:
(2)
2.2.4 大小差異 大小是面狀居民地最直觀的特征。周長和面積都可以反映面狀居民地的大小,本文采用面積差描述面狀居民地的大小差異。設(shè)AP和AQ分別為P和Q的面積,τA為P和Q的面積差異,則τA可表達(dá)為:
(3)
2.2.5 面積疊置率 面積疊置率是一個綜合性探測指標(biāo),不僅可以反映同名面狀居民地的空間位置差異,還可以反映形狀差異和大小差異。設(shè)面狀居民地P和Q并集的面積為UPQ,IPQ為P和Q交集的面積,則面積重疊率τO為:
(4)
上述5個不一致性探測指標(biāo)適用的范圍和匹配模式有所不同。實體表達(dá)狀態(tài)差異適合探測1∶0與0∶1匹配模式下同名面狀居民地的幾何不一致性;空間位置差異、形狀差異適合探測1∶1匹配模式下同名面狀居民地的幾何不一致性;大小差異、面積疊置率適合探測1∶1、m∶1、1∶n、m∶n匹配模式下同名面狀居民地的幾何不一致性。
2.3 多尺度居民地面/面目標(biāo)幾何不一致性探測步驟
多尺度居民地面/面目標(biāo)幾何不一致性探測步驟如下:1)數(shù)據(jù)預(yù)處理。統(tǒng)一的數(shù)學(xué)基礎(chǔ)是進(jìn)行居民地數(shù)據(jù)疊置和同名實體匹配的基礎(chǔ),數(shù)據(jù)預(yù)處理主要是為了實現(xiàn)兩種尺度面狀居民地數(shù)據(jù)坐標(biāo)系、投影的統(tǒng)一,采用坐標(biāo)系和投影變換方法統(tǒng)一兩種尺度面狀居民地數(shù)據(jù)的數(shù)學(xué)基礎(chǔ)。2)同名實體匹配。目標(biāo)的屬性信息、幾何信息、拓?fù)湫畔⒍伎梢宰鳛榕卸ǘ喑叨染用竦孛婺繕?biāo)與面目標(biāo)匹配的依據(jù)。當(dāng)兩種尺度下居民地面目標(biāo)的屬性結(jié)構(gòu)相同且屬性信息完整時,采用目標(biāo)的屬性信息作為匹配依據(jù),例如,若不同尺度居民地面目標(biāo)的名稱、類型、人口等屬性信息相同則判定兩者為同名實體;當(dāng)屬性結(jié)構(gòu)不同或者屬性信息不完整時,采用目標(biāo)的幾何信息和拓?fù)湫畔⒆鳛槠ヅ湟罁?jù)。對大比例尺空間數(shù)據(jù)與小比例尺空間數(shù)據(jù)中的同名面狀居民地以及匹配模式做標(biāo)記。3)依據(jù)匹配模式,計算幾何不一致性探測各個指標(biāo)的值。采用2.2節(jié)定義的不一致性探測指標(biāo)計算方法分別計算同名面狀居民地之間的空間位置差異、形狀差異、大小差異以及面積疊置率。4)根據(jù)指標(biāo)值判斷多尺度居民地面/面目標(biāo)的幾何不一致性。分別比較τD與空間位置差異閾值εD、τM與形狀差異閾值εM、τA與大小差異閾值εA、τO與面積疊置率閾值εO之間的大小,當(dāng)τD、τM、τA中任何一項指標(biāo)值大于對應(yīng)閾值或者τO小于εO,即判定多尺度居民地面/面目標(biāo)存在幾何不一致性。
為了驗證本文提出的多尺度居民地面/面目標(biāo)幾何不一致性探測方法的合理性和科學(xué)性,選取同一地區(qū)的1∶50萬與1∶100萬面狀居民地數(shù)據(jù)作為實驗對象。1∶50萬數(shù)據(jù)包含70個面狀居民地,1∶100萬數(shù)據(jù)包含14個面狀居民地。兩種數(shù)據(jù)疊置在一起的效果如圖3所示,虛線表示的面目標(biāo)為1∶100萬中的面狀居民地,實線表示的面目標(biāo)為1∶50萬中的面狀居民地。
圖3 實驗數(shù)據(jù)概況
采用文中方法進(jìn)行同名面狀居民地匹配,得到的1∶0、1∶1、0∶1、m∶1、1∶n、m∶n匹配數(shù)目分別為50、9、0、3、0、1。根據(jù)空間數(shù)據(jù)生產(chǎn)規(guī)范可以得知,在1∶100萬數(shù)據(jù)中圖上面積大于12 mm2的居民地采用面狀符號表示。分別計算1∶50萬數(shù)據(jù)中屬于1∶0匹配模式面狀居民地的圖上面積,并與12 mm2進(jìn)行比較。計算結(jié)果表明屬于1∶0匹配模式面狀居民地的圖上面積均小于12 mm2。因此,不存在非制圖綜合因素造成的幾何不一致性。
采用空間位置差異、形狀差異、大小差異、面積疊置率對1∶1、m∶1、1∶n、m∶n匹配模式下的同名面狀居民地進(jìn)行幾何不一致性探測。為了判定1∶1、m∶1、1∶n、m∶n匹配模式下同名面狀居民地之間是否存在幾何不一致性,需要確定εD、εM、εA、εO的值,如何評估制圖綜合對多尺度同名面狀居民地幾何不一致性的影響是確定εD、εM、εA、εO值的關(guān)鍵。由于制圖綜合對同名面狀居民地幾何不一致性的影響難以定量化表達(dá),本文根據(jù)制圖專家經(jīng)驗,分別取10%、15%、15%、85%作為εD、εM、εA、εO的值。對于1∶1匹配模式下的同名面狀居民地,若其空間位置差異、形狀差異、大小差異有任何一項大于對應(yīng)閾值或者面積疊置率小于85%,則判定實體表達(dá)形態(tài)不一致。對于m∶1模式下的同名面狀居民地,若其大小差異大于15%或者面積疊置率小于85%,則判定實體表達(dá)形態(tài)不一致。1∶50萬與1∶100萬居民地面/面目標(biāo)幾何不一致性的探測結(jié)果如表1所示。通過表1分析可以得知,存在幾何不一致性的同名面狀居民地共有8對,其中包括4對1∶1匹配,3對m∶1匹配,1對m∶n匹配。
表1 1∶50萬與1∶100萬同名面狀居民地幾何不一致性探測結(jié)果
為了驗證探測結(jié)果的可靠性,采取人工方式對多尺度同名面狀居民地幾何不一致性探測結(jié)果進(jìn)行檢驗。圖4是其中的3組同名面狀居民地樣本數(shù)據(jù),其中圖4a、圖4b、圖4c分別對應(yīng)著表1中序號為12、2、3的同名面狀居民地。從圖中可以看出,圖4a中的同名面狀居民地在不同尺度空間數(shù)據(jù)中的表達(dá)差異是由制圖綜合造成的;圖4b、圖4c中的同名面狀居民地的大小、形狀在不同尺度空間數(shù)據(jù)中表現(xiàn)出了較大差異,顯然,這種差異不是制圖綜合因素引起的,而是居民地在現(xiàn)實世界的變化沒有同步更新至1∶50萬、1∶100萬空間數(shù)據(jù)導(dǎo)致的。因此,圖4a中的同名面狀居民地不存在幾何不一致性,圖4b、圖4c中的同名面狀居民地存在幾何不一致性。通過比較表1中3組同名面狀居民地幾何不一致性的探測結(jié)果與人工判斷結(jié)果,可以得出如下結(jié)論:1)位置差異、形狀差異、大小差異、面積疊置率能夠識別出不同尺度數(shù)據(jù)中存在幾何不一致性的同名面狀居民地;2)探測結(jié)果可以作為多尺度居民地面/面目標(biāo)幾何不一致性處理的依據(jù)。
圖4 3組同名面狀居民地樣本數(shù)據(jù)
不一致性探測是多源空間數(shù)據(jù)集成與融合、空間數(shù)據(jù)變化檢測與更新、多尺度地理信息數(shù)據(jù)一致性維護(hù)的重要環(huán)節(jié)。本文提出采用實體表達(dá)狀態(tài)差異、空間位置差異、形狀差異、大小差異以及面積疊置率探測多尺度居民地面/面目標(biāo)的幾何不一致性,并進(jìn)行了實驗驗證。本文提出的幾何不一致性探測方法使用的各個閾值是基于制圖專家經(jīng)驗確定的,因此,存在一定的主觀性和局限性。采用多類型樣本數(shù)據(jù)進(jìn)行反復(fù)實驗使閾值的設(shè)置更加合理和科學(xué)是下一步工作的重點。
[1] KAINZ W.Logical consistency[A].GUPTILL S C,MORRISON J L.Elements of Spatial Data Quality[C].Oxford:Elsevier,1995.109-137.
[2] CORCORAN P,MOONEY P.Planar and non-planar topologically consistent vector map simplification[J].International Journal of Geographical Information Science,2011,25(10):1659-1680.
[3] 鄭春燕,胡華科.居民地與道路之間拓?fù)潢P(guān)系一致性的模糊評價[J].測繪科學(xué),2012,37(1):165-167.
[4] 杜世宏,雒立群,趙文智,等.多尺度空間關(guān)系研究進(jìn)展[J].地球信息科學(xué)學(xué)報,2015,17(2):135-146.
[5] 簡燦良.多比例尺地圖數(shù)據(jù)不一致性探測與處理方法研究[D].武漢:武漢大學(xué),2013.
[6] 朱蕊.一種面向道路要素更新的幾何位置一致性處理方法[J].測繪科學(xué)技術(shù)學(xué)報,2014,31(2):191-193.
[7] 詹陳勝,武芳,翟仁健,等.基于拓?fù)湟恢滦缘木€目標(biāo)空間沖突檢測方法[J].測繪科學(xué)技術(shù)學(xué)報,2011,28(5):387-390.
[8] GADISH D.Inconsistency Detection and Adjustment of Spatial Data Using Rule Discovery[D].Guelph:University of Guelph,2001.42-59.
[9] 陳佳麗,易寶林,任艷.基于對象匹配方法的多重表達(dá)中的一致性處理[J].武漢大學(xué)學(xué)報(工學(xué)版),2007,40(3):115-119.
[10] 王少華,鐘耳順,李紹俊,等.面向矢量數(shù)據(jù)疊加分析的拓?fù)湟恢滦蕴幚硌芯縖J].地理與地理信息科學(xué),2015,31(1):12-16.
[11] LIU W Z,CHEN J,ZHAO R L,et al.A refined line-line spatial relationship model for spatial conflict detection[A].Perspectives in Conceptual Modeling[C].Springer Berlin Heidelberg,2005.239-248.
[12]EGENHOFER M.Pre-processing queries with spatial constrains[J].Photogrammtric Engineering & Remote Sensing,1994,60(6):783-970.
[13] SHEEREN D,MUSTIRE S,ZUCKER J.How to integrate heterogeneous spatial databases in a consistent way[A].Advances in Databases and Information Systems[C].Springer Berlin Heidelberg,2004.364-378.
[14] 劉亦書,楊力華,孫倩.輪廓矩不變量及其在物體形狀識別中的應(yīng)用[J].中國圖像圖形學(xué)報,2004,9(3):308-312.
[15] AL-BAKRI M.Developing Tools and Models for Evaluating Geospatial Data Integration of Official and VGI Data Sources[D].Newcastle:Newcastle University,2012.109-114.
Geometry Inconsistency Detection Method of Multi-scale Corresponding Area Habitation for Small Scale
WEN Bo-wei,MA Jing-zhen,MA Chao
(InformationEngineeringUniversity,Zhengzhou450052,China)
Inconsistency detection is an important step of multi-source spatial data integration and fusion,spatial data change detection and updating,and multi-scale spatial data consistency maintenance.As one of the most active change elements in the real world,the geometry inconsistency problem of habitation in multi-scale spatial database is very serious.On the base of analyzing geometry inconsistency root,geometry inconsistency of the same area habitation was divided into entity expression status inconsistency and entity expression shape inconsistency.Geometry inconsistency detection method of the same area habitation was proposed in this paper,which utilized the differences of object′s expression state,spatial location,shape,size and area overlap ratio,and the specific experimental steps were given in this paper.The results showed that this method could recognize the same area habitation that had geometry inconsistency in multi-scale data,and the inconsistency detection results could provide basis for multi-scale corresponding area habitation consistency processing.
multi-scale habitation;same entity matching;geometry inconsistency;spatial location difference;shape difference;size difference
2016-01-27;
2016-05-25
國家自然科學(xué)基金項目(41201391、41571399)
溫伯威(1986-),男,博士,研究方向為多源空間數(shù)據(jù)融合、多尺度地理信息數(shù)據(jù)一致性處理。E-mail:GIS0803@163.com
10.3969/j.issn.1672-0504.2016.06.002
P208
A
1672-0504(2016)06-0007-05