李雙銀,王麗君,曹亞妮
(1.61243部隊,甘肅蘭州 730020;2.信息工程大學地理空間信息學院,河南鄭州 450052;3.西安衛(wèi)星測控中心,陜西西安 710043;4.地理信息工程國家重點實驗室,陜西西安 710054)
空間數(shù)據(jù)的規(guī)范性、完整性和精確性決定了地理信息應用的廣度和深度。空間數(shù)據(jù)的質量問題是一個關系到數(shù)據(jù)庫可靠性和地理信息服務可信性的重要問題,與規(guī)劃決策任務的成敗密切相關。然而,從矢量地圖數(shù)據(jù)的獲取、生產到可視化表達,從矢量地圖數(shù)據(jù)的處理、變換到應用,都不可避免地會出現(xiàn)數(shù)據(jù)質量問題,如數(shù)據(jù)形式不正確、幾何結構被破壞、屬性值缺失或錯誤、數(shù)據(jù)不完備、拓撲關系不正確等,這些質量問題都屬于數(shù)據(jù)缺陷。
矢量地圖數(shù)據(jù)缺陷是指矢量地圖數(shù)據(jù)的質量缺陷,即不符合地圖數(shù)據(jù)生產作業(yè)規(guī)范的數(shù)據(jù)質量問題。如圖1、圖2所示為常見的屬性缺陷,圖3所示為常見的空間關系缺陷。地圖數(shù)據(jù)缺陷可能會造成地圖數(shù)據(jù)的形式不夠統(tǒng)一,或造成地理目標間的空間關系不能正確表達現(xiàn)實世界對應地理實體間的空間關系。因此,矢量地圖數(shù)據(jù)缺陷給地圖數(shù)據(jù)的統(tǒng)一管理、有效共享和綜合應用帶來極大的困難[1]。
矢量地圖數(shù)據(jù)缺陷自動識別方法的研究已經成為空間數(shù)據(jù)生產、共享與融合、空間數(shù)據(jù)自動更新、空間數(shù)據(jù)質量評估與一致性檢測等空間數(shù)據(jù)諸多有效應用的一個必然需求,具有十分重要的理論研究意義與實際應用價值。矢量地圖數(shù)據(jù)缺陷的類型主要有兩種:空間關系缺陷和屬性缺陷,因此本文主要對這兩類缺陷的識別方法進行分析。
圖1 公路橋長的屬性值與圖上量算值之差超限Fig.1 The difference of attribute value between metrical value of highway bridge is overrun
圖3 空間關系缺陷Fig.3 Spatial relationship defects
空間關系缺陷的自動識別方法主要有3種:基于空間關系計算的空間沖突檢測方法;基于拓撲規(guī)則約束的空間沖突檢測方法和基于規(guī)則發(fā)現(xiàn)的空間沖突檢測方法。
基于空間關系計算的空間沖突檢測方法的基本思路是:
1)建立空間沖突的判斷規(guī)則;
2)對數(shù)據(jù)庫中地理目標之間的空間關系進行計算和形式化表達;
3)將計算出的關系與規(guī)則匹配,判斷是否為空間沖突;
4)對空間沖突進行確認。
其中,空間關系的細化計算和形式化表達是關鍵。集成描述的基本形式主要有兩種,表格法和矩陣法[3-6]。集成描述的基本形式實質上是一個集成表達的框架,在此框架的基礎上,將其他信息填入其中。表格法的優(yōu)點是看起來相對直觀,但不利于形式化表達和計算,即不利于計算機實現(xiàn);而矩陣法恰恰相反,在計算機實現(xiàn)方面有一定優(yōu)勢。如表1所示為復雜空間關系集成描述的表格法[5],而式(1)所示為復雜空間關系集成描述的矩陣法[7]。
表1 復雜空間關系集成描述的表格法Tab.1 Table of complex spatial relation integrated description
圖2 公路編號為空Fig.2 The number of highway is null
在空間關系集成表達的基礎上,劉萬增重點研究了線線之間的空間沖突檢測方法,定義了一些規(guī)則,從語義匹配、空間關系匹配和行為匹配3個層次,依次將這些規(guī)則與先驗規(guī)則進行匹配來判斷是否發(fā)生了空間關系沖突[3,8];吳長彬以地籍對象為實例,以9交模型為基礎,探索了一種適合復雜對象和時空對象的拓撲關系表達模型,較好地解決了地籍對象中各類要素間拓撲關系的描述和應用問題,實現(xiàn)了基于空間拓撲關系規(guī)則的地籍數(shù)據(jù)庫質量檢查[9-10];詹陳勝以線-線關系為例,建立了基于空間關系一致性的空間沖突檢測模型,探討了基于九交模型的線目標間拓撲關系的描述與計算,在此基礎上對地圖數(shù)據(jù)在多尺度表達時產生的空間沖突進行了檢測實驗[11]。
上述學者從空間關系細化描述與計算的角度對空間沖突檢測方法進行了不同程度的研究,但還存在以下不足:空間沖突檢測規(guī)則的定義不夠完備,對空間沖突檢測規(guī)則的管理、應用等方面考慮較少,檢測方法的靈活性與通用性等方面還有待加強。
這種方法通過建立或定義目標之間的拓撲規(guī)則約束來檢查目標之間的空間關系與它們的語義關系是否相矛盾。Kufoniyi、Cockroft、Dahmani、Ubeda、Servigne 等都對此類方法進行了研究[13-16]。ArcGIS軟件中提供了部分針對特定類型的拓撲錯誤檢測功能,通過創(chuàng)建和定義要素之間的拓撲規(guī)則、容差等來檢測和標示拓撲錯誤[3,12]。這些研究僅對特定類型的拓撲沖突檢測有效,缺乏系統(tǒng)性,難以滿足矢量地圖數(shù)據(jù)缺陷自動識別的實際應用需求。
在Oracle9i中,提供了11種基本空間拓撲關系查詢的操作算子:DISJOINT(邊界和內部均不相交),TOUCH(僅邊界相交),EQUAL(相等),OVERLAPBYINTERSECT(邊界和內部相交),CONTAINS(包含),COVERS(包含且邊界相交),INSIDE(CONTAINS的逆),COVEREDBY(COVERS 的逆),ANYINTERACT(A,B兩個實體有任意交集),OVERLAPBYDISJOINT(A實體的內部與B實體的內部和邊界相交,但是它們的邊界不相交),ON(A實體的內部和邊界在B實體的邊界上,并且B實體必須COVERS A實體)[17-18]。但是,這些算子無法計算和判斷復雜的空間拓撲關系,更無法直接應用于實際生產。
Gadish[10-11]提出了基于規(guī)則發(fā)現(xiàn)的空間沖突檢測方法,這是一種數(shù)理統(tǒng)計的方法。首先選擇關系正確的圖幅,采用4交模型計算目標間的拓撲關系,對計算結果進行統(tǒng)計分析,選擇概率最大的關系作為目標間的關系規(guī)則,進而結合語義關系來檢測面目標之間的拓撲關系沖突。任艷提出了一種空間拓撲規(guī)則發(fā)現(xiàn)機制,該機制通過分析空間對象及其與鄰對象間的拓撲關系及語義信息得到拓撲規(guī)則,利用該拓撲規(guī)則來檢測空間數(shù)據(jù)是否存在不一致[19-20]。另外,還有一些學者采用粗糙集的方法抽取地學現(xiàn)象內蘊含的主要空間關系規(guī)則,并將其用于地學問題的求解[21-23]。
但是,采用這種方法存在以下兩個問題:一方面該方法首先需要根據(jù)先驗知識進行所研究問題的可能性空間關系的選取,由此一定程度上受先驗知識的限制,不同的人采用同樣的方法可能會得出不同的實驗結果;另外得到的規(guī)則取決于所選取的樣本圖幅,帶有較多的不確定性因素,難以得到完備而確定的規(guī)則,在一定程度上可能會造成缺陷的漏檢和誤檢。
目前的研究主要集中于空間關系缺陷的自動識別,而對屬性缺陷自動識別的研究較少。屬性缺陷的自動識別方法主要有兩種:SQL查詢法和匹配法。
本方法的基本思路是將需要檢查的數(shù)據(jù)進行轉換,然后采用SQL查詢的方法來檢索數(shù)據(jù)屬性字段中不符合要求的數(shù)據(jù)[23]。這種方法需要對數(shù)據(jù)進行轉換處理,不僅消耗大量時間,操作復雜,而且在轉換過程中可能會引起數(shù)據(jù)質量的變化。另外,這種方法僅針對一些屬性缺陷有效,如編碼長度不合理、層碼不合法、屬性不唯一、屬性空值等缺陷,而對其他屬性缺陷無能為力,如橋長與輸入值不符、屬性編碼與要素類型不符等屬性之間邏輯錯誤。
匹配法首先定義標準的屬性項,包括所有的屬性項、屬性項的定義;然后將標準的屬性項定義與從數(shù)據(jù)中讀出的屬性項定義寫成同一種數(shù)據(jù)格式,如文本數(shù)據(jù)格式;進而應用程序進行比較檢查。如果讀取的結果與標準不一致,則認為產生缺陷,將缺陷記錄到數(shù)據(jù)庫中[24]。這種方法比較適用于對屬性項的值進行檢查,而對非法字符、字段長度不合規(guī)定、屬性之間的邏輯錯誤等屬性缺陷的識別不太適合,應用范圍比較有限。
通過對研究現(xiàn)狀的分析,可以看出國內外學者對矢量地圖數(shù)據(jù)缺陷自動識別問題進行了一些積極的探索。但是,目前在該領域仍然存在許多突出的問題沒有得到有效解決,主要集中在以下幾個方面:
1)復雜空間關系集成表達方法在通用性、實用性等方面還有所欠缺,模型性能評價方面缺少明確的衡量指標。
在矢量地圖數(shù)據(jù)中,大多數(shù)地理目標之間的關系都屬于復雜空間關系,因此,空間關系缺陷的自動識別需要對復雜空間關系的細化描述與集成表達進行研究,但目前還存在以下問題:
①成熟的空間關系描述模型,4交模型、9交模型等無法對復雜空間關系進行區(qū)分和描述。
②目前提出的復雜空間關系集成表達模型還不夠成熟,如集成表達模型描述的空間關系不夠直觀,不利于空間關系的比較和判斷;一些交分量的分解粒度太小,較為復雜[27],不利于理解、記憶與使用;依據(jù)描述方法或模型,較難復原空間拓撲關系圖,而空間拓撲關系的場景復原在實際應用中具有重要意義。
③對集成描述方法的優(yōu)劣性缺乏評判指標;模型的通用性較差,一些模型僅適合于一些特定的領域。
2)矢量地圖數(shù)據(jù)缺陷自動識別規(guī)則的研究較少,尤其是規(guī)則的表現(xiàn)形式、測試條件、如何管理、如何應用等方面還缺乏系統(tǒng)的理論研究。
對矢量地圖數(shù)據(jù)缺陷自動識別來說,一種理想的方案是:建立統(tǒng)一的缺陷自動識別規(guī)則庫,據(jù)此開發(fā)專門的數(shù)據(jù)檢查系統(tǒng),完成數(shù)據(jù)的自動檢查[25],但對于如何建立空間拓撲關系規(guī)則庫缺乏更深入的研究。
規(guī)則是矢量地圖數(shù)據(jù)缺陷自動識別最可靠的基礎[26],雖然當前有學者對自動識別規(guī)則進行了研究,但并未構建完善的規(guī)則庫,更未見規(guī)則庫管理、應用等方面的系統(tǒng)研究。另外,對缺陷識別規(guī)則的關鍵環(huán)節(jié)認識不夠清楚。本文認為缺陷識別規(guī)則的建立有兩個關鍵問題,即規(guī)則的表現(xiàn)形式和測試條件。就目前研究來說,規(guī)則的表現(xiàn)形式方面,對缺陷信息的描述不夠全面,如在當前測試條件下缺陷識別結果的可靠性、產生缺陷的地理實體目標、缺陷的等級等信息在規(guī)則中缺乏描述;而規(guī)則的測試條件方面,存在測試條件不清楚、不完備的情況。
3)矢量地圖數(shù)據(jù)缺陷識別方法的研究不夠全面和實用,靈活性和自適應性有待增強,缺少較為成體系的方法論對其進行指導。
目前,在空間沖突檢測方面,普遍對拓撲-語義缺陷自動識別的研究較為重視,而對其他缺陷識別方法的研究不夠。如屬性缺陷識別的具體實現(xiàn)方法雖然簡單,但是屬性缺陷識別對地圖數(shù)據(jù)質量的意義非常重大,而且在質量檢查時非?,嵥?,缺少較為成體系的方法論對其進行指導。另外,由于矢量地圖數(shù)據(jù)的質量缺陷與所采用的編碼、規(guī)范、數(shù)據(jù)結構、采集標準、具體要求等多種因素關系密切,且面向不同的生產與保障任務,這就導致現(xiàn)有的數(shù)據(jù)缺陷檢查與識別算法通用性較差,靈活性和自適應性有待增強。
因此,針對上述存在問題,矢量地圖數(shù)據(jù)缺陷自動識別方法進一步研究方向應當重點從空間關系的集成表達模型;矢量地圖數(shù)據(jù)缺陷自動識別規(guī)則以及任務自適應的缺陷自動識別方法3個問題入手。
[1]曹亞妮.矢量地圖數(shù)據(jù)缺陷自動識別的理論與方法研究[D].鄭州:中國人民解放軍信息工程大學,2014.
[2]翟仁健.基于全局一致性評價的多尺度矢量空間數(shù)據(jù)匹配方法研究[D].鄭州:中國人民解放軍信息工程大學,2011.
[3]劉萬增.GIS數(shù)據(jù)庫更新中空間沖突自動檢測方法[M].北京:測繪出版社,2009.
[4]鄧敏,李志林,祁華斌.GIS線目標間空間關系的集成表達方法[J].測繪學報,2007,36(4):421 -427.
[5]鄧敏,徐銳,李光強,趙偉.GIS面目標間空間關系的集成表達方法[J].計算機工程與應用,2009,49(2):39 -43.
[6]林艷,劉萬增,韓剛.一種單線與多面要素間的拓撲關系描述方法[J].測繪科學,2013,38(2):128 -131.
[7]劉萬增,陳軍,鄧喀中,等.線線空間關系描述的拓撲鏈模型[J].中國礦業(yè)大學學報,2010,39(1):75 -79.
[8]劉萬增,趙仁亮.水系要素更新中空間沖突的自動檢測研究[C]//中國GIS年會第八屆年會論文集.北京:中國地理信息系統(tǒng)協(xié)會,2004:145-152.
[9]吳長彬,閭國年.線面拓撲和度量關系的細分描述和計算方法[J].計算機輔助設計與圖形學學報,2009,21(11):1551 -1557.[10]GADISH D A.Inconsistency Detection and Adjustment of Spatial Data using Rule Discovery[D].Canada:University of Guelph,2001.
[11]吳長彬.地籍對象的拓撲關系表達與計算方法研究[D].南京:南京師范大學,2009.
[12]詹陳勝.多尺度數(shù)據(jù)庫中空間沖突自動檢測方法研究——以線要素為例[D].鄭州:中國人民解放軍信息工程大學,2012.
[13]SERVIGNE S,UBEDA T,PURICELLI A,et al.A methodology for spatial consistency improvement of geographic database[J].Geoinformatica,2000(1):7 -34.
[14]KUFONIYIO.Spatial coincidence modeling,automated database updating and data consistency in vector GIS[D].Holland:International Institute for Aerospace Survey and Earth Science,1995.
[15]DAHMANI H K.Updating in GIS:towards a more generic approach[C]//Proceedings of the 20thInternational Cartographic Conference.Beijing,China,2001:1463 -1471.
[16]UBEDA T,EGENHOFER M J.Topological error correcting in GIS
[C].In:M.Scholl and A.Proceedings of advances in Spatial Databases SSD'97.Berlin,Germany,Springer,1997:283 -297.
[17]王禮江,岳國森,程衛(wèi)興.基于Oracle Spatial的空間線線拓撲關系判斷的實現(xiàn)[J].測繪學報,2006,35(1):77 -82.
[18]喬柱,岳國森.基于Oracle Spatial的空間線/面拓撲關系判斷的實現(xiàn)[J].測繪與空間地理信息,2008,31(1):130 -134.
[19]任艷.空間拓撲一致性維護研究[D].武漢:華中師范大學,2007.
[20]任艷,易寶林,陳佳麗.基于規(guī)則的空間一致性維護[J].計算機工程,2007,33(19):93 -95.
[21]BEAUBOUEF T,PETRYE F,LADNER R.Spatial Data Methods and Vague Regions:A Rough Set Approach[J].Applied Soft Computing,2007,7(1):425 -440.
[22]BITTNER T,STELL G J.Rough Sets in Approximate Spatial Reasoning[J].Heidelberg,SpringerBerlin,2001:445 -453.
[23]曹峰,杜云艷,葛詠,等.基于粗糙集的地學空間關系規(guī)則抽取和應用[J].地球信息科學學報,2009,11(2):139 -144.
[24]袁淑芳.城市基礎地理信息系統(tǒng)中矢量數(shù)據(jù)質量控制[D].成都:西南交通大學,2006.
[25]曾衍偉.空間數(shù)據(jù)質量控制與評價技術體系研究[D].武漢:武漢大學,2004.
[26]吳長彬.地籍對象的拓撲關系表達與計算方法研究[D].南京:南京師范大學,2009.
[27]周曉光,陳軍,蔣捷,等.地籍地塊間的空間拓撲關系[J].測繪學報,2003,32(4):356 -361.
[28]陳斐.細分拓撲計算及其在更新中的應用[D].長沙:中南大學,2012.