李柯樺
(云南省測繪工程院,云南 昆明 650031)
研究如何高效地從∶測繪工程生產(chǎn)的AutoCAD地形圖中提取地形要素對于空間數(shù)據(jù)庫的構(gòu)建尤為重要,GIS數(shù)據(jù)與CAD數(shù)據(jù)在設(shè)計與應(yīng)用上的初衷不同,導(dǎo)致二者在數(shù)據(jù)結(jié)構(gòu)上的差異很大。目前,多種商業(yè)軟件如FME、EPS、ArcGIS等都提供了GIS數(shù)據(jù)與CAD數(shù)據(jù)的轉(zhuǎn)換方式,提高了內(nèi)業(yè)數(shù)據(jù)處理效率。但是,此類商業(yè)軟件轉(zhuǎn)換后的數(shù)據(jù)都存在屬性丟失或圖形錯誤等問題,無法直接進行數(shù)據(jù)入庫。
針對數(shù)據(jù)轉(zhuǎn)換中存在的問題,很多學(xué)者進行了研究,王化娟使用FME軟件對CAD數(shù)據(jù)與GIS數(shù)據(jù)之間的轉(zhuǎn)換關(guān)系進行研究,并且分析與處理了數(shù)據(jù)轉(zhuǎn)換后存在的數(shù)據(jù)信息丟失、屬性不全、圖形錯誤等問題;陳能提出并研究了在CAD數(shù)據(jù)與GIS數(shù)據(jù)轉(zhuǎn)換前對CAD數(shù)據(jù)進行預(yù)處理;針對要素因圖形分割不連續(xù)問題,彭春暉提出了將要素屬性作為自動接邊的參照。上述方法雖然提高了地形數(shù)據(jù)提取效率,但是都需要人工參與,自動化程度不高,需要研究更加自動化的要素提取方法。
本文在傳統(tǒng)地形要素提取的基礎(chǔ)上,根據(jù)要素之間的幾何關(guān)系,提出了基于空間拓?fù)潢P(guān)系的面狀要素提取方法。該方法不僅可以快速提取面狀幾何要素,還能自動進行分類屬性信息的識別與獲取。
以GIS建庫的數(shù)據(jù)質(zhì)量要求對AutoCAD格式的數(shù)據(jù)源進行質(zhì)量控制,AutoCAD格式數(shù)據(jù)源在命名、分層、拓?fù)浼俺蓤D上都有相應(yīng)的規(guī)范要求。針對數(shù)字地形數(shù)據(jù)在GIS中與AutoCAD中的表現(xiàn)形式與分層等的差異,首先對數(shù)字地形圖中需要提取的面狀地形要素在GIS與AutoCAD中的表現(xiàn)形式進行梳理。數(shù)字地形圖中需提取面狀要素及其表現(xiàn)形式(如表1所示):
表1 兩種軟件數(shù)據(jù)結(jié)構(gòu)對比
在GIS中,大部分地形要素如水系、道路、建筑物等表現(xiàn)為閉合面,但在AutoCAD中則表現(xiàn)為單線或復(fù)線。文字注記與獨立符號在GIS中表現(xiàn)為點和屬性,在AutoCAD中多存儲為塊或注記形式,塊或注記可以對地形要素進行標(biāo)識,如,植被的類別、建筑物的層數(shù)等,對塊或注記本身卻沒有屬性描述。GIS地形數(shù)據(jù)與AutoCAD地形數(shù)據(jù)產(chǎn)生差異的原因主要是應(yīng)用目的與領(lǐng)域不同:GIS更加側(cè)重于描述地理實體的數(shù)學(xué)模型,AutoCAD側(cè)重于地形要素的成圖與符號化。
各商業(yè)軟件都對軟件的數(shù)據(jù)結(jié)構(gòu)進行定義,以解決各軟件之間數(shù)據(jù)結(jié)構(gòu)的差異造成信息無法匹配問題,在數(shù)據(jù)轉(zhuǎn)換過程中盡可能保留原始信息[10]。以ArcGIS數(shù)據(jù)向AutoCAD數(shù)據(jù)轉(zhuǎn)換為例,首先按照幾何類型對轉(zhuǎn)化后的數(shù)據(jù)進行分層,數(shù)據(jù)導(dǎo)入AutoCAD中將自動按照圖形類型與圖層劃分存儲;文字將轉(zhuǎn)換為注記,注記的樣式、顏色、分層等信息將會自動保存與顯示??梢?,數(shù)據(jù)結(jié)構(gòu)的改變?nèi)匀粫A艚^大部分的數(shù)據(jù)信息,但是兩種軟件在數(shù)據(jù)存儲格式及符號化等方面差距較大,導(dǎo)致數(shù)據(jù)在轉(zhuǎn)換過程中發(fā)生錯誤或者丟失情況。AutoCAD數(shù)據(jù)中缺少數(shù)據(jù)間的拓?fù)渎?lián)系,由于節(jié)點難以捕捉,會產(chǎn)生例如縫隙、重復(fù)邊、懸掛線等拓?fù)溴e誤[11]。此外,由于地形圖的制作是以圖幅為單位的,所以還會造成圖形邊界的錯位、分割等情況。
為了快速提取得到地形要素,目前還需要解決的問題有:(1)對地形圖數(shù)據(jù)中的隱含信息進行充分挖掘,彌補商業(yè)軟件之間數(shù)據(jù)轉(zhuǎn)換造成的部分?jǐn)?shù)據(jù)丟失問題;(2)對轉(zhuǎn)換后的數(shù)據(jù)進行處理,得到滿足入庫要求的成果數(shù)據(jù)。
針對前文中提到問題,本文提出了一種自動提取面狀地形要素方法,該方法基于數(shù)據(jù)的空間拓?fù)潢P(guān)系。首先,為保證面狀地形要素的閉合,利用地形要素間的鄰接關(guān)系進行拓?fù)淙莶詈徒M合圖層的設(shè)置,并且通過拓?fù)錁?gòu)面實現(xiàn)面狀地形要素的快速構(gòu)建;其次,通過面狀要素與文字注記或獨立符號的包含關(guān)系,補充與濾除構(gòu)建的數(shù)據(jù)集;最后,構(gòu)建地形要素與獨立符號之間的映射關(guān)系,通過面狀要素與獨立符號的包含關(guān)系對地形要素進行識別與分類。
將AutoCAD中的線轉(zhuǎn)為面是構(gòu)建圖形的首要條件,線轉(zhuǎn)面分為兩個步驟:(1)篩選得到面;(2)對線要素進行拓?fù)錁?gòu)面。這種方法可以快速生成面要素,但是會造成提取效果不理想,主要原因有以下三個方面:(1)圖形是按照圖幅劃分,圖幅邊界造成的錯位和分割會導(dǎo)致無法構(gòu)面;(2)由于懸掛線的錯誤無法構(gòu)面;(3)數(shù)據(jù)轉(zhuǎn)換過程中導(dǎo)致線不閉合,也無法構(gòu)面,如,花圃面由房屋邊界與花圃邊界共同構(gòu)成的情況。通過傳統(tǒng)方法對建筑物進行提取出現(xiàn)的問題(如圖1所示):
圖1 傳統(tǒng)方法提取建筑物出現(xiàn)問題
出現(xiàn)上述建筑物提取的問題主要原因就是使用單要素圖層進行構(gòu)面,AutoCAD數(shù)據(jù)中沒有圖形拓?fù)潢P(guān)系,存在公共邊的多個圖形很難能夠同時閉合。因此,可以使用多要素組合構(gòu)面法以保證圖形閉合,并且對所有參與構(gòu)面的圖層集合進行分析;設(shè)置拓?fù)淙莶?,分析容差與成圖比例尺、數(shù)據(jù)分辨率間的關(guān)系,實現(xiàn)拓?fù)渥詣娱]合;完成要素屬性編輯后,針對圖形分割導(dǎo)致的邊界不連續(xù)問題,可以通過對要素屬性進行約束及對邊界緩沖區(qū)進行分析的方法進行數(shù)據(jù)接邊。
使用鄰接關(guān)系進行圖形構(gòu)建會產(chǎn)生以下問題:(1)由于數(shù)據(jù)質(zhì)量問題導(dǎo)致的圖形漏提;(2)為了保證圖形閉合,會產(chǎn)生較多的錯誤數(shù)據(jù)。圖2為構(gòu)建植被時出現(xiàn)的錯誤,將房屋及道路也加入構(gòu)面圖層中以確保臨近房屋或道路的植被圖形閉合,因此也提取得到道路與房屋的情況(如圖2(a)和圖2(b)所示);圖2(c)中植被的公共邊界可能是任一圖層中的要素,造成圖形無法構(gòu)建的原因可能是構(gòu)面圖層不全;懸掛點也會導(dǎo)致圖形無法構(gòu)建(如圖2(d)所示)。針對上述問題,將本文方法應(yīng)用到實際生產(chǎn)中的關(guān)鍵是對構(gòu)建的數(shù)據(jù)集進行檢查,使數(shù)據(jù)集滿足生產(chǎn)要求,內(nèi)容包括兩個方面:(1)對遺漏圖形的補充;(2)對錯誤圖形的濾除。
圖2 植被構(gòu)建主要面臨的問題
通過分析數(shù)據(jù)得到,在AutoCAD中對于要素屬性信息的描述缺乏,一般情況下主要通過兩種方式對地形要素進行識別:(1)將文字注記或者獨立符號繪制在要素范圍內(nèi),通過面狀要素與文字注記或者獨立符號的包含關(guān)系檢查構(gòu)建的數(shù)據(jù)集;(2)通過對數(shù)據(jù)進行分層管理,分層信息可作為要素識別的參考存儲進要素屬性中。
首先,通過AutoCAD對指定圖層的文字注記及獨立符號進行讀取,將包絡(luò)線中線點或塊的插入點作為檢查點,隨后對疊加構(gòu)建的面要素數(shù)據(jù)集與檢查點進行分析。如果點要素在面要素范圍外則表示漏提圖形,面要素包含的點要素數(shù)量為零則表示面要素為錯誤數(shù)據(jù)。
圖3 土質(zhì)與植被的符號圖示
對于面狀要素,主要通過獨立符號與文字注記進行分類識別。目前已有多種行業(yè)標(biāo)準(zhǔn)規(guī)范對數(shù)據(jù)的質(zhì)量進行控制。在國家規(guī)范標(biāo)準(zhǔn)的基礎(chǔ)上,各省市又進行了進一步地完善及細(xì)化,制定適應(yīng)本地數(shù)據(jù)生產(chǎn)的行業(yè)標(biāo)準(zhǔn)規(guī)范。這些行業(yè)規(guī)范對要素的分類編碼、分類名稱等都進行了要求與規(guī)定。國家標(biāo)準(zhǔn)中的土質(zhì)與植被的符號示意(如圖3所示):
對于地形要素分類的提取,需要根據(jù)相關(guān)標(biāo)準(zhǔn)規(guī)范要求。根據(jù)傳統(tǒng)做法提取地形要素分類,首先是通過標(biāo)準(zhǔn)規(guī)范對分類的編碼及名稱進行確定,其次使用屬性掛接或手工編輯的方式錄入分類信息。但是由于地形要素分類眾多且復(fù)雜,傳統(tǒng)方法容易出現(xiàn)分類錯誤且工作量巨大。因此,在使用空間拓?fù)潢P(guān)系檢查及構(gòu)建圖形后,進行AutoCAD獨立符號與地形要素分類間的映射關(guān)系,就可以同時完成獨立符號的識別與檢查點的提取,在中線點屬性中將獨立符號進行存儲。進行疊加濾波時,分類名稱與編碼就可以通過映射關(guān)系得到,從而能夠自動識別地物分類信息。同樣,該方法可以在地名自動匹配、房屋層數(shù)等文本注記的提取中得到應(yīng)用。
以昆明市1∶2000比例尺地形圖建庫項目為依托,對本文方法的可行性進行檢驗。選擇連續(xù)的10幅地形圖作為實驗數(shù)據(jù)進行專項用地、房屋及綠地的提取。實驗中使用的商業(yè)軟件為ArcGIS、AutoCAD及EPS等,通過商業(yè)軟件及工具進行數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換及數(shù)據(jù)編輯工作。實驗環(huán)境能夠真實反映行業(yè)的生產(chǎn)情況,符合當(dāng)前數(shù)據(jù)生產(chǎn)工作狀況。
在特征符號與數(shù)據(jù)分層都符合標(biāo)準(zhǔn)規(guī)范的情況下,通過統(tǒng)計實驗結(jié)果可知,本文方法可以有效提取數(shù)據(jù),同時滿足生產(chǎn)要求。使用傳統(tǒng)方法與本文方法提取面狀要素的效率對比(如表2所示):
表2 提取面狀要素效率對比
通過表2可知:本文提出的方法可以高效提取面狀要素,優(yōu)化數(shù)據(jù)生產(chǎn)方式,實現(xiàn)自動化數(shù)據(jù)提取。將作業(yè)員從繁重的數(shù)據(jù)提取工作中解放出來,把更多的精力與時間放在數(shù)據(jù)質(zhì)量檢查上。本文的研究具有一定的應(yīng)用價值。
本文對地形要素提取中的關(guān)鍵進行分析,使用拓?fù)錁?gòu)面、疊加分析及構(gòu)建映射關(guān)系等,對地形圖中的面狀要素進行快速構(gòu)建、數(shù)據(jù)檢查及自動識別等。以昆明市1∶2000比例尺地形圖建庫項目為依托對本文方法的可行性進行檢驗。實驗結(jié)果表明:本文使用的方法可以對數(shù)據(jù)生產(chǎn)方式進行優(yōu)化,提高數(shù)據(jù)的提取效率。下一步將研究增加針對文字注記或獨立符號擺放錯誤、懸掛點超出容差限定范圍造成的數(shù)據(jù)錯誤的排查機制,進一步提高算法的自動化水平。