蔡青,馬瑜宏,馬麗新
(山東省地質調查院,山東 濟南 250013)
技術方法
區(qū)域地質圖數(shù)據(jù)庫建庫中的質量檢查方法探討
蔡青,馬瑜宏,馬麗新
(山東省地質調查院,山東 濟南 250013)
數(shù)據(jù)質量檢查是地質圖空間數(shù)據(jù)庫建設項目中的一項重要內容,也是一項復雜的過程,應該貫穿數(shù)據(jù)的輸入和空間數(shù)據(jù)庫建立的每一個環(huán)節(jié),檢查技術方法和手段也一直進行更新。該文以1∶5萬區(qū)域地質圖空間數(shù)據(jù)庫建設為例,列舉了建庫過程中不同階段的多種的檢查方法和手段,對于不同內容使用不同的檢查方法進行探討,通過人工檢查及軟件檢查2種方式來確保入庫數(shù)據(jù)的質量。
區(qū)域地質圖;空間數(shù)據(jù)庫;數(shù)據(jù)質量檢查;MapGIS
區(qū)域地質調查是一項綜合性的基礎地質工作,隨著區(qū)域地質調查的不斷深入,地質信息日趨龐大,地質資料急劇增加,紙質地質圖和紙介質載體信息存儲方法難以滿足區(qū)調發(fā)展需要,為充分、迅速、有效地利用基礎地質數(shù)據(jù),輸出地質成果,開展了1∶5萬區(qū)域地質圖空間數(shù)據(jù)庫建設項目,數(shù)據(jù)庫屬于回溯型建設,即在原有資料的基礎上進行數(shù)字矢量化[1]。該項目以MapGIS軟件為平臺,自開展以來已經形成了一整套比較完整的作業(yè)流程和規(guī)范[2]。
數(shù)據(jù)的質量是數(shù)據(jù)庫的關鍵,將直接影響數(shù)據(jù)庫的可用性和精確性,錯誤的或不準確的數(shù)據(jù)信息將會產生錯誤的處理結果,導致錯誤或不準確的決策[3]。因此數(shù)據(jù)的質量控制、數(shù)據(jù)庫的質量檢查工作非常重要。數(shù)據(jù)質量檢查一直是地質圖空間數(shù)據(jù)庫建設項目的重要工作內容,對數(shù)據(jù)質量有著嚴格要求,檢查技術方法和手段也一直進行更新,來確保數(shù)據(jù)質量的精確性??臻g數(shù)據(jù)質量問題是伴隨著數(shù)據(jù)的采集、處理、轉換過程而產生的,每個環(huán)節(jié)產生的誤差都直接影響到最終數(shù)據(jù)的質量[4]。所以該文對1∶5萬區(qū)域地質圖空間數(shù)據(jù)庫建設中不同階段的多種檢查方法進行探討。
資料的預處理是為了確保入庫資料的質量,在入庫前對收集到的圖形資料進行精度檢查,對屬性資料進行正確性檢查,對圖形資料和屬性資料進行一致性檢查而進行的一項工作。對于質量不高的數(shù)據(jù)源,通過預處理工作不但可減少誤差,還可提高數(shù)字化工作的效率。
首先將收集的原始圖件,交與地質專家進行檢查審核,將其中的明顯錯誤:如明顯的標記錯誤、明顯的線劃錯誤及缺失、設色錯誤以及地質體時代或屬性標注錯誤等非觀念認識差異造成的錯誤等預先進行修改,矢量化時以修改后的為準,可以減少因發(fā)現(xiàn)錯誤時需要重新進行拓撲而進行的大量重復性工作,而重新拓撲可能會造成線弧不套合等更多嚴重錯誤。
空間數(shù)據(jù)的質量控制是一項復雜的過程,應該貫穿數(shù)據(jù)的輸入和空間數(shù)據(jù)庫建立的每一個環(huán)節(jié)[5]。地質圖空間數(shù)據(jù)和屬性數(shù)據(jù)的錯誤類型主要有:空間數(shù)據(jù)的不完整或重復,包括點、線、面數(shù)據(jù)的丟失或重復,數(shù)據(jù)斷線、多邊形不封閉等;圖層文件、數(shù)據(jù)表等不完整;空間數(shù)據(jù)位置不準確,點位不準確,線段過短,結點不重合;拓撲關系錯誤;屬性與空間數(shù)據(jù)聯(lián)接錯誤;屬性結構、字段類型及長度與規(guī)定不符,屬性值數(shù)據(jù)錯誤或不完整;圖面符號表達不清晰、壓蓋關系不合理;圖框外整飾不規(guī)范等等。
2.1矢量化過程中數(shù)據(jù)質量檢查
對于1∶5萬地質圖,因圖面內容較多,必須手工進行矢量化,才能保證數(shù)據(jù)精度。在矢量化過程中要盡量減少線段上的重復點、Z字線段、自相交或線段缺失等錯誤,需要成區(qū)的線相交一定要建立結點。
首先需要人工對矢量化完成后的圖件與原始地質圖進行對比,補齊漏掉的點和線圖元,對于字符、子圖大小和角度及線型,線寬等進行修改,盡量接近原圖。然后使用MapGIS軟件中的“圖形處理”模塊的“其他”工具項,進行“清除微短弧線、清重座標點及自相交、檢查重疊線”等檢查。如果發(fā)現(xiàn)微短線,應放大圖件仔細查看原因,有可能是單獨一條微短線,刪去就可以,也有可能是線段自相交,剪斷后出現(xiàn)的微小線段,這就需要將整條線段重新整理。重疊線,重疊坐標等錯誤,可以直接使用MapGIS編輯系統(tǒng)自有的檢查修改功能進行刪除。
由于水系的特殊性,其線方向即代表水系的流向,要求矢量化水系從上游到下游。矢量化過程中或后期處理時誤操作都可能導致線方向錯誤??梢栽贛apGIS編輯系統(tǒng)內選擇顯示線方向,結合地形地貌判斷其方向的正確性并作相應的修改。也可在等高線和高程點圖層附屬性值后,使用1∶5萬地質圖空間數(shù)據(jù)庫建設總項目組提供的基于MapGIS二次開發(fā)的應用程序GISEditTool進行檢查。方法是同時打開等高線、高程點和水系線文件,并將水系線文件置于當前編輯狀態(tài)下,執(zhí)行輔助工具中“水系線方向初步判別”功能,軟件即會提示可能的方向錯誤,檢查后確定是否存在錯誤。如果出錯,利用“改線方向”功能進行改正。項目要求屬性庫中的等高線必須連續(xù),該軟件也可以對等高線是否封閉進行檢查。
2.2 拓撲處理后數(shù)據(jù)質量檢查
拓撲類的錯誤可能是由于矢量化操作不當或拓撲前的檢查不仔細導致,也可能是拓撲處理完成并劃分了不同的圖層文件后操作不當引起。拓撲類的主要錯誤有:圖層套合檢查;同一圖層弧段和界線的套合;不同圖層間的套合,主要是水系和地層,斷層和地層,斷層和巖體,地層和巖體界線之間的套合關系;檢查水體、海岸線與地質體邊界線是否重合,是否有無效弧段和懸掛弧段等。
檢查此類錯誤,可以利用MapGIS自帶“區(qū)拓撲錯誤檢查”功能,但是有些錯誤不會被檢測出來。利用GISEditTool程序中“輔助工具”,可以基本查清出現(xiàn)的各種錯誤,并且能夠根據(jù)查出的錯誤進行一定程度的修改。主要檢查內容包括“檢查并更正拓撲套合關系、檢查區(qū)拓撲一致性、線或弧段Z字形、自相交批量檢查、清除重疊坐標、自動刪除多余弧段等。檢查時需要選擇標準文件,一般應選中地質界線圖層文件,以它為基準對其他它線、區(qū)文件進行一致性檢查。
對于查出錯誤后的修改,需要在MapGIS工程文件中同時打開錯誤報告文件和所有相關的線、區(qū)文件(包括地質界線、水系、斷層、水體、沉積巖、變質巖、非正式地層單位、侵入巖、脈巖、構造變形帶等參于拓撲的文件),取消還原顯示,并選中顯示坐標點,將窗口放大到清楚地看到錯誤為止。對于線弧不一致錯誤,通過線弧結點平差,移動線段或弧段上坐標點進行微調。如果是出現(xiàn)多個線和區(qū)圖層不套合時,線和弧段應同時修改,否則會出現(xiàn)更多的線弧不一致錯誤,或者是重新進行拓撲。
2.3 屬性掛接后數(shù)據(jù)質量檢查
屬性類錯誤是在圖層分層完成后進行屬性錄入過程中產生的與屬性有關的錯誤。由于地質圖數(shù)據(jù)庫涉及圖層文件很多,每個文件均有不同的屬性結構,每個屬性結構又存在很多字段,每個字段的類型、大小不同,字段名稱均為字母,在錄入過程中容易出現(xiàn)錯漏現(xiàn)象。屬性錄入時項目要求,同一字段項中漢字之間的連接符用全角符號,英文與數(shù)字之間的連接符用半角符號,因而需要在錄入屬性時仔細錄入。
屬性掛接時出現(xiàn)的主要問題有圖層分層錯誤,屬性與空間數(shù)據(jù)聯(lián)接錯誤;屬性結構、字段類型及長度與規(guī)定不符,屬性值數(shù)據(jù)錯誤或不完整;同一地質體,屬性內容不同;圖元編號不唯一等錯誤。
對于屬性內容的檢查,可以利用MapGIS中的檢查模塊。打開工程文件,在被檢查文件前打上“√”,設為當前編輯狀態(tài),在檢查工具欄中選擇“工作區(qū)屬性檢查”,出現(xiàn)檢查屬性內容對話框,單擊字段名稱,右側屬性內容框內顯示所有該字段屬性值(圖1),從這里可以檢查出建庫要求的必填項中的屬性內容是否有空值,如果有空值的話,需要查資料來補充完整。雙擊屬性內容中的任一項,賦該屬性內容的圖元閃爍,就可以清楚的看到屬性值與圖面內容,注釋是否一致,圖元設色及大小設置是否統(tǒng)一等問題。
圖1 工作區(qū)屬性檢查示意圖
檢查相同地質體的屬性內容是否一致,需要輸出屬性表來核對。一種方法是利用MapGIS自帶的“屬性庫管理”輸出屬性表,也可以利用工具軟件GISTools中的“屬性文件轉換”功能。打開生成的DBF屬性文件,選擇不重復的記錄,進行篩選。同一地質體應該只有一條記錄,如果出現(xiàn)多條,就證明其中有些圖元屬性是錯誤的,需要修改。同時也可以就這些屬性項與地質專家填寫的屬性表來核對,進一步檢查屬性內容的填寫是否準確。
MapGIS軟件自帶模塊不能對屬性結構類數(shù)據(jù)錯誤進行檢查,必須依靠項目組下發(fā)的檢查軟件。Check_MapGIS程序可以對屬性結構進行檢查,它要求在D盤建立事先編輯好的“屬性結構.TXT”,這個文件中有全部帶屬性結構的圖層文件名,字段名稱、類型和大小。選擇輸出路徑,選擇文件屬性檢查,指定被檢查文件,計算。在界面右側方框出現(xiàn)檢查結果,根據(jù)結果進行修改。GISEditTool程序可以對屬性中的空格進行檢查和刪除,還可以對圖元編碼進行自動整理,避免了圖元編碼重復,不唯一這類錯誤出現(xiàn)。
2.4 圖面內容檢查
輸出整圖,與原始圖件進行對照檢查,此項工作只能由人工進行檢查,主要是針對區(qū)的設色,線段類型、線寬大小及子圖、字符的角度等等,是否有錯漏,位置偏移等問題與原圖進行比對。在屏幕上顯示的顏色與輸出后紙質上的顏色有差別,必須根據(jù)紙質上打印的色進行微調,使圖件看起來美觀,且盡量與原圖保持一致。
對于數(shù)據(jù)庫的檢查和修改,僅應用MapGIS主控程序來進行不夠方便和完善,在檢查過程中還會有人為的錯誤產生,且工作量非常大。針對這種情況,為了提高數(shù)據(jù)的質量,開發(fā)了針對數(shù)據(jù)庫的質量檢查軟件,地質數(shù)據(jù)質量檢查與評價系統(tǒng)GeoCheck。
在引入規(guī)則時選擇“1∶5萬地質礦產圖庫標準”,即可以對1∶5萬地質圖數(shù)據(jù)庫進行包括拓樸關系和屬性結構內容的詳細的全面的檢查。進入界面后,選擇“空間數(shù)據(jù)檢查”,“空間拓撲集成檢查評價”界面(圖2),執(zhí)行“檢查與評價”。結束后,生成2個Excel文件,一個是檢查評價報告,一個是空間數(shù)據(jù)檢查結果。
圖2 空間拓撲集成檢查評價示意圖
檢查評價報告是對查出的缺陷數(shù)進行統(tǒng)計,得出分數(shù),顯示質量檢查是否通過??臻g數(shù)據(jù)檢查包括“拓撲結點檢查、重疊點坐標檢查、Z字線檢查、自相交線弧檢查、多余弧段檢查、重復點線面檢查、文件壓縮存盤情況檢查、套合一致性檢查、拓撲一致性檢查、等高線封閉性檢查、圖幅邊界矢量數(shù)據(jù)精度檢查、微小線段或弧段檢查、水系方向判別檢查、屬性結構檢查、屬性代碼檢查、數(shù)據(jù)值域檢查、圖元唯一性檢查、接觸關系檢查、斷層屬性檢查、產狀屬性檢查、數(shù)據(jù)填寫率檢查、成果目錄檢查、圖層文件命名情況檢查、多套成果一致性檢查、投影參數(shù)、誤差校正、其他檢查”27項內容。從以上羅列的條目就可以看出,這個檢查與評價系統(tǒng)對數(shù)據(jù)庫進行了全面細致的檢查,基本涵蓋了建庫中所有數(shù)據(jù)質量檢查的內容,所以說這是建庫后必須要做的一次檢查,可以將所有錯誤一次性檢查出來。在每個檢查結果表內都會顯示詳細的錯誤信息,方便找到出現(xiàn)錯誤的圖層或圖元來完成修改,可進行多次檢查,直到結果符合項目要求為止。通過應用此軟件的檢查,將屬性數(shù)據(jù)庫中的錯誤率降至最低,從而保證了入庫數(shù)據(jù)的質量。
數(shù)據(jù)質量檢查是區(qū)域地質圖空間數(shù)據(jù)庫項目工作中的一項重要內容,數(shù)據(jù)的質量直接影響到數(shù)據(jù)的更新和應用,為了確保數(shù)據(jù)庫的質量,數(shù)據(jù)庫的檢查工作是非常必要的。但同時數(shù)據(jù)質量檢查和修改也是一項非常復雜和費時的工作,對于復雜的地質圖空間數(shù)據(jù)庫的檢查,應用GIS技術,研發(fā)新的檢查程序進行軟件檢查,可以提高檢查速度和精度,減少檢查過程中的人為因素產生的錯誤,更好地保證數(shù)據(jù)的質量。該文以1∶5萬地質圖空間數(shù)據(jù)庫建設為例,列舉了建庫過程中不同階段的多種的檢查方法和手段,希望對以后的數(shù)據(jù)庫建設的數(shù)據(jù)質量檢查和質量控制提供一些參考。
[1] 李定平,胡光道,程咱. MapGIS下空間數(shù)據(jù)庫的建立及其典型問題研究[J].武漢大學學報, 2005,30(11):1029-1032.
[2] 陳愛明,柯育珍,周錄英. MapGIS地質圖空間數(shù)據(jù)庫建設常見錯誤與分析[J].資源環(huán)境與工程,2008,22(5):543-546.
[3] 譚紅霞.GIS空間數(shù)據(jù)的質量探討[J].山東國土資源,2009,25(6):28-31.
[4] 姜作勤.數(shù)據(jù)質量研究與實踐的現(xiàn)狀及空間數(shù)據(jù)質量標準[J].國土資源信息化,2004, (3):23-28.
[5] 陳述彭,魯學軍,周成虎.地理信息系統(tǒng)導論[M].北京:科學出版社,1999.
StudyonDataQualityCheckMethodinRegionalGeologicalMapSpatialDatabaseConstruction
CAI Qing,MA Yuhong,MA Lixin
(Shandong Geological Surveying Institute,Shandong Jinan 250013, China)
Data quality check is an important and complicated part in geological map spatial database construction project. It should run through each aspects of data input and database construction. Methods and means of the check technique have been under continuous updates. In this paper, setting regional geological map spatial database construction with the scale of 1∶50000 as an example, different methods and means in different stages of the database construction process have bee illustrated. Various methods should be used in data quality check. By using manual check and software check, the quality of inputting datas can be guranteed.
Regional geological map; spatial database construction; data quality check; MapGIS
P208
:B
2013-04-24;
:2013-07-06;編輯:陶衛(wèi)衛(wèi)
蔡青(1979—),女,山東定陶人,工程師,主要從事地質礦產信息技術研究工作;E-mail:wrka_qq@sina.com。