王劍輝,符 彥,伍素貞
(廣東省地質(zhì)測(cè)繪院,廣東 廣州 510800)
?
基于規(guī)則驅(qū)動(dòng)的地理國(guó)情數(shù)據(jù)質(zhì)量檢查方法*
王劍輝,符彥,伍素貞
(廣東省地質(zhì)測(cè)繪院,廣東 廣州510800)
文章從地理國(guó)情普查空間數(shù)據(jù)質(zhì)量檢查出發(fā),分析了常規(guī)質(zhì)檢方法的局限性,提出一種基于ArcGIS Data Reviewer構(gòu)建質(zhì)檢規(guī)則對(duì)空間數(shù)據(jù)質(zhì)量控制與檢查的方法。通過(guò)研究基于Data Reviewer構(gòu)建檢查規(guī)則進(jìn)行自動(dòng)化、批量化的數(shù)據(jù)檢查,并與交互式、可視化的數(shù)據(jù)檢查相結(jié)合,實(shí)現(xiàn)地理國(guó)情普查數(shù)據(jù)的檢查、修改、審核,這種數(shù)據(jù)檢查方法和質(zhì)量控制機(jī)制大大提高了質(zhì)檢的靈活性和效率,保證了數(shù)據(jù)成果的質(zhì)量。
空間數(shù)據(jù)質(zhì)量;Data Reviewer;地理國(guó)情;檢查規(guī)則
地理國(guó)情普查是一項(xiàng)重大的國(guó)情國(guó)力調(diào)查,是全面獲取地理國(guó)情信息的重要手段,國(guó)家制定了地表覆蓋、國(guó)情要素、元數(shù)據(jù)、解譯樣本、數(shù)據(jù)庫(kù)和統(tǒng)計(jì)分析等一系列規(guī)范,省、市和縣可根據(jù)地方需求擴(kuò)展地理省情、市情及縣情等,對(duì)地理國(guó)情普查的采集內(nèi)容進(jìn)行擴(kuò)充,對(duì)采集指標(biāo)進(jìn)行細(xì)化。因此,質(zhì)量檢查也需有相應(yīng)的自定義規(guī)則去適應(yīng)地方需求。
地理國(guó)情普查時(shí)間緊、任務(wù)重,以順德區(qū)為例,高清影像的采用、指標(biāo)的細(xì)化以及城市地區(qū)的劃定等都造成地表覆蓋圖斑、國(guó)情專題要素等數(shù)量劇增,質(zhì)量因素增多,因素之間互相影響,增加了生產(chǎn)和質(zhì)檢難度,靠人工檢查耗時(shí)耗力,且很多問(wèn)題較難通過(guò)人工檢查解決,雖然國(guó)普辦提供了檢查軟件,但此軟件是針對(duì)國(guó)家數(shù)據(jù)標(biāo)準(zhǔn)編寫(xiě)的,檢查方案不可更改,不能完全滿足順德區(qū)質(zhì)檢要求,數(shù)據(jù)的規(guī)范性、完整性、正確性[1]完全依靠生產(chǎn)人員和質(zhì)檢人員檢查,提高效率勢(shì)在必行。因此,在對(duì)地理國(guó)情普查空間數(shù)據(jù)成果進(jìn)行質(zhì)量檢查時(shí),檢查程序自動(dòng)化只是基本要求,建立一個(gè)以國(guó)家和地方的技術(shù)規(guī)則為依據(jù),全面規(guī)范化、無(wú)需編程且可重復(fù)利用的質(zhì)量檢查方法顯得極其重要。為此,本文利用Data Reviewer構(gòu)建檢查規(guī)則,進(jìn)行自動(dòng)化、批量化的數(shù)據(jù)檢查,并通過(guò)交互式、可視化的方式,將兩者相結(jié)合進(jìn)行成果質(zhì)量控制,提高了質(zhì)檢的靈活性和高效性。
目前通常采用購(gòu)買(mǎi)的QC-Spatial、Geoway地理國(guó)情普查質(zhì)檢軟件自動(dòng)檢查、人工檢查和人機(jī)交互檢查相結(jié)合的方法進(jìn)行檢查,該方法存在以下幾個(gè)問(wèn)題:
1)這些商業(yè)軟件的檢查內(nèi)容都是根據(jù)國(guó)家數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)編寫(xiě)的,不能完全滿足地方要求。
2)其檢查方案往往難以更改,軟件錯(cuò)誤或者增加功能都需要通過(guò)郵件、QQ群、電話等渠道多次溝通后進(jìn)行補(bǔ)充開(kāi)發(fā)、下發(fā)補(bǔ)丁,更改不及時(shí),周期過(guò)長(zhǎng)。
3)由于商業(yè)軟件購(gòu)買(mǎi)成本高,服務(wù)完地理國(guó)情項(xiàng)目后往往不能繼續(xù)在其它項(xiàng)目中發(fā)揮質(zhì)檢作用,軟件生命周期短,導(dǎo)致作業(yè)單位較少購(gòu)置,生產(chǎn)時(shí)需要輪換借用。
4)數(shù)據(jù)的規(guī)范性、完整性、正確性主要依靠生產(chǎn)人員和質(zhì)檢人員的經(jīng)驗(yàn),通過(guò)加班或基于ArcEngine二次開(kāi)發(fā)質(zhì)檢軟件進(jìn)行解決,勞動(dòng)強(qiáng)度大,效率不高。
2.1Data Reviewer介紹
ArcGIS Data Reviewer是ArcGIS平臺(tái)的一個(gè)擴(kuò)展模塊,在ESRI原有PLTS解決方案的基礎(chǔ)上發(fā)展而來(lái),Data Reviewer是進(jìn)行數(shù)據(jù)質(zhì)量控制很好的工具,在國(guó)外有不少成功案例,但是在國(guó)內(nèi)卻鮮有人知,它能夠自動(dòng)化和簡(jiǎn)化數(shù)據(jù)質(zhì)量控制的過(guò)程。Data Reviewer能夠幫助用戶集中管理質(zhì)量控制流程(查找、修改、驗(yàn)證錯(cuò)誤),從而減少與傳統(tǒng)的質(zhì)量控制流程相關(guān)的文件記錄。Data Reviewer提供了豐富的自動(dòng)化檢查項(xiàng)目,能夠較快提高數(shù)據(jù)的一致性,比如空間信息、屬性信息、拓?fù)?、連續(xù)性、數(shù)據(jù)庫(kù)驗(yàn)證、Z值[2]。不同行業(yè)的用戶都可以輕松地配置Data Reviewer檢查規(guī)則,無(wú)需編程開(kāi)發(fā)即可重復(fù)用于行業(yè)數(shù)據(jù)的檢查。
2.2基于Data Reviewer的地理國(guó)情數(shù)據(jù)質(zhì)量檢查
根據(jù)規(guī)范與設(shè)計(jì)要求,確定要素之間可能存在的規(guī)則,技術(shù)負(fù)責(zé)與檢查員共同設(shè)計(jì)檢查規(guī)則庫(kù),在實(shí)際應(yīng)用中不斷添加和完善。在Data Reviewer中可實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)化、可視化、批量化的檢查,生成錯(cuò)誤記錄、標(biāo)識(shí)和質(zhì)量分析報(bào)告,作業(yè)人員根據(jù)錯(cuò)誤記錄利用ArcGIS編輯工具進(jìn)行修改,檢查人員根據(jù)檢查和修改記錄進(jìn)行核查,核查之后滿足規(guī)則要求的數(shù)據(jù)才可入庫(kù),確保地理國(guó)情普查數(shù)據(jù)的質(zhì)量?;贒ata Reviewer的地理國(guó)情數(shù)據(jù)檢查技術(shù)路線,如圖1所示。
圖1 基于Data Reviewer的地理國(guó)情數(shù)據(jù)檢查技術(shù)路線Fig.1 Technical route of geographical conditions data based on Data Reviewer
2.2.1自動(dòng)化、批量化的數(shù)據(jù)檢查
2.2.1.1配置檢查器會(huì)話
Data Reviewer提供了檢查器會(huì)話管理器,它是一種較好的組織和管理數(shù)據(jù)質(zhì)量檢查表的方法,每一個(gè)檢查器會(huì)話可以由不同的人檢查、校正、驗(yàn)證數(shù)據(jù),并且每一次數(shù)據(jù)都會(huì)被記錄在數(shù)據(jù)質(zhì)量檢查器表中。通過(guò)檢查器會(huì)話管理器創(chuàng)建檢查器工作空間,它在地理數(shù)據(jù)庫(kù)中創(chuàng)建檢查器方案,其中包括檢查器表和檢查器要素?cái)?shù)據(jù)集,如圖2所示。
圖2 檢查器表和檢查器要素?cái)?shù)據(jù)集Fig.2 Table and feature datasets of checker
2.2.1.2檢查規(guī)則設(shè)計(jì)
利用Data Reviewer提供的11組42種校驗(yàn)規(guī)則(見(jiàn)圖3),對(duì)整個(gè)要素類(lèi)或數(shù)據(jù)庫(kù)、當(dāng)前范圍內(nèi)的要素或僅所選要素集執(zhí)行幾何和屬性驗(yàn)證,確保數(shù)據(jù)完整性、正確性[3]。
圖3 Data Reviewer數(shù)據(jù)校驗(yàn)規(guī)則Fig.3 Data validation rules of Data Reviewer
地理國(guó)情普查數(shù)據(jù)是空間數(shù)據(jù),其檢查主要包括地表覆蓋和國(guó)情要素檢查、地理國(guó)情元數(shù)據(jù)檢查、遙感解譯樣本檢查等[4]。其中,檢查內(nèi)容主要包括:空間參考、采集與分類(lèi)精度、庫(kù)體結(jié)構(gòu)、拓?fù)潢P(guān)系、屬性值、空間關(guān)系、一致性[5]。本文利用Data Reviewer數(shù)據(jù)校驗(yàn)規(guī)則設(shè)計(jì)了地表覆蓋和國(guó)情要素檢查的規(guī)則(見(jiàn)圖4),并將這些檢查規(guī)則以檢查器批處理作業(yè)文件(*.rbj)的形式保存。
圖4 地表覆蓋和國(guó)情要素檢查規(guī)則Fig.4 Checking rules of surface cover and national conditions elements
2.2.1.3 數(shù)據(jù)檢查
Data Reviewer提供了針對(duì)數(shù)據(jù)集、數(shù)據(jù)庫(kù)進(jìn)行的批處理作業(yè),它是一種封裝和分布質(zhì)量控制的方法。質(zhì)檢人員將設(shè)計(jì)好的rbj檢查規(guī)則文件導(dǎo)入到批處理作業(yè)中。在檢查同一區(qū)域不同作業(yè)區(qū)的數(shù)據(jù)時(shí),可通過(guò)批處理作業(yè)在不同位置使用相同的質(zhì)檢規(guī)則,確保數(shù)據(jù)質(zhì)量檢查的標(biāo)準(zhǔn)統(tǒng)一,如圖5所示。
圖5 導(dǎo)入規(guī)則執(zhí)行批量檢查Fig.5 Importing rules to perform batch check
2.2.2交互式的數(shù)據(jù)檢查
2.2.2.1創(chuàng)建檢查網(wǎng)格
Data Reviewer提供了多種方式創(chuàng)建網(wǎng)格(見(jiàn)圖6),它用于將指定范圍分解為單元格,以便系統(tǒng)地檢查一個(gè)大型數(shù)據(jù)集[6]。在面格網(wǎng)中,各格網(wǎng)單元都是可以屬性化和選擇的面要素。這些格網(wǎng)可以在檢查器會(huì)話期間使用,以便管理可視化和自動(dòng)質(zhì)量控制。使用檢查器,可以將面格網(wǎng)與檢查器表相關(guān)聯(lián)并將格網(wǎng)信息與各個(gè)記錄相關(guān)聯(lián)。如果單元格中所包含的要素已記錄為檢查器表中的記錄,那么單元格中的 QC_GRID 字段將填入面網(wǎng)格信息。
圖6 創(chuàng)建網(wǎng)格Fig.6 Creaing a grid
2.2.2.2人工輔助標(biāo)記缺失要素
將數(shù)據(jù)與影像或其他數(shù)據(jù)源進(jìn)行比較時(shí),發(fā)現(xiàn)地圖中缺失要素,可以通過(guò) Data Reviewer直接在地圖中數(shù)字化缺失的要素,也可以根據(jù)其所屬的要素類(lèi)和子類(lèi)型查找缺失要素的位置。在地圖中數(shù)字化要素會(huì)創(chuàng)建一個(gè)圖形,該圖形代表缺失的要素,并保存在檢查器數(shù)據(jù)集中的點(diǎn)、線、面圖層中。
使用檢查器表記事本窗口中的工具可根據(jù)需要繪制缺失的點(diǎn)、線或區(qū)域要素,然后自動(dòng)將其提交至檢查器表(見(jiàn)圖7)。
使用“標(biāo)記缺失要素”工具查找到缺失要素的位置之后,可以通過(guò)單擊“檢查器表”窗口上的“顯示記錄位圖”按鈕查看缺失要素所屬位置的快照。
圖7 捕獲缺失要素Fig.7 Flaging a missing feature
2.2.3數(shù)據(jù)修正與審核
在質(zhì)檢人員通過(guò)自動(dòng)化、批量化和可視化的數(shù)據(jù)檢查之后,提交質(zhì)檢庫(kù)給作業(yè)人員,作業(yè)人員根據(jù)檢查器表(見(jiàn)圖8)對(duì)檢查項(xiàng)逐一進(jìn)行修改,并記錄修改狀態(tài)(見(jiàn)圖9)。
圖8 檢查器表和數(shù)據(jù)瀏覽Fig.8 Checking table and browsing data
圖9 數(shù)據(jù)修改Fig.9 Data modify
在作業(yè)人員對(duì)數(shù)據(jù)進(jìn)行修改后,將數(shù)據(jù)庫(kù)提交給質(zhì)檢人員,質(zhì)檢人員進(jìn)行審核確認(rèn)(見(jiàn)圖10)。
基于規(guī)則驅(qū)動(dòng)的地理國(guó)情普查數(shù)據(jù)質(zhì)量檢
圖10 數(shù)據(jù)審核Fig.10 Data verify
查方法優(yōu)于普通的數(shù)據(jù)質(zhì)量檢查方法及ArcGIS軟件常規(guī)拓?fù)錂z查方法,該方法采用搭建式開(kāi)發(fā)實(shí)現(xiàn)了業(yè)務(wù)與代碼相分離,解決系統(tǒng)重用困難的同時(shí)全面完成了數(shù)據(jù)質(zhì)量規(guī)范性檢查,整個(gè)規(guī)則設(shè)計(jì)與搭建過(guò)程極其簡(jiǎn)便,無(wú)須編程,檢查人員和作業(yè)人員都可以進(jìn)行日常維護(hù),極大地提升了檢查效率,滿足檢查規(guī)則變
動(dòng)頻繁的要求,更適用于未來(lái)規(guī)?;?、海量化數(shù)據(jù)工程的質(zhì)量控制。
[1]李諾夫.GIS數(shù)據(jù)質(zhì)量控制方法探討[J].測(cè)繪通報(bào),2011(8):66-68.
[2]王寶山,張力仁,張俊.淺談地理國(guó)情普查項(xiàng)目成果的質(zhì)量控制關(guān)鍵點(diǎn)[J].測(cè)繪與空間地理信息,2013,36(9):224-226.
[3]楊海關(guān),丘云峰,楊忠祥,李俊娟.地理國(guó)情普查中的拓?fù)湟?guī)則[J].地理空間信息,2016,14(1):44-45.
[4]羅鵬.地理國(guó)情普查成果質(zhì)量控制及檢查方法探討[J].測(cè)繪與空間地理信息,2014,37(6):192-194.
[5]高天虹,張金剛,劉敏.地理國(guó)情普查成果內(nèi)業(yè)的質(zhì)量控制[J].測(cè)繪與空間地理信息,2014,37(6):210-212.
[6]穆志杰,盧志華,郭新玲.運(yùn)用統(tǒng)計(jì)方法對(duì)地理國(guó)情普查質(zhì)量控制技術(shù)的分析[J].測(cè)繪技術(shù)裝備,2014,16(2):9-13.
Quality Check Method of Geographical Conditions Data Based on Rule Driven
WANG Jian-hui,F(xiàn)U Yan,WU Su-zhen
(Guangdong Institute of Surveying and Mapping of Geology,Guangzhou Guangdong 510800,China)
Considering the spatial data quality control of Geographical Conditions Census,this study analyses the disadvantages of regular quality control methods.The purpose is to propose a quality control method for spatial data using checking rules of ArcGIS Data Reviewer.Based on the checking rules,this study has established an automatic,batching data processing,in combination with the interactive,and visual data checking,which carry out the inspection,modification and verification of Geographical Conditions Census data.This data checking methods and mechanism of quality control greatly improve the flexibility and efficiency of quality checking,and ensure the quality of the results.
quality of spatial data;Data Reviewer;geographical conditions;check rule
2016-05-24
P 208
B
1007-9394(2016)03-0026-03
王劍輝(1984~),男,廣東梅州人,學(xué)士,工程師,現(xiàn)主要從事不動(dòng)產(chǎn)測(cè)繪、工程測(cè)量、地理信息系統(tǒng)、攝影測(cè)量等方面的應(yīng)用研究工作。