沈向前,余 洋
(1.武漢大學 遙感信息工程學院,湖北 武漢 430079)
地理國情普查是一項重大的國情國力調查,是掌握地表自然、生態(tài)、經濟、人文基本情況的基礎性工作,對全面獲取地理國情信息、掌握經濟社會發(fā)展和自然資源環(huán)境狀況有著重要的意義[1-5]。精準、詳實的地理國情數據是地理國情普查后期統(tǒng)計分析、監(jiān)測評價、統(tǒng)籌決策的基礎。因此,地理國情普查的質量控制是地理國情普查生命力的保障。內業(yè)數據的質量檢查貫穿地理國情普查生產實施的全過程,關系到質量控制的成敗[6]。
內業(yè)更新生成的地表覆蓋分類數據和地理國情要素數據中存在的質量問題大致可分為規(guī)則不符錯誤和屬性判斷錯誤兩類。規(guī)則不符錯誤主要是數據不符合采集要求或數據達不到采集指標;屬性判斷錯誤主要是地物分類錯誤或地物屬性信息錯誤。對這些質量問題,目前檢查的方法有程序自動檢查、人工對照檢查、人機交互檢查3種。復雜環(huán)境下(山區(qū)或圖版破碎)的質檢問題是當前研究的一個弱點,這些地區(qū)的解譯會產生識別錯誤、位置不準確、表示困難等錯誤,采用單一檢查方法并不能有效地進行質量檢查。確定具體問題的最優(yōu)檢查方法,形成優(yōu)化質檢方案,可提高檢查效率,有效控制復雜環(huán)境下內業(yè)數據的質量。
1)程序自動檢查。通過設計模型算法和編制計算機程序,利用空間數據的圖形與屬性、圖形與圖形、屬性與屬性之間存在的邏輯關系和規(guī)律,檢查發(fā)現數據中存在的錯誤。該方法的優(yōu)點是:①檢查用時短,效率高,可以進行批量檢查;②節(jié)省人力資源,能加快項目進度;③能夠檢查肉眼難以分辨的錯誤,不容易出現漏檢、錯檢,檢查結果定位準確。其缺點是:① 很難對非結構化、主觀性強的質量問題進行檢查;②需要購買或自行研發(fā)質檢軟件,且需要對質檢人員進行質檢軟件的使用培訓。
2)人工對照檢查。通過人工檢查核對實物、數據表格或可視化的圖形,以此判斷檢查內容的正確性。該方法是地理國情普查內業(yè)質量控制的重要方法,其優(yōu)點是:①適用范圍廣,基本上所有類型的錯誤問題都可用人工對照的方法進行檢查;②對于普查過程中新制定的質量要求(指標)也能很好地檢查;③ 不需要購買或自行研發(fā)質檢軟件。其缺點是:①檢查用時長、效率低,且隨著檢查時間的拉長,檢查人員會出現視覺疲勞等問題,進一步降低檢查效率;②容易出現檢查遺漏、檢查錯誤等現象。地理國情普查要采集的要素種類繁多,內業(yè)編輯的質量要求和指標也多種多樣,大范圍的人工對照檢查會不可避免地出現錯漏現象。
3)人機交互檢查。利用程序將有疑點的地方搜索出來,縮小范圍或精確定位,再采用人機交互檢查方法,由人工判斷數據的正確性。對于一些能夠用程序檢查、但需要人工確認的質量問題,采用人機交互檢查方法,是對程序自動檢查和人工對照檢查的補充。
在明確數據質量要求、數據組織及成果歸檔要求的基礎上,依據《地理國情普查檢查驗收與質量評定規(guī)定》的要求[7],確定內業(yè)質量檢查流程,如圖1所示。
1)檢查面表征質量,主要包括面折刺檢查、面邊界回頭線檢查、最小上圖面積檢查。
圖1 內業(yè)質量檢查流程圖
2)檢查LCA屬性信息的完整性和正確性,主要包括CC項與TAG項的屬性值錯漏檢查、屬性值長度檢查。
3)檢查LCA層的拓撲問題,主要包括面重疊檢查、面裂隙檢查、面空洞檢查、碎面檢查、面連續(xù)檢查、要素復合檢查。
4)檢查地表覆蓋分類數據采集的平面精度,即采集的地物分界線與影像的套合精度,逐個圖斑進行檢查,重點檢查建筑物、道路、水系等界線明顯的圖斑。
5)檢查LCA分類精度,主要包括地物類型誤判、未分到最細類、達到采集指標漏采集、未按“自然優(yōu)先”和“就近就大”原則進行分類。
6)檢查接邊情況,確定LCA是否存在空間位置不接邊、屬性信息不接邊錯誤。
1)檢查地理國情要素數據層結構及各層要素完整性,主要包括要素多余檢查、要素遺漏檢查、空圖層檢查、多余圖層檢查。
2)檢查地理國情要素各層屬性表信息的數據結構,主要包括屬性值錯漏檢查、屬性值長度檢查、行政區(qū)代碼完整性檢查、行政區(qū)代碼名稱一致性檢查、國民經濟代碼正確性檢查、屬性附錄一致性(如GB碼和CC碼不一致)檢查、屬性項限制檢查。
3)檢查地理國情要素各層的拓撲問題,主要包括單獨層內的拓撲檢查、層與層之間的拓撲檢查。
4)檢查地理國情要素各層數據采集的平面精度,逐個圖斑檢查地理國情要素是否與影像套合。
5)檢查地理國情要素數據的分類精度,主要包括要素分類錯誤、未分到最細類、達到采集指標漏采集。
6)檢查接邊情況,確定地理國情要素數據層是否存在空間位置不接邊、屬性信息不接邊的錯誤。
7)檢查地理國情要素數據和其他數據一致性,主要包括與LCA的一致性檢查、與基礎地理信息數據和主題數據的一致性檢查。
根據質檢問題的性質和檢查方法的特點,明確具體質量問題的最優(yōu)檢查方法,形成綜合3種方法的優(yōu)化質檢方案。此方案多采用程序自動檢查和人機交互檢查,減少人工參與,提高了檢查效率,保障了內業(yè)數據的高精度、高質量[8]。質檢方案配置見表1。
表1 質檢方案優(yōu)化配置
使用質量檢查方案,對四川省廣漢市和湖北省仙桃市地理國情普查項目中的內業(yè)數據進行質量檢查,取得了很好的效果,保證了內業(yè)更新的地表覆蓋分類數據和地理國情要素數據的完整、真實、可靠。
1)程序自動檢查。通過程序自動檢查,標記錯誤圖斑的空間位置,并將錯誤圖斑的信息記錄在檢查屬性表中。圖2中,通過程序自動檢查LCA屬性信息,檢查出圖斑(CC碼為1032)的CC項異常。
圖2 程序自動檢查LCA屬性信息
2)人工對照檢查。人工對照檢查時,逐個圖斑或逐條記錄進行檢查,將發(fā)現的錯誤標記出來,并將錯誤對象(屬性記錄)的ID、錯誤類型等信息記錄在檢查記錄登記表中。圖3中,人工對照檢查LCA的平面精度,檢查出與影像不套合的圖斑(CC碼為0601)。
圖3 人工對照檢查LCA平面精度
3)人機交互檢查。人機交互檢查是程序自動檢查和人工對照檢查的結合,首先通過程序自動檢查,確定疑似問題的位置和錯誤類型,然后人工檢查確定。圖4中,人機交互檢查LCA和地理國情要素數據的一致性,檢查出道路線(ID為1098)穿過LCA中房屋建筑區(qū)的錯誤。
圖4 人機交互檢查數據一致性
目前,地理國情普查質量檢查的研究對質檢的內容和方法都進行了系統(tǒng)的總結,但對各檢查方法的特點、具體質量問題和檢查方法的對應關系沒有詳細地進行探討。地理國情普查的質檢軟件也有不少,但復雜環(huán)境下的質檢結果卻不能令人滿意,這些軟件過于追求“大而全”,忽視了有一些質量問題并不能通過程序自動檢查,或是現階段還不能實現。本文結合地理國情普查內業(yè)編輯和質量檢查的作業(yè)經驗,配合使用3 種檢查方法,形成了優(yōu)化的內業(yè)質檢方案,對內業(yè)更新數據中的各項質量問題給出了最優(yōu)的檢查方法。通過四川省廣漢市和湖北省仙桃市的項目對質檢方案進行檢驗,證實此方案能夠在復雜環(huán)境下有效地控制內業(yè)數據質量,可以作為制定地理國情普查內業(yè)質檢方案的依據或參考。
[1]李德仁,睦海剛,單杰.論地理國情監(jiān)測的技術支撐[J].武漢大學學報:信息科學版,2012,37(5):505-512
[2]李建松,洪亮,史曉明,等.對地理國情監(jiān)測若干問題的認識[J].地理空間信息,2013,11(5):1-3
[3]史文中,秦昆,陳江平,等.可靠性地理國情動態(tài)監(jiān)測的理論與關鍵技術探討[J].科學通報,2012,57(24):2 239-2 248
[4]李建松,周軍其.地理監(jiān)測原理與應用[M].武漢:武漢大學出版社,2014
[5]國發(fā)[2013]9號.國務院關于開展第一次全國地理國情普查的通知[S].
[6]高天虹,張金剛,劉敏.地理國情普查成果內業(yè)的質量控制[J].測繪與空間地理信息,2014,37(6):210-212
[7]GDPJ09-2013.地理國情普查檢查驗收與質量評定規(guī)定[S].
[8]王小娟,王珊,何鑫星.地理國情普查過程質量控制的思考與總結——西藏測區(qū)外業(yè)核查[J].測繪,2014,37(3):134-137