斯庭勇,高飛,胡小華
(1.合肥工業(yè)大學土木與水利工程學院,安徽合肥 230009;2.合肥市國土資源局,安徽合肥230071)
當前,隨著改革開放的逐步深入,我國加快城鎮(zhèn)化步伐的條件日益成熟,開始步入快速城市化進程。產(chǎn)業(yè)用地結(jié)構(gòu)不合理、布局不優(yōu)化、產(chǎn)業(yè)用地功能和利用效率低[1]等問題逐漸暴露出來。為此,相關(guān)單位開始著手研究“城市化地區(qū)產(chǎn)業(yè)用地集約化利用與調(diào)控技術(shù)研究與示范”這一課題,它是圍繞解決國土資源管理與開發(fā)利用過程中存在的集約化程度不高與調(diào)控難等問題,為國家開展土地調(diào)控、為政府各部門調(diào)整產(chǎn)業(yè)布局和優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)、促進國民經(jīng)濟協(xié)調(diào)發(fā)展提供數(shù)據(jù)支持和決策依據(jù)。“產(chǎn)業(yè)用地數(shù)據(jù)整合與建庫關(guān)鍵技術(shù)”是其中一個子課題,通過研究土地調(diào)查與經(jīng)濟普查、土地利用規(guī)劃、城市規(guī)劃、城市建設(shè)、國民經(jīng)濟、社會發(fā)展、生態(tài)環(huán)境等多種與產(chǎn)業(yè)用地有關(guān)的數(shù)據(jù)整合與建庫的關(guān)鍵技術(shù),實現(xiàn)不同產(chǎn)業(yè)的社會經(jīng)濟數(shù)據(jù)與用地數(shù)據(jù)的合理對接和有效整合,制定產(chǎn)業(yè)用地綜合數(shù)據(jù)庫標準,建立示范區(qū)產(chǎn)業(yè)用地綜合數(shù)據(jù)庫,建設(shè)產(chǎn)業(yè)用地綜合數(shù)據(jù)庫管理系統(tǒng),為相關(guān)其他研究工作提供數(shù)據(jù)庫標準和數(shù)據(jù)基礎(chǔ)支撐。其中,產(chǎn)業(yè)用地數(shù)據(jù)整合是首要解決的問題。本文結(jié)合該項目的實施,研究整合的大體思路、流程、技術(shù)方法以及相關(guān)的注意點。
經(jīng)過研究和分析,產(chǎn)業(yè)用地的結(jié)構(gòu)、分布、面積、投入、產(chǎn)出、稅收、就業(yè)、土地利用狀況和動態(tài)變化等方面的信息是產(chǎn)業(yè)用地綜合數(shù)據(jù)的主要內(nèi)容。而這些產(chǎn)業(yè)用地信息目前從經(jīng)濟普查數(shù)據(jù)、城鎮(zhèn)地籍數(shù)據(jù)、基礎(chǔ)地理信息數(shù)據(jù)、土地利用現(xiàn)狀數(shù)據(jù)、土地利用規(guī)劃數(shù)據(jù)、城市規(guī)劃數(shù)據(jù)和社會經(jīng)濟發(fā)展數(shù)據(jù)這7類數(shù)據(jù)中獲?。?]。由于產(chǎn)業(yè)用地數(shù)據(jù)獲取方式、表示和管理方面等不同,使得這些數(shù)據(jù)具有多源、多尺度、多時態(tài)等多源異構(gòu)性,在進行數(shù)據(jù)整合時必須要對這些源數(shù)據(jù)歸類整理及檢查分析,便于數(shù)據(jù)整合到標準形式。
產(chǎn)業(yè)用地數(shù)據(jù)具有明顯的時空特性,需要對不同來源、不同時段的土地調(diào)查、經(jīng)濟普查、土地利用規(guī)劃、城市規(guī)劃、城市建設(shè)、國民經(jīng)濟、社會發(fā)展、生態(tài)環(huán)境等產(chǎn)業(yè)用地數(shù)據(jù)集成整合,并進行多層次的空間分析、數(shù)據(jù)提取、格式轉(zhuǎn)換和匯總統(tǒng)計,創(chuàng)建產(chǎn)業(yè)用地數(shù)據(jù)整合技術(shù)體系。
產(chǎn)業(yè)用地待整理數(shù)據(jù)庫的數(shù)據(jù)量大,數(shù)據(jù)類型多樣,數(shù)據(jù)來源廣,相互關(guān)系復(fù)雜,所以在進行數(shù)據(jù)整合時,必須執(zhí)行科學縝密的技術(shù)路線,以確保數(shù)據(jù)整理工作的順利完成。
數(shù)據(jù)整合前,必須要制定一個標準,只有統(tǒng)一的數(shù)據(jù)標準,才能保證整合后數(shù)據(jù)的系統(tǒng)性,有利于數(shù)據(jù)的維護、分析和更新[3]。本文研究制定標準,采用面向?qū)ο蟮姆治鼋<夹g(shù),分析、研究產(chǎn)業(yè)用地要素的組成、分類體系、空間結(jié)構(gòu)、屬性特征和相互間的邏輯關(guān)系,整理、歸納與分析產(chǎn)業(yè)用地相關(guān)的數(shù)據(jù)模型、要素類、數(shù)據(jù)對象、表現(xiàn)形式和表示方法等內(nèi)容,抽象、概括產(chǎn)業(yè)用地信息要素類和數(shù)據(jù)對象,研究要素類的包含關(guān)系和繼承關(guān)系,空間數(shù)據(jù)對象的幾何拓撲關(guān)系和屬性邏輯關(guān)系,研究土地調(diào)查、經(jīng)濟普查、土地規(guī)劃、城市規(guī)劃、城市建設(shè)、生態(tài)環(huán)境、國民經(jīng)濟、社會發(fā)展數(shù)據(jù)間的關(guān)聯(lián)度,進行產(chǎn)業(yè)用地各要素的合理分類和邏輯關(guān)聯(lián),構(gòu)建統(tǒng)一、集成、高效的產(chǎn)業(yè)用地數(shù)據(jù)表達的標準化模型,提出《產(chǎn)業(yè)用地綜合數(shù)據(jù)庫標準》的框架結(jié)構(gòu)和主要內(nèi)容,制定產(chǎn)業(yè)用地綜合數(shù)據(jù)庫標準。標準中的產(chǎn)業(yè)用地數(shù)據(jù)庫要素劃分如表1,其中小類省略。
產(chǎn)業(yè)用地數(shù)據(jù)庫要素分類 表1
依據(jù)產(chǎn)業(yè)用地綜合數(shù)據(jù)庫標準和建設(shè)規(guī)范的要求,采用計算機和信息處理技術(shù),利用地理信息系統(tǒng)技術(shù)、數(shù)據(jù)的抽取轉(zhuǎn)換裝載技術(shù)和數(shù)據(jù)庫技術(shù),根據(jù)設(shè)備配置、數(shù)據(jù)庫情況,制定空間數(shù)據(jù)整合與非空間數(shù)據(jù)整合的技術(shù)路線,具體技術(shù)路線如圖1與圖2所示。
圖1 空間數(shù)據(jù)整合技術(shù)路線
圖2 非空間數(shù)據(jù)整合技術(shù)路線
數(shù)據(jù)整合流程:
(1)對已有的數(shù)據(jù)進行搜集、篩選、檢查,對照整合成果要求,對每一類待整合數(shù)據(jù)情況進行登記,摸清現(xiàn)有數(shù)據(jù)情況。對于需要更新或補充調(diào)查的,制定相應(yīng)的更新或調(diào)查方案。
(2)嚴格按照產(chǎn)業(yè)用地數(shù)據(jù)整合技術(shù)規(guī)范和成果要求,利用FME和ArcGIS相關(guān)軟件完成數(shù)據(jù)轉(zhuǎn)換、拓撲檢查、屬性檢查、數(shù)據(jù)拼接等處理,然后按西安80坐標系統(tǒng)和高斯克呂格投影,規(guī)定組織方式和命名規(guī)則對數(shù)據(jù)進行整合。
(3)人機交互和計算機自動處理相結(jié)合。在數(shù)據(jù)庫整合過程中充分利用計算機技術(shù),對數(shù)據(jù)進行處理,提高工作效率。同時結(jié)合人機交互處理技術(shù)進行檢查和修改,減低數(shù)據(jù)庫整合過程中的錯誤率。
(4)建立多級質(zhì)量檢查機制。在數(shù)據(jù)整合的各個中間環(huán)節(jié)及最后成果階段,均建立嚴格的檢查機制,對空間數(shù)據(jù)的拓撲關(guān)系一致性、多邊形是否閉合以及節(jié)點一致性等內(nèi)容以及屬性數(shù)據(jù)字段結(jié)構(gòu)、屬性內(nèi)容、要素分類、代碼是否完備等內(nèi)容均進行檢查。
(1)ETL技術(shù)
ETL(Extraction.Transformation.Loading)主要用來實現(xiàn)異構(gòu)多數(shù)據(jù)源的數(shù)據(jù)集成,是數(shù)據(jù)倉庫、數(shù)據(jù)挖掘以及商業(yè)智能等技術(shù)的基石。ETL具有數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)裝載功能,是數(shù)據(jù)整合的基礎(chǔ)[4]。在產(chǎn)業(yè)用地數(shù)據(jù)庫建設(shè)過程中,需要用到ETL技術(shù)對多源異構(gòu)數(shù)據(jù)進行整合,實現(xiàn)產(chǎn)業(yè)數(shù)據(jù)的抽取、轉(zhuǎn)換、清洗、加載等過程,其概念模型如圖3所示。
圖3中,ETL技術(shù)在產(chǎn)業(yè)用地數(shù)據(jù)庫整合過程中實現(xiàn):數(shù)據(jù)抽取需要符合一定結(jié)構(gòu)和規(guī)則體系[5],通過分析提取建立規(guī)則,然后從經(jīng)濟普查數(shù)據(jù)、城鎮(zhèn)地籍數(shù)據(jù)、基礎(chǔ)地理信息數(shù)據(jù)、土地利用現(xiàn)狀數(shù)據(jù)、土地利用規(guī)劃數(shù)據(jù)、城市規(guī)劃數(shù)據(jù)和社會經(jīng)濟發(fā)展數(shù)據(jù)這7類數(shù)據(jù)中提取符合規(guī)則的數(shù)據(jù),并對提取的數(shù)據(jù)分類標識,把重復(fù)、關(guān)聯(lián)度低、精度低的數(shù)據(jù)剔除。數(shù)據(jù)轉(zhuǎn)換是根據(jù)產(chǎn)業(yè)用地綜合數(shù)據(jù)庫的需要,將數(shù)據(jù)格式統(tǒng)一、類型統(tǒng)一,保證數(shù)據(jù)的統(tǒng)一性和完整性;數(shù)據(jù)清洗要借助規(guī)則的驅(qū)動[6],將不符合要求的數(shù)據(jù)清洗掉。數(shù)據(jù)裝載是將已經(jīng)清洗好的數(shù)據(jù)批量加載到目標數(shù)據(jù)庫里,然后,目標數(shù)據(jù)庫可以被系統(tǒng)直接訪問或通過數(shù)據(jù)文件方式訪問的方式進行批量加載,實現(xiàn)產(chǎn)業(yè)用地數(shù)據(jù)的統(tǒng)一入庫管理。
圖3 產(chǎn)業(yè)用地數(shù)據(jù)整合中的ETL概念模型
(2)數(shù)據(jù)庫技術(shù)
數(shù)據(jù)整合的最終形式是以ArcGIS的shape格式存儲的,但是由于城鎮(zhèn)地籍數(shù)據(jù),基礎(chǔ)地理信息數(shù)據(jù)和經(jīng)濟普查數(shù)據(jù)均是以不同的格式存儲的,這就需要將這些數(shù)據(jù)整合加載到ArcGIS工具里。以經(jīng)濟普查數(shù)據(jù)為例說明,經(jīng)濟普查數(shù)據(jù)源數(shù)據(jù)是Excel格式的,將Excel格式數(shù)據(jù)按照標準要求,保留需要的屬性。在ArcCatalog里新建表后,建立相關(guān)字段,將整理好的Excel數(shù)據(jù)加載進去。通過Access數(shù)據(jù)庫完善信息。
(3)經(jīng)濟數(shù)據(jù)與空間數(shù)據(jù)的連接
圖4 連接后的產(chǎn)業(yè)用地數(shù)據(jù)展示
整合好后的ArcCatalog里存儲的經(jīng)濟普查數(shù)據(jù)要與相應(yīng)產(chǎn)業(yè)單位空間位置數(shù)據(jù)高度保持關(guān)聯(lián),以產(chǎn)業(yè)單位的“組織機構(gòu)代碼”為主鍵,并以其為關(guān)鍵字段對這兩種數(shù)據(jù)連接。本文以合肥市產(chǎn)業(yè)用地數(shù)據(jù)整合為例,將連接后的產(chǎn)業(yè)單位空間數(shù)據(jù)以及相應(yīng)的其他類數(shù)據(jù)添加到ArcMap里,展示結(jié)果如圖4所示,其中點表示產(chǎn)業(yè)單位。
為了保證產(chǎn)業(yè)用地綜合數(shù)據(jù)庫成果的準確性、完整性,按照相關(guān)標準和要求,對數(shù)據(jù)成果建立多級多層次的質(zhì)量檢查機制。在數(shù)據(jù)整合的各個中間環(huán)節(jié)及最后成果階段,均進行工作人員自檢、工作小組互查、項目負責人抽查的多層次的檢查。具體數(shù)據(jù)質(zhì)量要求如下:
(1)數(shù)據(jù)入庫前應(yīng)對數(shù)據(jù)進行100%的數(shù)據(jù)質(zhì)量檢查。
(2)數(shù)據(jù)入庫后要對計算機自動輸出成果進行檢查。
(3)數(shù)據(jù)運行過程中要對數(shù)據(jù)庫整體安全性運行檢查。
(4)坐標系使用國家西安1980坐標系,投影類型使用3°分帶高斯-克呂格投影。
(5)宗地、房屋的要素完整。
(6)宗地、房屋等主要面狀要素的拓撲關(guān)系正確。
(7)注記要素完整。
(8)數(shù)據(jù)的命名及存儲格式符合要求,內(nèi)容完整。
隨著產(chǎn)業(yè)用地相關(guān)領(lǐng)域的深入研究,本文的產(chǎn)業(yè)用地數(shù)據(jù)整合路線已經(jīng)得到應(yīng)用,筆者參與了整個課題建設(shè)的流程,從數(shù)據(jù)采集,源數(shù)據(jù)的分析,標準的制定到數(shù)據(jù)整合的路線及關(guān)鍵技術(shù)不斷研究補充,取得了進展。產(chǎn)業(yè)用地數(shù)據(jù)由于其來源不同,格式不同,整合標準尚沒有統(tǒng)一等原因,造成此類整合內(nèi)容有一定的局限性,需要進一步探索研究及完善。
[1]李國平,薛領(lǐng).產(chǎn)業(yè)與空間:北京市產(chǎn)業(yè)用地分析、評價與集約利用研究[M].北京:中國經(jīng)濟出版社,2008.
[2]胡劉鵬,高飛,胡小華.基于ARCGIS的產(chǎn)業(yè)用地數(shù)據(jù)庫系統(tǒng)設(shè)計研究[J].測繪,2012,35(3):131~134.
[3]楊亞鋒,王黎明.地理信息系統(tǒng)建設(shè)中的幾個問題[J].測繪通報,2003(1):46~47.
[4]葛迪.ETL技術(shù)在交通信息資源整合工程中的應(yīng)用研究[D].哈爾濱:哈爾濱工程大學,2010.
[5]張梅蘭,肖桂榮.區(qū)域地理空間數(shù)據(jù)整合技術(shù)研究[J].計算機與數(shù)字工程,2011,39(1):48 ~52.
[6]舒飛躍.基于知識與規(guī)則驅(qū)動的國土資源空間數(shù)據(jù)整合方法研究[J].國土資源信息化,2007,(3):19~25.