邵林杉
(貴州省地質(zhì)礦產(chǎn)勘查開發(fā)局 測繪院,貴州 貴陽550018)
人口信息是國家的基礎(chǔ)信息之一,而我國是一個人口眾多的國家,目前人口統(tǒng)計局的工作重點和難點已經(jīng)逐步聚焦在如何有效管理和利用日益增多的統(tǒng)計數(shù)據(jù)上。傳統(tǒng)的人口管理信息已無法滿足信息時代經(jīng)濟快速發(fā)展的需要,開發(fā)GIS人口資源數(shù)據(jù)庫管理系統(tǒng)勢在必行[1]。GIS先進的空間數(shù)據(jù)庫管理和強大的空間數(shù)據(jù)分析功能,可以輕松地實現(xiàn)多元異構(gòu)數(shù)據(jù)的有機融合,快速完成大量統(tǒng)計數(shù)據(jù)的空間分析,并以地圖語言的形式表達最終的分析與計算結(jié)果[2]。
將GIS應(yīng)用于人口信息數(shù)據(jù)庫的優(yōu)勢主要體現(xiàn)在兩個方面:①GIS為人口信息提供了數(shù)據(jù)采集和管理的平臺。GIS可以實現(xiàn)空間圖形信息與屬性信息的一體化管理,建立空間與屬性的有機聯(lián)系,通過地圖圖元的空間唯一位置將分析模型相關(guān)的所有數(shù)據(jù)有機串聯(lián)起來。②G1S為人口信息分析模型提供了模型集成平臺。GIS具有強大空間數(shù)據(jù)管理和查詢分析功能。同時,這些功能也能方便地與其他人口分析模型進行集成,進而解決各種實際應(yīng)用,GIS的開放結(jié)構(gòu)也使得系統(tǒng)擴展其他模型非常方便[3]。
人口空間數(shù)據(jù)庫是連接人口統(tǒng)計數(shù)據(jù)和地理基礎(chǔ)數(shù)據(jù),并實現(xiàn)兩者信息相匹配的復(fù)雜數(shù)據(jù)庫系統(tǒng)。從內(nèi)容上可將其劃分為兩類:空間數(shù)據(jù)庫和屬性數(shù)據(jù)庫??臻g數(shù)據(jù)庫是由具有基礎(chǔ)性和空間分布特征的矢量和柵格數(shù)據(jù)組成的圖形數(shù)據(jù)庫(內(nèi)容包括行政區(qū)劃、土地利用、水系、道路等);屬性數(shù)據(jù)庫主要由來源和數(shù)據(jù)質(zhì)量相對可靠的社會統(tǒng)計信息構(gòu)成[4]。
在這期間要確保數(shù)據(jù)的準確性、完整性和時效性??梢赃M行抽樣對地區(qū)的人口數(shù)據(jù)進行校正,可以將縣總?cè)丝跀?shù)與縣域范圍內(nèi)的鄉(xiāng)鎮(zhèn)總?cè)丝跀?shù)進行比較、將省總?cè)丝谂c省域范圍內(nèi)的縣人口總數(shù)比較、全國人口與各省總?cè)丝跀?shù)進行比較等[5]。
包括矢量化地圖,柵格地形圖處理,遙感影像處理例如進行遙感影像解譯提取出居民地、水系、交通、地形要素,生成點居民地層、面居民地層、面狀河流湖泊層、公路層、鐵路層、鄉(xiāng)鎮(zhèn)居民點層;人口普查屬性數(shù)據(jù)表建立例如對地區(qū)的人口密度進行地理編碼,就是指定人口數(shù)據(jù)與它的地理位置關(guān)聯(lián)起來,實現(xiàn)人口密度數(shù)據(jù)與實際空間位置的統(tǒng)一[6]。
一般包括三個部分:數(shù)據(jù)存儲、數(shù)據(jù)管理和數(shù)據(jù)訪問。數(shù)據(jù)存儲,即將數(shù)據(jù)以某種格式記錄在計算內(nèi)部或外部介質(zhì)上。其存儲方式與數(shù)據(jù)文件的組織密度相關(guān),關(guān)鍵在于建立記錄的邏輯順序,即確定存儲的地址,以便提高存取的速度;另外要確定在數(shù)據(jù)管理系統(tǒng)中存儲和檢索數(shù)據(jù)的基本結(jié)構(gòu)。數(shù)據(jù)管理,需要管理的數(shù)據(jù)包括空間幾何體數(shù)據(jù)、非空間屬性數(shù)據(jù)??刹捎梦募芾砼c關(guān)系數(shù)據(jù)庫管理相結(jié)合的數(shù)據(jù)管理方案,同時使用文件和關(guān)系數(shù)據(jù)庫來管理GIS數(shù)據(jù)。數(shù)據(jù)的訪問一般根據(jù)用戶的要求進行選擇查看并應(yīng)用。
基于后臺關(guān)系型數(shù)據(jù)庫管理系統(tǒng)Oracle和數(shù)據(jù)庫引擎ArcSDE,運用GIS特有的空間數(shù)據(jù)和屬性數(shù)據(jù)管理能力,將相關(guān)的窄間數(shù)據(jù)和屬性數(shù)據(jù)進行匹配、疊加等一系列處理,生成地區(qū)人口空間、屬性一體化數(shù)據(jù)庫。
圖1 空間數(shù)據(jù)庫要素組織圖
在服務(wù)器端ArcSDE連接到Oracle以后,根據(jù)人口統(tǒng)計數(shù)據(jù)模型,創(chuàng)建各種要素集和要素類,以及關(guān)聯(lián)關(guān)系和拓撲關(guān)系規(guī)則,就可以利用ArcGISDesktop中的功能模塊ArcCatalog提供的向?qū)?,根?jù)人口統(tǒng)計模型結(jié)構(gòu),創(chuàng)建要素集、要素、屬性表、關(guān)聯(lián)類等;再分別導(dǎo)人空間數(shù)據(jù)和屬性數(shù)據(jù),實現(xiàn)人口數(shù)據(jù)庫的數(shù)據(jù)入庫和數(shù)據(jù)統(tǒng)一管理,并且提供各種常用的城市人口空間信息查詢、分析、專題地圖和圖表制作的功能。
所需數(shù)據(jù)基本分為兩類:空間數(shù)據(jù)和屬性數(shù)據(jù)。空間數(shù)據(jù)主要包括重慶市1:10000的行政區(qū)劃圖、城市道路圖、地形圖、河流等矢量圖;還包括帶有明顯空間位置的地理信息遙感影像數(shù)據(jù)資料圖。屬性數(shù)據(jù)包括人口專題屬性數(shù)據(jù)(主要包括統(tǒng)計年鑒、各街道辦事處的人口調(diào)研數(shù)據(jù)等描述性的屬性信息)。
重慶市人口GIS空間數(shù)據(jù)主要由地理底圖數(shù)據(jù)、點文件、線文件、面文件組成,其中地理底圖數(shù)據(jù)包含一些最基本的信息,如道路、建筑物等;各城市位置的空間數(shù)據(jù)形成點文件;省界、市界等的空間數(shù)據(jù)形成線文件;省、市、流域等的空間數(shù)據(jù)形成面文件,將這些文件進行合理的保存和安排(如圖1)。然后將空間數(shù)據(jù)和屬性數(shù)據(jù)相連,比如行政區(qū)的面文件和其人口數(shù)據(jù)相連例如,用ID公共字段連接空間信息和屬性信息。且在空間信息關(guān)聯(lián)的過程中,有時要關(guān)聯(lián)的擴展屬性表不止一個,所以必須充分考慮空間要素與擴展屬性信息的相關(guān)性,盡量避免產(chǎn)生數(shù)據(jù)結(jié)構(gòu)的冗余性。比如重慶市的行政區(qū)劃名稱、代碼、編號、面積等具有持久性的信息存放在一個文件中。另外,人口數(shù)量、受教育程度、性別比例、農(nóng)業(yè)或者非農(nóng)業(yè)人口、民族、信仰等具有變動特征的信息存放在另一個文件中,并通過關(guān)鍵字段相連(如圖2)。
如果將與人口有關(guān)的屬性數(shù)據(jù)和空間數(shù)據(jù)都存儲在數(shù)據(jù)庫中,則數(shù)據(jù)量龐大,數(shù)據(jù)的存儲、修改、讀取困難,也影響計算機的運行速度,所以要考慮的問題首先是需要考慮哪些與人口相關(guān)的因素入庫。人口空間分布受多種因素的影響,其中比較主要的幾個因素是氣候、地貌、交通、水系、土地利用、城市規(guī)模等。重慶市人口數(shù)據(jù)的空間分布研究,最重要的是要研究城市與鄉(xiāng)村人口分布的地理規(guī)律特征和區(qū)域特點,針對不同地區(qū),對影響人口分布的各因素分別進行分析,確定影響人口分布的主導(dǎo)因子。
圖2 重慶市人口數(shù)據(jù)庫建立流程圖
面對龐大的數(shù)據(jù)量如何選擇有效的方法對數(shù)據(jù)進行存儲,方便數(shù)據(jù)的修改和讀取也是難題之一。需要建立一個空間索引,建立一個檢索模型,通過城市區(qū)域坐標建立R樹索引——快速檢索幾何數(shù)據(jù)管理表。當數(shù)據(jù)庫的客戶端調(diào)用的時候通過檢索行政區(qū)劃的省—市—區(qū)(縣)——鄉(xiāng)得到需要的數(shù)據(jù)。
Geodatabase作為面向?qū)ο蟮腉IS數(shù)據(jù)模型,將空間數(shù)據(jù)和屬性數(shù)據(jù)有效地融合起來,對于處理復(fù)雜的地理空間對象有極大的優(yōu)越性。在此基礎(chǔ)上建立的人口統(tǒng)計數(shù)據(jù)模型。以地理空間數(shù)據(jù)和人口屬性數(shù)據(jù)為主要研究內(nèi)容,探討如何更好地將空間地理信息和人口普查信息有效地集成起來,建立面向?qū)ο蟮娜丝诳臻g數(shù)據(jù)庫,便于人口信息的各種空間檢索和分析處理,對人口信息資源進行充分開發(fā)與應(yīng)用,對于加強人口信息管理、科學(xué)決策可起到積極作用。存在的不足是可能由于數(shù)據(jù)量巨大而是操作速度變慢,在以后的學(xué)習(xí)中還將進行深入研究。
[1]李恒凱,陳優(yōu)良,李亮.基于GIS的江西省人口信息分析系統(tǒng)開發(fā)[J].人民黃河,2011,32(8):88-92.
[2]王均,陳向東.兩漢時期人口數(shù)據(jù)庫建設(shè)與應(yīng)用探討[J].測繪科學(xué),2001,26(3):43-48.
[3]劉艷萍,劉五周.基于ArcGIS的河南省人口資源數(shù)據(jù)庫設(shè)計與實現(xiàn)[J].科學(xué)時代,2010,21:232-235.
[4]白潔,陳 曦,楊遼,李江宏.梁承東基于GIS的面向?qū)ο笕丝诳臻g數(shù)據(jù)庫設(shè)計[J].蘭州大學(xué)學(xué)報,2009,45(4):13-19.
[5]陸偉東.同治以前陜甘回民聚落分布與數(shù)據(jù)庫建設(shè)[J].西北民族研究,2012,(4):37-45.
[6]李明玉,黃虎國,金愛芬.GIS的人口信息空間可視化技術(shù)在專題地圖制作過程中的作用[J].東疆學(xué)刊,2007,24(3):102-106.