屈 清,田永中,王 龍,郭金銘,刁德彬
(1.西南大學 地理科學學院,重慶 北碚 400715;2.內江師范學院 地理與資源環(huán)境學院 ,四川 內江 641112)
基于FME與ArcGIS的空間數(shù)據(jù)連接與數(shù)值模擬
屈 清1,田永中1,王 龍1,郭金銘2,刁德彬1
(1.西南大學 地理科學學院,重慶 北碚 400715;2.內江師范學院 地理與資源環(huán)境學院 ,四川 內江 641112)
在已有GIS理論與空間數(shù)值模擬的基礎上,根據(jù)涪陵區(qū)DEM、降水、溫度、農(nóng)用地質量等級和永久基本農(nóng)田等數(shù)據(jù),綜合使用FME與ArcGIS的數(shù)據(jù)鏈接集成、可視化與圖解建模等功能,并結合數(shù)據(jù)統(tǒng)計分析軟件SPSS,發(fā)現(xiàn)農(nóng)用地利用等指數(shù)分布與其他地理要素存在線性相關關系;并在此基礎上構建了多元線性回歸模型。此模型主要用于解決永久基本農(nóng)田劃定中利用等指數(shù)部分缺失問題。
基本農(nóng)田;GIS;空間數(shù)據(jù);模擬
地理空間數(shù)據(jù)是用來表示地理實體或現(xiàn)象的位置、形狀、大小及其分布等諸方面特征的數(shù)據(jù)[1,2]。從眾多的地理空間數(shù)據(jù)中獲取有用的地理空間數(shù)據(jù)是比較困難的,本文以區(qū)域性的地理數(shù)據(jù)處理為例,將FME與ArcGIS相結合進行了空間數(shù)據(jù)處理并實現(xiàn)了數(shù)值模擬,探尋未知區(qū)域的數(shù)據(jù)[3]。
1.1 研究區(qū)概況
涪陵區(qū)位于北緯29°21′~30°01′,東經(jīng)106°56′~107°43′之間,地處四川盆地和盆邊山地過渡地帶,長江與烏江交匯處。該區(qū)域地貌以低山丘陵為主,地勢總體上東南高而西北低[4],整體條件優(yōu)異,有利于農(nóng)作物的生長。
1.2 地形特征分析
根據(jù)中國科學院研究員李炳元[5]對陳志明[6]及歐洲地貌形態(tài)的總結分類,總體上涪陵區(qū)地形可歸納為4大類型(見表1):微起伏平原、平壩,起伏丘陵,山地起伏低山和山地起伏低中山。
表1 涪陵區(qū)地表形態(tài)歸類
利用ArcGIS10可實現(xiàn)地表形態(tài)的可視化分類,實驗過程分4步進行(見圖1)。結合ArcGIS10的圖解建模功能,利用涪陵區(qū)的DEM與地表起伏度數(shù)據(jù)建立涪陵區(qū)地表形態(tài)分類組合圖解模型。圖解模型中最主要部分是要實現(xiàn)柵格數(shù)據(jù)的擦除功能,以及海拔數(shù)據(jù)與起伏度兩者相結合的涪陵區(qū)地表形態(tài)分類(見圖2),并在此基礎上將每個結果合并為一個數(shù)據(jù)集,最終得到涪陵區(qū)的地表形態(tài)分類(見圖3)。由此可見,涪陵區(qū)地表形態(tài)主要是起伏丘陵山地,其次是平原、平壩,起伏較大的山地比較少。
圖1 涪陵區(qū)地表形態(tài)分類過程圖
圖2 ArcGIS10擦除功能實現(xiàn)圖解模型圖
圖3 涪陵區(qū)地表形態(tài)分類圖
圖4 數(shù)據(jù)推導模型構建流程圖
1.3 氣候特征分析
涪陵全區(qū)總體上降水量比較充沛,但仍然存在空間上的不均,降水主要集中在東南武陵山丘陵、山地起伏區(qū),西南微起伏平原、平壩區(qū),長江、烏江一線降水量相對偏少。涪陵區(qū)常年均溫較高,年均高溫區(qū)主要集中在長江、烏江一線,年均中溫區(qū)主要位于臺地和丘陵地區(qū),年均低溫區(qū)包括東南山地起伏和山地區(qū)。
1.4 農(nóng)用地等級空間分布
根據(jù)涪陵區(qū)農(nóng)用地分等定級成果數(shù)據(jù),通過空間可視化定性分析,全區(qū)利用等級較高的區(qū)域主要分布在平原、平壩區(qū)域以及年均溫較高降水適中的區(qū)域;利用等級較低區(qū)域大都分布在起伏山地與丘陵區(qū)域,年均溫較低區(qū)域。從可視化角度,結合上述地形與降水、氣溫圖分析發(fā)現(xiàn),利用等級與地形分類的相關程度較高,吻合度較好,具有一定的規(guī)律性。
為了探尋未知區(qū)域的數(shù)據(jù),需把不同來源但相同空間位置的數(shù)據(jù)通過疊加,將上述海拔、地表起伏度、氣溫、降水、坡度、農(nóng)用地利用等數(shù)據(jù)集成在一起進行空間統(tǒng)計分析,并構建相關的數(shù)學模型,實現(xiàn)對未知區(qū)域數(shù)據(jù)的求解。首先需要構建數(shù)據(jù)分析處理總體流程,如圖4所示。
2.1 數(shù)據(jù)鏈接輸入
FME重投影是在缺少轉換七參數(shù)的前提下首選的方式。首先需要在FME Workbench中將原始基于北京54坐標系的土地利用等數(shù)據(jù)*.shp格式文件輸入FME,然后調用Reprojector函數(shù)模塊,設置輸出的坐標系統(tǒng)為西安80坐標系,通過這種方法可很好地將基于北京54的農(nóng)田分等定級數(shù)據(jù)與基于西安80的基本農(nóng)田數(shù)據(jù)實現(xiàn)空間位置配準。在空間數(shù)據(jù)校正的基礎上,以基本農(nóng)田圖斑為統(tǒng)計單位,利用ArcGIS中的分區(qū)統(tǒng)計將需要融入分析的空間位置相同的數(shù)據(jù)以標識碼為統(tǒng)計單位和數(shù)據(jù)鏈接依據(jù),將所涉及的空間數(shù)據(jù)集成為一張表,便于數(shù)據(jù)統(tǒng)計分析。這里所涉及的空間數(shù)據(jù)主要包括海拔、地表起伏度、氣溫、降水、坡度、基本農(nóng)田圖斑和農(nóng)用地利用等。
2.2 利用等指數(shù)反演數(shù)學模型構建
采用上述數(shù)據(jù)集成方法將海拔、氣溫和降水等數(shù)據(jù)合并為一張表格(見表2),建立基本農(nóng)田圖斑標識碼與這些數(shù)據(jù)的對應關系,總計涉及83 764個圖斑,其中缺失質量數(shù)據(jù)部分總計15 530塊圖斑,此部分利用等指數(shù)的獲取作為空間數(shù)值模擬的重點。
結合諸多要素數(shù)據(jù)以及回歸模型,其基本構建流程為:①對多要素與基本農(nóng)田質量指數(shù)的相關性進行分析;②提取相關性明顯的要素進行回歸分析,選取構建模型構建回歸模型。
2.2.1 數(shù)據(jù)的量化分析
根據(jù)表2中數(shù)據(jù),采用地理學中的經(jīng)典統(tǒng)計分析方法,分別分析5類地理要素與利用等指數(shù)之間的相關程度,分別記為相關系數(shù)Rei、Rqi、Rsi、Rri和Rti。將上述空間變量代入Pearson的相關系數(shù)計算公式可求出相關系數(shù)。
表2 基本農(nóng)田圖斑地理要素對應表
利用SPSS數(shù)據(jù)分析軟件對上述數(shù)據(jù)進行相關分析,得到各要素與土地質量等級的相關性程度表(表3)。可以看出,在樣本容量為66 948且置信水平為0.01的情況下,質量等級與坡度、起伏度表現(xiàn)出強烈的負相關;與年均降水量和海拔高度呈負相關,但相關性較弱;與年均氣溫呈正相關,且正相關較強??傊@5類地理要素與質量等級之間表現(xiàn)為較強的線性關系,從相關程度上選取起伏度、坡度和年均氣溫作為構建土地質量估計模型的參數(shù)。
表3 各地理要素與土地利用等指數(shù)相關系數(shù)表
2.2.2 構建回歸模型及模型顯著性檢驗
在構建回歸模型之前,需明確地理要素變量的多寡,如果要素變量在一個以上,則需要選擇多元線性回歸模型,多元線性回歸 模型更具有普遍意義[7]。
假設土地利用等指數(shù)這一因變量i受3個自變量s、p、q的影響,其n組觀測值為(ia,sa,pa,qa),a=1,2,…,66 948,那么多元線性回歸模型的結構形式為:
式中,β0、β1、β2、β3為待定參數(shù);εa為隨機變量。
如果b0、b1、b2、b3分別為β0、β1、β2、β3的擬合值,則回歸方程為:
式中,b0為常數(shù);b1、b2、b3分別為偏回歸系數(shù)。其意義在于當其他自變量sj、tj、qj(j≠w)固定時,sw、tw、qw中一個自變量每變化一個單位而使因變量i平均改變的數(shù)值。
根據(jù)最小二乘法原理,β0、β1、β2、β3的估計值b0、b1、b2、b3應該使擬合值與觀測值之間的離差平方和趨近于最小,將樣本數(shù)據(jù)代入向量計算公式得到:
套用公式,進行矩陣運算,得到回歸系數(shù):
坡度(s)、溫度(t)和起伏度(q)之間的線性回歸方程為:
將所需參數(shù)代入公式得:
在置信水平α=0.05上,通過使用Excel中的F值計算函數(shù)FINV( ),可以查出F0.05(3,66 948)= 2.61。由于F> 2.08,所以回歸方程是顯著的。
2.2.3 對基本農(nóng)田缺失土地質量的反演
通過以上的定量化分析,土地利用等指數(shù)與地表起伏度、坡度和氣溫線性關系明顯,從而利用擬合線性回歸模型并根據(jù)起伏度、坡度和氣溫的值就能計算出基本農(nóng)田中缺失土地利用等指數(shù)部分的指數(shù)。
1)通過數(shù)值的回歸模擬,解決了涪陵區(qū)基本農(nóng)田數(shù)據(jù)中部分圖斑缺失利用等指數(shù)部分的數(shù)據(jù)。
2)綜合使用FME與ArcGIS等主流數(shù)據(jù)處理軟件,對空間數(shù)據(jù)集成的一般技術步驟做了進一步探析。
3)對涪陵區(qū)的地表形態(tài)分類做了一定的探討,不足之處在于對空間數(shù)值模擬結果需要進一步驗證,并在驗證的基礎上對模型做改進。
[1] Chang Kang-tsung. Introduction to Geographic Information Systems[M].北京:科學出版社,2003
[2] 田永中.地理信息系統(tǒng)基礎與實驗教程[M].北京:科學出版社,2010
[3] Guo Diansheng, Mennis J. Spatial Data Mining and Geographic Knowledge Discovery—An Introduction [J].Computers, Environment and Urban Systems,2009,33: 403-404
[4] 重慶市涪陵區(qū)統(tǒng)計局.涪陵統(tǒng)計年鑒2011[G].2011
[5] 李炳元.中國陸地基本地貌類型及其劃分指標探討[J].第四紀研究, 2008, 28(4): 535-543
[6] 陳志明.1∶400萬中國及其毗鄰地區(qū)地貌圖說明書[M].北京:中國地圖出版社, 1993
[7] 徐建華.計量地理學[M].北京:高等教育出版社,2006
P208
B
1672-4623(2014)01-0114-03
10.11709/j.issn.1672-4623.2014.01.039
屈清,碩士,研究方向為地圖制圖技術與土地信息系統(tǒng)。
2013-05-03。
項目來源:“十二五”農(nóng)村領域國家科技項目(2012BAJ231300)。