盧 克,吳建玉
(浙江水利水電??茖W(xué)校,浙江杭州 310018)
統(tǒng)計(jì)數(shù)據(jù)記錄著國(guó)家和社會(huì)的發(fā)展?fàn)顩r,是一個(gè)國(guó)家和地區(qū)最重要、最基本的信息資源,是認(rèn)識(shí)國(guó)情(區(qū)情)的重要依據(jù).在制定國(guó)策(地區(qū)政策)、經(jīng)濟(jì)發(fā)展計(jì)劃時(shí),將自然資源、人口、環(huán)境及社會(huì)經(jīng)濟(jì)發(fā)展等統(tǒng)計(jì)數(shù)據(jù)進(jìn)行綜合分析,是解決區(qū)域環(huán)境和社會(huì)問題,實(shí)現(xiàn)地區(qū)可持續(xù)、科學(xué)發(fā)展的基本條件.要實(shí)現(xiàn)這些數(shù)據(jù)的綜合分析利用,須先要解決統(tǒng)計(jì)數(shù)據(jù)的空間統(tǒng)計(jì)單元問題.一般社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)是以行政區(qū)劃為統(tǒng)計(jì)單元,經(jīng)過普查或抽樣調(diào)查等方法,然后逐級(jí)匯總,最終獲得的數(shù)據(jù)綜合反映了該行政區(qū)某統(tǒng)計(jì)指標(biāo)數(shù)據(jù)的總和.因此,在與其他數(shù)據(jù)進(jìn)行融合分析時(shí)存在以下問題:
(1)以行政單元為統(tǒng)計(jì)范圍所得到的統(tǒng)計(jì)數(shù)據(jù)是該行政單元內(nèi)統(tǒng)計(jì)指標(biāo)的總數(shù)或均值,不能體現(xiàn)統(tǒng)計(jì)指標(biāo)的空間分布特征,缺少單元內(nèi)部的細(xì)節(jié)信息;
(2)在進(jìn)行綜合分析時(shí),研究區(qū)域不一定與行政單元范圍相一致,導(dǎo)致需要先對(duì)數(shù)據(jù)加工處理,加大分析難度;
(3)多源數(shù)據(jù)融合的基礎(chǔ)不同.資源、環(huán)境等類型的數(shù)據(jù)基于的空間單元一般不是行政區(qū)劃單元,所以與統(tǒng)計(jì)數(shù)據(jù)存在著空間尺度差異,進(jìn)行融合分析時(shí)存在較大難度.
由于統(tǒng)計(jì)空間單元的局限,不便于區(qū)域?qū)I(yè)數(shù)據(jù)綜合開發(fā)利用,不能充分利用已有的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù).實(shí)踐表明,將統(tǒng)計(jì)數(shù)據(jù)空間網(wǎng)格化方法是解決這一問題的有效方法之一.可以將基于行政單元的統(tǒng)計(jì)數(shù)據(jù)離散網(wǎng)格化,這樣與基于柵格的空間數(shù)據(jù)(如遙感、DTM地形數(shù)據(jù)等)基礎(chǔ)相一致,便于開展分析;亦可以通過對(duì)網(wǎng)格單元進(jìn)行組合,形成所需的研究區(qū)域.本文針對(duì)統(tǒng)計(jì)數(shù)據(jù)網(wǎng)格化的模型進(jìn)行分析,得出一種利用多源數(shù)據(jù)進(jìn)行融合的通用網(wǎng)格化模型.
統(tǒng)計(jì)數(shù)據(jù)空間網(wǎng)格化是指將以行政區(qū)為空間范圍的統(tǒng)計(jì)數(shù)據(jù)按照一定的策略和規(guī)則,采用某種計(jì)算方法將指標(biāo)值科學(xué)地分配到一定尺度的規(guī)則地理柵格上,以便與環(huán)境、地形等數(shù)據(jù)綜合使用,最終實(shí)現(xiàn)多源數(shù)據(jù)融合分析功能.研究區(qū)域統(tǒng)計(jì)數(shù)據(jù)網(wǎng)格化示意見圖1.一般設(shè)計(jì)的網(wǎng)格尺寸較小,可以反映區(qū)域內(nèi)部細(xì)節(jié)信息,在GIS空間分析技術(shù)的支持下,經(jīng)過網(wǎng)格化后的數(shù)據(jù)和派生出來的結(jié)果,在時(shí)間上形成以網(wǎng)格為基礎(chǔ)的時(shí)間序列,便于分析其變化規(guī)律;在空間上形成網(wǎng)格間的數(shù)據(jù)梯度,可以進(jìn)行空間分異規(guī)律研究;同時(shí)也為和遙感,DEM等柵格數(shù)據(jù)融合提供了基礎(chǔ)[1].
圖1 研究區(qū)域統(tǒng)計(jì)數(shù)據(jù)網(wǎng)格化示意
社會(huì)統(tǒng)計(jì)數(shù)據(jù)可以分為兩種類型[4],即和值變量型統(tǒng)計(jì)數(shù)據(jù)和均值變量型統(tǒng)計(jì)數(shù)據(jù).和值型統(tǒng)計(jì)數(shù)據(jù)是反映一個(gè)區(qū)域的社會(huì)、經(jīng)濟(jì)等屬性的總量水平的一類統(tǒng)計(jì)指標(biāo),如:GDP、人口數(shù)、第三產(chǎn)業(yè)總產(chǎn)值等.均值型統(tǒng)計(jì)數(shù)據(jù)是指反映一個(gè)區(qū)域的社會(huì)、經(jīng)濟(jì)等屬性的平均水平的一類統(tǒng)計(jì)指標(biāo),如:人均住房面積、人均國(guó)內(nèi)生產(chǎn)總值、人口密度等.該類指標(biāo)一般是由兩種或多種和值型統(tǒng)計(jì)數(shù)據(jù)經(jīng)過復(fù)合運(yùn)算而來的.
對(duì)于均值變量型統(tǒng)計(jì)數(shù)據(jù),網(wǎng)格化后的行政單元內(nèi)的各網(wǎng)格值按面積加權(quán)平均值應(yīng)等于這個(gè)統(tǒng)計(jì)單元的統(tǒng)計(jì)值;而對(duì)于和值變量型統(tǒng)計(jì)數(shù)據(jù),網(wǎng)格化后的行政單元內(nèi)的各網(wǎng)格值相加總和應(yīng)等于這個(gè)統(tǒng)計(jì)單元的統(tǒng)計(jì)值.由于矢量面數(shù)據(jù)的統(tǒng)計(jì)指標(biāo)值不能簡(jiǎn)單地平均分?jǐn)偟矫總€(gè)網(wǎng)格單元上,需根據(jù)統(tǒng)計(jì)指標(biāo)的特點(diǎn)(專業(yè)意義)和其他的影響(限制條件)因子來加以調(diào)整,并由其他類型相關(guān)數(shù)據(jù)輔助,找出與統(tǒng)計(jì)指標(biāo)的分布存在較強(qiáng)相關(guān)關(guān)系的影響因子,通過對(duì)這些多源數(shù)據(jù)進(jìn)行融合建模,來調(diào)整網(wǎng)格化后的統(tǒng)計(jì)指標(biāo)的空間分布,使之更符合空間實(shí)際分布情況.
合理確定格網(wǎng)單元的大小十分重要.網(wǎng)格單元面積選擇過大則不能體現(xiàn)網(wǎng)格化的作用,且應(yīng)用還是存在問題;網(wǎng)格單元面積選擇過小則會(huì)增大計(jì)算的難度,以及與之匹配的多源數(shù)據(jù)的處理也會(huì)存在難度.大量的研究文獻(xiàn)資料以及實(shí)驗(yàn)得出:在選擇格網(wǎng)大小尺度時(shí)可以采用源區(qū)域單元平均面積大小的 0.2% 進(jìn)行[4].
下面以人口數(shù)據(jù)為例,對(duì)該網(wǎng)格化模式進(jìn)行介紹[1].此案例在進(jìn)行人口數(shù)網(wǎng)格化時(shí)主要考慮到面積和核心點(diǎn)距離這兩個(gè)影響因子.這里的核心點(diǎn)數(shù)據(jù)選取行政單元駐地點(diǎn).為了使人口密度分布更符合實(shí)際情況,這里使用行政駐地點(diǎn)數(shù)據(jù)為輔助,對(duì)單個(gè)行政單元內(nèi)的人口密度分布進(jìn)行調(diào)節(jié),并認(rèn)為人口密度的分布是由行政中心向外輻射的,離中心越近,密度值越大.
設(shè)定V為含有人口數(shù)屬性的行政區(qū)劃矢量圖層,G為將生成結(jié)果的網(wǎng)格單元(柵格)圖層.V圖層的屬性表中有行政單元Vi(i=1,2,…,m)面積的字段A,其值用Ai表示;同時(shí)屬性表中含有表示人口數(shù)的字段C,其值用Ci表示.同時(shí)假設(shè)G圖層有n個(gè)網(wǎng)格單元.模型計(jì)算流程為:
(1)在V圖層的屬性表中生成一個(gè)單位面積人口數(shù)字段T,計(jì)算方法如公式(1):
在V圖層的屬性表中生成兩個(gè)新的字段Xp、Yp,用來存放其各自單元的行政中心駐地點(diǎn)的坐標(biāo).
在G圖層的屬性表中生成兩個(gè)新的字段Xc、Yc,用來存放其各自的網(wǎng)格中心點(diǎn)坐標(biāo).
(2)對(duì)圖層V和G進(jìn)行空間多邊形疊加Union操作,見圖2.Union命令將產(chǎn)生一個(gè)新的圖層,并保留原來兩個(gè)圖層的所有區(qū)域,新圖層U的屬性表中包含V、G圖層的相應(yīng)屬性字段.參與后面計(jì)算步驟的屬性字段有:V圖層的ID碼字段Vi、T字段(其值用Ti表示)、C字段(其值用Ci表示)和Xp、Yp字段(其值用Xpi、Ypi表示),G圖層的ID碼字段Gi和Xc、Yc字段(其值用Xcj、Ycj表示),另外新圖層U將自動(dòng)生成各新多邊形的面積字段A,其值表示為Aij,i表示V圖層的 ID 碼,j表示G圖層的 ID 碼[2].
圖2 空間多邊形并(Union)示意圖
在U圖層中添加一個(gè)字段R來存放權(quán)重,采用距離倒數(shù)來作為權(quán)重,其值計(jì)算如式(2):
為了避免網(wǎng)格間的數(shù)值差別過大,可以給其設(shè)定范圍[Min,Max],當(dāng)Rij小于 Min 的時(shí)候取 Min,大于Max的時(shí)候取Max.
在U圖層中添加一個(gè)字段E來存放調(diào)節(jié)參數(shù),由同一個(gè)行政單元生成出的新多邊形有相同的值,記為Ei.
通過公式(3)可以計(jì)算出Ei的值.j的取值為G圖層中落在V圖層i對(duì)象內(nèi)部或相交的Gj對(duì)象編號(hào).
(3)在U圖層中新建字段U,用來存儲(chǔ)新多邊形對(duì)應(yīng)的人口數(shù)值,其值按公式(4)計(jì)算:
式中,Uij表示V圖層的Vi行政單元與G圖層的Gj格網(wǎng)疊加的交集.
(4)在G圖層中新建字段P,將U圖層中字段G-ID等于j(j=1,2,…,n)的所有Uij字段值相加,其結(jié)果值作為G圖層中字段G-ID等于j對(duì)應(yīng)的P字段.如式(5):
計(jì)算結(jié)束以后,G圖層P字段的內(nèi)容即是網(wǎng)格化的結(jié)果.
按照上述模型,利用廣西市級(jí)人口數(shù)據(jù)來進(jìn)行網(wǎng)格化處理,結(jié)果見圖3.從中可以看出,該方法產(chǎn)生的結(jié)果保持了行政單元統(tǒng)計(jì)數(shù)據(jù)的特征,如果行政單元數(shù)據(jù)的空間尺度比較高,則網(wǎng)格的分辨率也會(huì)提高,有利于準(zhǔn)確描述統(tǒng)計(jì)數(shù)據(jù)的空間分布;核心點(diǎn)數(shù)據(jù)也可以選取居民點(diǎn)或其他點(diǎn)數(shù)據(jù),這樣一個(gè)行政單元內(nèi)可以有多個(gè)核心點(diǎn),這樣更能提高其空間分布的精度;另外如果還能融合DEM、土地利用覆蓋等其他與統(tǒng)計(jì)指標(biāo)相關(guān)數(shù)據(jù),也可以使其更符合實(shí)際的空間分布狀況.
圖3 人口統(tǒng)計(jì)數(shù)據(jù)網(wǎng)格化結(jié)果
根據(jù)以上分析可以對(duì)參與多源融合的輔助數(shù)據(jù)分為以下3類:
(1)點(diǎn)類數(shù)據(jù)(如:駐地、居民點(diǎn)數(shù)據(jù)):采用反距離權(quán)重方式施加影響,正反影響.記為SRij.SRij是多個(gè)點(diǎn)距離權(quán)重的和值.
(2)面類型數(shù)據(jù)(如:土地利用類型):對(duì)其進(jìn)行分類分級(jí),不同的類別或等級(jí),賦予不同的權(quán)重,可以是等比、等差的或者是指數(shù)、對(duì)數(shù)的,具體根據(jù)統(tǒng)計(jì)指標(biāo)的意義來確定.將面類型數(shù)據(jù)和生成的格網(wǎng)數(shù)據(jù)進(jìn)行疊加操作,落在某一類別或等級(jí)區(qū)域中的格網(wǎng)獲得相應(yīng)的權(quán)重.如果一個(gè)網(wǎng)格落在多個(gè)類型的區(qū)域上,則該網(wǎng)格的權(quán)重值由多個(gè)類型確定.記該類型的權(quán)重值為Sj.
(3)網(wǎng)格類型數(shù)據(jù)(如:DEMDTM數(shù)據(jù)):如果網(wǎng)格的大小相同,則不用進(jìn)行轉(zhuǎn)換;如果分辨率不一致,則需要對(duì)其進(jìn)行重采樣,使其與生成的網(wǎng)格大小相一致.對(duì)應(yīng)的網(wǎng)格根據(jù)輔助數(shù)據(jù)獲得相應(yīng)的權(quán)重值.記為Zj.
結(jié)合以上輔助類型數(shù)據(jù),該網(wǎng)格化模式需對(duì)公式(3)修改為:
公式(4)改為:
本文是以人口統(tǒng)計(jì)數(shù)據(jù)網(wǎng)格化為例,對(duì)基于多源數(shù)據(jù)融合的統(tǒng)計(jì)數(shù)據(jù)的空間網(wǎng)格化方法進(jìn)行了介紹,主要目的是建立一種通用模型,來利用多源輔助數(shù)據(jù)將統(tǒng)計(jì)指標(biāo)值更合理的分配到空間網(wǎng)格單元上.文中以距離行政區(qū)劃駐地?cái)?shù)據(jù)作為影響人口分布的因子,來說明該通用模型的技術(shù)實(shí)現(xiàn)流程.對(duì)于其它類型的輔助數(shù)據(jù),只要合理選擇影響因子和權(quán)重,都可以使用該通用模型來實(shí)現(xiàn)空間分配的更科學(xué)化.隨著統(tǒng)計(jì)數(shù)據(jù)社會(huì)綜合應(yīng)用分析的深入發(fā)展,其網(wǎng)格化將是一項(xiàng)基礎(chǔ)工作,本文提出的網(wǎng)格化通用模式,在基于遙感、測(cè)量、生態(tài)和實(shí)地調(diào)查等多源數(shù)據(jù)融合基礎(chǔ)上,使統(tǒng)計(jì)數(shù)據(jù)格網(wǎng)化將向動(dòng)態(tài)方向發(fā)展,能提高網(wǎng)格結(jié)果數(shù)據(jù)的實(shí)用性和合理性.
[1]范一大,史培軍,辜智慧,等.行政單元數(shù)據(jù)向網(wǎng)格單元轉(zhuǎn)化的技術(shù)方法[J].地理科學(xué),2004,24(1):105 -108.
[2]廖順寶,孫九林.基于GIS的青藏高原人口統(tǒng)計(jì)數(shù)據(jù)空間化[J].地理學(xué)報(bào),2003,58(1):25 -33.
[3]符海月,李滿春,趙 軍,等.人口數(shù)據(jù)格網(wǎng)化模型研究進(jìn)展綜述[J].人文地理,2006,89(3):115 -119.
[4]閆慶武,卞正富.基于GIS的社會(huì)統(tǒng)計(jì)數(shù)據(jù)空間化處理方法[J].云南地理環(huán)境研究,2007,19(2):92 -95.
[5]朱良峰,吳信才,劉修國(guó).GIS中矢量多邊形網(wǎng)格化問題研究[J].地理與地理信息科學(xué),2004,20(1):12 -15.
[6]MENNIS,JEREMY.Generating Surface Models of Population Using Dasymetric Mapping[J].Professional Geographer,2003(1):31 -43.
[7]COHEN M,GREENBERG D P,IMMEL D S,et al.An efficient radiosity approach for realisity image synthesis[J].IEEE Computer Graphics and Application,1986,6(3):26-35.