呂欣陽,翟開慎
(1.南京林業(yè)大學(xué)林學(xué)院,江蘇 南京 210037;2.南京大學(xué)地理與海洋科學(xué)學(xué)院,江蘇 南京210023)
農(nóng)村居民點(diǎn)在我國農(nóng)村用地類型中占有重要地位,是農(nóng)村地區(qū)長期復(fù)雜的自然、人文因素相互作用相互影響的產(chǎn)物,其分布情況在一定程度上反映著當(dāng)?shù)氐淖匀惶卣骱蜕鐣宋那闆r。我國改革開放至今,城市化進(jìn)程加快,農(nóng)村居民點(diǎn)地區(qū)普遍存在著量大、布局散、空心村現(xiàn)象嚴(yán)重、城鄉(xiāng)住宅容積率嚴(yán)重失衡等問題[1-3]。開展農(nóng)村居民點(diǎn)的分組類型與布局優(yōu)化的研究,能夠使得鄉(xiāng)村公共基礎(chǔ)服務(wù)設(shè)施獲得集約利用和定向維護(hù),能充分利用農(nóng)村建設(shè)用地,緩解緊張的城鄉(xiāng)用地矛盾,緩解“空心村”現(xiàn)象的進(jìn)一步擴(kuò)張。
本文選取位于太湖平原的常州市武進(jìn)區(qū)農(nóng)村居民點(diǎn)為研究對象,采用空間分析技術(shù)、數(shù)理統(tǒng)計(jì)和聚類分析等研究方法,對現(xiàn)有農(nóng)村居民點(diǎn)進(jìn)行特征提取并分類,劃分出農(nóng)村居民點(diǎn)的區(qū)位特征和待優(yōu)化農(nóng)村居民點(diǎn)的優(yōu)先程度。研究結(jié)果可為布局不合理村莊進(jìn)行優(yōu)化和整治提供整治建議,也可用于農(nóng)村土地綜合整治實(shí)地工作的理論參考。
武進(jìn)區(qū)(北緯31°20′~31°48′、東經(jīng)119°40′~120°12′),隸屬于江蘇省常州市,地處江蘇省南部的長江三角洲,位于太湖平原西北,亞熱帶北緣,光溫適宜,雨水充沛,土地肥沃,物產(chǎn)豐富,素有“魚米之鄉(xiāng)”之稱。武進(jìn)經(jīng)濟(jì)產(chǎn)業(yè)發(fā)達(dá)且發(fā)展實(shí)力強(qiáng)勁。作為典型“蘇南模式”的發(fā)源地之一,武進(jìn)民營經(jīng)濟(jì)發(fā)達(dá),被列為全國首批雙創(chuàng)示范基地,中國馳名商標(biāo)數(shù)量穩(wěn)居全省前列,綜合實(shí)力長期穩(wěn)居全國2 800多個(gè)縣(市、區(qū))十強(qiáng)。
研究收集了武進(jìn)區(qū)2015年土地利用調(diào)查數(shù)據(jù),Open Street Map(OSM)地圖矢量數(shù)據(jù),“地理空間數(shù)據(jù)云”提供的GDEM 30 m分辨率數(shù)字高程數(shù)據(jù)以及全國1 km×1 km人口密度柵格數(shù)據(jù)。通過Python語言解析高德地圖API的數(shù)據(jù),獲取武進(jìn)區(qū)范圍內(nèi)的主要POI興趣點(diǎn)數(shù)據(jù)。
表1 研究數(shù)據(jù)
從2015年武進(jìn)區(qū)地類圖斑數(shù)據(jù)中分別提取二級類中的村莊用地、公路用地和水面集(水庫、河流、湖泊、坑塘)圖斑[8]。村莊用地即農(nóng)村居民點(diǎn)單元作為研究的主要對象。
圖1 武進(jìn)區(qū)鄉(xiāng)鎮(zhèn)級行政區(qū)分布
為能更好的了解農(nóng)村居民點(diǎn)圖斑的空間分布特征和其所處區(qū)位的優(yōu)劣,研究采用建立漁網(wǎng)單元的方式進(jìn)行初步分析。使用ArcGIS中創(chuàng)建漁網(wǎng)工具,對武進(jìn)區(qū)行政區(qū)進(jìn)行規(guī)則格網(wǎng)化處理,將漁網(wǎng)圖層與武進(jìn)區(qū)地類圖斑進(jìn)行疊加分析,獲得每個(gè)格網(wǎng)單元的各項(xiàng)地類屬性。使用Python語言從國內(nèi)地圖導(dǎo)航網(wǎng)站獲取相關(guān)POI數(shù)據(jù),選取交通設(shè)施服務(wù)、科教文化服務(wù)、醫(yī)療保健服務(wù)和購物及生活服務(wù)四類POI興趣點(diǎn)數(shù)據(jù)用于研究[6]。
在ArcGIS中利用DEM數(shù)據(jù)進(jìn)行地形因子的提取,分別生成武進(jìn)區(qū)海拔高程圖、坡度圖。為研究村莊圖斑所在區(qū)域內(nèi)村莊面積及鄰域面積的大小,將矢量格網(wǎng)數(shù)據(jù)按村莊面積作為輸出值,生成村莊面積柵格圖層。使用鄰域分析計(jì)算每個(gè)格網(wǎng)單元其5×5鄰域內(nèi)村莊面積大小和人口密度。根據(jù)“中國知網(wǎng)”提供的武進(jìn)區(qū)統(tǒng)計(jì)年鑒(2015-2016年)及相關(guān)統(tǒng)計(jì)公報(bào)等材料,將武進(jìn)區(qū)各下轄鎮(zhèn)主要經(jīng)濟(jì)指標(biāo)錄入行政區(qū)各省屬性表中。
2.3.1 GIS空間分析方法
使用矢量幾何計(jì)算、矢量疊合分析和空間近鄰分析,以及柵格數(shù)據(jù)空間分析中的數(shù)字地形模型分析、分區(qū)統(tǒng)計(jì)、焦點(diǎn)統(tǒng)計(jì)等功能。
2.3.2 智能聚類分析方法
聚類分析旨在揭露一個(gè)數(shù)據(jù)集中觀測值的子集,最常用的兩種聚類方法是層次聚類和劃分聚類。對于層次聚類來說,最常用的算法是單聯(lián)動、全聯(lián)動、平均聯(lián)動、質(zhì)心和Ward方法。對于劃分聚類來說,最常用的算法是K均值(K-means)和圍繞中心點(diǎn)的劃分(PAM)。本研究采用K均值聚類分析,算法步驟如下:
(1)隨機(jī)地選擇K條數(shù)據(jù),作為初次聚類中心點(diǎn);
(2)把每條數(shù)據(jù)行對應(yīng)的數(shù)據(jù)分配到距它最近的中心點(diǎn);
(3)重新計(jì)算K類中各點(diǎn)到其所在類的中心點(diǎn)距離的平均值;
(4)將每個(gè)數(shù)據(jù)按最近距離分配到它最近的中心點(diǎn);
(5)重復(fù)步驟(3)和(4)直到所有觀測值不再被分配或達(dá)到最大的預(yù)設(shè)迭代次數(shù)。
通過對2015年武進(jìn)區(qū)地類圖斑數(shù)據(jù)進(jìn)行空間分析,獲得農(nóng)村居民點(diǎn)的用地現(xiàn)狀。運(yùn)用地形位指數(shù),再結(jié)合交通因素,分析農(nóng)村居民點(diǎn)分布的離散特征以及影響因素的分布特點(diǎn),最后總結(jié)出武進(jìn)區(qū)農(nóng)村居民點(diǎn)的空間分布特征。取漁網(wǎng)單元中心點(diǎn)代表對應(yīng)的漁網(wǎng)單元格區(qū)域,分別計(jì)算了單元中心點(diǎn)與POI興趣點(diǎn)和公路的距離。將研究對象抽象為具有相同的面積范圍的格網(wǎng)單元,比較它們之間內(nèi)部地類構(gòu)成及各單元格的地理空間特征。
2015年,武進(jìn)區(qū)村莊用地面積為12 573.6 hm2,占全區(qū)土地總面積的13.80%,占全區(qū)建設(shè)用地面積的35.92%,村莊用地較2014年增長109.9 hm2。2015年武進(jìn)區(qū)地類圖斑包含村莊圖斑數(shù)24 467個(gè),圖斑最小面積為2.5 m2,最大面積為244 162.4 m2。
地形位指數(shù)是一個(gè)由海拔和坡度計(jì)算出的,分別包括了地區(qū)高程、坡度特征的一個(gè)綜合描述性指數(shù),反映某一地區(qū)的地形屬性,地形位指數(shù)計(jì)算公式為:
(1)
式(1)中:E為研究區(qū)域內(nèi)平均高程值;s為空間任一柵格坡度值;S為區(qū)域內(nèi)平均坡度值。計(jì)算各格網(wǎng)單元對應(yīng)的地形位指數(shù),可綜合描述高程和坡度屬性。高程越低且坡度越小的格網(wǎng)單元,地形位指數(shù)越低。地形位指數(shù)越低,越利于農(nóng)村居民點(diǎn)的建設(shè)和發(fā)展。
相關(guān)分析(Correlation Analysis)是研究兩個(gè)或兩個(gè)以上處于同等地位的隨機(jī)變量間的相關(guān)關(guān)系的統(tǒng)計(jì)分析方法,用來定量表述影響因子之間關(guān)系的密切程度。使用RStudio軟件對格網(wǎng)單元屬性數(shù)據(jù)進(jìn)行相關(guān)分析和顯著性檢驗(yàn)。在進(jìn)行相關(guān)分析和檢驗(yàn)之前,對原始數(shù)據(jù)進(jìn)行z-Score標(biāo)準(zhǔn)化處理。采用Pearson檢驗(yàn)計(jì)算線性相關(guān)系數(shù)(圖2)。
圖2 研究區(qū)數(shù)據(jù)相關(guān)分析圖
用于研究農(nóng)村居民點(diǎn)鄰域的宜居及發(fā)展?jié)摿η闆r的因子分別為:Slope(坡度值)、Elevation(高程值)、Topography(地形位指數(shù))、To Road(靠近公路距離)、To_Service(靠近生活購物服務(wù)距離),To_Hospital(靠近醫(yī)療保健服務(wù)距離),To_School(靠近科教文化服務(wù)距離),To_Station(靠近交通設(shè)施服務(wù)距離)、Fishnet_Pop(人口密度),Buffer_Pop(鄰域人口密度),F(xiàn)ishnet_RA(村莊用地面積),Buffer_RA(鄰域村莊用地面積)Waters(水域面積),共計(jì)13項(xiàng)。圖中所劃×號表示P值大于0.05,未劃×號的相關(guān)性值表示兩變量間具有統(tǒng)計(jì)學(xué)上的顯著意義,從圖中可知:
(1)研究區(qū)高程、坡度及地形位指數(shù)間有非常強(qiáng)的相關(guān)性,介于0.83~0.93,但三者與其余屬性的相關(guān)性較為微弱,表明在太湖平原地區(qū)地勢相對低平,海拔和坡度對農(nóng)村居民點(diǎn)的分布及發(fā)展沒有起到太大的影響。
(2)公共基礎(chǔ)服務(wù)設(shè)施多建在主要公路附近。規(guī)則格網(wǎng)單元靠近公路的距離與靠近醫(yī)療、教育、生活購物POI的距離成較強(qiáng)的相關(guān)性,表明這三項(xiàng)主要的公共基礎(chǔ)服務(wù)設(shè)施多分布在交通便利之處,且相互之間比較集中。
(3)農(nóng)村居民點(diǎn)多分布在交通便利、服務(wù)設(shè)施較完善的地方。距離四類POI點(diǎn)的距離與單元格網(wǎng)人口密度及村莊面積存在一定的負(fù)相關(guān)性。
(4)農(nóng)村居民點(diǎn)在空間分布上較為零散,人口數(shù)目在空間上分布較為均勻。
綜上所述,一個(gè)分布良好、具有長期留存價(jià)值和發(fā)展?jié)摿Φ霓r(nóng)村居民點(diǎn)具有的特征是:所在區(qū)域有較小的地形位指數(shù);交通便利,靠近公共服務(wù)設(shè)施點(diǎn),區(qū)域內(nèi)水域面積較小;農(nóng)村居民點(diǎn)自身或其一定鄰域內(nèi)有較大面積村莊。
3.4.1 變量預(yù)處理
選擇所有進(jìn)行相關(guān)分析的變量,共計(jì)13項(xiàng)。根據(jù)相關(guān)分析的結(jié)果,為使得研究數(shù)據(jù)各屬性因子都有相同的優(yōu)劣趨向性(值越大表示越有利于農(nóng)村居民點(diǎn)建設(shè)),對地形位指數(shù)、各距離值以及水域面積進(jìn)行取相反數(shù)處理。聚類分析主要按照數(shù)據(jù)點(diǎn)間的距離來分類。如果在分析中選擇的變量變化范圍很大,那么該變量對結(jié)果的影響也是最大的。所以在進(jìn)行分析之前需進(jìn)行數(shù)據(jù)縮放處理。最常用的方法是將變量進(jìn)行z-Score標(biāo)準(zhǔn)化,獲得一組均值為0,標(biāo)準(zhǔn)差為1的變量。
3.4.2 聚類結(jié)果
在RStudio中使用K-means聚類,聚類數(shù)目從1遍歷至20,每次聚類結(jié)果都會獲得三個(gè)統(tǒng)計(jì)量totSS、tot.withinSS和betweenSS。在聚類數(shù)目K確定的條件下,betweenSS/totSS越大,tot.withinSS越小,類內(nèi)相似度越高,聚類效果越好。經(jīng)過計(jì)算,較好的聚類數(shù)目為4類。
確定聚類數(shù)目后,會生成每個(gè)數(shù)據(jù)點(diǎn)的最終類別。將這些數(shù)據(jù)點(diǎn)按照規(guī)則格網(wǎng)ID導(dǎo)入ArcGIS中,即獲得聚類分析的可視化效果(圖3),其中白色區(qū)域不含農(nóng)村居民點(diǎn)。
圖3 K均值聚類(4類)結(jié)果
使用ArcGIS分組分析功能,按照4個(gè)分組數(shù)目生成相應(yīng)的分組結(jié)果(圖4),為方便比照,后期將分組結(jié)果的顏色進(jìn)行了調(diào)整。分組分析也支持評定最佳分組組數(shù),通常為F統(tǒng)計(jì)量較大而類數(shù)小的組數(shù)。再按照評定的最佳分組數(shù)進(jìn)行分組(圖5)。
圖4 ArcGIS分組分析(4類)結(jié)果
圖5 ArcGIS分組分析(2類)結(jié)果
組類數(shù)目地形位距公路距商店距醫(yī)院距學(xué)校距車站人口密度村莊面積水域面積綠2144次小次遠(yuǎn)次遠(yuǎn)最遠(yuǎn)最遠(yuǎn)較遠(yuǎn)最小次小最大黃1849最小最近最近最近最近最近最大最大次小藍(lán)56最大最遠(yuǎn)最遠(yuǎn)次遠(yuǎn)較遠(yuǎn)最遠(yuǎn)次小最小最小紅3276
結(jié)合圖5與表2可知,黃色格網(wǎng)區(qū)域?yàn)榻煌ㄗ畋憷?,公共服?wù)設(shè)施最完備,村莊用地面積最大,人口居住較為集中的地方,緊靠著武進(jìn)城區(qū),屬于最有發(fā)展前景的農(nóng)村居民點(diǎn)范圍;藍(lán)色格網(wǎng)區(qū)域數(shù)目最少,其主要特征是地形位指數(shù)最高,處于高海拔地區(qū),附近多有山峰,適宜發(fā)展旅游業(yè);綠色格網(wǎng)區(qū)域,交通狀況最不便利,距離周邊公共服務(wù)點(diǎn)也非常遠(yuǎn),區(qū)域內(nèi)多為小面積村莊,人口分布較為稀疏,為本次農(nóng)村居民點(diǎn)優(yōu)化布局的重點(diǎn)關(guān)注對象。紅色格網(wǎng)區(qū)域,介于黃色區(qū)域與綠色區(qū)域之間,發(fā)展優(yōu)勢與待優(yōu)化劣勢并存,屬于可選的村莊優(yōu)化對象。
在了解研究區(qū)農(nóng)村居民點(diǎn)分組類型基礎(chǔ)上,將之前K均值聚類與兩次分組分析結(jié)果進(jìn)行匯總,再選擇其中綠色和紅色區(qū)域,進(jìn)行求交集計(jì)算,結(jié)果如表3、表4及表5。
表3 三種分類結(jié)果
表4 綠色區(qū)域分類結(jié)果交集
表5 紅色區(qū)域分類結(jié)果交集
根據(jù)格網(wǎng)與村莊地類圖斑的空間關(guān)系可知,使用K均值與分四組分析時(shí),綠色優(yōu)先待優(yōu)化區(qū)域交集格網(wǎng)數(shù)有1 918個(gè),對應(yīng)村莊圖斑個(gè)數(shù)有6 246處;紅色可選優(yōu)化區(qū)域交集格網(wǎng)數(shù)有2 979個(gè),對應(yīng)村莊圖斑個(gè)數(shù)有9 518處。四分位數(shù)與均值常用于測量數(shù)據(jù)的分散程度。經(jīng)統(tǒng)計(jì),紅綠格網(wǎng)區(qū)域邊界處共有397處村莊地類圖斑。研究采用綠色區(qū)域內(nèi)村莊用地面積第一個(gè)四分位值508 m2作為閾值,并選擇數(shù)據(jù)中面積小于閾值的地類圖斑作為最終待優(yōu)化的農(nóng)村居民點(diǎn)對象,其中綠色區(qū)域內(nèi)村莊用地具有最高優(yōu)先級,紅色區(qū)域內(nèi)村莊用地面積普通優(yōu)先級,二者臨界線上的村莊用地具有較高優(yōu)先級。
表6 待優(yōu)化農(nóng)村居民點(diǎn)統(tǒng)計(jì)表
圖6 農(nóng)村居民點(diǎn)布局優(yōu)化方案
研究結(jié)果表明,在地形平坦、含有豐富的河網(wǎng)水系的太湖平原地區(qū),海拔高度與坡度大體較為一致,其與農(nóng)村居民點(diǎn)面積和空間分布的線性關(guān)系微弱,這時(shí)到達(dá)公路、公共基礎(chǔ)服務(wù)點(diǎn)的距離以及河網(wǎng)密度等因素對農(nóng)村居民點(diǎn)的分布起到很大作用,分布在交通便利、服務(wù)設(shè)施較完善地方的農(nóng)村居民點(diǎn),擁有更好的區(qū)位特征和更大的發(fā)展建設(shè)優(yōu)勢。通過對農(nóng)村居民點(diǎn)其空間分布特征的分析和研究,武進(jìn)區(qū)的農(nóng)村居民點(diǎn)空間分布仍較為零散,區(qū)域內(nèi)格網(wǎng)單元含村莊面積與鄰域內(nèi)含村莊總面積之間存在中等相關(guān)性。使用R語言和ArcGIS對其進(jìn)行聚類及分組分析,得到的分類結(jié)果基本一致。從結(jié)果中可看出同級區(qū)位分布較為集中,且區(qū)位特征按農(nóng)村居民點(diǎn)建設(shè)優(yōu)勢性從高到低依次對應(yīng)距離城區(qū)從近到遠(yuǎn)的區(qū)域,呈現(xiàn)出一定程度的圓形或水波形分布。