余超,李明陽,何隆華
(1.南京林業(yè)大學,南京210037;2.中國科學院南京地理與湖泊研究所,南京210008)
利用決策樹分類方法的南京江寧水稻面積變化研究
余超1,李明陽1,何隆華2
(1.南京林業(yè)大學,南京210037;2.中國科學院南京地理與湖泊研究所,南京210008)
自從2000年12月江寧撤縣設為南京市江寧區(qū)以來,2002年~2010年期間許多農(nóng)田現(xiàn)在變成了高樓大廈。該文以南京市江寧區(qū)水稻田為研究對象,以江寧區(qū)2002年、2006年以及2010年的遙感影像為主要信息源,利用決策樹分類的方法,通過坡度、濕度、NDVI等決策因子,根據(jù)野外實地勘測調(diào)查數(shù)據(jù)對比,提取出江寧區(qū)的水稻田,再通過驅(qū)動因子分析,用地理加權(quán)回歸方法找出主要影響因子,加上空間分布格局的動態(tài)分析,從而比較出在這段時間內(nèi)南京江寧區(qū)水稻田的變化情況。研究表明:①江寧區(qū)在2002年~2010年內(nèi)水稻田面積減少了約690km2,約70%的稻田變?yōu)槠渌玫?,變化非常明顯;②主要影響面積變化的驅(qū)動因子是人類居住活動范圍的變化;③水稻田的空間格局在2002年~2010年間聚集性減弱,破碎化趨勢加強。
水稻;決策樹;地理加權(quán)回歸;空間格局;面積變化;地理國情監(jiān)測
水稻主要生長在我國多云雨、溫度適宜的中部和南部地區(qū),該區(qū)域是我國的主要產(chǎn)糧區(qū),對該區(qū)域水稻進行種植面積的提取、長勢的監(jiān)測和產(chǎn)量的估算等研究是具有重要意義的[1]。水稻的面積提取有很多種方法,從數(shù)據(jù)的角度看,水稻信息提取的方法可分為兩大類型:以TM為代表的中高分辨率數(shù)據(jù)和以MODIS為代表的低分辨率數(shù)據(jù)[2]。其中,前一類型是靜態(tài)地通過單一時相的影像分類,這類數(shù)據(jù)自身具有較高空間分辨率分類精度較高;后一類型則主要通過時序歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)的差異結(jié)合知識的手段從而提高分類精度。王福民等[3]曾以水稻生長前期和后期2景TM影像進行穗帽變換并合成多時相影像,通過最小距離法來提取水稻信息;朱良等[4]通過TM影像的NDVI和陸地表水指數(shù)(Land Surface Water Index,LSWI)不同變化進行小尺度水稻面積提取;彭代亮[5]在2009年基于統(tǒng)計與MODIS數(shù)據(jù)來進行水稻遙感估產(chǎn);馬孟莉等[6]利用混合像元分解的方法也做過水稻面積的提取。
不過單一的通過某種因子來進行水稻田的提取,會造成誤差,比如僅僅通過NDVI來進行提取會誤將一部分覆滿水草的池塘也分類成稻田。決策樹分類的方法可以將多個分類因子同時進行判定篩選,更加嚴格地根據(jù)輸入的篩選條件進行面積提取,從而提高了分類精度。因此,本文以南京江寧區(qū)作為研究區(qū)域,利用決策樹的分類方法,提取出水稻田的面積,加上驅(qū)動因子分析以及空間動態(tài)分布格局,更加全面地比較出江寧2002年~2010年間的稻田面積變化,為江寧區(qū)農(nóng)業(yè)的進一步規(guī)劃發(fā)展提供重要參考。
江蘇省南京市江寧區(qū)(118°31′E~119°04′E,30° 38′N~32°13′N),位于江蘇省西南部,東與句容市接壤,南至東南與安徽省當涂縣、溧水區(qū)毗連,西南與馬鞍山市相鄰,西與安徽省和縣及南京市浦口區(qū)隔江相望。常態(tài)地貌有低山、丘陵、崗地、平原和盆地,其中丘陵崗地面積最大,境內(nèi)有大小山丘400多個。境內(nèi)河道主要有秦淮河和長江兩大水系,面積1577.75km2,全年總降水量959.6mm,其中2月、4月、7月~9月和11月份偏多,其余各月偏少,年無霜期225天。2008年統(tǒng)計年鑒統(tǒng)計的水稻稻田面積為210.8km2,約占總面積的13%,最大高程是363m。南京市江寧區(qū)農(nóng)業(yè)以油菜、小麥、水稻、大豆、紅薯和芝麻等為主要作物,冬小麥和油菜與水稻輪作為主。2000年12月,經(jīng)國務院批準,撤縣設立南京市江寧區(qū),現(xiàn)已呈功能效益多元顯現(xiàn)的都市型農(nóng)業(yè)格局。2004年,江寧區(qū)累計引進農(nóng)業(yè)外資項目238個,實際利用外資2.5億美元。到2012年已有近60個國家和地區(qū)的2400個項目落戶,集聚了40家世界500強企業(yè),累計實際使用外資超過60億美元,使電力自動化產(chǎn)業(yè)成為江寧的特色的產(chǎn)業(yè)。
3.1 數(shù)據(jù)來源與預處理
Landsat TM影像時間分辨率是16天,空間分辨率是30m,主要特點為具較高空間分辨率、波譜分辨率、極為豐富的信息量和較高定位精度。本次實驗選取2002年8月24日、2006年8月30日以及2010年8月15日三期遙感數(shù)據(jù)作為數(shù)據(jù)源。同時,利用GPS到江寧地區(qū)獲取研究區(qū)域內(nèi)各個地物位置詳細信息,用于幾何校正以及精度驗證。
TM數(shù)據(jù)的預處理包括:(1)幾何精校正。在ERDAS IMAGINE 9.2中利用實地測量的GPS定點來進行幾何校正處理。(2)大氣校正和輻射定標。利用ENVI的spectral工具欄下的preprocessing進行輻射定標和大氣校正。(3)研究區(qū)域的裁剪。利用江寧區(qū)行政邊界矢量圖形通過ENVI軟件下的subset data via ROIs工具裁剪出研究區(qū)。
3.2 決策樹模型的特征指數(shù)選取
決策樹是通過對訓練樣本進行歸納學習而生成決策規(guī)則,而后使用決策規(guī)則對數(shù)據(jù)進行分類的一種數(shù)學方法[7]。決策樹的每個內(nèi)部結(jié)點都是一系列類別屬性的集合。決策樹的葉結(jié)點對應一個類別屬性值。決策樹通過決策規(guī)則把根節(jié)點逐步劃分成內(nèi)部節(jié)點,也是通過決策規(guī)則把內(nèi)部節(jié)點劃分為葉節(jié)點。近年來,決策樹因其具有較高的魯棒性、計算效率高、分類精度高、分類規(guī)則直觀、易于理解等優(yōu)點,故被廣泛地運用于地物識別提?。?-9]。
TM影像常用的特征指數(shù)主要有NDVI,紅光波段能增強植被與非植被之間的差異,通過反映不同植物葉綠素含量的不同來區(qū)分植被種類。綠色植被在0.7μm~0.8μm之間有一個高反射峰,近紅外波段對植物類別差異敏感,是監(jiān)測植被的通用波段。水稻除了自身生物量與其他地物不同之外,其特殊的生長環(huán)境也為信息提取提供了有利條件[10]。根據(jù)對南京江寧區(qū)水稻田的實地定位調(diào)查,發(fā)現(xiàn)水稻多生長在海拔小于50m且坡度小于12°的區(qū)域,并且在對江寧區(qū)的水稻田監(jiān)測中發(fā)現(xiàn)其濕度一般在100%~400%之間。因此本文選擇作為決策樹分類的因子為NDVI、濕度、海拔以及坡度。
4.1 水稻田面積變化分析
對實驗區(qū)域樣本定量分析是建立決策樹的基礎和依據(jù)。根據(jù)南京市江寧區(qū)的NDVI數(shù)據(jù),研究從典型地物的NDVI時間序列曲線中將與其他類存在明顯差異的水體和建筑設定閾值加以區(qū)分,再根據(jù)水稻的生活習性依據(jù)海拔,坡度,濕度來進行進一步分類篩選。具體步驟為:(1)區(qū)分水體,閾值設為NDVI<0.15,水體與其他地類的NDVI曲線有明顯差別,故先將其進行剔除;(2)區(qū)分出居民點,閾值設為0.15<NDVI<0.35,居民地的NDVI明顯高于水體并且低于植被,采用多個時間的數(shù)據(jù)對該節(jié)點的規(guī)則在訓練區(qū)中進行訓練,最終得出該區(qū)間97.8%的像元都屬于居民點;(3)區(qū)分林地,根據(jù)對江寧區(qū)所有種植水稻地方的調(diào)查,發(fā)現(xiàn)水稻基本生長在海拔小于50m且坡度小于12°的區(qū)域,因此可以將此作為閾值進行分類。(4)區(qū)分旱田和水稻田,旱田和水稻田的濕度有明顯區(qū)別。水稻具有好濕喜溫的特性,通過ENVI軟件的纓帽變換得到江寧區(qū)的濕度圖,根據(jù)對江寧區(qū)200個水稻樣地點的測量,得出水稻田濕度值在100%~400%之間。
根據(jù)所設定的條件,用ENVI決策樹功能建立好決策樹如圖1所示。
圖1 決策樹模型
根據(jù)編輯的決策樹分類規(guī)則,用ENVI執(zhí)行決策樹進行分類。得到如圖2~圖4的分類結(jié)果。
圖2 2002年江寧區(qū)水稻分類結(jié)果
圖3 2006年江寧區(qū)水稻分類結(jié)果
圖4 2010年江寧區(qū)水稻分類結(jié)果
驗證分類精度時,根據(jù)在江寧區(qū)實地測量的200組樣地點GPS數(shù)據(jù),如圖5所示,利用ENVI軟件的混淆矩陣精度驗證法來進行精度驗證,得到水稻的識別精度結(jié)果如下表1所示。
通過3個不同的年代的水稻田分布對比,可以非常明顯地看出隨著城市化的發(fā)展,江寧區(qū)的水稻田面積在不斷變小。這是由于自1985年起整個江寧區(qū)的產(chǎn)業(yè)結(jié)構(gòu)發(fā)生了重大變化,其工業(yè)總產(chǎn)值首次超過農(nóng)、林、牧、副、漁的總產(chǎn)值。從1990年往后,隨著開發(fā)區(qū)的四處興起,大量的農(nóng)業(yè)用地首先被工業(yè)用地所占用,在早期所征用的農(nóng)地中,幾乎有60%的農(nóng)業(yè)用地變?yōu)榱斯I(yè)用地。另外,自從20世紀90年代中期以后,江寧區(qū)政府一方面大力引進外資工業(yè)對江寧進行開發(fā);另一方面,房地產(chǎn)開發(fā),帶來居住型用地的增長;同時,根據(jù)生態(tài)型新城區(qū)的定位,又占用了一部分的農(nóng)業(yè)用地,來進行生態(tài)新城區(qū)的規(guī)劃設計。此外,興建公共活動空間,基礎設施用地,這些項目的開展,也占用了大量的農(nóng)業(yè)用地[11]。
圖5 GPS樣地點分布圖
表1 江寧區(qū)水稻面積分類結(jié)果表
4.2 地理加權(quán)回歸分析
本文將水稻田斑塊距離道路距離,距離居民點距離,距離水體距離這3個因子作為自變量,將水稻田斑塊面積作為因變量,采用ArcGIS空間統(tǒng)計分析工具箱中的Graphically Weighted Regression模塊進行地理加權(quán)回歸。
在地理加權(quán)回歸模型輸出的評價系數(shù)中,Cond表示局部的共線性情況,當大于30時,表示實驗結(jié)果不理想,Predicted給出其預測結(jié)果,Residuals表明真實值與預測值的差。在本文中,Cond的最小值為3.701,最大值為25.451,平均值為11.624,表示實驗結(jié)果比較理想,模型的局部相關(guān)系數(shù)R2為0.7239,表明模型可以解釋72.39%差異。因變量距離居民點距離,距離道路距離,距離水體距離的平均相關(guān)系數(shù)分別為:0.0068,0.0041,-0.0025,表示與距離居民點以及道路距離成正相關(guān),與距離水體距離成負相關(guān),也就是說離居民點以及道路越遠越水田越多,離水越近水田越多。由此可以證明出水田面積變化的與人類居住地的變化有著密切的關(guān)系。
4.3 水稻田空間格局分析
將三期的水稻分類結(jié)果圖導入到景觀空間分析軟件Fragstats 3.3進行分析,在這里本文選取幾個結(jié)果指標來進行比較:斑塊類型面積(Total Class Area,CA),斑塊數(shù)量(Number of Patches,NP),斑塊密度(Patch Density,PD),最大斑塊指數(shù)(Largest Patch Index,LPI),結(jié)果如表2所示。
表2 水稻面積空間格局分析表
從表2可以看出,2002年~2010年間,江寧水稻的斑塊面積在不斷下降,斑塊的數(shù)量在增加,最大斑塊指數(shù)與斑塊密度也一同下滑,稻田不斷變小變碎變散,由原來的聚集密集型不斷破碎,變成又小又散的分布在各個區(qū)域。這與三期水稻田面積提取的結(jié)果吻合,可以看出由于人為因素的干擾,水稻田空間聚集性減弱,破碎化趨勢增強,同時面積也在急劇減少。
這是由于江寧從2000年開始成為南京市的一個新區(qū),發(fā)展政策發(fā)生了變化,由單一的縣城變?yōu)榱舜蟪鞘械倪吘墔^(qū),城市規(guī)劃政策的變化,導致了江寧的水稻田變得更加破碎以及消減。20世紀90年代中期以來,興起的“開發(fā)區(qū)熱”導致耕地大量被占,如自1992年江寧在東山鎮(zhèn)創(chuàng)辦經(jīng)濟技術(shù)開發(fā)區(qū),至1997年2月被批準為國家高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)以后,在縣城附近又建設了國家級民營科技園和江寧商城。同時,在縣城內(nèi)其他地區(qū)建立了13個鄉(xiāng)鎮(zhèn)工業(yè)小區(qū),8個專業(yè)市場,3大貿(mào)易市場。在5個重點鎮(zhèn):秣陵、祿口(機場建設)、麒麟、江寧、湖熟等地設立了開發(fā)區(qū)或工業(yè)園。除了開發(fā)區(qū)建設外,祿口機場的建設也是改變江寧土地利用的重要因素之一。另一方面,由于地處大城市的邊緣區(qū),隨著城市的不斷擴張,城市的發(fā)展必然需要尋求與其相鄰的邊緣區(qū)來解決大城市的壓力,如房地產(chǎn)開發(fā),新開工業(yè)基地的增加。從20世紀90年代以后,在東山鎮(zhèn)除開發(fā)區(qū)的建設外,還新建了百家湖住宅小區(qū)及其配套設施,也占用了大量耕地。以上江寧區(qū)眾多的區(qū)劃建設改變,導致其水稻田總體面積急劇下降,空間分布越來越零散破碎。
單一的通過某種因子來進行水稻田的提取,會造成誤差。決策樹分類的方法可以將多個分類因子同時進行判定篩選,更加嚴格地根據(jù)輸入的篩選條件進行面積提取,從而提高了分類精度。
本文利用決策樹的方法,根據(jù)坡度、濕度、NDVI等因子進行面積提取,有效地解決了以往一些單一方法的不足。
研究表明,2002年~2010年間,江寧區(qū)水稻田面積減少了約690km2,約70%的稻田變?yōu)槠渌玫?,主要影響面積變化的驅(qū)動因子是人類居住活動范圍的變化,水稻田的空間格局在此期間聚集性減弱,破碎化趨勢加強。
在進行實地水稻田GPS定點的過程中,還發(fā)現(xiàn)了一些影響面積提取精度的因素,例如有個別農(nóng)戶種植水稻的時間與大部分農(nóng)戶不一樣,導致了這一部分的水稻田在遙感影像上所反映出來的情況有所差異,江寧區(qū)水稻田面積較小且分布破碎也影響了一定的實驗精度,如何進一步提高這種小范圍破碎化的水稻田面積提取精度還需要更深入的研究。
[1] 趙銳,湯君友,何隆華.江蘇省水稻長勢遙感監(jiān)測與估產(chǎn)[J].國土資源遙感,2002,53(3):9-11.
[2] 朱良,平博.多時相TM影像決策樹模型的水稻識別提取[J].地球信息科學學報,2013,15(3):447-451.
[3] 王福民,黃敬峰,王秀珍.基于穗帽變換的TM影像水稻面積提取[J].中國水稻科學,2008,22(3):297-301.
[4] 朱良,平博.多時相TM影像決策樹模型的水稻識別提?。跩].地球信息科學學報,2013,15(3):447-451.
[5] 彭代亮.基于統(tǒng)計與MODIS數(shù)據(jù)的水稻遙感估產(chǎn)方法研究[D].浙江:浙江大學環(huán)境與資源學院,2009.
[6] 馬孟莉,朱艷.基于分層多端元混合像元分解的水稻面積信息提?。跩].農(nóng)業(yè)工程學報,2012,28(2):154-159.
[7] FREID M A,BRODLEY C E.Decision tree classification of land cover from remotely sensed data[J].Remote Sensing of Environment,1997(61):399-409.
[8] 李爽,張二勛.基于決策樹的遙感影像分類方法研究[J].地域研究與開發(fā),2003,2(1):17-21.
[9] CONRAD C,COLDITZ R R,DECH S,et al.Temporal segmentation of MODIS times series for impro-veing crop classification in Central Asian irrigation systems[J].International Journal of Remote Sensing,2011,32(23):8763-8778.
[10] 林文鵬,王長耀,儲德平,等.基于光譜特征分析的主要秋季作物類型提取研究[J].農(nóng)業(yè)工程學報,2006,22(9):128-132.
[11] 王周龍,馮學智,張安定,等.基于空間分析的江寧土地利用變化特征的研究[J].農(nóng)機化研究,2007,(7):80-85.
Changing of Paddy Area in Jiangning District Based on Decision Tree Classification
YU Chao1,LI Ming-yang1,HE Long-h(huán)ua2
(1.Nanjing Forestry University,Nanjing210037;2.Nanjing Institute of Geography&Limnology,Chinese Academy of Sciences,Nanjing210008)
Significant change has taken place in Jiangning from 2002to 2010.Since Jiangning became one of the districts of Nanjing in December 2000,much farmland has turned into high-rise buildings.This paper takes the paddy rice in Jiangning district as the research topic.It uses the remote sensing images of Jiangning district in 2002,2005and 2011as the main source of information.Adopting a decision tree classification method with slope,humidity,NDVI and other decision-making as factors,this paper extracts the rice fields in Jiangning district according to survey data compared with field surveys.The change area of rice fields in Jiangning in the past decade is obtained by driving factor analysis,using geographically weighted regression to identify the main factor,coupled with the dynamic analysis of spatial distribution pattern.Studies have shown that:(1)The area of rice fields in Jiangning district during 2002to 2010reduced by about 690km2.With about 70%of the paddy fields turned into other uses,change is very obvious.(2)The main driving factor is the change in the scope of human habitation activities.(3)The aggregation of spatial pattern in the rice fields between 2002and 2010has decreased,and the fragmentation trend has strengthened.
paddy;decision tree;geographically weighted regression;spatial pattern;area change;national geographical conditions monitoring
10.3969/j.issn.1000-3177.2015.02.014
TP79
A
1000-3177(2015)138-0080-05
2014-01-13
2014-04-23
國家自然科學基金項目(41271418)。
余超(1990~),男,碩士,現(xiàn)從事森林經(jīng)理、林業(yè)遙感和地理信息系統(tǒng)研究等工作。
E-mail:wsyc23@gmail.com
何隆華(1966~),男,博士,主要從事作物遙感監(jiān)測與醫(yī)學地理研究。
E-mail:lhhe@niglas.ac.cn