陳愛梅,李曉琳,張 芳
(1. 西南林業(yè)大學土木工程學院,云南 昆明 650224;2. 西南林業(yè)大學生態(tài)與水土保持學院,云南 昆明 650224)
生態(tài)用地是生態(tài)環(huán)境的載體,承擔了涵養(yǎng)水源、保護土壤、防風固沙、調節(jié)氣候、凈化環(huán)境、保護生物多樣性等生態(tài)功能,是一個地區(qū)國土生態(tài)環(huán)境質量好壞的“晴雨表”[1]。但隨著我國人口的快速增長和城市加速擴展,居民生活和生產建設對土地的需求越來越高,使得原有的生態(tài)用地大量被擠占,許多有特殊生態(tài)價值的土地如耕地、濕地、草地、水域等喪失其生態(tài)功能[2-3],使得本來就十分脆弱的生態(tài)系統(tǒng)日趨惡化,進而導致諸多環(huán)境問題。如何對快速城市化進程中的生態(tài)用地加以監(jiān)測及保護,是當下所面臨的一大難題。
隨著遙感技術的發(fā)展,尤其是影像處理技術和影像數(shù)據(jù)源數(shù)量的提高,遙感技術的應用開始普及推廣。其中,生態(tài)用地信息的提取是遙感技術應用的重要內容之一[4-5]。目前如何在現(xiàn)有的遙感數(shù)據(jù)基礎下,利用圖像處理與信息獲取技術從而得到更高精度的生態(tài)用地分類信息已成為土地利用研究不可或缺的一步。在快速城市化發(fā)展的過程中,昆明市轄區(qū)生態(tài)用地數(shù)量在逐年減少,因此,本研究采用Landsat8影像作為基礎數(shù)據(jù)源,利用最大似然法和決策樹分類法對昆明市生態(tài)用地信息進行提取,并對兩種研究方法的結果進行定量分析,通過精度判別不同的遙感分類方法適合提取的地物信息,以驗證基于決策樹分類的地表覆蓋遙感信息提取的可行性與有效性,為今后生態(tài)用地動態(tài)監(jiān)測提供方法參考,對實現(xiàn)生態(tài)用地的可持續(xù)利用具有重要的戰(zhàn)略意義。
昆明地處云貴高原中部,南瀕滇池,三面環(huán)山,東經(jīng)102°10′~103°41′,北緯24°23′~26°22′。昆明市總體地勢北部高,南部低,由北向南呈階梯狀逐漸降低,中部隆起,東西兩側較低,以湖盆巖溶高原地貌形態(tài)為主,大部分地區(qū)海拔在1 500~2 800 m之間,屬北緯低緯度亞熱帶-高原山地季風氣候,氣候溫和,夏無酷暑,冬無嚴寒,四季如春,年平均氣溫14℃~16℃,年降水量790.9 ~1 094.2 mm。境內河流分屬金沙江、珠江、紅河三大水系,形成高山大河與盆地共生、地面高差懸殊、水系復雜的特點。市域土地總面積2.11×106hm2,市區(qū)地面海拔1 891 m。下轄7個市轄區(qū)、4個縣、3個自治縣、1個縣級市(五華區(qū)、盤龍區(qū)、西山區(qū)、官渡區(qū)、呈貢區(qū)、東川區(qū)、晉寧縣、富民縣、嵩明縣、宜良縣、石林彝族自治縣、尋甸回族彝族自治縣、祿勸彝族苗族自治縣和安寧市)。
本研究所使用的遙感影像數(shù)據(jù)來源于中國科學院計算機網(wǎng)絡信息中心和中國科學院對地共享中心Landsat8衛(wèi)星影像。Landsat8衛(wèi)星,是美國自1972年以來,發(fā)射的Landsat系列第八顆衛(wèi)星,較之前的衛(wèi)星,該衛(wèi)星的性能在各方面都有所提高。本文采用的影像成像時間為2014年4月,云量0.04%,在影像預處理階段,主要進行大氣校正、輻射定標、圖像拼接裁剪等遙感影像預處理。
最大似然法又稱貝葉斯(Bayes)監(jiān)督分類,首先假定分類類別在光譜空間的分布是服從正態(tài)分布的,把特征向量X歸于某類集Wi的條件概率P(Wi|X)作為判別函數(shù),稱為概率判別函數(shù)[6]。由于概率是建立在統(tǒng)計意義上的,所以當使用概率判別函數(shù)進行分類時,錯分的現(xiàn)象不可避免,研究以“錯分損失最小”來建立需要的判別規(guī)則,這就是Bayes準則。最大似然法有著嚴密的理論基礎,對于呈正態(tài)分布的數(shù)據(jù),判別函數(shù)易于建立,綜合應用了每一類別在各波段的均值、方差以及多波段之間的協(xié)方差,有較好的統(tǒng)計特性,這些優(yōu)點使得它在很長時間內一直被認為是最先進的分類方法[7]。
本研究運用最大似然法分類的基本步驟如下:首先建立模板(訓練樣本),訓練樣本的定義主要靠目視解譯,遙感影像由多個波段組成,各個波段之間的相關性較高,不同的RGB組合可以得到不同的彩色合成影像;其次,創(chuàng)建了建設用地、耕地、林地、水域、未利用地5個感興區(qū),各類訓練樣本選擇具有明顯地物特征的區(qū)域且數(shù)量在200個左右。最后計算出給定像元,將其歸到概率最大的一類。
決策樹學習算法是現(xiàn)在數(shù)據(jù)應用領域中的最普遍、最著重強調算法的分類方法之一。決策樹分類的算法主要有C4.5算法、CART算法、S-PLUS算法等[8]。本文采用的算法為:CART算法。CART模型最早由Breman等人提出并已在統(tǒng)計學領域普遍應用,使用如下結構的學習樣本集:
L:={X1X2…Xm,Y}
X1:=(x11,x12,……x1t
Xm:=(x1,x2,…,xmtn)
Y:=(y1,y2,…,yk)
其中,X1……X2稱為屬性向量(Attribute Vectors),其屬性可以是連續(xù)的,也可以是離散的;Y稱為標簽向量(Label Vectors),其屬性可以是連續(xù)的,也可以是離散的。當Y是連續(xù)的數(shù)量值時,稱為回歸樹,當Y是離散值時,稱為分類樹[9-10]。
本研究運用決策樹分類的基本步驟如下:(1)特征波段提取,選擇合適的波段組合進行分類,最終選取包括校正好影像的4個波段,NDVI、第一主成分、第二主成分、第三主成分共8個波段和DEM參與最終的分類;(2)選擇訓練樣本;(3)決策樹生成:經(jīng)過融合處理提取后最終參與分類的8個波段,其中,Bl、B4、B5、B7波段為經(jīng)過輻射校正的原圖像4個波段,B9波段為NDVI,其余三個波段為第一主成分、第二主成分、第三主成分。為了消除陰影在決策樹中加入DEM數(shù)據(jù),并輔以NDVI信息,將陰影部分分為未利用地與林地,決策樹自動閾值分類按自然間斷點規(guī)則分類,“自然間斷點”分級法基于數(shù)據(jù)中固有的自然分組,對分類間隔加以識別,可對相似值進行最恰當?shù)胤纸M,并可使各個類之間的差異最大化。要素將被劃分為多個類,對于這些類,會在數(shù)據(jù)值的差異相對較大的位置處設置其邊界,如圖1所示。
圖1 決策樹的生成
基于昆明市2014年的遙感影像采用最大似然法提取了昆明市的四類生態(tài)用地,分別是水域、林地、耕地、未利用地。四類生態(tài)用地的總面積為1.62×106hm2,占昆明市總土地面積的78.87%。其中林地面積占比為40.51%,是四類生態(tài)用地中占比最大的,這主要是由于云南地理條件復雜,氣候復雜多樣,在這樣多樣化環(huán)境條件下發(fā)育出了豐富的植物區(qū)系。耕地的面積相對較少,僅占總面積的10.77%,未利用地的占比又相對較大,占總面積的24.40%,水域生態(tài)用地面積最下,僅占3.19%。最大似然法提取昆明市生態(tài)用地面積占比居前五位的地區(qū)分別為東川區(qū)、富民縣、安寧市、祿勸彝族苗族自治縣、晉寧縣。
采用決策樹方法提取的昆明市四類生態(tài)用地的總面積為1.85×106hm2,占總土地面積的90.29%。其中,水域生態(tài)用地、林地、耕地較最大似然法結果占比均有所增加,分別占整個昆明市土地面積的3.30%、53.58%、12.56%,而未利用地占比結果較最大似然法提取結果減少了3.54%。決策樹分類法提取昆明市生態(tài)用地面積占比居前五位的地區(qū)分別為祿勸彝族苗族自治縣、尋甸回族彝族自治縣、安寧市、東川區(qū)、晉寧縣。
從分類結果(圖2)可以看出,兩種方法對各類生態(tài)用地的面積分類結果有所差距,而且CART決策樹分類圖像的結果多為面狀,最大似然法分類結果地物分布細碎較多。這是由于兩種分類方法在分類規(guī)則上存在差異造成的。牛增懿[11]等人的研究表明最大似然法假定分類類別在光譜空間的分布是服從正態(tài)分布,最大似然法是參數(shù)形式,意味著每一輸入波段必須符合正態(tài)分布。在協(xié)方差矩陣中有較大值時,易于對范本分類過頭,如果在聚類組或訓練樣本中的象素分布較散,則范本的協(xié)方差矩陣中會出現(xiàn)大值,而決策樹分類法不需要服從正態(tài)分布,決策樹是從一個根節(jié)點出發(fā)按照不同分類規(guī)則逐層往下將每個地類進行細分。
圖2 兩種方法提取昆明市生態(tài)用地
最大似然法分類和決策樹分類提取的生態(tài)用地中各類生態(tài)用地的比例均存在差異(圖3),林地在各類生態(tài)用地中的占比均最大,且最大似然法分類中林地占比高達53.58%。針對建設用地的分類,兩種方法之間也存在顯著差異,所得結果分別為9.71%和21.12%,相差高達11.14%。兩種分類方法提取的地類信息中建設用地和林地兩類用地面積差異明顯,這主要是由于最大似然法對受人為主觀影響較強,利用光譜信息提取建設用地的精度低,被錯分的現(xiàn)象嚴重。耕地及水域的分類結果,兩種分類方法的差異較小。耕地占比分別為12.56%和10.77%,相差不足2%;水域3.30%和3.19%,差距僅有0.11%,說明兩種分類方式對水域影響不顯著。未利用地占比分別為20.86%和24.40%,分布細碎化。
圖3 昆明市土地利用比例分布圖
從表1可以看出CART決策樹分類精度高于最大似然法,在生態(tài)用地信息的提取過程中CART決策樹分類方法總體分類結果優(yōu)于最大似然法。CART決策樹將研究區(qū)遙感影像分類精度由最大似然分類精度83.02%提升到99.17%,提高16.15%,Kappa系數(shù)由0.77提升到0.98。林地的劃分在各方法下效果都較為理想,但決策樹方法的精度更高,有效地減少了林地被錯分為其他地類的概率,與De Colstoun等人早期用多時相的ETM數(shù)據(jù)和決策樹進行分類研究結果一致。由于耕地常種植農作物導致在不同的季節(jié)地物波譜的反射率存在差異,造成耕地判別需要結合多時相遙感影響判別;此外,在沒有農作物覆蓋的情況下耕地的反射率與未利用地的波普反射率大致相同,造成耕地和未利用地之間的錯分。從具體的分類結果來看,最大似然法對水域和林地兩種生態(tài)用地的分類精度較高,均可達90%以上,未利用地、耕地、建設用地分類精度相對較低。而CART決策樹分類對耕地、未利用地、建設用地的分類精度較好,用戶精度分別為97.94%、97.64%和97.61%。
表1最大似然法與決策樹分類精度評價對比
(1)從總體分類精度來看,對生態(tài)用地信息提取時CART決策樹分類方法優(yōu)于最大似然法。CART決策樹分類對耕地、未利用地、建設用地的分類精度均高于最大似然法,提取這類生態(tài)用地時具有優(yōu)勢。從地類的空間分布情況上看,CART決策樹分類圖像的結果多為面狀,最大似然法分類結果地物分布細碎較多。
(2)CART決策樹分類不僅對測試樣本的檢驗精度高于最大似然法,也更符合計算機自動分類的期望和習慣。但兩種分類方法各有特點,本文采用的只是將分類結果進行比較找出中分辨率分類結果的不足之處,以此為經(jīng)驗進行修改,今后的工作需要探索出更加科學合理的評判標準。