劉艷艷 劉漢湖
摘? 要:利用遙感影像進(jìn)行城市土地利用與土地覆被分類 (LULCC)是遙感的主要應(yīng)用之一,但由于城市景觀的不均勻性和光譜響應(yīng)的混雜性,對(duì)土地利用分類提出了挑戰(zhàn)。隨著人工智能的驚人創(chuàng)新進(jìn)展,機(jī)器學(xué)習(xí)在遙感圖像開發(fā)中越來越受歡迎。使用目視判讀和經(jīng)過修改的美國(guó)地質(zhì)調(diào)查局 (USGS)土地利用與土地覆被1級(jí)分類方案選擇訓(xùn)練區(qū)域;輸入數(shù)據(jù)包括10波段10m或20m可見光,近紅外和SWIR SMI波段圖像,導(dǎo)出NDVI和紋理層;基于隨機(jī)森林算法創(chuàng)建模型并生成土地利用類別預(yù)測(cè)。根據(jù)時(shí)間匹配的高分辨率谷歌地球Pro歷史圖像,評(píng)估得到的LULCC柵格地圖的準(zhǔn)確性。結(jié)果發(fā)現(xiàn),基于隨機(jī)森林的土地利用及土地覆被分類表現(xiàn)較好。
關(guān)鍵詞:GIS應(yīng)用? 機(jī)器學(xué)習(xí)? 土地利用與土地覆蓋分類? 隨機(jī)森林
中圖分類號(hào):TP751? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ?文章編號(hào):1674-098X(2020)09(a)-0026-03
Abstract:Urban land use and cover classification from remotely sensed imagery is one of the major applications of remote sensing. However, due to the inhomogeneity of urban landscape and the confounding of spectral response, the classification of land use is challenged. With the amazing innovative advancements in artificial intelligence, machine learning has gained increased popularity in exploiting remote sensing imagery.Training areas were selected using visual interpretation and a modified USGS level-1 classification program for land use and land cover.? Input data include 10-band 10 m or 20 m visible, NIR and SWIR SMI band images, derived NDVI and textural layers. Based on the random forest algorithm, the model was created and the land use category prediction was generated. The accuracy of the resulting LULCC raster map was assessed against temporally matched high-resolution Google Earth Pro historical imagery. It was found that random forest based classifier achieved significantly higher overall accuracy and kappa value.
Key Words:GIS application;? Machine Learning;Land use and land cover classification;? Random Forest
機(jī)器學(xué)習(xí)方法通過結(jié)構(gòu)化數(shù)據(jù)來分析研究數(shù)據(jù),幫助了解目標(biāo)圖像之間的差異,與傳統(tǒng)方法相比更為自動(dòng)化,因此在分類研究領(lǐng)域有著廣泛的前景。本文基于隨機(jī)森林模型,研究機(jī)器學(xué)習(xí)在土地利用及土地覆被分類應(yīng)用中的可行性,以佛羅里達(dá)西北部的彭薩科拉大都市圈為研究區(qū),根據(jù)USGS分類標(biāo)準(zhǔn)并結(jié)合研究區(qū)實(shí)際情況選取樣本進(jìn)行分析,其Kappa系數(shù)為0.78,表明隨機(jī)森林在土地利用及土地覆被分類中表現(xiàn)較好。
1? 研究區(qū)概況
研究區(qū)位于佛羅里達(dá)州沿海平原的狹長(zhǎng)地帶,處于北緯30°18′至31°,西經(jīng)86°38′至87°38′之間。研究區(qū)海拔高度較低、地勢(shì)整體平坦,整個(gè)研究區(qū)被無數(shù)河流切割,南部低洼地區(qū)由森林和混合硬木沼澤組成分割相對(duì)較少。
2? 數(shù)據(jù)和方法
2.1 數(shù)據(jù)來源
本文采用2018年4月5日和4月15日的歐洲環(huán)境衛(wèi)星哨兵2號(hào)(Sentinel-2B)1-C級(jí)影像且所有影像的云量均小于1%,影像條帶號(hào)分別為T16RDV、T16REV、T16RDU、T16REU。
2.2 研究方法與數(shù)據(jù)處理
對(duì)遙感影像進(jìn)行預(yù)處理后選取訓(xùn)練樣本,基于隨機(jī)森林分類模型[1]進(jìn)行研究區(qū)土地利用及土地覆被分類分析。
2.2.1 遙感影像預(yù)處理
在本研究中借助Sen2Cor軟件,對(duì)哨兵2號(hào)的初級(jí)遙感影像進(jìn)行大氣校正。通過輸入大氣數(shù)據(jù),對(duì)1-C級(jí)的遙感影像進(jìn)行大氣校正、地形校正以及卷云校正(去除云霧遮擋),將1-C級(jí)的光譜反射率轉(zhuǎn)換為表面反射率,以減少大氣對(duì)傳感器接收的輻射量的影響。
隨后對(duì)大氣校正后的影像進(jìn)行圖像融合,將哨兵2號(hào)10m分辨率與20m分辨率的圖像融合后再進(jìn)行真彩色波段合成。后將影像條帶號(hào)分別為T16RDV(2018.04.05),T16REV(2018.04.05),T16RDU(2018.04.15),16REU(2018.04.15)的四景影像進(jìn)行圖像鑲嵌,以研究區(qū)為邊界對(duì)鑲嵌處理后的影像進(jìn)行裁剪。
2.2.2 訓(xùn)練樣本選取
在進(jìn)行土地利用與土地覆被分類時(shí)所選取的訓(xùn)練樣本需要具有準(zhǔn)確性、代表性及統(tǒng)計(jì)性的原則[2-3]。對(duì)于所選取的訓(xùn)練樣本進(jìn)行屬性編碼賦值,以1976年USGS出版編號(hào)為依據(jù)[4-5],根據(jù)研究區(qū)的實(shí)際情況以及采樣點(diǎn)的具體用地類型,對(duì)子分類進(jìn)行合并調(diào)整為6個(gè)類型,分別為發(fā)展/人類活動(dòng)用地、林地、灌木用地、草本用地、農(nóng)作物用地以及濕地/河流(如表1)。
2.2.3 土地利用及土地覆被分類
基于ArcGIS Pro2.5 平臺(tái),輸入數(shù)據(jù)包括10個(gè)10m或20m可見光,近紅外和短波紅外波段圖像,導(dǎo)出NDVI。使用經(jīng)過調(diào)整的Breiman(2001)隨機(jī)森林創(chuàng)建分類模型進(jìn)行土地利用與土地覆被分類預(yù)測(cè)[6]。
2.2.4 精度分析
基于隨機(jī)森林模型生成的土地利用與土地覆被分類柵格影像,以研究區(qū)為邊界隨機(jī)生成500個(gè)樣本參照點(diǎn)。通過對(duì)比谷歌地球Pro歷史圖像上采樣點(diǎn)的實(shí)際土地利用類型與隨機(jī)森林模型生成影像的類型,得出混淆矩陣等統(tǒng)計(jì)數(shù)據(jù),對(duì)隨機(jī)森林模型在研究區(qū)域內(nèi)的分類精度進(jìn)行評(píng)價(jià)分析,評(píng)估了基于隨機(jī)森林分類的柵格地圖,其kappa值為0.78(見表2)。由于研究區(qū)自然環(huán)境保存完善,濕地及河流地區(qū)被大量的草本及灌木覆蓋,較難區(qū)分,且研究區(qū)為亞熱帶濕潤(rùn)氣候,全年最低溫在0℃以上,研究選取的4月份遙感影像上的濕地表層仍有草本和灌木植被等覆蓋,造成濕地/河流分類精度欠佳。
3? 結(jié)語(yǔ)
(1) Sen2Cor大氣校正可信度較高,為分類操作打下良好基礎(chǔ)。基于隨機(jī)森林得到研究區(qū)LULCC圖kappa值為0.78。其中林地和發(fā)展/人類活動(dòng)用地具有較高的精度;濕地/河流精確度很低,與農(nóng)作物用地等混雜。
(2) 錯(cuò)分現(xiàn)象主要與美國(guó)人口稀疏,自然景觀保持較為完善相關(guān)。研究區(qū)分布著大面積林地和農(nóng)業(yè)用地,以及大規(guī)模的濕地和沼澤。這些區(qū)域在遙感影像上光譜變化并不明顯。通過觀察研究區(qū)的自然地理環(huán)境特點(diǎn)得出,不同土地利用類型的海拔高度是不同的。在今后研究中可與雷達(dá)影像與遙感影像結(jié)合,減少錯(cuò)分現(xiàn)象。
(3) 有研究人員加入核函數(shù)的主成分分析 (KPCA)降低模型維度,以提高隨機(jī)森林模型的分類性能。在本文后續(xù)研究中,將與加入核函數(shù)的主成分分析 (KPCA)相結(jié)合,以提高最后的分類精度。
參考文獻(xiàn)
[1] 張潤(rùn),王永濱.機(jī)器學(xué)習(xí)及其算法和發(fā)展研究[J].中國(guó)傳媒大學(xué)學(xué)報(bào):自然科學(xué)版,2016,23(2):10-18,24.
[2] 谷曉天,高小紅,馬慧娟,等.復(fù)雜地形區(qū)土地利用/土地覆被分類機(jī)器學(xué)習(xí)方法比較研究[J].遙感技術(shù)與應(yīng)用,2019,34(1):57-67.
[3] 左曉慶,李瀟雨,劉懷鵬.基于隨機(jī)森林算法的城區(qū)土地覆蓋分類研究[J].河北省科學(xué)院學(xué)報(bào),2020,37(1):8-16.
[4] Huang, B., Li, R., Ding, Z., et al. A new remote-sensing-based indicator for integrating quantity and quality attributes to assess the dynamics of ecosystem assets. [J]. Global Ecology and Conservation, 2020, 22, e00999.
[5] 何云,黃翀,李賀,等.基于Sentinel-2A影像特征優(yōu)選的隨機(jī)森林土地覆蓋分類[J].資源科學(xué),2019,41(5):992-1001.
[6] 張曉羽,李鳳日,甄貞,等.基于隨機(jī)森林模型的陸地衛(wèi)星-8遙感影像森林植被分類[J].東北林業(yè)大學(xué)學(xué)報(bào),2016,44(6):53-57,74.