董秀春,蔣 怡,王 思,李宗南,王 昕
(四川省農(nóng)業(yè)科學院遙感應(yīng)用研究所,成都610066)
近年來,隨著空間信息技術(shù)的發(fā)展和遙感平臺的不斷更新,不同成像方式、不同波段和分辨率的遙感數(shù)據(jù)并存,形成了多源、海量、多時相的遙感大數(shù)據(jù)[1]。為充分利用遙感大數(shù)據(jù),需要更高的遙感影像分析、海量數(shù)據(jù)處理和信息提取能力[2-3]。傳統(tǒng)的遙感影像處理和分析技術(shù)難以滿足多源異構(gòu)海量大數(shù)據(jù)的處理精度和效率需求。以支持向量機[4]、隨機森林[5]、Softmax[6]等為代表的淺層機器學習方法可有效改善傳統(tǒng)監(jiān)督分類方法目標識別的準確度和分類精度,但其學習能力和泛化能力有限,難以滿足海量遙感影像分類的需求。深度學習是機器學習的重要分支,是一種模擬人腦神經(jīng)結(jié)構(gòu)處理信息的方法,能有效地進行特征選擇與特征提取,已在圖像識別分類、語音識別、自然語言處理等多應(yīng)用領(lǐng)域取得較大突破[7-8],為遙感大數(shù)據(jù)信息提取提供了新方法[9]。研究人員通過使用高分辨率真彩色影像進行圖像分類[10]和目標識別[11-12],在土地覆蓋分類、地籍邊界線提取等方面取得較好的應(yīng)用效果。
甘蔗是云南邊疆地區(qū)農(nóng)民脫貧致富的重要產(chǎn)業(yè)[13]。掌握甘蔗空間分布及時空變化可為地方政府、農(nóng)業(yè)部門進行作物種植結(jié)構(gòu)調(diào)整提供重要參考[14]。目前,甘蔗遙感分類提取方法包括監(jiān)督分類[15]、面向?qū)ο蠓诸悾?6]和決策樹[17-18]等,研究人員通過EOS/MODIS、HJ衛(wèi)星遙感數(shù)據(jù),實現(xiàn)了甘蔗種植信息提取、面積估算以及動態(tài)監(jiān)測。U-Net具有較強的語義分割功能,可對圖像上的每個像素點實現(xiàn)語義標注,目前在高分辨率遙感影像分類中得到較好的應(yīng)用[19-20]。為探索基于深度學習的甘蔗種植空間信息提取方法,文章以云南省隴川縣甘蔗種植園為研究對象,采用基于U-Net的神經(jīng)網(wǎng)絡(luò)模型提取甘蔗種植空間信息,利用地面樣方數(shù)據(jù)評價模型精度,為基于深度學習方法的甘蔗空間信息提取提供技術(shù)參考。
研究區(qū)隸屬于云南省德宏州隴川縣,位于云南省德宏州西南部(圖1)。該區(qū)域?qū)儆谀蟻啛釒Ъ撅L氣候,以河谷盆地、丘陵為主,平均海拔930~1 100 m,年均氣溫18.4~20.3℃,年降雨量1 400~1 700 mm,年日照時間2 281~2 453 h,晝夜溫差大,霜期短少,充足的氣候資源和土地資源適宜甘蔗生長。
圖1 研究區(qū)位置及影像示意圖Fig.1 Location and Google Earth imagery of study area
1.2.1 Google Earth數(shù)據(jù)
Google Earth影像是Google公司自2005年推出的高空間分辨率RGB合成影像,用戶可通過Google Earth(GE)虛擬地球軟件實時瀏覽和下載。云南秋冬季節(jié)可獲取清晰無云遙感影像,10—11月為甘蔗伸長期,是甘蔗最佳遙感監(jiān)測時期。下載2018年11月28日空間分辨率為0.26 m、19級的RGB合成影像為數(shù)據(jù)源,經(jīng)重采樣、裁剪等預(yù)處理,形成空間分辨率為0.5 m、影像幅寬為8 km×8 km的待分類影像,覆蓋區(qū)域地形分為典型的平壩和丘陵地區(qū),如圖1所示。
1.2.2 樣方數(shù)據(jù)
結(jié)合農(nóng)業(yè)農(nóng)村部大宗作物遙感監(jiān)測地面調(diào)查數(shù)據(jù),確定甘蔗解譯標志。將研究區(qū)分為甘蔗和非甘蔗兩類。選取甘蔗感興趣區(qū)建立樣本數(shù)據(jù)集,其中用于訓練的樣本200個,用于驗證的樣本40個(圖1)。在研究區(qū)隨機建立4個大小為500 m×500 m的樣方,隨機分布于平壩區(qū)和丘陵區(qū),如圖1黑色方框標注范圍所示,目視解譯獲取樣方內(nèi)甘蔗種植面積和空間分布,作為分類精度驗證數(shù)據(jù)。
使用ENVI5.5中的深度學習模塊進行甘蔗空間信息提取。該模塊是基于TensorFlow深度學習框架的遙感圖像分類工具,采用基于U-Net神經(jīng)網(wǎng)絡(luò)模型進行影像分類處理,該模型是典型的全卷積神經(jīng)網(wǎng)絡(luò)模型,由壓縮通道和擴張通道組成。壓縮通道是卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),重復(fù)采用2個卷積核大小均為3×3的卷積層和1個2×2步長為2的最大池化層,逐層完成影像特征提取,在每次下采樣過程中,特征通道的數(shù)量會加倍;擴展通道中每個步驟首先通過2×2的反卷積對特征圖進行上采樣,減半特征通道數(shù)量,然后再拼接對應(yīng)壓縮通道特征圖,同時進行2次3×3的卷積進行特征提取,重復(fù)該步驟,在最后的輸出層,通過卷積核大小為1×1的卷積層將特征圖映射到1個灰度圖像,其像素代表屬于感興趣特征的概率。具體步驟為:首先構(gòu)建U-Net網(wǎng)絡(luò)模型,然后加入訓練樣本和驗證數(shù)據(jù)進行模型訓練;最后使用模型進行影像分類,根據(jù)驗證數(shù)據(jù)計算混淆矩陣,評價模型分類結(jié)果。
該文采用2018年11月28日空間分辨率為0.5 m的Google Earth影像數(shù)據(jù),基于U-Net模型對云南省德宏州甘蔗種植區(qū)8 km×8 km的范圍進行種植空間信息提取,結(jié)果如圖2所示。U-Net模型精度驗證結(jié)果表明,基于Google Earth影像的深度學習分類總精度為92.76%,Kappa系數(shù)為0.848 0,面積總精度為94.41%。根據(jù)圖2,基于Google Earth開放數(shù)據(jù)的甘蔗深度學習分類效果良好,大部分甘蔗均能被較好識別。部分地物存在錯分,如部分河流區(qū)域草地、操場人工草坪、湖泊錯分為甘蔗,如圖2中矩形和橢圓形圈出部分。與典型的平壩、丘陵區(qū)域的分類精度比較結(jié)果見表1。平壩區(qū)、丘陵區(qū)分類精度存在明顯差異。其中,平壩區(qū)的分類總精度比丘陵區(qū)高約9%,Kappa系數(shù)較丘陵區(qū)域高約0.16;甘蔗的錯分、漏分誤差顯示平壩區(qū)較低,尤其是漏分誤差顯著低于丘陵 區(qū)。
不同區(qū)域分類精度存在明顯差異的主要原因是平壩區(qū)域地塊形狀規(guī)則、界線清晰,便于特征對象分割提??;平壩區(qū)域水肥條件好,大部分甘蔗長勢整齊,整體紋理特征一致,有利于特征識別。丘陵區(qū)域受地形、水肥條件、管理水平等影響,甘蔗長勢參差不齊,呈現(xiàn)出較大的紋理特征差異,部分長勢較差的甘蔗漏分較多;部分地塊受其他作物或植被干擾,地塊界線模糊,出現(xiàn)錯分現(xiàn)象,影響了整體分類結(jié)果。部分地物RGB影像特征與甘蔗相似,導致部分地物存在錯分現(xiàn)象。
圖2 基于U-Net的甘蔗提取結(jié)果Fig.2 Classification results of Sugarcane based on U-Net in study area
表1 不同區(qū)域分類精度驗證結(jié)果Table 1 Classification accuracy in different regions
U-Net網(wǎng)絡(luò)模型具有結(jié)構(gòu)清晰的優(yōu)點,能夠在小樣本數(shù)據(jù)集下獲得較好的訓練效果[21],可在一定程度上解決深度學習在作物空間信息提取中受限于作物樣本數(shù)據(jù)集缺乏的問題。研究以云南隴川縣甘蔗種植區(qū)0.5 m的Google Earth影像進行U-Net模型訓練和甘蔗分類提取,經(jīng)地面樣方數(shù)據(jù)驗證,基于U-Net模型的甘蔗分類總體精度和Kappa系數(shù)分別為92.76%和0.848 0,結(jié)果表明該方法可行,可為基于深度學習方法的甘蔗空間信息提取提供技術(shù)參考。
研究使用Google Earth開源高分辨率影像進行基于U-Net的甘蔗深度學習分類方法探索,結(jié)合研究結(jié)果,未來仍需進一步嘗試使用多光譜(尤其是帶有紅邊波段)影像數(shù)據(jù)進行作物深度學習分類方法研究。開放的Google Earth影像數(shù)據(jù)是研究人員常用空間參考數(shù)據(jù),被應(yīng)用在農(nóng)作物面積地面樣方調(diào)查[22]、遙感影像分類[23-24]等多項研究中。但分類結(jié)果顯示,受部分地物RGB影像特征與甘蔗相似的影響,使用Google Earth開放的RGB合成影像存在部分較明顯的錯分現(xiàn)象。相關(guān)研究表明,更廣的光譜范圍有利于地物識別[25],因此,需進一步研究多光譜影像作物空間信息提取方法,以減少作物錯分、漏分現(xiàn)象,提高作物分類提取精度。