張 穎,何貞銘,吳貞江
長江大學地球科學學院,湖北 武漢 430100
近年來,遙感技術(shù)成為作物分類的重要手段,不僅能夠快速準確地獲取農(nóng)作物的面積分布,也能為作物信息提取提供良好的技術(shù)支持。Vuolo[1]等利用多時相哨兵-2 圖像和隨機森林(Random forest,RF)分類器對農(nóng)作物進行識別,驗證多相作物的分類精度高于單相作物的分類精度。Bargiel[2]等結(jié)合哨兵-1 密集時間序列數(shù)據(jù)和耕地物候變化信息,評估了聯(lián)合使用時間序列的光學和SAR 數(shù)據(jù)識別作物類別的適用性。Sonobe[3]等利用多時相的哨兵數(shù)據(jù)和光學遙感影像,對農(nóng)作物類型進行分類研究,結(jié)果表明,雷達數(shù)據(jù)和光學數(shù)據(jù)的結(jié)合能夠?qū)崿F(xiàn)預期的效果。
融合多源遙感數(shù)據(jù)有助于提高分類精度[4],但特征維數(shù)增加到一定閾值,繼續(xù)增加反而會導致精度下降[5]。因此,常睿春[6]等人研究了基于FastICA 的高光譜遙感礦物信息提取方法,曹晶晶[7]等對獨立主成分分析(Independent principal component analysis,ICA)在高光譜混合像元分解方面進行研究,結(jié)果證明,ICA 可以保留部分特征波段,增加地物的可區(qū)分性[8]?;谙裨淖魑锓诸惙椒y以保證地物內(nèi)部的完整性[9]。本實驗采用面向?qū)ο筠r(nóng)作物分類,融合Sentinel-1 SAR數(shù)據(jù)和Sentinel-2多光譜數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù),采用獨立主成分分析方法,選取占方差95%的前6 個分量用于隨機森林分類器快速[10]分類,證明農(nóng)作物分類提取中,面向?qū)ο蠓诸惙椒ǖ木缺让嫦蛳裨撸叶嘣催b感數(shù)據(jù)融合比單獨使用多光譜數(shù)據(jù)或雷達數(shù)據(jù)分類更加精確。
本文選擇濟寧西南部為研究區(qū)域,該區(qū)域以小麥-玉米、小麥-棉花、小麥-水稻和辣椒-大蒜四種輪作方式為主。本文采集了研究區(qū)2020 年4 月到9 月有效的4 期Sentinel-2 2A 級少云(小于1%)光學數(shù)據(jù),并獲得同一時間段內(nèi)的Sentinel-1 雷達(SAR)影像[11]數(shù)據(jù),數(shù)據(jù)信息如表1 所示。
表1 Sentinel-1SAR 和Sentinel-2 多光譜數(shù)據(jù)采集Table 1 Sentinel-1 radar and Sentinel-2 multispectral data collection
通過實地調(diào)查采樣,采集樣本像元數(shù):水稻3980 個,辣椒7812 個,棉花1025 個,玉米6424個。本文選取50%的樣本作為訓練數(shù)據(jù),50%作為驗證數(shù)據(jù),使用2017 年土地利用數(shù)據(jù)對非農(nóng)作物區(qū)域進行掩膜,降低其他土地類別對作物分類的影響[12]。
為避免其他土地利用類別對分類精度的干擾,本實驗使用10 m 分辨率的土地利用數(shù)據(jù)對預處理完成的圖像中非農(nóng)作物區(qū)域進行掩膜。Sentinel-1 數(shù)據(jù)通過預處理,得到VV 極化和VH 極化[13]的后向散射系數(shù)。Sentinel-2 的2A 級數(shù)據(jù)已經(jīng)完成數(shù)據(jù)校正[11]。本文保留紅、綠、藍、近紅外波段,將紅邊波段重新采樣至10 m,其他波段因與本研究無關(guān)而被剔除。
為保證分割后生成的對象能與相鄰類別地物區(qū)分且不會太破碎[14],本文對不同尺度參數(shù)的分割結(jié)果進行對比,部分結(jié)果如圖1 所示,其中圖1(a)-(b)的合并參數(shù)為85,分割參數(shù)分別為54 和74,圖1(c)-(d)分割參數(shù)為64,合并參數(shù)分別為75 和95。可以看到,圖1(b)和圖1(d)存在明顯的欠分割,圖1(a)和圖1(c)存在過分割的情況,因此將分割參數(shù)設(shè)置為64,合并參數(shù)設(shè)置為85 時分割結(jié)果最優(yōu)。h
圖1 面向?qū)ο蠓指罱Y(jié)果圖Fig.1 Object-oriented segmentation result grap
雷達數(shù)據(jù)有較強紋理特征[15],除4 個時相的VV 和VH 極化后向散射系數(shù),本文針對每種極化數(shù)據(jù)提取了Homogeneity、Dissimilarity、Entropy 三種紋理特征。針對Sentinel-2 數(shù)據(jù)各提取4 個波段的光譜數(shù)據(jù),并從中提取歸一化植被指數(shù)(NDVI)。將這52 個特征合并,共同參與農(nóng)作物分類。
本文使用灰度共生矩陣(GLCM)來描述圖像的紋理特征[16],通過獨立主成分分析(ICA)進行分類和波譜提取,保留光譜影像各個波段之間的數(shù)據(jù)相關(guān)性[17]。采用隨機森林(RF)分類算法構(gòu)建子決策樹[18],篩選出重要性較高的特征變量表征地物的實際特性[10]。使用Kappa 系數(shù)和混淆矩陣反映圖像分類的精度[19],對實驗結(jié)果進行精度驗證。
根據(jù)研究區(qū)實際地物采樣點類型對研究區(qū)農(nóng)作物展開分類,冬小麥-玉米、冬小麥-棉花、冬小麥-水稻和辣椒-大蒜輪作分類結(jié)果如圖2 所示,精度評價結(jié)果如表2 所示。圖2(a)是面向?qū)ο蠓诸惤Y(jié)果圖,圖2(b)是面向像元的分類結(jié)果圖,可以發(fā)現(xiàn)面向像元分類結(jié)果存在明顯的“椒鹽現(xiàn)象”,在紅框標記中有明顯的同類地物被錯分的情況,因此在本實驗中,面向?qū)ο蟮淖魑锓诸惙椒ǜ袃?yōu)勢。
圖2 面向?qū)ο蠓诸惤Y(jié)果和面向像元分類結(jié)果對比Fig.2 Comparison of object-oriented classification results and pixel-oriented classification results
表2 多源數(shù)據(jù)融合后精度評價比較Table 2 Accuracy evaluation comparison
本研究將光學數(shù)據(jù)和雷達數(shù)據(jù)結(jié)合應用于目標農(nóng)作物信息的提取和分類,相比于單一的光譜數(shù)據(jù)提取,SAR 數(shù)據(jù)的加入可以提供相關(guān)作物的特征信息,使分類結(jié)果精度更高。根據(jù)研究區(qū)作物分布情況,分別對光學數(shù)據(jù)、雷達數(shù)據(jù)和光學與雷達數(shù)據(jù)融合后的影像進行分類,分類結(jié)果圖如圖3(a)-(c)所示,可以看出多源數(shù)據(jù)的融合有助于提升農(nóng)作物的分類精度,精度評價結(jié)果見表3。
圖3 雷達數(shù)據(jù)、光學數(shù)據(jù)和數(shù)據(jù)融合后分類結(jié)果圖Fig.3 Radar data,optical data,and data fusion classification result graph
表3 基于面向?qū)ο蟮牟煌瑪?shù)據(jù)分類精度比較Table 3 Classification data accuracy comparison
本實驗采用面向?qū)ο蠛兔嫦蛳裨獌煞N分類方法對野外驗證樣本集的提取結(jié)果進行精度評價,評價結(jié)果證明,面向?qū)ο蠓诸惥葹?9.62%,Kappa 系數(shù)為0.8488;面向像元分類精度為81.92%,Kappa 系數(shù)為0.7368。面向?qū)ο笞魑锓诸惥缺让嫦蛳裨诸惥雀?.7%。結(jié)果表明面向?qū)ο蟮淖魑锓诸惙椒ň雀?,相比于面向像元分類方法更有?yōu)勢。實驗使用不同影像檢驗農(nóng)作物的分類精度,驗證融合后的數(shù)據(jù)對農(nóng)作物分類精度有明顯提高,雷達數(shù)據(jù)對水稻的識別精度要高于光學數(shù)據(jù),因為水稻自身有較高的含水量,且水稻種植區(qū)域土壤的含水量高,因此它的介電常數(shù)也高,反射的雷達回波能量也強[15],識別精度更高。當數(shù)據(jù)融合以后,農(nóng)作物的總體分類精度為89.6226%,Kappa系數(shù)為0.8488,分類精度相較于只使用光學數(shù)據(jù)提升了16.84%,相比于只使用雷達數(shù)據(jù)提升了20.34%,結(jié)果表明,多源數(shù)據(jù)融合有助于提升農(nóng)作物分類精度。
本研究使用的Sentinel-1 SAR 和Sentinel-2 多光譜數(shù)據(jù)源自于歐洲航天局哥白尼計劃的地球環(huán)境監(jiān)測衛(wèi)星,衛(wèi)星開放了遙感數(shù)據(jù)的可用性,為農(nóng)作物精準分類提供基礎(chǔ)理論和數(shù)據(jù)支撐。Sentinel-1 SAR 和Sentinel-2 多光譜數(shù)據(jù)最高空間分辨率都達到了10 m,在不同傳感器影像配準融合方面有巨大優(yōu)勢,在作物分類中也有巨大潛力。Sentinel-1 的SAR 數(shù)據(jù)提供了共極化和交叉極化的反向散射,這對農(nóng)業(yè)應用和作物生長監(jiān)測非常重要,后續(xù)研究可以考慮使用全極化SAR 數(shù)據(jù),全極化數(shù)據(jù)對目標地物的形狀、尺寸、空間分布和方向更加敏感,能夠更全面地刻畫觀測目標的散射機制從而提供更豐富的地表信息[20,21],更顯著的提升作物分類精度。
本研究以濟寧西南部為研究區(qū)域,融合該區(qū)域Sentinel-1 SAR 和Sentinel-2 多光譜數(shù)據(jù),使用隨機森林分類方法識別研究區(qū)域2020 年不同種植模式下的作物種植面積。基于面向?qū)ο蟮淖魑锓诸惙椒▽ψ魑镞M行精度評價,評價結(jié)果表明,多源遙感數(shù)據(jù)融合后研究區(qū)農(nóng)作物的總體分類精度為89.6226%,Kappa 系數(shù)為0.8488,分類精度相比于單一遙感影像數(shù)據(jù)有較大提升,證明多源遙感數(shù)據(jù)融合配合面向?qū)ο蟮淖魑锓诸惙椒梢燥@著提升農(nóng)作物分類精度。本實驗獲得2020 年研究區(qū)農(nóng)作物種植的識別結(jié)果:嘉祥主要種植玉米,金鄉(xiāng)縣則是大蒜的主產(chǎn)區(qū),魚臺縣種植水稻小麥面積較大。研究區(qū)2020 年水稻種植面積為625.65 km2,玉米種植面積為796.41 km2,棉花種植面積為97.96 km2,辣椒種植面積為845.85 km2,為后續(xù)農(nóng)作物分類提取和農(nóng)作物估產(chǎn)提供技術(shù)參考。