羅明帆,王冬至*
(1.廣東省國土資源測繪院,廣東 廣州 510500)
稻谷是我國南方最重要的糧食作物。國家一直把糧食安全保障作為頭等大事來抓,近年來又陸續(xù)出臺(tái)政策建設(shè)高標(biāo)準(zhǔn)基本農(nóng)田、禁止亂占耕地建房等,從各方面提升水田質(zhì)量,保障人民的糧食安全。我國的主要水稻產(chǎn)地絕大部分分布在以成都平原、長江中下游平原、珠江三角洲平原為代表的平原地區(qū),其中珠江三角洲平原位于廣東省,是全省最重要的水稻供應(yīng)基地。然而,廣東省屬亞熱帶季風(fēng)氣候,臺(tái)風(fēng)暴雨等極端氣候頻發(fā),受分辨率、時(shí)相、云層等客觀條件的限制,一般的衛(wèi)星光學(xué)影像不易開展遙感監(jiān)測。
目前國內(nèi)外已有不少針對水稻種植范圍提取的研究成果,其中閾值法是主流方法之一[1]。隨著大數(shù)據(jù)和機(jī)器學(xué)習(xí)應(yīng)用的不斷拓展,隨機(jī)森林法逐漸成為提取水稻的重要方法,如雷小雨[2]等利用兩個(gè)時(shí)相的數(shù)據(jù)構(gòu)建差值特征來突出水稻物候變化特點(diǎn),并與隨機(jī)森林法相結(jié)合提取了水稻種植面積,完成了湖南省常德市鼎城區(qū)的水稻種植面積提?。凰闻闻蝃3]等提出了一種基于時(shí)間序列GF-1號遙感影像的水稻識別方法,驗(yàn)證了NIR、R、NDVI時(shí)間序列曲線擬合的有效性以及擬合曲線目標(biāo)特征區(qū)域設(shè)置的合理性;栗云峰[4]等提出了一種融合多時(shí)相的GF-1號衛(wèi)星多光譜影像和Sentinel-1雷達(dá)影像的水稻田提取方法,并在南京市江寧區(qū)進(jìn)行了研究。總體而言,受不同地區(qū)的水稻生長狀況和季節(jié)變化影響,不同的水稻提取方法的效果可能存在差異。由于遙感影像質(zhì)量和周期等的影響,目前的水稻提取研究主要仍集中在小區(qū)域范圍的提取研究實(shí)驗(yàn)上[5-6],大范圍的水稻提取應(yīng)用對比研究還比較缺乏,因此本文以珠三角地區(qū)為研究對象,基于長時(shí)間序列的SAR和多光譜遙感影像,利用閾值法和隨機(jī)森林法進(jìn)行水稻提取,并對兩種方法的提取效果進(jìn)行了比較,以期為廣東省的水稻提取提供思路。
本文選取的研究區(qū)為珠江三角洲平原所在的廣東省珠三角地區(qū),涉及廣州、深圳、佛山、東莞、惠州、江門、珠海、中山、肇慶等9個(gè)地級市。珠三角地區(qū)大部分位于北回歸線以南,南亞熱帶;屬亞熱帶海洋季風(fēng)氣候,雨量充沛,熱量充足,雨熱同季;年日照為2 000 h,四季分布比較均勻;年平均氣溫為21.4~22.4℃;年平均降雨量為1 600~2 300 mm,受季風(fēng)氣候影響,降雨量集中在4-9月;冬季盛行偏北風(fēng)、天氣干燥,夏季盛行西南和東南風(fēng)、高溫多雨。其中,江門市的水稻種植最多,素有“珠三角的糧倉”之稱。
1.2.1 SAR數(shù)據(jù)
Sentinel-1衛(wèi)星為全天時(shí)、全天候雷達(dá)成像,不受天氣影響。本文采用經(jīng)過預(yù)處理(軌道校正、熱噪聲去除、輻射校正、幾何校正和斑點(diǎn)噪聲抑制)的2019年12個(gè)月的珠三角地區(qū)的Sentinel-1影像數(shù)據(jù),極化方式為VV和VH極化。
1.2.2 多光譜數(shù)據(jù)
Sentinel-2A衛(wèi)星攜帶一臺(tái)多光譜成像儀,可覆蓋13個(gè)光譜波段,從可見光和近紅外到短波紅外,具有不同的空間分辨率。該衛(wèi)星數(shù)據(jù)在紅邊范圍含有3個(gè)波段,有利于監(jiān)測植被健康信息。廣東省水稻種植類型多為雙季稻,第一季稻在上半年種植,光譜信息易被云層遮擋;第二季稻在下半年種植,一般為農(nóng)歷7月中旬到7月底種植,農(nóng)歷10月中旬成熟。因此,本文主要采用7月、9月、11月(對應(yīng)水稻種植初期、水稻種植后期和水稻收割后)的Sentinel-2A遙感影像數(shù)據(jù),并根據(jù)去云算法對云覆蓋區(qū)域進(jìn)行掩膜。將每個(gè)月份的多張影像進(jìn)行云掩膜處理后取中值,最終采用一張影像代表一個(gè)月的數(shù)據(jù),作為實(shí)驗(yàn)的分類數(shù)據(jù)。
1.2.3 樣本選取
本文選取的樣本主要包括水稻、旱地、林地和其他(水體和城市用地)等,通過目視解譯Sentinel-2A影像選取水體和城市用地樣本;通過目視解譯Sentinel-2A影像并結(jié)合廣東省當(dāng)年的高分辨率影像數(shù)據(jù)選取林地樣本;通過目視解譯Sentinel-2A影像和高分辨率影像數(shù)據(jù),并結(jié)合12個(gè)月的改進(jìn)的歸一化水體指數(shù)(MNDWI)選取水稻和旱地樣本(水稻3月和8月的MNDWI值明顯大于0.1,而旱地全年的MNDWI值均小于0)。選取的樣本類型、定義和數(shù)量如表1所示。將選取的樣本進(jìn)行隨機(jī)抽樣,按照“訓(xùn)練數(shù)據(jù)∶驗(yàn)證數(shù)據(jù)=3∶1”的比例進(jìn)行后續(xù)訓(xùn)練與驗(yàn)證。
表1 樣本類型、定義和數(shù)量
1)閾值法。閾值法是目前較成熟的水稻識別方法,通過對選取的水稻樣本2019年12個(gè)月的NDVI和MNDWI的平均值進(jìn)行統(tǒng)計(jì),可得到研究區(qū)的樣本特征值區(qū)別于旱地、林地和其他地物的水體和植被特征的實(shí)際情況,再根據(jù)不同時(shí)間的NDVI和MNDWI設(shè)置閾值提取水稻。本文將6月和10月的NDVI均值大于0.4,且3月和7月的MNDWI均值大于0.1作為判斷水稻的依據(jù)。
2)隨機(jī)森林法。隨機(jī)森林法是一種基于分類樹的算法[7],可在進(jìn)行回歸或分類時(shí)評估變量的重要性[8],在運(yùn)算量沒有顯著提高的前提下提高預(yù)測精度。本文利用隨機(jī)森林法,基于Sentinel-1數(shù)據(jù)和Sentinel-2A數(shù)據(jù),采用不同的特征組合進(jìn)行水稻提取和檢測,并分析各特征和組合特征的重要性,以發(fā)現(xiàn)對于提取水稻比較好的特征與特征組合,從而得到較高精度的水稻分類結(jié)果。
本文利用2019年7月、9月、11月的Sentinel-2A數(shù)據(jù)以及2019年12個(gè)月的Sentinel-1數(shù)據(jù)獲得光譜特征、多種植被指數(shù)、水體指數(shù)、紋理特征以及預(yù)處理后的VV、VH極化特征。其中,植被指數(shù)包括NDVI、增強(qiáng)型植被指數(shù)(EVI)[9]、兩波段增強(qiáng)型植被指數(shù)(EVI2)、歸一化紅外指數(shù)(NDII)[10];水體指數(shù)包括MNDWI和對葉片水分和土壤水分敏感的地面水指數(shù)(LSWI)[9]。
根據(jù)水稻的水體屬性和植被屬性,對每幅Sentinel-2A影像的紅邊、近紅外、短波紅外波段(本文選擇Sentinel-2A的B6、B8、B11和B12,其中B6為紅邊波段,B8為近紅外波段、B11和B12為短波紅外波段)進(jìn)行基于3×3窗口的紋理濾波計(jì)算。紋理參數(shù)包括均值、方差、對比度、相關(guān)性,因此每個(gè)月的影像有共計(jì)4×4=16種紋理特征。
Sentinel-1的VV和VH極化都能在不同程度上體現(xiàn)地物特征[11],因此本文提取了2019年12個(gè)月的Sentinel-1的VV、VH極化特征,并納入特征集。選取的各種特征如表2所示。
表2 選取特征匯總表
本文首先利用2019年3月、6月、7月、10月的Sentinel-2A影像提取2019年6月、10月的NDVI數(shù)據(jù)以及3月、7月的MNDWI數(shù)據(jù);再根據(jù)閾值法得到珠三角地區(qū)水稻分類結(jié)果,并進(jìn)行精度驗(yàn)證;然后利用2019年7月、9月、11月的 Sentinel-2A影像進(jìn)行光譜特征、多種植被指數(shù)、水體指數(shù)和紋理特征的提取,根據(jù)2019年12個(gè)月的Sentinel-1數(shù)據(jù)得到12個(gè)月的VV、VH波段數(shù)據(jù),并對光譜特征、多種植被指數(shù)、水體指數(shù)、紋理特征和VV、VH數(shù)據(jù)進(jìn)行特征組合得到隨機(jī)森林分類結(jié)果,計(jì)算精度驗(yàn)證結(jié)果;最后將閾值法與隨機(jī)森林法得到的結(jié)果進(jìn)行對比綜合,得到精度較好的珠三角地區(qū)水稻提取結(jié)果,如圖1所示。
圖1 研究思路圖
閾值法的分類結(jié)果如圖2所示,隨機(jī)森林法的分類結(jié)果如圖3所示,可以看出,利用閾值法提取的水稻分布情況與利用SAR特征隨機(jī)森林分類提取的水稻分布情況相似(藍(lán)色線區(qū)域),但后者提取的水稻明顯更多一些;利用光譜特征隨機(jī)森林分類提取的水稻分布情況與利用植被指數(shù)和水體指數(shù)提取的植被分布情況相似(紅色線區(qū)域);利用紋理特征隨機(jī)森林分類提取的水稻較少,相對于其他的分類結(jié)果少了很多細(xì)碎的點(diǎn)。
圖2 閾值法(NDVI+MNDWI提取)的分類結(jié)果
圖3 隨機(jī)森林法的分類結(jié)果
通過選取的驗(yàn)證樣本對分類結(jié)果進(jìn)行精度驗(yàn)證,結(jié)果如表3所示,可以看出,閾值法提取的水稻總體精度(OA)、Kappa系數(shù)、查全率(Recall)、F1score都是最低的,但查準(zhǔn)率(Precision)卻是最高的;光譜特征隨機(jī)森林分類得到的各項(xiàng)精度指標(biāo)均優(yōu)于其他特征隨機(jī)森林分類結(jié)果。通過比較發(fā)現(xiàn),大范圍內(nèi)不同地區(qū)的水稻灌溉時(shí)間差異較大,閾值法所采用的模型相對簡單,不能很好地判斷這種差異與其他地物的區(qū)別;而隨機(jī)森林法使用的模型更復(fù)雜,能較好地避開水稻灌溉時(shí)間差異對識別的影響。
表3 選取樣本的精度驗(yàn)證的結(jié)果
光譜特征和植被指數(shù)+水體指數(shù)的分類結(jié)果的Kappa系數(shù)均在0.95之上,SAR特征和紋理特征的分類結(jié)果的Kappa系數(shù)在0.85~0.9之間。根據(jù)SAR特征、光譜特征和植被指數(shù)+水體指數(shù)的水稻分類結(jié)果的面積相差不大,而利用閾值法和紋理特征隨機(jī)森林分類得到的水稻提取面積明顯低于其他3種分類結(jié)果。
本文將不同的特征組合作為輸入特征進(jìn)行隨機(jī)森林分類,特征組合包括:①光譜特征+植被指數(shù)+水體指數(shù);②光譜特征+紋理特征;③光譜特征+SAR特征。3種特征組合進(jìn)行隨機(jī)森林分類得到的水稻分布情況相似,進(jìn)一步驗(yàn)證精度,得到的結(jié)果如表4所示。當(dāng)光譜特征與植被指數(shù)+水體指數(shù)進(jìn)行組合時(shí),分類精度相較于只采用光譜特征的精度提升至0.99左右;當(dāng)光譜特征與植被指數(shù)+SAR特征進(jìn)行組合時(shí),分類精度相較于只采用光譜特征的精度由0.98降至0.95左右。
表4 組合特征精度驗(yàn)證結(jié)果
本文分別利用閾值法和隨機(jī)森林法進(jìn)行水稻種植面積提取,結(jié)果表明,閾值法提取的水稻數(shù)量的Kappa系數(shù)、OA、F1score、Recall等指標(biāo)均明顯低于隨機(jī)森林法的提取結(jié)果,但閾值法提取的水稻的Precision非常高。在僅采用單類特征進(jìn)行隨機(jī)森林分類的情況下,光譜特征的分類效果最好,其次是植被指數(shù)+水體指數(shù),兩種分類結(jié)果的Kappa系數(shù)均在0.95之上;而SAR特征和紋理特征的分類結(jié)果的Kappa系數(shù)在0.85~0.9之間。將光譜特征與其他特征進(jìn)行組合發(fā)現(xiàn),當(dāng)光譜特征與植被指數(shù)+水體指數(shù)進(jìn)行組合時(shí),分類精度相較于只采用光譜特征的精度提升至0.99左右;當(dāng)光譜特征與植被指數(shù)+SAR特征進(jìn)行組合時(shí),分類精度相較于只采用光譜特征的精度明顯下降,從0.98降至0.95左右。今后需要改進(jìn)的方向?yàn)?
1)樣本數(shù)量。本文選取的樣本較少,但保證了樣本的均勻分布和可靠性,并對結(jié)果的有效性進(jìn)行了驗(yàn)證,今后可選取更多的樣本進(jìn)行訓(xùn)練,以提高識別精度。
2)樣本類型。本文得到的分類器可以很好地區(qū)分水稻和旱地,但與水稻易混淆的地物還有其他水生農(nóng)作物(如蓮藕)。由于僅靠目視解譯難以選出其他水生農(nóng)作物的樣本,因此本文選取的樣本主要為旱地作物的樣本。雖然水生農(nóng)作物的面積相對于水稻面積來說只有很少一部分,但若有一些樣本可以用來訓(xùn)練的話,得到的水稻提取效果將更好,且分類時(shí),紋理特征作用也將更明顯。
3)面積對比。由于未在統(tǒng)計(jì)年鑒上找到珠三角地區(qū)各市關(guān)于稻田面積的統(tǒng)計(jì),因此本文未能將分類結(jié)果得到的面積與實(shí)際稻田面積進(jìn)行對比,查看分類面積情況。
4)特征組合。本文對一些特征組合進(jìn)行分類發(fā)現(xiàn),光譜特征與植被指數(shù)+水體指數(shù)進(jìn)行組合時(shí)的分類效果最好,今后可進(jìn)行更加細(xì)致的特征組合,得到更加優(yōu)化的特征組合結(jié)果。