徐曉臣,任江龍
(中水北方勘測(cè)設(shè)計(jì)研究有限責(zé)任公司,天津 300222)
糧食安全一直是世界各國(guó)關(guān)注的焦點(diǎn),水稻作為世界上主要糧食作物之一,其在全球經(jīng)濟(jì)、糧食安全等方面發(fā)揮著重要作用。全球氣候變化、環(huán)境污染和人口增長(zhǎng)等因素,對(duì)水稻生產(chǎn)產(chǎn)生較大影響,部分地區(qū)的水稻耕種面積不斷減少。因此,及時(shí)準(zhǔn)確地獲取水稻種植信息對(duì)于區(qū)域水稻種植監(jiān)測(cè)、糧食安全等具有重要意義。
傳統(tǒng)獲取水稻種植信息的方式多為人工實(shí)測(cè),隨著衛(wèi)星遙感技術(shù)的發(fā)展,遙感技術(shù)已成為獲取作物種植信息的主要手段,其能夠穩(wěn)定準(zhǔn)確地提供大尺度觀測(cè)結(jié)果[1]。現(xiàn)有水稻種植信息的提取研究中主要是基于光學(xué)數(shù)據(jù)和微波數(shù)據(jù)。其中,基于光學(xué)影像水稻提取多以單景或多時(shí)序影像,主要采用機(jī)器學(xué)習(xí)或物候?qū)W原理方法。由于單景影像難以避免異物同譜的現(xiàn)象,使得水稻提取結(jié)果與選取影像時(shí)間關(guān)系密切。采用多時(shí)相光學(xué)數(shù)據(jù)進(jìn)行水稻提取,雖然能有效避免異物同譜現(xiàn)象,但易受云雨天氣影響,難以獲得高質(zhì)量多時(shí)序光學(xué)數(shù)據(jù)。合成孔徑雷達(dá)(SAR)數(shù)據(jù)能夠穿云透霧,全天候全天時(shí)對(duì)地表進(jìn)行監(jiān)測(cè),為水稻種植信息的提取提供了新的途徑[2]。通過(guò)分析水稻生長(zhǎng)季不同極化特征曲線,構(gòu)建決策樹(shù)或其他機(jī)器學(xué)習(xí)方法進(jìn)行水稻種植信息提取。Google earth engine(GEE)云平臺(tái)的快速發(fā)展[3],使得基于Sentinel-1 時(shí)間序列數(shù)據(jù)的水稻種植信息提取研究更加便捷。本研究基于GEE 云平臺(tái)構(gòu)建Sentinel-1 時(shí)序數(shù)據(jù),采用支持向量機(jī)和隨機(jī)森林方法,實(shí)現(xiàn)肥西縣水稻種植信息提取。
由于肥西縣水稻生長(zhǎng)期主要在5—9月,因此選擇2021年全年Sentinel-1A 影像分析水稻物候特征,并加載4—10月影像構(gòu)建時(shí)序特征進(jìn)行分類。本文選擇干涉寬幅(IW)模式地距影像(GRD)雙極化Sentinel-1A 影像,空間分辨率重采樣為10 m,影像寬幅為250 km,時(shí)間分辨率為12天。GEE 平臺(tái)中Sentinel-1 影像均已使用歐洲航天局(ESA)Sentinel-1 工具箱(S1TBX)進(jìn)行了預(yù)處理,包括軌道校正、熱噪聲消除、地形校正和輻射校正。
由于SAR 數(shù)據(jù)特殊的成像機(jī)制,導(dǎo)致圖像受噪聲影像,頻繁出現(xiàn)椒鹽噪聲現(xiàn)象,影響地物分類精度。而散斑濾波器根據(jù)圖像的局部變化進(jìn)行調(diào)整,采取適當(dāng)?shù)姆椒▽?duì)圖像進(jìn)行平滑處理,從而減少散斑帶來(lái)的影響,增強(qiáng)邊緣信息以保持圖像的清晰度。Ref ined Lee 濾波在農(nóng)作物分類提取中應(yīng)用較多[4]。因此,在GEE 平臺(tái)上對(duì)Sentinel-1 影像使用Ref ined Lee 濾波進(jìn)行散斑濾波處理,以減少椒鹽噪聲對(duì)分類結(jié)果的影響。同時(shí),采用Savitzky-Golay(SG)濾波方法對(duì)散斑濾波后的SAR 時(shí)序數(shù)據(jù)進(jìn)行時(shí)間濾波處理,進(jìn)而減少時(shí)序噪聲,其中SG 濾波中滑動(dòng)窗口設(shè)置為5。
本文樣本數(shù)據(jù)來(lái)源于谷歌歷史影像以及通過(guò)野外考察獲取,其中水稻樣本數(shù)量為152 個(gè),非水稻樣本125 個(gè)。隨機(jī)抽取70%的樣本作為訓(xùn)練樣本(194 個(gè)),其余30%的樣本作為驗(yàn)證樣本(83 個(gè))。
水稻生長(zhǎng)初期需要移栽到有水的土壤中,移栽前耕地呈現(xiàn)水體特征,導(dǎo)致后向散射系數(shù)較低。水稻被移栽后,植株開(kāi)始露出水面,微波雙重反射和多重反射機(jī)制導(dǎo)致后向散射系數(shù)不斷增大。隨著水稻植株不斷增高,后向散射系數(shù)也不斷增大,直至水稻抽穗時(shí)達(dá)到最大值,隨后其后向散射不斷減少。在野外調(diào)查過(guò)程中發(fā)現(xiàn)肥西縣多為單季稻,移栽主要集中在5月份左右,9月底或10月中上旬進(jìn)行收割,生長(zhǎng)周期多為100~120天。
根據(jù)野外考察獲得的水稻樣本加載2021年全年Sentinel-1數(shù)據(jù)進(jìn)行時(shí)序分析,結(jié)果如圖1 所示,包括散斑濾波處理后的VV、VH 極化和時(shí)間濾波處理后的VV_SG 和VH_SG 極化曲線。從圖中可以看出水稻在兩種原始極化曲線中均呈現(xiàn)出相似的波動(dòng),但VH 極化比VV 極化幅度更大(即,最大和最小峰值之差約為10 dB)。經(jīng)過(guò)SG 濾波處理后的VV和VH 極化能夠較好地體現(xiàn)水稻生長(zhǎng)的物候特征,其中VH_SG 在水稻稻田灌水期間,VH 后向散射明顯下降,水稻移栽后VH 后向散射明顯上升,直至成熟期達(dá)到最大值。而VV_SG 時(shí)序曲線在水稻生長(zhǎng)期內(nèi)沒(méi)有明顯的波動(dòng),振幅較小,僅當(dāng)水稻成熟期時(shí)VV_SG 后向散射有明顯提升。VH_SG 時(shí)序曲線相較于VV_SG 具有更明顯的物候特征。
圖1 水稻生長(zhǎng)SAR 時(shí)序物候特征曲線
支持向量機(jī)(SVM)是一種用于解決回歸和分類問(wèn)題的監(jiān)督學(xué)習(xí)算法,支持向量機(jī)分類器在訓(xùn)練階段創(chuàng)建一個(gè)理想的超平面,以最少的錯(cuò)誤分類像素分隔多個(gè)類[5]。用于選擇有助于創(chuàng)建超平面的極值點(diǎn)/向量,這些極值點(diǎn)被稱為支持向量。GEE 平臺(tái)通過(guò)加載ee.Classif ier.libsvm 函數(shù),可實(shí)現(xiàn)SVM 分類方法調(diào)用。
隨機(jī)森林(RF)是一種基于生成大量決策樹(shù)的分類學(xué)習(xí)方法,其中每個(gè)決策樹(shù)都是由使用訓(xùn)練集的不同子集構(gòu)建的[6]。這些子集通常是通過(guò)隨機(jī)抽樣和替換原始數(shù)據(jù)集獲取的。通過(guò)決策樹(shù)選擇最常見(jiàn)的輸出來(lái)識(shí)別分類共識(shí)。通過(guò)GEE 平臺(tái)中的smileRandomForest 函數(shù)調(diào)用隨機(jī)森林分類方法,并將時(shí)序指標(biāo)特征引入函數(shù),實(shí)現(xiàn)水稻和非水稻地塊的分類。根據(jù)前人的研究成果,將RF 分類器參數(shù)ntree 和mtry 分別設(shè)為100 和輸入變量的平方根。
本文利用GEE 平臺(tái)構(gòu)建了三種時(shí)序特征組合,分別為VV 時(shí)序數(shù)據(jù)集、VH 時(shí)序數(shù)據(jù)集以及VV 與VH 時(shí)序數(shù)據(jù)集。采用SVM 和RF 兩種分類器對(duì)三種時(shí)序特征組合進(jìn)行分類,分類精度如表1 所示。從表中可以看出,VV+VH組合分類精度最高,SVM 與RF 兩種分類器中均獲得最高精度,總體精度分別為89.98%和91.32%。其中RF 水稻種植信息提取的生產(chǎn)者精度與用戶精度均大于SVM 的提取結(jié)果,說(shuō)明RF 分類方法優(yōu)于支持向量機(jī)。在所有對(duì)比實(shí)驗(yàn)中,VV 時(shí)序特征組合的精度最低,其中SVM 分類方法下總體精度僅為56.32%,而RF 分類總體精度僅增加6.11%,生產(chǎn)者精度與用戶者精度均小于60%。而VH 時(shí)序特征組合下兩種分類方法的水稻分類總體精度有明顯提升,接近VV+VH 組合分類精度,說(shuō)明VH 極化信息對(duì)于水稻種植信息的提取尤為重要。
表1 不同特征組合分類精度
總體來(lái)看,SVM 水稻種植信息提取精度均小于RF 結(jié)果,這與前人的研究成果較為相似,RF 在傳統(tǒng)的機(jī)器學(xué)習(xí)方法中適用性較高。雖然VV 極化特征在兩種分類方法實(shí)驗(yàn)中均取得較低的分類精度,但是在VV+VH 特征組合中,兩種分類器相較于VH 時(shí)序特征組合的精度均有一定的提升,其中水稻的生產(chǎn)者精度和用戶精度均提高0 ~2%,說(shuō)明VV 極化對(duì)水稻種植信息提取具有一定的貢獻(xiàn)。
從圖2 中可以看出,兩種分類器在VV+VH 時(shí)序特征下均獲得較好的水稻分類效果,整體上并無(wú)明顯差異。在空間細(xì)節(jié)放大圖中,兩種分類器結(jié)果也并無(wú)明顯差異,但卻在空間細(xì)節(jié)上存在一定的差異。從圖中可以看出,SVM 分類結(jié)果相較于RF 分類結(jié)果存在部分漏提現(xiàn)象,水稻提取結(jié)果中連通性較差,有明顯的碎斑現(xiàn)象。而RF 方法的提取結(jié)果整體表現(xiàn)較為完整,很少出現(xiàn)水稻碎斑現(xiàn)象,提取結(jié)果較為完整。
圖2 SVM 與RF 分類結(jié)果(左SVM,右RF)
從圖3 中可以看出,肥西縣水稻種植主要集中在高店鄉(xiāng)、官?gòu)d鎮(zhèn)、山南鎮(zhèn)、柿樹(shù)崗鄉(xiāng)、花崗鎮(zhèn)、豐樂(lè)鎮(zhèn),種植面積占比較多的為山南鎮(zhèn)、柿樹(shù)崗鄉(xiāng)和高店鄉(xiāng)。從整體來(lái)看,肥西縣水稻種植多集中在西南部,這主要是因?yàn)榉饰髦袞|部地區(qū)與合肥市相連,受城市化與工業(yè)化發(fā)展的影響,中東部耕地多為建設(shè)用地或用于種植經(jīng)濟(jì)作物的土地。
圖3 基于VV+VH 時(shí)序特征的RF 水稻提取結(jié)果
本文基于GEE 云計(jì)算平臺(tái),分析了肥西縣水稻SAR 后向散射時(shí)間序列特征,構(gòu)建不同極化組合特征,采用SVM和RF 兩種分類方法進(jìn)行水稻種植信息提取。結(jié)果表明,水稻VH 極化時(shí)序曲線在水稻移栽前后具有明顯波動(dòng),VV 極化后向散射波動(dòng)較小。僅采用VV 極化時(shí)序特征獲得的分類精度最低,僅采用VH 極化時(shí)序特征,兩種分類器的水稻分類精度獲得明顯提升。而基于VV+VH 極化時(shí)序特征下兩種分類器均獲得了非常高的整體準(zhǔn)確度。其中,RF(91.32%)水稻提取結(jié)果優(yōu)于SVM(89.98%)。
后續(xù)工作將充分考慮Sentinel-1 不同極化間的信息,構(gòu)建極化特征指數(shù),進(jìn)一步提升水稻種植信息提取精度。同時(shí)由于SAR 數(shù)據(jù)受噪聲影響,使得水稻提取結(jié)果存在大量碎斑現(xiàn)象,難以保證水稻提取結(jié)果的精度。因此,在以后的研究工作中,將引入高分辨率影像,實(shí)現(xiàn)地塊信息的提取,進(jìn)而創(chuàng)建基于地塊的水稻種植信息提取方法,進(jìn)一步提升水稻種植信息的提取精度。