李 想,張永彬,劉瑋佳,孫冉冉,尹 軒,楊 睿
(華北理工大學(xué) 礦業(yè)工程學(xué)院,河北 唐山 063210)
農(nóng)業(yè)是我國的第一產(chǎn)業(yè),在國民經(jīng)濟中發(fā)揮重要作用[1]。同時,糧食安全是國家穩(wěn)定的基礎(chǔ),保障糧食安全是推進農(nóng)業(yè)現(xiàn)代化的首要任務(wù)。冬小麥作為我國三大主要糧食作物之一,及時、精準(zhǔn)地獲取冬小麥種植面積及其空間分布,對于農(nóng)業(yè)相關(guān)部門進行長勢監(jiān)測和產(chǎn)量估算具有支撐作用,對促進農(nóng)業(yè)生產(chǎn)發(fā)展和糧食安全有重要的現(xiàn)實意義[2]。
冬小麥種植面積的獲取主要有統(tǒng)計數(shù)據(jù)和遙感監(jiān)測兩種方式。傳統(tǒng)的統(tǒng)計抽樣調(diào)查手段,不僅消耗人力和物力,而且不能全面及時地更新重要信息[3]。然而,隨著中高分辨率遙感技術(shù)的不斷發(fā)展與廣泛應(yīng)用,其在短時間內(nèi)能夠連續(xù)收集大范圍地面信息的優(yōu)勢,為利用多時相遙感快速、準(zhǔn)確提取冬小麥種植信息提供數(shù)據(jù)基礎(chǔ)[4]。目前,光學(xué)影像是作物分類研究中最常用的數(shù)據(jù)源,是由被動遙感的方式獲取,并且單時相光學(xué)影像分類,很容易受到“異物同譜”的影響,從而出現(xiàn)漏分和錯分等問題[5]。多時相光學(xué)影像結(jié)合作物不同物候期光譜差異,能夠降低“異物同譜”的干擾。石濤等利用Landsat-8 數(shù)據(jù)結(jié)合不同作物物候差異對皖北地區(qū)冬小麥進行提取,精度達到90%以上[6]。光學(xué)影像容易受到云雨天氣影響,構(gòu)建時序數(shù)據(jù)難度較大,在作物信息提取上受到一定限制。合成孔徑雷達不受云雨天氣的限制并且穿透性強,能夠全天候獲取影像數(shù)據(jù),屬于主動遙感,在作物提取研究中廣泛應(yīng)用[7]。單捷等選用5 期Radarsat-2 全極化影像對江蘇鹽城區(qū)冬小麥面積提取,精度達到79.6%[8]。耿云憬等利用關(guān)鍵物候期多時相Sentinel-1A 的后向散射系數(shù)精準(zhǔn)提取冬小麥種植面積,發(fā)現(xiàn)VV 極化的誤差為13.17%,VH 極化的誤差為8.51%[9]。主動遙感數(shù)據(jù)和被動遙感數(shù)據(jù)各有優(yōu)勢,融合主被動遙感數(shù)據(jù)結(jié)合多時相可以提高作物提取精度。張科謙等融合Sentinel-1A 和Sentinel-2 影像并結(jié)合多時相提取冬小麥空間分布,生產(chǎn)者精度為95.48%,相對于單一數(shù)據(jù)源,分類精度有不同程度提升[10]。
目前,遙感數(shù)據(jù)用于農(nóng)作物提取的方法主要有基于像元和面向?qū)ο髢煞N。基于像元方法在分類時容易出現(xiàn)椒鹽效應(yīng),而面向?qū)ο蠓椒▌t通過對不同波段分割后的影像對象進行分類,能夠有效減少噪點的影響,避免椒鹽現(xiàn)象的出現(xiàn)[11]。在眾多分類算法當(dāng)中,隨機森林分類算法因其魯棒性強、性能穩(wěn)定,是農(nóng)作物分類常用方法之一,在分析特征重要性和分類提取等方面具有明顯優(yōu)勢。陳果等基于多特征隨機森林算法法進行土地利用分類,總體精度達到91.96%,Kappa 系數(shù)為0.902,提取效率快、精度高[12]。趙士肄等提出結(jié)合光譜特征、遙感指數(shù)特征、紋理特征等信息,對比不同分類模型精度,發(fā)現(xiàn)面向?qū)ο?隨機森林算法的耕地信息提取精度最高,旱地精度達到99.6%[13]。因此,面向?qū)ο蠼Y(jié)合隨機森林算法能夠減弱“椒鹽”現(xiàn)象,并一定程度上提高提取精度。
本文針對Sentinel-2 光學(xué)影像和Sentinel-1A雷達影像的自身特點,結(jié)合時間序列諧波分析法選取關(guān)鍵物候期,融合多時相光學(xué)影像和雷達影像,采用面向?qū)ο?隨機森林算法對冬小麥作物進行提取,探索主被動遙感影像在大區(qū)域識別冬小麥作物的能力,為快速、精確提取冬小麥種植面積和空間分布提供技術(shù)支持。
唐山市位于河北省東部、 華北平原東北部,南臨渤海,北依燕山,毗鄰京津(圖1),地跨東經(jīng)117°31′~119°19′,北緯38°55′~40°28′,地勢北高南低,平均海拔90m,氣候?qū)倥瘻貛О霛駶櫞箨懶图撅L(fēng)型氣候,年平均氣溫12℃左右,年平均降水量500~700mm[14]。全市土地總面積為143.4 萬公頃,耕地面積為56.71 萬公頃。截至2021 年,糧食播種面積49.0 萬公頃,糧食產(chǎn)量293.8 萬噸。冬小麥?zhǔn)翘粕绞兄饕Z食作物之一,每年10 月初寒露前后進入播種期,11~12 月出苗分蘗后停長越冬,次年3 月返青,4 月拔節(jié)抽穗,5 月灌漿,6 月中旬到達成熟期,生育期230~260 天。
圖1 研究區(qū)地理位置
1.2.1 Sentinel 數(shù)據(jù)獲取與預(yù)處理
本文所用Sentinel 系列衛(wèi)星遙感影像免費從歐空局?jǐn)?shù)據(jù)共享網(wǎng)站獲取,Sentinel-1 搭載C 波段傳感器,具有全天候、 全天時對地觀測能力,由Sentine-1A 和Sentinel-1B 兩顆衛(wèi)星組成,對地重訪周期可達6d,本文選用Sentinel-1A 雷達干涉寬幅成像模式的Level 1 級別數(shù)據(jù),極化模式為VV和VH,空間分辨率為10m。
Sentinel-2 衛(wèi)星包括Sentinel-2A 和Sentinel-2B 兩顆,重訪周期為5d,其多光譜傳感器捕捉了13 個波段,覆蓋了可見光、 近紅外和短波紅外范圍。其中,藍、綠、紅和近紅外波段的空間分辨率為10m,而三個紅邊波段、近紅外波段以及兩個短波紅外波段的空間分辨率為20m。海岸/氣溶膠波段、水蒸氣波段和短波紅外波段的分辨率為60m。
選取2022 年10 月~2023 年6 月冬小麥全生育期內(nèi),覆蓋研究區(qū)且云量小于20%的Sentinel-2 L1C 級別數(shù)據(jù)產(chǎn)品,共計獲取36 景(4 景×9 期),該數(shù)據(jù)已經(jīng)過正射校正與幾何精校正,在此基礎(chǔ)上,本文選取經(jīng)Sen2Cor 大氣校正后的Band2 ~8、Band11 和Band12 進行冬小麥信息提取,并統(tǒng)一空間分辨率至10m。同樣,Sentienl-1A 數(shù)據(jù)產(chǎn)品,共計獲取18 景(2 景×9 期),該數(shù)據(jù)需進行熱噪聲去除、輻射校正和地形校正等預(yù)處理過程。最終根據(jù)研究區(qū)典型地物特征,篩選關(guān)鍵物候期影像進行冬小麥空間信息提取。
1.2.2 特征變量數(shù)據(jù)集構(gòu)建
根據(jù)研究區(qū)植被生長環(huán)境和地物物候特征,本文選用Sentinel-1A 影像的VV 和VH 兩種后向散射系數(shù),Sentinel-2 影像的光譜反射率以及植被指數(shù)特征、紋理特征和形狀特征,共同提取唐山市冬小麥種植面積。其中,光譜反射率包括所有波段反射率均值(Mean)以及紅邊、近紅外波段光譜反射率(Band5~8);植被指數(shù)特征包括:歸一化差值植被指數(shù)(NDVI)、增強型植被指數(shù)(EVI)、土壤調(diào)節(jié)植被指數(shù)(SAVI)、紅邊位置指數(shù)(REPI)。為避免多紋理特征帶來的特征信息冗余,本文選取灰度共生矩陣生成的同質(zhì)性(GLCM Homogeneity)、熵(GLCM Entropy)、對比度(GLCM Contrast)、相關(guān)性(GLCM Correlation)、均 值(GLCM Mean)、標(biāo) 準(zhǔn) 差(GLCM StdDev)和異質(zhì)性(GLCM Dissimilarity)7 個紋理特征,以及矩形擬合和形狀指數(shù)2 個形狀特征,以上所選特征變量及其說明如表1 所示。
表1 分類特征變量集
1.2.3 野外調(diào)查數(shù)據(jù)
本研究分別于2023 年4 月29 日與5 月31日,對唐山市主要冬小麥種植區(qū)開展野外調(diào)查,利用手持GPS 定位并記錄典型土地覆被類型,共獲取典型地物樣點643 個,其中包括428 個冬小麥樣點及115 個其他類型樣點。實地調(diào)查發(fā)現(xiàn)唐山市主要農(nóng)作物包括:冬小麥、夏玉米、水稻和花生等大田作物,此外,該區(qū)域還分布有蔬菜、綠化草坪、草本濕地與林地等主要植物類型。結(jié)合遙感影像地物特征與野外調(diào)查數(shù)據(jù),本研究將地物類型劃分為:冬小麥、水體、林地、建筑和其他植被。
1.3.1 植被物候曲線擬合
時間序列諧波分析法(HANTS)基于傅里葉變換(FFT)和最小二乘法為擬合核心算法,對Sentinel-1A 影像生成的VH 和VV 以及Sentinel-2 NDVI 數(shù)據(jù)集波段重構(gòu)并進行平滑和濾波處理,能夠充分利用遙感影像的時空特性,更能夠考慮到地物物候在不同時間段之間的差異。HANTS 算法不僅可以去除云污染點的干擾,而且對影像選取的時間間隔不受影響,具有更大的靈活性[15]。本文基于GEE 平臺采用HANTS 濾波算法構(gòu)建3 種特征時序曲線,以獲取冬小麥信息提取關(guān)鍵物候期。
1.3.2 面向?qū)ο?隨機森林方法
面向?qū)ο蠓诸悓⑦b感影像中的相鄰?fù)|(zhì)像元分割為影像對象,并以此為分類基本單元,可綜合利用影像對象的光譜、紋理、形狀與對象間的上下文關(guān)系等更多語義信息,從而實現(xiàn)較高層次的地物信息提取,能夠有效改善傳統(tǒng)基于像元分類結(jié)果中具有的“椒鹽”現(xiàn)象,顯著提升精細(xì)地物分類的效率與精度[16]。面向?qū)ο蠓诸惖闹饕^程包括影像分割與分類算法選擇。
多尺度分割通過一種自下而上的區(qū)域合并算法來實現(xiàn)影像對象分割,主要包括圖層權(quán)重、分割尺度、形狀因子與緊致度等關(guān)鍵參數(shù),其中,分割尺度直接決定影像對象的大小[17]。圖層權(quán)重決定不同波段在分割過程中參與信息的多少,取值介于0~10 之間,權(quán)重越大,對應(yīng)波段信息用于影像分割就越多。另外,對象的光譜差異和形狀差異共同決定對象的異質(zhì)性,二者權(quán)重之和為1,多尺度分割中通過形狀因子設(shè)置來確定二者的權(quán)重;形狀因子則由光滑度和緊密度來衡量,二者權(quán)重之和亦為1[18]。
隨機森林(Random forest,RF)是目前機器學(xué)習(xí)中常用的一種分類算法,由多棵CART 決策樹組合而成,屬于監(jiān)督分類機器學(xué)習(xí)算法,具有精度高、參數(shù)少、性能穩(wěn)定等諸多優(yōu)勢。采用Bootstrap 抽樣從初始數(shù)據(jù)集中提取k 個樣本,每個樣本與原始數(shù)據(jù)集大小相同。然后,使用這些樣本構(gòu)建k 個決策樹模型,產(chǎn)生k 個分類結(jié)果。最終,通過對每個記錄進行綜合表決,得出最終的分類結(jié)果。雖然隨機森林分類器計算速度比其他單棵決策樹慢,但對于處理高維特征數(shù)據(jù),不容易產(chǎn)生過擬合現(xiàn)象,可以生成更準(zhǔn)確的分類結(jié)果[19]。
本研究基于eCognition 軟件進行冬小麥信息提取,采用多尺度分割算法獲取影像對象層,經(jīng)多次試驗將分割尺度、形狀因子和緊致度的大小分別設(shè)置為50、0.1 和0.5。將不同時相Sentinel-2 影像的近紅外波段權(quán)重設(shè)置為2,其余波段均為1。在影像對象層上分別選取冬小麥、水體、建筑、林地與其他植被(包括夏玉米、水稻、花生、蔬菜、綠化草坪和草本濕地等)典型對象作為訓(xùn)練樣本,計算1.2.2 中涉及的特征變量輸入到隨機森林分類模型中,為減少時間成本,樹木數(shù)量(ntree)設(shè)置為50,其他參數(shù)均為默認(rèn),對比不同特征變量集的分類精度。
為探求主被動遙感提取冬小麥的能力,設(shè)計兩種分類方案:一為單獨使用多時相Sentinel-2 被動遙感影像進行冬小麥提??; 二為融合多時相Sentinel-1A 和Sentinel-2 主被動遙感影像進行冬小麥信息提取。
1.3.3 精度評價
通過野外實地調(diào)查數(shù)據(jù)與分類結(jié)果計算混淆矩陣。采用總體精度(Overall accuracy,OA)、Kappa系數(shù)、用戶精度(User’s Accuracy,UA)和生產(chǎn)者精度(Producer’s Accuracy,PA)對分類結(jié)果進行綜合性評價[20]。計算公式如下:
式中N 代表總樣本數(shù),m 為總類別數(shù);pii為被分到正確類別的樣本數(shù);p+i和pi+分別是第i 類的真實樣本數(shù)和預(yù)測為第i 類的樣本數(shù)。
光學(xué)數(shù)據(jù)揭示了目標(biāo)地物的瞬時物理光譜特征,通過時序和動態(tài)的NDVI 波動,可以呈現(xiàn)植被在不同生長階段的物候特征變化。具有穿透能力的SAR 傳感器具備獲取植被表面后向散射信息的能力,而且不受天氣因素的制約。通過區(qū)分冬小麥與其他地物在不同物候期的光譜特征差異以及時序后向散射信息差異,進一步提取冬小麥。圖2 為各類地物的NDVI、VH 和VV 經(jīng)過HANTS 濾波后的物候曲線。從圖2(a)NDVI 時序曲線看出,在11~12月 和 次 年5~6 月,NDVI 數(shù) 值 較 高,2~3 月 期 間NDVI 數(shù)值較低,具有“兩峰一谷”的特性。冬小麥在越冬前期,植株經(jīng)過一段時間生長,使其NDVI 數(shù)值逐漸提高; 進入越冬期后,NDVI 數(shù)值逐漸降低;返青期到灌漿期之間,隨著植株葉綠素含量增加,NDVI 數(shù)值逐漸上升; 成熟期后冬小麥葉片含水率和葉綠素含量的下降將導(dǎo)致其NDVI 數(shù)值降低。11月中旬到次年2 月,冬小麥與其他地物之間呈現(xiàn)明顯的差異。而在4~5 月份,冬小麥正處于生長旺盛階段,其他植被尚未進入生長旺期,因此冬小麥與其他地物之間的可分性較為顯著。從圖2(b)和(c)的VH 和VV 物候曲線看出,冬小麥整個生長期的VH 和VV 后向散射系數(shù)數(shù)值均小于林地、 建筑以及其他植被,并且在11~12 月之間差異較大。隨著小麥的生長,葉片密度增加,土壤的散射作用減弱,導(dǎo)致VH 和VV 后向散射系數(shù)呈現(xiàn)先下降后上升的趨勢。綜上所述,本文最終選取Sentinel-2 影像時間為2022 年11 月30 日和2023 年04 月29 日,云量小于20%,Sentinel-1A 影像時間為2022 年12月15 日和2023 年05 月08 日,融合主被動遙感影像對冬小麥種植面積提取。
圖2 各類地物物候曲線
基于被動遙感影像分類精度評價如表2 所示,使用Sentinel-2 影像的總體精度為91.76%,Kappa系數(shù)為0.843,冬小麥的用戶精度為95.13%,生產(chǎn)者精度為95.79%。融合Sentinel-1A 影像和Sentinel-2 影像的分類結(jié)果如表3 所示,分類的總體精度為94.40%,Kappa 系數(shù)為0.894,冬小麥的用戶精度和生產(chǎn)者精度分別為96.74%和96.96%。相較于Sentinel-2 影像,總體精度提高2.64 個百分點,Kappa 系數(shù)提高了0.051,冬小麥用戶精度和生產(chǎn)者精度分別提高1.61、1.17 個百分點。因此,融合主被動遙感影像有助于提高冬小麥的提取精度。
表2 基于被動遙感影像分類精度評價
融合主被動遙感影像提取的唐山市冬小麥空間分布圖如圖3(a)所示,A、B、C 為小區(qū)域細(xì)節(jié)展示圖。唐山市冬小麥主要種植區(qū)在玉田縣、豐潤區(qū)、豐南區(qū)、灤南縣和樂亭縣,其他地區(qū)少量分布。北部地區(qū)和南部地區(qū),由于靠近山區(qū)和沿海,不適宜冬小麥生長,因此,冬小麥分布區(qū)主要在西北至東南一帶的平原地區(qū)。從圖3(c)和(d)中可以看出,融合主被動遙感提取的冬小麥效果良好,減少了零碎林地和水體周邊植被的干擾,道路、水體以及建筑提取完整。雷達影像在一定程度上反映了作物及其環(huán)境信息,能夠有效反應(yīng)植被結(jié)構(gòu)和生長狀況,并且彌補了光學(xué)影像在分類方面的缺陷。
圖3 唐山市冬小麥空間分布圖和不同數(shù)據(jù)源提取結(jié)果對比(a) 融合主被動遙感影像的唐山市冬小麥空間分布圖;(b)方形區(qū)域假彩色影像;(c)方形區(qū)域融合主被動遙感影像提取結(jié)果;(d)方形區(qū)域基于被動遙感影像提取結(jié)果
基于被動遙感的前15 個隨機森林特征變量重要性排序如圖4(a)所示,Nov_NDVI 和Nov_EVI 對模型的貢獻度最高,重要性超過0.10,其次為Nov_SAVI,對模型貢獻度為0.087; 前15 個特征中,植被指數(shù)特征有8 個,光譜特征有7 個,紋理特征和形狀特征未進入前15 名; 融合主被動遙感的前15 個隨機森林特征變量重要性排序如圖4(b)所 示,Nov_NDVI、Dec_VH 和Apr_SAVI 的 對 模 型的貢獻度最高,重要性最高達到0.102,其次為Nov_EVI,對模型貢獻度為0.096;前15 個特征中,雷達特征有3 個,植被指數(shù)特征有7 個,光譜特征有5 個,紋理特征和形狀特征排名未進入前15 名;5 種特征排序: 植被指數(shù)特征>雷達特征>光譜特征>紋理特征>形狀特征;植被指數(shù)特征和雷達特征顯著高于其他特征,因為11~12 月冬小麥與其他地物在光譜特征和后向散射系數(shù)存在顯著差異,更利于冬小麥的識別。
圖4 前15 個隨機森林特征變量重要性排序
本文應(yīng)用Sentinel 系列衛(wèi)星主被動遙感數(shù)據(jù),結(jié)合面向?qū)ο?隨機森林算法,根據(jù)總體分類精度和Kappa 系數(shù),對比分析融合多時相數(shù)據(jù)與單個數(shù)據(jù)的分類精度,選取最優(yōu)分類方案對唐山市冬小麥種植面積進行提取,并分析其特征重要性,得到結(jié)論如下:
(1)唐山市冬小麥提取的關(guān)鍵時期為11 月份至次年2 月份、4~5 月份,該時期冬小麥的光譜特征和雷達特征明顯,與其他地物差異顯著,可分離性高,降低混分現(xiàn)象。
(2)融合多時相Sentinel 衛(wèi)星主被動遙感數(shù)據(jù),充分整合光譜和結(jié)構(gòu)信息,在冬小麥提取中,用戶精度和生產(chǎn)者精度均優(yōu)于使用單一光學(xué)數(shù)據(jù),分別提高1.61、1.17 個百分點; 融合多時相主被動遙感影像的分類總體精度和Kappa 系數(shù)最高,分別為94.40%和0.894。唐山市冬小麥分布區(qū)主要在西北至東南一帶的平原地區(qū)。
(3)融合主被動遙感數(shù)據(jù)的變量特征重要性排序中,植被指數(shù)特征、雷達特征、光譜特征在冬小麥信息提取中貢獻度較大。