王振興 劉東 王敏
摘要:快速準(zhǔn)確地掌握作物種植類型和布局,對(duì)農(nóng)業(yè)生產(chǎn)和管理具有重要意義。選取西遼河流域?yàn)檠芯繀^(qū),基于Google Earth Engine(GEE)云平臺(tái),以Landsat和MODIS影像作為數(shù)據(jù)源,構(gòu)建時(shí)序NDVI、物候參數(shù)、光譜指數(shù)、反射率及地形因子等多維特征。分別采用隨機(jī)森林、支持向量機(jī)、分類回歸樹等方法,對(duì)比不同特征和分類器組合,選擇優(yōu)選特征和隨機(jī)森林分類器,完成西遼河流域玉米、大豆和水稻的提取。結(jié)果表明,基于GEE平臺(tái)可快速構(gòu)建作物識(shí)別的多維特征,進(jìn)一步利用遞歸消除隨機(jī)森林優(yōu)選特征,當(dāng)加入重要性前30位特征參數(shù)時(shí),總體精度可基本達(dá)到最高。選擇優(yōu)選特征組合并基于隨機(jī)森林模型進(jìn)行訓(xùn)練分類,可以實(shí)現(xiàn)高效率、高精度的作物空間分布制圖。在驗(yàn)證指標(biāo)中總體精度、κ系數(shù)、統(tǒng)計(jì)R2等驗(yàn)證指標(biāo)均大于0.9,說明作物識(shí)別精度較高。西遼河流域農(nóng)作物主要沿河流兩側(cè)呈條帶狀分布,玉米是最主要的農(nóng)作物類型,大豆、水稻種植面積較少。
關(guān)鍵詞:西遼河流域;GEE云平臺(tái);多維特征;作物識(shí)別;種植結(jié)構(gòu)
中圖分類號(hào):S127文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1002-1302(2023)21-0200-09
我國是人口大國,糧食生產(chǎn)一直是黨和國家工作的重中之重。準(zhǔn)確及時(shí)地獲取作物種植結(jié)構(gòu)信息,可以為政府部門提供基礎(chǔ)決策信息,提高農(nóng)業(yè)生產(chǎn)的科學(xué)管理水平,對(duì)糧食安全和經(jīng)濟(jì)發(fā)展具有重要意義[1-2]。農(nóng)作物的種植結(jié)構(gòu)是指區(qū)域內(nèi)農(nóng)作物的種類、面積和分布特征[3]。遙感因具有觀測(cè)范圍廣、時(shí)效高和成本低的優(yōu)點(diǎn),在農(nóng)業(yè)應(yīng)用中發(fā)揮了重要作用,成為獲取作物空間分布信息的重要手段[4]。農(nóng)作物識(shí)別主要依據(jù)作物間光譜、時(shí)相、紋理等多種特征的差異,按照一定規(guī)則進(jìn)行提取。原先的土地分類僅用少量的波譜特征,在作物識(shí)別中難以區(qū)分光譜相似度較高的不同作物,而通過構(gòu)建高維特征,如光譜指數(shù)、時(shí)間序列、后向散射、地形以及紋理等,能夠體現(xiàn)出作物全方位、多元化的特征差異,可以有效提高作物的識(shí)別能力[5-7]。牛乾坤等采用Sentinel-2影像,通過構(gòu)建光譜特征、紋理特征和植被特征提取河套灌區(qū)作物的種植結(jié)構(gòu)[8]。楊澤航等將Sentinel-2影像與MOD09GQ影像進(jìn)行時(shí)空融合,得到時(shí)間序列NDVI數(shù)據(jù),可以增加作物生長(zhǎng)信息并實(shí)現(xiàn)對(duì)黑河流域作物的早期識(shí)別[9]。在樣本有限的條件下,特征超過一定數(shù)量會(huì)影響模型性能和處理效率,降低分類精度。因此,需要選擇適當(dāng)數(shù)量和作用明顯的特征。朱夢(mèng)豪等通過改進(jìn)JM距離,確定作物識(shí)別的最優(yōu)特征組合,并獲得高精度的作物分類結(jié)果[10]。劉戈等使用Relief F算法在原始特征中選擇出24個(gè)最優(yōu)特征,并利用卷積神經(jīng)網(wǎng)絡(luò)方法完成分類,提高了運(yùn)算效率[11]。因此,合理構(gòu)建作物分類的多維特征并進(jìn)行適當(dāng)選擇是實(shí)現(xiàn)作物高精度制圖的重要工作。分類算法也是影響分類精度的關(guān)鍵因素,常用的隨機(jī)森林、支持向量機(jī)等機(jī)器學(xué)習(xí)方法在多年實(shí)踐中得到廣泛應(yīng)用并取得良好效果,近年來以卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)以及全卷積網(wǎng)絡(luò)為代表的深度學(xué)習(xí)算法進(jìn)一步提高了作物識(shí)別的準(zhǔn)確率,但深度學(xué)習(xí)模型訓(xùn)練需要足夠數(shù)量的樣本,在樣本有限時(shí)難以適用[12-13]。與傳統(tǒng)遙感影像處理平臺(tái)相比,Google Earth Engine(GEE)等云計(jì)算平臺(tái)可以快速完成數(shù)據(jù)獲取、預(yù)處理以及分類等任務(wù),極大地提高了工作效率,成為大面積農(nóng)作物制圖的重要工具[14-15]。因此,利用GEE云平臺(tái)的豐富資源和強(qiáng)大算力,構(gòu)建并優(yōu)化多維特征,選擇合適的作物制圖方法是目前農(nóng)作物識(shí)別的重要工作。西遼河流域是我國重要的玉米商品糧種植基地,近年來不合理的生產(chǎn)活動(dòng)導(dǎo)致流域生態(tài)環(huán)境惡化,同時(shí)受不同政策(生態(tài)修復(fù)工程、鐮刀彎政策等)影響,農(nóng)作物種植結(jié)構(gòu)發(fā)生較大改變。本研究基于GEE云平臺(tái),以Landsat影像為基礎(chǔ)數(shù)據(jù)源,建立作物分類的多維特征,探索適合該區(qū)域的作物制圖方案,以期為推動(dòng)未來種植業(yè)結(jié)構(gòu)調(diào)整和綠色農(nóng)業(yè)可持續(xù)發(fā)展提供數(shù)據(jù)支持。
1 研究區(qū)與數(shù)據(jù)源
1.1 研究區(qū)簡(jiǎn)介
西遼河流域(116°36′~124°34′E,41°05′~45°12′N)位于我國北方農(nóng)牧交錯(cuò)帶東部三北交界處,連接華北平原、東北平原和蒙古高原,流經(jīng)內(nèi)蒙古自治區(qū)、吉林省、河北省和遼寧省4個(gè)?。▍^(qū)),主要涉及的地級(jí)市包括內(nèi)蒙古自治區(qū)赤峰市、通遼市等,流域面積約13.6萬km2(圖1)。西遼河流域?qū)儆谂瘻貛О霛駶櫄夂蛳蛑袦貛О敫珊禋夂虻倪^渡區(qū)域,年均氣溫5~6 ℃,年均降水量300~400 mm、蒸發(fā)量1 200~2 200 mm。主要河流包括西遼河干流、教來河、老哈河、西拉木倫河、烏力吉木倫河和新開河。西、南、北三面環(huán)山,整體呈扇狀,地勢(shì)表現(xiàn)為西南高東北低。流域內(nèi)主要糧食作物有玉米、大豆、水稻等,1年1熟。
1.2 數(shù)據(jù)來源及處理
研究數(shù)據(jù)包括Landsat 8 OLI影像、MOD09Q1影像、DEM數(shù)據(jù)、統(tǒng)計(jì)年鑒數(shù)據(jù)及實(shí)地采樣數(shù)據(jù)。
Landsat 8 OLI影像由GEE平臺(tái)獲取,該數(shù)據(jù)集已經(jīng)過大氣校正和正射校正處理。Landsat 8 OLI是美國Landsat系列第8顆衛(wèi)星上的傳感器,包括9個(gè)波段,除全色波段外空間分辨率為30 m,運(yùn)行重訪周期為16 d。Landsat影像因具有較高空間分辨率和長(zhǎng)時(shí)間運(yùn)行周期被廣泛使用,也是本研究的主要數(shù)據(jù)源。衛(wèi)星運(yùn)行中會(huì)受到云、雨等天氣狀況的影響,造成可用像元數(shù)量的減少[16]。因此,本研究分析研究區(qū)內(nèi)Landsat影像的覆蓋分布與去云后的像元數(shù)量(圖2)。以 2017 年作物生長(zhǎng)季3—11 月為例,西遼河流域完整覆蓋共需 22 幅不同編號(hào)的 Landsat 影像,其間共有 342幅影像記錄數(shù)據(jù)。剔除云等因素干擾的像元后,在影像互有重疊的情況下,不同像元位置處最高有33次重訪,最低僅有1次重訪。進(jìn)一步統(tǒng)計(jì)發(fā)現(xiàn),未去云前,2.39%像元位置重訪次數(shù)為0~15;去云后,42.9%像元位置的重訪次數(shù)為0~15,充分表明云、雨等天氣可以降低Landsat影像的有效可用數(shù)量[17]。
MOD09Q1影像由GEE平臺(tái)獲取,包含250 m空間分辨率8 d合成的紅外波段和近紅外波段,還包括1個(gè)質(zhì)量控制波段。SRTM DEM由GEE平臺(tái)獲取,具有30 m空間分辨率。統(tǒng)計(jì)數(shù)據(jù)來源于《內(nèi)蒙古調(diào)查年鑒》《吉林統(tǒng)計(jì)年鑒》《遼寧統(tǒng)計(jì)年鑒》《河北統(tǒng)計(jì)年鑒》《河北農(nóng)村統(tǒng)計(jì)年鑒》,用來統(tǒng)計(jì)并驗(yàn)證西遼河流域各縣(旗、區(qū))玉米、大豆和水稻的種植面積。
作物采樣數(shù)據(jù)是2017年于西遼河流域?qū)嵉孬@取,包括作物類型和位置信息,用于農(nóng)作物分類的訓(xùn)練和驗(yàn)證。原始樣本由實(shí)地考察獲取,受各種條件限制,采集數(shù)量較少,難以滿足分類要求。通過計(jì)算已有樣本的歸一化植被指數(shù)(NDVI)和反射率序列特征的均值(見“2.1.1”節(jié)和“2.1.3”節(jié)),在耕地范圍內(nèi)計(jì)算與均值的光譜角距離,設(shè)定閾值為均值+1倍標(biāo)準(zhǔn)差,在閾值范圍內(nèi)選擇距離最接近的樣本,并利用高分辨率影像對(duì)比,刪去錯(cuò)誤明顯的樣本點(diǎn)后,擴(kuò)充原始樣本數(shù)量(表1)。將樣本按照7 ∶3隨機(jī)劃分為訓(xùn)練集和測(cè)試集。
2 研究方法
首先,在GEE平臺(tái)獲取研究所需的數(shù)據(jù)并進(jìn)行相關(guān)預(yù)處理;其次,構(gòu)建時(shí)間序列NDVI、物候參數(shù)、反射率、光譜指數(shù)、地形等多個(gè)特征。利用遞歸消除隨機(jī)森林進(jìn)行特征選擇,進(jìn)一步設(shè)計(jì)6組對(duì)照特征方案,分別基于隨機(jī)森林、支持向量機(jī)、分類回歸樹對(duì)比分析總體精度,選擇最適分類方案。作物分類中,提取耕地分布作為掩膜圖像,在上述方案的基礎(chǔ)上完成西遼河流域主要糧食作物識(shí)別;最后,利用驗(yàn)證樣本、統(tǒng)計(jì)數(shù)據(jù)評(píng)價(jià)分類精度(圖3)。
2.1 特征集構(gòu)建
本研究構(gòu)建包括時(shí)序NDVI、物候參數(shù)、光譜指數(shù)、反射率、地形特征等139 個(gè)作物分類特征(表2)。
2.1.1 時(shí)間序列 NDVI 特征
本研究通過GF-SG(Gap Filling and Savitzky-Golay)算法重構(gòu)得到3—11月8 d、30 m分辨率的Landsat NDVI圖像,共34期。GF-SG算法是利用Landsat和MOD09Q1 影像的高時(shí)空分辨率影像重建算法,有3個(gè)主要優(yōu)點(diǎn):第一,可有效提高 Landsat NDVI時(shí)間序列長(zhǎng)期連續(xù)缺失情況下的重建精度。第二,通過加權(quán)SG濾波器可減少云檢測(cè)誤差引起的殘余噪聲影響。第三,方法簡(jiǎn)單易運(yùn)算,沒有復(fù)雜的非線性參數(shù)優(yōu)化過程,可在GEE平臺(tái)實(shí)現(xiàn)[18]。算法的具體過程參照文獻(xiàn)[18]。利用GF-SG算法重構(gòu)后的NDVI序列平滑連貫,可以有效彌補(bǔ)去云后Landsat NDVI的長(zhǎng)時(shí)間缺失(圖4)。
2.1.2 物候參數(shù)特征
利用GF-SG生成的時(shí)序NDVI計(jì)算植被物候參數(shù),包括生長(zhǎng)季開始時(shí)間、生長(zhǎng)季結(jié)束時(shí)間、生長(zhǎng)季持續(xù)時(shí)間、NDVI 最大值、NDVI最小值、NDVI幅度和NDVI最大值日期(圖5)。NDVI最小值計(jì)算采用NDVI 時(shí)間序列前4個(gè)時(shí)間點(diǎn)(3月)和最后4個(gè)時(shí)間點(diǎn)(11月)的均值,這樣可有效減少異常值干擾。NDVI最大值即為NDVI時(shí)間序列中的最大值。NDVI幅度即為最大值與最小值的差值。生長(zhǎng)季開始時(shí)間是從 NDVI最小值增長(zhǎng)到振幅的10%處所對(duì)應(yīng)的時(shí)間日期。生長(zhǎng)季結(jié)束時(shí)間是NDVI曲線下降距離最低點(diǎn)振幅10%處所對(duì)應(yīng)的時(shí)間日期[19]。生長(zhǎng)季持續(xù)時(shí)間是生長(zhǎng)季開始時(shí)間和生長(zhǎng)季結(jié)束時(shí)間的差值[20]。物候參數(shù)位置見圖5。
2.1.3 反射率、光譜指數(shù)以及地形特征
分別計(jì)算3—11月OLI影像的 2~7波段和NDVI、EVI、LSWI、MNDWI、NDTI、NDSVI等植被指數(shù)的百分?jǐn)?shù)(5%、25%、50%、75%、95%)、均值、差值(5%~95%)以及標(biāo)準(zhǔn)差影像,作為反射率和光譜指數(shù)特征,百分?jǐn)?shù)、均值和標(biāo)準(zhǔn)差影像分別通過GEE中函數(shù)ee.Reduce.percentile()、ee.Reduce.mean()和ee.Reduce.stdDev()計(jì)算而來。植被指數(shù)具體名稱及計(jì)算公式見表3。此外,選擇 DEM 數(shù)據(jù)的高程和坡度信息作為地形特征。
2.2 耕地識(shí)別
對(duì)西遼河流域進(jìn)行土地利用分類,識(shí)別出耕地分布作為作物分類的掩膜圖像。分類樣本在Google Earth Engine平臺(tái)按照均勻、隨機(jī)的原則每類目視選取400~600個(gè)樣本點(diǎn)。分類源數(shù)據(jù)是4—10月Landsat 8 OLI影像,分類特征包括2~7波段和NDVI、EVI、LSWI、MNDWI、NDTI、NDBI等光譜指數(shù)的時(shí)間序列百分?jǐn)?shù)(5%、25%、50%、75%、95%)影像。利用隨機(jī)森林分類器進(jìn)行樣本訓(xùn)練,通過精度評(píng)價(jià),重復(fù)改進(jìn)樣本直至滿足要求,最終得到耕地分布圖。
2.3 特征選擇
采用遞歸消除隨機(jī)森林方法(RF-RFE)選擇適當(dāng)數(shù)量和作用明顯的分類特征。該方法將隨機(jī)森林和遞歸消除算法(recursive feature eliminate,RFE)結(jié)合使用。先利用隨機(jī)森林計(jì)算特征重要性并進(jìn)行排序,再把所有特征作為初始特征集,依次去除重要性最低的特征加入模型中訓(xùn)練,通過迭代計(jì)算出模型精度,最終在特征數(shù)量和模型精度間選擇數(shù)量較少和精度較高的特征數(shù)據(jù)集。本研究鑒于原始特征數(shù)量較多,故每次去除特征數(shù)量設(shè)為5個(gè)。
2.4 分類算法
隨機(jī)森林(random forest,RF)分類器是由多個(gè)決策樹模型組合形成的集成學(xué)習(xí)分類器,可以有效地避免模型過擬合,使其具有良好的魯棒性;同時(shí)可以處理高維特征數(shù)據(jù),并提供比傳統(tǒng)分類器更快、更可靠的分類結(jié)果,而無需顯著增加計(jì)算工作量[21-22]。
支持向量機(jī)(support vector machine,SVM)是一類基于統(tǒng)計(jì)學(xué)習(xí)的機(jī)器學(xué)習(xí)算法[23]。SVM通過將特征向量映射到高維特征空間,尋找不同類別區(qū)別度最高的超平面實(shí)現(xiàn)分類,具有較高的泛化能力,適用于樣本數(shù)量較少的情景。
分類回歸樹(classification and regression tree,CART)既可用于分類,也可用于回歸。CART分類包括二叉樹生成和“剪枝”,使用基尼系數(shù)進(jìn)行特征選擇和閾值劃分。該方法計(jì)算簡(jiǎn)單快捷,對(duì)異常值不敏感。
RF分類器設(shè)置參數(shù)樹的數(shù)量為30,其余參數(shù)選擇默認(rèn)。SVM分類器核函數(shù)類型為RBF,核函數(shù)γ值為0.5,cost參數(shù)為10。CART分類器參數(shù)默認(rèn)。
2.5 試驗(yàn)方案
為驗(yàn)證不同特征組合在不同分類算法下的精度,本研究設(shè)置6組特征組合(表4),分別是反射率、光譜指數(shù)、反射率+光譜指數(shù)、反射率+光譜指數(shù)+時(shí)序NDVI、所有特征和優(yōu)選特征。上述特征組合分別基于隨機(jī)森林、支持向量機(jī)和分類回歸樹訓(xùn)練分類,得到總體精度,對(duì)比分析篩選出最適分類方案。
2.6 精度驗(yàn)證
通過混淆矩陣和統(tǒng)計(jì)數(shù)據(jù)2種方式對(duì)提取作物的結(jié)果進(jìn)行精度驗(yàn)證?;煜仃噭e稱誤差矩陣,將分類結(jié)果與參考類別相比較得到分類結(jié)果的精度,是衡量遙感影像分類精度的常用方法。利用混淆矩陣計(jì)算制圖精度、用戶精度、總體精度和κ系數(shù)。
統(tǒng)計(jì)數(shù)據(jù)通過對(duì)比統(tǒng)計(jì)年鑒中的種植面積進(jìn)行驗(yàn)證,包括流域尺度和縣(旗、區(qū))尺度。流域尺度是通過整理流域內(nèi)各作物整體種植面積進(jìn)行比較,其中部分行政區(qū)在流域內(nèi)的縣(旗、區(qū)),通過行政區(qū)面積所占比例折算作物種植面積。縣(旗、區(qū))尺度是將流域內(nèi)具有完整行政單元縣(旗、區(qū))的統(tǒng)計(jì)數(shù)據(jù)與解譯數(shù)據(jù)進(jìn)行直線擬合,得到統(tǒng)計(jì)R2作為驗(yàn)證指標(biāo)。
3 結(jié)果與分析
3.1 特征重要性及優(yōu)選結(jié)果分析
按平均重要性排名,各類特征依次是地形、反射率波段、時(shí)序NDVI、光譜指數(shù)和物候參數(shù)。按平均排名,順序類似。地形特征中高程特征重要性突出,坡度信息排名靠后。反射率波段特征整體重要性高于其他特征,時(shí)序NDVI和光譜指數(shù)重要性其次(表5)。由時(shí)序NDVI計(jì)算而來的物候參數(shù)特征整體重要性偏低。
將特征按重要性排名依次遞減5個(gè)投入隨機(jī)森林模型中,觀察到特征數(shù)量由5到10時(shí),總體精度較大幅度增加,由10到20時(shí)平緩增加,特征數(shù)量達(dá)到20后,總體精度隨著特征數(shù)量增加在94%附近波動(dòng)變化,在特征數(shù)量為30時(shí),總體精度達(dá)到局部最大值94.51%。雖然在特征數(shù)量80和120位置處,總體精度仍存在局部最大值,但此時(shí)特征數(shù)量較多且與特征數(shù)量30時(shí)總體精度相差不大,考慮到特征數(shù)量增加導(dǎo)致的計(jì)算效率下降等問題,把特征重要性前30位的特征作為優(yōu)選特征方案(圖6)。進(jìn)一步統(tǒng)計(jì)優(yōu)選特征中各類別數(shù)量,反射率波段特征依然最多,其次是光譜指數(shù)和時(shí)序NDVI,物候參數(shù)和地形特征僅有1個(gè)。
3.2 不同方案對(duì)比分析
本研究利用6種特征組合分別在3種分類器下訓(xùn)練分類,得到總體精度并進(jìn)行比較分析(圖7)?;陔S機(jī)森林分類器中,僅利用反射率或光譜指數(shù)的總體精度分別為90.57%、90.35%;當(dāng)兩者都加入模型后,精度增加至91.89%;再加入時(shí)序NDVI,精度再次增加至94.74%;當(dāng)加入所有特征時(shí),精度下降,為93.64%;利用優(yōu)選特征時(shí),精度為94.52%,稍低于方案四的0.22%。該結(jié)果表明,不同類型特征的加入能提高作物識(shí)別總體精度,但重要性較弱的特征加入后反而會(huì)降低精度?;诜诸惢貧w樹分類器中,僅加入所有特征時(shí),精度超90%;優(yōu)選特征組合的精度緊隨其后,為89.47%。基于支持向量機(jī)分類器中,方案一至方案四精度逐漸增加至94.96%,但加入所有特征時(shí),精度驟降至42.98%;優(yōu)選特征方案也只有72.15%。這是因?yàn)橹С窒蛄繖C(jī)需要輸入特征的數(shù)據(jù)量度范圍統(tǒng)一,物候參數(shù)和地形特征的加入破壞了方案四中特征的一致性。綜合來看,隨機(jī)森林模型在處理多類型、多維度特征時(shí),無需進(jìn)行數(shù)據(jù)的歸一化操作,精度便可高于另外2個(gè)分類器;優(yōu)選特征組合在特征數(shù)量較少的前提下,模型也基本可以達(dá)到較高的分類精度。因此,選擇優(yōu)選特征組合并基于隨機(jī)森林模型進(jìn)行訓(xùn)練分類,既可以降低運(yùn)算復(fù)雜度,又可以保證較高分類精度。
3.3 提取作物精度及布局分析
耕地制圖的精度是作物識(shí)別準(zhǔn)確性的前提,對(duì)其分類結(jié)果進(jìn)行驗(yàn)證。耕地制圖精度為95.2%,用戶精度為89.7%,分類結(jié)果可以滿足農(nóng)作物制圖的使用要求。本研究分別基于樣本數(shù)據(jù)和統(tǒng)計(jì)數(shù)據(jù)驗(yàn)證作物提取的準(zhǔn)確性(表6)。2017年作物分類的總體精度為0.94,κ系數(shù)為0.92,均大于0.9,各作物的制圖精度和用戶精度也均大于0.9,說明從驗(yàn)證樣本的角度考慮,模型分類精度較高。其中水稻的制圖精度和用戶精度均等于1,間接表明擴(kuò)充樣本由于依賴于實(shí)際采集的少量數(shù)據(jù),雖然樣本數(shù)量在分類過程中滿足了要求,但是樣本的代表性、多樣性有所下降,導(dǎo)致模型存在一定程度的過擬合。進(jìn)一步從統(tǒng)計(jì)數(shù)據(jù)的角度分析作物分類精度。全域來看,3類作物的面積誤差絕對(duì)值在10%以內(nèi),玉米的提取面積和統(tǒng)計(jì)數(shù)據(jù)基本一致,大豆提取面積高于統(tǒng)計(jì)面積8 km2左右,水稻提取面積低于統(tǒng)計(jì)面積38 km2左右。本研究用西遼河流域內(nèi)行政區(qū)單元完整的11個(gè)縣(旗、區(qū))的解譯面積和統(tǒng)計(jì)面積擬合直線得到R2,3類作物R2均大于0.9,表明識(shí)別作物整體布局與統(tǒng)計(jì)結(jié)果基本吻合?;诮y(tǒng)計(jì)數(shù)據(jù)的擬合方程中,玉米斜率為1.22,大豆斜率為1.15,水稻為1.08,3類作物擬合斜率均大于1,表明在部分驗(yàn)證縣(旗、區(qū))解譯面積有高估趨勢(shì)。綜合來看,雖然部分縣(旗、區(qū))解譯面積與統(tǒng)計(jì)面積有所出入,但分類結(jié)果的作物整體布局和面積基本準(zhǔn)確,基于優(yōu)選特征的隨機(jī)森林分類方案可以得到高精度的作物分布。
本研究得到2017年西遼河流域玉米、大豆以及水稻的空間分布(圖8)。西遼河流域主要糧食作物分布在海拔較低的東、北部平原地區(qū),沿河流兩側(cè)呈條帶狀分布。西遼河干流和新開河流域一帶的縣(旗、區(qū))種植分布最密集;老哈河、教來河、西拉木倫河及烏爾吉木倫河種植面積相對(duì)較少。玉米是西遼河流域最主要的作物類型,在整個(gè)流域內(nèi)均有種植,分布范圍廣,面積約17 193.45 km2,在流域東部、南部地區(qū)最集中。流域內(nèi)科爾沁左翼中旗、科爾沁區(qū)和開魯縣是種植面積最多的縣(旗、區(qū)),面積分別為2 199.62、1 941.87、1 726.66 km2;元寶山區(qū)和紅山區(qū)種植面積較少,僅分別為193.54、43.20 km2。大豆整體種植面積較少,約為 348.42 km2,種植集中分布在流域東北部的長(zhǎng)嶺縣、雙遼市部分地區(qū)和流域中南部的敖漢旗、翁牛特旗部分地區(qū)(圖8-a、圖8-b)。水稻種植面積較少,約為492.78 km2,分布區(qū)域較集中,主要在西拉木倫河和老哈河流域的翁牛特旗北部、東部和科爾沁左翼后旗東部區(qū)域,其他地區(qū)種植分布較零散(圖 8-c、圖8-d)。
4 結(jié)論與討論
本研究以Landsat 8 OLI 和MOD09Q1影像為基礎(chǔ)數(shù)據(jù)源,構(gòu)建時(shí)序NDVI、物候參數(shù)、光譜指數(shù)、反射率以及地形等多維特征。對(duì)比分析不同特征和分類器組合,最終使用基于RF-RFE選擇的特征子集和隨機(jī)森林分類器,提取西遼河流域玉米、大豆和水稻的種植信息。主要結(jié)論有以下4點(diǎn)。第一,基于GEE平臺(tái)可快速獲取并構(gòu)建作物分類的多維特征,分別從時(shí)序曲線、物候、地形、光譜反射以及光譜指數(shù)等多方面區(qū)分作物間的細(xì)微差距。進(jìn)一步利用RF-RFE方法選擇特征時(shí),發(fā)現(xiàn)模型中加入重要性前30名的特征時(shí)總體精度可基本達(dá)到最高。第二,利用6種特征組合方案分別在3種分類器下訓(xùn)練分類,對(duì)比分析發(fā)現(xiàn)選擇優(yōu)選特征組合并基于隨機(jī)森林模型進(jìn)行分類,可以保證在特征數(shù)量較少的前提下,處理多類型、多維度特征,分類模型總體精度基本可以達(dá)到較高水平。第三,分別基于樣本數(shù)據(jù)和統(tǒng)計(jì)數(shù)據(jù)展開作物制圖精度驗(yàn)證,作物分類的總體精度、 κ系數(shù)、各作物的制圖精度和用戶精度以及統(tǒng)計(jì)R2均大于0.9,3類作物解譯面積誤差絕對(duì)值在10%以內(nèi),說明解譯作物整體布局和面積準(zhǔn)確度較高。第四,西遼河流域農(nóng)作物主要分布在海拔較低的東、北部平原地區(qū),沿河流兩側(cè)呈條帶狀分布,西遼河干流和新開河附近區(qū)域最密集。玉米是流域內(nèi)最主要的農(nóng)作物類型,分布范圍廣,大豆、水稻種植面積較少,僅在部分區(qū)域集中分布。
本研究沒有使用空間和時(shí)間分辨率更具優(yōu)勢(shì)的Sentinel系列影像,是因?yàn)楸狙芯恳庠谔剿鬟m用于以Landsat為基礎(chǔ)數(shù)據(jù)源的作物分類方案,將有助于向前或向后拓展監(jiān)測(cè)年份,而Sentinel衛(wèi)星在軌運(yùn)行時(shí)間短,難以完成2015年前歷史年份的監(jiān)測(cè)。同時(shí),西遼河流域作物種植分布集中,以平原地區(qū)為主,沒有復(fù)雜地形的干擾,30 m分辨率可以清晰地展現(xiàn)作物的空間細(xì)節(jié)。受篇幅和時(shí)間限制,后續(xù)將進(jìn)一步探究基于現(xiàn)有年份的分類模型遷移方法,并完成長(zhǎng)時(shí)間序列作物制圖任務(wù)。
參考文獻(xiàn):
[1]史 舟,梁宗正,楊媛媛,等. 農(nóng)業(yè)遙感研究現(xiàn)狀與展望[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(2):247-260.
[2]何 可,宋洪遠(yuǎn). 資源環(huán)境約束下的中國糧食安全:內(nèi)涵、挑戰(zhàn)與政策取向[J]. 南京農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2021,21(3):45-57.
[3]唐華俊,吳文斌,楊 鵬,等. 農(nóng)作物空間格局遙感監(jiān)測(cè)研究進(jìn)展[J]. 中國農(nóng)業(yè)科學(xué),2010,43(14):2879-2888.
[4]趙子娟,劉 東,杭中橋. 作物遙感識(shí)別方法研究現(xiàn)狀及展望[J]. 江蘇農(nóng)業(yè)科學(xué),2019,47(16):45-51.
[5]Tatsumi K,Yamashiki Y,Canales Torres M A,et al. Crop classification of upland fields using random forest of time-series Landsat 7 ETM+data[J]. Computers and Electronics in Agriculture,2015,115:171-179.
[6]郭昱杉,劉慶生,劉高煥,等. 基于MODIS時(shí)序NDVI主要農(nóng)作物種植信息提取研究[J]. 自然資源學(xué)報(bào),2017,32(10):1808-1818.
[7]宋宏利,雷海梅,尚 明. 基于Sentinel2A/B時(shí)序數(shù)據(jù)的黑龍港流域主要農(nóng)作物分類[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2021,37(1):83-92.
[8]牛乾坤,劉 瀏,黃冠華,等. 基于GEE和機(jī)器學(xué)習(xí)的河套灌區(qū)復(fù)雜種植結(jié)構(gòu)識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022,38(6):165-174.
[9]楊澤航,王 文,鮑健雄. 融合多源遙感數(shù)據(jù)的黑河中游地區(qū)生長(zhǎng)季早期作物識(shí)別[J]. 地球信息科學(xué)學(xué)報(bào),2022,24(5):996-1008.
[10]朱夢(mèng)豪,李國清,彭壯壯. 特征優(yōu)選下的農(nóng)作物遙感分類研究[J]. 測(cè)繪科學(xué),2022,47(3):122-128.
[11]劉 戈,姜小光,唐伯惠. 特征優(yōu)選與卷積神經(jīng)網(wǎng)絡(luò)在農(nóng)作物精細(xì)分類中的應(yīng)用研究[J]. 地球信息科學(xué)學(xué)報(bào),2021,23(6):1071-1081.[HJ2.06mm]
[12]Ji S P,Zhang C,Xu A J,et al. 3D convolutional neural networks for crop classification with multi-temporal remote sensing images[J]. Remote Sensing,2018,10(2):75.
[13]王德軍,姜琦剛,李遠(yuǎn)華,等. 基于Sentinel-2 A/B時(shí)序數(shù)據(jù)與隨機(jī)森林算法的農(nóng)耕區(qū)土地利用分類[J]. 國土資源遙感,2020,32(4):236-243.
[14]Amani M,Ghorbanian A,Ali Ahmadi S,et al. Google earth engine cloud computing platform for remote sensing big data applications:a comprehensive review[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2020,13:5326-5350.
[15]張紫荊,華 麗,鄭 萱,等. 基于GEE平臺(tái)與Sentinel-NDVI時(shí)序數(shù)據(jù)江漢平原種植模式提?。跩]. 農(nóng)業(yè)工程學(xué)報(bào),2022,38(1):196-202.
[16]黃 波. 時(shí)空遙感影像融合研究的進(jìn)展與趨勢(shì)[J]. 四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,43(4):427-434,424.
[17]劉建波,馬 勇,武易天,等. 遙感高時(shí)空融合方法的研究進(jìn)展及應(yīng)用現(xiàn)狀[J]. 遙感學(xué)報(bào),2016,20(5):1038-1049.
[18]Chen Y,Cao R Y,Chen J,et al. A practical approach to reconstruct high-quality Landsat NDVI time-series data by gap filling and the Savitzky-Golay filter[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2021,180:174-190.
[19]周玉科. 基于遙感的中國東北植被物候不對(duì)稱特征分析[J]. 遙感技術(shù)與應(yīng)用,2019,34(2):345-354.
[20]項(xiàng)銘濤,衛(wèi) 煒,吳文斌. 植被物候參數(shù)遙感提取研究進(jìn)展評(píng)述[J]. 中國農(nóng)業(yè)信息,2018,30(1):55-66.
[21]張馨予,蔡志文,楊靖雅,等. 時(shí)序?yàn)V波對(duì)農(nóng)作物遙感識(shí)別的影響[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022,38(4):215-224.
[22]劉 杰,劉吉?jiǎng)P,安晶晶,等. 基于時(shí)序Landsat 8 OLI多特征與隨機(jī)森林算法的作物精細(xì)分類研究[J]. 干旱地區(qū)農(nóng)業(yè)研究,2020,38(3):281-288,298.
[23]丁世飛,齊丙娟,譚紅艷. 支持向量機(jī)理論與算法研究綜述[J]. 電子科技大學(xué)學(xué)報(bào),2011,40(1):2-10.
收稿日期:2023-02-21
基金項(xiàng)目:國家自然科學(xué)基金(編號(hào):41671525)。
作者簡(jiǎn)介:王振興(1998—),男,山東東營人,碩士研究生,從事農(nóng)作物遙感識(shí)別研究。E-mail:wangzhenxing20@mails.ucas.ac.cn。
通信作者:劉 東,博士,副教授,從事資源環(huán)境遙感與區(qū)域發(fā)展研究。E-mail:lldking@ucas.ac.cn。