朱奇磊,梁 棟,徐新剛,安曉飛,陳立平,楊貴軍,黃林生,許思喆
(1.安徽大學(xué)電子信息工程學(xué)院,安徽合肥 230601;2.北京市農(nóng)林科學(xué)院信息技術(shù)研究中心,北京 100097;3.北京市農(nóng)林科學(xué)院智能裝備技術(shù)研究中心,北京 100097;4.安徽大學(xué) 農(nóng)業(yè)生態(tài)大數(shù)據(jù)分析與應(yīng)用技術(shù)國(guó)家地方聯(lián)合工程研究中心,安徽合肥 230601)
作物秸稈是指收獲后殘留在農(nóng)田地表的作物剩余物質(zhì)。作物秸稈覆蓋于農(nóng)田土壤表面,具有減少土壤水分蒸發(fā)和減緩?fù)寥里L(fēng)化的作用[1]。同時(shí),秸稈還田也有助于提高農(nóng)田土壤肥力,是保護(hù)性耕作的重要內(nèi)容[2-3]。作物秸稈覆蓋度(crop residue coverage,CRC)指單位面積田塊中秸稈覆蓋所占的比例,是表征作物秸稈數(shù)量與分布的重要參數(shù)。實(shí)現(xiàn)大面積、實(shí)時(shí)和準(zhǔn)確的作物秸稈覆蓋度監(jiān)測(cè),對(duì)評(píng)估農(nóng)田生態(tài)環(huán)境和開(kāi)展保護(hù)性耕作具有重要意義。
目前,作物秸稈覆蓋度測(cè)取方法有拉繩法和照相法。拉繩法在實(shí)際操作過(guò)程耗時(shí)費(fèi)力,工作效率低[4];照相法具有便攜和易操作的優(yōu)勢(shì)[5-8],但對(duì)于不同區(qū)域農(nóng)田秸稈覆蓋度的監(jiān)測(cè),仍不能滿足大范圍、實(shí)時(shí)監(jiān)測(cè)的需求。遙感技術(shù)具有大面積、快速和動(dòng)態(tài)監(jiān)測(cè)的特點(diǎn),在作物秸稈覆蓋度估算中扮演著越來(lái)越重要的角色。李志婷等利用地面高光譜數(shù)據(jù),構(gòu)建不同遙感影像的波段反射率,通過(guò)構(gòu)建敏感光譜特征指數(shù)用于小麥秸稈覆蓋度估測(cè)的分析比較,結(jié)果表明,Landsat-8 OLI數(shù)據(jù)在波段劃分上更為精細(xì),且利用其構(gòu)建的光譜指數(shù)NDIOLI21估測(cè)精度優(yōu)于Landsat-5 TM[9]。Cai等綜合利用Sentinel-2光學(xué)與Sentinel-1微波數(shù)據(jù),構(gòu)建光譜與微波信息的復(fù)合指數(shù)對(duì)作物覆蓋度的估測(cè)精度較線性模型得到了提升[10]。Daughtry等在復(fù)雜混合場(chǎng)景下獲取的小麥、玉米、土壤等地物高光譜數(shù)據(jù)進(jìn)行作CRC分析試驗(yàn),結(jié)果發(fā)現(xiàn),作物秸稈在2 100 nm處所特有的光譜吸收特征能夠很好地將秸稈與土壤區(qū)分開(kāi)來(lái),進(jìn)而構(gòu)建纖維素吸收指數(shù)(cellulose absorption index,CAI)[11]。黃晉宇等運(yùn)用哨兵Sentinel-2衛(wèi)星遙感數(shù)據(jù),結(jié)合典型的光譜指數(shù)與不同土壤類型因素實(shí)現(xiàn)玉米秸稈覆蓋度的估測(cè)[12-13]。在眾多CRC估測(cè)中運(yùn)用光學(xué)特征居多。Jin等利用Landsat-8 OLI遙影像提取的植被指數(shù)和紋理特征估測(cè)玉米秸稈覆蓋度,結(jié)果顯示,影像紋理特征對(duì)玉米秸稈覆蓋度進(jìn)行估測(cè)具有可行性[14]。紋理特征在遙感數(shù)據(jù)中能提供豐富的空間信息。Li等運(yùn)用機(jī)器學(xué)習(xí)算法結(jié)合GF-1的光譜特征與紋理特征與Sentinel-1微波特征實(shí)現(xiàn)森林生物量的估測(cè),結(jié)果表明,利用GF影像提取的光譜與紋理特征并結(jié)合隨機(jī)森林模型在森林生物量估測(cè)中精度最高[15]。
目前,在光譜植被特征信息的基礎(chǔ)上加入紋理特征,在玉米秸稈覆蓋度的遙感監(jiān)測(cè)中是可行的,但小麥和玉米秸稈在農(nóng)田地表結(jié)構(gòu)和形態(tài)上具有較大的差異,在光譜植被特征基礎(chǔ)上引入紋理信息是否能顯著提高小麥秸稈覆蓋的監(jiān)測(cè)精度需要進(jìn)一步分析探究。此外,隨著遙感特征變量的增多,不同數(shù)據(jù)之間的特征融合,如何有效篩選對(duì)作物秸稈敏感的特征量,并盡可能提高估測(cè)精度是當(dāng)前作物秸稈覆蓋度遙感監(jiān)測(cè)研究的重要內(nèi)容。
本研究以當(dāng)前廣泛使用的Sentinel-2衛(wèi)星影像為數(shù)據(jù)源,探討利用典型光譜特征、植被指數(shù)和紋理特征及其組合在估測(cè)小麥秸稈覆蓋度的可行性,通過(guò)灰色關(guān)聯(lián)度與隨機(jī)森林(GRA-RF)相結(jié)合的變量篩選方法,優(yōu)選對(duì)小麥秸稈覆蓋度敏感的特征變量,利用套索(LASSO)、嶺回歸(RR)、高斯過(guò)程回歸(GPR)等機(jī)器學(xué)習(xí)算法,針對(duì)不同特征變量集,構(gòu)建小麥秸稈覆蓋度遙感估算模型并實(shí)現(xiàn)小麥CRC遙感估測(cè),以期為大范圍小麥秸稈覆蓋度估測(cè)提供新的思路和方法。
試驗(yàn)于2020年7月在北京市小湯山國(guó)家精準(zhǔn)農(nóng)業(yè)示范基地進(jìn)行 (40°00′N~40°21′N,116°34′E~ 117°00′E,見(jiàn)圖1)。研究區(qū)地勢(shì)平坦,平均海拔高度約為36 m,四季分明,屬于大陸性季風(fēng)氣候,春季干旱多風(fēng),夏季炎熱多雨,年平均日照時(shí)長(zhǎng)2 684 h,降水量500~600 mm。圖1為研究區(qū)位置及Sentinel-2衛(wèi)星影像采樣點(diǎn)分布。
圖1 小麥試驗(yàn)區(qū)域位置及樣點(diǎn)分布
1.2.1 田間實(shí)測(cè)小麥CRC獲取
于2020年7月7日,采用手持多光譜相機(jī)(具有紅、綠、藍(lán)、近紅、紅邊五個(gè)光譜波段)在固定高度對(duì)試驗(yàn)采樣區(qū)域地面正上方垂直拍攝,共獲取115個(gè)高分辨率秸稈覆蓋數(shù)據(jù)及拍攝時(shí)間和經(jīng)緯度信息。為了更接近秸稈還田真實(shí)場(chǎng)景,對(duì)試驗(yàn)區(qū)秸稈在自然環(huán)境中靜置處理,以保證在下季作物種植期有更真實(shí)的秸稈覆蓋數(shù)據(jù)。圖2為原始多光譜數(shù)據(jù)真彩色合成圖。
圖2 田間地面實(shí)測(cè)圖像
對(duì)田間試驗(yàn)樣點(diǎn)采用人工目視解譯的方法選取5個(gè)地物類別構(gòu)建ROI感興趣區(qū)域[土壤、秸稈、綠植、陰影(土壤陰影、非土壤陰影)]。目前常見(jiàn)的地物分類算法有支持向量機(jī)、隨機(jī)森林、最小距離等,本研究通過(guò)試驗(yàn)分析選取分類精度較高的隨機(jī)森林分類算法進(jìn)行影像處理。地物分類后采用混淆矩陣與Kappa系數(shù)作為評(píng)價(jià)標(biāo)準(zhǔn),其中RF的兩種系數(shù)評(píng)估結(jié)果分別為88.33%、0.85。
1.2.2 遙感數(shù)據(jù)處理
借助Google Earth Engine(GEE)平臺(tái)獲取Sentinel-2在2020年7月6日本試驗(yàn)區(qū)域的遙感數(shù)據(jù),并對(duì)遙感影像做相應(yīng)預(yù)處理,包括輻射定標(biāo)、大氣校正、幾何校正處理,遙感數(shù)據(jù)狀態(tài)良好且無(wú)云[16-17]。
1.3.1 遙感影像光譜特征提取
針對(duì)近地面高分辨率的多光譜數(shù)據(jù),通過(guò)變量篩選的方法選取重要性程度高的光譜指數(shù),對(duì)地面樣點(diǎn)進(jìn)行分類處理,以減少運(yùn)算量和冗余信息,提高處理效率。以往的研究基于Sentinel-2數(shù)據(jù)利用短波區(qū)域合成的光譜指數(shù)對(duì)遙感影像處理,其中枯燃料指數(shù)(dead fuel index,DFI)、歸一化差異耕作指數(shù)(normalized differential tillage index,NDTI)、簡(jiǎn)單耕作指數(shù)(simple tillage index)以及歸一化差值指數(shù)NDI(x,y)等[18-19]對(duì)秸稈覆蓋度估測(cè)效果較好。
DFI=100(1-SWIR2/SWIR1)×R/NIR
(1)
NDTI=(SWIR1-SWIR2)/(SWIR1+SWIR2)
(2)
STI=SWIR1/SWIR2
(3)
DNI(X,Y)=(Y-X)/(Y+X)
(4)
式中SWIR1、SWIR2分別為波段B11、B12,R、NIR分別為B4和B8,x,y為遙感影像的不同光譜波段。
1.3.2 遙感影像紋理特征提取
對(duì)Sentinel-2影像從不同波段分別獲取灰度共生矩陣(gray-level co-occurrence matrix,GLCM)的8種紋理特征(表1),包括均值(mean)、方差(variance ,Var)、同質(zhì)性(homogeneity,Hom)、對(duì)比度(contrast,Con)、差異性(dissimilarity,Dis)、熵(entropy,Ent)、二階矩(second moment,Sec)、相關(guān)性(correlation,Cor)。隨著這些紋理特征的加入,估測(cè)模型就可以反映空間特征。
表1 紋理特征表達(dá)式
1.4.1 灰色關(guān)聯(lián)-隨機(jī)森變量篩選方法
灰色關(guān)聯(lián)分析(GRA)是一種能夠權(quán)衡特征變量與比較數(shù)列關(guān)聯(lián)程度的無(wú)量綱統(tǒng)計(jì)分析方法,可通過(guò)計(jì)算變量之間的關(guān)聯(lián)度,獲得變量的排序情況,進(jìn)而分析自變量與因變量之間的關(guān)系。關(guān)聯(lián)度較大的參量表明其與比較數(shù)列的變化趨勢(shì)更為相近[20-25]。隨機(jī)森林(random forest,RF)算法屬于一種集成算法,由許多決策樹(shù)構(gòu)成的分支集合而成,眾多決策樹(shù)的投票結(jié)果能夠共同完成對(duì)數(shù)據(jù)屬性的分類與預(yù)測(cè)任務(wù),通過(guò)對(duì)每個(gè)特征在決策樹(shù)上的平均貢獻(xiàn)率進(jìn)行評(píng)估,獲得特征的重要性排序,同時(shí)所采用Bootstrap抽樣法能有放回地隨機(jī)生成多個(gè)決策樹(shù)數(shù)據(jù),而且隨機(jī)性的引入使得模型不容易陷入過(guò)擬合[26-28]?;疑P(guān)聯(lián)分析能對(duì)多目標(biāo)靈活處理數(shù)據(jù),但僅適用于線性關(guān)系的分析,隨著數(shù)據(jù)信息量的增加,其分析過(guò)程也將變得復(fù)雜。而隨機(jī)森林作為機(jī)器學(xué)習(xí)方法,既能實(shí)現(xiàn)多特征的非線性分析,也能應(yīng)對(duì)大量的數(shù)據(jù)信息,在模型構(gòu)建過(guò)程中對(duì)不同特征信息進(jìn)行充分學(xué)習(xí),并提供特征重要性排序。因此,本研究嘗試對(duì)兩者優(yōu)勢(shì)進(jìn)行融合。首先運(yùn)用兩種分析方法各自運(yùn)算獲得的結(jié)果分別進(jìn)行歸一化處理,然后將特征重要性得分對(duì)應(yīng)加和,獲得特征信息排名。
(5)
(6)
式中,x0(j)為參考因子數(shù)列;xi(j)為比較因子數(shù)列;α為分辨系數(shù),通常取0.5;i為比較因子的個(gè)數(shù);j為數(shù)據(jù)的組數(shù);用公式5計(jì)算關(guān)聯(lián)系數(shù)后求取平均值,獲得關(guān)聯(lián)度ri。
1.4.2 機(jī)器學(xué)習(xí)算法
本研究應(yīng)用偏最小二乘、嶺回歸、套索回歸及高斯過(guò)程回歸等代表性的4種機(jī)器算法,比較分析不同算法在冬小麥秸稈覆蓋度遙感監(jiān)測(cè)中的性能和作用。
偏最小二乘回歸(Partial least squares regression,PLSR)屬于數(shù)學(xué)統(tǒng)計(jì)的一種優(yōu)化方法,能夠用于構(gòu)建多個(gè)因變量與多個(gè)自變量之間的模擬關(guān)系,結(jié)合試驗(yàn)參數(shù)進(jìn)行主成分分析,突出對(duì)模型貢獻(xiàn)較大的主成分信息,通過(guò)對(duì)多變量間的相關(guān)性檢測(cè),減少多重共線性下的冗余參量,最后進(jìn)行多元線性回歸分析[29-31]。
嶺回歸(Ridge regression,RR)是一種能夠消除多重共線性所帶來(lái)的回歸誤差的方法,是對(duì)最小二乘的一種改進(jìn)算法,最先用來(lái)處理樣本量少于輸入特征參數(shù)的情況,通過(guò)對(duì)目標(biāo)函數(shù)引入正則項(xiàng)的方式,使得無(wú)解的狀況得到解決,減少了參數(shù)量,使得模型更穩(wěn)定且更符合實(shí)際[24,32]。
套索回歸(Least absolute shrinkage and selection operator,LASSO)由Robert Tibshirani在1996年首次提出。該算法集合了RR與最小二乘的優(yōu)勢(shì),能在建模時(shí)自動(dòng)將不重要回歸系數(shù)自動(dòng)剔除,降低了模型的復(fù)雜性即減少總體的回歸系數(shù),能夠?qū)崿F(xiàn)自動(dòng)篩選變量的功能,在一定程度上降低共線性的影響[31,33-34]。
高斯過(guò)程回歸(Gaussian process regression,GPR)是利用高斯過(guò)程對(duì)數(shù)據(jù)進(jìn)行分析來(lái)尋找數(shù)據(jù)之間內(nèi)在關(guān)聯(lián),在處理非線性問(wèn)題上具有較好的表現(xiàn),也適用于解決樣本量小的回歸問(wèn)題,具有較好的泛化能力與適應(yīng)性[35-38]。
本研究在多種特征融合基礎(chǔ)上構(gòu)建機(jī)器學(xué)習(xí)回歸模型,選取70%數(shù)據(jù)為訓(xùn)練集,30%數(shù)據(jù)為驗(yàn)證集,用10折交叉驗(yàn)證獲取模型平均得分作為最終評(píng)估結(jié)果,采用決定系數(shù)(coefficient of determination,r2)和均方根誤差(root mean square error,RMSE)來(lái)分析模型精度。其中,r2越接近于1,RMSE越接近于0,模型擬合效果越好。用方差膨脹因子(variance inflation factor,VIF)檢測(cè)模型變量參數(shù)之間是否存在共線性問(wèn)題,當(dāng)VIF>10時(shí),則認(rèn)為變量之間存在共線性問(wèn)題。
(7)
(8)
(9)
2.1.1 基于不同數(shù)據(jù)的特征相關(guān)性分析
對(duì)光譜波段、光譜指數(shù)、紋理特征與CRC進(jìn)行相關(guān)性分析。從相關(guān)性由大到小的排序來(lái)看,排在前五的遙感光譜波段、光譜指數(shù)與紋理特征排序分別依次為B12>B4>B3>B8>B5、DFI>NDTI>STI>NDI(4,11)>NDI(3,11)和Mean_B12>Hom_B3>Sec_B3>Dis_B3>Ent_B3(圖3)。由于不同特征變量之間具有一定的相關(guān)性,因而在多元線性回歸模型中需要利用方差膨脹因子(VIF)檢測(cè)來(lái)消除變量之間的多重共線性問(wèn)題?;谶@些特征變量與CRC線性回歸建模,結(jié)果(表2)表明,光譜指數(shù)DFI、STI和NDTI的建模效果較好。
表2 CRC線性模型分析
圖3 波段、指數(shù)、紋理特征相關(guān)系數(shù)分析
2.1.2 基于GRA-RF的敏感特征分析
GRA-RF法分別對(duì)光譜、指數(shù)、紋理特征進(jìn)行敏感特征篩選,每種特征關(guān)聯(lián)度較大的前五個(gè)特征排序結(jié)果與相關(guān)性分析結(jié)果具有一定的相似性(圖4),即關(guān)聯(lián)度最高的特征相同。
圖4 不同特征的GRA-RF特征重要性排序
2.1.3 基于機(jī)器學(xué)習(xí)的CRC遙感估測(cè)
為探究不同數(shù)據(jù)特征及其相互組合對(duì)CRC模型精度的影響,根據(jù)重要性排序結(jié)果,結(jié)合多種機(jī)器學(xué)習(xí)算法來(lái)構(gòu)建CRC估測(cè)模型。結(jié)果發(fā)現(xiàn),多個(gè)波段特征組合的模型精度較線性模型明顯提升,其中較穩(wěn)定的模型有LASSO、RR、PLSR模型(表3)。在用光譜指數(shù)構(gòu)建的回歸模型中RR模型較為穩(wěn)定且與DFI模型精度相近,光譜指數(shù)特征及其組合特征在所選機(jī)器學(xué)習(xí)模型中r2均穩(wěn)定在0.5以上。紋理特征作為GPR模型特征參數(shù)時(shí)獲得最穩(wěn)定且精度最高的CRC估測(cè)結(jié)果。多種特征的融合在不同模型中各有突出的表現(xiàn)。與線性回歸模型相比,運(yùn)用機(jī)器學(xué)習(xí)算法與特征組合方式使得CRC模型總體估算精度得到了 改善。
表3 多種特征組合回歸模型精度評(píng)估
為進(jìn)一步探究特征數(shù)量對(duì)模型精度影響,基于以上分析結(jié)果,通過(guò)逐步增加特征數(shù)量來(lái)觀察不同特征及其組合在機(jī)器學(xué)習(xí)建模過(guò)程中的精度變化趨勢(shì)。其中,對(duì)光譜波段、光譜指數(shù)以及紋理特征通過(guò)關(guān)聯(lián)分析選取前10個(gè)排序結(jié)果,不同特征之間組合各選取前5個(gè)作為模型訓(xùn)練參數(shù),其中模型參數(shù)最多的為波段、紋理、光譜三者組合,訓(xùn)練時(shí)最多含有15個(gè)變量且初始變量隨機(jī)。
通過(guò)建模分析繪制CRC模型趨勢(shì)圖(圖5),對(duì)其進(jìn)行分析發(fā)現(xiàn),含有光譜指數(shù)的所有模型的初始精度較高且整體較為穩(wěn)定,對(duì)CRC具有較好的估算效果。而含有波段特征的精度曲線中,回歸模型隨著特征數(shù)的增加,其精度首先迅速提升后趨于平穩(wěn),其中在模型趨于穩(wěn)定前達(dá)到最高的兩個(gè)特征波段為B12與B11,說(shuō)明機(jī)器學(xué)習(xí)算法結(jié)合敏感變量篩選構(gòu)建的多元模型可實(shí)現(xiàn)小麥秸稈覆蓋度較好估測(cè)。紋理特征在前5個(gè)特征中估測(cè)精度相對(duì)不高,但在GPR模型中隨著特征數(shù)增加,模型最終趨于穩(wěn)定且精度優(yōu)于其他模型。LASSO與RR模型總體趨勢(shì)較為相似,僅在少數(shù)變量變化中出現(xiàn)較小的上下浮動(dòng),而LASSO是基于RR回歸的一種改進(jìn)算法,隨著變量數(shù)的增加,能自動(dòng)剔除對(duì)模型精度貢獻(xiàn)不大的特征。綜合分析后,從兩種算法中可選取精度較好且相對(duì)穩(wěn)定的LASSO構(gòu)建最優(yōu)模型。表4為部分特征與LASSO算法建模參數(shù)及精度,所有特征變量均通過(guò)方差膨脹因子檢驗(yàn),模型各參數(shù)的VIF均小于10。圖6對(duì)應(yīng)表4中CRC模型在訓(xùn)練集與測(cè)試集的精度評(píng)估結(jié)果。依據(jù)三種模型分析得到研究區(qū)CRC的分布狀況(圖7),與實(shí)際觀察較為相符。
圖5 CRC模型精度趨勢(shì)圖(r2為三角,RMSE為圓點(diǎn))
a:波段特征;b:波段與紋理;c:光譜指數(shù)、波段與紋理特征。
圖7 不同特征組合下LASSO模型估測(cè)CRC分布
表4 不同特征與LASSO模型精度及公式
本研究利用不同光譜特征及其組合構(gòu)建機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)小麥秸稈覆蓋度的估測(cè),依據(jù)訓(xùn)練集與驗(yàn)證集的決定系數(shù)差異最小的原則,篩選穩(wěn)定性最優(yōu)的CRC估測(cè)模型。從相關(guān)性分析結(jié)果看,在遙感影像波段特征中B12與小麥CRC敏感性,高于其他光譜波段,主要是因?yàn)樽魑锝斩捲? 100 nm處光譜反射率與土壤有較大的區(qū)別[11];光譜指數(shù)與CRC的相關(guān)性優(yōu)于波段特征和紋理特征,其中利用DFI、STI、NDI(x,y)構(gòu)建的CRC估算模型具有較好的精度,與已有研究結(jié)果相近[18-19]。當(dāng)前,通過(guò)紋理特征實(shí)現(xiàn)作物秸稈估測(cè)研究較少,與玉米秸稈的紋理特征相比,小麥秸稈更為細(xì)長(zhǎng)密集且反射面積小,空間分辨率越高,紋理特征可能會(huì)越明顯。在紋理特征中Mean_B12與CRC的相關(guān)性表現(xiàn)較好,但構(gòu)建多特征模型時(shí),其他紋理特征對(duì)CRC精度的提升優(yōu)于Mean_B12,這可能是B12的光譜特征或指數(shù)特征與其本身的紋理信息存在一定的共線性。在以往的多元線性回歸模型中,隨著變量特征數(shù)的增加,模型精度會(huì)得到一定的提升,但不同變量特征之間可能存在一定的共線性問(wèn)題。因此,本研究利用敏感特征篩選和模型趨勢(shì)分析,探究機(jī)器學(xué)習(xí)在CRC
估算中最優(yōu)的模型方法及最佳特征變量。
本研究通過(guò)敏感特征篩選,利用排序后的特征進(jìn)行建模,并分析特征變量的變化對(duì)CRC估算精度的影響,結(jié)果表明,隨著光譜變量數(shù)的增加,機(jī)器學(xué)習(xí)算法模型如PLSR模型對(duì)CRC的估測(cè)精度沒(méi)有實(shí)質(zhì)性的提升,這與前人研究結(jié)果相似[15]。LASSO等算法依靠自身具有的正則化約束作用,在一定程度上消除了共線性問(wèn)題[39]。從特征信息的增加對(duì)CRC模型精度的影響看,隨著變量數(shù)的增加,利用機(jī)器學(xué)習(xí)算法構(gòu)建的估算模型的精度有上升或下降,表明不同特征的加入對(duì)模型估算精度的影響不同。通過(guò)趨勢(shì)線分析,經(jīng)GPA-RF篩選的5個(gè)特征在單特征建模中,模型精度不隨變量的增加而增加,且部分特征組合在最高精度具有相一定的相似性。相比僅利用波段特征信息,波段與紋理的組合模型中,隨著紋理信息的加入,GPR、PLSR模型得到穩(wěn)定,而LASSO與RR模型精度在穩(wěn)定后得到提升,在光譜指數(shù)模型中加入紋理也有相似的表現(xiàn)。在多種特征組合情況,RR與LASSO模型精度趨于穩(wěn)定甚至整體精度得到提升,而GPR與PLSR模型在個(gè)別特征組合中最高精度并無(wú)明顯差異,說(shuō)明建模信息過(guò)度冗余,后續(xù)需要通過(guò)對(duì)曲線精度最高點(diǎn)的特征進(jìn)行提取,在原有基礎(chǔ)上構(gòu)建新的CRC估測(cè)模型以降低模型的復(fù)雜性。
本研究通過(guò)GRA-RF方法篩選特征變量,再結(jié)合多種機(jī)器學(xué)習(xí)算法構(gòu)建CRC估測(cè)模型,相比傳統(tǒng)光譜指數(shù)模型,混合光譜特征模型能顯著提高整體精度,為實(shí)現(xiàn)大面積小麥CRC估測(cè)提供新的研究思路。但本研究?jī)H基于秸稈還田試驗(yàn)基地,且部分田塊采用輪作的種植方式,故從采集的圖片數(shù)據(jù)中可以看出,在靜置處理過(guò)程中出現(xiàn)新一季作物幼苗,這在秸稈還田試驗(yàn)中需要考慮,在后續(xù)的研究中可以結(jié)合作物物候期與多時(shí)相遙感數(shù)據(jù)對(duì)研究區(qū)秸稈還田時(shí)期進(jìn)行判定。此外,本研究區(qū)局部地形的變化對(duì)模型影響較小,在大區(qū)域尺度進(jìn)行CRC研究時(shí)需考慮不同地區(qū)在土壤含水量上的時(shí)空分布差異。同時(shí),不同遙感影像在空間分辨率上有所區(qū)別,而較高分辨率影像包含更多的紋理信息。相比遙感光譜信息,紋理特征能夠反映影像數(shù)據(jù)的表觀性質(zhì),在CRC估算中能反映秸稈與土壤紋理上的空間差異,彌補(bǔ)了僅利用單一光譜特征對(duì)CRC估算的局限性。隨著國(guó)產(chǎn)遙感衛(wèi)星技術(shù)的不斷發(fā)展,利用較高的空間分辨率與光譜分辨率優(yōu)勢(shì)實(shí)現(xiàn)作物秸稈覆蓋度估算具有重要研究意義。綜上所述,在作物秸稈實(shí)地研究中,田間場(chǎng)景的復(fù)雜程度、地表物質(zhì)的多樣性以及土壤的含水量與有機(jī)質(zhì)含量等需要進(jìn)行采樣分析。在后續(xù)研究中,將考慮區(qū)域范圍更廣、秸稈類型更多、分布更為均勻的野外覆蓋度估測(cè)分析,并為不同區(qū)域場(chǎng)景構(gòu)建相應(yīng)的地物特征庫(kù),進(jìn)而構(gòu)建具有普適意義的秸稈覆蓋度模型。
基于Sentinel-2遙感數(shù)據(jù),通過(guò)GRA-RF方法對(duì)波段、光譜指數(shù)、紋理特征進(jìn)行敏感性分析,將不同特征信息的組合并結(jié)合多種機(jī)器學(xué)習(xí)算法構(gòu)建冬小麥秸稈覆蓋度估測(cè)模型。結(jié)果表明,基于單一特征的模型中,利用光譜指數(shù)的估測(cè)精度較高,其中DFI表現(xiàn)最好(r2=0.54,RMSE= 10.26%);單一紋理特征對(duì)冬小麥CRC的敏感性較差,但利用多個(gè)紋理信息構(gòu)建機(jī)器學(xué)習(xí)估算模型時(shí)精度得到改善(r2=0.43~0.46)。通過(guò)構(gòu)建特征變量與精度趨勢(shì)變化曲線,對(duì)變量變化拐點(diǎn)處的特征進(jìn)行提取,篩選出小麥CRC最優(yōu)模型特征,其中3種特征(B11,B8,B4_B11,STI,Ent_B3,Hom_B3,Mean_B2)混合的模型精度最優(yōu),r2與RMSE分別為0.65%和9.25%。因此,與單特征變量構(gòu)建的模型相比,多特征信息的組合顯著提高了小麥CRC的估算精度。