張智韜 譚丞軒 許崇豪 陳碩博 韓文霆 李 宇
(1.西北農(nóng)林科技大學旱區(qū)農(nóng)業(yè)水土工程教育部重點實驗室, 陜西楊凌 712100;2.西北農(nóng)林科技大學水利與建筑工程學院, 陜西楊凌 712100;3.西北農(nóng)林科技大學機械與電子工程學院, 陜西楊凌 712100)
農(nóng)田土壤水分是作物生長發(fā)育的基本條件,也是農(nóng)作物墑情監(jiān)測和判斷的重要指標[1]。傳統(tǒng)的土壤含水率測量方法,如干燥法、中子儀法、時域反射儀法等,存在耗時、費力和采樣成本高等缺點[2],而遙感技術具有簡便、高效、無損等優(yōu)勢,在土壤含水率監(jiān)測中具有廣闊的應用前景和發(fā)展空間[3]。
國內(nèi)外學者對應用遙感技術監(jiān)測土壤含水率進行了廣泛探討和深入研究,并建立了相應的經(jīng)驗或半經(jīng)驗模型[4-7]。無人機遙感克服了衛(wèi)星遙感時空分辨率不匹配[8],以及地面非成像光譜儀耗時、費力等問題,具有機動靈活、實時圖像采集、高時效性、高空間分辨率等優(yōu)點[9],可快速、高效獲取農(nóng)田厘米級遙感影像,更好地滿足農(nóng)田尺度上精準灌溉的要求。BIAN等[10]利用無人機搭載熱紅外和多光譜傳感器,通過水分脅迫指數(shù)(Crop water stress index, CWSI)和多種植被指數(shù)共同診斷棉花的水分脅迫狀況;陳俊英等[11]通過棉花花蕾期不同時刻冠層無人機多光譜遙感影像,利用植被光譜反射率對水分脅迫指標——蒸騰速率(Tr)和氣孔導度(Gs)等進行了反演;張智韜等[12]利用六旋翼無人機搭載MCA多光譜傳感器完成了對裸土土壤含水率的反演,且反演精度較高,決定系數(shù)在0.7以上;王敬哲等[13]基于無人機高光譜傳感器,分析了差值指數(shù)(Difference index,DI)、比值指數(shù)(Ratio index, RI)、歸一化指數(shù)(Normalization index, NDI)和垂直植被指數(shù) (Perpendicular vegetation index, PVI)與土壤含水率之間的關系,構建了干旱區(qū)綠洲農(nóng)田土壤含水率定量估算模型;陳文倩等[14]基于植被反射率數(shù)據(jù),計算了多種植被指數(shù),從而構建了干旱區(qū)綠洲土壤含水率與植被光譜指數(shù)之間的估算模型,對淺層土壤含水率進行了反演。但利用無人機多光譜遙感,構建多種植被指數(shù)與大田玉米根域土壤含水率的估算模型的相關研究還鮮有報道。
灰度關聯(lián)分析法是通過計算關聯(lián)度來比較系統(tǒng)各因素之間主次關系的一種變量選擇方法[15],在光譜分析中可以更好地篩選敏感波段和光譜指數(shù)[14,16-17]。該方法對樣本的多少和樣本有無規(guī)律都同樣適用,計算量小,不會出現(xiàn)量化結果與定性分析結果不符的情況。雖然不同植被指數(shù)與土壤含水率之間具有一定的關聯(lián)性,但土壤含水率與植被光譜之間的關系復雜,并不一定是單一的線性關系。而機器學習算法在處理非線性、異方差性等復雜問題時有較大的優(yōu)勢,具有對數(shù)據(jù)處理的智能化和對數(shù)據(jù)價值的充分挖掘性,可以提高模型的反演精度,在農(nóng)業(yè)遙感領域廣泛應用[18-21]。前人大多利用機器學習方法進行農(nóng)田作物參數(shù)的反演,而利用灰度關聯(lián)和機器學習相結合的方法進行農(nóng)田土壤含水率的反演研究較少。
本文利用無人機遙感平臺獲取不同生育期大田玉米冠層高分辨率多光譜遙感影像,并計算多種植被指數(shù),然后采用灰度關聯(lián)法篩選對根域土壤含水率敏感的植被指數(shù),將其作為自變量,分別構建不同生育期條件下的多元混合線性回歸(Cubist)、反向傳播神經(jīng)網(wǎng)絡(Back propagation neural network, BPNN)以及支持向量機回歸(Support vector machine regression,SVR)等機器學習模型,并進行驗證,以期獲得適應于大田玉米根域土壤墑情監(jiān)測的最優(yōu)模型,為農(nóng)田土壤水分監(jiān)測和灌溉管理提供理論依據(jù)和技術支持。
研究區(qū)域位于內(nèi)蒙古自治區(qū)鄂爾多斯市達拉特旗昭君鎮(zhèn)(40°26′0.29″N,109°36′25.99″E,海拔1 010 m),屬于典型溫帶大陸性氣候。試驗地土壤為砂壤土,平均田間持水率為18.5%(體積含水率),土壤容重為1.56 g/cm3。玉米種植品種為“鈞凱918”,其播種時間為2018年5月11日,出苗時間為5月18日,收獲時間為9月8日,生育期(Day after planting,DAP)總共114 d,其中5月24日—7月26日為營養(yǎng)生長期(Vegetative stage,V期),7月27日—8月23日為生殖期(Reproductive stage,R期),8月24日—9月8日為成熟期(Maturation stage,M期)。玉米播種深度約5 cm,種植行距50 cm、株距25 cm,行向由東到西,試驗地面積1.13 hm2,采用中心軸式噴灌機進行灌溉。
試驗地被均等劃分為5個扇形區(qū)域,每個扇形區(qū)域再劃分成3個6 m×6 m的采樣區(qū)(圖1),相當于3次重復,并以不同百分比的田間持水率在V期、R期和M期對5個處理區(qū)進行不同梯度的水分處理,在營養(yǎng)生長期和成熟期進行了相應的水分脅迫處理,而R期為產(chǎn)量敏感期,為了避免造成玉米重大的減產(chǎn),故在R期并未設置過多的脅迫處理,本文以田間持水率的95%為充分灌溉,各生育期的水分處理情況見表1。其實際灌溉量和降雨量分別通過安裝在噴灌機上的流量計(MIK-2000H型)和試驗地相鄰的標準氣象站采集。
圖1 試驗小區(qū)示意圖Fig.1 Layout of testing plots
水分處理區(qū)V期R期M期T1100100100T26510065T34010080T4656565T54010040
自主研發(fā)的無人機多光譜影像采集系統(tǒng)如圖2所示,該系統(tǒng)采用開源飛控Pixhawk,經(jīng)緯M600型機架,搭載RedEdge(MicaSense,USA)多光譜相機,該相機具有475 nm(藍光,B)、560 nm(綠光,G)、668 nm(紅光,R)、717 nm(紅邊,RE)、840 nm(近紅外,NIR)等5個波長的光譜采集通道,且配有光強傳感器和固定反射率校正板(GroupVIII, USA)。光強傳感器可校正外界光線的變化對光譜影像造成的影響,固定反射率校正板可對多光譜影像進行輻射校正,以生成反射率影像圖和植被指數(shù)正射影像圖。
數(shù)據(jù)采集時間為2018年7月12日(DOY193)、7月17日(DOY198)、7月21日(DOY202)、8月2日(DOY214)、8月23日(DOY235)、8月28日(DOY240)、9月7日(DOY250)的11:00—13:00,每日采集一次,全生育期共7次試驗。期間天氣晴朗無風,多光譜相機鏡頭垂直向下,飛行高度70 m,地面分辨率為4.77 cm/像素。每次都采用固定航線飛行,航向和旁向重疊度均為85%。
在光譜信息采集完成后,及時在每個采樣區(qū)的中心位置打鉆取土,取土深度分別為10、20、30、45、60 cm,采用干燥法測定玉米根域土壤含水率(體積含水率),將5個不同深度土層的土壤含水率取平均值,代表為6 m×6 m采樣區(qū)土壤含水率的均值。隨機抽取2/3數(shù)據(jù)用于建模,1/3數(shù)據(jù)用于驗證,各生育期土壤含水率統(tǒng)計特征如表2所示。
表2 土壤含水率統(tǒng)計特征Tab.2 Statistical characteristics of SMC
植被指數(shù)的提取主要分以下幾步:①采用Pix4DMapper 軟件對原始遙感影像進行拼接,通過對RedEdge相機拍攝的多光譜影像進行輻射校正、幾何校正以及高斯均值濾波等處理,在Pix4DMapper 軟件中根據(jù)波段運算生成不同植被指數(shù)的正射影像圖。②利用R軟件讀取各種植被指數(shù)正射影像圖以及15個采樣區(qū)的面狀矢量文件,以便對植被指數(shù)影像圖進行分割處理。③提取分割后植被指數(shù)的柵格文件并計算其平均值,最后將不同生育期條件下的不同植被指數(shù)均值整理,以便與對應的土壤含水率數(shù)據(jù)進行統(tǒng)計分析。
本文涉及了18種植被指數(shù),其植被指數(shù)計算方法如表3所示。
表3 植被指數(shù)匯總Tab.3 Vegetation index summary
注:B、G、R、RE以及NIR分別為475、560、668、717、840 nm波長處的光譜反射率。
灰色關聯(lián)法是一種確定變量是否相關并確定其相關程度的一種分析方法。其基本思想是通過計算關聯(lián)度找出系統(tǒng)各因素之間的主次關系,從而找出影響最大的因素。在系統(tǒng)發(fā)展過程中,如果兩者相對變化基本相同,則認為兩者的關聯(lián)度大;反之,則認為兩者關聯(lián)度小。在計算灰色關聯(lián)度之前,首先對數(shù)據(jù)進行灰度關聯(lián)分析中常用的“均值化”預處理,以降低植被指數(shù)和土壤含水率間因量綱不一致而造成的分析誤差[15-17]?;疑P聯(lián)度的主要計算步驟如下:設參考序列為X0={x0(k),k=1,2,…,n},比較序列為Xi={xi(k),k=1,2,…,n},則X0和Xi之間的灰色關聯(lián)度(Gray correlation degree,GCD)計算公式為
(1)
其中
γ(x0(k),xi(k))=
(2)
式中ρ——分辨系數(shù),取0.5
1.6.1多元混合線性回歸
多元混合線性回歸(Cubist)是由Rule Quest 公司開發(fā)的一種機器學習算法,其常應用于分類和回歸分析當中,是一種改進的回歸樹系統(tǒng)[38-39]。與CART算法相比,Cubist模型與其最大的區(qū)別在于模型樹的節(jié)點是一系列的線性模型,而回歸樹的節(jié)點上是一個具體的值,因而其建模的靈活性和精度都優(yōu)于回歸樹模型。Cubist模型用一種分段式的多元線性函數(shù)來預測變量,在解決非線性問題的同時,也提高了模型的預測精度。與單純的線性回歸相比,Cubist模型可由算法自動對輸入空間進行分割,且訓練規(guī)則簡單、有效,對高維屬性的問題也有很好的解決辦法。它很好地結合了回歸樹和多元線性回歸,成功預測連續(xù)值[40-41]。訓練前對自變量進行了標準化處理,利用R3.5.1軟件的Cubist包進行Cubist回歸分析。
1.6.2反向傳播神經(jīng)網(wǎng)絡
反向傳播神經(jīng)網(wǎng)絡是按照誤差逆向傳播算法訓練的多層前饋神經(jīng)網(wǎng)絡,在數(shù)據(jù)分析時不需要建立數(shù)學模型,仿真性強,對各種非線性相關問題有很好的解釋性。它的基本思想是應用最速下降法和反向傳播算法對網(wǎng)絡的權值和偏差不斷進行調(diào)整,在模型的實際輸出值和期望輸出值的誤差最小時或者誤差小于某一期望值時結束訓練。BP神經(jīng)網(wǎng)絡模型拓撲結構由輸入層、輸出層、隱含層構成,本文輸入層選擇為植被指數(shù),輸出層為土壤含水率,隱含層中的網(wǎng)絡層數(shù)為1,隱含層節(jié)點數(shù)通過交叉驗證獲得。為了消除量綱、數(shù)量級等對數(shù)據(jù)分析造成的影響,將各植被指數(shù)進行了歸一化處理[17-18,42]。采用R3.5.1軟件中的nnet包進行BP回歸分析。
1.6.3支持向量機回歸
支持向量機是基于結構風險最小化原理,逐漸發(fā)展起來用于分類和回歸的一種有監(jiān)督機器學習模型。它具有結構簡單、適應性強和全局最優(yōu)等特點,在處理小樣本、非線性以及高維模式識別問題中有優(yōu)勢,在很大程度上克服了“維數(shù)災難”和“過學習”等問題[43-44]。利用SVM在解決回歸問題時,支持向量機回歸的基本思想是通過一個非線性變換將數(shù)據(jù)變換到一個高維特征空間,并在該特征空間建立線性模型來擬合回歸函數(shù)。這種非線性變換是通過核函數(shù)來實現(xiàn)的,常用的核函數(shù)有線性核函數(shù)(Linear)、多項式核函數(shù)(Polynomial)、徑向基核函數(shù)(RBF)等,而采用不同的核函數(shù)會導致不同的SVR算法,本文采用RBF核函數(shù)進行計算,并利用R3.5.1軟件中的e1071包進行SVR分析[19,45]。
采用3個指標對模型的建模和驗證精度進行評估:決定系數(shù)R2(Coefficient of determination)、均方根誤差(Root mean square error,RMSE)以及標準均方根誤差(Normalized root mean square error,nRMSE)。R2越接近1,RMSE和nRMSE越接近0說明模型效果越好,其中nRMSE小于10%表明模型幾乎無差異;介于10%~20%之間表明模型差異較小;介于20%~30%之間表明模型差異一般;大于30%表明差異較大[11,20]。其計算公式為
(3)
(4)
(5)
式中yi——土壤含水率實測值
n——樣本數(shù)
在不同生育期條件下,利用灰色系統(tǒng)對植被指數(shù)與土壤含水率進行灰色關聯(lián)分析,各生育期的植被指數(shù)與土壤含水率(SMC)之間的灰色關聯(lián)度見表4。
從表4可以看出,在同一生育期,不同植被指數(shù)與土壤含水率的GCD不盡相同,以及在不同的生育期,同一植被指數(shù)與土壤含水率的GCD也不相同;其次,利用可見光波段組合的植被指數(shù)的GCD總體較低,但V期有個別植被指數(shù),如GI、NDVIg-b的GCD較高,而包含近紅外波段的植被指數(shù)的GCD總體較高。分別在V、R、M以及全生育期4個不同的生育期內(nèi),篩選出GCD排序前5的植被指數(shù)分別進行建模分析。
圖3 植被指數(shù)變化曲線Fig.3 Changing curves of vegetation indices
根據(jù)不同生育期植被指數(shù)與土壤含水率的GCD情況,每個生育期按GCD由大到小排序選擇的植被指數(shù)如下:①V期:GI、RVI、SIPI、NDVIg-b、MSR。②R期:NDVI、SIPI、MSR、RVI、RVI2。③M期:SIPI、RVI、MSR、RVI2、NDVI。④全生育期:SIPI、NDVI、RVI、MSR、RVI2。以上4個生育期總共選擇了NDVI、MSR、RVI、SIPI、RVI2、NDVIg-b、GI 7種不同的植被指數(shù)。5個不同水分處理小區(qū),每個小區(qū)的3個采樣方植被指數(shù)取平均值,不同的植被指數(shù)隨時間的變化曲線如圖3所示。
從圖3可以看出,由可見光和近紅外波段組合成的植被指數(shù),NDVI、MSR、RVI、SIPI、RVI2總體趨勢為:在生育前期先逐漸增大,生育后期再慢慢減小;由于在DOY214以及DOY240天氣較為干旱,試驗的水分脅迫比較嚴重,所以植被指數(shù)呈急劇下降的趨勢。由于T4在R期設置了水分脅迫處理,因此T4在DOY214的植被指數(shù)“急劇下降”的程度更大;NDVI等5種指數(shù)都是充分灌溉區(qū)T1的植被指數(shù)大于其他水分處理小區(qū),水分脅迫嚴重的T4的植被指數(shù)為5個水分處理小區(qū)的最小值。
由可見光波段組合的植被指數(shù),NDVIg-b、GI與NDVI等近紅外波段構成的植被指數(shù)的變化趨勢不相同。NDVIg-b基本呈現(xiàn)出“先增大后減小,再增大”的變化規(guī)律,在DOY 214和DOY 240水分脅迫較為嚴重時呈谷。GI在生育前期先逐漸增大,在DOY 214形成一個峰值,之后在DOY 235呈現(xiàn)下降趨勢,在DOY 240上升形成另一個峰值,隨后呈下降趨勢;但是它與其他指數(shù)變化有差異,在DOY 214以及DOY 240水分脅迫比較嚴重的階段,它反而上升,在DOY 235反而下降。NDVIg-b、GI與NDVI等近紅外構成的植被指數(shù)變化不相同的原因是:在可見光譜段內(nèi),葉綠素、胡蘿卜素等色素對植被光譜起著支配作用,尤其是葉綠素起著最重要的作用。葉綠素等色素吸收了以450 nm為中心的藍波段以及以670 nm為中心的紅波段的大部分光譜而呈吸收谷,而在540 nm的綠波段附近吸收較少而呈反射峰,若植物受到水分脅迫等形式的抑制,葉綠素含量會降低,使得在藍、紅波段吸收減少而反射增強,尤其是紅反射率增強更為顯著;而在近紅外光譜區(qū),葉片內(nèi)部的細胞結構決定了植物的光譜特性,葉子的細胞壁和細胞空隙間多重反射導致了近紅外光譜的高反射率。水分脅迫狀況的不同和生育期的變化,近紅外波段與可見光波段的反射率變化趨勢和程度并不完全吻合,因此由不同波段構建的植被指數(shù)在生育期的變化會有較大的差異[46]。
對于不同生育期選定的敏感植被指數(shù)建立多元混合線性回歸(Cubist)分析,Cubist模型的兩個重要參數(shù)committees和neighbors通過caret包的train函數(shù)進行模型參數(shù)的優(yōu)選,采用交叉驗證和網(wǎng)格搜索法(Grid search)相結合的方法進行參數(shù)尋優(yōu),選取估算模型的RMSE最小為最終的模型參數(shù)。根據(jù)選定的模型參數(shù)建立不同生育期的Cubist回歸模型(表5)。
表5 基于不同生育期土壤含水率的Cubist模型Tab.5 Cubist regression model of soil moisture content at different growth stages
從表5可以看出,V期、M期、全生育期的建模和預測效果較好,建模和驗證的決定系數(shù)都在0.68以上,并且建模集和驗證集的nRMSE都介于10%~20%之間,屬于較小差異。R期的效果相對較差,建模和驗證決定系數(shù)分別為0.587和0.584。就總體而言,M期的模型為最佳監(jiān)測模型,M期土壤含水率的Cubist模型的建模決定系數(shù)為0.772,稍小于V期的0.806,但是,其驗證決定系數(shù)0.751為4個模型中最高,驗證集的nRMSEv僅為11.39%屬較小差異,RMSE僅為1%,都為4個模型的最小值,且建模集和驗證集的決定系數(shù)也比較接近。
利用caret調(diào)用nnet包訓練單隱含層人工神經(jīng)網(wǎng)絡,最大迭代次數(shù)為1 000,隱藏節(jié)點數(shù)和權值的衰減參數(shù)采用10次的5折交叉驗證和網(wǎng)格搜索法(Grid search)進行參數(shù)尋優(yōu),選取估算模型的平均均方根誤差最小的待選值作為最終的模型參數(shù)[21],根據(jù)選定的模型參數(shù)建立不同生育期的BPNN回歸模型(表6)。
表6 基于不同生育期土壤含水率的BPNN模型Tab.6 BPNN regression model of soil moisture content at different growth stages
由表6可知,基于不同生育期土壤含水率的BPNN回歸模型,V期、M期以及全生育期建模和預測效果較好,建模集和驗證集的決定系數(shù)都在0.7以上,RMSE都在2%以下,nRMSE都在20%以下,表示模型的精度具有較小差異。R期建模和預測效果相較于其他生育期模型較差,其建模和驗證的決定系數(shù)分別為0.517和0.438。總體來看,M期模型效果最優(yōu),其模型的建模集和驗證集的決定系數(shù)最為接近,分別為0.794和0.815,建模決定系數(shù)稍小于V期建模決定系數(shù)0.805,但是驗證集的決定系數(shù)為4個模型的最大值,驗證集的精度指標nRMSEv僅為9.54%,RMSE僅為0.9%,都為4個模型的最小值。
利用e1071包本身的tune.svm函數(shù)進行SVR參數(shù)的最優(yōu)選取,利用格點搜索法選取模型參數(shù)gamma和成本參數(shù)cost,選取交叉驗證誤差最小的模型所對應的參數(shù),根據(jù)選定的模型參數(shù)建立不同生育期的SVR回歸模型(表7)。
從表7可以看出,基于不同生育期土壤含水率的SVR回歸模型當中,V期、M期、全生育期的建模和驗證效果比較好,建模和預測的決定系數(shù)達到了0.7以上,V期、M期的建模和驗證的決定系數(shù)達到了0.8以上,建模集和驗證集的nRMSE都在15%以下,R期的效果相對最差,建模和驗證決定系數(shù)分別為0.619和0.571,不過建模和驗證的nRMSE分別為14.05%和15.53%,都屬于較小差異精度,表明在R期利用SVR回歸同樣具有較強的建模和預測能力。就總體來看,M期的建模和預測效果最優(yōu),建模集和驗證集的決定系數(shù)分別為0.851和0.875,都為4個模型的最大值,驗證集的精度指標nRMSEv僅為8.32%,幾乎無差異,RMSEv僅為0.7%,都為4個模型的最小值。
表7 基于不同生育期土壤含水率的SVR模型Tab.7 SVR model of soil moisture content at different growth stages
4個生育期3種機器學習模型的預測值和實測值比較如圖4所示。從圖4可以看出,除了在R期3種模型的擬合效果相對較差,其余3個生育期模型的預測值與實測值的擬合效果均表現(xiàn)良好。V期SVR模型的斜率接近1,且擬合方程的決定系數(shù)為0.818,為3種模型中的最大值。R期Cubist模型的擬合方程的決定系數(shù)最大,為0.584,但是線條也最為陡峭,BPNN模型的擬合方程的決定系數(shù)最小,為0.438,但是線條較為平緩,SVR模型介于兩者之間。M期的SVR模型和BPNN模型的斜率都比較接近1,且擬合方程的決定系數(shù)較大,Cubist模型稍差。全生育期可以看出BPNN模型和Cubist模型的擬合回歸直線近乎重合,SVR模型的線條更為平緩,且擬合方程的決定系數(shù)最大,為0.729。
土壤含水率是反映農(nóng)業(yè)墑情以及指導灌溉的重要參數(shù),而無人機遙感以其高時效性、高光譜分辨率以及高空間分辨率等性能可對作物根域土壤含水率的狀況實施定點、定時監(jiān)測,是實現(xiàn)精準灌溉的基礎和關鍵。當光照、溫度等條件變化不大時,植被生長狀況主要受土壤含水率影響,此時可利用不同的植被指數(shù)來表征其水分脅迫狀況,進而間接估算出土壤含水率,更為直接地影響土壤含水率的反演精度[14,46-47],而本文利用無人機采集大田玉米全生育期的多光譜影像,利用灰度關聯(lián)法選擇敏感植被指數(shù),結合3種機器學習模型構建作物根域土壤含水率反演模型,結果表明3種模型均具有較高的精度和魯棒性,其中SVR模型的精度最高,這與陳果等[48]和丁世飛等[43]研究SVR算法在小樣本數(shù)據(jù)分析中具有較高精度的結果相一致。并且相較于鮑艷松等[49]利用衛(wèi)星數(shù)據(jù)構建TVDI反演土壤含水率和高中靈等[7]構建ATVDI監(jiān)測土壤含水率,本文所需要的數(shù)據(jù)和方法相對簡單,僅需要無人機獲取的作物冠層多光譜影像以及土壤水分數(shù)據(jù),但是精度并未下降,表明利用無人機采集作物多光譜影像,構建敏感植被指數(shù)進行農(nóng)田水分監(jiān)測有其優(yōu)勢和潛力。
圖4 基于機器學習的土壤含水率實測值與預測值比較Fig.4 Contrast of measured and predicted SMC based on machine learning
本文在各生育期篩選出的植被指數(shù)并不相同,原因為影響綠色植物葉片反射率變化的因素,在可見光譜段和近紅外譜段有著較大的差異。在可見光譜段內(nèi),葉綠素、葉黃素等色素對植被光譜起著支配作用,尤其是葉綠素起著最重要的作用。而在近紅外譜段內(nèi),植物的光譜特性主要受到葉子內(nèi)部的細胞結構的影響,即葉子的細胞壁和細胞空隙間多重反射導致了近紅外光譜的高反射率[46,50]。因而水分脅迫狀況的不同和隨著生育期的變化,不同波段反射率的變化趨勢和程度并不完全吻合,故基于不同波段光譜構建的植被指數(shù),對水分脅迫的響應和隨著生育期的變化有著較大的差異。所以,在同一生育期,不同植被指數(shù)對水分脅迫的敏感程度并不相同;在不同生育期,篩選出的植被指數(shù)也有很大的差異。植被光譜與土壤水分在玉米V期和M期的模型效果較優(yōu),R期效果較差。原因可能為玉米在V期處于快速生長階段,玉米快速生長根系下扎,需求大量的養(yǎng)分和水分,故此時土壤含水率對植被光譜影響較大,二者相關性較好;而玉米處于R期時,考慮到R期為產(chǎn)量敏感期,為了避免玉米嚴重的減產(chǎn),甚至是絕收,此時并未對所有小區(qū)都進行水分脅迫處理[51-52],加上在R期降雨較多,各小區(qū)土壤水分之間幾乎無差距,因此導致反演精度較差;而玉米在M期處于成熟期,地上部分生長茂盛,主要根系較深,根系可以從不同深度的土層吸取水分,加上此時植被基本達到了全覆蓋,土壤像元影響較小,土壤含水率直接影響著植被指數(shù),故此時效果較好。
然而本研究也存在許多不足,機器學習算法將變量之間的關系直接體現(xiàn)在算法之中,無法生成顯性的數(shù)學公式或規(guī)則,因而可能會導致模型的解釋性偏弱[21]。此外,本文主要利用灰度關聯(lián)法選擇植被指數(shù),通過機器學習模型來反演作物根域土壤含水率,并未與相關系數(shù)法選擇敏感植被指數(shù)和其他建模方法(如偏最小二乘法)作對比,同時也沒有考慮到溫度、氣象等因素對土壤含水率的影響。且由于多光譜相機波段的限制,本文并未引入波段外對水分脅迫敏感的植被指數(shù)。故今后應將多光譜傳感器與其他傳感器相結合,同時參考溫度、氣象等參數(shù),以期構建對水分脅迫更為敏感的指數(shù),再運用不同的反演方法進一步驗證,從而得到最優(yōu)根域土壤含水率的反演模型。
(1)經(jīng)過灰度關聯(lián)分析篩選出的植被指數(shù)有NDVI、MSR、RVI、SIPI、RVI2、NDVIg-b和GI,由于不同波段的光譜特征不同,故基于不同波段光譜構建的植被指數(shù)隨生育期的變化會有所不同,對植被脅迫狀況的響應也有所不同。
(2)對不同生育期內(nèi)玉米根域土壤含水率的機器學習模型進行比較,結果表明,多元混合線性回歸(Cubist)、反向傳播神經(jīng)網(wǎng)絡(BPNN)、支持向量機回歸(SVR)3種機器學習方法均在M期取得了最高的精度,其次為V期,而R期模型的建模和預測效果最差,但在全生育期也有較高的建模和預測精度,R2均在0.68以上。說明利用灰度關聯(lián)和機器學習相結合的方法,根據(jù)不同植被指數(shù)間接估算土壤含水率可行。
(3)在同一生育期內(nèi),SVR模型的建模和驗證決定系數(shù)最高,且模型穩(wěn)定性相對較好,均方根誤差RMSE和標準均方根誤差nRMSE最?。籅PNN模型效果次之;Cubist模型相對較差。因此,SVR模型為玉米根域土壤含水率的最優(yōu)反演模型。