曹英麗,江凱倫,劉亞帝,于正鑫,肖 文,于豐華
(沈陽農(nóng)業(yè)大學信息與電氣工程學院/遼寧省農(nóng)業(yè)信息化工程技術中心,沈陽110161)
在水稻生產(chǎn)中,水稻植株的葉綠素含量是反映其營養(yǎng)脅迫、光合能力和健康狀況的重要生化指標之一,也是決定水稻產(chǎn)量和品質(zhì)的關鍵要素[1]。無人機高光譜遙感技術能夠?qū)λ镜娜~綠素含量進行大規(guī)模的連續(xù)監(jiān)測,實現(xiàn)優(yōu)化資源利用和控制水稻健康生長,獲得更好的水稻產(chǎn)量。
高光譜遙感監(jiān)測主要是通過提取作物冠層反射率信息構建光譜特征參數(shù),對作物的葉片葉綠素含量、氮素、葉面積指數(shù)等生物量進行反演,其中紅邊位置(red edge position,REP)是綠色植被反射光譜中較為明顯的光譜特征參數(shù)[2],與作物的葉綠素含量密切相關[3]。相比于受脅迫和不健康的植物,具有較高葉綠素含量的健康植物的REP會向更長的波長移動(紅移)[4]。由于REP對中高密度植被的敏感性更高,因此廣泛用于作為監(jiān)測大田作物生物量的光譜特征參數(shù),例如玉米葉綠素含量[5]、冬小麥葉綠素含量[6]、馬鈴薯植株氮濃度[2]、油菜葉氮含量[7]和小麥冠層氮濃度[8]等。
高光譜REP提取算法主要包括:最大一階導數(shù)(MFD)[9]、線性四點插值(LI)[10]、線性外推法(LE)[11]、多項式擬合(PF)[12]、拉格朗日插值(LAG)[13]和倒高斯模型(IG)[14]等方法。MFD是從反射光譜中提取REP最常用的方法,但是此方法提取的REP數(shù)據(jù)在700nm和725nm呈雙峰分布,并且出現(xiàn)不連續(xù)現(xiàn)象[11]。一些算法傾向于從反射光譜數(shù)據(jù)中提取連續(xù)REP,例如,通過IG方法提取的REP與針葉樹葉綠素含量有顯著的相關性[14]。DAWSON等[13]提出了LAG方法,然而僅當一階導數(shù)光譜可用時,基于LAG和IG的方法才適用[14]。CHO等[11]定義了從4個坐標波段的一階導數(shù)光譜中提取REP的LE方法,以減輕雙峰特征對葉綠素和REP之間相關性的不穩(wěn)定性影響。DARVISHZADEH等[15]通過LE方法提取的REP能夠精確地模擬意大利馬杰拉國家公園的草地葉綠素含量和葉面積指數(shù)。PF技術使用高階曲線擬合光譜,將REP定位為反射光譜的最大一階導數(shù),PU等[12]表明用PF方法擬合的反射率曲線幾乎接近紅邊區(qū)域的實際光譜特性。GUYOT等[10]定義了LI方法,并表明該方法是從反射光譜數(shù)據(jù)中提取REP的一種更實用和更合適的方法,只需要4個波段和一個簡單的插值計算可得到REP。這些提取REP的算法已被證明在監(jiān)測幾種植物的葉綠素[5-6]、氮[7-8]和葉面積指數(shù)[15-16]方面表現(xiàn)出良好的效果。
基于無人機光譜遙感影像的作物營養(yǎng)監(jiān)測模型的構建方法主要包括機器學習和經(jīng)驗統(tǒng)計回歸方法[17]。以機器學習模型為代表的有反向傳播神經(jīng)網(wǎng)絡(BPNN)、支持向量機(SVM)、極限學習(ELM)等,紀偉帥等[18]利用無人機低空遙感技術,通過構建6個特征光譜指數(shù)建立多元線性回歸、SVM、BPNN 3種棉花花鈴期的SPAD值反演模型,其中BPNN模型的決定系數(shù)達到0.758,實現(xiàn)對棉花長勢的監(jiān)測。于豐華等[19]采用PCA提取水稻高光譜特征,利用粒子群優(yōu)化后的ELM建立水稻氮素含量反演模型,決定系數(shù)達到0.838,為農(nóng)用無人機精準施肥提供模型基礎。毛博慧等[20]采取遺傳算法對冬小麥冠層高光譜特征參數(shù)尋優(yōu),利用最小二乘SVM預測冬小麥葉綠素含量,為后續(xù)施肥管理提供依據(jù)。經(jīng)驗統(tǒng)計回歸模型更多應用在研究光譜植被指數(shù)和作物的生理化參數(shù)的關系中,董超等[21]通過無人機采集冬小麥多光譜影像數(shù)據(jù)獲得6種植被指數(shù),建立小麥冠層SPAD值的線性、二階多項式、對數(shù)、指數(shù)和冪函數(shù)模型,反演冬小麥不同施氮水平的狀況。高林等[22]利用大豆的多光譜和高光譜數(shù)據(jù)獲取5種植被指數(shù),結合地面實測LAI構建線性、對數(shù)、冪、指數(shù)、二次多項式等回歸模型,為精準農(nóng)業(yè)研究提供理論研究。本研究通過無人機遙感系統(tǒng)采集的水稻冠層高光譜圖像數(shù)據(jù),對比分析MFD、LI、PF、LE、IG、LAG共6種算法從高光譜反射率數(shù)據(jù)中獲取的REP,然后使用5種統(tǒng)計回歸方法(線性回歸、對數(shù)曲線回歸、乘冪曲線回歸、指數(shù)曲線回歸、二次多項式回歸)和兩種機器學習方法(BPNN、ELM)量化不同REP與水稻葉綠素含量之間的關系,從而建立能夠監(jiān)測水稻冠層葉綠素含量的反演模型,研究結果將有助于建立水稻田大規(guī)模的監(jiān)測技術,為水稻葉綠素的無損、快捷、大規(guī)模診斷提供依據(jù)。
試驗于2019~2020年6~9月進行,地點在沈陽農(nóng)業(yè)大學北方粳型超級稻成果轉(zhuǎn)化基地(118°53′E,38°43′N,平均海拔40m),試驗設計4個施氮水平:N0對照(0kg·hm-2)、N1(150kg·hm-2)、N2(240kg·hm-2)、N3(330kg·hm-2);2019年種植5個粳稻品種:V1(399)、V2(鹽豐47)、V3(橋潤粳)、V4(美豐稻)、V5(鹽粳糯66),共20個小區(qū);2020年種植V1-V3和V5,4個粳稻品種,2019年小區(qū)分布圖如圖1。
圖1 水稻試驗小區(qū)分布圖Figure 1 Distribution of rice plots
1.2.1 無人機高光譜圖像采集 無人機采用深圳大疆創(chuàng)新公司M600 PRO六旋翼無人機,搭載四川雙利合浦公司GaiaSky內(nèi)置推掃式機載高光譜成像系統(tǒng)采集高光譜圖像,高光譜成像傳感器采集的波段范圍為400~1000nm,采樣間隔為0.45nm,在400~1000nm的光譜范圍內(nèi)產(chǎn)生1345個波段。去除了光譜上下邊界上的兩個波段,得有效波段1343個。無人機高光譜成像系統(tǒng)如圖2。
圖2 無人機高光譜成像系統(tǒng)Figure 2 Hyperspectral imaging system of UAV
在數(shù)據(jù)采集過程中,高光譜圖像的采集時間選定每次試驗11∶00至12∶00之間進行。數(shù)據(jù)采集時間為晴天或多云天氣(云量小于20%),太陽光強度相對穩(wěn)定。無人機飛行高度為50m,一幅高光譜場景圖像對應的覆蓋面積為400m2。所有的高光譜圖像都是在水稻生育期獲得的。利用ENVI5.3+IDL軟件對采集到的高光譜數(shù)據(jù)進行處理和提取。在處理過程中,首先采用光譜角度映射器(SAM)去除噪聲,通過計算每個感興趣區(qū)域的平均光譜,得到每個試驗小區(qū)的高光譜信息。
水稻田間冠層數(shù)據(jù)獲取試驗時間范圍主要涵蓋水稻生長中的分蘗期、拔節(jié)期和孕穗期3個時期。人工地面采集數(shù)據(jù)作為無人機高光譜數(shù)據(jù)的地面真值,采集時間與高光譜圖像數(shù)據(jù)采集時間同步。在每個試驗小區(qū)中間長勢均勻區(qū)域隨機選取4穴水稻作為該小區(qū)的樣本點。共有效采集240份水稻樣品,每份樣品取50片冠層葉片放入密封袋中,儲存在溫度約為4℃的移動冰室中。使用手持差分GPS裝置RTK測量采樣點的地理坐標信息,無人機高光譜成像系統(tǒng)獲取的高光譜遙感圖像包含每個像素的GPS信息,將地面數(shù)據(jù)一一對應到HSI數(shù)據(jù)中具有相同GPS坐標的像素。采用移動平均濾波器(moving average filter)對試驗小區(qū)獲取的400~800nm的反射率光譜數(shù)據(jù)進行降噪平滑處理(濾波系數(shù)為0.2),降低噪聲對葉綠素含量反演精度的影響,處理后水稻冠層高光譜曲線如圖3。
圖3 高光譜反射率平滑降噪處理Figure 3 Hyperspectral reflectance smoothing and noise reduction
1.2.2 葉片葉綠素含量測定與高光譜 將水稻樣品送回
實驗室后,從樣品中選出充分展開的葉片,剪碎后相互混合均勻,稱取0.4g置于200mL混合溶液中,混合溶液由體積比9∶9∶2的丙酮、乙醇和蒸餾水3種溶液配置而成。將含葉混合物的溶液在實驗室遮光環(huán)境溫度約為20℃下靜置,待葉樣品呈全白色后,利用分光光度計進行比色,分別測定D663nm和D645nm,按式(1)計算水稻樣品的葉綠素含量(Chl)[23-24]。
本研究進行6次試驗數(shù)據(jù)采集,共收集有效數(shù)據(jù)樣本230個。在數(shù)據(jù)集的劃分中采用5折劃分方法,將數(shù)據(jù)劃為5等分,選擇1個分區(qū)作為測試集,剩下的4個分區(qū)作為訓練集,因此訓練集和測試集共有5組(圖4),表1顯示了其中一組的數(shù)據(jù)統(tǒng)計特征。
圖4 數(shù)據(jù)5折劃分Figure 4 Data partition in 5 fold
由表1可知,除樣本量外,訓練集和測試集具有相似的統(tǒng)計特性。另外,變異系數(shù)大于50%,說明葉綠素含量數(shù)據(jù)具有較高的離散性。在葉綠素含量整體樣本中,其最大值和最小值分別為99.70mg·L-1和2.60mg·L-1,其變幅計算為97.10mg·L-1,樣本的葉綠素含量變異系數(shù)為50.83%,均值為53.197mg·L-1,標準差為27.04,根據(jù)Lilliefors檢驗[25],p=0.4032>0.05,顯著性概率值說明該葉綠素樣本數(shù)據(jù)符合正態(tài)分布,滿足葉綠素含量的反演要求。
表1 水稻葉片葉綠素含量統(tǒng)計結果Table 1 A statistical table of chlorophyll content in rice leave
1.3.1 最大一階導數(shù)法(MFD)在最大一階導數(shù)法[9]中,REP由反射光譜在紅邊區(qū)域的最大一階導數(shù)對應的波長來確定。利用反射光譜的一階差分變換計算一階導數(shù),即:
式中:FDR為在波長i處的光譜反射率的一階導數(shù)值,i位于波長為j和j+1之間的中點;Rλ(j)和Rλ(j+1)分別為波長為j與j+1處的光譜反射率;Δλ為波長為j和j+1之間的差值。
1.3.2 線性四點插值法(LI) 線性四點插值法[10]將紅邊處的反射率曲線簡化為一條直線,利用波長為670nm和780nm的反射率確定拐點處反射率,700nm和740nm處的反射率通過線性插值來估計拐點波長。它僅使用4個波段(670,700,740,780nm)通過兩步簡單的計算來確定REP。
計算拐點處的反射率(Rre):
式中:R為光譜反射率。
計算紅邊波長即紅邊位:
1.3.3 線性外推法(LE)線性外推法[11]計算REP為一階導數(shù)遠紅外區(qū)(680~700nm)和近紅外區(qū)(725~760nm)光譜外推的兩條直線交點所對應的波。
遠紅外直線(Far-red line):
近紅外直線(NIR line):
式中:m和c為直線的斜率和截距。在交點處,這兩條直線有相等的λ(波長)和FDR值。因此,REP即交點處的λ值,可表示為:
線性外推法利用4個波段來計算REP,其中2個固定波段:680nm和760nm(表示紅邊區(qū)域的上下界),通過使用遠紅外與近紅外區(qū)域的不同波段組合得到的REPs與葉綠素含量的相關性強度來確定另外2個波段。
1.3.4 多項式擬合法(PF)多項式擬合法[12]是利用5次多項式函最小二乘擬合到對應于紅邊區(qū)域反射率的波長之間的反射光譜。
式中:λ為從670~780nm中連續(xù)的249個波段。REP由近似源譜的函數(shù)的最大一階導數(shù)來確定的,一階導數(shù)利用一階差分變換計算得出。
1.3.5 倒高斯模型(IG) 紅邊反射率的光譜形狀近似于倒高斯函數(shù)的一半。因此,使用倒高斯模型[13]來擬合紅邊區(qū)域的反射率,反射率方程表示為:
式中:Rs為近紅外區(qū)光譜反射率最大值;R0為紅光區(qū)光譜反射率最小值;λ為波長;λp和σ分別為光譜參數(shù)和高斯模型偏差系數(shù),REP由這兩個參數(shù)確定。
式中:λp和σ可利用線性擬合法計算出,式(3)可變換為:
式中:B()
λ為關于λ的線性方程,因此通過線性回歸可計算出與倒高斯模型兩個參數(shù)相關的最佳擬合系數(shù)a0和a1,λp和σ可表示為:
1.3.6 拉格朗日插值法(LAG)拉格朗日插值法[14]利用光譜反射率的最大一階導數(shù)對應的波長以及相鄰的兩個波段進行插值計算得到REP。
式中:Dλ為波長λ的光譜反射率的一階導數(shù)值;λi為最大一階導數(shù)對應的波長;λi+1和λi-1為相鄰上下的兩個波段。
本研究利用6種紅邊位置提取方法,從水稻冠層高光譜反射率數(shù)據(jù)中獲取REP作為反演模型的輸入,對于反演模型的建立使用5種統(tǒng)計回歸算法(線性回歸、對數(shù)曲線回歸、乘冪曲線回歸、指數(shù)曲線回歸和二次多項式回歸),以及兩種非線性的機器學習方法[反向傳播神經(jīng)網(wǎng)絡(BPNN)和極限學習機(ELM)]。
反向傳播神經(jīng)網(wǎng)絡(BPNN)屬于一種前饋網(wǎng)絡,具有自學習和自適應的優(yōu)點[26-27]。BPNN基于梯度下降策略,根據(jù)實際輸出值和目標輸出值之間的誤差進行參數(shù)調(diào)整。訓練是通過在每個循環(huán)結束時反復更新權值來進行的,直到所有訓練樣本的平均平方和誤差最小化,并且在指定的誤差范圍內(nèi)。更多細節(jié)可以參考[28]。BP NN結構為1-10-1,即輸入層和輸出層為1個神經(jīng)元,隱含層的神經(jīng)元個數(shù)為10,設定學習速率為0.01,最大確認失敗次數(shù)為6,最小性能梯度為10-6,最大訓練次數(shù)為1000次。
極限學習機(ELM)[29]是一種新型的單隱含層前饋神經(jīng)網(wǎng)絡,它與傳統(tǒng)的單隱含層前饋神經(jīng)網(wǎng)絡相比,能夠有效克服傳統(tǒng)神經(jīng)網(wǎng)絡因采用梯度下降法進行訓練而導致陷入局部極值的缺點,并且具有處理速度快、泛化能力強、易于實現(xiàn)等優(yōu)點[30]。ELM輸入層和隱含層的連接權值、隱含層的閾值可以隨機設定,且設定完后不再調(diào)整,而BPNN在訓練過程中需要不斷反向去調(diào)整權值和閾值,ELM在保證學習精度的前提下,比BPNN學習算法速度更快、泛化能力更強。
對于模型的評價,使用五折交叉驗證法:5組測試集的決定系數(shù)(R2)、均方根誤差(RMSE)、絕對誤差(MAE)的各均值作為模型的評價參數(shù),3種參數(shù)的計算公式為:
式中:y^i、yi和yˉ分別為水稻葉綠素含量的預測值、觀測值、平均值;n為樣本的數(shù)量。通過比較不同模型的評價參數(shù),最終選擇最佳的水稻冠層葉綠素反演模型。
在230個葉綠素(Chl)含量樣本中,將葉綠素含量按從小到大順序排列,選取第1~76個葉綠素樣本對應的47條光譜反射率曲線求平均得到的一條光譜曲線作為低Chl含量光譜,同理分別將第77~153和第153~230的葉綠素樣本對應的光譜反射率曲線計算得到中、高Chl含量光譜,3種水平的葉綠素平均含量分別為90.1612,53.5189,15.3215mg·L-1,其對應的光譜反射率在紅邊光譜區(qū)(680~780nm)變化曲線如圖5。在704~780nm可以觀察到相比于低、中Chl含量光譜,高Chl含量光譜表現(xiàn)出更低的反射率,原因是葉綠素含量越高,吸收的紅光越多[20]。
圖5 不同葉綠素含量下的光譜紅邊區(qū)反射率Figure 5 Reflectance of the red edge region of the spectral under different chlorophyll contents
低、中、高Chl含量光譜曲線的一階導數(shù)值由光譜反射率的數(shù)值梯度與光譜波長的數(shù)值梯度的比值計算得到,在紅邊光譜區(qū)(680~780nm)變化曲線如圖6。在波段685~714nm區(qū),3種Chl含量水平的光譜反射率明顯上升,葉綠素含量越低,反射率上升程度越高,這是因為葉片內(nèi)部散射增加的原因[20]。
圖6 不同葉綠素含量下的光譜紅邊區(qū)反射率的一階導數(shù)值Figure 6 The first derivative value of the reflectance in the red edge region of the spectrum under different chlorophyll content
6種不同的方法所提取紅邊位置的頻率直方圖如圖7,相關的統(tǒng)計信息如表2。可以看出MFD所提取的紅邊位置主要分布在700~730nm,而LAG所提取的紅邊位置分布與其類似,并且統(tǒng)計參數(shù)也相接近,這是因為LAG是基于MFD利用一階導數(shù)最大值對應波段與其相鄰的波段進行內(nèi)插;LI提取的紅邊位置變幅較大,主要分布在700~750nm,LE提取的紅邊位置涵蓋了紅邊區(qū)域,經(jīng)過檢驗,兩種方法提取的紅邊位置都符合正態(tài)分布,p分別為0.46和0.50,并且LI和LE所提取的紅邊位置與水稻葉綠素含量皮爾遜相關系數(shù)高于其他4種方法,分別為0.71和0.70。LE中除固定的兩個波段外,另兩個波段由遠紅外和近紅外內(nèi)不同的波段組合得到,不同組合波段下通過LE提取紅邊位置,計算其與水稻葉綠素數(shù)據(jù)的皮爾遜相關系數(shù)最大值來確定最優(yōu)的波段組合,圖8為不同波段組合下計算得到的皮爾遜相關系數(shù)圖,可以看出在近紅外遠紅外691~700nm和731~760nm下的波段組合得到的相關系數(shù)值較大,最大值對應的橫縱坐標即對應所求的2個波段,分別為699.5nm和731nm,波段的組合會因不同作物的和光譜反射率的變化而改變,應根據(jù)作物的改變?nèi)ふ腋鼮檫m合的組合波段[18]。PF提取的紅邊位置主要集中分布在720nm附近,部分分布于780nm,皮爾遜相關系數(shù)最小,為0.28;PF與MFD的原理相似,都是尋通過找紅邊區(qū)域反射率的最大一階導數(shù)值對應的波段確定紅邊位置,不過PF的紅邊區(qū)域反射率是由五次多項式擬合原反射光譜得到,目的是為了減少一階導數(shù)不連續(xù)性的影響,而分布在780nm附近的紅邊位置是由于所擬合的部分多項式函數(shù)在770~780nm出現(xiàn)極值。IG所提取的紅邊位置值主要分布在715~730nm,標準差最小,為3.58。6種方法提取的紅邊位置的均值都接近720nm,LI和LE所提取的紅邊位置與水稻葉綠素數(shù)據(jù)的相關性高于其他4種方法;其中PF提取的紅邊位置過于集中,在730~770nm出現(xiàn)不連續(xù),且與葉綠素的相關性低。
圖7 6種不同方法提取紅邊位置的頻率統(tǒng)計直方圖Figure 7 Frequency statistical histograms of red edge locations from 6 methods
表2 6種不同方法提取紅邊位置統(tǒng)計Table 2 The statistics of red edge position from 6 method
圖8 LE不同組合波段與葉綠素含量相關性系數(shù)圖Figure 8 Diagram of correlation coefficient of different LE combination bands and chlorophyll concentrations
2.2.1 統(tǒng)計回歸模型結果 對6種紅邊位置提取算法分別建立線性模型、對數(shù)曲線模型、乘冪曲線模型、指數(shù)曲線模型和二次多項式模型,各模型的評價參數(shù)以及p值如表3。
表3 基于統(tǒng)計回歸方法的葉綠素含量反演模型信息Table 3 Chlorophyll inversion model information for different statistical regressions
可以看出LE-對數(shù)曲線模型精度最高,測試集R2、RMSE、MAE的均值分別達到0.763,9.249,11.253,p=0.016<5%,具有95%的置信區(qū)間(CI)的回歸系數(shù),LE方法提取的REP和葉綠素含量存在顯著對數(shù)回歸關系;其次是LI-線性模型,測試集R2、RMSE、MAE的均值分別達到0.695,10.106,11.237,p_value=0.032<5%,LI方法提取的REP和葉綠素含量同樣存在顯著線性回歸關系。整體來看,相同提取REP技術下的線性模型、對數(shù)曲線模型以及二次多項式模型更優(yōu)于乘冪曲線模型和指數(shù)曲線模型,R2值都高于后兩者,乘冪曲線模型、指數(shù)曲線模型的R2值偏小,均低于0.35,RMSE和MAE值偏大,該類模型不能夠很好的解釋REP和葉綠素的關系。在6種REP提取算法中,由LI和LE所提取的REP相比其余4種方法更能反映葉綠素含量關系,相同統(tǒng)計回歸算法下所建立的模型的性能優(yōu)于后者。
基于不同技術提取的REP不同模型,由表3可知,除指數(shù)模型外在紅邊波段皆是增函數(shù),可以說明的是與葉綠素含量較低相比,較高葉綠素含量的REP會向較長波長移動,即紅移,另外基于LI的線性回歸結果說明該方法提取的REP與葉綠素含量存在一定的線性關系,這與ANSAR等[16]研究發(fā)現(xiàn)一致。LE-對數(shù)曲線模型和LI-線性模型可以滿足水稻葉綠素的診斷,兩者都是利用四個相應的波段計算求出紅邊位置,對于LE-對數(shù)曲線模型,REP由4個波段(680,699.5,731,760nm)外推的兩條直線的交點所確定,其中699.5nm和731nm這兩個波段由紅邊內(nèi)的波段組合和葉綠素含量的最大相關系數(shù)確定,而對于LI-線性模型,只需4個波段(670,780,740,780nm)的反射率通過簡單的兩步計算[式(3)和式(4)]來直接計算得出紅邊位置。
2.2.2 機器學習建模方法結果 在機器學習建模方法中,同樣利用六種紅邊位置作為模型輸入量,BPNN和ELM的模型參數(shù)結果如表4??梢钥闯?,以LI和LE方法提取的紅邊位置,在兩種模型中表現(xiàn)優(yōu)于其他4種REP提取方法,這與回歸建模的結果一致,LE-ELM模型測試集R2、RMSE、MAE的均值分別達到0.781,8.375,9.828,LI-ELM模型測試集R2、RMSE、MAE的均值分別達到0.702,9.794,9.339。兩種建模方法比較,ELM模型的預測精度優(yōu)于BPNN模型,并且由于ELM的特定超參數(shù)隨機設定后不再調(diào)整,使其學習速度更快。PF和IG方法提取的紅邊位置在兩種建模方法中的精度最低,該兩種紅邊位置不能夠很好地反演葉綠素含量的。值得注意的是機器學習算法在葉綠素反演中更優(yōu)于回歸算法,這是因為機器學習算法通過犧牲可解釋性來獲得更高的預測能力。
表4 反向傳播神經(jīng)網(wǎng)絡和極限學習機的葉綠素含量反演模型信息Table 4 BPNN and ELM chlorophyll content inversion model information
本研究利用無人機采集的水稻冠層高光譜數(shù)據(jù),建立了估算水稻葉綠素含量的反演模型,能夠?qū)λ救~綠素含量進行快速準確的監(jiān)測。為此,比較了6種常用的紅邊位置(REP)提取算法,對從高光譜反射率中提取的REP進行分析和比較。其次,利用5種統(tǒng)計回歸方法(線性回歸、對數(shù)曲線回歸、乘冪曲線回歸、指數(shù)曲線回歸、二次多項式回歸)和兩種機器學習方法(BPNN、ELM),研究紅邊位置與地面所測量的水稻葉綠素含量的關系,最終選取基于紅邊位置水稻葉綠素含量的最佳反演模型。
水稻冠層葉綠素含量高光譜紅邊特性分析結果表明,紅邊區(qū)域(680~727nm)觀察到水稻冠層表現(xiàn)出更敏感的光譜響應:低葉綠素含量的近紅外光譜區(qū)(660~727nm)反射率較高、高葉綠素含量的REP出現(xiàn)紅移。水稻葉綠素含量統(tǒng)計回歸模型結果表明,LE-對數(shù)曲線模型表現(xiàn)出良好的葉綠素預測性能,測試集R2、RMSE、MAE均值分別達到0.763,9.249,11.253,構成波段組合的另2個波段為699.5nm和731nm,REP分布范圍涵蓋紅邊區(qū)域(660~780nm),該模型能夠較準確反演水稻葉綠素含量。LI-線性模型模型測試集R2、RMSE、MAE均值分別達到0.695,10.106,11.237,該方法計算簡單,可為水稻葉綠素檢測儀的開發(fā)提供理論依據(jù)。水稻葉綠素含量機器學習反演模型中,以LI和LE所提取的紅邊位置作為特征輸入,相比與其他4種REP提取方法表現(xiàn)出更好的預測效果,在BPNN模型中,以LE提取的REP作為模型輸入,測試集R2、RMSE、MAE均值分別為0.699,10.818,10.427。對于ELM模型,其中LE-ELM模型和LI-ELM模型的測試集R2、RMSE、MAE均值分別為0.781和0.702,8.375和9.794,9.828和9.339,滿足對水稻葉綠素含量的反演要求,LE-ELM模型在所有模型中,其預測精度最高,能夠有效準確地評估水稻葉綠素含量。與BPNN算法相比,ELM有著預定義的網(wǎng)絡架構,不需要手動調(diào)整參數(shù),有更快的學習速度、更高的泛化性能。