王瑾杰,丁建麗,葛翔宇,張 喆,韓禮敬
1. 新疆大學地理與遙感科學學院,新疆 烏魯木齊 830017 2. 北京師范大學防沙治沙教育部工程研究中心,北京 100875 3. 中國科學院數(shù)字地球重點實驗室,北京 100094 4. 新疆大學新疆綠洲生態(tài)自治區(qū)重點實驗室,新疆 烏魯木齊 830017 5. 新疆大學智慧城市與環(huán)境建模自治區(qū)普通高校重點實驗室,新疆 烏魯木齊 830017
土壤含水量(soil moisture content,SMC)是區(qū)域精準農(nóng)業(yè)和水資源管理中易受影響的重要參量,是約束作物生態(tài)化學參數(shù)的關鍵指標[1]。在干旱和半干旱地區(qū),農(nóng)業(yè)極易受到干旱脅迫,造成作物長勢稀疏、 產(chǎn)量下降[2-3]。盡管干旱區(qū)農(nóng)業(yè)水資源具有重要意義,但在實踐中仍然缺乏快速易行、 無損監(jiān)測的手段。特別是農(nóng)業(yè)土壤被作物覆蓋,土壤水分的變化以植被生物化學結構表現(xiàn),常見的星載光學遙感光譜分辨率較低,難以完整捕捉植被生物化學結構的細微變化[4]。因此,及時精準地掌握農(nóng)業(yè)區(qū)域SMC的空間分布對精準農(nóng)業(yè)和農(nóng)業(yè)信息化發(fā)揮著重要作用。
隨著無人機遙感技術在農(nóng)業(yè)中的推廣,及時的無損監(jiān)測逐漸成為可能[5-6]。機載高光譜成像傳感器能有效捕捉作物冠層特征,提供豐富的光譜信息,并保留地理空間屬性[7]。然而,從高維的高光譜數(shù)據(jù)中挖掘出敏感變量仍存在一定難度。高光譜成像儀的波段范圍適用于農(nóng)業(yè)區(qū)域作物覆蓋區(qū)域的監(jiān)測[8]。雖然光譜范圍較小(400~1 000 nm),但包含植被生化結構敏感波段和植被紅邊信息波段,并被證明植被冠層的光譜特征在不同的SMC脅迫條件下發(fā)生變化[9]。因此,通過挖掘植被冠層信息估算SMC的研究值得探索。近年在高光譜數(shù)據(jù)挖掘研究中,微分處理受到廣泛關注[10]。袁婕等通過一階和二階微分光譜變換,探尋與植被鹽分關聯(lián)程度較高的敏感波段,并提升模型定量估算的效果[11]。Wang等考慮基于一階和二階微分光譜獲得植被冠層的紅邊參數(shù),并通過紅邊信息發(fā)現(xiàn)植被受到的脅迫程度[12]。盡管這些研究已經(jīng)取得較好的結果,但整數(shù)階微分處理仍有局限,整數(shù)階微分可能造成光譜部分信息的丟失,并引入大量噪聲峰[13]。此外,因一階微分與二階微分的波形差異較大,可能會忽略由于作物根部SMC造成冠層光譜細微的差異[14]。高整數(shù)階微分處理可以增強成像光譜的圖像邊緣,然而精細的紋理和平滑的區(qū)域可能會被忽略[15]。分數(shù)階微分利用較窄的階數(shù)區(qū)間擴展了整數(shù)階微分在光譜預處理中的應用[16],從而為處理機載高光譜數(shù)據(jù)提供了新的視角。
基于此,以干旱區(qū)典型農(nóng)業(yè)區(qū)為研究對象,利用機載高光譜傳感器獲取成像光譜數(shù)據(jù),基于分數(shù)階技術挖掘冠層光譜信息與SMC間的敏感關系,以期提高SMC估算精度,旨在為干旱區(qū)的精準農(nóng)業(yè)和農(nóng)業(yè)信息化提供準確而有前景的解決方案。
試驗田位于烏魯木齊市東北隅的阜康市,北鄰庫爾班通古特沙漠,是綠洲與荒漠的交錯帶(圖1)。該地區(qū)以溫帶大陸性沙漠氣候為特征,年平均降水量200 mm,全年無霜期176 d,年平均氣溫7.1 ℃,降水分布不均勻。阜康市是糧食、 優(yōu)質蔬菜和特殊作物生產(chǎn)的重要基地。試驗田內種植冬小麥,熟制為一年一熟。
圖1 研究區(qū)及采樣點分布 (a):高分1號RGB真彩色合成的阜康市及采樣區(qū)示意圖;(b):采樣點示意圖Fig.1 The study area and distribution of sampling points (a): RGB true color image of Fukang city and study area using Gaofen-1; (b):Sampling points
在試驗區(qū)內均勻地布設采樣網(wǎng)格(0.5 m×0.5 m),并用GPS記錄網(wǎng)格中心位值坐標。每份土樣通過環(huán)株四點法混合收集,均為表層土(0~10 cm)。土壤樣品采集時均以鋁盒密封,在室內處理。通過室內烘干(105 ℃烘干箱,48 h)計算得到SMC數(shù)據(jù)集。
無人機作業(yè)采用DJI Matrice600Pro?(中國深圳大疆創(chuàng)新科技有限公司)無人機平臺和Headwall Nano-Hyperspec?高光譜傳感器(Headwall Photonics Inc.,Bolton,MA,USA)。成像光譜儀具有400~100 nm的波段范圍,6 nm的光譜分辨率,2.2 nm的重采樣間隔和272個光譜波段。當航高為100 m時,所捕獲影像空間分辨率為4 cm。高光譜數(shù)據(jù)于2018年4月17日15:00獲取,作業(yè)時響晴無風,并遵循暗電流去除和白板校正流程。室內通過Hyperspec Ⅲ和Headwall SpectralView軟件進行高光譜數(shù)據(jù)預處理和正射校正,利用Savitzky-Golay濾波器(second-order polynomial smoothing and 5-band window width,S-G)平滑處理影像(視為原始影像)。S-G平滑處理在MATLABR2016b(The MathWorks,Natick,MA,USA)中進行。所獲取的影像長250 m,寬100 m,面積為2.5×104m2。
圖2 無人機作業(yè)及機載高光譜傳感器Fig.2 UAV operation and UAV-based hyperspectral sensor
根據(jù)分數(shù)階微分(fractional order differential,F(xiàn)OD)方法的幾何和物理意義,F(xiàn)OD理論更適合處理分形問題。分數(shù)階的幾何意義是函數(shù)曲線的一般斜率,物理意義是分數(shù)流和廣義振幅。一般來說,物體的光譜被視為一個物理光電信號[15]。分數(shù)階微分通常有三個定義,包括Caputo,Riemann-Liouville,Grünwald-Letnikov(G-L)。我們根據(jù)研究的可持續(xù)性選擇了G-L定義[16]。先前的研究中表明,三種算法定義中G-L在處理一維光譜時是有效的[16-17]。我們利用式(1)在MATLABR2016b中對成像光譜進行處理,在0~2階區(qū)間內進行了20次分數(shù)階變換,步長為0.1。
(1)
式(1)中,x為自變量,v為階數(shù),Γ(g(x))為Gamma函數(shù),m是微分上下限差。當v=0.0則表示原始光譜,v=1.0則表示一階微分,v=2.0表示二階微分。
選擇基于聯(lián)合x-y距離 (Simple set portioning based on joint x-y distance,SPXY)方法[18]對70個樣本執(zhí)行劃分,50個樣本為建模集,其余20個樣本作為驗證集。在構建估算模型時,全部波段作為預測變量,實測SMC則為響應變量。
梯度提升回歸樹(gradient-boosued regression tree,GBRT)是基于決策樹的集成學習模型[19]。GBRT對解釋冠層光譜信息與SMC的非線性關系極具潛力,是一種魯棒性較強的估算模型。因其集成了多個弱學習機,并將多個弱學習機組合成共識模型,在先前研究中GBRT表現(xiàn)出優(yōu)于隨機森林的潛能。GBRT本質是在每次迭代時添加新的學習機,并利用最小二乘法最小化負梯度,對前一次遺留的殘差的輸入,允許從中學習,從而實現(xiàn)集成的效果[20]。GBRT關鍵參數(shù)設置如下:樹的個數(shù)(n.trees)=500,樹深(max_depth)= 5。
經(jīng)SPXY模型劃分后樣本集合描述性統(tǒng)計結果如圖3,小提琴圖中三條曲線為核密度估計,其面積越大表示樣本量越多,箱線的上下限分別表示一分位數(shù)和三分位數(shù)。全集、 建模集和驗證集的均值(Mean)分別為24.464%,24.090%和25.400%,標準差分別是5.408%,5.832%和4.148%。相近的統(tǒng)計特征可以最大程度保證估算模型的效果,此外,各數(shù)據(jù)集樣本分布直方圖也保持近似的分布,可證明SPXY劃分數(shù)據(jù)集具有較好的代表性,盡可能降低在模型估算中的誤差。
圖3 樣本集的描述性統(tǒng)計圖Fig.3 Descriptive chart of the sample sets
無人機高光譜影像具有圖譜合一的特征,因而將從影像和光譜兩個層面分析FOD處理后的效果。圖4和圖5分別是RGB影像和平均光譜。低階FOD(0<階數(shù)<1)和高階FOD(1<階數(shù)< 2)的結果有顯著差異。在RGB影像中,低階FOD的影像仍能保持較好的清晰度,但從0.6階逐漸增現(xiàn)部分噪聲,使得隨著階數(shù)增加圖像清晰度下降。高階FOD而言,噪聲隨著階數(shù)增加而增加,難以清晰地分辨影像目標。圖5中紅色為平均光譜,藍色區(qū)間表示均值加減標準差。低階FOD的光譜區(qū)間能維持與植被光譜形似的光譜曲線,特別是對于水、 氧吸收谷區(qū)域(760 nm附近)突顯。然而,高階FOD處理后的光譜曲線隨著階數(shù)增加,植被光譜曲線形態(tài)特征喪失越明顯,相應地增加了噪聲峰。因此,從光譜特征角度可確定低階FOD是處理無人機成像高光譜數(shù)據(jù)的首選方案。
不同F(xiàn)OD處理下光譜與SMC的相關系數(shù)如圖6所示。與高階FOD處理下光譜與SMC的相關系數(shù)相比,低階FOD的相關系數(shù)較高,并集中于可見光波段范圍內。通過比較不同預處理下光譜和SMC的最大絕對值(rmax),表明在0.4階時,rmax值最大(rmax=0.768),低階FOD的rmax整體上優(yōu)于高階FOD。在高階FOD中,rmax變化較緩,顯示出略高于原始光譜(0階)與SMC的rmax值。與整數(shù)階微分(一階微分和二階微分)的結果相比,0.4階處理的光譜與SMC的相關性分別提高了0.157和0.158。因此,F(xiàn)OD可以很好地挖掘和凸顯細微光譜間信息,提高光譜與SMC的相關性。
圖4 分數(shù)階微分處理后的高光譜影像 (a):高光譜影像立方體;(b)—(u):0.1階—2階處理結果Fig.4 Hyperspectral images after FOD processing (a):Hyperspectral image cube; (b)—(u): Processing results of 0.1 to 2 orders
圖5 不同的FOD預處理光譜曲線Fig.5 Spectral preprocessed by different FOD
圖6 不同F(xiàn)OD處理下光譜與SMC的相關系數(shù) (a):不同預處理下光譜與SMC的相關系數(shù)熱圖;(b):不同預處理下光譜與SMC相關性系數(shù)的最大絕對值Fig.6 The correlation coefficient between band and SMC under different FOD pretreatments (a): Heatmap; (b): Maximum correlation coefficient
表1 基于不同F(xiàn)OD建模策略SMC的GBRT估算模型比較Table 1 Comparisons of GBRT models based ondifferent modeling strategies
集成學習算法優(yōu)勢在于對參與模型的變量均能賦予相應重要程度,不同F(xiàn)OD下的全波段重要性如圖9所示。FOD處理后的光譜對SMC重要性最高的波段集中在400 nm附近,藍光波段處通常為葉片含水量緊密相關。此外,在低階FOD中,波段重要性主要集中在400~500,520和970 nm附近。對于高階FOD,更重要的區(qū)域集中在大約400,640和720 nm附近。上述波段范圍與植被的葉綠素、 作物脅迫和水分存在較好的響應。相較于原始波譜重要性而言,F(xiàn)OD技術挖掘了更多波段的協(xié)同響應。
圖譜合一的無人機高光譜影像包含大量信息,光譜微分技術是分析反射光譜的一種有利方法,可以消除背景噪聲、 銳化光譜特征[20]。FOD技術與整數(shù)階微分相比,挖掘了光譜中細微的信息,并且光譜保留了光譜原始的特征(圖5),低階FOD處理后影像在紅邊區(qū)域非常明顯。FOD技術在提
圖7 實測SMC與估算SMC散點圖Fig.7 Scatter plot of measured SMC and estimated SMC
圖8 最優(yōu)模型下SMC空間分布Fig.8 SMC spatial distribution under the optimal model
圖9 不同預處理下波段重要性Fig.9 Bands importance under different FOD pretreatment
高光譜與SMC相關性的同時,改善模型精度。近年來,對高光譜數(shù)據(jù)的預處理主要集中于整數(shù)階微分處理,相較之下,二階微分處理效果不如一階微分處理,其結果表現(xiàn)不足[23]。高階FOD處理效果同樣不如低階FOD處理結果,因在高階FOD處理結果中,光譜在近紅外區(qū)域(900~1 000 nm)出現(xiàn)大量噪聲峰,圖像隨著階數(shù)的增加清晰度開始下降。因此高階FOD可能不適合機載高光譜數(shù)據(jù)。FOD技術一定程度上擴展高維數(shù)據(jù)對預處理需求,同時對數(shù)據(jù)的挖掘極具潛力。值得注意的是,F(xiàn)OD技術理論上對等距間隔數(shù)據(jù)才可執(zhí)行,對于非等距光譜間隔的星載遙感影像略顯乏力。
植物生物物理特性和生物化學特性極易受到土壤屬性的脅迫。特別是,干旱脅迫使葉綠素吸收強度變化,從而誘發(fā)植被冠層光譜的差異,在作物生長的早期,干旱脅迫的影響尤為明顯。采樣時節(jié)正值冬小麥返青期,SMC對作物葉綠素含量的邊際效應隨SMC的增加而增加[24]。從植物生化組分的光譜吸收特征及形成機理的角度出發(fā),與葉綠素極大相關的關鍵位值基本在430,460,640和660 nm[25]。結合圖9所示的波段重要性分析,不難發(fā)現(xiàn)分數(shù)階微分處理后的光譜挖掘出更多與葉綠素強相關的光譜信息并協(xié)同了部分水分強吸收的信息。低階FOD更多地拓展了430~460 nm的光譜信號,而高階FOD更傾向于在紅邊和近紅外附近挖掘更多信息。在此基礎上,基于植被光譜信息定量估算SMC在物理原理上是可行的,利用植被光譜信息反演SMC存在清楚的遙感和光譜機制。在作物覆被較高的生長期,利用機載高光譜數(shù)據(jù)獲取冠層光譜信息,從而方便制定更合理的精準農(nóng)業(yè)灌溉管理方案。
即使機器學習往往能很好的解釋非線性關系,但模型的訓練盡可能需要大量樣本和適合的超參數(shù)[25]。正因如此,本工作采用集成學習算法進行估算,集成學習可以有效地規(guī)避小樣本建模估算的問題。從實測值與估算值的散點圖(圖7)中發(fā)現(xiàn),算法出現(xiàn)了部分低估的現(xiàn)象,但在建模過程中取得了較好的精度和性能??傊?,間接估算受脅迫的植被冠層光譜可能為SMC定量估計提供新的視角。此外,輻射傳輸模型和熱紅外數(shù)據(jù)在近年研究中應用于水分脅迫等研究[26],結合更多的理論和數(shù)據(jù)可能會帶來更令人期待的估算結果。雖然本研究通過FOD技術有效地挖掘了“返青期”的冬小麥冠層信息,但由于現(xiàn)實情況限制,物候情境下的無人機高光譜數(shù)據(jù)未能采集,我們將進一步探索和實踐。在此基礎上,有助于實現(xiàn)了精確的灌溉管理,為干旱地區(qū)的綠洲農(nóng)業(yè)日益脆弱的農(nóng)業(yè)生態(tài)系統(tǒng)提供科學支持。