張兵+范澤華+姚江河+陳杰
摘要:采用頻譜測量的谷物氮元素估算方法易受作物水分等因素的影響,對此提出了采用近紅外光譜與最小二乘法(PLS)的小麥氮素與水分預測方案。采用光譜傳感器獲得的光譜反射率數據(光譜范圍是400~950 nm),在植物生長階段(BBCH 32)測試了是否可以估算春小麥中的氮與水分。2014—2015年,在甘肅地區(qū)進行小麥的田地試驗,試驗場共包含36個小區(qū),在播種期間主小區(qū)使用氮施肥(N 70 kg/hm2或100 kg/hm2),子塊則使用水灌溉。在BBCH 32,對所有的小區(qū)使用便攜式光譜儀測量其冠層反射率,然后,每個小區(qū)選擇0.25 m2樣方作為地表小麥作物量的采樣,并分析總氮量。首先通過對數線性比對光譜數據進行預處理,然后使用Savitzky-Golay方法與均值化對其進行第一階導數濾波,然后,通過偏最小二乘法(PPLS)結合光譜信息與正定數據對模型進行校準。結果表明,本方法優(yōu)于基于指標的方法,其最優(yōu)模型的氮、水分性能分別為RPD=2.26、RPD=1.49。
關鍵詞:春小麥;近紅外光譜;最小二乘法;主成分分析;氮含量估算;水含量估算
中圖分類號: S127;S512.106 文獻標志碼: A
文章編號:1002-1302(2016)09-0374-05
氮是決定作物成長情況的重要養(yǎng)分,因為異質型土壤的質量在空間上有所變化,所以氮的使用效率也呈現空間性變化[1-2]。為了優(yōu)化農產品企業(yè)的經濟效益,應當使用均勻的氮施肥比例[3]。
采用電磁頻譜[4]中可視與近紅外頻譜范圍的電磁能光譜反射可實現氮含量的估算,電磁頻譜的可視范圍(400~700 nm)會被葉片組織的葉綠素影響,電磁頻譜的近紅外頻譜為700~2 500 nm[5-6]。可見近紅外光譜法具有分析簡便快速、低成本、無污染及樣品的非破壞性和多組分同時測定等優(yōu)點[7~12]。本研究基于近紅外技術的廣泛使用對小麥的含氮量與含水量進行無損檢測。
1 材料與方法
1.1 農田試驗
在甘肅地區(qū)合作農產品企業(yè)的幫助下進行農田試驗,試驗區(qū)域的經緯度為(103.73°E,36.03°N,海拔1 537 m),年平均降水量為310 mm,年平均溫度為10 ℃,平均生長季溫度約15 ℃,試驗地的地形平坦。
農田試驗占地22.5 m×45 m,將其劃分為若干個2 m×7.5 m 大小的小區(qū),每個小區(qū)的兩邊均設置1.5 m×7.5 m的邊界區(qū)來防止邊緣效果,如圖1所示。
對主小區(qū)注入氮養(yǎng)分(分別為70或100 kg N /hm2),對子區(qū)域則使用水灌溉[分為3個灌溉級別:少量水灌溉(W-),自然水灌溉(W0),額外的水灌溉(W+)]。具體處理方法為W-:在小區(qū)內放置2.5 m×4 m的塑料與鋁合金框架遮雨;W0:僅有自然雨水灌溉,無外部水灌溉;W+:除降水以外,額外采用外部水灌溉。W+小區(qū)則采用便攜式滴灌設備對其進行額外水灌溉(覆蓋面積為2 m×4 m),按照不規(guī)則的時間間隔共進行40 mm水灌溉。在2014年與2015年分別進行了4、5次額外的水灌溉,如圖2所示。
在2014年與2015年相同的試驗田位置進行田地試驗,每年同一季節(jié)進行春小麥的播種與施肥。
1.2 環(huán)境條件與土壤含水量
距離試驗田約100 m處設置了1個小型氣象站,每隔1 h測量降水量與大氣環(huán)境參數。在2014年,每星期在每個處理小區(qū)中,通過頻域反射儀對4個深度(10、20、30、40 cm)監(jiān)控土壤的體積含水量。為了增加測量的頻率,本試驗采用ECH2O介電常數傳感器在9個選擇的塊中(10、20 cm深度)分別連續(xù)地測量土壤環(huán)境(圖2)。使用文獻[13]的轉換函數與土壤的紋理數據,計算土壤凋蔫點(-1 500 kPa)等級等重要土壤環(huán)境參數。
在2014年,測量之前的兩星期相對較干燥,僅有12 mm降水量, 而發(fā)芽期間的降水量為[KG*5]72mm; 2015年同一時間的降水量則分別是31、162 mm。2014年從發(fā)芽直到測量時的平均空氣溫度為10.4 ℃;2015年的相應溫度為12.0 ℃。2014年發(fā)芽到測量時間點土壤上部(0~20厘米)的含水量平均值是15%,2015年對應的平均值為25%。
1.3 頻譜測量
在冠層生長期(BBCH32)測量了冠層反射率,測量方法為采用便攜式田地光譜儀(Carl-Zeiss光譜儀與Hamamatsu傳感器相連,并通過PCI-USB操作控制器),傳感器記錄太陽輻射與小麥冠層反射的輻射。將輸入輻射反射分割以獲得反射率數據,在作物冠層之上1.5 m處使用離最低點60°的視角操作儀器。
1.4 參考測量
頻譜測量之后,選擇地上小麥生物量作為樣本并作為參考,樣本選擇方式為:在每個試驗中劃分1個0.25 m2的樣方(圖1)。采樣后每隔30 min進行以此采樣,并更新各統(tǒng)計參數值。然后將樣本置于60 ℃的環(huán)境下做干燥處理(持續(xù)48 h),然后稱作物的干質量。通過提取水元素來計算作物的水含量,通過比色法(使用FIAstar 5000流動注射分析儀)分析氮含量。
1.5 數據分析與統(tǒng)計
每年對新鮮(干燥)的作物量、植物水分以及氮含量使用分塊模型進行方差分析,分塊模型中將氮處理作為主小區(qū),水處理作為子小區(qū)。將氮、水含量作為固定因子,將其他因子作為隨機因素。所有測試中假設顯著性值為P<0.05,圖3所示是平均數據的箱線圖。
Wis-NIR波譜的預處理過程如下。初步測試之后,選擇3個方法來獲得最優(yōu)的校準結果:(1)對數線性化;(2)Savitzky-Golay方法的一階濾波;(3)平均歸一化方法。使用主成分分析法(PCA)對多光譜數據進行降維處理,在2年的數據集分析中,因為析因模型的不確定性,成分分數的分配與加載是一個矩陣旋轉的任意結果,所以本研究改變PC1與PC3分數的分配來確保單年數據集的分組準確性。使用PLS與PPLS回歸從輻射度數據估算出冠層的特征。因為相關的樣本較?。▎文阯=36,2年為n=72),本研究采用leave-one-out交叉驗證方法。
為了評估模型的性能,本研究計算交叉驗證模型統(tǒng)計的集合,其中包括根均方誤差(RMSE)、決定系數(R2)、一致性相關系數(定義為數據集的標準偏差與對應數據集模型預測RMSE的比例)。如果估算的RMSE與種群傳播相比較大,RPD相對較小且校準模型是非魯棒的,那么RPD與R2之間具有確定的函數關系:RPD值越高,則模型的估算能力越強。本研究結論的模型性能主要基于RPD值,其中測試過程參考文獻[14]:狀態(tài)為RPD<1.4的模型無法用于預測;狀態(tài)為1.4≤RPD≤2的模型具有預測潛力;RPD>2的模型具有預測能力。然后使用Akiake信息準則選擇模型分量的最優(yōu)數量[15]。
PPLS與PLS之間最大的差異是控制參數g,通過該參數可直接調節(jié)PPLS算法,g=0.5時PPLS模型則變換為普通的PLS模型。使用PPLS算法建模,調節(jié)g參數以獲得RPD最大值,校準的PPLS模型包含1個回歸系數的集合,其中每個系數對應1個測量的頻帶。本研究為植物的氮、水含量均建立了3個模型的校準程序。
除了多元建模,本研究測試所選擇指標的預測能力最終將對應VI的計算值作為獨立的變量,采用線性回歸方法實現回歸處理(代替PPLS)。
2 結果與分析
2.1 參考數據
首先為主要效果:水灌溉對測量的生物量與植物水含量產生了明顯的影響,但是并不影響氮含量。地表小麥植物中施氮肥100 kg/hm2的小區(qū)比70 kg/hm2的小區(qū)生物量、含水量以及氮含量多,2015年新鮮生物量的差異較為明顯。
在處理層,氮含量較高的小區(qū)生物量越多(W+N100),而2種不同水含量供給模式的生物量接近,其中,W-小區(qū)的生物量最少(圖3)。
2.2 光譜數據
原始反射率數據的方差在NIR范圍中高于頻譜的可視部分,如圖4所示,W+小區(qū)的冠層比W-小區(qū)多反射10%以上的NIR輻射能量。在NIR區(qū)域與綠色頻帶中(540~550 nm),反射數據中氮含量的影響較低,但隨著氮含量的升高,反射率升高;而在其他頻帶中則具有最小的方差,例如,低含氮量小區(qū)(藍色、紅色頻帶)的反射率較低。對原反射率數據預處理以防止早熟并且消除頻譜方差之間的差異。在頻譜區(qū)域400~420、510~530、620~660、690~710 nm(圖4),方差有所變化。
2.3 分類
在多元化分析的第一步,測試頻譜數據是否包含在不同的處理條件下足夠區(qū)分氮含量與水元素的信息。使用PCA為相關頻帶融入新的變量,在每個分析的頻譜數據集中,前3個主成分的數量高于總方差的98%,如圖5所示。
第1個主成分(PC1)包含植物水含量的信息,圖5中可看出,沿著PC1坐標上,W-小區(qū)與W+小區(qū)之間具有明顯的差異。分別分析2014年與2015年數據,W-小區(qū)的所有分數為負值,W+的所有小區(qū)分數是正值。在2014年相對干燥的季節(jié),W0分數最高與W-分數為同一級別,在2015的潮濕季節(jié),W0的分數與W+分數相當。
第2個主成分(PC2)包含的主要信息與植物氮含量相關,分別分析每年的情況,氮比例最高的小區(qū)趨向于負的,氮比例最低的小區(qū)總體為正的。
在2年總數據集的PCA分數小區(qū)中,最相關信息包含于PC1與PC3中。這說明PC2數據中包含額外的重要變化,大約為總方差的28.5%,本研究將變化歸因于2年之間數據集的差異性。
2.4 校準
在PCA分類步驟中,分別處理各小區(qū)獲得了較好的質量結果,本研究從氮與水含量的冠層光譜分析量化的信息。表1所示是多元PLS與PPLS的水與氮含量結果,其中對頻譜反射數據進行預處理,并使用選擇的窄帶植被指數完成線性回歸。
比較2個測試的多元校準方法,本研究發(fā)現一個總體輕度較好的性能PPLS方法比PLS。水含量被最優(yōu)估計使用PPLS模型,將g值設為0.9,然而氮含量被最優(yōu)估算,將g值設為0.8。PPLS與PLS模型之間RMSE的差異可忽略不計,但是更多信息的策略RPD顯示估算的提高當是使用PPLS建模的時候。
考慮單年數據集的多元校準,證明水含量與頻譜數據的相關性(R2=0.87)優(yōu)于氮含量(R2=0.59),綜合2年數據集則對2個特征分析均可獲得較好的分析效果。因為R2增加到0.86的級別,所以氮含量的預測效果提高明顯;多元模型對于2年綜合的水含量估算僅略差于2013年的數據集。2年綜合數據集的PPLS模型RPD值高于2,說明在量化模型中使用2個模型的有效性。
作為比較,本研究也測試了線性模型對水與葉綠素狀態(tài)指標的有效性。對于估算氮與水含量的效果,多元模型優(yōu)于基于指標的模型。對于2季的數據集,氮含量數據都可建立較好的模型,因為綜合數據集的所有測試指標獲得的RPD值均大于2,而單年數據集獲得了較差的校準效果,其RPD值低于1.4,所以對于定量的氮估算,不可采用NDVI的結果。
通過比較可看出,所有的指標中基于NDVI的方法給出了水分估算的最優(yōu)結果,一致性系數低于NDVI,說明其模型可能過度估算了極值。當從2年中遍歷水分數據,基于指標的模型性能較差。
以下部分提出氮、水含量最適應的校準模型,如圖6所示。模型使用PPLS,其g值分別為0.8與0.9。深度分析線性模型使用X-Y孤立點,Q-Q分布與Cook距離指出幾個對應的孤立點。從圖6的分布可看出,通過刪除孤立點可明顯地改進模型的適應度。
3 討論
在Vis-NIR區(qū)域(400~950 nm)使用冠層反射的頻譜信息,本方法在BBCH 32階段可在地表區(qū)分小麥的水分與氮含量。在處理層,通過PCA分開定量處理,使用PPLS模型定量地估算氮、水含量,并基于參考數據校準。此外,本研究檢測了不同的頻帶間隔(對于水模型尤其重要),在頻譜中減小近紅外區(qū)域(400~950 nm)。假設傳感器具有有效的頻譜范圍來區(qū)分谷物中的水與氮含量,該假設對于施肥的優(yōu)化極為重要。
4 結論
Vis-NIR區(qū)域的頻譜信息(400~950 nm)可用于小麥中氮與水含量的估算,該信息對于氮含量的優(yōu)化極為重要。本方法融入了反射數據的多元化分析,并采用數據預處理技術來估算田地異質性等因素所引起的方差。而基于指標的方法則不具備足夠的信息來估算氮、水含量。
參考文獻:
[1]許圓圓,祖艷群,陳建軍,等. 元陽梯田周圍不同植物群落氮元素背景值特征及其元素循環(huán)[J]. 云南農業(yè)大學學報:自然科學版,2012,27(2):270-275.
[2]彭向永,常 寶,徐術人,等. 谷胱甘肽對小麥幼苗銅毒害的緩解作用及其與氮、硫、磷積累的相關性[J]. 農業(yè)環(huán)境科學學報,2012,31(5):867-873.
[3]黃 擎,劉博睿,蔡華杰,等. 凍融交替對不同施肥水平的黑土中氮磷元素含量的影響[J]. 農業(yè)工程學報,2015(增刊1):188-195.
[4]王 磊,謝樹果,蘇東林,等. 基于時間序列分析的頻譜異常自主檢測和穩(wěn)健估計方法[J]. 電子學報,2014(6):1055-1060.
[5]何東健,陳 煦,任嘉琛,等. 土壤速效磷含量近紅外光譜田間快速測定方法[J]. 農業(yè)機械學報,2015,46(3):152-157.
[6]何東健,陳 煦. 土壤有機質含量田間實時測定方法[J]. 農業(yè)機械學報,2015,46(1):127-132.
[7]Morón A,García A,Sawchik J,et al. Preliminary study on the use of near-infrared reflectance spectroscopy to assess nitrogen content of undried wheat plants[J]. Journal of the Science of Food & Agriculture,2007,87(1):147-152.
[8]vergaard,S. I,Isaksson,T,Kvaal,K,et al. Comparisons of two hand-held,multispectral field radiometers and a hyperspectral airborne imager in terms of predicting spring wheat grain yield and quality by means of powered partial least squares regression[J]. Journal of Near Infrared Spectroscopy,2010,18(18):247-261.
[9]賀城,楊增玲,黃光群,等. 可見/近紅外光譜分析秸稈-煤混燃物的秸稈含量[J]. 農業(yè)工程學報,2013,29(17):188-195.
[10]胡永光,陳培培,趙夢龍. 綠茶殺青葉料含水率可見-近紅外光譜檢測[J]. 農業(yè)機械學報,2013,44(8):174-179.
[11]Liao Y,Fan Y,Fang C. On-line prediction of pH values in fresh pork using visible/near-infrared spectroscopy with wavelet de-noising and variable selection methods[J]. Journal of FoodEngineering,2012,109(4):668-675.
[12]Wang J,Nakano K,Ohashi S,et al. Comparison of different modes of visible and near-infrared spectroscopy for detecting internal insect infestation in jujubes[J]. Journal of Food Engineering,2010,101(1):78-84.
[13]Riley H. Estimation of physical properties of cultivated soils in southeast Norway from readily available soil information[J]. Norwegian Journal of Agricultural Sciences,1996,25(Suppl):1-51.
[14]Chang C W,Laird,David A,et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties[J]. Soil Science Society of America Journal,2001,65(2):480-490.
[15]Akaike H. Information theory and an extension of the maximum likelihood principle[J]. Inter Symp on Information Theory,1973,1:610-624.
[16]Barnes E M,Clarke T R,Richards S E,et al. Coincident detection of crop water stress,nitrogen status and canopy density using ground-based multispectral data[C]. Proceedings of the 5th International Conference on Precision Agriculture Bloomington. Minnesota,USA,2000.
[17]Rouse J W,Haas R H,Schell J A,et al. Monitoring vegetation systems in the great plains with erts[J]. Nasa Special Publication,1974,351:309.
[18]Lelong C C D,Pinet P C,Poilvé H. Hyperspectral imaging and stress mapping in agriculture:a case study on wheat in Beauce (France)[J]. Remote Sensing of Environment,1998,66(2):179-191.