王曉珂, 趙春江, 董大明
(1.首都師范大學,北京 100097; 2.北京市農(nóng)林科學院北京農(nóng)業(yè)智能裝備技術研究中心,北京 100097)
肥料是農(nóng)業(yè)生產(chǎn)的基礎物質(zhì)之一,它可以為植物提供必需的營養(yǎng)元素,并且能夠改善土壤的性質(zhì)、提高土壤的肥力水平[1]。在肥料生產(chǎn)時,通過檢測氮、磷、鉀等微量元素的含量可以較好地控制肥料質(zhì)量[2],從而確保農(nóng)作物的產(chǎn)量并避免環(huán)境污染[3]。目前國內(nèi)公認的肥料檢測方法大都是先采樣后分析,通過化學檢測的方式測量肥料中各種元素的含量[4]。這樣做不僅費時費力,不能對肥料成分進行實時評價,并且檢測用的試劑可能會對環(huán)境造成二次污染[5]。近年來,一些學者嘗試應用光學方法對肥料進行檢測,這些方法有望實現(xiàn)快速測量[6]。但在肥料生產(chǎn)中,肥料處于高速移動狀態(tài),生產(chǎn)線移動過程帶來測量的很多難題,目前的研究成果尚不能支持這種高通量檢測。
近紅外光譜是一種快速且無損的光譜學方法,被廣泛應用于多種農(nóng)產(chǎn)品和食品測量[7-9],如Wang等應用近紅外光譜測量水果中各種營養(yǎng)元素的含量[10-11]。也有一些學者利用近紅外光譜測量土壤養(yǎng)分,如Knadel等應用近紅外光譜測量土壤中有機碳、有機氮、全碳、全氮等的含量[8,12-13];Li等應用近紅外光譜對土壤進行分類[14-15]。因此,利用近紅外光譜對未出廠的肥料進行快速無損的檢測有著一定的可行性。
利用近紅外光譜對生產(chǎn)線上的肥料養(yǎng)分進行測量是一個新挑戰(zhàn),由于移動中的光譜獲取受到多種因素影響,不同種類肥料的模型傳遞性較差,更為重要的是,全波段光譜的運算量過大,難以實現(xiàn)實時性。因此本研究的主要目標為:(1)研究針對移動中肥料近紅外光譜的預處理方法,從而能夠最大限度地降低由于樣本移動而產(chǎn)生的噪聲;(2)建立先分類、再定量的算法模型,從而能夠應用于不同種類和不同廠家的肥料。
試驗中使用的肥料樣品均來自中國常用的肥料廠商,分別為芭田、新洋豐、嘉施利、史丹利(表1)。所有肥料樣本均取自生產(chǎn)線,并由北京市土肥站根據(jù)國標方法進行氮、磷、鉀的測試分析,給出實測值。在研究中,樣本隨機分為校正集和預測集。
表1 不同廠家肥料樣本養(yǎng)分含量分布
本試驗利用美國Thermo Antaris傅立葉變換近紅外光譜儀(4 000~10 000 cm)采集肥料樣品的近紅外光譜,儀器的最高分辨率為8 cm。光譜儀內(nèi)置了積分球。此外,光譜儀的出光口經(jīng)光纖擴充改造,可以在積分球和對外光路之間自動切換。為了模擬生產(chǎn)線上肥料的快速移動狀態(tài),筆者設計了1個自動勻速旋轉(zhuǎn)的樣本臺,角速度為12°/s。在光譜儀的入光口附近增加了1個鹵素燈,在樣品光譜采集時,控制鹵素燈輻照樣品,實現(xiàn)漫反射測量。在樣本臺上方設置2個反射鏡,分別反射光源和樣本的光線。
樣本光譜測量前首先關閉近紅外光源,直接測量光譜并作為參黑光譜。再控制光路切換到積分球,測量獲得參白光譜。測量過程中,旋轉(zhuǎn)臺的轉(zhuǎn)速為12°/s,每個樣本測量時間為30 s。為了快速完成測量,儀器的分辨率設置為8 cm。1 h更換1次存黑存白的背景光譜。研究中所采用的光譜預處理算法和建模算法在Unscrambler 9.7平臺下完成。
本次試驗于2016年9—10月在北京市農(nóng)林科學院展開,共采集了412組近紅外光譜,肥料的近紅外吸收特征光譜分布在4 000~10 000 cm-1(1 000~2 500 nm)(圖1)。
從圖1可以看出,由于不同廠家的肥料樣品中所含的化學成分可能不同,導致不同廠家肥料的光譜特征有著較為明顯的差異。同時也可看出,同一廠家肥料的光譜特性較為集中,很難通過肉眼觀察到光譜特征隨成分的變化規(guī)律。由于近紅外光譜特征復雜,沒有明顯的吸收峰,很難用單一或少數(shù)變量實現(xiàn)氮、磷、鉀元素含量的回歸分析。所以,采用PLS方法對數(shù)據(jù)降維回歸[16],將所有光譜數(shù)據(jù)基于全波段直接進行PLS建模的結(jié)果如表2所示。
表2 基于所有廠家的全波段光譜數(shù)據(jù)直接建模的校正集相關參數(shù)值
注:r2表示確定系數(shù);RMSE表示均方根預測誤差。
由表2可知,所有光譜數(shù)據(jù)直接建模的模型中r2較低,且RMSE較高,這說明了不同廠家光譜差異較明顯,模型不具有通用特性。因此,基于全波段建模時采用1個PLS模型針對1個特定廠家的方式,表3為不同廠家直接建立PLS模型的參數(shù)值。
表3 不同廠家基于全波段分別建模的校正集相關參數(shù)值
從表3可以看出,針對不同廠家單獨建模的方式對于模型的性能有一定提高,但部分廠家和部分元素仍然不能滿足定量化分析的要求,比如芭田肥料鉀元素的校正集確定系數(shù)僅有0.65。通過比較分析固定狀態(tài)和移動狀態(tài)下的模型預測能力發(fā)現(xiàn),這可能是由于移動過程中帶來的噪聲的影響。由于移動過程中會產(chǎn)生光的散射等干擾問題,這會在很大程度上影響光譜質(zhì)量。
為了達到更好的模型性能指標,采用Norris求導作為預處理方法來對原始光譜進行去噪處理,從而試圖降低移動中的影響[16-18]。圖2為芭田肥料的原始光譜及其經(jīng)過預處理方法后的光譜特征,從圖2中可以清楚地看到,經(jīng)過Norris求導預處理后的光譜數(shù)據(jù)較好地去除了各類噪聲的影響。
表4中的數(shù)據(jù)顯示,Norris求導預處理方法可提高P和K的預測能力,較好地消除了移動等噪聲的影響。
表4 芭田肥料樣品原始光譜與Norris求導光譜分別PLS建模的性能指標
合適的預處理方法提高了光譜質(zhì)量,從而降低了移動過程對定量化分析的影響。但如表2所示,不同廠家的肥料由于成分差異較大,很難用統(tǒng)一的模型實現(xiàn)定量。因此,通過先定性分類-再定量計量的模式實現(xiàn)模型的高效傳遞。
從圖3可以看出,通過對全部廠家的肥料原始光譜數(shù)據(jù)進行主成分分析(PCA),可以很好地將數(shù)據(jù)進行分類[16,19],圖的分類結(jié)果證明先分類、再采用不同的模型計算肥料成分的想法是可行的。整體算法的設計思路如圖4所示,即先用PCA分類器對不同廠家肥料進行分類,再針對不同廠家,采用預先建立的對應的PLS模型進行定量化計算。研究結(jié)果表明,這一算法適用于研究中采用的全部4種肥料,對肥料中微量元素的預測能力如表5所示。
本研究通過一系列試驗,證明了對移動中的肥料近紅外光譜數(shù)據(jù)進行PLS建模并實時預測氮、磷、鉀元素的含量是可行的。適當?shù)念A處理方式能夠降低由于樣本移動而產(chǎn)生的噪聲,進而提高系統(tǒng)的確定系數(shù)的同時降低系統(tǒng)的均方根誤差,本系統(tǒng)預測的準確率在88%以上;通過實現(xiàn)先PCA分類,再進行定量的算法模型,為開發(fā)能夠應用于不同肥料廠家的設備提供了理論支撐。
表5 PCA分類器分類后建模的結(jié)果