李錦昌,何洪源,趙雪珺,王曉賓,呂銣麟,胡益滔
(1.中國人民公安大學 偵查學院,北京 100038;2.上海市刑事科學技術研究院 上海市現場物證重點實驗室,上海 200083)
土壤營養(yǎng)元素氮(N)、磷(P)、鉀(K)常見于肥料當中,用于提高土壤的肥力和農作物產量。施肥欠缺會因土壤肥力下降而限制作物的生長,施肥過量會造成土壤富營養(yǎng)化等環(huán)境問題[1-2]。因此,農業(yè)中對于土壤中氮磷鉀含量的控制是土壤分析的關鍵因素,也是土壤信息化管理和土壤環(huán)境監(jiān)測的前提條件。土壤中營養(yǎng)元素含量傳統的檢測以化學方法為主,包括凱氏定氮法、氫氧化鈉-鉬銻抗分光光度法和醋酸銨萃取-火焰光度法等[3]。由于這些方法存在分析過程復雜、檢測周期長、成本高以及實驗中產生的廢液還會因處理不當造成環(huán)境污染等缺點。近年來,光譜技術以快速性、準確性和無損性的特性[4],已成為土壤中營養(yǎng)元素含量檢測技術研究和應用的熱點問題。光譜技術檢測土壤營養(yǎng)元素含量的流程見圖1。
圖1 光譜技術檢測土壤營養(yǎng)元素含量流程圖Fig.1 Flow chart of spectroscopic technology for detectingsoil nutrient element content
本文介紹了近年來國內外采用可見-近紅外光譜(Vis-NIRS)、激光誘導擊穿光譜(LIBS)、X射線熒光光譜(XRF)和高光譜遙感(HRS)4種常見的光譜技術結合化學計量學方法檢測土壤營養(yǎng)元素含量的研究現狀,并對未來研究進行了展望。
利用光譜技術檢測土壤中營養(yǎng)元素時,為了消除非目標因素對結果的影響,通常會對原始光譜數據進行預處理來達到降噪的目的,以提升實驗結果的準確性。常用光譜數據預處理方法主要有以下幾種。
SG平滑由Savizky和Golay在1946年提出[5],本質上該方法是對移動窗口平均法的改進。SG平滑利用多項式最小二乘擬合,計算出窗口內中心點關于其周圍點的加權平均和。在土壤研究領域中會有效地去除土壤光譜中的高頻噪聲信號,從而突出氮磷鉀在土壤光譜中的信息。郭志新等[6]在利用可見-近紅外光譜技術研究杉木林土壤中氮磷鉀含量時將采集到的光譜進行了SG平滑,很大程度上消除了光譜噪聲信號。
數學變換包括導數和對數變換。導數變換分為一階導數法(FD)和二階導數法(SD),導數變換可以很好地去除土壤光譜中基線漂移的影響,呈現出土壤光譜的輪廓變化,提供比原始光譜更高的分辨率,但要求原始光譜應具有較高的信噪比。朱琦等[7]對采集的光譜進行一階導數處理,從而解決了紅外光譜分析時出現的譜圖偏移或漂移的現象。對數變換可以增強光譜差異,還能有效地減小噪聲對目標物光譜波段的影響。高會等[8]進行了對不同有效磷含量的土壤高光譜反射率包括對數變換在內的一系列數學變換,得到了變換形式中(lnR)′對有效磷的估算效果最佳。
由于土壤顆粒粒徑存在差異,表面分布不均,從而產生對原始光譜干擾的散射現象。針對該現象采取的處理方法稱為散射校正法,包括多元散射校正(MSC)和變量標準化(SNV)。MSC常用于校正散射現象對土壤原始光譜數據的影響,減少基線漂移。SNV則類似于MSC,但SNV更適用于樣本光譜差異較大的條件下進行前處理。Ramrio等[9]通過對原始光譜進行SNV處理,使得可見-近紅外光譜在預測土壤有效磷和有效鉀的結果更加準確?;谕寥拦庾V數據的常見光譜預處理方法的原理與作用見表1。
表1 光譜預處理方法Table 1 Pre-processing methods for spectroscopy
由于采集的光譜數據存在譜峰重疊造成的光譜信息冗余、特征吸收峰不明顯等缺點[8],因此需要尋找對模型起關鍵作用的有效波長來代替全譜建立預測模型。特段波長提取方法可以有效提高光譜技術分析結果的準確性。土壤光譜中常用的特征波段提取方法包括以下幾種。
連續(xù)投影算法(SPA)是通過對光譜數據投影映射選取原始數據中的少數波長,盡可能多地概括樣本光譜信息,最大程度避免信息重疊[24]。朱淑鑫等[25]提出了結合SPA和K均值算法對高光譜特征波段進行選擇,結果表明可以有效地減低數據冗余的情況。
無信息變量消除算法(UVE)是基于PLS回歸系數建立的波長選擇算法,用于消除無用信息變量,降低模型復雜程度。Li等[26]分別利用SPA和UVE兩種方法提取特征波長,最終證明UVE提取得到的特征變量結合模型時預測效果更好。
主成分分析(PCA)可用于對土壤營養(yǎng)元素的光譜數據信息矩陣進行壓縮,即將光譜信息矩陣分解得到主成分載荷矩陣和得分矩陣,然后再使用樣本集的主成分對應其相應的得分作圖[27]。Terra等[28]利用PCA對光譜數據進行降維,得到了中紅外光譜和近紅外光譜對土壤樣品預測的分布情況。
隨機青蛙(Radom frog)是一種基于青蛙覓食過程而創(chuàng)建的一種智能優(yōu)化算法。何東健等[29]采用隨機蛙跳算法進行特征波長的選擇,結果表明該方法可以很好地選取特征波長,有效去除冗余信息且建模結果很好。
競爭性自適應重加權算法(CARS)是模仿了達爾文進化論中的“適者生存”原則,可以有效找到最優(yōu)變量組合的一種算法。而穩(wěn)定競爭性自適應加權抽樣法(sCARS) 是在CARS的基礎上將穩(wěn)定性同時納入考慮中,將變量的穩(wěn)定性作為變量建模能力的指標,剔除冗余信息[30]。Sara等[13]采用CARS對LIBS、Vis-NIRS檢測土壤中磷含量的光譜數據集進行特征提取,結果表明CARS在篩選關鍵波長上十分有效?;谕寥拦庾V數據的光譜特征常見提取方法總結見表2。
表2 光譜特征提取方法Table 2 Spectral feature extraction methods
基于樣本的光譜數據和已知信息建立預測模型,通過獲得未知土壤樣本的光譜數據,依照建立的預測模型,可以預測出未知土壤樣本中營養(yǎng)元素的準確含量。目前,基于土壤光譜數據所建立的預測模型以線性回歸模型的偏最小二乘法為主。隨著研究人員對更高預測精度的要求,更多非線性模型也引入到了土壤數據研究中,并在檢測土壤營養(yǎng)元素含量時有著較好的預測效果。光譜技術在檢測土壤營養(yǎng)元素含量的研究日趨成熟。
為評估模型的預測能力,通常會從決定系數(R2)、相關系數(r)、性能偏差比(RPD)、均方根誤差(RMSE)等方面來比較不同標定方法的預測精度。通常好的預測模型具有較高的R2、RPD值和較低的RMSE值。RPD的區(qū)分范圍沒有明確規(guī)定,一般由研究人員會自行確立一個界定范圍以區(qū)別不同RPD值模型預測能力。Qi等[10]利用SSR/SST(即R2值)和RPD值作為模型預測土壤中氮磷鉀元素含量的評估標準,即通過SSR/SST>0.5和RPD>2來評判最佳的模型預測能力。
可見-近紅外光譜(Vis-NIRS) 是基于電磁輻射與物質之間的相互作用,波長范圍在400~2 500 nm之間。可見區(qū)(400~700 nm)主要由分子的電子躍遷控制,近紅外區(qū)(700~2 500 nm)主要由中紅外區(qū)分子振動的泛頻和組合頻控制。由于土壤中各個組分與吸收的輻射相聯系,因此可提供樣品的定性和定量信息[36]。
Mouazen等[37]通過PLSR建立了土壤有效磷含量的預測模型,發(fā)現Vis-NIRS預測磷含量是可行的,隨后研究了不同光譜數據處理方法來提高預測模型的準確性。袁石林等[11]以浙江省潮化鹽土為研究對象,利用Vis-NIRS檢測了6組120個土壤樣品中總氮(TN)和總磷(TP)的含量,分別建立了PLS和LS-SVM的預測模型,結果發(fā)現在預測總磷方面LS-SVM方法要比PLS好。李雪瑩等[38]以青島市三個不同地區(qū)的180份土壤樣品為研究對象,基于Vis-NIRS結合PLSR對土壤中TN、TP、TK建立了預測模型。結果為TN和TP校正集和驗證集的R2均在0.9以上,RPD值均高于2,表明模型對土壤中TN、TP、預測能力較好。吳茜等[12]以云南省玉溪水稻土為研究對象,基于Vis-NIRS結合BPNN對土壤有效氮磷鉀含量進行了預測,得到rp分別為0.90,0.82和0.94。Qi等[10]研究對比了原始光譜和22種光譜預處理方法,結合PLSR、LS-SVM和BPNN三種模型對土壤中營養(yǎng)元素含量進行了預測,最終得出BPNN+MSC是預測鉀的最優(yōu)方法,RPD值為2.23,R2為0.81;SG+LG/PLS-R是預測磷的最優(yōu)方法,RPD值為1.47,R2為0.95。
激光誘導擊穿光譜(LIBS)是一種原子發(fā)射光譜技術,可以對樣品中多元素成分進行快速現場定量檢測。通過超短脈沖激光聚焦樣品表面形成等離子體,進而對等離子體發(fā)射光譜進行分析以確定樣品的物質成分及含量[39]。
在土壤研究中,LIBS通過結合化學計量學方法可用于測定氮磷鉀的常量和微量元素。Erler等[31]使用基于LIBS的手持儀器,采用多元回歸方法估計農田土壤中的常見組分(氮、磷、鉀、鈣、鎂等),測定的結果表明鉀的預測效果最好,而對于磷和氮的預測效果較差。Sara等[13]利用LIBS和 Vis-NIRS 對印度農田的147份土壤樣品對可浸出磷、奧森磷、草酸可浸出磷和總磷進行了檢測。建立了PLSR模型,結合區(qū)間偏最小二乘回歸(iPLS)和競爭自適應重加權抽樣(CARS)確定了土壤中磷的特征波段。結果表明,在幾乎所有模型建立和預測土壤磷庫方面,LIBS比Vis-NIRS結果好。猜測可能是由于磷的譜線強度可能會受到土壤中其他金屬元素的影響,且建議應當建立多元的定量模型以提高預測相關系數(R2)。Xu等[40]將LIBS與偏最小二乘回歸法(PLSR)相結合,同時測定了土壤的pH值、陽離子交換容量(CEC)、土壤有機質(SOM)、TN、TP、TK、速效磷(AP)和土壤有機質(SOM),結果表明基于全LIBS光譜下對上述土壤參數都有較好的預測能力,特別是對土壤中TP的預測,RPD值達到了1.993。
在X射線熒光光譜(XRF)中,利用原級X射線光子或其它微觀粒子以一定能量(在1~115 keV)范圍激發(fā)待測物質中的原子,使之產生次級的特征X射線(X光熒光)來進行物質成分分析和研究。在土壤檢測中,通過便攜式X射線熒光光譜在現場初篩后再進行實驗室檢測,可以避免盲目的大量采樣[41]。
Towett等[42]采用總X射線熒光光譜法(TXRF)對南非44個地區(qū)的700份土壤樣品進行了檢測,結果顯示磷和鉀都得到較好的預測效果。Said等[43]使用隨機森林(RF)對便攜式XRF檢測的光譜數據進行分析,來預測鉀(K)、磷(P)、鎂(Mg)和鈣(Ca)的含量。結果表明鉀的預測效果最佳,R2為0.83。說明便攜式XRF結合數據分析方法,可快速、低成本、準確地分析土壤鉀的含量。Tiago等[22]證明了XRF對關鍵土壤肥力屬性的測量中利用多元回歸模型分析是有效的,其中磷和鉀均得出的預測結果為RPD>1.54和R2>0.61。最近,關于XRF與其他技術(如可見光和近紅外光譜)數據融合使用的研究也開始流行起來。Javadi等[32]檢驗了可見-近紅外光譜和X射線熒光光譜數據融合技術的潛力,以提高實踐中對關鍵土壤屬性的估計精度。探究了數據融合在可見近紅外光譜和XRF測定土壤屬性的潛力,結果表明基于CNN建模方法測定含磷土壤屬性的效果最好。
高光譜遙感(HRS)是指利用固定的電磁波波段獲取地物的連續(xù)光譜信息,與反映地物空間分布的影像相結合,從而可以同時對土壤表面狀況與其性質的空間信息進行監(jiān)測的一種技術。近地傳感高光譜因其成本低,操作省時省力,且具備大范圍監(jiān)測的應用潛力,故在土壤研究中得到廣泛關注[44-45]。
Malley和Williams[46]于1997年利用HRS對湖泊沉積物中的重金屬元素進行了定量反演,取得了較好的預測精度。在此之后HRS才被廣泛應用于土壤營養(yǎng)元素檢測中。徐麗華等[47]通過斷點擬合和消除包絡線的預處理方法,分別選取了4個相關系數較大的波段作為總磷和總氮的特征波段,在基于特征譜線下建立的預測模型表現出較高的預測精度,R2分別為0.842和0.622。陶培峰等[21]通過對土壤原始反射率光譜進行了數學變換、MSC等變換,利用多元逐步回歸(SMLR)、PLSR和BPNN三種分析方法建立了高光譜預測模型,結果表明PLSR和BPNN模型的預測能力更好。Li等[11]利用高光成像系統在900~1 700 nm光譜范圍內檢測了土壤樣品中的TN含量,并對不同的特征光譜提取方法(UVE和SPA)和預測模型(PLS和ELM(極限學習機))進行了比較,結果表明UVE-ELM模型可獲得相對較好的結果,rp、RMSEP和RPD分別為 0.940 8,0.007 5 和2.97。Patel等[48]結合深度學習算法,利用高光譜數據估算了土壤和尿素肥料混合樣品的豐度,結果表明該算法可有效提高數據的光譜分解精度,也說明HRS可用于農田土壤肥力狀況的評價。
目前,可見-近紅外光譜、激光誘導擊穿光譜、X射線熒光光譜和高光譜遙感已廣泛用于土壤營養(yǎng)元素含量的檢測工作中。利用化學計量學方法對測得的光譜數據進行處理已成為研究熱點,利用SG平滑處理可有效減小噪聲干擾,MSC和SNV可有效消除土壤中不均勻介質產生的散射。光譜預處理方法從單一化向多樣化發(fā)展,再到多種方法并用,有研究者采用SG+MSC+FD或SG+LG等組合的方法校準光譜數據以提高預測模型的準確度。還有應用SPA、CARS和GA和隨機蛙跳等方法對目標元素的特定波長進行選擇。近些年,建模方法從采用PLSR線性回歸模型轉向了復雜的神經網絡模型,如CNN、DBN、BPNN等模型的復雜度更高,泛化能力更強,在測量土壤營養(yǎng)元素含量有更好的預測效果。
研究發(fā)現,四類光譜技術雖然已在土壤營養(yǎng)元素含量的研究中得到普遍使用,但大部分工作還是針對特定地域或地區(qū)進行的分析,盡管得到了較為理想的預測模型,但模型的通用性會受到一定限制。在未來的工作中,隨著便攜式光譜檢測儀器的不斷發(fā)展,可以實地采樣測量獲得數據信息。為了適應復雜的土壤類型和大面積土壤營養(yǎng)元素含量的測定,研究人員還要不斷優(yōu)化建模方法,提高模型的泛化能力。進一步擴大采樣范圍,建立大規(guī)模的土壤光譜數據庫,將其應用到農業(yè)或地質科學研究中,不僅通過與傳統的土壤剖面分類圖結合起來完成數字化土壤分類,從而實現對不同土壤層級進行快速有效分析;還可與光譜數據的化學計量學模型相結合,對各類作物提供施肥建議,更好地為發(fā)展精準農業(yè)服務。