楊 超,邢艷秋,李俊明
(東北林業(yè)大學(xué)森林作業(yè)與環(huán)境研究中心,哈爾濱 150040)
土壤氮素是植物生長所必須的營養(yǎng)元素,直接影響著植物的生產(chǎn)發(fā)育,是土壤肥力的重要指標(biāo)之一。傳統(tǒng)的土壤全氮含量測(cè)定由于耗時(shí)、低效、成本高并且時(shí)效性差等缺點(diǎn),難以滿足當(dāng)前大區(qū)域快速監(jiān)測(cè)的需求。而近紅外光譜分析技術(shù)的出現(xiàn)和發(fā)展,被證明可以在土壤全氮含量實(shí)時(shí)快速測(cè)定方面具有巨大潛力[1-2]。于飛建[3]等采用一階導(dǎo)數(shù)結(jié)合偏最小二乘法估測(cè)土壤全氮含量,模型精度達(dá)到0.88。張娟娟[4]等研究了我國不同地區(qū)主要類型土壤全氮含量與近紅外光譜之間的關(guān)系,結(jié)果表明,采用Norris濾波平滑后的一階導(dǎo)數(shù)光譜建立估算模型能有效估算土壤全氮含量。黃明祥[5]等對(duì)不同濾波器去噪效果進(jìn)行定量評(píng)價(jià),通過對(duì)比發(fā)現(xiàn)小波去噪既能達(dá)到曲線平滑又能較好地保證波段特征。以上研究表明,采用近紅外光譜技術(shù)估測(cè)土壤全氮含量是可行的,但是上述研究在進(jìn)行光譜預(yù)處理的時(shí)候,并沒有考慮到濃度對(duì)光譜的影響,在濾澡過程中同時(shí)會(huì)損失部分與待測(cè)品質(zhì)相關(guān)的光譜信息[6]。而正交信號(hào)校正 (Orthogonal Signal Correc-tion,OSC)方法在進(jìn)行光譜與處理時(shí),卻能很好地消除光譜矩陣中一些與待測(cè)品質(zhì)無關(guān)的噪聲信號(hào),從而達(dá)到提高預(yù)測(cè)模型的需求。
本研究以松嫩平原不同類型土壤全氮含量為研究對(duì)象,采用近紅外光譜技術(shù),結(jié)合正交信號(hào)校正預(yù)處理方法,對(duì)土壤全氮進(jìn)行估測(cè),從而為提高近紅外光譜反演土壤全氮含量精度提供方法支持。
本研究試驗(yàn)區(qū)為松嫩平原齊齊哈爾和綏化地區(qū),共采集鹽堿地、農(nóng)田以及林地樣本228個(gè),采樣深度0~20 cm。土壤樣品經(jīng)過風(fēng)干、研磨后,分別過20目和100目篩,20目篩樣品進(jìn)行光譜分析,100目篩樣品采用半微量凱氏定氮法進(jìn)行土壤全氮含量測(cè)定。
本研究使用美國ASD公司生產(chǎn)的FieldSpec3系列野外便攜式地物波譜儀進(jìn)行光譜測(cè)定。光譜范圍為350~2 500 nm,在350 nm到1 050 nm處采樣間隔是1.4 nm,1 000 nm到2 500 nm區(qū)間采樣間隔為2 nm,重采樣間隔1 nm。測(cè)定光譜時(shí),光源使用鎢燈,鎢燈與法線成15度角照射土壤樣本,光學(xué)纖維探頭以距樣品表面10 cm高處垂直于樣品進(jìn)行光譜采集。采集時(shí),盡量使土壤樣本表面平整,并旋轉(zhuǎn)樣本,共采集10次,求其平均值。每采集3個(gè)樣本光譜,進(jìn)行反射白板校正1次。
在采集近紅外光譜信息的過程中,除了樣品本身的光譜性質(zhì)的影響外,導(dǎo)致近紅外光譜基線漂移和光譜不重復(fù)的因素中往往還包含一些與待測(cè)樣品性質(zhì)無關(guān)的因素。為盡可能獲得準(zhǔn)確的光譜信息,在進(jìn)行光譜分析前,對(duì)原始光譜進(jìn)行預(yù)處理分析,消除與樣品本身信息無關(guān)的噪聲非常必要。本研究擬采用平滑、多元散射校正 (MSC)以及OSC方法對(duì)原始光譜進(jìn)行預(yù)處理。其中平滑可以很好的降低隨機(jī)噪聲,而MSC可以有效的消除由于樣本表面不均勻等引起的散射影響?;谡煌队暗恼绦盘?hào)校正由S.Wold1998年作為一種光譜過濾方法提出[7]。該方法的基本思想是濾除原始光譜矩陣X中與待測(cè)品質(zhì)Y不相關(guān)的部分信號(hào)。以上數(shù)據(jù)分析均在Unscrambler V9.5和matlab7.0中實(shí)現(xiàn)。
OSC具體算法如下:
(1)將原始光譜矩陣X與濃度矩陣Y進(jìn)行標(biāo)準(zhǔn)化。
(2)對(duì)于Y正交的主成分t賦值。
(3)計(jì)算tnew=(1 -Y(Y′Y) -1Y′)t,特征向量ω=X-tnew。
(4)根據(jù)新計(jì)算得到的X、ω計(jì)算正交主成分t,t=Xω。
(5)檢驗(yàn)收斂性,如果‖t-told‖/‖t‖<10-6,收斂轉(zhuǎn)到 (6),否則返回 (3)。
(6)計(jì)算載荷向量,p′=t′X/(t tnew)。
(7)從X中減去與Y正交的部分,E=X-t p′。
(8)將E作為新的X,計(jì)算新的與X正交的主成分,直到合適為止,通常只需兩個(gè)正交主成分便可達(dá)到良好的精度。
(9)將經(jīng)過正交信號(hào)校正的光譜矩陣X作為新矩陣,建立模型。
(10)未知樣品的預(yù)測(cè),同樣要經(jīng)過正交信號(hào)校正,利用最后得到的殘差向量e,根據(jù)校正模型即可對(duì)未知樣品進(jìn)行預(yù)測(cè)。
本研究采用偏最小二乘法建立土壤全氮含量反演模型,利用交叉驗(yàn)證和外部驗(yàn)證相結(jié)合對(duì)模型進(jìn)行評(píng)價(jià),評(píng)價(jià)指標(biāo)為決定系數(shù)R2和均方根誤差RMSEV。其中,228個(gè)樣本中隨機(jī)抽取150個(gè)樣本作為校正集,用于反演模型建立和交叉驗(yàn)證;其余78個(gè)樣本作為外部驗(yàn)證集對(duì)反演模型進(jìn)行評(píng)價(jià)。模型的建立與評(píng)價(jià)研究在matlab7.0中實(shí)現(xiàn)。
表1為不同類型土壤樣本全氮含量統(tǒng)計(jì)值。由表1可以看出,土壤全氮含量在農(nóng)田、林地及鹽堿地中有較大差異,變化幅度較大,有利于模型的建立。其中林地土壤含氮量最好,農(nóng)田次之,鹽堿地土壤全氮含量最低。圖1為不同類型土壤樣本光譜數(shù)據(jù),可以看出,所有樣本在1 900 nm處均有一個(gè)大的水分吸收峰,樣本反射率大小順序依次為鹽堿地>農(nóng)田>林地,這主要因?yàn)榱值赝寥篮胸S富的腐殖質(zhì)顏色較深,吸光度較大,從而反射率較低,而鹽堿地土壤顏色較淺反射率高。同時(shí),在1 000 nm處產(chǎn)生一個(gè)小的階躍,主要是由于光譜儀器自身350~1 000 nm段所使用的探測(cè)器與1 000~2 500 nm段使用的探測(cè)器類型不同造成的。
表1 土壤全氮測(cè)定結(jié)果Tab.1 Measurements of the soil total nitrogen g·kg-1
圖1 不同類型土壤樣本光譜Fig.1 Original near infrared spectra of the different types of soil
為了比較不同預(yù)處理方法的建模效果,本研究對(duì)原始光譜分別采用平滑、平滑+MSC、平滑+MSC+OSC等方法進(jìn)行建模前降噪處理,結(jié)合偏最小二乘法進(jìn)行建模。結(jié)果見表2。其中以采用平滑+MSC+OSC方法對(duì)原始光譜進(jìn)行預(yù)處理,主因子個(gè)數(shù)為4時(shí),建模精度最高,決定系數(shù)R2為0.990 1,均方根誤差為0.297 5;直接采用原始光譜進(jìn)行建模,效果不理想,決定系數(shù)R2為0.672 0,均方根誤差為0.421 5。說明OSC可以有效的去除與濃度陣無關(guān)的光譜信息,提高了預(yù)測(cè)模型的精度。因此,可以看出選擇合適的預(yù)處理方法對(duì)提高土壤全氮近紅外光譜預(yù)測(cè)模型的精度非常必要,平滑+MSC+OSC預(yù)處理方法可以滿足預(yù)測(cè)模型的要求。
表2 不同光譜預(yù)處理方法的PLS模型內(nèi)部交叉驗(yàn)證結(jié)果Tab.2 Internal cross-validation results of different pretreatment methods
表3為不同OSC因子個(gè)數(shù)結(jié)合PLS建模結(jié)果??梢钥闯觯脊庾V建立的PLS模型交叉驗(yàn)證決定系數(shù)為0.672 0,均方根誤差為0.421 5,外部驗(yàn)證決定系數(shù)為0.712 6,均方根誤差為0.398 2,建立PLS模型時(shí)主因子個(gè)數(shù)為13,不僅模型比較復(fù)雜精度較低,并且模型不是很穩(wěn)定。當(dāng)OSC因子個(gè)數(shù)為6時(shí)建立的PLS模型,模型主因子個(gè)數(shù)為4,模型精練,內(nèi)部交叉驗(yàn)證決定系數(shù)和均方根誤差分別為0.990 1和0.297 5,外部驗(yàn)證決定系數(shù)和均方根誤差分別為0.926 1和0.283 6,模型精度很高,并具有很高的穩(wěn)定性。對(duì)原始光譜進(jìn)行OSC校正時(shí),隨著OSC因子個(gè)數(shù)的增加,預(yù)測(cè)模型的精度有所提高。
表3 不同OSC因子個(gè)數(shù)建模結(jié)果Tab.3 Modeling results for different number of OSC factors
偏最小二乘法PLS是進(jìn)行光譜多元定量校正時(shí)最常用的一種方法,在建模過程中集中了典型相關(guān)分析、主成分分析和線性回歸分析的工作特點(diǎn)[8-10]。本研究采用偏最小二乘法建立土壤全氮近紅外光譜預(yù)測(cè)模型。圖2(a)和圖2(b)分別為預(yù)測(cè)模型內(nèi)部交叉驗(yàn)證和外部驗(yàn)證結(jié)果,采用平滑+MSC+OSC方法對(duì)光譜進(jìn)行預(yù)處理,OSC因子個(gè)數(shù)和PLS主因子個(gè)數(shù)分別為6和4,相關(guān)系數(shù)R2較大分別為0.990 1和0.926 1,說明光譜陣與濃度陣相關(guān)性強(qiáng),均方根誤差較小分別為0.297 5和0.283 6。這表明通過結(jié)合OSC和PLS法建立土壤全氮近紅外光譜預(yù)測(cè)模型預(yù)測(cè)精度較高,穩(wěn)定性強(qiáng)。
圖2 模型交叉驗(yàn)證結(jié)果Fig.2 Model validation results
土壤的反射光譜包含了極其豐富的土壤信息,是土壤性狀的綜合體現(xiàn),常用的預(yù)處理方法都有一定的局限性,可能導(dǎo)致土壤反射光譜信息冗余或者缺失。本研究采集了松嫩平原不同類型土壤樣本,采用OSC法對(duì)土壤近紅外光譜進(jìn)行預(yù)處理,結(jié)合偏最小二乘法建立了土壤全氮含量的估測(cè)模型,利用交叉驗(yàn)證和外部驗(yàn)證相結(jié)合的方法對(duì)模型進(jìn)行評(píng)價(jià)分析。結(jié)果顯示,不同的預(yù)處理方法對(duì)建模結(jié)果影響較大,其中采用平滑+MSC+OSC對(duì)光譜進(jìn)行預(yù)處理,建模結(jié)果最優(yōu),內(nèi)部交叉驗(yàn)證決定系數(shù)和均方根誤差分別為0.990 1和0.297 5,外部驗(yàn)證決定系數(shù)和均方根誤差分別為0.926 1和0.283 6??傮w看來,OSC可以很好的去除光譜陣中與濃度陣無關(guān)的噪聲信號(hào),并且隨著OSC因子個(gè)數(shù)的增加,PLS模型的精度有所提高,當(dāng)OSC因子和PLS主因子個(gè)數(shù)分別為6和4時(shí),模型精度最高,穩(wěn)定性最強(qiáng)。因此,不同預(yù)處理方法近紅外估測(cè)模型的建立影響較大,采用正交信號(hào)校正結(jié)合偏最小二乘方法建立土壤全氮近紅外光譜預(yù)測(cè)模型時(shí)可行的,可以簡化PLS模型,并且精度穩(wěn)定性較高。
【參 考 文 獻(xiàn)】
[1]Bendor E,Banin A.Near-infrared analysis as a rapid method to simultaneously evaluate several soil properties[J].Soil Science Society of America Journal,1995,59:364-372.
[2]徐永明,藺啟忠,黃秀華,等.利用可見光/近紅外反射光譜估算土壤總氮含量的實(shí)驗(yàn)研究[J].地理與地理信息科學(xué),2005,21(1):19-22.
[3]于飛健,閔順耕,巨曉棠,等.近紅外光譜法分析土壤中的有機(jī)質(zhì)和氮素[J].分析實(shí)驗(yàn)室,2002,1(3):49 -51.
[4]張娟娟,田永超,姚 霞,等.基于高光譜的土壤全氮含量測(cè)定[J].自然資源學(xué)報(bào),2011,26(5):881 -890.
[5]黃明祥,王 珂.土壤高光譜噪聲過濾評(píng)價(jià)研究[J].光譜學(xué)與光譜分析,2009,29(3):722 -755.
[6]趙杰文,張海東,劉木華.簡化蘋果糖度預(yù)測(cè)模型的近紅外光譜預(yù)處理方法[J].光學(xué)學(xué)報(bào),2006,26(1):136 -140.
[7]Wold S,Antti H,Lindgren F,et al.Orthogonal signal correction of near-infrared spectra[J].Chemometrics and Intelligent Laboratory Systems,1998,44(1-2):175-185.
[8]王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國防工業(yè)出版社,1999.
[9]高祥斌.森林土壤化學(xué)性質(zhì)與土壤酶活性典型相關(guān)分析[J].林業(yè)科技,2007,17(1):11 -13.
[10]周桂香,張文元,胡冬南,等.土壤有機(jī)碳影響因素及測(cè)定方法探討[J].江西林業(yè)科技,2011,21(6):31 -34.