汪洪濤,李耀翔
(東北林業(yè)大學(xué) 工程技術(shù)學(xué)院,哈爾濱 150040)
在陸地生態(tài)系統(tǒng)中,森林土壤碳庫(kù)是全球土壤碳庫(kù)中最重要的部分,同時(shí)也是森林生態(tài)系統(tǒng)中最大的碳庫(kù),碳儲(chǔ)量約占全球土壤碳儲(chǔ)量的73%,森林土壤碳庫(kù)微小的變化都會(huì)對(duì)大氣圈、生物圈及全球變化產(chǎn)生巨大影響[1-2]。土壤碳是土壤肥力保持的重要因子,為作物提供養(yǎng)料供給,改善土壤物理性質(zhì),防止土壤侵蝕,實(shí)現(xiàn)土壤的可持續(xù)利用以及提高森林土壤的涵養(yǎng)水源功能,確保植物的生長(zhǎng)發(fā)育與種群的演替[3]。小興安嶺林區(qū)是我國(guó)最大天然林區(qū)之一,以有機(jī)碳含量高、無機(jī)碳豐富及土壤肥沃著稱。因此,尋求快速獲得土壤碳含量的方法在陸地生態(tài)系統(tǒng)中至關(guān)重要。
近紅外反射光譜分析技術(shù)(NIR)是一種快速、環(huán)保、無損傷、簡(jiǎn)便的技術(shù),波長(zhǎng)范圍介于780~2 500 nm之間,近紅外光主要吸收含氫基團(tuán)X-H(X=C、N、O)振動(dòng)的倍頻和合頻,這些基團(tuán)反映大多數(shù)有機(jī)物的組成和結(jié)構(gòu)信息[4]。由于不同的有機(jī)物含有不同的基團(tuán),不同的基團(tuán)有不同的能級(jí),不同的基團(tuán)和同一基團(tuán)在不同物理化學(xué)環(huán)境中對(duì)近紅外光的吸收波長(zhǎng)都有明顯差別,且吸收系數(shù)小,發(fā)熱少,因此近紅外光譜可作為獲取信息的一種有效的載體[5]。近年來,在農(nóng)業(yè)、林業(yè)、中藥、煙草、食品等行業(yè)中都有廣泛的應(yīng)用并已成為一種快速的例行分析方法[6-7]。同時(shí),分析應(yīng)用領(lǐng)域不斷拓寬,用于土壤成分分析日益趨增,其中包括土壤有機(jī)質(zhì)、含水率、全氮和pH值[8-9]。對(duì)于預(yù)測(cè)土壤碳含量的可行性來說,由于土壤的組成包括礦物質(zhì)、有機(jī)質(zhì)和微生物等,它們的構(gòu)成包含豐富的氫基團(tuán),含氫基團(tuán)是關(guān)乎土壤碳含量的重要信息,因此,近紅外光譜可以有效地反映土壤碳含量情況,為快速測(cè)定土壤碳含量提供技術(shù)可行性。
土壤樣品采自東北小興安嶺帶嶺林業(yè)局東方紅林場(chǎng),土壤樣品近紅外光譜利用美國(guó)ASD公司制造一款通用便攜式的儀器-LabSpec Pro近紅外光譜儀。光譜儀的光譜測(cè)量范圍為350~2 500 nm,掃描次數(shù)設(shè)定30次,每10個(gè)樣品進(jìn)行一次背景校正[10]。
將120個(gè)土壤樣本隨機(jī)分集,由于是采用交互驗(yàn)證,校正集和驗(yàn)證集樣本相同為90個(gè),預(yù)測(cè)集樣本為30個(gè)。
PLS建模方法集中了普通最小二乘法和主成分分析的優(yōu)點(diǎn),在此算法下可以實(shí)現(xiàn)特征波長(zhǎng)變量提取和回歸模型建立兩個(gè)過程。PLS建模方法對(duì)原有波長(zhǎng)自變量矩陣X進(jìn)行線性組合,尋找少于原有自變量個(gè)數(shù)的新變量,這些新的變量可由原有變量線性表示并且相互獨(dú)立,因此會(huì)盡可能多地保留原有自變量矩陣X中的有用信息,同時(shí)保證新變量與因變量矩陣Y的相關(guān)程度達(dá)到最大,從而在消除原有自變量共線性的同時(shí),使建立的回歸模型仍能充分地反映出自變量與因變量之間的相互關(guān)系[11-12]。
PLS法的基本原理:
首先將n個(gè)樣品m個(gè)組分的濃度矩陣Y=(yij)n×m和儀器測(cè)定n個(gè)樣品p個(gè)波長(zhǎng)點(diǎn)處吸光度矩陣X=(xij)n×xp分解成特征向量形式:
Y=UQ+F;X=TP+E。
其中U和T分別為n行d列(d為抽象組分?jǐn)?shù))的濃度特征因子矩陣和吸光度特征因子矩陣,Q為d×m階濃度載荷矩陣,P為d×p階吸光度載荷陣,F(xiàn)和E分別為n×m,n×p階濃度殘差陣和吸光度殘差陣[13]。
PLS法是根據(jù)特征向量的相關(guān)性分解Y和X,建立回歸模型:
U=TB+Ed。
(1)
式中:Ed為隨機(jī)誤差陣;B為d維對(duì)角回歸系數(shù)矩陣。
對(duì)待測(cè)樣品,如果吸光度向量為x,則濃度為:Y=X(UX)′BQ。
評(píng)價(jià)化學(xué)計(jì)量學(xué)建立的模型性能的基本指標(biāo)有決定系數(shù)R2和均方根誤差RSME,評(píng)價(jià)應(yīng)用建立的模型預(yù)測(cè)樣品時(shí)的基本指標(biāo)有決定系數(shù)R2、均方根誤差RSME和預(yù)測(cè)標(biāo)準(zhǔn)差SEP等。
決定系數(shù)(R2)取值越接近1,模型擬合性越好:
(2)
均方根誤差越小,模型的擬合效果越好:
(3)
預(yù)測(cè)標(biāo)準(zhǔn)差SEP越小,模型的預(yù)測(cè)效果越好:
(4)
圖1為120條不同碳含量值的土壤樣品的近紅外光譜圖。從光譜圖的整體來看,三條光譜的變化趨勢(shì)基本一致,最顯著的特征是近紅外光譜均在在1 414 nm,1 918 nm,2 207nm附近出現(xiàn)較強(qiáng)的吸收峰,這主要是由于1 414 nm波長(zhǎng)對(duì)應(yīng)亞甲基CH2、C-H組合頻和烴類或脂肪類;1 918 nm波長(zhǎng)對(duì)應(yīng)水分子O-H;2 207 nm波長(zhǎng)對(duì)應(yīng)芳基C-H、CONH2、β-折疊結(jié)構(gòu)中與肽主鏈呈直角的N-H和C=O[14],這些特征波長(zhǎng)點(diǎn)能很好地反映樣品的基團(tuán)信息,不同的基團(tuán)的吸收峰和吸收強(qiáng)度不同,由于土壤樣品的碳含量不同,使各個(gè)樣品的基團(tuán)含量不同,最終使光譜特征發(fā)生相應(yīng)的變化。
圖1 原始的不同碳含量值土壤樣品近紅外光譜
由于光譜受噪聲、顆粒度和波峰過尖等的影響,本文比較了Savitzky-Golay平滑、Noise去噪、MSC多元散射校正、基線校正、小波變換等多種光譜預(yù)處理方法,最終比較得到Savitzky-Golay平滑、Noise去噪和MSC多元散射校正處理使得光譜的信息較好。將以上3種方法應(yīng)用于土壤樣品近紅外原始光譜,得到預(yù)處理后土壤樣品光譜圖(圖2),再利用偏最小二乘法建立土壤碳含量近紅外光譜預(yù)測(cè)模型。
圖2 預(yù)處理后的近紅外光譜
圖3所示為土壤樣品得分圖,X軸為PC1,Y軸為PC2,通過樣品的多維空間向二維平面投影得到樣品點(diǎn),由圖可知:樣品點(diǎn)在PC1上的波動(dòng)較大,方差較大,得分達(dá)到94%,適合建立在PC1軸上的線性回歸,而在PC2上波動(dòng)很小,方差很小,得分達(dá)到68%,可以忽略在PC2上的影響。同時(shí),剔除異常點(diǎn)A和點(diǎn)B。
圖3 得分圖
從誤差和主成分?jǐn)?shù)的圖4可以知道,隨著主成分?jǐn)?shù)的增加,殘余校準(zhǔn)方差(residual calibration variance)下降非常明顯,直至主成分?jǐn)?shù)為2時(shí)下降變緩,當(dāng)主成分?jǐn)?shù)超過3時(shí),殘余校準(zhǔn)方差幾乎不變,接近水平直線。通過CAMO軟件獲得驗(yàn)證模型和校正模型的相關(guān)統(tǒng)計(jì)表,同時(shí)給出了模型對(duì)主成分?jǐn)?shù)的優(yōu)選情況表,見表1。
圖4 誤差-主成分?jǐn)?shù)
表1 最小二乘法中主成分?jǐn)?shù)對(duì)模型的影響
由表1可知,當(dāng)主成分?jǐn)?shù)從2增加至5時(shí),校正模型的決定系數(shù)由0.664增加至0.815,校正模型偏移由8.071減少至3.534,校正均方根誤差由7.458減少至3.905。所以,對(duì)校正模型來說,模型的精度隨著主成分?jǐn)?shù)的增加不斷提高的。驗(yàn)證模型的決定系數(shù)在主成分?jǐn)?shù)為4時(shí)達(dá)到最大,為0.621。驗(yàn)證均方根誤差和模型偏移均在主成分?jǐn)?shù)為4時(shí)最小,分別為7.521和8.243。因此,確定主成分?jǐn)?shù)4為最佳主成分個(gè)數(shù)。
圖5為校正模型和驗(yàn)證模型中土壤碳含量的預(yù)測(cè)值和實(shí)測(cè)值的關(guān)系圖,實(shí)線代表校正模型,虛線代表驗(yàn)證模型。由圖知道,土壤碳含量在30~100g/kg范圍內(nèi),校正模型、驗(yàn)證模型的趨勢(shì)線與理想趨勢(shì)線基本重合,而被測(cè)土壤樣品的碳含量值80%以上在此區(qū)間內(nèi),而且校正模型與驗(yàn)證模型的決定系數(shù)分別為0.784和0.621。
圖5 校正與驗(yàn)證模型實(shí)測(cè)值與預(yù)測(cè)值的關(guān)系圖
由表2可知,依據(jù)偏最小二乘法(PLS)建立的模型,對(duì)30個(gè)土壤樣本的碳含量進(jìn)行預(yù)測(cè),決定系數(shù)為0.735,均方根誤差7.202,預(yù)測(cè)標(biāo)準(zhǔn)差10.356。結(jié)果,PLS模型對(duì)土壤碳含量預(yù)測(cè)具有可靠性。
表2 預(yù)測(cè)后的基本指標(biāo)情況
從波長(zhǎng)780~2 500 nm范圍內(nèi)研究土壤的光譜特性可知:由于1 414 nm波長(zhǎng)對(duì)應(yīng)亞甲基CH2、C-H組合頻和烴類或脂肪類;1 918 nm波長(zhǎng)對(duì)應(yīng)水分子O-H;2 207 nm波長(zhǎng)對(duì)應(yīng)芳基C-H、CONH2、β-折疊結(jié)構(gòu)中與肽主鏈呈直角的N-H和C=O,近紅外光譜在波長(zhǎng)1 414 nm,1 918 nm,2 207 nm附近出現(xiàn)較強(qiáng)的吸收峰,這些吸收峰很好地反映土壤的構(gòu)成情況。
對(duì)原始土壤光譜進(jìn)行Savitzky-Golay平滑、Noise去噪和多元散射校正預(yù)處理,應(yīng)用偏最小二乘(PLS)法建立土壤碳含量與吸光度的定量校正模型,剔除異常點(diǎn)A和B后得到最終模型。校正模型的決定系數(shù)R2和均方根誤差RMSE分別為0.784和5.752。然后利用該模型對(duì)30個(gè)樣本的預(yù)測(cè)集進(jìn)行預(yù)測(cè),其決定系數(shù)R2為0.735,均方根誤差RMSE為7.202,預(yù)測(cè)標(biāo)準(zhǔn)差SEP為10.356。結(jié)果表明應(yīng)用近紅外技術(shù)可以有效地預(yù)測(cè)土壤碳含量,本研究為森林土壤碳含量大面積、實(shí)時(shí)測(cè)定提供了新的技術(shù)可行性,進(jìn)而為林分土壤碳循環(huán)的相關(guān)研究提供了新的思路。
【參 考 文 獻(xiàn)】
[1]劉世榮,王 暉.中國(guó)森林土壤碳儲(chǔ)量與土壤碳過程研究進(jìn)展[J].生態(tài)學(xué)報(bào),2011,31(19)5437-5448.
[2]周國(guó)模,劉恩斌,佘光輝.森林土壤碳庫(kù)研究方法進(jìn)展[J].浙江林學(xué)院學(xué)報(bào),2006,23(2):207-216.
[3]申 艷,張曉平,梁愛珍,等.近紅外光譜分析法測(cè)定東北黑土有機(jī)碳和全氮含量[J].應(yīng)用生態(tài)學(xué)報(bào),2010,21(1):109-114.
[4]陸婉珍,袁洪福.現(xiàn)代近紅外光譜分析技術(shù)[M].北京:中國(guó)石化出版社,2007.
[5]高榮強(qiáng),范世福.現(xiàn)代近紅外光譜分析技術(shù)的原理及應(yīng)用[J].分析儀器,2002,3(9):12.
[6]劉 旭,陳華才,劉太昂,等.PCA-SVR聯(lián)用算法在近紅外光譜分析煙草成分中的應(yīng)用[J].光譜學(xué)與光譜分析,2007,27(12):2460-2463.
[7]王多加,周向陽,金同銘,等.近紅外光譜檢測(cè)技術(shù)在農(nóng)業(yè)和食品分析上的應(yīng)用[J].光譜學(xué)與光譜分析,2004,24(4):38-40.
[8]相秉仁,李 睿,吳擁軍,等.近紅外光譜分析技術(shù)在藥學(xué)領(lǐng)域中的應(yīng)用[J].計(jì)算機(jī)與應(yīng)用化學(xué),1999,16(5):327-328.
[9]陳鵬飛,劉良云,王紀(jì)華,等.近紅外光譜技術(shù)實(shí)時(shí)測(cè)定土壤中總氮及磷含量的初步研究[J].光譜學(xué)與光譜分析,2008,28(2):295-298.
[10]張慧娟,李耀翔,張鴻富,等.基于近紅外光譜不同波段的紅松木材含水率預(yù)測(cè)分析[J].東北林業(yè)大學(xué)學(xué)報(bào),2011,39(4):83-85.
[11]Rinnan R,Rinnan A.Application of near infrared reflectance(NIR)and fluorescence spectroscopy to analysis of microbiological and chemical properties of arctic soil [J].Soil Biology and Biochemistry,2007,39(7):1664-1673.
[12]Bellon-Maurel V,McBratney A.Near-infrared(NIR)and mid-infrared(MIR)spectroscopic techniques for assessing the amount of carbon stock in soils-Critical review and research perspectives [J].Soil Biology and Biochemistry,2011,43(7):1398-1410.
[13]韓瑞珍,宋 韜,何 勇.基于可見/近紅外光譜的土壤有機(jī)質(zhì)含量預(yù)測(cè)[J].信息科學(xué),2010,40:111-116.
[14](美)杰爾·沃克曼,文依.近紅外光譜解析實(shí)用指南[M].褚小立,許育鵬,田高友,譯.北京:化學(xué)工業(yè)出版社,2009