謝 文 趙小敏郭 熙 葉英聰 李偉峰 汪曉燕 張佳佳
(江西農(nóng)業(yè)大學(xué)江西省鄱陽湖流域農(nóng)業(yè)資源與生態(tài)重點實驗室/林學(xué)院,南昌 330045)
基于組合模型的廬山森林土壤有效鐵光譜間接反演研究*
謝 文 趙小敏?郭 熙 葉英聰 李偉峰 汪曉燕 張佳佳
(江西農(nóng)業(yè)大學(xué)江西省鄱陽湖流域農(nóng)業(yè)資源與生態(tài)重點實驗室/林學(xué)院,南昌 330045)
鐵是植物生長的重要微量營養(yǎng)元素之一,土壤有效鐵含量對林地環(huán)境起著重要的影響,利用土壤光譜預(yù)測技術(shù)獲取土壤有效鐵含量信息具有重要意義。而要通過土壤光譜直接預(yù)測土壤有效鐵含量是難以實現(xiàn)的,因此提出利用土壤有機質(zhì)含量與有效鐵含量之間的相關(guān)性,探討間接估算土壤有效鐵含量的可行性。以廬山森林土壤樣本為研究對象,研究基于偏最小二乘回歸(PLSR)和徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的組合模型預(yù)測土壤有機質(zhì)含量的適用性,并且通過構(gòu)建有機質(zhì)含量與有效鐵含量的二項式線性模型,對土壤有效鐵含量進行間接反演,探討不同權(quán)重下的最優(yōu)組合模型。結(jié)果表明,組合模型的預(yù)測效果優(yōu)于偏最小二乘回歸和RBF神經(jīng)網(wǎng)絡(luò)單個模型,并且熵值組合為最優(yōu)組合模型,其中,土壤有機質(zhì)的反演模型驗證的決定系數(shù)(R2)為0.81,均方根誤差(RMSEp)為11.54 g kg-1,測定值標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)預(yù)測誤差的比值(RPD)為2.18;有效鐵的間接反演模型R2為0.70,RMSEp為21.60 mg kg-1,RPD為1.77。通過土壤有機質(zhì)構(gòu)建土壤有效鐵含量的光譜反演間接模型,在光譜反演模型中,組合模型能較大限度地利用各種預(yù)測樣本信息,能有效減少單個預(yù)測模型中隨機因素的影響,增強預(yù)測穩(wěn)定性,提高模型的預(yù)測能力。因此,組合模型可對土壤有機質(zhì)含量的光譜預(yù)測及土壤有效鐵的間接預(yù)測發(fā)揮更好的作用。
土壤光譜;有效鐵預(yù)測;RBF神經(jīng)網(wǎng)絡(luò);偏最小二乘回歸(PLSR);組合模型
鐵是植物生長不可或缺的微量元素,在土壤元素中含量相對較高[1],土壤是植物所需有效鐵的主要供給源,植物缺鐵會影響葉綠素的合成,土壤有效鐵含量高低會影響植被的生長發(fā)育[2-4]。因此,研究土壤中有效鐵含量對評價廬山生態(tài)環(huán)境及植被健康生長狀況非常必要。
化學(xué)成分是決定土壤反射光譜特征的最重要因素,高光譜遙感數(shù)據(jù)具有豐富的光譜特征,并且利用光譜分析技術(shù)可以快速、無損、低成本實現(xiàn)土壤參數(shù)實時在線監(jiān)測,為土壤化學(xué)成分的快速、無損測定提供新的方法,因此,高光譜遙感具有獲取土壤化學(xué)成分的研究潛力[5-8]。目前已有不少學(xué)者在利用實驗室和野外測量的反射光譜數(shù)據(jù)分析土壤Fe元素的特征波段、研究土壤Fe的光譜特性等方面取得了一定成果,例如Chodak等[9]利用線性回歸分析法研究了森林覆蓋區(qū)域的土壤Fe與反射光譜間的關(guān)系;Kemper和Sommer[10]提出土壤重金屬與鐵含量的相關(guān)性是反演重金屬的主要機理;Siebielec等[11]發(fā)現(xiàn)中紅外光譜較近紅外光譜預(yù)測土壤中Fe含量效果更好;Ren等[12]利用標(biāo)準(zhǔn)歸一化處理預(yù)測Fe含量效果較好;李巨寶等[13]利用偏最小二乘法構(gòu)建了土壤Fe含量的反射光譜預(yù)測模型;彭杰等[14-15]發(fā)現(xiàn)利用土壤線參數(shù)反演氧化鐵含量具有可行性,但在622~851nm波段范圍內(nèi),氧化鐵對土壤有機質(zhì)的高光譜特征具有明顯的抑制作用,并通過不同含量氧化鐵對有機質(zhì)光譜的影響分析,發(fā)現(xiàn)氧化鐵含量高于20 g kg-1或氧化鐵含量與有機質(zhì)含量比值高于2.0時,有機質(zhì)定量反演精度會降低等。在光譜反演模型方面,多元線性回歸、主成分回歸、偏最小二乘回歸和神經(jīng)網(wǎng)絡(luò)等線性和非線性方法在土壤各組分含量估算中應(yīng)用較多,并且均得到了較好的預(yù)測精度[5],而神經(jīng)網(wǎng)絡(luò)模型中應(yīng)用于土壤光譜反演的主要是BP神經(jīng)網(wǎng)絡(luò)模型,但BP神經(jīng)網(wǎng)絡(luò)模型存在學(xué)習(xí)效率低、收斂速度慢的缺陷,而徑向基函數(shù)(RBF)能提高BP的學(xué)習(xí)速度,在非線性函數(shù)擬合方面也有很好的優(yōu)勢[16],但由于傳統(tǒng)單一預(yù)測模型自身存在局限性,為解決單一模型誤差的問題,Bates和Granger[17]提出綜合多個單一模型構(gòu)建組合預(yù)測模型。綜上所述,雖然有不少學(xué)者探討過土壤中Fe含量的光譜反演,但由于土壤中鐵含量不高,存在形式多樣,因此,反演精度均不理想;此外大多數(shù)土壤養(yǎng)分含量反演采用的均為單一模型,造成在利用土壤光譜反演土壤養(yǎng)分含量的研究中,存在一定局限性,因此,本文以廬山森林土壤為研究對象,將RBF神經(jīng)網(wǎng)絡(luò)模型與偏最小二乘回歸(PLSR)模型進行組合,對比不同的加權(quán)最優(yōu)組合預(yù)測模型,先進行土壤有機質(zhì)含量的光譜反演,再通過有機質(zhì)含量與有效鐵含量的二項式線性模型對有效鐵含量進行間接反演研究,探討利用高光譜技術(shù)進行土壤有效鐵含量間接反演的可行性。
1.1 樣品采集
土壤樣品采集于亞熱帶典型紅壤區(qū)的廬山,位于江西省北部,其土壤具有明顯的垂直地帶性及養(yǎng)分分布規(guī)律性,土壤類型隨海拔的升高,依次為山地紅壤、山地黃壤、山地黃棕壤、山地棕壤和山地草甸土[18]。本文主要采集的是廬山林地表層0~20 cm的土壤,按照1 km×1 km的范圍進行選點,共布設(shè)192個樣點,去除兩個異常樣點,共有190個有效樣點,其中,山地紅壤143個、山地黃紅壤8個、山地黃壤2個、山地黃棕壤34個和山地棕壤3個。對土樣進行風(fēng)干、碾磨、過0.25 mm篩處理后,分成兩份,分別用于土壤理化分析和光譜測定。土壤有機質(zhì)含量采用重鉻酸鉀容量法-外加熱法測定[19],土壤有效鐵含量采用DTP浸提,原子吸收光譜法測定[20]。
由于樣本海拔跨度較大,土壤有效鐵含量差異很大,最小值僅為0.04 mg kg-1,最大值為167.5 mg kg-1,平均含量為46.31 mg kg-1,土壤有機質(zhì)含量的差異性也較大,最小值為4.80 g kg-1,最大值為150.9 g kg-1,土壤有效鐵含量離散程度要高于土壤有機質(zhì)含量(表1)。
根據(jù)Kennard-Stone光譜主成分空間歐式距離算法,選取總樣本的75%作為建模樣本(143個)構(gòu)建模型,25%(47個)作為驗證樣本進行驗證。從表1樣本有機質(zhì)和有效鐵含量統(tǒng)計特征來看,建模樣本與驗證樣本的標(biāo)準(zhǔn)差、變異系數(shù)與總樣本接近,具有代表性。
表1 土壤有機質(zhì)及有效鐵含量統(tǒng)計特征Table 1 Statistics of available iron and organic matter contents in soil
1.2 光譜數(shù)據(jù)采集與預(yù)處理
光譜測定是將風(fēng)干、研磨、過篩處理后的土樣采用美國ASD公司生產(chǎn)的ASD FieldSpec3地物光譜儀進行土壤測試,波長范圍為350~2 500 nm,采樣間隔為1.4 nm(350~1 000 nm)、2 nm (1 000~2 500 nm),重采樣間隔為1 nm。光譜測量時,在能控制光照條件的暗室內(nèi)進行,將土樣平鋪裝滿于盛樣皿中,利用50 W的鹵素?zé)糇鳛楣庠?,距土壤表?0 cm,天頂角15°,5°探頭,距離土樣15 cm垂直觀測,測定前以白板定標(biāo),并每間隔20~30 min進行一次標(biāo)準(zhǔn)白板校正,每個土樣測定5次,取算術(shù)平均值作為每個土樣的實際反射光譜數(shù)據(jù)。每個土樣重采樣間隔為1nm進行光譜輸出,測定得到350~2 500 nm波長、波段數(shù)為2 151的反射光譜數(shù)據(jù)。
由于光譜采集過程中存在背景及環(huán)境因子的影響,為消除誤差,利用ASD光譜儀自帶的ViewSpec Pro Version 6.0工具進行斷點校正,并且考慮光譜邊緣波段噪聲的影響,去除邊緣波段(350~399 nm,2 451~2 500 nm),保留400~2 450 nm波段的反射光譜數(shù)據(jù)。為研究不同處理方法對土壤有效鐵含量的影響,對原始光譜進行了倒數(shù)、一階導(dǎo)數(shù)、對數(shù)、平方根、去包絡(luò)線等處理,對比選擇原始光譜作為最優(yōu)光譜數(shù)據(jù)進行研究。
1.3 建模方法
本研究首先通過分析土壤有機質(zhì)含量與土壤有效鐵含量之間的相關(guān)性,建立兩者之間的二項式線性模型,然后通過對土壤有機質(zhì)含量的光譜反演,最后通過建立的二項式模型對土壤有效鐵含量進行估測。
研究土壤屬性與反射光譜之間關(guān)系常用的方法有多元逐步線性回歸、偏最小二乘回歸(PLSR)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機等方法,而偏最小二乘回歸是集成了主成分分析、典型相關(guān)分析和線性回歸分析的經(jīng)典和最常用的一種線性模型方法[21]。目前BP神經(jīng)網(wǎng)絡(luò)模型是應(yīng)用最廣神經(jīng)網(wǎng)絡(luò)模型之一,但由于BP神經(jīng)網(wǎng)絡(luò)算法存在很多收斂速度慢等問題,在處理較復(fù)雜的模型時,徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)模型在時間、非線性曲線擬合能力和學(xué)習(xí)速度等方面均優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型,因此,RBF網(wǎng)絡(luò)模型在預(yù)測非線性問題中精度高、學(xué)習(xí)速度快,值得推廣[16,22-23]。而單一模型自身存在的局限性明顯,通過單一模型進行預(yù)測分析,不能全面反映事物的信息,會使預(yù)測結(jié)果誤差較大,組合預(yù)測模型較單個預(yù)測模型具有更高的預(yù)測精度[24]。
RBF神經(jīng)網(wǎng)絡(luò)是具有突出的函數(shù)逼近能力并且在模式識別、函數(shù)逼近和經(jīng)濟預(yù)測等領(lǐng)域有著廣泛應(yīng)用的一類局部逼近的前饋式神經(jīng)網(wǎng)絡(luò),是由輸入層、隱含層和輸出層組成的非線性函數(shù),多輸入單輸出RBF神經(jīng)網(wǎng)絡(luò)的輸出為:
式中,n為隱含層神經(jīng)元的個數(shù),x(x1,…,xm)為輸入向量,ωi為第i個隱含層神經(jīng)元與輸出層神經(jīng)元的聯(lián)結(jié)權(quán)值,φi為RBF高斯函數(shù)第i個隱含層神經(jīng)元的輸出,ci為隱含層第i個神經(jīng)元的基函數(shù)中心值,δ為高斯函數(shù)的方差[25-27]。
本文的RBF組合模型選取兩個常用的偏最小二乘回歸(PLSR)線性預(yù)測模型和徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)非線性預(yù)測模型分別對建模樣本進行預(yù)測,利用單一模型的預(yù)測結(jié)果進行算術(shù)平均、預(yù)測誤差平方和倒數(shù)及熵值[28]三種賦權(quán)方法組合后,進行RBF模型預(yù)測,研究選擇MATLAB2014a軟件工具箱中的newrb函數(shù)作為核函數(shù)進行建模,對比驗證精度,驗證精度通過均方根誤差(RMSE)、預(yù)測偏差比(RPD)和決定系數(shù)(R2)進行評價。
1.4 組合模型權(quán)重的確定
組合模型是綜合各單個預(yù)測模型的預(yù)測結(jié)果,利用不同的權(quán)系數(shù)進行加權(quán)平均后得到的預(yù)測模型,權(quán)系數(shù)是組合預(yù)測模型最重要的一個部分[29]。本文分別運用算術(shù)平均法、預(yù)測誤差平方和倒數(shù)法和熵值法三種常用的權(quán)系數(shù)方法確定單個預(yù)測模型的權(quán)重,確定最優(yōu)的權(quán)系數(shù)組合預(yù)測模型。
算術(shù)平均法特點是單個預(yù)測模型的加權(quán)系數(shù)完全相等,即將單個預(yù)測模型同等看待,系數(shù)確定公式為:
式中,lk為某預(yù)測模型的組合權(quán)系數(shù),m為單個預(yù)測模型個數(shù)。
預(yù)測誤差平方和倒數(shù)法特點是單個預(yù)測模型精度越低,加權(quán)系數(shù)則越大,即通過預(yù)測誤差平方和倒數(shù)確定權(quán)系數(shù)來降低預(yù)測精度低的單個模型在組合預(yù)測模型中的重要性,系數(shù)確定公式為:
式中,lk為某預(yù)測模型的組合權(quán)系數(shù),m為單個預(yù)測模型個數(shù),Ekk為第k個單項預(yù)測模型的預(yù)測誤差平方和,xki為第k個單個預(yù)測模型在第i個樣本中的預(yù)測值,xi為同一預(yù)測樣本的實際值,n為建模樣本個數(shù)。
熵值法的特點是熵值越大,單個預(yù)測模型預(yù)測誤差變異程度就越小,則在組合預(yù)測模型中的權(quán)系數(shù)就越大,即通過熵值體現(xiàn)單個預(yù)測模型在組合模型中的重要程度[28]。
圖1 不同類型土壤的反射率均值曲線Fig.1 Reflectance spectra of soils different in soil type
2.1 不同類型土壤的高光譜曲線特征
本文采集的數(shù)據(jù)來自于廬山森林土壤,土壤類型包括山地紅壤、山地黃紅壤、山地黃壤、山地黃棕壤和山地棕壤五種類型,同一類型的土壤光譜求取平均后得到其相對應(yīng)的反射光譜曲線,從圖1可以看出,不同土壤類型的土壤反射光譜曲線存在差異,但變化趨勢上又存在一定的規(guī)律性。例如在可見光350~500 nm波段范圍五種土壤類型光譜曲線均很相似,區(qū)分并不明顯,而山地黃紅壤、山地黃棕壤、山地黃壤和山地棕壤的光譜反射強度、曲線變化的斜率和吸收谷的強度等特征總體均較為相似,呈現(xiàn)的均是1 400 nm、1 900 nm、2 200 nm紅外波段附近的吸收谷特征,而山地紅壤由于Fe3+含量較高,在900 nm波段附近有一個比較明顯的Fe3+的吸收谷[21]。與表2土壤有機質(zhì)含量對比,可以明顯看出,土壤類型光譜曲線與有機質(zhì)含量基本呈現(xiàn)的是隨不同土壤類型有機質(zhì)含量均值的增加,平均反射率降低,但由于黃棕壤、黃紅壤的有機質(zhì)均值含量相差不大,因此平均反射率曲線相接近;由于棕壤樣本數(shù)偏少,有機質(zhì)含量對于光譜曲線的影響不是很明顯。
表2 不同類型土壤有機質(zhì)含量統(tǒng)計特征Table 2 Statistics of organic matter contents in different types of soils
2.2 土壤有機質(zhì)的反射光譜特征
考慮到不同土壤類型有機質(zhì)含量所反映出來的光譜特征并不明顯,為更準(zhǔn)確地探析有機質(zhì)的光譜特征,選擇山地紅壤這一特定土壤類型的土樣來分析,將有機質(zhì)劃分為低于10 g kg-1、10~20 g kg-1、20~30 g kg-1、30~40 g kg-1和高于40 g kg-1五個等別,每等取光譜及連續(xù)統(tǒng)平均值曲線(圖2)進行對比。
從反射率曲線(圖2a)可以看出,山地紅壤的光譜曲線隨有機質(zhì)含量均值的升高,光譜反射率降低,但低于10 g kg-1與10~20 g kg-1范圍的趨勢并不是很明顯,有機質(zhì)含量大于20 g kg-1的土樣趨勢更明顯。并且在400~600 nm波段范圍這種差異性不明顯,但在 600~1400 nm波段范圍光譜曲線的差異性更明顯。
圖2 山地紅壤有機質(zhì)含量的反射率(a)與連續(xù)統(tǒng)去除(b)曲線Fig. 2 Reflectance(a)and continuum removal spectral curves(b)of mountain red soil in soil organic matter content
從曲線形態(tài)方面可以看出,不同有機質(zhì)含量的光譜反射曲線在1 400 nm、1 900 nm和2 200 nm附近有明顯的水分吸收特征,但不同有機質(zhì)含量等別的土樣之間差異不明顯,說明這些波段與有機質(zhì)含量的相關(guān)性不大;從反射率曲線可以看出在400~600 nm波段存在一個小的吸收谷,通過連續(xù)統(tǒng)曲線(圖2b)可以看出,在420 nm附近有一個小的反射峰,480 nm附近有一個小的吸收谷,600 nm附近又出現(xiàn)一個較高的反射峰,同時800 nm附近有較明顯的反射峰,在900 nm附近有較明顯的吸收谷,并且該反射峰與吸收谷的特征與有機質(zhì)含量等級有關(guān),有機質(zhì)含量越低,特征越明顯,含量越高,特征越不明顯;而在連續(xù)統(tǒng)去除曲線中,420~480 nm附近的波峰及吸收谷特征除小于10 g kg-1含量的有機質(zhì)光譜曲線之外,其他含量的光譜曲線差別不明顯,600~800 nm附近隨有機質(zhì)含量的增加,波峰越明顯,而在900~2 450 nm波段范圍,曲線與有機質(zhì)含量的特征并不是很明顯,說明在900~2 450 nm波段附近的有機質(zhì)光譜特征并不明顯。因此,廬山林地山地紅壤有機質(zhì)含量與反射率之間的關(guān)系表現(xiàn)主要為400~600 nm及 600~800 nm波段范圍,并且在600~800 nm波段反射率的影響特征要明顯大于400~600 nm波段;光譜特征主要反映在400~900 nm波段,例如反射率曲線在800 nm附近存在反射峰、900 nm附近的吸收谷及連續(xù)統(tǒng)去除曲線中420 nm附近的發(fā)射峰、480 nm附近的吸收谷和600 nm附近的反射峰。這與彭杰[29]所得出的570~630 nm 波段是有機質(zhì)最敏感的波段一致。
2.3 基于土壤有機質(zhì)間接反演有效鐵
從有效鐵含量與光譜的相關(guān)曲線與有機質(zhì)含量的光譜相關(guān)曲線(圖3)的對比可以看出,相關(guān)曲線高度相似,尤其在600~1 850 nm波段范圍,趨勢接近完全一致,但在1 900 nm波段附近,有效鐵與有機質(zhì)的相關(guān)曲線略有不同,有機質(zhì)的相關(guān)性要明顯高于有效鐵,且幅度有所增加,說明土壤有機質(zhì)對土壤有效鐵的高光譜特征具有很強的掩蓋作用,因此,通過土壤光譜對土壤有效鐵含量進行直接反演比較困難。
可見近紅外光譜分析技術(shù)已逐漸成為土壤有機質(zhì)、全氮等多種理化參數(shù)分析常用的方法,土壤有機質(zhì)是影響土壤光譜在可見近紅外區(qū)的主要成分,而由于土壤中Fe等其他成分受土壤性質(zhì)的影響,含量的變化較大,對土壤光譜的影響是不穩(wěn)定的,并且有機質(zhì)對鐵氧化物的反演具有明顯的影響[30-33],因此,可通過有機質(zhì)含量與有效鐵含量之間的相關(guān)性分析探討土壤有效鐵含量與土壤光譜間的間接關(guān)系。
表3 不同土壤有機質(zhì)含量統(tǒng)計特征Table 3 Statistics of soil organic matter contents
從表1中可以發(fā)現(xiàn),受地理位置與差異影響,廬山林地土壤樣品中有機質(zhì)含量與有效鐵含量的離散程度均比較高,且離散程度很接近,從圖3中土壤有機質(zhì)含量與有效鐵含量與土壤光譜的相關(guān)曲線可以看出,相關(guān)曲線趨勢趨于一致,可見,廬山林地土壤樣品的有機質(zhì)含量與有效鐵含量之間存在一定的相關(guān)性。并且土壤有機質(zhì)含量的光譜特征明顯,可通過土壤光譜對土壤有機質(zhì)含量進行直接反演。由于有機質(zhì)含量與有效鐵含量之間存在一定的相關(guān)性,因此,為通過構(gòu)建土壤有機質(zhì)含量與土壤有效鐵含量之間的相關(guān)模型,進而對土壤有效鐵含量進行土壤光譜的間接反演提供了可能。
圖3 土壤有效鐵、土壤有機質(zhì)含量與反射率及其變化光譜的相關(guān)性Fig. 3 Correlationsof reflectance and its variation spectra with soil organic matter and soil available iron content
將土壤有機質(zhì)含量與土壤有效鐵含量進行Pearson相關(guān)分析,得出在0.01水平(雙側(cè))上的相關(guān)系數(shù)為0.726,呈顯著相關(guān)。進而可得到有效鐵含量隨有機質(zhì)含量變化的散點圖和擬合線性方程。由圖4可以看出,隨著有機質(zhì)含量的升高,有效鐵含量呈線性上升,因此可得出有機質(zhì)含量與有效鐵含量之間的二項式擬合方程。
圖4 有機質(zhì)含量與有效鐵含量的散點圖及擬合方程Fig. 4 Scatter plot and binomial equation of organic matter contents and available iron contents
而通過土壤有機質(zhì)含量與變化光譜的相關(guān)曲線(圖3)可以看出,在403~525 nm可見光區(qū)域附近,經(jīng)過一階微分和對數(shù)一階微分變換處理后的相關(guān)性要較原始光譜反射率顯著提高,但是549nm~2 400nm可見光—近紅外波段范圍內(nèi),土壤有機質(zhì)含量與原始光譜反射率呈顯著的負相關(guān),并且相關(guān)性大于一階微分和對數(shù)一階微分處理后的光譜反射率,而經(jīng)過倒數(shù)對數(shù)變化處理后的相關(guān)性與原始光譜反射率是呈對稱的關(guān)系。因此,從土壤反射光譜與有機質(zhì)含量的相關(guān)曲線可以看出,土壤反射光譜與有機質(zhì)含量在可見光—近紅外波段呈連續(xù)的相關(guān)性,且對應(yīng)的波段范圍較大,因此,本文在構(gòu)建土壤有機質(zhì)含量的光譜模型中選用原始光譜數(shù)據(jù)進行建模。
2.4 單一模型的選擇與驗證結(jié)果
單一預(yù)測模型的選擇與相應(yīng)權(quán)重系數(shù)的確定是組合模型預(yù)測精度的兩個重要影響因素,單一模型的精度對組合模型的預(yù)測結(jié)果至關(guān)重要,模型間的預(yù)測誤差越小組合模型的預(yù)測誤差就越小,同時模型數(shù)量并不是越多越好[24]。
考慮偏最小二乘回歸(PLSR)是光譜分析中最為經(jīng)典和常用的線性建模方法,非線性處理方法中人工神經(jīng)網(wǎng)絡(luò)具有較強的處理能力,而徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)模型較應(yīng)用最廣的BP神經(jīng)網(wǎng)絡(luò)模型在算法方面要快很多,更適合預(yù)測結(jié)構(gòu)未知對象的模型,函數(shù)逼近能力和精度方面均要優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型[21,25,34]。本文選擇PLSR和RBF神經(jīng)網(wǎng)絡(luò)模型作為單一預(yù)測模型。PLSR對于模型線性部分有很好的分析效果,RBF神經(jīng)網(wǎng)絡(luò)模型則對模型的非線性部分有很好的逼近分析效果。
圖5 土壤有機質(zhì)、有效鐵預(yù)測模型偏最小二乘回歸(a,c)、徑向基函數(shù)(b,d)結(jié)果比較Fig. 5 Comparison between models of Partial Least Squares Regression(PLSR)(a,c)and Radial Basis Function(RBF)(b,d)in prediction of soil organic matter content and available iron content
分別建立土壤有機質(zhì)含量PLSR和RBF光譜預(yù)測模型,將得到的預(yù)測值通過有機質(zhì)含量與有效鐵含量的二項式獲取有效鐵含量的間接預(yù)測值。圖5a和圖5b分別為實測土壤有機質(zhì)含量和PLSR、RBF單個模型驗證結(jié)果,圖5c和圖5d為實測土壤有效鐵含量和單個模型間接驗證結(jié)果。對比發(fā)現(xiàn),對有機質(zhì)含量的直接預(yù)測驗證中,RBF模型的驗證結(jié)果要好于PLSR模型,其驗證R2由0.68提高至0.72,RMSEp由14.49 g kg-1降低至13.68 g kg-1,RPD由1.74提高至1.83,RBF模型的擬合曲線較PLSR模型更加接近1∶1線,尤其是對于有機質(zhì)含量較高的土樣PLSR模型存在明顯的低估現(xiàn)象,說明RBF模型在有機質(zhì)含量光譜直接預(yù)測驗證中,在解決高值低估的問題上較PLSR有更好的優(yōu)勢;但在有效鐵含量的間接預(yù)測驗證中,RBF模型的驗證結(jié)果與PLSR模型擬合效果相差不大,甚至精度要略低于PLSR模型,這主要是因為有效鐵含量的預(yù)測是通過二項式線性模型進行間接預(yù)測,而PLSR模型也屬于線性模型,間接擬合過程中誤差小,而RBF模型屬于非線性模型,間接擬合過程中易造成預(yù)測的誤差偏大。但總體比較,RBF模型在土壤屬性含量的光譜直接預(yù)測的優(yōu)勢比較明顯。
2.5 不同權(quán)重組合模型與驗證結(jié)果
從驗證結(jié)果(表4)可以看出,無論在土壤有機質(zhì)含量的直接預(yù)測還是在土壤有效鐵含量的間接預(yù)測驗證中,組合模型與單個預(yù)測模型相比,決定系數(shù)R2更高,均方根誤差(RMSEp)與預(yù)測偏差比RPD效果更好,因此綜合比較,說明用組合模型來預(yù)測土壤屬性含量較單個預(yù)測模型精度更高、效果更好。
表4 不同預(yù)測模型的土壤有機質(zhì)與有效鐵含量驗證結(jié)果Table 4 Results of organic matter and soil available iron contents using different models
而從表4的組合模型可以看出,不同的權(quán)系數(shù)方法驗證結(jié)果也存在差異,本文中三種權(quán)系數(shù)確定方法對比可以看出,算術(shù)平均權(quán)系數(shù)與熵值權(quán)系數(shù)組合模型的驗證結(jié)果相差不大,優(yōu)勢比較明顯,而熵值權(quán)系數(shù)法的驗證結(jié)果要略優(yōu)于算數(shù)平均權(quán)系數(shù)法,在土壤有機質(zhì)含量直接建模的驗證結(jié)果中,熵值權(quán)系數(shù)組合模型的決定系數(shù)(R2)將單個預(yù)測模型最低的0.68提高至0.81,將單個模型的預(yù)測偏差比(RPD)從1.74提高至2.18,而在土壤有效鐵含量間接建模的驗證結(jié)果中,熵值權(quán)系數(shù)法將單個間接預(yù)測模型的決定系數(shù)(R2)從0.58提高至0.70,預(yù)測偏差比(RPD)從1.56提高至1.77。由于本文只選用了兩種不同的單個預(yù)測模型,一種是線性模型、另一種是非線性模型,因此權(quán)系數(shù)確定方法中倒數(shù)權(quán)系數(shù)法由于只考慮兩個單個模型的整體預(yù)測誤差,受單個模型數(shù)量限制及對單個模型具體影響因素考慮不周的因素影響,預(yù)測結(jié)果沒有算術(shù)平均權(quán)系數(shù)及熵值權(quán)系數(shù)組合模型的優(yōu)越性明顯。
通過土壤有效鐵與有機質(zhì)之間的相關(guān)性分析,本研究建立的RBF神經(jīng)網(wǎng)絡(luò)組合模型對于廬山林地土壤有效鐵含量的間接預(yù)測具有一定的可行性,且通過組合模型在土壤有機質(zhì)含量直接預(yù)測的結(jié)果可以看出,對比傳統(tǒng)的PLSR模型預(yù)測精度有了顯著的提高。而不同的權(quán)系數(shù)法對于組合模型的預(yù)測精度會略有不同,為組合模型在土壤光譜其他屬性含量反演中的應(yīng)用提供了思路。
[1] 茍文平,劉世全,張世熔,等. 西藏土壤有效鐵含量及其影響因素. 山地學(xué)報,2007,25(3):359—363
Gou W P,Liu S Q,Zhang S R,et al. Status of soil available iron and its affecting factors in Tibet(In Chinese). Journal of Mountain Science,2007,25 (3):359—363
[2] 楊媛媛,李占斌,宋曉強,等. 丹江水源區(qū)小流域土壤有效鐵空間分布特征. 西安理工大學(xué)學(xué)報,2015,31 (2):201—206
Yang Y Y,Li Z B,Song X Q,et al. Spatial distribution of soil available iron in a small watershed of Danjiang River water resource district(In Chinese). Journal of Xi’an University of Technology,2015,31 (2):201—206
[3] 范玉蘭,黃曉成,盧映瓊,等. 贛南地區(qū)臍橙園土壤有效鐵含量分布特征研究. 中國南方果樹,2015,44 (3):53—58
Fan Y L,Huang X C,Lu Y Q,et al. Study on the distribution characteristics of soil available iron content in Gannan navel orange orchard(In Chinese). South China Fruits,2015,44(3):53—58
[4] Adiloglu A. Determination of suitable chemical extraction methods for the available iron content of brown forest soil in turkey. Eurasian Soil Science,2006,39(9):961—967
[5] 田燁,沈潤平,丁國香. 支持向量機在土壤鎂含量高光譜估算中的應(yīng)用. 土壤,2015,47(3):602—607
Tian Y,Shen R P,Ding G X. Application of support vector machine on soil magnesium content estimation based on hyper-spectra(In Chinese). Soils,2015,47(3):602—607
[6] 于雷,洪永勝,耿雷,等. 基于偏最小二乘回歸的土壤有機質(zhì)含量高光譜估算. 農(nóng)業(yè)工程學(xué)報,2015,31 (14):103—109
Yu L,Hong Y S,Geng L,et al. Hyperspectral estimation of soil organic matter content based on partial least squares regression(In Chinese). Transactions of the Chinese Society of Agricultural Engineering,2015,31(14):103—109
[7] 呂杰,徐靜,閆振國. 基于小波神經(jīng)網(wǎng)絡(luò)的礦區(qū)土壤銅含量反演研究. 礦業(yè)研究與開發(fā),2015,35(4):68—70
Lü J,Xu J,Yan Z G. Remote sensing inversion on copper content in mine tailings based on wavelet neural network(In Chinese). Mining Research and Development,2015,35(4):68—70
[8] 章文龍,曾從盛,高燈州,等. 閩江河口濕地土壤全磷高光譜遙感估算. 生態(tài)學(xué)報,2015,35(24):8085—8093
Zhang W L,Zeng C S,Gao D Z,et al. Estimating the soil total phosphorus content based on hyper-spectral remote sensing data in the Min River estuarine wetland (In Chinese). Acta Ecologica Sinica,2015,35 (24):8085—8093
[9] Chodak M,Ludwig B,Khanna P,et al.Use of near infrared spectroscopy to determine biological and chemical characteristics of organic layers under spruce and beech stands. Journal of Plant Nutrition and Soil Science,2002,165(1):27—33
[10] Kemper T,Sommer S. Estimate of heavy metal comtamination in soil after a mining accident using reflectance spectroscopy. Environmental Science & Technology,2002,36(12):2742—2747
[11] Siebielec G,McCarty G W,Stuczynski T I,et al. Near-and mid-infrared diffuse reflectance spectroscopy for measuring soil metal content.Journal of Environmental Quality,2004,33(6):2056—2069
[12] Ren H Y,Zhuang D F,Singh A N,et al. Estimation of As and Cu contamination in agricultural soils around a mining area by reflectance spectroscopy:A case study. Pedosphere,2009,19(6):719—726
[13] 李巨寶,田慶久,吳均昭. 滏陽河兩岸農(nóng)田土壤Fe、Zn、Se元素光譜響應(yīng)研究. 遙感信息,2005(3):10—13
Li J B,Tian Q J,Wu J Z. The study of spectral responses of agricultural soils for Fe,Zn and Se in the area of Fuyang riversides(In Chinese). Remote Sensing Information,2005(3):10—13
[14] 彭杰,李曦,周清,等.氧化鐵對有機質(zhì)光譜特性的影響分析. 遙感學(xué)報,2013,17(6):1396—1412
Peng J,Li X,Zhou Q,et al. Influence of iron oxide on the spectral characteristics of organic matter(In Chinese). Journal of Remote Sensing,2013,17 (6):1396—1412
[15] 彭杰,向紅英,周清,等. 土壤氧化鐵的高光譜相應(yīng)研究. 光譜學(xué)與光譜分析,2013,33(2):502—506
Peng J,Xiang H Y,Zhou Q. et al. Influence of soil iron oxide on VNIR diffuse reflectance spectroscopy(In Chinese). Spectroscopy and Spectral Analysis,2013,33(2):502—506
[16] 嚴(yán)曉明,鄭之. BP與RBF網(wǎng)絡(luò)在一些非線性曲線擬合上性能的比較. 福建農(nóng)林大學(xué)學(xué)報(自然科學(xué)版),2011,40(6):653—656
Yan X M,Zheng Z. Performance comparison between some nonlinear curves fitting with BP and RBF(In Chinese). Journal of Fujian Agriculture and Forestry University(Natural Science Edition),2011,40 (6):653—656
[17] Bates J M,Granger C W J. The combiantion offorecasts. Operational Research Society,1969,20 (4):451—468
[18] 王景明,盧志紅,吳建富,等. 廬山土壤類型的特點與分布規(guī)律. 江西農(nóng)業(yè)大學(xué)學(xué)報,2010,32(6):1284—1290
Wang J M,Lu Z H,Wu J F,et al. The characteristics and distribution patterns of the soil types in MT. Lushan(In Chinese). Acta Agriculturae Universitatis Jiangxiensis,2010,32(6):1284—1290
[19] 鮑士旦.土壤農(nóng)化分析. 北京:中國農(nóng)業(yè)出版社,1999:30—34
Bao S D. Soil agri-chemical analysis(In Chinese). Beijing:China Agriculture Press,1999:30—34
[20] 馬青杰. 土壤有效性銅、鋅、鐵、錳簡易測定方法. 農(nóng)業(yè)科技與信息,2010(1):34—34
Ma Q J. A simple method for the determination of copper,zinc,iron and manganese in soil(In Chinese). Journal of Agricultural Science and Information,2010(1):34—34
[21] 史舟,王乾龍,彭杰,等. 中國主要土壤高光譜反射特性分類與有機質(zhì)光譜預(yù)測模型. 中國科學(xué):地球科學(xué),2014,44(5):978—988
Shi Z,Wang Q L,Peng J,et al. Debelopment of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations(In Chinese). Science China:Earth Sciences,2014,44 (5):978—988
[22] 馬海姣,崔晨風(fēng). 基于可見-近紅外光譜和神經(jīng)網(wǎng)絡(luò)的土壤類型鑒別. 江蘇農(nóng)業(yè)科學(xué),2014,42(4):284—286
Ma H J,Cui C F. Identification of soil type based on visible and near infrared spectroscopy and neural network(In Chinese). Jiangsu Agruicultural Sciences,2014,42(4):284—286
[23] 高寧,張建中. MATLAB在RBF神經(jīng)網(wǎng)絡(luò)模型中的應(yīng)用. 農(nóng)業(yè)網(wǎng)絡(luò)信息,2009(2):110—116
Gao N,Zhang J Z. Application of RBF neural network model based on MATLAB(In Chinese). Agriculture Network Information,2009(2):110—116
[24] 黃仁東,張海彬,楊志輝,等. 基于多準(zhǔn)則的組合預(yù)測模型權(quán)重研究及其應(yīng)用. 中南大學(xué)學(xué)報(自然科學(xué)版),2015,46(5):1778—1785
Huang R D,Zhang H B,Yang Z H,et al. Research and application of multi-criteria combination forecast mode (In Chinese). Journal of Central South University(Science and Technology),2015,46(5):1778—1785
[25] 劉旭,于國祥,沈西挺. 基于神經(jīng)網(wǎng)絡(luò)的預(yù)測模型的比較研究. 河北省科學(xué)院學(xué)報,2007,24(4):7—12
Liu X,Yu G X,Shen X T. Comparative research on forecasting models based on neural networks(In Chinese). Journal of the Hebei Academy of Sciences,2007,24(4):7—12
[26] 尹燕平,盧文喜,許曉鴻,等. 基于RBF神經(jīng)網(wǎng)絡(luò)的土壤侵蝕預(yù)測模型研究. 水土保持研究,2013,20 (2):25—28
Yin Y P,Lu W X,Xu X H,et al. Research on soil erosion prediction model based on RBF neural network(In Chinese). Research of Soil and Water Conservation,2013,20(2):25—28
[27] 衛(wèi)敏,余樂安.具有最優(yōu)學(xué)習(xí)率的RBF神經(jīng)網(wǎng)絡(luò)及其應(yīng)用. 管理科學(xué)學(xué)報,2012,15(4):50—57
Wei M,Yu L A. A RBF neural network with optimum learning rates and its appliction(In Chinese). Journal of Management Sciences in China,2012,15(4):50—57
[28] 劉玉成. 熵法確定權(quán)重的地基沉降組合預(yù)測模型. 中國科技論文在線,2010,6(11):875-878
Liu Y C. A combined prediction model for foundation subsidence using the entropy weight method(In Chinese). Sciencepaper Online,2010,6(11):875—878
[29] 付華,許凡,徐耀松,等. 基于變權(quán)重RBF組合模型的煤與瓦斯突出強度預(yù)測. 中國安全科學(xué)學(xué)報,2013,23(8):65—70
Fu H,Xu F,Xu Y S,et al. Prediction of goal and gas outburst intensity based on variable weight RBF combination model(In Chinese). China Safety Science Journal,2013,23(8):65—70
[30] 彭杰,周清,張楊珠,等. 有機質(zhì)對土壤光譜特性的影響研究. 土壤學(xué)報,2013,50(3):517—524
Peng J,Zhou Q,Zhang Y Z,et al. Effect of soil organic matter on spectral characteristics of soil(In Chinese). Acta pedologica sinica,2013,50(3):517—524
[31] Bo S,Rossel R A V,Mouazen A M,et al. Visible and near infrared spectroscopy in soil science. Advances in Agronomy,2010,107:163—214
陳頌超,馮來磊,李碩,等.基于局部加權(quán)回歸的土壤全氮含量可見-近紅外光譜反演. 土壤學(xué)報,2015,52 (2):312—320
[32] Chen S C,F(xiàn)eng L L,Li S,et al. Vis-nir spectral inversion for prediction of soil total nitrogen content in laboratory based on locally weighted regression(In Chinese). Acta Pedologica Sinica,2015,52(2):312—320
[33] 劉艷芳,盧延年,郭龍,等.基于地類分層的土壤有機質(zhì)光譜反演校正樣本集的構(gòu)建. 土壤學(xué)報,2016,53 (2):332—341
Liu Y F,Lu Y N,Guo L,et al. Construction of calibration set based on the land use types in visible and near-infrared(VIS-NIR)model for soil organic matter estimation(In Chinese). Acta Pedologica Sinica,2016,53(2):332—341
[34] 沈潤平,丁國香,魏國栓,等. 基于人工神經(jīng)網(wǎng)絡(luò)的土壤有機質(zhì)含量高光譜反演. 土壤學(xué)報,2009,46 (3):391—397
Shen R P,Ding G X,Wei G S,et al. Retrieval of soil organic matter content from hyper-spectrum based on ANN(In Chinese). Acta Pedologica Sinica,2009,46(3):391—397
Composite-Model-Based Indirect Reversion of Soil Available Iron Spectrum of Forest Soil in Lushan
XIE Wen ZHAO Xiaomin?GUO Xi YE Yingcong LI Weifeng WANG Xiaoyan ZHANG Jiajia
(Key Laboratory of Poyang Lake Watershed Agricultural Resources and Ecology of Jiangxi Province,Jiangxi Agruicultural University /College of Forestry,Nanchang 330045,China)
【Objective】As iron is one of the nutrient elements essential to plant growth,the content of soil available plays an important role in evolution of forest environment. The technology of hyper-spectral remote-sensing(RS)provides a new means for determination of soil physical and chemical components in laboratory.【Method】In this study,the relationship between soil organic matter and available iron was used to predict the content of available iron in soil indirectly. Besides the traditional single factor prediction model has its own limitation. In order to solve the problem of errors with the single-factor model,this study brought forth a composite model to improve accuracy of the prediction of soil organic matter contents in forest soils at a regional scale with the Vis-NIR spectrum technique. A total of 190 soil samples were collected from the 0~20 cm soil layers of the forests typical of Lushan region in Jiangxi Province. An ASD FieldSpec3 spectrograph diameter equipped with a high intensity contact probe was used to measure original spectral reflectance of the samples in line with standard procedure of the laboratory conditions,and mean while,the soil samples were analyzed for physical and chemical properties. Out of the 190 soil samples,143 were picked out as samples for modeling and the remaining 47 verification ones.【Result】The results showed that a significant positive correlation was found between the contents of soil organic matter and soil available iron,and then the binomial model can be built. Based on the results of spectral inversion of soil organic matter content,the contents of soil available iron were retrievable indirectly. Among the spectral inversion models,based on the full band(400~2450 nm)of soil spectra in this study,PLSR(Partial Least Square Regression)of the optimal linear fitting model and RBF(Radial Basis Function)neural network of the nonlinear fitting model were selected to form a combination to figure out arithmetic mean weight coefficients and to project an optimal combination model based on squared,reciprocal and entropy weight coefficients. Accuracies of the predictions of soil available iron content were evaluated by root mean squared error(RMSEp),ratio of partial deviation (RPD)and determination coefficients(R2). Results show that the combination model is superior to the two separate models in prediction accuracy. Among the combination models,the entropy weight coefficient combination model is the best,with determination coefficient(R2)in verification model,root mean squared error(RMSEp)and ratio of standard deviation of determination to standard deviation(RPD)of the soil organic matter prediction being 0.81,11.54 g kg-1and 2.18,the soil available iron indirect prediction being 0.70,21.60 mg kg-1and 1.77,respectively. The combination model is able to make use to a maximum margin of various information of the samples for prediction,reduce effectively the impacts of random factorsin using single prediction models,enhance prediction stability and raise prediction capability of the models.【Conclusion】All the findings of the study demonstrate that it is feasible to in directly predict soil available iron contents in forest soils by making use of hyper-spectral RS data. In the end,it can be concluded that the combination model can play a pretty good role in predicting soil organic matter content and indirect predicting soil available iron content.
Soil spectrum;Prediction of soil available iron;RBF neural network;Partial least squares regression(PLSR);Combination model
S127;O657.3
A
(責(zé)任編輯:檀滿枝)
* 國家自然科學(xué)基金項目(41361049)和土壤與農(nóng)業(yè)可持續(xù)發(fā)展國家重點實驗室項目(0812201202)資助 Supported by the National Natural Science Foundation of China(No.41361049)and The Project of State Key Laboratory of Soil and Sustainable Agricultural(No.0812201202)
? 通訊作者 Corresponding author,E-mail:zhaoxm889@126.com
謝 文(1978—),女,江西上高人,博士研究生,講師,主要從事土壤遙感與信息技術(shù)研究。E-mail:183385413@qq.com
2016-06-21;
2016-11-03;優(yōu)先數(shù)字出版日期(www.cnki.net):2017-02-13
10.11766/trxb201606210174