朱亞星,于雷,洪永勝,章濤,朱強(qiáng),李思締,郭力,劉家勝
?
土壤有機(jī)質(zhì)高光譜特征與波長(zhǎng)變量?jī)?yōu)選方法
朱亞星,于雷,洪永勝,章濤,朱強(qiáng),李思締,郭力,劉家勝
(華中師范大學(xué)地理過(guò)程分析與模擬湖北省重點(diǎn)實(shí)驗(yàn)室/華中師范大學(xué)城市與環(huán)境科學(xué)學(xué)院,武漢430079)
探究土壤有機(jī)質(zhì)的高光譜特征及響應(yīng)規(guī)律,優(yōu)選土壤有機(jī)質(zhì)的敏感波長(zhǎng),降低土壤有機(jī)質(zhì)高光譜估測(cè)模型復(fù)雜度,提高模型穩(wěn)健性,為利用高光譜技術(shù)對(duì)農(nóng)田土壤肥力的定量監(jiān)測(cè)提供理論支撐。采集江漢平原潮土土樣130個(gè),將其中40個(gè)樣本作為訓(xùn)練集,測(cè)量其去有機(jī)質(zhì)前、后的土壤有機(jī)質(zhì)含量及光譜數(shù)據(jù),計(jì)算差值及變化率,分析土壤有機(jī)質(zhì)含量變化對(duì)光譜特征的影響,結(jié)合無(wú)信息變量消除(uninformative variables elimination,UVE)、競(jìng)爭(zhēng)適應(yīng)重加權(quán)采樣(competitive adaptive reweighted sampling,CARS)變量?jī)?yōu)選方法確定土壤有機(jī)質(zhì)敏感波長(zhǎng);采用45個(gè)建模集樣本,基于偏最小二乘回歸(partial Least Squares Regression,PLSR)和反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)建立土壤有機(jī)質(zhì)含量的估算模型;利用45個(gè)驗(yàn)證集樣本檢驗(yàn)敏感波長(zhǎng)對(duì)同類土壤的適用性。通過(guò)有機(jī)質(zhì)去除試驗(yàn),供試土壤的平均光譜反射率在全波段均有所增加,在可見(jiàn)光波段變化率高于近紅外波段;比較UVE、CARS、UVE-CARS、CARS-UVE這4種變量?jī)?yōu)選方法,得到最佳變量?jī)?yōu)選方法為UVE-CARS,該方法從2001個(gè)波長(zhǎng)變量中優(yōu)選得到84個(gè)變量作為土壤有機(jī)質(zhì)的敏感波長(zhǎng),分布于561—721、1 920—2 280 nm波段覆蓋范圍;基于敏感波長(zhǎng)的PLSR、BPNN模型性能均優(yōu)于全波段模型,其中,基于敏感波長(zhǎng)的BPNN模型的估測(cè)能力高于PLSR,模型驗(yàn)證集2、RMSE、RPD、MAE、MRE值分別為0.74、1.33 g·kg-1、2.02、1.04 g·kg-1、6.2%,可實(shí)現(xiàn)土壤有機(jī)質(zhì)含量的有效估測(cè)。通過(guò)訓(xùn)練集獲得的土壤有機(jī)質(zhì)敏感波長(zhǎng),能夠?qū)崿F(xiàn)對(duì)該試驗(yàn)區(qū)同種土壤類型樣本土壤有機(jī)質(zhì)含量的有效估測(cè);利用去有機(jī)質(zhì)試驗(yàn)結(jié)合變量?jī)?yōu)選方法確定的敏感波長(zhǎng)建模,不僅將輸入波長(zhǎng)壓縮至全波段波長(zhǎng)數(shù)目的4.2 %,而且提升了模型估測(cè)精度,降低了變量維度和模型復(fù)雜度,為快速準(zhǔn)確評(píng)估農(nóng)田土壤有機(jī)質(zhì)含量提供了新途徑。
土壤有機(jī)質(zhì);高光譜;變量?jī)?yōu)選;偏最小二乘回歸;反向傳播神經(jīng)網(wǎng)絡(luò);潮土
【研究意義】土壤有機(jī)質(zhì)是土壤營(yíng)養(yǎng)元素的重要來(lái)源,是反映和判斷土壤肥力的關(guān)鍵指標(biāo)[1]。高光譜技術(shù)是一種新興的農(nóng)業(yè)現(xiàn)代化技術(shù),具有高效、非接觸、無(wú)污染等優(yōu)勢(shì),被應(yīng)用于估算土壤有機(jī)質(zhì)含量的研究[2-5]。土壤高光譜是土壤各種理化性狀(有機(jī)質(zhì)、氧化鐵、水分、質(zhì)地和孔隙度等)的綜合外在表現(xiàn),包含了豐富的土壤屬性信息,其中必然存在與土壤有機(jī)質(zhì)無(wú)關(guān)的光譜信息。土壤有機(jī)質(zhì)與其他理化屬性的光譜吸收峰之間相互重疊[6],呈現(xiàn)合頻和倍頻現(xiàn)象,導(dǎo)致土壤高光譜中存在較多與土壤有機(jī)質(zhì)相關(guān)而冗余的波長(zhǎng)信息,均嚴(yán)重影響估測(cè)模型性能和精度。鑒于此,有必要探究土壤有機(jī)質(zhì)的高光譜特征,揭示土壤有機(jī)質(zhì)的高光譜響應(yīng)規(guī)律,為優(yōu)選土壤有機(jī)質(zhì)的敏感波長(zhǎng)、構(gòu)建較高精度的估測(cè)模型提供理論依據(jù)?!厩叭搜芯窟M(jìn)展】利用土壤有機(jī)質(zhì)敏感波長(zhǎng)建立土壤有機(jī)質(zhì)含量估算模型,可以降低模型復(fù)雜度,同時(shí)保持甚至提升模型精度。早期學(xué)者們采用相關(guān)分析法研究土壤有機(jī)質(zhì)與土樣光譜反射率(或其不同數(shù)學(xué)變換形式)的關(guān)系,將相關(guān)系數(shù)高的波長(zhǎng)作為土壤有機(jī)質(zhì)敏感波長(zhǎng)[7-9]。而后,學(xué)者們通過(guò)分析土壤去除有機(jī)質(zhì)前、后的光譜變化特征,獲取土壤光譜反射率變化較大的波段,將其作為土壤有機(jī)質(zhì)的敏感波段[10-12]。近年來(lái),越來(lái)越多的學(xué)者采用變量?jī)?yōu)選方法[13-14],從全波段中濾除無(wú)效變量或冗余變量,優(yōu)選出敏感波段。YANG等[15]基于田間較小范圍土壤光譜,采用無(wú)信息變量消除(uninformative variables elimination,UVE)方法結(jié)合連續(xù)投影算法(successive projections algorithm,SPA)優(yōu)選敏感波長(zhǎng),采用敏感波長(zhǎng)建立的偏最小二乘回歸(partial least squares regression,PLSR)模型的估測(cè)精度和全波段模型基本一致;于雷等[16]嘗試將不同的變量?jī)?yōu)選方法耦合進(jìn)行土壤有機(jī)質(zhì)敏感波長(zhǎng)變量的優(yōu)選,得到競(jìng)爭(zhēng)適應(yīng)重加權(quán)采樣(competitive adaptive reweighted sampling,CARS)與SPA方法耦合的CARS-SPA-PLSR模型估測(cè)精度略高于全波段模型。上述研究結(jié)果表明,變量?jī)?yōu)選方法可以精確、有效地確定敏感波長(zhǎng)。【本研究切入點(diǎn)】然而,相關(guān)分析法僅對(duì)觀測(cè)結(jié)果進(jìn)行數(shù)理統(tǒng)計(jì),未能嘗試探究土壤有機(jī)質(zhì)的高光譜響應(yīng)機(jī)理,揭示土壤有機(jī)質(zhì)的光譜響應(yīng)規(guī)律;去除有機(jī)質(zhì)方法雖能夠較好地確定敏感程度高的有機(jī)質(zhì)響應(yīng)波段,但仍需要深入分析這些敏感波段是否存在無(wú)效或冗余信息?!緮M解決的關(guān)鍵問(wèn)題】因此,本文以江漢平原潮土為研究對(duì)象,將去有機(jī)質(zhì)試驗(yàn)和變量?jī)?yōu)選方法的優(yōu)勢(shì)相結(jié)合,通過(guò)分析土樣去有機(jī)質(zhì)前、后的光譜數(shù)據(jù),揭示土壤有機(jī)質(zhì)的光譜響應(yīng)規(guī)律,基于變量?jī)?yōu)選方法確定土壤有機(jī)質(zhì)敏感波長(zhǎng),為利用高光譜技術(shù)監(jiān)測(cè)農(nóng)田土壤提供理論支撐。
試驗(yàn)區(qū)位于湖北省潛江市竹根灘鎮(zhèn)(圖1),江漢平原腹地,地勢(shì)平坦;屬于亞熱帶季風(fēng)性濕潤(rùn)氣候,四季分明,雨量充沛,耕地地力優(yōu)越;主要分布的土壤類型為潮土,是江漢平原最常見(jiàn)的土壤類型之一;主要種植棉花、大豆和花生等旱生作物。
選取試驗(yàn)區(qū)內(nèi)面積約為650 m×300 m田塊,設(shè)置5行、26列,行間距為75 m、列間距為25 m,布設(shè)130個(gè)樣點(diǎn)(圖2);采集耕層土樣,深度為0—20 cm,十字法取樣,剔除侵入體,混合均勻后四分法采樣,帶回實(shí)驗(yàn)室風(fēng)干、磨碎、過(guò)2 mm孔篩。
將130份土樣分為訓(xùn)練集、建模集和驗(yàn)證集(表1)。按照采樣順序取1號(hào)土樣后,每隔2個(gè)編號(hào)抽取1份土樣,直至結(jié)束共獲取40份供試土樣為訓(xùn)練集;剩余90份土樣按照土壤有機(jī)質(zhì)含量升序排列,排在奇數(shù)位的45份土樣作為建模集,排在偶數(shù)位的45份土樣作為驗(yàn)證集。訓(xùn)練集樣本用于土壤有機(jī)質(zhì)去除試驗(yàn),確定土壤有機(jī)質(zhì)敏感波長(zhǎng);建模集樣本用于基于敏感波長(zhǎng)建立估算模型;驗(yàn)證集樣本用于檢驗(yàn)土壤有機(jī)質(zhì)敏感波長(zhǎng)對(duì)同種土壤類型的適用性。采用重鉻酸鉀容量法-外加熱法[17]測(cè)定土壤有機(jī)質(zhì)含量。
圖1 試驗(yàn)區(qū)地理位置圖
圖2 樣本采集示意圖
表1 土壤有機(jī)質(zhì)含量統(tǒng)計(jì)特征
去有機(jī)質(zhì)試驗(yàn)的具體步驟如下:量取300 mL土樣放入5 000 mL燒杯中,加入200 mL 30% H2O2溶液,用橡膠頭玻璃棒攪動(dòng)加速其氧化,待強(qiáng)烈氧化過(guò)后,靜置片刻,再次加入200 mL H2O2,重復(fù)上述操作,直至最后一次加入H2O2溶液時(shí)燒杯中的土樣無(wú)明顯反應(yīng)且有上層清液出現(xiàn),則停止操作。土樣靜置約24 h,移除上層清液,將去有機(jī)質(zhì)土樣置于60℃恒溫箱烘干,重新過(guò)2 mm孔篩,測(cè)定有機(jī)質(zhì)含量,獲取去除有機(jī)質(zhì)后土樣的有機(jī)質(zhì)含量統(tǒng)計(jì)特征(表2)。
土樣高光譜數(shù)據(jù)的測(cè)定采用美國(guó)Analytical Spectral Devices公司開發(fā)生產(chǎn)的ASD FieldSpec3地物光譜儀,波譜范圍350—2 500 nm,采樣間隔1.4 nm(350—1 000 nm)和2 nm(1 000—2 500 nm),重采樣間隔1 nm。光源為能夠提供平行光線的50 W鹵素?zé)?。采?°視場(chǎng)角光纖探頭,光源到土壤表面距離()為50 cm,光源入射角度()為30°,探頭到土壤表面距離()為15 cm[18]。將土樣置于直徑10 cm深2 cm盛樣皿中,土壤表面刮平,在暗室內(nèi)進(jìn)行光譜測(cè)量。每次采集光譜前,用白板(反射率100%)對(duì)光譜儀進(jìn)行優(yōu)化和標(biāo)定。每個(gè)土樣進(jìn)行4個(gè)方向(轉(zhuǎn)動(dòng)3次,每次90°)的測(cè)量,每個(gè)方向保存5條光譜曲線,共20條,對(duì)其進(jìn)行算術(shù)平均后得到土樣原始光譜,每條光譜去除噪聲較大的邊緣波段350—399 nm和2 401—2 500 nm之后為本文所用光譜數(shù)據(jù)。
去有機(jī)質(zhì)前、后光譜的差值及變化率運(yùn)算可獲取因有機(jī)質(zhì)含量變化而引起的光譜變化信息,為土壤有機(jī)質(zhì)的高光譜特征分析提供數(shù)據(jù)基礎(chǔ)。具體算法為:
=-(1)
式中,為去有機(jī)質(zhì)前、后的差值光譜矩陣,為樣本數(shù),即40,為波長(zhǎng)變量數(shù),即2 001,為去有機(jī)質(zhì)后的光譜矩陣,為去有機(jī)質(zhì)前的光譜矩陣。
UVE算法[19]是在分析PLSR模型回歸系數(shù)的基礎(chǔ)上,消除不提供目標(biāo)矩陣信息即無(wú)用的變量信息。本文訓(xùn)練集去有機(jī)質(zhì)前、后的差值光譜矩陣與有機(jī)質(zhì)去除量矩陣1存在如下關(guān)系:1=·+,其中表示回歸系數(shù)向量,表示誤差向量。UVE算法是將隨機(jī)變量矩陣即噪音矩陣(與自變量矩陣數(shù)目相同)加入原始光譜矩陣中,通過(guò)PLSR交叉驗(yàn)證逐一剔除原始光譜矩陣中的無(wú)用變量,得到回歸系數(shù)矩陣,利用回歸系數(shù)矩陣中回歸系數(shù)向量的平均值和標(biāo)準(zhǔn)偏差的商即變量的穩(wěn)定性,評(píng)價(jià)每個(gè)變量的可靠性[20-21],從而獲取可靠性較強(qiáng)的波長(zhǎng)變量。表達(dá)式如下:
表2 訓(xùn)練集樣本去有機(jī)質(zhì)后的土壤有機(jī)質(zhì)含量統(tǒng)計(jì)特征
式中,(b)表示回歸系數(shù)向量的平均值,(b)表示回歸系數(shù)向量的標(biāo)準(zhǔn)偏差,表示光譜矩陣中第列向量。
C=Max[abs(C)] (4)
CARS算法模仿達(dá)爾文進(jìn)化理論中“適者生存”的基本原理,各波長(zhǎng)變量將被作為單一個(gè)體,在進(jìn)行個(gè)體選擇的過(guò)程中,保留具有較強(qiáng)適應(yīng)能力的個(gè)體,剔除適應(yīng)能力較弱的個(gè)體。在波長(zhǎng)變量?jī)?yōu)選過(guò)程中,通過(guò)優(yōu)選PLSR模型回歸系數(shù)絕對(duì)值相對(duì)較大的波長(zhǎng)變量,剔除模型回歸系數(shù)絕對(duì)值相對(duì)較小的波長(zhǎng)變量,從而獲得多個(gè)優(yōu)選變量子集,再通過(guò)獲取交叉驗(yàn)證模型中交叉驗(yàn)證均方根誤差(root-mean-square error of cross-validation,RMSECV)最小的優(yōu)選變量子集,即為最優(yōu)變量子集[23-24]。
將UVE、CARS 兩種算法相結(jié)合,比較UVE、CARS、UVE-CARS、CARS-UVE這4種變量?jī)?yōu)選方法,獲取最佳變量?jī)?yōu)選方法。
UVE、CARS方法以及示意圖繪制均通過(guò)Matlab R2012a(The MathWorks,USA)軟件完成。
利用線性和非線性模型中較為典型的PLSR和BPNN方法進(jìn)行建模、驗(yàn)證分析。PLSR可以較好地解決樣本數(shù)量小于波長(zhǎng)數(shù)量的問(wèn)題,以及自變量之間存在多重相關(guān)性的問(wèn)題;此外,該模型可以有效地提取對(duì)系統(tǒng)解釋能力較強(qiáng)的綜合變量,從而排除無(wú)解釋能力的信息,對(duì)因變量的解釋能力增強(qiáng)[25]。
BPNN是目前應(yīng)用較為廣泛的一類人工神經(jīng)網(wǎng)絡(luò)模型,具有較強(qiáng)的非線性處理能力和抗干擾能力[26]。該模型的特點(diǎn)是信號(hào)前向傳遞,誤差反向傳遞。在前向傳遞中,輸入信號(hào)由輸入層經(jīng)隱含層逐層處理,直至輸出層;每一層的神經(jīng)元狀態(tài)只影響下一層神經(jīng)元狀態(tài),如果輸出層得不到期望輸出,則轉(zhuǎn)入反向傳播,根據(jù)預(yù)測(cè)誤差調(diào)整網(wǎng)絡(luò)權(quán)值,權(quán)值不斷調(diào)整的過(guò)程即為網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程;直至網(wǎng)絡(luò)輸出的誤差逐漸減少至可接受的程度或達(dá)到設(shè)定的學(xué)習(xí)次數(shù)為止[27-28]。本文采用訓(xùn)練函數(shù)為L(zhǎng)evenberg-Marquardt算法的trainlm,隱含層傳遞函數(shù)為正切Sigmoid函數(shù),輸出層為purelin函數(shù),學(xué)習(xí)速率為0.01,最大訓(xùn)練次數(shù)為1 000次,模型期望誤差為0.001。
利用決定系數(shù)(determination coefficients,2)、均方根誤差(root mean squared error,RMSE)、相對(duì)分析誤差(relative percent deviation,RPD)、平均絕對(duì)誤差(mean absolute error,MAE)、平均相對(duì)誤差(mean relative error,MRE)及1﹕1線綜合評(píng)價(jià)PLSR及BPNN的模型性能。其中,2值越接近于1,表明模型的穩(wěn)定性及擬合度越高;RMSE值越接近于0,表明模型的估測(cè)值與實(shí)測(cè)值誤差變幅越??;RPD值是計(jì)算樣本標(biāo)準(zhǔn)差與均方根誤差比值得到,若RPD<1.4,模型對(duì)樣本無(wú)法實(shí)施估測(cè),1.4≤RPD<2,模型可對(duì)樣本進(jìn)行粗略評(píng)估,RPD≥2,模型可對(duì)樣本進(jìn)行極好的估測(cè);MAE和MRE值能夠反應(yīng)估測(cè)值誤差的真實(shí)情況。PLSR模型的建立與驗(yàn)證在The Unscrambler 9.7軟件中完成,BPNN模型建立與驗(yàn)證在Matlab R2012a(The MathWorks,USA)軟件中完成。
去有機(jī)質(zhì)前、后平均光譜反射曲線特征比較表明,光譜反射率在全波段范圍隨有機(jī)質(zhì)含量的減少而呈現(xiàn)增加趨勢(shì)(圖3-A),而反射率增加后的光譜曲線幾何特征與去有機(jī)質(zhì)前的在不同波段存在差異:去有機(jī)質(zhì)后的光譜曲線在400—600 nm的斜率及550—650 nm的弓曲差[29]均大于去有機(jī)質(zhì)前(圖3-A1、3-A2),在800—2 400 nm的斜率則小于去有機(jī)質(zhì)前(圖3-A3)。
應(yīng)用差值運(yùn)算對(duì)訓(xùn)練集樣本去有機(jī)質(zhì)前、后光譜的差異進(jìn)行研究,提取因有機(jī)質(zhì)含量變化所造成的光譜差異信息。去有機(jī)質(zhì)前、后的平均差值光譜反射曲線呈現(xiàn)出各波段對(duì)有機(jī)質(zhì)含量變化的響應(yīng)規(guī)律(圖4),具體為:差值光譜反射率值在全波段范圍均大于零,其在可見(jiàn)光波段(400—780 nm)總體大于近紅外波段(780—2 400 nm)。可見(jiàn)光波段的光譜反射曲線在600 nm附近凸起,該波長(zhǎng)處反射率值達(dá)到最大。近紅外波段的光譜反射率值在780—1 900 nm波段呈減小趨勢(shì),1 900—2 400 nm逐漸趨于平穩(wěn),僅2 000 nm附近存在微弱的凸起。這說(shuō)明各波段的光譜對(duì)有機(jī)質(zhì)含量變化的響應(yīng)具有差異。
圖 3 去有機(jī)質(zhì)前、后平均光譜反射曲線比較
圖 4 平均差值光譜反射曲線
采用變化率表征基于不同有機(jī)質(zhì)去除量,去有機(jī)質(zhì)后全波段及分波段的光譜反射率變化情況:有機(jī)質(zhì)去除量與去有機(jī)質(zhì)后光譜反射率的變化率呈正相關(guān)關(guān)系,當(dāng)樣本本身有機(jī)質(zhì)去除量最大時(shí),光譜反射率的變化率在任何波段都最大;各個(gè)供試土樣去有機(jī)質(zhì)后,在全波段范圍的光譜反射率均有所增加,尤其在可見(jiàn)光波段增加明顯(表3)。這說(shuō)明去有機(jī)質(zhì)試驗(yàn),不僅對(duì)土壤有機(jī)質(zhì)光譜響應(yīng)規(guī)律產(chǎn)生直接作用,而且揭示了同一樣本的有機(jī)質(zhì)含量變化對(duì)不同波段的影響效果不同,這使得優(yōu)選光譜變量的必要性顯著,消除無(wú)效變量,獲取重要性變量,即對(duì)土壤有機(jī)質(zhì)響應(yīng)強(qiáng)烈的敏感波長(zhǎng)變量尤為重要。
2.3.1 UVE變量?jī)?yōu)選 利用去有機(jī)質(zhì)前、后的差值光譜矩陣與有機(jī)質(zhì)去除量矩陣進(jìn)行UVE變量?jī)?yōu)選,得到UVE變量穩(wěn)定性分析結(jié)果(圖5-A)。其中,2 000 nm處的豎直線為變量分隔線,分隔線左側(cè)為原始矩陣2 001個(gè)光譜變量的穩(wěn)定性的分布曲線,右側(cè)為UVE噪音矩陣2 001個(gè)隨機(jī)變量的穩(wěn)定性的分布曲線,兩條水平線為UVE變量篩選的上下閾值線,其中閾值的選擇標(biāo)準(zhǔn)設(shè)置為C的0.99倍。從而剔除變量穩(wěn)定性值位于2條閾值線以內(nèi)的無(wú)用信息變量,保留2條閾值線以外的有用信息變量。經(jīng)UVE變量?jī)?yōu)選后,共有575個(gè)優(yōu)選變量被保留。
2.3.2 CARS變量?jī)?yōu)選 采用CARS方法優(yōu)選,設(shè)置蒙特卡羅采樣次數(shù)為50次,隨著采樣數(shù)增加,被優(yōu)選出的波長(zhǎng)變量數(shù)逐漸減少(圖5B-a)。在1—23次采樣過(guò)程中,RMSECV值不斷降低,表明篩選過(guò)程中剔除的變量與有機(jī)質(zhì)去除量無(wú)關(guān),而23次采樣以后,RMSECV值呈回升趨勢(shì),表明開始剔除與有機(jī)質(zhì)去除量相關(guān)的重要變量,從而導(dǎo)致RMSECV值上升(圖5B-b)。當(dāng)采樣次數(shù)為第23次時(shí),RMSECV值最小即所選擇的光譜變量子集最優(yōu)(圖5B-c中“*”對(duì)應(yīng)的位置),其中該子集包含48個(gè)光譜變量。
圖 5 基于不同方法的變量?jī)?yōu)選
表3 去除有機(jī)質(zhì)后對(duì)土壤光譜反射率的影響
2.3.3 UVE-CARS、CARS-UVE變量?jī)?yōu)選 將UVE、CARS兩種變量?jī)?yōu)選方法按照不同運(yùn)行順序結(jié)合(UVE-CARS、CARS-UVE)對(duì)去有機(jī)質(zhì)前、后差值光譜進(jìn)行變量?jī)?yōu)選,獲得基于不同方法的優(yōu)選變量分布(圖6)。
以不同變量?jī)?yōu)選方法的優(yōu)選變量為自變量,有機(jī)質(zhì)含量為因變量,建立、比較各PLSR模型內(nèi)部交叉驗(yàn)證的效果,確定最佳的變量?jī)?yōu)選方法(表4)。結(jié)果表明,采用UVE-CARS方法獲得的優(yōu)選變量所建模型精度最高,由此后續(xù)基于建模集和驗(yàn)證集進(jìn)行分析的土壤有機(jī)質(zhì)敏感波長(zhǎng)(記為sen)以UVE-CARS方法的優(yōu)選變量為準(zhǔn),其84個(gè)優(yōu)選變量分布于561—721、1 920—2 280 nm覆蓋范圍。
圖中括號(hào)內(nèi)數(shù)字是基于各變量?jī)?yōu)選方法的優(yōu)選變量個(gè)數(shù);圖右側(cè)波段表示基于各變量?jī)?yōu)選方法的優(yōu)選變量的波段覆蓋范圍
表4 不同變量?jī)?yōu)選方法的優(yōu)選變量PLSR模型結(jié)果
基于sen建模的同時(shí)引入全波段進(jìn)行比較(圖7)。以sen對(duì)應(yīng)光譜反射率為PLSR分析的自變量,土壤有機(jī)質(zhì)含量為因變量,采用Full Cross Validation法確定回歸模型中最佳因子數(shù),建立PLSR模型(簡(jiǎn)稱sen-PLSR)。以同樣數(shù)據(jù)集為BPNN的輸入變量,土壤有機(jī)質(zhì)含量為輸出變量,建立BPNN模型(簡(jiǎn)稱sen-BPNN),將其與全波段的PLSR(簡(jiǎn)稱F-PLSR)和BPNN(簡(jiǎn)稱F-BPNN)進(jìn)行比較(表5)。結(jié)果表明,sen-PLSR、sen-BPNN模型性能均優(yōu)于基于各自方法的全波段模型。對(duì)比sen-PLSR、sen-BPNN模型,后者建模和驗(yàn)證的穩(wěn)定性和擬合程度均高于前者。基于sen建模,將模型的自變量數(shù)目從2 001個(gè)降低至84個(gè),數(shù)據(jù)壓縮率為95.8%。
去有機(jī)質(zhì)試驗(yàn)結(jié)果表明,去有機(jī)質(zhì)前、后光譜反射率曲線的幾何特征在不同波段存在差異。隨著有機(jī)質(zhì)去除量的增加,去有機(jī)質(zhì)后光譜反射率變化也隨之增大,尤其表現(xiàn)在可見(jiàn)光波段。這說(shuō)明該試驗(yàn)對(duì)于深入探討土壤有機(jī)質(zhì)光譜響應(yīng)規(guī)律產(chǎn)生直接作用,為后續(xù)確定土壤有機(jī)質(zhì)敏感波長(zhǎng)奠定基礎(chǔ)。供試土樣去有機(jī)質(zhì)后,光譜的平均反射率在全波段范圍均有所增加,在可見(jiàn)光波段增加明顯。彭杰等[13]通過(guò)比較去有機(jī)質(zhì)前、后土壤的光譜反射特性,認(rèn)為供試的多種土壤類型土樣均在400—700 nm波段的平均光譜反射率變化最大,即去有機(jī)質(zhì)對(duì)該波段的影響最大。而本文最終定量獲取土壤有機(jī)質(zhì)敏感波長(zhǎng)分布于561—721、1 920—2 280 nm覆蓋范圍,這說(shuō)明將去有機(jī)質(zhì)試驗(yàn)與變量?jī)?yōu)選方法的優(yōu)勢(shì)相結(jié)合,一些原本較隱晦的土壤有機(jī)質(zhì)光譜特征信息被提取[30],該敏感波長(zhǎng)的分布與可見(jiàn)光譜區(qū)受到土壤發(fā)色團(tuán)和有機(jī)質(zhì)本身黑色的影響,以及2 200 nm附近有機(jī)質(zhì)中O-H官能團(tuán)的伸縮振動(dòng)和轉(zhuǎn)角振動(dòng)的合頻躍遷有關(guān)[31-32]。
圖7 土壤有機(jī)質(zhì)含量的實(shí)測(cè)值與估測(cè)值比較
表 5 土壤有機(jī)質(zhì)含量估測(cè)模型的建模集和驗(yàn)證集結(jié)果
通過(guò)去有機(jī)質(zhì)前、后光譜的差值運(yùn)算,基于光譜變化信息,采用多種變量?jī)?yōu)選方法從全波段范圍中獲取優(yōu)選變量。單一進(jìn)行UVE變量?jī)?yōu)選,則僅僅消除無(wú)用變量,并未確定對(duì)土壤有機(jī)質(zhì)敏感性強(qiáng)的相關(guān)變量。單一進(jìn)行CARS變量?jī)?yōu)選,則存在大量無(wú)用信息影響甚至遮蔽重要性信息的優(yōu)選。故考慮將兩種方法按照不同運(yùn)行順序進(jìn)行結(jié)合,表明UVE-CARS的內(nèi)部交叉驗(yàn)證結(jié)果不僅優(yōu)于單一優(yōu)選方法,而且優(yōu)于CARS-UVE,成為最佳的變量?jī)?yōu)選方法。這與2種算法本身特征及算法運(yùn)行順序密切有關(guān),UVE方法消除了光譜中對(duì)模型貢獻(xiàn)小甚至無(wú)用的變量,降低了噪聲干擾對(duì)模型穩(wěn)健性的影響,提高模型的抗干擾能力[21],在此基礎(chǔ)上CARS方法優(yōu)選了對(duì)模型貢獻(xiàn)大的波長(zhǎng)變量集合[33],UVE-CARS在消除了無(wú)用信息后,被掩蓋的有用信息的重要性被釋放和凸顯,得到的優(yōu)選變量個(gè)數(shù)甚至多于單一CARS方法,這種先“過(guò)濾”后“優(yōu)選”的運(yùn)算過(guò)程,能夠合理、精確、有效的確定敏感波長(zhǎng)在全波段中的位置。
利用建模集基于敏感波長(zhǎng)建模,輸入變量大幅減少,線性及非線性模型性能均優(yōu)于全波段模型,驗(yàn)證集的檢驗(yàn)結(jié)果體現(xiàn)了敏感波長(zhǎng)對(duì)該試驗(yàn)區(qū)同類土壤有機(jī)質(zhì)含量估測(cè)的適用性。其中,BPNN模型的估測(cè)能力高于PLSR的結(jié)果說(shuō)明,BPNN模型具有強(qiáng)大的容錯(cuò)能力及非線性逼近能力[34],該模型可以歸避由于儀器、人為等因素引起的異常數(shù)據(jù)對(duì)模型的不良影響,使分析結(jié)果達(dá)到了較高的估測(cè)精度[28]。尤其是sen-BPNN模型的估測(cè)效果最優(yōu),說(shuō)明本文研究方法獲得的敏感波長(zhǎng),更能夠反映土壤有機(jī)質(zhì)與光譜反射率之間的非線性關(guān)系。紀(jì)文君等[34]在進(jìn)行土壤有機(jī)質(zhì)高光譜估測(cè)建模研究中將PLSR提取出的主成分帶入BPNN進(jìn)行訓(xùn)練,與PLSR算法相比顯著提高了模型的估測(cè)精度,而主成分的提取過(guò)程是通過(guò)線性變換保留包含信息量多的組分,舍棄含信息量少的組分,這與本文變量?jī)?yōu)選方法的基本特征相一致,均將敏感性強(qiáng)的變量置于BPNN模型,從而實(shí)現(xiàn)基于非線性方法的土壤有機(jī)質(zhì)含量高精度的估測(cè)。
已有研究表明,基于統(tǒng)計(jì)學(xué)方法建立的估測(cè)模型精度受樣本變異程度的影響較大,不同土壤類型樣本之間的變異程度越高,模型估測(cè)精度也隨之提升[35],反之亦然[36]。本文以單一潮土為研究對(duì)象,將研究區(qū)限定在一個(gè)較小的空間范圍,使土壤樣本的變異度較低,將樣本變異度對(duì)建模的影響降到最低,能夠更單純地驗(yàn)證去有機(jī)質(zhì)試驗(yàn)和變量?jī)?yōu)選方法對(duì)提升模型估測(cè)精度的作用。本文的研究思路對(duì)該類土壤具有較好的可行性,未來(lái)可以嘗試擴(kuò)大研究范圍,將該方法應(yīng)用于不同土壤類型的有機(jī)質(zhì)含量估測(cè)研究,逐漸豐富和完善高光譜監(jiān)測(cè)土壤有機(jī)質(zhì)的理論體系。
本文以江漢平原潮土的130個(gè)土樣為研究對(duì)象,利用其中的訓(xùn)練集樣本進(jìn)行土壤有機(jī)質(zhì)去除試驗(yàn),分析去有機(jī)質(zhì)前、后土壤高光譜變化規(guī)律,基于兩者的差值光譜分析土壤有機(jī)質(zhì)的光譜響應(yīng)特征,采用最佳的變量?jī)?yōu)選方法獲取土壤有機(jī)質(zhì)敏感波長(zhǎng),建模集基于敏感波長(zhǎng)分別建立土壤有機(jī)質(zhì)的PLSR和BPNN的估算模型,驗(yàn)證集檢驗(yàn)本文研究方法對(duì)同類土壤的普適性。從而表明通過(guò)有機(jī)質(zhì)去除試驗(yàn),供試土壤的光譜反射率在全波段均有所增加,尤其在可見(jiàn)光波段變化明顯。基于訓(xùn)練集去有機(jī)質(zhì)前、后差值光譜,采用最佳的變量?jī)?yōu)選方法UVE-CARS進(jìn)行變量?jī)?yōu)選,最終獲得土壤有機(jī)質(zhì)的敏感波長(zhǎng)分布于561—721、1 920—2 280 nm波段覆蓋范圍。建模集基于土壤有機(jī)質(zhì)敏感波長(zhǎng)建立的PLSR、BPNN模型性能均優(yōu)于全波段,其中,基于敏感波長(zhǎng)的BPNN模型估測(cè)能力高于PLSR,建模集2、RMSE、RPD、MAE、MRE值分別為0.74、1.34 g·kg-1、2.00、1.04 g·kg-1、6.2%,驗(yàn)證集2、RMSE、RPD、MAE、MRE值分別為0.74、1.33 g·kg-1、2.02 g·kg-1、1.04 g·kg-1、6.2%。本研究將去有機(jī)質(zhì)試驗(yàn)和變量?jī)?yōu)選方法的優(yōu)勢(shì)相結(jié)合,獲取敏感波長(zhǎng)建模,所得線性、非線性模型精度較于全波段模型均有所提升。
[1] 胡克林, 余艷, 張鳳榮, 王茹. 北京郊區(qū)土壤有機(jī)質(zhì)含量的時(shí)空變異及其影響因素. 中國(guó)農(nóng)業(yè)科學(xué), 2006, 39(4): 764-771.
HU K L, YU Y, ZHANG F R, WANG R. The spatial-temporal variability of soil organic matter and its influencing factors in suburban area of Beijing., 2006, 39(4): 764-771. (in Chinese)
[2] ROSSEL VISCARRA R A, CATTLE S R, ORTEGA A, FOUAD Y. In situ measurements of soil colour, mineral composition and clay content by vis–NIR spectroscopy., 2009, 150(3/4): 253-266.
[3] 史舟, 王乾龍, 彭杰, 紀(jì)文君, 劉煥軍, 李曦, ROSSEL VISCARRA R.A. 中國(guó)主要土壤高光譜反射特性分類與有機(jī)質(zhì)光譜預(yù)測(cè)模型. 中國(guó)科學(xué): 地球科學(xué), 2014, 44(5): 978-988.
SHI Z, WANG Q L, PENG J, JI W J, LIU H J, LI X, ROSSEL VISCARRA R A., 2014, 44(5): 978-988. (in Chinese)
[4] ZHENG G H, RYU D, JIAO C X, HONG C Q. Estimation of organic matter content in coastal soil using reflectance spectroscopy., 2016, 26(1): 130-136.
[5] BAO N S, WU L X, YE B Y, ZHOU W. Assessing soil organic matter of reclaimed soil from a large surface coal mine using a field spectroradiometer in laboratory., 2017, 288: 47-55.
[6] SHI T Z, CHEN Y Y, LIU Y L, WU G F. Visible and near-infrared reflectance spectroscopy—An alternative for monitoring soil contamination by heavy metals., 2014, 265(30): 166-176.
[7] 盧艷麗, 白由路, 楊俐蘋, 王紅娟. 基于高光譜的土壤有機(jī)質(zhì)含量預(yù)測(cè)模型的建立與評(píng)價(jià). 中國(guó)農(nóng)業(yè)科學(xué), 2007, 40(9): 1989-1995.
LU Y L, BAI Y L, LIU L P, WANG H J. Prediction and validation of soil organic matter content based on Hyperspectrum., 2007, 40(9): 1989-1995. (in Chinese)
[8] 于士凱, 姚艷敏, 王德?tīng)I(yíng), 司海青. 基于高光譜的土壤有機(jī)質(zhì)含量反演研究. 中國(guó)農(nóng)學(xué)通報(bào), 2013, 29(23): 146-152.
YU S K, YAO Y M, WANG D Y, SI H Q. Studies on the inversion of soil organic matter content based on hyper-spectrum., 2013, 29(23): 146-152. (in Chinese)
[9] 劉煥軍, 張柏, 趙軍, 張興義, 宋開山, 王宗明, 段洪濤. 黑土有機(jī)質(zhì)含量高光譜模型研究. 土壤學(xué)報(bào), 2007, 44(1): 27-32.
LIU H J, ZHANG B, ZHAO J, ZHANG X Y, SONG K S, WANG Z M, DUAN H T. Spectral models for prediction of organic matter in black soil., 2007, 44(1): 27-32. (in Chinese)
[10] 徐彬彬, 季耿善, 朱永豪. 中國(guó)陸地背景和土壤光譜反射特性的地理分區(qū)的初步研究. 環(huán)境遙感, 1991, 6(2): 142-151.
XU B B, JI G S, ZHU Y H. A preliminary research of geographic regionalization of China land background and Spectral reflectance characteristics of soil., 1991, 6(2): 142-151. (in Chinese)
[11] 彭杰, 張楊珠, 周清, 劉香伶, 周衛(wèi)軍. 去除有機(jī)質(zhì)對(duì)土壤光譜特性的影響. 土壤, 2006, 38(4): 453-458.
PENG J, ZHANG Y Z, ZHOU Q, LIU X L, ZHOU W J. Spectral characteristics of soils in Hunan province as affected by removal of soil organic matter., 2006, 38(4): 453-458. (in Chinese)
[12] 彭杰, 周清, 張楊珠, 向紅英. 有機(jī)質(zhì)對(duì)土壤光譜特性的影響研究. 土壤學(xué)報(bào), 2013, 50(3): 517-524.
PENG J, ZHOU Q, ZHANG Y Z, XIANG H Y. Effect of soil organic matter on spectral characteristic of soil., 2013, 50(3): 517-524. (in Chinese)
[13] VOHLAND M, LUDWIG M, THIELE-BRUHN S, LUDWIG B. Determination of soil properties with visible to near- and mid-infrared spectroscopy: Effects of spectral variable selection., 2014, 223-225: 88-96.
[14] XU S X, ZHAO Y C, WANG M Y, SHI X Z. Determination of rice root density from Vis–NIR spectroscopy by support vector machine regression and spectral variable selection techniques., 2017, 157: 12-23.
[15] YANG H, KUANG B, MOUAZEN A M. Quantitative analysis of soil nitrogen and carbon at a farm scale using visible and near infrared spectroscopy coupled with wavelength reduction., 2012, 63(3): 410-420.
[16] 于雷, 洪永勝, 周勇, 朱強(qiáng), 徐良, 李冀云, 聶艷. 高光譜估算土壤有機(jī)質(zhì)含量的波長(zhǎng)變量篩選方法. 農(nóng)業(yè)工程學(xué)報(bào), 2016, 32(13): 95-102.
YU L, HONG Y S, ZHOU Y, ZHU Q, XU L, LI J Y, NIE Y. Wavelength variable selection methods for estimation of soil organic matter content using hyperspectral technique., 2016, 32(13): 95-102. (in Chinese)
[17] 鮑士旦. 土壤農(nóng)化分析. 3 版. 北京: 中國(guó)農(nóng)業(yè)出版社, 2013: 30-34.
BAO S D.Beijing: China Agriculture Press, 2013: 30-34. (in Chinese)
[18] 洪永勝, 于雷, 耿雷, 張薇, 聶艷, 周勇. 應(yīng)用DS算法消除室內(nèi)幾何測(cè)試條件對(duì)土壤高光譜數(shù)據(jù)波動(dòng)性的影響. 華中師范大學(xué)學(xué)報(bào), 2016, 50(2): 303-308.
HONG Y S, YU L, GENG L, ZHANG W, NIE Y, ZHOU Y. Using direct standardization algorithm to eliminate the effect of laboratory geometric parameters in soil hyperspectral data fluctuate characteristic., 2016, 50(2): 303-308. (in Chinese)
[19] CENTNER V, MASSART D L, DE NOORD O E, DE JONG S, VANDEGINSTE B M, STERNA C. Elimination of uninformative variables for multivariate calibration., 1996, 68(21): 3851-3858.
[20] 楊梅花, 趙小敏. 基于可見(jiàn)-近紅外光譜變量選擇的土壤全氮含量估測(cè)研究. 中國(guó)農(nóng)業(yè)科學(xué), 2014, 47(12): 2374-2383.
YANG M H, ZHAO X M. Study on soil total N estimation by Vis-NIR spectra with variable selection., 2014, 47(12): 2374-2383. (in Chinese)
[21] CAI W S, LI Y K, SHAO X G. A variable selection method based on uninformative variable elimination for multivariate calibration of near-infrared spectra., 2008, 90(2): 188-194.
[22] 孫通, 吳宜青, 劉秀紅, 莫欣欣, 劉木華. 激光誘導(dǎo)擊穿光譜聯(lián)合UVE變量?jī)?yōu)選檢測(cè)大豆油中的鉻含量. 光譜學(xué)與光譜分析, 2016, 36(10): 3341-3345.
SUN T, WU Y Q, LIU X H, MO X X, LIU M H. Detection of chromium content in soybean oil by laser induced breakdown spectroscopy and UVE method., 2016, 36(10): 3341-3345. (in Chinese)
[23] 于雷, 朱亞星, 洪永勝, 夏天, 劉目興, 周勇. 高光譜技術(shù)結(jié)合CARS算法預(yù)測(cè)土壤水分含量. 農(nóng)業(yè)工程學(xué)報(bào), 2016, 32(22): 138-145.
YU L, ZHU Y X, HONG Y S, XIA T, LIU M X, ZHOU Y. Determination of soil moisture content by hyperspectral technology with CARS algorithm., 2016, 32(22): 138-145. (in Chinese)
[24] JIANG H, ZHANG H, CHEN Q S, MEI C L, LIU G H. Identification of solid state fermentation degree with FT-NIR spectroscopy: Comparison of wavelength variable selection methods of CARS and SCARS., 2015, 149: 1-7.
[25] 彭小婷, 高文秀, 王俊杰. 基于包絡(luò)線去除和偏最小二乘的土壤參數(shù)光譜反演. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2014, 39(7): 862-866.
PENG X T, GAO W X, WANG J J. Inversion of soil parameters from hyperspectra based on continuum removal and partial least squares regression., 2014, 39(7): 862-866. (in Chinese)
[26] 于雷, 洪永勝, 周勇, 朱強(qiáng). 連續(xù)小波變換高光譜數(shù)據(jù)的土壤有機(jī)質(zhì)含量反演模型構(gòu)建. 光譜學(xué)與光譜分析, 2016, 36(5): 1428-1433.
YU L, HONG Y S, ZHOU Y, ZHU Q. Inversion of soil organic matter content using hyperspectral data based on continuous wavelet transformation., 2016, 36(5): 1428-1433. (in Chinese)
[27] 王凱龍, 熊黑鋼, 張芳. 基于PLSR-BP復(fù)合模型的綠洲土壤pH高光譜反演. 干旱區(qū)研究, 2014, 31(6): 1005-1009.
WANG K L, XIONG H G, ZHANG F. PLSR-BP complex model-based hyper-spectrum retrieval of oasis soil pH., 2014, 31(6): 1005-1009. (in Chinese)
[28] 鄭立華, 李民贊, 潘孌, 孫建英, 唐寧. 基于近紅外光譜技術(shù)的土壤參數(shù)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè). 光譜學(xué)與光譜分析, 2008, 28(5): 1160-1164.
ZHENG L H, LI M Z, PAN L, SUN J Y, TANG N. Estimation of soil organic matter and soil total nitrogen based on NIR spectroscopy and BP neural network., 2008, 28(5): 1160-1164. (in Chinese)
[29] 徐彬彬, 戴昌達(dá). 南疆土壤光譜反射特性與有機(jī)質(zhì)含量的相關(guān)分析. 科學(xué)通報(bào), 1980(6): 282-284.
XU B B, DAI C D. Relationship between soil re?ectance characteristics and SOM content in south area of Xinjiang Province., 1980(6): 282-284. (in Chinese)
[30] 彭杰, 張楊珠, 龐新安, 王家強(qiáng). 新疆南部土壤有機(jī)質(zhì)含量的高光譜特征分析. 干旱區(qū)地理, 2010, 33(5): 740-746.
PENG J, ZHANG Y Z, PANG X A, WANG J Q. Hyperspectral features of soil organic matter content in South Xinjiang., 2010, 33(5): 740-746. (in Chinese)
[31] 盧艷麗, 白由路, 楊俐蘋, 王磊, 王賀. 東北平原不同類型土壤有機(jī)質(zhì)含量高光譜反演模型同質(zhì)性研究. 植物營(yíng)養(yǎng)與肥料學(xué)報(bào), 2011, 17(2): 456- 463.
LU Y L, BAI Y L, YANG L P, WANG L, WANG H. Homogeneity of retrieval models for soil organic matter of different soil types in Northeast Plain using hyperspectral data., 2011, 17(2): 456- 463. (in Chinese)
[32] BEN-DOR E, BANIN A. Near-infrared analysis as a rapid method to simultaneously evaluate several soil properties., 1995, 59(2): 364-372.
[33] LI H D, LIANG Y Z, XU Q S, CAO D S. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration., 2009, 648:77-84.
[34] 紀(jì)文君, 李曦, 李成學(xué), 周銀, 史舟. 基于全譜數(shù)據(jù)挖掘技術(shù)的土壤有機(jī)質(zhì)高光譜預(yù)測(cè)建模研究. 光譜學(xué)與光譜分析, 2012, 32(9): 2393-2398.
JI W J, LI X, LI C X, ZHOU Y, SHI Z. Using different data mining algorithms to predict soil organic matter based on visible-near infrared spectroscopy., 2012, 32(9): 2393-2398. (in Chinese)
[35] ASKARI M S, O’ROURKE S M. HOLDEN N M. Evaluation of soil quality for agricultural production using visible near infrared spectroscopy., 2015, 243-144: 80-91.
[36] 武永峰, 董一威, 胡新, 呂國(guó)華, 任德超, 宋吉青. 基于近紅外漫反射光譜的農(nóng)田原位表層土壤含水量定量建模方法比較. 光譜學(xué)與光譜分析, 2015, 35(12): 3416-3421.
WU Y F, DONG Y W, HU X, Lü G H, REN D C, SONG J Q. Quantification of agricultural in-situ surface soil moisture content using near infrared diffuse reflectance spectroscopy: a comparison of modeling methods., 2015, 35(12): 3416-3421. (in Chinese)
(責(zé)任編輯 李云霞)
Hyperspectral Features and Wavelength Variables Selection Methods of Soil Organic Matter
ZHU YaXing, YU Lei, HONG YongSheng, ZHANG Tao, ZHU Qiang, LI SiDi, GUO Li, LIU JiaSheng
(Key Laboratory for Geographical Process Analysis and Simulation, Hubei Province, Central China Normal University/ College of Urban & Environmental Science, Central China Normal University, Wuhan 430079)
The objective of this study is to explore the hyperspectral features and response regularity of the soil organic matter, and to select the sensitive wavelengths of soil organic matter, so as to reduce complexity of hyperspectral estimation model of soil organic matter and improve robustness of the model, which is to provide theoretical support to quantitatively monitor the soil fertility of farmland by using the hyperspectral technology.A total of 130 fluvo-aquic soil samples were collected from Jianghan plain, of which 40 were the training set samples. The soil organic matter content (SOMCraw) and spectral reflectance (SRraw) were measured from total samples, and an experiment of removal of organic matter was performed using the training set samples, and then we measured the soil organic matter content (SOMCrem) and spectral reflectance (SRrem) from samples of removal of organic matter. By calculating the difference and rate of change between SRrawand SRremfrom training set samples, we could analyze how the content changes of soil organic matter itself influence the spectral features. The soil organic matter sensitive wavelengths were determined by the methods of uninformative variables elimination (UVE) and competitive adaptive reweighted sampling (CARS). The calibration set with 45 samples was utilized to build the soil organic matter estimation models base on partial least squares regression (PLSR) and back propagation neural network (BPNN), and the validation set of 45 samples was utilized to test whether sensitive wavelengths were suitable for the same type soil.The experiment of removal of organic matter showed that the average spectral reflectance of test soil samples increased at full-spectrum with removing organic matter content, especially at the visible spectrum; after the comparison of UVE, CARS, UVE-CARS, and CARS-UVE, the optimal method of variables selection was UVE-CARS. The method of UVE-CARS provided 84 selected variables which were the soil organic matter sensitive wavelengths with coverage area of 561-721, 1 920-2 280 nm. Based on soil organic matter sensitive wavelengths, the PLSR and BPNN had better performance than full-spectrum model, and BPNN was better than PLSR in predictive ability with its value of2, RMSE, RPD, MAE, MRE were 0.74, 1.33 g·kg-1, 2.02, 1.04 g·kg-1, 6.2%, respectively, so it could effectively estimate soil organic matter.The soil organic matter sensitive wavelengths from training set could effectively estimate soil organic matter content in this test area with the same type samples. In addition, modeling of sensitive wavelengths by obtaining from the experiment of removal of organic matter and variables selection method could not only compress input wavelengths down into 4.2% of full-spectrum, but also enhance the estimation accuracy and reduce the model complexity. In this study, it provided a new approach to quickly and accurately evaluate soil organic matter content in the farmland.
soil organic matter; hyperspectra; variables selection; partial least squares regression; back propagation neural network; fluvo-aquic
2017-05-07;
國(guó)家自然科學(xué)基金(41401232)、中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(CCNU15A05006)、華中師范大學(xué)研究生教育創(chuàng)新資助項(xiàng)目(2017CXZZ007)
接受日期:2017-10-13
聯(lián)系方式:朱亞星,E-mail:383253389@qq.com。通信作者于雷,E-mail:yulei@mail.ccnu.edu.cn