亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        傅里葉變換紅外光譜的土壤團聚體有機碳和全氮含量估測

        2020-12-04 13:25:00劉翠英張津瑞樊建凌
        光譜學與光譜分析 2020年12期
        關鍵詞:特征模型

        劉翠英,張津瑞,曾 濤,樊建凌*

        1. 南京信息工程大學應用氣象學院,江蘇省農(nóng)業(yè)氣象重點實驗室,江蘇 南京 210044 2. 南京信息工程大學環(huán)境科學與工程學院,江蘇省大氣環(huán)境監(jiān)測與污染控制高技術研究重點實驗室,江蘇 南京 210044

        引 言

        土壤團聚體是土壤的基本單位,是土壤礦物通過膠結團聚過程形成的具有一定大小的土壤基本結構單元,具有水穩(wěn)性、力穩(wěn)性、多孔性等特點,對土壤的理化性質有著重要的影響[1]。 此外,土壤團聚體的形成過程及其穩(wěn)定機制受土壤有機質,特別是其中碳氮的影響,團聚體與有機質含量是土壤結構狀況和肥力水平的重要評判依據(jù)。 然而,影響土壤有機碳氮在團聚體內(nèi)的含量與分布的因素非常復雜[2],快速、精確地了解土壤有機碳氮含量在團聚體內(nèi)部的分布與變化將有助于了解土壤碳氮交換量、儲量變化及土壤養(yǎng)分的管理。

        近幾十年來,人們對紅外光譜法預測土壤性質進行了大量的嘗試,利用紅外光譜可以根據(jù)樣本的光譜特征確定其中特定成分的含量,整個測量過程簡單、快速且無破壞性。 紅外光譜法已被用于對土壤有機碳、粘粒含量、全氮含量、pH、可提取態(tài)P、K、Fe、Ca、Mg及CEC等指標的分析[3]。 由于光譜數(shù)據(jù)的復雜性,主成分回歸、多元線性回歸(MLR)、偏最小二乘法回歸(PLSR)等多元數(shù)據(jù)分析技術常被用于紅外光譜預測土壤性質分析建模,隨著數(shù)據(jù)挖掘技術的發(fā)展,支持向量機(SVM)、隨機森林(RF)、人工神經(jīng)網(wǎng)絡(ANN)等機器學習方法也逐漸被應用于紅外光譜數(shù)據(jù)建模。 然而,針對多元數(shù)據(jù)處理算法的比較研究還較缺乏,各種算法的優(yōu)劣及適用范圍尚不清楚。 最近,Moura-Bueno等[4]基于紅外光譜,采用PLSR、MLR、SVM和RF方法建立了土壤有機碳的預測模型,結果表明,預測效果最好的是PLSR模型; 基于隨機森林建立的模型預測效果不夠突出。 另一方面,已有研究多針對全土性質進行建模分析,用紅外光譜對土壤團聚體有機碳(SOC)和全氮(TN)進行預測的研究還不多見。 本研究以我國內(nèi)蒙古淡栗鈣土為研究對象,采用遺傳算法(genetic algorithm, GA)進行特征波長選擇,采用PLSR、SVM、ANN和RF等方法建立了不同粒徑團聚體SOC、TN和紅外光譜吸光度之間的關系模型,進而評價不同模型預測土壤團聚體中SOC和TN含量的潛力,探尋有效預測土壤團聚體性質的最佳算法,為實時、快速分析土壤團聚體有機碳和全氮含量提供技術支撐。

        1 實驗部分

        1.1 土壤樣本

        土壤樣品采自內(nèi)蒙古自治區(qū)烏蘭察布市四子王旗,是典型的內(nèi)蒙古短花針茅荒漠草原帶,共采集24個土壤樣品,土壤類型為淡栗鈣土。 樣品運回實驗室后在4 ℃保存,采用濕篩法[5]對土壤團聚體進行分級,共分為>2,0.25~2,0.053~0.25及<0.053 mm四級團聚體,共得到96個團聚體樣品。 所得各級團聚體樣品經(jīng)冷凍干燥后研磨過100目篩,用稀HCl溶液(1 mol·L-1)去除土壤樣品中的無機碳。 將土壤再次研細,過100目,用元素分析儀(Vario EL IIII, Elementar, Germany)測定團聚體土壤有機碳(SOC)和全氮(TN)含量,每個樣品重復測定三次并求平均值。

        1.2 紅外光譜測定與光譜數(shù)據(jù)處理

        團聚體樣品紅外光譜用傅里葉變換紅外光譜儀(Nicolet iS5, Thermo Fisher Inc.)測定,光譜范圍為400~4 000 cm-1,分辨率為4 cm-1,掃描次數(shù)為32次。 將所得光譜數(shù)據(jù)轉換為吸光度[log(1/反射率)],并校正基線。 采用Savitzky-Golay平滑法對光譜數(shù)據(jù)進行平滑處理,然后取一階微分,預處理后的光譜如圖1所示。

        圖1 經(jīng)S-G平滑(a)及一階微分(b)處理后的團聚體FTIR光譜圖

        1.3 校正數(shù)據(jù)集與預測數(shù)據(jù)集的劃分

        在建立模型前,需要將樣品紅外光譜及對應的SOC、TN數(shù)據(jù)劃分為建模數(shù)據(jù)集和驗證數(shù)據(jù)集,采用Kennard-Stone算法進行劃分,通過計算樣本光譜變量之間的歐氏距離,在樣本特征空間里均勻地選取建模樣本。 劃分所得建模數(shù)據(jù)集與驗證數(shù)據(jù)集的統(tǒng)計結果如表1所示。

        表1 建模數(shù)據(jù)集與驗證數(shù)據(jù)集的樣本統(tǒng)計結果Table 1 Statistic summary of the modeling and validating data subsets

        1.4 光譜變量選擇與建模方法

        1.4.1 確定區(qū)間大小

        采用遺傳算法(genetic algrothim)[6]進行特征波長選擇,由于FTIR光譜波長數(shù)目較大(每一光譜包含7 468個數(shù)據(jù)),直接采用原始數(shù)據(jù)會使GA的優(yōu)化搜索空間過大,因此需要按一定波長區(qū)間對光譜數(shù)據(jù)進行劃分。 按適宜波長間隔將整個光譜均分為x個區(qū)間,然后求取各區(qū)間數(shù)據(jù)的標準偏差,平均標準偏差值越小說明區(qū)間數(shù)據(jù)越相近,因此在保障區(qū)間數(shù)據(jù)相近性的前提下應該盡量減少變量數(shù)目以優(yōu)化計算效率。

        1.4.2 特征光譜的確定

        經(jīng)S-G平滑及一階微分處理后的數(shù)據(jù),按適宜的波長區(qū)間對光譜進行均分,以各區(qū)間的平均譜數(shù)據(jù)為自變量,以交叉校驗均方根誤差RMSECV為適應度函數(shù),采用遺傳算法(GA)進行最優(yōu)光譜波長的選擇,設定種群大小為30,最大繁殖代數(shù)為100,交叉概率為0.5,變異概率為0.01[7],五次重復遺傳算法后,確定特征光譜。 本研究使用“caret”包進行GA分析。

        1.4.3 偏最小二乘法回歸(PLSR)

        偏最小二乘回歸(PLSR)是一種廣泛用于土壤光譜定量分析的線性回歸模型,使用潛變量方法對預測變量和觀察變量的兩個投影空間中的協(xié)方差結構進行建模。 因此,PLSR模型克服了變量之間的共線性問題。 此外,PLSR模型在選擇特征向量時,強調自變量對因變量的解釋和預測,消除了無用噪聲對回歸的影響,并最大程度地減少了模型中包含的變量數(shù)量。 本研究使用“pls”包進行PLSR建模。

        1.4.4 支持向量機(SVM)

        支持向量機(SVM)是一種對數(shù)據(jù)進行二元分類的模型,SVM的基本模型是找到一個可以分隔正反數(shù)據(jù)的超平面,選擇的超平面需要離訓練集數(shù)據(jù)盡可能遠; 支持向量機的關鍵在于核函數(shù),這是一個非線性的分類器。 它的學習策略就是間隔最大化,找到距離超平面間隔最小的樣本點,然后將其間隔最大化。 本研究使用“e1071”包進行SVM建模。

        1.4.5 人工神經(jīng)網(wǎng)絡(ANN)

        人工神經(jīng)網(wǎng)絡是基于生物學中神經(jīng)網(wǎng)絡的基本原理,模仿生物的神經(jīng)網(wǎng)絡來對復雜的外界信息進行處理,它是對生物神經(jīng)元網(wǎng)絡的簡易化模仿。 人工神經(jīng)網(wǎng)絡模型可以并行分布地去處理問題,擁有很高的容錯性,把信息的加工和記憶能力結合一起。 它實際上是一個復雜網(wǎng)絡,連接大量的簡單元件,因此ANN具有很高的非線性,能夠進行復雜的邏輯操作,處理非線性關系的樣本數(shù)據(jù)。 本研究使用“neuralnet”包進行ANN建模。

        1.4.6 隨機森林(RF)

        隨機森林模型通過自助重采樣技術,連續(xù)生成訓練樣本和測試樣本,并從訓練樣本中生成多個分類樹以形成隨機森林。 它通過對決策樹進行平均來降低過擬合的風險。 即使新的數(shù)據(jù)點出現(xiàn)在數(shù)據(jù)集中,整個算法也不會受到太大的影響,只會影響一個決策樹,并且很難影響所有決策樹。 本研究使用“randomForest”包進行RF建模。

        1.5 模型評價

        主要采用決定系數(shù)(R2)、均方根誤差(RMSE)以及相對分析誤差(RPD)對模型進行評價。R2越大且RMSE越小說明模型精度越好、其預測效果越好。R2的判斷標準為:R2>0.90表示預測結果出色;R2在0.81~0.90之間表示預測結果很好;R2在0.66~0.80之間為預測結果一般;R2<0.66表示預測結果很差。 PRD的判斷標準為: RPD>2表明模型具有極好的預測能力; 1.4

        2 結果與討論

        2.1 適宜波長區(qū)間

        由圖2可見,波長間隔越小,樣本的平均標準偏差越低,但同時區(qū)間數(shù)目越多。 在波長間隔大小為6 cm-1時最大標準偏差出現(xiàn)一個低谷,此時區(qū)間數(shù)為600個,因此在兼顧數(shù)據(jù)相近性與變量少量性的前提下,確定6 cm-1作為劃分區(qū)間的適宜大小,將整個光譜分為600個區(qū)間,然后將區(qū)間的平均光譜值作為自變量形成光譜曲線。

        圖2 平均標準偏差和最大標準偏差與波長區(qū)間大小的關系Fig.2 Relations between the mean SD, maximumSD and wavelength interval

        2.2 土壤團聚體特征光譜區(qū)間

        采用GA算法并重復5次后,篩選出團聚體SOC特征光譜區(qū)間共計303個。 由團聚體SOC特征光譜區(qū)間的分布(圖3)可以看出,SOC的特征光譜覆蓋范圍較廣,但在2 200~2 700及>3 700 cm-1以上波長范圍內(nèi)選取的特征光譜區(qū)間較少。 此外,在GA篩選過程中1 132~1 138,1 372~1 378,1 630~1 636,1 810~1 816,1 864~1 870cm-1這五個光譜區(qū)間在每次重抽樣中均被選為特征光譜,表明這些光譜區(qū)間對團聚體SOC含量較為敏感。

        圖3 團聚體SOC和TN特征光譜區(qū)間分布Fig.3 Histrogam of charasteristic wavelengthsof SOC and TN in soil aggregates

        對于土壤團聚體TN,GA算法共篩選出特征光譜161個。 由團聚體TN特征光譜區(qū)間的分布(圖3)可以看出,TN的特征光譜覆蓋范圍較平均,但在>3 200 cm-1以上波長范圍內(nèi)選取的特征光譜區(qū)間較少。 在GA篩選過程中1 114~1 120,1 258~1 264,1 264~1 270,1 276~1 282和1 408~1 414 cm-1這五個光譜區(qū)間在每次重抽樣中均被選為特征光譜,表明這些光譜區(qū)間對團聚體TN含量較為敏感。

        2.3 不同建模方法對團聚體SOC預測結果比較

        基于特征光譜區(qū)間,采用PLSR或ANN對團聚體SOC的建模結果均非常出色(R2>0.90,表2),同時這兩種模型對驗證樣本的預測結果也很好(R2>0.80)。 然而PLSR模型對驗證樣本SOC含量較低時出現(xiàn)了較明顯的高估(圖4),導致模型預測結果在低值區(qū)與實測值偏差較大,RMSE值較高,使得PLSR整體預測能力較為一般(PRD<2)。 采用SVM模型對團聚體SOC的建模結果也較好,但模型對樣本的預測能力卻較差(R2<0.66,PRD<2)。 然而,RF對團聚體SOC的建模及預測結果均較差,基本無法對樣本進行預測(PRD<1.4)。 總之,四種模型中ANN的建模及預測結果均是最好的,其對驗證樣本的預測除有少數(shù)點偏離外,其余點基本均在1∶1線的附近(圖4),其RMSE值在四種模型中最低(RMSE=0.227)。 此外,ANN在對團聚體SOC預測時并沒有受團聚體粒徑的影響,整體表現(xiàn)出極好的預測能力(RPD>2)。 然而,本研究樣品數(shù)量相對較少,若增加建模樣品數(shù)量可能會建立效果更好的模型。

        表2 不同模型對SOC和TN預測效果比較Table 2 Comprison of SOC and TN predictingresults by different models

        圖4 不同模型對團聚體SOC的預測值與實測值對比Fig.4 Comparison of predicted SOC and measured SOC in soil aggregates by different models

        2.4 不同建模方法對團聚體TN預測結果比較

        基于特征光譜區(qū)間,采用PLSR或SVM對團聚體TN的建模結果均較好(R2>0.80,表2),然而這兩種模型對驗證樣本的預測結果卻一般(0.660.90),雖然對驗證樣本的預測結果一般,但仍表現(xiàn)出了極好的預測能力(RPD>2),這主要是因為ANN模型對團聚體TN的預測沒有出現(xiàn)明顯的高估或低估,整體預測點均在1∶1線的附近(圖5),其RMSE值在四種模型中最低(RMSE=0.036)。 因此,隨著建模樣品數(shù)量的增加,可以使用ANN建立效果更好的團聚體TN預測模型。

        圖5 不同模型對團聚體TN的預測值與實測值對比Fig.5 Comparison of predicted TN and measured TN in soil aggregates by different models

        2.5 基于全譜的團聚體SOC和TN估測

        為了驗證特征光譜選擇對團聚體SOC和TN估測的影響,運用上述結果中表現(xiàn)最好的ANN模型對FTIR全譜數(shù)據(jù)進行了建模預測。 結果表明,采用全譜數(shù)據(jù)對驗證樣本SOC的預測結果較好,對TN的預測結果卻一般(圖6)。 此外,采用全譜數(shù)據(jù)對SOC和TN的預測效果均低于基于GA選擇的特征光譜區(qū)間的ANN模型(圖4和圖5)。 可見,采用GA進行特征光譜區(qū)間的選擇不僅可以簡化模型的結構,剔除光譜中無關的信息,而且可以提高模型的精度和預測效果。

        特征波長選擇是紅外光譜預測土壤性質的一個重要步驟,通過對特征波長的選擇可以剔除無關的信息,提高模型的預測性能及計算效率。 由于紅外光譜數(shù)據(jù)量大,常采用相關系數(shù)法、連續(xù)投影算法、遺傳算法、粒子群算法、蟻群算法等[5-6]來選取特征波長。 如劉振堯等[9]基于隨機森林優(yōu)選信息波長,選取了215個波長信息,建立了土壤有機質的預測模型。 本研究選用遺傳算法對特征光譜區(qū)間進行篩選,充分利用了土壤的光譜信息,采用人工神經(jīng)網(wǎng)絡建模對團聚體SOC和TN的預測也取得了較滿意的結果。 因此,遺傳算法從整體最優(yōu)化的角度篩選了土壤團聚體SOC和TN的特征波段,簡化了模型的結構并提高了模型的精度,結合人工神經(jīng)網(wǎng)絡建模,更適用于團聚體土壤有機碳和全氮的光譜特征分析與估測模型的構建。

        紅外光譜由于測量過程簡單、快速且無破壞性,已被廣泛用于對土壤有機碳、粘粒含量、全氮含量、pH、可提取態(tài)P、K、Fe、Ca、Mg及CEC等指標的分析[3, 10]。 Erktan等[11]采集了法國南部75個荒地土壤樣品并將其分為<1,1~2和3~5 mm三級團聚體,利用中紅外-近紅外光譜對團聚體穩(wěn)定性進行了預測。 Shi等[12]采集了83個比利時土壤樣本并將其分為>250,63~250和<63 μm三級團聚體,利用可見-近紅外光譜建立了團聚體穩(wěn)定性的偏最小二乘法定量模型。 可見,已有研究往往針對不同粒徑組分分別建立模型進行預測,該過程要求樣本量大且很難對所有組分同時進行合理預測。 此外,不同研究者所選用的土壤團聚體粒徑分級方案存在差異,獲得的團聚體粒徑也不盡相同,不易針對不同粒徑進行建模分析,嚴重制約了紅外光譜法在分析預測土壤團聚體理化性質中的應用。 本研究發(fā)現(xiàn),雖然不同粒徑土壤團聚體在不同波長的吸光度存在較大差異,但其FTIR光譜的整體趨勢是一致的,因此可以考慮將不同粒徑土壤團聚體FTIR數(shù)據(jù)混合建模。 通過遺傳算法篩選特征光譜,我們發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡模型可以很好地對土壤團聚體碳氮含量進行預測,且不會受團聚體粒徑的影響。 這可能由于在遺傳算法選擇特征光譜時已將某些反映土壤礦物、粘粒等特征的波長區(qū)間包含在內(nèi)(圖3),如780~800 cm-1處是石英礦物中Si—O鍵伸縮振動、910 cm-1為高嶺石和三水鋁石等粘土礦物中O—H的彎曲振動、1 034 cm-1為高嶺石礦物中Si—O鍵的伸縮振動、3 600~3 700 cm-1為粘土礦物中O—H鍵的伸縮振動[10, 13]。 由于人工神經(jīng)網(wǎng)絡的復雜性和高度的非線性,其所建立的模型可能已包含了不同粒徑對土壤碳氮含量的影響。 因此,我們認為基于遺傳算法篩選特征波長區(qū)間并采用人工神經(jīng)網(wǎng)絡可以將不同粒徑土壤團聚體統(tǒng)一建模,用于團聚體土壤有機碳和全氮含量的估測。

        圖6 基于全譜數(shù)據(jù)對團聚體SOC和TN的預測值與實測值對比Fig.6 Comparison of predicted TN and measured TN in soil aggregates by different models

        3 結 論

        (1)采用Savitzky-Golay平滑并取一階微分對FTIR光譜數(shù)據(jù)進行預處理后,在波長間隔大小為6 cm-1時最大標準偏差出現(xiàn)一個低谷,同時平均標準偏差較小,區(qū)間數(shù)量適中,可以用于劃分FTIR光譜區(qū)間。

        (2)基于遺傳算法篩選的特征光譜區(qū)間構建的土壤團聚體SOC和TN含量的ANN模型建模及預測能力均是最好的(RPD>2),顯著優(yōu)于PLSR、SVM及RF模型。

        (3)基于全譜數(shù)據(jù)的ANN模型對土壤團聚體SOC和TN的預測效果均低于基于GA選擇的特征光譜區(qū)間的ANN模型。 結果表明,采用GA進行特征光譜區(qū)間的選擇不僅可以簡化模型結構,剔除無關的信息,而且可以提高模型的精度和預測效果。

        (4)將不同粒徑土壤團聚體FTIR數(shù)據(jù)混合建模。 通過遺傳算法篩選特征光譜,發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡模型不僅可以很好地對土壤團聚體SOC和TN含量進行預測,而且不會受團聚體粒徑的影響,表明該方法可以用于團聚體土壤有機碳和全氮含量的估測。

        猜你喜歡
        特征模型
        一半模型
        抓住特征巧觀察
        重要模型『一線三等角』
        新型冠狀病毒及其流行病學特征認識
        重尾非線性自回歸模型自加權M-估計的漸近分布
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        抓住特征巧觀察
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        色狠狠一区二区三区香蕉| 中文字幕在线看精品乱码| 亚洲欧美综合精品成人网站| 国产一卡2卡3卡四卡国色天香| 日韩在线看片| 亚洲中文字幕高清乱码毛片| 国产av精品麻豆网址| 国产裸体舞一区二区三区| 丝袜AV在线一区二区三区| 国产女主播免费在线观看| 亚洲毛片在线观看免费| 成年女人色毛片| 99国产免费热播视频| 中文字幕高清一区二区| 色综合久久中文综合网亚洲| 久久99精品久久久久久秒播| 国产精品乱一区二区三区| 国产噜噜亚洲av一二三区| 精品亚洲一区二区三区四| 国产真实老熟女无套内射| 九九九影院| 在线视频自拍视频激情| 日韩夜夜高潮夜夜爽无码 | 免费在线黄色电影| 疯狂做受xxxx高潮欧美日本| 亚洲AV无码AV色| 国产无套一区二区三区久久| 欧美精品黑人粗大免费| 欧美视频第一页| 中文字幕人妻在线少妇完整版| 优优人体大尺大尺无毒不卡| 小sao货水好多真紧h视频 | 荡女精品导航| 日本国主产一区二区三区在线观看| 日本一区二区精品高清| 少妇性荡欲视频| 精品人伦一区二区三区蜜桃麻豆| 中文字幕一区乱码在线观看| 久久久久久久极品内射| 91免费永久国产在线观看| 一本色道久久88综合亚精品|