熊靜玲 朱西存? 高華光 于瑞陽 溫 新
(1 山東農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,山東泰安 271018)
(2 中國國家博物館,北京 100006)
夯土齊長城由泥土夯筑而成,土壤水分對夯土結(jié)構(gòu)具有重要影響,土壤含水率過高會造成夯土穩(wěn)定性降低,進(jìn)而引起墻體局部坍塌等問題[1-4]。因此,對夯土齊長城進(jìn)行土壤含水率估測研究,對齊長城遺址的保護(hù)具有重要意義。傳統(tǒng)的稱重法、中子法和張力計(jì)法等土壤含水率測定方法,雖然精度較高,但工作量大、耗費(fèi)時(shí)間長,要求條件較為苛刻[5-7]。高光譜技術(shù)具有數(shù)據(jù)信息豐富、高效無損等特點(diǎn),彌補(bǔ)了傳統(tǒng)測定方法上的不足。近年來國內(nèi)外學(xué)者將其廣泛應(yīng)用于土壤理化性質(zhì)估測研究中,因此,它已經(jīng)逐漸成為高效獲取土壤含水率的重要手段之一。
在利用高光譜數(shù)據(jù)估測土壤含水率的研究過程中,學(xué)者們發(fā)現(xiàn)土壤含水率光譜的響應(yīng)波段是建立反演模型估算土壤含水率的關(guān)鍵[8-10]。已有研究表明,通過對土壤高光譜數(shù)據(jù)進(jìn)行微分、對數(shù)、倒數(shù)、包絡(luò)線去除等變換,可以增強(qiáng)光譜數(shù)據(jù)與土壤含水率之間的相關(guān)性,能有效地對比和篩選出敏感波段。劉偉東等[11]使用相對反射率法、一階微分法、差分法等對土壤水分進(jìn)行預(yù)測,結(jié)果發(fā)現(xiàn)反射率對數(shù)的一階微分預(yù)測效果較好;尹業(yè)彪等[12]采用包絡(luò)線且一階微分法對土壤原始光譜反射率進(jìn)行處理,提高了土壤含水率估測模型的預(yù)測精度;姚艷敏等[13]對土壤原始光譜反射率進(jìn)行對數(shù)、倒數(shù)、一階微分以及反射率倒數(shù)的一階微分、對數(shù)的一階微分變換,對比不同預(yù)處理后光譜反射率與土壤含水率之間的相關(guān)系數(shù),發(fā)現(xiàn)對數(shù)的一階微分變換后其相關(guān)系數(shù)最大;史舟等[14]采用多種方法對光譜數(shù)據(jù)進(jìn)行預(yù)處理,通過對后期預(yù)測效果的比較發(fā)現(xiàn)SG平滑加一階微分?jǐn)?shù)據(jù)轉(zhuǎn)換方法最佳;鄧孺孺等[15-16]提出了土壤樣品粒度對土壤反射率具有較大影響,申艷等[17]通過研究證明利用多元散射校正可以消除該影響。近年來,國內(nèi)外學(xué)者發(fā)現(xiàn)多元散射校正方法可以消除樣品粒度不同產(chǎn)生的散射影響,進(jìn)而消除不同光譜之間的物理散射信息差異[18-19],但關(guān)于利用MSC方法校正過的光譜是否可以更加準(zhǔn)確地進(jìn)行波長優(yōu)選的比較研究卻很少。因此,本研究以夯土齊長城遺址土壤為研究對象,對原始反射率進(jìn)行Lg(R)′和MSC +Lg(R)′兩次預(yù)處理,進(jìn)而對兩次預(yù)處理之后的光譜數(shù)據(jù)和土壤含水率進(jìn)行相關(guān)分析,對比兩者之間的差異,篩選出土壤含水率的敏感波段。最終建立土壤含水率SVM估測模型,實(shí)現(xiàn)對齊長城土壤含水率的快速無損監(jiān)測。
研究區(qū)為青島市黃島區(qū)夯土齊長城遺址,其地理坐標(biāo)為35°35′~36°08′N,119°30′~120°11′E,夯土齊長城由多種類型泥土夯筑而成。
于2017年8月24—27日進(jìn)行土樣采集。首先,在齊長城中心線上每隔50 m選定一個(gè)點(diǎn),然后,垂直于該點(diǎn)在齊長城遺跡兩側(cè)每隔20 m選定一個(gè)采樣點(diǎn),最終確定24個(gè)采樣點(diǎn),如圖1所示。每個(gè)樣點(diǎn)取1 kg左右的新鮮土樣裝入采樣袋中密封編號,每個(gè)采樣點(diǎn)取兩份樣品。
圖1 夯土齊長城土壤樣點(diǎn)分布圖Fig. 1 Soil sampling site Great Wall Dynasty Great Wall distribution map of the Qi Dynasty
常規(guī)的光譜測量是先將土壤進(jìn)行研磨、自然風(fēng)干等一系列處理,然后設(shè)計(jì)不同含水量的土壤樣品,這樣的測量方法存在一些問題,土壤經(jīng)過處理后破壞了土壤結(jié)構(gòu),并且最終建立的模型預(yù)測精度也存在較大的差異[20-21]。因此,為避免這些問題,本研究在采集土樣的同時(shí)采用烘干法來獲取原始土樣的含水量。首先將干燥干凈的鋁盒稱重,記為W1;然后將50 g左右土樣置于鋁盒中,蓋后稱重,記為W2,去蓋放入烘箱中,105℃條件下烘至恒重;最后取出放干燥器冷卻至恒溫,立即稱重,記為W3。計(jì)算公式為:
利用地物波譜儀對土壤樣本進(jìn)行光譜測定,測定儀器為美國ASD FieldSpec4便攜式地物波譜儀,波譜儀波段范圍為350~2 500 nm,350~1 000 nm波段范圍內(nèi)光譜采樣間隔為1.4 nm,光譜分辨率為3 nm;1 000~2 500 nm波段范圍內(nèi)為2 nm,光譜分辨率為8 nm。重采樣間隔為1 nm,輸出波段數(shù)為2 151個(gè)。在一個(gè)能控制光照條件的暗室內(nèi),將土壤樣本放于半徑為5 cm、深為2 cm的器皿中,裝滿之后用直尺將土壤樣本表面刮平。儀器的光源采用功率為50 W的鹵素?zé)簦庠淳嚯x土樣中心30 cm。將光纖探頭固定于三腳架上,探頭的視場角為25°,距離土壤表面15 cm。測試之前先進(jìn)行白板校正。測定時(shí)每個(gè)樣品按90°旋轉(zhuǎn)3次,每次采集5個(gè)土樣光譜值,最后取20次平均值作為該土樣的反射光譜數(shù)據(jù)。
為驗(yàn)證MSC對優(yōu)選敏感波長的作用,采用Lg(R)′和MSC+Lg(R)′對原始光譜數(shù)據(jù)進(jìn)行兩次預(yù)處理。MSC算法如下:
式中,i = 1,2,…,n;n為樣本數(shù);j表示第j個(gè)波長。
支持向量機(jī)算法最早是由Vladimir N.Vapnik和Alexey Ya.Chervonenkis在1963年提出,在90年代得到迅速發(fā)展和完善,目前的版本是Corinna Cortes和Vapnik在1995年發(fā)表。支持向量機(jī)的基本思想是求解能夠正確劃分訓(xùn)練數(shù)據(jù)集并且?guī)缀伍g隔最大的最佳超平面[22-23]。在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢。通過多次訓(xùn)練進(jìn)行參數(shù)優(yōu)選,利用DPS數(shù)據(jù)處理軟件確定該模型的參數(shù),核函數(shù)類型為RBF,Gamma設(shè)置為2,其余各項(xiàng)均為默認(rèn)值。
采用決定系數(shù)(R2)、相對誤差(RE)、均方根誤差(RMSE)和相對分析誤差(RPD)對模型進(jìn)行檢驗(yàn),以驗(yàn)證預(yù)測模型的精度。R2越大、RE和RMSE越小,表明模型估測精度越高;當(dāng)1.5≤RPD<2.0時(shí)表明模型只能對樣品含量高低進(jìn)行粗略估測,當(dāng)2.0≤RPD<2.5時(shí)表明模型具有較好的定量預(yù)測能力。
土壤是多種成分的復(fù)雜綜合體,其高光譜反射率是由土壤組分及其結(jié)構(gòu)的內(nèi)在性質(zhì)決定的[24-26]。為研究土壤含水率對土壤光譜特征的影響,分別選取含水率為6.16%、8.94%、10.27%、14.10%、18.03%、24.29%的土壤樣本,其高光譜反射率曲線如圖2所示。由圖2可見,不同土壤含水率光譜曲線總體變化相似,但是隨著含水率的增加,土壤高光譜反射率呈現(xiàn)逐漸下降趨勢。對于具體波段而言,不同波段區(qū)間土壤含水率的響應(yīng)特性也會不同。當(dāng)土壤含水率較低時(shí),隨著土壤含水率的增加,短波紅外波段反射率的變化幅度較大。
圖2 不同含水率的土壤光譜曲線Fig. 2 Soil spectral curve relative to soil moisture content
原始光譜曲線如圖3所示,各樣本光譜反射率明顯差異較大,光譜間存在基線平移、傾斜等現(xiàn)象,這可能是由土壤顆粒以及土壤樣品裝填密度不同產(chǎn)生的散射影響造成的[27-30]。多元散射校正處理后的光譜曲線如圖4所示,與原始光譜反射率相比,各樣本光譜反射率差異顯著減小,光譜更集中,光譜曲線特點(diǎn)更一致,這說明各樣品的光譜偏移得到了一定的控制。如圖3和圖4所示,校正前后的光譜均保留了土壤樣品的基本光譜特征,在393~790 nm曲線斜率較陡,790~1 350 nm曲線坡度較緩;在1 260 nm、1 686 nm以及2 125 nm附近具有明顯的反射峰,在1 408 nm以及1 910 nm附近具有特征吸收帶。
圖3 土壤原始光譜反射率Fig. 3 Original spectral reflectance of the soil
圖4 MSC預(yù)處理后土壤光譜反射率Fig. 4 Soil spectral reflectance after MSC-pretreatment
為研究MSC處理后的光譜是否可以更加準(zhǔn)確地篩選敏感波長,分別對Lg(R)′和MSC+Lg(R)′處理后的光譜反射率與土壤含水率進(jìn)行相關(guān)分析,如圖5和圖6。經(jīng)對比可看出,經(jīng)過MSC處理后,土壤光譜反射率與土壤含水率的相關(guān)性得到了明顯增強(qiáng)。如圖6所示,1 450~1 500 nm、1 850~1 900 nm和2 050~2 100 nm波段范圍內(nèi),土壤含水率與光譜反射率的相關(guān)性均達(dá)顯著水平。如表1所示,對原始光譜數(shù)據(jù)進(jìn)行MSC+Lg(R)′處理得到7個(gè)相關(guān)性較高的波長,并且其相關(guān)系數(shù)明顯提高,分別為-0.72、-0.71、0.7、-0.7、-0.69、-0.69、0.69;而對原始光譜數(shù)據(jù)進(jìn)行對數(shù)一階微分處理后,僅得到4個(gè)相關(guān)性較高的波長。因此,說明MSC可以對土壤光譜中的非化學(xué)信息進(jìn)行校正,增強(qiáng)與土壤含水率相關(guān)的光譜吸收信息,有利于更加準(zhǔn)確地選取敏感波長。最終選擇1 861 nm、1 866 nm、1 549 nm、1 885 nm、1 871 nm、1 895 nm和2 095 nm作為土壤含水率的敏感波長。
圖5 Lg(R) ′光譜反射率與土壤含水率相關(guān)系數(shù)Fig. 5 Correlation efficient between Lg(R)′spectral reflectance and soil moisture content
圖6 MSC+ Lg(R) ′光譜反射率與土壤含水率相關(guān)系數(shù)Fig. 6 Correlation efficient between MSC+Lg(R)′ spectral reflectance and soil moisture content
將本實(shí)驗(yàn)的48組數(shù)據(jù)按照含水率從小到大的順序排列,按4∶1的比例進(jìn)行抽取,即每隔4個(gè)樣本抽取1個(gè)樣本,選取校正集36個(gè),驗(yàn)證集12個(gè)。
表1 土壤含水率與敏感波長的相關(guān)性Table 1 Correlativity between soil moisture content and sensitive wavelength
為進(jìn)一步探討MSC處理是否能有效提取光譜信息中的微妙信號,更好地選取與土壤含水率有關(guān)的特征波段,分別利用Lg(R)′預(yù)處理后篩選出的波長和MSC+Lg(R)′ 預(yù)處理后篩選出的波長建立SVM回歸模型,對比其模型精度。
利用Lg(R)′預(yù)處理后篩選出的波長1 860 nm、1 872 nm、1 884 nm和2 083 nm建立SVM回歸模型,模型對校正集和驗(yàn)證集的預(yù)測效果如圖7所示。
圖7 基于Lg(R)′預(yù)處理建立的SVM回歸模型Fig. 7 SVM regression model based on Lg(R)′pretreatment
利用MSC+ Lg(R)′預(yù)處理后篩選出的敏感波長1 861 nm、1 866 nm、1 549 nm、1 885 nm、1 871 nm、1 895 nm和2 095 nm建立SVM回歸模型,模型對校正集和驗(yàn)證集的預(yù)測效果如圖8所示,SVM回歸模型的決定系數(shù)Rc2為0.811,RE為0.001,RMSEP為0.019;檢驗(yàn)的決定系數(shù)R2v為0.764,RE為0.062,RMSEP為0.159,RPD為2.671。
圖8 基于MSC+ Lg(R)′預(yù)處理建立的SVM回歸模型Fig. 8 SVM regression model based on MSC+Lg(R)′pretreatment
根據(jù)圖7和圖8,對兩個(gè)模型做對比分析,分別計(jì)算出決定系數(shù)(R2)、相對誤差(RE)、均方根誤差(RMSE)、相對分析誤差(RPD),對模型進(jìn)行檢驗(yàn),以驗(yàn)證預(yù)測模型的精度。如表2所示。
表2 SVM回歸模型檢驗(yàn)精度對比Table 2 Comparative analysis of SVM regression models in prediction precision
從表2可以看出,基于不同預(yù)處理篩選出的敏感波段建立SVM回歸模型,預(yù)測效果有所差異。利用Lg(R)′ 預(yù)處理后的數(shù)據(jù)建立的模型檢驗(yàn)的決定系數(shù)Rv2為0.679,RE為0.143,RMSEP為0.431,RPD為1.765;而經(jīng)過MSC處理后,建立的模型檢驗(yàn)的決定系數(shù)Rv2為0.764,RE為0.062,RMSEP為0.159,RPD達(dá)到2.671,較Lg(R)′ 預(yù)處理后建立的模型預(yù)測效果更好,說明MSC方法校正過的光譜可以更加準(zhǔn)確地建立土壤含水率估測模型。
經(jīng)過Lg(R)′以及MSC+Lg(R)′處理后的夯土齊長城土壤光譜反射率的敏感波段主要集中在1 450~1 500 nm、1 850~1 900 nm和2 050~2 100nm范圍內(nèi),其中1 861 nm、1 866 nm、1 549 nm、1 885 nm、1 871 nm、1 895 nm和2 095 nm處與土壤含水率的相關(guān)系數(shù)最高。將土壤光譜數(shù)據(jù)進(jìn)行MSC預(yù)處理,可以剔除各樣品間由于散射影響造成的基線變化問題,更加準(zhǔn)確地揭示土壤含水率與土壤光譜之間的相關(guān)性,提高敏感波長篩選的準(zhǔn)確度。經(jīng)對比發(fā)現(xiàn),基于MSC+Lg(R)′ 預(yù)處理建立的SVM回歸模型具有較高的精確度,其檢驗(yàn)?zāi)P偷腞E為0.062,RMSEP為0.159,RPD為2.671,這進(jìn)一步說明MSC處理可以增強(qiáng)光譜與土壤含水率相關(guān)的吸收信息,可更加準(zhǔn)確地篩選敏感波長。