陳 玉,魏永明,王欽軍,2*,LI Lin,雷少華,路春燕
1. 中國科學(xué)院數(shù)字地球重點(diǎn)實(shí)驗(yàn)室,中國科學(xué)院空天信息創(chuàng)新研究院,北京 100094 2. 三亞中科遙感研究所,海南 三亞 572029 3. Department of Earth Sciences,Indiana University-Purdue University Indianapolis (IUPUI),IN 46202,USA 4. 南京師范大學(xué),江蘇 南京 210023 5. 福建農(nóng)林大學(xué),福建 福州 350002
近年來,實(shí)驗(yàn)室可見-近紅外高光譜數(shù)據(jù)(VIS-NIR)被越來越多應(yīng)用于土壤組分反演中。作為傳統(tǒng)昂貴的物理和化學(xué)性質(zhì)測量方法的重要補(bǔ)充甚至替代方案,該方法具有快速、高效、無損等技術(shù)優(yōu)勢。當(dāng)前,利用實(shí)驗(yàn)室高光譜數(shù)據(jù)反演土壤組分的研究多集中在以下三個(gè)方面: (1)光譜預(yù)處理方法: 通過對原始光譜數(shù)據(jù)進(jìn)行數(shù)學(xué)變換以消除噪聲或突出待反演土壤組分的光譜特征[1],常用有平滑、去包絡(luò)、導(dǎo)數(shù)變換、指數(shù)變換、多元散射變換、正態(tài)變換等[2-4]; (2)特征優(yōu)選和波段選擇: 通過對土壤組分光譜特征的分析或者在反演模型參數(shù)分析的基礎(chǔ)上,基于特定的優(yōu)化策略優(yōu)選特征波段組合,從而減少高光譜數(shù)據(jù)冗余并簡化模型[5-7]; (3)模型算法研究: 除傳統(tǒng)線性回歸模型,一些非線性模型甚至深度學(xué)習(xí)模型也被引入到土壤組分反演的研究中,以獲取更高建模精度[8-9]。當(dāng)然,以上三個(gè)方面并非孤立存在,大部分研究均是三者具有不同側(cè)重點(diǎn)的組合。
而在已有的研究工作中,針對不同光譜分辨率對土壤組分建模影響效應(yīng)分析的研究相對較少。土壤的可見-近紅外高光譜數(shù)據(jù)本質(zhì)上是電磁波在不同波長范圍對土壤特征的反應(yīng)(反射、吸收)。很顯然,光譜分辨率越高所能表達(dá)的土壤信息越豐富,但另一方面也帶來了數(shù)據(jù)冗余,導(dǎo)致數(shù)據(jù)分析時(shí)產(chǎn)生較高的計(jì)算復(fù)雜度以及維數(shù)災(zāi)難現(xiàn)象[10]。那么對于特定土壤組分信息而言,究竟多高分辨率的光譜數(shù)據(jù)不會(huì)顯著降低土壤組分建模精度? 土壤組分的診斷吸收特征究竟在什么樣的光譜分辨率尺度下仍能有效識(shí)別? 現(xiàn)有的衛(wèi)星傳感器的分辨率設(shè)置對土壤組分的反演能力究竟如何?個(gè)別學(xué)者在該方面開展了試探性研究,但限于選擇的樣本數(shù)量較少,工作區(qū)范圍局限,研究結(jié)果代表性不足[11-12]。為探討上述問題,本研究基于覆蓋歐洲23個(gè)國家,多種土壤類型的標(biāo)準(zhǔn)化數(shù)據(jù)集19 036條土壤高光譜數(shù)據(jù)開展針對性研究。選擇應(yīng)用最廣泛的偏最小二乘回歸方法(PLS)并選擇30%的隨機(jī)樣本作為獨(dú)立驗(yàn)證,分析評(píng)價(jià)的標(biāo)準(zhǔn)基于獨(dú)立驗(yàn)證的決定系數(shù)(R2)和相對分析誤差(RPD)兩個(gè)指標(biāo)。通過對原始高光譜數(shù)據(jù)的重采樣分別開展不同光譜分辨率條件下土壤有機(jī)碳(OC)、總氮(N)、碳酸鈣(CaCO3)、粘土(Clay)含量建模影響的分析,并基于光譜響應(yīng)函數(shù)將光譜數(shù)據(jù)模擬到常見衛(wèi)星傳感器相應(yīng)波段,在光譜尺度對衛(wèi)星影像的反演建模能力開展評(píng)價(jià)。
選用歐洲土壤中心公開的數(shù)據(jù)集(LUCAS,European Land Use/Cover Area Frame Statistical Survey),該數(shù)據(jù)集包含土壤樣本19 036個(gè),于2008年—2012年間采集自23個(gè)歐盟國家,包括耕地、草地、林地等用地類型,土壤樣本覆蓋面廣,所有樣本通過總體規(guī)劃,并對取樣方式進(jìn)行了一致性規(guī)范。取樣后對收集的土壤樣品的理化特性進(jìn)行測試,并使用FOSSXDS近紅外光譜分析儀測量土壤可見光近紅外光譜,測量前將土壤樣本進(jìn)行風(fēng)干、過篩預(yù)處理。光譜儀測量范圍為400~2 500 nm,儀器測量分辨率為2 nm[13],后重采樣為0.5 nm,因此原始數(shù)據(jù)集光譜中包含4 200維數(shù)據(jù)。需要注意的是獲取的數(shù)據(jù)為吸收系數(shù),依據(jù)Marco Nocita[14]介紹的方法將其轉(zhuǎn)化為反射率數(shù)據(jù)。土壤樣本的理化特性分析由ISO認(rèn)證的實(shí)驗(yàn)室完成。LUCAS數(shù)據(jù)集的數(shù)據(jù)由歐盟委員會(huì)授權(quán)歐洲土壤數(shù)據(jù)中心(European Soil Data Centre)公開,可以在https://esdac.jrc.ec.europa.eu/申請免費(fèi)使用。
1.2.1 等間距平均光譜重采樣
原始數(shù)據(jù)集光譜分辨率為0.5 nm,包含4 200個(gè)光譜通道,首先以2,4,8,16,…,1 024 nm對原始光譜重采樣。重采樣后的光譜分辨率及光譜波段數(shù)見表1所示。重采樣后各光譜反射率值以采樣間隔內(nèi)原有光譜反射率均值替代。以LUCAS數(shù)據(jù)集所有反射光譜平均光譜曲線為例,重采樣后的光譜曲線及色譜圖如圖1所示。
表1 重采樣后光譜分辨率及波段數(shù)Table 1 Spectral resolutions and band numbersafter resampling
圖1 光譜數(shù)據(jù)重采樣色譜圖
黑色曲線為對應(yīng)采樣間隔LUCAS數(shù)據(jù)集平均反射光譜重采樣后曲線,以色譜高度為0~1范圍繪制
Fig.1 The chromatogram of spectral data after resampling
The black curve is the average reflection spectrum of the LUCAS dataset corresponding to the sampling interval after resampling,and the height range is 0~1
1.2.2 光譜響應(yīng)函數(shù)重采樣
為從光譜尺度考察分析衛(wèi)星傳感器對土壤組分的反演能力,將LUCAS數(shù)據(jù)集19 036條土壤反射光譜基于光譜響應(yīng)函數(shù)模擬到常見衛(wèi)星傳感器相應(yīng)波段。其中GF2 PMS1傳感器波譜響應(yīng)函數(shù)來自中國資源衛(wèi)星應(yīng)用中心http://www.cresda.com/,其余傳感器函數(shù)來自歐洲氣象衛(wèi)星中心網(wǎng)站https://www.nwpsaf.eu/。選擇了6種常用的衛(wèi)星傳感器,這6種傳感器在400~2 500 nm范圍內(nèi)波段數(shù)見表2,對應(yīng)光譜響應(yīng)函數(shù)曲線見圖2所示。
表2 六種衛(wèi)星傳感器在400~2 500 nm范圍內(nèi)波段Table 2 Bands between 400~2 500 nm of the6 satellite sensors
圖2 常用6種衛(wèi)星傳感器光譜響應(yīng)函數(shù)紅色曲線為LUCAS數(shù)據(jù)集平均光譜反射率曲線(a): GF2; (b): S3A; (c): L8; (d): Aster; (e): Modis; (f): S3OLCI圖中橫坐標(biāo)為波長(nm),縱坐標(biāo)為反射率值Fig.2 The spectral response function curves of six satellite sensorsThe red curve is the average spectral reflectance of the LUCAS dataset(a): GF2; (b): S3A; (c): L8; (d): Aster; (e): Modis; (f): S3OLCIThe X axis is the wavelength (nm) and the Y axis is the reflection value
目前,應(yīng)用高光譜數(shù)據(jù)反演土壤組分的模型種類較多,包括多元線性回歸模型、偏最小二乘回歸模型、支持向量機(jī)、隨機(jī)森林等。其中,偏最小二乘回歸模型(partial least squares regression,PLS)是應(yīng)用最為廣泛的一種模型。該模型集典型相關(guān)分析、多元線性回歸分析和主成分分析基本功能于一體,能夠很好的解決自變量多重共線的問題,為方便比較,本研究統(tǒng)一采用PLS模型開展分析。在建模過程中,將所有的19 036個(gè)樣本隨機(jī)分成兩部分: 70%樣本(13 325個(gè))用于建模,30%樣本(5 711個(gè))用于驗(yàn)證。建模過程中用內(nèi)部交叉驗(yàn)證法(cross validation)建模,以30%樣本的獨(dú)立驗(yàn)證結(jié)果作為模型評(píng)價(jià)標(biāo)準(zhǔn),選取決定系數(shù)(R2)和相對分析誤差(RPD)兩個(gè)指標(biāo)來評(píng)價(jià)模型的穩(wěn)定性和精度。為獲取更穩(wěn)定的模型評(píng)價(jià)精度樣本的隨機(jī)劃分進(jìn)行10次,最后以10次評(píng)價(jià)結(jié)果的平均值作為最終評(píng)價(jià)結(jié)果。R2和RPD計(jì)算公式分別如式(1)和式(2)
(1)
(2)
不同光譜分辨率下,土壤總氮(N)、有機(jī)碳(OC)、碳酸鈣(CaCO3)、粘土(Clay)4類土壤組分含量的模型驗(yàn)證精度如表3所示,其中決定系數(shù)隨著光譜分辨率降低的變化趨勢如圖3。可以看出,隨著光譜分辨率的降低,土壤各類組分反演精度均呈下降趨勢,光譜分辨率優(yōu)于64 nm,4類土壤組分普遍具有較高模型驗(yàn)證精度,光譜分辨率在128 nm以下CaCO3和Clay組分精度顯著變差(R2<0.7,RPD<1.4)。其中,CaCO3在光譜分辨率優(yōu)于32 nm情況下,具有比其他組分更高的模型驗(yàn)證精度(R2>0.86,RPD>2.72),但在32 nm以后模型精度降低速度最快,表明CaCO3對光譜分辨率敏感性較強(qiáng),在低光譜分辨率條件下極易丟失特征而不利于光譜識(shí)別。
基于不同傳感器光譜響應(yīng)函數(shù)擬合的光譜數(shù)據(jù)對土壤總氮(N)、有機(jī)碳(OC)、碳酸鈣(CaCO3)、粘土(Clay)4類土壤組分含量的模型驗(yàn)證精度如表4所示,其中決定系數(shù)R2柱
表3 不同光譜分辨率下4類土壤組分含量的模型驗(yàn)證精度表Table 3 Model validation accuracy for the 4 types of soil components at different spectral resolutions
圖3 不同光譜分辨率土壤組分模型精度R2趨勢圖Fig.3 R2 tendency of soil component modelaccuracy at different spectral resolutions
狀圖如圖4所示。可以看出,土壤N、OC在各傳感器中均可獲得較高的精度,甚至在GF2 傳感器僅有4個(gè)波段情況下,也具有不錯(cuò)的驗(yàn)證精度(R2=0.56; RPD=1.51),表明土壤N與OC主要與土壤整體光譜反射率大小走勢相關(guān),局部光譜特征影響相對較小。而土壤CaCO3及Clay由于各傳感器波段數(shù)較少反演精度普遍較差(R2<0.5; RPD<1.4)。
總體而言,傳感器波段數(shù)越多,土壤組分反演能力越強(qiáng),但是傳感器波段位置的影響也很顯著,擁有近紅外長波(1 100~2 500 nm)波段范圍的傳感器對土壤組分的反演能力優(yōu)于缺少該波段的傳感器。比如Aster傳感器盡管總體波段數(shù)較少,但是其土壤組分反演能力整體并不比S3OLCI傳感器差,其中OC及Clay模型驗(yàn)證精度甚至優(yōu)于后者,這主要是由于Aster傳感器雖然只有9個(gè)波段,但在1 100~2 500 nm之間分布了6個(gè)波段,而S3OLCI傳感器21個(gè)波段均集中在1 100 nm以下,土壤組分的反演能力相對受限。特別是粘土礦物的吸收峰多位于近紅外長波段,S3A,L8,Aster和Modis傳感器的Clay反演能力均優(yōu)于波段數(shù)更多的S3OLCI。
圖4 不同傳感器土壤組分模型驗(yàn)證精度R2柱狀圖Fig.4 R2 histogram of soil components model verificationaccuracy with different sensors
表4 不同傳感器4類土壤組分含量的模型驗(yàn)證精度表Table 4 Model validation accuracy for the 4 types of soil components with different sensors
基于目前公開的全球最大的土壤光譜數(shù)據(jù)集LUCAS,以土壤總氮(N)、有機(jī)碳(OC)、碳酸鈣(CaCO3)、粘土(Clay)4類土壤組分的光譜反演為例,從等間距均值重采樣及衛(wèi)星傳感器光譜響應(yīng)函數(shù)重采樣兩種方式出發(fā)探討了不同光譜分辨率對土壤組分建模的影響。結(jié)果表明隨著光譜分辨率的降低,土壤各類組分反演精度均呈下降趨勢,光譜分辨率在64 nm以上,4類土壤組分普遍具有較高模型驗(yàn)證精度,其中CaCO3對特征波段敏感性較強(qiáng),在高光譜分辨率條件下具有較高的反演精度,但在低光譜分辨率條件下極易丟失特征而不利于光譜識(shí)別; 通過分析GF2,S3A,L8,Aster,Modis和S3OLCI六種常見衛(wèi)星傳感器在光譜尺度的反演能力可以看出,土壤N和OC在各傳感器中均可獲得較高的精度,而土壤CaCO3及Clay反演精度普遍較差。除傳感器波段數(shù)量外,波段位置對土壤組分的反演能力的影響也很顯著,擁有近紅外長波(1 100~2 500 nm)波段范圍的傳感器對土壤組分的反演能力優(yōu)于缺少該波段的傳感器。需要指出的是,對于不同衛(wèi)星傳感器土壤組分反演能力的分析僅從光譜尺度考慮,在實(shí)際應(yīng)用中還需考慮空間尺度的混合像元效應(yīng)的影響。不管怎樣,本研究對土壤組分遙感反演數(shù)據(jù)源的選擇、光譜數(shù)據(jù)的預(yù)處理及未來傳感器的設(shè)計(jì)仍然具有指導(dǎo)意義。