鄧來飛, 張 飛, 3*,齊亞霄,袁 婕
1. 新疆大學(xué)資源與環(huán)境科學(xué)學(xué)院智慧城市與環(huán)境建模自治區(qū)普通高校重點(diǎn)實(shí)驗(yàn)室,新疆 烏魯木齊 830046 2. 新疆大學(xué)綠洲生態(tài)教育部重點(diǎn)實(shí)驗(yàn)室,新疆 烏魯木齊 830046 3. 中亞地理信息開發(fā)利用國家測繪地理信息局工程技術(shù)研究中心,新疆 烏魯木齊 830002
新疆鹽漬土地分布廣、面積大,在這些鹽漬土地上生長著多種類型的鹽生植物,它們對改良鹽漬土地、維護(hù)生態(tài)穩(wěn)定、促進(jìn)生態(tài)平衡具有重要的現(xiàn)實(shí)意義。因此,有關(guān)鹽生植物的相關(guān)研究受到了眾多學(xué)者的重視。有關(guān)研究發(fā)現(xiàn),許多鹽土植物大量吸收鈉,鈉與鉀都能增加細(xì)胞滲透壓,以適應(yīng)高鹽環(huán)境,產(chǎn)生膨壓而促進(jìn)細(xì)胞的伸長,因而對其生長是有益的,能部分代替鉀的功能。因此,掌握鹽生植物的鈉特征,有助于了解鹽生植物對生態(tài)環(huán)境的長期適應(yīng)和響應(yīng)。
隨著高光譜遙感技術(shù)的發(fā)展,眾多學(xué)者利用高光譜遙感估算植被營養(yǎng)元素、監(jiān)測植被含水量[1]、識別植被信息與提取特征參數(shù)、監(jiān)測植被生長狀況與評估生物量[1-3]等。植被生理參數(shù)估算采用的研究方法主要包括基于統(tǒng)計(jì)的經(jīng)驗(yàn)或半經(jīng)驗(yàn)?zāi)P秃椭脖惠椛鋫鬏斈P汀,F(xiàn)階段,由于統(tǒng)計(jì)方法建模簡單、建模結(jié)果可以有效適用,因而目前在估算植被生物化學(xué)成分中使用較為廣泛。在統(tǒng)計(jì)方法中,利用高光譜技術(shù)估算植被生物化學(xué)成分的常見模型有傳統(tǒng)線性模型和非線性回歸模型,如偏最小二乘回歸[4]、最小二乘支持向量機(jī)回歸、BP神經(jīng)網(wǎng)絡(luò)等。Zhang等[5]采用統(tǒng)計(jì)分析的方法篩選了鹽漬土環(huán)境下棉花葉片Na+,K+,Ca2+和Mg2+等離子含量和水分含量與光譜反射率的敏感波段,構(gòu)建了基于葉片離子含量和相對水分含量與光譜特征指數(shù)的簡單線性和指數(shù)函數(shù)模型。Mirzaie等[6]使用偏最小二乘回歸和主成分回歸分析對植被含水量反演精度的影響。田曠達(dá)等篩選出表征小麥葉綠素含量的指數(shù)REP,使用最小二乘支持向量回歸模型反演葉綠素含量,并使用該模型進(jìn)行OMIS影像的填圖。李媛媛[7]等使用主成分回歸、偏最小二乘回歸和BP神經(jīng)網(wǎng)絡(luò)模型建立了乳熟期的玉米葉片SPAD值和光譜特征參數(shù)的估算模型。
SVM模型具有嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)基礎(chǔ),通過統(tǒng)計(jì)學(xué)習(xí)中的VC維理論和尋求結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理來提高泛化能力,且能在保證數(shù)據(jù)精度的同時(shí)降低逼近函數(shù)的復(fù)雜度,特別是對小樣本、非線性問題的求解具有諸多優(yōu)勢。在 SVM 模型中,決定模型預(yù)測精度的主要參數(shù)是懲罰因子c和核函數(shù)參數(shù)σ,一般采用網(wǎng)格劃分的方式、遺傳算法、粒子群算法等對c和σ進(jìn)行尋優(yōu)。本文以實(shí)測的植被高光譜數(shù)據(jù)和葉片Na+含量為數(shù)據(jù)源,構(gòu)建對Na+含量有較好預(yù)測能力的小波植被指數(shù),采用支持向量機(jī)(support vector regression,SVM)、最小二乘支持向量機(jī)(least squares-support vector regression,LS-SVM)、粒子群優(yōu)化的支持向量機(jī)(particle swarm optimization for SVM,PSO-SVM)、和粒子群優(yōu)化的最小二乘支持向量機(jī)(particle swarm optimization for LSSVM,PSO-LSSVM)4種方法構(gòu)建適用于該區(qū)域的鹽生植被葉片Na+含量的高光譜估算模型,為使用高光譜技術(shù)監(jiān)測西北干旱區(qū)鹽生植被生長提供技術(shù)參考。
艾比湖濕地國家自然保護(hù)區(qū)位于新疆博爾塔拉蒙古自治州(博州)境內(nèi)東北角(E 82°36′—83°50′, N 44°30′—45°10′),總面積2 670.85 km2,其中水域面積為500~600 km2。在行政區(qū)劃上地跨博州精河縣、博樂市和阿拉山口口岸。研究區(qū)屬典型的溫帶干旱大陸氣候,干旱少雨、氣溫變化劇烈,年平均氣溫6~8 ℃,年降水量約160 mm,蒸發(fā)量1 600 mm以上,日照數(shù)約2 800 h。近年來,由于入湖水量減少,湖面萎縮,水位下降,加之艾比湖腹地位于阿拉山口主風(fēng)通道區(qū),保護(hù)區(qū)土壤鹽漬化嚴(yán)重。主要植物類型有梭梭、胡楊、堿蓬、檉柳、鹽穗木、鹽節(jié)木、花花柴、蘆葦?shù)取?/p>
于2017年5月對研究區(qū)進(jìn)行綜合調(diào)查,根據(jù)研究區(qū)的可達(dá)性和植被分布情況,環(huán)湖均勻布設(shè)37個(gè)采樣點(diǎn),如圖1。每個(gè)樣點(diǎn)選擇數(shù)種典型鹽生植被。采用ASD Field Spec3型地物光譜儀(光譜范圍350~2 500 nm,光譜分辨率3 nm,采樣間隔1 nm),測量時(shí)間為10:00—14:00,在風(fēng)力小、天氣晴朗條件下進(jìn)行植株冠層高光譜測量。測量前用白板定標(biāo),為減少環(huán)境對儀器的影響,每隔一段時(shí)間用白板參考。儀器探頭置于植株上方10 cm處,與地面保持垂直,每一樣本重復(fù)測量10次,對10條光譜曲線取均值作為原始光譜反射率,采用移動窗口平滑對光譜數(shù)據(jù)進(jìn)行平滑處理。將采集光譜的植株葉片取下,放于液氮罐中,返回室內(nèi)測植株Na+含量,方法參見文獻(xiàn)[8]。
圖1 研究區(qū)示意圖
小波分析的最主要特點(diǎn)就是通過小波函數(shù)的伸縮和平移表征信號的局部頻譜特征,而植被的各種理化成分的吸收或反射特征具有明顯的局部特征,因此,對植被光譜數(shù)據(jù)使用小波分析進(jìn)行提取,可充分表征光譜信息。離散小波變換可減少冗余信息,可有效地從光譜信號中提取信息,Liu等[9]研究表明db5小波能精準(zhǔn)的探測作物光譜的奇異性,可有效提取植被光譜信息。本文采用離散小波變換(DWT)和db5母小波對原始光譜進(jìn)行9層小波分解,借鑒李軍等[10]提出的相關(guān)系數(shù)法確定最佳小波分解層次。
選擇歸一化型(NDSI)、比值型(RSI)和差值型指數(shù)(DSI)構(gòu)建原始光譜植被指數(shù); 并對小波分解后重構(gòu)的低頻和高頻分量構(gòu)建上述3種小波植被指數(shù)。公式如表1。
表1 構(gòu)建的各植被指數(shù)公式
其中,Rλ1和Rλ2為原始光譜反射率,?Rλ1和?Rλ2分別為小波分解后重構(gòu)得到的低頻或高頻分量。
LS-SVR是在傳統(tǒng)SVR的基礎(chǔ)上采用不同的損失函數(shù),同時(shí)將SVR中的不等式約束條件轉(zhuǎn)化為等式約束條件,在此過程中求解的是線性方程組,從而簡化問題,提高運(yùn)行效率。粒子群(PSO)是一種基于種群和適應(yīng)度的全局優(yōu)化算法,其易于理解、便于實(shí)現(xiàn),多用于參數(shù)尋優(yōu)、模型分類、神經(jīng)網(wǎng)絡(luò)訓(xùn)練預(yù)測等領(lǐng)域[11]。PSO可以有效優(yōu)化SVR和LS-SVR模型參數(shù)(c,g),廣泛應(yīng)用于非線性回歸模型參數(shù)估計(jì)中,具體介紹參見文獻(xiàn)[12-13]。
本文依據(jù)Kennard-Stone算法選擇建模樣本與預(yù)測樣本,數(shù)量比為2∶1,模型精度評估選取決定系數(shù)(coefficient of determination,R2),均方根誤差(root mean squared error,RMSE)和平均相對分析誤差(residual predictive deviation,RPD)。
表2為Na+含量樣本統(tǒng)計(jì)特征,Na+變異系數(shù)為61.97%,屬于中等變異,Kolmogorov-Smirnov檢驗(yàn)所得p值為0.797,大于0.1,樣本符合正態(tài)分布。
2.2.1 光譜小波變換及最佳分解層數(shù)
由于光譜儀器和環(huán)境噪聲影響,水分吸收谷附近存在巨大噪聲,水分吸收谷波段附近本文不作討論,研究的光譜波段為: 350~1 350,1 440~1 800和2 020~2 400 nm。由db5小波母函數(shù)對鹽生植被高光譜曲線進(jìn)行9層分解后,對各層高頻系數(shù)進(jìn)行單支重構(gòu),并將其與葉片Na+含量進(jìn)行相關(guān)性分析。如圖2,4~5層的相關(guān)系數(shù)高于1~3層,并且從第5層開始相關(guān)系數(shù)的波動幅度減小,漸漸趨于穩(wěn)定。由此,本研究的最佳分解層數(shù)確定為5層。
表2 Na+含量樣本統(tǒng)計(jì)特征
圖2 9層小波分解高頻系數(shù)與葉片Na+含量相關(guān)系數(shù)圖
2.2.2 小波植被指數(shù)與葉片Na+的關(guān)系
使用db5小波母函數(shù)對光譜數(shù)據(jù)進(jìn)行5層分解,得到1個(gè)低頻分量CA5,5個(gè)高頻分量CD1,CD2,CD3,CD4和CD5,對低頻和高頻分量構(gòu)建?NDSI,?RSI,?DSI指數(shù),并建立各小波植被指數(shù)與Na+含量的決定系數(shù)等勢線圖,如圖3。
由圖3可知,由低頻分量CA5構(gòu)建的NDSI指數(shù)R2較高的波段集中在可見光、近紅外區(qū)域,范圍為:X: 1 440~1 800 nm,Y: 600~720 nm和X: 1 200~1 300 nm,Y: 1 160~1 230 nm,決定系數(shù)最高在(R1 277,R1 171)處,R2為0.452。由低頻分量CA5構(gòu)建的RSI指數(shù)R2較高的波段集中在可見光、近紅外區(qū)域,范圍為:X: 1 440~1 800 nm,Y: 590~710 nm和X: 1 200~1 300 nm,Y: 1 160~1 230 nm和X: 630~700 nm,Y: 400~600 nm,決定系數(shù)最高在(R1 281,R1 172)處,R2為0.457。由低頻分量CA5構(gòu)建的DSI指數(shù)R2較高的波段集中在可見光、近紅外區(qū)域,范圍為:X: 1 430~1 800 nm,Y: 590~720 nm,X: 2 020~2 400 nm,Y: 1 460~1 800 nm和Y: 2 020~2 270 nm,決定系數(shù)最高在(R2 232,R2 046)處,R2為0.483。由高頻分量CD3構(gòu)建的NDSI指數(shù)R2較高的波段位于可見光和近紅外區(qū)域,范圍為:X: 1 135~1 160 nm,Y: 530~670 nm,決定系數(shù)最高在(R1 141,R554)處,R2為0.32。由高頻分量CD3構(gòu)建RSI指數(shù)R2較高的波段位于近紅外區(qū)域,范圍為:X: 1 140~1 160 nm,Y: 700~745 nm,決定系數(shù)最高在(R1 143,R729)處,R2為0.336。由高頻分量CD3構(gòu)建DSI指數(shù)R2較高的波段位于可見光和近紅外區(qū)域,范圍為:X: 785~830 nm,Y: 705~720 nm,決定系數(shù)最高在(R826,R715)處,R2為0.403。由高頻分量CD4構(gòu)建NDSI指數(shù)R2較高的波段位于可見光和近紅外區(qū)域,范圍為:X: 1 140~1 200 nm,Y: 500~585 nm,決定系數(shù)最高在(R1 182,R550)處,R2為0.436。由高頻分量CD4構(gòu)建RSI指數(shù)R2較高的波段位于可見光和近紅外區(qū)域,范圍為:X: 1 140~1 200 nm,Y: 500~630 nm,決定系數(shù)最高在(R1 157,R559)處,R2為0.378。由高頻分量CD4構(gòu)建DSI指數(shù)R2較高的波段位于可見光和近紅外區(qū)域,范圍為:X: 820~1 320 nm,Y: 500~600 nm決定系數(shù)最高在(R960,R548)處,R2為0.425。由高頻分量CD5構(gòu)建NDSI指數(shù)R2較高的波段位于可見光和近紅外區(qū)域,范圍為:X: 1 190~1 240 nm,Y: 500~635 nm,決定系數(shù)最高在(R1 237,R612)處,R2為0.586。由高頻分量CD5構(gòu)建RSI指數(shù)R2較高的波段位于可見光和近紅外區(qū)域,范圍為:X: 1 215~1 225 nm,Y: 505~635 nm,決定系數(shù)最高在(R1 218,R564)處,R2為0.438。由高頻分量CD5構(gòu)建DSI指數(shù)R2較高的波段位于可見光、近紅外區(qū)域,范圍為:X: 1 130~1 220 nm,Y: 490~830 nm決定系數(shù)最高在(R1 237,R613)處,R2為0.515。詳見表3。(高頻分量CD1,CD2構(gòu)建的指數(shù)效果不好,予以省略)表3是從等勢線圖中挑選出較好的小波植被指數(shù)用于估算鹽生植被葉片Na+含量。本文選取R2大于或等于0.4的指數(shù)作為估算葉片Na+含量的敏感波段組合,分別是: NDSI(CA5)(R1 277,R1 171),RSI(CA5)(R1 281,R1 172),DSI(CA5)(R2 232,R2 046),DSI(CD3)(R826,R715),NDSI(CD4)(R1 182,R550),DSI(CD4)(R960,R548),NDSI(CD5)(R1 237,R612),RSI(CD5)(R1 218,R564),DSI(CD5)(R1 237,R613)。此外,挑選由原始光譜構(gòu)建的NDSI(R1 275,R1 172),RSI(R1 275,R1 172)和DSI(R2 231,R2 040)指數(shù),用于估算葉片Na+含量。
圖3 小波植被指數(shù)與Na+含量決定系數(shù)圖
表3 基于小波變換構(gòu)建的植被指數(shù)
2.3.1 基于小波植被指數(shù)的葉片Na+含量反演
以挑選的9個(gè)小波植被指數(shù)作為自變量,構(gòu)建Na+的估算模型,模型結(jié)果表明以低頻分量CA5構(gòu)建的DSI指數(shù)和高頻分量CD5構(gòu)建的DSI和NDSI指數(shù)的光譜特征值構(gòu)建的Na+估測模型效果較好,并以這3個(gè)小波植被指數(shù)作為輸入變量,構(gòu)建Na+含量綜合反演模型,并引入PLSR作為對比,結(jié)果見表4。
總體上,小波植被指數(shù)DSICA5(R2 232, R2 046)構(gòu)建的各估算模型中,對比各模型建模集和預(yù)測集的R2,RMSE,RPD可知,PSO-SVR模型預(yù)測效果最好,模型建模集R2為0.494,RMSE為0.145、預(yù)測集R2為0.656,RMSE為0.124、RPD為1.533; PSO-LS-SVR模型預(yù)測效果次之,建模集R2為0.483,RMSE為0.147、預(yù)測集R2為0.634,RMSE為0.129、RPD為1.474; LS-SVR模型效果次于PSO-LS-SVR模型,其R2和RPD稍低于PSO-LS-SVR,RMSE稍高于PSO-LS-SVR; SVR模型預(yù)測效果最差; PLSR模型預(yù)測結(jié)果出現(xiàn)負(fù)值。小波植被指數(shù)DSICD5(R1 237, R613)構(gòu)建的各估算模型中,PSO-LS-SVR模型預(yù)測效果最好,建模集R2為0.51,RMSE為0.144,預(yù)測集R2為0.561,RMSE為0.107,RPD為1.645; PSO-SVR模型次之,SVR模型預(yù)測效果最差; PLSR模型預(yù)測結(jié)果出現(xiàn)負(fù)值。小波植被指數(shù)NDSICD5(R1 237, R612)構(gòu)建的各估算模型中,PSO-LS-SVR模型建模集R2為0.528,RMSE為0.144,預(yù)測集R2為0.758,RMSE為0.092,RPD為2.035; PSO-SVR和LS-SVR模型精度次之; SVR和PLSR模型精度最低。光譜小波變換后的低頻分量(CA5)實(shí)際為分辨率降低后的植被光譜,其表征光譜峰谷特征的細(xì)節(jié)信息又被分解到高頻部分,這是高頻分量(CD5)構(gòu)建的NDSI指數(shù)估算Na+含量預(yù)測模型精度優(yōu)于低頻分量(CA5)構(gòu)建的DSI指數(shù)估算Na+含量預(yù)測模型精度的原因。
表4 小波植被指數(shù)的模型反演結(jié)果
以DSICA5(R2 232, R2 046),DSICD5(R1 237, R613)和NDSICD5(R1 237, R612)這3個(gè)指數(shù)作為輸入變量,構(gòu)建的Na+含量綜合反演模型中,PSO-LS-SVR模型預(yù)測效果最佳,建模集R2為0.642,RMSE為0.136、預(yù)測集R2為0.778,RMSE為0.094、RPD為2.126; PSO-SVR模型預(yù)測效果次之,建模集R2為0.549,RMSE為0.138、預(yù)測集R2為0.77,RMSE為0.102、RPD為1.96; LS-SVR,SVR和PLSR模型精度最低。相比于單一小波指數(shù),以綜合小波指數(shù)構(gòu)建的各模型預(yù)測精度均有所提高,它是綜合多尺度、多分辨率數(shù)據(jù)的反演模型,其更能從不同側(cè)面反映植被的信息。綜上,4種模型預(yù)測結(jié)果表明,PSO能有效優(yōu)化SVR和LS-SVR模型參數(shù)(c,g),提高模型精度和預(yù)測能力。由于篇幅限制,僅列出由綜合小波指數(shù)構(gòu)建的PSO-LS-SVR模型的最終優(yōu)化參數(shù)結(jié)果,如圖4。
圖4 PSO-LS-SVR模型參數(shù)優(yōu)化和預(yù)測效果
表5 光譜植被指數(shù)的各模型反演結(jié)果
2.3.2 基于光譜植被指數(shù)的葉片Na+含量反演
分別以挑選的3個(gè)光譜植被指數(shù)作為輸入變量,構(gòu)建Na+含量的預(yù)測模型,并以這3個(gè)光譜植被指數(shù)為輸入變量,構(gòu)建Na+含量綜合反演模型,并引入PLSR作為對比,如表5。
3個(gè)光譜植被指數(shù)分別構(gòu)建的各模型預(yù)測效果均不太理想(省略)。以這3個(gè)光譜植被指數(shù)作為輸入變量,構(gòu)建的各綜合反演模型結(jié)果,如表5,PSO-LS-SVR模型最優(yōu),建模集R2為0.55,RMSE為0.137、預(yù)測集R2為0.781,RMSE為0.094、RPD為2.126; PSO-SVR次之,建模集R2為0.542,RMSE為0.137、預(yù)測集R2為0.665,RMSE為0.103、RPD為1.940; LS-SVR,SVR和PLSR模型精度最低。4種模型預(yù)測結(jié)果表明,PSO能有效優(yōu)化SVR和LS-SVR模型參數(shù)(c,g),提高模型精度和預(yù)測能力。相比于單一光譜指數(shù),由于加入了多波段的信息,以綜合光譜指數(shù)構(gòu)建的SVR模型預(yù)測精度均有所提高。
對比兩種類型的植被指數(shù)反演結(jié)果,單一小波植被指數(shù)構(gòu)建Na+含量的預(yù)測模型可取得較好的預(yù)測效果,單一光譜指數(shù)估測Na+含量效果不佳,這是因?yàn)樾〔ㄗ儞Q可以減少原始光譜的噪聲,凸顯光譜的細(xì)節(jié)信息,增強(qiáng)其反演Na+含量的精度; 綜合小波植被指數(shù)構(gòu)建的模型是綜合多尺度、多分辨率數(shù)據(jù)的反演模型,其模型精度和預(yù)測效果優(yōu)于綜合光譜指數(shù)構(gòu)建的模型。光譜經(jīng)過小波分解后,低頻部分保留了植被原始光譜特征,但相對于原始光譜,其分辨率有所降低,體現(xiàn)原始光譜峰谷特征信息被分解到高頻部分,其可凸顯光譜的細(xì)節(jié)信息,利用該種小波信號建立的指數(shù)可提高葉片Na+含量反演精度。
(1)5種模型預(yù)測結(jié)果表明,PSO能有效優(yōu)化SVR和LS-SVR模型參數(shù)(c,g),提高模型精度和預(yù)測能力。(2)基于綜合小波指數(shù)構(gòu)建的模型是綜合多尺度、多分辨率數(shù)據(jù)的反演模型,其更能從不同側(cè)面反映植被的信息,因而綜合小波指數(shù)構(gòu)建的4種模型優(yōu)于單一小波指數(shù)構(gòu)建的模型。(3)對比兩種類型的植被指數(shù)反演結(jié)果,單一小波植被指數(shù)構(gòu)建Na+含量的預(yù)測模型可取得較好的預(yù)測效果,單一光譜指數(shù)估測Na+含量效果不佳,這是因?yàn)樾〔ㄗ儞Q可以減少原始光譜的噪聲,凸顯光譜的細(xì)節(jié)信息,增強(qiáng)其反演Na+含量的精度; 綜合小波植被指數(shù)構(gòu)建的模型精度和預(yù)測效果優(yōu)于綜合光譜指數(shù)構(gòu)建的模型,原始光譜經(jīng)小波變換后,可凸顯更多的細(xì)節(jié)信息,提高高光譜反演葉片Na+含量的能力。