何爽,張森,田家,盧霞
1.江蘇海洋大學 海洋技術與測繪學院,連云港 222000;
2.南京大學 國際地球系統(tǒng)科學研究所,南京 210023
堿蓬是一種濱海濕地改良土壤的重要植物(Liu 等,2020;Jia 等,2018;李從娟 等,2015),可以增加土壤肥力(Li 等,2019),具有一定藥用和經濟價值(Li等,2019;陳仲新 等,2016),但近年來鹽沼堿蓬總面積整體呈不斷下降趨勢(Chen 等,2022)。葉面積指數LAI(Leaf Area Index)是堿蓬群體結構的重要量化指標,常用于模擬植被光合作用、呼吸作用與蒸騰作用等方面(Fang 等,2019;Parker,2020),對堿蓬產量的提升起到至關重要的作用,精確估算堿蓬LAI可以為判斷堿蓬生長狀況提供重要依據(Yan等,2019),進而為監(jiān)測鹽沼濕地提供有效幫助。
相較于傳統(tǒng)植被LAI測量方法,無人機高光譜遙感技術因其快速、重復的信息捕獲能力及高空間分辨率的特點,在小地塊精確監(jiān)測中被廣泛應用。眾多學者圍繞無人機高光譜影像提出了植被指數法(Ma 等,2022)、紅邊參數法(黃敬峰 等,2006;Xie 等,2018)、改進型光譜特征參數法(高林 等,2017b)以及使用無人機高光譜影像的紋理特征(Duan 等,2019)等方法結合統(tǒng)計分析反演模型估計植被LAI,常用統(tǒng)計分析反演模型主要有線性回歸、冪函數回歸、指數函數回歸(Yu等,2019;Sha 等,2019;吳偉斌 等,2018)。但這些模型通常無法很好表現植被指數VI(Vegetation Index)與植被LAI之間的非線性關系(謝巧云 等,2014)。
由于無人機高光譜數據一般具有多重共線性,存在數據冗余問題,機器學習算法具有較高的學習和預測能力,能夠從不同角度克服變量間共線性的問題(馬怡茹 等,2021;郭云開 等,2019),進而提高模型精度(謝巧云 等,2014;姚雄 等,2017;Wang 等,2019;蘇中濱 等,2021)。土壤背景是植被LAI遙感研究的重要制約因素之一(高林 等,2017a),土壤因子作為土壤背景的重要組成部分,能夠直接影響植被生長,進而影響植被LAI反演精度(楊煥瑩 等,2019;羅光浪 等,2022)。
當前研究多側重基于單一特征(植被指數、紋理特征等)的植被LAI反演研究,而綜合多特征因子對植被LAI的反演研究較少。當變量數目較多時,線性回歸等方法受到限制,且常用的機器學習方法:隨機森林算法RF(Random Forest)易受環(huán)境干擾波動大(姚雄 等,2017);支持向量機SVM(Support Vector Machine)沒有通用參數選取方案、優(yōu)化不穩(wěn)定(謝巧云 等,2014);BP 神經網絡(Back Propagation Neural Network)易陷入局部最優(yōu)、訓練速度慢(Wang 等,2019);極限學習機ELM(Extreme Learning Machine)在處理高維數據時存在局限性,模型性能不穩(wěn)定(蘇中濱 等,2021)。深度極限學習機DELM(Deep Extreme Learning Machine)由ELM 衍生而來,可以獲得數據中更抽象的表征信息,更有效地處理小數據樣本(Zhang 等,2022;Sun 等,2017),但尚未用于植被LAI反演模型中。
本文以濱海濕地堿蓬為研究對象,采集無人機高光譜遙感影像和地面實測堿蓬反射光譜、葉面積指數及區(qū)域土壤因子,發(fā)展隨機森林(RF)和粒子群(PSO)雙優(yōu)化策略的深度極限學習機(DELM)算法結合多模態(tài)數據的算法開展鹽沼濕地堿蓬LAI 的無人機高光譜反演研究。RF 多模態(tài)特征優(yōu)選可解決高光譜數據中存在的冗余特征和可分性較差的問題,有效優(yōu)選出敏感特征;PSODELM 快速、準確地對多模態(tài)數據進行反演建模,提高反演模型精度,為鹽沼濕地堿蓬的實時監(jiān)測和生態(tài)修復提供技術支撐。
選取山東省東營市黃河三角洲自然保護區(qū)內一塊長為600 m,寬為400 m 的矩形堿蓬生長密集區(qū)作為研究區(qū)(37°47'00″N—37°47'30″N,119°09'30″E—119°10'00″E)(圖1),屬于暖溫帶半濕潤大陸季風性氣候(Ma等,2019),土壤類型以濱海潮土和鹽土為主(Xia 等,2019),含鹽量較高。在保護區(qū)內分布著大量的檉柳、堿蓬、蘆葦等自然植被資源,以及白鸛、丹頂鶴等國家級重點保護動物資源。
圖1 研究區(qū)地理位置及采樣點空間分布Fig.1 The geographical location of the study area and the spatial distribution of sampling points
經前期實地考察發(fā)現區(qū)域內地勢平坦,堿蓬植被株高為10—20 cm,冠徑大小為5—15 cm,研究區(qū)南部堿蓬生長比較集中,北部堿蓬比較稀疏。根據堿蓬生長狀況,共劃分了密度不等的123個采樣區(qū),每個采樣區(qū)為1 m2的樣方。為了更好地了解研究區(qū)土壤養(yǎng)分含量,用對角線采樣法在樣方內對0—20 cm 水平的表層土壤進行采樣并將其均勻混合作為土壤樣品,并測定土壤中的pH、全鹽、全氮、全磷、全鉀、有機質、總碳、含水量。
2.2.1 無人機高光譜圖像獲取和預處理
無人機遙感平臺采用大疆M600Pro六旋翼無人機,無人機搭載的高光譜傳感器為北京智科遠達數據技術有限公司自主研發(fā)的新型ZK-VNIRFPG480 高光譜成像儀(表1),采用推掃式成像方式,可探測的波段范圍為400—1000 nm,光譜通道數為270,光譜分辨率為3 nm。于2020年7月20日上午10—12 點晴朗無風的天氣條件下獲取研究區(qū)無人機高光譜遙感影像。利用ZK-VNIR-FPG480高光譜成像儀自帶的數據預處理軟件進行數據導出、數據復原、光譜定標、輻射定標等預處理。在此基礎上,利用ENVI 軟件對輻射校正后的高光譜遙感影像進行幾何校正與影像拼接(圖2)。
表1 ZK-VNIR-FPG480高光譜成像儀參數Table 1 ZK-VNIR-FPG480 hyperspectral imager parameters
圖2 標準假彩色影像(R:846nm,G:641 nm,B:538 nm)Fig.2 Standard false color image(R:846 nm,G:641 nm,B:538 nm)
本研究區(qū)位于黃河三角洲國家級自然保護區(qū)內一塊堿蓬生長密集區(qū)域,且由圖2拼接后的無人機高光譜影像也可以看出,該區(qū)域內南部的堿蓬生長比較集中,相對濃密,而北部地區(qū)則較為稀疏,與堿蓬實地考察的生長狀況相一致。但由于受到儀器質量問題,拼接過程存在少量藍色條紋現象。
為了提取無人機高光譜影像中每個樣方的冠層光譜反射率,先在每個樣方中堿蓬覆蓋區(qū)建立感興趣區(qū),通過統(tǒng)計分析,將其平均值作為堿蓬樣方的高光譜反射率。經統(tǒng)計發(fā)現無人機高光譜遙感影像在400—450 nm和900—1000 nm波段范圍內的光譜反射率噪聲較大,因此選取450—900 nm波段范圍內的198個波段進行堿蓬LAI反演研究。
無人機高光譜遙感圖像在獲取過程中因受環(huán)境因素的影響會不可避免地產生噪聲,對無人機高光譜遙感影像依次進行S-G 平滑濾波、包絡線去除和一階微分處理。首先,利用ENVI 軟件中的S-G平滑濾波工具對無人機高光譜遙感影像進行平滑濾波,窗口設為60,擬合多項式設為5;之后,將平滑濾波處理后的無人機高光譜影像進行包絡線去除,并將每個樣方的平均反射光譜作為樣方堿蓬包絡線去除后的反射光譜;最后,將包絡線去除后的每個樣方堿蓬平均反射光譜進行一階微分處理,以突出對堿蓬LAI敏感的特征波段。
2.2.2 特征提取
基于無人機高光譜影像提取紋理特征以及堿蓬反射光譜提取紅邊參數和植被指數作為堿蓬LAI反演的多模態(tài)數據。
(1)紅邊參數提取。依據表2 列出的計算公式,利用MATLAB 軟件分別計算堿蓬紅邊面積、紅邊振幅、紅邊偏度系數、紅邊峰度系數和紅邊位置五種紅邊參數(Jiang等,2019)。
表2 紅邊特征參數的計算公式Table 2 Calculation formula of red feature parameters
將計算后的紅邊參數與堿蓬LAI進行相關性分析,結果如表3 所示。從表3 中可以看出:堿蓬冠層光譜反射率的紅邊面積和紅邊振幅與LAI相關性很高,相關系數分別為0.711和0.675(p<0.01);且紅邊振幅與堿蓬LAI的相關性最高,這主要是因為在紅光波段,植被葉片葉綠素強烈吸收;在近紅外波段,植被葉片內部多次散射形成強烈的反射。紅邊面積和紅邊振幅將這種獨特的光譜特征進一步放大從而增強了與堿蓬LAI這種植被結構形態(tài)之間的相關性(Li 等,2017;Kanke 等,2016)。因此,基于堿蓬冠層反射光譜提取的紅邊面積和紅邊振幅對堿蓬LAI比較敏感,可作為堿蓬LAI反演模型的光譜特征變量。
表3 紅邊參數與堿蓬LAI的秩序相關系數Table 3 Order correlation coefficients between red edge characteristic parameters and LAI
(2)植被指數提取。將堿蓬冠層反射光譜進行任意波段組合分別構建比值植被指數RVI(式(1))、差值植被指數DVI(式(2))和歸一化植被指數NDVI(式(3)),與堿蓬LAI進行相關性分析,如圖3 所示。從圖3 中可以看出:RVI 與LAI 相關性最高的波段組合中x波段集中分布在680—750 nm波段范圍中,y波段集中分布在580—610 nm 波段范圍內,其中690 nm 和598 nm 構建的D690/D598植被指數與堿蓬LAI 的相關系數最高(r=0.714)。DVI與LAI 相關性最高的波段組合中x波段集中分布在680—700 nm波段范圍中,y波段集中分布在550—610 nm 波段范圍內,其中699 nm 和598 nm 構建的(D699-D598)植被指數與LAI 的相關系數最高(r=0.656)。NDVI與LAI相關性最高的波段組合中x波段集中分布在580—610 nm 波段范圍中,y波段集中分布在680—740 nm 波段范圍內,其中598 nm和693 nm 構建的(D598-D693)/(D598+D693)植被指數與堿蓬LAI的相關系數最高(r=0.676)。
圖3 預處理后的3種VI與LAI的秩序相關系數Fig.3 Order correlation coefficients between three vegetation indexes and LAI after preprocessing
式中,D為一階微分后的光譜反射率,x,y為450—900 nm的任意波段。
因此,植被指數D690/D598、(D699-D598)和(D598-D693)/(D598+D693)可作為構建堿蓬LAI 反演模型的敏感植被指數。
(3)紋理特征提取。計算無人機高光譜影像各波段反射率與LAI 之間的皮爾遜相關系數(Pearson Correlation Coefficient),結果如圖4 所示。從圖4 中可以看出:700 nm 波段反射率與堿蓬LAI的相關性最高,相關系數為0.473(p<0.01)。
圖4 堿蓬冠層光譜反射率與LAI之間的秩序相關系數Fig.4 Order correlation coefficients between reflectance and LAI after preprocessing
利用灰度共生矩陣方法基于對700 nm 的無人機高光譜波段提取均值、方差、協同性、對比度、相異性、信息熵、二階矩和相關性8 個紋理特征。綜合考慮無人機高光譜影像的空間分辨率(0.1 m)和區(qū)域堿蓬分布特點,選取3×3窗口;因無人機航向接近45°,在紋理分析時方向選取45°方向分析8 個紋理特征,同時將45°方向的8 個紋理特征作為堿蓬LAI反演模型的敏感紋理特征。
2.2.3 堿蓬LAI測定
在獲取無人機高光譜遙感圖像的同時,同步測定了堿蓬葉面積指數。為了確保儀器的探測鏡頭視場角完全覆蓋樣方內所有堿蓬,在每個樣方的中心位置挖出一個直徑15 cm,深15 cm 的小洞,然后把CI-110 植物冠層分析儀器探頭置于洞內,且不要接觸洞的四周,并保證探頭頂部與地面平行。使用CI-110 冠層分析儀自帶數據處理軟件(Plant Canopy Analyst System)計算出每個樣方的堿蓬LAI。
2.2.4 土壤因子測定
將采集的土壤樣品分為兩部分,其中一部分原樣用于測定土壤含水量;另一部分土壤原樣,首先進行自然風干,然后充分混合、過篩和保存?zhèn)溆茫鬁y定土壤pH、全鹽、全氮、全磷、全鉀、有機質、總碳等要素(郝小玲 等,2020)。土壤各要素的詳細測定方法如表4所示。
表4 土壤樣品分析與測定Table 4 Soil sample analysis and determination
RF是一種將回歸學習方法與Bagging技術相結合的集成分類算法(Cutler 等,2012),由許多決策樹組成用于訓練,并將訓練結果顯示于對每棵樹進行分類和回歸的預測中,即可得到特征的重要性排序(張磊 等,2019)。
由于各種各樣的環(huán)境因素和無人機高光譜等高維多模態(tài)數據都會影響堿蓬LAI,且RF可以高效地處理高維數據的非線性關系,因此本文采用RF 篩選出對堿蓬LAI影響程度較高的多模態(tài)特征變量。
經多次實驗驗證后,RF 模型具體參數設置如表5 所示,具體實驗采用Python 語言中的Scikitlearn 庫。以決定系數作為篩選指標,將每個模態(tài)的變量與LAI建立RF模型,最終進行重要性排序。在特征優(yōu)選過程中,采用多次訓練取平均值的5折交叉驗證的統(tǒng)計學方法來訓練模型,以提升模型穩(wěn)定性和增加特征選擇結果的可信度(汪學清 等,2021)。
表5 RF實驗配置參數Table 5 Experimental configuration parameters of RF
PSO 是一種并行的智能群集優(yōu)化算法(于豐華 等,2020),實現容易、收斂快,廣泛地被應用于函數擬合和優(yōu)化中。PSO 優(yōu)化算法隨機初始化,迭代尋優(yōu),同時以DELM的均方根誤差作為適應度函數評價當前解是否達到最優(yōu),追隨當前解尋得優(yōu)化問題的全局最優(yōu)解(朱騰 等,2014)。
極限學習機ELM(Extreme Learning Machine)是隱藏層節(jié)點參數隨機初始化,最小二乘法求解的單隱含層前饋神經網絡,具有學習速度快和泛化能力強等優(yōu)點(Li等,2021)。但是,ELM在處理維度過高的多模態(tài)數據時,易陷入局部最優(yōu)值,無法捕捉到有效的隱藏信息和表征特征。因此,采用DELM對多模態(tài)數據的堿蓬LAI進行反演預測。
DELM 以自編碼訓練方式為基礎,利用分層的無監(jiān)督方法提取高維數據的隱藏信息,并以ELM作為基礎學習單位,通過多個ELM級聯得到以層次編碼形式傳輸的最優(yōu)網絡參數,將定量特征通過ELM 映射到輸出空間,在維持彼此量化特征的同時,最大限度地減少重構誤差。DELM 避免反向調優(yōu)過程,減少數據損失,有效提高模型預測精度。
盡管DELM有助于多層次學習特征,減少了調整參數的需要,然而輸入的權重和閾值是正交矩陣隨機產生的,從而導致預測過程中模型不穩(wěn)定,波動較大。因此,采用PSO 智能優(yōu)化算法對初始權重和閾值進行參數尋優(yōu)。
PSO-DELM 模型整個流程步驟說明如下:
(1)初始化粒子群參數。隨機初始化粒子的位置和速度,粒子的迭代次數、種群規(guī)模、種群維度和慣性因子分別設置為200、40、2和0.9。
(2)以均方根誤差函數計算粒子適應度,從而選舉出個體的局部最優(yōu)位置和全局最優(yōu)位置,然后進行迭代,若當前適應度優(yōu)于個體最優(yōu)值和全局最優(yōu)值,則更新個體最優(yōu)值和全局最優(yōu)值,直到滿足條件輸出最優(yōu)解為止。
(3)采用最小二乘法得到最小二乘解和PSO尋得的輸入權重和閾值進行逐層訓練,得到相關量化特征,通過DELM 分類器映射到目標輸出空間,得到最終的預測結果。
采用基于RF-PSO-DELM 算法構建鹽沼濕地堿蓬LAI 反演模型。利用留出法訓練模型,即取103 個樣方點數據作為訓練集,剩下20 個樣方點作為測試集。為減小變量之間的差異性,反演前進行歸一化處理,反演后進行相應地反歸一化操作。詳細反演步驟和流程如圖5所示。
圖5 基于RF-PSO-DELM 的LAI反演流程圖Fig.5 Flow chart of LAI based on RF-PSO-DELM
目前,大部分研究沒有明確提出ELM 中隱藏層節(jié)點數的選取準則,依據主觀性選取,不具一般性(陸軍勝 等,2021;Li等,2021)。為了尋得最佳隱含層節(jié)點數,以測試集的平均決定系數(R2)作為選取準則。如圖7 所示,隱含層節(jié)點數分布為2—40,隱含層激活函數分別設置為“Sigmoid 函數”,“Sine 函數”以及“Hardlim 函數”,繪制隱含層節(jié)點數與平均決定系數的關系圖。
從圖6 可以看出:隱含層函數為“Sigmoid 函數”的網絡結構的決定系數(R2)明顯優(yōu)于另外兩個激活函數,因此,DELM 模型選取Sigmoid 作為激活函數。
圖6 隱含層節(jié)點數與決定系數的關系Fig.6 The relationship between the number of hidden layer nodes and the coefficient of determination
在“Sigmoid 函數”作為激活函數的模型中,對應的均方根誤差在0.1 左右,直接取決定系數最大時隱含層對應的節(jié)點數。因此,DELM 模型選取Sigmoid 作為最優(yōu)的激活函數,對應的最優(yōu)隱含層為20,且每一層的節(jié)點數為15。此外,利用均方根誤差RMSE(Root Mean Squared Error)和模型決定系數(R2)作為堿蓬LAI反演模型精度的評價標準。
不同模態(tài)數據的影響系數即為每一個影響因素對于堿蓬LAI 的影響程度(表6),土壤全氮、全磷、全鹽和土壤含水量與堿蓬LAI的影響系數較大,這與多數學者的相關研究結果一致(趙珊珊等,2020;靖淑慧 等,2018;賀文君 等,2021)。例如,趙珊珊 等(2020)研究表明堿蓬可直接利用土壤中的氮磷進行吸收,也就是說氮磷在一定程度上會影響堿蓬生長。
表6 不同模態(tài)特征選擇表Table 6 Different modal feature selection table
不同模態(tài)數據的影響因素對堿蓬LAI的影響系數如表6 所示。從表6 中可以看出:土壤因子中,有機質、總碳和全鉀;紅邊參數中,紅邊位置和紅邊偏度;紋理特征中,相異性、相關性、協同性、二階矩和信息熵對堿蓬LAI反演的影響系數小于0.1,予以刪除。選用對堿蓬LAI 反演的影響系數大于0.1 的參量作為模態(tài)特征參數,分別是土壤全鹽、全氮、全磷、含水量,紅邊振幅、紅邊面積和紅邊峰度;均值、對比度和方差;植被指數D690/D598、(D699-D598)和(D598-D693)/(D598+D693)和植被覆蓋度。
4.2.1 LAI反演模型構建
為了檢驗本研究提出的基于RF-PSO-DELM算法結合多模態(tài)數據的堿蓬LAI 反演模型的有效性,在樣本數據相同情況下,基于SVM、BP、ELM、DELM、PSO-DELM、RF-PSO-DELM 等6 種算法建立黃河三角洲堿蓬LAI 的反演模型。設置SVM類型為?-SVR,選擇RBF為核函數,懲罰系數為2.5、核函數參數為0.07且損失函數值為0.01;BP 神經網絡中的隱含層節(jié)點設置為15、最大訓練次數為200、學習率為0.01、訓練需求精度為le-5;ELM 和DELM 的參數設置與RF-PSO-DELM 一致,選取Sigmoid 作為最優(yōu)的激活函數,對應的最優(yōu)隱含層為20,且每一層的節(jié)點數為15;另外,PSODELM 中關于粒子群優(yōu)化算法的參數設置與RFPSO-DELM 一致,不同的是,將不同模態(tài)的所有數據全部輸入到PSO-DELM模型中。
4.2.2 模型精度評價
基于6 種算法構建的堿蓬葉面積指數LAI 反演模型精度比較結果如圖7所示。從圖7中可以看出:圖7(a)—(f)分別為SVM、BP、ELM、DELM、PSO-DELM、RF-PSO-DELM等6種模型在測試集上的反演效果,其中,決定系數(R2)分別為0.8225、0.6892、0.7509、0.8765、0.9016 和0.9546,均方根誤差(RMSE)分別為0.1877、0.2169、0.2052、0.1718、0.1627和0.1341,決定系數(R2)最高提高了0.2654,均方根誤差RMSE 最大降低了0.0828。由此可見,RF-PSO-DELM 預測模型輸出結果與實際結果很接近,RMSE 很小,表明RF-PSO-DELM模型在LAI 預測方面具有較好的擬合學習能力。PSO-DELM 和RF-PSO-DELM 的決定系數(R2)比DELM、ELM、BP 和SVM 提高了至少0.0791。這也充分說明,經過PSO 優(yōu)化后具有更好的預測性能。相比于PSO-DELM,RF-PSO-DELM 的R2提高了0.053、RMSE 降低了0.0286,精度更加準確,模型更穩(wěn)定,預測效果更佳,這也表明了RF 特征優(yōu)選也是一個優(yōu)化過程,很好地提升了模型的預測性能。
圖7 測試集不同算法反演效果比較Fig.7 Comparison of inversion results of test set
此外,在相同樣本數據和輸入條件下,DELM模型的性能優(yōu)于ELM、BP 和SVM 模型。SVM 模型預測性能優(yōu)于ELM 和BP,這主要是因為ELM 和BP容易陷入局部最優(yōu)導致過擬合。結合實驗過程,BP 神經網絡相較于ELM 訓練時間較長,主要是由于ELM 不需要迭代微調,耗時較短。因此,采用RF-PSO 雙優(yōu)化策略可以很好地幫助DELM 優(yōu)選訓練樣本,找到最優(yōu)參數,提升模型預測性能。
4.2.3 反演模型應用
將基于RF-PSO-DELM 算法構建的堿蓬LAI最優(yōu)反演模型應用到黃河三角洲堿蓬灘濕地,得到研究區(qū)堿蓬LAI 的空間分布,結果如圖8 所示。從圖8 中可以看出:影像中非堿蓬生長區(qū)域的LAI 值為0,堿蓬LAI最大為0.2。
圖8 研究區(qū)內堿蓬LAI空間分布圖Fig.8 The spatial distribution of the LAI of Suaeda salsa in the study area
葉面積指數較高的主要集中分布在研究區(qū)東南部,北部堿蓬稀疏區(qū)域的LAI比較低,根據實地勘察情況,研究區(qū)選定的地理位置北部區(qū)域中有潮溝經過且距離北部渤海較近,常年受潮溝中海水的高水鹽侵蝕。而且結合實測的土壤樣方來看,北部區(qū)域土壤樣方有機質含量和全氮含量較低,含水量和鹽濃度較高,這與Hernández 等(1995)及Qi 等(2009)研究結果相一致,堿蓬植被在較高的水和鹽濃度下,其葉綠體和線粒體會遭受鈉離子的毒害,并形成活性氧(ROS),造成堿蓬植被生長萎縮,從而造成堿蓬LAI降低。
本研究結合區(qū)域土壤因子、植被紅邊參數和植被指數等光譜特征、無人機高光譜遙感影像紋理特征和地面實測的植被覆蓋度等多模態(tài)數據,發(fā)展雙優(yōu)化策略的RF-PSO-DELM 算法,構建了濱海濕地堿蓬LAI反演模型,與傳統(tǒng)的模型構建相比,該反演模型增加了反映濱海濕地堿蓬的多模態(tài)數據,為堿蓬LAI 模型反演提供了新思路和新方法。
為了驗證模型的泛化性和分析不同模態(tài)數據特征對堿蓬LAI 反演的影響,采用RF-PSO-DELM和傳統(tǒng)經典且廣泛使用的SVM 算法應用不同模態(tài)數據構建堿蓬葉面積指數LAI的反演模型,精度比較分析結果如表7所示。
表7 基于不同模態(tài)特征下的LAI反演結果Table 7 Inversion results of LAI under different modal features
從表7中可以看出:在不同單模態(tài)數據中,應用RF-PSO-DELM 算法反演堿蓬LAI 的決定系數(R2)明顯高于SVM 算法,其中利用植被指數反演堿蓬LAI的決定系數(R2)提升了近11%,模型的均方根誤差(RMSE)也減少了0.1947,說明RFPSO-DELM 算法模型也更加穩(wěn)定。
對比基于RF-PSO-DELM 和SVM 算法構建的堿蓬LAI 反演模型精度可知:基于RF-PSO-DELM算法的LAI預測值與真實值更接近,RF-PSO-DELM算法對于非線性特征具有更好的擬合學習能力,具有更強的泛化性。植被覆蓋度對堿蓬LAI的反演精度影響較大,這表明植被覆蓋度可以很好地提升堿蓬LAI反演精度,這與瞿瑛等(2008)等理論研究一致,植被覆蓋度與堿蓬LAI之間存在一定的統(tǒng)計模型關系。此外,利用多模態(tài)數據特征基于RF-PSO-DELM 和SVM 算法構建的堿蓬LAI的預測精度明顯優(yōu)于僅使用單一模態(tài)特征數據的預測精度。因此,植被LAI的高光譜反演研究需要考慮植被的不同模態(tài)數據特征,以提高相關模型的反演精度。
為了進一步說明結合多模態(tài)數據的反演模型優(yōu)越性,利用RF-PSO-DELM 算法結合不同模態(tài)數據的部分結果如圖9所示,結果表明組合使用不同模態(tài)數據的決定系數(R2)均高于僅使用單一模態(tài)數據的決定系數(R2),其中結合所有模態(tài)數據的精度最高為0.9546,其次就是結合土壤因子、紅邊參數和植被覆蓋度的精度較高為0.9501。該研究結果與高林等(2017a)在不同土壤背景下使用不同的模態(tài)數據(紅邊參數和改進型的植被指數)估算冬小麥LAI類似,結合多模態(tài)特征可有效提升LAI的預測精度。
圖9 基于RF-PSO-DELM 的不同模態(tài)部分組合方式反演結果比較Fig.9 Comparison of inversion results of different mode combinations based on RF-PSO-DELM
(1)以濱海濕地堿蓬為研究對象,結合無人機高光譜數據,提出了一種基于RF-PSO-DELM算法,構建了濱海濕地堿蓬葉面積指數LAI的反演模型,與SVM、BP 等傳統(tǒng)模型相比,具有反演性能更高,模型更加穩(wěn)定的特點。
(2)綜合考慮影響濱海濕地堿蓬生長的土壤因子、紋理特征、光譜特征和植被覆蓋度等多源模態(tài)數據,并利用隨機森林特征優(yōu)選算法提取對堿蓬葉面積指數LAI敏感的重要影響因素,有效降低了模型反演的復雜性,大大提高了模型預測的精度。
(3)利用隨機森林算法進行特征選擇,粒子群算法優(yōu)化閾值參數,實質是采用雙向特征優(yōu)化策略,避免無關特征影響,減小了DELM訓練過程中的運算量,提高了訓練速度。
由于濱海濕地堿蓬樣本數量有限,基于區(qū)域尺度的堿蓬LAI 反演模型的普適性尚需進一步驗證。因此,未來可針對多個區(qū)域不同生長期的堿蓬LAI 分別構建反演模型,并增加濕地覆被類型,提高濕地植被LAI反演模型的普適性。在利用多模態(tài)數據構建堿蓬LAI反演模型時,可在后續(xù)研究中進一步考慮葉片葉綠素含量等實測植物參數對堿蓬LAI反演的影響。