王寶水,劉 旭,楊紅軍
(1. 江陰市城市規(guī)劃信息咨詢中心,江蘇 江陰 2144331;2. 徐州市賈汪區(qū)國土資源局,江蘇 徐州 221011;3. 江蘇省地質測繪院,江蘇 南京 210008)
一種基于高光譜遙感數(shù)據(jù)的植被LAI反演算法
王寶水1,劉 旭2,楊紅軍3
(1. 江陰市城市規(guī)劃信息咨詢中心,江蘇 江陰 2144331;2. 徐州市賈汪區(qū)國土資源局,江蘇 徐州 221011;3. 江蘇省地質測繪院,江蘇 南京 210008)
針對高光譜遙感數(shù)據(jù)反演葉面積指數(shù)(LAI)的問題,提出了基于主成分變換(PCA)的綜合反演算法。研究表明,利用變換后的高光譜數(shù)據(jù)建立的神經(jīng)網(wǎng)絡反演模型具有更好的泛化性,提高了實測數(shù)據(jù)的反演穩(wěn)定性和精度,同時加快了反演速度。
:PCA;神經(jīng)網(wǎng)絡;PROSAIL 模型;LAI
葉面積指數(shù)(LAI)是描述植被冠層結構的重要參數(shù)之一[1]。作為反映農(nóng)作物長勢和農(nóng)作物估產(chǎn)的重要參量,如何快速、有效、準確地獲取LAI信息已成為當前遙感應用的重要研究內(nèi)容[2]。LAI的反演方法主要有經(jīng)驗模型法、物理模型法和綜合反演法等。經(jīng)驗模型法通常是在光譜和相關生化參量之間建立回歸經(jīng)驗模型,是目前較為常用的一種方法;物理模型法是以物理輻射傳輸模型為基礎的參數(shù)反演,理論基礎完善,具有明確的物理意義;綜合反演法是利用物理模型模擬的大量樣本數(shù)據(jù),結合神經(jīng)網(wǎng)絡、投影追蹤和回歸樹等方法建立反演模型,從而實現(xiàn)反演。研究表明,綜合反演法具有反演速度快、無需設置參數(shù)初值、保證反演收斂等優(yōu)點,已成為多種衛(wèi)星遙感產(chǎn)品的實用反演算法。
在綜合反演法中,將BP神經(jīng)網(wǎng)絡和PROSAIL模型相結合的LAI反演方法是一種常用的反演策略。在高光譜遙感數(shù)據(jù)中,由于光譜波段眾多、信息冗余度高,存在如何利用光譜信息的問題。若高光譜波段全部進入反演模型,則存在神經(jīng)網(wǎng)絡結構復雜、訓練過程耗時過多、計算機內(nèi)存不足、網(wǎng)絡收斂慢或無法收斂等情況,從而無法高效、快速地進行LAI估算。楊貴軍[3]、劉洋[4]、Verger A[5]等通過選擇特征波段的方法減少光譜間的相關性,取得了較好的反演結果。但是,特征波段依賴于波段選擇算法,不同的算法會選出不同的波段組合,為實際反演過程帶來困難。此外,由于神經(jīng)網(wǎng)絡對訓練數(shù)據(jù)的依賴性較大,泛化性較差,當用原始的高光譜數(shù)據(jù)進行神經(jīng)網(wǎng)絡訓練時,會導致不同訓練數(shù)據(jù)訓練的神經(jīng)網(wǎng)絡的反演結果不穩(wěn)定,影響反演精度。
主成分變換(PCA)是一種常用的數(shù)據(jù)降維和特征提取方法,由于主成分實際上相當于對原始數(shù)據(jù)進行了一次加權求和運算,因此,對高光譜遙感數(shù)據(jù)進行PCA,利用變換后的數(shù)據(jù)訓練神經(jīng)網(wǎng)絡,可降低神經(jīng)網(wǎng)絡模型對訓練數(shù)據(jù)的敏感性,增強神經(jīng)網(wǎng)絡的泛化能力,進而提高反演精度。
1.1 PROSAIL模型簡介
植被輻射傳輸模型PROSAIL是由葉片光學特性模型PROSPECT和冠層反射模型SAIL耦合而成[6],已廣泛應用于植被生化組分提取、冠層結構估計等多個方面。PROSPECT模型是一個用于計算葉片反射率(ρl)和透射率(τl)的輻射傳輸模型,由Jacquemoud和Baret等首先提出[7]。SAIL模型是用于計算植被冠層二向反射率ρ(λ)的輻射傳輸模型,由Verhoef在Suit模型的基礎上修改而成。PROSAIL模型的表達式為[8]:ρ(λ)=PROSAIL(N,Cab,Cw,Cm,Cbp,LAI,hspot,ALA,ρs,SKYL,θS,θv,θSv)
式中,N為葉片結構參數(shù);Cab為葉綠素含量;Cw為等效水厚度;Cm為干物質含量;Cbp為棕色素含量;hspot為熱點效應參數(shù);ALA為平均葉傾角;ρs為土壤反射率;SKYL為天空光比例;θS為太陽天頂角;θv為冠層天頂角;θSv為反射方位角。
1.2 數(shù)據(jù)準備
本文研究需要模擬數(shù)據(jù)和地面實測數(shù)據(jù)。模擬數(shù)據(jù)用于神經(jīng)網(wǎng)絡的訓練,根據(jù)PROSAIL模型的輸入?yún)?shù),采用高斯分布隨機生成98 304種輸入?yún)?shù)組合,其中各輸入?yún)?shù)的取值范圍如表1所示,模型的其余參數(shù)采用固定值。各參數(shù)組合對應的冠層光譜數(shù)據(jù)由PROSAIL模型計算得到。
表1 模擬數(shù)據(jù)各輸入?yún)?shù)范圍
本文研究所用的地面實測數(shù)據(jù)是由歐洲航空局(ESA)Sentinel-3 Experiment提供。實驗區(qū)域位于西班牙西南部的巴拉克斯地區(qū)(Barrax),地勢平坦,海拔高度為700 m。觀測時間是2009年6月20~24日,觀測植被包括玉米、大蒜和向日葵等農(nóng)作物。該實驗野外測量了植被冠層的反射率、葉片的反射率和透射率、土壤反射率、葉綠素含量、水含量、LAI以及氣象數(shù)據(jù)等。
神經(jīng)網(wǎng)絡在遙感圖像處理領域得到廣泛應用[9]。由于神經(jīng)網(wǎng)絡可以逼近任意非線性函數(shù),因此,當利用PROSAIL模型模擬了足夠的樣本數(shù)據(jù)后,可通過這些樣本數(shù)據(jù)訓練神經(jīng)網(wǎng)絡去逼近PROSAIL模型的逆函數(shù),實現(xiàn)模型反演。本文以BP神經(jīng)網(wǎng)絡為工具,結合PROSAIL模型反演植被LAI。算法流程如圖1所示。
圖1 算法流程圖
首先模擬出符合高斯分布的植被生化參數(shù),并根據(jù)PROSAIL模型計算出參數(shù)對應的光譜數(shù)據(jù);然后將得到的模擬光譜數(shù)據(jù)進行PCA,選取不同的主成分個數(shù)和對應的變換矩陣;再將未進行PCA的原始數(shù)據(jù)和變換后的數(shù)據(jù)分別進行網(wǎng)絡訓練,形成反演模型;最后將原實測數(shù)據(jù)和變換后的實測數(shù)據(jù)分別進行反演計算。變換后實測數(shù)據(jù)的反演方法為:利用前一步驟得到的變換矩陣對實測光譜數(shù)據(jù)進行PCA,得到變換后的主成分數(shù)據(jù),并將其帶入訓練好的網(wǎng)絡中進行反演計算。另外,還需從變換前后反演精度變化和主成分個數(shù)選擇兩個方面對該算法進行討論與分析。
為了研究神經(jīng)網(wǎng)絡對訓練數(shù)據(jù)的敏感性,從98 304 個模擬數(shù)據(jù)里,隨機選擇20個數(shù)據(jù)子集,每個子集包含4 000個樣本。對這20個子集分別進行變換前的網(wǎng)絡訓練和變換后的網(wǎng)絡訓練。變換前的數(shù)據(jù)采用兩個隱含層的網(wǎng)絡結構,每層神經(jīng)元個數(shù)為30和10;變換后的數(shù)據(jù)采用一個隱含層的網(wǎng)絡結構,神經(jīng)元個數(shù)為5。在實驗中,主成分個數(shù)分別取2~10。對變換前和變換后的數(shù)據(jù)都進行20次反演計算,精度評價指標為均方根誤差RMSE。20次反演結果的標準差和平均值如表2所示。
分析可知,經(jīng)過PCA后,反演結果可分為兩種情況:選擇的主成分個數(shù)為2~7時,RMSE變化較小,穩(wěn)定性高于變換前的結果;選擇的主成分個數(shù)大于7時,RMSE的波動變得較為明顯,呈逐漸增加的趨勢,穩(wěn)定性逐步降低。研究表明,在反演的穩(wěn)定性上,變換后的反演結果要優(yōu)于變換前的結果;在反演的精度上,選取2~7個主成分,變換后的反演結果RMSE明顯小于變換前的值,精度明顯提高。
如何選取主成分個數(shù)也是算法中重要的一步,不同的主成分個數(shù)對反演的結果具有重要影響,從表2可以看出,前2個和前3個的反演穩(wěn)定性高于其他的,前3個的精度RMSE高于其余幾個。研究表明,從穩(wěn)定性和精度上綜合比較,選擇3個主成分時,能夠得到最優(yōu)的結果。
表2 變換前和變換后的反演結果
針對高光譜遙感反演問題,本文提出了利用PCA數(shù)據(jù)訓練神經(jīng)網(wǎng)絡的反演算法,用于植被LAI的估算,取得了較好的結果;并從變換前后反演精度的變化和主成分個數(shù)選擇兩個方面進行了分析,得出如下結論:
1)在進行神經(jīng)網(wǎng)絡反演時,變換前數(shù)據(jù)訓練的神經(jīng)網(wǎng)絡對訓練數(shù)據(jù)的敏感性較強,反演結果不穩(wěn)定;而進行變換后并選擇合適的主成分個數(shù)進行神經(jīng)網(wǎng)絡訓練,反演結果的穩(wěn)定性顯著提高,反演精度也得到了提高。
2)主成分個數(shù)對反演結果影響較為明顯,主成分選擇過多也會導致反演結果的不穩(wěn)定。本文選擇3個主成分就可獲得較好的反演結果。
3)本算法實現(xiàn)了對原始數(shù)據(jù)的降維處理,減少了用于網(wǎng)絡訓練的數(shù)據(jù)量,在進行神經(jīng)網(wǎng)絡計算時,對計算機的內(nèi)存需求小,提高了訓練和計算速度。
[1] CHEN J M, Black T A.Defining Leaf Area Index for Non-flat Leaves [J]. Plant,Cell and Environment,1992,15(4):421-429
[2] 邢著榮,馮幼貴,李萬明,等.高光譜遙感葉面積指數(shù)(LAI)反演研究現(xiàn)狀[J].測繪科學,2010,35(增刊1):162-164
[3] 楊貴軍,趙春江,邢著榮,等.基于PROBA/CHRIS遙感數(shù)據(jù)和PROSAIL模型的春小麥LAI反演[J].農(nóng)業(yè)工程學報,2011,27(10):88-94
[4] 劉洋,劉榮高,劉斯亮,等.基于物理模型訓練神經(jīng)網(wǎng)絡的作物葉面積指數(shù)遙感反演研究[J].地球信息科學學報,2010,12(3):426-435
[5] Verger A,Baret F,Camacho F. Optimal Modalities for Radiative Transfer-neural Network Estimation of Canopy Biophysical Characteristics: Evaluation over an Agricultural Area with CHRIS/PROBA Observations[J]. Remote Sensing of Environment,2011,115(2):415-426
[6] Jacquemoud S, Verhoef W,Baret F,et al. PROSPECT+SAIL Models: a Review of Use for Vegetation Characterization[J]. Remote Sensing of Environment,2009,113(S):56-66
[7] Verhoef W, Bach H. Remote Sensing Data Assimilation Using Coupled Radiative Transfer Models[J]. Physics & Chemistry of the Earth,Parts A/B/C,2003,28(1/3):3-13
[8] Jacquemoud S, Verhoef W,Baret F,et al. PROSPECT+SAIL:15 Years of Use for Land Surface Characterization[C]. IEEE International Conference on Geoscience & Remote Sensing Symposium, Denver,2006:1 992-1 995
[9] 段連飛,黃國滿,榮偉,等.基于BP神經(jīng)網(wǎng)絡的機載高分辨率SAR圖像分類方法研究[J].測繪通報,2009(2):14-17,27
P237
:B
:1672-4623(2016)11-0072-02
10.3969/j.issn.1672-4623.2016.11.026
王寶水,主要從事測繪工程相關工作。
2014-11-17。