楊可明 孫陽陽 王林偉 史鋼強 魏華鋒 劉飛
摘要:葉綠素含量是綠色植物生長狀態(tài)的一個重要指標。首先在實驗室采集玉米葉片高光譜數(shù)據(jù)和測定葉綠素含量,并對光譜數(shù)據(jù)進行對數(shù)一階微分變換,對比選取建模反演因子。根據(jù)選定的反演因子采用線性回歸、模糊識別和BP神經(jīng)網(wǎng)絡(luò)方法建立了玉米葉片葉綠素含量高光譜反演模型,并計算出模型的精度。結(jié)果表明,有較好非線性映射能力的BP神經(jīng)網(wǎng)絡(luò)反演模型能夠高精度地反演出玉米葉片中的葉綠素含量。BP神經(jīng)網(wǎng)絡(luò)模型葉綠素含量預測和實測葉綠素含量的平均絕對誤差(e)為1.126,決定系數(shù)(R2)為0.902,均方根誤差(RMSE)為1.375。玉米葉片葉綠素含量與高光譜數(shù)據(jù)并非線性關(guān)系,BP神經(jīng)網(wǎng)絡(luò)反演模型能夠較好地運用到葉片葉綠素含量反演中。
關(guān)鍵詞:玉米葉片;葉綠素含量;高光譜遙感;反演模型
中圖分類號:P237;S513 文獻標識碼:A 文章編號:0439-8114(2015)11-2744-05
DOI:10.14088/j.cnki.issn0439-8114.2015.11.049
Researches on Hyperspectral Inversion Model of Corn Leaf Chlorophyll Content
YANG Ke-ming, SUN Yang-yang,WANG Lin-wei, SHI Gang-qiang, WEI Hua-feng, LIU Fei
(College of Geosciences and Survey Engineering, China University of Mining & Technology (Beijing), Beijing 100083, China)
Abstract:Chlorophyll content is an important indicator of green plant growth status. Firstly the hyperspectral data and chlorophyll content of corn leaf were measured in the laboratory, and the inversion factors were selected by comparing the data which was transferred by the hyperspectral data of corn leaf through the first order differential of logarithmic. Then hyperspectral inversion models of corn leaf chlorophyll content were established by method of liner regression, BP neural network and fuzzy recognition based on the selected inversion factors and the accuracy of each model was calculated. Results showed that the BP neural network inversion model with good nonlinear mapping capability could accurately predict the chlorophyll content of corn leaf high. The mean absolute error was 1.126,R2 was 0.902 and RMSE was 1.375 in BP neural network inversion model. The chlorophyll content and hyperspectral data of corn leaf was not a linear relationship and the BP neural network inversion model could be applied in leaf chlorophyll inversion.
Key words:corn leaf; chlorophyll content; hyperspectral remote sensing; inversion model
高光譜遙感技術(shù)是21世紀遙感技術(shù)重大、影響深遠的突破,在國民經(jīng)濟發(fā)展中發(fā)揮了重要作用[1]。高光譜波譜分辨率高,光譜連續(xù)性強,蘊含著豐富的地物信息,為遙感從對地定性觀測到定量觀測提供了強有力的技術(shù)支撐[2]。
綠色植物為地球生命提供養(yǎng)料和能量,是社會生存和發(fā)展的根本,對植物的生長監(jiān)測有著十分重要的意義。葉綠素是綠色植物中存在的最廣泛。最主要的色素,在植物的光合作用中扮演著非常重要的角色[3]。葉綠素含量反映植被的生長狀態(tài),是植物理化分析的一個重要指標。傳統(tǒng)的葉綠素含量測定方法費時費力,因此結(jié)合新技術(shù)實現(xiàn)對葉綠素含量的反演有著重要意義。為此,以玉米葉片高光譜波譜數(shù)據(jù)為基礎(chǔ),結(jié)合線性回歸、模糊識別和BP神經(jīng)網(wǎng)絡(luò)建模算法,對玉米葉片的高光譜波譜數(shù)據(jù)與葉綠素含量關(guān)系進行了探究,以期為精細化農(nóng)業(yè)和生態(tài)環(huán)境監(jiān)測提供新的技術(shù)手段。
1 BP神經(jīng)網(wǎng)絡(luò)理論及其應(yīng)用
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)[4]由Rumelhart和McCelland為首的科學家小組于1986年提出,是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)包括輸入層(Input layer)、隱含層(Hidden layer)和輸出層(Output layer),具體見圖1。隱含層是位于輸入層和輸出層之間的一種內(nèi)部結(jié)構(gòu),可以有多層多個節(jié)點,是輸入模式在神經(jīng)網(wǎng)絡(luò)中的一種內(nèi)部表示[5]。隱含層的作用是將輸入模式的特征進行抽取,并將抽取的特征傳遞至下層,直至輸出層,然后由輸出層進行判斷其與其他輸入模式的不同。隱含層產(chǎn)生作用的過程其實是神經(jīng)元之間連接權(quán)值的調(diào)節(jié)過程,是一個自組織化的過程。因此,BP神經(jīng)網(wǎng)絡(luò)模型的建立過程就是確定隱含層以及節(jié)點數(shù)并根據(jù)訓練樣本不斷調(diào)整神經(jīng)元之間的權(quán)值,使誤差函數(shù)達到極小值的過程。
BP神經(jīng)網(wǎng)絡(luò)的信息循環(huán)包括輸入信息的正向傳播和輸出誤差的反向傳播。正向傳播符合神經(jīng)最基本的三個特征:加權(quán)、求和與轉(zhuǎn)移[6],節(jié)點的特征見圖2。圖2中,x1,x2,…,xn-1,xn分別代表來自前一層的神經(jīng)元1,2,…,n-1,n的輸入;w1j,w2j,…,w(n-1)j,wnj分別表示前一層神經(jīng)元1,2,…,n-1,n與神經(jīng)元j的連接權(quán)值;bj為閾值;F(y)為激勵函數(shù);Yj為第j個神經(jīng)元的輸出。BP神經(jīng)網(wǎng)絡(luò)在j個神經(jīng)元的輸出Yj見式(1)。
Yj=F(y)=F(■wijxi+bj)=F(WjX+bj) (1)
式中,Wj=[w1j,w2j,…,w(n-1)j,wnj],X=[x1,x2,…,xn-1,xn]T。
BP神經(jīng)網(wǎng)絡(luò)每正向傳播一次就會獲得一個實際輸出Yj(j=1,2,…,n),實際輸出與期望輸出Tj(j=1,2,…,n)的誤差函數(shù)見式(2)。當誤差沒有達到設(shè)定的容許誤差或者取得極小值,則神經(jīng)網(wǎng)絡(luò)進行輸出誤差反向傳播,不斷調(diào)整神經(jīng)元之間的連接權(quán)值,使誤差達到允許范圍之內(nèi)。
E=■■(Tj-Yj)2 (2)
BP神經(jīng)網(wǎng)絡(luò)以及其改進模型已經(jīng)在各行各業(yè)中得到了廣泛的應(yīng)用。周建春等[7]對隧道圍巖力學參數(shù)進行BP神經(jīng)網(wǎng)絡(luò)的反演,證明了該方法的有效性;吐爾遜·艾山[8]等利用BP神經(jīng)網(wǎng)絡(luò)進行鹽堿土鹽分反演建模,模型精度達到88.77%;張娟娟等[9]利用BP神經(jīng)網(wǎng)絡(luò)對不同類型土壤的有機質(zhì)進行預測,達到了較高的精度;李雪等[10]利用BP神經(jīng)網(wǎng)絡(luò)優(yōu)化的粒子群算法對糧食產(chǎn)量進行預測,彌補了粒子群算法的缺點,取得了較好的效果。
2 數(shù)據(jù)獲取與處理
2.1 數(shù)據(jù)獲取
測量的對象為實驗室培養(yǎng)玉米的葉片,對玉米植株的不同部位分別取樣,測量取樣的高光譜數(shù)據(jù)和葉綠素含量。
光譜測量儀器是美國SVC公司生產(chǎn)的型號為SVC HR-1024I的高性能地物光譜儀,該光譜儀光譜范圍為350~2 500 nm,其中在350~1 000 nm范圍內(nèi)光譜采樣帶寬為1.5 nm,光譜分辨率為3.5 nm;在1 000~1 850 nm范圍內(nèi)光譜采樣帶寬為3.6 nm,光譜分辨率為9.5 nm;在1 850~2 500 nm范圍內(nèi)光譜采樣帶寬為2.5 nm,光譜分辨率為6.5 nm。光譜數(shù)據(jù)在暗室內(nèi)進行測量,使用光譜儀配套的功率為50 W的鹵素燈光源和4°視場角的探頭,探頭垂直于葉片表面40 cm;輸出的光譜為3條原始掃描光譜自動平均所得,光譜反射系數(shù)經(jīng)專用平面白板標準化。
葉片中的葉綠素主要分為葉綠素a和葉綠素b,傳統(tǒng)的葉綠素含量測量主要采用化學實驗法。研究表明[11],綠色植物綠色度值(SPAD)與葉綠素含量相關(guān)性顯著,應(yīng)用葉綠素計測量葉綠素含量是可行的。故采用SPAD-502測定玉米葉片中的葉綠素含量,在每個葉片不同位置隨機測量5個值,求取平均值代替葉片的葉綠素含量值。
2.2 光譜數(shù)據(jù)的處理
2.2.1 光譜數(shù)據(jù)的去噪和變換 在光譜的測量過程中由于人為和儀器的原因,光譜曲線總存在一些包含在信號中的少量噪聲。實踐表明,如果噪聲的頻率較高,其量值也不大,用平滑方法可在一定程度上降低噪聲[12]。采用五點加權(quán)平均值的方法對原始光譜進行平滑,計算方法見式(3)。設(shè)原始光譜曲線測點的反射率和五點光滑后曲線測點的反射率分別為Ri和ri(i=3,4,…,N),則:
ri=0.1Ri-2+0.2Ri-1+0.4Ri+0.2Ri+1+0.1Ri+2 (3)
光譜數(shù)據(jù)的變換方法有很多種,采用式(4)對數(shù)的一階微分變換。對數(shù)變換不但能夠減少光照條件變化引起的乘性因素的影響,而且能夠增加光譜值偏低區(qū)域的光譜差異;微分變換有助于降低低頻噪聲對目標光譜的影響。
Ai=■ (4)
式中,Ai、ri和?姿i分別為測點i的光譜變換值、光譜反射率值和中心波長。一階微分變換后其數(shù)據(jù)值很小,為了方便數(shù)據(jù)的使用,將數(shù)據(jù)統(tǒng)一乘以100。
2.2.2 反演因子的選擇 葉綠素含量的高光譜反演是根據(jù)葉片的高光譜數(shù)據(jù)通過數(shù)據(jù)計算處理,建立葉片高光譜數(shù)據(jù)與葉綠素含量的內(nèi)在關(guān)系。光譜數(shù)據(jù)相鄰波段不可避免的存在冗余,若把350~2 500 nm的光譜數(shù)據(jù)作為模型的反演因子沒有必要,也不利于建模。因此,選擇最佳波段的光譜值作為建模的因子十分必要。
計算各個波段光譜數(shù)據(jù)變換值與與葉綠素含量相關(guān)系數(shù)并生成折線圖,相關(guān)系數(shù)見圖3。在折線圖上選取拐點處且相關(guān)系數(shù)較大的點作為模型的反演因子,選取的反演因子及其相關(guān)系數(shù)見表1,最終得到的建模數(shù)據(jù)見表2。
3 反演模型的建立
為了探究玉米葉片高光譜數(shù)據(jù)與葉綠素含量的關(guān)系,分別建立了線性回歸模型、模糊識別和BP神經(jīng)網(wǎng)絡(luò)模型3種反演模型并計算出模型的精度。評價反演模型精度的指標主要有均方根誤差(RMSE)、葉綠素預測值與實測值的決定系數(shù)(R2)和平均相對誤差(e)。
3.1 線性回歸模型及其精度
線性回歸是研究因變量與自變量之間線性相關(guān)關(guān)系的一種基本建模方法,根據(jù)因變量的多少可以分為一元線性回歸和多元線性回歸。
3.1.1 一元線性回歸建模及精度 一元線性回歸分別建立各個反演因子以及反演因子加權(quán)均值與因變量的線性方程,回歸方程及精度見表3。
對不同的一元線性估測模型進行加權(quán)綜合,建立一元線性綜合反演模型,具體見式(5)。
Y=■ (5)
式中,i表示反演因子數(shù),Pi表示反演因子i的權(quán)重(由各個反演因子與葉綠素含量的相關(guān)系數(shù)求得),yi表示模型估測值。一元線性綜合反演模型的RMSE、R2和■分別為3.180、0.657和2.754,圖4為葉綠素實測值與一元線性綜合反演模型反演值。
3.1.2 多元線性回歸建模及精度 多元線性回歸模型的建模數(shù)據(jù)為全部的45個數(shù)據(jù),最后得出的多元線性回歸方程:
y=24.78-1.3 x1-1.27 x2+12.34 x3+0.68 x4+22.41 x5
(6)
式中,x1、x2、x3、x4、x5分別代表反演因子1~5。
多元線性回歸模型的RMSE、R2和■分別為2.938、0.698和2.489。通過比較可以看出,相對于單因子一元線性估測模型,加權(quán)綜合估測模型和多元線性回歸模型精度并沒有得到顯著提高。當選反演因子5(波長為743 nm)時的單因子線性回歸模型精度最高,RMSE為1.906,R2為0.693,■為2.499。
3.2 模糊識別反演模型及其精度
首先將建模數(shù)據(jù)歸一化,選取45個樣本數(shù)據(jù)的35個作為建模數(shù)據(jù)建立反演模型,剩余10個作為檢驗樣本檢驗?zāi)P途?,模型的精度見?,模型反演值見圖5。
3.3 BP神經(jīng)網(wǎng)絡(luò)模型及其精度
在建立BP神經(jīng)網(wǎng)絡(luò)進行反演建模時,選取45個數(shù)據(jù)中的35個作為建模數(shù)據(jù),其余10個作為檢驗樣本,設(shè)置最小訓練速率為0.1,允許誤差為0.000 1,迭代次數(shù)為20 000。由建模數(shù)據(jù)可知,BP神經(jīng)網(wǎng)絡(luò)的輸入層與輸出層分別為5和1,根據(jù)所設(shè)置不同的隱含層分別建立了6個BP神經(jīng)網(wǎng)絡(luò)模型,各個模型的隱含層數(shù)及節(jié)點數(shù)見表5。
BP神經(jīng)網(wǎng)絡(luò)建模后,得到建模數(shù)據(jù)的擬合值以及檢驗樣本的預測值,分別計算每個模型建模數(shù)據(jù)擬合值和檢驗樣本預測值的RMSE、R2和e,具體見表6。
由表6可以看出,當隱含層為3層,第一隱含層節(jié)點數(shù)為5,第二隱含層節(jié)點數(shù)為4,第三隱含層節(jié)點數(shù)為2時,模型的精度最高。該模型的RMSE為1.375,R2為0.902,■為1.126,相對于最優(yōu)的線性回歸模型,精度有了大幅度提高,圖6為葉綠素實測值與BP反演模型模Ⅴ反演值。
4 小結(jié)
通過對玉米葉片光譜反射率與葉綠素含量模型的反演研究可以得出以下結(jié)論。
1)適合對玉米葉片中葉綠素含量進行反演的波段位于可見光波段。葉綠素主要作用于光合作用,而光合作用的波段主要是可見光,這與已知知識相一致。同時說明了SPAD-502測定的綠度值在一些應(yīng)用中可以替代葉綠素含量的化學實驗測定值。
2)高光譜葉綠素的線性反演模型的精度與反演因子的選擇有很大的關(guān)系。反演因子多的線性回歸模型的精度不一定比單一因子的選擇精度高,但是多因子的模型能夠降低反演因子選擇帶來的模型精度風險。
3)葉綠素含量與光譜反演因子并非線性關(guān)系。BP神經(jīng)網(wǎng)絡(luò)反演模型的精度高于線性反演模型,說明其建立的反演模型更能夠表達光譜數(shù)據(jù)與葉綠素含量的的映射關(guān)系,而BP神經(jīng)網(wǎng)絡(luò)對非線性相關(guān)關(guān)系表達比線性回歸模型更有優(yōu)勢。
4)BP神經(jīng)網(wǎng)絡(luò)模型的的魯棒性比模糊識別模型的強。通過表4和表6的對比可以發(fā)現(xiàn),對于模型的建模精度和檢驗精度BP神經(jīng)網(wǎng)絡(luò)模型的幾乎沒有什么區(qū)別,而模糊識別模型相差較大。因此,在一定的樣本條件下,BP神經(jīng)網(wǎng)絡(luò)模型的穩(wěn)定性比模糊識別模型高。
本文雖然是以玉米葉片作為試驗對象,但是對其他的農(nóng)作物也起到了借鑒作用。在高光譜葉綠素反演模型中引入了模糊識別和BP神經(jīng)網(wǎng)絡(luò)等技術(shù),在葉綠素的反演取得了良好的效果。反演模型的輸入數(shù)據(jù)是光譜數(shù)據(jù)的變換值,在以后的研究中可以將反演因子多樣化。
參考文獻:
[1] 童慶禧,張 兵,鄭蘭芬.高光譜遙感——原理、技術(shù)與應(yīng)用[M]. 北京:高等教育出版社,2006.
[2] 王潤生,甘甫平,閆柏琨,等.高光譜礦物填圖技術(shù)與應(yīng)用研究[J].國土資源遙感,2010,22(1):1-13.
[3] 張懷斌.葉綠素的光學性質(zhì)及其應(yīng)用[D].濟南:山東師范大學, 2008.
[4] RUMELHART D E, MCCLELLAND J L, THE PDP Research Group. Parallel Distributed Processing——Explorations in the Microstructure of Cognition(Volume 1): Foundation[M]. The Cambridge, Massachusetts,USA:The MIT Press, 1987.
[5] 黃繼紅.基于改進PSO的BP網(wǎng)絡(luò)的研究及應(yīng)用[D].長沙:長沙理工大學,2008.
[6] 孫娓娓,劉瓊蓀.一種基于放大誤差信號的自適應(yīng)BP算法[J]. 計算機應(yīng)用,2008,28(8):2081-2083.
[7] 周建春,魏 琴,劉光棟.采用BP神經(jīng)網(wǎng)絡(luò)反演隧道圍巖力學參數(shù)[J].巖石力學與工程學報,2004,23(6):941-945.
[8] 吐爾遜·艾山,塔西甫拉提·特依拜,買買提沙吾提.基于BP神經(jīng)網(wǎng)絡(luò)的鹽堿土鹽分反演模型研究[J].環(huán)境污染與防治,2011, 33(2):23-28.
[9] 張娟娟,田永超,朱 艷,等.不同類型土壤的光譜特征及其有機質(zhì)含量預測[J].中國農(nóng)業(yè)科學,2009,42(9):3154-3163.
[10] 李 雪,顧沈明,年 浩.改進粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的糧食產(chǎn)量預測[J].閩南師范大學學報(自然科學版),2014(1):56-61.
[11] 姜麗芬,石福臣,王化田,等.葉綠素計SPAD-502在林業(yè)上應(yīng)用[J].生態(tài)學雜志,2005,24(12):1543-1548.
[12] 徐永明,藺啟忠,王 璐,等.基于高分辨率反射光譜的土壤營養(yǎng)元素估算模型[J].土壤學報,2006,43(5):709-716.