李 寶,王孟和,汪光勝,胡 陽,李偉濤,劉玉嬋,徐建輝
(1.安徽省基礎(chǔ)測繪信息中心,安徽 合肥 230000;2南京市測繪勘察研究院股份有限公司,江蘇 南京 210019;3. 滁州學(xué)院 安徽地理信息集成應(yīng)用協(xié)同創(chuàng)新中心,安徽 滁州 239000)
葉綠素是植物體所特有的一類與光合作用有密切關(guān)系的最重要的色素,植物葉綠素的含量及其變化能夠較好地反映植物的光合能力、養(yǎng)分狀況和生長健康狀況[1-2]。在農(nóng)作物長勢監(jiān)測、病蟲害監(jiān)測、作物產(chǎn)量估算和作物成熟期預(yù)測等方面具有重要意義[3]。傳統(tǒng)的葉綠素測量方法多采用化學(xué)測定法,對葉片破壞性大,耗時長[4]。 隨著高光譜技術(shù)的發(fā)展,特別是便攜式高光譜測量儀器的出現(xiàn),部分學(xué)者開始探討葉片葉綠素與高光譜之間的關(guān)系[4-5]并將其應(yīng)用到農(nóng)產(chǎn)品研究中[6-8],取得較好的成果,驗證高光譜監(jiān)測葉片葉綠素的可能性且具有較高的精度。鮮桃生產(chǎn)是滁州市果樹類農(nóng)業(yè)生產(chǎn)的重要一部分,特別是山區(qū)經(jīng)濟發(fā)展的重要途徑,但是在實際生產(chǎn)中,鮮桃生產(chǎn)管理的技術(shù)較為落后,還無法達到精準(zhǔn)農(nóng)業(yè)的要求,快速、低耗、無損地測定鮮桃葉片葉綠素含量對鮮桃長勢監(jiān)測,施肥控制,產(chǎn)量估測等具有重要意義。因此,基于高光譜技術(shù),利用ASD公司的FieldSpec3光譜儀采集40棵鮮桃樹的4個生長時期的葉片高光譜數(shù)據(jù)及對應(yīng)的葉綠素含量數(shù)據(jù),分別建立鮮桃葉片葉綠素的主成分分析-支持向量 (principle component analysis-support vector regression,PCA-SVR) 回歸預(yù)測模型和小波去噪-偏最小二乘法(wavelet denoising-partial least square regression,WD-PLSR)回歸預(yù)測模型,旨在實現(xiàn)鮮桃葉片葉綠素含量快速、無損檢測,為鮮桃生產(chǎn)管理提供科學(xué)參考。
實驗樣本來源于安徽省滁州市來安縣桃園,桃樹品種為“秋蜜紅”,桃齡約為10年,處于盛果期,樹形為主干分層型,每年修剪一次枝葉,施肥以氮肥為主。樣本采集時間分別為2015-05-12,06-20,07-22,09-06,對應(yīng)鮮桃生長的萌芽期、穩(wěn)果期、壯果期和采果期。選取40棵桃樹,從每棵桃樹分別均勻地采集8片大小勻稱的健康葉片,使用清水清洗,并用棉布擦干后裝入保鮮袋中封存編號,最后平整置于保溫箱中。
在暗箱實驗室環(huán)境中使用ASD公司的FieldSpec3光譜儀采集鮮桃葉片高光譜數(shù)據(jù),光譜值范圍為350~2 500 nm,光譜自然間隔為1 nm。光纖探頭加裝視場角為10°的鏡頭,探測距離為6 cm,使用ASD公司提供的標(biāo)準(zhǔn)白板進行光譜校正。分別在葉片尖部、中部和根部采集光譜反射率取其平均值作為此葉片的光譜反射率。取同一時期同棵鮮桃樹上8片葉子的平均光譜反射率作為一個樣本單元,提取4個時期40棵鮮桃樹的160個鮮桃葉片光譜反射率樣本。鮮桃葉片在4個生長期的平均光譜反射率如圖1所示。
圖1 不同生長時期鮮桃葉片樣本平均反射率
由圖1可以看出,四個時期葉片光譜差異較為明顯,總體而言,萌芽期葉片光譜反射率略高于其他時期,采果期葉片光譜反射率較低,主要的光譜區(qū)分區(qū)間為500~560 nm的綠光波段,760~1 300的近紅外、中紅外和遠紅外波段,以及1 500~1 850 nm和2 000~2 400 nm波段,可區(qū)分性較好,在可見光波段向近紅外過渡時,除萌芽期外,其他時期的光譜發(fā)射率的相對順序都發(fā)生了轉(zhuǎn)置,主要原因是這兩個波段區(qū)間影響光譜反射率因素的影響狀況差異明顯。
為獲取鮮桃葉片實際葉綠素含量,通過分光光度法測定每個葉片葉綠素含量,具體測定過程及葉綠素總質(zhì)量濃度和葉綠素質(zhì)量分?jǐn)?shù)計算參見文獻[9]。通過葉綠素測定實驗,得到4個不同生長期160份鮮桃葉片樣本葉綠素含量數(shù)據(jù),統(tǒng)計結(jié)果如表1所示。
表1 不同生長時期鮮桃葉片葉綠素含量
測得的高光譜數(shù)據(jù)波段多達2 150個,存在多重共線性,數(shù)據(jù)冗余量較大,不利于數(shù)據(jù)處理和分析,也會降低數(shù)據(jù)建模結(jié)果的精度,因此對原始數(shù)據(jù)的降維處理是必要的。主成分分析能夠確定原始波段最優(yōu)線性組合,實現(xiàn)高光譜圖像數(shù)據(jù)降維[10]。小波去噪是使用小波分解含噪光譜,將其與噪聲部分分離,能夠提高光譜數(shù)據(jù)信息的精度[11]。分別采用主成分分析法對原始光譜數(shù)據(jù)進行降維處理和使用小波去噪進行數(shù)據(jù)處理,經(jīng)過多次試驗,確定最優(yōu)參數(shù)的組合,并對結(jié)果進行比較選優(yōu)。
支持向量回歸是由支持向量機應(yīng)用在非線性回歸問題上發(fā)展而來的,在保證逼近訓(xùn)練精度的同時降低學(xué)習(xí)機器的復(fù)雜度[9]。在高光譜分析中有很多應(yīng)用[12-13]。利用SVR算法構(gòu)建模型時,核函數(shù)參數(shù)γ和懲罰系數(shù)C對模型結(jié)果具有重大影響,本文選用徑向基(Radial Basis Function,RBF)核函數(shù)并采用格點搜索法進行正交驗證確定核函數(shù)參數(shù)γ和懲罰系數(shù)C。利用決定系數(shù)R2和均方根誤差RMSE估測回歸模型精度,最終選定PCA較優(yōu)能量比和較優(yōu)光譜形式。偏最小二回歸具有主成分分析、普通多元線性回歸及典型相關(guān)分析的綜合優(yōu)點,在解決高光譜多波段之間的多重共線性及復(fù)雜計算問題時,具有獨特的優(yōu)勢[14]。因此,采用支持向量機回歸和偏最小二回歸以及傳統(tǒng)建模方法進行鮮桃葉片葉綠素檢測模型的構(gòu)建,對構(gòu)建模型的結(jié)果進行分析比較。
使用特征值能量占比的方法確定主成分?jǐn)?shù),分別從單個生長期和全生長期角度隨機選取25和100個樣本作為校正集,便于建模,共選取15和60個樣本作為驗證集,對模型性能進行評估(其他試驗數(shù)據(jù)集的劃分標(biāo)準(zhǔn)相同)。
根據(jù)小波參數(shù)中對去噪效果的影響程度,選取小波基函數(shù)、分解層數(shù)、閾值方案和閾值調(diào)整方案。為篩選最佳小波參數(shù)組合,引入正交試驗。選擇結(jié)果較優(yōu)的3個小波基函數(shù),通過實驗尋找最優(yōu)組合。選取1,3,5作為分解層數(shù),正交試驗因素水平如表2所示。使用留一交叉驗證法對PLSR模型的最優(yōu)主成分?jǐn)?shù)進行確定,評估指標(biāo)選擇校正集模型決定系數(shù)(C-R2)、校正集均方根誤差(C-RMSE)、驗證集模型決定系數(shù)(V-R2)、驗證集均方根誤差(V-RMSE)。根據(jù)表2中3個水平和4個因素構(gòu)造一個L9(34)正交表進行實驗。模型構(gòu)建過程詳見圖2。
圖2 模型構(gòu)建流程
表2 正交試驗因素水平表
3.1.1 不同主成分?jǐn)?shù)建模
通過實驗,得到各生長時期及全生長期的不同能量比下校正集及驗證集的模型性能指標(biāo)實驗結(jié)果(見表3)。
由表3可知,利用樣本數(shù)據(jù)構(gòu)建校正集時,各個時期隨著能量比和主成分?jǐn)?shù)的增加,模型的決定系數(shù)R2隨之增大,均方根誤差RMSE隨之減??;但在相同能量比和主成分?jǐn)?shù)構(gòu)建相應(yīng)時期的驗證集時,R2并未呈現(xiàn)遞增的趨勢,而是在超過一定能量比后,R2大幅度降低,出現(xiàn)“過擬合”現(xiàn)象,所以以此能量比作為最優(yōu)能量比。結(jié)果顯示,在萌芽期和穩(wěn)果期,能量比為96%,主成分?jǐn)?shù)為3時,建模性能最優(yōu),校正集R2分別為0.843 6和0.838 3,驗證集R2分別為0.822 4和0.830 2;在壯果期,采果期,全生長期,能量比為99%,主成分?jǐn)?shù)為5時,建模性能最優(yōu),矯正集R2分別為0.851 4,0.843 6和0.830 5,驗證集R2分別為0.838 3,0.825 1和0.813 7。因此,本試驗選擇能量比為96%作為萌芽期和穩(wěn)果期建模的最優(yōu)能量比以確定對應(yīng)時期PCA主成分?jǐn)?shù)目,選擇能量比為99%作為壯果期、采果期、全生長期建模的最優(yōu)能量比以確定對應(yīng)時期PCA主成分?jǐn)?shù)目,進而預(yù)測鮮桃葉片的葉綠素含量。
表3 不同能量比下主成分?jǐn)?shù)及模型性能評估
注:R2為模型決定系數(shù);RMSE為均方根誤差,下同
3.1.2 不同光譜形式建模
不同的光譜形式含有其特有性質(zhì),可以從不同角度構(gòu)建光譜與葉綠素之間的關(guān)系,采用原始光譜r,一階導(dǎo)數(shù)光譜r′,二階導(dǎo)數(shù)光譜r″,倒數(shù)光譜1/r,對數(shù)光譜log(r)經(jīng)PCA預(yù)處理,并保持PCA不同時期最優(yōu)能量比以構(gòu)建模型,各時期SVR模型核函數(shù)參數(shù)γ和懲罰系數(shù)C通過格點搜索法和正交驗證取得最優(yōu)值,得到不同光譜形式下的建模結(jié)果(見表4)。
表4 不同光譜形式下建模結(jié)果
注:r為原始光譜;r′為一階導(dǎo)數(shù)光譜;r″為二階導(dǎo)數(shù)光譜;1/r為倒數(shù)光譜;log(r)為對數(shù)光譜,下同
由表4分析得出,不同光譜變換,不同時期下,一階導(dǎo)數(shù)光譜r′建模精度最高;萌芽期、穩(wěn)果期、壯果期、采果期、全生長期校正集R2分別為0.841 3,0.833 2,0.854 3,0.853 0,0.842 7,驗證集R2為0.829 3,0.834 8,0.843 2,0.841 8,0.829 2;原始光譜r構(gòu)建的模型精度僅次于一階導(dǎo)數(shù)光譜r′,二階導(dǎo)數(shù)光譜r″構(gòu)建的模型精度最低。
3.2.1 小波去噪正交實驗結(jié)果
采用極差分析法對小波去噪?yún)?shù)進行的正交實驗進行分析,結(jié)果如表5所示。
表5 小波去噪正交實驗結(jié)果
注:K1,K2,K3為某一水平的評價指標(biāo)均值;R為極差
由表5可知,小波基函數(shù)位于K3、分解層數(shù)位于K3、閾值方案位于K1、閾值調(diào)整方案位于K2時校正集模型精度和驗證集模型精度均能達到較高值,即小波基函數(shù)為sym2、分解層數(shù)為5、閾值方案為Rigrsure、閾值調(diào)整方案為sln。因此本試驗最終選定A3B3C1D2水平組合對光譜進行小波去噪。
3.2.2 不同光譜形式的建模分析
使用最優(yōu)A3B3C1D2水平組合的小波去噪處理不同變換形式的光譜,構(gòu)建偏最小二乘回歸模型,并使用留一交叉驗證法確定模型的最優(yōu)主成分?jǐn)?shù),得到建模分析結(jié)果(見表6)。
表6 不同光譜形式下建模結(jié)果
由表6可知,不同光譜變換,不同時期下,一階導(dǎo)數(shù)光譜建模精度最高;萌芽期、穩(wěn)果期、壯果期、采果期、全生長期校正集R2分別為0.891 3,0.883 2,0.8943,0.893 0,0.872 7,驗證集R2為0.869 3,0.874 8,0.873 2,0.869 8,0.871 4;原始光譜r構(gòu)建的模型精度僅次于一階導(dǎo)數(shù)光譜r′,二階導(dǎo)數(shù)光譜r″構(gòu)建的模型精度最低。
將建模效果最好的小波去噪-偏最小二乘模型與3種傳統(tǒng)模型結(jié)果進行對比。選取全生長期光譜數(shù)據(jù)的一階導(dǎo)數(shù)光譜r′經(jīng)小波去噪變換后導(dǎo)入4個模型中,得到各模型的驗證集結(jié)果(見圖3)。其中BP神經(jīng)網(wǎng)絡(luò)模型在輸入數(shù)據(jù)之前進行了主成分降維處理,避免輸入節(jié)點數(shù)過大的問題。
由圖3可以看出,小波去噪-偏最小二乘建模擬合度最高,驗證集模型R2為0.871 4,RMSE為0.154 4,其次是主成分回歸模型,驗證集模型R2為0.825 9,RMSE為0.174 0,逐步回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型結(jié)果相對較差。各模型驗證集中均存在預(yù)測誤差較大的點,主要在于提取出來的數(shù)據(jù)不能完全反映原始數(shù)據(jù),只是對原始數(shù)據(jù)的最優(yōu)分析,一定程度上會增加部分?jǐn)?shù)據(jù)的誤差,導(dǎo)致誤差較大的點的出現(xiàn)。
基于主成分分析-支持向量回歸和小波去噪-偏最小二乘回歸兩種方法,對鮮桃生長的4個時期的鮮桃葉片葉綠素含量進行建模。
1)采用PCA-VCR模型時,萌芽期和穩(wěn)果期能量比為96%,壯果期、采果期、全生長期能量比為99%的模型預(yù)測性能較優(yōu)。驗證集的R2分別為0.822 4、0.830 2、0.838 3、0.825 1和0.813 7。
2)在不同光譜變換形式下,一階導(dǎo)數(shù)光譜總體上優(yōu)于其他光譜形式,作為輸入矢量應(yīng)用于PCR-SVR和WD-PLSR模型,全生長期數(shù)據(jù)驗證集模型R2分別為0.829 2和0.871 4,RMSE分別為0.177 9和0.154 4估測精度最高,PCR-SVR模型略優(yōu)于WD-PLSR模型。
3)三種傳統(tǒng)模型中,建模效果最優(yōu)的是主成分分析模型,全生長期驗證集模型R2為0.825 9,RMSE為0.174 0。由此可見, PCA-VCR和WD-PLCR建模效果均優(yōu)于傳統(tǒng)的建模方法的建模效果,可以較好的應(yīng)用于鮮桃樹葉綠素含量監(jiān)測研究中。
圖3 不同建模方法下葉綠素質(zhì)量分?jǐn)?shù)真實值和預(yù)測值的比較(n=60)