doi:10.3969/j.issn.1000-4440.2024.05.011
收稿日期:2023-05-31
基金項(xiàng)目:國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2017YFD1100307);貴州省科技支撐計(jì)劃項(xiàng)目;貴州省農(nóng)業(yè)科學(xué)院青年基金項(xiàng)目
作者簡介:王" 宇(1998-),女,貴州安順人,碩士研究生,主要從事農(nóng)業(yè)攝影測量方面的研究。(E-mail)2029807592@qq.com
通訊作者:肖玖軍,(E-mail)xiaojiujun0504@163.com
摘要:" 為了準(zhǔn)確監(jiān)測辣椒生長,本研究對辣椒冠層光譜反射率進(jìn)行對數(shù)處理、倒數(shù)處理、倒數(shù)的對數(shù)處理、連續(xù)統(tǒng)去除處理、一階微分處理、二階微分處理,并與SPAD值進(jìn)行相關(guān)性分析,用最大相關(guān)系數(shù)法(MCC)選取相關(guān)性較好的特征波段生成特征波段數(shù)據(jù)集,再用遺傳算法-偏最小二乘法(GAPLS)進(jìn)行降維得到最優(yōu)特征波段組合,采用偏最小二乘法(PLSR)、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、隨機(jī)森林(RF)和最小二乘支持向量機(jī)(LSSVM)4種機(jī)器學(xué)習(xí)算法構(gòu)建辣椒葉綠素含量反演模型。結(jié)果表明,最優(yōu)波段和對應(yīng)處理分別為700 nm(原始光譜)、699 nm(對數(shù)處理)、713 nm(連續(xù)統(tǒng)去除處理)、500 nm(二階微分處理)、713 nm(二階微分處理)。GAPLS的降維效果較好,與降維前相比PLSR模型的精度提升率最高,R2、RPD分別提升了82.22%、136.98%,RMSE降低了29.96%。4種模型中,GAPLS降維處理后的PLSR模型的精度最好,R2、RMSE和RPD分別為0.82、1.94、4.55。本研究構(gòu)建的MCC-GAPLS-PLSR模型具有較好的反演潛力,適用于研究區(qū)辣椒葉片葉綠素含量測定,推動辣椒高效種植。
關(guān)鍵詞:" 葉綠素含量;辣椒;高光譜;光譜變換;遺傳算法-偏最小二乘法
中圖分類號:" S127;S641.3""" 文獻(xiàn)標(biāo)識碼:" A""" 文章編號:" 1000-4440(2024)05-0865-09
Hyperspectral quantitative inversion of chlorophyll content in pepper based on MCC-GAPLS-PLSR
WANG Yu1," WANG Hong2," XIAO Jiujun3,4,5," XING Dan6," LI Kexiang3,4," ZHANG Yongliang2," YUE Yanbin7
(1.Guiyang Engineering Corporation Limited, Power China, Guiyang 550081, China;2.College of Mining, Guizhou University, Guiyang 550025, China;3.Institute of Mountain Resources, Guizhou Academy of Sciences, Guiyang 550001, China;4.Engineering Research Center for Land Green Consolidation of Guizhou, Guiyang 550001, China;5.College of Resources and Environmental Engineering, Guizhou University, Guiyang 550025, China;6.Pepper Research Institute, Guizhou Academy of Agricultural Sciences, Guiyang 550009, China;7.Institute of Agricultural Science and Technology Information, Guizhou Academy of Agricultural Sciences, Guiyang 550009, China)
Abstract:" In order to accurately monitor the growth of peppers, this study performed logarithmic treatment, reciprocal treatment, reciprocal logarithmic treatment, continuum removal treatment, first derivative treatment, second derivate treatment on the canopy spectral reflectance of peppers, and conducted correlation analysis with SPAD values. The maximum correlation coefficient method (MCC) was used to select the feature bands with good correlation to generate a feature band dataset. And the genetic algorithm-partial least squares (GAPLS) was used to reduce the dimensionality to obtain the optimal feature band combination. Pepper chlorophyll content inversion model was constructed by using four machine learning algorithms: partial least squares regression (PLSR), backpropagation neural network (BPNN), random forest (RF) and least squares support vector machine (LSSVM). The results showed that the optimal wavelengths and corresponding treatments were 700 nm (original reflectivity), 699 nm (logarithmic treatment), 713 nm (continuum removal treatment), 500 nm (second derivate treatment), 713 nm (second derivate treatment). The dimensionality reduction effect by GAPLS was good. And compared with before dimension reduction, the accuracy improvement rate of PLSR model was the highest, R2 and RPD increased by 82.22% and 136.98% respectively, and RMSE decreased by 29.96%. Among the four models, PLSR model after dimensionality reduction by GAPLS had the best accuracy, with R2, RMSE, and RPD of 0.82, 1.94, and 4.55, respectively. The MCC-GAPLS-PLSR model constructed in this study has good inversion potential and is suitable for measuring the chlorophyll content of pepper leaves in the study area, thus promoting efficient cultivation of peppers.
Key words:" chlorophyll content;pepper;hyperspectral;spectral transformation;genetic algorithm-partial least squares
葉綠素是植被進(jìn)行光合作用的主要物質(zhì),可以作為植被生長狀況的監(jiān)測指標(biāo)。監(jiān)測葉綠素含量動態(tài)變化可幫助了解植物健康、營養(yǎng)狀況和生產(chǎn)力。前人常采用化學(xué)試驗(yàn)法對葉綠素含量進(jìn)行測定,該方法費(fèi)時(shí)費(fèi)力,且在葉綠素提取過程中易造成色素?fù)p失,破壞性取樣也無法保證樣品完整性,同時(shí)該方法僅能實(shí)現(xiàn)點(diǎn)狀檢測,需達(dá)到一定樣本量后才能借助一些空間插值法擴(kuò)展為面狀尺度,離植物生長快速區(qū)域性監(jiān)測有一定距離,無法滿足精準(zhǔn)農(nóng)業(yè)要求。SPAD(Soil and plant analyzer develotrnent)-502葉綠素計(jì)被廣泛用于葉綠素含量測定,SPAD值能準(zhǔn)確表征葉綠素相對含量,可用于測量植被葉綠素含量。由于高光譜遙感技術(shù)具有連續(xù)且豐富的光譜信息,它可以更加精確地估算出植物的葉綠素含量,并且高光譜遙感技術(shù)還具有快速、無損監(jiān)測的優(yōu)勢,可以在不損害植物的前提下,對植物的長勢進(jìn)行監(jiān)測。
近年來,針對高光譜反演SPAD值展開的研究取得了一定成果,通常在對原始光譜進(jìn)行預(yù)處理后利用相關(guān)模型對植被參數(shù)進(jìn)行反演。學(xué)者們在植被指數(shù)構(gòu)建、光譜數(shù)據(jù)處理、特征波長選擇等具體方面又各有所側(cè)重。如Zheng等研究原位高光譜測量反演山地草原葉綠素含量時(shí)發(fā)現(xiàn)植被指數(shù)MSR(Modified simple ratio)、MCARI(Modified chlorophyⅡ absorption ratio index)、MCARI/OSAVI(Modified chlorophyⅡ absorption ratio index/Optimized soil-adjusted vegetation index)和TCARI(Transformed chlorophyⅡ absorption ratio index)在估計(jì)冠層葉綠素含量方面具有較高準(zhǔn)確性。Jiang等開發(fā)出三波段高光譜植被指數(shù)用于反演受不同程度病蟲害威脅的紅樹林的葉片相對葉綠素含量。依爾夏提·阿不來提等對棉花原始光譜進(jìn)行連續(xù)統(tǒng)去除、立方根轉(zhuǎn)換等處理,發(fā)現(xiàn)轉(zhuǎn)換后的光譜反射率與SPAD值相關(guān)性比原始光譜反射率高。李長春等對光譜反射率進(jìn)行分?jǐn)?shù)階微分處理,結(jié)果表明處理后的光譜反射率與冬小麥葉綠素含量的相關(guān)系數(shù)絕對值有所提升。苑迎春等提出在對顏色特征進(jìn)行篩選時(shí)采用熵權(quán)法,并利用機(jī)器學(xué)習(xí)法對小麥冠層葉綠素含量進(jìn)行反演。張佳偉等利用不同紅邊位置算法估測了玉米葉綠素含量。在模型構(gòu)建方面,線性模型法簡單,建模速度快,如多元逐步線性回歸(MSLR)、主成分回歸(PCR)、偏最小二乘回歸(PLSR)等,其中PLSR應(yīng)用最為廣泛。但線性模型無法理解多個(gè)變量之間的相互作用,不能很好地?cái)M合非線性數(shù)據(jù)?,F(xiàn)階段大量的非線性數(shù)據(jù)挖掘技術(shù)如人工神經(jīng)網(wǎng)絡(luò)(ANN)、隨機(jī)森林(RF)、后向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)被廣泛應(yīng)用于遙感反演建模中。采用聯(lián)合回歸方法建立葉綠素含量混合反演模型的研究也有零星報(bào)道。總體上多以單種光譜預(yù)處理后再經(jīng)過特征波段選擇來直接回歸建?;驑?gòu)建植被指數(shù)間接回歸建模。
目前作物葉綠素含量反演研究對象多為玉米、高梁、大麥等糧食作物,對經(jīng)濟(jì)作物研究較少,鮮見有對辣椒的高光譜反演研究。辣椒是重要的蔬菜作物,構(gòu)建辣椒葉綠素含量反演模型對監(jiān)測辣椒生長速度、智慧化種植、提升辣椒果實(shí)品質(zhì)具有重要意義。本研究對辣椒冠層高光譜數(shù)據(jù)進(jìn)行多種方法預(yù)處理,各預(yù)處理方法的特征波段提取采用最大相關(guān)系數(shù)法(MCC,Maximum correlation coefficient),組成特征波段數(shù)據(jù)集,再利用遺傳算法-偏最小二乘法(GAPLS)對特征波段數(shù)據(jù)集進(jìn)行變量選擇,將選擇的波段作為自變量輸入偏最小二乘法回歸(PLSR)、最小二乘支持向量機(jī)(LSSVM)、后向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)和隨機(jī)森林(RF)4個(gè)機(jī)器學(xué)習(xí)模型中構(gòu)建辣椒葉綠素含量反演模型,并對模型精度進(jìn)行驗(yàn)證,優(yōu)選最佳反演模型,探討辣椒葉綠素含量高光譜反演方法,以期提高辣椒葉綠素含量反演模型的反演能力,推動辣椒高效、綠色種植。
1" 材料與方法
1.1" 研究區(qū)概況與試驗(yàn)設(shè)計(jì)
研究區(qū)位于貴州省遵義市辣椒研究基地(107°2′27″E,27°44′5″N)(圖1),屬亞熱帶季風(fēng)氣候,年平均降水量1 200 mm,日照充足,其氣候、土壤等自然條件十分適合辣椒栽培。
2021年4-10月在研究區(qū)對各辣椒品種進(jìn)行不同施肥處理。選用貴州主栽辣椒的線椒和朝天椒,線椒品種為黔椒8號和紅辣18號,朝天椒品種為辣研101號和紅全球,共4個(gè)品種。每個(gè)辣椒品種都以0 kg/hm2、200 kg/hm2、350 kg/hm2、500 kg/hm2 4個(gè)施氮量進(jìn)行處理, 3次重復(fù)。共計(jì)48個(gè)試驗(yàn)區(qū),每個(gè)試驗(yàn)區(qū)長6 m,寬5 m。分別于播種期和開花期施肥,播種期和開花期施肥量相等。在最能反映辣椒生長狀況、決定辣椒產(chǎn)量與品質(zhì)的盛花期、盛果期采集試驗(yàn)數(shù)據(jù)。
1.2" 光譜反射率和葉綠素含量測定方法
1.2.1" 光譜反射率測定" 利用美國 ASD公司制造的FieldSpec4 Standard-Res便攜式地物光譜儀,在350~2 500 nm波段測量辣椒冠層的反射率,采樣間隔為1 nm。在10:00~15:00對高光譜數(shù)據(jù)進(jìn)行測量,測量當(dāng)天為晴天,無風(fēng),無云。在測量過程中,傳感器探頭垂直于地面,并且與辣椒植株頂部的高度距離為30 cm,視場角25°。每隔5株植株進(jìn)行1次標(biāo)準(zhǔn)白板校正,每株植株重復(fù)測量5次,該植株最終光譜反射率為測量數(shù)據(jù)的平均值。在高光譜波段范圍內(nèi),可見光和近紅外波段為葉綠素的主要響應(yīng)波段,所以將研究光譜區(qū)域定為400~1 000 nm。
1.2.2" 葉綠素含量測定" 本研究用SPAD值表征辣椒葉綠素含量。葉綠素含量采用SPAD-502 Plus葉綠素儀進(jìn)行測定,與高光譜測量同步。每株辣椒測定15~20片辣椒冠層葉片葉綠素含量,測定時(shí)對每片葉片上、中、下部測定6~10次,取平均值作為辣椒葉綠素含量,測定時(shí)避開葉脈。
1.3" 數(shù)據(jù)處理方法
1.3.1" 異常值處理" 用3倍標(biāo)準(zhǔn)差法檢查SPAD數(shù)據(jù)集異常樣本,剔除均值-3倍標(biāo)準(zhǔn)差以及均值+3倍標(biāo)準(zhǔn)差之外的數(shù)據(jù),對剔除后的SPAD數(shù)據(jù)集再次用3倍標(biāo)準(zhǔn)差法檢查,如此反復(fù),直至無異常樣本。用主成分分析法檢測光譜數(shù)據(jù),在主成分分布圖中,95%置信橢圓之外的點(diǎn)被認(rèn)為是異常樣本,予以剔除,經(jīng)多次反復(fù)檢測,直至無異常樣本。最后得到光譜數(shù)據(jù)和SPAD數(shù)據(jù)對,共80對。
1.3.2" 光譜預(yù)處理" 對光譜數(shù)據(jù)進(jìn)行Svitzky-Golay平滑處理,對反射率進(jìn)行降噪處理,以此曲線為基礎(chǔ)再進(jìn)行光譜變換。光譜變換方法為連續(xù)統(tǒng)去除、對數(shù)、倒數(shù)的對數(shù)、一階微分、倒數(shù)和二階微分處理,以不變換光譜為對照。Svitzky-Golay卷積平滑利用Origin運(yùn)算,光譜變換利用Matlab運(yùn)算。
1.3.3" 特征變量選擇" (1)最大相關(guān)系數(shù)法(MCC)。Pearson相關(guān)性系數(shù)可用來度量變量X和變量Y之間的相關(guān)性,取值為。通過MCC可以一定程度上減少光譜數(shù)據(jù)的冗余信息,從而篩選特征波段。將從各光譜變換中篩選出的特征變量進(jìn)行組合,形成特征波段數(shù)據(jù)集。(2)遺傳算法-偏最小二乘法(GAPLS)。特征波段對于構(gòu)建模型至關(guān)重要。偏最小二乘法擅于處理小樣本數(shù)據(jù),可降低特征維數(shù),使低維數(shù)據(jù)更具解釋性,從而獲得更好的識別精度。GAPLS不僅具有遺傳算法的全局優(yōu)化搜索能力,還能利用偏最小二乘法對特征波段進(jìn)行篩選。其基本思路是將偏最小二乘法中交叉均方根RMSECV作為遺傳算法中的適應(yīng)度函數(shù),用遺傳算法進(jìn)行變量篩選,提取特征參數(shù)。本研究控制參數(shù)為:規(guī)模30,種群規(guī)模大小視樣本個(gè)數(shù)決定,最大迭代次數(shù)120,交叉概率50%,變異概率1%,收斂終止條件由迭代次數(shù)決定。對特征波段數(shù)據(jù)集執(zhí)行10次GAPLS運(yùn)算,根據(jù)貢獻(xiàn)率高、RMSECV值小的原則提取特征波段,組成特征波段組合。
1.4" 模型構(gòu)建方法
為了保證模型構(gòu)造與反演的穩(wěn)定性與魯棒性,本研究采用Kennard-Stone方法,選取75%的數(shù)據(jù)進(jìn)行建模,25%的數(shù)據(jù)進(jìn)行驗(yàn)證。分別利用偏最小二乘回歸(PLSR)、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、隨機(jī)森林(RF)和最小二乘支持向量機(jī)(LSSVM)4種機(jī)器學(xué)習(xí)算法構(gòu)建辣椒葉綠素含量反演模型,并對模型精度進(jìn)行驗(yàn)證。(1)偏最小二乘回歸(PLSR)。PLSR不僅可以有效解決多重線性模型帶來的問題,還可以解決諸如主成分分析等分析方法能解決的問題,進(jìn)而提供更加深入、有用的信息。(2)隨機(jī)森林(RF)。RF可以對數(shù)據(jù)進(jìn)行分類和回歸,它將問題劃分成多棵樹進(jìn)行解決,從根源上提高模型的準(zhǔn)確性,規(guī)避擬合現(xiàn)象,主要原理是集成學(xué)習(xí)思想。其參數(shù)設(shè)置:決策樹數(shù)為200,方法為回歸,每個(gè)樹葉的最小觀察數(shù)為3。(3)反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)。BPNN屬于非線性模型,具有很好的監(jiān)督學(xué)習(xí)功能,被廣泛應(yīng)用到測繪遙感領(lǐng)域中,其參數(shù)設(shè)置:迭代次數(shù)1 000次,誤差1×10-5,學(xué)習(xí)率0.05,附加動量因子0.9,最小性能梯度1×10-5,最大失敗次數(shù)3。(4)最小二乘支持向量機(jī)(LSSVM)。LSSVM將經(jīng)典SVM中的不等式限制轉(zhuǎn)化為等式限制,并通過求解一系列線性方程組來實(shí)現(xiàn),從而提高了SVM運(yùn)行效率,可以處理線性和非線性多元變量建模問題,還可以解決多元變量的復(fù)雜性問題。
1.5" 模型參數(shù)驗(yàn)證方法
用決定系數(shù)(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)對高光譜信息和葉綠素含量進(jìn)行評估。采用Chang等提出的RPD評判等級,即當(dāng)RPD<1.4時(shí),模型將不能對數(shù)據(jù)進(jìn)行預(yù)測;當(dāng)1.4<RPD<2.0時(shí),模型可較好地對數(shù)據(jù)進(jìn)行預(yù)測;而當(dāng)RPD>2.0時(shí),模型可以非常好地對數(shù)據(jù)進(jìn)行預(yù)測。當(dāng)R2越接近1,RPD值越大,RMSE值越接近0,模型預(yù)測結(jié)果越接近真實(shí)值。
R2=n1(yi^-y-)2(yi-y-)2(1)
RMSE=n1(yi^-y-)2n(2)
RPD=SD/RMSE(3)
式中,n為樣本數(shù),yi^為反演值,yi為實(shí)測值,y-為平均值,SD為yi^的標(biāo)準(zhǔn)差。
2" 結(jié)果與分析
2.1" 最大相關(guān)系數(shù)法生成特征波段數(shù)據(jù)集
相關(guān)系數(shù)被廣泛用于度量變量間線性相關(guān)的強(qiáng)弱程度。將原始光譜的反射率和經(jīng)處理后的反射率與SPAD值進(jìn)行Pearson相關(guān)性分析(圖2)。由圖2A可見,辣椒原始光譜反射率與SPAD值在可見光421~726 nm波段呈極顯著負(fù)相關(guān)(P<0.01),在近紅外波段(780~1 000 nm)相關(guān)性不顯著,相關(guān)性最高的波長是572 nm和700 nm,相關(guān)系數(shù)分別為-0.717和-0.691。
對數(shù)處理(LR)、倒數(shù)處理(IR)和倒數(shù)的對數(shù)處理(RL)因光照條件對光譜產(chǎn)生的乘性因素降低,可見光區(qū)光譜差異放大。由圖2B~圖2D可知,相對于原始光譜反射率,對數(shù)處理、倒數(shù)處理和倒數(shù)的對數(shù)處理僅改變了反射率與SPAD值相關(guān)系數(shù)大小及正負(fù)相關(guān)性,特征波段僅相差1~2 nm,并沒有突出其他特征波段。在429~725 nm波段,對數(shù)處理后的反射率與SPAD值呈極顯著負(fù)相關(guān)(P<0.01),相關(guān)性最好的波長是573 nm和700 nm,相關(guān)系數(shù)分別為-0.658和-0.675。在446~724 nm波段,倒數(shù)處理后的反射率和SPAD值呈極顯著正相關(guān)(P<0.01),相關(guān)性最好的波長是571 nm和700 nm,相關(guān)系數(shù)分別為0.606和0.619。在428~726 nm波段,倒數(shù)的對數(shù)處理后的反射率和SPAD值呈極顯著正相關(guān)(P<0.01),相關(guān)性最好的波長是572 nm和699 nm,相關(guān)系數(shù)分別為0.686和0.712。
連續(xù)統(tǒng)去除處理可削弱背景噪聲,并放大弱吸收特征信息。由圖2E可知,在520~748 nm波段,連續(xù)統(tǒng)去除處理后的反射率與葉綠素含量呈顯著負(fù)相關(guān)(P<0.01),相關(guān)性最好的波長是632 nm和713 nm,相關(guān)系數(shù)分別為-0.478和-0.741。
微分處理可提升光譜反射率與樣品之間的敏感度,其中,一階微分處理主要解決的是線性雜聲帶來的影響問題,二階微分處理主要解決的是土壤、其他植被等背景帶來的影響問題,提高分析精度,這2種微分處理是近紅外常用的光譜預(yù)處理方法。從圖2F可見,在400~421 nm、435~554 nm、677~704 nm波段一階微分處理后的反射率和SPAD值呈極顯著負(fù)相關(guān)(P<0.01),相關(guān)性最好的波長為500 nm和688 nm,其對應(yīng)的相關(guān)系數(shù)值分別為-0.789和-0.791,在563~621 nm、633~672 nm、716~758 nm波段一階微分處理后的反射率和SPAD值呈極顯著正相關(guān)(P<0.01),相關(guān)性最好的波長為644 nm和662 nm,其對應(yīng)的相關(guān)系數(shù)值分別為0.718和0.716。在483~541nm、573~580 nm、616~625 nm、643~651 nm、662~692nm、736~752 nm波段,二階微分處理后的反射率和SPAD值呈極顯著負(fù)相關(guān)(P<0.01),相關(guān)性最好的波段為500 nm和647 nm,其對應(yīng)的相關(guān)系數(shù)值分別為-0.721和-0.832;在518~568 nm、626~640 nm、654~659 nm、696~714 nm波段,二階微分處理后的反射率和SPAD值呈極顯著正相關(guān)(P<0.01),相關(guān)性最好的波長為632 nm和702 nm,其對應(yīng)的相關(guān)系數(shù)值分別為0.819和0.845。
經(jīng)過MCC降維處理,7種光譜數(shù)據(jù)由4 027個(gè)特征變量減少到18個(gè),并由這18個(gè)特征變量組成特征波段數(shù)據(jù)集。
2.2" GAPLS選擇變量生成最優(yōu)特征波段組合
用GAPLS算法對MCC生成的特征波段數(shù)據(jù)集進(jìn)一步篩選,進(jìn)而建立更加穩(wěn)定、反演能力更強(qiáng)的模型。由表1和表2可見,當(dāng)變量選擇數(shù)為1、2時(shí),交叉驗(yàn)證均方根誤差(RMSECV)在0.2以上,誤差較大,當(dāng)變量選擇數(shù)>2,RMSECV降至0.08左右。根據(jù)貢獻(xiàn)率高、RMSECV小的篩選原則選擇特征波段,當(dāng)變量選擇數(shù)為5,可獲得最高貢獻(xiàn)率(99.34%),最低RMSECV(0.081 0),故選出第10、8、2、15、18波段作為最優(yōu)特征波段組合,最優(yōu)波段和對應(yīng)處理分別為700 nm(原始光譜)、699 nm(對數(shù)處理)、713 nm(連續(xù)統(tǒng)去除處理)、500 nm(二階微分處理)、713 nm(二階微分處理)。
2.3" 回歸建模與評價(jià)
將MCC生成的特征波段數(shù)據(jù)集作為自變量輸入到4種機(jī)器學(xué)習(xí)回歸模型中,驗(yàn)證集精度評價(jià)結(jié)果如表3所示,根據(jù)評價(jià)指標(biāo)R2排序,4種模型的精度由高到低為LSSVM>RF>BPNN>PLSR;根據(jù)評價(jià)指標(biāo)RMSE排序,4種模型的精度由高到低為PLSR>LSSVM>RF>BPNN;根據(jù)評價(jià)指標(biāo)RPD排序,4種模型的精度由高到低為PLSR>BPNN>RF>LSSVM。綜合以上結(jié)果可以看出,線性模型優(yōu)于非線性模型,三個(gè)非線性模型精度各異。
PLSR:偏最小二乘法回歸;LSSVM:最小二乘支持向量機(jī);BPNN:后向傳播神經(jīng)網(wǎng)絡(luò);RF:隨機(jī)森林。R2:決定系數(shù);RMSE:均方根誤差;RPD:相對分析誤差。
將經(jīng)過GAPLS降維處理后得到的最優(yōu)特征波段組合作為自變量也輸入4種機(jī)器學(xué)習(xí)回歸模型中,同樣用60個(gè)校正樣本進(jìn)行模型構(gòu)建,20個(gè)驗(yàn)證樣本進(jìn)行模型驗(yàn)證,其精度評價(jià)結(jié)果如表4所示。4種回歸模型R2均大于0.7,4個(gè)模型反演值和實(shí)測值間均極顯著相關(guān)(P<0.01)。GAPLS降維處理后的PLSR模型的RMSE最小,為1.94,其余3種模型的RMSE在4以上。4種模型的RPD均大于1.4,均可對葉綠素含量進(jìn)行粗略反演。GAPLS降維處理后的PLSR模型的RPD最高,在2以上,達(dá)到了4.55,表明該模型具有較好的反演能力。
根據(jù)R2值越接近1、RMSE值越小、RPD值越大模型越好的原則,通過對不同模型的反演值和實(shí)測值進(jìn)行擬合(圖3),可以看出,4種模型均能很好反演辣椒葉綠素含量。PLSR模型反演效果最好,曲線斜率為0.913 9,最接近1,其次是BPNN模型,斜率達(dá)到1.127 2。綜上分析,GAPLS降維處理后的PLSR模型最優(yōu),其R2為0.82,RMSE為1.94,RPD為4.55,對辣椒葉綠素含量反演效果最佳。
PLSR:偏最小二乘法回歸;LSSVM:最小二乘支持向量機(jī);BPNN:后向傳播神經(jīng)網(wǎng)絡(luò);RF:隨機(jī)森林。R2:決定系數(shù);RMSE:均方根誤差;RPD:相對分析誤差。
PLSR:偏最小二乘法回歸;LSSVM:最小二乘支持向量機(jī);BPNN:后向傳播神經(jīng)網(wǎng)絡(luò);RF:隨機(jī)森林。R2:決定系數(shù);RMSE:均方根誤差;RPD:相對分析誤差。
GAPLS降維處理前后對比可見(圖4),GAPLS降維處理后模型精度普遍比未經(jīng)GAPLS降維處理升高,說明GAPLS處理達(dá)到了進(jìn)一步降低MCC生成的特征波段數(shù)據(jù)集維數(shù)的效果。同時(shí)不同模型精度提升情況存在差異,精度提升率最高的是GAPLS降維處理后的PLSR模型,其次是GAPLS降維處理后的BPNN模型。
PLSR:偏最小二乘法回歸;LSSVM:最小二乘支持向量機(jī);BPNN:后向傳播神經(jīng)網(wǎng)絡(luò);RF:隨機(jī)森林。R2:決定系數(shù);RMSE:均方根誤差;RPD:相對分析誤差。
3" 討論
為了提高光譜數(shù)據(jù)與葉綠素含量的相關(guān)性,減少噪聲等環(huán)境的影響,本研究對辣椒冠層光譜反射率數(shù)據(jù)進(jìn)行連續(xù)統(tǒng)去除等6種數(shù)學(xué)變換處理,并在此基礎(chǔ)上用最大相關(guān)系數(shù)法篩選出18個(gè)特征波段,這些對辣椒葉綠素含量敏感的波段多位于500 nm、570 nm、640 nm、700 nm處,與大多數(shù)綠色植物特征波段一致,方慧等指出葉綠素響應(yīng)光譜主要集中在紅邊位置(波段為700 nm左右)及綠峰位置(波段為500~600 nm)。在6種數(shù)學(xué)變換處理中,微分處理后的反射率與SPAD值相關(guān)性最強(qiáng),在702 nm處相關(guān)性系數(shù)達(dá)到最大值0.845,這可能是由于辣椒沒有封行現(xiàn)象,葉片空隙較大,辣椒栽培時(shí)的薄膜和土壤會產(chǎn)生較大背景噪聲而影響光譜反射率,而微分處理能夠較好地消除這些噪聲。對數(shù)、倒數(shù)和倒數(shù)的對數(shù)處理后的特征波段與原始光譜的特征波段位置大致不變,這可能是3種變換的主要作用是降低光照影響因素,放大光譜差異,而本試驗(yàn)在測量辣椒光譜反射率過程中受光照條件因素影響不大。
特征光譜數(shù)據(jù)集經(jīng)GAPLS算法降維處理后,4種機(jī)器學(xué)習(xí)回歸模型的精度均有所提升,這主要是因?yàn)镚APLS算法改進(jìn)了全局優(yōu)化搜索能力,同時(shí)降低了特征維數(shù),使低維數(shù)據(jù)更具解釋性,從而獲得更好的識別精度,不僅避免了光譜數(shù)據(jù)局部最優(yōu)問題,還能解決光譜數(shù)據(jù)多重共線性問題,更利于搭建一個(gè)穩(wěn)定、精度高的模型。
PLSR、RF、LSSVM、BPNN模型的R2、RMSE、RPD均表現(xiàn)出較好的預(yù)測精度,故4個(gè)模型都具有較好的反演能力,其中PLSR模型的反演精度最好,遠(yuǎn)高于其他3種模型,可能是由于經(jīng)過GAPLS處理后的最優(yōu)特征波段數(shù)量減少,且已較大程度消除了共線性、數(shù)據(jù)噪聲等問題,故由2個(gè)變量構(gòu)建的線性回歸模型表現(xiàn)出較好的反演能力,在高維數(shù)據(jù)、高變量時(shí)表現(xiàn)更加突出,孔鈺如等研究結(jié)果進(jìn)一步證實(shí)了該結(jié)論。而非線性模型中的BPNN模型也具有較好的反演效果,這可能是由于辣椒葉綠素含量與最優(yōu)特征波段組合間除了線性關(guān)系之外,還有一定的非線性關(guān)系,值得后續(xù)進(jìn)一步研究。
4" 結(jié)論
本研究以西南地區(qū)盛花、盛果期辣椒冠層葉片為研究對象,對原始光譜反射率進(jìn)行數(shù)學(xué)變換處理,并與辣椒SPAD值進(jìn)行相關(guān)性分析,采用MCC、GAPLS算法對特征波段數(shù)據(jù)集進(jìn)行降維,獲取最優(yōu)波段組合,從而建立辣椒葉綠素含量反演模型,并對各模型的精度進(jìn)行比較,得到如下結(jié)論:(1)辣椒葉片葉綠素的敏感波段主要分布在紅光區(qū)域和綠光區(qū)域,最優(yōu)波段和對應(yīng)處理分別為700 nm(原始光譜)、699 nm(對數(shù)處理)、713 nm(連續(xù)統(tǒng)去除處理)、500 nm(二階微分處理)、713 nm(二階微分處理)。(2)GAPLS對特征波段數(shù)據(jù)集的降維處理效果較為明顯,各機(jī)器學(xué)習(xí)回歸模型精度均呈現(xiàn)不同程度的提升,其中PLSR提升效果最突出,R2、RPD分別提升了0.37、0.83,RMSE降低了2.63。(3)4種機(jī)器學(xué)習(xí)回歸模型中,PLSR模型的精度最好,由MCC-GAPLS-PLSR構(gòu)建的辣椒葉綠素含量反演模型具有較好的反演潛力。
參考文獻(xiàn):
王" 雪,吉海彥. 基于便攜式光譜儀和反射、透射光譜技術(shù)的小麥葉片葉綠素定量分析研究. 中國農(nóng)學(xué)通報(bào),2011,27(21):39-43.
ZHENG F L, XU B, XIAO P F, et al. Estimation of chlorophyll content in mountain steppe using in situ hyperspectral measurements. Spectroscopy Letters,2021,54(7):495-506.
JANG S H, HWANG Y K, LEE H J, et al. Selecting significant wavelengths to predict chlorophyⅡ content of grafted cucumber seedlings using hyperspectral images. Korean Journal of Remote Sensing,2018,34(4):681-692.
GUO Y H, CHEN S Z, LI X X, et al. Machine learning-based approaches for predicting SPAD values of maize using multi-spectral images. Remote Sensing,2022,14(6):1337.
陳" 瀾,常慶瑞,高一帆,等. 獼猴桃葉片葉綠素含量高光譜反演模型研究. 西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,48(6):79-89,98.
徐若涵,楊再強(qiáng),申夢吟,等. 苗期低溫脅迫對“紅顏”草莓葉綠素含量及冠層高光譜的影響. 中國農(nóng)業(yè)氣象,2022,43(2):148-158.
李長春,施錦錦,馬春艷,等. 基于小波變換和分?jǐn)?shù)階微分的冬小麥葉綠素含量反演. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2021,52(8):172-182.
JIANG X P, ZHEN J N, MIAO J, et al. Newly-developed three-band hyperspectral vegetation index for estimating leaf relative chlorophyll content of mangrove under different severities of pest and disease. Ecological Indicators,2022,140:108978.
依爾夏提·阿不來提,買買提·沙吾提,白燈莎·買買提艾力,等. 基于隨機(jī)森林法的棉花葉片葉綠素含量反演. 作物學(xué)報(bào),2019,45(1):81-90.
李長春,施錦錦,馬春艷,等. 基于小波變換和分?jǐn)?shù)階微分的冬小麥葉綠素含量反演. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2021,52(8):172-182.
苑迎春,周" 毅,宋宇斐,等. 基于信息熵特征選擇的小麥冠層葉綠素含量估測方法. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(8):186-195.
張佳偉,王仲林,譚先明,等. 利用不同紅邊位置算法估測玉米葉綠素含量. 浙江大學(xué)學(xué)報(bào)(農(nóng)業(yè)與生命科學(xué)版),2021,47(4):464-472.
劉" 濤,張" 寰,王志業(yè),等. 利用無人機(jī)多光譜反演小麥葉面積指數(shù)和葉綠素含量. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(19):65-72.
CANDIANI G, TAGLIABUE G, PANIGADA C, et al. Evaluation of hybrid models to estimate chlorophyⅡand nitrogen content of maize crops in the framework of the future CHIME mission. Remote Sensing,2022,14(8):1792.
王芳東,嚴(yán)志雁,趙小敏,等. 油茶葉片葉綠素含量高光譜估測的偏最小二乘模型參數(shù)選擇. 江西農(nóng)業(yè)大學(xué)學(xué)報(bào),2022,44(1):86-96.
NAU J, PROKOPOV J, RˇEBCˇEK J, et al. SPAD chlorophyⅡ meter reading can be pronouncedly affected by chloroplast movement. Photosynthesis Research,2010,105(3):265-271.
付波霖,鄧良超,張" 麗,等. 聯(lián)合星載高光譜影像和堆棧集成學(xué)習(xí)回歸算法的紅樹林冠層葉綠素含量遙感反演. 遙感學(xué)報(bào),2022,26(6):1182-1205.
李" 勝,張培林,李" 兵,等. 量子GA-PLS特征選擇算法及其應(yīng)用. 量子電子學(xué)報(bào),2014,31(2):194-201.
JIA W K, ZHAO D A, DING L. An optimized RBF neural network algorithm based on partial least squares and genetic algorithm for classification of small sample. Applied Soft Computing,2016,48:373-384.
SONG K S, LI L, LI S, et al. Hyperspectral retrieval of phycocyanin in potable water sources using genetic algorithm-partial least squares (GA-PLS) modeling. International Journal of Applied Earth Observation and Geoinformation,2012,18:368-385.
紀(jì)文君. 基于野外vis-NIR高光譜的土壤屬性反演及田間水分影響去除研究. 杭州:浙江大學(xué),2014.
彭曉偉,張愛軍,楊曉楠,等. 谷子葉綠素含量高光譜特征分析及其反演模型構(gòu)建. 干旱地區(qū)農(nóng)業(yè)研究,2022,40(2):69-77.
ZHOU W, YANG H, XIE L J, et al. Hyperspectral inversion of soil heavy metals in Three-River Source Region based on random forest model. CATENA,2021,202:105222.
郭云開,許" 敏,張曉炯,等. 結(jié)合PRO-4SAIL和BP神經(jīng)網(wǎng)絡(luò)的葉綠素含量高光譜反演. 測繪通報(bào),2020 (3):21-24.
SHAO Y H, LI C N, HUANG L W, et al. Joint sample and feature selection via sparse primal and dual LSSVM. Knowledge-Based Systems,2019,185:104915.
CHANG C W, LAIRD D A, MAUSBACH M J, et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties. Soil Science Society of America Journal,2001,65(2):480-490.
SERRANO L, PEUELAS J, USTIN S L. Remote sensing of nitrogen and lignin in Mediterranean vegetation from AVIRIS data:Decomposing biochemical from structural signals. Remote Sensing of Environment,2002,81(2):355-364.
李嵐?jié)?,汪善勤,? 濤,等. 基于高光譜的冬油菜葉片磷含量診斷模型. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(14):209-218.
郭超凡,郭逍宇. 基于可見光波段包絡(luò)線去除的濕地植物葉片葉綠素反演. 生態(tài)學(xué)報(bào),2016,36(20):6538-6546.
李敏夏,張林森,李丙智,等. 蘋果葉片高光譜特性與葉綠素含量和SPAD值的關(guān)系. 西北林學(xué)院學(xué)報(bào),2010,25(2):35-39.
羅" 靖,楊再強(qiáng),楊" 立,等. 基于高光譜參數(shù)建立苗期高溫條件下草莓葉片葉綠素含量反演模型. 中國農(nóng)業(yè)氣象,2022,43(10):832-845.
方" 慧,宋海燕,曹" 芳,等. 油菜葉片的光譜特征與葉綠素含量之間的關(guān)系研究. 光譜學(xué)與光譜分析,2007,27(9):1731-1734.
蔡建楠,劉海龍,姜" 波,等. 基于GA-PLS算法的河網(wǎng)水體化學(xué)需氧量高光譜反演. 灌溉排水學(xué)報(bào),2020,39(9):126-131.
WANG C, FENG M C, YANG W D, et al. Extraction of sensitive bands for monitoring the winter wheat (Triticum aestivum) growth status and yields based on the spectral reflectance. PLoS One,2017,12(1):e167679.
孔鈺如,王李娟,馮海寬,等. 無人機(jī)高光譜波段選擇的葉面積指數(shù)反演. 光譜學(xué)與光譜分析,2022,42(3):933-939.
(責(zé)任編輯:成紓寒)