收稿日期:2024-10-10
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(41701398、42071240)
作者簡(jiǎn)介:唐國(guó)強(qiáng)(2000-),男,湖南衡陽(yáng)人,碩士研究生,主要從事土地資源與空間信息技術(shù)研究。(E-mail)1813377325@qq.com
通訊作者:劉夢(mèng)云,(E-mail)lmy471993@163.com
摘要: 葉片葉綠素含量是表征植被生長(zhǎng)狀態(tài)的重要生理生化參數(shù),傳統(tǒng)的葉綠素含量測(cè)定方法操作復(fù)雜且會(huì)破壞葉片組織結(jié)構(gòu),對(duì)植物造成不可逆的損傷。通過(guò)構(gòu)建高精度葉綠素反演模型,可以實(shí)現(xiàn)對(duì)獼猴桃葉片葉綠素含量的實(shí)時(shí)無(wú)損監(jiān)測(cè)。本研究采集了獼猴桃冠層的高光譜數(shù)據(jù),并同步測(cè)定了葉片葉綠素相對(duì)含量(SPAD值)。通過(guò)對(duì)原始光譜進(jìn)行分?jǐn)?shù)階微分變換(階數(shù)為0~2,步長(zhǎng)為0.2),結(jié)合競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣算法(CARS)篩選得到敏感波段。分別基于原始波段和敏感波段訓(xùn)練隨機(jī)森林模型(RF)、支持向量機(jī)模型(SVR)和極限學(xué)習(xí)機(jī)模型(ELM)。結(jié)果表明,分?jǐn)?shù)階微分變換顯著提高了光譜反射率與獼猴桃葉片葉綠素含量的相關(guān)性,CARS算法提升了模型精度。光譜反射率經(jīng)過(guò)1.8階微分處理后,采用CARS算法篩選出敏感波段,利用這些敏感波段訓(xùn)練隨機(jī)森林模型,取得了最佳效果。訓(xùn)練后的隨機(jī)森林模型在驗(yàn)證集上決定系數(shù)(R2)達(dá)到0.93,均方根誤差(RMSE)為2.56,相對(duì)分析誤差(RPD)為3.89。該研究結(jié)果可為獼猴桃葉片葉綠素含量的高精度估算提供理論依據(jù)和技術(shù)參考,對(duì)獼猴桃生長(zhǎng)監(jiān)測(cè)和精準(zhǔn)農(nóng)業(yè)管理具有重要意義。
關(guān)鍵詞: 獼猴桃;葉綠素含量;高光譜;分?jǐn)?shù)階微分變換;競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣
中圖分類號(hào): S663.4"" 文獻(xiàn)標(biāo)識(shí)碼: A"" 文章編號(hào): 1000-4440(2025)02-0335-10
Estimation of kiwifruit leaf chlorophyll content based on fractional-order differential processing
TANG Guoqiang, LIU Mengyun, JIANG Danyao, SONG Zhenghua, CHANG Qingrui
(College of Natural Resources and Environment, Northwest Aamp;F University, Yangling 712100, China)
Abstract:" The leaf chlorophyll content is an important physiological and biochemical parameter for characterizing the growth status of vegetation. Traditional methods for measuring chlorophyll content are cumbersome and destructive to leaf tissue, causing irreversible damage to plants. By constructing high-precision chlorophyll inversion models, real-time, non-destructive monitoring of chlorophyll content in kiwifruit leaves can be achieved. In this study, high-spectral data of the kiwifruit canopy were collected, and the relative chlorophyll content (SPAD) of the leaves was measured synchronously. The original spectra were subjected to fractional-order differential transformation (with orders ranging from 0 to 2 at a step size of 0.2). Subsequently, the competitive adaptive reweighted sampling algorithm (CARS) was used to identify the sensitive bands. Random forest (RF), support vector machine (SVR), and extreme learning machine (ELM) models were trained based on both the original bands and the sensitive bands. The results showed that the fractional-order differential transformation significantly enhanced the correlation between spectral reflectance and chlorophyll content in kiwifruit leaves, and the CARS algorithm improved model accuracy. After the spectral reflectance was processed by the 1.8th order differential, the sensitive bands were screened out by the CARS algorithm, and the random forest model trained using these sensitive bands achieved the best performance. The trained RF model had a determination coefficient (R2) of 0.93, a root mean square error (RMSE) of 2.56, and a relative percent deviation (RPD) of 3.89 on the validation set. The results of this study can provide a theoretical basis and technical reference for the high-precision estimation of chlorophyll content in kiwifruit leaves and are of great significance for kiwifruit growth monitoring and precision agricultural management.
Key words: kiwifruit;chlorophyll content;hyperspectral;fractional order differential transformations;competitive adaptive reweighted sampling
葉片葉綠素含量(LCC)是表征植被生長(zhǎng)狀態(tài)的重要生理生化參數(shù),該參數(shù)可以反映植被生長(zhǎng)階段和營(yíng)養(yǎng)狀態(tài)[1]。傳統(tǒng)的葉綠素含量測(cè)定方法存在操作復(fù)雜、耗時(shí)、費(fèi)力等問(wèn)題,而且會(huì)破壞葉片組織結(jié)構(gòu),對(duì)植物造成不可逆的損傷[2]。相比之下,使用葉綠素儀能夠高效、無(wú)損、準(zhǔn)確地表征葉綠素相對(duì)含量[3]。中國(guó)獼猴桃種植面積在全球排第一,同時(shí)也是主要的獼猴桃出口國(guó)[4]。陜西地區(qū)依托秦嶺山脈獨(dú)特的地理優(yōu)勢(shì),所產(chǎn)獼猴桃果實(shí)大、糖分高、營(yíng)養(yǎng)豐富,已成為中國(guó)獼猴桃的主要生產(chǎn)地。因此,建立快速、高效的獼猴桃葉片葉綠素含量監(jiān)測(cè)方法具有重要意義。
高光譜遙感技術(shù)憑借其快速、高效和無(wú)損檢測(cè)的優(yōu)勢(shì),被廣泛用于植物葉片葉綠素含量的估測(cè)[5]。研究結(jié)果表明,作物光譜反射率與葉片葉綠素含量之間存在顯著相關(guān)性。在玉米的4個(gè)關(guān)鍵生長(zhǎng)階段,基于機(jī)器學(xué)習(xí)的LCC-MR模型能夠準(zhǔn)確反映葉綠素含量與光譜反射率之間的關(guān)系,表現(xiàn)出較高的整體準(zhǔn)確性[6]。王宇等[7]發(fā)現(xiàn),MCC-GAPLS-PLSR模型在利用光譜數(shù)據(jù)反演葉綠素含量方面表現(xiàn)出了較強(qiáng)的能力。Song等[8]發(fā)現(xiàn),結(jié)合高光譜圖像中提取到的光譜信息和紋理信息,能夠提升模型對(duì)感染花葉病蘋果葉片葉綠素含量的檢測(cè)精度;李紫琴等[9]利用高光譜技術(shù)實(shí)現(xiàn)對(duì)不同施氮水平下棉花葉綠素含量的快速無(wú)損檢測(cè);Niu等[10]采用分?jǐn)?shù)階微分處理高光譜數(shù)據(jù),通過(guò)分析葉綠素敏感波段,構(gòu)建了典型植被指數(shù),并建立了高精度模型以尋找葉綠素含量與光譜反射率之間的關(guān)聯(lián)性。阿熱孜古力·肉孜等[11]采用了一系列光譜處理方法(對(duì)數(shù)變換、平方根變換、包絡(luò)線去除、分?jǐn)?shù)階微分變換、小波變換)和多植被指數(shù)相結(jié)合的方法,構(gòu)建了基于鯨魚優(yōu)化算法的隨機(jī)森林模型,用于定量反演葉綠素含量?,F(xiàn)有葉綠素含量無(wú)損檢測(cè)方法多采用單一模型,容易出現(xiàn)反演精度不足和模型泛化能力差等問(wèn)題[12]。傳統(tǒng)機(jī)器學(xué)習(xí)模型在參數(shù)設(shè)置不當(dāng)?shù)那闆r下,不僅會(huì)導(dǎo)致擬合精度顯著降低,還可能產(chǎn)生訓(xùn)練集表現(xiàn)良好而測(cè)試集效果欠佳的過(guò)擬合現(xiàn)象[13]。
目前將分?jǐn)?shù)階微分與CARS算法相結(jié)合用于篩選最優(yōu)變量子集,進(jìn)而反演獼猴桃葉片葉綠素含量的研究較少。本研究擬以楊凌區(qū)獼猴桃作為研究對(duì)象,在葉片高光譜數(shù)據(jù)和實(shí)測(cè)葉綠素相對(duì)含量(SPAD)值的基礎(chǔ)上,對(duì)原始光譜進(jìn)行分?jǐn)?shù)階微分變換,并采用CARS算法剔除冗余數(shù)據(jù),篩選敏感波段構(gòu)建優(yōu)選變量集,再用優(yōu)選變量集訓(xùn)練隨機(jī)森林模型、支持向量機(jī)模型和極限學(xué)習(xí)機(jī)模型,對(duì)冠層葉片葉綠素含量進(jìn)行預(yù)測(cè)和分析,以期為獼猴桃生長(zhǎng)發(fā)育期葉綠素含量的檢測(cè)提供技術(shù)支持。
1 材料與方法
1.1 試驗(yàn)區(qū)與試驗(yàn)材料
試驗(yàn)區(qū)(圖1)位于陜西省楊凌農(nóng)業(yè)高新技術(shù)產(chǎn)業(yè)示范區(qū)五泉鎮(zhèn)蔣家寨村(108°01′20″E,34°18′11″N),該地區(qū)地勢(shì)平坦,海拔516.4~540.1 m,土壤肥沃,水資源豐富、水利條件優(yōu)越,適宜多種農(nóng)作物生長(zhǎng),年降水量635.1~663.9 nm,年平均氣溫12.9 ℃,屬暖溫帶季風(fēng)半濕潤(rùn)氣候,適宜種植獼猴桃。
試驗(yàn)所用獼猴桃品種為徐香,采樣時(shí)間為2023年6月29日,正值獼猴桃的膨果期。膨果期是獼猴桃生長(zhǎng)的關(guān)鍵階段,該時(shí)期獼猴桃果實(shí)快速發(fā)育。選取健康且樹(shù)齡較大的獼猴桃樹(shù),采用隔行采樣法,選取8行,每一行選擇10個(gè)點(diǎn),在每個(gè)樣點(diǎn)都摘取長(zhǎng)勢(shì)差異大的健康無(wú)蟲害的新老葉片各2片,80個(gè)采樣點(diǎn)共采集320片葉片,葉片采摘后立即裝入密封袋送回實(shí)驗(yàn)室。
1.2 試驗(yàn)方法
1.2.1 葉片葉綠素含量測(cè)定 采用葉綠素測(cè)量?jī)x(型號(hào)SPAD-502Plus,日本Konica Minolta公司產(chǎn)品)測(cè)定膨果期獼猴桃葉片的SPAD值,SPAD值與葉綠素的實(shí)際含量之間存在直接的正相關(guān)關(guān)系,通過(guò)一定的轉(zhuǎn)換關(guān)系,可以將SPAD值換算為葉綠素含量[14]。測(cè)定時(shí)避開(kāi)葉脈,從葉尖端至葉柄端,在葉片的左右側(cè)各選擇3個(gè)區(qū)域,每個(gè)區(qū)域測(cè)量2次,共測(cè)6次,最終取平均值。
1.2.2 葉片高光譜反射率測(cè)定 利用便攜式非成像地物光譜儀測(cè)定高光譜反射率,光譜波段為350~2 500 nm。為保證試驗(yàn)的科學(xué)性和可靠性,在測(cè)量前需進(jìn)行多次白板矯正,直至結(jié)果穩(wěn)定。測(cè)量時(shí),使用紙巾清潔葉片表面,確保無(wú)灰塵和泥土等雜物,并且每隔30 min需進(jìn)行1次白板矯正。按編號(hào)順序用葉片夾夾持葉片,避開(kāi)葉脈,從葉尖端至葉柄端,在葉片的左右側(cè)各選擇3個(gè)區(qū)域,每個(gè)區(qū)域測(cè)量2次。每片葉片測(cè)得12條光譜曲線,取平均值。
1.2.3 光譜數(shù)據(jù)處理 利用便攜式非成像地物光譜儀對(duì)原始數(shù)據(jù)進(jìn)行重采樣,采樣的間隔為1 nm,區(qū)間為400~1 000 nm,隨后利用SG濾波法(Savitzky golay filter)對(duì)數(shù)據(jù)進(jìn)行平滑處理,以有效去噪并保留植被生長(zhǎng)過(guò)程中的局部突變信息[15]。盡管便攜式非成像地物光譜儀僅能采集部分光譜數(shù)據(jù),但其涵蓋葉綠素敏感的關(guān)鍵波段。與使用全光譜數(shù)據(jù)相比,使用部分關(guān)鍵光譜數(shù)據(jù)可提高模型處理效率和分析速度,在實(shí)際應(yīng)用中可以更快地進(jìn)行葉綠素反演。此外,便攜式非成像地物光譜儀的光譜分辨率和靈敏度較高,可以精確捕捉目標(biāo)的光譜特征。
1.2.4 分?jǐn)?shù)階微分處理 本研究采用分?jǐn)?shù)階微分(Fractional order differentiation,F(xiàn)OD)算法對(duì)原始光譜進(jìn)行處理,對(duì)光譜反射率實(shí)施0~2階(步長(zhǎng)0.2)的分?jǐn)?shù)階微分變換。分?jǐn)?shù)階微分是一種用于計(jì)算非整數(shù)階導(dǎo)數(shù)的方法,能夠突出光譜曲線中斜率較高的區(qū)域,忽略平緩部分,從而提高數(shù)據(jù)分析的精度和效果,尤其在處理復(fù)雜光譜數(shù)據(jù)時(shí)具有顯著優(yōu)勢(shì)[16]。與整數(shù)階微分相比,分?jǐn)?shù)階微分能夠更全面地捕捉光譜細(xì)節(jié)信息。研究結(jié)果表明,整數(shù)階模型的精度顯著低于分?jǐn)?shù)階模型[17]。
1.2.5 競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣 競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法(Competitive adaptive reweighted sampling,CARS)是一種基于達(dá)爾文生物進(jìn)化理論的變量選擇算法,通過(guò)迭代統(tǒng)計(jì)信息篩選出對(duì)生化參數(shù)敏感的波段,解決變量組合中的相關(guān)問(wèn)題[18]。采樣過(guò)程包括蒙特卡羅采樣、指數(shù)衰減波長(zhǎng)選擇、自適應(yīng)重加權(quán)采樣和循環(huán)迭代4個(gè)步驟。
1.2.5.1 蒙特卡羅采樣 采用隨機(jī)法劃分?jǐn)?shù)據(jù)集,使用偏最小二乘法(PLS)構(gòu)建回歸模型,通過(guò)計(jì)算回歸系數(shù)的絕對(duì)值百分比,估算每個(gè)變量對(duì)目標(biāo)變量的重要性。
1.2.5.2 指數(shù)衰減波長(zhǎng)選擇 CARS算法初始包含所有變量,并在迭代中逐步減少變量數(shù)量。第i次采樣中,變量保留比例的計(jì)算公式為:
ri=ae-ki(1)
上式的約束條件為r1=P,rN=2/P,可得函數(shù)參數(shù)為:
a=(P/2)1/(N-1)(2)
k=ln(p/2)/(N-1)(3)
式中,ri為第i次采樣時(shí)保留的變量比例;a為初始變量比例;k為衰減常數(shù);N為迭代次數(shù)。
CARS算法中變量選擇包括2個(gè)階段:快選階段(i<n),在這一階段,算法會(huì)快速地剔除大量變量;精選階段(n<i<N),在這一階段,算法會(huì)更精確地分析剩余的變量,每次迭代僅刪除少量變量。
1.2.5.3 自適應(yīng)重加權(quán)采樣 根據(jù)指數(shù)衰減選擇波長(zhǎng)對(duì)應(yīng)的變量,剔除無(wú)用變量,構(gòu)建預(yù)測(cè)模型并計(jì)算均方根誤差(RMSE),采用交叉驗(yàn)證均方根誤差(RMSECV)評(píng)估模型性能。
1.2.5.4 循環(huán)迭代 通過(guò)多次循環(huán)迭代,對(duì)比偏最小二乘回歸模型的RMSECV值,確定最優(yōu)變量子集。CARS算法通過(guò)Matlab2023b實(shí)現(xiàn)[18]。
1.2.6 建模方法 利用光譜反射率訓(xùn)練隨機(jī)森林模型 (RF)、支持向量機(jī)模型 (SVM)與極限學(xué)習(xí)機(jī)模型(ELM)。隨機(jī)森林模型具有高準(zhǔn)確率、處理大型數(shù)據(jù)集能力強(qiáng)和抗過(guò)擬合的優(yōu)點(diǎn),但模型可解釋性較差,訓(xùn)練和預(yù)測(cè)速度較慢[19]。本研究中隨機(jī)森林模型的樹(shù)數(shù)量設(shè)為5,每棵樹(shù)深度為5。支持向量機(jī)模型適用于高維空間且去噪能力強(qiáng),但不適用于大規(guī)模數(shù)據(jù)集[20]。本研究中,支持向量機(jī)模型的核心函數(shù)選擇fitrsvm函數(shù),最大迭代次數(shù)設(shè)為30。極限學(xué)習(xí)機(jī)模型具有良好的泛化能力、多樣性和靈活性以及一定的魯棒性[21],本研究所用激活函數(shù)為sigmoid函數(shù),隱藏層節(jié)點(diǎn)個(gè)數(shù)設(shè)置為50。
通過(guò)決定系數(shù)(R2)、均方根誤差(RMSE)和相對(duì)分析誤差(RPD)比較模型精度。R2越接近1,表明模型對(duì)目標(biāo)變量的解釋和預(yù)測(cè)能力越強(qiáng),擬合效果越好;RMSE越小,表明模型的預(yù)測(cè)精度越高,誤差越小。RPD越大,表明模型對(duì)數(shù)據(jù)集的適用性越好。
RPD=SD/RMSEP(4)
式中,SD為實(shí)測(cè)值的標(biāo)準(zhǔn)偏差,RMSEP為預(yù)測(cè)均方根誤差。
RMSE=1n∑ni=1(yi^-yi)2(5)
R2=1-∑ni=1(yi-yi^)2∑ni=1(yi-yi—)2(6)
式中,yi^、yi、yi—分別為估測(cè)值、實(shí)測(cè)值、實(shí)測(cè)值平均值,n為樣本數(shù)。
2 結(jié)果與分析
2.1 分?jǐn)?shù)階微分處理的光譜反射率與葉片葉綠素含量的相關(guān)性
利用0~2階(步長(zhǎng)為0.2)的分?jǐn)?shù)階微分對(duì)光譜反射率進(jìn)行預(yù)處理,以分析光譜反射率與葉綠素含量之間的相關(guān)性。如圖2所示,波長(zhǎng)400~865 nm,光譜反射率與葉綠素含量呈負(fù)相關(guān);波長(zhǎng)550 nm處,光譜反射率與葉綠素含量的相關(guān)系數(shù)最小(-0.86);波長(zhǎng)866~1 000 nm,光譜反射率與葉綠素含量呈正相關(guān)。
2.2 葉片高光譜特征
2.2.1 原始光譜反射率 根據(jù)SPAD值將160個(gè)獼猴桃葉片的光譜反射率數(shù)據(jù)分為3組,每組的最小值、最大值與平均值分別為(16.2,35.5,27.4)、(35.5,46.6,42.2)和(46.6,62.1,51.6)。如圖3所示,3條光譜反射率曲線的走勢(shì)基本一致,在可見(jiàn)光波段(380~750 nm),550 nm附近的綠光波段出現(xiàn)反射峰,680 nm附近的紅光波段出現(xiàn)吸收谷,這是由于獼猴桃葉片對(duì)紅光具有強(qiáng)吸收性。在紅邊波段(680~750 nm),光譜反射率急劇上升,形成典型的紅邊效應(yīng)。在近紅外光波段,光譜曲線呈現(xiàn)高反射平臺(tái),光譜反射率隨著SPAD值的增加而升高,表明葉片的內(nèi)部結(jié)構(gòu)更加穩(wěn)定[22]。在可見(jiàn)光波段,光譜反射率隨著SPAD值的增大而降低,同時(shí)紅邊向長(zhǎng)波方向移動(dòng),表明獼猴桃葉片對(duì)可見(jiàn)光的吸收能力增強(qiáng)。
2.2.2 分?jǐn)?shù)階微分處理的光譜反射率 如圖4所示,隨著微分階數(shù)的增加,曲線變化幅度越小,光譜反射率逐漸趨近于0,特征峰更加明顯。在0.4階~2.0階微分處理下,光譜反射率出現(xiàn)負(fù)值。
2.3 利用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法(CARS)篩選敏感波段
在CARS計(jì)算過(guò)程中,設(shè)置因子數(shù)為5,交叉驗(yàn)證折數(shù)為10,蒙特卡羅采樣次數(shù)為50,旨在通過(guò)50次迭代尋找偏最小二乘法(PLS)模型最小的交叉驗(yàn)證均方根誤差(RMSECV)。如圖5所示,在原CARS迭代過(guò)程中,剩余光譜波段數(shù)量呈指數(shù)下降,而PLS模型的RMSECV總體呈現(xiàn)先急劇下降后波動(dòng)上升的趨勢(shì)。在前23次迭代中,PLS模型的RMSECV整體呈下降趨勢(shì),表明與葉綠素含量無(wú)關(guān)的噪聲信息被逐步剔除。在第23次迭代時(shí),PLS模型的RMSECV最小,表明模型的預(yù)測(cè)精度達(dá)到最高。此后,PLS模型的RMSECV總體呈上升趨勢(shì),主要是因?yàn)榕c葉綠素含量密切相關(guān)的關(guān)鍵波段被剔除。因此,選擇迭代23次時(shí)的波段組合作為子集。
如圖6所示,對(duì)光譜反射率進(jìn)行1.0階微分預(yù)處理,使用CARS算法篩選得到的敏感波段最少(7個(gè));對(duì)光譜反射率進(jìn)行0.4階微分預(yù)處理,使用CARS算法篩選得到的敏感波段最多(149個(gè))。對(duì)光譜反射率進(jìn)行0~2.0階微分預(yù)處理,使用CARS算法篩選得到的敏感波段為7~149個(gè),且大部分波段屬于可見(jiàn)光波段。如表1所示,基于0~2.0階微分處理光譜反射率,PLS模型RMSECV最小值為4.99~5.54,模型的預(yù)測(cè)誤差水平較為穩(wěn)定,表明CARS算法對(duì)各階微分處理的光譜反射率均有較好的篩選效果。
2.4 模型構(gòu)建
本研究分別基于各階分?jǐn)?shù)階微分變換的光譜數(shù)據(jù)及其經(jīng)CARS篩選后的最優(yōu)變量集構(gòu)建模型,訓(xùn)練集與測(cè)試集按4∶1的數(shù)量比例分配。
2.4.1 隨機(jī)森林模型 分別基于各階分?jǐn)?shù)階微分處理后的光譜反射率數(shù)據(jù)及經(jīng)CARS算法篩選后的敏感波段訓(xùn)練隨機(jī)森林模型(RF)。如表2和表3所示,光譜反射率經(jīng)過(guò)1.8階微分處理后,采用CARS算法篩選出敏感波段,利用這些敏感波段訓(xùn)練隨機(jī)森林模型,取得了最佳效果。訓(xùn)練后的隨機(jī)森林模型在驗(yàn)證集上R2達(dá)到0.93,RMSE為2.56,RPD為3.89。0~2.0階微分預(yù)處理光譜反射率后,利用經(jīng)過(guò)CARS算法篩選得到的敏感波段訓(xùn)練的模型,其在驗(yàn)證集上的決定系數(shù)(R2)和相對(duì)分析誤差(RPD)均高于未經(jīng)過(guò)CARS算法篩選的原始波段訓(xùn)練的模型,其在驗(yàn)證集上的均方根誤差(RMSE)均低于利用未經(jīng)過(guò)CARS算法篩選的原始波段訓(xùn)練的模型。表明利用經(jīng)過(guò)CARS算法篩選得到的敏感波段訓(xùn)練的隨機(jī)森林模型性能更好,精度更高。
2.4.2 支持向量機(jī)模型 分別基于各階分?jǐn)?shù)階微分處理后的光譜反射率數(shù)據(jù)及經(jīng)CARS算法篩選后的敏感波段訓(xùn)練支持向量機(jī)模型(SVM)。如表4和表5所示,光譜反射率經(jīng)過(guò)1.6階微分處理后,采用CARS算法篩選出敏感波段,利用這些敏感波段訓(xùn)練支持向量機(jī)模型,取得了最佳效果。訓(xùn)練后的支持向量機(jī)模型在驗(yàn)證集上R2達(dá)到0.88,RMSE為3.98,RPD為2.96。除0.2階和1.4階微分處理外,其他分?jǐn)?shù)階微分預(yù)處理光譜反射率后,利用經(jīng)過(guò)CARS算法篩選得到的敏感波段訓(xùn)練的模型,其在驗(yàn)證集上的決定系數(shù)(R2)和相對(duì)分析誤差(RPD)均高于未經(jīng)過(guò)CARS算法篩選的原始波段訓(xùn)練的模型,其在驗(yàn)證集上的均方根誤差(RMSE)均低于利用未經(jīng)過(guò)CARS算法篩選的原始波段訓(xùn)練的模型。表明利用經(jīng)過(guò)CARS算法篩選得到的敏感波段訓(xùn)練的支持向量機(jī)模型性能更好,精度更高。
2.4.3 極限學(xué)習(xí)機(jī)模型 分別基于各階分?jǐn)?shù)階微分處理后的光譜反射率數(shù)據(jù)及經(jīng)CARS算法篩選后的敏感波段訓(xùn)練極限學(xué)習(xí)機(jī)模型(ELM)。如表6和表7所示,光譜反射率經(jīng)過(guò)0.6階微分處理后,采用CARS算法篩選出敏感波段,利用這些敏感波段訓(xùn)練極限學(xué)習(xí)機(jī)模型,取得了最佳效果。訓(xùn)練后的極限學(xué)習(xí)機(jī)模型在驗(yàn)證集上R2達(dá)到0.86,RMSE為4.03,RPD為3.29。0~2.0階微分預(yù)處理光譜反射率后,利用經(jīng)過(guò)CARS算法篩選得到的敏感波段訓(xùn)練的模型,其在驗(yàn)證集上的決定系數(shù)(R2)和相對(duì)分析誤差(RPD)均高于未經(jīng)過(guò)CARS算法篩選的原始波段訓(xùn)練的模型,其在驗(yàn)證集上的均方根誤差(RMSE)均低于利用未經(jīng)過(guò)CARS算法篩選的原始波段訓(xùn)練的模型。表明利用經(jīng)過(guò)CARS算法篩選得到的敏感波段訓(xùn)練的極限學(xué)習(xí)機(jī)模型性能更好,精度更高。
3 討論
葉綠素是植物進(jìn)行光合作用的重要色素,其含量與光合作用強(qiáng)度密切相關(guān),直接影響植物的生長(zhǎng)發(fā)育。因此,快速、準(zhǔn)確地獲取植物葉綠素含量對(duì)檢測(cè)植物生長(zhǎng)狀態(tài)具有重要意義。本研究通過(guò)分析不同SPAD值下的光譜特征發(fā)現(xiàn),原始光譜的整體走勢(shì)基本一致。隨著SPAD值的增加,可見(jiàn)光區(qū)域的反射率總體下降,而近紅外區(qū)域的反射率則呈上升趨勢(shì),這表明SPAD值高的獼猴桃葉片細(xì)胞柵欄組織穩(wěn)定性提高[23]。研究還發(fā)現(xiàn),隨著分?jǐn)?shù)階微分階數(shù)的增加,光譜反射峰更加明顯,但可見(jiàn)光和部分近紅外區(qū)域的反射率一致性降低,噪聲現(xiàn)象更嚴(yán)重,導(dǎo)致建模精度并未隨階數(shù)增加而持續(xù)提高。
針對(duì)相鄰波段光譜反射率相關(guān)性較高的問(wèn)題,本研究采用分?jǐn)?shù)階微分方法顯著提升了光譜數(shù)據(jù)與獼猴桃葉片葉綠素含量之間的相關(guān)性。并進(jìn)一步結(jié)合競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣方法(CARS)對(duì)分?jǐn)?shù)階微分后的光譜數(shù)據(jù)進(jìn)行處理,結(jié)果表明,CARS算法能夠有效剔除與葉綠素含量無(wú)關(guān)的波段,篩選出最優(yōu)變量子集,顯著提高建模精度。
分別基于原始波段和分?jǐn)?shù)階微分變換+CARS算法篩選得到的敏感波段訓(xùn)練隨機(jī)森林模型(RF)、支持向量機(jī)模型(SVM)與極限學(xué)習(xí)機(jī)模型(ELM),所有模型在驗(yàn)證集和訓(xùn)練集上的精度R2均達(dá)到0.65及以上。其中,光譜反射率經(jīng)過(guò)1.8階微分處理后,采用CARS算法篩選出敏感波段,利用這些敏感波段訓(xùn)練隨機(jī)森林模型,取得了最佳效果。訓(xùn)練后的隨機(jī)森林模型在驗(yàn)證集上R2達(dá)到0.93,RMSE為2.56,RPD為3.89。RF模型因其優(yōu)異的集成學(xué)習(xí)機(jī)制和對(duì)特征的魯棒性,在處理本研究數(shù)據(jù)時(shí)表現(xiàn)出最佳的預(yù)測(cè)能力,而支持向量機(jī)模型在處理高維數(shù)據(jù)和邊界定義方面表現(xiàn)良好[24]。在未來(lái)的研究中可進(jìn)一步優(yōu)化模型參數(shù),同時(shí)可以嘗試集成各模型的優(yōu)勢(shì)以獲得最佳預(yù)測(cè)結(jié)果[25]。
本研究基于膨果期獼猴桃開(kāi)展葉綠素監(jiān)測(cè)試驗(yàn),該結(jié)論是否適用于其他生育期仍需進(jìn)一步驗(yàn)證。此外,探索更多階數(shù)的分?jǐn)?shù)階微分變換對(duì)光譜信息的處理效果也具有重要的研究意義。
4 結(jié)論
本研究利用便攜式非成像地物光譜儀測(cè)得400~1 000 nm高光譜反射率,通過(guò)0~2.0階微分變換光譜反射率,并采用CARS算法篩選敏感波段,分別將原始波段和篩選得到的敏感波段用于訓(xùn)練隨機(jī)森林模型(RF)、支持向量機(jī)模型(SVM)和極限學(xué)習(xí)機(jī)模型(ELM)。光譜反射率經(jīng)過(guò)1.8階微分處理后,采用CARS算法篩選出敏感波段,利用這些敏感波段訓(xùn)練隨機(jī)森林模型,取得了最佳效果。訓(xùn)練后的隨機(jī)森林模型在驗(yàn)證集上R2達(dá)到0.93,RMSE為2.56,RPD為3.89。
參考文獻(xiàn):
[1] 王 爍,常慶瑞,劉夢(mèng)云,等.基于高光譜遙感的棉花葉片葉綠素含量估算[J]. 中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2017,22(4):16-27.
[2] 陳 瀾,常慶瑞,高一帆,等. 獼猴桃葉片葉綠素含量高光譜估算模型研究[J]. 西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,48(6):79-89,98.
[3] 李粉玲,王 力,劉 京,等. 基于高分一號(hào)衛(wèi)星數(shù)據(jù)的冬小麥葉片SPAD值遙感估算[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(9):273-281.
[4] 張計(jì)育,莫正海,黃勝男,等. 21世紀(jì)以來(lái)世界獼猴桃產(chǎn)業(yè)發(fā)展以及中國(guó)獼猴桃貿(mào)易與國(guó)際競(jìng)爭(zhēng)力分析[J]. 中國(guó)農(nóng)學(xué)通報(bào),2014,30(23):48-55.
[5] ANSAR A, MUHAMMAD M. Evaluating the potential of red edge position (REP) of hyperspectral remote sensing data for real time estimation of LAI amp; chlorophyll content of kinnow mandarin ( Citrus reticulata ) fruit orchards[J]. Scientia Horticulturae,2020,267:109326.
[6] GUO Y M, JIANG S Y, MIAO H L, et al. Ground-based hyperspectral estimation of maize leaf chlorophyll content considering phenological characteristics[J]. Remote Sensing,2024,16(12). DOI:10.3390/rs16122133.
[7] 王 宇,汪 泓,肖玖軍,等. 基于MCC-GAPLS-PLSR的辣椒葉綠素含量高光譜定量反演[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2024,40(5):865-873.
[8] SONG Z H, LIU Y F, YU J R, et al. Estimation of chlorophyll content in apple leaves infected with mosaic disease by combining spectral and textural information using hyperspectral images[J]. Remote Sensing,2024,16:2190.
[9] 李紫琴,王家強(qiáng),李 貞,等. 基于光譜指數(shù)的棉花葉片葉綠素密度估算研究[J]. 中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),2024,26(8):103-111.
[10]NIU L Y, GAO C Y, SUN J B, et al. Study on hyperspectral estimation model of chlorophyll content in grape leaves[J]. Agricultural Biotechnology,2018(4):55-58,61.
[11]阿熱孜古力·肉孜,買買提·沙吾提,何旭剛,等. 基于多植被指數(shù)組合的棉花葉片葉綠素含量估算[J]. 干旱區(qū)研究,2023,40(11):1865-1874.
[12]符欣彤,常慶瑞,張佑銘,等. 基于Stacking集成學(xué)習(xí)的獼猴桃葉片葉綠素含量估算[J]. 干旱地區(qū)農(nóng)業(yè)研究,2023,41(4):247-256.
[13]林少喆,彭致功,王春堂,等. 基于“三邊”參數(shù)的冬小麥冠層SPAD值監(jiān)測(cè)模型[J]. 排灌機(jī)械工程學(xué)報(bào),2021,39(1):102-108.
[14]劉 楠,楊海波,高 飛,等. 基于查找表法和優(yōu)化光譜指數(shù)的馬鈴薯葉綠素反演[J]. 中國(guó)馬鈴薯,2022,36(6):495-507.
[15]姜海玲,姚奕旭,洪繡超,等. 基于sg濾波去噪的時(shí)間序列諧波分析重建算法研究[J]. 吉林師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,42(3):133-140.
[16]向友珍,王 辛,安嘉琪,等. 基于分?jǐn)?shù)階微分和最優(yōu)光譜指數(shù)的大豆葉面積指數(shù)估算[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(9):329-342.
[17]蔣宇恒,晏 博,莊清源,等. 基于分?jǐn)?shù)階微分的土壤重金屬鋅和鎳的定量反演模型研究[J]. 光譜學(xué)與光譜分析,2024,44(10):2850-2857.
[18]李 鎧,常慶瑞,陳 倩,等. 基于連續(xù)小波變換耦合cars算法的冬小麥冠層葉片含水量估算[J]. 麥類作物學(xué)報(bào),2023,43(2):251-258.
[19]張瑞杰,周春艷,陳 輝,等. 基于GF-5B衛(wèi)星的隨機(jī)森林模型反演京津冀地區(qū)PM2.5[J]. 中國(guó)環(huán)境科學(xué),2024,44(11):5961-5970.
[20]池 濤,曹廣溥,李丙春,等. 基于高光譜數(shù)據(jù)和SVM方法的土壤鹽漬度反演[J]. 山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,49(4):585-590.
[21]艾小童. 基于elm模型的極化sar土壤水分降尺度研究[J]. 地理空間信息,2023,21(7):11-15.
[22]YUAN Z R, YE Y, WEI L F, et al. Study on the optimization of hyperspectral characteristic bands combined with monitoring and visualization of pepper leaf SPAD value[J]. Sensors,2022,22(1):183.
[23]王婷婷. 基于高光譜和高分一號(hào)衛(wèi)星影像的冬小麥葉綠素遙感反演[D]. 咸陽(yáng):西北農(nóng)林科技大學(xué),2019.
[24]張學(xué)工. 關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J]. 自動(dòng)化學(xué)報(bào),2000,26(1):36-46.
[25]HAN X H, MA S F, SHI Z W, et al. A novel power transformer fault diagnosis model based on Harris-Hawks-optimization algorithm optimized kernel extreme learning machine[J]. Journal of Electrical Engineering amp; Technology,2022,17(3):1993-2001.
(責(zé)任編輯:成紓寒)
江蘇農(nóng)業(yè)學(xué)報(bào)2025年2期