李 斌, 高 攀, 馮 盼, 陳丹艷, 張海輝, 胡 瑾*
1. 西北農(nóng)林科技大學(xué)機(jī)械與電子工程學(xué)院, 陜西 楊凌 712100 2. 農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)物聯(lián)網(wǎng)重點(diǎn)實(shí)驗(yàn)室, 陜西 楊凌 712100 3. 陜西省農(nóng)業(yè)信息感知與智能服務(wù)重點(diǎn)實(shí)驗(yàn)室, 陜西 楊凌 712100
葉綠素?zé)晒饧夹g(shù)作為植物光合作用的探針, 能間接反映植物光合系統(tǒng)對(duì)光能的吸收、 傳遞、 耗散和分配。 葉綠素?zé)晒鈪?shù)(Fv/Fm)為光學(xué)系統(tǒng)Ⅱ(PSⅡ)反應(yīng)中心最大光合效率, 是使用頻率最高的參數(shù)之一, 被廣泛應(yīng)用于植物逆境脅迫研究中。 Zhou等[1]采用Fv/Fm進(jìn)行番茄耐熱性的早期檢測(cè); Hazrati等[2]研究表明水分脅迫和光照脅迫會(huì)造成蘆薈的Fv/Fm降低; 秦紅艷等[3]對(duì)葡萄幼苗進(jìn)行不同濃度鹽處理, 發(fā)現(xiàn)其葉片F(xiàn)v/Fm隨鹽脅迫程度加劇而降低。 實(shí)現(xiàn)Fv/Fm的快速檢測(cè)對(duì)于表征植物生理狀態(tài)具有重要意義。 然而傳統(tǒng)的Fv/Fm檢測(cè)方式需對(duì)待測(cè)葉片進(jìn)行暗適應(yīng), 無法實(shí)現(xiàn)實(shí)時(shí)測(cè)量, 另外由于葉綠素?zé)晒鈨x價(jià)格昂貴,F(xiàn)v/Fm檢測(cè)成本高, 不能滿足實(shí)際應(yīng)用中大范圍檢測(cè)需求。
光譜檢測(cè)技術(shù)具有快速、 無損、 成本相對(duì)較低的優(yōu)勢(shì), 近年來在植物生理狀態(tài)監(jiān)測(cè)方面發(fā)展迅速。 國內(nèi)外學(xué)者對(duì)植物葉綠素?zé)晒鈪?shù)與反射光譜的關(guān)系進(jìn)行了深入研究, 朱艷等[4]對(duì)不同施氮水平下, 不同品種和生育時(shí)期的不同葉位小麥葉片的葉綠素?zé)晒鈪?shù)和高光譜反射率進(jìn)行分析, 發(fā)現(xiàn)小麥頂部?jī)扇~片的熒光參數(shù)同其差值植被指數(shù)DVI(550和750 nm)相關(guān)性最高,F(xiàn)v/Fm與該指數(shù)相關(guān)性達(dá)0.68; Ibarakip等[5]搭建了一套光學(xué)植被指數(shù)(PRI)成像系統(tǒng), 采集馬鈴薯葉片的反射光強(qiáng)并計(jì)算出PRI指數(shù)(530和570 nm), 發(fā)現(xiàn)葉片暗適應(yīng)后, 在弱光條件下該指數(shù)同F(xiàn)v/Fm存在線性關(guān)系。 Zhang等[7]采用主成分分析的方法提取出水稻葉片葉綠素?zé)晒鈪?shù)的特征波段, 選出多個(gè)植被指數(shù)與熒光參數(shù)建模, 結(jié)果表明歸一化植被指數(shù)NDSI(680和935 nm)的擬合效果最好, 其Fv/Fm的回歸模型的相關(guān)系數(shù)R為-0.818, 均方根誤差RMSE為0.03。 有報(bào)道分析了緊湊型玉米整個(gè)生長(zhǎng)期Fv/Fm同高光譜植被指數(shù)的關(guān)系, 發(fā)現(xiàn)結(jié)構(gòu)色敏指數(shù)SIPI(445, 680和800 nm)同F(xiàn)v/Fm相關(guān)性最好, 并以SIPI構(gòu)建了Fv/Fm監(jiān)測(cè)模型, 決定系數(shù)可達(dá)0.813。 以上研究證明了反射光譜預(yù)測(cè)Fv/Fm的可行性, 然而多著重于分析植被指數(shù)同F(xiàn)v/Fm的關(guān)系, 建立的預(yù)測(cè)模型以植被指數(shù)為輸入, 其包含的波長(zhǎng)信息量有限, 且多用固定公式擬合建模, 導(dǎo)致模型精度受限。 然而鮮見研究采用統(tǒng)計(jì)學(xué)方法分析反射光譜同F(xiàn)v/Fm的關(guān)系, 并以提高精度為目的探尋預(yù)測(cè)模型建模方法。
本工作以茄子葉片作為研究對(duì)象, 測(cè)量其可見光-近紅外光譜數(shù)據(jù)及葉綠素?zé)晒鈪?shù)Fv/Fm, 采用3種光譜數(shù)據(jù)預(yù)處理方法濾除光譜噪聲; 使用5種變量篩選方法提取特征波長(zhǎng), 并建立偏最小二乘回歸(partial least square regression, PLSR)模型, 根據(jù)模型精度確定不同預(yù)處理方法下的最優(yōu)特征波長(zhǎng)組合; 最后采用4種機(jī)器學(xué)習(xí)算法建立Fv/Fm預(yù)測(cè)模型, 并與傳統(tǒng)線性回歸算法進(jìn)行對(duì)比, 選出最優(yōu)建模方式, 實(shí)現(xiàn)基于可見-近紅外光譜的茄子葉片F(xiàn)v/Fm準(zhǔn)確預(yù)測(cè)。
實(shí)驗(yàn)于西北農(nóng)林科技大學(xué)農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)物聯(lián)網(wǎng)重點(diǎn)實(shí)驗(yàn)室(北緯34°07′39″, 東經(jīng)107°59′50″, 海拔648 m)進(jìn)行, 實(shí)驗(yàn)材料為紫紅長(zhǎng)茄F1幼苗, 采用基質(zhì)培養(yǎng)(Pindstrup Substrate, 丹麥)。 為獲取熒光參數(shù)差異顯著的茄子葉片, 于2018年11月將生長(zhǎng)健康、 長(zhǎng)勢(shì)一致的茄子幼苗置于光照強(qiáng)度設(shè)置為6個(gè)梯度(光量子通量密度分別為50, 90, 140, 220, 280和340 μmol·m-2·s-1)的6個(gè)CO2人工氣候箱(達(dá)斯卡特, RGL-P500D-CO2)內(nèi)培養(yǎng)。 箱內(nèi)光周期為晝/夜14h/10h, 環(huán)境溫度為晝/夜25 ℃/16 ℃, 空氣相對(duì)濕度為晝/夜60%/50%, CO2濃度為400 μmol·mol-1。 由于各箱內(nèi)茄子植株接受光輻射不同, 培育15 d后, 產(chǎn)生了長(zhǎng)勢(shì)良好和受光抑制影響明顯的植株樣本, 其株高、 莖粗, 葉片形狀、 顏色等形態(tài)特征產(chǎn)生明顯區(qū)別, 且葉綠素?zé)晒鈪?shù)Fv/Fm差異較大, 分布于0.682~0.877的區(qū)間內(nèi)。 對(duì)其進(jìn)行可見-近紅外光譜和葉綠素?zé)晒鈪?shù)測(cè)定, 共獲取光譜及熒光數(shù)據(jù)302組。
可見-近紅外反射光譜數(shù)據(jù)采集系統(tǒng)包括波長(zhǎng)范圍為350~1 100 nm, 像素為2068的光譜儀(OFS-1100, Ocean Optics, 美國), 鹵鎢燈(HL-2000, Ocean Optics, 美國), 積分球(SpectroClip-TR, Ocean Optics, 美國)及計(jì)算機(jī)。 其中測(cè)量前, 將鹵鎢燈預(yù)熱30 min, 以保證光源強(qiáng)度均勻。 通過光譜校正去除設(shè)備暗電流影響, 獲得樣本光譜反射率, 其計(jì)算公式如式(1)所示
(1)
式(1)中,R為樣本光譜反射率;I為樣本反射光譜光強(qiáng);Iw為參考白板的反射光譜光強(qiáng);Ib為光源關(guān)閉時(shí)光譜儀采集的光譜光強(qiáng)。
使用SpectraSuite軟件(Ocean Optics, 美國)設(shè)置光譜采集參數(shù): 光譜積分時(shí)間為80 ms, 掃描次數(shù)為10, 平滑度為5。 對(duì)每個(gè)葉片取避開葉脈的三個(gè)點(diǎn)采集反射光譜數(shù)據(jù), 取平均值作為單個(gè)葉片的原始光譜。
使用便攜式調(diào)制葉綠素?zé)晒鈨xMini-Pam-II(Walz, 德國)測(cè)定葉綠素?zé)晒鈪?shù)。 測(cè)定前使用暗適應(yīng)葉片夾夾取待測(cè)葉片, 充分暗適應(yīng)20 min后, 通過光纖探頭在葉片相同位置采集葉綠素?zé)晒鈪?shù)Fv/Fm, 同樣取三點(diǎn)均值作為單個(gè)葉片F(xiàn)v/Fm。
1.4.1 樣本集劃分
由于光譜首尾波段信噪比較低, 選取了400~1 000 nm波長(zhǎng)范圍內(nèi)的1 358個(gè)波段進(jìn)行光譜分析。 在302個(gè)樣品中, 利用蒙特卡洛抽樣方法(Monte-Carlo sampling method, MCS)對(duì)光譜數(shù)據(jù)進(jìn)行分析, 去除9個(gè)明顯異常值, 在剩余293個(gè)樣本中, 按4∶1隨機(jī)劃分出訓(xùn)練集和測(cè)試集, 其樣本數(shù)分別為234和59。
1.4.2 光譜數(shù)據(jù)預(yù)處理
為消除儀器產(chǎn)生的隨機(jī)噪聲、 葉片表面散射、 光程變化等對(duì)光譜產(chǎn)生的影響[7], 保留有效光譜信息, 提高模型精度及適用性, 本研究分別使用SG卷積平滑(savitzky-golay, SG)、 多元散射校正(multiplicative scatter correction, MSC)、 標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate transformation, SNV)三種方法對(duì)光譜進(jìn)行預(yù)處理。
1.4.3 特征波長(zhǎng)提取
葉片反射光譜波段線性重復(fù)性高、 冗余信息多, 會(huì)導(dǎo)致模型復(fù)雜且精確性下降[8]。 特征波長(zhǎng)篩選可以減少波長(zhǎng)變量的個(gè)數(shù), 且有利于提高模型預(yù)測(cè)速度。 本研究采用連續(xù)投影法(successive projections algorithm, SPA)、 隨機(jī)蛙跳算法(random frog, RF)、 競(jìng)爭(zhēng)性自適應(yīng)加權(quán)算法(competitive adaptive reweighted sampling, CARS)及其組合進(jìn)行特征波長(zhǎng)篩選。 其中, SPA是一種前向循環(huán)選擇方法, 通過向量的投影分析, 將含有最少冗余度和最小共線性的波長(zhǎng)組合提取出來; RF和CARS則是以優(yōu)化校正模型的預(yù)測(cè)精度為目的, 通過循環(huán)迭代建立預(yù)測(cè)模型得到最適于提高模型精度的特征變量。 其不同之處在于RF算法通過計(jì)算循環(huán)過程中各波長(zhǎng)的被選擇概率作為特征波長(zhǎng)選擇的標(biāo)準(zhǔn)[9], 而CARS則在迭代過程中不斷篩去貢獻(xiàn)小的波長(zhǎng), 以精度最高的模型所采用的波長(zhǎng)組合為特征波長(zhǎng)組合, 其變量選擇的具體步驟見文獻(xiàn)[10]。 為實(shí)現(xiàn)在考慮模型精度的同時(shí)盡可能地減少特征波長(zhǎng)的個(gè)數(shù), 選擇將CARS和RF分別與SPA連用, 即先采用CARS和RF提取出有利于預(yù)測(cè)模型精度的特征波長(zhǎng)組合, 而后使用SPA篩去重復(fù)性高的冗余變量。
為衡量各方法提取的特征波長(zhǎng)組合的性能, 以預(yù)處理后的樣本光譜的特征波長(zhǎng)反射率為輸入, 葉綠素?zé)晒鈪?shù)Fv/Fm為輸出, 采用PLSR算法建立預(yù)測(cè)模型。 以決定系數(shù)(R2)和均方根誤差(RMSE)衡量模型精度, 確定最適數(shù)據(jù)處理方法下的最優(yōu)波長(zhǎng)組合。 為評(píng)價(jià)波長(zhǎng)組合內(nèi)各特征波長(zhǎng)的重要性, 對(duì)建立的PLSR預(yù)測(cè)模型中各波長(zhǎng)權(quán)值的比重進(jìn)行計(jì)算, 如式(2)
(2)
式(2)中,bi為PLSR擬合公式中第i個(gè)特征波長(zhǎng)的回歸系數(shù),wi是第i個(gè)特征波長(zhǎng)的權(quán)值比重。
為了獲取最優(yōu)的建模方法, 分析4種常用的機(jī)器學(xué)習(xí)算法對(duì)Fv/Fm預(yù)測(cè)模型精度的影響, 并與PLSR模型進(jìn)行對(duì)比, 從而建立預(yù)測(cè)模型。 機(jī)器學(xué)習(xí)算法分別為: BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BP)、 RBF神經(jīng)網(wǎng)絡(luò)(radial basis function neural network, RBF)、 極限學(xué)習(xí)機(jī)(extreme learning machine, ELM)及回歸型支持向量機(jī)(support vector regression, SVR)。 以測(cè)試集Fv/Fm的實(shí)測(cè)值與預(yù)測(cè)值的決定系數(shù)(R2)及均方根誤差(RMSE)衡量模型預(yù)測(cè)效果。
研究中BP神經(jīng)網(wǎng)絡(luò)隱層數(shù)量設(shè)置為1, 各層之間的傳遞函數(shù)為tansig, 優(yōu)化函數(shù)為trainlm, 目標(biāo)誤差為0.000 1, 最大迭代次數(shù)為1 000, 學(xué)習(xí)速率為0.1; RBF神經(jīng)網(wǎng)絡(luò)的目標(biāo)誤差設(shè)置為0.000 1, 徑向基函數(shù)擴(kuò)散速度為13.5。 ELM的隱層神經(jīng)元個(gè)數(shù)設(shè)置為50, 傳遞函數(shù)為sigmod; SVR的核函數(shù)設(shè)置為徑向基函數(shù), 通過網(wǎng)格搜索法確定正則化參數(shù)c與核函數(shù)參數(shù)g。
取葉片樣本Fv/Fm值區(qū)間為[0.65, 0.90], 按步長(zhǎng)為0.05將其劃分為5個(gè)子區(qū)間, 將Fv/Fm值落于各子區(qū)間的茄子葉片反射光譜取均值, 其平均光譜如圖1所示。 其光譜符合植物光譜普遍規(guī)律, 在550 nm左右出現(xiàn)反射率峰值“綠峰”, 在680 nm存在反射率低谷“紅谷”[11]。 在可見光與近紅外波段之間, 出現(xiàn)反射率急劇上升的“紅邊”現(xiàn)象。 另外, 隨葉片F(xiàn)v/Fm的增加, 其光譜反射率整體呈下降趨勢(shì)。 其中, 500~700 nm區(qū)域內(nèi)的光譜幅值降低對(duì)該趨勢(shì)的反映極為明顯。 分析認(rèn)為Fv/Fm是植物PSⅡ反映中心的最大光能轉(zhuǎn)化效率,F(xiàn)v/Fm值大的葉片樣本對(duì)光能的吸收、 利用能力強(qiáng), 故其在葉綠素吸收光范圍內(nèi)的反射光強(qiáng)明顯低于Fv/Fm值小的樣本。 這種葉片光譜的統(tǒng)一變化趨勢(shì)為建立Fv/Fm預(yù)測(cè)模型提供了理論依據(jù)。
圖1 樣本平均光譜
為篩選建模效果最優(yōu)的特征波長(zhǎng)組合, 在光譜預(yù)處理及特征波長(zhǎng)提取的基礎(chǔ)上, 以PLSR建立的預(yù)測(cè)模型的精度以及采用的特征波長(zhǎng)個(gè)數(shù)如表1所示。 在三種預(yù)處理方法中, MSC和SNV的表現(xiàn)較好, 訓(xùn)練集和測(cè)試集的R2均能達(dá)到0.8以上, RMSE均在0.015以下。 而SG平滑效果一般, 除了以RF-SPA方法提取特征波長(zhǎng)的建模效果比原光譜有較小提升的效果, 其余的模型精度反而不如原始光譜數(shù)據(jù)建立的預(yù)測(cè)模型, 可能是由于SG平滑在過濾噪聲的同時(shí)也消除了部分光譜中的有效信息。
表1 不同預(yù)處理及變量篩選方法下的PLS模型精度
由表1中三種變量篩選算法單獨(dú)使用的結(jié)果可知, CARS和SPA的效果較好。 CARS提取的波長(zhǎng)建模精度最優(yōu), SPA次之, 但其提取出的特征波長(zhǎng)數(shù)量最少。 這是由于CARS的選擇策略是基于模型精度最優(yōu), 而SPA則是基于各變量之間的重復(fù)性最小。 RF算法表現(xiàn)不佳是因?yàn)槠涓鶕?jù)單個(gè)波長(zhǎng)被選擇的概率進(jìn)行變量篩選, 沒有考慮波長(zhǎng)之間的組合效果。 而CARS和SPA篩選出的則是特征波長(zhǎng)的集合。 兩者的組合使用充分發(fā)揮了各自的優(yōu)點(diǎn)。 各預(yù)處理下, CARS-SPA的模型精度與CARS相近, 但其特征波長(zhǎng)數(shù)量遠(yuǎn)少于CARS。 在所有方法中, MSC-CARS-SPA及SNV-CARS-SPA的波長(zhǎng)選擇效果最優(yōu)。 MSC-CARS-SPA-PLSR的測(cè)試集R2為0.896 1, RMSE為0.011 8, 而SNV-CARS-SPA-PLSR的測(cè)試集精度與前者相近而訓(xùn)練集精度更高, 兩者的特征波長(zhǎng)個(gè)數(shù)均為12個(gè), 僅占全光譜建模中1 358個(gè)波長(zhǎng)的0.88%。 兩方法均在大幅度降低模型輸入的同時(shí), 提高了模型預(yù)測(cè)能力, 故將兩者篩選出的波長(zhǎng)變量作為最終的特征波長(zhǎng)組合。
進(jìn)一步對(duì)兩種方法篩選出的特征波長(zhǎng)分布情況及重要性進(jìn)行分析。 各特征波長(zhǎng)的分布及其權(quán)值比重如圖2所示, 其中圖2(a)和(b)分別為經(jīng)MSC及SNV預(yù)處理后的光譜圖, 圖2(c)和(d)則是MSC-CARS-SPA和SNV-CARS-SPA兩種方法篩選出的12個(gè)特征波長(zhǎng)的權(quán)重分布, 采用點(diǎn)劃線表示特征波長(zhǎng)在預(yù)處理光譜中的位置。 由圖2(a)和(b)可知, 兩種方法提取出的特征波長(zhǎng)在可見光(400~780 nm)與近紅外區(qū)域(780~1 000 nm)的數(shù)量較為均勻, MSC-CARS-SPA的分布比例為1∶1, 而SNV-CARS-SPA的分布比例為5∶7。 但由圖2(c)和(d)可發(fā)現(xiàn): 在權(quán)重分布上, 可見光區(qū)域的權(quán)重明顯高于近紅外區(qū)域, MSC-CARS-SPA的可見光范圍特征波長(zhǎng)累積權(quán)重為71.54%, SNV-CARS-SPA為68.15%; 另外, 兩種方法在400~730 nm范圍提取出的特征波長(zhǎng)具有高度相似性。 在該范圍內(nèi)MSC-CARS-SPA提取出的波長(zhǎng)分別為405, 512, 644和729 nm, 而SNV-CARS-SPA的特征波長(zhǎng)為402, 512, 648, 708和723 nm。 以上波長(zhǎng)的權(quán)重也具有類似變化, 隨波長(zhǎng)增大, 呈先降后升趨勢(shì), 并在730 nm附近達(dá)到最大值, MSC-CARS-SPA篩選的729 nm處的波長(zhǎng)權(quán)重為18.97%, 而SNV-CARS-SPA對(duì)應(yīng)的723 nm的權(quán)重為24.64%, 表明該處波長(zhǎng)信息對(duì)Fv/Fm的反映最為明顯, 這可能是由于該波長(zhǎng)位于植物反射率光譜變化最為明顯的紅邊位置, 而紅邊信息可良好地反映植物的葉綠素含量、 含水率、 氮含量等影響植物生長(zhǎng)發(fā)育的重要生理量, 故此處波長(zhǎng)的權(quán)重最大。
圖2 特征波長(zhǎng)分布及權(quán)值比重
以樣本光譜數(shù)據(jù)特征波長(zhǎng)組合反射率數(shù)據(jù)為輸入, 葉綠素?zé)晒鈪?shù)Fv/Fm為輸出, 分別使用4種機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型, 并與PLSR算法進(jìn)行對(duì)比。 其中, 由于BP神經(jīng)網(wǎng)絡(luò)和ELM算法的隨機(jī)性, 選擇以運(yùn)行十次的決定系數(shù)和均方根誤差的平均值評(píng)價(jià)模型精度。 模型運(yùn)行結(jié)果如表2所示。
由表2可知, 相比于PLSR模型, 四種機(jī)器學(xué)習(xí)模型的訓(xùn)練集的精度都得到了明顯提升, 這是由于機(jī)器學(xué)習(xí)的非線性擬合能力更強(qiáng)。 另外, 除ELM模型, 其他三種機(jī)器學(xué)習(xí)模型的測(cè)試集精度都得到了提高。 但往往存在過擬合現(xiàn)象, 即訓(xùn)練集精度明顯高于測(cè)試集。 在幾種算法中, SVR的建模效果最優(yōu), 其在小樣本訓(xùn)練的優(yōu)勢(shì)得到了體現(xiàn), 表現(xiàn)為最高的決定系數(shù)、 最小的均方根誤差及優(yōu)秀的泛化能力。 在所有模型中, 以SNV-CARS-SPA方法獲取特征波長(zhǎng), 并采用SVR建立的茄子葉片F(xiàn)v/Fm模型的預(yù)測(cè)效果最好, 其訓(xùn)練集與測(cè)試集的擬合結(jié)果分別如圖3(a,b)所示。 其訓(xùn)練集R2為0.912 7, RMSE為0.010 5; 測(cè)試集R2為0.911 7, RMSE為0.010 8, 且模型輸入僅為12個(gè)波長(zhǎng)。 而采用PLSR算法建立的全光譜模型的測(cè)試集R2為0.875 7, RMSE為0.012 9。 這表明本研究所采用的預(yù)處理和變量篩選方法有效地去除了光譜中的冗余信息, 保留了與Fv/Fm最相關(guān)的特征波長(zhǎng)組合, 且SVR算法更適于構(gòu)建光譜數(shù)據(jù)對(duì)Fv/Fm的預(yù)測(cè)關(guān)系。
表2 不同建模方法下的模型精度
圖3 基于SVR構(gòu)建預(yù)測(cè)模型的擬合結(jié)果
以苗期茄子植株為研究對(duì)象, 采用可見-近紅外光譜分析技術(shù)對(duì)其葉綠素?zé)晒鈪?shù)Fv/Fm進(jìn)行定量預(yù)測(cè), 使用多種預(yù)處理方法及變量選擇算法完成特征波長(zhǎng)的篩選, 基于多種機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型, 通過模型精度對(duì)比確定了最優(yōu)數(shù)據(jù)處理方法及建模算法。 主要結(jié)論有以下四點(diǎn):
(1) 通過試驗(yàn)獲取不同F(xiàn)v/Fm的茄子葉片的反射光譜, 分析發(fā)現(xiàn)光譜反射率隨Fv/Fm的增加呈下降趨勢(shì), 在500~700 nm波段處該現(xiàn)象最為明顯。
(2) 采用SG, MSC和SNV進(jìn)行光譜數(shù)據(jù)預(yù)處理, 通過SPA, RF, CARS, CARS-SPA和RF-SPA提取特征波長(zhǎng)組合, 并使用PLSR建立建模。 發(fā)現(xiàn)MSC-CARS-SPA和SNV-CARS-SPA方法提取的波長(zhǎng)組合建模效果最好, 且波長(zhǎng)個(gè)數(shù)僅為12個(gè)。
(3) 由特征波長(zhǎng)權(quán)重分布可知, 可見光區(qū)域的特征波長(zhǎng)權(quán)重明顯高于近紅外區(qū)域, 表明該處特征波長(zhǎng)對(duì)于Fv/Fm的預(yù)測(cè)貢獻(xiàn)更大。 另外, 所有特征波長(zhǎng)中紅邊位置的波長(zhǎng)權(quán)重最大, 對(duì)Fv/Fm的反映最為明顯。
(4) 基于兩類特征波長(zhǎng)信息, 分別使用BP, RBF, ELM和SVR算法建立預(yù)測(cè)模型, 發(fā)現(xiàn)SNV-CARS-SPA-SVR方式建立的模型精度最優(yōu), 其測(cè)試集R2為0.911 7, RMSE為0.010 8。 其精度高于全光譜PLSR模型, 表明本研究所采用的特征波長(zhǎng)篩選方法結(jié)合機(jī)器學(xué)習(xí)算法有效地提高了模型預(yù)測(cè)能力。
本研究基于統(tǒng)計(jì)學(xué)方法, 探索了以可見-近紅外光譜預(yù)測(cè)苗期茄子葉綠素?zé)晒鈪?shù)Fv/Fm的有效方式, 擬進(jìn)一步推廣至不同生長(zhǎng)期的其他作物, 為植物生長(zhǎng)逆境的快速、 無損檢測(cè)提供技術(shù)支撐。