時(shí) 鳴,競(jìng) 霞,史曉亮
(西安科技大學(xué)測(cè)繪科學(xué)與技術(shù)學(xué)院,陜西西安 710054)
植物進(jìn)行光合作用的主要場(chǎng)所是葉綠體[1],其中包含了葉綠素這種主要的光合色素,而葉綠素含量是評(píng)價(jià)植物健康狀況的重要生化指標(biāo)。因此,快速準(zhǔn)確地監(jiān)測(cè)作物葉綠素含量,是實(shí)現(xiàn)作物長(zhǎng)勢(shì)和健康程度精準(zhǔn)監(jiān)測(cè)的關(guān)鍵。傳統(tǒng)的監(jiān)測(cè)葉綠素含量的方法一般都具有破壞性,難以進(jìn)行大面積應(yīng)用[2]。而遙感技術(shù)為植物葉綠素含量的監(jiān)測(cè)提供了不同尺度上的新方法[3]。Sims等通過構(gòu)建綠光波段以及紅邊波段葉綠素指數(shù)進(jìn)行葉綠素含量監(jiān)測(cè)[4]。姜海玲等通過對(duì)冬小麥冠層反射率與對(duì)應(yīng)葉綠素含量的相關(guān)性進(jìn)行分析,篩選出相關(guān)性高的波段構(gòu)建5種光譜指數(shù)[5]。崔小濤等通過分析油菜葉片的SPAD值與光譜參數(shù)的相關(guān)性,挑選出對(duì)SPAD值敏感的參數(shù),構(gòu)建并比較3種模型的反演精度[6]。但以往的反演算法在特征選擇時(shí)常采用相關(guān)性作為判別依據(jù),忽略了特征波段與葉綠素含量之間的非線性關(guān)系。另外,基于原始反射率數(shù)據(jù)及其波段運(yùn)算得到的指數(shù)數(shù)據(jù)易受背景和噪聲的影響。微分處理能夠增強(qiáng)光譜的細(xì)微變化,消除部分背景及噪聲。整數(shù)微分易造成信號(hào)缺失,影響探測(cè)精度。而分?jǐn)?shù)階微分處理能夠突出光譜的漸變信息,被眾多學(xué)者所應(yīng)用。張文文等對(duì)銅含量進(jìn)行分析時(shí)發(fā)現(xiàn),分?jǐn)?shù)階微分能擴(kuò)大特征空間[7]。亞森江·喀哈爾采用分?jǐn)?shù)階微分優(yōu)化光譜指數(shù)并建立模型[8]。蔣明分析不同采樣間隔下分?jǐn)?shù)階微分對(duì)土壤重金屬含量反演的影響[9]。趙慧等為實(shí)現(xiàn)土壤鹽分含量的高精度反演,引入分?jǐn)?shù)階微分對(duì)土壤反射率進(jìn)行處理[10]。分?jǐn)?shù)階微分在一定程度上可以增強(qiáng)弱光譜的吸收特性,保留更多的有用信息?;疑P(guān)聯(lián)分析(grey relational analysis,GRA)是通過分析特征變量與其他變量序列間幾何形狀的相似程度作為判別依據(jù),曲線越相似,兩序列間的關(guān)聯(lián)性就越大。即考慮到參數(shù)間的線性關(guān)系,又對(duì)非線性關(guān)系有所體現(xiàn)。在建模時(shí)BP神經(jīng)網(wǎng)絡(luò)(back propagation network)是常見的建模方法,在數(shù)據(jù)擬合和函數(shù)逼近方面優(yōu)勢(shì)顯著。孫焱鑫等利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行植被葉綠素含量的反演研究[11-12]。朱繼文等運(yùn)用Hyperion數(shù)據(jù)和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)研究區(qū)土壤鹽分含量進(jìn)行反演[13]。但BP神經(jīng)網(wǎng)絡(luò)算法也存在如收斂速度等方面的諸多缺點(diǎn)。因此,本研究利用步長(zhǎng)為0.1的分?jǐn)?shù)階方法對(duì)反射率數(shù)據(jù)進(jìn)行0~2階的光譜處理,再利用灰色關(guān)聯(lián)分析法對(duì)葉綠素含量敏感的分?jǐn)?shù)階光譜特征波段進(jìn)行提取,并作為模型的輸入特征,最后使用遺傳算法(genetic algorithm),優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行葉綠素含量反演,并與未優(yōu)化模型進(jìn)行精度比較,評(píng)價(jià)聯(lián)合GA的BP神經(jīng)網(wǎng)絡(luò)算法在小麥葉綠素含量反演中的有效性。
研究區(qū)位于陜西省岐山縣劉家河村(34.45°N,107.59°E),分別在2021年5月11日、18日和25日進(jìn)行試驗(yàn)測(cè)定。試驗(yàn)樣地選取22塊長(zhǎng)勢(shì)均衡、品種單一的區(qū)域,共標(biāo)記108個(gè)位置,采集健康、完整、無損的葉片,將其裝入密封袋中,放入遮光的便攜式冰箱中,運(yùn)回室內(nèi)測(cè)定。
1.2.1 葉片反射率光譜測(cè)定 光譜數(shù)據(jù)測(cè)量?jī)x器為美國(guó)ASD公司(Analytica Spectral Devices,Inc.)生產(chǎn)的Field Spec便攜式地物光譜儀,儀器的光譜范圍為350~2 500 nm。測(cè)試時(shí)將葉片擦拭干凈,放置在自帶鹵鎢燈光源的葉片夾上。在每張葉片的上、中、下(避開葉脈部分)區(qū)域各測(cè)定10條光譜,共30組光譜數(shù)據(jù),取其每組平均值作為該葉片的光譜反射率。
1.2.2 葉片葉綠素含量測(cè)定 采用分光光度法測(cè)定葉綠素含量。首先,將樣本葉片洗凈、擦干、去除葉柄及葉脈;其次,將其剪碎、研磨、混勻,從中稱取0.4 g樣品放入裝有無水乙醇和99%丙酮1 ∶2混合液的50 mL試瓶中,在密封后搖晃數(shù)次,避光靜置12 h;最后,通過分光光度計(jì)分別測(cè)定萃取液中645、663 nm處的吸光度,根據(jù)公式(1)計(jì)算葉綠素含量值C。
C=20.29×D645 nm+8.05×D663 nm。
(1)
式中:D645 nm、D65 nm分別表示645、663 nm波長(zhǎng)處的吸光度。
1.3.1 分?jǐn)?shù)階微分光譜 分?jǐn)?shù)階微分?jǐn)U展了整數(shù)階微分的概念,能夠細(xì)化高光譜數(shù)據(jù)的局部信息,可有效去除部分背景和噪聲,獲取漸變的光譜信息。分?jǐn)?shù)階微分主要是基于一元函數(shù)差分實(shí)現(xiàn)的[14]。
(2)
式中:x表示高光譜波段;α表示階數(shù);h表示步長(zhǎng);t、a分別表示微分上限和下限;Γ表示Gamma函數(shù)。本研究將步長(zhǎng)h設(shè)置為1,t與a分別為高光譜起始波長(zhǎng),因此,式(2)可被推導(dǎo)為:
(3)
由公式(3)可知,當(dāng)階次為1時(shí),x+1處的微分值僅與x處的微分值相關(guān),而階次為分?jǐn)?shù)時(shí),x+1處的微分值則考慮到前面所有x的影響,因此,分?jǐn)?shù)階微分處理可保留原始光譜的細(xì)節(jié)特征[15]。本研究利用分?jǐn)?shù)階微分對(duì)原始光譜進(jìn)行0~2階步長(zhǎng)為0.1的處理。
1.3.2 灰色關(guān)聯(lián)分析 灰色關(guān)聯(lián)分析是通過關(guān)聯(lián)度來確定各個(gè)因素之間的影響程度。本研究以分?jǐn)?shù)階微分處理后的光譜波段為特征序列,以對(duì)應(yīng)的葉綠素含量值作為母序列進(jìn)行灰色關(guān)聯(lián)分析。關(guān)聯(lián)系數(shù)計(jì)算見公式(4)。
(4)
式中:i=1,2,3,…,n(樣本數(shù));k=1,2,3,…,m(特征數(shù));|x0(k)-xi(k)|表示第i個(gè)樣品第k個(gè)特征的歸一化值與最優(yōu)值的絕對(duì)差值;ρ表示分辨系數(shù),取值為[0,1],使用灰色關(guān)聯(lián)分析時(shí),分辨系數(shù)一般設(shè)置為0.5。
關(guān)聯(lián)度計(jì)算為
(5)
由公式(5)可知,分辨系數(shù)對(duì)關(guān)聯(lián)度的結(jié)果有影響。分辨系數(shù)的取值范圍沒有一定的參考標(biāo)準(zhǔn)。因此,在已有研究成果的基礎(chǔ)上[16],通過計(jì)算樣本數(shù)據(jù)最大和最小標(biāo)準(zhǔn)差,分別用公式(6)和公式(7)確定分辨系數(shù)
p=σmin/(σmin+σmax);
(6)
q=σmax/(σmin+σmax)。
(7)
式中:σmin表示最小標(biāo)準(zhǔn)差;σmax表示最大標(biāo)準(zhǔn)差。則關(guān)聯(lián)系數(shù)計(jì)算公式為
(8)
1.3.3 反演建模方法 神經(jīng)網(wǎng)絡(luò)包含信號(hào)正向傳播和誤差反向傳遞2種主要的學(xué)習(xí)過程[17],其網(wǎng)絡(luò)結(jié)構(gòu)分為輸入層、隱含層和輸出層[18]。但其存在收斂速度慢、易陷入局部極小值等缺點(diǎn)[19]。因此,本研究采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(圖1)。
第一,根據(jù)輸入數(shù)據(jù)確定神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),由隱含層節(jié)點(diǎn)數(shù)的經(jīng)驗(yàn)計(jì)算公式計(jì)算得到其取值范圍,第二,在不同隱含層節(jié)點(diǎn)條件下訓(xùn)練數(shù)據(jù),通過使10次十折交叉驗(yàn)證小訓(xùn)練集訓(xùn)練數(shù)據(jù)誤差均值最小化得到最優(yōu)隱含層節(jié)點(diǎn)數(shù)。第三,生成初始化種群,采用實(shí)數(shù)編碼方式,數(shù)值本身即為編碼,即不存在解碼步驟。其各基因組合為神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值的組合。第四,將其賦值給神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。根據(jù)小測(cè)試集數(shù)據(jù)誤差計(jì)算適應(yīng)度,經(jīng)選擇、交叉和變異操作不斷調(diào)整權(quán)值與閾值,直至達(dá)到終止條件。第五,利用優(yōu)化后的權(quán)值和閾值及最佳隱含層節(jié)點(diǎn)數(shù)對(duì)網(wǎng)絡(luò)重新訓(xùn)練,利用訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行測(cè)試集仿真,并得到反演結(jié)果。
其中,在設(shè)置適應(yīng)度函數(shù)時(shí),以十折交叉驗(yàn)證小測(cè)試集誤差平方和的均值作為目標(biāo)函數(shù),由于目標(biāo)函數(shù)為極小值問題,因此在適應(yīng)度函數(shù)構(gòu)建時(shí)采用倒數(shù)形式。同時(shí)考慮到分母為0的情況,通過分母上目標(biāo)函數(shù)加1,最終構(gòu)成本研究的適應(yīng)度函數(shù)。
F=1/1+mean_error。
(9)
式中:F表示適應(yīng)度值;mean_error表示小測(cè)試集十折交叉驗(yàn)證的誤差平方和的均值,誤差值越小,其適應(yīng)度值越高,當(dāng)誤差為0時(shí),適應(yīng)度值達(dá)到最大值1。
本研究利用輪盤賭法進(jìn)行個(gè)體優(yōu)選。
(10)
式中:Pi表示選擇概率,其值越大,則被選擇的概率越大;Fi表示每個(gè)個(gè)體的適應(yīng)度值。適應(yīng)性更好的個(gè)體更易被選中,模擬優(yōu)勝劣汰。選中的個(gè)體組成新的種群,再根據(jù)公式(11)隨機(jī)交換不同個(gè)體的基因,接著根據(jù)公式(12)和公式(13)進(jìn)行基因變異,產(chǎn)生新的個(gè)體。
(11)
(12)
(13)
式中:b、r、r1皆為0~1之間的隨機(jī)數(shù);G表示當(dāng)前遺傳代數(shù);Gmax表示最大迭代次數(shù)。重復(fù)上述操作100次,得到最優(yōu)個(gè)體,即最優(yōu)權(quán)值與閾值組合,將其作為初始參數(shù)來訓(xùn)練。
統(tǒng)計(jì)原始光譜數(shù)據(jù)和各分?jǐn)?shù)階微分光譜數(shù)據(jù)與葉綠素含量的顯著相關(guān)與極顯著相關(guān)的波段數(shù)量,結(jié)果如表1所示。
由表1可知,隨著分?jǐn)?shù)階階數(shù)的增加,反射率與葉綠素含量相關(guān)性達(dá)到顯著與極顯著水平的波段數(shù)量整體呈現(xiàn)先增加后減少的趨勢(shì),無論是0.05顯著性水平還是0.01顯著性水平,分?jǐn)?shù)階光譜在各個(gè)階次整體多于原始光譜。統(tǒng)計(jì)達(dá)到0.05顯著水平的波段數(shù)為18 782個(gè),達(dá)到0.01極顯著水平的波段數(shù)為14 422個(gè)。表明分?jǐn)?shù)階微分處理能突出光譜的細(xì)微變化,保留更多的有用信息。
對(duì)葉片光譜反射率數(shù)據(jù)進(jìn)行0~2階步長(zhǎng)為0.1的分?jǐn)?shù)階微分處理,并將處理結(jié)果與葉綠素含量進(jìn)行灰色關(guān)聯(lián)分析,篩選出排序前30位的分?jǐn)?shù)階光譜數(shù)據(jù)(表2)。
表1 顯著性檢驗(yàn)波段數(shù)量
表2 分?jǐn)?shù)階微分光譜灰色關(guān)聯(lián)分析(N=108)
由表2可知,與葉綠素含量灰色關(guān)聯(lián)度高的波段主要集中在0.6~0.9分?jǐn)?shù)階微分光譜波段的731~754 nm范圍內(nèi),對(duì)其與葉綠素含量進(jìn)行相關(guān)性分析,其相關(guān)性均達(dá)到極顯著相關(guān)水平。
為簡(jiǎn)化模型,提高GA-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度,減小選擇出的特征波段間信息冗余。通過灰色關(guān)聯(lián)分析后的排序,逐次計(jì)算波段間的相關(guān)性,剔除波段間相關(guān)性高的波段,最終篩選出與葉綠素含量關(guān)聯(lián)度較高且波段間相關(guān)性較低的10個(gè)波段,分別為0.6階的751、760 nm,0.7階的744、751 nm,0.8階的738、747 nm,0.9階的738、750 nm,1.0階的731、750 nm,其與葉綠素含量的相關(guān)性均達(dá)到極顯著相關(guān)水平。
為更客觀地評(píng)價(jià)模型精度、可靠性及穩(wěn)定性,減少由于樣本選擇不同而引起的模型精度差異,本研究利用十折交叉驗(yàn)證的方式擴(kuò)充數(shù)據(jù)集。將108個(gè)數(shù)據(jù)點(diǎn)分為訓(xùn)練集(80個(gè))和測(cè)試集(28個(gè))。又將訓(xùn)練集數(shù)據(jù)按照8 ∶2的比例分為小訓(xùn)練集(64個(gè))和小測(cè)試集(16個(gè)),用于模型參數(shù)的校正和建模,測(cè)試集數(shù)據(jù)用于模型的精度評(píng)定。
GA-BP神經(jīng)網(wǎng)絡(luò)模型中另一個(gè)重要參數(shù)為種群規(guī)模的選擇。本研究通過設(shè)置10~60間且步長(zhǎng)為10的不同種群規(guī)模(個(gè)),以測(cè)試集數(shù)據(jù)的均方根誤差RMSE作為評(píng)判標(biāo)準(zhǔn),選擇均方根誤差(RMSE)值最小的種群規(guī)模作為模型的最優(yōu)種群規(guī)模。不同種群規(guī)模下測(cè)試集數(shù)據(jù)均方根誤差和運(yùn)行時(shí)間見圖3。
當(dāng)種群規(guī)模設(shè)置為30個(gè)時(shí),GA-BP神經(jīng)網(wǎng)絡(luò)模型估算農(nóng)作物葉片葉綠素含量與實(shí)測(cè)葉綠素含量之間的均方根誤差最小,且隨著種群規(guī)模的增加,模型運(yùn)行時(shí)間也顯著延長(zhǎng)。
綜上,最終確定遺傳算法和神經(jīng)網(wǎng)絡(luò)選擇參數(shù)(表3)。
表3 遺傳算法和BP神經(jīng)網(wǎng)絡(luò)參數(shù)
由圖4可知,隨著進(jìn)化代數(shù)的逐漸增加,小測(cè)試集數(shù)據(jù)每代的平均適應(yīng)度和最佳適應(yīng)度都呈現(xiàn)上升趨勢(shì),即小測(cè)試集數(shù)據(jù)的誤差值逐漸降低。在第40代時(shí)最佳適應(yīng)度達(dá)到最佳,往后波動(dòng)幅度極小,逐漸趨于穩(wěn)定。
對(duì)驗(yàn)證集數(shù)據(jù)在BP神經(jīng)網(wǎng)絡(luò)模型和遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型下對(duì)葉綠素含量的預(yù)測(cè)結(jié)果進(jìn)行繪圖分析(圖5)。通過數(shù)據(jù)分析可知,BP神經(jīng)網(wǎng)絡(luò)模型對(duì)葉綠素含量的預(yù)測(cè)結(jié)果普遍遠(yuǎn)低于實(shí)際值,可能是由于BP神經(jīng)網(wǎng)絡(luò)模型易陷入局部極小值。對(duì)BP神經(jīng)網(wǎng)絡(luò)模型(y2)和GA-BP神經(jīng)網(wǎng)絡(luò)模型(y1)的驗(yàn)證集實(shí)測(cè)值與預(yù)測(cè)值的一元線性回歸可知,BP神經(jīng)網(wǎng)絡(luò)模型決定系數(shù)r2為0.952,均方根誤差RMSE為15.761,GA-BP神經(jīng)網(wǎng)絡(luò)模型決定系數(shù)r2為0.952,均方根誤差RMSE為3.647,GA-BP神經(jīng)網(wǎng)絡(luò)模型采用遺傳算法優(yōu)化網(wǎng)絡(luò)的權(quán)值和閾值,使葉綠素含量預(yù)測(cè)精度得到提高。相比于BP神經(jīng)網(wǎng)絡(luò)模型反演精度更高,預(yù)測(cè)效果好。
遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值組合進(jìn)行選擇、交叉和變異操作,利用優(yōu)化后的模型訓(xùn)練數(shù)據(jù),使得模型的預(yù)測(cè)能力較好。
與原始光譜相比,分?jǐn)?shù)階微分光譜與葉綠素含量達(dá)到顯著與極顯著相關(guān)性的波段數(shù)量顯著增加,說明基于分?jǐn)?shù)階微分處理原始光譜能夠突出光譜的細(xì)微信息,描述光譜數(shù)據(jù)間的微小差異。
目前,劉潤(rùn)等在葉綠素含量預(yù)測(cè)領(lǐng)域應(yīng)用了各種模型,其中對(duì)神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化與改進(jìn)的模型反演精度優(yōu)于原始模型[21],這與本研究結(jié)果一致。葉綠素含量主要反映在可見光與近紅外光譜波段,主要是由于不同葉綠素含量的植物葉片對(duì)光子的吸收與重吸收作用不同。但無論是基于原始光譜數(shù)據(jù)還是基于其數(shù)學(xué)變換的數(shù)據(jù),皆受到數(shù)據(jù)采集條件等因素的限制,與基于物理的模型相比,得出的結(jié)論不適用于大面積宏觀預(yù)測(cè)。但由于該類模型操作較簡(jiǎn)單便捷,因此得到了廣泛應(yīng)用。
由于不同作物葉綠素含量不同,同種作物葉綠素含量也受種植條件、生育期、水肥脅迫等影響,導(dǎo)致無法確立統(tǒng)一的模型。本研究所建立的模型僅限于本研究區(qū)域。
本研究以冬小麥試驗(yàn)小區(qū)為基礎(chǔ),測(cè)量關(guān)中地區(qū)冬小麥葉片反射率及其對(duì)應(yīng)的葉綠素含量。為增強(qiáng)光譜曲線的細(xì)微變化,消除背景及噪聲對(duì)光譜的影響,突出光譜的漸變信息,通過分?jǐn)?shù)階微分這一數(shù)學(xué)變換方法,對(duì)冬小麥葉片光譜數(shù)據(jù)進(jìn)行0~1階步長(zhǎng)為0.1的分?jǐn)?shù)階光譜變換,再通過灰色關(guān)聯(lián)度分析,提取10種關(guān)聯(lián)度高且波段間相關(guān)性低的分?jǐn)?shù)階光譜特征作為模型的輸入?yún)?shù)。為克服BP神經(jīng)網(wǎng)絡(luò)模型收斂速度慢和易陷入局部極小值等缺點(diǎn),運(yùn)用遺傳算法(GA)對(duì)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行優(yōu)化。結(jié)果表明,遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)葉綠素含量的預(yù)測(cè)精度更高,可為小麥葉綠素含量預(yù)測(cè)提供一定的理論和技術(shù)支持。