呂小艷,薛 琳,競(jìng) 霞,張 超,徐海清,朱啟法
(1西安科技大學(xué)測(cè)繪科學(xué)與技術(shù)學(xué)院,西安710054;2中國(guó)農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京100083;3安徽皖南煙葉有限責(zé)任公司,安徽宣城242000)
煙草作為中國(guó)的重要經(jīng)濟(jì)作物,科學(xué)化、精細(xì)化的管理對(duì)于提高煙草質(zhì)量至關(guān)重要,煙草施肥、長(zhǎng)勢(shì)與品質(zhì)的監(jiān)管主要依據(jù)于煙草生化參數(shù),葉綠素作為煙草主要生化參數(shù)之一,是葉片葉綠體內(nèi)進(jìn)行光合作用的主要色素[1],并且可用于煙草氮素狀況、產(chǎn)量[2-5]等的預(yù)測(cè)。快速精準(zhǔn)無(wú)損地估測(cè)煙草葉片的葉綠素含量,有助于及時(shí)掌握煙草的長(zhǎng)勢(shì)狀況,為種植管理者提供科學(xué)依據(jù)。
傳統(tǒng)實(shí)驗(yàn)室化學(xué)測(cè)定葉綠素含量的方法耗時(shí),同時(shí)對(duì)作物具有破壞性。SPAD(soil and plant analyzer development)值可準(zhǔn)確表征葉綠素含量,但獲取SPAD值時(shí)需要反復(fù)接觸葉片,不適于大范圍葉綠素信息的獲取[6]。高光譜數(shù)據(jù)具有快速、無(wú)損特點(diǎn),已廣泛應(yīng)用于SPAD值的估測(cè)[7-11]。
目前,利用高光譜估算SPAD值的研究中,主要通過(guò)反射率原始數(shù)據(jù)[12]、變換數(shù)據(jù)[13-15]、微分?jǐn)?shù)據(jù)[16,17]與SPAD的關(guān)系,反演SPAD值。而利用微分?jǐn)?shù)據(jù)估測(cè)SPAD值的研究中,主要基于整數(shù)階微分,但整數(shù)階微分忽略了微分光譜的漸變信息,限制了估測(cè)模型的精度[18]。分?jǐn)?shù)階微分作為整數(shù)階微分的拓展,可以突出光譜的細(xì)微信息[19-21]。王敬哲等[22]通過(guò)分?jǐn)?shù)階微分處理的光譜數(shù)據(jù),研究了荒漠土壤鉻含量反演,得出分?jǐn)?shù)階微分優(yōu)于一階微分。Fu等[23]通過(guò)研究地面高光譜遙感和Landsat 8 OLI數(shù)據(jù)的Grünwald-Letnikov分?jǐn)?shù)階微分光譜數(shù)據(jù)與土壤有效鉀含量的相關(guān)性,表明分?jǐn)?shù)階微分可描述光譜數(shù)據(jù)的微小差異,茹克亞·薩吾提等[24]利用經(jīng)過(guò)對(duì)數(shù)變換和分?jǐn)?shù)階微分處理的光譜計(jì)算的植被指數(shù)建立偏最小二乘模型,實(shí)現(xiàn)了小麥葉綠素含量的估算。
上述研究表明,對(duì)高光譜數(shù)據(jù)進(jìn)行分?jǐn)?shù)階微分處理可挖掘高光譜數(shù)據(jù)的細(xì)微信息,且利用分?jǐn)?shù)階微分估測(cè)葉綠素含量是可行的,但目前該方法應(yīng)用于煙草生化參數(shù)估測(cè)的研究較為鮮見(jiàn),煙草是典型的雙子葉植物,它的收獲對(duì)象為葉片,估測(cè)葉片的SPAD值對(duì)于預(yù)測(cè)煙草產(chǎn)量具有重要意義。煙草旺長(zhǎng)期是煙草的重要生育期,此時(shí)煙草的葉片數(shù)、葉面積、干物質(zhì)積累迅速增加,是決定葉數(shù)、葉面積和葉重的關(guān)鍵時(shí)期,也是決定產(chǎn)量和品質(zhì)的重要階段。因此,本文以旺長(zhǎng)期煙葉為研究對(duì)象,在以高光譜數(shù)據(jù)估測(cè)煙葉SPAD值的基礎(chǔ)上,提出了利用高光譜分?jǐn)?shù)階微分估測(cè)煙葉SPAD值的方法,研究分?jǐn)?shù)階微分光譜在煙葉SPAD值估測(cè)中的可行性,以期為煙草長(zhǎng)勢(shì)監(jiān)測(cè)提供科學(xué)依據(jù)。
以安徽省宣城市(29°56′48′—31°19′30′N,117°57′54"—119°38′39′E)為研究區(qū),該區(qū)域?qū)儆诘湫偷膩啛釒Ъ撅L(fēng)氣候,年平均溫度為15.6℃,年降水量1200~1500 mm,無(wú)霜期8個(gè)月,適宜煙草種植[25]。煙草品種為‘云煙97’,大田生長(zhǎng)期為3月中下旬至7月下旬,種植行距1.2 m,株距0.45 m左右。試驗(yàn)選取能夠代表該研究區(qū)特性的煙田16塊,每個(gè)田塊布設(shè)5個(gè)樣點(diǎn),樣點(diǎn)之間相距50 m,共80個(gè)樣點(diǎn)。
2019年5月7日—11日,采用美國(guó)SVC HR-640i型全波段地物光譜儀,實(shí)地采集煙葉高光譜數(shù)據(jù)。測(cè)量時(shí)天氣晴朗、無(wú)風(fēng)。視場(chǎng)角為25°,探頭垂直向下。北京時(shí)間11:00—15:00進(jìn)行光譜測(cè)量,以煙草的中部葉為測(cè)量目標(biāo),每片葉子采集5次光譜數(shù)據(jù),將平均值作為該樣本光譜反射率數(shù)據(jù),每次測(cè)量前后均用標(biāo)準(zhǔn)參考板進(jìn)行標(biāo)定。該儀器有640通道,光譜探測(cè)范圍為350 nm~2500 nm。在350~1000 nm波段的帶寬≤1.5 nm,1000~1890 nm 波段的帶寬≤14 nm,1890~2500 nm波段的帶寬≤10 nm。對(duì)應(yīng)于煙葉光譜的測(cè)定位置,采用SPAD-502便捷式葉綠素儀測(cè)定煙葉的SPAD值,每片葉子測(cè)量3次SPAD值,取平均值作為該葉片的SPAD值。
1.3.1 光譜數(shù)據(jù)預(yù)處理及最優(yōu)變換方式確定 便于分?jǐn)?shù)階微分光譜的計(jì)算,將反射率光譜重采樣為間隔1 nm,并利用Savitzky-Golay(SG)濾波進(jìn)行平滑去噪。此外,利用原始反射率(R)和8種變換的反射率數(shù)據(jù)[倒數(shù)(1/R)、對(duì)數(shù)(logR)、均方根(SqrtR)、倒數(shù)對(duì)數(shù)(log(1/R))、對(duì)數(shù)倒數(shù)(1/logR)、均方根倒數(shù)(1/SqrtR)、多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變換(SNV)]與SPAD值進(jìn)行相關(guān)性分析,通過(guò)統(tǒng)計(jì)達(dá)到0.001顯著水平的波段數(shù),以確定估測(cè)煙葉SPAD值的最優(yōu)光譜變換方式,波段數(shù)越多表明與煙葉SPAD值的響應(yīng)關(guān)系越優(yōu)。由表1可知,SNV變換光譜與SPAD值達(dá)到0.001顯著水平的波段數(shù)量最多為654,表明SNV變換光譜與SPAD值的響應(yīng)關(guān)系最優(yōu),因此,SNV為最優(yōu)變換方式。
表1 變換光譜與SPAD值達(dá)到0.001水平相關(guān)的波長(zhǎng)數(shù)量
1.3.2 高光譜分?jǐn)?shù)階微分 分?jǐn)?shù)階微分是整數(shù)階微分的擴(kuò)展,常用的分?jǐn)?shù)階微分采用Grünwald-Letnilov(G-L)方法,其定義如式(1)[26]。
為了確定輸入模型的特征波長(zhǎng),提高模型精度。首先通過(guò)分析煙葉分?jǐn)?shù)階微分光譜與煙葉SPAD值的相關(guān)性,去除未達(dá)到0.001顯著水平的波長(zhǎng),實(shí)現(xiàn)數(shù)據(jù)降維;然后基于RF算法及OOB重要性方法實(shí)現(xiàn)特征波長(zhǎng)的篩選。
RF是通過(guò)Bootstrap的方法抽取訓(xùn)練樣本集,每個(gè)樣本未被抽中的概率為(1-2/n)n=0.368,(n足夠大時(shí)),這些未被抽中的樣點(diǎn)成為OOB[27],然后利用OOB,計(jì)算每個(gè)波長(zhǎng)變量的重要性,其具體步驟如下[28]:
(1)以袋外樣本數(shù)據(jù)對(duì)n顆回歸樹(shù)測(cè)試,得到每棵樹(shù)t的OOB誤差(errOOBt);
(2)以隨機(jī)擾動(dòng)方法打亂袋外樣本數(shù)據(jù)中變量XK的值,形成新袋外測(cè)試集,以新OOB測(cè)試集對(duì)n顆回歸樹(shù)測(cè)試,得到擾動(dòng)后每棵樹(shù)t的OOB誤差(errOOB′t);
(3)計(jì)算兩次測(cè)試的OOB誤差的差值的平均值,即為單棵樹(shù)對(duì)變量XK重要性得分,計(jì)算如公式(2)所示。
雖然OOB對(duì)波長(zhǎng)進(jìn)行了的重要性評(píng)價(jià),但最終波長(zhǎng)數(shù)量的過(guò)多或過(guò)少都會(huì)影響模型的準(zhǔn)確率和穩(wěn)定性。為此,本文將波長(zhǎng)按照重要性從大到小進(jìn)行排序,選取排序前20的波長(zhǎng),依次增加波長(zhǎng)的數(shù)量作為RF模型的自變量,即,第一次僅用排序第一的波段建模,第二次使用排序第一、二的波段建模(1≤e≤20,e為波長(zhǎng)數(shù)量),SPAD值為因變量,構(gòu)建估測(cè)煙葉SPAD值模型,以決定系數(shù)(determination coefficient,R2)的最大值確定特征波長(zhǎng)。
將樣本數(shù)據(jù)(g=80)按照2:1的比例隨機(jī)分成訓(xùn)練集(g=60)和驗(yàn)證集(g=20),以特征波長(zhǎng)為自變量,SPAD為因變量,基于RF算法建立煙葉SPAD值估測(cè)模型,并通過(guò)R2和均方根誤差(root mean square error,RMSE)2個(gè)指標(biāo)對(duì)煙葉SPAD估測(cè)模型進(jìn)行精度驗(yàn)證。
表2為不同階次下估測(cè)煙葉SPAD值的特征波長(zhǎng)數(shù)量及特征波長(zhǎng),通過(guò)分析不同階次的特征波長(zhǎng)可知,估測(cè)煙葉SPAD值的特征波長(zhǎng)主要有葉綠素強(qiáng)反射區(qū)的綠波段(499、500 nm),葉綠素強(qiáng)吸收帶的紅邊波段(634、636、702、703、732nm)、反映煙草冠層和葉片細(xì)胞結(jié)構(gòu)的近紅外波段(972、1286、1289、1295、1298、1316 nm)、和煙草含水量狀況相關(guān)的短紅外波段(1450、1453、1456、1806 nm)。
表2 不同階次特征波長(zhǎng)數(shù)量及特征波長(zhǎng)對(duì)應(yīng)表
以特征波長(zhǎng)為自變量,煙葉SPAD值為因變量,建立RF-SPAD模型,模型精度如表3所示。由表3可知,RF-SPAD模型訓(xùn)練集R2的范圍為0.824~0.925,比較穩(wěn)定且較高。RF-SPAD模型驗(yàn)證集R2的范圍為0.346~0.690,RMSE的范圍為2.782~3.932,驗(yàn)證集精度最高的模型為1.9階次的RF-SPAD模型,R2=0.690,RMSE=2.799,其R2比0、1、2階次分別提高了22.1%、42.6%、87%,RMSE比0、1、2階次RMSE分別減少了13.5%,20.2%,27.8%。由煙葉實(shí)測(cè)與估測(cè)SPAD值散點(diǎn)圖(圖1)可以看出,SPAD小于44時(shí),估測(cè)SPAD大于實(shí)測(cè)SPAD,在SPAD大于44時(shí),估測(cè)SPAD小于實(shí)測(cè)SPAD,表明該模型在SPAD值低時(shí)會(huì)高估SPAD值,而在SPAD值較高時(shí),會(huì)低估SPAD值。
圖1 1.9階次的RF-SPAD模型估測(cè)SPAD值與實(shí)測(cè)SPAD值的擬合關(guān)系
表3 RF-SPAD模型精度
續(xù)表3
為了進(jìn)一步確定分?jǐn)?shù)階微分的優(yōu)越性,利用偏最小二乘(PLS)和BP神經(jīng)網(wǎng)絡(luò)(BP)模型建立了估測(cè)煙葉SPAD值的PLS-SPAD、BP-SPAD模型,模型精度見(jiàn)表4,由表4可知,BP-SPAD模型的最優(yōu)估測(cè)精度在1.1階,R2為0.589較0、1、2階分別提高了25.8%、25.6%、38.0%,RMSE為3.219比0、1、2階分別減少了9%、15.7%、13.6%;PLS-SPAD模型的最優(yōu)估測(cè)精度在1.4階,R2為0.660較0、1、2階分別提高了19.7%、41.6%、145.4%,RMSE為2.870比0、1、2階分別減少了17.6%、22.0%、33.4%。
表4 PLS-SPAD、BP-SPAD模型驗(yàn)證集精度
為了更有效地利用高光譜估測(cè)葉綠素含量,林少喆等[29]通過(guò)數(shù)學(xué)變換后的反射率光譜構(gòu)建了不同光譜變換形式下冬小麥冠層SPAD值監(jiān)測(cè)模型,結(jié)果表明不同光譜變換形式下適宜模型的組合可提高SPAD值監(jiān)測(cè)效果;武倩雯等[30]以玉米抽雄期葉片為研究對(duì)象,探究了葉片葉綠素含量與多種高光譜參數(shù)的關(guān)系,表明預(yù)測(cè)玉米抽雄期葉綠素含量的最佳模型為:y葉綠素=6912x760+44.878(x760為760 nm處的光譜反射率一階微分值)。盡管這些研究表明,通過(guò)對(duì)原始反射率光譜進(jìn)行數(shù)學(xué)變換可以較好地估測(cè)葉綠素含量,但未結(jié)合分?jǐn)?shù)階微分,而本文在最優(yōu)變換的基礎(chǔ)上利用分?jǐn)?shù)階微分算法對(duì)光譜進(jìn)行了處理,挖掘了高光譜信息估測(cè)葉綠素的潛能,為提高葉綠素估測(cè)模型的精度提供了更大的可能。
在葉綠素含量估測(cè)模型構(gòu)建方面,本文除了建立RF-SPAD模型,為了進(jìn)一步確定分?jǐn)?shù)階微分的優(yōu)越性,還建立了PLS-SPAD、BP-SPAD模型,發(fā)現(xiàn)利用分?jǐn)?shù)階微分處理后的高光譜數(shù)據(jù)所建立的煙葉SPAD值估測(cè)模型較整數(shù)階微分具有較好的穩(wěn)定性和預(yù)測(cè)能力。但在不同的估測(cè)模型中,精度最高時(shí)所對(duì)應(yīng)的階次不同,RF-SPAD模型為1.9階次、BP-SPAD模型為1.1階次,PLS-SPAD模型為1.4階次,表明葉綠素含量估測(cè)模型精度的變化除了受特征波長(zhǎng)的影響,還受到RF、BP、PLS自身性能的影響,即使基于相同的因變量與自變量方法,但使用不同的機(jī)器學(xué)習(xí)建模方法,得出的結(jié)果會(huì)存在差異。
受高光譜數(shù)據(jù)采集的限制,本文僅在煙草旺長(zhǎng)期建立了煙葉SPAD值估測(cè)模型,隨著煙草生長(zhǎng)地域、品種、生育期的變化,光譜與SPAD值的響應(yīng)關(guān)系也會(huì)發(fā)生變化,因此該模型是否適用于不同煙草品種、不同生育期煙葉SPAD值的預(yù)測(cè)還需進(jìn)一步驗(yàn)證。再者本研究?jī)H利用地面高光譜數(shù)據(jù)研究了分?jǐn)?shù)階微分在葉綠素含量估測(cè)中的可行性,應(yīng)用于無(wú)人機(jī)遙感、衛(wèi)星遙感數(shù)據(jù)的效果如何,是今后研究大尺度葉綠素含量估測(cè)的方向。
本文基于高光譜分?jǐn)?shù)階微分光譜,利用1.9階次的特征波長(zhǎng)所構(gòu)建的RF-SPAD模型R2=0.690,較0、1、2階次分別提高了22.1%、42.6%、87.0%,RMSE=2.799,比0、1、2階分別減少了13.5%,20.2%,27.8%,表明利用分?jǐn)?shù)階微分光譜進(jìn)行煙葉SPAD值估測(cè)是可行的,為高光譜數(shù)據(jù)定量估測(cè)作物SPAD值提供了新的思路。