劉 莉 陶紅燕 方 靜 鄭文娟 王良龍 金 秀
(1.安徽農(nóng)業(yè)大學(xué)園藝學(xué)院, 合肥 230036; 2.安徽農(nóng)業(yè)大學(xué)信息與計(jì)算機(jī)學(xué)院, 合肥 230036)
梨在我國(guó)的種植范圍廣泛,產(chǎn)量?jī)H次于蘋果、柑橘[1]。在梨樹的生長(zhǎng)過程中,各種病害不僅威脅著梨樹的生長(zhǎng),還會(huì)影響梨果實(shí)的品質(zhì),最典型的有黑斑病、炭疽病、銹病等,且病害的大規(guī)模爆發(fā)會(huì)造成嚴(yán)重的經(jīng)濟(jì)損失[2]。因此,及時(shí)檢測(cè)梨葉片病害,并采取針對(duì)性的病害防治措施,對(duì)于梨樹病害防治、減少經(jīng)濟(jì)損失有著重要意義。
在梨樹諸多病害中,炭疽病和黑斑病的發(fā)病癥狀相似,僅憑肉眼很難區(qū)分。盡管目前可見-近紅外檢測(cè)技術(shù)[3-5]、機(jī)器視覺檢測(cè)技術(shù)[6-7]等已經(jīng)廣泛運(yùn)用于農(nóng)作物的無損檢測(cè),但是可見-近紅外只能檢測(cè)到農(nóng)作物的內(nèi)部信息,而無法獲取其外部特征,機(jī)器視覺檢測(cè)技術(shù)雖然可以獲得農(nóng)作物的外部特征,但是卻無法檢測(cè)其內(nèi)部信息。相比之下,高光譜技術(shù)具有圖譜合一的特點(diǎn),既可以探測(cè)到農(nóng)作物的外部圖像信息,又可以獲得其內(nèi)部品質(zhì)信息。
目前已有很多學(xué)者利用高光譜技術(shù)在農(nóng)產(chǎn)品品質(zhì)檢測(cè)方面做了大量研究[8-10]。國(guó)外學(xué)者側(cè)重于將高光譜技術(shù)用于肉類以及水果的品質(zhì)測(cè)定[11-12],國(guó)內(nèi)學(xué)者則多將此技術(shù)應(yīng)用于蔬菜水果農(nóng)產(chǎn)品的無損檢測(cè)、病蟲害識(shí)別與分類[13-15]。ELMASRY等[16]利用波長(zhǎng)400~1 000 nm的高光譜成像儀采集“Mclntosh”蘋果的高光譜圖像,建立了“Mclntosh”蘋果的早期損傷判別模型,并通過試驗(yàn)表明,利用高光譜技術(shù)可以有效識(shí)別損傷1 h以上的蘋果與正常蘋果;MEHL[17]利用高光譜技術(shù)建立了Golden Delicious、Gala、Red Delicious 3個(gè)品種蘋果的表面損傷程度的檢測(cè)模型,檢測(cè)結(jié)果的準(zhǔn)確率分別為85%、95%和76%;吳龍國(guó)等[18]利用高光譜圖像采集技術(shù)采集了波長(zhǎng)400~1 000 nm范圍的高光譜圖像,對(duì)靈武長(zhǎng)棗表面的外部碰傷缺陷進(jìn)行檢測(cè),結(jié)果較為理想;李勛蘭等[19]利用高光譜成像技術(shù)采集了4種柚子的上表面與下表面的高光譜圖像,構(gòu)建了柚子種類鑒別的識(shí)別模型,準(zhǔn)確率分別為99.46%和98.44%。但目前有關(guān)利用高光譜技術(shù)對(duì)梨樹病害種類進(jìn)行識(shí)別研究的報(bào)道比較少。
本文以碭山酥梨葉片黑斑病與炭疽病為研究對(duì)象,以碭山酥梨正常葉片、炭疽病葉片與黑斑病葉片的高光譜圖像為試驗(yàn)樣本,通過對(duì)高光譜圖像光譜信息的預(yù)處理、特征波長(zhǎng)提取,并結(jié)合支持向量機(jī)(SVM)與反向傳播(BP)神經(jīng)網(wǎng)絡(luò)模式識(shí)別等建立碭山酥梨炭疽病和黑斑病的識(shí)別模型,以期為果樹的病害識(shí)別提供參考依據(jù)與技術(shù)支持。
本試驗(yàn)供試材料為安徽農(nóng)業(yè)大學(xué)資源育種實(shí)驗(yàn)室盆栽碭山酥梨葉片,挑選采集葉片大小均勻、葉面較為寬大、位于新梢頂端且健康的嫩葉葉片,共90片。
提前在實(shí)驗(yàn)室配置好炭疽病與黑斑病菌絲。接種病菌前,用標(biāo)簽標(biāo)注每片葉片,并采集所有葉片正反兩面的高光譜圖像,共獲取180幅高光譜圖像。然后對(duì)90片樣品葉片進(jìn)行菌絲塊接種處理。
為了觀察各葉片從健康狀態(tài)到發(fā)病狀態(tài)的連續(xù)動(dòng)態(tài)過程,自接種病菌當(dāng)天開始連續(xù)對(duì)葉片進(jìn)行高光譜圖像采集,每天記錄發(fā)病葉片的標(biāo)簽號(hào)及其發(fā)病癥狀,并將肉眼所能看到的發(fā)病癥狀與高光譜圖像上的癥狀作比較。
圖1 高光譜圖像采集系統(tǒng)Fig.1 Hyperspectral image acquisition system1.50 W鹵素?zé)?2.精密云臺(tái) 3.高光譜相機(jī) 4.樣本 5.便攜式計(jì)算機(jī)
試驗(yàn)所采用的高光譜圖像采集系統(tǒng)如圖1所示。采用美國(guó)OKSI公司的Hycan1211型高光譜相機(jī),其圖像分辨率為1 620像素×2 325像素,光譜分辨率為1.79 nm,波長(zhǎng)范圍為400~1 000 nm,光譜采集點(diǎn)有339個(gè)波段。
拍攝環(huán)境封閉,儀器被置于用遮光布搭建的棚中,拍攝時(shí)除了光源外無其他任何干擾。同時(shí),為了確保穩(wěn)定的光源照射強(qiáng)度,每次采集高光譜圖像之前將高光譜儀預(yù)熱30 min,然后在計(jì)算機(jī)上對(duì)配套軟件進(jìn)行參數(shù)設(shè)置以保證采集到的圖像清晰且不失真:掃描角度設(shè)置為-10°~10°,掃描速度設(shè)置為1.844(°)/s,鏡頭焦距為60 nm,相機(jī)曝光時(shí)間為10 ms。圖2為利用高光譜儀器采集的高光譜圖像樣例。
圖2 高光譜圖像Fig.2 Hyperspectral images
為了減少試驗(yàn)過程中外界自然光、暗箱內(nèi)照明以及采集系統(tǒng)本身暗電流對(duì)高光譜圖像質(zhì)量的影響,需要進(jìn)行黑白板圖像校正。黑白板標(biāo)定公式為
式中R——校正后圖像I——原始圖像
W——白板圖像B——全黑圖像
圖3 病害葉片圖像樣例Fig.3 Sample images of diseased leaves
同時(shí)為了進(jìn)一步從光譜圖像上確定對(duì)應(yīng)的病害區(qū)域,用相機(jī)拍攝發(fā)病葉片每天的狀態(tài),進(jìn)行對(duì)照,分辨率在70ppi以上。拍攝背景統(tǒng)一使用單一白色,拍攝距離為15~20 cm,圖像保存為JPEG格式,采集的圖像樣例如圖3所示。
1.3.1信息提取
基于ENVI 4.7軟件對(duì)高光譜圖像進(jìn)行操作,操作過程主要分為2部分:①提取感興趣區(qū)域,獲取病害區(qū)域與健康葉片的平均光譜反射率,通過光譜反射率曲線從光譜角度找差別并建立模型,從而進(jìn)行炭疽病、黑斑病與健康葉片的高精度分類。②對(duì)所有的圖像進(jìn)行主成分分析,一方面可以對(duì)高光譜數(shù)據(jù)進(jìn)行數(shù)據(jù)降維,獲取每個(gè)感興趣區(qū)域的數(shù)據(jù)矩陣,另一方面可以通過計(jì)算主成分貢獻(xiàn)率獲取主成分圖像與特征波長(zhǎng)。
高光譜圖像感興趣區(qū)域提取的具體操作:首先,在ENVI 4.7軟件中打開需處理的梨葉片高光譜圖像(圖4a);然后,采用ROI TOOL多邊形感興趣區(qū)域選擇工具分割出感興趣區(qū)域,如圖4b所示,即葉片中形如圓形斑點(diǎn)所示的發(fā)病區(qū)域;將感興趣區(qū)域的數(shù)據(jù)保存為.txt文件和.sta文件,.txt和.sta文件中都包括了400~1 000 nm高光譜圖像339個(gè)波段,曲線中間一條白色曲線即為DN值(像素值)的平均值;用Excel將.sta文件與.txt文件打開,獲取到感興趣區(qū)域的相關(guān)信息后,通過DN平均值數(shù)據(jù),并根據(jù)黑白標(biāo)定公式計(jì)算出感興趣區(qū)域的平均光譜反射率;最后,得到有效光譜反射率圖。
1.3.2信息預(yù)處理
為了提高后期建模效率,使得光譜變化輪廓更加清楚并提高光譜數(shù)據(jù)的信噪比,需在建模前對(duì)提取出的高光譜圖像感興趣區(qū)域的平均反射率數(shù)據(jù)進(jìn)行預(yù)處理。剔除不符合條件的曲線后,獲得可供建模的光譜反射曲線共計(jì)440條,如圖5a所示, 葉片平均光譜反射率如圖5b所示。從整個(gè)光譜反射率曲線可以觀察到,健康葉片、炭疽病葉片與黑斑病葉片的光譜反射曲線整體走勢(shì)一致,差別在于反射率的大小。
圖4 提取感興趣區(qū)域流程圖Fig.4 Flow chart of extracting region of interest
圖5 葉片光譜反射率Fig.5 Leaf spectral reflectance diagrams
獲得原始曲線后,采用多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變換(SNV)和Savitzky-Golay(S-G)卷積平滑法分別對(duì)其進(jìn)行預(yù)處理,預(yù)處理后反射率見圖6。由圖6可知,MSC減少了樣本之間發(fā)生基線偏移或平移現(xiàn)象,最大限度地保留樣本中與化學(xué)成分相關(guān)的光譜吸收信息;S-G法對(duì)光譜數(shù)據(jù)進(jìn)行平均計(jì)算并重新分配誤差,對(duì)每個(gè)數(shù)據(jù)點(diǎn)進(jìn)行處理,去除光譜數(shù)據(jù)中的高頻噪聲并保留有用的低頻信息,不存在波峰與波谷的區(qū)別,這樣的優(yōu)點(diǎn)是可以讓光譜曲線發(fā)生傾斜偏移與線性平移;與MSC算法相比,SNV算法的不同之處在于單獨(dú)對(duì)每個(gè)樣本的光譜進(jìn)行校正,并且不需要理想光譜,但是每個(gè)波段吸光度均符合正態(tài)分布[20]。
圖6 不同算法預(yù)處理后所有葉片原始平均光譜反射率Fig.6 Original average spectral reflectance of all leaves after preprocessing by different algorithms
3種方法雖然具體運(yùn)算過程不同,但都間接提高了原始光譜數(shù)據(jù)的信噪比及后期的建模效率。其中,基于SNV法的預(yù)處理效果最佳。
通過高光譜成像技術(shù)得到的數(shù)據(jù)信息量豐富,但冗余信息也相對(duì)較多,繼而對(duì)后期建模效率、模型精度等會(huì)產(chǎn)生一系列影響,因此需從原有光譜中提取與樣本化學(xué)成分相關(guān)的波段和波長(zhǎng)來進(jìn)行降維處理。本試驗(yàn)采取的特征提取方法有主成分分析法(PCA)、連續(xù)投影算法(SPA)、無信息變量消除法(UVE)、競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(CARS)和隨機(jī)蛙跳算法(SFLA)。PCA算法需要選擇貢獻(xiàn)率大的波長(zhǎng),且要求累計(jì)貢獻(xiàn)率之和大于85%;SPA算法利用少數(shù)幾列光譜概括大部分原始光譜的變量信息[21-22];UVE算法可以去除光譜中含有的較多噪聲,優(yōu)選出特征波長(zhǎng);CARS算法不僅可以有效去除無信息變量,而且還可以最大程度地減少共線性變量對(duì)模型的影響[23];SFLA算法具有遺傳算法和PSO算法的優(yōu)勢(shì),在數(shù)據(jù)降維中具有重要的作用[24]。
1.5.1基于特征波段的支持向量機(jī)(SVM)分類識(shí)別建模
SVM模型的核心思想是通過找出邊際最大的決策邊界ωx+b=0,對(duì)數(shù)據(jù)進(jìn)行分類。本研究中SVM算法選取的核函數(shù)為徑向基核函數(shù)(Radical basis function, RBF)。研究通過調(diào)整懲罰參數(shù)c及核函數(shù)參數(shù)g來提升模型的泛化性能,從而使得模型有更好的預(yù)測(cè)效果。
具體步驟如下:
(1) 選定建模集與測(cè)試集
本試驗(yàn)所采集的樣本分為兩部分:①采集的樣本包括炭疽病與黑斑病病害區(qū)域的平均光譜反射率,以這部分樣本的高光譜數(shù)據(jù)作為測(cè)試集。②所獲取的樣本經(jīng)過了從葉片健康狀態(tài)到發(fā)病狀態(tài)且病斑從小到大的連續(xù)動(dòng)態(tài)過程,樣本量大,以這部分采集的高光譜數(shù)據(jù)作為建模集。
(2) 數(shù)據(jù)歸一化預(yù)處理
SVM網(wǎng)絡(luò)訓(xùn)練對(duì)建模集與測(cè)試集都進(jìn)行歸一化處理,以提高尋找最優(yōu)解的效率,保證程序在運(yùn)行時(shí)收斂加快。
(3) 參數(shù)尋優(yōu)
本次建模試驗(yàn)以準(zhǔn)確率為評(píng)價(jià)指標(biāo),通過十折交叉驗(yàn)證,選取建模效果最優(yōu)的c和g,有效避免模型欠擬合現(xiàn)象的發(fā)生,同時(shí)保證了模型的泛化能力。
1.5.2BP神經(jīng)網(wǎng)絡(luò)分類識(shí)別建模
BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層與輸出層組成,各層有若干個(gè)節(jié)點(diǎn),層與層之間直接通過權(quán)重來連接。核心步驟分為正向傳播與反向傳播。反向傳播依靠學(xué)習(xí)率η和梯度更新權(quán)重。本研究搭建的BP神經(jīng)網(wǎng)絡(luò)隱含層設(shè)置為1層,激活函數(shù)為tanh,輸出層的激活函數(shù)為softmax。
用測(cè)試集驗(yàn)證模型在未知樣本上的表現(xiàn),所建的各SVM模型以分類準(zhǔn)確率作為評(píng)價(jià)指標(biāo)。對(duì)各BP模型以分類準(zhǔn)確率、召回率、F1值為評(píng)價(jià)指標(biāo)進(jìn)行綜合評(píng)價(jià)。準(zhǔn)確率即從模型預(yù)測(cè)角度出發(fā),表示在預(yù)測(cè)為i(i=1,2,3)的樣本中,預(yù)測(cè)正確的比率。召回率是從樣本的角度出發(fā),表示的是標(biāo)簽為i(i=1,2,3)的樣本中,被正確預(yù)測(cè)的比率。F1值為準(zhǔn)確率與召回率的調(diào)和平均值。
樣本的平均光譜反射曲線共440條,分別編號(hào)1~440。具體劃分結(jié)果如表1所示,用標(biāo)簽1、2、3分別代表健康葉片、炭疽病葉片和黑斑病葉片。類別1健康葉片所對(duì)應(yīng)的編號(hào)為1~140,建模集曲線100條,測(cè)試集曲線40條;類別2炭疽病葉片所對(duì)應(yīng)的編號(hào)為141~290,建模集曲線110條,測(cè)試集曲線40條;類別3黑斑病葉片所對(duì)應(yīng)的編號(hào)為291~440,建模集曲線110條,測(cè)試集曲線40條。
表1 碭山酥梨葉片樣本光譜劃分Tab.1 Spectral division of ‘Dangshan’ pear leaf samples
PCA、SPA、UAE、CARS、SFLA法提取的特征波長(zhǎng)如表2所示。
(1)PCA法。對(duì)碭山酥梨健康葉片、炭疽病葉片和黑斑病葉片光譜數(shù)據(jù)求取各變量的標(biāo)準(zhǔn)差并進(jìn)行標(biāo)準(zhǔn)差變換,然后計(jì)算各主成分的累計(jì)貢獻(xiàn)率,并對(duì)加權(quán)系數(shù)加權(quán)平均,經(jīng)過內(nèi)部的交叉驗(yàn)證,將339個(gè)原始光譜波段壓縮為27個(gè)主成分。
(2)SPA法。原始光譜數(shù)據(jù)是一個(gè)440×339的光譜矩陣,將最小特征波長(zhǎng)數(shù)設(shè)置為15,任意選擇一列向量,計(jì)算該列向量在剩余所有列向量上的投影,輸出最大投影對(duì)應(yīng)的列向量序號(hào),當(dāng)均方根誤差(RMSECV)最小時(shí),對(duì)應(yīng)的波長(zhǎng)即特征波長(zhǎng)。
(3)UVE法。經(jīng)過UVE處理之后,共有15個(gè)被認(rèn)為是有用信息的特征波長(zhǎng)。
(4)CARS法。CARS是利用蒙特卡洛方法采樣,當(dāng)程序運(yùn)行100次時(shí),采樣次數(shù)為56,從中選擇44個(gè)樣本建立偏最小二乘模型并計(jì)算該模型的回歸系數(shù)的絕對(duì)值與各回歸系數(shù)的權(quán)重,當(dāng)最優(yōu)變量子集確定的十折交叉驗(yàn)證法均方根誤差(RMSECV)最小值等于1.27時(shí),提取的特征波長(zhǎng)數(shù)有26個(gè)。
(5)SFLA法。利用SFLA法可以計(jì)算出每個(gè)變量被選擇的概率,經(jīng)過之前對(duì)梨樹葉片光譜數(shù)據(jù)的分析,本試驗(yàn)中將變量被選擇的概率閾值設(shè)置為0.8,經(jīng)過程序運(yùn)行,提取出的最優(yōu)特征波長(zhǎng)為20個(gè)。
5種方法提取的特征波長(zhǎng)多集中在400~550 nm間,表明病變?nèi)~片內(nèi)部成分變化較為明顯的多集中響應(yīng)在此波段范圍內(nèi)。
表2 不同算法提取的特征波長(zhǎng)Tab.2 Characteristic wavelength selected by different algorithms
各模型分類準(zhǔn)確率如表3所示。
表3 各SVM模型分類預(yù)測(cè)準(zhǔn)確率Tab.3 Prediction results of SVM models
將PCA、CARS、SPA、UVE和SFLA算法所選取的特征波長(zhǎng)作為SVM支持向量機(jī)的輸入變量,本試驗(yàn)中SVM所應(yīng)用的核函數(shù)為RBF,其中參數(shù)g與c的最優(yōu)取值均采用十折交叉驗(yàn)證法實(shí)現(xiàn)。參數(shù)g即函數(shù)自帶參數(shù)gamma,決定了數(shù)據(jù)映射到新的特征空間后的分布,gamma值影響支持向量機(jī)的數(shù)量。參數(shù)c即懲罰參數(shù),即對(duì)誤差的寬容度。因此,PCA-SVM、CARS-SVM、SPA-SVM、UVE-SVM和SFLA-SVM模型中的最優(yōu)c值均為16,最優(yōu)g值均為0.062 5。
(1)PCA-SVM測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖7a。將這27個(gè)特征波長(zhǎng)作為輸入變量,并對(duì)c和g劃分網(wǎng)格進(jìn)行搜索,采用十折交叉驗(yàn)證方法,得到最佳的c值為16,最佳的g值為0.062 5,最佳的RMSECV,即得到的所有分類準(zhǔn)確率的平均數(shù)為87.925 7??傊С窒蛄繑?shù)為137,每類樣本支持向量數(shù)為115,建模集分類識(shí)別率為93.71%,測(cè)試集樣本分類識(shí)別率為90.83%,均方根誤差為0.205 1,預(yù)測(cè)效果良好。
(2)SPA-SVM測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖7b。最佳的RMSECV為87.735 8。總支持向量數(shù)為146,每類樣本的支持向量數(shù)為123,建模集識(shí)別率為94.80%,120個(gè)預(yù)測(cè)樣本中正確分類的個(gè)數(shù)為111,測(cè)試集識(shí)別率為93.25%,均方根誤差為0.154 7。建模集和測(cè)試集的識(shí)別率均達(dá)到了90%以上,說明SPA-SVM具有較好的預(yù)測(cè)效果。
圖7 基于不同算法的SVM模型測(cè)試集分類結(jié)果Fig.7 Classification results of SVM model test set based on different algorithms
(3)UVE-SVM測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖7c。得到懲罰參數(shù)c為16,核函數(shù)參數(shù)g為0.062 5,最佳的RMSECV為80.625 0??傊С窒蛄繑?shù)為236,每類樣本的支持向量數(shù)為198,建模集分類識(shí)別率為87.14%,測(cè)試集樣本分類識(shí)別率為86.23%,均方根誤差為1.175 0。與PCA-SVM和SPA-SVM模型相比,UVE-SVM模型的優(yōu)點(diǎn)在于準(zhǔn)確無誤地將健康葉片樣本識(shí)別出來。
(4)CARS-SVM測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖7d。得到懲罰參數(shù)c為16,核函數(shù)參數(shù)g為0.062 5,最佳的RMSECV為86.525 6。總支持向量數(shù)為155,每類樣本支持向量數(shù)為129。最終得到的建模集樣本分類識(shí)別率為87.14%,測(cè)試集樣本分類識(shí)別率為86.23%,均方根誤差為0.158 3。
(5)SFLA-SVM測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖7e。得到懲罰參數(shù)c為16,核函數(shù)參數(shù)g為0.062 5,最佳的RMSECV為81.25。總支持向量數(shù)為238,每類樣本支持向量數(shù)為203。建模集分類識(shí)別率為87.14%。
當(dāng)實(shí)際測(cè)試集分類圖例與預(yù)測(cè)測(cè)試集分類圖例相重合時(shí),分類結(jié)果即為正確,反之則說明模型分類錯(cuò)誤。通過所有測(cè)試集的實(shí)際分類與預(yù)測(cè)分類圖發(fā)現(xiàn),SVM支持向量機(jī)幾乎可以識(shí)別所有的正常葉片,分類誤差較大的為黑斑病葉片與炭疽病葉片。
各模型分類準(zhǔn)確率如表4所示。
表4 各BP模型分類預(yù)測(cè)準(zhǔn)確率Tab.4 Prediction results of BP models
(1)PCA-BP測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖8a。此模型的學(xué)習(xí)率為0.1,網(wǎng)絡(luò)結(jié)構(gòu)為27-20-3(輸入層有27個(gè)節(jié)點(diǎn),隱藏層有20個(gè)節(jié)點(diǎn),輸出層有3個(gè)節(jié)點(diǎn))。此模型幾乎可以識(shí)別所有的正常葉片,但在炭疽病識(shí)別上,表現(xiàn)能力欠佳,在測(cè)試集40個(gè)炭疽病葉片樣本中,有29片被誤判為黑斑病葉片。
(2)SPA-BP測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖8b。此模型學(xué)習(xí)率為0.1,網(wǎng)絡(luò)結(jié)構(gòu)為12-50-3。SPA-BP建模集準(zhǔn)確率為86.88%,為5個(gè)模型中最佳,且可以識(shí)別所有的正常葉片,誤差集中在2處:將16片炭疽病葉誤判成黑斑病葉片,將9片黑斑病葉片誤判成炭疽病葉片。
(3)UVE-BP測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖8c。此模型學(xué)習(xí)率為0.2,網(wǎng)絡(luò)結(jié)構(gòu)為15-16-3。UVE-BP在識(shí)別正常葉片方面表現(xiàn)出色,38片正常葉片分類正確,僅將2片正常葉片誤判為黑斑病葉片。在識(shí)別炭疽病葉片方面,UVE-BP 將28片炭疽病葉片判定正確,但將余下12片誤判為黑斑病葉片。在黑斑病葉片的識(shí)別上,25片被判定正確,只有1片葉片被誤判為正常葉片,還有14片葉片被誤判為炭疽病葉片。
(4)CARS-BP測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖8d。此模型學(xué)習(xí)率為0.2,網(wǎng)絡(luò)結(jié)構(gòu)為26-40-3。CARS-BP測(cè)試集準(zhǔn)確率為79.17%,為5個(gè)模型中最高,且識(shí)別出了大部分正常葉片,僅有6枚葉片被誤判為炭疽病葉片。分類誤差較大的集中在炭疽病葉片和黑斑病葉片的識(shí)別上,但CARS-BP可識(shí)別將近75%的炭疽病葉片,以及80%的黑斑病葉片。
(5)SFLA-BP測(cè)試集的實(shí)際分類和預(yù)測(cè)分類結(jié)果見圖8e。此模型學(xué)習(xí)率為0.1,網(wǎng)絡(luò)結(jié)構(gòu)為20-50-3。SFLA-BP幾乎可以識(shí)別所有的正常葉片,40片正常葉片樣本中僅有2片被誤判。SFLA-BP識(shí)別了75%的炭疽病葉片,余下的葉片樣本被誤判為黑斑病葉片。然而此模型在黑斑病葉片樣本的識(shí)別方面誤差較大,40個(gè)樣本中有18片葉片被誤判,且大多被誤判為炭疽病葉片。
圖8 基于不同算法的BP模型測(cè)試集分類結(jié)果Fig.8 Classification results of BP model test set based on different algorithms
所建的各模型中,健康葉片、炭疽病、黑斑病葉片測(cè)試集的分類準(zhǔn)確率、召回率、F1值如表5所示,建模集的各評(píng)價(jià)指標(biāo)如表6所示。
表5 BP模型測(cè)試集分類預(yù)測(cè)結(jié)果Tab.5 Test set classification prediction results of BP models
表6 BP模型建模集分類預(yù)測(cè)結(jié)果Tab.6 Training set classification prediction results of BP models
在所建的5個(gè)SVM模型中,測(cè)試集準(zhǔn)確率大于85%的模型為SPA-SVM、PCA-SVM、CARS-SVM、UVE-SVM。其中基于SPA算法優(yōu)選的特征變量建立的SVM模型性能最好,在減少模型變量的同時(shí)提高了模型精度。SPA算法將用于建模的特征波長(zhǎng)由339個(gè)減少到了12個(gè),測(cè)試集精度達(dá)到了93.25%,且相對(duì)于其它模型,SPA-SVM可以準(zhǔn)確無誤地將健康葉片樣本識(shí)別出來,表明SPA法較其他4種特征波長(zhǎng)提取方法,更大限度地剔除了噪聲數(shù)據(jù),降低了相關(guān)性小的波長(zhǎng)的干擾,同時(shí)提高了光譜的表現(xiàn)能力。在所建的各BP模型中,建模集準(zhǔn)確率最高的模型為SPA-BP模型,準(zhǔn)確率為86.88%,測(cè)試集準(zhǔn)確率最高的模型為CARS-BP模型,準(zhǔn)確率為79.17%。綜上所述,SPA-SVM模型效果最佳。
經(jīng)試驗(yàn)發(fā)現(xiàn),所建的10個(gè)模型分別能識(shí)別大部分的梨炭疽病與黑斑病葉片,但由于2種病葉的表現(xiàn)癥狀過于相似,導(dǎo)致識(shí)別結(jié)果存在或多或少的偏差。在實(shí)際生產(chǎn)中,可以將模型結(jié)果與肉眼觀察到的果實(shí)發(fā)病特征相結(jié)合進(jìn)行對(duì)比分析,從而進(jìn)一步提高2種葉片識(shí)別的準(zhǔn)確率:梨炭疽病果實(shí)表面有褐色的病斑,明顯下陷,軟腐,中央有大量輪紋狀排列隆起的黑色小粒點(diǎn),即病菌分生孢子盤,且潮濕時(shí)呈緋紅色黏液形式從中溢出;患有黑斑病的梨果果面通常出現(xiàn)一至數(shù)個(gè)黑色斑點(diǎn),略凹陷,隨著時(shí)間的推移,顏色變淺,形成淺褐至灰褐色圓形病斑,且發(fā)病后期病果畸形、龜裂,裂縫可深達(dá)果心,果面和裂縫內(nèi)產(chǎn)生黑霉,并常常引起落果[25-27]。
(1)采用近紅外高光譜成像技術(shù),獲取目標(biāo)樣本的光譜數(shù)據(jù),用ENVI 4.7軟件提取碭山酥梨病葉的感興趣區(qū)域并進(jìn)行處理,再用MSC、S-G平滑法、SNV分別對(duì)原始圖像進(jìn)行預(yù)處理。相較而言,基于SNV法的預(yù)處理效果最佳。
(2)基于PCA、SPA、UVE、CARS和SFLA分別提取了27、12、15、26、20條特征波長(zhǎng),5種方法均有效剔除了與建模無相關(guān)性或相關(guān)性小的波段,提高了信噪比并提升了后期建模精度。
(3)在病害識(shí)別模型建立的方法上,一方面,基于特征波長(zhǎng)并利用支持向量機(jī)進(jìn)行數(shù)據(jù)建模,在基于5種方法所建的分類模型中,SPA-SVM模型識(shí)別效果最佳,其建模集準(zhǔn)確率為94.80%,測(cè)試集準(zhǔn)確率為93.25%,均方根誤差為0.154 7。另一方面,BP神經(jīng)網(wǎng)絡(luò)是完全不同于SVM的識(shí)別分類方式,CARS-BP模型的測(cè)試集準(zhǔn)確率最高(79.17%)。結(jié)果表明,近紅外高光譜技術(shù)可以較好地應(yīng)用在梨炭疽病和黑斑病葉片的識(shí)別檢測(cè)中,且利用高光譜技術(shù)可以為識(shí)別碭山酥梨葉片黑斑病與炭疽病提供在線技術(shù)支持與理論依據(jù)。
(4)由于梨炭疽病葉片和黑斑病葉片內(nèi)部物質(zhì)元素的變化,借助近紅外高光譜技術(shù),2種病葉能在相應(yīng)波段呈現(xiàn)出不同的特點(diǎn),因此2種病葉能被區(qū)分開,葉片識(shí)別率較人工分辨顯著提高,大大改善了憑肉眼難以區(qū)分2種病葉的問題。