朱幸輝,周 勇*
(湖南農(nóng)業(yè)大學(xué) 信息科學(xué)與技術(shù)學(xué)院,湖南 長沙 410128)
植物葉子是進(jìn)行光合作用和呼吸作用,制造有機(jī)養(yǎng)料的重要器官,對(duì)植物生長來說至關(guān)重要,因此必須保證其健康。一旦發(fā)生病害,必須及時(shí)進(jìn)行治療[1]。病害特征主要通過葉片狀態(tài)顯現(xiàn),因此番茄病害識(shí)別主要通過番茄葉片出現(xiàn)的病斑來實(shí)現(xiàn)[2]。早先番茄葉片病斑識(shí)別主要通過人眼去判斷其類別,不僅容易出錯(cuò),還效率地下,因此當(dāng)前番茄葉片病斑識(shí)別,主要目標(biāo)檢測算法來實(shí)現(xiàn),如基于遺傳算法、AdaBoost算法、隨機(jī)森林算法等,其原理先將圖像轉(zhuǎn)換成不同大小,然后分別目標(biāo)檢測,最后將結(jié)果綜合起來,得到識(shí)別結(jié)果[3]。由于圖像是經(jīng)過分割等多重處理的,圖像中部分信息會(huì)丟失,因此mAP(Mean Average Precision),即均值平均精度并不高。
針對(duì)上述情況,本次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用其中,提出一種新的番茄葉片病斑識(shí)別方法。方法最大特點(diǎn)了節(jié)省了圖像預(yù)處理環(huán)節(jié),直接輸入整體圖像即可,需要進(jìn)行圖像分割、轉(zhuǎn)換,只需完成圖像質(zhì)量改善即可,且它將特征提取、特征選擇和特征分類融合為一體,直接利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)每個(gè)滑動(dòng)窗口產(chǎn)生的候選區(qū)進(jìn)行二分類,判斷其是否為待檢測目標(biāo)[4]。最后通過仿真實(shí)例驗(yàn)證本文方法有效性,結(jié)果表明:與基于遺傳算法、AdaBoost算法的目標(biāo)識(shí)別方法相比,本文基于卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別方法mAP較高,即能更為準(zhǔn)確、迅速的完成病害辨別,為其防止提供了重要的理論依據(jù)。
番茄是人們?nèi)粘o嬍持谐R姷囊环N蔬菜,包含了大量的纖維素、鉀元素、蘋果酸、胡蘿卜素、番茄紅素等營養(yǎng)物質(zhì),因此每年我國都會(huì)種植大量番茄。而在番茄種植中,會(huì)發(fā)生多種病害,如早疫病、晚疫病、葉霉病、灰霉病、葉斑病等,具體見表1[5]。
表1 番茄多種病害描述
本文以番茄為對(duì)象,基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行其葉片病斑識(shí)別研究,研究思路如圖1所示。
圖1 基于卷積神經(jīng)網(wǎng)絡(luò)番茄葉片病斑識(shí)別思路
通過攝像頭獲取到原始圖像,圖像預(yù)處理中,包括圖像灰度化、圖像去噪、圖像增強(qiáng)三項(xiàng)內(nèi)容[6]。
1)圖像灰度化
圖像灰度化是圖像預(yù)處理中必經(jīng)步驟,主要作用是將采集到的彩色圖像轉(zhuǎn)變?yōu)橛刹煌幕叶燃?jí)的圖像。
攝像頭采集下來的原始圖像多數(shù)都為彩色圖像,即包括RGB及CMYK兩種,其中前者更為常見,因此下述圖像灰度化就以RGB彩色圖像為對(duì)象進(jìn)行說明。RGB彩色圖像由R(紅色)、G(綠色)、B(藍(lán)色)三種不同顏色成分組合而成圖像。而R(紅色)、G(綠色)、B(藍(lán)色)像素的不同是造成圖像彩色的原因,因此只要消除彩色圖像中三種顏色不同像素值之間的差距,即使R=G=B,即可實(shí)現(xiàn)圖像灰度化[7]。不同灰度化表達(dá)式分別如下所示:
①分量法
(1)
其中,Gk(i,j)(k=1,2,3)為轉(zhuǎn)換后的灰度圖像在(i,j)處的灰度值;R(i,j)、G(i,j)、B(i,j)分別是彩色圖像在(i,j)處的R、G、B分量
②最大值法
G(i,j)=max[R(i,j),G(i,j),B(i,j)]
(2)
③平均值法
(3)
④加權(quán)平均法
G(i,j)=0.299R(i,j)+0.578G(i,j)+0.114B(i,j)
(4)
2)圖像去噪
現(xiàn)實(shí)中的數(shù)字圖像在采集、處理和傳輸過程中常受到成像設(shè)備與外部環(huán)境噪聲干擾等影響,造成圖像質(zhì)量下降,因此需要減少圖像中噪聲影響,提高圖像質(zhì)量,這一過程就被稱為圖像去噪。目前圖像方法有多種,在本文中選擇基于小波閾值的方法進(jìn)行去噪[8]。首先對(duì)二維圖像p(x1,x2)進(jìn)行小波域的二維Mallat分解,如圖2所示。
圖2 Mallat算法分解重構(gòu)
圖中,L代表低頻子圖、H代表水平方向的高頻子圖、V代表垂直方向的高頻子圖、D代表對(duì)角線方向的高頻子圖。利用二維小波分解與重構(gòu)算法所具有可分離的特性,對(duì)二維信號(hào)依次按行、按列與一維的低通濾波器和高通濾波器進(jìn)行卷積,二維基本小波ψ(x1,x2)要遵循容許性條件cψ:
(5)
上式中,ω1、ω2表示圖像的頻率信息。
圖像P在經(jīng)過Mallat算法分解后,其圖像中有用信息會(huì)基本分布在低頻部分,即L低頻子圖中,這一部分的小波系數(shù)的絕對(duì)值較大;而圖像中無用信息,即噪聲的分解系數(shù),會(huì)集中分布在高頻子圖中,這一部分的小波系數(shù)絕對(duì)值則較小。
根據(jù)上述描述,小波閾值去噪基本原理如下:當(dāng)分解的小波系數(shù)小于某個(gè)臨界閾值時(shí),則認(rèn)為是噪聲造成的,過濾掉,而當(dāng)分解的小波系數(shù)大于某個(gè)臨界閾值時(shí),則認(rèn)為是有用信息,保留下來。即大于該閾值的小波系數(shù)含有噪聲圖像信號(hào)的概率趨近于零,其表達(dá)式如下所示:
(6)
式中,σn表示零均值高斯白噪聲的標(biāo)準(zhǔn)方差,N表示圖像信號(hào)長度。
最后將保留下來的小波系數(shù)進(jìn)行重構(gòu),即可獲得M×M帶有噪聲的圖像去噪后的圖像[9]。
(7)
3)圖像增強(qiáng)
圖像灰度化和去噪后,圖像會(huì)存在失真現(xiàn)象,圖像中部分信息會(huì)丟失,因此還需要進(jìn)行圖像增強(qiáng),選擇直方圖均衡化方法進(jìn)行圖像增強(qiáng),其基本原理是根據(jù)積分概率密度函數(shù),將去噪圖像直方圖轉(zhuǎn)化為概率密度為1的圖像,此時(shí)為理想情況,在一定程度上提高對(duì)比度。
卷積神經(jīng)網(wǎng)絡(luò),從數(shù)據(jù)流角度來看,包括三個(gè)部分:輸入層、特征提取和輸出層;而從結(jié)構(gòu)上看,則由一個(gè)或多個(gè)卷積層、池化層和全連通層組成[10]。
圖3 卷積神經(jīng)網(wǎng)絡(luò)
其中,卷積層主要作用是對(duì)輸入的圖像進(jìn)行卷積運(yùn)算,提取圖像局部特征,因此卷積層也被稱為特征提取層。池化層主要作用對(duì)卷積層提取到的圖像局部特征進(jìn)行下采樣,即利用局部相關(guān)性聚合圖像局部特征,以較少的信息代表局部特征,減少特征維數(shù),因此池化層也被稱為下采樣層。全連通層是卷積神經(jīng)網(wǎng)絡(luò)的分類器,利用輸入信號(hào)的加權(quán)求和以及非線性激活函數(shù),將提取到的圖像特征映射到樣本的標(biāo)記空間當(dāng)中,實(shí)現(xiàn)圖像分類,即完成番茄葉片病斑識(shí)別[11-12]。
在本章節(jié)中,選擇卷積神經(jīng)網(wǎng)絡(luò)中的SSD算法來完成番茄葉片病斑識(shí)別。在CNN系列的許多模型中,Region Proposal和分類是分作兩塊[12],而SSD算法模型是將二者統(tǒng)一在一起,使得目標(biāo)識(shí)別更加簡單和快速。根據(jù)SSD算法的匹配策略,定義xij=1來表示第i個(gè)默認(rèn)框匹配類別p的第j個(gè)真實(shí)框,可能有多個(gè)默認(rèn)框的閾值大于 0.5。目標(biāo)損失函數(shù)是位置損失和置信損失的加權(quán)和,目標(biāo)函數(shù)表示如下
(8)
式中,N表示默認(rèn)框的個(gè)數(shù),Lloc(x,l,g)表示位置損失,即預(yù)測框與真實(shí)標(biāo)簽框之間的平滑損失值,Lconf(x,c)表示置信度損失,α設(shè)置為 1。
充分利用不同尺度的特征圖來預(yù)測邊界框的類別分?jǐn)?shù)和位置偏移,可大大提高檢測精度。
SSD 的檢測架構(gòu)如圖4所示:
圖4 SSD 的檢測架構(gòu)
在訓(xùn)練期間,需要用默認(rèn)框來與圖片所標(biāo)記的真實(shí)框進(jìn)行匹配。黑框默認(rèn)匹配到病變區(qū)域,能夠正確匹配到真實(shí)框的設(shè)定為正樣本,其余的框設(shè)定為負(fù)樣本。為保證其有效性和準(zhǔn)確性,SSD模型應(yīng)用前需要進(jìn)行訓(xùn)練。SSD模型訓(xùn)練具體流程如圖5所示。
圖5 SSD模型訓(xùn)練流程
于2019年7月15日在山東省某番茄種植基地利用佳能A640數(shù)碼攝像機(jī)拍攝番茄葉片病害圖片作為本章實(shí)例分析樣本。該樣本情況如下表2所示。
表2 實(shí)驗(yàn)樣本情況
為降低這些圖片對(duì)計(jì)算機(jī)系統(tǒng)的壓力,需要利用Matlab7.0軟件對(duì)每幅圖片進(jìn)行分辨率壓縮,壓縮規(guī)格為256×256,最后以JPEG格式導(dǎo)入計(jì)算機(jī)當(dāng)中,構(gòu)建番茄葉片病害圖像數(shù)據(jù)庫。
表3 實(shí)驗(yàn)平臺(tái)參數(shù)設(shè)置
3.3.1 病斑識(shí)別結(jié)果分析
為進(jìn)一步驗(yàn)證該識(shí)別方法的有效性,分析不同方法的病斑識(shí)別結(jié)果。
圖6 不同方法病斑識(shí)別結(jié)果分析
由上圖可以看出,遺傳算法與AdaBoost算法均難以從病害圖像中準(zhǔn)確的識(shí)別病斑,對(duì)于識(shí)環(huán)境干擾無法做出準(zhǔn)確判斷。卷積神經(jīng)網(wǎng)絡(luò)方法展示出了良好的分割效果及魯棒性。主要原因在于選擇卷積神經(jīng)網(wǎng)絡(luò)中的SSD算法來完成番茄葉片病斑識(shí)別,SSD模型應(yīng)用前需要進(jìn)行訓(xùn)練,保證了識(shí)別的有效性和準(zhǔn)確性。
3.3.2 溫室番茄病害識(shí)別
為驗(yàn)證卷積神經(jīng)網(wǎng)絡(luò)識(shí)別番茄葉片病斑準(zhǔn)確性,采用測試數(shù)據(jù)集對(duì)模型進(jìn)行測試,測試結(jié)果顯示在測試結(jié)果面板中。如圖7所示。
圖7 識(shí)別結(jié)果顯示面板
由圖7可以看出,以霜霉病以及白粉病為例,各去數(shù)據(jù)集415個(gè)、332個(gè)。在數(shù)據(jù)處理結(jié)果顯示的混淆矩陣中,霜霉病樣本中正確識(shí)別率達(dá)到47.6%,樣本識(shí)別個(gè)數(shù)為1070個(gè),白粉病樣本中,正確識(shí)別率達(dá)到48.1%,樣本識(shí)別個(gè)數(shù)為1027個(gè)。其中,識(shí)別錯(cuò)誤率較低,不超過4%,白粉病誤識(shí)率為0.8%,霜霉病的誤識(shí)率為3.5%。整體來說,病害識(shí)別率高達(dá)95.7%,霜霉病以及白粉病的識(shí)別準(zhǔn)確率分別為93.1%、98.4%。依據(jù)上述數(shù)據(jù)結(jié)果,可知該方法可準(zhǔn)確識(shí)別番茄病害,為病害治療提供理論依據(jù)。
3.3.3 葉片平均檢測精度值(mAP)分析
番茄葉片病斑識(shí)別方法的評(píng)價(jià)指標(biāo)為mAP值,即均值平均精度,是指每個(gè)類別AP(PR曲線圍起來的面積)的平均值,其值越高代表方法的識(shí)別性能越好。通過下式計(jì)算mAP值,結(jié)果如下表4所示。
表4 mAP值測試結(jié)果
(9)
式中,AveragePrecisionC表示驗(yàn)證集中葉片圖片各類別的平均精度之和,N(Classes)表示所有類別的數(shù)目。
從表4中可以看出,利用基于卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行番茄葉片病斑識(shí)別,得到的mAP值為0.988,而利用基于遺傳算法、AdaBoost算法進(jìn)行番茄葉片病斑識(shí)別,得到的mAP值分別為0.847、0.836。以上三種結(jié)果對(duì)比可知,本文基于卷積神經(jīng)網(wǎng)絡(luò)的番茄葉片病斑識(shí)別方法的性能更好,識(shí)別準(zhǔn)確率更高。
綜上所述,農(nóng)作物在生長過程中,無法避免會(huì)產(chǎn)生病害,對(duì)其產(chǎn)量和質(zhì)量造成了嚴(yán)重影響,因此必須進(jìn)行及時(shí)、有效的治療。而治療之前,確定其病因?qū)τ谥委煷胧┻x擇具有重要意義。本次以番茄病害為例,利用基于卷積神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行番茄葉片病斑識(shí)別,并以基于遺傳算法、AdaBoost算法目標(biāo)識(shí)別方法作為對(duì)比項(xiàng),進(jìn)行仿真實(shí)例分析。結(jié)果表明,本文方法得到的mAP值更高,病斑識(shí)別識(shí)別性能更強(qiáng),病害識(shí)別結(jié)果較為準(zhǔn)確,這為病害治療措施的選擇提供了重要的理論依據(jù)。