吳開興 苗雪菲 馬文妙
摘要:采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)創(chuàng)建番茄病害識(shí)別模型,對(duì)番茄的健康葉片圖像及7種病害圖像進(jìn)行預(yù)處理;采用深度學(xué)習(xí)架構(gòu)TensorFlow進(jìn)行CNN訓(xùn)練;研究了卷積層采用不同尺寸的卷積核及池化層采用不同的池化方法對(duì)番茄病害識(shí)別模型性能的影響。實(shí)驗(yàn)表明卷積層采用尺寸為5×5,3×3的卷積核及池化層采用最大值池化建立的模型分類識(shí)別效果好。測(cè)試集的平均識(shí)別率達(dá)到95.47%,該模型較本研究設(shè)計(jì)的其他模型分類識(shí)別率提高,魯棒性較強(qiáng),為后續(xù)蔬菜病害診斷與防治提供研究基礎(chǔ)。
關(guān)鍵詞: 卷積神經(jīng)網(wǎng)絡(luò);番茄病害;圖像處理;分類識(shí)別模型
中圖分類號(hào):TP37 ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)25-0025-03
Abstract:The model of tomato disease recognition was established by using a convolutional neural network (CNN). Images of healthy tomato leaves and seven kinds of tomato disease images were processed. And the deep CNN was trained by deep learning framework Tensor Flow. The effects of different sizes of the convolution kernel and different pooling methods on the performance of the tomato disease recognition model were studied. The convolution layer adopted the convolution kernel with a size of 5×5,3×3 and the pooling layer adopted the model established by max_pooling, the model classification and recognition accuracy was better. The training times were 1000 times, and the classification and identification accuracy was 95.47%.Compared with other models in this study, this model had a higher classification and recognition effect, stronger robustness, and provideda research foundation for the subsequent diagnosis and prevention of vegetable diseases.
Key words:convolutional neural network(CNN); tomato disease; image processing; classification and recognition model
隨著計(jì)算機(jī)技術(shù)的持續(xù)進(jìn)步,其被眾多領(lǐng)域普遍運(yùn)用,20世紀(jì)末用于識(shí)別病蟲害。王海濤等[1]利用圖像處理技術(shù)和計(jì)算機(jī)技術(shù)設(shè)計(jì)了柑橘病毒病的診斷系統(tǒng)。崔艷麗等[2]利用基于色度的特征值提取對(duì)兩種黃瓜病害識(shí)別進(jìn)行了研究。馬旭等[3]提出了利用顏色空間的轉(zhuǎn)換及模糊聚類分析,研究出分割玉米大斑病害圖像的方法。柴阿麗等[4]以計(jì)算機(jī)視覺技術(shù)為方法,通過圖像處理來分割病斑研究出番茄葉部病害判別模型。陳麗等[5]研究了識(shí)別玉米葉部病害的方法,運(yùn)用了圖像處理技術(shù)和概率神經(jīng)網(wǎng)絡(luò)技術(shù)。劉連忠等[6]采用小波變換進(jìn)行預(yù)處理,再對(duì)病害未知的非綠特征進(jìn)行提取來實(shí)現(xiàn)對(duì)小麥病害的識(shí)別。楊倩等[7]提出采用顏色矩提取顏色特征及LBP算子提取紋理特征來實(shí)現(xiàn)大麥病害的識(shí)別。張建華等[8]采用最優(yōu)二叉樹的多類SVM技術(shù),研究了一種識(shí)別蜜柚葉部病害的方法。Sharada等[9]訓(xùn)練了一個(gè)深層卷積神經(jīng)網(wǎng)絡(luò)來鑒定作物病情。田凱等[10]采用計(jì)算機(jī)視覺技術(shù),且用圖像處理技術(shù)分割病斑,研究出一種識(shí)別茄子褐紋病的方法。魏麗冉等[11]通過提高病害處與健康處的對(duì)比度,再進(jìn)一步做圖像處理,研究了采用基于核函數(shù)SVM的分類識(shí)別方法。趙建敏等[12]提出基于CNN的馬鈴薯葉片病害檢測(cè)系統(tǒng)。邱靖等[13]研究了基于CNN的水稻病害圖像檢測(cè)的方法。張乃夫等[14]設(shè)計(jì)了通過CNN實(shí)現(xiàn)農(nóng)作物病害分類的模型。本研究擬構(gòu)建一種卷積神經(jīng)網(wǎng)絡(luò)模型,直接輸入彩色的番茄葉片圖像,通過卷積層進(jìn)行特征提取,最終經(jīng)過輸出層實(shí)現(xiàn)分類識(shí)別。
番茄是一種頗受歡迎的蔬菜,但瘡痂病、早疫病、晚疫病、葉霉病、斑枯病等多種病害造成了產(chǎn)量的減少且嚴(yán)重降低質(zhì)量。所以,番茄病害的識(shí)別研究是相當(dāng)關(guān)鍵的。如何快速、準(zhǔn)確地識(shí)別出番茄病害,并實(shí)施綠色健康的防治措施十分重要。大部分番茄病害的癥狀呈現(xiàn)于葉片的形狀、顏色和紋理,且每種病害表現(xiàn)出來的特征是不相同的[15]。于是,通過番茄葉片圖像便可識(shí)別其為何種病害。
1 研究對(duì)象選取及模型確定
1.1 研究對(duì)象的選取
通過卷積神經(jīng)網(wǎng)絡(luò)來提取番茄葉片圖像的特征及識(shí)別病害類型的長處之一是原始番茄葉片圖像不用實(shí)施一些煩瑣的預(yù)處理,如病斑分割、提高對(duì)比度等處理,原始三通道的番茄葉片圖像可直接輸入到經(jīng)過訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)模型中。
本研究模型的識(shí)別對(duì)象為番茄健康葉片及瘡痂病葉片、早疫病葉片、晚疫病葉片、葉霉病葉片、斑枯病葉片、紅蜘蛛損傷葉片和斑點(diǎn)病葉片,對(duì)以上葉片圖像實(shí)現(xiàn)分類識(shí)別。原始圖像共6400張,每種類型各800張,將所有圖像的80%制作成訓(xùn)練集,20%制作成測(cè)試集(即每種類型640張圖像為訓(xùn)練集,160張圖像為測(cè)試集)。利用python的PIL庫中的resize方法將所有圖像處理為相同尺寸(本研究中選用的圖像原始尺寸均為256×256,裁剪為32×32輸入至模型,以減輕系統(tǒng)的計(jì)算量,提高模型的訓(xùn)練速度),并對(duì)所有圖像制作標(biāo)簽,記為“m_n”。其中m表示圖像對(duì)應(yīng)的類型(0表示番茄健康;1表示瘡痂病;2表示早疫病;3表示晚疫病;4表示葉霉病;5表示斑枯病;6表示紅蜘蛛損傷;7表示斑點(diǎn)?。?,n表示圖像的編號(hào),例如名為“7_160”的圖像為番茄斑點(diǎn)病類型圖像的第160張。將所有圖像設(shè)置為JPG格式,構(gòu)成番茄病害圖像數(shù)據(jù)庫。部分圖像如圖1所示。
1.2 識(shí)別模型確定
卷積神經(jīng)網(wǎng)絡(luò)的主要結(jié)構(gòu)為輸入層、卷積層、池化層和輸出層。輸入層輸入訓(xùn)練數(shù)據(jù)(即訓(xùn)練集),卷積層從輸入圖像中提取圖像特征,池化層用于降低圖像維度和分辨率,但保留了重要信息,并且避免存在過擬合等問題。本研究通過在卷積層設(shè)置不同尺寸的卷積核及在池化層設(shè)置不同的池化方法,設(shè)計(jì)CNN模型,以番茄葉片圖像作為輸入,輸入層包含3個(gè)顏色通道的32×32像素的圖像,它可以看成32×32×3(長、寬、深)的長方體,也可以分散成3個(gè)通道的圖像矩陣。卷積層和池化層均為2層,輸出層的神經(jīng)元為8個(gè)(對(duì)應(yīng)8種類型),激活函數(shù)選用ReLU。卷積核尺寸選用3×3、5×5、7×7等,池化方法選用均值池化(average_pooling)、最大值池化(max_pooling)。第1部分的結(jié)構(gòu)為1個(gè)卷積層、1個(gè)ReLU層和一個(gè)池化層。卷積層含有20個(gè)卷積核,對(duì)輸入的RGB圖像進(jìn)行特征提取。將池化層卷積核的尺寸設(shè)置為2×2,對(duì)特征再次進(jìn)行提取,降低本層輸出圖像的維度,減少計(jì)算量,最終效果并不會(huì)受到影響,意味著池化層可將卷積層輸出中的多余的特征進(jìn)行刪減。第2部分與第1部分結(jié)構(gòu)相同,其卷積層含有60個(gè)卷積核,池化層的結(jié)構(gòu)和第1部分相同。輸出層包含8個(gè)神經(jīng)元,分別代表8個(gè)識(shí)別類型。
根據(jù)以上提出的算法,所設(shè)計(jì)的模型一共采用了5種卷積核尺寸、2種池化方法,共計(jì)10個(gè)基于CNN的番茄葉片圖像識(shí)別模型,并通過實(shí)驗(yàn)效果比較各模型。
2 仿真實(shí)驗(yàn)及分析
2.1 實(shí)驗(yàn)環(huán)境
本研究使用的計(jì)算機(jī)CPU為Intel Corei7-8550U,內(nèi)存為8G;GPU為NVIDIA GEFORCE 940MX,顯存為2G;操作系統(tǒng)為Windows10,采用的框架為TensorFlow,選用的編程語言為python,選用python解釋器為PyCharm,在PyCharm上進(jìn)行編輯、運(yùn)行。在TensorFlow上構(gòu)造CNN模型,部分參數(shù)設(shè)置:學(xué)習(xí)率為1×10-4、dropout為0.25、epoch為1000。
為檢驗(yàn)本研究所設(shè)計(jì)模型的有效性,將測(cè)試集(每種類型的番茄葉片圖像各160張,共計(jì)1280張)分別輸入到訓(xùn)練結(jié)束的10個(gè)模型中,通過識(shí)別結(jié)果進(jìn)行分析。結(jié)果如表1所示:從卷積核尺寸看,卷積核尺寸為5×5,3×3時(shí),模型識(shí)別率最高,此現(xiàn)象是因?yàn)椴煌矸e核對(duì)圖像特征的提取能力是不同的;從池化方法看,采用最大值池化識(shí)別率較高,原因可能是最大值池化通常能夠盡量保存邊緣,而均值池化用到了局部感受葉中的所有元素,相當(dāng)于是進(jìn)行了模糊處理;從訓(xùn)練時(shí)間看,卷積核尺寸與訓(xùn)練時(shí)長呈正相關(guān)的關(guān)系,由于本研究卷積神經(jīng)網(wǎng)絡(luò)的深度較淺,時(shí)間區(qū)別不是很直觀;從測(cè)試識(shí)別率看,均達(dá)到87%以上,說明模型實(shí)用性較佳。綜合分析,相同深度和相同池化層池化方法的網(wǎng)絡(luò),卷積核設(shè)置為5×5,3×3尺寸的模型的識(shí)別效果較好,其次是卷積核設(shè)置為3×3及5×5尺寸的模型,卷積核設(shè)置為7×7及9×9尺寸的模型的識(shí)別效果相比其他模型較不理想;相同深度和相同卷積核尺寸的模型,池化方法選擇max_pooling識(shí)別效果較佳。模型model-1的輸入圖像為32×32×3,經(jīng)過第1部分的卷積層輸出為28×28×20,經(jīng)過第1部分的池化層輸出為14×14×20,經(jīng)過第2部分的卷積層輸出為12×12×60,經(jīng)過第2部分的池化層輸出為6×6×60,將3維特征轉(zhuǎn)換為1維,經(jīng)過全連接層,最后輸出為8個(gè)類型。嘗試將訓(xùn)練次數(shù)增大,識(shí)別測(cè)試集的準(zhǔn)確率沒有繼續(xù)上升反而下降,可能學(xué)習(xí)率還需要調(diào)小。最終損失為0.11,訓(xùn)練時(shí)長為11分鐘,整個(gè)測(cè)試集的平均識(shí)別率達(dá)到95.47%,其中對(duì)番茄瘡痂病和紅蜘蛛損傷的識(shí)別效果最好,識(shí)別率達(dá)到98.75%。
2.3 模型比較分析
利用該模型對(duì)番茄病害圖像進(jìn)行分類,平均識(shí)別率為95.47%。柴帥等[16]建立的基于VGG-19通過遷移學(xué)習(xí)改進(jìn)番茄病蟲害檢測(cè)模型,識(shí)別準(zhǔn)確率為88.98%;閻園園等[17]建立的基于群智能算法分類模型進(jìn)行番茄病害識(shí)別,識(shí)別準(zhǔn)確率為94.13%;胡志偉等[18]建立的基于注意力與殘差思想相結(jié)合的CNN番茄病害檢測(cè)模型,識(shí)別準(zhǔn)確率為88.2%;郭小清等[19]建立的基于優(yōu)化Multi-Scale AlexNet的番茄病害檢測(cè)模型,識(shí)別準(zhǔn)確率為92.7%。經(jīng)對(duì)比,表明本研究所設(shè)計(jì)的模型識(shí)別率較高,模型實(shí)用性強(qiáng)。
3 結(jié)論
本研究通過在卷積層設(shè)置不同尺寸的卷積核,在池化層設(shè)置不同的池化方法,改進(jìn)CNN模型,通過番茄葉片圖像實(shí)現(xiàn)其病害種類的識(shí)別。實(shí)驗(yàn)表明,所有圖像的80%制作成訓(xùn)練集,20%制作成測(cè)試集的條件下,卷積核采用5×5,3×3的尺寸,池化方法采用max_pooling的model-1模型,對(duì)番茄健康葉片、瘡痂病葉片、早疫病葉片、晚疫病葉片、葉霉病葉片、斑枯病葉片、紅蜘蛛損傷葉片和斑點(diǎn)病葉片的識(shí)別率分別為98.13%、98.75%、89.38%、95.00%、96.88%、92.50%、98.75%和94.38%,平均識(shí)別率為95.47%,能夠滿足實(shí)際應(yīng)用。
通過與其他模型識(shí)別率比較,證實(shí)本研究所設(shè)計(jì)的模型識(shí)別準(zhǔn)確率較高,應(yīng)用價(jià)值較大,實(shí)現(xiàn)對(duì)番茄健康葉片和其他7種病害的識(shí)別,同時(shí)為接下來研究植物病蟲檢測(cè)積累經(jīng)驗(yàn)和參考。下一步將收集番茄病害圖像,擴(kuò)增樣本數(shù),對(duì)模型進(jìn)行優(yōu)化和調(diào)整,以提高番茄病害圖像識(shí)別的實(shí)用性和準(zhǔn)確性,更好的應(yīng)用到生活生產(chǎn)中。
參考文獻(xiàn):
[1]王海濤,萬蜀淵,李興成.柑橘病毒病專家系統(tǒng)的研制[J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào),1998(05):91-94.
[2] 崔艷麗,程鵬飛,董曉志,等.溫室植物病害的圖像處理及特征值提取方法的研究——基于色度的特征值提取研究[J].農(nóng)業(yè)工程學(xué)報(bào),2005,21(z2):32-35.
[3] 馬旭,齊龍,張小超.基于模糊聚類的玉米大斑病害圖像的分割技術(shù)[J].農(nóng)機(jī)化研究,2008,30(12):24-26.
[4] 柴阿麗,李寶聚,石延霞,等.基于計(jì)算機(jī)視覺技術(shù)的番茄葉部病害識(shí)別[J].園藝學(xué)報(bào),2010,37(9):1423-1430.
[5] 陳麗,王蘭英.概率神經(jīng)網(wǎng)絡(luò)在玉米葉部病害識(shí)別中的應(yīng)用[J].農(nóng)機(jī)化研究,2011,33(6):145-148.
[6] 劉連忠,張武,朱誠.基于改進(jìn)顏色特征的小麥病害圖像識(shí)別技術(shù)研究[J].安徽農(nóng)業(yè)科學(xué),2012,40(26):12877-12879.
[7] 楊倩,高曉陽,武季玲,等.基于顏色和紋理特征的大麥主要病害識(shí)別研究[J].中國農(nóng)業(yè)大學(xué)學(xué)報(bào),2013,18(5):129-135.
[8] 張建華,孔繁濤,李哲敏,等.基于最優(yōu)二叉樹支持向量機(jī)的蜜柚葉部病害識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2014,30(19):222-231.
[9] Mohanty S P,Hughes D P,Salathé M.Using deep learning for image-based plant disease detection[J].Frontiers in Plant Science,2016,7:1419.DOI:10.3389/fpls.2016.01419.
[10] 田凱,張連寬,熊美東,等.基于葉片病斑特征的茄子褐紋病識(shí)別方法[J].農(nóng)業(yè)工程學(xué)報(bào),2016(Z1):184-189.
[11]魏麗冉,岳峻,李振波,等.基于核函數(shù)支持向量機(jī)的植物葉部病害多分類檢測(cè)方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(S1):166-171.
[12] 趙建敏,李艷,李琦,等.基于卷積神經(jīng)網(wǎng)絡(luò)的馬鈴薯葉片病害識(shí)別系統(tǒng)[J].江蘇農(nóng)業(yè)科學(xué),2018,46(24):251-255.
[13] 邱靖,劉繼榮,曹志勇,等.基于卷積神經(jīng)網(wǎng)絡(luò)的水稻病害圖像識(shí)別研究[J].云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2019,34(5):884-888.
[14] 張乃夫,譚峰,范禹希,等.基于卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)作物病害識(shí)別方法研究[J].安徽農(nóng)業(yè)科學(xué),2020,48(5):242-245.
[15] 賈建楠,吉海彥.基于病斑形狀和神經(jīng)網(wǎng)絡(luò)的黃瓜病害識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2013(z1):115-121.
[16] 柴帥,李壯舉.基于遷移學(xué)習(xí)的番茄病蟲害檢測(cè)[J].計(jì)算機(jī)工程與設(shè)計(jì),2019,40(6):1701-1705.
[17] 閻園園,陳華,姜波.基于群智能算法分類模型的番茄病害識(shí)別[J].江蘇農(nóng)業(yè)科學(xué),2020,48(1):219-224.
[18] 胡志偉,楊華,黃濟(jì)民,等.基于注意力殘差機(jī)制的細(xì)粒度番茄病害識(shí)別[J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào),2019,40(6):124-132.
[19] 郭小清,范濤杰,舒欣.基于改進(jìn)Multi-Scale AlexNet的番茄葉部病害圖像識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2019,35(13):162-169.
【通聯(lián)編輯:唐一東】