張航 程清 武英潔 王亞新 張承明 殷復偉
摘要:針對準確識別小麥常見病害的需要,提出了一種基于卷積神經網絡的小麥病害識別方法。該方法首先以小麥病害圖片資料為基礎,利用中值濾波法、直方圖閾值法等對圖像進行去背景、去噪、病斑分割等預處理形成樣本庫,然后利用卷積神經網絡構建一個具有五層結構的深度學習模型進行樣本學習,并利用隨機梯度下降法進行學習過程控制,最后以獲取的特征集對小麥圖片進行病害識別,并形成一個在線識別系統(tǒng)。在泰安市4樣點的試驗結果表明,利用該方法可以有效實現對小麥常見病害——紋枯病、條銹病、葉銹病、稈銹病、赤霉病和白粉病的識別,綜合識別率可達99%以上,可以應用于實際生產管理。
關鍵詞:小麥病害;卷積神經網絡;在線識別;病害識別
中圖分類號:S512.1:S127文獻標識號:A文章編號:1001-4942(2018)03-0137-05
Abstract Based on the needs of identifying wheats common diseases accurately, a wheat disease recognition method based on convolutional neural network was put forward in this study. This method was based on the wheat disease image data, firstly it formed a sample database after a series of pre-treatments including removing background, denoising, segmentation of lesion with median filter and histogram thresholding method; then it built a five-layer-structure model of deep learning sample for learning using convolutional neural network, and using stochastic gradient descent method to control learning process; finally, it identified the wheats pictures with obtained feature set, and formed an online identification system. The experimental results in Taian showed that this method could effectively identify the common diseases of wheat, and the comprehensive recognition rate reached more than 99%, which could be applied to the actual production management.
Keywords Wheat disease; Convolutional Neural Network; Online identification; Disease identification
小麥是我國的主要糧食作物,每年播種面積都在3億公頃左右,占全國糧食作物總面積的20%~27%。利用高新技術手段,保證小麥高產穩(wěn)產,對于保障我國糧食供應、社會安定、經濟發(fā)展具有重要作用。小麥主要病害有38種左右[1],常年發(fā)生面積約7 000萬公頃,造成小麥產量損失高達30億千克[2]。因此,有效改進小麥病害的防治措施,對于提高小麥產量和質量具有重要意義。
傳統(tǒng)農業(yè)生產中,目視診斷是小麥病害的常用識別方法,在小麥生產管理中發(fā)揮了重要作用。但目視診斷結果與診斷者的知識背景、診斷經驗具有非常大的關系,而實際生產中,往往有經驗的診斷人員較少,導致病害不能得到及時診斷。近年來,隨著圖像處理技術的發(fā)展,利用該技術進行小麥病蟲害病理特征的自動提取以及在線實時智能識別,成為一個新的研究熱點。由于病害種類及特征繁多,傳統(tǒng)的圖像處理技術在病害的識別精度和效率方面還有很大提升空間[3-5]。
隨著神經網絡的發(fā)展,研究者已成功將神經網絡應用于圖像模式識別和降維處理[6 ,7]。在此基礎上,有研究者綜合利用圖像處理和神經網絡技術進行小麥病害識別研究,取得了較大的進展。如:余秀麗等利用支持向量機對3種小麥葉部常見病害進行識別[8];李冠林等[9]利用 K-means 硬聚類算法,使用優(yōu)選的26個特征參數有效地對小麥條銹病和葉銹病圖像進行了識別。但以上研究僅針對2~3種病害進行識別,對于多種復雜病害難以達到理想的識別效果。
2017年,山東省小麥種植面積達380多萬公頃,是全國第二大小麥產地,其中泰安市種植面積為16.9萬公頃,在山東小麥生產中占有重要地位。但紋枯、條銹、葉銹、稈銹等病害在當地普遍且嚴重發(fā)生,常年受病害面積約4萬公頃,造成小麥產量損失達170萬千克,嚴重影響其小麥產量和品質。本研究針對準確識別小麥常見病害的需要,提出一種基于卷積神經網絡的小麥病害識別方法,并形成在線識別系統(tǒng),通過對泰安市岱岳區(qū)四個鎮(zhèn)的6種小麥病害進行識別驗證,識別精度高且快速,對有效識別農作物病害、提高糧食產量和品質具有重要意義。
1 研究區(qū)概況及數據來源
岱岳區(qū)隸屬山東省泰安市,位于泰安市中部偏北,北緯35°52′~36°28′、東經116°50′~117°29′。屬于暖溫帶半濕潤大陸性季風氣候,年均光照時間2 634.5 h,年均降水量727.4 mm,適合小麥生長。2016年岱岳區(qū)小麥播種面積2.34萬公頃,產量15 795萬千克。
本研究選取岱岳區(qū)夏張、滿莊、良莊和大汶口4個鎮(zhèn)作為樣本采集地,采樣點分布見圖1。選擇光照良好的天氣,使用相機拍攝得到640×480分辨率的小麥病害清晰照片。圖2、圖3分別為小麥白粉病、條銹病樣本。
2 研究方法
2.1 基于卷積神經網絡的小麥病害識別總體流程
本研究以研究區(qū)小麥病害圖片資料為基礎,利用卷積神經網絡,構建針對小麥病害識別的深度學習模型,并形成在線識別系統(tǒng),實現對小麥重要病害的快速識別。該方法的總體流程如圖4所示。
2.2 圖像預處理
為盡可能減少天氣、光線以及雜草等對病害圖像樣本的影響,需選取光照條件好的時刻拍攝分辨率為640×480的清晰圖像樣本,并使用中值濾波法[10]去噪、直方圖閾值法去除背景及進行圖像分割,標記病理區(qū)域,形成樣本集,以此作為模型的輸入對模型進行訓練。
圖像預處理方法如下:
(1)去噪。首先采用全局閾值法實現噪聲的初步標識,然后根據噪聲的孤立性、非同時性等特點,通過考查噪聲點鄰域內的拓撲結構,剔除誤判點,最后對拓撲矩陣中所有標記的噪聲點進行中值濾波,得到去噪后的圖像。
(2)圖像分割。采用直方圖閾值法,首先建立圖像灰度直方圖,然后計算背景和目標的出現概率,最后計算兩個區(qū)域的類間方差,實現閾值分割。
(3)標記病理區(qū)域,形成樣本集。
2.3 模型建立與學習
卷積神經網絡(convolutional neural networks,CNN)是一種以卷積運算為基礎的深度神經網絡,卷積運算可以減少深層網絡占用資源及網絡的參數個數,能夠較有效地解決過擬合問題[11-13]。
在CNN的一個卷積層中,通常包含若干個特征圖(feature map),每個特征圖由一些矩形排列的神經元組成,同一特征圖的神經元共享權值,即所謂的卷積核。卷積核一般以隨機小數矩陣的形式初始化,在網絡的訓練過程中卷積核將學習得到合理的權值[14]。卷積核有效減少了網絡各層之間的連接,同時又降低了過擬合的風險。子采樣,也叫做池化(pooling),通常有均值子采樣(mean pooling)和最大值子采樣(max pooling)兩種形式[15]。子采樣可以看作一種特殊的卷積過程。卷積和子采樣大大簡化了模型復雜度,減少了模型參數。
本研究提出的方法是以卷積神經網絡為基礎,對預處理得到的樣本病理區(qū)域作標記,建立網絡結構,初始化卷積核及偏置等參數,輸入到一個5層的卷積神經網絡中,通過梯度下降法控制學習過程,經過40 000次迭代訓練,得到訓練模型,用于識別。對于識別度不高的目標物體,再找相似樣本,重復訓練。網絡結構如下:
輸入層:分辨率為480×640的圖片。
第一層卷積層:7×7的卷積核,得到64個特征圖。
第一層下采樣層:2×2的核,得到64個特征圖。
第二層卷積層:5×5的卷積核,得到128個特征圖。
第二層下采樣層:2×2的核,得到128個特征圖。
第三層卷積層:5×5的卷積核,得到512個特征圖。
第三層下采樣層:2×2的核,得到512個特征圖。
第四層卷積層:3×3的卷積核,得到1 024個特征圖。
第五層卷積層:3×3的卷積核,該層與上一層連接沒有經過下采樣層,得到2 048個特征圖。
第五層下采樣層:2×2的核,得到2 048個特征圖。
全連接層:4 096維,將第五層下采樣層的輸出連接成為一個一維向量,作為該層的輸入。
Softmax層:輸出為1 000維,輸出是圖片屬于每個類別的概率,這一層即可用于對圖像中小麥病害進行判斷。
在一個卷積層,上一層的特征圖被一個可學習的卷積核進行卷積,然后通過一個激活函數,就可以得到輸出特征圖。每一個輸出特征圖可能是組合卷積多個輸入特征圖的值,卷積公式如下:
2.4 識別實現
模型訓練完成后,得到的特征集即可用于識別病害。為了更好地應用于生產實際,本研究開發(fā)了視頻識別和圖片識別兩種方式。在視頻識別方式中,可以利用攝像頭采集圖像進行實時識別;在圖片識別方式中,可以對不同途徑獲取的照片進行識別,可用于遠程診斷。
3 試驗驗證
選取800幅小麥病害圖像,其中500幅為訓練樣本,300幅為測試樣本,采用本研究提出的方法進行識別,測試集識別分類結果如表1所示。可以看出,條銹病、葉銹病、赤霉病和白粉病識別準確率達到 100%,主要是因為這四種病害的顏色、紋理特征較為明顯,易于正確識別。而紋枯病和稈銹病的形狀、顏色和紋理特征不明顯,在實際生成過程中不易完全區(qū)分,出現了極少數錯誤,識別準確率均為98%。與傳統(tǒng)的識別方法相比,基于卷積神經網絡的小麥病害識別整體準確率達99.3%,能獲得理想的分類效果,為小麥葉部常見病害的快速準確診斷提供了有效的分析手段。
4 結論
將計算機技術應用于農作物病害診斷,可以快速準確地識別出病害信息,不僅能夠降低病害帶來的經濟損失,而且可以解放勞動力,提高農作物產量和質量。本研究提出了一種基于卷積神經網絡的小麥病害識別方法,該方法首先建立了一種基于卷積神經網絡的能夠識別小麥病害的網絡結構,然后對樣本圖像進行預處理,并采用梯度下降法控制卷積神經網絡的學習過程,得到最優(yōu)的權值參數;完成網絡訓練后,以普通圖像作為輸入,即可得出病害識別分類結果。選取泰安市岱岳區(qū)4個鎮(zhèn)的300幅小麥病害圖片進行測試,總體識別率達99.3%,與傳統(tǒng)的人工識別方法及前饋神經網絡等算法相比,該方法能夠快速、準確地識別出小麥的病害信息,有效提高識別精度,可以用于實際生產,并對其它農作物病害識別診斷具有借鑒意義。
參 考 文 獻:
[1] 中國農業(yè)科學院植物保護研究所. 中國農作物病蟲害(上冊)[M]. 第2版. 北京:中國農業(yè)出版社,1995: 351-437.
[2] 陳萬權. 圖說小麥病蟲草鼠害防治關鍵技術[M]. 北京: 中國農業(yè)出版社, 2012.
[3] 王美麗, 牛曉靜, 張宏鳴, 等. 小麥葉部常見病害特征提取及識別技術研究[J]. 計算機工程與應用,2014, 50(7):154-157.
[4] Pujari J D, Yakkundimath R, Byadgi A S. Classification of fungal disease symptoms affected on cereals using color texture features [J]. International Journal of Signal Processing,2013, 6(6): 321-330.
[5] Sannakki S S, Rajpurohit V S, Nargund V B, et al. Leaf disease grading by machine vision and fuzzy logic [J]. Int. J. Comp. Tech. Appl., 2011, 2(5): 1709-1716.
[6] 趙春江. 農業(yè)智能系統(tǒng)[M]. 北京: 科學出版社, 2009.
[7] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks [J].Science, 2006, 313(5786):504-507.
[8] 余秀麗, 徐超, 王丹, 等. 基于SVM的小麥葉部病害識別方法研究[J]. 農機化研究, 2014, 36(11):151-155.
[9] 李冠林, 馬占鴻, 王海光. 基于支持向量機的小麥條銹病和葉銹病圖像識別[J]. 中國農業(yè)大學學報,2012,17(2):72-79.
[10]李文杰, 姚建剛,毛李帆, 等. 基于中值濾波法及小波自適應擴散法的絕緣子紅外熱像去噪[J]. 電網技術, 2010, 34(8): 160-164.
[11]常亮, 鄧小明, 周明全, 等. 圖像理解中的卷積神經網絡[J/OL]. 自動化學報, 2016, 42(9):1300-1312.
[12]Bouvrie J. Notes on convolutional neural networks [R]. MIT CBCL Tech. Report, Cambridge, MA, 2006.
[13]周飛燕,金林鵬,董軍. 卷積神經網絡研究綜述[J/OL].計算機學報,2017,40(6):1229-1251.
[14]Ijjina E P, Chalavadi K M. Human action recognition using genetic algorithms and convolutional neural networks [J]. Pattern Recognition, 2016, 59: 199-212.
[15]Tomè D, Monti F, Baroffio L, et al. Deep convolutional neural networks for pedestrian detection [J]. Signal Processing: Image Communication, 2016, 47: 482-489 .