邊柯橙,楊海軍,路永華
(蘭州財(cái)經(jīng)大學(xué)信息工程學(xué)院,甘肅蘭州 730030)
目前,國(guó)內(nèi)大多數(shù)農(nóng)民對(duì)農(nóng)作物病蟲害的判別方法停留在傳統(tǒng)的實(shí)地目測(cè)上,通過農(nóng)作物的外觀表面形態(tài)等進(jìn)行判斷,多依賴于個(gè)人經(jīng)驗(yàn)。專家對(duì)于病蟲害識(shí)別具有豐富經(jīng)驗(yàn),但往往不能及時(shí)趕往現(xiàn)場(chǎng),或者因有限的人力資源不能進(jìn)行大型區(qū)域識(shí)別,容易導(dǎo)致誤判和漏判。如何有效、快捷地防治農(nóng)作物病蟲害,成為當(dāng)前智能農(nóng)業(yè)必須考慮的問題。
計(jì)算機(jī)視覺技術(shù)在農(nóng)業(yè)應(yīng)用中最為廣泛,主要研究方向有作物病害檢測(cè)與診斷[1]、農(nóng)產(chǎn)品采摘預(yù)測(cè)[2]、農(nóng)產(chǎn)品品質(zhì)檢測(cè)[3]、農(nóng)產(chǎn)品分級(jí)等。使用計(jì)算機(jī)視覺技術(shù)在不影響農(nóng)作物本身生長(zhǎng)的前提下對(duì)農(nóng)業(yè)病蟲害進(jìn)行檢測(cè)識(shí)別,具有無損、快速、實(shí)時(shí)等特點(diǎn)。國(guó)內(nèi)外專家學(xué)者在病蟲害圖像識(shí)別領(lǐng)域的研究工作主要集中在圖像分割、圖像特征提取、圖像分類和識(shí)別等[4]。
本文研究的主要?jiǎng)右蚴牵涸谵r(nóng)作物病蟲害檢測(cè)識(shí)別領(lǐng)域進(jìn)行深入研究與探索,以促進(jìn)農(nóng)作物病蟲害檢測(cè)識(shí)別技術(shù)突破和廣泛應(yīng)用。為了全面認(rèn)識(shí)農(nóng)作物病蟲害防治問題,本文重點(diǎn)分析39 項(xiàng)有關(guān)研究工作,這些研究對(duì)于深度學(xué)習(xí)在病蟲害檢測(cè)識(shí)別等方面的應(yīng)用具有重要影響。
本文數(shù)據(jù)分析包括收集相關(guān)研究成果、詳細(xì)審查與分析兩個(gè)步驟?;陉P(guān)鍵字搜索論文或期刊文章,主要來源于科學(xué)數(shù)據(jù)庫(kù)CNKI 和ElsevierScienceDirect,以及Web 科學(xué)索引的科學(xué)服務(wù)網(wǎng)和谷歌學(xué)術(shù)。本文使用關(guān)鍵字“深度學(xué)習(xí)”“病蟲害識(shí)別”“農(nóng)業(yè)”進(jìn)行搜索,過濾掉涉及深度學(xué)習(xí)但不適用于農(nóng)業(yè)領(lǐng)域病蟲害識(shí)別的文獻(xiàn)。通過有效篩選,在搜索集合里選取有意義的論文共39 篇。本文主要就以下內(nèi)容進(jìn)行比較分析:①數(shù)據(jù)來源、類型及標(biāo)注情況;②數(shù)據(jù)預(yù)處理或增強(qiáng)技術(shù)使用;③深度學(xué)習(xí)應(yīng)用領(lǐng)域;④深度學(xué)習(xí)模型或其它相關(guān)模型的一般方法和類型;⑤度量標(biāo)準(zhǔn)和總體性能。
深度學(xué)習(xí)方法是一種特征表示方法,它能將原數(shù)據(jù)通過簡(jiǎn)單的多種非線性模型組合轉(zhuǎn)變?yōu)楦邔哟蔚某橄笮问?,而其核心是各層特征而不再是人工設(shè)計(jì),通過通用的學(xué)習(xí)過程自主獲得[5-8]。正是由于深度學(xué)習(xí)能自動(dòng)提取高層次特征的特點(diǎn),采用它進(jìn)行圖像處理時(shí)極大減免了特征工程的復(fù)雜操作,減少了模型訓(xùn)練時(shí)間[9-10],使得模型分析結(jié)果更精準(zhǔn)[11],運(yùn)行效率也相對(duì)較高[12]。并且,深度學(xué)習(xí)模型可以開發(fā)模擬數(shù)據(jù)集以解決實(shí)際問題[13]。
得益于深度學(xué)習(xí)在眾多領(lǐng)域的成功應(yīng)用,現(xiàn)階段國(guó)內(nèi)外大量學(xué)者將目光投向了深度學(xué)習(xí)和農(nóng)業(yè)領(lǐng)域的結(jié)合上,而其中應(yīng)用最普遍的深度學(xué)習(xí)技術(shù)是卷積神經(jīng)網(wǎng)絡(luò)(Convol-utional Neural Networks,CNN)[14-18]。卷積神經(jīng)網(wǎng)絡(luò)模型是一種前向神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)方法,通過共享權(quán)值、局部連接和池化達(dá)到網(wǎng)絡(luò)更優(yōu)化并降低過擬合。由于多層卷積層和池化層能提取圖像的分類特征,Softmax 分類器能實(shí)現(xiàn)圖像分類識(shí)別,因此其被廣泛應(yīng)用于圖像識(shí)別相關(guān)領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)最先由Lecun 等學(xué)者提出,用在手寫體識(shí)別上,取得了較大成功。近年來,卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域展現(xiàn)出強(qiáng)大能力。2012 年,Hinton 的研究小組提出用深度卷積神經(jīng)網(wǎng)絡(luò)識(shí)別圖片,在ImageNet 數(shù)據(jù)集上將分類錯(cuò)誤率大幅降低,掀起了深度學(xué)習(xí)的熱潮。之后VGG(Visual Geometry Group)、GoogleNet 等在ImageNet 數(shù)據(jù)集上,將分類錯(cuò)誤率進(jìn)一步降低,它們對(duì)此前的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),使用更小的卷積核,以及更深的網(wǎng)絡(luò)結(jié)構(gòu)。這些網(wǎng)絡(luò)在大的數(shù)據(jù)集上才會(huì)體現(xiàn)出性能上的優(yōu)異。2012 年,AlexNet 模型被提出,將圖像識(shí)別錯(cuò)誤率較之前降低50%[14],至此,CNN 在圖像識(shí)別和分類領(lǐng)域的應(yīng)用被重新重視起來。
當(dāng)前,深度學(xué)習(xí)模型大量涌現(xiàn)并得以推廣應(yīng)用,研究人員可以借鑒相關(guān)模型開展研究,避免從頭開始模型構(gòu)建,提高了工作效率。常用CNN 模型包括AlexNet、CaffeNet、VGG、GoogleNet 和Initiation ResNet 等。這些模型通過卷積層和池化層代替全連接層(見圖1),并實(shí)現(xiàn)不同神經(jīng)元之間的權(quán)值共享,使它們更類似于生物神經(jīng)網(wǎng)絡(luò),降低網(wǎng)絡(luò)復(fù)雜度,減少網(wǎng)絡(luò)參數(shù)。并且,這些模型都經(jīng)過一些數(shù)據(jù)集的預(yù)訓(xùn)練,其帶有預(yù)訓(xùn)練的權(quán)重參數(shù),會(huì)為某些特定問題提供相對(duì)有效的分類功能。
Fig.1 CNN basic model(C*;Convolution layer,S*:Pooling layer)圖1 CNN 基本模型(C*;卷積層,S*:池化層)
此外,各種深度學(xué)習(xí)框架相繼出現(xiàn),以便于研究人員進(jìn)行實(shí)驗(yàn),最常見的有Goolgle 公司研發(fā)的Tensorflow、Mi?crosoft 公司研發(fā)的CNTK(ComputationalNetworkToolkit)、Fchollet 公司研發(fā)的Keras、DMLC 研發(fā)的MXNet 以及BLVC(BerkeleyVisionandLearningCenter)和社區(qū)貢獻(xiàn)者共同研發(fā)的Caffe 等。這些深度技術(shù)框架主要被應(yīng)用于圖像識(shí)別分類、手寫字識(shí)別、語音識(shí)別、預(yù)測(cè)、自然語言處理等方面。其中一些工具(如Caffe)包含了流行的模型,如上文提到Alexnet、VGG 和Googlenet,可以作為庫(kù)或類使用。
近年來,基于深度學(xué)習(xí)的特征提取與識(shí)別方法受到了極大關(guān)注,并在自然圖像分類識(shí)別中被成功應(yīng)用。大量試驗(yàn)結(jié)果表明,基于深度學(xué)習(xí)得到的特征表達(dá)比手工設(shè)計(jì)的底層視覺特征,如HOG(Histogram of Oriented Gradient)、SIFT(ScaleInvariant-Feature-Transform)特征等,在圖像識(shí)別方面具有更大的優(yōu)越性。
本文對(duì)39 項(xiàng)農(nóng)業(yè)病蟲害相關(guān)研究工作進(jìn)行分析,并介紹它們的數(shù)據(jù)來源、所使用的數(shù)據(jù)預(yù)處理技術(shù)和數(shù)據(jù)增強(qiáng)技術(shù)、研究對(duì)象、選擇的深度學(xué)習(xí)模型和體系結(jié)構(gòu)、采用的性能指標(biāo)。
觀察所研究文章的數(shù)據(jù)集,如表1 所示,大部分研究使用的數(shù)據(jù)集規(guī)模較大,圖像數(shù)目多達(dá)千張甚至上萬張。
研究中涉及的數(shù)據(jù)集分為兩類:一類是自主獲取,包括采用高清相機(jī)或手機(jī)進(jìn)行拍攝獲取;網(wǎng)上獲取并裁剪合成;使用高普光成像儀獲取圖像或使用農(nóng)業(yè)互聯(lián)網(wǎng)傳感器采集昆蟲數(shù)據(jù)信息;另一類來源于公開數(shù)據(jù)集,其中使用最為廣泛的是Imagenet 和PlantVillage 等。ImageNet 數(shù)據(jù)集是為了促進(jìn)計(jì)算機(jī)圖像識(shí)別技術(shù)發(fā)展而設(shè)立的一個(gè)大型圖像數(shù)據(jù)集,其中已經(jīng)超過千萬張圖片,每一張圖片都被手工標(biāo)定好類別。PlantVillage 是一個(gè)公開數(shù)據(jù)集,已經(jīng)收集成千上萬健康和患病作物圖片,并公開和免費(fèi)提供這些圖片。
一般認(rèn)為,使用深度學(xué)習(xí)技術(shù)進(jìn)行識(shí)別的類別越復(fù)雜,種類越多,需要的數(shù)據(jù)就越多。因此,大量真實(shí)的數(shù)據(jù)集在模型訓(xùn)練和測(cè)試中具有重要影響。
Table 1 Data source表1 數(shù)據(jù)源
部分研究(32 篇論文,80%)為了實(shí)現(xiàn)識(shí)別效果最優(yōu)化,在圖像或圖像的特定特征輸入到深度學(xué)習(xí)模型之前對(duì)圖像作預(yù)處理。在使用深度學(xué)習(xí)對(duì)圖像進(jìn)行分類識(shí)別時(shí),圖像的亮度、對(duì)比度等屬性對(duì)圖像識(shí)別效果影響非常大,相同物體在不同亮度和對(duì)比度下的差別非常大。在農(nóng)業(yè)病害圖像檢測(cè)識(shí)別問題中,經(jīng)常會(huì)遇到陰影、強(qiáng)曝光之類的圖片,這些因素都不應(yīng)該影響最后的識(shí)別結(jié)果,因此要對(duì)圖像作預(yù)處理,使得到的實(shí)驗(yàn)結(jié)果盡可能小地被無關(guān)因素所影響。調(diào)整圖像大小是最常見的預(yù)處理過程,深度學(xué)習(xí)模型常用尺寸有:256×256、227×227、224×224 等。圖像分割也是圖像預(yù)處理的一種較流行的做法,可以增加數(shù)據(jù)集規(guī)模,也可以通過突出感興趣的區(qū)域促進(jìn)學(xué)習(xí)過程,使專家和志愿者更容易對(duì)數(shù)據(jù)進(jìn)行注釋。研究表明,采用分割圖像的平均識(shí)別精度相比原始圖像取得了更好的識(shí)別效果,其余數(shù)據(jù)預(yù)處理方法如表2 所示。
Table 2 Data preprocessing表2 數(shù)據(jù)預(yù)處理
部分研究(24 篇論文,59%)采用數(shù)據(jù)增強(qiáng)技術(shù),人為擴(kuò)大訓(xùn)練圖像數(shù)量,這有助于改進(jìn)整體學(xué)習(xí)過程和性能,并且可以為實(shí)現(xiàn)泛化而向模型提供不同的數(shù)據(jù)。這種增強(qiáng)過程對(duì)于那些只擁有小數(shù)據(jù)集訓(xùn)練其深度學(xué)習(xí)模型的研究極其重要,作者使用合成圖像對(duì)模型進(jìn)行訓(xùn)練,并在真實(shí)圖像上進(jìn)行測(cè)試。在這種情況下,擴(kuò)充的合成圖像數(shù)據(jù)擴(kuò)大了訓(xùn)練集,使其訓(xùn)練出的模型更有效,提升了泛化能力,能夠更好地適應(yīng)實(shí)際問題。尤其是,在Hu 等[19]的研究中,利用改進(jìn)的條件將卷積生成對(duì)抗網(wǎng)絡(luò)(C-DCGAN)生成新的訓(xùn)練樣本進(jìn)行數(shù)據(jù)增強(qiáng),平均識(shí)別精度比旋轉(zhuǎn)和平移的識(shí)別精度高28% 左右;DeChant 等[21]運(yùn)用硬負(fù)挖掘技術(shù),即采用55 步長(zhǎng)的滑動(dòng)窗口方法,將未感染植物的圖像分解成不同像素;黃雙萍等[55]通過對(duì)高光譜圖像隨機(jī)扔棄波段圖像增加數(shù)據(jù)集規(guī)模。其它常見數(shù)據(jù)擴(kuò)充方法如表3所示。
Table 3 Data enhancement表3 數(shù)據(jù)增強(qiáng)
本文研究的39 篇論文都集中在農(nóng)業(yè)病害領(lǐng)域,其中有33 篇論文對(duì)農(nóng)作物病害葉片進(jìn)行檢測(cè)識(shí)別,4 篇論文直接對(duì)病蟲圖像進(jìn)行檢測(cè)識(shí)別,兩篇論文對(duì)農(nóng)作物病蟲害進(jìn)行預(yù)測(cè)。
從技術(shù)角度看,本文所涉及的研究工作大都(37 篇論文,95%)采用了CNN 模型。大部分研究(28 篇,72%)基于已存在的CNN 模型進(jìn)行優(yōu)化,包括AlexNet、LeNet、VGG16、ResNet 和DenseNet 等,或建立自己的卷積神經(jīng)網(wǎng)絡(luò)模型(9 篇,23%),如表4 所示。
Table 4 Deep learning network model表4 深度學(xué)習(xí)網(wǎng)絡(luò)模型
續(xù)表
此外,有些研究利用遷移學(xué)習(xí)開展工作(14 篇論文,36%),這涉及到利用一些相關(guān)任務(wù)或領(lǐng)域的現(xiàn)有知識(shí),通過微調(diào)預(yù)先訓(xùn)練的模型以提高學(xué)習(xí)效率。因真實(shí)數(shù)據(jù)集很小或具有復(fù)雜的多任務(wù)網(wǎng)絡(luò)而無法從頭開始訓(xùn)練網(wǎng)絡(luò),因此需要用另一個(gè)預(yù)訓(xùn)練模型中的權(quán)重對(duì)網(wǎng)絡(luò)進(jìn)行部分初始化。通過微調(diào),這些模型將適應(yīng)特定的任務(wù)和數(shù)據(jù)集,適用于VGG16、DenseNet、AlexNet 和GoogleNet 等模型。一些研究將深度學(xué)習(xí)模型與弱機(jī)器學(xué)習(xí)分類器進(jìn)行結(jié)合,張苗輝[52]通過CaffeNet 提取害蟲特征后,通過稀疏編碼法,即構(gòu)建稀疏字典,并通過稀疏表示算法獲得測(cè)試樣本的稀疏系數(shù)并進(jìn)行分類識(shí)別;安強(qiáng)強(qiáng)等[53]利用自建的6 層CNN 網(wǎng)絡(luò)提取害蟲特征后,輸入SVM(Support Vector Machines)中進(jìn)行分類識(shí)別,相對(duì)于人工提取特征,深度學(xué)習(xí)的特征自動(dòng)提取取得了更好的分類效果。通過深度學(xué)習(xí)模型自動(dòng)提取特征提高了特征提取速度,相比于簡(jiǎn)單地提取顏色、形狀和紋理特征,其最終分類識(shí)別效果更好。
除采用卷積神經(jīng)網(wǎng)絡(luò)模型外,有研究使用深度置信網(wǎng)絡(luò)對(duì)農(nóng)作物病蟲害進(jìn)行預(yù)測(cè)。張善文等[47]對(duì)深度置信網(wǎng)絡(luò)進(jìn)行改進(jìn),使用無監(jiān)督和有監(jiān)督訓(xùn)練形成特征集后輸入BPNN 中對(duì)冬棗病蟲害進(jìn)行預(yù)測(cè);王獻(xiàn)鋒等[51]提出一個(gè)改進(jìn)型深度置信網(wǎng)絡(luò),由RBM(Restricted Boltzmann Machine)網(wǎng)絡(luò)和一個(gè)DRBM 網(wǎng)絡(luò)(判別RBM)構(gòu)成,用于對(duì)棉花病蟲害進(jìn)行預(yù)測(cè)。深度置信網(wǎng)絡(luò)的數(shù)據(jù)不同于卷積神經(jīng)網(wǎng)絡(luò),其為數(shù)值數(shù)據(jù),多采用農(nóng)業(yè)傳感器獲取,數(shù)據(jù)獲取手段單一是限制其預(yù)測(cè)效果的關(guān)鍵原因。
這些研究工作所用模型都在一些常用的深度學(xué)習(xí)框架下進(jìn)行測(cè)試,其中Caffe 使用次數(shù)最多(9 篇論文,23%),其次是MATLAB(8 篇論文,21%)和Keras(7 篇論文,18%)以及Tensorflow(4 篇論文,10%)。Caffe 和MATLAB 廣泛使用的一個(gè)可能原因是它們結(jié)合了各種CNN 模型和數(shù)據(jù)集,用戶可以輕松、自動(dòng)地使用這些框架和數(shù)據(jù)集,如表5所示。
Table 5 Main deep learning framework表5 主要深度學(xué)習(xí)框架
續(xù)表
對(duì)于分類效果評(píng)價(jià)指標(biāo),表6 列出了這些度量的符號(hào)和定義。在一些論文中,作者提到精度而沒有說明其定義,假設(shè)他們?yōu)榉诸惥龋–A,表6 中列出的第一個(gè)度量)。在本文研究中,將“深度學(xué)習(xí)性能”作為表6 中所列性能指標(biāo)值。
Table 6 Main performance index表6 主要性能指標(biāo)
在使用同一數(shù)據(jù)集且具有相同度量的前提下,基于同類問題對(duì)深度學(xué)習(xí)方法與其它技術(shù)進(jìn)行比較(17 篇論文,57%),或基于深度學(xué)習(xí)不同模型之間進(jìn)行比較后發(fā)現(xiàn),幾乎在所有的研究工作中,深度學(xué)習(xí)模型都優(yōu)于其它方法,其在農(nóng)作物病蟲害檢測(cè)、識(shí)別和分類中均表現(xiàn)出很好的效果。例如,在DeChant[21]的研究中,其使用分段式CNN 對(duì)玉米病害進(jìn)行識(shí)別,在運(yùn)行時(shí),為一個(gè)圖像生成一個(gè)熱圖大約需要2min,而對(duì)一組3 個(gè)熱圖分類則需要不到1s 的時(shí)間。在Cheng 等[33]的研究中,將卷積神經(jīng)網(wǎng)絡(luò)模型ResNet 與支持向量機(jī)和傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)相比,在復(fù)雜農(nóng)田背景下的pest 圖像識(shí)別精度有明顯提高;黃雙萍等[55]在水稻穗瘟病檢測(cè)中,將優(yōu)化的GoogleNet 模型與SVM 和詞袋模型進(jìn)行比較,準(zhǔn)確率提高了14 個(gè)百分點(diǎn)。
分析表明,在每篇論文中,將基于深度學(xué)習(xí)的方法性能與其它技術(shù)進(jìn)行比較時(shí),最重要的是要堅(jiān)持相同的實(shí)驗(yàn)條件(數(shù)據(jù)集和性能度量),并將基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法和其它每篇論文中所解決的特定問題而采用的先進(jìn)技術(shù)進(jìn)行比較。
每篇論文涉及不同的數(shù)據(jù)集、預(yù)處理技術(shù)、度量、模型和參數(shù),因此每篇論文中使用的技術(shù)受到嚴(yán)格限制?;谶@些約束條件可知,深度學(xué)習(xí)比傳統(tǒng)的SVM、Decision Tree等分類器有更好的分類表現(xiàn)。在特征提取方面,相較于尺度不變特征變換、紋理、顏色和形狀等傳統(tǒng)方法,深度學(xué)習(xí)模型的自動(dòng)特征提取更有效。
本文研究表明,一些研究工作取得了較好成果,因?yàn)槠鋽?shù)據(jù)集具有較高的真實(shí)性和較大的規(guī)模性,而對(duì)于部分真實(shí)數(shù)據(jù)集則較少研究,觀察其對(duì)模型的遷移學(xué)習(xí)預(yù)訓(xùn)練并在真實(shí)數(shù)據(jù)上進(jìn)行測(cè)試,其中數(shù)據(jù)集中真實(shí)數(shù)據(jù)所占比率越高,分類效果越好。因此可以得出,遷移學(xué)習(xí)是深度學(xué)習(xí)的重要內(nèi)容,它是解決各種研究問題中真實(shí)數(shù)據(jù)集不存在或不夠大的關(guān)鍵,但其中數(shù)據(jù)集中真實(shí)數(shù)據(jù)所占比率仍是影響其實(shí)驗(yàn)效果的關(guān)鍵因素,真實(shí)數(shù)據(jù)比率越高,分類效果越好。
大多數(shù)論文基于已存在的深度學(xué)習(xí)模型進(jìn)行優(yōu)化(28篇,72%)。優(yōu)化目的包括減少訓(xùn)練參數(shù)、提高運(yùn)行速度和提高分類效果等。
通過添加Dropout 層、改變池化組合、校正線性單元(Relu)函數(shù)、減少分類器數(shù)量等減少訓(xùn)練參數(shù)。采用SGD優(yōu)化模型并提高分類效果,由于SGD 每次選擇樣本都具有一定的隨機(jī)性,從而在訓(xùn)練過程中會(huì)產(chǎn)生些許波動(dòng),為了減少波動(dòng),可以選擇加入優(yōu)化器Momentum、RM-Sprop 和Adam,或采用批量隨機(jī)梯度下降法(MSGD-stochastic Gra?dient Method with Minibart-ches),它將訓(xùn)練數(shù)據(jù)集分割成小批量,用于修正模型錯(cuò)誤和更新模型參數(shù)。
有些研究采用了不同的優(yōu)化方法。Hu 等[31]將標(biāo)準(zhǔn)卷積替換為可分離卷積,用于減少模型參數(shù)個(gè)數(shù),提高模型計(jì)算速度;Albert 等[20]和劉永波等[44]通過向模型中補(bǔ)充額外特征以提高分類識(shí)別效果;賈少鵬等[54]為了彌補(bǔ)空間信息丟失,以膠囊網(wǎng)絡(luò)代替全連接層。
研究也表明,并非網(wǎng)絡(luò)深度越深,識(shí)別率越高,在不同的應(yīng)用場(chǎng)景下,需要根據(jù)實(shí)際問題的復(fù)雜程度,選擇簡(jiǎn)單或者復(fù)雜的網(wǎng)絡(luò)。例如,Rahman 的研究中提出,相比于追求更先進(jìn)的CNN 結(jié)構(gòu),農(nóng)民更需要一個(gè)能夠離線運(yùn)行基于CNN 模型的水稻病蟲害檢測(cè)移動(dòng)應(yīng)用,因此其提出了一個(gè)兩階段的小型CNN 結(jié)構(gòu),參數(shù)相對(duì)于AlexNet、GoogleNet和LeNet-5 等大幅度減少,學(xué)習(xí)能力下降但運(yùn)行效率提升,在實(shí)際應(yīng)用中更加廣泛。
(1)數(shù)據(jù)集要求較大。盡管數(shù)據(jù)增強(qiáng)技術(shù)可以增加一些具有標(biāo)簽的數(shù)據(jù)集,但實(shí)際上根據(jù)所研究問題的復(fù)雜性(分類數(shù)、所需精度等),深度學(xué)習(xí)至少需要數(shù)千張甚至上萬張圖像。有些研究沒有考慮到研究對(duì)象的多種外界條件影響,使得數(shù)據(jù)采樣不夠充分,這一事實(shí)降低了對(duì)總體分析結(jié)果的可信度,盡管研究表明,這些模型似乎具有良好的通用性,但性能優(yōu)化或上升幅度很小。因此,為了提高模型泛化能力,需要更加多樣化的訓(xùn)練數(shù)據(jù)。而當(dāng)前國(guó)內(nèi)農(nóng)業(yè)病蟲害相關(guān)公共數(shù)據(jù)集較少,迫使研究人員耗費(fèi)大量時(shí)間獲取數(shù)據(jù),降低工作效率。針對(duì)數(shù)據(jù)集較小的問題,除遷移學(xué)習(xí)外,部分研究采用數(shù)據(jù)增強(qiáng)技術(shù)對(duì)自己的數(shù)據(jù)集進(jìn)行擴(kuò)充。數(shù)據(jù)擴(kuò)充能有效增加真實(shí)數(shù)據(jù)集規(guī)模,從而提高檢測(cè)分類效果。但同時(shí)發(fā)現(xiàn),遷移學(xué)習(xí)弱化了數(shù)據(jù)擴(kuò)充的作用,即數(shù)據(jù)擴(kuò)充對(duì)全新學(xué)習(xí)的影響大于遷移學(xué)習(xí),但對(duì)于數(shù)量較小的數(shù)據(jù)集,遷移學(xué)習(xí)后進(jìn)行數(shù)據(jù)擴(kuò)充仍然可以有效提高模型識(shí)別性能。動(dòng)態(tài)的數(shù)據(jù)擴(kuò)充方式節(jié)省了存儲(chǔ)擴(kuò)充數(shù)據(jù)所需的巨大空間,豐富了數(shù)據(jù)的多樣性,可以減輕模型過擬合現(xiàn)象,但在一定程度上破壞了原數(shù)據(jù)集的樣本分布,增加了訓(xùn)練的波動(dòng)性。
(2)數(shù)據(jù)預(yù)處理耗時(shí)長(zhǎng)。數(shù)據(jù)來源冗雜混亂,需要對(duì)數(shù)據(jù)進(jìn)行歸一化或離散化以適應(yīng)模型需要。有些數(shù)據(jù)集中不同類別之間的區(qū)分特征差別較小,或存在低分辨率、低準(zhǔn)確度形式的噪音、作物阻塞、植物重疊和聚集等問題,對(duì)研究的識(shí)別效果有很大影響,因此要進(jìn)行數(shù)據(jù)預(yù)處理以增強(qiáng)實(shí)現(xiàn)效果。
(3)實(shí)驗(yàn)條件不足。深度學(xué)習(xí)在訓(xùn)練過程中產(chǎn)生大量參數(shù),耗時(shí)長(zhǎng)且占用內(nèi)存較大,需要較大的計(jì)算資源。有些研究為了減少參數(shù)數(shù)量,采取了一些優(yōu)化方法,包括減少全連接層和卷積層,遷移學(xué)習(xí)或選用輕量級(jí)的CNN 模型。
在農(nóng)業(yè)計(jì)算機(jī)視覺方面,深度學(xué)習(xí)應(yīng)用已十分廣泛,但多數(shù)都集中在土地覆蓋分類、作物類型估算、作物物候、雜草檢測(cè)和水果分級(jí)方面,對(duì)于種子鑒定、土壤和葉片含氮量、灌溉、植物水分脅迫檢測(cè)、水蝕評(píng)估、害蟲檢測(cè)、除草劑使用、污染物鑒定等的研究相對(duì)較少。相關(guān)研究工作中討論的一些解決方案表現(xiàn)出一定的商業(yè)用途,盡管模型培訓(xùn)需要大量時(shí)間(在高性能GPU 集群計(jì)算機(jī)上需要多個(gè)小時(shí)),但分類本身非??欤ㄔ贑PU 上不到1s),因此可以很容易地在智能手機(jī)上加以實(shí)現(xiàn)。這為在全球范圍內(nèi)利用智能手機(jī)輔助診斷農(nóng)作物疾病提供了一條可行路徑。
根據(jù)當(dāng)前農(nóng)業(yè)病蟲害檢測(cè)識(shí)別可分為幾下幾個(gè)研究方向:
(1)建立國(guó)內(nèi)大型農(nóng)業(yè)圖像數(shù)據(jù)庫(kù)。與國(guó)外相關(guān)研究相比,我國(guó)農(nóng)業(yè)病蟲害圖像數(shù)據(jù)庫(kù)建立相對(duì)落后,一般的實(shí)驗(yàn)數(shù)據(jù)集大多是研究人員自行采集,沒有建立起聯(lián)通的數(shù)據(jù)庫(kù)網(wǎng)絡(luò),而一般的圖像采集將大大耗費(fèi)研究人員的時(shí)間,降低研究效率。
(2)利用紅外熱成像和高光譜成像技術(shù)采集農(nóng)作物信息??梢姽獬上窦夹g(shù)已趨于成熟,為了彌補(bǔ)其只能采集農(nóng)作物表面信息,引入紅外成像和高光譜成像,這是農(nóng)作物病蟲害檢測(cè)的一個(gè)重要方向。
(3)將手工提取特征和使用各種技術(shù)自動(dòng)提取特征相結(jié)合,以提高整體性能。
(4)模型輕量化。提高算法執(zhí)行速度,滿足實(shí)時(shí)性要求,以實(shí)現(xiàn)在移動(dòng)設(shè)備上的應(yīng)用,這是當(dāng)前深度學(xué)習(xí)在農(nóng)業(yè)病蟲害識(shí)別領(lǐng)域的重要突破方向。未來研究將致力于構(gòu)建微型版本的具有較高內(nèi)存效率的非順序型CNN 架構(gòu)。