doi:10.15889/j.issn.1002-1302.2024.20.003
摘要:農(nóng)作物圖像識別是一項(xiàng)重要的農(nóng)業(yè)技術(shù),它能夠通過分析農(nóng)田中的圖像數(shù)據(jù)來快速、準(zhǔn)確地識別不同作物的生長狀態(tài)和健康狀況。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,基于深度學(xué)習(xí)的農(nóng)作物圖像識別研究取得了顯著的進(jìn)展。梳理近年來該領(lǐng)域的研究進(jìn)展,總結(jié)不同深度學(xué)習(xí)模型在農(nóng)作物圖像識別任務(wù)中的應(yīng)用。首先,回顧農(nóng)作物圖像識別技術(shù)的發(fā)展進(jìn)程,從基于特征選擇的傳統(tǒng)方法到近年來基于深度學(xué)習(xí)的方法;其次,討論神經(jīng)網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)、目標(biāo)檢測、知識蒸餾等深度學(xué)習(xí)算法在農(nóng)作物圖像識別中的應(yīng)用,包括對不同農(nóng)作物品種、病蟲害和生長階段的識別;最后,分析該領(lǐng)域存在的問題與挑戰(zhàn),并提出未來可探索的研究方向,進(jìn)而為農(nóng)業(yè)科技的進(jìn)一步發(fā)展提供參考,促進(jìn)農(nóng)作物圖像識別技術(shù)的應(yīng)用和推廣,推動我國農(nóng)業(yè)生產(chǎn)的智能化和可持續(xù)發(fā)展。
關(guān)鍵詞:深度學(xué)習(xí);農(nóng)作物圖像識別;卷積神經(jīng)網(wǎng)絡(luò);目標(biāo)檢測
中圖分類號:S126;TP391.41" 文獻(xiàn)標(biāo)志碼:A
文章編號:1002-1302(2024)20-0018-07
收稿日期:2023-11-23
基金項(xiàng)目:中央引導(dǎo)地方科技發(fā)展資金(編號:XZ202101YD0014C)。
作者簡介:方曉捷(1998—),女,安徽滁州人,碩士研究生,主要從事農(nóng)作物圖像識別研究。E-mail:fangxiaojie2021@163.com。
通信作者:嚴(yán)李強(qiáng),碩士,教授,主要從事智能控制研究。E-mail:158201730@qq.com。
我國是世界上最大的農(nóng)業(yè)國之一,擁有豐富的農(nóng)作物資源。根據(jù)地理和氣候條件的不同,各地域的農(nóng)作物種植模式也不盡相同。在南方地區(qū),水稻是主要的糧食作物;北方地區(qū)以小麥為主要糧食作物,油菜籽、大豆和玉米是主要的油料和飼料作物,棉花則是重要的紡織原料。此外,番茄、花生、甘蔗、葡萄、蘋果等也得到廣泛種植[1]。我國農(nóng)業(yè)不斷發(fā)展創(chuàng)新,致力于提高農(nóng)作物品質(zhì)和產(chǎn)量,農(nóng)業(yè)技術(shù)的應(yīng)用和農(nóng)作物圖像識別等領(lǐng)域的研究也日益重要。隨著農(nóng)業(yè)科技的快速發(fā)展和農(nóng)業(yè)生產(chǎn)的轉(zhuǎn)型升級,農(nóng)作物圖像識別在智能農(nóng)業(yè)領(lǐng)域扮演著越來越重要的角色。傳統(tǒng)的農(nóng)作物圖像識別方法主要依賴于手工設(shè)計(jì)的特征提取和分類算法,這種方法的局限性和瓶頸逐漸顯現(xiàn)出來[2]。近年來,深度學(xué)習(xí)的興起給農(nóng)作物圖像識別帶來了突破性的改變。這些新技術(shù)不僅可以自動提取和學(xué)習(xí)圖像中的特征,還具有優(yōu)秀的分類性能,可以大大提升農(nóng)作物圖像識別的精度和效率[1-2]。本研究通過總結(jié)基于深度學(xué)習(xí)的農(nóng)作物圖像識別的發(fā)展,探討其在解決農(nóng)作物管理過程中實(shí)際問題的潛力和應(yīng)用,進(jìn)而促進(jìn)對農(nóng)作物圖像識別技術(shù)的深入理解,為未來的研究和應(yīng)用提供指導(dǎo)和參考,推動智能農(nóng)業(yè)的發(fā)展,并最終提高農(nóng)業(yè)生產(chǎn)效益和可持續(xù)發(fā)展水平。
1" 農(nóng)作物圖像識別的發(fā)展進(jìn)程
20世紀(jì)80年代,美國率先提出“精確農(nóng)業(yè)”的構(gòu)想,并在此后多年的實(shí)踐中成為“精確農(nóng)業(yè)”績效最好的國家,這為“智慧農(nóng)業(yè)”奠定了良好的發(fā)展基礎(chǔ)[3]。國內(nèi)由于圖像識別技術(shù)不夠成熟,農(nóng)作物圖像識別一直處于較低水平。直到2010年左右,隨著計(jì)算機(jī)視覺和深度學(xué)習(xí)等技術(shù)的快速發(fā)展,農(nóng)作物圖像識別開始成為一個熱門研究領(lǐng)域,其通過分析和識別農(nóng)作物圖像,實(shí)現(xiàn)對農(nóng)作物生長狀態(tài)、病害檢測和農(nóng)田管理等方面的有效監(jiān)測和診斷。
傳統(tǒng)的機(jī)器視覺技術(shù)對農(nóng)作物圖像識別需要進(jìn)行繁瑣的預(yù)處理,不僅耗時長,還增加了建模工作量,識別效果不夠精確。隨著科技的發(fā)展,2006年Hinton等提出“深度學(xué)習(xí)”的概念,并在之后的研究中逐步發(fā)展了基于深度學(xué)習(xí)的各種模型和算法[4]。近年來,研究人員利用深度學(xué)習(xí)進(jìn)行農(nóng)作物圖像識別,相較于之前的識別方法,可以直接將圖像輸入到網(wǎng)絡(luò)中,自動逐層提取高級視覺特征,不僅更快速準(zhǔn)確,還減少了人工設(shè)計(jì)特征產(chǎn)生的不完備性。隨著網(wǎng)絡(luò)結(jié)構(gòu)的不斷改進(jìn),在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,衍生出多種不同網(wǎng)絡(luò)深度的卷積神經(jīng)網(wǎng)絡(luò)模型,如GoogLeNet、VGGNet、Resnet、YOLO、Faster R-CNN等,這些改進(jìn)在目標(biāo)檢測、圖像識別中具有較好的效果[5]。
2" 基于深度學(xué)習(xí)的圖像識別技術(shù)
2.1" 卷積神經(jīng)網(wǎng)絡(luò)
作為深度學(xué)習(xí)的代表算法之一,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)。CNN的設(shè)計(jì)靈感來自于生物學(xué)中視覺皮層對視覺信息處理的模擬。卷積神經(jīng)網(wǎng)絡(luò)的主要優(yōu)勢是利用卷積和池化操作的局部感知能力,減少參數(shù)數(shù)量,并通過共享權(quán)重提取平移不變的特征[6]。這使得CNN在圖像識別、語義分割等計(jì)算機(jī)視覺任務(wù)中具有良好的效果和廣泛的應(yīng)用。卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層、池化層、分類輸出層構(gòu)成,它們分別負(fù)責(zé)提取圖像的局部特征、降低特征維度、進(jìn)行最終分類或預(yù)測[7](圖1)。
在圖像識別中常用的卷積神經(jīng)網(wǎng)絡(luò)模型有LeNet、AleXNet、GoogLeNet、VGGNet、ResNet等。郭小燕等采用VGG16作為嵌入單元提取蟲害樣本特征與類別特征,解決植物蟲害小樣本分類問題[8];廖露等針對傳統(tǒng)水稻病害分類方法效率低、準(zhǔn)確度不高等問題,提出一種聯(lián)合VGG19卷積神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)模型的水稻病害圖像分類方法,正確率達(dá)到99%以上[9];Nandi等使用ResNet對14個不同品種的植物葉片圖像組成的數(shù)據(jù)集進(jìn)行識別任務(wù),準(zhǔn)確率高達(dá)99.53%[10];李玉芳通過改造GoogLeNet的Inception模塊,減少網(wǎng)絡(luò)中的Inception模塊數(shù)量,結(jié)果顯示,改造后的分類網(wǎng)絡(luò)在9分類的農(nóng)作物病害分類中的精度達(dá)到98.4%[11]。
2.2" 基于單雙階段的目標(biāo)檢測算法
在圖像識別技術(shù)中,目標(biāo)檢測是一項(xiàng)重要任務(wù),用于在圖像中定位和分類出不同類別的目標(biāo)物體。目標(biāo)檢測算法可以根據(jù)其基本思想和實(shí)現(xiàn)方式分為單階段和雙階段目標(biāo)檢測算法[1]。雙階段目標(biāo)檢測方法的提出主要是為了解決準(zhǔn)確度的問題。在傳統(tǒng)方法中,通常使用滑動窗口的方式進(jìn)行目標(biāo)識別,但這種方法效率較低,且容易產(chǎn)生大量的冗余計(jì)算,雙階段方法通過引入候選框生成的策略,能夠更準(zhǔn)確地定位和分類目標(biāo),且具有較高的檢測精度。但雙階段目標(biāo)檢測算法的速度相對較慢,并不適用于一些實(shí)時應(yīng)用場景。因此,單階段目標(biāo)檢測方法的提出是為了解決速度問題。單階段目標(biāo)檢測方法通過在不同尺度的特征圖上進(jìn)行目標(biāo)預(yù)測,可以在1次前向傳遞中同時完成檢測任務(wù),從而實(shí)現(xiàn)實(shí)時目標(biāo)檢測的需求,是端到端的過程[12](表1)。
2.2.1" 雙階段目標(biāo)檢測
雙階段目標(biāo)檢測算法是指將目標(biāo)檢測問題拆分為2個階段進(jìn)行處理。第一階段是目標(biāo)建議生成,它生成一組候選目標(biāo)框;第二階段是目標(biāo)框分類和細(xì)化,它對候選目標(biāo)框進(jìn)行分類和位置精修。雙階段目標(biāo)檢測算法通常具有更高的準(zhǔn)確性,但計(jì)算代價也更高[2]。其中幾個常見的雙階段目標(biāo)檢測算法包括:R-CNN(region-based convolutional neural networks),它首先生成一組候選框,再通過卷積神經(jīng)網(wǎng)絡(luò)提取每個框中的特征,最后進(jìn)行分類和邊界框回歸; FastR-CNN通過
引入感興趣區(qū)RoI(region of interest)池化操作,將整個圖像轉(zhuǎn)化為特征圖,可以提高目標(biāo)檢測的速度和準(zhǔn)確性;Faster R-CNN引入?yún)^(qū)域建議網(wǎng)絡(luò)RPN(region proposal network),用于生成候選目標(biāo)框,再通過共享卷積層提取特征并進(jìn)行框的分類和精修(圖2)。
Widiyanto等使用Faster R-CNN模型進(jìn)行訓(xùn)練,可以通過番茄圖像中的顏色來識別番茄成熟度,其檢測平均精確度高達(dá)98.7%[13];岑霄對Faster R-CNN加以改進(jìn),提出融合空洞卷積和特征金字塔網(wǎng)絡(luò)的Faster R-CNN模型來檢測柑橘害蟲類別,對比原模型,準(zhǔn)確率提高至91.72%[14];劉闐宇等在基于Faster R-CNN檢測結(jié)構(gòu)的基礎(chǔ)上,改進(jìn)檢測結(jié)構(gòu)中區(qū)域建議網(wǎng)絡(luò),提高建議區(qū)域質(zhì)量,該方法對自然條件下多姿態(tài)葡萄葉片檢測精度更高[15-17];劉亞恒利用Faster R-CNN模型并加以改進(jìn),骨干網(wǎng)絡(luò)為ResNet-50,將特征金字塔網(wǎng)絡(luò)與骨干網(wǎng)絡(luò)相結(jié)合,搭建蘋果葉部病害的檢測模型[18];趙越等認(rèn)為,F(xiàn)aster R-CNN和VGG16組合的結(jié)構(gòu)對馬鈴薯葉片病害識別取得了較高的精度,檢測精度高達(dá)99.5%,明顯優(yōu)于YOLO v3、YOLO v4網(wǎng)絡(luò)[19]。
2.2.2" 單階段目標(biāo)檢測
單階段目標(biāo)檢測算法是指直接從輸入圖像中預(yù)測目標(biāo)位置和類別的算法。它將目標(biāo)檢測問題視為一個回歸問題,并使用一個網(wǎng)絡(luò)結(jié)構(gòu)來直接回歸目標(biāo)的邊界框和類別概率。單階段目標(biāo)檢測算法一般具有簡單、快速的特點(diǎn)[2]。其中幾個常見的單階段目標(biāo)檢測算法包括:YOLO(you only look once)系列,它們通過將圖像分為不同的網(wǎng)格單元,每個單元預(yù)測目標(biāo)的邊界框和類別概率;SSD(single shot multi box detector)使用多尺度卷積特征圖來預(yù)測不同大小的目標(biāo),通過在不同層級進(jìn)行預(yù)測來提高檢測的準(zhǔn)確性;Retina Net通過使用一種稱為Focal Loss的損失函數(shù)來解決目標(biāo)檢測中類別不平衡的問題,可以提高小目標(biāo)檢測的精度(圖3)。
葉中華等采用SSD算法對自建數(shù)據(jù)集進(jìn)行復(fù)雜背景下的作物病害檢測,檢測平均精度為83.90%[20];俞佩仕設(shè)計(jì)基于殘差網(wǎng)絡(luò)的水稻紋枯病病斑SSD檢測算法,為了提高網(wǎng)絡(luò)提取特征的能力,將VGG16網(wǎng)絡(luò)替換為ResNet50,實(shí)現(xiàn)了水稻紋枯病的病害檢測,檢測精度高達(dá)81.2%[21];李康順等提出一種基于卷積注意力機(jī)制改進(jìn)的YOLOX-Nano智能檢測與識別模型,大大提高了病害檢測的精度[22];Agbulos等利用YOLO算法成功識別水稻葉片是否患有褐斑病或葉瘟?。?3];Mohandas等提出YOLO v4-tiny模型,用于檢測番茄、草莓、馬鈴薯、豆類和芒果的相關(guān)病害,精度高且耗時短[24];公徐路等提出一種基于YOLO v5s的蘋果葉片小目標(biāo)病害輕量化檢測方法,將YOLO v5s的骨干網(wǎng)絡(luò)更改為ShuffleNet v2輕量化網(wǎng)絡(luò),引入CBAM注意力模塊使模型關(guān)注蘋果葉片小目標(biāo)病害, 提高蘋果葉
片病害檢測精度,該方法對小目標(biāo)的檢測準(zhǔn)確率提高了3百分點(diǎn)[25]。
2.3" 生成對抗網(wǎng)絡(luò)
生成對抗網(wǎng)絡(luò)(generative adversarial network,GAN)是一種深度學(xué)習(xí)模型,由生成器(generator)和判別器(discriminator)2個互相競爭的神經(jīng)網(wǎng)絡(luò)組成。生成器的目標(biāo)是從隨機(jī)噪聲中生成與訓(xùn)練數(shù)據(jù)相似的新樣本。它將隨機(jī)噪聲作為輸入,并通過一系列的轉(zhuǎn)換層逐漸生成逼真的樣本圖像。生成器的目標(biāo)是盡可能地欺騙判別器,使其將生成器生成的樣本誤認(rèn)為是真實(shí)的;判別器的任務(wù)是將生成器生成的樣本與真實(shí)樣本區(qū)分開來。它接收生成器生成的樣本和真實(shí)樣本作為輸入,并輸出1個概率值來表示輸入樣本是真實(shí)樣本的可能性。判別器的目標(biāo)是有效識別生成器生成的假樣本,并準(zhǔn)確地區(qū)分真實(shí)樣本和生成的樣本[26]。通過不斷地競爭和訓(xùn)練,生成器逐漸提升生成樣本的質(zhì)量,而判別器則逐漸提高區(qū)分真實(shí)和生成樣本的能力。當(dāng)生成器和判別器達(dá)到平衡時,生成器可以生成與訓(xùn)練數(shù)據(jù)相似的逼真樣本,且判別器無法準(zhǔn)確區(qū)分真實(shí)和生成的樣本[27](圖4)。
Sharma等針對沒有廣泛的數(shù)據(jù)集可用于訓(xùn)練模型問題,訓(xùn)練了3種算法,以手動收集的芒果葉數(shù)據(jù)集為輸入創(chuàng)建1個全新的數(shù)據(jù)集,再將Wasserstein生成對抗網(wǎng)絡(luò)(WGAN)、深度卷積生成對抗網(wǎng)絡(luò)(DCGAN)以及生成對抗網(wǎng)絡(luò)(GAN)等3種算法進(jìn)行比較,以找到產(chǎn)生新數(shù)據(jù)集的最佳算法,結(jié)果表明,WGAN算法能得到最好的圖像質(zhì)量[28];Kamohara等提出一種無監(jiān)督學(xué)習(xí)方法的對抗性生成網(wǎng)絡(luò)GANomaly,使用未標(biāo)記的健康葉片圖像作為訓(xùn)練數(shù)據(jù),結(jié)果表明,該模型可以減少診斷的時間成本,且各評價指標(biāo)都較好[29];Ramadan等使用SRGAN作為一種水稻病害數(shù)據(jù)增強(qiáng)方法,獲得新的數(shù)據(jù)集,且新創(chuàng)建的數(shù)據(jù)集在分類模型上準(zhǔn)確率高達(dá)94.30%[30];陶賢鵬提出ViT-PWGAN-GP網(wǎng)絡(luò),生成模型利用ViT模塊對目標(biāo)樣本的特征空間進(jìn)行全局特征學(xué)習(xí),并逐步提高生成圖像的分辨率,結(jié)果表明,使用ViT-PWGAN-GP進(jìn)行圖像數(shù)據(jù)增強(qiáng)對VGG-16、GooLeNet、ResNet-50的水稻病害識別準(zhǔn)確率分別提升15.3%、14.7%、14.3%[31]。
2.4" 遷移學(xué)習(xí)
遷移學(xué)習(xí)(transfer learning)是一種在圖像識別技術(shù)中廣泛應(yīng)用的方法,它可以將一個任務(wù)中學(xué)到的知識遷移到另一個相關(guān)任務(wù)上,以提升性能并加快學(xué)習(xí)速度。遷移學(xué)習(xí)利用已經(jīng)訓(xùn)練好的模型在新任務(wù)上進(jìn)行初始化,然后通過微調(diào)模型的參數(shù),以適應(yīng)新任務(wù)的特性[32]。
遷移學(xué)習(xí)通常會有1個源域Ds、1個學(xué)習(xí)任務(wù)Ts和1個目標(biāo)域Dt、1個學(xué)習(xí)任務(wù)t,其中源域用Ds={xi,yi}Nsi表示,xi、yi分別表示數(shù)據(jù)樣本和對應(yīng)的類別標(biāo)簽,目標(biāo)域用Dt={xi,yi}Nti表示,遷移學(xué)習(xí)的目的就是獲取源域Ds和學(xué)習(xí)任務(wù)Ts中的知識以幫助提升目標(biāo)域中學(xué)習(xí)任務(wù)Tt的完成(圖5)。
萬軍杰等探究遷移學(xué)習(xí)技術(shù)和GoogLeNet模型相結(jié)合的方法,針對果園病蟲害樣本的識別并對它們的危害程度進(jìn)行分類研究,得到較高的準(zhǔn)確率,平均識別精度達(dá)到99.35%[33];Arshad等為提高植物葉片病害的檢測率,利用ResNet50和遷移學(xué)習(xí)識別馬鈴薯、番茄和玉米的病害,準(zhǔn)確率達(dá)到98.93%[34];Song等針對蘋果樹病害圖像數(shù)據(jù)集樣本量較小的問題,采用遷移學(xué)習(xí)的思想對網(wǎng)絡(luò)模型訓(xùn)練過程進(jìn)行升級,進(jìn)一步提高了果樹病害圖像的分類精度[35];王大慶等為解決域遷移和過擬合問題,提出一種兩階段遷移學(xué)習(xí)訓(xùn)練方法,使得玉米葉部病害識別準(zhǔn)確率大大提高[36];鄧朋飛等以提高玉米病害圖像的準(zhǔn)確率、降低網(wǎng)絡(luò)參數(shù)和模型大小為目的,提出一種結(jié)合遷移學(xué)習(xí)和模型壓縮的卷積神經(jīng)網(wǎng)絡(luò)用于玉米病害識別,通過遷移學(xué)習(xí),平均識別準(zhǔn)確率達(dá)到93.38%[37]。
2.5" 知識蒸餾
知識蒸餾(knowledge distillation)是一種常用的圖像識別技術(shù),它通過將一個大型、復(fù)雜的模型(教師模型)的知識轉(zhuǎn)移給一個較小、簡單的模型(學(xué)生模型),以此提升學(xué)生模型的性能。知識蒸餾的基本思想是:通過教師模型的輸出概率分布,引導(dǎo)學(xué)生模型更好地學(xué)習(xí),以提高性能。教師模型通常是一個預(yù)訓(xùn)練好的復(fù)雜模型,可以是一個深層的卷積神經(jīng)網(wǎng)絡(luò)。而學(xué)生模型是一個較淺的模型,可以是一個淺層的卷積神經(jīng)網(wǎng)絡(luò)[38](圖6)。
李慶盛提出一種通過知識蒸餾和生成對抗網(wǎng)絡(luò)相結(jié)合的番茄病害圖像識別方法,通過生成對抗網(wǎng)絡(luò)緩解深度學(xué)習(xí)中數(shù)據(jù)量不足的問題,并通過知識蒸餾進(jìn)行模型壓縮[39];李若曦針對模型輕量化問題,提出一種基于多層次特征遷移和知識蒸餾的病害識別方法,通過中間層和深層知識蒸餾提升預(yù)測分類準(zhǔn)確率[40];Wei等為了進(jìn)一步提高模型的準(zhǔn)確性,提出一種改進(jìn)的基于溫度衰減的知識蒸餾方法,在不增加模型參數(shù)和計(jì)算量的前提下,提高花卉分類的準(zhǔn)確率,使其高達(dá)98.76%[41];劉媛媛等針對卷積神經(jīng)網(wǎng)絡(luò)參數(shù)過多,在嵌入式設(shè)備上部署具有挑戰(zhàn)的問題,提出基于知識蒸餾和模型剪枝的輕量化模型植物病害識別,以ResNet為骨干網(wǎng)絡(luò),最終模型準(zhǔn)確率達(dá)到97.78%,且模型能夠移植到Android平臺上并有效運(yùn)行[38];溫釗發(fā)等以大田復(fù)雜背景為前提,提出一種基于知識蒸餾與EssNet的病害識別方法,實(shí)現(xiàn)了病害的高效識別,準(zhǔn)確率達(dá)到95.21%,且易于搭載至移動端[42]。
3" 存在的問題
綜上所述,針對農(nóng)作物圖像識別問題,各種深度學(xué)習(xí)模型在試驗(yàn)中均取得了可觀的識別準(zhǔn)確率。然而,這些模型真正運(yùn)用在農(nóng)業(yè)生產(chǎn)實(shí)踐中卻面臨著以下幾個方面的問題。
3.1nbsp; 樣本數(shù)據(jù)量不足
深度學(xué)習(xí)方法在農(nóng)作物圖像識別中的應(yīng)用導(dǎo)致對訓(xùn)練數(shù)據(jù)量的需求激增。盡管存在一些公開的大型數(shù)據(jù)集如Plant Village[43],但這些數(shù)據(jù)集的圖像多拍攝于受控的實(shí)驗(yàn)室環(huán)境,樣本較簡單,無法準(zhǔn)確識別實(shí)際環(huán)境中的各種病害。在實(shí)際環(huán)境下采集高質(zhì)量病害樣本非常困難,因?yàn)椴『Πl(fā)生具有隨機(jī)性,且不同類型病害在不同生長階段、不同地區(qū)表現(xiàn)出的特征均不相同。此外,實(shí)驗(yàn)室采集的圖片雖然理想,但實(shí)際環(huán)境下的樣本背景復(fù)雜,包含土壤、污垢、昆蟲等干擾信息,影響模型的分析效果,導(dǎo)致模型在實(shí)際應(yīng)用中的普適性和泛化能力較差[44]。不同類型病蟲害的癥狀相似性也增加了數(shù)據(jù)標(biāo)注的難度,易發(fā)生錯誤標(biāo)注,從而影響模型的準(zhǔn)確性。目前仍然缺乏大規(guī)模、多種類、多類型的公開數(shù)據(jù)庫,建立全面且多樣性強(qiáng)的實(shí)際環(huán)境下的數(shù)據(jù)集需要投入大量人力物力進(jìn)行監(jiān)測和拍攝,這是目前深度學(xué)習(xí)訓(xùn)練面臨的重要問題。
3.2" 模型性能問題
為了能夠捕捉不同病害之間的細(xì)微差異,從而提升模型在病害識別中的準(zhǔn)確率,通常采用的方法是使用更深層次的卷積神經(jīng)網(wǎng)絡(luò)。深層網(wǎng)絡(luò)具有更多的卷積層,這使得模型能夠提取圖像中更為抽象和語義更豐富的特征,從而提高對復(fù)雜病害的識別精度。例如,更深的網(wǎng)絡(luò)能夠識別更細(xì)微的紋理和形狀差異,進(jìn)而更準(zhǔn)確地區(qū)分相似的病害[45]。然而,這種方法也帶來了顯著的挑戰(zhàn)。首先,深層網(wǎng)絡(luò)的計(jì)算和訓(xùn)練成本非常高,這不僅需要大量的計(jì)算資源,還需要較長的訓(xùn)練時間;其次,深層網(wǎng)絡(luò)的計(jì)算需求往往超出了手持移動設(shè)備的處理能力,使得在這些設(shè)備上實(shí)現(xiàn)實(shí)時病害檢測變得困難[46-47]。實(shí)時檢測要求模型能夠迅速處理圖像數(shù)據(jù)并給出結(jié)果,但深層網(wǎng)絡(luò)由于其復(fù)雜性,可能導(dǎo)致處理速度變慢,影響應(yīng)用的實(shí)用性和用戶體驗(yàn)。因此,如何在提升模型性能和保持實(shí)時性之間找到合理的平衡,將是亟待解決的關(guān)鍵問題。
4" 結(jié)論與展望
4.1" 結(jié)論
本研究系統(tǒng)闡述了基于深度學(xué)習(xí)的農(nóng)作物圖像識別的研究發(fā)展。首先介紹農(nóng)作物圖像識別技術(shù)的發(fā)展進(jìn)程,再介紹基于深度學(xué)習(xí)的圖像識別的新技術(shù),如YOLO系列、生成對抗網(wǎng)絡(luò)等。綜合上述內(nèi)容,農(nóng)作物圖像識別在傳統(tǒng)方法的基礎(chǔ)上,通過引入深度學(xué)習(xí)取得了顯著的進(jìn)展,新型算法的應(yīng)用使得農(nóng)作物圖像識別能夠更準(zhǔn)確、更高效地監(jiān)測不同農(nóng)作物的生長狀態(tài)和健康狀況。但盡管取得了許多成果,農(nóng)作物圖像識別仍然面臨著一些問題與挑戰(zhàn),如數(shù)據(jù)集的標(biāo)注困難、模型的泛化能力不足等。因此,今后的研究需要更加關(guān)注這些問題,不斷改進(jìn)農(nóng)作物圖像識別技術(shù)的可靠性和實(shí)用性。
4.2" 展望
大規(guī)模、高質(zhì)量的農(nóng)作物圖像數(shù)據(jù)集是農(nóng)作物圖像識別研究的基礎(chǔ)。因此,未來應(yīng)該積極推動數(shù)據(jù)集的建立和標(biāo)注工作,特別是針對農(nóng)作物生長不同階段和各種生態(tài)環(huán)境的數(shù)據(jù)集。未來的研究可以致力于進(jìn)一步優(yōu)化農(nóng)作物圖像識別的深度學(xué)習(xí)模型,通過改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)、損失函數(shù)和訓(xùn)練策略等來提升識別的準(zhǔn)確性和魯棒性。
參考文獻(xiàn):
[1]郭文娟,馮" 全,李相周. 基于農(nóng)作物病害檢測與識別的卷積神經(jīng)網(wǎng)絡(luò)模型研究進(jìn)展[J]. 中國農(nóng)機(jī)化學(xué)報,2022,43(10):157-166.
[2]何" 瀟. 基于深度學(xué)習(xí)的西瓜葉片病害識別與檢測方法研究[D]. 長沙:湖南農(nóng)業(yè)大學(xué),2021.
[3]美國發(fā)展“智慧農(nóng)業(yè)”的做法及啟示[EB/OL]. (2021-06-26)[2023-11-18]. https://www.sohu.com/na/474158734_121123754.
[4]陳" 楨. 基于深度學(xué)習(xí)的農(nóng)作物病害分類算法研究[D]. 濟(jì)南:齊魯工業(yè)大學(xué),2022.
[5]何雨霜,王" 琢,王湘平,等. 深度學(xué)習(xí)在農(nóng)作物病害圖像識別中的研究進(jìn)展[J]. 中國農(nóng)機(jī)化學(xué)報,2023,44(2):148-155.
[6]魏" 花. 基于卷積神經(jīng)網(wǎng)絡(luò)的細(xì)粒度圖像識別關(guān)鍵技術(shù)分析與研究[D]. 長春:中國科學(xué)院大學(xué)(中國科學(xué)院長春光學(xué)精密機(jī)械與物理研究所),2021.
[7]賀" 晉. 基于卷積神經(jīng)網(wǎng)絡(luò)的三種粒度的圖像識別模型研究[D]. 北京:北京郵電大學(xué),2021.
[8]郭小燕,尚皓璽. 基于元學(xué)習(xí)的植物蟲害識別原型網(wǎng)絡(luò)VGG-ML[J]. 南京農(nóng)業(yè)大學(xué)學(xué)報,2024,47(2):392-401.
[9]廖" 露,韓春峰,何純櫻. 基于VGG19卷積神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)的水稻病害圖像分類方法[J]. 測繪,2023,46(4):153-157,181.
[10]Nandi A,Yadav S,Jaiswal Y.Crop disease recognition and diagnosis using Residual Neural Network[C]//2022 International Conference on Advancements in Smart,Secure and Intelligent Computing.Bhubaneswar:IEEE,2022:1-6.
[11]李玉芳. 基于簡化GoogLeNet的農(nóng)作物葉片病害識別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 信息與電腦(理論版),2023,35(9):179-181.
[12]朱東郡. 面向復(fù)雜場景圖像的目標(biāo)檢測與識別方法研究[D]. 徐州:中國礦業(yè)大學(xué),2022.
[13]Widiyanto S,Wardani D T,Wisnu P S. Image-based tomato maturity classification and detection using faster R-CNN method[C]//5th International Symposium on Multidisciplinary Studies and Innovative Technologies.Ankara:IEEE,2021:130-134.
[14]岑" 霄. 融合空洞卷積和特征金字塔的Faster R-CNN柑橘害蟲檢測方法[J]. 中國農(nóng)學(xué)通報,2023,39(22):158-164.
[15]劉闐宇,馮" 全,楊" 森. 基于卷積神經(jīng)網(wǎng)絡(luò)的葡萄葉片病害檢測方法[J]. 東北農(nóng)業(yè)大學(xué)學(xué)報,2018,49(3):73-83.
[16]劉闐宇,馮" 全. 基于卷積神經(jīng)網(wǎng)絡(luò)的葡萄葉片檢測[J]. 西北大學(xué)學(xué)報(自然科學(xué)版),2017,47(4):505-512.
[17]劉闐宇. 基于卷積神經(jīng)網(wǎng)絡(luò)的葡萄葉片病害檢測方法研究[D]. 蘭州:甘肅農(nóng)業(yè)大學(xué),2018.
[18]劉亞恒. 基于改進(jìn)Faster R-CNN蘋果葉部病害檢測方法研究[D]. 漢中:陜西理工大學(xué),2022.
[19]趙" 越,趙" 輝,姜永成,等. 基于深度學(xué)習(xí)的馬鈴薯葉片病害檢測方法[J]. 中國農(nóng)機(jī)化學(xué)報,2022,43(10):183-189.
[20]葉中華,趙明霞,賈" 璐. 復(fù)雜背景農(nóng)作物病害圖像識別研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報,2021,52(增刊1):118-124,147.
[21]俞佩仕. 水稻莖基部病害圖像智能采集與病斑檢測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 杭州:浙江理工大學(xué),2019.
[22]李康順,楊振盛,江梓鋒,等. 基于改進(jìn)YOLOX-Nano的農(nóng)作物葉片病害檢測與識別方法[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報,2023,44(4):593-603.
[23]Agbulos M K,Sarmiento Y,Villaverde J. Identification of leaf blast and brown spot diseases on rice leaf with YOLO algorithm[C]//7th International Conference on Control Science and Systems Engineering.Qingdao:IEEE,2021:307-312.
[24]Mohandas A,Anjali M S,Rahul Varma U. Real-time detectionand identification of plant leaf diseases using YOLO v4-tiny[C]//12th International Conference on Computing Communication and Networking Technologies.Kharagpur:IEEE,2021:1-5.
[25]公徐路,張淑娟. 基于改進(jìn)YOLO v5s的蘋果葉片小目標(biāo)病害輕量化檢測方法[J]. 農(nóng)業(yè)工程學(xué)報,2023,39(19):175-184.
[26]施煬明. 基于生成對抗網(wǎng)絡(luò)的弱光圖像增強(qiáng)算法研究[D]. 合肥:中國科學(xué)技術(shù)大學(xué),2022.
[27]胡瀟菡. 基于生成對抗網(wǎng)絡(luò)的弱監(jiān)督圖像語義分割方法研究[D]. 西安:西安電子科技大學(xué),2020.
[28]Sharma A,Kaur H,Prashar D.Generative adversarial networks based approach for data augmentation in mango leaf disease detection system[C]//12th International Conference on Communication Systems and Network Technologies. Bhopal:IEEE,2023:816-821.
[29]Kamohara Y,Sakuma T,Kato S.Plant disease detection with generative adversarial networks for assisting extension workers[C]//11th Global Conference on Consumer Electronics.Osaka:IEEE,2022:840-841.
[30]Ramadan S T Y,Sakib T,Ul Haque M M,et al. Generative adversarial network-based augmented rice leaf disease detection using deep learning[C]//25th International Conference on Computer and Information Technology. Coxs Bazar:IEEE,2022:976-981.
[31]陶賢鵬. 基于WGAN-GP的水稻圖像數(shù)據(jù)增強(qiáng)方法研究[D]. 大慶:黑龍江八一農(nóng)墾大學(xué),2023.
[32]余" 勝,謝" 莉. 基于遷移學(xué)習(xí)和卷積視覺轉(zhuǎn)換器的農(nóng)作物病害識別研究[J]. 中國農(nóng)機(jī)化學(xué)報,2023,44(8):191-197.
[33]萬軍杰,祁力鈞,盧中奧,等. 基于遷移學(xué)習(xí)的GoogLeNet果園病蟲害識別與分級[J]. 中國農(nóng)業(yè)大學(xué)學(xué)報,2021,26(11):209-221.
[34]Arshad M S,Rehman U A,F(xiàn)raz M M. Plant disease identification using transfer learning[C]//2021 International Conference on Digital Futures and Transformative Technologies.Islamabad:IEEE,2021:1-5.
[35]Song X,Mariano V Y. Image-based apple disease detection based on residual neural network and transfer learning[C]//3rd International Conference on Power,Electronics and Computer Applications.Shenyang:IEEE,2023:365-369.
[36]王大慶,祿" "琳,于興龍,等. 基于深度遷移學(xué)習(xí)的EfficientNet玉米葉部病害識別[J]. 東北農(nóng)業(yè)大學(xué)學(xué)報,2023,54(5):66-76.
[37]鄧朋飛,官" 錚,王宇陽,等. 基于遷移學(xué)習(xí)和模型壓縮的玉米病害識別方法[J]. 計(jì)算機(jī)科學(xué),2022,49(增刊2):444-449.
[38]劉媛媛,王定坤,鄔" 雷,等. 基于知識蒸餾和模型剪枝的輕量化模型植物病害識別[J]. 浙江農(nóng)業(yè)學(xué)報,2023,35(9):2250-2264.
[39]李慶盛. 基于圖像識別與深度學(xué)習(xí)的農(nóng)作物病害檢測研究[D]. 淄博:山東理工大學(xué),2022.
[40]李若曦. 農(nóng)作物病害圖像識別與模型輕量化研究[D]. 天津:河北工業(yè)大學(xué),2022.
[41]Wei X D,Zhang H Y,Shi C K,et al. A lightweight flower classification model based on improved knowledge distillation[C]//10th Joint International Information Technology and Artificial Intelligence Conference.Chongqing:IEEE,2022:2236-2239.
[42]溫釗發(fā),蒲" 智,程" 曦,等. 基于知識蒸餾與EssNet的田間農(nóng)作物病害識別[J]. 山東農(nóng)業(yè)科學(xué),2023,55(5):154-163.
[43]李子涵,周省邦,趙" 戈,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)業(yè)病蟲害識別研究綜述[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(7):15-23.
[44]慕君林,馬" 博,王云飛,等. 基于深度學(xué)習(xí)的農(nóng)作物病蟲害檢測算法綜述[J]. 農(nóng)業(yè)機(jī)械學(xué)報,2023,54(增刊2):301-313.
[45]戴久竣.基于深度學(xué)習(xí)的農(nóng)作物葉片病害識別研究[D]. 杭州:浙江科技學(xué)院,2022.
[46]張穎超. 基于深度學(xué)習(xí)的農(nóng)作物葉片病害檢測識別方法及其應(yīng)用研究[D]. 石家莊:河北科技大學(xué),2021.
[47]毛" 星,金" 晶,張" 欣,等. 基于改進(jìn)DeepLab v3+模型和遷移學(xué)習(xí)的高分遙感耕地信息提取方法[J]. 江蘇農(nóng)業(yè)學(xué)報,2023,39(7):1519-1529.