尚皓璽,郭小燕,朱恒宇
(1.甘肅農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院,甘肅蘭州 730070;2.濟(jì)南大學(xué)數(shù)學(xué)科學(xué)學(xué)院,山東濟(jì)南 250000)
蟲害問題是影響農(nóng)業(yè)生產(chǎn)產(chǎn)量和質(zhì)量的關(guān)鍵因素之一[1-2],農(nóng)業(yè)蟲害防治對(duì)智能化害蟲檢測(cè)與識(shí)別提出了新要求,若能快速、準(zhǔn)確地發(fā)現(xiàn)與識(shí)別害蟲并及時(shí)采取防御措施,可有效降低蟲害帶來的損失。傳統(tǒng)的作物害蟲識(shí)別依賴于經(jīng)驗(yàn)豐富的專家,存在主觀性強(qiáng)、準(zhǔn)確率低、成本高等問題。隨著人工智能技術(shù)的發(fā)展,以及VGG[3]、ResNet[4]等經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)模型的提出,基于深度學(xué)習(xí)的農(nóng)業(yè)害蟲識(shí)別技術(shù)已成為一個(gè)研究熱點(diǎn)[5]。張善文等[6]在VGG-16 模型基礎(chǔ)上引入可形變卷積,構(gòu)建一種能夠適應(yīng)不同形狀、狀態(tài)和尺寸等幾何形變害蟲特征的VGG-16 模型,并應(yīng)用于田間作物害蟲檢測(cè),在實(shí)際田間害蟲圖像數(shù)據(jù)庫上的檢測(cè)準(zhǔn)確率為91.14%;Wu 等[7]構(gòu)建一個(gè)用于農(nóng)作物害蟲識(shí)別的數(shù)據(jù)集IP02,使用ResNet 網(wǎng)絡(luò)對(duì)數(shù)據(jù)集中的害蟲圖片進(jìn)行分類,但由于未對(duì)數(shù)據(jù)集圖像進(jìn)行篩選處理,分類準(zhǔn)確率僅為49.4%;趙立新等[8]以棉花葉部病蟲害圖像為研究對(duì)象,利用PlantVillage 大數(shù)據(jù)集訓(xùn)練AlexNet 模型取得預(yù)訓(xùn)練模型,準(zhǔn)確率為93.50%,之后使用數(shù)據(jù)增強(qiáng)方法擴(kuò)充數(shù)據(jù)集,準(zhǔn)確率為97.16%。
采用上述傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)對(duì)作物害蟲進(jìn)行識(shí)別,模型體積較大,訓(xùn)練耗費(fèi)資源多,且需要大量樣本數(shù)據(jù)作為模型訓(xùn)練的基礎(chǔ),因此近年來也不斷有學(xué)者探索小樣本條件下的輕量級(jí)農(nóng)業(yè)害蟲識(shí)別模型。如楊明欣等[9]提出一種改進(jìn)遷移學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的玉米病害識(shí)別方法,采用基于遷移的MobileNetV2 模型與Focal Loss 函數(shù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,識(shí)別準(zhǔn)確率為97.23%,網(wǎng)絡(luò)參數(shù)權(quán)重為8.69 MB;李靜等[10]為了解決玉米螟蟲害圖像識(shí)別準(zhǔn)確率和效率低的問題,通過數(shù)據(jù)增強(qiáng)擴(kuò)充樣本,之后使用遷移學(xué)習(xí)將Inception-v4 網(wǎng)絡(luò)結(jié)構(gòu)知識(shí)轉(zhuǎn)移到玉米螟Pyrausta nubilalis 蟲害識(shí)別任務(wù)中,識(shí)別準(zhǔn)確率達(dá)到96.44%;楊紅云等[11]為了實(shí)現(xiàn)水稻害蟲的快速、準(zhǔn)確識(shí)別,提出基于遷移學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)的水稻害蟲識(shí)別方法,將VGG16 模型在圖像數(shù)據(jù)集ImageNet 上訓(xùn)練得到的權(quán)重參數(shù)遷移到水稻害蟲識(shí)別中,該模型的平均測(cè)試準(zhǔn)確率為99.05%,模型文件大小為74.2M;鮑文霞等[12]設(shè)計(jì)一個(gè)由特征提取、全局優(yōu)化及局部?jī)?yōu)化模塊構(gòu)成的輕量型殘差網(wǎng)絡(luò)用于水稻害蟲識(shí)別,實(shí)現(xiàn)了模型的輕量化,網(wǎng)絡(luò)在13 類水稻害蟲圖像測(cè)試數(shù)據(jù)集上的識(shí)別準(zhǔn)確率達(dá)到92.5%,并且網(wǎng)絡(luò)參數(shù)量?jī)H為1.62×106。
以上研究在農(nóng)業(yè)害蟲識(shí)別模型的輕量化方面已取得了一定進(jìn)展,準(zhǔn)確率也較高,但大部分研究只針對(duì)某一類農(nóng)作物害蟲進(jìn)行識(shí)別,將GhostNet 網(wǎng)絡(luò)應(yīng)用于農(nóng)作物害蟲識(shí)別領(lǐng)域的案例還很少[13]。為此,本文從農(nóng)作物害蟲防治入手,構(gòu)建一個(gè)包含10 類農(nóng)業(yè)害蟲圖像的數(shù)據(jù)集Cron Pest,嘗試將遷移學(xué)習(xí)技術(shù)與輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)Ghost-Net 相結(jié)合以構(gòu)建一個(gè)農(nóng)業(yè)害蟲檢測(cè)網(wǎng)絡(luò)。針對(duì)農(nóng)業(yè)害蟲樣本數(shù)量較少的問題,使用數(shù)據(jù)增強(qiáng)技術(shù)增加樣本數(shù)量,應(yīng)用遷移學(xué)習(xí)方法訓(xùn)練模型,防止模型在訓(xùn)練中無法收斂,從而提高模型識(shí)別準(zhǔn)確率。最終得到Migrated Ghost-Net 模型,識(shí)別準(zhǔn)確率與召回率分別為93.64%與93.89%。與上文提到的模型相比,本文模型在低資源占用情況下實(shí)現(xiàn)了較高的害蟲識(shí)別率,在農(nóng)業(yè)害蟲識(shí)別方面作出了新的探索與嘗試,可進(jìn)一步應(yīng)用于實(shí)際的農(nóng)業(yè)害蟲防治中。
實(shí)驗(yàn)使用的硬件配置為:華擎B450 主板、Inter(R)Core i7-8700K CPU、16G DDR4 2666MHz 內(nèi)存、NVIDIA Geforce GTX1080 Ti 顯卡,軟件配置為:CUDA11.1、Cudnn8.0.4、Python3.7.0,并采用Pytorch1.8.0 深度學(xué)習(xí)框架,以及Ubuntu18.04操作系統(tǒng)。
1.2.1 數(shù)據(jù)來源
使用IP102 論文提供的開源農(nóng)業(yè)害蟲數(shù)據(jù)集構(gòu)建本文的害蟲數(shù)據(jù)集,該數(shù)據(jù)集共有害蟲類別102 類,共計(jì)超過75 000 張害蟲圖片[7]。本文從中選擇10 類害蟲圖像,去除每類圖像中分辨率較低、有嚴(yán)重干擾信息的圖片后,篩選出1 137 幅害蟲圖片,用于構(gòu)建本文自用的害蟲分類數(shù)據(jù)集Cron Insect。其中,螻蛄(Grub)129 幅,紅蜘蛛(Red spider)124 幅,白星花金龜(Potosiabre vitarsis)123 幅,跳甲(Flea beetle)95 幅,甜菜象甲(Meadow moth)99 幅,蝗蟲(Locustoidea)104 幅,芫菁(Blister beetle)120 幅,盲蝽(Miridae)117 幅,青蛾蠟蟬(Salurnis marginella Guerr)97 幅,葉蟬(Cicadellidae)129 幅。這10 類圖像被放在10 個(gè)不同的文件夾中,每個(gè)文件夾代表一個(gè)類別標(biāo)簽。標(biāo)簽0 為螻蛄,標(biāo)簽1 為紅蜘蛛,標(biāo)簽2 為白星花金龜,標(biāo)簽3 為跳甲,標(biāo)簽4 為甜菜象甲,標(biāo)簽5 為蝗蟲,標(biāo)簽6 為芫菁,標(biāo)簽7 為盲蝽,標(biāo)簽8為青蛾蠟蟬,標(biāo)簽9為葉蟬。
圖1 為Cron Pest 數(shù)據(jù)集害蟲示例圖像(彩圖掃OSID碼可見,下同)。
1.2.2 數(shù)據(jù)增強(qiáng)
為了增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)的魯棒性,使訓(xùn)練出來的網(wǎng)絡(luò)更加穩(wěn)定,本文對(duì)Cron Insect 數(shù)據(jù)進(jìn)行如圖2 所示的隨機(jī)數(shù)據(jù)增強(qiáng),以豐富數(shù)據(jù)的多樣性,防止模型過擬合。主要采取多角度旋轉(zhuǎn)、錯(cuò)變換、隨機(jī)縮放、隨機(jī)翻轉(zhuǎn)、亮度調(diào)整等方式,將害蟲圖像數(shù)據(jù)擴(kuò)充為原來的3 倍,并將圖片尺寸統(tǒng)一處理為224×224。數(shù)據(jù)集共有3 413 幅害蟲圖像,按照8:1:1 的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。圖2 為數(shù)據(jù)增強(qiáng)方式,表1 給出了Cron Pest 數(shù)據(jù)集中每類害蟲圖像數(shù)量。
1.3.1 GhostNet卷積神經(jīng)網(wǎng)絡(luò)
GhostNet 是一種輕量級(jí)深度學(xué)習(xí)網(wǎng)絡(luò),其對(duì)傳統(tǒng)卷積網(wǎng)絡(luò)計(jì)算過程中特征圖冗余的問題進(jìn)行改進(jìn),采用與深度可分離卷積類似的計(jì)算過程對(duì)圖像特征進(jìn)行提取[14]。先用標(biāo)準(zhǔn)卷積(即Conv+BN+Activation)生成部分原始特征圖,再用深度卷積生成原始特征圖的“幻影”特征圖(Ghost feature maps),接下來利用線性變換生成恒等映射特征圖(Intrinsic feature maps),最后將原始特征圖與恒等映射特征圖疊加得到輸出特征圖。
Table 1 Number of pest images in Cron Pest dataset表1 Cron Pest數(shù)據(jù)集中害蟲圖像數(shù)量
Fig.1 Cron Pest dataset pest images圖1 Cron Pest數(shù)據(jù)集害蟲圖像
Fig.2 Pest image data enhancement example圖2 害蟲圖像數(shù)據(jù)增強(qiáng)示例
假定輸入數(shù)據(jù)X∈Rh×w×c,其中c 是輸入通道數(shù),h、w是高度與寬度,Y為經(jīng)過卷積運(yùn)算的輸出特征圖,則輸出特征圖計(jì)算公式為:
其中,*為卷積運(yùn)算,b為偏差項(xiàng)為具有n個(gè)通道的輸出特征圖,f∈Rn×k×k×c為卷積核,h'、w'與n'為輸出數(shù)據(jù)維度,k×k為卷積核f的大小。卷積過程的運(yùn)算量為n· h' ·w' ·c·k·k。
由于卷積層的輸出特征圖通常包含很多冗余,并且其中一些可能彼此相似,故不需要逐一生成冗余特征圖,而是先使用一次卷積生成m個(gè)原始特征圖
其中,f' ∈Rm×k×k×c為卷積核,m≤n,之后對(duì)Y'中的每個(gè)原始特征進(jìn)行一系列廉價(jià)的線性運(yùn)算,以生成s個(gè)幻影特征圖(Ghost feature maps):
GhostNet 借鑒了ResNet 的殘差瓶頸結(jié)構(gòu)[4],設(shè)計(jì)了Ghost bottleneck(G-bneck)。Ghost bottleneck 主要由兩個(gè)堆疊的Ghost 模塊組成,第一個(gè)Ghost 模塊用作擴(kuò)展層,增加了通道數(shù),第二個(gè)Ghost 模塊可減少通道數(shù),以與shortcut 路徑匹配。然后,使用shortcut 連接這兩個(gè)Ghost 模塊的輸入和輸出。Ghost 模塊中的初始卷積是點(diǎn)卷積(Pointwise Convolution)。GhostNet網(wǎng)絡(luò)基礎(chǔ)模塊如圖4所示。
Fig.3 GhostNet convolution process圖3 GhostNet卷積過程
Fig.4 GhostNet network basic module圖4 GhostNet網(wǎng)絡(luò)基礎(chǔ)模塊
GhostNet 網(wǎng)絡(luò)結(jié)構(gòu)以Ghost bottleneck 為基礎(chǔ),遵循MobileNetV3 基本體系結(jié)構(gòu)的優(yōu)勢(shì)[15-17],使用Ghost bottleneck 替換MobileNetV3 中的bottleneck,構(gòu)建如表2 所示的網(wǎng)絡(luò)結(jié)構(gòu)。主要將Ghost 模塊作為構(gòu)造塊,第一層為具有16 個(gè)卷積核的標(biāo)準(zhǔn)卷積層,通過一系列G-bneck 操作,通道數(shù)逐漸增加。這些Ghost bottleneck 根據(jù)其輸入特征圖的大小分為不同階段,除每個(gè)階段最后一個(gè)Ghost bottleneck 步長(zhǎng)為2 外,其他所有Ghost bottleneck 的步長(zhǎng)均為1。表2 中,SE 表示擠壓與激發(fā)塊(Squeeze-and-Excitation)[18],Conv2d 表示卷積層,AvgPool 表示均值池化層,F(xiàn)C表示全連接層。
1.3.2 基于遷移學(xué)習(xí)的GhostNet模型
農(nóng)業(yè)病蟲害領(lǐng)域缺少高質(zhì)量、大規(guī)模的公開數(shù)據(jù)集,導(dǎo)致使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行作物病蟲害識(shí)別成為一項(xiàng)挑戰(zhàn)。本文使用遷移學(xué)習(xí)以減少深度學(xué)習(xí)模型構(gòu)建所需的訓(xùn)練數(shù)據(jù)與計(jì)算量,并且能較好地解決小數(shù)據(jù)集在復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)上容易出現(xiàn)的過擬合問題[19-20]。遷移學(xué)習(xí)利用數(shù)據(jù)、任務(wù)與模型之間的相似性,將在舊領(lǐng)域模型學(xué)習(xí)到的知識(shí)應(yīng)用于新領(lǐng)域的學(xué)習(xí)過程中,從而降低模型訓(xùn)練難度,減少學(xué)習(xí)所需的硬件資源。遷移學(xué)習(xí)可定義為:
式中,D(s)為源領(lǐng)域,D(t)為目標(biāo)領(lǐng)域,χ 為領(lǐng)域數(shù)據(jù)的特征空間,P(χ)為領(lǐng)域數(shù)據(jù)特征空間對(duì)應(yīng)的邊緣概率分布。
本文首先使用ImageNet 大數(shù)據(jù)集對(duì)GhostNet 網(wǎng)絡(luò)進(jìn)行訓(xùn)練,代替原先的網(wǎng)絡(luò)權(quán)重隨機(jī)初始化操作,從而獲得預(yù)訓(xùn)練模型,然后用農(nóng)作物害蟲數(shù)據(jù)集Cron Insect 基于預(yù)訓(xùn)練模型進(jìn)行遷移學(xué)習(xí),使用訓(xùn)練完成的模型進(jìn)行測(cè)試集害蟲識(shí)別任務(wù)。基于遷移學(xué)習(xí)的GhostNet 網(wǎng)絡(luò)訓(xùn)練流程如圖5所示。
Table 2 GhostNet network structure表2 GhostNet網(wǎng)絡(luò)結(jié)構(gòu)
基于遷移學(xué)習(xí)的算法流程如下:①圖像預(yù)處理。對(duì)農(nóng)業(yè)害蟲圖像數(shù)據(jù)集Cron Pest 進(jìn)行數(shù)據(jù)增強(qiáng)預(yù)處理,實(shí)現(xiàn)害蟲數(shù)據(jù)集的擴(kuò)增;②模型預(yù)訓(xùn)練。對(duì)GhostNet 模型使用ImageNet 數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練;③模型微調(diào)數(shù)據(jù)構(gòu)建。從Cron Pest 害蟲圖像樣本中隨機(jī)抽取80%作為訓(xùn)練集數(shù)據(jù)進(jìn)行輸入;④預(yù)訓(xùn)練GhostNet 模型參數(shù)遷移與微調(diào)。通過參數(shù)遷移方式初始化預(yù)訓(xùn)練GhostNet 模型參數(shù),之后凍結(jié)模型池化層參數(shù)并對(duì)模型進(jìn)行訓(xùn)練,優(yōu)化模型卷積層和FC 全連階層參數(shù);⑤模型測(cè)試。從Cron Pest 害蟲數(shù)據(jù)集中抽取余下10%的農(nóng)業(yè)害蟲圖片,作為測(cè)試樣本對(duì)模型進(jìn)行測(cè)試,以驗(yàn)證模型的精確度。
Fig.5 Training process of GhostNet network based on transfer learning圖5 基于遷移學(xué)習(xí)的GhostNet網(wǎng)絡(luò)訓(xùn)練流程
本文將數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集3 部分,采取批訓(xùn)練方式,設(shè)置Batchsize 為128;梯度更新策略使用Adam 優(yōu)化器,動(dòng)量大小為0.9,初始學(xué)習(xí)率為0.1;使用動(dòng)態(tài)學(xué)習(xí)率策略,網(wǎng)絡(luò)預(yù)熱參數(shù)設(shè)置為5輪,最大訓(xùn)練輪次(Epoch)設(shè)置為60,每輪迭代次數(shù)(Iterator)等于11,模型圖像輸入分辨率為224×224;采用數(shù)據(jù)增強(qiáng)技術(shù),隨機(jī)選取80%的數(shù)據(jù)用于訓(xùn)練,10%的數(shù)據(jù)用于驗(yàn)證;選擇準(zhǔn)確率(Accuracy)與召回率(Recall)作為模型評(píng)價(jià)指標(biāo),用于評(píng)估算法表現(xiàn)。準(zhǔn)確率是預(yù)測(cè)正確的數(shù)量與樣本總數(shù)量的百分比,召回率是真實(shí)為正例的樣本中預(yù)測(cè)結(jié)果為正例的比例。
使用訓(xùn)練好的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),正確預(yù)測(cè)的樣本數(shù)為329 張,總體準(zhǔn)確率為93.64%,召回率為93.89%,該模型可有效識(shí)別出圖像中的害蟲信息。Migrated GhostNet模型對(duì)10種害蟲的識(shí)別結(jié)果如表3所示。
Table 3 Recognition results of 10 pests with Migrated GhostNet model表3 Migrated GhostNet模型對(duì)10種害蟲識(shí)別結(jié)果
圖6-圖9 分別表示模型訓(xùn)練過程中的top1 精確度、top5 精確度、學(xué)習(xí)率和損失值隨訓(xùn)練迭代次數(shù)的變化。由圖可以看出,隨著訓(xùn)練迭代次數(shù)接近200 次,損失值與精確度收斂趨于穩(wěn)定,表明模型訓(xùn)練成功。
Fig.6 Model training top1 accuracy change圖6 模型訓(xùn)練top1精度變化
Fig.7 Model training learning rate changes圖7 模型訓(xùn)練學(xué)習(xí)率變化
Fig.8 Model training top5 accuracy changes圖8 模型訓(xùn)練top5精度變化
Fig.9 Model training loss value change圖9 模型訓(xùn)練損失值變化
為驗(yàn)證本文提出的基于遷移學(xué)習(xí)的Migrated GhostNet模型的有效性,將Migrated-GhostNet 與GhonstNet 模型訓(xùn)練結(jié)果進(jìn)行對(duì)比。圖10 為兩種模型訓(xùn)練過程中驗(yàn)證集的精確度變化,圖11 為兩種模型訓(xùn)練過程中驗(yàn)證集的損失值變化。從圖中可以看出,運(yùn)用遷移學(xué)習(xí)技術(shù)的Migrated GhostNet 驗(yàn)證集最高準(zhǔn)確率為95.84%,相比普通GhostNet驗(yàn)證集93.17%的最高準(zhǔn)確率提高了2.67%,且使用遷移學(xué)習(xí)訓(xùn)練的Migrated GhostNet 模型,損失值收斂更加穩(wěn)定,當(dāng)訓(xùn)練到20 輪時(shí)基本收斂,而GhostNet 模型直到40 輪才收斂,證明了使用遷移學(xué)習(xí)的Migrated-Ghost 模型訓(xùn)練過程更加穩(wěn)定,權(quán)重學(xué)習(xí)速率更快。
Fig.10 Comparison of model training accuracy圖10 模型訓(xùn)練準(zhǔn)確率對(duì)比
Fig.11 Model training loss value comparison圖11 模型訓(xùn)練損失值對(duì)比
通過遷移的GhostNet 對(duì)害蟲Corn Insect 數(shù)據(jù)集中的測(cè)試集進(jìn)行預(yù)測(cè),對(duì)測(cè)試集的預(yù)測(cè)結(jié)果制作混淆矩陣,標(biāo)簽0 為螻蛄,標(biāo)簽1 為紅蜘蛛,標(biāo)簽2 為白星花金龜,標(biāo)簽3 為跳甲,標(biāo)簽4 為甜菜象甲,標(biāo)簽5 為蝗蟲,標(biāo)簽6 為芫菁,標(biāo)簽7 為盲蝽,標(biāo)簽8 為青蛾蠟蟬,標(biāo)簽9 為葉蟬。Migrated GhostNet與GhostNet混淆矩陣如圖12所示。
Fig.12 Confusion matrix of Migrated GhostNet and GhostNet圖12 Migrated GhostNet與GhostNet混淆矩陣
從圖中可以看出,GhostNet 對(duì)標(biāo)簽7 的盲蝽和標(biāo)簽9的葉蟬識(shí)別出錯(cuò)的圖片數(shù)量最多,而應(yīng)用遷移學(xué)習(xí)的Migrated GhostNet 減少了對(duì)標(biāo)簽7 和標(biāo)簽9 的錯(cuò)誤識(shí)別,但對(duì)甜菜象甲的預(yù)測(cè)錯(cuò)誤率較高,將4 張圖片誤判為盲蝽,可看出甜菜象甲、盲蝽與跳甲的圖像特征有相似之處,容易引起模型誤判。綜合來看,Migrated GhostNet 正確識(shí)別的圖片數(shù)量為329 張,高于GhostNet 正確識(shí)別的324 張。Migrated GhostNet 測(cè)試集識(shí)別的準(zhǔn)確率與召回率分別為93.64%與93.89%,GhostNet 測(cè)試集識(shí)別的準(zhǔn)確率與召回率為92.33%與92.23%,前者比后者分別高出了1.31%與1.66%,表明Migrated GhostNet 有效降低了錯(cuò)誤識(shí)別的圖片數(shù)量,提高了對(duì)農(nóng)作物害蟲訓(xùn)練集的識(shí)別準(zhǔn)確率。
本文針對(duì)傳統(tǒng)農(nóng)業(yè)害蟲識(shí)別方法在害蟲圖像樣本量較少情況下存在識(shí)別效果差、效率低等問題,提出基于卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)業(yè)害蟲識(shí)別模型。相比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法,本文利用GhostNet 網(wǎng)絡(luò)結(jié)構(gòu)的高效特征提取能力對(duì)農(nóng)業(yè)害蟲圖像進(jìn)行識(shí)別,同時(shí)對(duì)訓(xùn)練模型所用的害蟲數(shù)據(jù)進(jìn)行增強(qiáng)處理,一定程度上提高了模型識(shí)別效率。在模型訓(xùn)練方面使用遷移學(xué)習(xí)技術(shù),提升模型的泛化能力與訓(xùn)練穩(wěn)定性,并提高了模型識(shí)別精度。本文模型的優(yōu)勢(shì)在于:①通過混淆矩陣對(duì)比Migrated GhostNet 與GhostNet 對(duì)每種害蟲的分類情況,發(fā)現(xiàn)使用遷移學(xué)習(xí)訓(xùn)練方法的Migrated GhostNet 相比正常方式訓(xùn)練的GhostNet,每類害蟲的識(shí)別率均有不同程度提升,識(shí)別準(zhǔn)確率提高了1.31%,召回率提高了1.66%,模型識(shí)別效率較高;②使用自建數(shù)據(jù)集并對(duì)圖片進(jìn)行過濾篩選與數(shù)據(jù)增強(qiáng),通過數(shù)據(jù)擴(kuò)充方式避免了因數(shù)據(jù)量不足導(dǎo)致模型訓(xùn)練精度不佳的問題,豐富了數(shù)據(jù)的多樣性,減少了模型的過擬合現(xiàn)象。
實(shí)驗(yàn)結(jié)果表明,本文提出的Migrated Ghostnet 模型能較好地進(jìn)行農(nóng)業(yè)害蟲檢測(cè),其檢測(cè)結(jié)果準(zhǔn)確,模型占用資源小,可應(yīng)用于嵌入式設(shè)備與移動(dòng)設(shè)備的蟲害防治中。但同時(shí)也存在以下不足之處:①實(shí)際農(nóng)業(yè)生產(chǎn)活動(dòng)中的害蟲圖像背景復(fù)雜,需要過濾的干擾因素更多,而本文進(jìn)行的害蟲圖像識(shí)別檢測(cè)是在較為理想的樣本條件下進(jìn)行的,在識(shí)別前過濾了質(zhì)量較低的害蟲圖像;②本文采用的Migrated GhostNet 模型的參數(shù)量與計(jì)算量較小,但檢測(cè)精度與傳統(tǒng)網(wǎng)絡(luò)相比略有不足,對(duì)特征較為相似的害蟲識(shí)別準(zhǔn)確率較低,還需要加強(qiáng)。
因此,未來工作可從以下幾方面進(jìn)行改進(jìn):
(1)采集更多農(nóng)業(yè)害蟲樣本圖片并進(jìn)行標(biāo)注。針對(duì)目標(biāo)分布不均衡問題,采用數(shù)據(jù)增強(qiáng)技術(shù)對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,提升網(wǎng)絡(luò)的泛化能力。
(2)優(yōu)化GhostNet 網(wǎng)絡(luò)模型,在保持參數(shù)量與計(jì)算量的同時(shí),提高模型的特征獲取能力,進(jìn)一步提升檢測(cè)性能。
(3)未來可結(jié)合卷積神經(jīng)網(wǎng)絡(luò)壓縮方法,進(jìn)一步降低模型的參數(shù)量與運(yùn)算量,并將算法移植到嵌入式設(shè)備或移動(dòng)端設(shè)備等硬件設(shè)備上使用。同時(shí),可將本文模型應(yīng)用于其他農(nóng)業(yè)害蟲識(shí)別中。