李大華 仲婷 王筍 于曉
摘要:番茄大面積種植導(dǎo)致葉片部位被病蟲害侵蝕面積不一、侵蝕種類多樣化等問題,為了滿足在資源有限的硬件設(shè)備上實現(xiàn)對番茄葉片病害準(zhǔn)確識別,提出改進ShuffleNet v2模型。首先對基本單元進行改進,提出SA-stage模塊,使模型密切關(guān)注葉片相關(guān)特征信息的同時減小了參數(shù)量和計算量;其次提出LFN輕量化特征融合模塊,實現(xiàn)淺層和深層網(wǎng)絡(luò)的上下文信息交互;接著引入RFB-s輕量化特征增強模塊,增強小目標(biāo)病害的特征提??;最后將SPD-Conv代替普通卷積和最大池化層,降低圖像分辨率的同時保留了番茄葉片病害小目標(biāo)的細(xì)粒度信息。試驗結(jié)果表明,改進ShuffleNet v2模型在10種番茄葉片病害圖像上進行測試,準(zhǔn)確率和平均召回率分別達到了96.55%、96.40%,較原模型分別提高了4.44、3.70百分點;參數(shù)量和計算量分別為348 154、38.75 MB,較原模型分別減少 3 888、3.88 MB。相比于其他分類模型AlexNet、ResNet50、MobileNet v3等,改進ShuffleNet v2模型不僅準(zhǔn)確率最高、參數(shù)量和計算量最小,而且權(quán)重最小,僅為1.51 MB。該研究提出的改進ShuffleNet v2模型具備在資源有限的移動設(shè)備上部署的條件,滿足實時、準(zhǔn)確地識別番茄葉片病害。
關(guān)鍵詞:番茄;葉片病害;病害識別;輕量化;參數(shù)量
中圖分類號:TP183;TP391.41? 文獻標(biāo)志碼:A
文章編號:1002-1302(2024)03-0220-09
為了滿足社會的需求,番茄的種植面積逐漸擴大,產(chǎn)量逐漸提升,然而病蟲害發(fā)生范圍及影響也逐漸提高[1],而病蟲害的侵蝕位置初期以葉片為主。人們主要依靠種植人員的經(jīng)驗判斷番茄葉片病害的種類,該方法費時費力,還會造成誤判從而影響對病蟲害的噴霧防治作用[2]。因此提供一種對番茄葉片病害種類快速、準(zhǔn)確的識別方法尤其重要。
隨著人工智能技術(shù)的不斷發(fā)展,尤其是深度學(xué)習(xí)技術(shù)和深度學(xué)習(xí)框架的廣泛應(yīng)用[3-4],基于卷積神經(jīng)網(wǎng)絡(luò)的分類模型有利于快速、準(zhǔn)確地對葉片病害種類進行識別。戴久竣等提出在ResNet50模型基礎(chǔ)上進行改進實現(xiàn)對葡萄葉片病害的識別,改進模型對葉片病害識別準(zhǔn)確率達到98.20%[5]。曹藤寶等提出在DenseNet模型基礎(chǔ)上融合空間注意力機制的玉米葉片病害分類方法,將PReLU激活函數(shù)代替ReLU,改進后模型準(zhǔn)確率達到98.77%[6]。Ding等采用增加CBAM模塊和隨機裁剪分支2種方案對ResNet18網(wǎng)絡(luò)進行改進,對蘋果葉病進行分類,準(zhǔn)確率分別達到95.2%、97.2%[7]。Naik等設(shè)計基于SE的卷積神經(jīng)網(wǎng)絡(luò),在自建辣椒葉數(shù)據(jù)集上達到98.63%的精度[8]。Paymode等對葡萄和番茄葉片圖像進行增強,在卷積神經(jīng)網(wǎng)絡(luò)中利用VGG模型設(shè)置超參數(shù),利用遷移學(xué)習(xí)分別達到98.40%和95.71%的準(zhǔn)確率[9]。劉擁民等提出優(yōu)化的Swin Transformer網(wǎng)絡(luò)模型,結(jié)合Mixup混合增強算法對數(shù)據(jù)集進行增強,并采用遷移學(xué)習(xí)對番茄葉片進行訓(xùn)練,最終準(zhǔn)確率達到98.40%[10]。由于以上常規(guī)的卷積神經(jīng)網(wǎng)絡(luò)ResNet、DenseNet、VGG以及現(xiàn)階段較為新穎的網(wǎng)絡(luò)模型Swin Transformer參數(shù)量較多[11-15],模型較為復(fù)雜,在訓(xùn)練數(shù)據(jù)集時訓(xùn)練時間過長,還需要相對較大的存儲空間,導(dǎo)致在資源有限的移動設(shè)備上缺少研究的應(yīng)用價值。
在移動設(shè)備廣為使用的現(xiàn)狀下,研究一種參數(shù)量、計算量較少,較為輕量的番茄葉片病害識別模型顯得尤為重要。ShuffleNet v2模型平衡了輕量級模型識別的準(zhǔn)確率和模型復(fù)雜度[16],本研究在此基礎(chǔ)上提出一種改進ShuffleNet v2番茄葉片病害識別方法,采用ShuffleNet v2 0.5x框架,在所有階段(stage)每個模塊(block)中引入一種輕量且有效的置換注意力機制(shuffle attention,SA)[17],并對其結(jié)構(gòu)進行優(yōu)化,組成SA-stage結(jié)構(gòu),著重關(guān)注葉片病害相關(guān)的信息并降低模型參數(shù)量及計算量,在網(wǎng)絡(luò)的淺層引入輕量化特征增強模塊(receptive field block-s,RFB-s)[18],增強淺層葉片病害的語義信息從而提升模型識別準(zhǔn)確率,接著對每個的輸出進行輕量化特征融合,將深度可分離卷積(depthwise separable convolution,DSC)[19]代替普通卷積,進一步提升識別準(zhǔn)確率的同時保證模型較低的參數(shù)量和計算量,最后使用SPD-Conv(space-to-depth convolution)[20]取代模型的卷積和池化層,提高低分辨率圖像中葉片病害的準(zhǔn)確率。
1 材料與方法
本研究于2023年2—4月在天津理工大學(xué)電氣工程及自動化碩士實驗室進行試驗,從Plant Village公開數(shù)據(jù)集中隨機挑選番茄病害葉片圖像作為研究對象,葉片病害包括細(xì)菌性斑點病、早疫病、晚疫病、葉霉病、斑枯病、二斑葉螨病、輪斑病、花葉病和黃化曲葉病。每張圖像包含1種葉片病害,加上番茄健康葉片,共10種葉片病害種類,共 1 267 張圖像。為了避免在訓(xùn)練過程中出現(xiàn)過擬合現(xiàn)象,對圖像進行增強操作(高斯濾波、高斯噪聲、明亮、昏暗、翻轉(zhuǎn)、旋轉(zhuǎn)180°等7種方式),可模擬模糊、光線明亮、光線昏暗等環(huán)境,增強模型的泛化能力,部分番茄病害葉片增強圖像如圖1所示,每種病害葉片數(shù)量為900張左右,總數(shù)量達到8 869張。
2 改進ShuffleNet v2模型相關(guān)設(shè)計
2.1 置換注意力機制
將空間注意和通道注意融合在一起可能會比它們各自應(yīng)用展現(xiàn)更好的性能,但會不可避免地增加計算開銷。置換注意力SA模塊可以解決此問題,SA模塊的整體架構(gòu)見圖2。對于給定的番茄葉片病害特征圖X∈RC×H×W,SA首先按照通道維度分組為G個子特征,即X=[X1,X2,…,XG],Xk∈RC/G×H×W,在訓(xùn)練過程中捕捉特定的病害語義信息,然后Xk沿著通道維度被分成2個分支,即Xk1、Xk2,兩者均∈RC/2G×H×W,一個分支利用通道間的相互關(guān)系生成通道注意力圖,另一個分支利用特征間的空間關(guān)系生成空間注意力圖。為了捕捉通道之間的依賴性,獲取病害通道權(quán)重,首先通過使用全局平均池化(GAP)來嵌入全局信息,以生成通道方式的統(tǒng)計信息s∈RC/2G×1×1,可通過將Xk1收縮到空間維度 H×W來計算:
s=FGAP(Xk1)=1H×W∑Hi=1∑Wj=1Xk1(i,j)。(1)
此外,通過Sigmoid激活函數(shù)獲得通道注意力的最終輸出:
Xk1′=σ[FC(s)]·Xk1=σ(W1s+b1)·Xk1。(2)
其中,W1∈RC/2G×1×1,b1∈RC/2G×1×1,兩者分別是用于縮放和移位s的參數(shù)。
為了獲取病害空間權(quán)重,在Xk1上使用組歸一化(group norm,GN)來獲取空間統(tǒng)計信息[21],通過Sigmoid激活函數(shù)獲得空間注意力的最終輸出:
Xk2′=σ[W2·GN(Xk2)+b2]·Xk2。(3)
其中,W2∈RC/2G×1×1,b2∈RC/2G×1×1。
然后將這2個分支連接,即Xk′=[Xk1′,Xk2′]∈RC/G×H×W。最后將病害所有子特征聚合 并采用通道混洗算子使葉片病害不同的子特征之間跨組進行信息交流,使得該模塊有效學(xué)習(xí)病害的關(guān)鍵信息。
2.2 基本單元結(jié)構(gòu)優(yōu)化
ShuffleNet v2模型提出一種較為新穎且更加輕量的基本單元?;灸K(block)包含2種不同結(jié)構(gòu),如圖3所示,一種為步長(stride)=1的結(jié)構(gòu),另一種為stride=2的結(jié)構(gòu),這2種結(jié)構(gòu)的主分支都由3個卷積層構(gòu)成,分別為1×1普通卷積、3×3深度可分離卷積、1×1普通卷積,但輸入端和側(cè)分支的構(gòu)成有所不同。在步長為1的結(jié)構(gòu)中,輸入端進行通道分割,側(cè)分支直接將通道分割后的圖像與主分支圖像進行維度上拼接(concat);在步長為2的結(jié)構(gòu)中,圖像直接進入輸入端經(jīng)過2個分支的處理,其側(cè)分支由 3×3 深度可分離卷積和1×1普通卷積構(gòu)成。在這2種結(jié)構(gòu)中,最后通過通道混洗進行2個分支之間的信息通信。
ShuffleNet v2的整體結(jié)構(gòu)主要由stage2、stage3、stage4構(gòu)成,而每個stage又由多個基本單元組成,所以優(yōu)化基本單元結(jié)構(gòu)在番茄葉片病害特征提取中起著重要作用,優(yōu)化的基本單元SA-stage結(jié)構(gòu)見圖4。由于最后的1×1普通卷積不改變通道數(shù),起到信息結(jié)合的作用,可能會造成信息冗余,所以本研究去除此卷積,降低了計算量和參數(shù)量,但也造成了準(zhǔn)確率下降,為了彌補此情況,進一步使模型在特征提取時,獲取不同葉片病害有效信息,提升識別準(zhǔn)確率,在主分支1×1普通卷積之后添加置換注意力機制SA,該模塊相對輕量化,基本單元結(jié)構(gòu)的優(yōu)化既保證病害識別準(zhǔn)確率的提升,也減少了參數(shù)量和計算量。
2.3 輕量化特征融合網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)淺層特征感受野較小,包含病害更多的細(xì)節(jié)信息,無法提供更多語義信息;深層特征感受野較大,包含病害更多語義信息,但卻缺少相關(guān)的紋理、顏色等細(xì)節(jié)信息。網(wǎng)絡(luò)不同卷積層生成不同分辨率特征圖,無法避免葉片病害相關(guān)特征的缺失,導(dǎo)致模型識別效果欠佳。針對此種情況,又考慮到既能提高模型識別能力,又能保證該模型的輕量化,設(shè)計一種輕量化特征融合網(wǎng)絡(luò)(LFN)如圖5所示,該模塊先將增強后的SA-stage2和 SA-stage3 進行融合,采用深度可分離卷積(DSC)
代替普通卷積,通過步長為2的逐通道卷積將大小為 56×56 的特征圖調(diào)整為28×28,又通過步長為1的逐點卷積將通道數(shù)調(diào)整為96,與增強后的stage3保持同樣形狀(shape);接著使該融合的結(jié)果通過深度可分離卷積,將特征圖大小調(diào)整為14×14×192,與SA-stage4進行融合。該模塊融合了葉片病害淺層和深層特征,為最終識別模型提供了更多的精確病害信息。
2.4 輕量化特征增強模塊
番茄葉片表現(xiàn)為不規(guī)則、多為小病斑病害,根據(jù)成像特點,拍攝環(huán)境與光線的影響會導(dǎo)致病害識別的準(zhǔn)確率不高。本研究引入RFB-s模塊(圖6),膨脹卷積的應(yīng)用不僅增強了小目標(biāo)病害的特征提取能力,還保證了模型較少的參數(shù)量方便在移動設(shè)備上部署。RFB-s是一個多分支卷積模塊,由多分支卷積層和膨脹卷積層構(gòu)成。每條分支均由1×1卷積對通道數(shù)進行調(diào)整;中間2條分支采用1×3和3×1卷積來代替3×3卷積,減少了參數(shù)量;右側(cè)緊接3×3卷積對葉片病害進行特征提??;然后每條分別連接膨脹率為1、3、3、5的3×3卷積,為了在不同感受野下有效提取葉片病害的特征;通過concat連接與1×1卷積將不同感受野下的病害特征進行融合,最后將輸入特征圖與concat連接得到的特征圖進行相加,通過獲取不同尺度融合的葉片病害特征圖,提高了番茄葉片小目標(biāo)病害的識別效果。
2.5 SPD-Conv 結(jié)構(gòu)
在卷積網(wǎng)絡(luò)ShuffleNet? v2中 為了去除冗余像素信息,通過普通卷積和最大池化對圖像進行處理,得到小分辨率特征圖,會導(dǎo)致丟失關(guān)于番茄葉片病害小目標(biāo)的細(xì)粒度信息,用于模型學(xué)習(xí)的上下文信息也有限,在特征學(xué)習(xí)過程中,使小目標(biāo)病害無法被識別。為了解決此問題,引入SPD-Conv(圖7)來取代普通卷積和最大池化層,SPD-Conv由空間到深度層(SPD層)和非跨步卷積層構(gòu)成。
SPD層對葉片病害特征圖進行下采樣,但卻保留了通道維度中的所有相關(guān)信息。對于特征圖X,將一系列子特征圖分割為
f0,0=X[0:S:scale,0:S:scale],
f1,0=X[1:S:scale,0:S:scale],…,fscale-1,0=X[scale-1:S:scale,0:S:scale];
f0,scale-1=X[0:S:scale,scale-1:S:scale],f1,scale-1,…,
fscale-1,scale-1=X[scale-1:S:scale,scale-1:S:scale]。
番茄葉片子特征圖fx,y由所有特征映射組成 X(i,j) 特征圖,每個子映射可按照一定比例對病害特征圖X進行下采樣,在圖7中,當(dāng)比例為2時,得到四個子特征圖f0,0、f1,0、f0,1、f1,1,其大小為S×S×C1,并將特征圖X下采樣2倍。然后沿著通道維度將這些子特征圖進行連接,獲得新的特征圖X′,其大小為S2×S2×4C1。
接著通過非跨步卷積層,即使用步長為1、通道數(shù)為C2的卷積核將特征圖轉(zhuǎn)變成X″為S2×S2×C2,可以學(xué)習(xí)較少的特征相關(guān)參數(shù)來減少通道數(shù)量。
2.6 改進ShuffleNet v2模型整體框架
本研究的改進ShuffleNet v2模型整體框架如圖8所示,輸入圖片大小為224×224×3,經(jīng)過 SPD-Conv1 對圖片進行下采樣,保留了所有與番茄葉片病害相關(guān)的特征;用SA-stage2、SA-stage3、SA-stage4、代替原模型中的基本單元stage2、stage3、stage4,接著使用輕量化特征增強模塊RFB-s對SA-stage2、SA-stage3輸出的特征圖進行處理,提高葉片小目標(biāo)病害的識別效果;在此基礎(chǔ)上采用LFN模塊對葉片病害進行特征融合,實現(xiàn)病害不同尺度信息的交互;最后通過全局池化、全連接層(FC)對葉片病害進行識別,輸出病害類別,該模型不僅提升了對番茄葉片病害識別的準(zhǔn)確率,還具備在移動設(shè)備上部署的優(yōu)勢。
3 試驗條件
3.1 試驗平臺
本次模型訓(xùn)練及測試所采用的試驗平臺為:使用編程軟件Python 3.9.12,利用CUDA 11.6及PyTorch 1.12.1的深度學(xué)習(xí)框架搭建模型,使用NVIDIA GeForce RTX 3060 的顯卡,在Windows 11操作系統(tǒng)上進行運行。
3.2 改進模型訓(xùn)練參數(shù)
在改進模型進行訓(xùn)練前,將番茄病害葉片數(shù)據(jù)集的訓(xùn)練集與驗證集以9 ∶1的比例進行劃分。在訓(xùn)練過程中,輸入番茄病害葉片圖片大小為224×224,批量大?。˙atch_size)設(shè)為16,初始學(xué)習(xí)率為0.01,選擇 SGD 優(yōu)化器對學(xué)習(xí)率進行優(yōu)化,動量設(shè)置為0.9,共迭代50次,模型訓(xùn)練逐漸達到穩(wěn)定,在測試時,隨機從PlantVillage公開番茄病害葉片數(shù)據(jù)集中構(gòu)建測試集,對該模型的識別效果進行測試,更能體現(xiàn)出改進模型的識別效果。
4 結(jié)果與分析
4.1 ShuffleNet v2與改進ShuffleNet v2模型訓(xùn)練結(jié)果對比
為了更直觀地觀察原模型與改進模型在訓(xùn)練過程中對番茄葉片病害識別的準(zhǔn)確率,以及損失值變化情況對比,制作準(zhǔn)確率對比圖和損失值對比圖,分別如圖9、圖10所示。
由圖9、圖10可知,僅迭代10次,改進ShuffleNet v2模型在驗證集上的準(zhǔn)確率高于ShuffleNet v2模型;而損失值從一開始就比原模型小,并且下降得較快,說明對原模型改進后,收斂速度更快,泛化能力更強。
4.2 不同分類模型準(zhǔn)確率對比
各個分類模型均具備其特點 為了對比分類模型在番茄葉片病害驗證集上的準(zhǔn)確率,選擇常規(guī)分類模型AlexNet、ResNet50、GooleNet以及輕量化分類模型MobileNet v3,制作準(zhǔn)確率曲線對比圖,如圖11所示,相比之下,改進ShuffleNet v2模型雖然在訓(xùn)練剛開始準(zhǔn)確率偏低,但隨后上升速度很快,在迭代
10次后,基本達到平穩(wěn)狀態(tài),且高于其他分類模型。
4.3 消融試驗結(jié)果
為了進一步探究所提各項改進模塊相比原模型識別性能是否有所提升,在隨機制作的測試集上進行消融試驗,消融試驗結(jié)果見表1。
從表1中可觀察到在原模型基礎(chǔ)上,將基本單元結(jié)構(gòu)改變?yōu)镾A-stage結(jié)構(gòu),置換注意力SA模塊的添加使準(zhǔn)確率提高了1.23百分點,平均召回率提高了1.00百分點,又將1×1普通卷積刪除,使得參數(shù)量和計算量均有所減??;在添加SA-stage基礎(chǔ)上,添加LFN輕量化特征融合模塊,雖然額外增大了參數(shù)量和計算量,但由于深度可分離卷積的替換,使得參數(shù)量和計算量低于原模型,并且準(zhǔn)確率和平均召回率又分別提高了1.53、1.50百分點;接著隨著RFB-s模塊的加入,準(zhǔn)確率又提升了0.80百分點,平均召回率提高了0.40百分點;通過各個改進模塊的引入,相比原模型,改進ShuffleNet v2模型的參數(shù)量和計算量均降低,準(zhǔn)確率提高了4.44百分點,平均召回率也上升了3.70百分點。由上述分析可知,各個模塊的融合不僅提高了番茄葉片病害識別的有效性,還使得最終改進ShuffleNet v2模型更加輕量化。
4.4 混淆矩陣
為了判斷改進ShuffleNet v2模型將番茄葉片病害是否預(yù)測正確,對分類模型評價指標(biāo)混淆矩陣可視化,如圖12所示,該混淆矩陣是在隨機制作的葉片病害測試集上進行測試判斷,每種葉片病害圖像大致在100張左右。從圖12中可直觀看出,改進模型對于番茄葉片病害大部分都能正確識別,晚疫病的誤測率比其他稍高,基本被誤測為早疫病,因為這2種病害在發(fā)病到一定程度時特征基本相似,導(dǎo)致無法準(zhǔn)確區(qū)分,但不足以影響該模型對病害的識別,依然具備滿足實際應(yīng)用的要求。
4.5 模型熱力圖可視化
在使用分類模型處理圖像分類問題時,通過卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練之后,直接得到關(guān)于番茄葉片病害的分類種類,卻不知病害哪些位置信息影響著最終的分類結(jié)果,為此使用原模型ShuffleNet v2和改進ShuffleNet v2模型,對部分葉片病害進行類激活圖(class activation mapping,CAM)可視化對比,如圖13所示,在熱力圖中,整張圖片表現(xiàn)出的顏色不一致,與葉片病害越相關(guān)的信息位置,顏色表現(xiàn)越明顯,越接近于紅色。
從圖13可以看出,針對葉片細(xì)菌性斑點病、晚疫病、葉霉病、斑枯病,有些病害病斑較小、分布零散,導(dǎo)致原模型ShuffleNet v2無法全面、準(zhǔn)確地定位到病害的關(guān)鍵區(qū)域,而改進ShuffleNet v2模型能夠提取與葉片病害相關(guān)的關(guān)鍵特征信息,既可以全面覆蓋葉片病害的關(guān)鍵區(qū)域,也能準(zhǔn)確、清晰定位病害關(guān)鍵區(qū)域的具體位置。由上述分析可知,改進ShuffleNet v2模型能夠清晰關(guān)注到圖像中與番茄葉片病害相關(guān)的關(guān)鍵信息,增強了該模型對葉片病害的識別效果。
4.6 不同分類模型性能對比
不同分類模型在番茄葉片病害驗證集上達到了較高的準(zhǔn)確率,為了進一步探究識別性能,對其在隨機制作的測試集上進行試驗。
根據(jù)在番茄葉片病害測試集上的試驗結(jié)果(表2)可知,改進ShuffleNet v2模型對病害識別的準(zhǔn)確率、參數(shù)量以及權(quán)重均優(yōu)于其他分類模型。與常規(guī)分類模型AlexNet、GooleNet相比,準(zhǔn)確率大幅上升,相比于ResNet50模型,準(zhǔn)確率上升了5.55百分點;與新穎模型Vision Transformer相比,準(zhǔn)確率也大幅上升,參數(shù)量和權(quán)重大幅降低;相比于輕量化模型MobileNet v3,準(zhǔn)確率上升了9.25百分點。改進模型參數(shù)量和計算量分別為348 154、38.75 MB,權(quán)重僅為1.51 MB,與原模型ShuffleNet v2基本持平,且小于其他模型。進一步證明了改進ShuffleNet v2模型對于番茄葉片病害識別性能的優(yōu)勢,具有較強的魯棒性。
5 結(jié)論
本研究以常見的番茄葉片細(xì)菌性斑點病、早疫病、晚疫病、葉霉病等9種病害為研究對象,使用PlantVillage公開數(shù)據(jù)集劃分訓(xùn)練集與驗證集,從中隨機構(gòu)建測試集。為了解決ShuffleNet v2模型在葉片病害測試集上識別準(zhǔn)確率不高、模型參數(shù)量和計算量較大等問題,提出改進ShuffleNet v2模型,通過一系列對比試驗,得到如下結(jié)論。
(1)原模型ShuffleNet v2基本單元關(guān)注著病害不同程度相關(guān)的特征信息,會造成信息冗余,模型較為復(fù)雜,則提出SA-stage基本單元,試驗結(jié)果表明該方法使模型關(guān)注緊密相關(guān)的病害特征,同樣減小了模型復(fù)雜度。
(2)原分類模型僅靠卷積神經(jīng)網(wǎng)絡(luò)深層特征進行病害識別,缺少相關(guān)的紋理、顏色等細(xì)節(jié)信息,導(dǎo)致模型識別效果欠佳,提出LFN模塊,使模型淺層和深層網(wǎng)絡(luò)實現(xiàn)上下文信息交互,不僅提高了識別效果,而且降低了參數(shù)量和計算量。
(3)番茄葉片多表現(xiàn)為不規(guī)則、小病斑病害,根據(jù)成像特點,導(dǎo)致病害識別的準(zhǔn)確率不高,引入RFB-s模塊,利用不同感受野的膨脹卷積提取不同尺度葉片病害特征,增強了小目標(biāo)病害的識別效果。
(4)普通卷積和最大池化對圖像進行處理會導(dǎo)致番茄葉片病害小目標(biāo)的細(xì)粒度信息丟失,在特征學(xué)習(xí)過程中,使小目標(biāo)病害無法被識別,則引入 SPD-Conv 代替普通卷積和最大池化層,試驗結(jié)果表明,不僅提高了模型識別準(zhǔn)確率,還使模型更加輕量化,便于在資源有限的設(shè)備上進行部署。
參考文獻:
[1]高 山. 設(shè)施番茄病蟲害綠色防控技術(shù)分析[J]. 農(nóng)村實用技術(shù),2022(6):98-100.
[2]蘇子峰. 基于大數(shù)據(jù)的大棚番茄病蟲害防治栽培技術(shù)研究[J]. 中國農(nóng)業(yè)文摘(農(nóng)業(yè)工程),2023,35(1):69-73.
[3]蔣萬勝,田 姿. 論深度學(xué)習(xí)技術(shù)對人類社會發(fā)展的影響[J]. 寶雞文理學(xué)院學(xué)報(社會科學(xué)版),2023,43(1):133-139.
[4]唐曉彬,沈 童. 深度學(xué)習(xí)框架發(fā)展綜述[J]. 調(diào)研世界,2023(4):83-88.
[5]戴久竣,馬肄恒,吳 堅,等. 基于改進殘差網(wǎng)絡(luò)的葡萄葉片病害識別[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(5):208-215.
[6]曹藤寶,張 欣,陳孝玉龍,等. 融合空間注意力機制和DenseNet的玉米病害分類方法[J]. 無線電工程,2022,52(10):1710-1717.
[7]Ding R R,Qiao Y L,Yang X H,et al. Improved ResNet based apple leaf diseases identification[J]. IFAC-Papers On Line,2022,55(32):78-82.
[8]Naik B N,Malmathanraj R,Palanisamy P. Detection and classification of chilli leaf disease using a squeeze-and-excitation-based CNN model[J]. Ecological Informatics,2022,69:101663.
[9]Paymode A S,Malode V B. Transfer learning for multi-crop leaf disease image classification using convolutional neural network VGG[J]. Artificial Intelligence in Agriculture,2022,6:23-33.
[10]劉擁民,劉翰林,石婷婷,等. 一種優(yōu)化的Swin Transformer番茄葉片病害識別方法[J]. 中國農(nóng)業(yè)大學(xué)學(xué)報,2023,28(4):80-90.
[11]He K M,Zhang X Y,Ren S Q,et al. Deep residual learning for image recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016:770-778.
[12]Huang G,Liu Z,van der Maaten L,et al. Densely connected convolutional networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017:4700-4708.
[13]Simonyan K,Zisserman A. Very deep convolutional networks for large-scale image recognition[J]. arXiv preprint arXiv:1409.1556,2014.
[14]Liu Z,Lin Y,Cao Y,et al. Swin transformer:hierarchical vision transformer using shifted windows[C]//Proceedings of the IEEE/CVF international conference on computer vision. 2021:10012-10022.
[15]熊夢園,詹 煒,桂連友,等. 基于ResNet模型的玉米葉片病害檢測與識別[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(8):164-170.
[16]Ma N,Zhang X,Zheng H T,et al. Shufflenet v2:practical guidelines for efficient cnn architecture design[C]//Proceedings of the European conference on computer vision (ECCV). 2018:116-131.
[17]Zhang Q L,Yang Y B. Sa-net:shuffle attention for deep convolutional neural networks[C]//ICASSP 2021-2021 IEEE international conference on acoustics,speech and signal processing (ICASSP). IEEE,2021:2235-2239.
[18]Liu S,Huang D. Receptive field block net for accurate and fast object detection[C]//Proceedings of the European conference on computer vision (ECCV). 2018:385-400.
[19]Howard A G,Zhu M L,Chen B,et al. Mobilenets:efficient convolutional neural networks for mobile vision applications[J]. arXiv preprint arXiv,2017.
[20]Sunkara R,Luo T. No more strided convolutions or pooling:a new CNN building block for low-resolution images and small objects[C]//European conference on machine learning and principles and practice of knowledge discovery in Databases(ECML PKDD),Grenoble,F(xiàn)rance,September 19-23,2022,Proceedings,Part Ⅲ. Cham:Springer Nature Switzerland,2023:443-459.
[21]Wu Y X,He K M. Group normalization[C]//Proceedings of the European conference on computer vision (ECCV). 2018:3-19.