黃鋁文 鄭梁 黃煜 謙博 關(guān)非凡
摘要:為提高草莓病害圖像的分類(lèi)準(zhǔn)確性,提出一種基于通道域增強(qiáng)的深度超參數(shù)化金字塔卷積殘差網(wǎng)絡(luò)(CEM-DOPConv-ResNet18)。首先,針對(duì)草莓病害的多尺度特點(diǎn),基于金字塔卷積與深度超參數(shù)化卷積提出深度超參數(shù)化金字塔卷積(DOPConv),在提取多尺度病害特征的同時(shí),緩解參數(shù)量增加導(dǎo)致的收斂干擾;其次,提出基于雙重池化的通道增強(qiáng)模塊,用以提高模型的特征選擇能力,增強(qiáng)有用尺度下的特征;最后,將上述方法與ResNet18結(jié)合,將原本的3×3卷積替換為DOPConv,同時(shí)在殘差塊中加入通道增強(qiáng)模塊,構(gòu)建出草莓病害分類(lèi)網(wǎng)絡(luò)。為驗(yàn)證模型識(shí)別性能與模塊有效性,在草莓病害圖像數(shù)據(jù)集上進(jìn)行對(duì)比試驗(yàn)和消融試驗(yàn)。對(duì)比試驗(yàn)結(jié)果表明,與原有ResNet18模型相比,CEM-DOPConv-ResNet18的準(zhǔn)確率達(dá)97.867%,提高3.045百分點(diǎn),同時(shí)內(nèi)存占用量下降16.6%;消融試驗(yàn)結(jié)果表明,相較于原始金字塔卷積,DOPConv可以優(yōu)化模型收斂,對(duì)通道增強(qiáng)模塊具有更高的兼容度。該模型提高了草莓病害的分類(lèi)準(zhǔn)確率,降低了網(wǎng)絡(luò)復(fù)雜度,為病害的精準(zhǔn)識(shí)別提供了一種有效解決模型。
關(guān)鍵詞:草莓病害識(shí)別;多尺度卷積算子;特征增強(qiáng);殘差模塊
中圖分類(lèi)號(hào):TP391.41文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1002-1302(2023)10-0202-09
我國(guó)是全球最大的草莓生產(chǎn)國(guó),草莓播種面積在全球占比近1/3[1]。而草莓病害的發(fā)生和擴(kuò)散造成了大量減產(chǎn)。傳統(tǒng)草莓病害的預(yù)防方法主要依靠種植人員的經(jīng)驗(yàn),對(duì)草莓生長(zhǎng)進(jìn)行追蹤和監(jiān)控,但草莓病害癥狀多樣,部分特征相似性強(qiáng),僅靠人工檢測(cè)無(wú)法達(dá)到有效防控。研究表明,深度學(xué)習(xí)方法已被應(yīng)用于多種作物的病害識(shí)別,實(shí)現(xiàn)了高效病害檢測(cè)[2-4]。病害識(shí)別模型的可靠性和準(zhǔn)確性,一直是農(nóng)作物病害檢測(cè)的研究熱點(diǎn)。為此,本研究提出一種基于殘差模型的多尺度病害識(shí)別方法,提高草莓病害的整體識(shí)別精度。
由表1可知,文獻(xiàn)[5-6]采用遷移學(xué)習(xí)方式,將病害先驗(yàn)與網(wǎng)絡(luò)融合,提高了模型的泛化能力[7]。文獻(xiàn)[8-9]采用膠囊網(wǎng)絡(luò)模型,膠囊層可包含病害的多種信息,提高了模型的識(shí)別能力[10]。文獻(xiàn)[11-12]采用注意力機(jī)制,通過(guò)特征重標(biāo)定,提高了模型的特征選擇能力[13]。然而,上述模型大多采用單一尺度卷積,感受野較固定,在面對(duì)尺度分布較復(fù)雜的病害時(shí),特征提取能力有限。
結(jié)合草莓發(fā)病性狀的特點(diǎn),在葉片和果實(shí)上的病斑通常呈現(xiàn)尺度不一的性質(zhì);同時(shí),在同一發(fā)病位置上,不同病癥在不同發(fā)病時(shí)期的病斑具有尺度差異。表1所示方法還未充分考慮病斑大小不一所導(dǎo)致的多尺度特征問(wèn)題。金字塔卷積能通過(guò)集成不同尺度的卷積核,提取不同尺度分布下的目標(biāo)特征[14],在多標(biāo)簽圖像分類(lèi)[15]、醫(yī)學(xué)圖像分割[16]上效果較為明顯。相較于文獻(xiàn)[7]的多分支融合提取方式,金字塔卷積僅需單分支,較為簡(jiǎn)易;但多尺度提取方式在一定程度上會(huì)導(dǎo)致參數(shù)量增加,干擾模型的收斂。文獻(xiàn)[18]提出的深度超參數(shù)化卷積,可以通過(guò)改變卷積方式優(yōu)化模型的收斂,能提高整體的識(shí)別性能,已應(yīng)用于高光譜圖像分類(lèi)[19]、視覺(jué)跟蹤[20]和醫(yī)學(xué)圖像分割[21]。
為提高作物病害的識(shí)別精度,解決深度模型單一尺度特征的不足,并改善參數(shù)量增加導(dǎo)致的模型快速收斂問(wèn)題,本研究提出了一種基于金字塔卷積和深度超參數(shù)化卷積的深度超參數(shù)化金字塔卷積(DOPConv),將其用于改造和優(yōu)化卷積神經(jīng)網(wǎng)絡(luò);同時(shí)提出并使用基于雙重池化的通道增強(qiáng)模塊(CEM),以進(jìn)一步優(yōu)化網(wǎng)絡(luò)分類(lèi)性能。該模型可滿足草莓常見(jiàn)病害的分類(lèi)與快速檢測(cè)需求。
1材料與方法
1.1草莓病害數(shù)據(jù)集獲取
病害數(shù)據(jù)集為Afzaal等提供的草莓圖像,包含草莓果實(shí)上的白粉病、灰霉病、炭疽病及葉面上的白粉病、蛇眼病、角斑病、枯萎病7類(lèi)樣本,共計(jì)2500幅圖像,其中每類(lèi)病害均包含了發(fā)病各個(gè)時(shí)期的圖像[22]。數(shù)據(jù)集中的圖像文件大小集中于143~226kB之間,尺寸為419×419像素。各類(lèi)別病害數(shù)量分布如表2所示,示例樣本如圖1所示。
在草莓?dāng)?shù)據(jù)集中,發(fā)病部位涵蓋了葉片和果實(shí),呈現(xiàn)整體病斑大小不一、形態(tài)特征多樣等性質(zhì),但是不同發(fā)病時(shí)期的不同病害呈現(xiàn)相似的發(fā)病特征。例如,葉片角斑病在發(fā)病初期,表面出現(xiàn)紅褐色不規(guī)則病斑,病斑擴(kuò)大時(shí)受葉脈限制,形成角形葉斑;葉片蛇眼病在發(fā)病初期,表面出現(xiàn)紫紅色小圓斑,隨后病斑擴(kuò)大,中心為灰色,周?chē)虾稚?,呈蛇眼狀。由圖1-a、圖1-b可見(jiàn),二者在感染初期特征相近,都具有大小相似的褐色不規(guī)則病斑。當(dāng)果實(shí)感染白粉病時(shí),幼果被白粉覆蓋;在感染灰霉病時(shí),幼果濕軟腐爛;濕度大時(shí),病部產(chǎn)生灰褐色霉?fàn)钗?。由圖1-e、圖1-f可見(jiàn),灰霉病、白粉病發(fā)病初期都具有灰白色霜狀覆蓋物,邊界形狀不規(guī)則,相似程度高。不同類(lèi)別的草莓病害在一定條件下會(huì)形成相似的特征,葉片癥狀主要表現(xiàn)為出現(xiàn)病斑,呈現(xiàn)小而密集的特點(diǎn);果實(shí)癥狀表現(xiàn)多為果實(shí)表面有明顯覆蓋物,屬于較大目標(biāo)。以上這些病害的識(shí)別都會(huì)受到發(fā)病區(qū)域大小等尺度因素的影響。
1.2數(shù)據(jù)增強(qiáng)
為增強(qiáng)模型的泛化能力,在現(xiàn)有數(shù)據(jù)條件下擴(kuò)充數(shù)據(jù)集規(guī)模,能模擬同一圖像目標(biāo)在不同拍攝環(huán)境下的狀態(tài),更加充分利用現(xiàn)有數(shù)據(jù)集的價(jià)值[23]。采用顏色與對(duì)比度調(diào)整模擬不同光照條件下的病害圖像采集,有利于降低模型對(duì)白粉病、灰霉病等顏色特征較為明顯的病害敏感性;采用幾何旋轉(zhuǎn)與鏡像翻轉(zhuǎn)模擬不同拍攝角度下的病害圖像,提高模型對(duì)于不同角度的魯棒性。將數(shù)據(jù)集按照6∶2∶2劃分為訓(xùn)練集、驗(yàn)證集、測(cè)試集,然后通過(guò)上述2類(lèi)共8種數(shù)據(jù)增強(qiáng)方法進(jìn)行數(shù)據(jù)增強(qiáng)。增強(qiáng)前后的對(duì)比結(jié)果如圖2所示,最終數(shù)據(jù)集劃分結(jié)果如表3所示。
2草莓病害識(shí)別模型
為實(shí)現(xiàn)草莓病害不同尺度大小的病斑特征識(shí)別,構(gòu)建基于通道增強(qiáng)的深度超參數(shù)化金字塔卷積殘差網(wǎng)絡(luò)模型CEM-DOPConv-ResNet18(Channel-Enhancement-Module-Depthwise-Over-Parameterized-Convolution-ResNet18)。模型組成主要包括3個(gè)部分:(1)提取病害深度語(yǔ)義特征的殘差模塊;(2)草莓病害性狀的多尺度特征提取模塊;(3)基于雙重池化的尺度自適應(yīng)增強(qiáng)模塊。
2.1殘差模塊
草莓病害的發(fā)病癥狀多樣,例如:白粉病在葉片或果實(shí)表面呈現(xiàn)白色粉狀全覆蓋物;灰霉病、炭疽病會(huì)導(dǎo)致不規(guī)則棕褐色斑;蛇眼病、角斑病等會(huì)產(chǎn)生密集的角狀和橢圓病斑。淺層網(wǎng)絡(luò)通常只能提取到邊緣等低級(jí)共性特征,表達(dá)能力較弱,不足以區(qū)分相似性強(qiáng)、大小不一的草莓病癥。同時(shí),在深度模型的層數(shù)堆疊過(guò)度時(shí),容易發(fā)生梯度彌散、梯度爆炸的問(wèn)題。為此,本研究采用何愷明等提出的殘差網(wǎng)絡(luò)[24]來(lái)提取草莓病害的深度特征,殘差網(wǎng)絡(luò)的核心即殘差模塊的基本結(jié)構(gòu)如圖3所示。
在每個(gè)殘差模塊中,代表原始輸入的identity與經(jīng)過(guò)特征提取層的輸出F(x)相加,得到最終的輸出H(x),此時(shí)F(x)=H(x)-x,即為最終輸出的殘差,以此達(dá)到讓模型學(xué)習(xí)殘差的目的。殘差模塊的計(jì)算公式為:
式中:yi表示第i個(gè)殘差塊輸出結(jié)果;wi表示第i個(gè)殘差塊權(quán)重層;xi表示第i個(gè)殘差塊輸入特征;downsample表示下采樣操作。
在反向傳播過(guò)程中,由于模型學(xué)習(xí)的F(x)=H(x)-x,因此梯度可以始終保持一個(gè)較大的值,不會(huì)因?yàn)榫W(wǎng)絡(luò)的加深而出現(xiàn)彌散現(xiàn)象,便于模型參數(shù)的優(yōu)化。同時(shí)模型深度的增加提高了模型的表達(dá)能力,有利于提高最終的病害分類(lèi)精度??紤]到模型容量與數(shù)據(jù)規(guī)模的適配性,本研究選擇ResNet18作為基礎(chǔ)網(wǎng)絡(luò)。
2.2深度超參數(shù)化金字塔卷積
草莓病害特征在尺度分布上有較大差異,如蛇眼病早期在葉片上形成許多近圓形小斑點(diǎn),呈現(xiàn)小而密的特點(diǎn),但在中后期小斑點(diǎn)會(huì)匯聚成大病斑,形成類(lèi)別內(nèi)的特征尺度差異;另外,果實(shí)病害形成的病斑較大,如白粉病的白色菌層等,而在葉片上的病斑較小,如角斑病的角狀病斑,構(gòu)成類(lèi)別間的尺度差異。因此,采用多尺度特征提取,有利于模型精準(zhǔn)捕捉到不同病害的發(fā)病部位。但是,現(xiàn)有多尺度特征提取通常使用多分支融合方式進(jìn)行,易導(dǎo)致模型參數(shù)量增加,使得模型在參數(shù)空間中難以收斂。為此,結(jié)合深度超參數(shù)化卷積與金字塔卷積模型,提出了深度超參數(shù)化金字塔卷積模型,在提取多尺度特征的同時(shí),便于網(wǎng)絡(luò)收斂和最優(yōu)參數(shù)組合。
由圖4可見(jiàn),金字塔卷積由1個(gè)卷積核金字塔構(gòu)成,集成了不同尺度的卷積核。大尺度卷積核具備較大感受野,可以提取草莓病害中的大病斑特征;小尺度卷積核感受野較小,可以提取小病斑特征。在多種尺度的卷積操作之后,通過(guò)調(diào)整padding、stride等參數(shù),將不同尺度的病斑特征統(tǒng)一到同一尺度特征圖下,再通過(guò)通道拼接的方式完成特征融合。
本研究在金字塔卷積基礎(chǔ)上引入深度超參數(shù)化卷積,核金字塔中采用不同尺度的深度超參數(shù)化卷積,形成深度超參數(shù)化金字塔卷積。進(jìn)行特征提取時(shí)首先使用1次深度卷積[25],再使用1次標(biāo)準(zhǔn)卷積,計(jì)算完成后得到某一個(gè)尺度上的輸出特征圖。深度卷積使單一卷積核卷積單一通道,針對(duì)某一特定通道,使用Dmul個(gè)卷積核,能得到Dmul個(gè)特征圖。因此,假定卷積核尺度為m×n,輸入通道數(shù)為Cin,輸出通道數(shù)為Cout,則深度卷積的權(quán)重空間屬于F(Cin×Dmul×m×n)。由于每次卷積只利用了單一通道的信息,沒(méi)有進(jìn)行跨通道交互,導(dǎo)致了信息損失。因此,再對(duì)中間結(jié)果進(jìn)行標(biāo)準(zhǔn)卷積,將多通道信息融合,此時(shí)所用的標(biāo)準(zhǔn)卷積權(quán)重空間屬于R(Cin×Cout×Dmul)。深度超參數(shù)化卷積的計(jì)算公式為:
式中:P表示輸入特征圖;O表示輸出特征圖;D表示深度卷積核;o表示深度卷積操作;W表示標(biāo)準(zhǔn)卷積核;*表示標(biāo)準(zhǔn)卷積操作。
根據(jù)文獻(xiàn)[18]中的方法,令Dmul=m×n,則會(huì)多出Cin×m×n×Dmul個(gè)參數(shù),為1個(gè)深度卷積的參數(shù)量。與原來(lái)的金字塔卷積相比,在引入深度超參數(shù)化卷積后,雖然在一定程度上增加了參數(shù)量,但是在正向傳播過(guò)程中,深度卷積核與標(biāo)準(zhǔn)卷積核通過(guò)核融合方式,可以合并為單一卷積核,不會(huì)增加計(jì)算需求。在反向傳播時(shí),核金字塔所有層中的2個(gè)卷積核可以同時(shí)被訓(xùn)練,相較于標(biāo)準(zhǔn)的卷積方式,額外進(jìn)行了1次參數(shù)更新,因此可以加速模型的訓(xùn)練,優(yōu)化模型在參數(shù)空間中的收斂過(guò)程。消融試驗(yàn)結(jié)果表明,金字塔卷積與深度超參數(shù)卷積結(jié)合,可以有效抵消由增加多尺度組件和其他網(wǎng)絡(luò)組件帶來(lái)的模型復(fù)雜度、干擾模型收斂等問(wèn)題,有利于提高整體的識(shí)別準(zhǔn)確率。
2.3基于雙重池化的通道增強(qiáng)模塊
草莓病害圖像中除了病斑,還有背景和未被病害侵染的健康組織,而不同通道的特征圖中可能包含了這些影響模型分類(lèi)的信息,需要進(jìn)行篩選。同時(shí),不同尺度下,特征的重要程度受病害性狀的影響。為此,本研究提出了基于雙重池化的通道增強(qiáng)模塊,對(duì)尺度進(jìn)行自適應(yīng)增強(qiáng)和選擇。該機(jī)制根據(jù)每一幅特征圖的全局信息和最大信息,進(jìn)行特征通道的重標(biāo)定,能增強(qiáng)對(duì)識(shí)別任務(wù)更有幫助的通道,抑制較無(wú)用的通道。由于模型中不同通道中的信息含有不同尺度下提取的特征語(yǔ)義,因此,增強(qiáng)通道的行為將改進(jìn)模型學(xué)習(xí)中較重要的尺度。
基于雙重池化的通道篩選模塊結(jié)構(gòu)如圖5所示,首先進(jìn)行平均池化和最大池化,得到每個(gè)通道特征圖的全局表示和最大表示,然后沿著通道維度分別進(jìn)行一維卷積,將卷積得到的2個(gè)結(jié)果相加,并進(jìn)行Sigmoid運(yùn)算,最終結(jié)果作為權(quán)重,并將相應(yīng)的通道加權(quán)。在一維卷積核長(zhǎng)度為2K+1時(shí),公式如下。
式中:AvgPool表示全局平均池化;MaxPool表示全局最大池化;ai表示平均信息一維卷積中第i個(gè)權(quán)重;bi表示最大信息一維卷積中第i個(gè)權(quán)重;σ(·)表示Sigmoid運(yùn)算;xi表示第i個(gè)通道特征圖;wi表示第i個(gè)通道權(quán)重。
通道增強(qiáng)模塊使用了病害的全局信息和最大信息,相較于ECA注意力[26],使用了更多信息,提高了通道特征的表達(dá)能力,增加了特征重標(biāo)定的精確性。在進(jìn)行一維卷積時(shí),不同通道均利用了相鄰?fù)ǖ赖男畔ⅲ纬煽缬虻男畔⒘魍?,相較于SE注意力及其變體[27],避免壓縮過(guò)程中通道降維操作導(dǎo)致的信息損失等負(fù)面影響。
2.4病害識(shí)別模型結(jié)構(gòu)
在ResNet18的基礎(chǔ)上,CEM-DOPConv-ResNet18加入深度超參數(shù)化金字塔卷積與通道增強(qiáng)模塊,共分為4個(gè)殘差層,每層包含2個(gè)殘差模塊。將每個(gè)殘差塊中第1個(gè)3×3卷積替換為多尺度卷積,從第1層到第4層,核金字塔內(nèi)的核尺度依次為(3,5,7,9)、(3,5,7)、(3,5)、3。將第2個(gè)3×3卷積替換為1×1卷積進(jìn)行通道升降維。同時(shí),在每個(gè)殘差塊的末尾加入通道增強(qiáng)模塊;為便于梯度計(jì)算,將模塊放置在殘差連接之前。特征降采樣由每層第1個(gè)殘差塊中步長(zhǎng)為2的多尺度卷積完成。在網(wǎng)絡(luò)最后,保留原有平均池化與全連接層,作為最終分類(lèi)判別輸出,整體網(wǎng)絡(luò)結(jié)構(gòu)和各殘差層內(nèi)部結(jié)構(gòu)如圖6所示。
3試驗(yàn)結(jié)果與分析
本試驗(yàn)于2022年9月在西北農(nóng)林科技大學(xué)信息工程學(xué)院深度學(xué)習(xí)服務(wù)器上運(yùn)行,試驗(yàn)環(huán)境使用Ubuntu20.04.4,CPU型號(hào)為IntelXeonE5-2690v4(14核、主頻2.6GHz),GPU型號(hào)為NVIDIAGeForceRTX3080Ti(流處理器10240個(gè)、顯存16GB),深度學(xué)習(xí)框架為PyTorch1.10.2。訓(xùn)練過(guò)程中,為使模型能夠逃離局部最小點(diǎn),優(yōu)化器采用帶動(dòng)量的SGD[28],學(xué)習(xí)率調(diào)整采用余弦退火策略。
試驗(yàn)參數(shù)設(shè)置訓(xùn)練輪數(shù)為80,批次大小為128,初始學(xué)習(xí)率為0.001,動(dòng)量值為0.7,余弦退火周期為10個(gè)訓(xùn)練輪數(shù)。余弦退火的學(xué)習(xí)率變化曲線如圖7所示,余弦退火可使學(xué)習(xí)率的大小如余弦函數(shù)般周期性變化;在1個(gè)周期的最大值中,模型可以憑借較大的學(xué)習(xí)率逃離局部最優(yōu)點(diǎn),然后學(xué)習(xí)率逐漸減小,使模型能夠在一段區(qū)間內(nèi)較好地收斂。在多個(gè)周期中,學(xué)習(xí)率會(huì)循環(huán)變化,覆蓋范圍較大,具有較好的魯棒性。
3.1模型性能對(duì)比
將本研究模型與經(jīng)典模型對(duì)測(cè)試集準(zhǔn)確率、精確率、召回率、F1值、參數(shù)量、內(nèi)存占用量大小6個(gè)指標(biāo)進(jìn)行比較,結(jié)果如表4所示。同時(shí),對(duì)各模型進(jìn)行不同類(lèi)別草莓病害識(shí)別準(zhǔn)確率對(duì)比,結(jié)果如表5所示。
由表4可知,CEM-DOPConv-ResNet18取得最高的準(zhǔn)確率和F1值,且內(nèi)存占用較??;相較于InceptionV3、ResNet34,在減少內(nèi)存占用的同時(shí)提高了準(zhǔn)確率;相較于基礎(chǔ)模型ResNet18,參數(shù)量、模型內(nèi)存占用量分別下降了16.7%、16.6%。
由表5可知,果實(shí)上炭疽病、灰霉病、白粉病的識(shí)別準(zhǔn)確率較低。這是因?yàn)?,果?shí)上的白粉病與炭疽病在發(fā)病早期癥狀較為類(lèi)似,都會(huì)呈現(xiàn)灰白色覆蓋物的特征,所以兩者區(qū)分較為困難。從特征細(xì)節(jié)看,白粉病是附著表面的白色菌絲且覆蓋面積大,而灰霉病是不規(guī)則的灰色霉層且覆蓋面較小,兩者全局信息相似但有細(xì)微的顏色差異和尺度差異。除此之外,炭疽病和灰霉病的褐色病斑顏色相近,蛇眼病發(fā)病前后期的病斑大小不一致,都具有一定的識(shí)別難度。本研究中,CEM-DOPConv-ResNet18在果實(shí)白粉病、灰霉病和葉片角斑病、枯萎病、白粉病的識(shí)別上,取得了最高的準(zhǔn)確率,在炭疽病果實(shí)的識(shí)別上僅次于ResNet34,在蛇眼病葉片的識(shí)別上僅次于InceptionV3。上述結(jié)果充分說(shuō)明,該模型能夠捕捉不同病害癥狀之間的細(xì)微差別和尺度差異,對(duì)草莓病害圖像分類(lèi)有良好表現(xiàn)。
為了直觀地呈現(xiàn)不同模型在訓(xùn)練過(guò)程中驗(yàn)證集準(zhǔn)確率的變化,繪制訓(xùn)練曲線(圖8)。由圖8可知,本研究所提出模型在訓(xùn)練過(guò)程中始終保持較高的準(zhǔn)確率,曲線振蕩幅度較小,整體較平滑,這說(shuō)明深度超參數(shù)化卷積對(duì)于模型訓(xùn)練有優(yōu)化作用?;煜仃嚳梢跃唧w反映出模型的誤識(shí)別情況。由圖9可得,模型將26個(gè)炭疽病果實(shí)識(shí)別為灰霉病果實(shí),11個(gè)灰霉病果實(shí)識(shí)別為炭疽病果實(shí)。由圖10可見(jiàn),灰霉病前期會(huì)在果實(shí)表面形成褐色病斑,后產(chǎn)生灰色霉層;炭疽病也會(huì)在果實(shí)表面形成褐色病斑。在灰霉病褐色病斑與霉層交疊時(shí),產(chǎn)生出與炭疽病病斑相近的癥狀,因此導(dǎo)致模型的誤識(shí)別。
同時(shí),模型將34個(gè)白粉病果實(shí)識(shí)別為了灰霉病果實(shí)。由圖11可見(jiàn),2類(lèi)果實(shí)表面均有白色絮狀覆蓋物。白粉病果實(shí)發(fā)病會(huì)在表面生成白色霉層,而灰霉病會(huì)在發(fā)病時(shí)生成灰色霉層,在一定的光照與角度下,2種霉層顏色較相近,因此導(dǎo)致了模型的誤識(shí)別。
綜上所述,本研究提出的模型在對(duì)于葉片發(fā)病部位的分類(lèi)上具有較高的準(zhǔn)確率,多尺度的特征提取與通道域增強(qiáng)的尺度選擇,可以減少模型對(duì)病斑大小的敏感性,能夠?qū)Υ笮〔“哌M(jìn)行合理提取并區(qū)分。模型對(duì)部分發(fā)病果實(shí)有一定誤識(shí)別現(xiàn)象,因?yàn)椴煌墓麑?shí)病害在不同發(fā)病時(shí)期可能會(huì)產(chǎn)生相近且難以區(qū)分的癥狀,因此增加了模型識(shí)別的難度。
3.2消融試驗(yàn)
為了分析深度超參數(shù)化金字塔卷積和通道增強(qiáng)模塊對(duì)于模型的提升效果,本研究設(shè)置了消融試驗(yàn),結(jié)果如表6所示。使用了多尺度卷積后,模型的識(shí)別性能都有較大的提升。在使用標(biāo)準(zhǔn)卷積的金字塔卷積模型中,增加CEM后,識(shí)別準(zhǔn)確率有所下降,表明了金字塔卷積與CEM的融合為模型性能帶來(lái)了負(fù)面影響。因?yàn)樵黾泳W(wǎng)絡(luò)組件而提升了模型復(fù)雜度,使得模型的收斂變得更加困難,造成性能的下降。在使用深度超參數(shù)化金字塔卷積后,再加入CEM,模型的準(zhǔn)確率提高了1.099百分點(diǎn),F(xiàn)1值提高了2.026百分點(diǎn),表明深度超參數(shù)金字塔卷積與CEM的融合進(jìn)一步提升了模型性能。同時(shí),引入了深度超參數(shù)卷積,模型準(zhǔn)確率均高于未引入時(shí)。由此可以看出,深度超參數(shù)化卷積可以優(yōu)化模型的收斂,對(duì)于其他網(wǎng)絡(luò)組件有更好的兼容性,使得模型學(xué)習(xí)到更優(yōu)的參數(shù)組合。
3.3特征可視化
為了直觀了解圖像中對(duì)于模型決策更加重要的部分,使用類(lèi)激活圖(classattentionmap,CAM)[29]進(jìn)行特征可視化。由圖12可知,高激活值區(qū)域可以覆蓋各個(gè)病害的發(fā)病區(qū)域,且大小不一。CEM-DOPConv-ResNet18對(duì)于果實(shí)上的炭疽病、灰霉病、白粉病,在表面覆蓋物和潰爛處激活值較高;對(duì)于葉片上的蛇眼病、角斑病,高激活值部分基本覆蓋病斑區(qū)域,但是分布并不均勻。對(duì)于葉片上的枯萎病、白粉病,高激活值部分精準(zhǔn)覆蓋發(fā)病區(qū)域。因此,本研究提出的CEM-DOPConv-ResNet18模型可有效捕捉不同部位、不同尺度下的發(fā)病特征。
4結(jié)論
針對(duì)草莓病害的不同發(fā)病部位和不同病斑尺度等識(shí)別問(wèn)題,提出了深度超參數(shù)化金字塔卷積,并以ResNet18為基礎(chǔ)模型進(jìn)行改進(jìn)優(yōu)化,將殘差塊中的第1個(gè)3×3卷積改為金字塔卷積,將第2個(gè)3×3卷積改為1×1卷積,使得模型可以提取多尺度特征。同時(shí),在殘差連接之前加入通道增強(qiáng)模塊,增強(qiáng)較有用的通道,抑制較無(wú)用的通道,進(jìn)行尺度篩選。
改進(jìn)后的CEM-DOPConv-ResNet18對(duì)于7類(lèi)草莓病害的分類(lèi)準(zhǔn)確度達(dá)97.867%,相較于原本的ResNet18提高了3.045百分點(diǎn);模型參數(shù)量、內(nèi)存占用量分別下降了16.7%、16.6%,降低模型復(fù)雜度的同時(shí),提高了模型性能。相較于ResNet18,對(duì)果實(shí)上發(fā)病性狀相似的白粉病、灰霉病、炭疽病的識(shí)別準(zhǔn)確率均有所提高。
本研究提出的深度超參數(shù)化金字塔卷積算子,可以增加特征多尺度提取能力,還能優(yōu)化模型收斂,對(duì)于其他網(wǎng)絡(luò)組件具有較好的兼容度,可以應(yīng)用到相似識(shí)別領(lǐng)域。
參考文獻(xiàn):
[1]王鳴謙,薛莉,趙珺,等.世界草莓生產(chǎn)及貿(mào)易現(xiàn)狀[J].中國(guó)果樹(shù),2021(2):104-108.
[2]ThakurPS,KhannaP,SheoreyT,etal.Trendsinvision-basedmachinelearningtechniquesforplantdiseaseidentification:asystematicreview[J].ExpertSystemsWithApplications,2022,208:118117.
[3]翟肇裕,曹益飛,徐煥良,等.農(nóng)作物病蟲(chóng)害識(shí)別關(guān)鍵技術(shù)研究綜述[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2021,52(7):1-18.
[4]NgugiLC,AbelwahabM,Abo-ZahhadM.Recentadvancesinimageprocessingtechniquesforautomatedleafpestanddiseaserecognition-Areview[J].InformationProcessinginAgriculture,2021,8(1):27-51.
[5]MaL,GuoXL,ZhaoSK,etal.Algorithmofstrawberrydiseaserecognitionbasedondeepconvolutionalneuralnetwork[J].Complexity,2021,2021:1-10.
[6]KimB,HanYK,ParkJH,etal.Improvedvision-baseddetectionofstrawberrydiseasesusingadeepneuralnetwork[J].FrontiersinPlantScience,2021,11:559172.
[7]ZhuangFZ,QiZY,DuanKY,etal.Acomprehensivesurveyontransferlearning[J].ProceedingsoftheIEEE,2021,109(1):43-76.
[8]丁永軍,張晶晶,李民贊.基于卷積膠囊網(wǎng)絡(luò)的百合病害識(shí)別研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2020,51(12):246-251,331.
[9]張會(huì)敏,謝澤奇,張善文.基于注意力膠囊網(wǎng)絡(luò)的作物病害識(shí)別方法[J].江蘇農(nóng)業(yè)科學(xué),2022,50(6):101-106.
[10]KwabenaPatrickM,F(xiàn)elixAdekoyaA,AbraMightyA,etal.Capsulenetworks-Asurvey[J].JournalofKingSaudUniversity-ComputerandInformationSciences,2022,34(1):1295-1310.
[11]李書(shū)琴,陳聰,朱彤,等.基于輕量級(jí)殘差網(wǎng)絡(luò)的植物葉片病害識(shí)別[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(3):243-250.
[12]王美華,吳振鑫,周祖光.基于注意力改進(jìn)CBAM的農(nóng)作物病蟲(chóng)害細(xì)粒度識(shí)別研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2021,52(4):239-247.
[13]NiuZY,ZhongGQ,YuH.Areviewontheattentionmechanismofdeeplearning[J].Neurocomputing,2021,452:48-62.
[14]ShiH,CaoG,GeZX,etal.Double-branchnetworkwithpyramidalconvolutionanditerativeattentionforhyperspectralimageclassification[J].RemoteSensing,2021,13(7):1403.
[15]YangXH,YangY,YangJ,etal.Imagemulti-labelclassificationbasedonpyramidconvolutionandsplit-attentionmechanism[C]//202118thInternationalComputerConferenceonWaveletActiveMediaTechnologyandInformationProcessing(ICCWAMTIP).December17-19,2021,Chengdu,China.IEEE,2022:534-538.
[16]LiCY,F(xiàn)anYX,CaiXD.PyConvU-Net:alightweightandmultiscalenetworkforbiomedicalimagesegmentation[J].BMCBioinformatics,2021,22(1):14.
[17]黃林生,羅耀武,楊小冬,等.基于注意力機(jī)制和多尺度殘差網(wǎng)絡(luò)的農(nóng)作物病害識(shí)別[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2021,52(10):264-271.
[18]CaoJM,LiYY,SunMC,etal.DO-conv:depthwiseover-parameterizedconvolutionallayer[J].IEEETransactionsonImageProcessing,2022,31:3726-3736.
[19]GaoHM,ChenZH,LiCM.Shallownetworkbasedondepthwiseoverparameterizedconvolutionforhyperspectralimageclassification[J].IEEEGeoscienceandRemoteSensingLetters,2022,19:1-5.
[20]WangYY,ZhangWS,ZhangLM,etal.Depthwiseover-parameterizedSiamesenetworkforvisualtracking[C]//2021InternationalConferenceonInformationTechnologyandBiomedicalEngineering(ICITBE).December24-26,2021,Nanchang,China.IEEE,2022:58-62.
[21]LiuYH,ShenJ,YangL,etal.ResDO-UNet:adeepresidualnetworkforaccurateretinalvesselsegmentationfromfundusimages[J].BiomedicalSignalProcessingandControl,2023,79:104087.
[22]AfzaalU,BhattaraiB,PandeyaYR,etal.AninstancesegmentationmodelforstrawberrydiseasesbasedonmaskR-CNN[J].Sensors,2021,21(19):6565.
[23]ShortenC,KhoshgoftaarTM.Asurveyonimagedataaugmentationfordeeplearning[J].JournalofBigData,2019,6(1):1-48.
[24]HeKM,ZhangXY,RenSQ,etal.Deepresiduallearningforimagerecognition[C]//2016IEEEConferenceonComputerVisionandPatternRecognition(CVPR).June27-30,2016,LasVegas,NV,USA.IEEE,2016:770-778.
[25]CholletF.Xception:deeplearningwithdepthwiseseparableconvolutions[C]//2017IEEEConferenceonComputerVisionandPatternRecognition(CVPR).July21-26,2017,Honolulu,HI,USA.IEEE,2017:1800-1807.
[26]WangQL,WuBG,ZhuPF,etal.ECA-net:efficientchannelattentionfordeepconvolutionalneuralnetworks[C]//2020IEEE/CVFConferenceonComputerVisionandPatternRecognition(CVPR).June13-19,2020.Seattle,WA,USA.IEEE,2020:11531-11539.
[27]HuJ,ShenL,AlbanieS,etal.Squeeze-and-excitationnetworks[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2020,42(8):2011-2023.
[28]史加榮,王丹,尚凡華,等.隨機(jī)梯度下降算法研究進(jìn)展[J].自動(dòng)化學(xué)報(bào),2021,47(9):2103-2119.
[29]ZhouBL,KhoslaA,LapedrizaA,etal.Learningdeepfeaturesfordiscriminativelocalization[C]//2016IEEEConferenceonComputerVisionandPatternRecognition(CVPR).June27-30,2016.LasVegas,NV,USA.IEEE,2016:2921-2929.