doi:10.15889/j.issn.1002-1302.2024.20.010
摘要:針對缺鈣草莓葉片病害特征較小、病害尺度特征變換較大、傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型對小目標(biāo)的檢測效果不佳等問題,提出一種基于YOLO v5模型的缺鈣草莓葉片識別方法。該方法首先以YOLO v5模型為基礎(chǔ)從其Backbone、Neck、損失函數(shù)等方面進(jìn)行優(yōu)化,提高其對缺鈣草莓葉片病害特征的檢測能力,并將優(yōu)化后的網(wǎng)絡(luò)模型命名為YOLO v5-Smix,再采用多種數(shù)據(jù)增強(qiáng)手段對已有數(shù)據(jù)集進(jìn)行擴(kuò)充,以保障后續(xù)卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練。該方法將原有Backbone骨骼中的CSPDarknet53主干網(wǎng)絡(luò)替換為以C2F模塊為核心的Darknet-53網(wǎng)絡(luò),保留缺鈣草莓葉片的小目標(biāo)特征;在Neck特征融合層添加BiFPN結(jié)構(gòu),有效解決缺鈣草莓葉片圖像尺度特征變換較大的問題,同時增強(qiáng)網(wǎng)絡(luò)多尺度特征融合能力;更換原本的損失函數(shù)CIoU為WIoU,進(jìn)一步提高模型的檢測效率及檢測能力。依據(jù)模型評價指標(biāo),通過試驗(yàn)將YOLO v5-Smix網(wǎng)絡(luò)與經(jīng)典的Faster-RCNN、YOLO v3、YOLO v4、YOLO v5等4種卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行對比。結(jié)果表明,YOLO v5-Smix的識別精確度達(dá)89.1%,召回率達(dá)81.0%,平均精確度達(dá)78.8%,與Faster RCNN、YOLO v3、YOLO v4、YOLO v5相比,識別精確度均有提高,能夠較精確地識別缺鈣草莓葉片病害特征,完成小目標(biāo)病害特征的檢測任務(wù)。
關(guān)鍵詞:YOLO v5;小目標(biāo);目標(biāo)檢測;輕量化模型;缺鈣;草莓
中圖分類號:TP391.41" 文獻(xiàn)標(biāo)志碼:A
文章編號:1002-1302(2024)20-0074-09
收稿日期:2023-10-10
基金項(xiàng)目:河北省科技計(jì)劃(編號:22370701D)。
作者簡介:李炳鑫(1999—),男,河北唐山人,碩士研究生,主要從事人工智能與機(jī)器學(xué)習(xí)研究。E-mail:291750154@qq.com。
通信作者:宋" 濤,博士,高級實(shí)驗(yàn)師,碩士生導(dǎo)師,主要從事智能傳感器與物聯(lián)網(wǎng)技術(shù)研究。E-mail:songtao@hebut.edu.cn。
作為我國農(nóng)業(yè)溫室培育水果中的典型代表,能否受到良好培育的前提在于草莓的生長狀態(tài)是否正常。草莓在生長的過程中生長狀態(tài)大多表現(xiàn)在葉片上,且極易受到鈣元素的影響,所以如何根據(jù)草莓葉片特征對生長狀態(tài)進(jìn)行判斷具有著十分重要的研究價值。對草莓葉片狀態(tài)的監(jiān)測和判別,目前農(nóng)業(yè)上采用依靠機(jī)電化設(shè)備檢測環(huán)境參數(shù)與人工檢測草莓葉片相互配合的方法來實(shí)現(xiàn),這種方法雖然能從宏觀上對草莓的狀態(tài)進(jìn)行判別,但效率極低且花費(fèi)大量人力物力,只適合小面積的溫室培育,無法滿足大面積的農(nóng)作物種植需求[1]。
近年來,隨著機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,部分學(xué)者已經(jīng)開始將計(jì)算機(jī)視覺技術(shù)運(yùn)用到農(nóng)作物生長狀態(tài)上。例如,孫圓龍等通過設(shè)計(jì)高效運(yùn)算網(wǎng)絡(luò)實(shí)現(xiàn)對黃瓜葉部病害的判別[2],劉慶飛等通過設(shè)計(jì)基于深度可分離卷積的網(wǎng)絡(luò)實(shí)現(xiàn)了田間自然環(huán)境下雜草和甜菜的識別[3],丁常宏等通過基于SSD-MobileNet v1的網(wǎng)絡(luò)實(shí)現(xiàn)了藥用植物的識別[4]。這些方法雖然可在一定程度上促進(jìn)機(jī)器學(xué)習(xí)在農(nóng)業(yè)智能化領(lǐng)域的研究發(fā)展,擺脫機(jī)電化設(shè)備限制,并通過計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)農(nóng)作物生長狀態(tài)的監(jiān)測,但它們目前都還聚焦于整體目標(biāo)或者大目標(biāo)的監(jiān)測上,對小目標(biāo)物體的監(jiān)測效果還無法達(dá)到非常好的水準(zhǔn)。對于小目標(biāo)物體的界定,Hariri等通過提出一個針對小目標(biāo)的數(shù)據(jù)集,對小目標(biāo)進(jìn)行界定,在同一類別中,所有目標(biāo)實(shí)例的相對面積,即邊界框面積與圖像面積之比的中位數(shù)在0.08%~0.58%之間則視為小目標(biāo),如在640像素×480像素的圖像中,16像素×16像素到42像素×42像素的目標(biāo)應(yīng)考慮為小目標(biāo)[5-6]。草莓缺鈣時,葉片會產(chǎn)生邊緣焦枯現(xiàn)象,該特征在整幅圖片中非常微小且尺度不固定,在檢測過程中很難達(dá)到非常好的識別效果。在缺鈣草莓葉片檢測研究中,多數(shù)學(xué)者采用單階段目標(biāo)檢測算法YOLO來實(shí)現(xiàn),YOLO算法具有檢測速度快、效果好等特點(diǎn),可以完成多種復(fù)雜背景下的檢測任務(wù)。YOLO算法因具有獨(dú)特的算法模塊化結(jié)構(gòu),便于研究人員進(jìn)行優(yōu)化發(fā)展,在YOLO系列中,YOLO v5因算法的穩(wěn)定性和兼容性好而受到研究人員的青睞,與YOLO v8等高版本相比,YOLO v5更加適合作為改進(jìn)的基礎(chǔ)算法。
為解決在實(shí)際農(nóng)作物培育中的小目標(biāo)物體識別難點(diǎn),以YOLO v5網(wǎng)絡(luò)為基礎(chǔ)研究一種更加適合小目標(biāo)物體的卷積神經(jīng)網(wǎng)絡(luò)模型YOLO v5-Smix,該模型使用以C2F模塊為核心的Darknet-53網(wǎng)絡(luò)進(jìn)行小目標(biāo)物體識別,并使用BiFPN特征融合網(wǎng)絡(luò)來增強(qiáng)模型對小目標(biāo)物體的泛化能力,同時通過更換上采樣方式、損失函數(shù)來增強(qiáng)模型的檢測能力與檢測速度。
1" 研究方法
1.1" 基本的YOLO v5算法
在目標(biāo)檢測算法中,YOLO v5網(wǎng)絡(luò)因具有檢測速度快、檢測效果好等優(yōu)點(diǎn),應(yīng)用范圍十分廣泛。YOLO v5的網(wǎng)絡(luò)組成包括特征提取網(wǎng)絡(luò)、特征融合和檢測頭等3個部分,具體結(jié)構(gòu)如圖1所示。
首先,將輸入進(jìn)網(wǎng)絡(luò)的圖像數(shù)據(jù)調(diào)整為網(wǎng)絡(luò)適應(yīng)的分辨率,本研究采用640像素×640像素,然后通過多層卷積和跨階段局部(CSP)殘差模塊進(jìn)入到特征金字塔(SPPF)模塊,將底層信息輸入至neck層進(jìn)行融合,Backbone部分主要包含完全邊界分離(CBS)卷積結(jié)構(gòu)和CSP殘差結(jié)構(gòu),其中CBS結(jié)構(gòu)主要由卷積層、批量歸一化(BN)層、激活函數(shù)組成,在卷起層中主要使用1×1卷積和3×3卷積完成圖像特征的提??;再由殘差模塊得到2個分支,即通過對子特征圖進(jìn)行加和得到新的特征輸出,隨著網(wǎng)絡(luò)深度的加深,模型的優(yōu)化難度增大,而殘差模塊的引入能讓深層次的網(wǎng)絡(luò)模型達(dá)到更好的訓(xùn)練效果,本研究在殘差網(wǎng)絡(luò)中提出殘差映射,替換以往的基礎(chǔ)映射殘差模塊結(jié)構(gòu),如圖2所示[7-8]。
最后,在SPPF模塊中將經(jīng)過CBS的輸入、1次池化后的結(jié)果、2次池化后的結(jié)果和3次池化后的結(jié)果進(jìn)行拼接,然后再通過CBS進(jìn)行特征提取。仔細(xì)觀察不難發(fā)現(xiàn),雖然SPPF對特征圖進(jìn)行了多次池化,但特征圖尺寸并未發(fā)生變化,通道數(shù)更不會變化,所以后續(xù)的4個輸出能夠在channel維度進(jìn)行融合。這一模塊的主要作用是對高層特征進(jìn)行提取并融合,在融合過程中筆者多次運(yùn)用最大池化盡可能多地提取高層次的語義特征[9]。SPPF模塊結(jié)構(gòu)如圖3所示。
在Neck層中,YOLO v5使用不同尺度來預(yù)測并用特征金字塔結(jié)合像素聚合網(wǎng)絡(luò)結(jié)構(gòu)對特征進(jìn)行多尺度融合。YOLO v5 Neck層原本使用的是PANet網(wǎng)絡(luò),是一種包含了自頂向下傳遞特征信息和自底向上傳遞位置信息的特征融合網(wǎng)絡(luò),該網(wǎng)絡(luò)雖然可以減輕網(wǎng)絡(luò)層次加深帶來的位置信息不明確問題,但得到的模型過于復(fù)雜且檢測效果依然不佳[10]。PANet網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
Head層中Bounding box的損失函數(shù)為CIoU,它在以往損失函數(shù)的基礎(chǔ)上將長寬比考慮進(jìn)去,使得模型的檢測更加穩(wěn)定,不容易發(fā)散。
YOLO v5原本的損失函數(shù)為完全交并比(CIoU),其公式如下:
CIoU=IoU-ρ2(b,bgt)c2-αv。
式中:ρ2(b,bgt)代表預(yù)測框和真實(shí)框的中心點(diǎn)歐氏距離;c代表能夠同時包含預(yù)測框和真實(shí)框的最小閉包區(qū)域的對角線距離。邊界框的準(zhǔn)確度一般用IoU表示,IoU等于計(jì)算的2個邊界框的交集和并集比;一般閾值設(shè)為0.5,所以一般約定,在檢測中,IoUgt;0.5,則認(rèn)為檢測正確。權(quán)重因子α和寬高比懲罰項(xiàng)v的公式如下:
α=v1-IoU+v;
v=4π2arctanwgthgt-arctanwh2。
式中:w、wgt分別為預(yù)測框、真實(shí)框?qū)挾龋籬、hgt分別為預(yù)測框、真實(shí)框高度。
基礎(chǔ)的YOLO v5模型更適合完成中、大型目標(biāo)的檢測任務(wù),但是在農(nóng)業(yè)復(fù)雜環(huán)境中,尤其是在小目標(biāo)物體形態(tài)發(fā)生較大變化的情況下,檢測效果尚未達(dá)到預(yù)期水平。為在復(fù)雜的背景中正確識別小目標(biāo)物體,需要對YOLO v5進(jìn)行進(jìn)一步改進(jìn),本研究設(shè)計(jì)一個名為YOLO v5-Smix的新型模型,它采用最新的Darknet-53網(wǎng)絡(luò)替代YOLO v5原本的CSPDarknet53主干網(wǎng)絡(luò),以解決CSPDarknet53網(wǎng)絡(luò)在提取小目標(biāo)特征方面的不足。同時,對Neck層中的特征融合部分進(jìn)行修改,引入具有雙向融合特征的網(wǎng)絡(luò)BiFPN,以實(shí)現(xiàn)目標(biāo)的多尺度特征融合。最后,對損失函數(shù)進(jìn)行更換,將原本的CIoU損失函數(shù)換成WIoU損失函數(shù)。通過以上改進(jìn)解決現(xiàn)有YOLO v5模型對復(fù)雜背景下的小目標(biāo)檢測能力不足的問題[11]。
1.2" 改進(jìn)后的YOLO v5-Simx算法
1.2.1" Backbone部分改進(jìn)
草莓在缺鈣時葉片表現(xiàn)出的癥狀屬于小目標(biāo),在進(jìn)行特征提取時,YOLO v5 原本網(wǎng)絡(luò)的下采樣方式會丟失掉部分小目標(biāo)信息。為解決小目標(biāo)物體特征信息訓(xùn)練不全面的問題,本研究改進(jìn)模型 YOLO v5-Smix 采用最新的Darknet-53網(wǎng)絡(luò)(圖5)。
Darknet-53與CSPDarknet53的主要區(qū)別在于前者用更為先進(jìn)的C2F模塊更換了C3(跨階段殘差瓶頸)模塊即圖5中的CBS模塊。C2F模塊的優(yōu)勢在于它是整合了C3模塊以及ELAN思想進(jìn)行的設(shè)計(jì),可以讓網(wǎng)絡(luò)在保證輕量化的同時,獲得更加豐富的梯度流信息,C2F模塊中的卷積核參數(shù)數(shù)量比C3模塊少,因此,C2F模塊所需要的計(jì)算資源更少,會有更快的計(jì)算速度,且C2F模塊可以適應(yīng)不
同大小的輸入,這使得C2F模塊在處理不同大小的圖像時更加靈活,對小目標(biāo)也更加敏感。C2F模塊結(jié)構(gòu)如圖6所示。
1.2.2" Neck部分改進(jìn)
在網(wǎng)絡(luò)的訓(xùn)練過程中,隨著網(wǎng)絡(luò)層次的加深,獲得的特征信息越來越高級,而層次的加深讓網(wǎng)絡(luò)無法獲得明確的位置信息,以至于使小目標(biāo)物體的位置信息損失增大。因此,在提取到缺鈣草莓葉片的特征信息后,需要對從特征提取層輸送過來的目標(biāo)特征信息進(jìn)行特征融合,以提高檢測頭Head對缺鈣葉片位置和特征信息預(yù)測的準(zhǔn)確度[12-14]。
本研究中的YOLO v5-Smix采用BiFPN網(wǎng)絡(luò)結(jié)構(gòu),刪除原本的PANet網(wǎng)絡(luò)中只有1條輸入邊的節(jié)點(diǎn),這些節(jié)點(diǎn)的刪除不僅不會對網(wǎng)絡(luò)產(chǎn)生影響,同時還能將雙向網(wǎng)絡(luò)簡化。為了能夠在不增加過多成本的情況下融合更多的目標(biāo)信息,BiFPN網(wǎng)絡(luò)在原始輸入節(jié)點(diǎn)和輸出節(jié)點(diǎn)之間添加1條額外的邊,與原本的PANet網(wǎng)絡(luò)不同,BiFPN網(wǎng)絡(luò)在處理每個雙向路徑時都作為一個特征網(wǎng)絡(luò)層,并重復(fù)同一層多次,以實(shí)現(xiàn)更高層次的特征融合[15]。BiFPN網(wǎng)絡(luò)結(jié)構(gòu)示意如圖7所示,在網(wǎng)絡(luò)中的結(jié)構(gòu)如圖8所示。
BiFPN結(jié)構(gòu)使網(wǎng)絡(luò)學(xué)習(xí)不同分辨率特征圖在特征融合中的重要程度,并反復(fù)進(jìn)行多尺度特征融合。BiFPN帶權(quán)融合公式為
O=∑iwie+∑jwj·Ii。
式中:Ii表示輸入特征;wi、wj為權(quán)值,用于度量不同分辨率特征在特征融合中的貢獻(xiàn)值;e表示數(shù)值極小的學(xué)習(xí)率,用來約束數(shù)值的振蕩;O為輸出加權(quán)特征融合的值。
BiFPN網(wǎng)絡(luò)在融合不同尺度的特征圖時,因其獨(dú)有的雙向交叉尺度融合連接結(jié)構(gòu),使得模型在訓(xùn)練時的特征融合效率有了極大的提高,可高效地融合多分辨率下缺鈣草莓葉片的目標(biāo)特征;同時運(yùn)用加權(quán)融合的方式得到處于不同尺度時輸入特征與輸出特征的貢獻(xiàn)情況,從而解決缺鈣草莓葉片尺度變換過大的問題,提高模型的檢測能力。
1.2.3" Head部分改進(jìn)
通過以上對YOLO v5網(wǎng)絡(luò)模型特征提取層Backbone骨骼模塊的更換、特征融合Neck層的優(yōu)化,理論上提高了模型對小目標(biāo)特征信息的運(yùn)用能力,再對模型損失函數(shù)進(jìn)行一系列優(yōu)化和比較試驗(yàn),可得出優(yōu)化后的小目標(biāo)檢測模型,進(jìn)一步提高模型在小目標(biāo)物體上的檢測能力。
對于目標(biāo)檢測模型,都會有3個主要的檢測任務(wù),首先需要檢測出圖像中若干目標(biāo)的位置、目標(biāo)的大小,然后再對檢測到的目標(biāo)進(jìn)行分類。在訓(xùn)練時模型檢測效果的不斷優(yōu)化需要損失函數(shù)來發(fā)揮作用[16-18]。
損失函數(shù)的發(fā)展經(jīng)歷了很長一段時間,在這段時間有無數(shù)優(yōu)秀的損失函數(shù)被學(xué)者所提出,其中包括擴(kuò)展交并比/焦點(diǎn)擴(kuò)展交并比(EIoU/Focal EIoU)、平滑交并比(SIoU)、廣義交并比(GIoU)等,本研究采用WIoU損失函數(shù)來更換CIoU函數(shù),加權(quán)交并比(WIoU)函數(shù)因具有動態(tài)非單調(diào)聚焦機(jī)制,獲得優(yōu)越的性能[19]。WIoU函數(shù)定義如下:
LWIoUv1=RWIoULIoU;
RWIoU=exp(x-xgt)2+(y-ygt)2(W2g+H2g)*
式中:Wg、Hg分別表示最小包圍框的寬和高;x、y代表中心坐標(biāo)值;gt代表真實(shí)值。為防止Rwiou產(chǎn)生,阻礙收斂的梯度,將Wg和Hg從計(jì)算圖中分離出來(上標(biāo)*表示此操作)。WIoU有效地消除了阻礙收斂的因素,沒有引入新的度量,例如縱橫比[20-21]。
將更換WIoU損失函數(shù)的YOLO v5算法分別與更換EIoU、SIoU、CIoU的算法進(jìn)行試驗(yàn)比較,結(jié)果如圖9所示。
由圖9可見,WIoU在效果上不輸CIoU等損失函數(shù),同時還具有非常可觀的收斂速度,這對模型檢測效果的提升意義巨大。
2" 圖像數(shù)據(jù)集與預(yù)處理
2.1" 試驗(yàn)數(shù)據(jù)
本研究使用的試驗(yàn)數(shù)據(jù)集來源于Mendeley數(shù)據(jù)網(wǎng)站,并從國外開源網(wǎng)站Kaggle上下載壓縮圖像數(shù)據(jù)包。數(shù)據(jù)包中包括健康的草莓葉片和出現(xiàn)缺鈣癥狀的草莓葉片圖像總計(jì)1 431張,其中出現(xiàn)缺鈣癥狀的圖像為891張,正常狀態(tài)的圖像為540張,本研究只使用出現(xiàn)缺鈣癥狀的草莓葉片圖像作為數(shù)據(jù)集,數(shù)據(jù)集樣例如圖10所示。
2.2" 數(shù)據(jù)增強(qiáng)
為提高試驗(yàn)數(shù)據(jù)集的豐富性和網(wǎng)絡(luò)識別的準(zhǔn)確性,同時防止訓(xùn)練過程中產(chǎn)生過擬合現(xiàn)象,采用多種數(shù)據(jù)增強(qiáng)方式對數(shù)據(jù)樣本進(jìn)行擴(kuò)充,以保障網(wǎng)絡(luò)模型的訓(xùn)練。具體方式為使用亮度線性變換、隨機(jī)旋轉(zhuǎn)、水平垂直翻轉(zhuǎn)、隨機(jī)裁剪等方式對原始圖像進(jìn)行數(shù)據(jù)增強(qiáng),原始圖像如圖11所示,數(shù)據(jù)增強(qiáng)后的對比結(jié)果如圖12所示。圖12中按照九宮格排序依次為原圖、線性亮度降低25%、線性亮度上升25%、隨機(jī)左旋轉(zhuǎn)、隨機(jī)右旋轉(zhuǎn)、隨機(jī)中心點(diǎn)縮放、上下翻轉(zhuǎn)、左右翻轉(zhuǎn)、隨機(jī)裁剪。最終得到缺鈣草莓葉片圖像8 000張,將8 000張圖像按照訓(xùn)練集(6 400張)、驗(yàn)證集(800張)、測試集(800張)的順序分成8 ∶1 ∶1 3個部分。
2.3" 數(shù)據(jù)標(biāo)注
為使網(wǎng)絡(luò)模型能更好地學(xué)習(xí)草莓缺鈣時葉片的特征信息,對圖像中出現(xiàn)鈣元素缺失的草莓葉片
部位進(jìn)行標(biāo)注。本研究使用標(biāo)注軟件LabelImg對圖像中的缺鈣草莓葉片進(jìn)行標(biāo)記,標(biāo)記時盡可能使邊界框最小,以減少背景對模型識別的影響。標(biāo)注效果如圖13所示。
標(biāo)注完成后,得到記錄草莓缺鈣葉片位置信息和特征信息的Label文件,將其放入標(biāo)簽文件夾中保障后續(xù)模型訓(xùn)練,Label文件記錄目標(biāo)檢測框的位
置、類別等信息。
2.4" 試驗(yàn)環(huán)境
試驗(yàn)時間為2022年6月,地點(diǎn)位于河北工業(yè)大學(xué)北辰校區(qū)電子信息學(xué)院樓,模型的訓(xùn)練在服務(wù)器主機(jī)上進(jìn)行,服務(wù)器的硬件環(huán)境配置:CPU采用英特爾處理器,具體型號為i7-11700KF,GPU采用NVIDIA GeForce RTX 3090。軟件環(huán)境使用3.8版本下Python實(shí)現(xiàn),深度學(xué)習(xí)框架使用Pytroch 1.8.0,數(shù)據(jù)集尺寸為1 024像素×768像素,試驗(yàn)相關(guān)參數(shù)設(shè)置如表1所示。
2.5" 評估指標(biāo)
為了客觀評估模型性能,本研究采用精確度、召回率、平均精度和0.5比率下的平均精度均值來評價模型的識別效果。各指標(biāo)計(jì)算公式如下:
P=TPTP+FP×100%;
R=TPTP+FN×100%;
AP=∫10PdR;
mAP=1N∑Ni=1APi。
式中:TP為正樣本被正確識別為正樣本的數(shù)量;FP為負(fù)樣本被錯誤識別為正樣本的數(shù)量;FN為正樣本被錯誤識別為負(fù)樣本的數(shù)量;N為目標(biāo)的類別數(shù);P為精確度;R為召回率;AP為平均精度;mAP為0.5比率下的平均精度均值。本研究的檢測目標(biāo)只有缺鈣草莓葉片這一個目標(biāo)類別,所以mAP數(shù)值和AP數(shù)值完全一致,mAP數(shù)值越大,網(wǎng)絡(luò)效果越好[22]。
3" 試驗(yàn)結(jié)果
3.1" YOLO v5-Smix模型訓(xùn)練結(jié)果
采用本研究中的YOLO v5-Smix對缺鈣草莓葉片進(jìn)行檢測和識別,由訓(xùn)練結(jié)果(圖14)可觀察到,YOLO v5-Smix網(wǎng)絡(luò)訓(xùn)練時的收斂速度和損失回歸曲線都比較平穩(wěn),且沒有出現(xiàn)過多的過擬合現(xiàn)象。
3.2" 不同網(wǎng)絡(luò)模型對缺鈣葉片檢測性能指標(biāo)比較
將Faster-RCNN、YOLO v3、YOLO v4、YOLO v5和本研究中改進(jìn)模型YOLO v5-Smix的精確率、召回率、0.5比率下的平均精度均值進(jìn)行對比,結(jié)果如表2所示。
由表2可見,在對草莓缺鈣部位進(jìn)行識別時,YOLO v3、YOLO v4的檢測效果相比Faster RCNN有了極大的改善,但還是略低于YOLO v5。YOLO v5-Smix 的檢測效果在YOLO v5的基礎(chǔ)上得到進(jìn)一步提高,其精確度、召回率、0.5比率下的平均精度均值和綜合評價指標(biāo)均有所提升。其中,精確度比Faster RCNN高17.2百分點(diǎn),比YOLO v3高10.7百分點(diǎn),比YOLO v4高12.4百分點(diǎn),比YOLO v5高6.9百分點(diǎn)。YOLO v5和YOLO v5-Smix的識別精度對比曲線對比圖如圖15所示。
3.3" YOLO v5-Simx消融試驗(yàn)
為驗(yàn)證改進(jìn)試驗(yàn)的有效性,采取消融試驗(yàn)的方式來進(jìn)行模型效果的對比分析,結(jié)果如表3所示。
模型1是YOLO v5網(wǎng)絡(luò)模型,模型2是更換了Darknet-53后得到的網(wǎng)絡(luò)模型,模型3是將 YOLO v5 的特征融合網(wǎng)絡(luò)替換為BiFPN得到的網(wǎng)絡(luò)模型,模型4是只更換WIoU損失函數(shù)的網(wǎng)絡(luò)模型,模型5是本研究改進(jìn)網(wǎng)絡(luò)模型YOLO v5-Smix。試驗(yàn)時,各網(wǎng)絡(luò)模型訓(xùn)練輪次、學(xué)習(xí)率等參數(shù)均相同。
由表3可見,模型2、模型3、模型4、模型5的0.5比率下的平均精度均值相較于模型1均有不同程度的提高,這說明Darknet-53網(wǎng)絡(luò)和BiFPN網(wǎng)絡(luò)的替換均可提升模型的檢測效果。損失函數(shù)的更換雖然在精確度上的提高效果不佳,但其召回率
卻得到增強(qiáng);而模型5的提高效果最明顯,其中精確度比模型1提高6.9百分點(diǎn), 召回率提升5.2百分點(diǎn),平均精度均值提高7.7百分點(diǎn)。
4" 結(jié)論
針對缺鈣草莓葉片目標(biāo)特征過小且存在尺度大小不一以及目標(biāo)易受環(huán)境背景影響等識別難題,提出一種適用于缺鈣草莓葉片的小目標(biāo)物體檢測識別模型YOLO v5-Smix,通過多種數(shù)據(jù)增強(qiáng)方式擴(kuò)充數(shù)據(jù)集,使用以C2F模塊為核心的Darknet-53網(wǎng)絡(luò)提取特征,結(jié)合BiFPN結(jié)構(gòu)進(jìn)行特征融合,更換WIoU損失函數(shù),構(gòu)建復(fù)雜環(huán)境背景下的缺鈣草莓葉片檢測模型,并采用對比試驗(yàn)和消融試驗(yàn)對模型的性能進(jìn)行評估與分析。
在缺鈣草莓葉片的檢測中,本研究構(gòu)建的YOLO v5-Smix模型識別準(zhǔn)確度為89.1%,召回率為81.0%,0.5比率下的平均精度均值為78.8%,與其他目標(biāo)檢測網(wǎng)絡(luò)模型相比,本研究優(yōu)化的YOLO v5-Smix模型具有更好的小目標(biāo)檢測效果,結(jié)果可為精準(zhǔn)農(nóng)業(yè)、智慧農(nóng)業(yè)的發(fā)展提供技術(shù)支持。
參考文獻(xiàn):
[1]成玉波,包成友,成玉富. 草莓缺素癥及其防治方法[J]. 現(xiàn)代農(nóng)業(yè)科技,2007(3):34.
[2]孫圓龍,徐曉輝,宋" 濤,等. 高效運(yùn)算網(wǎng)絡(luò)在作物葉部病害識別中的研究[J]. 中國農(nóng)機(jī)化學(xué)報,2021,42(7):156-161.
[3]劉慶飛,張宏立,王艷玲. 基于深度可分離卷積的實(shí)時農(nóng)業(yè)圖像逐像素分類研究[J]. 中國農(nóng)業(yè)科學(xué),2018,51(19):3673-3682.
[4]丁常宏,王守宇,高" 鵬. 基于SSD-MobileNet v1深度學(xué)習(xí)算法的藥用植物葉片識別方法[J]. 江蘇農(nóng)業(yè)科學(xué),2020,48(22):222-228.
[5]Hariri M,Avar E. Tipburn disorder detection in strawberry leaves using convolutional neural networks and particle swarm optimization[J]. Multimedia Tools and Applications,2022,81(8):11795-11822.
[6]林銘捷. 基于深度學(xué)習(xí)的春石斛生長狀態(tài)識別的研究[D]. 廣州:華南理工大學(xué),2021.
[7]袁" 磊,唐" 海,陳彥蓉,等. 改進(jìn)YOLO v5的復(fù)雜環(huán)境道路目標(biāo)檢測方法[J]. 計(jì)算機(jī)工程與應(yīng)用,2023,59(16):212-222.
[8]許璧麒,馬志強(qiáng),寶財吉拉呼,等. 基于YOLO v5的高速公路小目標(biāo)車輛逆行檢測模型[J]. 國外電子測量技術(shù),2022,41(11):146-153.
[9]王寅凱,曹" 磊,錢佳晨,等. 一種改進(jìn)YOLO v5的多尺度像素林火識別算法[J]. 林業(yè)工程學(xué)報,2023,8(2):159-165.
[10]張利紅,蔡敬菊. 基于輕量化YOLO v5算法的目標(biāo)檢測系統(tǒng)[J]. 計(jì)算機(jī)技術(shù)與發(fā)展,2022,32(11):134-139.
[11]楊文姬,胡文超,趙應(yīng)丁,等. 基于改進(jìn)YOLO v5植物病害檢測算法研究[J]. 中國農(nóng)機(jī)化學(xué)報,2023,44(1):108-115.
[12]朱香元,聶" 轟,周" 旭. 基于TPH-YOLO v5和小樣本學(xué)習(xí)的害蟲識別方法[J]. 計(jì)算機(jī)科學(xué),2022,49(12):257-263.
[13]劉思誠,李嘉琛,鄧" 皓,等. 基于YOLO v5改進(jìn)的小目標(biāo)檢測算法[J]. 兵工自動化,2022,41(12):78-82,94.
[14]馬宏興,張" 淼,董凱兵,等. 基于改進(jìn)YOLO v5的寧夏草原蝗蟲識別模型研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報,2022,53(11):270-279.
[15]Zhu P C,Chen B L,Liu B S,et al. Object detection for hazardous material vehicles based on improved YOLO v5 algorithm[J]. Electronics,2023,12(5):1257.
[16]Li J F,Lian X Q. Research on forest fire detection algorithm based on improved YOLO v5[J]. Machine Learning and Knowledge Extraction,2023,5(3):725-745.
[17]Jiang T Y,Li C,Yang M,et al. An improved YOLO v5s algorithm for object detection with an attention mechanism[J]. Electronics,2022,11(16):2494.
[18]周紹發(fā),肖小玲,劉忠意,等. 改進(jìn)的基于YOLO v5s蘋果樹葉病害檢測[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(13):212-220.
[19]Sun C,Zhang S W,Qu P Q,et al. MCA-YOLO v5-light:a faster,stronger and lighter algorithm for helmet-wearing detection[J]. Applied Sciences,2022,12(19):9697.
[20]Guo G G,Zhang Z Y. Road damage detection algorithm for improved YOLO v5[J]. Scientific Reports,2022,12(1):15523.
[21]Sun Z J,Yang H,Zhang Z F,et al. An improved YOLO v5-based tapping trajectory detection method for natural rubber trees[J]. Agriculture,2022,12(9):1309.
[22]豐玉華,魏" 怡,劉力手,等. 面向跌倒行人的MP-YOLO v5檢測模型[J]. 重慶郵電大學(xué)學(xué)報(自然科學(xué)版),2023,35(5):960-970.