亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        HCI-YOLO:基于改進YOLOv8的茄子果實病蟲害檢測模型

        2024-12-28 00:00:00郭臻李玥
        軟件工程 2024年12期
        關鍵詞:注意力機制圖像識別

        關鍵詞:圖像識別;輕量化網(wǎng)絡;注意力機制;多級特征融合;病蟲害檢測

        0 引言(Introduction)

        我國作為茄子最大的產(chǎn)量國,茄子的年產(chǎn)量占世界茄子年總產(chǎn)量的一半以上[1]。在現(xiàn)代農(nóng)業(yè)生產(chǎn)中,病蟲害檢測與防治趨向于規(guī)?;椭悄芑痆2],及時識別病蟲害,實現(xiàn)更高效、更主動的病蟲害管理,可以有效提高茄子果實的品質(zhì)[3]。

        近年來,以深度學習作為基礎的病蟲害目標檢測算法取得了顯著進步,根據(jù)檢測階段的不同,這些算法可以分為兩類。一類是以R-CNN(Region-Convolutional Neural Network)[4] 和Faster R-CNN(Faster Region-Convolutional Neural Network)[5]為代表的兩階段(two-stage)檢測算法。例如,劉毅君等[6]提出一種基于改進Faster R-CNN算法的馬鈴薯發(fā)芽與表面損傷檢測方法,顯著提升了檢測平均精確率。另一類是以SSD(SingleShot MultiBox Detector)[7]和YOLO(You Only Look Once)系列[8]為代表的單階段(one-stage)目標檢測算法。例如,賈雪瑩等[9]提出一種基于改進YOLOv7模型的柑橘表面缺陷檢測,在網(wǎng)絡頭部引入CT(Contextual Transformer)模塊,融合靜態(tài)和動態(tài)上下文表征特征,增強了缺陷部分特征表達能力。于春濤等[10]提出一種改進的YOLOv7模型,在網(wǎng)絡中添加CARAFE(Content-Aware ReAssembly Feature Extraction)特征上采樣算子、SE(Squeeze-and-Excitation)注意力機制模塊和WIoU位置損失函數(shù),提高了復雜農(nóng)田環(huán)境下的目標檢測性能。

        針對茄子病蟲害檢測方法的研究,目前主要集中在茄子葉片病蟲害檢測[11]領域,較少考慮在自然環(huán)境和多目標情況下,實現(xiàn)計算量小、時延低且檢測精度高的病蟲害檢測。為解決此類問題,本研究基于YOLOv8n模型,對茄子果實病害檢測方法進行改進和優(yōu)化,提出一種計算量小、檢測精確度高及檢測速度快的茄子果實病蟲害檢測模型,即HCI-YOLO。

        1 材料與方法(Materials and methods)

        1.1 數(shù)據(jù)集

        茄子果實病蟲害數(shù)據(jù)的采集來源于公開數(shù)據(jù)集和網(wǎng)絡圖片,為了豐富數(shù)據(jù)的多樣性、提高模型的泛化能力以及平衡不同病害特征樣本數(shù)量,在不同時間段的自然光照下,多角度拍攝目標及多距離拍攝目標;拍攝的圖片中不僅包括清晰的茄子果實病蟲害特征,也包含其他周圍自然環(huán)境背景;最后,剔除質(zhì)量較差和非典型病蟲害圖像,保留自然環(huán)境背景下3種茄子果實病蟲害,分別是蛀果蟲(Fruit Borer)、瓜薊馬(MelonThrips)、果腐?。‵ruit Rot),同時采集了一些健康茄子果實圖片。采集圖片如圖1所示。

        一些圖片包含多個該類病蟲害的目標以及同時存在其他類型的病蟲害,滿足多目標、多種類的檢測需求。通過平衡每個類別在數(shù)據(jù)集中的占比,防止出現(xiàn)某類別在數(shù)據(jù)集中代表性不足導致的模型通過持續(xù)預測多數(shù)類別實現(xiàn)高精度的假象。將1 369張圖片作為本研究的數(shù)據(jù)。每張圖片所含樣本數(shù)量分布以及數(shù)據(jù)集的樣本分布和劃分如圖2所示。

        使用數(shù)據(jù)增強技術擴增訓練集數(shù)據(jù)量[12],添加90°旋轉(zhuǎn)(包含順時針、逆時針及上下顛倒旋轉(zhuǎn))操作,以此增強模型對圖片方向變化的不敏感性[13]。同時,對圖片進行了提亮、變暗及曝光處理,通過增加圖片亮度的可變性,幫助模型更好地適應照明和相機設置的變化[14]。經(jīng)過這一系列數(shù)據(jù)增強操作,最終將數(shù)據(jù)集擴增至3 247張。

        1.2 YOLOv8算法

        YOLOv8是在YOLOv5的基礎上進行優(yōu)化和改進得到的[15],它可以調(diào)整不同的模型深度和模型寬度,能滿足各種場景需求。YOLOv8主要包含三大部分。一是特征提取部分(Backbone),整個部分以C2f模塊作為基本構成單元,采用了一系列卷積和反卷積層提取特征,同時使用了殘差連接和瓶頸結構以減小網(wǎng)絡的大小和提高模型的性能[16]。二是特征增強網(wǎng)絡部分(Neck),它包括了1個SPPF模塊、1個PAA模塊和2個PAN模塊,可加強網(wǎng)絡對不同縮放尺度對象的特征融合能力。三是頭部部分(Head),其核心是解耦頭(Decoupled-Head),即將原來的1個檢測頭分解成檢測頭和分類頭兩2部分,檢測頭包含一系列卷積層和反卷積層,用于產(chǎn)生檢測結果;分類頭則采用全局平均池化對每個特征圖進行分類。

        相較于上一版本的YOLOv5,YOLOv8大幅提升了模型性能,簡化了模型結構,實現(xiàn)了模型輕量化[17]。

        2 算法改進(Algorithm improvement)

        針對茄子果實病蟲害檢測中模型參數(shù)量大、自然環(huán)境下檢測精度低及多尺度目標檢測等問題,提出一種茄子果實病蟲害檢測模型HCI-YOLO,實現(xiàn)了更低的計算成本和更精確的模型表現(xiàn),其網(wǎng)絡結構圖如圖3所示。首先,提出多級特征融合金字塔(HS-FPN)結構,減少了模型參數(shù)量,解決了尺度變化時模型識別精度低的問題[18]。其次,采用CA[19]坐標注意力機制獲取全局感受野,并編碼精確的位置信息,使其在復雜環(huán)境干擾下依然能夠準確捕獲有價值的區(qū)域。最后,引入Inner-SIoU損失函數(shù),融合使用Inner-IoU[20]和SIoU;其中,采用SIoU復雜的邊界框回歸方法解決了網(wǎng)絡模型邊界框的局限性,提升了模型目標檢測任務的精確度,而Inner-IoU可以加速模型回歸,提升模型的檢測效率。

        2.1 HS-FPN網(wǎng)絡結構

        HS-FPN(High-level Screening-feature Fusion Pyramid Networks)是一種專為白細胞檢測而設計的網(wǎng)絡結構,主要用于解決白細胞數(shù)據(jù)集中的多尺度挑戰(zhàn),其網(wǎng)絡結構圖如圖4所示。通過將這一概念融入YOLOv8模型,將其應用于茄子病害數(shù)據(jù)集,成功地解決了茄子數(shù)據(jù)集中的多尺度挑戰(zhàn)以及參數(shù)量問題。HS-FPN的基本原理包括兩個關鍵部分:特征選擇模塊(Feature Selection Module)和特征融合模塊(Feature FusionModule)。特征選擇模塊首先利用通道注意力(ChannelAttention)和維度匹配(Dimension Match)機制對不同尺度的特征圖進行篩選,其次運用全局最大值池化或全局平均池化和權重運算獲取特征圖通道中的重要信息;特征融合模塊通過選擇性特征融合(Selective Feature Fusion)機制,以高級特征作為權重,過濾出低尺度特征中的重要信息。通過這兩個模塊的協(xié)同工作,有效地提高了模型的檢測精度和魯棒性。

        選擇性特征融合(SFF)機制是HS-FPN網(wǎng)絡中的一個關鍵組件,它在特征融合模塊中用高級特征作為注意力權重篩選低尺度特征,這種方法高效地融合了高級特征與低尺度特征的信息,進而提升了不同尺度下的模型檢測精確度。

        2.2 坐標注意力機制

        在自然環(huán)境中,因為病斑與周圍環(huán)境的區(qū)分度不高,所以準確定位茄子果實病蟲害是一項極具挑戰(zhàn)性的任務。針對這個問題,引入CA(Coordinate attention)坐標注意力機制,提升了模型的回歸性能,其網(wǎng)絡框架圖如圖5所示。CA通過將特征張量沿X 方向和Y 方向進行1D全局平均池化,分別過濾出垂直和水平方向的重要特征,并且保留其精確的位置信息以及長距離的相互關系。這兩個方向的特征圖轉(zhuǎn)換為對方向和位置敏感度高的注意力圖,再作用于輸入特征圖上,以突顯出可能有病害的區(qū)域。通道注意力的引入,使得模型能夠準確地定位在自然環(huán)境中的茄子果實病害位置信息,并且其輕量級和靈活性特點,使它可以輕松地集成到現(xiàn)有的移動網(wǎng)絡架構中,幾乎不會增加計算量。

        2.3Inner-SIoU損失函數(shù)

        在茄子病蟲害目標檢測任務中,果實病害特征復雜多變,而傳統(tǒng)的邊界框回歸方法具有一定的局限性。為了克服這一難題,通過引入SIoU損失函數(shù)實現(xiàn)了更快的訓練速度和更高的預測準確性。SIoU更多地考慮了邊界框的幾何特性,引入了一種更為復雜的邊界框回歸方法,打破了以往損失函數(shù)的局限性。SIoU損失函數(shù)包括角度損失∧(Angle cost)、距離損失△(Distance cost)、形狀損失Ω(Shape cost)及IoU 損失(IoUcost)4個部分,具體如公式(3)所示。此外,在SIOU的基礎上融合Inner-IOU理念,這一融合策略能夠捕捉到以往在固定邊框大小時難以回歸的精確位置,進一步打破邊界框回歸的局限性。Inner-IOU 首先計算出具有自身特性且不同于傳統(tǒng)IoU的IoUInner,具體如式(4)所示,其次通過公式(5)融合SIoU,計算出最終的損失函數(shù)LInner-SIoU。

        3 實驗與分析(Experiment and analysis)

        3.1 實驗環(huán)境和參數(shù)配置

        實驗使用Windows 10操作系統(tǒng),具體軟硬件配置和參數(shù)配置如表1所示。

        3.2 評價指標

        實驗使用精確度(Precision)、召回率(Recall)和平均精度均值(mean Average Precision, mAP)對模型的性能進行評價[21]。精確度衡量了模型在識別為正類的樣本中有多少是真正的正類樣本,精確度計算如公式(6)所示。召回率衡量了模型在所有真正的正類樣本中有多少被正確地識別,召回率計算如公式(7)所示。平均精度均值是目標檢測任務中常用的綜合評價指標,結合了不同類別的平均精度衡量模型的整體性能。mAP@0.5衡量了模型在預測的邊界框與真實邊界框之間IoU 大于等于0.5時的平均精度。mAP@0.5~0.95考慮了從IoU 閾值0.5到0.95的范圍內(nèi)的mAP,該范圍覆蓋了一系列的IoU 閾值,例如0.5、0.55、0.6、…、0.95,每個閾值都對應不同的交并比,從較寬松到較嚴格。計算mAP@0.5~0.95可以更全面地評估模型對于不同交并比的檢測精度。

        3.3 消融實驗

        為驗證本文提出的算法中各個改進模塊的有效性,以原始的YOLOv8為基線模型,并以精確度、召回率、mAP@0.5、mAP@0.5~0.95、幀率FPS、浮點計算數(shù)、參數(shù)量、模型大小作為評價指標,通過多個改進模塊的不同組合方式進行消融實驗,結果如表2和表3所示。

        從綜合表2和表3中的結果可以看出,單獨使用HS-FPN結構改進了YOLOv8的neck部分后,模型參數(shù)量和計算量分別降低了36.67百分點和14.81百分點,召回率上升了1.3百分點,mAP@0.5、mAP@0.5~0.95分別降低了1.1百分點和0.4百分點,HS-FPN結構顯著地降低了模型的參數(shù)量和計算量,并且模型在召回率上升的同時仍然維持了較高的精度,說明HS-FPN結構可以有效地應對多尺度問題。單獨使用CA坐標注意力機制改進backbone部分后,模型的召回率提升了5.5百分點,精確度降低了2.4百分點,說明CA坐標注意力機制與位置信息的結合可以準確定位出病害的位置。單獨使用Inner-SIoU損失函數(shù)改進原CIoU損失函數(shù),其精度與召回率分別提升了1.2百分點和0.7百分點,說明更為復雜的邊界框回歸方法與輔助邊框結合有效地提升了模型的精度。由于CA注意力機制的輕量級和靈活性,在改進HS-FPN結構的基礎上添加CA坐標注意力機制,能夠使模型在其參數(shù)量、浮點計算數(shù)和權重文件幾乎不變的情況下,性能得到進一步提升,模型的召回率、mAP@0.5和mAP@0.5~0.95分別提高了2.4百分點、1.8百分點和0.1百分點。在此基礎上繼續(xù)添加Inner-SIoU損失函數(shù)后,精確度、召回率、mAP@0.5及mAP@0.5~0.95分別提高了2百分點、1.2百分點、0.9百分點和0.7百分點。

        綜上,研究所改進后的YOLOv8模型相比于基線網(wǎng)絡模型,雖然幀率有小幅度降低,但是仍能滿足實時檢測需求,精確度、召回率、mAP@0.5和mAP@0.5~0.95分別提高了1.5百分點、4.3百分點、2.1百分點和0.9百分點,浮點計算數(shù)、參數(shù)量和模型大小分別下降了14.8百分點、34.5百分點和33.4百分點,表明本文提出的改進算法的有效性。

        對比圖6所示的混淆矩陣可以清晰地觀察到,相較于基準模型YOLOv8n,HCI-YOLO在茄子果實病害檢測任務上展現(xiàn)出了更優(yōu)越的性能。HCI-YOLO減少了將病害特征識別為背景的情況,顯著地提高了改進模型在自然環(huán)境下的抗干擾能力與對多尺度遮擋目標的檢測能力。

        為進一步證明改進的YOLOv8n在自然環(huán)境下抗干擾能力和模型精度的提升,用XGrad-CAM 類激活熱力圖對兩個模型進行可視化分析,結果如圖7所示。從圖7中可看出,改進模型對病害特征預測輸出的權重更高,對區(qū)分度不高的病害也給予了更多的關注,并且對周圍環(huán)境關注度更低,最大限度地避免了漏檢情況。

        3.4 不同算法對比實驗分析

        將HCI-YOLO與其他算法進行對比分析,具體試驗結果如表4所示。

        在對比實驗中,我們以YOLOv8n作為基線模型,深入分析了多種目標檢測算法的性能。與two-stage的目標檢測算法Faster-RCNN相比,其具有較多的浮點計算量和參數(shù)量,導致生成的模型較大,因此two-stage的目標檢測算法不適合實時監(jiān)測任務對輕量化網(wǎng)絡的要求。在YOLO 家族的熱門模型中,與YOLOv5n相比,YOLOv8n的精確度、mAP@0.5和召回率分別提升了1.2百分點、2.3百分點和0.1百分點;與YOLO7-tiny相比,YOLOv8n的精確度和mAP@0.5分別提升了2.5百分點和1.2百分點,模型參數(shù)量及計算量更低。進一步對比基于MobileNetV3[22]和ShuffleNetV2[23]的改進YOLOv8n網(wǎng)絡,其中YOLOv8-MobileNetV3的精度、召回率和mAP@0.5雖然分別提高了0.1百分點、2.6百分點和0.4百分點,略優(yōu)于YOLOv8n,但是其參數(shù)量與模型的計算量更高;YOLOv8-ShuffleNetV2在參數(shù)量和模型大小方面有優(yōu)勢,但相比于基線模型YOLOv8n,其精度、召回率和mAP@0.5分別下降了1.1百分點、0.4百分點和3.5百分點。與原始的YOLOv8n相比,本文提出的YOLOv8n模型在保持高精度檢測的同時,實現(xiàn)了更小的參數(shù)量和模型權重文件。具體來說,HCI-YOLO的參數(shù)量及模型權重文件更小,并且精確度等均優(yōu)于原始YOLOv8n算法。

        4 結論(Conclusion)

        本文探索了YOLOv8n算法在茄子果實病蟲害檢測領域的優(yōu)化路徑,并提出了一種改進方案。在YOLOv8n模型的基礎上將特征增強部分替換為HSFPN結構,減少了模型參數(shù),提升了網(wǎng)絡模型在尺度變化時的檢測精度;在主干特征提取網(wǎng)絡中加入CA坐標注意力機制,該機制能準確定位出有價值的對象位置,有效地提升了模型性能;引入Inner-SIOU損失函數(shù)替代原始YOLOv8n模型的損失函數(shù),有利于模型收斂,提高了模型的檢測精度。

        改進的YOLOv8算法與目前主流目標檢測算法YOLOv5n、YOLOv7-tiny、YOLOv8、Faster-RCNN 相比,平均精度均值mAP@0.5分別提高了4.4百分點、3.3百分點、2.1百分點、4百分點。多種可視化分析結果表明,改進的YOLOv8網(wǎng)絡能夠為茄子果實病蟲害的檢測與識別提供新的思路和方法。

        研究解決茄子果實病蟲害的檢測問題,對于提升茄子作物的品質(zhì)至關重要,相較于傳統(tǒng)的人工檢測方式,該技術能夠在更短的時間內(nèi)以更高的精度和更低的成本完成檢測任務,標志著農(nóng)業(yè)智能化進程的一大進步。未來的研究應聚焦于在更多樣化的天氣、光照和作物條件下對模型進行訓練。此外,隨著其他病蟲害檢測算法的出現(xiàn),模型的輕量化也成為未來研究的重要方向。

        猜你喜歡
        注意力機制圖像識別
        基于Resnet-50的貓狗圖像識別
        電子制作(2019年16期)2019-09-27 09:34:50
        高速公路圖像識別技術應用探討
        面向短文本的網(wǎng)絡輿情話題
        基于自注意力與動態(tài)路由的文本建模方法
        軟件導刊(2019年1期)2019-06-07 15:08:13
        基于深度學習的問題回答技術研究
        圖像識別在物聯(lián)網(wǎng)上的應用
        電子制作(2018年19期)2018-11-14 02:37:04
        圖像識別在水質(zhì)檢測中的應用
        電子制作(2018年14期)2018-08-21 01:38:16
        基于LSTM?Attention神經(jīng)網(wǎng)絡的文本特征提取方法
        基于注意力機制的雙向LSTM模型在中文商品評論情感分類中的研究
        軟件工程(2017年11期)2018-01-05 08:06:09
        InsunKBQA:一個基于知識庫的問答系統(tǒng)
        亚洲国产中文字幕九色| 国内精品久久久久久久影视麻豆| 婷婷亚洲国产成人精品性色 | 女人扒开下面无遮挡| 特黄做受又粗又长又大又硬| 成人网站免费大全日韩国产| 国产成人av在线影院无毒| 激情偷拍视频一区二区| 日韩免费视频| 97久久综合区小说区图片区| 欧美v亚洲v日韩v最新在线| 亚洲天天综合色制服丝袜在线| 白白色发布视频在线播放 | 女人下面毛多水多视频| 国产无套视频在线观看香蕉| 日韩精品有码中文字幕| 亚洲成人精品在线一区二区| 无码人妻一区二区三区兔费| 久久综合九色综合欧美狠狠| 亚洲春色AV无码专区在线播放| 天天综合色中文字幕在线视频| 亚洲av无码乱码国产麻豆 | 中文字幕日韩熟女av| 日韩精品一区二区三区乱码| 久久成人国产精品免费软件| 国产一级毛片卡| 久久精品亚洲熟女九色| 日韩综合无码一区二区| 特黄a级毛片免费视频| 亚洲第一看片| 午夜在线观看一区二区三区四区| 大尺度免费观看av网站| 97伦伦午夜电影理伦片| 欧美自拍丝袜亚洲| 亚洲国产精品成人av| 久久精品国产亚洲超碰av| 亚洲av综合av国产av| 污污污国产免费网站| 亚洲天堂av在线免费播放| 人妻免费一区二区三区免费| 真多人做人爱视频高清免费|