亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)YOLOv8n模型的多品種葡萄簇檢測(cè)方法

        2024-12-31 00:00:00張傳棟亓璐丁華立
        關(guān)鍵詞:注意力機(jī)制目標(biāo)檢測(cè)

        摘要:葡萄簇目標(biāo)的精準(zhǔn)檢測(cè)是實(shí)現(xiàn)估產(chǎn)、采摘等作業(yè)的前提,現(xiàn)有方法難以實(shí)現(xiàn)多品種葡萄簇的輕量化精準(zhǔn)檢測(cè)。為提高復(fù)雜自然場(chǎng)景下多品種葡萄簇檢測(cè)準(zhǔn)確性、魯棒性與泛化性,提出一種基于改進(jìn)YOLOv8n模型的多品種葡萄簇檢測(cè)模型ESIC-YOLOv8n,該模型在YOLOv8n的Backbone和Neck網(wǎng)絡(luò)中分別添加EMA和SA注意力模塊,以加強(qiáng)網(wǎng)絡(luò)的特征提取和多尺度特征融合能力,降低因遮擋或重疊對(duì)葡萄簇檢測(cè)的干擾,提高檢測(cè)精度和召回率;在Head把CIoU替換成Inner-CIoU,利用輔助框提高重疊目標(biāo)檢測(cè)的準(zhǔn)確性,從而提升模型整體的檢測(cè)準(zhǔn)確性和泛化性。ESIC-YOLOv8n模型的檢測(cè)精度為87.00%,召回率為81.60%,mAP為88.90%,F(xiàn)1值為84.21%,較原YOLOv8n模型分別提高1.05%、2.90%、1.48%和2.00%。結(jié)果表明,ESIC-YOLOv8n模型具有準(zhǔn)確率高、泛化性好、輕量化等優(yōu)點(diǎn),可為葡萄產(chǎn)量估計(jì)、采摘等研究提供技術(shù)支持。

        關(guān)鍵詞:葡萄簇檢測(cè);目標(biāo)檢測(cè);YOLOv8n;注意力機(jī)制

        中圖分類(lèi)號(hào):TP391.41; S225" " " 文獻(xiàn)標(biāo)識(shí)碼:A" " " 文章編號(hào):2095?5553 (2024) 09?0220?07

        Detection method of multi variety grape cluster based on improved YOLOv8n

        deep learning algorithm

        Zhang Chuandong, Qi Lu, Ding Huali

        (School of Mathematics and Computer Application Technology, Jining University, Qufu, 273100, China)

        Abstract: The precise detection of grape clusters is a prerequisite for achieving yield estimation, picking and other operations, but existing methods are still difficult to achieve lightweight and accurate detection of multi?variety grape clusters. To enhance the accuracy, robustness, and generalization of multi?variety grape cluster detection in complex natural scenes, a model named ESIC-YOLOv8n is proposed based on the improved YOLOv8n model. In this model, EMA and SA attention modules are respectively added to the Backbone and Neck networks of YOLOv8n to strengthen the network's feature extraction and multi?scale feature fusion capabilities, meanwhile, to reduce the interference from occlusion or overlap in grape cluster detection and to improve the detection accuracy and recall. In addition, by replacing CIoU with Inner CIoU in the head and using auxiliary boxes to improve the accuracy of overlapping object detection, the overall detection accuracy and generalization of the model was enhanced. As a result, the ESIC-YOLOv8n model achieves a detection accuracy of 87.00%, a recall rate of 81.60%, mAP of 88.90%, and F1 score of 84.21%, representing improvements of 1.05%, 2.90%, 1.48% and 2.00%, respectively, compared to the original YOLOv8n model. The results indicate that the ESIC-YOLOv8n model possesses high accuracy, good generalization, and lightweight characteristics, providing technical support for research on grape yield estimation and harvesting.

        Keywords: grape cluster detection; object detection; YOLOv8n; attention mechanism

        0 引言

        葡萄產(chǎn)量估計(jì)是規(guī)?;咸逊N植企業(yè)科學(xué)管理和調(diào)度的關(guān)鍵[1],傳統(tǒng)依靠經(jīng)驗(yàn)的估產(chǎn)方法準(zhǔn)確率較低,無(wú)法作為規(guī)模化葡萄種植企業(yè)科學(xué)管理的依據(jù)。目前,智能化估產(chǎn)技術(shù)代替?zhèn)鹘y(tǒng)的經(jīng)驗(yàn)估產(chǎn)是當(dāng)前種植企業(yè)科學(xué)管理的趨勢(shì),實(shí)現(xiàn)葡萄簇的智能檢測(cè)是準(zhǔn)確估產(chǎn)的關(guān)鍵,對(duì)于提高估產(chǎn)效率和準(zhǔn)確率具有重要意義。

        近年來(lái),由于深度學(xué)習(xí)具有特征提取能力強(qiáng),泛化性好等特點(diǎn),已被廣泛應(yīng)用于葡萄簇目標(biāo)識(shí)別研究領(lǐng)域。Aguiar等[2]在預(yù)先訓(xùn)練的SSD MobileNet-V1模型上進(jìn)行微調(diào),對(duì)圖像中不同生長(zhǎng)階段的葡萄簇進(jìn)行目標(biāo)檢測(cè),其mAP值為66.96%。Ghiani等[3]提出了一種基于Mask R-CNN框架的葡萄簇檢測(cè)方法,其mAP值為91.00%。Li等[4]提出了一種高效的葡萄檢測(cè)模型YOLO grape,結(jié)果表明,YOLO grape的F1得分為90.47%,mAP為91.08%,檢測(cè)速度為81 fps,解決了由于復(fù)雜的生長(zhǎng)環(huán)境、樹(shù)枝和樹(shù)葉的陰影以及葡萄的重疊而導(dǎo)致的無(wú)法識(shí)別或識(shí)別精度下降的問(wèn)題。Wang等[5]用SwinGD對(duì)紅、綠葡萄簇進(jìn)行檢測(cè),獲得了紅葡萄簇94%的mAP值,綠葡萄簇mAP值較低。Wei等[6]為了提高青葡萄簇的檢測(cè)精度,提出了一種基于改進(jìn)YOLOv3的成熟期葡萄檢測(cè)模型S-MGDM,AP值為96.73%和F1值為91.00%。李國(guó)進(jìn)等[7]為提高田間葡萄圖像中小目標(biāo)葡萄檢測(cè)的速度和精度,提出了一種基于輕量級(jí)網(wǎng)絡(luò)的釀酒葡萄檢測(cè)模型WGDM,在公開(kāi)的釀酒葡萄圖像數(shù)據(jù)集WGISD測(cè)試集上的平均精度為81.20%,F(xiàn)1分?jǐn)?shù)為85.63%。Lu等[8]提出了Swin-T-YOLOv5模型用于葡萄簇檢測(cè),精度為97.90%,召回率為94.70%,mAP為97.40%,F(xiàn)1得分為96.0%,但未成熟青色葡萄的檢測(cè)結(jié)果低于成熟葡萄的檢測(cè)結(jié)果,其mAP為90.31%,F(xiàn)1得分為82.00%。Zhao等[9]為減少葡萄簇檢測(cè)模型的參數(shù),提出了一種輕量級(jí)端到端模型YOLO-GP,mAP為93.27%,參數(shù)數(shù)量減少了10.00%以上。為了解決密集葡萄果實(shí)因?yàn)檎趽鯇?dǎo)致難以識(shí)別的問(wèn)題,Liu等[10]提出了一種葡萄檢測(cè)模型YOLOX-RA,mAP值為88.75%,檢測(cè)速度為84.88 fps,模型大小為17.53 MB。上述葡萄簇目標(biāo)檢測(cè)研究已經(jīng)取得較好的成果,但其準(zhǔn)確性與泛化性尚需提高。

        葡萄簇由小目標(biāo)漿果聚集組成,多個(gè)品種的葡萄簇之間在形狀、顏色、大小和致密度等方面有巨大差異[11],其生長(zhǎng)密集,復(fù)雜場(chǎng)景下容易受到遮擋、重疊、與背景顏色一致等因素的影響,葡萄簇準(zhǔn)確檢測(cè)相對(duì)蘋(píng)果[12]、平菇[13]等農(nóng)作物果實(shí)檢測(cè)更具有挑戰(zhàn)性。為了提高葡萄簇檢測(cè)網(wǎng)絡(luò)的精度,則不斷增加網(wǎng)絡(luò)深度和寬度,這不利于網(wǎng)絡(luò)模型在移動(dòng)終端的部署。宋懷波等[14]提出了一種基于YOLOv4-SENL模型的蘋(píng)果幼果目標(biāo)檢測(cè)方法,在網(wǎng)絡(luò)模型中引入注意力機(jī)制,在不明顯加深網(wǎng)絡(luò)結(jié)構(gòu)的前提下加強(qiáng)網(wǎng)絡(luò)性能,為本研究提供了思路。針對(duì)多品種葡萄簇檢測(cè)準(zhǔn)確性和泛化性不高的問(wèn)題,本研究改進(jìn)YOLOv8n模型,在YOLOv8n的Backbone和Neck中分別添加Efficient Multi?Scale Attention (EMA)和Shuffle Attention (SA)注意力模塊,以加強(qiáng)網(wǎng)絡(luò)的特征提取和多尺度特征融合能力,把CIoU替換成Inner-CIoU,利用輔助框提高重疊目標(biāo)檢測(cè)的準(zhǔn)確性,從而提升模型整體的檢測(cè)準(zhǔn)確性和泛化性。

        1 試驗(yàn)數(shù)據(jù)

        1.1 WGISD數(shù)據(jù)集

        本研究采用的數(shù)據(jù)集來(lái)源于Santos等[11]公開(kāi)的釀酒葡萄實(shí)例分割數(shù)據(jù)集WGISD(Wine Grape Instance Segmentation Dataset),包含300幅采集自巴西圣保羅的瓜斯帕里酒莊的葡萄園的葡萄簇圖像,分別采用佳能EOS REBEL T3i數(shù)碼單反相機(jī)和摩托羅拉Z2 Play智能手機(jī)拍攝,攝像機(jī)位于葡萄藤線(xiàn)之間,面向葡萄藤,距離約1~2 m。REBEL相機(jī)拍攝240幅圖像,包括所有西拉照片,Z2 Play智能手機(jī)拍攝60幅圖像。將REBEL圖像縮放到2 048像素×1 365像素,將Z2 Play所拍攝圖像縮放到2 048像素×1 536像素,使用LabelImg工具進(jìn)行標(biāo)注,形成包含4 432個(gè)矩形邊界框的標(biāo)注文件。

        WGISD數(shù)據(jù)集有霞多麗、品麗珠、赤霞珠、長(zhǎng)相思和西拉5個(gè)在形狀、顏色和緊湊度等方面有明顯差異的葡萄品種,有利于檢測(cè)模型的泛化性研究,部分圖像如圖1所示。WGISD數(shù)據(jù)集信息如表1所示。

        1.2 本地?cái)?shù)據(jù)集

        本地葡萄數(shù)據(jù)集圖像包含50幅巨峰葡萄圖像,采集自中國(guó)山東省曲阜市的一個(gè)葡萄果園,采用OPPO (Find X2 Pro)智能相機(jī)采集,分辨率為3 840像素×2 160像素,采集時(shí)間為2022年9月17日,天氣晴朗,用以驗(yàn)證所提網(wǎng)絡(luò)的泛化性。

        2 研究方法

        2.1 YOLOv8n網(wǎng)絡(luò)

        YOLOv8網(wǎng)絡(luò)是一種快速的單階段目標(biāo)檢測(cè)方法,在YOLOv5的基礎(chǔ)上引入并改進(jìn)了其他YOLO版本的SOTA 技術(shù)而成,進(jìn)一步提高了性能和靈活性,其結(jié)構(gòu)與YOLOv5相似,包括主干(Backbone)、頸部(Neck)和檢測(cè)頭(Head)三個(gè)主要部分。Backbone網(wǎng)絡(luò)和Neck網(wǎng)絡(luò)構(gòu)成了YOLOv8的中心結(jié)構(gòu),Backbone網(wǎng)絡(luò)進(jìn)行特征提取,Neck網(wǎng)絡(luò)進(jìn)行特征融合,Head進(jìn)行結(jié)果預(yù)測(cè),被廣泛用于目標(biāo)檢測(cè)、實(shí)例分割、圖像分類(lèi)等計(jì)算機(jī)視覺(jué)任務(wù)當(dāng)中。YOLOv8有5個(gè)模型,其中YOLOv8n網(wǎng)絡(luò)深度和特征圖較小,體積更小,檢測(cè)速度更快,可在保證檢測(cè)精度的同時(shí)達(dá)到更快的檢測(cè)速度,因此,本研究?jī)?yōu)選使用YOLOv8n開(kāi)展研究并對(duì)其進(jìn)行改進(jìn)。

        2.2 改進(jìn)YOLOv8n網(wǎng)絡(luò)

        葡萄簇漿果微小,生長(zhǎng)環(huán)境復(fù)雜,葡萄簇檢測(cè)容易受到遮擋、重疊和近背景色等因素的干擾,為提高Backbone網(wǎng)絡(luò)和Neck網(wǎng)絡(luò)的特征提取和融合能力,本研究提出ESIC-YOLOv8n模型,其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

        在YOLOv8n模型的Backbone網(wǎng)絡(luò)和Neck網(wǎng)絡(luò)分別添加EMA和SA注意力模型,通過(guò)通道空間并行的結(jié)構(gòu),使模型更加聚焦于不同維度的特征,從而獲取更豐富更全面的葡萄簇有效特征,增強(qiáng)網(wǎng)絡(luò)特征提取和多尺度特征融合能力,從而提高模型檢測(cè)的準(zhǔn)確性。在Head部分使用Inner-CIoU代替原網(wǎng)絡(luò)的CIoU作為損失函數(shù),使網(wǎng)絡(luò)關(guān)注邊界框的核心部分,利用輔助框的尺度調(diào)整提高目標(biāo)檢測(cè)任務(wù)的精確度和效率。

        2.2.1 EMA注意力機(jī)制

        EMA注意力[15]是一種使用分組結(jié)構(gòu)無(wú)需降維的高效多尺度注意力機(jī)制,為了保留每個(gè)通道的信息并減少計(jì)算開(kāi)銷(xiāo),EMA注意力設(shè)計(jì)了一個(gè)用于建立短期和長(zhǎng)期依賴(lài)關(guān)系的多尺度并行子網(wǎng)絡(luò),將通道維度分組為多個(gè)子特征,在沒(méi)有通道降維的情況下在每個(gè)并行子網(wǎng)絡(luò)中建立局部跨通道交互,通過(guò)跨空間學(xué)習(xí)方法融合兩個(gè)并行子網(wǎng)絡(luò)的輸出特征圖,以學(xué)習(xí)不同的語(yǔ)義,實(shí)現(xiàn)更豐富的特征聚合。EMA注意力機(jī)制結(jié)構(gòu)如圖3所示。

        EMA注意力使用并行子結(jié)構(gòu),可在多個(gè)處理器之間有效地并行化處理,提高了特征提取的效率,同時(shí)保持了小深度和低延遲。對(duì)于任何給定的輸入特征圖[X∈RC×H×W],EMA在通道維度方向上將X劃分為G個(gè)子特征[X=X0,X1,…,XG-1],[X∈RC//G×H×W],取[G?C],使用學(xué)習(xí)的注意力權(quán)重用于增強(qiáng)每個(gè)子特征中的感興趣區(qū)域的特征表示。由圖3可知,EMA注意力機(jī)制用3條并行路線(xiàn)來(lái)提取分組特征圖的注意力權(quán)重,其中兩條并行路由位于1×1分支中,第三條路由位于3×3分支中。在1×1分支中,有兩個(gè)1D全局平均池化操作分別沿著兩個(gè)空間方向?qū)π诺肋M(jìn)行編碼,在3×3分支中僅堆疊單個(gè)3×3內(nèi)核用于捕獲多尺度特征表示,通過(guò)跨空間信息聚合方法把三條路線(xiàn)的輸出特征計(jì)算為兩個(gè)空間注意力權(quán)重值的總和,由 Sigmoid激活函數(shù)突出顯示所有像素的全局上下文像素,最終的輸出與輸入特征圖[X∈RC//G×H×W]的維度大小相同。

        EMA注意力機(jī)制對(duì)長(zhǎng)程依賴(lài)關(guān)系進(jìn)行建模,在信道中保存精確的空間結(jié)構(gòu)信息,實(shí)現(xiàn)了不同的跨通道交互特征,擴(kuò)大了特征空間,加快了響應(yīng)速度,適合葡萄漿果這種小目標(biāo)識(shí)別,把EMA注意力放在YOLOv8網(wǎng)絡(luò)Backbone結(jié)構(gòu)中,有利于提升網(wǎng)絡(luò)對(duì)葡萄簇目標(biāo)的特征提取能力。

        2.2.2 SA注意力機(jī)制

        SA注意力機(jī)制和EMA注意力機(jī)制一樣,都是使用并行子結(jié)構(gòu)融合空間和通道特征信息的多尺度注意力機(jī)制,把SA注意力機(jī)制放入YOLOv8n的Neck結(jié)構(gòu)中,可以增強(qiáng)網(wǎng)絡(luò)多尺度特征融合能力,提升檢測(cè)目標(biāo)的特征信息表示,提高檢測(cè)網(wǎng)絡(luò)的精度。

        2.2.3 Inner-IoU

        Inner-IoU是一種基于輔助邊框的邊框回歸損失,使用尺度因子ratio控制生成不同尺度的輔助邊框用于計(jì)算損失,在模型訓(xùn)練過(guò)程中,使用較小尺度的輔助邊框計(jì)算IoU損失將有助于高IoU樣本回歸,達(dá)到加速收斂的效果。使用較大尺度的輔助邊框計(jì)算IoU損失能夠加速低IoU樣本回歸過(guò)程。與傳統(tǒng)的IoU計(jì)算方法不同,Inner-IoU專(zhuān)注于邊界框內(nèi)部的重疊部分,改進(jìn)目標(biāo)檢測(cè)中邊界框回歸的準(zhǔn)確性,特別是在處理高度重疊的目標(biāo)時(shí)。將Inner-IoU應(yīng)用至現(xiàn)有基于IoU的邊框回歸損失函數(shù)中達(dá)到SOTA,如Inner-CIoU、Inner-DIoU、Inner-EIoU等。本研究使用Inner-CIoU作為損失函數(shù),能夠提高被遮擋或重疊葡萄簇目標(biāo)等檢測(cè)的準(zhǔn)確性和效率。Inner-CIoU計(jì)算如式(5)所示。

        3 試驗(yàn)與分析

        3.1 試驗(yàn)平臺(tái)

        試驗(yàn)使用的機(jī)器配置是AMD Ryzen 7-5800H CPU,32 GB RAM,8 GB Nvidia GeForce RTX 3070 GPU。在Win10操作系統(tǒng)下搭建PyTorch深度學(xué)習(xí)框架,Cuda 11.6,PyTorch 1.12.0,采用Python 3.8編程。

        3.2 評(píng)價(jià)指標(biāo)

        3.3 模型訓(xùn)練

        訓(xùn)練過(guò)程中,設(shè)置圖像輸入尺寸為640像素×640像素,批量大小設(shè)置為2,使用隨機(jī)梯度下降(Stochastic Gradient Descend,SGD)作為優(yōu)化器,初始學(xué)習(xí)率設(shè)置為0.01,動(dòng)量設(shè)置為0.937,權(quán)重衰退系數(shù)設(shè)為0.000 5,IoU閾值IoU-thres為0.5,置信度閾值Conf-thres為0.001,訓(xùn)練輪數(shù)設(shè)置為300 輪,Inner-CIoU尺度因子ratio設(shè)置為0.75。

        改進(jìn)的ESIC-YOLOv8n模型訓(xùn)練損失圖5所示,損失值在訓(xùn)練前70個(gè)Epoch中迅速下降,訓(xùn)練曲線(xiàn)收斂速度較快,在這期間,精度迅速提高,表明模型學(xué)習(xí)效率較高。在經(jīng)歷300個(gè)Epoch之后,損失值不再減小,精度也不再上升,表示模型達(dá)到收斂狀態(tài)。

        4 結(jié)果與分析

        4.1 檢測(cè)模型結(jié)果對(duì)比

        為了驗(yàn)證所提方法對(duì)葡萄簇檢測(cè)的有效性,將改進(jìn)的ESIC-YOLOv8n模型與YOLOv8n原模型在相同條件進(jìn)行試驗(yàn)對(duì)比,試驗(yàn)結(jié)果如表2所示。相對(duì)于YOLOv8n模型,ESIC-YOLOv8n模型在P、R、mAP和F1值等指標(biāo)方面均有明顯提升,分別提升1.05%、2.90%、1.48%和2.00%,模型權(quán)重僅增加0.91 MB。用改進(jìn)前后的YOLOv8n網(wǎng)絡(luò)對(duì)測(cè)試集中的5個(gè)葡萄品種圖像進(jìn)行檢測(cè),檢測(cè)效果如圖6所示。由圖6可知,當(dāng)葡萄簇存在被枝干、葉片遮擋或重疊情況時(shí),ESIC-YOLOv8n模型的檢測(cè)效果明顯高于YOLOv8n模型,圖6(a)~圖6(e)中YOLOv8n網(wǎng)絡(luò)均有多處誤檢(圖中紅色箭頭處)和漏檢(圖中紫色箭頭處)情況,ESIC-YOLOv8n模型則能正確檢測(cè)出上述葡萄簇目標(biāo)。綜上所述,本研究提出的方法在葡萄簇目標(biāo)檢測(cè)時(shí)具有更高的檢測(cè)置信度,能減少遮擋或重疊造成的誤檢和漏檢情況,提高葡萄簇目標(biāo)的檢測(cè)性能。

        4.2 消融試驗(yàn)

        本研究在YOLOv8n模型的基礎(chǔ)上,分別在Backbone和Neck結(jié)構(gòu)中添加EMA和SA注意力模塊,提高網(wǎng)絡(luò)的特征提取能力和多尺度特征融合能力,加強(qiáng)模型對(duì)被遮擋葡萄簇和重疊葡萄簇的特征信息表示;在預(yù)測(cè)層使用Inner-CIoU作為損失函數(shù),以加速收斂的效果,提高網(wǎng)絡(luò)的準(zhǔn)確性、魯棒性和泛化性。為驗(yàn)證各種改進(jìn)的有效性,依次對(duì)ESIC-YOLOv8n網(wǎng)絡(luò)進(jìn)行縮減,分別在測(cè)試集上進(jìn)行消融試驗(yàn),表3為消融試驗(yàn)結(jié)果。

        從表3可知,在YOLOv8n模型中單獨(dú)添加SA注意力模塊或改變損失函數(shù)后雖然精度有所下降,但R值和F1值都有所提高。同時(shí)把EMA和SA注意力分別添加在YOLOv8n模型的Backbone和Neck結(jié)構(gòu)中時(shí),P、R、mAP和F1值分別提升2.56%、1.01%、1.14%和1.74%。在此基礎(chǔ)上修改損失函數(shù)為Inner-CIoU時(shí),R、mAP和F1值又分別增加1.87%、0.34%和0.25%,精度略有降低。相對(duì)于YOLOv8n模型,ESIC-YOLOv8n模型在P、R、mAP和F1值等指標(biāo)方面分別提升1.05%、2.90%、1.48%和2.00%??梢?jiàn),本研究所提的方法可以有效減少誤檢和漏檢情況,提高網(wǎng)絡(luò)的魯棒性。

        4.3 不同檢測(cè)模型性能對(duì)比

        為進(jìn)一步分析驗(yàn)證本研究所提方法的有效性,將其與YOLOv5s、YOLOv6n、YOLOv7-tiny和WGDM進(jìn)行了對(duì)比,不同檢測(cè)模型性能對(duì)比如表4所示,檢測(cè)效果對(duì)比如圖7所示。

        由表4可知,ESIC-YOLOv8n模型的精度僅低于YOLOv5s模型1.81%,F(xiàn)1值僅低于WGDM模型1.66%,但模型權(quán)重(Weights)比YOLOv5s和WGDM模型小50.63%和83.84%,可見(jiàn),ESIC-YOLOv8n模型具有明顯的輕量化優(yōu)勢(shì),易于在移動(dòng)端設(shè)備進(jìn)行部署。與YOLOv6n模型相比,ESIC-YOLOv8n模型的P、R、mAP和F1值分別提升4.19%、5.70%、3.13%和5.00%,YOLOv7-tiny模型相比,ESIC-YOLOv8n模型的P、mAP和F1值分別提升2.72%、1.95%和0.50%,R降低了3.80%。對(duì)比結(jié)果表明,ESIC-YOLOv8n模型在滿(mǎn)足輕量化的同時(shí)綜合表現(xiàn)最好,可以實(shí)現(xiàn)葡萄簇目標(biāo)的快速準(zhǔn)確識(shí)別。

        4.4 泛化性試驗(yàn)

        為了驗(yàn)證ESIC-YOLOv8n網(wǎng)絡(luò)的泛化性,采用本地葡萄圖像數(shù)據(jù)集進(jìn)行泛化性試驗(yàn)。其P、R、mAP和F1值等指標(biāo)值分別為79.70%、71.60%、75.80%和75.43%,檢測(cè)效果如圖8所示。

        與公共數(shù)據(jù)集WGISD上檢測(cè)結(jié)果相比,ESIC-YOLOv8n網(wǎng)絡(luò)在本地?cái)?shù)據(jù)集上的檢測(cè)結(jié)果略低,主要原因在于巨峰葡萄與霞多麗、品麗珠、赤霞珠、長(zhǎng)相思和西拉等5個(gè)葡萄品種在形狀、顏色、紋理和緊湊度等方面有明顯差異;數(shù)據(jù)集圖像在拍攝角度、拍攝距離、拍攝設(shè)備、成像大小、分辨率及拍攝光線(xiàn)等多方面有明顯差異[17]。這些品種、場(chǎng)景、成像技術(shù)間的差異化對(duì)檢測(cè)結(jié)果具有較大影響。綜上,雖然ESIC-YOLOv8n網(wǎng)絡(luò)在沒(méi)有訓(xùn)練過(guò)的本地?cái)?shù)據(jù)集上的檢測(cè)精度比公共數(shù)據(jù)集WGISD略低,但反映了網(wǎng)絡(luò)在更為復(fù)雜環(huán)境、差異化品種識(shí)別中的引用潛力。

        5 結(jié)論

        為提高復(fù)雜場(chǎng)景下多品種葡萄簇檢測(cè)的準(zhǔn)確性、魯棒性和泛化性,本研究提出ESIC-YOLOv8n模型,并在包含5個(gè)葡萄品種的WGISD數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試,取得較好的檢測(cè)效果,提高被遮擋或重疊葡萄簇目標(biāo)的檢測(cè)精度。

        1) 在原YOLOv8n 模型Backbone和Neck結(jié)構(gòu)中分別添加EMA和SA注意力模塊,通過(guò)通道空間并行的結(jié)構(gòu),提取更全面的有效特征,提高網(wǎng)絡(luò)在復(fù)雜場(chǎng)景下的特征提取能力和多尺度特征融合能力,有效地解決遮擋和重疊對(duì)葡萄簇檢測(cè)的干擾。

        2) 在檢測(cè)頭層使用Inner-CIoU 代替原網(wǎng)絡(luò)的CIoU作為損失函數(shù),使網(wǎng)絡(luò)關(guān)注邊界框的核心部分而非整體,實(shí)現(xiàn)對(duì)重疊區(qū)域更加精確的評(píng)估,加速收斂的效果,提高網(wǎng)絡(luò)的準(zhǔn)確性和泛化性。

        3) 本研究葡萄簇檢測(cè)的P值為87.00%,R值為81.60%,mAP值為88.90%,F(xiàn)1值為84.21%,相對(duì)原YOLOv8n模型,分別提高1.05%、2.90%、1.48%和2.00%,模型權(quán)重僅增加0.91 MB,各項(xiàng)性能指標(biāo)明顯優(yōu)于原始YOLOv8n網(wǎng)絡(luò)。本研究所提模型的優(yōu)勢(shì)主要體現(xiàn)在減少因遮擋或重疊造成的誤報(bào)和漏報(bào)情況,提升葡萄簇的檢測(cè)精度。綜上,ESIC-YOLOv8n模型是一個(gè)準(zhǔn)確率高、魯棒性、泛化性好的輕量化多品種葡萄簇檢測(cè)模型,具有較好的實(shí)用價(jià)值。

        參 考 文 獻(xiàn)

        [ 1 ] Torres?Sánchez J, Mesas?Carrascosa F J, Santesteban L G, et al. Grape cluster detection using UAV photogrammetric point clouds as a low?cost tool for yield forecasting in vineyards [J]. Sensors, 2021, 21(9): 3083.

        [ 2 ] Aguiar A S, Magalh?es S A, Dos Santos F N, et al. Grape bunch detection at different growth stages using deep learning quantized models [J]. Agronomy, 2021, 11(9): 1890.

        [ 3 ] Ghiani L, Sassu A, Palumbo F, et al. In?Field automatic detection of grape bunches under a totally uncontrolled environment [J]. Sensors, 2021, 21(11): 3908.

        [ 4 ] Li H, Li C, Li G, et al. A real?time table grape detection method based on improved YOLOv4-tiny network in complex background [J]. Biosystems Engineering, 2021, 212: 347-359.

        [ 5 ] Wang J, Zhang Z, Luo L, et al. SwinGD: A robust grape bunch detection model based on Swin Transformer in complex vineyard environment[J]. Horticulturae, 2021, 7(11): 492.

        [ 6 ] Wei X, Xie F, Wang K, et al. A study on Shine?Muscat grape detection at maturity based on deep learning[J]. Scientific Reports, 2023, 13(1): 4587.

        [ 7 ] 李國(guó)進(jìn), 黃曉潔, 李修華, 等. 采用輕量級(jí)網(wǎng)絡(luò) MobileNetV2 的釀酒葡萄檢測(cè)模型[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2021, 37(17): 168-176.

        Li Guojin, Huang Xiaojie, Li Xiuhua, et al. Detection model for wine grapes using MobileNetV2 lightweight network [J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(17): 168-176.

        [ 8 ] Lu S, Liu X, He Z, et al. Swin?Transformer?YOLOv5 for real?time wine grape bunch detection [J]. Remote Sensing, 2022, 14(22): 5853.

        [ 9 ] Zhao R, Zhu Y, Li Y. An end?to?end lightweight model for grape and picking point simultaneous detection [J]. Biosystems Engineering, 2022, 223(Part A): 174-188.

        [10] Liu B, Zhang Y, Wang J, et al. An improved lightweight network based on deep learning for grape recognition in unstructured environments [J]. Information Processing in Agriculture, 2024, 11(2): 202-216.

        [11] Santos T T, De Souza L L, Dos Santos A A, et al. Grape detection, segmentation, and tracking using deep neural networks and three?dimensional association [J]. Computers and Electronics in Agriculture, 2020, 170: 105247.

        [12] 龍燕, 楊智優(yōu), 何夢(mèng)菲. 基于改進(jìn) YOLOv7的疏果期蘋(píng)果目標(biāo)檢測(cè)方法[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2023, 39(14): 191-199.

        Long Yan, Yang Zhiyou, He Mengfei. Recognizing apple targets before thinning using improved YOLOv7 [J]. Transactions of the Chinese Society of Agricultural Engineering, 2023, 39(14): 191-199.

        [13] 王磊磊, 王斌, 李東曉, 等. 基于改進(jìn) YOLOv5 的菇房平菇目標(biāo)檢測(cè)與分類(lèi)研究[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2023, 39(17): 163-171.

        Wang Leilei, Wang Bin, Li Dongxiao, et al. Object detection and classification of pleurotus ostreatus using improved YOLOv5 [J]. Transactions of the Chinese Society of Agricultural Engineering, 2023, 39(17): 163-171.

        [14] 宋懷波, 江梅, 王云飛, 等. 融合卷積神經(jīng)網(wǎng)絡(luò)與視覺(jué)注意機(jī)制的蘋(píng)果幼果高效檢測(cè)方法[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2021, 37(9): 297-303.

        Song Huaibo, Jiang Mei, Wang Yunfei, et al. Efficient detection method for young apples based on the fusion of convolutional neural network and visual attention mechanism [J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(9): 297-303.

        [15] Ouyang D, He S, Zhang G, et al. Efficient multi?scale attention module with cross?spatial learning [C]. 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, 2023: 1-5.

        [16] Zhang Q, Yang Y. SA?Net: Shuffle attention for deep convolutional neural networks [C]. 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, 2021: 2235-2239.

        [17] Zhang C, Ding H, Shi Q, et al. Grape cluster real?time detection in complex natural scenes based on YOLOv5s deep learning network [J]. Agriculture, 2022, 12 (8): 1242.

        猜你喜歡
        注意力機(jī)制目標(biāo)檢測(cè)
        面向短文本的網(wǎng)絡(luò)輿情話(huà)題
        基于自注意力與動(dòng)態(tài)路由的文本建模方法
        基于深度學(xué)習(xí)的問(wèn)題回答技術(shù)研究
        基于LSTM?Attention神經(jīng)網(wǎng)絡(luò)的文本特征提取方法
        基于注意力機(jī)制的雙向LSTM模型在中文商品評(píng)論情感分類(lèi)中的研究
        軟件工程(2017年11期)2018-01-05 08:06:09
        InsunKBQA:一個(gè)基于知識(shí)庫(kù)的問(wèn)答系統(tǒng)
        視頻中目標(biāo)檢測(cè)算法研究
        軟件(2016年4期)2017-01-20 09:38:03
        行為識(shí)別中的人體運(yùn)動(dòng)目標(biāo)檢測(cè)方法
        移動(dòng)機(jī)器人圖像目標(biāo)識(shí)別
        基于背景建模法的運(yùn)動(dòng)目標(biāo)檢測(cè)
        牛鞭伸入女人下身的真视频| 亚洲日本国产精品久久| 人妻洗澡被强公日日澡电影| 久久男人av资源网站无码| 成年奭片免费观看视频天天看| 国产精品美女自在线观看| 国产精品一区二区三区在线免费 | 国产97色在线 | 免| 亚洲精品女同在线观看| 国产精品激情自拍视频| 亚洲伊人成综合网| 野外三级国产在线观看| 国产一区二区在线中文字幕| 国产精品久久精品第一页| 亚洲一区精品无码色成人| 欧美性xxx久久| 国产一区二区三区免费av| 伊甸园亚洲av久久精品| 久久99精品久久久久久hb无码| 国产一区二区a毛片色欲| 最新国产激情视频在线观看| 又色又爽又高潮免费视频国产| 国产精品深田咏美一区二区| 宅男久久精品国产亚洲av麻豆| 国产精品高清视亚洲乱码| 99久久久无码国产精品6| 久久无码一一区| 成人免费毛片立即播放| 97人伦影院a级毛片| 成人免费ā片在线观看| 美女露屁股无内裤视频| 亚洲av日韩一区二区| 国产精品一区二区久久不卡| 亚洲欧洲日产国码久在线观看| 亚洲长腿丝袜中文字幕| 无码孕妇孕交在线观看| 久久久窝窝午夜精品| 一区二区视频资源在线观看| 亚洲成a∨人片在线观看无码| 亚洲粉嫩高潮的18p| 亚洲av网一区天堂福利|