張嘉琪,徐啟蕾
(青島科技大學(xué)自動(dòng)化與電子工程學(xué)院,山東 青島 266061)
中國是一個(gè)農(nóng)業(yè)大國,其蘋果年產(chǎn)量超過1700萬噸。然而,大部分蘋果的分揀和分級(jí)過程仍然沒有實(shí)現(xiàn)自動(dòng)化。蘋果在采摘和運(yùn)輸過程中容易因磕碰、擠壓造成機(jī)械損傷導(dǎo)致加速腐爛,降低蘋果的經(jīng)濟(jì)價(jià)值。目前,蘋果采摘后主要采用人工分揀的方式,該方式具有很大的局限性:1)錯(cuò)誤率高且效率低;2)由于工人對(duì)蘋果缺陷判斷沒有標(biāo)準(zhǔn),結(jié)果可能會(huì)有所不同[1-5]。部分依靠機(jī)械結(jié)構(gòu)進(jìn)行分揀[6-8]。
近年來,深度學(xué)習(xí)算法被大量應(yīng)用于農(nóng)產(chǎn)品檢測(cè),應(yīng)用深度學(xué)習(xí)進(jìn)行蘋果缺陷檢測(cè)成為主要研究熱點(diǎn)之一,國內(nèi)外學(xué)者對(duì)蘋果分級(jí)做了大量研究,根據(jù)蘋果大小、形狀、顏色等特征進(jìn)行分級(jí)的方法已比較成熟[9-11],而蘋果缺陷的檢測(cè)一直是蘋果分級(jí)的一個(gè)障礙。Yu等人[12]基于多圖像特征和加權(quán)K-means聚類算法提出了一種快速有效的蘋果自動(dòng)分級(jí)方法,使用頂部、底部和兩側(cè)的圖像和蘋果平均灰度值區(qū)分蘋果缺陷、莖、花萼,準(zhǔn)確率達(dá)到96.00%,該算法處理速度較快,但精度與魯棒性欠佳。Hu 等人[13]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)的方法,使用來自水果掃描網(wǎng)格的3D形狀信息來檢測(cè)瘀傷的蘋果。Fan 等人[14]引入了一種基于計(jì)算機(jī)視覺的在線系統(tǒng),該系統(tǒng)采用CNN 實(shí)現(xiàn)蘋果缺陷檢測(cè),實(shí)驗(yàn)結(jié)果表明,該方式優(yōu)于支持向量機(jī)(Support Vector Machines,SVM),分級(jí)準(zhǔn)確率達(dá)96.00%。該系統(tǒng)檢測(cè)時(shí)每個(gè)蘋果需采集6張照片,檢測(cè)效率仍有提升空間。可見,采用上述方法對(duì)蘋果分級(jí)有著重要意義,但仍然存在分類準(zhǔn)確度低,細(xì)小缺陷檢測(cè)能力差等問題。Redmon 等人[15]于2016 年提出(You Only Look Once,YOLO)算法。YOLO 系列被大量應(yīng)用于農(nóng)業(yè)領(lǐng)域[16-18]。Valdez 等人[19]將YOLOv3 應(yīng)用于RGB 圖像中蘋果的2 類分級(jí)。蘋果按照缺陷與健康進(jìn)行分類,健康蘋果與缺陷平均檢測(cè)精度分別是80.70%和69.00%,檢測(cè)精度有待提升。
因此,本文主要針對(duì)提高蘋果缺陷檢測(cè)精度與效率,克服蘋果缺陷的復(fù)雜多樣因素造成的誤檢和漏檢,在原有的YOLOv5 網(wǎng)絡(luò)中加入基于Transformer 的TRANS 模塊,改進(jìn)YOLOv5 的頸部特征融合網(wǎng)絡(luò),并引入基于歸一化的注意力機(jī)制;利用改進(jìn)的YOLOv5網(wǎng)絡(luò)對(duì)蘋果進(jìn)行缺陷檢測(cè),優(yōu)化蘋果實(shí)時(shí)檢測(cè)效果。
YOLOv5 是Glenn Jocher 在2020 年提出的一種單階段目標(biāo)識(shí)別算法。YOLOv5 主要包含4 個(gè)部分,即輸入端(Input)、骨干網(wǎng)絡(luò)(Backbone)、頸部網(wǎng)絡(luò)(Neck)和檢測(cè)頭(Head),其中Input 經(jīng)過圖像預(yù)處理統(tǒng)一圖像大小;Backbone 提取圖像特征;Neck 包含了一系列網(wǎng)絡(luò)層,可以根據(jù)一定的規(guī)律融合主干提取的圖像特征,使特征語義信息更加豐富,并將輸出處理后的特征作為預(yù)測(cè)層的輸入;通過Head 網(wǎng)絡(luò)預(yù)測(cè)輸入特征獲得對(duì)象的類別并生成邊界框的最終坐標(biāo)。核心思想是將目標(biāo)檢測(cè)作為回歸問題來處理,將數(shù)據(jù)經(jīng)過特征提取、特征融合后直接定位目標(biāo)位置并對(duì)目標(biāo)進(jìn)行歸類。
根據(jù)網(wǎng)絡(luò)寬度和深度的差異,YOLOv5 可分為n、s、m、l、x 這5 種網(wǎng)絡(luò)模型。其中,YOLOv5s 網(wǎng)絡(luò)的計(jì)算速度最快,但平均精度低。本文選擇YOLOv5s 作為主要研究模型,YOLOv5s 網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。Backbone 網(wǎng)絡(luò)主要由卷積層、BN 層、SiLU 激活函數(shù)、空間金字塔快速池化(Spatial Pyramid Pooling-Fast, SPPF)和集中綜合卷積(Concentrated-Comprehensive Convolution,C3)模塊組成。
圖1 YOLOv5s網(wǎng)絡(luò)結(jié)構(gòu)
Sigmoid 加權(quán)襯墊(Sigmoid Weighted Liner Unit,SiLU)激活函數(shù)[20]是一種平滑非單調(diào)函數(shù),可有效抑制訓(xùn)練過程中的梯度消失。Backbone 中C3-1由CBS、Resunit、Concat 模塊組成,在Neck 中將C3-1中的Resunit 替換成了CBS 模塊。SPPF 結(jié)構(gòu)是在空間金字塔池化(Spatial Pyramid Pooling,SPP)的基礎(chǔ)上改進(jìn)的,SPPF 可以更高效地實(shí)現(xiàn)SPP 的功能。SPPF 將特征圖依次輸入3 個(gè)最大池化層Maxpool,并將特征圖拼接后進(jìn)行尺度統(tǒng)一,確保目標(biāo)大小與位置保持一致,使得網(wǎng)絡(luò)更好地提高分類精度和速度,同時(shí)提取更豐富的特征信息。Neck 采用特征金字塔(Feature Pyramid Networks,F(xiàn)PN)[21]+路徑聚合網(wǎng)絡(luò)(Path Aggregation Network,PAN)結(jié)構(gòu),F(xiàn)PN 和PAN結(jié)構(gòu)實(shí)現(xiàn)了高層特征和底層特征的融合和互補(bǔ)。二者相輔相成,克服了各自的局限性,增強(qiáng)了模型的特征提取能力。圖像輸入Backbone 后,在不同的圖像粒度上聚集并形成圖像特征。Neck 將圖像特征合并隨即傳輸?shù)筋A(yù)測(cè)層,Head 預(yù)測(cè)圖像特征以生成邊界框和預(yù)測(cè)類別。
針對(duì)蘋果缺陷檢測(cè)經(jīng)常誤檢漏檢、缺陷易混淆等問題,降低在復(fù)雜場(chǎng)景下檢測(cè)蘋果表面不同缺陷的誤檢率與漏檢率,本文提出一種基于改進(jìn)YOLOv5s 的NAM-YOLO 模型。其網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖2 所示,相比于傳統(tǒng)YOLOv5s 網(wǎng)絡(luò),本模型分別在Backbone網(wǎng)絡(luò)、Neck 網(wǎng)絡(luò)進(jìn)行改進(jìn)。在Backbone 網(wǎng)絡(luò)中添加基于Transformer 的TRANS 模塊,以更好地融合特征與全局信息。在Neck 中將BiFPN 結(jié)構(gòu)替換YOLOv5原有的PANet 結(jié)構(gòu),以增強(qiáng)多尺度特征融合能力,并在Neck 網(wǎng)絡(luò)與Head 之間添加一種輕量級(jí)的高效的注意力機(jī)制(Normalization-based Attention Module,NAM)[22]以強(qiáng)化目標(biāo)區(qū)域的關(guān)鍵特征,提高網(wǎng)絡(luò)的檢測(cè)精度。
圖2 改進(jìn)后的NAM-YOLO網(wǎng)絡(luò)結(jié)構(gòu)
本文將Transformer[23]引入YOLOv5s 的網(wǎng)絡(luò)模型中。Transformer 模型能夠關(guān)注全局圖像特征塊之間的依賴關(guān)系,并保留足夠的空間信息用于目標(biāo)檢測(cè),捕獲豐富的上下文信息。TRANS 結(jié)構(gòu)如圖3 所示。每個(gè)TRANS 編碼器包含2個(gè)子層,第1個(gè)子層是多頭注意力機(jī)制,多頭注意力通過不同的線性變換將特征映射到不同的向量空間,這有助于網(wǎng)絡(luò)關(guān)注當(dāng)前像素,獲得上下文語義[24]。第2個(gè)子層是全連接的前饋網(wǎng)絡(luò)多層感知機(jī)(Multilayer Perceptron,MLP)。2 個(gè)子層之間通過殘差連接(Residual),然后進(jìn)行層歸一化(Layer Normalization,LN)[25]。采用殘差連接可以減弱神經(jīng)網(wǎng)絡(luò)的“退化現(xiàn)象”?!巴嘶F(xiàn)象”即在網(wǎng)絡(luò)層數(shù)加深時(shí),網(wǎng)絡(luò)的損失值不降反增。
圖3 TRANS編碼器的架構(gòu)
在Backbone前端添加TRANS模塊容易觸發(fā)邊界回歸,從而丟失部分有助于檢測(cè)的上下文信息。將TRANS 模塊添加到特征圖分辨率較小、網(wǎng)絡(luò)層數(shù)較深的Backbone 末端,可以降低計(jì)算和存儲(chǔ)消耗,更好地提高蘋果缺陷的檢測(cè)效率與精度。在蘋果缺陷檢測(cè)數(shù)據(jù)集上,可以證明TRANS模塊具有更好的性能。
頸部網(wǎng)絡(luò)的作用是更好地利用骨干網(wǎng)絡(luò)提取的特征,通過對(duì)骨干網(wǎng)絡(luò)在不同階段提取的特征進(jìn)行上采樣、下采樣和融合,增強(qiáng)模型在不同尺度的檢測(cè)能力。如圖4(a)所示,F(xiàn)PN 是從P3 到P7 自上而下融合構(gòu)建特征圖像金字塔,在特征圖像金字塔的每一層提取出不同的特征,每一層都會(huì)進(jìn)行預(yù)測(cè)。這樣精度有所提升,但計(jì)算量大、需要大量的內(nèi)存。PANet 結(jié)構(gòu)示意圖如圖4(b)所示,包含一個(gè)自頂向下和自底向上的雙向融合骨干網(wǎng)絡(luò),同時(shí)在最底層和最高層之間添加了一條“捷徑”,用于縮短層之間的路徑。PANet包含自適應(yīng)特征池化和全連接融合2個(gè)模塊。PANet識(shí)別由骨干網(wǎng)絡(luò)提取的蘋果單一缺陷這類淺層特征,效果較為明顯,但難以獲得深層的特征以識(shí)別復(fù)雜的缺陷。
圖4 特征網(wǎng)絡(luò)結(jié)構(gòu)
本文將加權(quán)雙向特征金字塔(Bidirectional Feature Pyramid Network,BiFPN)[26]引入YOLOv5s 網(wǎng)絡(luò),其結(jié)構(gòu)示意圖如圖4(c)所示。BiFPN 通過向不同分辨率的輸入特征添加額外的權(quán)重,使網(wǎng)絡(luò)獲得每個(gè)輸入特征的重要性以更好地平衡不同尺度的特征信息。BiFPN 通過優(yōu)化多尺度特征融合方法,實(shí)現(xiàn)了有效的雙向跨尺度連接和加權(quán)特征融合,平衡了模型的效率和精度。
近年來,注意力機(jī)制因其具有即插即用、有效增強(qiáng)信息、共享權(quán)重的特點(diǎn)被廣泛應(yīng)用于深度學(xué)習(xí)目標(biāo)檢測(cè)領(lǐng)域[27]。
卷積塊注意模塊(Convolutional Block Attention Module,CBAM)[28]采用了空間和通道混合注意力機(jī)制,包含2 個(gè)模塊:通道注意力模塊和空間注意力模塊。2個(gè)注意力模塊采用串聯(lián)的方式。
NAM 在CBAM 的基礎(chǔ)上進(jìn)行改進(jìn),按順序重新設(shè)計(jì)通道注意模塊和空間注意模塊,通過調(diào)整訓(xùn)練權(quán)重在通道維度和空間維度上的方差來調(diào)整注意力的權(quán)重。其結(jié)構(gòu)如圖5 所示。NAM 使用了批歸一化(Batch Normalization,BN)[29]中的縮放因子來表示權(quán)值的重要程度如式(1)所示,以避免如擠壓與激勵(lì)注意力機(jī)制(Squeeze and Excitation Module,SE)和CBAM一樣增加全連接層和卷積層。
圖5 NAM注意力機(jī)制的結(jié)構(gòu)
其中,γ與β分別為可訓(xùn)練尺度與移位參數(shù),μB與σB分別為小批量β的均值與標(biāo)準(zhǔn)差。比例因子γ為BN的方差,ε是為了避免分母為0而增加的一個(gè)接近于0的很小的值。較大的方差可以帶來更多的變化以及更豐富的信息。基于通道注意模塊的γ歸一化相關(guān)權(quán)重Wγ,可以對(duì)重要信道給予更多關(guān)注,并抑制無關(guān)的權(quán)重。假設(shè)F1∈R(H·W·C)為輸入特征圖,H、W和C分別表示通道的高度、寬度和數(shù)量。通道注意的輸出如式(2)所示:
空間注意模塊采用與通道注意模塊相同的方式,將BN 應(yīng)用于空間維度中的像素,即像素歸一化(PN)。根據(jù)縮放因子λ聚焦于信息量較大的像素,并調(diào)整相關(guān)權(quán)重Wλ。F2∈R(H·W·C)是輸入特征圖,空間注意模型的輸出如式(3)所示:
為了抑制不太重要的權(quán)重,NAM 向損失函數(shù)添加正則化項(xiàng):
其中:l(·)與g(·)分別表示損失函數(shù)和l1范數(shù)懲罰因子;x和y分別是輸入和輸出;W是網(wǎng)絡(luò)權(quán)重;p是平衡懲罰因子。
本文在BiFPN 結(jié)構(gòu)的末端串聯(lián)插入了3 個(gè)NAM模塊以更好地細(xì)化頸部特征融合層的通道和空間信息,高效地提取復(fù)雜的蘋果表面特征。
深度學(xué)習(xí)框架為PyTorch 1.7.0,編程語言采用Python3.7。本文實(shí)驗(yàn)在Linux Ubuntu 20.04 LTS 操作系統(tǒng)上運(yùn)行,配備Intel(R)Core(TM)i9-10900X CPU @ 3.70 GHz 處理器。搭載了顯存為8 GB 的NVIDIA GeForce RTX 3070 顯卡以及Compute Unified Device Architecture (CUDA) 10.1,由cuDNN 7.6.5 版本加速。內(nèi)存大小為16 GB。本文改進(jìn)后的YOLOv5s模型訓(xùn)練的超參數(shù)設(shè)置如表1所示。
已訓(xùn)練好的網(wǎng)絡(luò)模型、攝像頭以及上位機(jī)軟件共同構(gòu)成了蘋果分級(jí)檢測(cè)系統(tǒng),檢測(cè)系統(tǒng)界面如圖6 所示。
圖6 檢測(cè)系統(tǒng)界面
目前并沒有統(tǒng)一公開的蘋果缺陷檢測(cè)數(shù)據(jù)集,本文所使用實(shí)驗(yàn)數(shù)據(jù)通過現(xiàn)場(chǎng)采集獲得,自制了一個(gè)蘋果缺陷檢測(cè)數(shù)據(jù)集。對(duì)市場(chǎng)上的蘋果進(jìn)行圖像、尺寸以及重量信息采集。拍攝圖像尺寸為3024×3024 像素,得到符合條件的圖像共1800 張,保存格式為PNG,數(shù)據(jù)集圖例如圖7 所示。經(jīng)過拍攝新鮮的蘋果圖像共1000 張,變質(zhì)(包括腐爛、裂果等)的蘋果圖像800 張。通過水平翻轉(zhuǎn)、平移以及隨機(jī)裁剪與填充等方式對(duì)原數(shù)據(jù)集進(jìn)行擴(kuò)充,將圖像擴(kuò)充至4800 余張。YOLOv5 模型采用Mosaic 進(jìn)行數(shù)據(jù)增強(qiáng),對(duì)輸入圖像進(jìn)行隨機(jī)裁剪與排布,將4 張圖片進(jìn)行拼接。拼接后的圖片輸入YOLOv5 網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,提高了模型的泛化能力,避免過擬合現(xiàn)象影響蘋果的檢測(cè)效果。
圖7 蘋果數(shù)據(jù)集圖例
本文使用的標(biāo)注軟件為LabelImg,將檢測(cè)對(duì)象分成fresh 和stale 這2 類。根據(jù)蘋果的位置標(biāo)記實(shí)驗(yàn)中的圖像并添加標(biāo)簽框,通過圖像中標(biāo)記目標(biāo)樣本來生成包含蘋果目標(biāo)類型和坐標(biāo)信息的XML 文件,標(biāo)注如圖8所示。
圖8 數(shù)據(jù)集標(biāo)
通過上述工作,完成數(shù)據(jù)集的制作。將數(shù)據(jù)集隨機(jī)按8:1:1 的比例劃分為訓(xùn)練集、驗(yàn)證集、測(cè)試集,如表2所示。
表2 數(shù)據(jù)集劃分/張
準(zhǔn)確率(Precision,P)、召回率(Recall,R)和各類別AP的平均值(Mean Average Precision,mAP)作為模型的評(píng)估指標(biāo)。準(zhǔn)確率是預(yù)測(cè)為正的所有樣本中實(shí)際為正的樣本的概率,表示對(duì)正樣本結(jié)果的預(yù)測(cè)精度,計(jì)算公式如式(5)。召回率是在實(shí)際正樣本中被預(yù)測(cè)為正樣本的概率,表示整體預(yù)測(cè)精度,計(jì)算公式如式(6)。mAP的計(jì)算公式如式(7)。
其中,TP 表示被檢測(cè)對(duì)象中被正確預(yù)測(cè)的部分,F(xiàn)P表示被錯(cuò)誤地檢測(cè)為目標(biāo)對(duì)象的部分,F(xiàn)N 表示目標(biāo)檢測(cè)對(duì)象中預(yù)測(cè)錯(cuò)誤的部分,n表示所有由網(wǎng)絡(luò)模型檢測(cè)壞果的數(shù)量,N表示測(cè)試樣本的類別數(shù),AP是計(jì)算出的準(zhǔn)確率Precision 在不同召回率Recall 水平下的平均值。
本文設(shè)計(jì)了消融實(shí)驗(yàn)來驗(yàn)證每個(gè)改進(jìn)模塊的優(yōu)化效果,一共驗(yàn)證了6 種網(wǎng)絡(luò),分別在YOLOv5s 網(wǎng)絡(luò)的基礎(chǔ)上單獨(dú)添加TRANS、NAM 注意力機(jī)制以及在頸部更改BiFPN 結(jié)構(gòu)進(jìn)行對(duì)比驗(yàn)證。采用相同的蘋果缺陷檢測(cè)數(shù)據(jù)集,一致的超參數(shù)配置。消融實(shí)驗(yàn)分別比較了各種模塊組合后的準(zhǔn)確率、召回率、mAP。
模型1 使用的是未進(jìn)行改進(jìn)的YOLOv5s 模型,mAP 為93.07%。模型2 中采用本文改進(jìn)后的頸部網(wǎng)絡(luò),將BiFPN 結(jié)構(gòu)代替YOLOv5s模型原有的PANet結(jié)構(gòu),提高了網(wǎng)絡(luò)多尺度融合能力,mAP 提升了1.93 個(gè)百分點(diǎn)。模型3 中采用本文修改后的主干網(wǎng)絡(luò),在原有主干的尾端增加了TRANS 結(jié)構(gòu)。模型4 中,主要驗(yàn)證了YOLOv5s頸部末端添加NAM注意力機(jī)制對(duì)實(shí)驗(yàn)結(jié)果的影響,加入NAM 注意力機(jī)制后,mAP提升了2.25個(gè)百分點(diǎn)。模型5、模型6和模型7分別是對(duì)模型2、模型3 和模型4 中的改進(jìn)方式的兩兩融合,本文提出的NAM-YOLO 網(wǎng)絡(luò)模型則是同時(shí)融合上述3 種改進(jìn)。表3 顯示了每個(gè)模型的參數(shù)和消融研究結(jié)果的比較。其中,“×”表示未使用改進(jìn)的方法,而“√”表示使用了改進(jìn)的方法,“-”表示空白項(xiàng)。
表3 消融實(shí)驗(yàn)結(jié)果
為了探究NAM-YOLO 對(duì)蘋果缺陷的檢測(cè)能力,選取鮮果、帶有碰傷、裂口和腐爛的壞果圖像共230幅輸入模型中進(jìn)行測(cè)試。將碰傷、裂口和腐爛的蘋果歸為一類進(jìn)行檢測(cè)。部分檢測(cè)效果如圖9 所示,對(duì)應(yīng)檢測(cè)結(jié)果如表4 所示。NAM-YOLO 對(duì)鮮果和帶有裂口蘋果識(shí)別效果最好,無漏檢(壞果被識(shí)別為鮮果);帶有碰傷的壞果漏檢了2個(gè);腐爛的壞果漏檢了2個(gè)。結(jié)果表明,NAM-YOLO 在分析蘋果品質(zhì)中更有優(yōu)勢(shì),可以完整地檢測(cè)蘋果狀態(tài),具有良好的魯棒性。
表4 蘋果果實(shí)檢測(cè)結(jié)果
圖9 蘋果檢測(cè)結(jié)果對(duì)比
為了驗(yàn)證改進(jìn)算法的性能,本文引入主流目標(biāo)檢測(cè)算法YOLOv3、YOLOv5s、YOLOv7,設(shè)置相同的超參數(shù)對(duì)蘋果缺陷檢測(cè)數(shù)據(jù)集進(jìn)行訓(xùn)練。對(duì)比實(shí)驗(yàn)選擇mAP@0.5作為模型評(píng)估指標(biāo)。檢測(cè)結(jié)果如表5所示,不同算法的mAP曲線如圖10所示。
圖10 不同算法mAP曲線圖
圖10 中,橫坐標(biāo)為訓(xùn)練輪次,縱坐標(biāo)為檢測(cè)算法的mAP 值。在經(jīng)過300 次迭代后,YOLOv3 的mAP 值最低;YOLOv5s 與NAM-YOLO 的mAP 值波動(dòng)較?。桓倪M(jìn)后的NAM-YOLO 算法較YOLOv3、YOLOv5s、YOLOv7,mAP 分別提高了18.00 個(gè)百分點(diǎn)、5.70 個(gè)百分點(diǎn)、3.70 個(gè)百分點(diǎn)。通過對(duì)比可知,改進(jìn)后的NAM-YOLO算法具有明顯優(yōu)勢(shì)。
針對(duì)傳統(tǒng)視覺方案下,蘋果缺陷檢測(cè)系統(tǒng)質(zhì)量分析效率低、精度差的問題,本文提出了一種基于YOLOv5 算法的NAM-YOLO 模型,用于對(duì)蘋果的壞果進(jìn)行檢測(cè)。該模型在Backbone 網(wǎng)絡(luò)中加入TRANS 模塊,提高融合特征與全局信息能力,使用BiFPN 模塊代替頸部網(wǎng)絡(luò)中的PANet結(jié)構(gòu),以提高模型的特征融合能力。在BiFPN 模塊的末端接入基于歸一化的注意力機(jī)制NAM。
NAM-YOLO 模型在蘋果缺陷檢測(cè)數(shù)據(jù)集中,檢測(cè)準(zhǔn)確率達(dá)到98.73%,召回率達(dá)到97.39%,mAP達(dá)到98.90%。與改進(jìn)前的YOLOv5 模型對(duì)比,準(zhǔn)確率提升了10.44個(gè)百分點(diǎn),召回率提升了2.16個(gè)百分點(diǎn),mAP提升了5.83 個(gè)百分點(diǎn)。相比于主流檢測(cè)算法檢測(cè)精度較高,網(wǎng)絡(luò)模型具有更優(yōu)的魯棒性。因此,本文提出的NAM-YOLO 模型的檢測(cè)精度高,分類效果好,能滿足生產(chǎn)環(huán)境下對(duì)蘋果果實(shí)實(shí)時(shí)檢測(cè)的任務(wù)需要。在進(jìn)一步的工作中,將擴(kuò)展數(shù)據(jù)集,設(shè)計(jì)一套集壞果檢測(cè)、蘋果尺寸分級(jí)一體的蘋果分揀分級(jí)系統(tǒng)。添加蘋果尺寸樣本,還將考慮如何縮小模型,提高模型的檢測(cè)速度。