袁 野,譚曉陽
(1.南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,南京 211106;2.模式分析與機(jī)器智能工業(yè)和信息化部重點(diǎn)實(shí)驗(yàn)室(南京航空航天大學(xué)),南京 211106;3.軟件新技術(shù)與產(chǎn)業(yè)化協(xié)同創(chuàng)新中心,南京 211106)
金屬制品是人類社會中重要的工具用品。在實(shí)際使用時(shí),金屬制品表面常要求光滑無痕,一批產(chǎn)品的質(zhì)量也會以表面缺陷占比來衡量。以冰箱為例,表面的缺陷一般表現(xiàn)為劃痕、凹痕、擦痕等,當(dāng)冰箱表面出現(xiàn)缺陷時(shí),該產(chǎn)品將被直接淘汰,當(dāng)一條生產(chǎn)線中表面缺陷率過高時(shí),也將極大地影響產(chǎn)品的整體質(zhì)量。因此,冰箱表面的缺陷信息需要得到準(zhǔn)確的檢測。
實(shí)際生產(chǎn)中如果采用人工檢測的方法,人力物力將被極大地浪費(fèi),所以需要用到自動化的檢測系統(tǒng),應(yīng)用機(jī)器視覺技術(shù)快速準(zhǔn)確地獲得缺陷的位置。在早期的工作中,缺陷檢測常常應(yīng)用到紅外、電磁、激光超聲等技術(shù),對設(shè)備與環(huán)境的要求較高,且難以準(zhǔn)確定位缺陷的位置,提取進(jìn)一步的信息,所以在實(shí)際生產(chǎn)中實(shí)用價(jià)值不高。隨著深度學(xué)習(xí)的快速發(fā)展,缺陷檢測開始大范圍地使用深度學(xué)習(xí)技術(shù),本次研究就是基于冰箱金屬表面的缺陷圖像進(jìn)行缺陷識別。
然而,冰箱表面實(shí)際上是金屬面,有受光照影響大、缺陷特征不明顯、形狀多樣且密集的特點(diǎn),且實(shí)際生產(chǎn)環(huán)境非常復(fù)雜,光照與拍攝設(shè)備的質(zhì)量難以得到保證,所以檢測時(shí)難以定位以及分類,容易造成誤檢和漏檢,檢測難度較大?,F(xiàn)有的主流目標(biāo)檢測網(wǎng)絡(luò)都是效果非常好的網(wǎng)絡(luò)模型,但是在金屬表面缺陷的檢測中效果也不佳,所以基于金屬表面缺陷的特殊性質(zhì),需要對網(wǎng)絡(luò)做出針對性的改進(jìn)。
針對金屬表面特點(diǎn)需要設(shè)計(jì)出針對性的網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)據(jù)處理算法,本文從已有的神經(jīng)網(wǎng)絡(luò)模型中選取合適的模型,加以改進(jìn)設(shè)計(jì)出了Metal-YOLOv3 模型。在YOLOv3(You Only Look Once version 3)算法原損失函數(shù)、先驗(yàn)框(anchor)尺寸與非極大值抑制算法等方面進(jìn)行改進(jìn),在保證了檢測速度的前提下大大提升了檢測精度。
該模型能對復(fù)雜情況下的冰箱金屬表面缺陷進(jìn)行精確的檢測,提取出產(chǎn)品上的缺陷信息,同時(shí)也具有較快的檢測速度,而且對反光、灰暗的拍攝環(huán)境也具有良好的魯棒性,能在實(shí)際生產(chǎn)中應(yīng)用。
本文的主要貢獻(xiàn)如下:
1)針對金屬表面檢測調(diào)整設(shè)計(jì)了Metal-YOLOv3 算法,算法高效簡單,準(zhǔn)確性較高;
2)在與現(xiàn)有的檢測算法模型對比時(shí),本文算法的準(zhǔn)確性是最高的;
3)本文算法采用的基礎(chǔ)結(jié)構(gòu)是YOLOv3,檢測與訓(xùn)練速度比區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Regional Convolutional Neural Network,R-CNN)[1-4]系列的模型快,抗干擾性強(qiáng)。
計(jì)算機(jī)視覺在生活與工業(yè)方面都有應(yīng)用,其中目標(biāo)檢測是非常熱門的應(yīng)用領(lǐng)域。傳統(tǒng)的目標(biāo)檢測是基于目標(biāo)的紋理特征、顏色對比等光學(xué)特性設(shè)計(jì)對應(yīng)的算法,但這樣的算法依賴的是人為總結(jié)的特征,在稍微復(fù)雜的應(yīng)用場景中效果與檢測速度經(jīng)常不盡人意,而且當(dāng)使用的需求有變化時(shí),需要時(shí)刻調(diào)整算法參數(shù),非常浪費(fèi)人力資源,所以目標(biāo)檢測算法在設(shè)計(jì)之初并未受到重視。
隨著深度學(xué)習(xí)的迅速發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測算法在準(zhǔn)確性、檢測速度等指標(biāo)都已滿足應(yīng)用需求,成功地替代了基于光學(xué)特性的傳統(tǒng)方法,成為了目標(biāo)檢測算法的主流。在眾多基于深度學(xué)習(xí)的目標(biāo)檢測算法中,以R-CNN 系列網(wǎng)絡(luò)為主要代表,此外還有單階段多邊框目標(biāo)檢測算法(Single Shot multibox Detector,SSD)[5]、YOLO[6]、YOLOv3[7]等經(jīng)典算法。
Faster R-CNN Faster R-CNN 模型分為兩個(gè)部分:第1 部分就是直接用普通分類網(wǎng)絡(luò)的卷積層來提取共享特征,后接一個(gè)感興趣區(qū)域池化層[2],在第1部分的最后一張?zhí)卣鲌D上提取針對各個(gè)感興趣區(qū)域(Region of Interest,RoI)的特征圖,然后將所有RoI 的特征圖都交由第2 部分來處理。第2 部分是一個(gè)區(qū)域候選網(wǎng)絡(luò)(Region Proposal Network,RPN)[3],使用RPN 卷積網(wǎng)絡(luò)替代R-CNN 與Fast R-CNN 的選擇性搜索[8]模塊,將RPN 集成到檢測網(wǎng)絡(luò)中,得到一個(gè)統(tǒng)一的檢測網(wǎng)絡(luò),用來對每一個(gè)RoI 進(jìn)行分類和回歸。由此得到每個(gè)RoI 的類別和歸回結(jié)果。其中第1 部分的基礎(chǔ)分類網(wǎng)絡(luò)計(jì)算是所有RoI共享的,只需要進(jìn)行一次前向計(jì)算即可得到所有RoI 所對應(yīng)的特征圖。
YOLO 與R-CNN 系列的網(wǎng)絡(luò)模型不同,YOLO 訓(xùn)練和檢測均是在一個(gè)單獨(dú)網(wǎng)絡(luò)中進(jìn)行。R-CNN采用分離的模塊求取候選框,訓(xùn)練過程因此也是分成多個(gè)模塊。在Faster R-CNN中,盡管RPN 與R-CNN 共享卷積層,但是R-CNN 將檢測過程分為兩部分:先得到候選框,再進(jìn)行分類回歸,需要反復(fù)訓(xùn)練RPN 和R-CNN。YOLO 將物體檢測分類問題與回歸問題作為同一個(gè)回歸問題進(jìn)行求解,輸入圖像經(jīng)過一次推斷,便能得到圖像中所有物體的位置和其所屬類別及相應(yīng)的置信概率,大大提升了檢測的速度。
SSD SSD 算法結(jié)合了YOLO 與Faster R-CNN 的特點(diǎn),在單獨(dú)的網(wǎng)絡(luò)中一次性回歸出物體的位置與類別,具有很快的檢測速度。與YOLO 不同的是SSD 提取了不同尺度的特征圖來做檢測,用較大尺寸的特征圖來識別小物體,小尺寸的特征圖則用來檢測大物體。此外,SSD 借鑒了Faster R-CNN,采用了不同尺度與長寬比的anchors,可以更大限度地匹配目標(biāo)形狀,減少訓(xùn)練難度。
YOLOv3 YOLOv3 算法是YOLO 系列的較新成果,相比YOLO,引入了多尺度融合的特征提取方式,采用類似FPN[9]的上采樣和融合方法,將不同尺度的特征圖融合起來,然后在不同尺度上劃分不同的anchors 尺寸,進(jìn)行檢測分類。在網(wǎng)絡(luò)結(jié)構(gòu)上,借鑒了殘差網(wǎng)絡(luò)(Residual Net,ResNet)[10]的思想,在網(wǎng)絡(luò)中加入了殘差模塊,用來代替池化層與全連接層。
目前針對金屬表面缺陷檢測的研究主要是基于激光超聲技術(shù)[11-14]、磁場技術(shù)[15-16]、紅外處理技術(shù)[17]、圖像處理技術(shù)[18-20]和神經(jīng)網(wǎng)絡(luò)識別技術(shù)[21-22]。
文獻(xiàn)[11-13]將激光超聲技術(shù)應(yīng)用在金屬表面缺陷檢測中;文獻(xiàn)[14]總結(jié)了激光超聲技術(shù)作用于缺陷檢測的機(jī)理;文獻(xiàn)[15]基于交變磁場研究了金屬表面缺陷的磁場特性;文獻(xiàn)[16]使用磁記憶方法進(jìn)行金屬表面缺陷識別;文獻(xiàn)[17]將紅外技術(shù)引入缺陷識別中,取得了不錯(cuò)的成果;文獻(xiàn)[18]結(jié)合多種光照條件與圖像處理技術(shù),提供了金屬表面缺陷新的識別思路;文獻(xiàn)[19]使用了多種光照技術(shù)、3D 成像技術(shù)金屬表面的灰度變換,深度研究了鋼材表面缺陷的光學(xué)特征與內(nèi)在規(guī)律;文獻(xiàn)[20]針對凹痕缺陷與擦傷缺陷采用灰度差分與小波變換算法,提取出了不同的特征信息;文獻(xiàn)[21]將陶瓷球表面的直方圖等特征提取出來,結(jié)合反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)進(jìn)行了缺陷識別,能為金屬表面缺陷檢測提供新的切入點(diǎn);文獻(xiàn)[22]將BP神經(jīng)網(wǎng)絡(luò)引入到鋼材表面缺陷檢測中,取得了不錯(cuò)的效果。
目前業(yè)內(nèi)在金屬表面缺陷檢測中經(jīng)常使用的是結(jié)合磁場、激光等技術(shù)實(shí)現(xiàn)的識別,對硬件與工作環(huán)境有著較高要求。本文使用的Metal-YOLOv3 網(wǎng)絡(luò)模型簡化了對檢測設(shè)備的要求,且能在復(fù)雜的環(huán)境下成功地識別出冰箱金屬表面缺陷,實(shí)現(xiàn)了對金屬表面缺陷的有效檢測。
本章對Metal-YOLOv3 在金屬表面缺陷檢測上的應(yīng)用方法進(jìn)行了詳細(xì)介紹,展示了Metal-YOLOv3 的網(wǎng)絡(luò)結(jié)構(gòu)與實(shí)現(xiàn)細(xì)節(jié)。
實(shí)驗(yàn)使用的數(shù)據(jù)集是車間中的冰箱表面劃痕圖像。在對劃痕圖像的觀察與標(biāo)注過程中,本研究發(fā)現(xiàn)金屬表面缺陷特征多樣且不明顯,常有重疊或難以辨認(rèn)的情況,會使得人工標(biāo)注時(shí)出現(xiàn)標(biāo)注的錯(cuò)漏,所以首先需要剔除錯(cuò)漏的標(biāo)注。在檢測模型的訓(xùn)練過程中,需要克服金屬表面缺陷特征不明顯、缺陷重疊以及金屬表面反光等影響檢測精度的情況;同時(shí)也需要保證模型的檢測速度、魯棒性能滿足實(shí)用要求。
基于數(shù)據(jù)集的特征及實(shí)用性需求,本文在YOLOv3 模型的基礎(chǔ)上,結(jié)合了最新提出的完整交并比(Complete-IoU,CIoU)損失函數(shù)[23]設(shè)計(jì)了Metal-YOLOv3算法。
如圖1,Metal-YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)分為兩個(gè)部分:
第一部分是Darknet-53 為主體的卷積層,用于提取圖像的特征。
第二部分是采樣與輸出結(jié)構(gòu),對圖像特征分3 次進(jìn)行上采樣與輸出,在3 種尺寸的特征圖上按照置信度提取候選區(qū)域,與anchors 組成的預(yù)測值進(jìn)行比較得出相應(yīng)的檢測框與置信度,然后按照非極大值抑制(Non-Maximum Suppression,NMS)算法[24]剔除不符要求的候選框,最后按照CIoU 損失的計(jì)算方式來計(jì)算損失。
圖1 Metal-YOLOv3 模型結(jié)構(gòu)Fig.1 Structure of Metal-YOLOv3 model
衡量檢測框精確度的指標(biāo)一般是交并比(Intersectionover-Union,IoU),IoU 的定義如式(1),指檢測框與目標(biāo)框的重疊面積與總面積的比值:
YOLOv3模型在不同尺度上的特征圖用anchors提取檢測框,然后與真實(shí)目標(biāo)框計(jì)算損失,原損失函數(shù)如式(2),
其中:Lxy表示檢測框與目標(biāo)框中心點(diǎn)距離的損失,Lwh表示檢測框與目標(biāo)框高寬的損失,Lconf與Lclass表示置信度損失與類別損失。
可以看出,邊框的位置損失與尺寸損失是分開計(jì)算的,無法像IoU 那樣直接反映檢測框與目標(biāo)框的重合度信息。金屬表面缺陷檢測對邊框的準(zhǔn)確度要求很高,但對缺陷的分類沒有要求,而且檢測目標(biāo)的尺寸、形狀與位置分布都非常復(fù)雜,所以原損失函數(shù)不適合本任務(wù)。
本文直接從IoU 信息中提取預(yù)測值和真實(shí)值的損失,但是直接用IoU 值計(jì)算損失有一定問題,當(dāng)預(yù)測框和真實(shí)框沒有重合部分時(shí),IoU 值簡單地等于0,無法反映出更多的信息。為了解決這一問題,文獻(xiàn)[23]提出了CIoU-Loss。在IoU 的基礎(chǔ)上加入了針對檢測框尺寸與位置兩個(gè)懲罰項(xiàng),給出的損失函數(shù)設(shè)計(jì)如式(3):
其中:Mconf為每個(gè)檢測框的置信度,Ldis是基于檢測框與目標(biāo)框位置差異計(jì)算的懲罰項(xiàng),Lsize是基于檢測框與目標(biāo)框尺寸差異計(jì)算的懲罰項(xiàng),能幫助模型迅速收斂,直接反映出邊框的準(zhǔn)確度。同時(shí),CIoU 損失與置信度損失之間的權(quán)重也需要靈活調(diào)整,以充分適應(yīng)金屬表面缺陷的特征,本文最終采用的損失函數(shù)如式(4):
在實(shí)驗(yàn)中,可以發(fā)現(xiàn)引入的損失函數(shù)與權(quán)重調(diào)整能明顯提升模型檢測的精確度。
在YOLOv3 網(wǎng)絡(luò)結(jié)構(gòu)中,卷積特征圖有3 個(gè)尺度的輸出,每個(gè)尺度下的圖像劃分為若干網(wǎng)格,在每個(gè)網(wǎng)格中用3 個(gè)anchors 來進(jìn)行檢測。顯然,處于不同分布下的數(shù)據(jù)中,目標(biāo)框的尺寸是滿足一定分布的,所以檢測過程中的anchors 的尺寸如果能更好地契合目標(biāo)框尺寸的分布,對目標(biāo)檢測的是非常有益的。本研究采用YOLOv2[25]中的方法,使用K-means 聚類算法來獲得合適的anchors值。
為了避免領(lǐng)域內(nèi)邊界框重疊導(dǎo)致重復(fù)檢測的現(xiàn)象,YOLOv3 采取了NMS 算法來選取領(lǐng)域中分?jǐn)?shù)較高的檢測框,能有效提升識別的精度。在可視對象類(Visual Object Classes,VOC)數(shù)據(jù)集與一般數(shù)據(jù)類(Common Objects in COntext,COCO)數(shù)據(jù)集上,采用的NMS 算法閾值為0.5;但與VOC 和COCO 數(shù)據(jù)集不同,金屬表面缺陷常有重疊連貫的現(xiàn)象,特征也更加不明顯,所以在目標(biāo)附近產(chǎn)生的檢測框會較多,若算法閾值太大會有明顯的重疊率,所以在本模型中采用的算法閾值為0.35。經(jīng)過實(shí)驗(yàn)表明,該閾值設(shè)定明顯減少了檢測框重疊現(xiàn)象,有效地提升了檢測精度。
本文所用的數(shù)據(jù)是某冰箱制造企業(yè)提供的冰箱表面缺陷樣本,但人工采集缺陷樣本的成本較高,所以樣本數(shù)量較少。在深度卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,若樣本數(shù)量不充足,便會影響模型的訓(xùn)練效果,無法達(dá)到正常的訓(xùn)練目標(biāo)。針對本樣本集的圖像特征,本研究發(fā)現(xiàn)對圖像垂直翻轉(zhuǎn)、圖像水平翻轉(zhuǎn)、圖像旋轉(zhuǎn)、隨機(jī)填充與尺度變換等數(shù)據(jù)擴(kuò)充方式并不會影響樣本特性,所以本文采用了上述的樣本擴(kuò)充方式,將樣本集數(shù)倍擴(kuò)充,提升了樣本的多樣性。通過這一操作,能有效地提升識別精度,也能避免過擬合現(xiàn)象的出現(xiàn)。
本實(shí)驗(yàn)采用標(biāo)記工具在各缺陷四周標(biāo)記出目標(biāo)框的四個(gè)頂點(diǎn),轉(zhuǎn)換為4 個(gè)二維坐標(biāo)并按格式記錄到文檔中,能用于模型訓(xùn)練與邊框繪制中。
本次模型訓(xùn)練過程中,原始數(shù)據(jù)共有750 張帶缺陷樣本與750張無缺陷樣本,樣本集按照8∶1∶1的比例被劃分為訓(xùn)練集、驗(yàn)證集與測試集。在整個(gè)訓(xùn)練過程中,每次提取訓(xùn)練樣本都以隨機(jī)參數(shù)進(jìn)行數(shù)據(jù)擴(kuò)充,將樣本數(shù)提升了約800 倍。因?yàn)楸緮?shù)據(jù)集與COCO 數(shù)據(jù)集的識別特征相似,所以本文選取了COCO 數(shù)據(jù)集訓(xùn)練出的模型來進(jìn)行遷移學(xué)習(xí)。訓(xùn)練初期,設(shè)定初始學(xué)習(xí)率為0.001,將COCO 預(yù)訓(xùn)練模型的最后兩層凍結(jié)訓(xùn)練9 000輪。獲得充分訓(xùn)練后解凍最后兩層,然后設(shè)置初始學(xué)習(xí)率為0.000 1,訓(xùn)練30 000 輪。在整個(gè)訓(xùn)練過程中,當(dāng)損失連續(xù)3 000 輪未降低時(shí),令學(xué)習(xí)率降低至原來的3/10,連續(xù)10 000輪未降低時(shí),提前結(jié)束訓(xùn)練。
Metal-YOLOv3網(wǎng)絡(luò)在3個(gè)卷積層輸出特征圖與對應(yīng)的檢測框,與訓(xùn)練數(shù)據(jù)比對計(jì)算相應(yīng)的損失,負(fù)反饋調(diào)整網(wǎng)絡(luò)的參數(shù),最終達(dá)到學(xué)習(xí)訓(xùn)練的目的。
經(jīng)過充分的訓(xùn)練,用測試集對模型性能進(jìn)行驗(yàn)證,可以發(fā)現(xiàn)Metal-YOLOv3 能有效地識別冰箱金屬表面缺陷,驗(yàn)證了該模型的有效性。
本章用冰箱金屬表面缺陷樣本集對Metal-YOLOv3 模型的性能進(jìn)行了詳細(xì)的驗(yàn)證分析。
本節(jié)使用同樣的樣本集,在當(dāng)前主流的幾種目標(biāo)檢測算法上進(jìn)行相同的訓(xùn)練,對比各模型所得到的效果。本文選取了Metal-YOLOv3 的基礎(chǔ)模型YOLOv3、SSD 模型和Faster RCNN 模型與本文的Metal-YOLOv3 模型進(jìn)行實(shí)驗(yàn)對比。基于相同的冰箱金屬表面缺陷樣本集,在3 種不同的模型上各自訓(xùn)練至少30 000輪,然后在同樣的測試集上進(jìn)行檢測,對比檢測效果。如圖2,可以發(fā)現(xiàn)Metal-YOLOv3 模型的檢測效果比YOLOv3、Faster R-CNN模型更好。
圖2 不同網(wǎng)絡(luò)模型的檢測結(jié)果Fig.2 Detection results of different network models
為了綜合評價(jià)模型性能,在檢測精度外,也要考慮到檢測速度,本文選取了業(yè)內(nèi)用于目標(biāo)檢測任務(wù)的主流網(wǎng)絡(luò)模型YOLOv3[7]、Faster R-CNN[3]及SSD[4],同本文的Metal-YOLOv3模型在相同的冰箱金屬表面缺陷樣本集對比檢測精度和檢測速度,并選取平均精確度(Average Precision,AP)和每秒幀數(shù)(Frame Per Second,F(xiàn)PS)衡量算法精度和速度。經(jīng)過實(shí)驗(yàn),得到各檢測算法在金屬表面缺陷驗(yàn)證數(shù)據(jù)集與測試數(shù)據(jù)集上的性能對比(如表1)。從表1中可以看出,Metal-YOLOv3的檢測精度略優(yōu)于Faster R-CNN,是檢測精度最高的模型,而且檢測速度遠(yuǎn)勝于Faster R-CNN,算法性能最優(yōu)。
表1 不同檢測算法性能對比Tab.1 Performance comparison of different detection algorithms
Metal-YOLOv3 模型的損失函數(shù)主要由置信度損失和CIoU 損失兩部分組成,鑒于金屬表面檢測任務(wù)的特殊性,靈活地調(diào)整這兩部分的權(quán)重才能最有效地滿足實(shí)際檢測需求。本文將損失函數(shù)設(shè)置為式(4),調(diào)整兩部分權(quán)重的比值,對比訓(xùn)練后模型的檢測結(jié)果。
從表2 可以看出,λ1/λ2為10 時(shí)模型的檢測精度最高,能顯著提升網(wǎng)絡(luò)模型的性能,可以證明損失權(quán)重的設(shè)置對Metal-YOLOv3網(wǎng)絡(luò)模型的檢測精度具有非常重要的作用。
表2 不同損失權(quán)重下檢測精度對比Tab.2 Accuracy comparison under different loss weights
金屬表面的光學(xué)特性非常多樣,所以在實(shí)際的缺陷檢測過程中,檢測圖像常有局部反光、明暗程度不一等特殊現(xiàn)象。
為了驗(yàn)證本算法在實(shí)際檢測過程中的實(shí)用性,需要進(jìn)行進(jìn)一步的魯棒性實(shí)驗(yàn)。本實(shí)驗(yàn)選取了這類特殊的場景進(jìn)行驗(yàn)證,經(jīng)過對檢測結(jié)果(如圖3)的對比,Metal-YOLOv3 網(wǎng)絡(luò)模型在強(qiáng)烈反光與光線過暗的情況下表現(xiàn)亦優(yōu)于YOLOv3 與Faster R-CNN 模型,可以說明Metal-YOLOv3 網(wǎng)絡(luò)模型具有更好的魯棒性,實(shí)用價(jià)值與泛化性能優(yōu)于YOLOv3 與Faster RCNN模型。
圖3 檢測模型的魯棒性對比Fig.3 Robust comparison of detection models
本文針對冰箱金屬表面的缺陷檢測問題設(shè)計(jì)了Metal-YOLOv3 網(wǎng)絡(luò)模型,有效便捷地實(shí)現(xiàn)了缺陷檢測功能。為了算法的實(shí)用性與便捷性,提升時(shí)間效率,本文采用了YOLOv3的基礎(chǔ)框架,保證了檢測速度;同時(shí)針對金屬表面紋理特征不明顯、光學(xué)特性多樣、缺陷特征模糊、形狀多樣且重疊度高的特點(diǎn),本文采用了CIoU 損失函數(shù)并改進(jìn)了非極大值抑制算法,彌補(bǔ)了YOLOv3模型anchors數(shù)量較少、二范數(shù)損失不準(zhǔn)確的缺點(diǎn)。最終的實(shí)驗(yàn)結(jié)果表明本文的模型不僅有較好的檢測速度,在檢測精度上也優(yōu)于現(xiàn)有的主流目標(biāo)檢測算法。鑒于本模型良好的泛化性能與實(shí)用性,可應(yīng)用于實(shí)際的生產(chǎn)過程中。