亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于邊界極限點(diǎn)特征的改進(jìn)YOLOv3目標(biāo)檢測(cè)

        2023-02-03 03:01:34李克文楊建濤黃宗超
        計(jì)算機(jī)應(yīng)用 2023年1期
        關(guān)鍵詞:特征提取特征檢測(cè)

        李克文,楊建濤,黃宗超

        (中國(guó)石油大學(xué)(華東)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東 青島 266580)

        0 引言

        目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域的基本任務(wù)之一,不僅需要對(duì)目標(biāo)進(jìn)行分類(lèi),而且需要預(yù)測(cè)目標(biāo)所在位置。目標(biāo)檢測(cè)廣泛應(yīng)用于日常生活安全、交通場(chǎng)景檢測(cè)、遙感圖像檢測(cè)、醫(yī)學(xué)圖像檢測(cè)以及自動(dòng)駕駛等領(lǐng)域。隨著深度神經(jīng)網(wǎng)絡(luò)的高速發(fā)展以及深度神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測(cè)領(lǐng)域的廣泛應(yīng)用,當(dāng)前目標(biāo)檢測(cè)算法在計(jì)算機(jī)視覺(jué)領(lǐng)域已經(jīng)取得了相當(dāng)不錯(cuò)的效果[1-3],然而在實(shí)際高精度目標(biāo)檢測(cè)場(chǎng)景下,其檢測(cè)精度仍然不能滿(mǎn)足應(yīng)用需求,對(duì)目標(biāo)實(shí)現(xiàn)高精度檢測(cè)仍然是目標(biāo)檢測(cè)中具有挑戰(zhàn)性的任務(wù)。造成目標(biāo)檢測(cè)困難的原因有兩種:一種是檢測(cè)目標(biāo)較小且數(shù)量眾多;另一種是檢測(cè)目標(biāo)高度重疊,因此在檢測(cè)過(guò)程中極易出現(xiàn)漏檢、誤檢等情況。

        近年來(lái)隨著深度學(xué)習(xí)[4-6]的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用在目標(biāo)檢測(cè)領(lǐng)域,并且取得了一定成果。目標(biāo)檢測(cè)算法主要分為兩大類(lèi):基于邊界框回歸的一階段目標(biāo)檢測(cè)算法和基于候選區(qū)域的兩階段目標(biāo)檢測(cè)算法。一階段目標(biāo)檢測(cè)算法在產(chǎn)生邊界框的同時(shí)對(duì)目標(biāo)進(jìn)行分類(lèi)和回歸,如YOLO(You Only Look Once)系 列[7-9]、SSD(Single Shot MuitiBox Detector)[10]以及RetinaNet[11]目標(biāo)檢測(cè)算法。兩階段目標(biāo)檢測(cè)算法首先生成候選區(qū)域,再對(duì)候選區(qū)域進(jìn)行特征提取,之后對(duì)目標(biāo)分別進(jìn)行分類(lèi)和回歸,如區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Region-Convolutional Neural Network,R-CNN)[12]、Fast RCNN[13]以及Faster R-CNN[14]目標(biāo)檢測(cè)算法。上述目標(biāo)檢測(cè)算法盡管在目標(biāo)檢測(cè)中取得了一些進(jìn)展,但是均采用基于點(diǎn)的邊界框特征表示,該特征感受野有限,缺乏目標(biāo)邊界信息,不能有效表示目標(biāo)實(shí)例語(yǔ)義信息以進(jìn)行回歸訓(xùn)練,而且上述目標(biāo)檢測(cè)算法不能很好地解決中小目標(biāo)檢測(cè)以及目標(biāo)高度重疊的問(wèn)題,以致不能實(shí)現(xiàn)高精度目標(biāo)檢測(cè)。

        針對(duì)上述目標(biāo)檢測(cè)算法存在的問(wèn)題,提出一種基于邊界極限點(diǎn)特征的改進(jìn)YOLOv3 目標(biāo)檢測(cè)算法。首先,引入一種邊界增強(qiáng)算子Border,自適應(yīng)地從邊界極限點(diǎn)中提取邊界特征來(lái)增強(qiáng)已有點(diǎn)特征,使目標(biāo)實(shí)例特征具有較大的感受野以及較強(qiáng)的目標(biāo)邊界信息,解決目標(biāo)高度重疊問(wèn)題,提高目標(biāo)檢測(cè)的準(zhǔn)確率;其次,為解決目標(biāo)檢測(cè)場(chǎng)景下小目標(biāo)檢測(cè)困難的問(wèn)題,通過(guò)增加目標(biāo)檢測(cè)尺度,細(xì)化特征圖,增強(qiáng)特征圖深、淺層語(yǔ)義信息融合,進(jìn)一步提高目標(biāo)檢測(cè)精度;最后,基于目標(biāo)檢測(cè)中改進(jìn)網(wǎng)絡(luò)模型及目標(biāo)實(shí)例特性引入完全交并比(Complete Intersection Over Union,CIoU)函數(shù)[15]分析目標(biāo)物體的尺度敏感性,通過(guò)預(yù)測(cè)框與真實(shí)框的重疊面積、中心點(diǎn)距離和長(zhǎng)寬比改進(jìn)原YOLOv3 損失函數(shù),更好地反映預(yù)測(cè)框和真實(shí)框的重合程度,解決邊界框收斂速度慢、召回率低的問(wèn)題,提高了目標(biāo)檢測(cè)的準(zhǔn)確率。MS COCO 數(shù)據(jù)集[16]上的實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有目標(biāo)檢測(cè)算法相比較,改進(jìn)YOLOv3 算法能夠有效提高目標(biāo)檢測(cè)精度,并且達(dá)到實(shí)時(shí)檢測(cè)效果。

        1 相關(guān)工作

        Redmon 等[7-9]基于一階段邊界框回歸策略提出了YOLO系列目標(biāo)檢測(cè)算法,該系列算法在目標(biāo)檢測(cè)中具有實(shí)時(shí)的檢測(cè)效果和較高的檢測(cè)精度,受到研究學(xué)者的廣泛關(guān)注。此后,許多相關(guān)的改進(jìn)算法被提出,并應(yīng)用于各個(gè)領(lǐng)域。然而,在實(shí)現(xiàn)高精度目標(biāo)檢測(cè)的同時(shí)兼顧檢測(cè)速度方面,相關(guān)改進(jìn)算法并不能提出有效的解決方法。

        Huang 等[17]提出一種基于密集連接和空間金字塔的改進(jìn)算法,采用卷積層的密集連接,并引入改進(jìn)空間金字塔結(jié)構(gòu)加強(qiáng)特征提取,使網(wǎng)絡(luò)全面學(xué)習(xí)目標(biāo)特征,提高檢測(cè)精度;Wu 等[18]利用特征提取網(wǎng)絡(luò)輸出特征圖與殘差結(jié)構(gòu)輸出特征圖進(jìn)行融合,促進(jìn)目標(biāo)特征重用與獲??;Liu 等[19]利用圓形邊界框(Circle-Bounding box,C-Bbox)替換傳統(tǒng)的矩形邊界框,改善非極大值抑制計(jì)算,同時(shí)減少坐標(biāo)預(yù)測(cè),提高目標(biāo)定位精度;Hsu 等[20]提出比率和尺度感知(Ratio Scale Aware-YOLO,RSA-YOLO)算法,解決目標(biāo)縱橫比差異較大的問(wèn)題,提高邊界框收斂速度。

        以上改進(jìn)算法相較于YOLO 系列目標(biāo)檢測(cè)算法在檢測(cè)精度上均有提升,但是面對(duì)實(shí)時(shí)高精度目標(biāo)檢測(cè)任務(wù)時(shí),都不能在保證對(duì)目標(biāo)進(jìn)行高精度檢測(cè)的同時(shí)確保實(shí)時(shí)性。本文提出一種基于邊界極限點(diǎn)特征的改進(jìn)YOLOv3 目標(biāo)檢測(cè)算法,在COCO 數(shù)據(jù)集上驗(yàn)證了所提算法的高效性。

        2 YOLOv3目標(biāo)檢測(cè)算法

        YOLOv3 以YOLOv2 為基礎(chǔ)進(jìn)行改進(jìn),在識(shí)別速度和精度上有了明顯的提高。YOLOv3 使用Darknet-53[9]全卷積網(wǎng)絡(luò)作為骨干網(wǎng)絡(luò)進(jìn)行特征提取,如表1 所示,Convolutional 為卷積層。Darknet-53 包含52 個(gè)卷積層和1 個(gè)全連接層,并且交替使用大小為1 和3 的卷積核進(jìn)行卷積,能夠提取豐富的目標(biāo)實(shí)例語(yǔ)義信息;同時(shí)Darknet-53 使用了Residual 殘差模塊[4]和批歸一化層(Batch Normalization,BN),解決了因網(wǎng)絡(luò)加深而出現(xiàn)的網(wǎng)絡(luò)過(guò)擬合以及性能下降問(wèn)題。

        表1 Darknet-53網(wǎng)絡(luò)結(jié)構(gòu)Tab.1 Darknet-53 network architecture

        不同尺度的特征圖感受野具有的語(yǔ)義信息粒度不同,為提高目標(biāo)檢測(cè)精度,YOLOv3 在加深網(wǎng)絡(luò)的同時(shí)采用特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network,F(xiàn)PN)[21]中的金字塔結(jié)構(gòu),將多種尺度特征圖融合幫助網(wǎng)絡(luò)學(xué)習(xí)不同尺度的特征信息,然后將融合后的特征信息輸入預(yù)測(cè)層進(jìn)行多尺度目標(biāo)預(yù)測(cè)。FPN 對(duì)最后獲得的特征圖進(jìn)行兩次上采樣,得到三個(gè)尺度的特征圖,之后融合特征提取網(wǎng)絡(luò)中同尺度的細(xì)粒度特征,分別進(jìn)行三種不同尺度的目標(biāo)預(yù)測(cè)。對(duì)于輸入大小為416×416 的圖像,特征提取網(wǎng)絡(luò)獲得其32 倍下采樣13×13 大小的特征圖,該特征圖具有較大的感受野,包含更加抽象的語(yǔ)義信息,適合大尺度目標(biāo)檢測(cè)。為檢測(cè)中等尺度的目標(biāo),對(duì)大小為13×13 的特征圖進(jìn)行上采樣得到26×26 大小的特征圖,與特征提取網(wǎng)絡(luò)中同尺度特征圖進(jìn)行深度拼接;同樣,對(duì)大小為26×26 的特征圖進(jìn)行上采樣得到52×52 大小的特征圖,并與特征提取網(wǎng)絡(luò)中同尺度特征圖進(jìn)行深度拼接,得到8 倍下采樣52×52 大小的特征圖,該特征圖感受野最小,適合檢測(cè)小尺度目標(biāo)。

        YOLOv3 目標(biāo)檢測(cè)算法采用anchor box 機(jī)制分別為3 種尺度的特征圖設(shè)置3 種先驗(yàn)框,如表2 所示,這些先驗(yàn)框由K-means 聚類(lèi)算法根據(jù)COCO 數(shù)據(jù)集聚類(lèi)得到,生成9 種尺寸的先驗(yàn)框。通過(guò)對(duì)3 種尺度特征圖進(jìn)行分類(lèi)和邊界框回歸,特征圖上的每個(gè)網(wǎng)格會(huì)根據(jù)預(yù)先設(shè)置的先驗(yàn)框預(yù)測(cè)出3個(gè)邊界框,每個(gè)邊界框包含k個(gè)類(lèi)別的概率、1 個(gè)置信度以及4 個(gè)邊界框位置回歸參數(shù)。每個(gè)網(wǎng)格預(yù)測(cè)輸出(4+1+k)×3 維向量,分別對(duì)應(yīng)預(yù)測(cè)得到的邊界框位置回歸參數(shù)、置信度以及每個(gè)類(lèi)別的概率。

        表2 不同尺度先驗(yàn)框Tab.2 Prior boxes with different scales

        YOLOv3 損失函數(shù)分為三個(gè)部分,包括目標(biāo)定位損失Lloc、目標(biāo)置信度損失Lconf以及目標(biāo)分類(lèi)損失Lobj,分別如式(1)~(3)所示,YOLOv3 總的損失LYOLO為三個(gè)損失之和,如式(4)所示。為更好地進(jìn)行目標(biāo)檢測(cè)回歸訓(xùn)練并平衡各項(xiàng)損失的比重,增加較大的權(quán)重λloc=5 于坐標(biāo)損失,對(duì)于不含檢測(cè)目標(biāo)的置信度損失給予較小的權(quán)重λnoobj=0.5。

        其中:s2為劃分圖片的網(wǎng)格數(shù);B為每個(gè)網(wǎng)格預(yù)測(cè)的邊界框數(shù);圖片第i個(gè)網(wǎng)格中第j個(gè)邊界框負(fù)責(zé)預(yù)測(cè)目標(biāo)時(shí),為1,否則為0;圖片第i個(gè)網(wǎng)格中第j個(gè)邊界框不負(fù)責(zé)預(yù)測(cè)目標(biāo)時(shí)為1,否則為0;圖片第i個(gè)網(wǎng)格中存在預(yù)測(cè)目標(biāo)時(shí),為1,否則為0。

        3 改進(jìn)YOLOv3目標(biāo)檢測(cè)算法

        針對(duì)目標(biāo)檢測(cè)場(chǎng)景中待檢測(cè)目標(biāo)數(shù)量眾多、目標(biāo)尺度較小、目標(biāo)高度重疊等問(wèn)題,本文改進(jìn)YOLOv3 目標(biāo)檢測(cè)算法首先引入邊界增強(qiáng)算子Border,增強(qiáng)目標(biāo)實(shí)例特征的目標(biāo)邊界信息以及感受野信息,解決目標(biāo)高度重疊問(wèn)題,提高目標(biāo)檢測(cè)的準(zhǔn)確率;其次,增加目標(biāo)檢測(cè)尺度,細(xì)化特征圖,增強(qiáng)特征圖深、淺層語(yǔ)義信息的融合,解決目標(biāo)檢測(cè)場(chǎng)景下小目標(biāo)檢測(cè)不易問(wèn)題;最后,基于目標(biāo)檢測(cè)中改進(jìn)網(wǎng)絡(luò)模型及目標(biāo)實(shí)例特性引入CIoU 函數(shù)分析目標(biāo)物體的尺度敏感性,通過(guò)預(yù)測(cè)框與真實(shí)框的重疊面積、中心點(diǎn)距離以及長(zhǎng)寬比三個(gè)因素改進(jìn)原YOLOv3 損失函數(shù),更好地反映預(yù)測(cè)框和真實(shí)框的重合程度,解決邊界框回歸收斂速度慢、召回率低的問(wèn)題,提高目標(biāo)檢測(cè)的準(zhǔn)確率。

        3.1 邊界特征提取

        YOLOv3 目標(biāo)檢測(cè)算法采用基于單點(diǎn)特征的邊界框預(yù)測(cè)目標(biāo),這些邊界框由網(wǎng)格上的每個(gè)點(diǎn)進(jìn)行預(yù)測(cè),如圖1(a)所示,由于沒(méi)有進(jìn)行額外的特征提取,這種單點(diǎn)特征便于目標(biāo)定位與目標(biāo)分類(lèi);但是,較小的點(diǎn)特征感受野不能很好地表示目標(biāo)實(shí)例的語(yǔ)義信息,而且缺少目標(biāo)邊界信息來(lái)更好地進(jìn)行回歸預(yù)測(cè),不能有效解決目標(biāo)重疊問(wèn)題。因此,引入邊界特征提取算子Border,直接利用邊界框每條邊的極限點(diǎn)特征以增強(qiáng)原單點(diǎn)特征,如圖1(b)所示,Border 專(zhuān)注于邊界極限點(diǎn),自適應(yīng)地提取目標(biāo)邊界的代表性特征,計(jì)算量較小,提升了準(zhǔn)確率。

        圖1 不同特征提取策略Fig.1 Different feature extraction strategies

        與現(xiàn)有的單點(diǎn)特征增強(qiáng)[18-20]技術(shù)相比,Border 的計(jì)算量更小,檢測(cè)速度更快,準(zhǔn)確率更高。如圖2(a)所示,圓點(diǎn)為檢測(cè)目標(biāo)的單點(diǎn)特征表示,沒(méi)有明確的目標(biāo)邊界信息,會(huì)限制目標(biāo)檢測(cè)算法的定位能力;如圖2(b)所示,從邊界框的整個(gè)區(qū)域提取特征來(lái)增強(qiáng)單點(diǎn)特征,這種操作能夠提供比單點(diǎn)特征表示更加豐富的語(yǔ)義信息,但是計(jì)算冗余,容易受到背景特征的干擾;如圖2(c)所示,通過(guò)提取邊界框每條邊的全部點(diǎn)特征來(lái)增強(qiáng)單點(diǎn)特征,在一定程度上減少了計(jì)算冗余,但還是會(huì)受到背景信息的干擾;如圖2(d)所示,自適應(yīng)提取邊界框極值點(diǎn)特征來(lái)增強(qiáng)單點(diǎn)特征,能夠科學(xué)利用邊界特征精確地定位目標(biāo),避免特征計(jì)算冗余以及背景信息的干擾。

        圖2 不同點(diǎn)特征增強(qiáng)技術(shù)Fig.2 Different point feature enhancement techniques

        自適應(yīng)邊界特征提取算子Border 采用具有5C通道的邊界敏感特征作為輸入,輸入特征的其中4C通道分別對(duì)應(yīng)邊界框的四個(gè)邊界(上、下、左、右),剩余C通道對(duì)應(yīng)原始的單點(diǎn)特征。Border 的體系結(jié)構(gòu)如圖3 所示,Border 將特征提取網(wǎng)絡(luò)13×13×C的輸出特征圖映射為13×13×5C的特征圖作為輸入,對(duì)每個(gè)邊界均勻采樣N個(gè)點(diǎn),選取其中的最大值作為該邊界的極限點(diǎn)特征對(duì)單點(diǎn)特征進(jìn)行增強(qiáng),最后將13×13×5C的輸出特征圖降維為13×13×C的特征圖作為YOLO 算法檢測(cè)分支的輸入。

        圖3 Border結(jié)構(gòu)Fig.3 Border architecture

        Border 采用自適應(yīng)邊界極限點(diǎn)特征提取策略,假設(shè)輸入特征的映射順序?yàn)辄c(diǎn)、左邊界、上邊界、右邊界、下邊界,則輸出特征映射F如式(5)所示:

        其中:Ic是輸入特征圖;Fc(i,j)是輸出特征圖F的第c個(gè)通道第(i,j)個(gè)點(diǎn)的特征值;(x0,y0,x1,y1)是點(diǎn)(i,j)的邊界框預(yù)測(cè)回歸信息;w和h分別是邊界框的寬和高;N是邊界框每條邊的采樣點(diǎn)個(gè)數(shù)。為了避免量化誤差,對(duì)輸入特征圖上的特征值使用雙線(xiàn)性插值算法精確計(jì)算每個(gè)采樣點(diǎn)的特征值。

        3.2 多尺度檢測(cè)

        YOLOv3 目標(biāo)檢測(cè)算法通過(guò)Darknet-53 對(duì)目標(biāo)實(shí)例進(jìn)行特征提取,該網(wǎng)絡(luò)共有53 層,利用大小為3 的卷積核進(jìn)行卷積操作。Darknet-53 經(jīng)過(guò)深層次卷積提取特征后,感受野較大,但是犧牲了空間分辨率,丟失了目標(biāo)實(shí)例語(yǔ)義信息。在目標(biāo)檢測(cè)場(chǎng)景中還存在小目標(biāo)數(shù)量多的問(wèn)題,這些問(wèn)題大多依賴(lài)于淺層細(xì)粒度特征。盡管YOLOv3 通過(guò)三個(gè)尺度檢測(cè)目標(biāo),但輸出特征圖維度較低,極易出現(xiàn)漏檢、誤檢,不能很好地解決小目標(biāo)檢測(cè)問(wèn)題,檢測(cè)精度較低。

        為了進(jìn)一步解決目標(biāo)檢測(cè)中小目標(biāo)檢測(cè)難的問(wèn)題,本文以YOLOv3 網(wǎng)絡(luò)結(jié)構(gòu)為基礎(chǔ),綜合考慮檢測(cè)網(wǎng)絡(luò)準(zhǔn)確率與性能,采用原始網(wǎng)絡(luò)圖像輸入大小416×416,對(duì)特征提取網(wǎng)絡(luò)的13×13 輸出特征圖進(jìn)行三次上采樣,即在原始網(wǎng)絡(luò)結(jié)構(gòu)上增加一個(gè)104×104 的檢測(cè)分支,與特征提取網(wǎng)絡(luò)中相同大小特征圖進(jìn)行深度拼接,得到4 倍下采樣104×104 大小的特征圖,該特征圖感受野最小,適合檢測(cè)小尺度目標(biāo)。改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示,采用13×13、26×26、52×52、104×104 四個(gè)尺度檢測(cè),細(xì)化特征提取網(wǎng)絡(luò)輸出,增強(qiáng)特征圖深、淺層語(yǔ)義信息融合,以解決目標(biāo)檢測(cè)場(chǎng)景下小目標(biāo)檢測(cè)難的問(wèn)題。

        圖4 改進(jìn)后網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Improved network structure

        3.3 損失函數(shù)

        YOLOv3 檢測(cè)算法作為端到端的一階段目標(biāo)檢測(cè)算法,損失函數(shù)由目標(biāo)定位、置信度以及分類(lèi)損失三部分組成,其中目標(biāo)定位損失使用均方差(Mean Square Error,MSE)損失函數(shù)計(jì)算。交并比(Intersection over Union,IoU)[7]是目標(biāo)檢測(cè)任務(wù)中常用的指標(biāo),由于IoU 是比值的概念,對(duì)目標(biāo)物體的尺度不敏感,然而目標(biāo)定位損失中使用的MSE 損失函數(shù)對(duì)目標(biāo)物體的尺度是敏感的,因此在優(yōu)化過(guò)程中目標(biāo)定位損失優(yōu)化和IoU 優(yōu)化不等價(jià)。在目標(biāo)檢測(cè)算法中上述目標(biāo)定位損失存在的問(wèn)題會(huì)導(dǎo)致邊界框回歸收斂速度過(guò)慢以及目標(biāo)檢測(cè)定位精度低,不能夠很好地滿(mǎn)足目標(biāo)檢測(cè)任務(wù)實(shí)時(shí)、高精度的需求。

        通過(guò)分析目標(biāo)檢測(cè)中目標(biāo)實(shí)例特點(diǎn)以及改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu),本文采用CIoU 函數(shù)來(lái)計(jì)算目標(biāo)定位損失,CIoU 函數(shù)包括預(yù)測(cè)框與真實(shí)框的三個(gè)幾何因素,即重疊面積、中心點(diǎn)距離和長(zhǎng)寬比,能夠更好地反映重合程度,提高定位準(zhǔn)確度,CIoU示意如圖5 所示。

        圖5 CIoU示意圖Fig.5 CIoU schematic

        CIoU 計(jì)算式為:

        其中:fIoU是真實(shí)框與預(yù)測(cè)框的交并比;d是真實(shí)框與預(yù)測(cè)框的中心點(diǎn)距離;s是真實(shí)框與預(yù)測(cè)框最小外接矩形對(duì)角線(xiàn)的長(zhǎng)度;α是平衡參數(shù);v用于計(jì)算真實(shí)框與預(yù)測(cè)框的長(zhǎng)寬比。v、α計(jì)算式如下所示:

        其中:wgt與hgt為真實(shí)框的寬與高;w與h為預(yù)測(cè)框的寬與高,因此,目標(biāo)定位損失函數(shù)可以定義為:

        4 實(shí)驗(yàn)與結(jié)果分析

        4.1 實(shí)驗(yàn)方法與設(shè)置

        在COCO 數(shù)據(jù)集上驗(yàn)證本文改進(jìn)YOLOv3 算法的有效性,其中COCO 數(shù)據(jù)集包含80 類(lèi)目標(biāo),且小目標(biāo)居多。為了達(dá)到更好的驗(yàn)證效果,本文使用的評(píng)價(jià)指標(biāo)包含:IoU 為0.5∶0.05∶0.9 時(shí)的平均精度(Average Precision,AP);IoU 為0.5 時(shí)的平均精度(AP50);IoU 為0.75 時(shí)的平均精度(AP75);APS、APM、APL分別為小、中、大型目標(biāo)的AP;每秒檢測(cè)的圖像幀數(shù)(Frames Per Second,F(xiàn)PS)為目標(biāo)檢測(cè)網(wǎng)絡(luò)的檢測(cè)速度。

        實(shí)驗(yàn)在COCO 訓(xùn)練集上訓(xùn)練,在COCO 測(cè)試集上測(cè)試評(píng)估,使用Darknet-53 作為骨干網(wǎng)絡(luò)。訓(xùn)練階段首先利用ImageNet 數(shù)據(jù)集預(yù)訓(xùn)練的權(quán)重初始化骨干網(wǎng)絡(luò),然后參照文獻(xiàn)[9]的實(shí)驗(yàn)環(huán)境設(shè)置,整個(gè)算法迭代次數(shù)為9 × 104,初始學(xué)習(xí)率設(shè)置為10-2,分別在6 × 104次和8 × 104次時(shí)將學(xué)習(xí)率降低為原來(lái)的1/10,最終學(xué)習(xí)率為10-4,動(dòng)量因子為0.9,權(quán)重衰減系數(shù)為10-4,采用隨機(jī)梯度下降法優(yōu)化損失函數(shù)。

        4.2 邊界增強(qiáng)算子Border實(shí)驗(yàn)與分析

        邊界增強(qiáng)算子Border 首先需要對(duì)目標(biāo)邊界框每條邊進(jìn)行均勻多點(diǎn)采樣,之后自適應(yīng)選取每條邊界最大值作為極限點(diǎn)。采用實(shí)驗(yàn)分析采樣點(diǎn)個(gè)數(shù)對(duì)目標(biāo)檢測(cè)算法性能的影響,比較不同采樣點(diǎn)大小下算法的檢測(cè)性能,實(shí)驗(yàn)結(jié)果如表3 所示。當(dāng)采樣點(diǎn)個(gè)數(shù)為0 時(shí),實(shí)驗(yàn)結(jié)果等價(jià)于YOLOv3 算法性能;當(dāng)采樣點(diǎn)個(gè)數(shù)較少時(shí),檢測(cè)精度提升較小且效果不穩(wěn)定;當(dāng)采樣點(diǎn)個(gè)數(shù)較多時(shí)會(huì)導(dǎo)致額外的計(jì)算量,精度提升較大但檢測(cè)速率較慢。因此,最終設(shè)置10 為采樣點(diǎn)個(gè)數(shù),此時(shí)精度提升較大且檢測(cè)速率較快。

        表3 不同采樣點(diǎn)個(gè)數(shù)下算法性能對(duì)比Tab.3 Comparison of algorithm performance under different number of sampling points

        為了驗(yàn)證本文采用的Border 的效果,提供了對(duì)圖2 不同單點(diǎn)特征增強(qiáng)技術(shù)的更深層次分析。首先,采用YOLOv3 目標(biāo)檢測(cè)算法在COCO 數(shù)據(jù)集上的檢測(cè)結(jié)果作為基線(xiàn);隨后依次采用圖2 中展示的特征增強(qiáng)技術(shù)驗(yàn)證單點(diǎn)特征的增強(qiáng)結(jié)果。如表4 所示,邊界框區(qū)域特征Fregion能夠顯著增強(qiáng)單點(diǎn)特征,使用區(qū)域特征對(duì)單點(diǎn)特征進(jìn)行增強(qiáng),AP 較YOLOv3 提高1.8 個(gè)百分點(diǎn);當(dāng)邊界框區(qū)域特征用于增強(qiáng)單點(diǎn)特征時(shí),邊界特征FBorder在區(qū)域特征中起主要作用,如果忽略邊界框區(qū)域特征的內(nèi)部區(qū)域只引入邊界特征,相較于Fregion,AP 只下降0.3 個(gè)百分點(diǎn);與Fregion相比,邊界極限點(diǎn)特征Fmax能夠在采樣點(diǎn)N較少的情況下達(dá)到相近的性能,在某些情況下更優(yōu)。對(duì)于目標(biāo)檢測(cè),使用邊界框區(qū)域或者邊界特征進(jìn)行特征增強(qiáng)是冗余的。因此,對(duì)于目標(biāo)的特征表示,本文引入的自適應(yīng)提取邊界極限點(diǎn)特征來(lái)增強(qiáng)單點(diǎn)特征的策略能夠更好地提高目標(biāo)檢測(cè)器的性能。

        表4 不同特征增強(qiáng)技術(shù)效果對(duì)比Tab.4 Comparison of effect of different feature enhancement techniques

        4.3 消融實(shí)驗(yàn)與分析

        本文提出的基于邊界極限點(diǎn)特征的改進(jìn)YOLOv3 目標(biāo)檢測(cè)算法采用Border、增加檢測(cè)尺度以及損失函數(shù)優(yōu)化的方法提高目標(biāo)檢測(cè)算法的檢測(cè)效果。為了驗(yàn)證本文算法對(duì)于高精度目標(biāo)檢測(cè)的有效性,選取各個(gè)改進(jìn)模塊進(jìn)行消融實(shí)驗(yàn),結(jié)果如表5 所示。從表5 的實(shí)驗(yàn)結(jié)果可知,在使用Border后,AP 較YOLOv3 提高了1.7 個(gè)百分點(diǎn),表明使用Border 后檢測(cè)目標(biāo)特征被增強(qiáng),具有明顯的邊界特征,提升了檢測(cè)效果。在使用增加檢測(cè)尺度的方法后,APS提升1.1 個(gè)百分點(diǎn),APM提升0.8 個(gè)百分點(diǎn),APL提升0.3 個(gè)百分點(diǎn),表明增加檢測(cè)尺度后,增強(qiáng)了特征圖深淺層語(yǔ)義信息融合,顯著提高了檢測(cè)算法對(duì)中小目標(biāo)的檢測(cè)效果,驗(yàn)證了增加檢測(cè)尺度方法的有效性。優(yōu)化損失函數(shù)后,AP75相較AP50提升較大,表明該模塊能夠顯著提高檢測(cè)框的召回率,提高目標(biāo)定位準(zhǔn)確度,改善檢測(cè)效果。通過(guò)三大模塊結(jié)合進(jìn)行實(shí)驗(yàn)獲得了最好的性能,AP 相較于YOLOv3 原模型提高了3.9 個(gè)百分點(diǎn),表明本文的改進(jìn)算法對(duì)目標(biāo)檢測(cè)的高精度檢測(cè)是有效的。

        表5 不同模塊消融實(shí)驗(yàn)結(jié)果對(duì)比 單位:%Tab.5 Comparison of ablation experiment results of different modules unit:%

        4.4 不同算法對(duì)比實(shí)驗(yàn)與分析

        為驗(yàn)證本文提出的改進(jìn)YOLOv3 目標(biāo)檢測(cè)算法的檢測(cè)效果,采用當(dāng)前較為先進(jìn)的目標(biāo)檢測(cè)算法與改進(jìn)YOLOv3 目標(biāo)檢測(cè)算法在COCO 數(shù)據(jù)集上進(jìn)行對(duì)比。其中:Faster RCNN+++[4]、Cascade RPN(Cascade Region Proposal Network)[22]、Faster R-CNN by G-RMI(Google-Research and Machine Intelligence)[23]、TDM(Top-Down Modulation)[24]均為Faster RCNN 的改進(jìn)算法,對(duì)大目標(biāo)的檢測(cè)效果較好;SSD513[10]、DSSD 513(Deconvolutional Single Shot Detector)[25]、EfficientDet-D0[26]算法具有較好的穩(wěn)定性;YOLOv3+ASFF*(Adaptively Spatial Feature Fusion)[27]、交互的目標(biāo)檢測(cè)與實(shí)例分割網(wǎng)絡(luò)(Reciprocal Object Detection and Instance Segmentation Net,RDSNet)[28]、高效特征化圖金字塔(Efficient Featurized Image Pyramid,EFIP)[29]、M2Det[29]具有較好的檢測(cè)效果,且對(duì)中小目標(biāo)檢測(cè)精度較高。

        如表6 所示,本文算法的AP 為36.6%,相較于其他算法精度更高;AP75為37.8%,表明其召回率較高,相比其他算法具有更好的目標(biāo)定位準(zhǔn)確度;APS和APM分別為21.7%和38.5%,表明其在中小目標(biāo)檢測(cè)方面也優(yōu)于其他目標(biāo)檢測(cè)算法。從表6 中也可以得知,相較于YOLO 系列目標(biāo)檢測(cè)算法,本文算法的AP 提高了3.9 個(gè)百分點(diǎn),具有更好的檢測(cè)效果;相較于EfficientDet-D0、YOLOv3+ASFF*以及RDSNet 算法,本文算法在小、中尺度目標(biāo)檢測(cè)效果較好;相較于R-CNN 系列目標(biāo)檢測(cè)算法,本文算法的檢測(cè)效果更優(yōu)。因此,相較于對(duì)比算法,本文算法更具優(yōu)勢(shì),能夠提高綜合的目標(biāo)檢測(cè)效果,具有很大的前景優(yōu)勢(shì)。

        表6 不同算法檢測(cè)效果對(duì)比 單位:%Tab.6 Detection effect comparison of different algorithms unit:%

        圖6 展示了本文改進(jìn)算法在COCO 數(shù)據(jù)集中對(duì)目標(biāo)的檢測(cè)效果,從圖中可以看出本文檢測(cè)算法能夠很好地對(duì)目標(biāo)進(jìn)行定位,具有較高的定位準(zhǔn)確度;同時(shí)也可以看出,本文算法能夠準(zhǔn)確地識(shí)別出物體的類(lèi)別,具有較好的檢測(cè)效果。

        圖6 預(yù)測(cè)效果展示Fig.6 Predictive effect display

        5 結(jié)語(yǔ)

        為了滿(mǎn)足目標(biāo)檢測(cè)實(shí)景條件下對(duì)于目標(biāo)檢測(cè)算法中實(shí)時(shí)性以及高準(zhǔn)確性的要求,盡可能避免誤檢、漏檢情況,本文提出一種基于邊界極限點(diǎn)特征的改進(jìn)YOLOv3 目標(biāo)檢測(cè)算法,引入一種邊界增強(qiáng)算子Border,增加目標(biāo)檢測(cè)尺度以及損失函數(shù)改進(jìn),提高了算法的準(zhǔn)確度和收斂速度。實(shí)驗(yàn)結(jié)果表明,相較于其他目標(biāo)檢測(cè)算法,本文提出的改進(jìn)YOLOv3目標(biāo)檢測(cè)算法能夠更好地提取目標(biāo)實(shí)例語(yǔ)義信息,獲得較好的檢測(cè)效果。在未來(lái)的目標(biāo)檢測(cè)算法研究中,將進(jìn)一步優(yōu)化目標(biāo)檢測(cè)網(wǎng)絡(luò)模型,提高檢測(cè)精度,加快檢測(cè),結(jié)合當(dāng)前深度學(xué)習(xí)先進(jìn)技術(shù)進(jìn)一步提升檢測(cè)效果,利用改進(jìn)的目標(biāo)檢測(cè)算法解決生活中更加復(fù)雜的目標(biāo)檢測(cè)難題。

        猜你喜歡
        特征提取特征檢測(cè)
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        如何表達(dá)“特征”
        基于Gazebo仿真環(huán)境的ORB特征提取與比對(duì)的研究
        電子制作(2019年15期)2019-08-27 01:12:00
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        一種基于LBP 特征提取和稀疏表示的肝病識(shí)別算法
        小波變換在PCB缺陷檢測(cè)中的應(yīng)用
        基于MED和循環(huán)域解調(diào)的多故障特征提取
        亚洲成人av一区免费看| 福利网址在线观看| 亚洲av成人在线网站| 精品国产日产av在线| 久久无码潮喷a片无码高潮| 97人人模人人爽人人喊电影| 超91精品手机国产在线| 国产自产自现在线视频地址| 国产偷国产偷亚洲综合av| 亚洲人成77777在线播放网站 | av永远在线免费观看| 青青河边草免费在线看的视频| 无码va在线观看| 99热在线精品播放| 一区二区三区在线免费av| 青青草免费手机视频在线观看| 777亚洲精品乱码久久久久久| 国产精品亚洲欧美天海翼| 亚洲色图在线视频观看| 极品粉嫩小仙女高潮喷水网站| 在线高清理伦片a| 国产91福利在线精品剧情尤物| 国内偷拍视频一区二区| 亚洲中文字幕av天堂自拍| 性一交一乱一伧国产女士spa | 亚洲女人天堂成人av在线| 国产精品私密保养| 999久久久免费精品国产| 亚洲第一免费播放区| 国产一区二区三区最新地址| 人妻色综合网站| 成年女人免费v片| 亚洲av第二区国产精品| 欧美怡春院一区二区三区| 亚洲美免无码中文字幕在线| 亚洲av永久青草无码精品| 97青草超碰久久国内精品91| 免费操逼视频| 亚洲色AV性色在线观看| 少妇人妻精品一区二区三区视 | 亚洲国产精品激情综合色婷婷|