亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于新型算子采樣優(yōu)化的交通標(biāo)志檢測(cè)網(wǎng)絡(luò)

        2022-10-16 12:28:02陳春輝馬社祥
        計(jì)算機(jī)工程 2022年10期
        關(guān)鍵詞:交通標(biāo)志算子卷積

        陳春輝,馬社祥

        (天津理工大學(xué) 集成電路科學(xué)與工程學(xué)院,天津 300384)

        0 概述

        交通標(biāo)志識(shí)別是智能交通系統(tǒng)中的重要組成部分。無(wú)論是自動(dòng)駕駛系統(tǒng)還是輔助駕駛系統(tǒng),交通標(biāo)志識(shí)別為駕駛員提供必要的路況信息、方向指示、交通預(yù)警,以確保行車安全。但是,在實(shí)際行車環(huán)境中,道路情況千變?nèi)f化。因此,如何在復(fù)雜環(huán)境下高效、精確地識(shí)別小目標(biāo)、模糊目標(biāo)及遮擋目標(biāo)對(duì)于交通標(biāo)志識(shí)別具有重要意義[1-3]。

        近年來(lái),深度學(xué)習(xí)飛速發(fā)展。卷積算子是組成現(xiàn)代神經(jīng)網(wǎng)絡(luò)的核心。由卷積算子構(gòu)成的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)在目標(biāo)檢測(cè)領(lǐng)域中取得顯著進(jìn)展。檢測(cè)網(wǎng)絡(luò)主要分為一階段檢測(cè)器和兩階段檢測(cè)器。一階段檢測(cè)器直接回歸物體的類別概率和位置信息,具有檢測(cè)速度快、準(zhǔn)確率低的特點(diǎn),代表性算法有YOLO[4]、SSD[5]、YOLOv2[6]、RetinaNet[7]、YOLOv3[8]等。兩階段檢測(cè)器需要先進(jìn)行候選區(qū)域算法,再通過(guò)網(wǎng)絡(luò)進(jìn)行分類,與一階段檢測(cè)器相比速度較慢,但是準(zhǔn)確率較高,代表性算法有SPPNet[9]、RCNN[10]、Fast R-CNN[11]、Faster R-CNN[12]等。

        傳統(tǒng)機(jī)器學(xué)習(xí)根據(jù)顏色和形狀的區(qū)別進(jìn)行交通標(biāo)志檢測(cè)[13-15]。與傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,深度學(xué)習(xí)在檢測(cè)交通標(biāo)志過(guò)程中更加高效、精確。研究人員提出一種引入深度可分離卷積(Depthwise Separable Convolution,DSC)[16]和改進(jìn)正負(fù)樣本處理算法,以YOLOv3 檢測(cè)精度,但是檢測(cè)所需時(shí)間較長(zhǎng)。文獻(xiàn)[17]介紹一種通過(guò)精簡(jiǎn)主干網(wǎng)絡(luò),以增加特征提取尺度,從而加快YOLOv4 算法的檢測(cè)速度,但是對(duì)交通標(biāo)志的檢測(cè)精度還有待提升。YOLOv5 算法同時(shí)兼顧速度和精度等優(yōu)點(diǎn)獲得廣泛應(yīng)用,但是當(dāng)面對(duì)交通標(biāo)志這類小目標(biāo)較多的任務(wù)時(shí),采用堆疊大量卷積核進(jìn)行下采樣的方式,使得采樣特征失去表達(dá)能力[18],難以靈活地調(diào)整內(nèi)部參數(shù),從而丟失圖像的細(xì)節(jié)信息,導(dǎo)致檢測(cè)算法對(duì)小目標(biāo)、遮擋目標(biāo)的檢測(cè)能力降低。

        本文提出基于YOLOv5 的端到端改進(jìn)網(wǎng)絡(luò)。以新型算子[19]作為采樣架構(gòu),通過(guò)自卷積方式減少通道冗余,同時(shí)采用控制變量的實(shí)驗(yàn)方式分析網(wǎng)絡(luò)深度與采樣信息的關(guān)系,結(jié)合注意力機(jī)制,構(gòu)建跨階段注意力機(jī)制(AMCSP)模塊,增加通道的重要性權(quán)值。利用優(yōu)化的通道聚合網(wǎng)絡(luò)(Path Aggregation Network,PAN)[20]進(jìn)行特征融合,采用K-means 聚類算法重新定義適合交通標(biāo)志的先驗(yàn)框,在保證檢測(cè)精度的同時(shí)大幅減少模型計(jì)算量。在此基礎(chǔ)上,通過(guò)引入距離交并比(Distance Intersection Over Union,DIOU)[21]函數(shù)進(jìn)行非極大值抑制,采用加入懲罰項(xiàng)的方式,使得目標(biāo)框之間的距離最小化,從而提升檢測(cè)精度和回歸效率。

        1 新型算子

        傳統(tǒng)卷積核的設(shè)計(jì)主要有2 個(gè)重要性質(zhì):1)空間無(wú)關(guān)性,采用一個(gè)卷積核處理一張?zhí)卣鲌D,不會(huì)因?yàn)閳D像內(nèi)空間變換而改變卷積核的權(quán)值,即全部滑窗共享權(quán)值;2)通道特異性,輸入圖像通道數(shù)量等于卷積核通道數(shù)量,即每個(gè)圖像通道獨(dú)享其對(duì)應(yīng)的卷積核。卷積運(yùn)算流程如圖1 所示。

        圖1 卷積運(yùn)算流程Fig.1 Convolution calculation procedure

        空間無(wú)關(guān)性可以有效減少網(wǎng)絡(luò)的參數(shù)量,但由于卷積核提取的特征單一,因此無(wú)法根據(jù)應(yīng)用場(chǎng)景靈活地調(diào)整參數(shù)。而通道特異性無(wú)法使得通道參數(shù)共享,導(dǎo)致網(wǎng)絡(luò)模型通道參數(shù)冗余。為了解決以上問(wèn)題,具有空間特異性和通道無(wú)關(guān)性的Involution 算子(Inv)被提出。與卷積核設(shè)計(jì)理念相反,Inv 算子的通道無(wú)關(guān)性是在更高的維度上,即整個(gè)輸入通道范圍共享G(G?C)個(gè)Inv 核參數(shù);空間特異性表示Inv 在同一通道不同空間位置上獨(dú)享Inv 核參數(shù)。每個(gè)Inv 核由輸入圖像本身生成,如式(1)所示:

        其中:Hij∈RH×W×K×K×G表示Inv 核;XΔij表示在特征圖上一個(gè)坐標(biāo)為(i,j)的鄰域集合。為了更好地契合YOLOv5 模型框架,減少模型參數(shù)量,本文使用SiLU作為Φ的非線性激活函數(shù),如式(2)和式(3)所示:

        Inv 采樣計(jì)算可以認(rèn)為是一種自注意機(jī)制的應(yīng)用,基于PyTorch 框架的偽代碼實(shí)現(xiàn)。Involution 算子采樣計(jì)算流程如圖2 所示。本文通過(guò)Unfold 滑窗函數(shù)將數(shù)據(jù)打包壓縮,數(shù)據(jù)通過(guò)Φ步驟產(chǎn)生核函數(shù),調(diào)整兩者維度為(B,G,C//G,K×K,H,W);將數(shù)據(jù)與核函數(shù)相乘疊加,調(diào)整維度為(B,C,H,W)輸出。其中,B表示數(shù)據(jù)批量大小,C表示通道數(shù)量,K表示Inv 核大小,H、W表示特征圖的高和寬,Ci、Co表示輸入與輸出通道維度。

        圖2 Involution 算子采樣計(jì)算流程Fig.2 Sampling calculation procedure of Involution operator

        2 交通標(biāo)志檢測(cè)網(wǎng)絡(luò)

        2.1 改進(jìn)的特征提取網(wǎng)絡(luò)

        跨階段注意力機(jī)制(AMCSP)模塊結(jié)構(gòu)如圖3所示。

        圖3 跨階段注意力機(jī)制模塊結(jié)構(gòu)Fig.3 Structure of cross stage attention mechanism module

        圖中虛線框所示為YOLOv5 使用的跨階段局部(Cross Stage Partial,CSP)模塊,其中,n表示結(jié)構(gòu)中Bottleneck 模塊的重復(fù)次數(shù)。這種殘差結(jié)構(gòu)通過(guò)將梯度信息分別集中到特征圖中,在保證精度的同時(shí)提高算術(shù)單元利用率。但是CSP 模塊對(duì)于檢測(cè)交通標(biāo)志這樣的小目標(biāo)仍存在不足,分辨率為640×640 像素的圖像經(jīng)過(guò)下采樣之后最小僅為20×20 像素,相當(dāng)于每個(gè)像素點(diǎn)對(duì)應(yīng)的視野為32×32 像素的圖像塊,特征被嚴(yán)重削弱,對(duì)于所占空間小的目標(biāo)很容易消失,而AMCSP 模塊能夠有效解決該問(wèn)題。

        結(jié)合混合域注意力機(jī)制[22]的思想,在原有CSP模塊上增加通道注意力機(jī)制,特征圖經(jīng)過(guò)平均池化后,大小為C×1×1,第1 個(gè)全連接層通過(guò)一個(gè)比例因子r進(jìn)行降維,第2 個(gè)全連接層再將通道升維到C,使網(wǎng)絡(luò)獲得更多非線性組合,經(jīng)過(guò)Sigmoid 函數(shù)后得到各通道的重要性權(quán)值,最后與原輸入張量權(quán)值相乘,使網(wǎng)絡(luò)在訓(xùn)練中提高對(duì)小目標(biāo)的學(xué)習(xí)能力。

        特征提取網(wǎng)絡(luò)作為目標(biāo)檢測(cè)的主干網(wǎng)絡(luò),其采樣特性將直接決定預(yù)測(cè)網(wǎng)絡(luò)的精確率。在小目標(biāo)檢測(cè)任務(wù)中,下采樣率與網(wǎng)絡(luò)深度能夠顯著影響目標(biāo)語(yǔ)義信息的提取效果。對(duì)此,本文結(jié)合Inv 核結(jié)構(gòu)的特性,對(duì)YOLOv5 特征提取網(wǎng)絡(luò)的采樣層進(jìn)行改進(jìn),并進(jìn)行多組拆分組合實(shí)驗(yàn)。

        改進(jìn)后的特征提取網(wǎng)絡(luò)參數(shù)如表1 所示。網(wǎng)絡(luò)中第2、4、6、8 層分別利用Inv 核進(jìn)行4、8、16、32 倍下采樣。但是,由于淺層和深層所含的語(yǔ)義信息有很大區(qū)別,因此本文結(jié)合Conv 與Inv 的特性,最大程度地提高網(wǎng)絡(luò)性能。輸入網(wǎng)絡(luò)的圖像尺寸為640×640像素,F(xiàn)ocus 模塊通過(guò)堆疊3×3 的卷積結(jié)構(gòu)對(duì) 圖像進(jìn)行等間隔切片采樣,再將采樣后的信息拼接,使信息集中到通道域。Inv 模塊隨著采樣倍率和網(wǎng)絡(luò)層數(shù)的不斷加深,比Conv 模塊挖掘到更加豐富的語(yǔ)義信息。

        表1 改進(jìn)的特征提取網(wǎng)絡(luò)參數(shù)Table 1 Parameters of improved feature extraction network

        2.2 改進(jìn)的特征融合網(wǎng)絡(luò)

        提取后的特征信息(第5、7、10 層)先經(jīng)過(guò)特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network,F(xiàn)PN)[23],將來(lái)自第10 層和第7 層的高層特征信息采用自頂向下的上采樣方式,與第5 層底層特征進(jìn)行3 個(gè)尺度的傳遞融合。改進(jìn)的特征融合網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示。本文對(duì)PAN 進(jìn)行優(yōu)化設(shè)計(jì),去掉Concat 連接方式,改為Add 連接,然后通過(guò)1×1 的卷積將3 個(gè)融合層調(diào)整為相同的張量維度送入檢測(cè)輸出層。

        圖4 改進(jìn)的特征融合網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of improved feature fusion network

        Concat 連接方式是將通道數(shù)相疊加,本身特征所含的信息量沒(méi)變。Add 連接方式是將描述特征的信息量相疊加,卻并不增加圖像通道數(shù)。相比Concat 連接方式,Add 連接方式大幅減小所需的計(jì)算量與參數(shù)量。

        2.3 目標(biāo)的檢測(cè)輸出

        特征融合后的3 個(gè)尺度張量信息如式(4)所示:

        其中:K×K表示特征圖的尺寸;3 表示特征圖的每個(gè)網(wǎng)格會(huì)生成3 個(gè)邊界框;C表示類別個(gè)數(shù);1 表示該邊界框的置信度得分;4 表示預(yù)先設(shè)置的先驗(yàn)框和最終生成預(yù)測(cè)框之間的4 個(gè)偏移量坐標(biāo)(tx,ty,tw,th)。最終預(yù)測(cè)框的生成計(jì)算過(guò)程如式(5)所示:

        其中:(bx,by,bw,bh)表示預(yù)測(cè)框的中心點(diǎn)坐標(biāo)及寬高度信息;(cx,cy,pw,ph)表示先驗(yàn)框網(wǎng)格的左上角坐標(biāo)及寬高度信息;σ表示Sigmoid 激活函數(shù)。

        針對(duì)交通標(biāo)志檢測(cè)應(yīng)用場(chǎng)景,本文使用K-means聚類算法生成更合適的9個(gè)先驗(yàn)框尺寸,分別為(15,16)、(24,24)、(23,52)、(36,34)、(57,55)、(58,116)、(110,90)、(390,341)、(575,545)。

        YOLOv5的損失函數(shù)由分類損失和回歸損失組成,分別使用二值交叉熵(Binary Cross Entropy,BCE)函數(shù)和CIOU_Loss 計(jì)算。在交通標(biāo)志檢測(cè)網(wǎng)絡(luò)的預(yù)測(cè)框生成后,需要對(duì)預(yù)測(cè)框進(jìn)行篩選。YOLOv5 采用非極大值抑制(Non-Maximum Suppression,NMS)方式進(jìn)行后處理,普通NMS 只考慮重疊面積,如果遇到遮擋情況,經(jīng)常會(huì)將相近的目標(biāo)錯(cuò)誤剔除掉。本文對(duì)此不足進(jìn)行改進(jìn),采用DIOU_NMS 進(jìn)行后處理。DIOU 的計(jì)算如式(6)所示:

        其中:IIOU為兩框交集與并集比值;d為兩框中心點(diǎn)距離;c為兩框最小外接矩形的對(duì)角線長(zhǎng)度。DIOU_NMS 的剔除機(jī)制如式(7)所示:

        其中:si表示分類得分;ε表示NMS閾值。DIOU_NMS 除了考慮重疊面積外,還考慮了預(yù)測(cè)框之間的中心點(diǎn)距離,可以更加準(zhǔn)確地對(duì)預(yù)測(cè)框進(jìn)行篩選。

        本文網(wǎng)絡(luò)整體架構(gòu)如圖5 所示。本文網(wǎng)絡(luò)結(jié)構(gòu)分為特征提取、特征融合以及檢測(cè)輸出3 個(gè)部分,網(wǎng)絡(luò)會(huì)對(duì)輸入圖像中的目標(biāo)進(jìn)行邊界框、置信度以及類別的預(yù)測(cè)回歸。

        圖5 本文網(wǎng)絡(luò)整體架構(gòu)Fig.5 Overall architecture of the proposed network

        3 實(shí)驗(yàn)與結(jié)果分析

        實(shí)驗(yàn)平臺(tái)為Ubuntu 18.04 操作系統(tǒng),采用3 路Xeon E5-2678 v3 CPU,NVIDIA Tesla k80 GPU,顯存12 GB。運(yùn)行環(huán)境為Python 3.8,深度學(xué)習(xí)框架為PyTorch 1.7。數(shù)據(jù)集為中國(guó)交通標(biāo)志檢測(cè)數(shù)據(jù)集[24](CCTSDB)。該數(shù)據(jù)集是在中國(guó)高速公路和城市道路上采集的圖片,包含15 734 張。本文對(duì)數(shù)據(jù)集進(jìn)行篩選,將變化小和標(biāo)注不明顯的圖片剔除后,從中選取10 000 張包含不同角度以及不同光照變化的圖片,每張圖片分辨率為1 024×720 像素,共分為Prohibitory、Mandatory、Warning 3 個(gè)類別,其中9 000 張為訓(xùn)練集,1 000 張為測(cè)試集。

        交通標(biāo)志檢測(cè)網(wǎng)絡(luò)在訓(xùn)練之前,先對(duì)數(shù)據(jù)集進(jìn)行等比例縮放,使圖片滿足輸入分辨率后采用Mosaic 數(shù)據(jù)增強(qiáng)進(jìn)行處理[25],批量大小為16。Mosaic 算法每次通過(guò)隨機(jī)縮放、裁剪、排布對(duì)4 張圖片進(jìn)行拼接,不但擴(kuò)充了數(shù)據(jù)集,還增強(qiáng)了對(duì)小目標(biāo)的檢測(cè)能力,加快了推理速度。表2 為網(wǎng)絡(luò)訓(xùn)練相關(guān)超參數(shù)配置。Mosaic 數(shù)據(jù)增強(qiáng)樣例如圖6 所示(彩色效果見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML 版)。

        圖6 Mosaic 數(shù)據(jù)增強(qiáng)樣例Fig.6 Examples of Mosaic data enhancement

        表2 相關(guān)超參數(shù)設(shè)置Table 2 Related hyperparameter settings

        由于本文對(duì)YOLOv5 的底層網(wǎng)絡(luò)架構(gòu)進(jìn)行改進(jìn),因此無(wú)法使用遷移學(xué)習(xí)進(jìn)行加速訓(xùn)練,總迭代次數(shù)為200。檢測(cè)網(wǎng)絡(luò)的學(xué)習(xí)率設(shè)置分為兩個(gè)階段,預(yù)熱階段采用線性插值對(duì)學(xué)習(xí)率進(jìn)行更新,預(yù)熱階段后采用余弦退火算法來(lái)調(diào)整學(xué)習(xí)率。

        3.1 評(píng)價(jià)指標(biāo)

        檢測(cè)精度和檢測(cè)速度是用于衡量目標(biāo)檢測(cè)網(wǎng)絡(luò)性能的兩個(gè)指標(biāo)。檢測(cè)速度是指目標(biāo)檢測(cè)網(wǎng)絡(luò)每秒能夠檢測(cè)的圖片數(shù)量(幀數(shù)),用FPS(Frames Per Second)表示。本文采用平均精度均值(mean Average Precision,mAP)評(píng)估網(wǎng)絡(luò)的檢測(cè)精度。精確率(P)如式(8)所示:

        其中:TTP表示正樣本被預(yù)測(cè)為正樣本的數(shù)量;FFP表示負(fù)樣本被預(yù)測(cè)為正樣本的數(shù)量。精確率表示模型預(yù)測(cè)的所有正樣本,預(yù)測(cè)正確所占的比例。召回率(R)如式(9)所示:

        其中:FFN表示正樣本被預(yù)測(cè)為負(fù)樣本的數(shù)量。召回率表示在所有正樣本中,模型預(yù)測(cè)正確的正樣本所占比例。精度(AAP)可以近似看作P-R曲線下的面積,采用定積分的方式計(jì)算最終AAP值。精度(AAP)如式(10)所示:

        其中:Psmooth表示將P-R曲線平滑處理;i表示類別索引,每個(gè)類別對(duì)應(yīng)一個(gè)AAP。本文采用以下2 個(gè)mAP指 標(biāo):1)mAP(IOU=0.5),即交并比(Intersection Over Union,IOU)閾值為0.5 時(shí),各個(gè)類別的精度取平均值;2)mAP(IOU∈0.50~0.95),即IOU 閾值以0.05 為步長(zhǎng),取0.50~0.95 精度的平均值。

        3.2 實(shí)驗(yàn)對(duì)比

        3.2.1 有效性分析

        本文設(shè)計(jì)7 組對(duì)比分析實(shí)驗(yàn),以驗(yàn)證Inv、AMCSP 和DIOU_NMS 模塊對(duì)基礎(chǔ)網(wǎng)絡(luò)YOLOv5 性能的影響,以及結(jié)合Conv 與Inv 特性,最大程度地提高檢測(cè)網(wǎng)絡(luò)性能。不同實(shí)驗(yàn)的性能分析如表3 所示,組與組之間采用控制變量的方式進(jìn)行對(duì)比,并在CCTSDB 數(shù)據(jù)集上采用2 個(gè)mAP 指標(biāo)進(jìn)行評(píng)估。其中√表示采用Inv 構(gòu)造4、8、16、32 倍下采樣,×表示沒(méi)有進(jìn)行下采樣。

        從表3 可以看出,在實(shí)驗(yàn)1、實(shí)驗(yàn)2 和實(shí)驗(yàn)3 中,AMCSP、DIOU_NMS 對(duì)檢測(cè)網(wǎng)絡(luò)的性能均有提升。在AMCSP、DIOU_NMS 兩種模塊都使用的情況下,與實(shí)驗(yàn)1、實(shí)驗(yàn)2 和實(shí)驗(yàn)3 相比,實(shí)驗(yàn)4 的mAP(IOU∈0.50~0.95)提升了約3%,在交通標(biāo)志檢測(cè)這種小目標(biāo)眾多、容易出現(xiàn)遮擋的應(yīng)用場(chǎng)景中,AMCSP 和DIOU_NMS 模塊能夠有效提升網(wǎng)絡(luò)的檢測(cè)性能。

        表3 不同實(shí)驗(yàn)的性能分析Table 3 Performance analysis among different experiments

        本文對(duì)比表3 中實(shí)驗(yàn)4 和實(shí)驗(yàn)5 的結(jié)果可知,將特征提取網(wǎng)絡(luò)中淺層的采樣層替換為Inv 結(jié)構(gòu),檢測(cè)性能幾乎沒(méi)有改變。本文進(jìn)行實(shí)驗(yàn)6,將提取網(wǎng)絡(luò)中深層的采樣層替換為Inv 結(jié)構(gòu),與實(shí)驗(yàn)4 相比mAP 提升約2%。其原因主要有以下2 個(gè):1)淺層網(wǎng)絡(luò)包含更多的像素特征信息,即圖像細(xì)節(jié)信息,根據(jù)Conv結(jié)構(gòu)的通道特異性使每個(gè)通道層獨(dú)享核函數(shù),可以更加全面地學(xué)習(xí)細(xì)節(jié)信息,比Inv 結(jié)構(gòu)更加合適;2)深層網(wǎng)絡(luò)包含更多的特征抽象信息,即圖像語(yǔ)義信息,Inv 結(jié)構(gòu)的空間特異性可以保證每個(gè)像素能夠更加靈活地學(xué)習(xí)核函數(shù),而通道不變性又能確保不產(chǎn)生冗余干擾信息。因此,相比Conv 結(jié)構(gòu),Inv 結(jié)構(gòu)更加適合放在深層網(wǎng)絡(luò)中。

        本文進(jìn)行實(shí)驗(yàn)驗(yàn)證了上述分析的正確性,Conv結(jié)構(gòu)適合淺層網(wǎng)絡(luò),Inv 結(jié)構(gòu)適合深層網(wǎng)絡(luò)。采用性能優(yōu)異的實(shí)驗(yàn)?zāi)P蛯?duì)CCTSDB 數(shù)據(jù)集上每個(gè)類別的精確率、召回率以及AP(IOU=0.5)進(jìn)行統(tǒng)計(jì)分析,結(jié)果如表4 所示。從表4 可以看出,實(shí)驗(yàn)6 的網(wǎng)絡(luò)模型在各個(gè)類別的評(píng)價(jià)指標(biāo)均達(dá)到最高。因此,本文最終采用實(shí)驗(yàn)6 的改進(jìn)網(wǎng)絡(luò)模型進(jìn)行后續(xù)實(shí)驗(yàn)分析。

        表4 在不同實(shí)驗(yàn)中各類別的評(píng)價(jià)指標(biāo)對(duì)比Table 4 Evaluation indexs comparison of each category on different experiments %

        3.2.2 檢測(cè)網(wǎng)絡(luò)對(duì)比

        本文網(wǎng)絡(luò)與典型檢測(cè)網(wǎng)絡(luò)在CCTSDB 數(shù)據(jù)集上進(jìn)行各項(xiàng)實(shí)驗(yàn)對(duì)比,為保證實(shí)驗(yàn)的公平性,所有實(shí)驗(yàn)基于同一平臺(tái)測(cè)試,包括YOLOv5、Faster R-CNN+FPN、SSD。其中,后兩者的特征提取網(wǎng)絡(luò)均為Resnet50。圖7 所示為不同網(wǎng)絡(luò)最佳IOU 閾值的mAP 分析,相比SSD 檢測(cè)網(wǎng)絡(luò),本文網(wǎng)絡(luò)的mAP 提高了約10 個(gè)百分點(diǎn)。

        圖7 不同網(wǎng)絡(luò)的mAP 對(duì)比Fig.7 mAP comparison among different networks

        推理速度決定檢測(cè)網(wǎng)絡(luò)是否能滿足實(shí)時(shí)需求,而模型參數(shù)量決定網(wǎng)絡(luò)是否方便部署到小型移動(dòng)設(shè)備上。不同網(wǎng)絡(luò)的檢測(cè)速度與參數(shù)量對(duì)比如表5 所示。

        表5 不同網(wǎng)絡(luò)的檢測(cè)速度與參數(shù)量對(duì)比Table 5 Detection speed and parameter quantity comparison among different networks

        相比YOLOv5 網(wǎng)絡(luò),本文所提網(wǎng)絡(luò)的推理速度提升1/8(推理速度受GPU 資源所限,因此只比較提升比例),在交通標(biāo)志檢測(cè)應(yīng)用場(chǎng)景中可以做到實(shí)時(shí)處理。另外,由于Inv 結(jié)構(gòu)實(shí)現(xiàn)通道參數(shù)共享、PAN結(jié)構(gòu)的優(yōu)化,因此本文網(wǎng)絡(luò)模型參數(shù)量較YOLOv5減少了15.7%。

        在測(cè)試集上隨機(jī)挑選一張實(shí)際拍攝的交通標(biāo)志圖像進(jìn)行測(cè)試。不同網(wǎng)絡(luò)的目標(biāo)檢測(cè)結(jié)果對(duì)比如圖8 所示(彩色效果見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML 版)。圖中含有5 處交通標(biāo)志,包括2 處小目標(biāo)和1 處遮擋目標(biāo)。在同一應(yīng)用場(chǎng)景中,本文網(wǎng)絡(luò)能夠精準(zhǔn)檢測(cè)目標(biāo),而YOLOv5 漏檢了遮擋目標(biāo),F(xiàn)aster R-CNN+FPN 和SSD網(wǎng)絡(luò)對(duì)小目標(biāo)檢測(cè)能力還有待加強(qiáng)。

        圖8 不同網(wǎng)絡(luò)的目標(biāo)檢測(cè)結(jié)果對(duì)比Fig.8 Target detection results comparison among different networks

        4 結(jié)束語(yǔ)

        在交通標(biāo)志檢測(cè)場(chǎng)景中,本文結(jié)合優(yōu)化的新型算子結(jié)構(gòu)與跨階段注意力機(jī)制模塊,提出基于YOLOv5 采樣優(yōu)化的檢測(cè)網(wǎng)絡(luò)。通過(guò)控制變量實(shí)驗(yàn)探究新型算子與卷積相結(jié)合對(duì)網(wǎng)絡(luò)性能的影響,以減少通道聚合網(wǎng)絡(luò)的參數(shù)運(yùn)算量。在中國(guó)交通標(biāo)志數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文網(wǎng)絡(luò)具有較少的參數(shù)量,在滿足實(shí)時(shí)性的同時(shí)具有較優(yōu)的檢測(cè)精度。后續(xù)將在特征融合部分,結(jié)合新型算子方法設(shè)計(jì)高效的自注意力結(jié)構(gòu),提高算力資源的利用率和模型精度。

        猜你喜歡
        交通標(biāo)志算子卷積
        交通標(biāo)志認(rèn)得清
        基于雙向特征融合的交通標(biāo)志識(shí)別
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        擬微分算子在Hp(ω)上的有界性
        各向異性次Laplace算子和擬p-次Laplace算子的Picone恒等式及其應(yīng)用
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        一類Markov模算子半群與相應(yīng)的算子值Dirichlet型刻畫(huà)
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        Roper-Suffridge延拓算子與Loewner鏈
        交通標(biāo)志小課堂
        久久精品国产亚洲AV香蕉吃奶| 国产综合在线观看| 久久久久亚洲精品无码网址色欲| 国产乱淫视频| 国产一区二区三区四区色| 日本视频在线观看一区二区| 国产成人精品亚洲日本在线观看| 日本高清色倩视频在线观看| 亚洲都市校园激情另类| 亚洲中文字幕乱码在线视频| av网站在线观看入口| 亚洲精品无码久久久久牙蜜区| 国产成人精品精品欧美| 精品国产一区二区三区男人吃奶| av免费在线播放视频| 久久久无码人妻精品无码| 国产在线高清视频| 蜜臀av人妻一区二区三区| 国产一区二区三区内射| 99国产精品无码| 亚洲gay片在线gv网站| 国产av无码专区亚洲awww| 久久久久久av无码免费看大片| 国产精品无码久久久久下载 | 大陆国产乱人伦| 国产成人亚洲精品一区二区三区| 免费a级毛片又大又粗又黑| 久久久精品人妻一区二区三区蜜桃 | 国产精品卡一卡二卡三| 午夜在线观看有码无码| 一区二区三区视频亚洲| 人妻 色综合网站| 欧美在线日韩| 亚洲av手机在线一区| 一本色道久久88加勒比—综合| 欧美极品美女| 久久天堂av色综合| 久亚洲一线产区二线产区三线麻豆| 国产精品videossex国产高清| 66lu国产在线观看| 一区二区久久精品66国产精品|