亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Lite-YOLOv3輕量級行人與車輛檢測網(wǎng)絡(luò)

        2023-01-31 11:23:14涂媛雅湯國放張建勛
        小型微型計算機系統(tǒng) 2023年1期
        關(guān)鍵詞:精準度行人卷積

        涂媛雅,湯國放,張建勛

        (重慶理工大學(xué) 計算機科學(xué)與工程學(xué)院,重慶 400054)

        1 引 言

        近年來隨著社會的發(fā)展、圖形計算硬件算力的提升、科研隊伍的壯大,深度學(xué)習方法已經(jīng)在各個領(lǐng)域發(fā)揮重要作用.2021年,《中華人民共和國國民經(jīng)濟和社會發(fā)展第14個5年規(guī)劃和2035年遠景目標綱要》在數(shù)字化應(yīng)用場景中闡述智能交通的重要性.在智能交通領(lǐng)域,有效的行人與車輛檢測是最基礎(chǔ)的保障.

        許多研究者使用機器學(xué)習和圖像處理技術(shù)實現(xiàn)了行人和車輛的檢測.楊婉香[1]等人提出一種多尺度融合的行人檢測算法,采用方向梯度直方圖(HOG)[2]提取行人特征,再結(jié)合支持向量機(SVM)實現(xiàn)分類檢測.王周春[3]以HOG+SVM分類模型為基礎(chǔ),通過加入GLCM[4]算法提取目標紋理特征,解決穿著不同服飾的紅外面目標識別問題.穆柯楠[5]等人提出一種基于多尺度邊緣融合和SURF[6]特征匹配的車輛檢測算法,克服了傳統(tǒng)基于邊緣特征的車輛檢測方法易受噪聲、背景干擾的問題.施培蓓[7]等人基于RealAdaboost[8]框架提出一種基于快速增量學(xué)習的行人檢測方法,能夠有效解決行人檢測器的場景自適應(yīng)問題.這些算法利用行人和車輛特點手工設(shè)計特征并配合圖像處理和機器學(xué)習實現(xiàn)了行人和車輛檢測,取得了一定的檢測效果,但實際城市交通環(huán)境存在復(fù)雜背景、復(fù)雜干擾等問題,基于傳統(tǒng)特征提取算法的行人和車輛檢測可能存在穩(wěn)定性差和泛化能力不足等問題,導(dǎo)致行人和車輛檢測不準確或出現(xiàn)漏檢.也有研究者采用基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)[9]的目標檢測算法,對比傳統(tǒng)特征提取的目標檢測算法,基于CNN的目標檢測算法不僅可以提取更高層次和更好的表達特征,而且可以在同一模型中完成特征的提取,選擇和分類,具有檢測準確率高和泛化能力強的特點.

        基于CNN的目標檢測算法主要包含兩種主流算法:1.區(qū)域提議模型,例如R-CNN[10],SPP-Net[11],F(xiàn)ast R-CNN[12],F(xiàn)aster R-CNN[13],R-FCN[14];2.端到端(無區(qū)域建議)模型,例如YOLO[15],YOLO9000[16],YOLOv3[17],SSD(單發(fā)多盒檢測器)[18].前者基于分類的算法核心是區(qū)域提議,通常是通過使用選擇性搜索(Selective Search)[19]算法或區(qū)域提議網(wǎng)絡(luò)(Region Proposal Network)獲得感興趣的區(qū)域(Region of Interest),然后使用CNN模型對每個區(qū)域進行分類以獲得類別和置信度.目前,此類方法因其檢測精度高仍然流行,2020年,陳康[20]等人基于Faster R-CNN算法解決布匹瑕疵點檢測問題,主要通過引入深度殘差網(wǎng)絡(luò)和增加預(yù)測錨點框的方式提升多尺度瑕疵點檢測和小目標瑕疵點的檢測性能.同年,吉訓(xùn)生[21]等人也使用FasterR-CNN作為基礎(chǔ)網(wǎng)絡(luò)對電路板字符進行檢測.但是由于此類方法需要先定位目標候選框然后利用分類算法進行目標分類,存在效率低的弊端.后者將目標檢測問題轉(zhuǎn)化為單步的回歸問題,將目標框與目標分類合起來,一次輸出目標類別和目標位置信息,大大提高了檢測的效率,但檢測準確率稍弱.2020年,徐守坤[22]等人提出一種安全帽佩戴檢測算法,該算法基于YOLOv3網(wǎng)絡(luò),主要通過改進網(wǎng)絡(luò)多尺度預(yù)測結(jié)構(gòu)和初始錨框參數(shù)提升檢測性能.由于卷積神經(jīng)網(wǎng)絡(luò)的深度深、復(fù)雜性高,對數(shù)據(jù)集的訓(xùn)練將消耗許多計算資源,并且要達到實時檢測的目的對計算機硬件配置要求很高,許多研究者們開始探索小型微型目標檢測算法.

        2018年,Joseph Redmon提出了YOLOv3網(wǎng)絡(luò),引入特征提取網(wǎng)絡(luò)Darknet-53和多尺度預(yù)測網(wǎng)絡(luò).與之前提出的版本(YOLO,YOLO9000)比較而言,YOLOv3網(wǎng)絡(luò)體積較大,但預(yù)測準確率更高.同時,作者提出了其小型網(wǎng)絡(luò)Tiny-YOLOv3來滿足對速度要求比較高的項目.Tiny-YOLOv3大小為33.4MB,接近于YOLOv3的1/8倍.其在YOLOv3的基礎(chǔ)上刪減了一些特征提取層,只保留了兩個預(yù)測分支,因此檢測速度有很大程度的提升,滿足實時性任務(wù)的要求.但同時因其網(wǎng)絡(luò)的刪減導(dǎo)致整體檢測準確率有所下降,預(yù)測分支的減少也導(dǎo)致對小目標物體的檢測能力不足.因此如何在檢測速度和檢測精準度上找到一個平衡點成為近些年目標檢測任務(wù)的重點與難點.

        基于此,本文提出一種輕量級行人與車輛檢測網(wǎng)絡(luò)Lite-YOLOv3,網(wǎng)絡(luò)模型在檢測速度與檢測精度方面均有較大幅度提升.

        2 Tiny-YOLOv3網(wǎng)絡(luò)

        本文采用輕量級網(wǎng)絡(luò)Tiny-YOLOv3作為基礎(chǔ)網(wǎng)絡(luò),Tiny-YOLOv3是YOLOv3網(wǎng)絡(luò)的簡化網(wǎng)絡(luò),其參數(shù)量小的特性使得網(wǎng)絡(luò)檢測速度較快,能夠滿足低性能計算機對檢測實時性的需求.

        Tiny-YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,Tiny-YOLOv3的主干網(wǎng)絡(luò)(BackBone)由6層卷積層和池化層組成,卷積層主要用于提取特征,池化層主要用于降低特征圖尺寸,相較于YOLOv3網(wǎng)絡(luò)的主干網(wǎng)絡(luò),Tiny-YOLOv3采用更少的卷積層提取特征,并且YOLOv3主干網(wǎng)絡(luò)通過卷積的方式下采樣,由此可知Tiny-YOLOv3的參數(shù)量大幅下降,其模型運算速度得到大幅提升,但是由于網(wǎng)絡(luò)深度變淺,其提取特征的能力則有所下降.Tiny-YOLOv3的預(yù)測網(wǎng)絡(luò)(Head)由卷積層、上采樣層和連接層組成,其卷積層主要用于提取抽象特征,使得網(wǎng)絡(luò)能夠?qū)W習到圖像的深層語義信息.上采樣層將13×13像素的特征圖放大到26×26像素,連接層將低維度的特征圖與高維度特征圖進行通道拼接融合,使得網(wǎng)絡(luò)能夠?qū)W習到不同深度的語義特征,加強了網(wǎng)絡(luò)的特征學(xué)習能力.Tiny-YOLOv3網(wǎng)絡(luò)有2個預(yù)測尺度,分別為13×13和26×26,相較于YOLOv3網(wǎng)絡(luò),其預(yù)測尺度減少1個,從而參數(shù)計算量減少了一部分,但是其預(yù)測精度也有一定程度的下降.

        圖1 Tiny-YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Structure of Tiny-YOLOv3

        YOLOv3網(wǎng)絡(luò)與Tiny-YOLOv3網(wǎng)絡(luò)參數(shù)對比如表1所示,Tiny-YOLOv3作為YOLOv3的輕量版,網(wǎng)絡(luò)刪減大量卷積層并且使用兩個尺度預(yù)測結(jié)果,其網(wǎng)絡(luò)層數(shù)和參數(shù)量均得到大幅下降,分別為YOLOv3網(wǎng)絡(luò)參數(shù)量的1/6倍和1/7倍,因此Tiny-YOLOv3網(wǎng)絡(luò)運算速率得到大幅提升.

        表1 YOLOv3網(wǎng)絡(luò)與Tiny-YOLOv3網(wǎng)絡(luò)參數(shù)對比Table 1 Comparison of YOLOv3 network and Tiny-YOLOv3 network parameters

        3 相關(guān)工作

        3.1 BottleNeckLayer

        BottleNeck Layer亦稱瓶頸層,其含義是卷積過程中生成的特征圖的大小如同花瓶的瓶頸.BottleNeck Layer網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,BottleNeck層由兩層卷積層組成,第1層卷積核大小為1×1,第2層卷積核大小為3×3.每層卷積核的個數(shù)不固定,往往第1層卷積核的數(shù)量較小,第2層卷積核的數(shù)量較大,前者用于降低特征圖維度,后者用于提取特征.BottleNeck層在不增加冗余計算量的同時,使得網(wǎng)絡(luò)能夠提取到更深層的語義信息.

        圖2 瓶頸層網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Structure of BottleNeck

        假設(shè)輸入特征圖的大小為hinput×winput×cinput,分別代表輸入特征圖的寬、高、通道數(shù),直接使用3×3卷積,輸出特征圖的大小為hout×wout×cout,根據(jù)參數(shù)量計算公式(1)可知兩種情況的參數(shù)量:

        Params=hinput×winput×cinput×k2×cout

        (1)

        Pconv=cinput×3×3×cout

        (2)

        當使用BottleNeck層時,先用1×1卷積下降到C1個通道,再用3×3卷積升維到C1個通道,參數(shù)計算量為:

        Pbottlenck=1×1×cinput×cmid+3×3×cmid×cout

        (3)

        兩者之比為:

        (4)

        其中,Params表示卷積過程中的參數(shù)量,k表示卷積核大小,cout表示輸出特征圖通道數(shù).cmid表示BottleNeck中第1次卷積輸出的特征圖維度.

        3.2 深度可分離卷積

        深度可分離卷積(Depthwise Separable Convolution,DSC)將標準卷積結(jié)構(gòu)進行拆分,主要分為兩個過程,分別為逐通道卷積(Depthwise Convolution)和逐點卷積(Pointwise Convolution).深度可分離卷積首先使用逐通道卷積在二維平面內(nèi)對輸入層的每個通道獨立進行卷積,卷積后生成的特征圖數(shù)量與輸入層的通道數(shù)相同,但是沒有有效利用不同通道在相同空間位置上的特征信息.因此需要使用逐點卷積在上述步驟生成的特征圖深度方向上進行加權(quán)組合,由此生成新的特征圖.逐通道卷積和逐點卷積的過程如圖3所示.

        圖3 逐通道卷積和逐點卷積Fig.3 Depthwise convolution and pointwise convolution

        假設(shè)輸入特征圖大小為Wi×Hi×C,Wi代表輸入特征圖的寬,Hi代表輸入特征圖的高,C代表輸入特征圖的通道數(shù),標準卷積大小為Wc×Hc×C×N,分別代表標準卷積的寬、高、通道數(shù)和卷積核個數(shù),經(jīng)過標準卷積后,輸出特征圖大小為Wo×Ho×N.則標準卷積的參數(shù)計算量為:

        Params(Sd)=Wo×Ho×N×Wc×Hc×C

        (5)

        深度可分離卷積首先使用Wc×Hc×1×C的卷積進行逐通道卷積,然后使用1×1×C×N的卷積進行逐點卷積,則深度可分離卷積的參數(shù)計算量為:

        Params(DSC)=Wo×Ho×1×Wc×Hc×C+
        Wo×Ho×N×1×1×C

        (6)

        兩者之比為:

        (7)

        3.3 卷積代替池化

        原Tiny-YOLOv3的骨干網(wǎng)絡(luò)由一系列卷積層和池化層組成,其中卷積層為常見的3×3卷積,用于提取圖像特征,池化層采用2×2的最大池化策略,其作用機理為:在每4個權(quán)重值中取最大值作為新特征圖的權(quán)重.雖然池化層在降低特征圖的大小的同時保證了圖像語義信息平移不變性,但是在2×2特征圖中選擇1個特征作為新權(quán)重的方式會導(dǎo)致新的特征圖不包含其他3個權(quán)重的信息,整體上會丟失部分語義信息,導(dǎo)致訓(xùn)練結(jié)果不理想.故本文提出了使用卷積代替池化的骨干網(wǎng)絡(luò),使用尺寸大小為3×3,步長為2的卷積層代替2×2的最大池化層,在不影響輸出結(jié)果尺寸的同時,能夠保證新特征圖的權(quán)重值間接包含前面特征圖的所有權(quán)重值,一定程度上能夠豐富深層特征圖的語義信息.

        4 Lite-YOLOv3

        基于BottleNeck、深度可分離卷積與卷積代替池化等方案,本文提出了Lite-YOLOv3網(wǎng)絡(luò),其具體網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示.Lite-YOLOv3網(wǎng)絡(luò)共包含20層,其中所有的下采樣池化層均被尺度為3×3步長為2的卷積層替代.Lite-YOLOv3網(wǎng)絡(luò)在第9層加入本文改進的BottleNeck網(wǎng)絡(luò)塊,第11、12、14和18層加入本文提出的DPRConv網(wǎng)絡(luò)塊.

        圖4 Lite-YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of Lite-YOLOv3

        本文基于組卷積方法改進BottleNeck,其具體結(jié)構(gòu)如圖5(a)所示,由1×1和3×3的卷積組成,其中第1層1×1的卷積核個數(shù)為輸入特征圖通道數(shù)的一半,卷積核個數(shù)的降低可以減少網(wǎng)絡(luò)參數(shù)量.如圖4中網(wǎng)絡(luò)第9層所示,BottleNeck塊的輸入特征圖的大小為26×26×256,經(jīng)過1×1×128卷積輸出尺寸為26×26×128的特征圖,1×1的卷積在加深網(wǎng)絡(luò)提取深層語義信息的同時降低網(wǎng)絡(luò)一半的參數(shù)量,使得后續(xù)的卷積計算量大幅降低.BottleNeck塊第2層為3×3卷積為組卷積層,組卷積的卷積核個數(shù)為輸入特征圖的通道數(shù),將26×26×128的特征圖按通道分為128個26×26×1的特征圖,并使用128個3×3的卷積核提取特征,將輸入和輸出特征圖對位相加得到最終特征圖,對位相加方法在一定程度上可以解決網(wǎng)絡(luò)退化問題.

        表2 BottleNeck改進前后參數(shù)量對比

        根據(jù)公式(1)可計算出BottleNeck改進前后參數(shù)量.具體如表2所示,可以發(fā)現(xiàn)改進后的BottleNeck塊相較于原BottleNeck塊參數(shù)量有大幅下降,比率接近1/10.因此可以說明加入組卷積模塊的BottleNeck塊具有更少的參數(shù)量和更快的運算速度,為網(wǎng)絡(luò)模型的實時性奠定良好基礎(chǔ).

        圖5 BottleNeck和DPRConv結(jié)構(gòu)Fig.5 Structure of BottleNeck and DPRConv

        卷積可分離殘差網(wǎng)絡(luò)DPRConv是本文基于Depth Point網(wǎng)絡(luò)和Resnet網(wǎng)絡(luò)提出的網(wǎng)絡(luò)模塊,其具體結(jié)構(gòu)如圖5(b)所示.DPRConv由一個組卷積和兩個3×3卷積組成,其中組卷積由c1個3×3的卷積核組成,分離輸入圖像的每一個通道再卷積.其后第1個卷積層尺寸為1×1×c2,并且包含一個在通道上拼接的concat操作,目的是整合輸入與輸出的特征圖,得到通道數(shù)為c1+c2特征圖.第2個卷積層的尺寸為3×3×c2,其作用是將輸出特征圖通道數(shù)由c1+c2降低為c2,目的是降低最終輸出特征圖的參數(shù)量.

        本文在Lite-YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)中的改進點中增加了concat操作和卷積降維層,雖然在一定程度上導(dǎo)致網(wǎng)絡(luò)參數(shù)量增多,但是對輸入數(shù)據(jù)進行信息疊加,使得輸出特征的語義信息更豐富,從而能夠提升模型預(yù)測精準度,并且降維層使得后續(xù)的網(wǎng)絡(luò)結(jié)構(gòu)的輸入?yún)?shù)減少,從而提升模型運算速度.

        5 實驗結(jié)果與分析

        5.1 實驗環(huán)境

        本文的實驗硬件環(huán)境為: Intel(R) Core(TM) i7-8750H CPU @ 2.20GHz,8G DDR4內(nèi)存,NVIIA GeForce GTX3060 8G獨立顯卡.軟件環(huán)境為:ubuntu18.04操作系統(tǒng),使用Pytorch[23]深度學(xué)習框架,python3.8.5,A9.2,torch1.6.0,opencv-python4.4.0等相關(guān)工具包.

        5.2 數(shù)據(jù)集

        本文實驗數(shù)據(jù)集是KITTI,它是目前世界上最大的自動駕駛場景中的計算機視覺算法評估數(shù)據(jù)集.包含從市區(qū),村莊和高速公路等場景收集的真實圖像數(shù)據(jù).圖像最多包含的檢測目標可達15輛汽車和30位行人,并且圖像具有不同程度的遮擋和截斷.目標檢測包括7481張訓(xùn)練圖像和7518張測試圖像,包括總共80256個帶標簽的物體,并且標簽分為小汽車、貨車、卡車、行人、人(坐)、騎自行車的人、有軌電車和其他雜項.本文主要對行人和車輛進行檢測,所以對數(shù)據(jù)集類別進行合并為3種,分別是Pedestrains、Car和Cyclists.具體是將小汽車、貨車、卡車、有軌電車合并為Car,行人、人(坐)合并為Pedestrians,騎自行車的人為Cyclists.

        5.3 評估指標

        為了驗證改進后的網(wǎng)絡(luò)模型Lite-YOLOv3的性能,本文采用平均精準度(mean Average Precision,mAP)、精確率(Precision,P)、召回率(Recall,R)和每秒檢測幀數(shù)(FPS)4個指標對算法進行評估.其中,mAP是對所有類別的平均精度(Average Precision,AP)求取均值后獲得,采用mAP_0.5∶0.95,表示在不同IOU閾值(從0.5-0.95,步長0.05)上的平均mAP.精確率如公式(8)所示,召回率如公式(9)所示,平均精度如公式(11)所示.本文統(tǒng)計了FPS參數(shù),以驗證模型的檢測速率.

        (8)

        (9)

        其中,TP表示檢測結(jié)果為正的正樣本,F(xiàn)P表示檢測結(jié)果為正的負樣本,TP+FP表示檢測結(jié)果為正的樣本總數(shù),F(xiàn)N表示檢測結(jié)果為負的正樣本,TP+FN表示正樣本的總數(shù).P表示檢測結(jié)果為正的樣本中真正正樣本占的比例,R表示所有正樣本中有多少正樣本被預(yù)測正確.

        (10)

        (11)

        其中,Sum表示測試集中圖片總數(shù),Class表示檢測類別數(shù).

        (12)

        其中,fn表示模型處理圖像的總數(shù),T表示所用時間.

        5.4 模型訓(xùn)練

        本文訓(xùn)練模型初始學(xué)習率為0.01,OneCycle學(xué)習率為0.10,動量為0.937,weight_decay為0.0005,warmup_epochs為20,warmup_momentum為0.8,warmup_bias_lr為0.1,訓(xùn)練epoch為600次.

        本文采用消融實驗對比不同模型的參數(shù)量,模型如表3所示.Tiny YOLOv3 ConvSample、Tiny YOLOv3 BottleNeck、Tiny YOLOv3 DPR、Tiny YOLOv3和 Lite-YOLOv3.Tiny YOLOv3 ConvSample網(wǎng)絡(luò)使用大小為3×3、步長為2的卷積層代替原Tiny YOLOv3網(wǎng)絡(luò)中的下采樣層.Tiny YOLOv3 BottleNeck網(wǎng)絡(luò)使用改進后的BottleNeck層替換原Tiny YOLOv3網(wǎng)絡(luò)的第9層.Tiny YOLOv3 DPR使用改進后的可分離卷積層替換11、12、14和18層.Lite-YOLOv3即本文提出的基于ConvSample、BottleNeck和DPR模型的輕量級網(wǎng)絡(luò),其具體包含模型、模型參數(shù)量與GFLOPS如表3所示.

        表3 多種模型參數(shù)對比表

        ConvSample卷積替代池化參數(shù)量雖然增多,但是隨著卷積的加入有兩個作用:1)使得網(wǎng)絡(luò)層數(shù)增加,激活函數(shù)的增多可以使得學(xué)習特征更具非線性特征;2)相較于舍棄權(quán)重的下采樣卷積方式,卷積過程能夠提取上一層輸入特征圖的所有權(quán)重值.在引入改進后的基于組卷積BottleNeck、DPR等模塊后,網(wǎng)絡(luò)的參數(shù)量得到有效降低,證明以上二者具有降低參數(shù)量的效果,并且二者均由多層網(wǎng)絡(luò)組成,同樣可以提取深度語義信息.

        5.5 消融實驗

        消融實驗平均精準度對比如圖6所示,4種網(wǎng)絡(luò)模型在平均準確率mAP方面由高到低的排序是:Lite-YOLOv3,Tiny-YOLOv3 ConvSample,Tiny-YOLOv3 DPR,Tiny- YOLOv3 BottleNeck和Tiny-YOLOv3,具體準確率如表4所示,其中Lite-YOLOv3的mAP0.5:0.95與mAP0.5平均準確率值分別為42.51%和76.64%,相較于Tiny-YOLOv3網(wǎng)絡(luò),Lite-YOLOv3網(wǎng)絡(luò)具有6.26%和9.07%的平均準確率的提升,證明卷積替代池化方案可以提取到更多輸入信息,識別更多目標行人與車輛,并且多層網(wǎng)絡(luò)可以將輸出特征向量非線性化,使得網(wǎng)絡(luò)學(xué)習到的特征更擬合輸入數(shù)據(jù).

        圖6 消融實驗平均檢測精準度對比圖Fig.6 Comparison chart of mAP of ablation experiment

        表4 消融實驗性能對比Table 4 Comparison of ablation performance

        由表4數(shù)據(jù)可知,ConvSample網(wǎng)絡(luò)的精準度相較于Tiny-YOLOv3網(wǎng)絡(luò)有一定的提升,同時其網(wǎng)絡(luò)運算速度有一定損失,證明卷積代替池化能夠提升網(wǎng)絡(luò)識別精準度,但在一定程度上增加模型的參數(shù)量,降低網(wǎng)絡(luò)運算速度.BottleNeck和DPR模型的運算速度相較于原網(wǎng)絡(luò)有一定提升,證明組卷積的加入能夠有效降低網(wǎng)絡(luò)參數(shù)量,提升模型運算速度,并且BottleNeck和DPR模型的平均準確率均有一定提升,證明兩個模塊的多層卷積網(wǎng)絡(luò)可以有效增強特征擬合能力,提升網(wǎng)絡(luò)檢測精準度.

        5.6 主流算法對比實驗

        本文與兩種目標檢測領(lǐng)域流行的輕量級網(wǎng)絡(luò)框架進行對比實驗,分別是NanoDet和Tiny-YOLOv4[24].主要對比3個網(wǎng)絡(luò)模型的mAP和FPS兩個指標,如表5所示.Lite-YOLOv3網(wǎng)絡(luò)的平均檢測精準度最高,相較于NanoDet和Tiny-YOLOv4分別提升了4.5%和5.73%.在網(wǎng)絡(luò)運行速度方面,NanoDet具有較大優(yōu)勢,但是Lite-YOLOv3其42f/s的運行速度完全滿足實時檢測的要求.所以三者在網(wǎng)絡(luò)滿足實時輸出檢測目標的情況下,Lite-YOLOv3具有更高的檢測精準度,能夠檢測到更多的有效車輛和行人.證明Lite-YOLOv3的3個改進模塊在一定程度降低了模型的參數(shù)量,使得模型的運算速度加快,且能夠提取到更豐富的圖像特征.

        表5 主流目標檢測網(wǎng)絡(luò)對比

        5.7 檢測結(jié)果

        5種網(wǎng)絡(luò)的實驗結(jié)果如圖7所示,由上到下依次是Tiny-YOLOv3,Tiny-YOLOv3 BottleNeck,Tiny-YOLOv3 DPR,Tiny-YOLOv3 ConvSample和Lite-YOLOv3,下文使用abcde代替.第1列結(jié)果中(d)、(e)網(wǎng)絡(luò)輸出圖中的檢測框數(shù)量明顯多于(a)、(b)和(c),說明卷積替代池化模塊可以提取到更多的信息,從而識別出更多的目標車輛.(e)相較于(d)網(wǎng)絡(luò),其輸出特征圖的類別置信度均高于(d),說明BottleNeck和DPR結(jié)構(gòu)中的cat和add操作可以有效防止網(wǎng)絡(luò)退化,從而不丟失前部網(wǎng)絡(luò)學(xué)習的特征信息.第2列結(jié)果圖中只有(e)網(wǎng)絡(luò)具有多個檢測框,且檢測目標均為小目標.第3列輸出圖與第2列輸出圖相似,(e)網(wǎng)絡(luò)能夠識別到遠處的行人與車輛,說明卷積替代池化操作能夠提升淺層網(wǎng)絡(luò)的深度,BottleNeck和DPR結(jié)構(gòu)包含多個卷積層再次加深網(wǎng)絡(luò)模型,進而提升網(wǎng)絡(luò)擬合數(shù)據(jù)能力,提高針對小目標行人和車輛的檢測能力.

        圖7 結(jié)果對比圖Fig.7 Results comparison chart

        6 總 結(jié)

        本文基于改進的BottleNeck,DPR模塊和卷積代替下采樣方案在Tiny-YOLOv3基礎(chǔ)提Lite-YOLOv3.Lite- YOLOv3在平均檢測精準度和網(wǎng)絡(luò)運算速度方面較Tiny- YOLOv3 均有一定提升,分別提升9.07%和9f/s.通過實驗結(jié)果分析,所提出的Lite-YOLOv3網(wǎng)絡(luò)模型能夠在提升網(wǎng)絡(luò)檢測速度的情況下同時有效實現(xiàn)小目標的檢測,為嵌入式移動終端提供了可行性.通過整體實驗效果來看,DPR和BottleNeck中的組卷積部分雖然可以降低網(wǎng)絡(luò)運算速度,但是可能導(dǎo)致一定的特征損失,降低網(wǎng)絡(luò)學(xué)習能力.后續(xù)考慮使用空洞卷積代替組卷積進行實驗,同時考慮知識蒸餾再次壓縮網(wǎng)絡(luò)模型.

        猜你喜歡
        精準度行人卷積
        BH66F5355 增強型24-bit A/D MCU
        傳感器世界(2023年5期)2023-08-03 10:38:18
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        毒舌出沒,行人避讓
        意林(2021年5期)2021-04-18 12:21:17
        讓黨建活動更加有“味”——禮泉縣增強“兩新”黨建精準度
        當代陜西(2020年24期)2020-02-01 07:06:56
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        路不為尋找者而設(shè)
        揚子江(2019年1期)2019-03-08 02:52:34
        基于傅里葉域卷積表示的目標跟蹤算法
        論提高不動產(chǎn)產(chǎn)權(quán)保護精準度的若干問題
        我是行人
        機械加工過程中的機械振動分析
        中國機械(2014年15期)2014-04-29 00:09:45
        久久99热国产精品综合| 亚洲AV无码久久久久调教| 高清少妇一区二区三区| 一本一道久久精品综合| 岳毛多又紧做起爽| 波多野结衣一区| 另类人妖在线观看一区二区| 亚洲国产av一区二区四季| 野外亲子乱子伦视频丶| 日韩精品成人一区二区三区| 网友自拍人妻一区二区三区三州| 日本亚洲中文字幕一区| 东京道一本热中文字幕| 国产成人综合久久精品推| 91精品人妻一区二区三区蜜臀| 日本一区二区在线高清| 天堂√在线中文官网在线| 波多野结衣视频网址| 免费毛片一区二区三区女同| 国产99一区二区三区四区| 在线高清理伦片a| 国产精品高潮无码毛片| 国产偷拍自拍在线观看| 亚洲av丰满熟妇在线播放| 国产成人综合亚洲精品| 91精品日本久久久久久牛牛| 免费人妻精品一区二区三区| 全黄性性激高免费视频| 欧美极品美女| 福利一区二区三区视频在线| 国产一区av男人天堂| 日韩吃奶摸下aa片免费观看| 在线观看av手机网址| 亚洲av推荐网站在线观看| 国产精品99精品久久免费| 国内少妇偷人精品视频免费| 青青草视频原手机在线观看| 中文字幕国产精品一二三四五区| 亚洲精品乱码久久久久久蜜桃图片| 亚洲福利天堂网福利在线观看| 人妻少妇偷人精品一区二区|