亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進(jìn)YOLO v4-tiny的火焰實時檢測*

        2022-12-22 11:31:24王冠博趙一帆楊俊東丁洪偉
        計算機(jī)工程與科學(xué) 2022年12期
        關(guān)鍵詞:特征檢測模型

        王冠博,趙一帆,李 波,楊俊東,丁洪偉

        (1.云南大學(xué)信息學(xué)院,云南 昆明 650504;2.云南民族大學(xué)電氣信息工程學(xué)院,云南 昆明 650031)

        1 引言

        在現(xiàn)實生活中,火災(zāi)具有傳播速度快、破壞性強(qiáng)等特點,嚴(yán)重威脅著自然環(huán)境和社會安全。因此,構(gòu)建一個快速、有效的火焰識別系統(tǒng)具有重要的現(xiàn)實意義。

        目標(biāo)檢測是計算機(jī)視覺領(lǐng)域的一項挑戰(zhàn)性任務(wù)。近幾年,得益于深度神經(jīng)網(wǎng)絡(luò)的發(fā)展及硬件計算能力的提升[1,2],目標(biāo)檢測取得了一系列重大突破,如SSD(Single Shot Multibox Detector)[3]、YOLO(You Only Look Once)[4-7]系列等算法在速度和精度二者之間達(dá)到了均衡,在實際中得到了廣泛應(yīng)用。YOLO v4-tiny是YOLO系列輕量級網(wǎng)絡(luò)的最新改進(jìn),與YOLO v4相比,模型的參數(shù)量已大幅縮減,適合部署在移動設(shè)備上,但其計算量和準(zhǔn)確度仍有改進(jìn)的空間。

        針對火焰實時檢測的實時性需求,以及火焰特征復(fù)雜、火焰檢測易受周圍環(huán)境干擾的特點,為了能在算力有限的移動設(shè)備上部署更高效的目標(biāo)檢測模型,本文對YOLO v4-tiny進(jìn)行了改進(jìn),在縮小模型尺寸的同時提升了模型的準(zhǔn)確性與實時性。本文做的改進(jìn)主要有以下3點:

        (1)采用結(jié)構(gòu)化修剪的方法對YOLO v4-tiny的卷積核進(jìn)行了修剪。針對火焰圖像噪聲干擾較大、明暗度差別較大且火焰尺寸大小不一的特點,采用膨脹卷積擴(kuò)大模型的感受野,并修改CSP(Cross Stage Partial connections)模塊的部分卷積核尺寸,提出沙漏型CSP-ResNet結(jié)構(gòu);

        (2)為使模型在網(wǎng)絡(luò)淺層即可獲取不同尺度的火焰特征,在模型的前端加入CSP-RFBs(Receptive Field Block)結(jié)構(gòu),增大模型的感受野,生成具有更高分辨率的特征;

        (3)為了使模型能夠檢測不同尺度的火焰圖像,在網(wǎng)絡(luò)深層采用了改進(jìn)型SPPs(Spatial Pyramid Pooling),對多重感受野進(jìn)行進(jìn)一步融合。

        2 相關(guān)工作

        2.1 基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法

        基于深度學(xué)習(xí)的目標(biāo)檢測依靠卷積和池化技術(shù)已達(dá)到優(yōu)異性能,但其參數(shù)量和計算成本比較大,無法部署在移動平臺上?,F(xiàn)實中的目標(biāo)檢測任務(wù)(如自動駕駛)旨在有限的計算能力下達(dá)到最佳精度,這促使研究人員提出了一系列速度更快、精度更高的輕量級網(wǎng)絡(luò)結(jié)構(gòu),主要包括Retinanet[8],Xception[9],MobileNetV1[10],MobileNetV2[11],MobileNetV3[12],ShuffleNet[13]和ShuffleNet V2[14]。

        2.2 膨脹卷積

        膨脹卷積首先出現(xiàn)在DeepLab[15]中,其通過稀疏式的卷積操作來生成具有更高分辨率的特征圖,同時保持相同的參數(shù)量,無需增加計算成本即可捕獲更大區(qū)域信息,已被廣泛應(yīng)用于語義分割任務(wù)中大規(guī)模上下文信息的合并[16]。這種設(shè)計也被一些目標(biāo)檢測器采用,如R-FCN(Region-based Fully Convolutional Network)[17]和DetNet(Deterministic Networking)[18],以提高檢測速度和準(zhǔn)確性。針對火焰圖像場景復(fù)雜、噪聲干擾較多且火焰形態(tài)不一等問題,若要進(jìn)一步提升模型檢測的準(zhǔn)確率,需要擴(kuò)大模型的感受野以獲取更密集的特征。此外,采用膨脹卷積代替?zhèn)鹘y(tǒng)卷積,并不會對圖像特征進(jìn)行壓縮,在處理單類別問題和較大尺度物體時,具有明顯優(yōu)勢。

        2.3 感受野

        在卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)中,感受野可決定某一層輸出結(jié)果中一個元素對應(yīng)的輸入層的區(qū)域大小。在人體關(guān)鍵點檢測、圖像分割等領(lǐng)域,已有采用增大感受野的方法來提高模型性能的研究。Luo等[19]提出了有效感受野的概念,采用擴(kuò)張卷積和逆高斯分布的權(quán)重初始化等方法,抵消感受野的高斯分布影響。Singh等[20]提出了HetConv,在大幅減少參數(shù)量的前提下擴(kuò)大了感受野,同時保證了卷積操作的低延遲和準(zhǔn)確性。

        在目標(biāo)檢測領(lǐng)域,也可以通過增加感受野的方法來提高模型的特征提取能力,改善模型性能。感受野塊RFB(Receptive Field Block)把人類視覺中的感受野機(jī)制引入目標(biāo)檢測,增加模型的感受野,增強(qiáng)了輕量級網(wǎng)絡(luò)結(jié)構(gòu)的特征表示。TridentNet[21]以ResNet-101為骨干網(wǎng)絡(luò),引入膨脹卷積層增加模型感受野,使模型可適用于多尺度特征提取。

        Figure 1 Structure of YOLO v4-tiny network

        3 模型設(shè)計

        3.1 YOLO v4-tiny網(wǎng)絡(luò)結(jié)構(gòu)

        YOLO v4-tiny網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。為了減少計算量,YOLO v4-tiny僅采用了3個級聯(lián)的CSP-ResNet[21]模塊,逐步輸出具有更高分辨率的特征圖。網(wǎng)絡(luò)的檢測層分別連接2種尺寸的YOLO層,分別對輸出的特征圖進(jìn)行分類和定位,并未采用其它技巧來提升模型性能。

        YOLO v4-tiny的模型中端采用3個CSP-ResNet(如圖2所示)進(jìn)行特征提取。CSP-ResNet將CSPNet與ResNet[22]進(jìn)行有效結(jié)合,將梯度變化集成至特征圖,可在減少計算量的同時保證模型的準(zhǔn)確率。

        Figure 2 Structure of CSP-ResNet

        與YOLO v3-tiny堆疊卷積層和池化層的方法不同,YOLO v4-tiny采用了3個殘差模塊來提取圖像特征。YOLO v4-tiny網(wǎng)絡(luò)深層采用了512的卷積濾波器,模型參數(shù)量較大,影響了模型的檢測速度。此外,模型均采用3×3的卷積核,這就使得模型的感受野受限,不利于多尺度特征提取。

        為了解決YOLO v4-tiny的問題,本文提出了改進(jìn)型YOLO v4-tiny。改進(jìn)型YOLO v4-tiny旨在在算力有限的移動設(shè)備上處理速度更快、準(zhǔn)確率更高、性能更好。首先,本文減少了模型參數(shù),并在模型中端的CSP-ResNet引入膨脹卷積,提出沙漏型CSP-ResNet結(jié)構(gòu)。為了解決YOLO v4-tiny感受野有限的問題,在不大量增加額外計算參數(shù)的情況下,本文提出了改進(jìn)型CSP-RFBs并將其應(yīng)用于模型網(wǎng)絡(luò)淺層,以獲取具有更高分辨率的特征。此外,本文在網(wǎng)絡(luò)深層采用了改進(jìn)型CSP-SPPs,對多重感受野進(jìn)行進(jìn)一步融合。圖3為改進(jìn)后的YOLO v4-tiny結(jié)構(gòu)圖。

        3.2 改進(jìn)型YOLO v4-tiny的網(wǎng)絡(luò)結(jié)構(gòu)

        3.2.1 模型參數(shù)修剪

        本文主要采用調(diào)整卷積層濾波器數(shù)目的方法對YOLO v4-tiny進(jìn)行修剪。由于模型剪枝不是本文的主要研究工作,因此采用了一種同時修剪多個卷積層濾波器數(shù)量的剪枝方案。

        目前的模型修剪方法大多是在VGG(Visual Geometry Group)和ResNet等大型神經(jīng)網(wǎng)絡(luò)模型上進(jìn)行的,而用于YOLO v4-tiny、MobileNet和ShuffleNet等的剪枝方法很少,其中一個主要原因是輕量級模型的冗余度明顯低于重量級模型。

        表1為模型參數(shù)修剪前后網(wǎng)絡(luò)結(jié)構(gòu)對比。本文主要對模型中卷積層的濾波器數(shù)量進(jìn)行了修剪。對于具有修剪彈性的層,這種修剪方法可以去除網(wǎng)絡(luò)中的重要部分,并且可以在短時間內(nèi)通過重新訓(xùn)練來恢復(fù)準(zhǔn)確性(小于原來的訓(xùn)練時間)。然而,當(dāng)敏感層的一些過濾器被修剪或大部分網(wǎng)絡(luò)被修剪時,可能無法恢復(fù)原來的準(zhǔn)確性。本文的消融實驗結(jié)果顯示,修剪后模型的參數(shù)量僅為原始模型的32.9%,權(quán)重文件大小為原始模型的55.7%,但模型的準(zhǔn)確率僅比原始模型下降了2.2%,這充分表明了本文采用的修剪方法的有效性。

        Figure 3 Structure of improved YOLO v4-tiny network proposed in this paper

        3.2.2 改進(jìn)骨干網(wǎng)絡(luò)

        為減少模型的計算量,本文對YOLO v4-tiny卷積濾波器數(shù)量進(jìn)行了修剪,并將CSP-ResNet模塊兩端的卷積核尺寸改為1×1,其結(jié)構(gòu)如圖4b所示。這確實大幅度減少了模型的計算量,但帶來了準(zhǔn)確度損失,如表1 所示。為了在縮減參數(shù)的同時盡可能提高模型的準(zhǔn)確性,受MobileNext中沙漏型殘差瓶頸結(jié)構(gòu)的啟發(fā),本文嘗試將膨脹卷積層加入CSP-ResNet,提出沙漏型CSP-ResNet結(jié)構(gòu),如圖4c所示。

        Table 1 Comparison of network structures before and after model pruning

        Figure 4 Structure of CSP-ResNet before and after pruning

        圖4a為YOLO v4-tiny中CSP-ResNet的原始結(jié)構(gòu),包括由b層3×3卷積核組成的基礎(chǔ)層、b/2層3×3卷積核組成的ResNet、b層1×1卷積核組成的過渡層。圖4b為修剪參數(shù)后的CSP-ResNet層,對模型的參數(shù)進(jìn)行了大量修剪,基礎(chǔ)層3×3的卷積核修改為1×1卷積核,模型的整體結(jié)構(gòu)與圖4a的保持一致。圖4c為本文提出的沙漏型CSP-ResNet,在圖4b基礎(chǔ)上,在基礎(chǔ)層和過渡層中加入了膨脹卷積層。

        膨脹卷積最初來自DeepLab[15],可在保持參數(shù)量和相同卷積核尺寸的情況下獲取更高分辨率的特征。

        膨脹卷積既帶有常規(guī)卷積層的卷積濾波功能,也具有池化層的泛化作用。此外,膨脹卷積不會隨著步長Stride的增加而減小特征圖尺寸。膨脹卷積支持指數(shù)級拓展的感受野,在模型中采用膨脹卷積的操作不會丟失分辨率和覆蓋范圍。膨脹卷積的平面計算層如圖5所示。感受野的尺寸呈指數(shù)增長,模型的參數(shù)量則為線性增長。

        Figure 5 Planar computational layers of the 3×3 convolution kernel at different expansion rates

        膨脹卷積可擴(kuò)大模型的感受野,以獲取更高分辨率的特征圖。將膨脹卷積應(yīng)用于CSP-ResNet的基礎(chǔ)層和跨階段連接層,可以極小的計算代價拓寬CSP-ResNet感受野,緩解梯度混淆的問題,進(jìn)而提升模型性能。

        Figure 6 Structure of RFB

        表2為在對模型進(jìn)行參數(shù)修剪后,不同的膨脹率對模型性能的影響,其中BFLOPs(Billion FLoat Operations Per second)表示每秒鐘執(zhí)行的百萬次浮點運(yùn)算次數(shù)。膨脹卷積不會額外增加模型的參數(shù)量,因此3組實驗的參數(shù)量相同。但是,較大膨脹率的膨脹卷積層在計算過程中需要更多的推理時間,且權(quán)重較大,這會直接影響模型的推理時間。因此,采用更大的膨脹率后模型的準(zhǔn)確率略有提升,但模型的FPS下降了0.4。膨脹率設(shè)為1時,即為普通卷積。當(dāng)膨脹率為2和4時,模型的FPS分別下降了0.2和0.4,但模型的準(zhǔn)確率提升了4.8%,這表明膨脹卷積層的引入是有效的。綜合考慮模型的準(zhǔn)確率和實時性,本文選取膨脹率為2的膨脹卷積層。

        Table 2 Inflated convolutional layers performance comparison of pruned model with different ratios

        3.2.3 擴(kuò)大模型的感受野

        Bochkovskiy[7]在YOLO v4中提到,擴(kuò)大模型的感受野是一種以較小推理成本提高目標(biāo)檢測準(zhǔn)確性的方法。由于火焰圖像尺度變化較大,模型的沙漏型CSP-ResNet結(jié)構(gòu)的膨脹卷積可對大尺度的火焰圖像進(jìn)行檢測處理,但膨脹卷積由于網(wǎng)格效應(yīng),在檢測小物體時性能較差。如果能在模型淺層獲取較小尺度的火焰特征,將有助于模型針對較小火焰的識別與檢測。為了在模型淺層就能獲取到更高分辨率的特征圖,且不大量增加計算量,本文在模型前端加入CSP-RFBs。RFB借鑒了Inception的多分支結(jié)構(gòu),加入了膨脹卷積層,可使輕量級CNN模型提取到更深層特征,有效擴(kuò)大了模型的感受野。RFB的結(jié)構(gòu)包括多分支卷積層和膨脹卷積層,其結(jié)構(gòu)如圖6所示。

        RFB網(wǎng)絡(luò)中采用了多尺度的膨脹卷積,并設(shè)置瓶頸結(jié)構(gòu)減少特征圖的通道數(shù)。為獲取更高分辨率的特征,RFB的每個分支都在正常卷積運(yùn)算后面連接不同尺寸的膨脹卷積運(yùn)算。最終,將所有的分支進(jìn)行級聯(lián)合并特征圖。與RFB不同,RFBs(圖7)采用3×3的卷積層來替換5×5的卷積層,以減少RFBs的參數(shù)量。然而,這種方法并不適用輕量級目標(biāo)檢測網(wǎng)絡(luò)。

        Figure 7 Structure of RFBs

        Figure 8 Improved CSP-RFBs

        為了達(dá)到速度與實時性的均衡,本文在RFB的基礎(chǔ)上提出了實時性與準(zhǔn)確性均衡的CSP-RFBs。Wang等[22]引入了CSPNet,這種結(jié)構(gòu)可以應(yīng)用于各種CNN的架構(gòu)中,減少了模型的參數(shù)量和計算量。此外,CSPNet的結(jié)構(gòu)可以減少網(wǎng)絡(luò)的推理時間,已被廣泛應(yīng)用于目標(biāo)檢測的YOLO v4、YOLO v4-tiny等算法。因此,本文將CSPNet的網(wǎng)絡(luò)結(jié)構(gòu)與RFBs相結(jié)合,提出了CSP化的RFBs,圖8為其結(jié)構(gòu)圖。

        RFBs是為了大型目標(biāo)檢測網(wǎng)絡(luò)設(shè)計的,參數(shù)量較大。雖然RFBs采用了1×3和3×1的卷積層,但對于輕量級的目標(biāo)檢測來說,仍然存在較多的冗余參數(shù)。因此,為了進(jìn)一步降低計算成本,增加網(wǎng)絡(luò)中非線性模塊的數(shù)量,本文采用多個1×1 卷積層來加深和拓寬網(wǎng)絡(luò)結(jié)構(gòu)。此外,本文還在1×1卷積層中加入非線性激勵層,以增強(qiáng)網(wǎng)絡(luò)的表現(xiàn)力。然而,僅修改卷積核尺寸并不能達(dá)到預(yù)期的效果,所以本文還改進(jìn)了RFB的結(jié)構(gòu),在RFBs中加入了一個Shortcut層,以增強(qiáng)特征表達(dá)。為了進(jìn)一步增強(qiáng)輸出特征,本文提出了CSP-RFBs。CSP-RFBs增加了3個3×3的卷積層和深度分離的卷積,使模型能夠獲得更深的特征,增強(qiáng)CSP-RFBs的魯棒性。

        為了驗證CSP-RFBs的有效性,本文將RFBs與改進(jìn)型RFBs、CSP-RFBs在火焰數(shù)據(jù)集上進(jìn)行對比。表3為分別采用RFB、RFBs和改進(jìn)型RFBs時模型的性能對比。RFB是針對通用型大型卷積神經(jīng)網(wǎng)絡(luò)設(shè)計的,因此模型參數(shù)量最大,實時處理速度最慢。采用RFBs之后,模型的參數(shù)量得到了縮減,準(zhǔn)確率和FPS也得到了進(jìn)一步提升。采用本文提出的改進(jìn)型CSP-RFBs之后,模型的參數(shù)量得到進(jìn)一步縮減,整體性能優(yōu)于RFB的和RFBs的。

        Table 3 Model performance comparison respectively using RFB, RFBs, and improved RFBs

        3.2.4 改進(jìn)型CSP-SPPs

        由于真實火焰圖像的尺寸變化較大,為了使模型可以檢測不同大小的火焰圖像,使模型整體具有較強(qiáng)的魯棒性,本文在模型深層將不同尺寸的特征進(jìn)行了融合。He 等[23]首先提出SPP結(jié)構(gòu),將空間金字塔匹配模塊融合至卷積神經(jīng)網(wǎng)絡(luò),并采用了最大池化層。YOLO v3、YOLO v4和Scaled-YOLO v4均對SPP進(jìn)行了改進(jìn),并達(dá)到了最優(yōu)效果。但是,這些改進(jìn)的SPP結(jié)構(gòu)都是為參數(shù)量和計算量都比較大的大型目標(biāo)檢測網(wǎng)絡(luò)設(shè)計的,并不適用于輕量級目標(biāo)檢測網(wǎng)絡(luò)。因此,本文對SPP重新進(jìn)行了設(shè)計,分別刪除了CSP-SPP中的1×1和3×3卷積層,如圖9所示。消融實驗結(jié)果表明了改進(jìn)型CSP-SPPs的有效性。

        Figure 9 Structure of CSP-SPP and improved CSP-SPP

        Table 4 Models performance comparison respectively using SPP, CSP-SPP,and improved CSP-SPPs

        表4為修剪后的模型分別采用SPP、CSP-SPP和改進(jìn)型CSP-SPPs時的性能對比。由于SPP是針對大型目標(biāo)檢測網(wǎng)絡(luò)設(shè)計的,基礎(chǔ)層的卷積層較多,參數(shù)量較大,因此采用SPP后,模型的參數(shù)量最大,實時處理速度最慢。采用CSP-SPP之后,模型的參數(shù)量和權(quán)重文件大小得到縮減,實時處理速度提升了14,但模型的準(zhǔn)確率下降了0.3%。采用改進(jìn)型CSP-SPPs之后,模型的參數(shù)量和權(quán)重文件大小分別減少了0.301 BFLOPs和1.8 Mb,準(zhǔn)確率和FPS分別提升了2.4%和1.2。因此,在移動設(shè)備采用改進(jìn)型CSP-SPPs是有效的。

        4 實驗及結(jié)果分析

        4.1 實驗平臺與數(shù)據(jù)集

        本節(jié)在NVIDIA RTX 2080Ti平臺上訓(xùn)練改進(jìn)型YOLO v4-tiny,在NVIDIA Jeston Xavier NX開發(fā)板上測試FPS。NVIDIA Jeston Xavier NX開發(fā)板具有384個CUDA核心,48個tensor核心和2個NVIDIA引擎,性能是NVIDIA Jetson TX2的10倍以上,具有精確多模式的AI推理功能,在15 W功率下AI性能可達(dá)21 TOPS(Tera Operations Per Second)。以下實驗采用15W 2核心的功率模式進(jìn)行測試。

        Table 5 NVIDIA RTX 2080Ti vs NVIDIA Jetson Xavier NX

        本文采用的實驗火焰圖像數(shù)據(jù)集分別來自kaggle火焰數(shù)據(jù)集(https://www.kaggle.com/phylake1337/fire-dataset)、火焰公開數(shù)據(jù)集(http://signal.ee.bilkent.edu.tr/VisiFire/)以及互聯(lián)網(wǎng)采集,一共967幅火焰圖像,其中,70%(711幅)組成訓(xùn)練集,30%(256幅)組成測試集。所有數(shù)據(jù)集均用LabelImg進(jìn)行標(biāo)注。

        本文實驗以YOLO v4作者提供的模型參數(shù)為基礎(chǔ),經(jīng)過大量實驗選取最優(yōu)參數(shù),并對部分參數(shù)進(jìn)行了調(diào)整。本實驗采用DarkNet框架在2080Ti平臺上對改進(jìn)型YOLO v4-tiny進(jìn)行訓(xùn)練,它是一個用C和CUDA編寫的開源神經(jīng)網(wǎng)絡(luò)框架,支持CPU和GPU。模型默認(rèn)輸入圖像尺寸為416×416,采用SGD優(yōu)化器,批量大小設(shè)為64,動量為0.9,學(xué)習(xí)率在初期設(shè)為0.002 61,在迭代至訓(xùn)練次數(shù)的80%和90%時,學(xué)習(xí)率分別降至初始值的10%和1%,迭代次數(shù)設(shè)為8 000。

        4.2 消融實驗

        為了證明改進(jìn)方法的有效性以及每個模塊對模型的影響,本文首先對YOLO v4-tiny的網(wǎng)絡(luò)參數(shù)進(jìn)行了縮減,之后依次加入CSP-RFBs模塊、沙漏型CSP-ResNet模塊和改進(jìn)型CSP-SPPs模塊分別進(jìn)行實驗。表4為消融實驗結(jié)果,實驗結(jié)果包括準(zhǔn)確率(mAP)、模型權(quán)重文件大小、模型參數(shù)量和實時處理速度FPS。

        Figure 10 Comparison of detection results between YOLO v4-tiny and the improved model in this paper

        由表6可知,對YOLO v4-tiny的模型參數(shù)進(jìn)行修剪之后,模型的參數(shù)量僅為2.23 BFLOPs,模型的權(quán)重文件大小為13.1 Mb,約為原始模型的55.7%。由于參數(shù)量和模型的計算量得到了極大縮減,因此模型的推理時間也大幅減少,F(xiàn)PS提升了20.6,但同時也帶來了準(zhǔn)確率的損失,模型的準(zhǔn)確率相比原始模型的下降了2.2%。加入CSP-RFBs后,在淺層網(wǎng)絡(luò)擴(kuò)大了模型的感受野,僅額外增加0.13 BFLOPs的計算量,模型的準(zhǔn)確率卻得到了14.6%的提升。由于增加了一個CSP網(wǎng)絡(luò)層,因此模型的FPS下降了5.3。加入沙漏型CSP-ResNet模塊后,參數(shù)量增加了0.06 BFLOPs,模型的準(zhǔn)確率得到了進(jìn)一步的提升。由于膨脹卷積層的加入,模型的權(quán)重文件大小增加了2.9 Mb,F(xiàn)PS損失了6.3。最后,在模型中加入改進(jìn)型CSP-SPPs模塊,參數(shù)量僅增加了0.03 BFLOPs,模型的FPS與之前相比并無較大變化,但準(zhǔn)確率得到了1.8%的提升。因此,本文在減小模型尺寸、減少計算量的基礎(chǔ)上,提升了模型的檢測精度和檢測速度。

        Table 6 Analysis of the ablation experimental results of the improved YOLO v4-tiny model

        圖10為YOLO v4-tiny與本文改進(jìn)模型針對火焰圖像的檢測結(jié)果對比圖。從圖10中可看到,在較為簡單的檢測場景中,本文改進(jìn)模型的準(zhǔn)確度均優(yōu)于原始模型的。在檢測目標(biāo)較多、火焰尺度變化較大的復(fù)雜場景中,原始模型會出現(xiàn)漏檢、虛檢情況。本文提出的改進(jìn)模型在實際檢測中,準(zhǔn)確度和檢測效果均有較大提升,模型整體優(yōu)于原始模型。

        4.3 與其他輕量級目標(biāo)檢測模型性能對比

        本節(jié)選取SqueezeNet SSD、MobileNet SSD與改進(jìn)型YOLO v4-tiny進(jìn)行對比,數(shù)據(jù)集同樣采用火焰數(shù)據(jù)集,在NVIDIA RTX 2080Ti平臺上進(jìn)行訓(xùn)練,在NVIDIA Jetson Xavier NX平臺上進(jìn)行測試,與前文實驗環(huán)境保持一致。

        表7為模型性能對比的實驗結(jié)果。從表7可以看出,改進(jìn)型YOLO v4-tiny在權(quán)重、參數(shù)量和FPS方面均取得了較好的結(jié)果。改進(jìn)型YOLO v4-tiny的參數(shù)量約為SqueezeNet SSD的54.6%,權(quán)重文件大小減小了5.9 Mb,mAP提高了17.3%,實時處理速度也高于SqueezeNet SSD的。MobileNet SSD的準(zhǔn)確率高于表6中的YOLO v4-tiny的準(zhǔn)確率。為了進(jìn)一步比較MobileNet SSD與改進(jìn)型YOLO v4-tiny的性能,本文對MobileNet SSD的卷積核進(jìn)行了修剪,在保證模型參數(shù)量相近的情況下,比較模型的性能。修剪卷積核之后的MobileNet SSD的模型權(quán)重文件大小和FPS均有較大改進(jìn),但準(zhǔn)確率卻急劇下降。因此,就整體性而言,改進(jìn)型YOLO v4-tiny是一種部署在計算能力有限平臺上的競爭模型。

        Table 7 Comparison with other lightweight target detection models on the flame dataset

        5 結(jié)束語

        本文提出一種針對火焰實時檢測的改進(jìn)型輕量級目標(biāo)檢測模型。本文在YOLO v4-tiny的基礎(chǔ)上,對模型參數(shù)量進(jìn)行了縮減。為達(dá)到準(zhǔn)確率與實時性的均衡,本文首先對CSPNet模塊進(jìn)行改進(jìn),增強(qiáng)了模型特征提取能力;之后加入RFBs模塊以擴(kuò)大感受野,使模型可獲取到更高分辨率的特征圖;最后在網(wǎng)絡(luò)深層加入改進(jìn)型CSP-SPPs,對多重感受野進(jìn)行進(jìn)一步融合。實驗結(jié)果表明,本文提出的改進(jìn)YOLO v4-tiny模型的整體性能均優(yōu)于YOLO v4-tiny的,但針對復(fù)雜場景的火焰檢測,會出現(xiàn)虛檢和誤檢的現(xiàn)象,這是由于網(wǎng)絡(luò)較淺,學(xué)習(xí)能力較差。因此,為解決這個問題,接下來準(zhǔn)備將特征金字塔網(wǎng)絡(luò)進(jìn)行輕量化改進(jìn),并將其應(yīng)用至輕量化檢測模型,以獲得更優(yōu)的性能。

        猜你喜歡
        特征檢測模型
        一半模型
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達(dá)“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        3D打印中的模型分割與打包
        久久想要爱蜜臀av一区二区三区| 久久精品亚洲牛牛影视| 亚洲国产精品午夜电影| av在线网站一区二区| 亚洲日本国产精品久久| 人妻夜夜爽天天爽三区| 无遮挡亲胸捏胸免费视频| АⅤ天堂中文在线网| 日韩av水蜜桃一区二区三区| 久久久久亚洲av成人网人人软件| 依依成人精品视频在线观看| 国产亚洲精品福利在线| 长腿丝袜在线观看国产| 精品国产sm最大网站| 久久国产精品-国产精品| 精品一精品国产一级毛片| 中文字幕一区二区三区精品在线| 国产高清一区二区三区四区色| 亚洲av日韩av天堂一区二区三区| 一本大道香蕉视频在线观看| 日本最新在线一区二区| 日本一区二区在线免费视频 | 国产乱淫视频| 亚洲免费看三级黄网站| 青青草骚视频在线观看| 国产高清在线精品一区二区三区| 国产人成无码视频在线| 色婷婷一区二区三区四| 无遮挡激情视频国产在线观看| 性一交一乱一乱一视频| 国产精品天天看大片特色视频 | 亚洲国产综合在线亚洲区亚洲av| 久久精品国产免费观看| 国产精品久久国产精品99gif| av天堂手机在线免费| 亚洲中文字幕人妻av在线| 亚洲色丰满少妇高潮18p| 青青草视频网站免费观看| 国产乱人伦偷精品视频还看的| 久久婷婷五月综合97色一本一本| 国内精品一区二区三区|