亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)YOLOv3的加油站卸油檢測(cè)方法

        2022-12-16 09:38:08杜雪瑞
        關(guān)鍵詞:特征檢測(cè)模型

        劉 均,杜雪瑞

        (東北石油大學(xué) 電氣信息工程學(xué)院,黑龍江 大慶 163318)

        0 引 言

        目前,深度卷積神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于圖像識(shí)別與目標(biāo)檢測(cè),而加油站生產(chǎn)安全問(wèn)題始終是社會(huì)關(guān)注度極高的問(wèn)題,如果工作人員安全意識(shí)淺薄,不合理佩戴安全帽,滅火裝置擺放不規(guī)范,可能引發(fā)嚴(yán)重的安全生產(chǎn)事故。因此,基于加油站安全生產(chǎn)和人員的安全考慮,越來(lái)越多的加油站開始規(guī)范生產(chǎn)安全制度,要求人員在卸油生產(chǎn)時(shí)佩戴安全帽。由于加油站生產(chǎn)作業(yè)環(huán)境繁雜,所以肉眼觀測(cè)等方式容易出現(xiàn)紕漏。為強(qiáng)化對(duì)卸油作業(yè)現(xiàn)場(chǎng)的監(jiān)管力度,考慮將機(jī)器視覺(jué)應(yīng)用其中,以提高監(jiān)管效率,避免安全事故發(fā)生。加油站的卸油檢測(cè)方法已經(jīng)成為構(gòu)建生產(chǎn)安全的一項(xiàng)重要技術(shù),并且其在建筑工地、煤礦、變電站等實(shí)際場(chǎng)景中有廣泛需求。

        深度卷積神經(jīng)網(wǎng)絡(luò)由于能自主從大量樣本的目標(biāo)學(xué)習(xí)特征中,提取關(guān)鍵信息,無(wú)需預(yù)處理,因而可學(xué)習(xí)更廣義的特征。近年來(lái),基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法主要?jiǎng)澐譃閮深?一類是基于目標(biāo)候選框思想的two-stage,另一類是基于回歸思想的one-stage。two-stage算法首先提取感興趣區(qū)域特征,然后采用分類器定位位置,如Fast R-CNN[1],Faster R-CNN等。其中基于區(qū)域進(jìn)行目標(biāo)識(shí)別,雖然定位精度更高,但存在檢測(cè)速度慢的缺點(diǎn)。而one-stage算法利用整張圖片作為網(wǎng)絡(luò)的輸入,直接在輸出層回歸檢測(cè)框的位置和檢測(cè)框所屬的類別,具有更快的檢測(cè)速度,如SSD(Single Shot multibox Detector)、YOLO(You Only Look Once)、YOLOv2等。Redmon等[2]在2018年提出了YOLOv2的改進(jìn)版YOLOv3,通過(guò)在骨干網(wǎng)絡(luò)中引入殘差思想,有助于更好地訓(xùn)練模型,提升網(wǎng)絡(luò)的學(xué)習(xí)能力。

        與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,由于YOLO[3]系列網(wǎng)絡(luò)在檢測(cè)速度方面具有優(yōu)勢(shì),所以廣泛應(yīng)用于工業(yè)領(lǐng)域。但面對(duì)卸油人員的違規(guī)操作,卸油安全無(wú)法保證等因素,通過(guò)增加網(wǎng)絡(luò)規(guī)模的方法雖然能提高檢測(cè)精度,但增大了對(duì)設(shè)備性能的要求,給大規(guī)模部署帶來(lái)了困難,因此難以滿足加油站場(chǎng)景的需要。筆者選用YOLOv3[2]作為基礎(chǔ)模型,在該模型上做進(jìn)一步改進(jìn)。通過(guò)引入RFB(Receptive Field Block)模塊解決模型感受野不足的問(wèn)題,通過(guò)加入CSP(Cross Stage Partial)網(wǎng)絡(luò)降低參數(shù)量并保持檢測(cè)精度,更有利于模型的訓(xùn)練。實(shí)驗(yàn)結(jié)果表明,筆者提出的兩種目標(biāo)檢測(cè)算法YOLOv3-CR和YOLOv3-CRS具有較好的檢測(cè)性能,可為加油站安全、作業(yè)生產(chǎn)提供有效的輔助技術(shù)支持。

        1 YOLOv3算法的基本原理

        YOLOv3是一個(gè)端到端的深度神經(jīng)網(wǎng)絡(luò)模型,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,主要由Darknet-53作為基礎(chǔ)特征提取網(wǎng)絡(luò),Darknet-53網(wǎng)絡(luò)內(nèi)包含大量的殘差結(jié)構(gòu),有助于更好地訓(xùn)練模型;為了能使低層和高層信息進(jìn)行交互,在網(wǎng)絡(luò)模型頸部引入特征金字塔FPN(Feature Pyramid Network)[4],提升網(wǎng)絡(luò)的定位精度。在 YOLOv3模型中,舍棄了池化層,保留了卷積層,通過(guò)調(diào)節(jié)卷積步長(zhǎng)控制輸出特征圖的尺寸,將淺層特征與深層特征進(jìn)行融合,使淺層特征也擁有豐富的語(yǔ)義信息[5]。在訓(xùn)練過(guò)程中對(duì)每幅輸入尺寸416×416的圖像,YOLOv3模型會(huì)分別預(yù)測(cè)得到13×13、26×26、52×52不同尺度大小的特征圖。

        圖1 YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 YOLOv3 network structure

        雖然YOLOv3使用了FPN結(jié)構(gòu)進(jìn)行多尺度檢測(cè),但面對(duì)加油站場(chǎng)景監(jiān)管難度大,目標(biāo)尺度不均等問(wèn)題,原始YOLOv3并不能滿足實(shí)際需要,而且容易受到復(fù)雜場(chǎng)景的干擾,導(dǎo)致檢測(cè)邊界框定位誤差較大,造成小目標(biāo)檢測(cè)效果不好。

        2 加油站作業(yè)檢測(cè)方法

        2.1 空洞卷積

        空洞卷積(Dilated Convolution)[6]可在保證特征圖分辨率不下降、網(wǎng)絡(luò)參數(shù)量不增加的情況下,增大卷積操作的感受野,有效捕獲多尺度特征信息??斩淳矸e是在普通卷積處理數(shù)據(jù)的過(guò)程中注入不同數(shù)量的間隔,間隔的數(shù)量用擴(kuò)張率(dilation Rate)[7]表示,普通卷積相當(dāng)于擴(kuò)張率為1的空洞卷積。圖2給出了擴(kuò)張率分別為1、2、3的空洞卷積過(guò)程。

        圖2 不同擴(kuò)張率的空洞卷積Fig.2 The empty convolution of different expansion rates

        2.2 多尺度感受視野模塊

        感受視野(Respective Field)[8]指特征圖中某單元在輸入圖像上所映射的一塊區(qū)域,其大小與卷積層的參數(shù)、網(wǎng)絡(luò)深度有關(guān)。在加油站作業(yè)檢測(cè)場(chǎng)景中,不同種類的目標(biāo)普遍存在較大的尺寸差異,而同一種目標(biāo)也會(huì)因?yàn)楸O(jiān)控?cái)z像頭的拍攝角度不同,產(chǎn)生不同的尺寸。YOLOv3雖然憑借FPN結(jié)構(gòu)而具有3個(gè)感受視野尺度,但仍較難匹配卸油場(chǎng)景中各尺寸的目標(biāo),因?yàn)闇\層特征分辨率高,具有豐富的空間細(xì)節(jié),對(duì)位置信息更敏感[9],但感受野小卻無(wú)法包含足夠的上下文信息。對(duì)此,筆者參考RFBNet[10],在YOLOv3中引入多尺度感受視野模塊RFB。

        圖3 RFB與RFBS結(jié)構(gòu)圖Fig.3 RFB and RFBS structure drawing

        由于性能較高的目標(biāo)檢測(cè)器計(jì)算非常復(fù)雜,并且YOLOv3檢測(cè)器模型精確度也需要進(jìn)一步提高,而RFB模塊解決了上述問(wèn)題[11],通過(guò)模擬人類視覺(jué)系統(tǒng)感受野特點(diǎn),加上人為設(shè)計(jì)的部分而不是頑固地加深模型,有效增大了感受視野,加強(qiáng)了網(wǎng)絡(luò)特征提取能力。其網(wǎng)絡(luò)結(jié)構(gòu)與Inception[12]的多分支結(jié)構(gòu)非常相似,主要是在Inception基礎(chǔ)上增加了空洞卷積層。RFB模塊建立感受視野與離心率之間的關(guān)系,以增強(qiáng)網(wǎng)絡(luò)特征提取的魯棒性和可區(qū)分性。如圖3a所示,RFB模塊的每個(gè)分支都是由普通卷積和空洞卷積組成,不同分支之間包含了不同尺寸卷積核的普通卷積層,以及空洞卷積層。各分支之間的差異會(huì)產(chǎn)生兩種效果,不同尺寸普通卷積層會(huì)形成不同的基礎(chǔ)感受視野,不同擴(kuò)張率的空洞卷積會(huì)使基礎(chǔ)感受視野得到不同程度的擴(kuò)大。RFB最后將不同分支的輸出特征圖以Concat方式進(jìn)行拼接,再與原特征圖相加,提高YOLOv3網(wǎng)絡(luò)對(duì)各尺寸待檢測(cè)目標(biāo)進(jìn)行匹配的能力。

        為使網(wǎng)絡(luò)更加輕量化,RFBS中選擇兩個(gè)堆疊的3×3卷積層替換RFB中5×5卷積層,并用一個(gè)3×1和一個(gè)1×3卷積層替換原始3×3卷積層。RFB模塊與SPP(Spatial Pyramid Pooling)[13]模塊相比,結(jié)構(gòu)略有差異,二者只是對(duì)特征圖的特征進(jìn)行不同尺度提取。在YOLOv3網(wǎng)絡(luò)中引入RFB網(wǎng)絡(luò)比SPP模塊能獲得更大感受視野,并且不會(huì)增加網(wǎng)絡(luò)深度和計(jì)算量。

        2.3 CSP跨階段局部網(wǎng)絡(luò)

        更深層的卷積神經(jīng)網(wǎng)絡(luò),具有更強(qiáng)的特征表達(dá)和逐層學(xué)習(xí)的能力,但深層網(wǎng)絡(luò)帶來(lái)的梯度不穩(wěn)定和計(jì)算量驟增的問(wèn)題嚴(yán)重影響其網(wǎng)絡(luò)性能。CSPNet(Cross Stage Partial Network)[14]通過(guò)將基礎(chǔ)層的特征圖劃分為兩個(gè)部分,然后通過(guò)跨階段層次結(jié)構(gòu)將它們的特征融合。通過(guò)分割梯度流,使其通過(guò)不同的網(wǎng)絡(luò)路徑傳播,兩條路徑中都不包含屬于另一方的重復(fù)的梯度信息。局部過(guò)渡層(Transition)采用截?cái)嗵荻攘鞯牟呗?避免不同層學(xué)習(xí)重復(fù)的梯度信息,提升網(wǎng)絡(luò)的學(xué)習(xí)能力。

        (1)

        其中*為卷積操作,wi為第i個(gè)密集層的權(quán)重。反向權(quán)重更新的方程為

        (2)

        其中f為權(quán)重更新的函數(shù),gk為傳播到k個(gè)密集層的梯度。由反向權(quán)重方程可看出,權(quán)重是通過(guò)不同梯度信息分開集成的,這樣既保留了原始網(wǎng)絡(luò)特征重用的特點(diǎn),又通過(guò)截?cái)嗵荻攘鞯姆椒ǚ乐固荻刃畔⑷哂郲15]。

        面對(duì)繁雜的加油站作業(yè)場(chǎng)景,YOLOv3網(wǎng)絡(luò)經(jīng)常學(xué)習(xí)過(guò)多的重復(fù)信息,更新的梯度信息很難產(chǎn)生差異,這將影響網(wǎng)絡(luò)的學(xué)習(xí)能力,導(dǎo)致排查違規(guī)操作不準(zhǔn)確,進(jìn)而引發(fā)安全隱患。而CSP結(jié)構(gòu)能有效減少重復(fù)的梯度學(xué)習(xí),使網(wǎng)絡(luò)的學(xué)習(xí)能力大大提升。因此,通過(guò)引入CSP結(jié)構(gòu),設(shè)計(jì)兩種具有跨階段多尺度感受野RFB_CSP和RFBS_CSP結(jié)構(gòu)(見圖4),通過(guò)引入RFB和RFBS模塊并與CSP網(wǎng)絡(luò)結(jié)構(gòu)結(jié)合,減少相同尺度信息的重復(fù)學(xué)習(xí),有利于模型實(shí)現(xiàn)更豐富的梯度組合,同時(shí)降低計(jì)算瓶頸。

        圖4 RFB_CSP和RFBS_CSP結(jié)構(gòu)Fig.4 RFB_CSP and RFBS_CSP structure

        2.4 改進(jìn)的YOLOv3卸油檢測(cè)網(wǎng)絡(luò)結(jié)構(gòu)

        為提升網(wǎng)絡(luò)檢測(cè)效果,提出的網(wǎng)絡(luò)對(duì)YOLOv3網(wǎng)絡(luò)做出如下結(jié)構(gòu)層面改進(jìn):1) 在原有的Darknet53主干網(wǎng)絡(luò)后添加RFB結(jié)構(gòu)模塊,融合全局特征與局部特征,提升檢測(cè)效果;2) 融合CSPNet,提出RFB_CSP和RFBS_CSP兩種模塊,有效解決了在網(wǎng)絡(luò)深度處理中梯度信息因重復(fù)學(xué)習(xí)而造成計(jì)算量增加的問(wèn)題。綜上所述,跨階段局部多尺度YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。

        圖5 改進(jìn)的YOLOv3加油站卸油檢測(cè)網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Improved YOLOv3 gas station unloading detection network structure

        3 實(shí)驗(yàn)結(jié)果

        3.1 構(gòu)建加油站數(shù)據(jù)集

        該實(shí)驗(yàn)的加油站數(shù)據(jù)來(lái)源于大慶安世爾和順達(dá)加油站油庫(kù)視頻監(jiān)控,符合加油站場(chǎng)景下的實(shí)際工作狀況。數(shù)據(jù)集包含黃色工作服、深藍(lán)色工作服、淺藍(lán)色工作服、安全帽、頭部、人、滅火器、滅火毯和油罐車等9個(gè)類別,加油站數(shù)據(jù)集包含了不同大小、顏色等多尺度的目標(biāo)信息,有利于提升模型在檢測(cè)目標(biāo)安全情況時(shí)的魯棒性。為了對(duì)模型性能進(jìn)行評(píng)估,按照9 ∶1的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集總共有1 583張圖像,測(cè)試集有176張圖像,每張圖像中包含一個(gè)或多個(gè)屬于這9類的目標(biāo)。受加油站生產(chǎn)安全,卸油作業(yè)的強(qiáng)度過(guò)大等影響,作業(yè)人員在工作場(chǎng)景下存在難以檢測(cè)的問(wèn)題,以此作為實(shí)驗(yàn)數(shù)據(jù)集更能凸顯本網(wǎng)絡(luò)在檢測(cè)精確度和檢測(cè)效率上的優(yōu)越性。實(shí)驗(yàn)環(huán)境配置如表1所示。

        表1 實(shí)驗(yàn)環(huán)境配置Tab.1 Experimental environment configuration

        3.2 錨盒計(jì)算

        YOLOv3算法中原始的anchor生成方案是根據(jù)COCO數(shù)據(jù)集進(jìn)行的,對(duì)加油站卸油場(chǎng)景下的違規(guī)作業(yè),采用原始的anchor并不合適,為獲得符合目標(biāo)的anchor boxes,使用K-means++聚類算法[16]重新進(jìn)行錨盒計(jì)算,算法步驟如下。

        步驟1 從集合Z中隨機(jī)選取點(diǎn),成為第1個(gè)聚類中心M1。

        步驟2 計(jì)算Z中其余各點(diǎn)x到最近聚類中心Mx的距離D(x),距離越遠(yuǎn)的點(diǎn)具有越大的概率P(x)成為下一個(gè)聚類中心。重復(fù)此步驟,直到找到K個(gè)聚類中心。

        步驟3 計(jì)算Z中每個(gè)點(diǎn)到K個(gè)聚類中心的距離D(x),將距離某一個(gè)聚類中心較近的點(diǎn)劃分到該聚類中心類別中,根據(jù)聚類結(jié)果,重新計(jì)算每個(gè)類別的聚類中心Ci。

        步驟4 重復(fù)步驟3,直到每個(gè)聚類類別的聚類中心Ci不再變化,輸出K個(gè)聚類中心。

        在用K-means++算法進(jìn)行錨盒計(jì)算時(shí),選擇IOU(Intersection Over Union)作為距離D(x)度量指標(biāo),IOU為真實(shí)框x與其重合度較高的聚類中心錨框Cx的交并比。距離D(x)、概率P(x)和聚類中心Ci的計(jì)算公式分別為

        D(x)=1-KIOU(x,Mx)

        (3)

        (4)

        (5)

        經(jīng)過(guò)聚類,聚類出最適合數(shù)據(jù)集的錨盒數(shù)量及尺寸大小,得到了9組錨盒(12,20),(17,36),(21,69),(26,117),(37,191),(38,53),(65,102),(117,251),(234,409),產(chǎn)生的候選框與原標(biāo)記框之間交集與并集的比值為72.29%。

        3.3 標(biāo)注與訓(xùn)練策略

        加油站數(shù)據(jù)集按照YOLO標(biāo)簽格式制作,采用Labelimg打標(biāo)簽開源軟件進(jìn)行標(biāo)注,在對(duì)滅火裝置進(jìn)行標(biāo)注時(shí),選擇作業(yè)時(shí)未用紅布套上的滅火裝置進(jìn)行框定,且樣本數(shù)據(jù)集標(biāo)注過(guò)程中,對(duì)存在遮擋及顯示不全部分未超過(guò)70%的現(xiàn)場(chǎng)目標(biāo),可對(duì)其未遮擋部分進(jìn)行標(biāo)注。訓(xùn)練一共設(shè)置300個(gè)epoch,輸入圖像大小為416×416,在測(cè)試中輸入圖像大小設(shè)為512×512,超參數(shù)Batch size設(shè)為2,初始學(xué)習(xí)率learning rate設(shè)為0.001(學(xué)習(xí)率會(huì)根據(jù)迭代次數(shù)實(shí)時(shí)更新)、衰減系數(shù)decay設(shè)為0.005、動(dòng)量Momentum設(shè)為0.9。其中Labelimg操作界面如圖6所示。

        德國(guó)成熟的分類體系與各級(jí)政府采取的法律制約、政策導(dǎo)向和經(jīng)濟(jì)刺激等手段密不可分,一是合理的垃圾收費(fèi)政策,可回收垃圾不收費(fèi),剩余垃圾按量收費(fèi);二是抵押金制度;三是企業(yè)化的垃圾回收宣傳教育;四是巨額的懲罰機(jī)制。完善的法規(guī)和良好的民眾環(huán)保意識(shí)促進(jìn)了德國(guó)生活垃圾處理產(chǎn)業(yè)的發(fā)展,為德國(guó)在全球垃圾處理領(lǐng)域的領(lǐng)先地位奠定了基礎(chǔ)。目前90%的德國(guó)家庭參與分類收集,家庭的分類工作是對(duì)系統(tǒng)的重大貢獻(xiàn),如果在家庭沒(méi)有進(jìn)行預(yù)分類,到了分揀廠就很難進(jìn)行高效率的分選,回收和再利用的效果將大打折扣。

        圖6 Labelimg操作界面Fig.6 Labeling operation interface

        3.4 評(píng)價(jià)指標(biāo)

        為定量評(píng)價(jià)實(shí)驗(yàn)結(jié)果,選取多類別平均準(zhǔn)確度均值mAP(mean Average Precision)作為網(wǎng)絡(luò)的精度指標(biāo),mAP在公式中用F表示,且有

        (6)

        其中n表示分類數(shù),D為單個(gè)目標(biāo)的平均精度,且有

        (7)

        精確率(Precision)是對(duì)給定數(shù)據(jù)集分類正確樣本個(gè)數(shù)和總樣本數(shù)的比值,召回率(Recall)用于說(shuō)明分類器中判定為真的正例占總正例的比值。精確率和召回率計(jì)算公式分別為

        (8)

        (9)

        其中T為預(yù)測(cè)正確的正樣本數(shù),M為預(yù)測(cè)為正樣本但實(shí)際為負(fù)樣本的數(shù)量,N為預(yù)測(cè)為負(fù)樣本但實(shí)際為正樣本的數(shù)量。

        3.5 實(shí)驗(yàn)結(jié)果與分析

        3.5.1K-means++優(yōu)化結(jié)果對(duì)比實(shí)驗(yàn)

        實(shí)驗(yàn)首先對(duì)比了使用K-means++聚類算法優(yōu)化錨定框Anchor box后,在加油站數(shù)據(jù)集上,YOLOv3算法對(duì)小目標(biāo)的檢測(cè)性能的變化。將未經(jīng)優(yōu)化的目標(biāo)框與通過(guò)K-means++聚類得到的目標(biāo)框的YOLOv3網(wǎng)絡(luò)在加油站數(shù)據(jù)集上進(jìn)行訓(xùn)練,并在測(cè)試集上進(jìn)行驗(yàn)證,結(jié)果如表2所示。

        表2 目標(biāo)框優(yōu)化效果結(jié)果對(duì)比Tab.2 Comparison of optimization results of target box

        表2中從平均準(zhǔn)確率P、平均召回率R以及mAP@0.5,對(duì)比分析使用K-means++算法優(yōu)化目標(biāo)框?qū)W(wǎng)絡(luò)性能帶來(lái)的影響。其中 YOLOv3表示使用未經(jīng)優(yōu)化Anchor box的原始網(wǎng)絡(luò),YOLOv3+anchor表示使用優(yōu)化的錨盒的網(wǎng)絡(luò)。從表2可看出,優(yōu)化目標(biāo)框使其適合對(duì)加油站數(shù)據(jù)集上小目標(biāo)的框定能明顯提升網(wǎng)絡(luò)的檢測(cè)精度,mAP@0.5提升了1.1%。

        筆者提出的YOLOv3加油站作業(yè)檢測(cè)算法進(jìn)行了2方面的改進(jìn):引入多尺度感受RFB和RFBS模塊,以及引入CSP網(wǎng)絡(luò)結(jié)構(gòu)降低計(jì)算量。為驗(yàn)證改進(jìn)算法的有效性,在加油站數(shù)據(jù)集上,進(jìn)行了各類方法的消融實(shí)驗(yàn)。消融實(shí)驗(yàn)結(jié)果如表3所示。表3給出了當(dāng)IOU為0.6時(shí)模型的檢測(cè)精度和召回率,mAP@0.5表示模型的平均準(zhǔn)確率。由表3可知,當(dāng)輸入分辨率為416×416時(shí),在主干特征提取網(wǎng)絡(luò)后引入RFB和RFBS的模型B和C,相比原YOLOv3模型A,平均準(zhǔn)確率分別提升了0.7%和2.3%。模型D、E分別是在B和C的基礎(chǔ)上增加CSP技術(shù),與B和C相比,平均準(zhǔn)確率分別提升了1.6%和0.6%,模型權(quán)重分別減少了12.3 MByte和12.2 MByte。可以看出,針對(duì)YOLOv3的改進(jìn)策略對(duì)檢測(cè)性能的提升均有一定的幫助。

        表3 模型分解對(duì)比實(shí)驗(yàn)Tab.3 Comparative experiment of model decomposition

        綜上,筆者提出的加油站作業(yè)檢測(cè)模型D,在加油站數(shù)據(jù)集上的mAP達(dá)到了83.7%,與原始的YOLOv3模型A相比,mAP提高了2.3%,提出的加油站作業(yè)檢測(cè)模型E,在加油站數(shù)據(jù)集上的mAP達(dá)到了84.3%,與原始的YOLOv3模型A相比,mAP提高了2.9%。

        3.5.3 不同算法性能對(duì)比實(shí)驗(yàn)

        為說(shuō)明算法的有效性,筆者還對(duì)提出算法與目標(biāo)檢測(cè)算法中的表示性算法進(jìn)行了比較。檢測(cè)算法選擇YOLOv3及其改進(jìn)算法,包括YOLOv3-SPP、YOLOv3-Anchor和YOLOv4,并采用相同的實(shí)驗(yàn)配置,在加油站數(shù)據(jù)集上實(shí)現(xiàn)這些算法,結(jié)果如表4所示。

        結(jié)合表4對(duì)比不同算法在加油站數(shù)據(jù)集上的檢測(cè)精度,筆者提出的算法的精度均高于YOLOv4和YOLOv3算法及其改進(jìn)版本。由于筆者提出的加油站作業(yè)檢測(cè)算法旨在實(shí)現(xiàn)輔助視頻監(jiān)控,部署設(shè)備通常是低性能設(shè)備,所以尺寸較小的模型更具有優(yōu)勢(shì)。

        表4 不同算法性能對(duì)比Tab.4 Performance comparison of different algorithms

        3.5.4 不同類別的對(duì)比實(shí)驗(yàn)

        表5列出了YOLOv3及其改進(jìn)算法對(duì)不同類別AP值的對(duì)比,從表5可以看出,筆者提出的兩種模型相比原YOLOv3模型對(duì)9種類別的目標(biāo)檢測(cè)精度都有一定提高,尤其是安全帽和頭部等小目標(biāo)分別比YOLOv3高出了6%和6.6%,同時(shí),對(duì)滅火裝置和油罐卡車等尺寸和形狀變化較大的目標(biāo),精度分別提高了3.3%和9.8%??梢?筆者提出的算法還是達(dá)到了較高的精度。

        表5 不同類別的檢測(cè)AP值對(duì)比Tab.5 Comparison of detection AP values of different categories (%)

        從自制的加油站數(shù)據(jù)集中選取若干幅圖片進(jìn)行YOLOv3算法與筆者提出的算法檢測(cè)結(jié)果對(duì)比實(shí)驗(yàn),二者的IOU閾值、置信度閾值分別設(shè)置為0.6、0.25,從中隨機(jī)選取5幅圖片進(jìn)行說(shuō)明(見圖7)。圖7中左側(cè)圖和右側(cè)圖分別給出了YOLOv3與YOLOv3-CRS的檢測(cè)效果。圖7b中YOLOv3-CRS預(yù)測(cè)出了復(fù)雜場(chǎng)景下的遮擋目標(biāo),由于遮擋目標(biāo)特征不明顯,YOLOv3收到復(fù)雜背景信息的干擾,很難準(zhǔn)確識(shí)別,而YOLOv3-CRS可以更好地提取遮擋物的特征。圖7c中YOLOv3在檢測(cè)黃色工作服時(shí),出現(xiàn)重復(fù)錨框,而YOLOv3-CRS能準(zhǔn)確定位目標(biāo)。圖7e和圖7g中YOLOv3存在不少漏檢目標(biāo),YOLOv3-CRS檢測(cè)出了更多的目標(biāo)。圖7j中YOLOv3-CRS準(zhǔn)確檢測(cè)出了遠(yuǎn)處模糊的滅火毯,其得益于良好的小尺度特征提取能力。

        4 結(jié) 語(yǔ)

        筆者提出了一種多尺度感受野和跨階段局部網(wǎng)絡(luò)相結(jié)合的加油站檢測(cè)算法,首先以YOLOv3主干特征提取網(wǎng)絡(luò)Darknet-53獲取不同尺度的特征圖,接著引入一種多感受野特征提取模塊,實(shí)現(xiàn)不同分辨率特征的融合,在不同尺度的特征圖中融合全局語(yǔ)義信息和局部位置信息。通過(guò)構(gòu)建跨階段局部結(jié)構(gòu)降低計(jì)算成本并保證準(zhǔn)確率。所提出的改進(jìn)模型在加油站數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,以及與原有模型的比較,說(shuō)明了該模型的檢測(cè)準(zhǔn)確率更高。在后續(xù)的研究中,將考慮對(duì)模型進(jìn)行壓縮、剪枝以輕量化加油站作業(yè)檢測(cè)模型,在保證算法檢測(cè)精度的基礎(chǔ)上提升模型檢測(cè)的實(shí)用性。

        猜你喜歡
        特征檢測(cè)模型
        一半模型
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        3D打印中的模型分割與打包
        色婷婷精品大在线视频| 国产亚洲婷婷香蕉久久精品| 免费人成在线观看播放国产| 一区二区三区国产视频在线观看| 国产精品亚洲一级av第二区| 免费人成年激情视频在线观看 | 亚洲精品动漫免费二区| 亚洲av一宅男色影视| 国产一线视频在线观看高清| 精品蜜桃av免费观看| 大陆国产乱人伦| 亚洲日韩精品欧美一区二区 | 精品的一区二区三区| 国产性色av一区二区| 精品国产麻豆免费人成网站| 一卡二卡三卡视频| 亚洲精品2区在线观看| 国产一区二区三区在线视频观看| 日韩放荡少妇无码视频| 亚洲手机国产精品| 色偷偷亚洲女人的天堂| 日韩人妻无码精品一专区二区三区 | 国产小视频网址| 亚洲成人免费久久av| 一本色道久久hezyo无码| 亚洲av无码一区二区三区四区| 国产成年无码久久久免费| 中文字幕午夜精品一区二区三区| 在办公室被c到呻吟的动态图| 中文字幕影片免费在线观看| 99热久久只有这里是精品| 一区二区视频在线观看地址| 熟女少妇在线视频播放 | 亚洲一区二区三区在线网站| 久久这里只有精品黄色| 蜜桃18禁成人午夜免费网站| 成 人 免费 黄 色 视频| 国产精品亚洲国产| 人妻夜夜爽天天爽三区麻豆av| 又大又紧又粉嫩18p少妇| 人妻无码一区二区在线影院|