亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)YOLOv5的X射線安檢圖像違禁品目標(biāo)檢測(cè)算法

        2023-01-11 15:24:48吳素雪
        現(xiàn)代計(jì)算機(jī) 2022年20期
        關(guān)鍵詞:特征檢測(cè)

        吳素雪

        (廣東第二師范學(xué)院物理與信息工程學(xué)院,廣州 510303)

        0 引言

        隨著經(jīng)濟(jì)發(fā)展和貿(mào)易往來的日益頻繁,我國(guó)在重要交通樞紐和人員密集的公共場(chǎng)所對(duì)旅客及其行李實(shí)施安全檢查,維護(hù)公共場(chǎng)所的安全和秩序,保證國(guó)民人身安全和財(cái)產(chǎn)安全。目前,行李安全檢查主要是依賴安檢員對(duì)經(jīng)過X光安檢機(jī)生成的偽彩色圖像進(jìn)行判讀和識(shí)別。面對(duì)客流高峰和高速通行矛盾問題,容易導(dǎo)致疲勞和注意力下降等各種因素干擾,會(huì)造成可能存在的漏檢情況,使得安檢質(zhì)量難以得到保證。因此,尋求智能化、高效化的安檢X射線圖像違禁品檢測(cè)方法,實(shí)現(xiàn)違禁品的自動(dòng)識(shí)別和預(yù)警,更好地輔助安檢人員完成安檢工作,具有較高、較實(shí)用的研究意義[1-2]。

        X射線圖像違禁品檢測(cè)主要任務(wù)是主動(dòng)識(shí)別違禁品的種類,同時(shí)在生成的偽彩色圖像中定位違禁品的位置。由于應(yīng)用場(chǎng)所的特殊性,X射線圖像違禁品檢測(cè)系統(tǒng)生成的偽彩色圖像有其自身特點(diǎn),在安檢過程中待檢測(cè)物品隨機(jī)性和物品擺放隨意性,導(dǎo)致X射線圖像成像背景復(fù)雜,物品間存在嚴(yán)重重疊、遮擋現(xiàn)象和違禁品多尺度等問題,給違禁品檢測(cè)帶來了諸多挑戰(zhàn)。傳統(tǒng)的X射線圖像違禁品檢測(cè)算法大多存在處理步驟繁瑣,檢測(cè)的類目單一或較少,泛化能力較差,針對(duì)特定的場(chǎng)景等問題,難以滿足目前安檢檢測(cè)的任務(wù)需求。與傳統(tǒng)檢測(cè)算法相比,基于卷積神經(jīng)網(wǎng)絡(luò)的X射線安檢圖像違禁品檢測(cè)算法具有更高的準(zhǔn)確率和強(qiáng)大的泛化能力[3]。卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征能力和平移不變性,解決了人為設(shè)計(jì)特征提取器的繁瑣和復(fù)雜背景中目標(biāo)特征提取困難的問題,同時(shí)可以對(duì)區(qū)域特征進(jìn)行分類和邊框回歸,實(shí)現(xiàn)了對(duì)X射線安檢圖像違禁品目標(biāo)的端到端檢測(cè)。因此,基于卷積神經(jīng)網(wǎng)絡(luò)的X射線安檢圖像違禁品檢測(cè)是目前安檢領(lǐng)域的研究熱點(diǎn)和方向[4]。張友康等[5]在SSD框架的基礎(chǔ)上,提出了適用于X光安檢圖像非對(duì)稱卷積多視野神經(jīng)網(wǎng)絡(luò)ACMNet,在公開的數(shù)據(jù)集與自建的數(shù)據(jù)集上,精確度取得了令人滿意的效果。穆思奇等[6]提出一種空洞密集卷積模塊來增強(qiáng)特征表達(dá)能力和卷積視野,加入注意力機(jī)制來增強(qiáng)有效特征和抑制無效特征,得到較好了檢測(cè)效果。

        安檢是一個(gè)兼顧檢測(cè)精度和效率的過程,本文基于一階段YOLOv5網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn),對(duì)其進(jìn)行改進(jìn)以進(jìn)一步適用于安檢圖像違禁品目標(biāo)檢測(cè)場(chǎng)景中。實(shí)驗(yàn)結(jié)果表明,本文算法得到較好的檢測(cè)效果,同時(shí)兼顧了檢測(cè)精度和檢測(cè)速度。

        1 YOLOv5檢測(cè)模型

        卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法主要分為兩大類:一類是基于候選區(qū)域的兩階段算法;另一類是一階段的目標(biāo)檢測(cè)算法。一階段的目標(biāo)檢測(cè)直接對(duì)輸入圖像進(jìn)行一次處理就能夠得到目標(biāo)物體的類別與位置信息,不使用區(qū)域生成算法生成候選框,兼顧了較高的檢測(cè)精度的同時(shí),極大地提高了檢測(cè)速度。YOLOv5屬于一階段YOLO系列[7]中較新的目標(biāo)檢測(cè)算法,其具有輕量級(jí)模型大小及精度高等優(yōu)點(diǎn),如圖1所示。

        圖1 YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)

        由圖1可知,YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)主要由主干網(wǎng)絡(luò)、瓶頸層和預(yù)測(cè)層構(gòu)成。主干網(wǎng)絡(luò)主要用于對(duì)輸入圖像進(jìn)行特征提取,與YOLOv1-4相比,YOLOv5對(duì)輸入的圖片進(jìn)行了Focus切片操作,可以看作是一個(gè)特殊的下采樣操作,減少參數(shù)計(jì)算。每個(gè)CBS模塊由一個(gè)卷積層、標(biāo)準(zhǔn)化層和激活函數(shù)組成,其中激活函數(shù)引入了SiLU激活函數(shù),其在深層模型上的效果優(yōu)于ReLU激活函數(shù)。在主干網(wǎng)絡(luò)中獲取了三個(gè)有效特征層進(jìn)行下一步網(wǎng)絡(luò)的構(gòu)建。

        瓶頸層主要用于對(duì)來自主干網(wǎng)絡(luò)的特征進(jìn)行加強(qiáng)處理。瓶頸層主要包括了特征金字塔網(wǎng)絡(luò)結(jié)構(gòu)(Feature Pyramid Network,F(xiàn)PN)和路徑聚合網(wǎng)絡(luò)結(jié)構(gòu)(Path Aggregation Network,PAN)兩部分。FPN結(jié)構(gòu)采用自上而下的方式對(duì)獲得的有效特征層進(jìn)行特征信息融合,而PAN結(jié)構(gòu)采用自底向上路徑增強(qiáng)的方式進(jìn)行特征信息融合。瓶頸層對(duì)主干網(wǎng)絡(luò)中的有效特征進(jìn)行不同尺度的特征融合,使其同時(shí)具有深層的語義信息和淺層的紋理信息,有利于下一步對(duì)目標(biāo)的分類和定位預(yù)測(cè)。

        預(yù)測(cè)層主要用于對(duì)目標(biāo)的分類與回歸。通過主干網(wǎng)絡(luò)和瓶頸層,已獲得三個(gè)加強(qiáng)過的有效特征層,每一個(gè)特征層都有寬、高和通道數(shù),預(yù)測(cè)層判斷每一個(gè)特征層是否有目標(biāo)與其對(duì)應(yīng),分類和回歸在一個(gè)1×1卷積里實(shí)現(xiàn)。

        相對(duì)眾多目標(biāo)檢測(cè)算法,YOLOv5算法在檢測(cè)速度和精度上都達(dá)到了較高的水平,但在遮擋目標(biāo)和小目標(biāo)檢測(cè)方面還有待改進(jìn),因此本文選擇使用YOLOv5作為基礎(chǔ)算法,嵌入即插即用的模塊,從而得到更加適用于X射線安檢圖像目標(biāo)檢測(cè)算法。

        2 改進(jìn)的X射線安檢圖像違禁品目標(biāo)檢測(cè)模型

        針對(duì)X射線安檢圖像存在重疊遮擋和小尺度違禁品易造成漏檢誤檢的問題,本文引入了一種掩碼自注意力機(jī)制模塊[8],增強(qiáng)網(wǎng)絡(luò)對(duì)全局特征關(guān)系的捕捉能力,在瓶頸層的有效特征層的輸出后和預(yù)測(cè)層輸入前嵌入掩碼自注意力機(jī)制模塊,如圖2所示。該模塊分別對(duì)大、中、小三種尺寸的特征圖進(jìn)行掩碼自注意力操作,完成多尺度違禁品的檢測(cè),提高算法的檢測(cè)精度。此外,改進(jìn)了YOLOv5的類別損失函數(shù),引用Quality Focal Loss(QFL)損失函數(shù),有效地緩解了一階段目標(biāo)檢測(cè)問題中類別不均衡問題。

        圖2 嵌入掩碼自注意力

        2.1 掩碼自注意力機(jī)制模塊

        掩碼自注意力機(jī)制利用并行查詢從輸入特征向量中提取到不同子空間進(jìn)行相關(guān)程度的獲取,其結(jié)構(gòu)如圖3所示。

        圖3 掩碼自注意力機(jī)制結(jié)構(gòu)

        在圖3中,輸入特征圖X與卷積核WQ、WK、WV相乘分別生成查詢向量矩陣Q、鍵向量矩陣K、值向量矩陣V,即Q=XWQ,K=XWK,V=XWV。通過縮放點(diǎn)積對(duì)查詢向量矩陣Q與鍵向量矩陣K做內(nèi)積運(yùn)算,然后用Softmax激活函數(shù)做歸一化得到注意力得分,其數(shù)學(xué)表達(dá)式定義如式(1),對(duì)獲取的注意力得分進(jìn)行掩碼計(jì)算,最后再與值向量矩陣V相乘得到自注意力的輸出。掩碼自注意力模塊的輸出由公式(1)給出:

        2.2 損失函數(shù)

        在一階段的目標(biāo)檢測(cè)算法中,輸入X射線安檢圖像產(chǎn)生的候選框中,只有很少一部分包含著待檢測(cè)的目標(biāo),正負(fù)樣本數(shù)據(jù)不均衡,造成了類別不均衡問題。此外,由于待檢測(cè)物品的隨機(jī)擺放性和X射線安檢偽彩色圖像的特點(diǎn),當(dāng)待檢測(cè)違禁品目標(biāo)集中時(shí),它們的候選框之間的交叉和重疊現(xiàn)象會(huì)有所增加,訓(xùn)練和推理之間的誤差缺口也會(huì)相應(yīng)變大,分類和定位精度容易受到影響。因此,本文使用QFL損失函數(shù)替代YOLOv5中的類別損失函數(shù),可降低大量簡(jiǎn)單負(fù)樣本在訓(xùn)練中所占權(quán)重。QFL損失函數(shù)的數(shù)學(xué)表達(dá)式定義如下:

        其中,y是平滑后的0~1標(biāo)簽,σ為預(yù)測(cè)結(jié)果。β選取1.5。

        3 實(shí)驗(yàn)結(jié)果與分析

        3.1 實(shí)驗(yàn)環(huán)境與參數(shù)設(shè)置

        本實(shí)驗(yàn)使用的硬件環(huán)境為:Intel(R)Core(TM)i7-8750H CPU@2.20GHz處理器,Nvidia GeForce GTX 1070 8GB顯卡,16 G內(nèi)存。軟件環(huán)境為:操作系統(tǒng)Windows10,加速環(huán)境CUDA10.1,編程語言Python3.7,深度學(xué)習(xí)框架Pytorch1.7。

        網(wǎng)絡(luò)模型訓(xùn)練階段,將總迭代周期設(shè)置為300,采用mosaic數(shù)據(jù)增強(qiáng),輸入圖像尺寸大小為640×640,迭代批次大小值為8,初始化學(xué)習(xí)率為0.001,動(dòng)量因子為0.9。

        3.2 實(shí)驗(yàn)數(shù)據(jù)與評(píng)價(jià)指標(biāo)

        為了驗(yàn)證本文算法的有效性,選擇在公開SIXray數(shù)據(jù)集上進(jìn)行算法驗(yàn)證[9]。該數(shù)據(jù)集含有槍、刀、鉗子、扳手、剪刀共5種違禁品類別,該數(shù)據(jù)集由實(shí)際安檢場(chǎng)所拍攝,集中目標(biāo)物體堆放隨機(jī)性相當(dāng)大,圖像中背景復(fù)雜且其中物體存在嚴(yán)重的重疊和遮擋,能較好地反映安檢實(shí)際情況。圖像數(shù)據(jù)集按照7∶3的比例劃分為訓(xùn)練集和測(cè)試集。

        本文采用目標(biāo)檢測(cè)算法中常用的評(píng)價(jià)體系進(jìn)行算法評(píng)估,包括召回率R(recall)、精準(zhǔn)率P(precision)、平均精準(zhǔn)度AP(average precision)和均 值 平 均精 度mAP(mean average precision),F(xiàn)PS定義為模型1 s內(nèi)檢測(cè)的圖像數(shù),該指標(biāo)反映模型在平臺(tái)上的檢測(cè)速度,F(xiàn)PS越高,檢測(cè)速度越快。各標(biāo)準(zhǔn)的具體公式如下:

        其中,TP、FP、FN分別表示檢測(cè)中真正例、假正例、假反例的數(shù)量,Psmooth(r)表示平滑的P-R曲線,K表示類別數(shù)。

        3.3 實(shí)驗(yàn)結(jié)果與實(shí)驗(yàn)分析

        為了驗(yàn)證本文算法的性能,在X射線安檢圖像測(cè)試集上進(jìn)行了實(shí)驗(yàn),結(jié)果顯示mAP和FPS性能結(jié)果分別為82.23%和19 ms,驗(yàn)證了本文算法的有效性。進(jìn)一步將本文算法在X射線安檢圖像測(cè)試集上進(jìn)行檢測(cè)可視化,部分檢測(cè)可視化結(jié)果如圖4所示。

        圖4可視化了本文算法X射線安檢圖像檢測(cè)結(jié)果,其中數(shù)字為目標(biāo)的置信度。由圖4可以看出,在X射線安檢圖像場(chǎng)景中本文算法具有較高的檢測(cè)精度和較好的檢測(cè)效果,能夠準(zhǔn)確檢測(cè)多個(gè)相互遮擋違禁品目標(biāo),在復(fù)雜背景紋理與違禁品目標(biāo)紋理相互重疊的情況下也能檢測(cè)出違禁品目標(biāo),同時(shí)對(duì)分辨率較低且特征信息不明顯的小目標(biāo)也有較好的檢測(cè)效果。

        4 結(jié)語

        為提高X射線安檢圖像中不同違禁品檢測(cè)的性能,本文在YOLOv5基礎(chǔ)上引入掩碼自注意力機(jī)制模塊和QFL損失函數(shù)。通過在瓶頸層輸出后和預(yù)測(cè)層輸入前嵌入即插即用的掩碼自注意力機(jī)制模塊,增強(qiáng)了網(wǎng)絡(luò)對(duì)全局特征關(guān)系的捕捉能力;加入QFL損失函數(shù)有效地降低了因正負(fù)樣本數(shù)據(jù)不均衡造成的較低檢測(cè)精準(zhǔn)度。實(shí)驗(yàn)證明了改進(jìn)后的網(wǎng)絡(luò)模型在SIXray數(shù)據(jù)集上的mAP達(dá)到了82.23%,單幀檢測(cè)速度為19 ms,能夠滿足安檢環(huán)境中的檢測(cè)需求。

        猜你喜歡
        特征檢測(cè)
        抓住特征巧觀察
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        “幾何圖形”檢測(cè)題
        “角”檢測(cè)題
        新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        91情侣视频| 国产成人精品午夜视频| 色狠狠av老熟女| 福利视频一二区| 精品人妻一区二区三区不卡毛片| 色综合久久网| 好大好深好猛好爽视频免费 | 狠狠综合久久av一区二区| 国产成人精品电影在线观看18| 在线va免费看成| 浪荡少妇一区二区三区| 久久国产精品精品国产色| 男女18禁啪啪无遮挡激烈网站| 亚洲国产激情一区二区三区| 国产成人v爽在线免播放观看| 亚洲中文久久久久无码| 国产精品女丝袜白丝袜美腿| 免费大片黄国产在线观看| 亚洲色无码播放| 8090成人午夜精品无码| 日本一级片一区二区三区| 国产内射爽爽大片视频社区在线| 国产99久久久久久免费看| 国产精品白浆视频免费观看| 一区二区精品天堂亚洲av| 欧美又粗又长又爽做受| 国产精品人妻一码二码尿失禁| 国产又黄又爽又无遮挡的视频| 久久精品一区一区二区乱码| 久久精品国产亚洲av麻豆色欲| 无码熟熟妇丰满人妻啪啪| 特黄三级一区二区三区| 插入日本少妇一区二区三区| 亚洲色欲色欲综合网站| 国产喷水在线观看| 午夜男女视频一区二区三区| 精品国产亚洲亚洲国产| 国产香蕉尹人在线观看视频| 亚洲中文一本无码AV在线无码| 国产白色视频在线观看| 麻豆影视视频高清在线观看|