李雨陽,沈記全,翟海霞,馮偉華
(1.河南理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,河南 焦作 454000;2.中國煙草總公司鄭州煙草研究院,鄭州 450000)
新冠疫情爆發(fā)對(duì)全球產(chǎn)生了重大影響。文獻(xiàn)[1]的研究結(jié)果表明,醫(yī)用口罩能夠有效遏制新冠病毒的傳播。佩戴口罩大幅降低了新冠病毒傳播到戴口罩人群的概率,可以有效阻止病毒在人群中的擴(kuò)散,保障人們的生命安全。目前,新冠疫苗已經(jīng)開始大面積接種,但是在公共場(chǎng)合佩戴口罩仍必不可少。因此,在公共場(chǎng)合檢測(cè)人們是否佩戴口罩已經(jīng)成為一項(xiàng)至關(guān)重要的計(jì)算機(jī)視覺任務(wù)。
當(dāng)前,研究人員對(duì)口罩佩戴檢測(cè)算法做了研究。文獻(xiàn)[2]利用HSV+HOG 等傳統(tǒng)的目標(biāo)檢測(cè)算法對(duì)口罩佩戴行為進(jìn)行檢測(cè),雖然達(dá)到了較高的檢測(cè)精度,但傳統(tǒng)的檢測(cè)方法時(shí)間復(fù)雜度較高,魯棒性差。文獻(xiàn)[3]結(jié)合深度學(xué)習(xí)方法設(shè)計(jì)了一種口罩檢測(cè)算法;文獻(xiàn)[4]對(duì)YOLO 算法進(jìn)行改進(jìn),設(shè)計(jì)了新的口罩檢測(cè)算法,雖然這兩種算法均取得了較好的檢測(cè)效果,但只對(duì)口罩是否佩戴的情況進(jìn)行了檢測(cè),沒有充分考慮口罩佩戴錯(cuò)誤的情況,無法充分滿足現(xiàn)實(shí)情況下對(duì)口罩檢測(cè)的需求??谡謾z測(cè)需要準(zhǔn)確識(shí)別出人臉,并且要判斷其是否佩戴口罩、佩戴是否正確。在佩戴口罩的情況下,人臉的大部分特征被遮蓋,這為佩戴口罩檢測(cè)帶來了一定的干擾,因此口罩檢測(cè)對(duì)算法的細(xì)節(jié)特征學(xué)習(xí)及處理能力有更高的要求。此外,有關(guān)口罩佩戴的公開數(shù)據(jù)集較少且數(shù)據(jù)不夠完善,需要重新建立新數(shù)據(jù)集。
目標(biāo)檢測(cè)技術(shù)是實(shí)現(xiàn)口罩佩戴檢測(cè)任務(wù)的關(guān)鍵技術(shù),也是計(jì)算機(jī)視覺方向的研究熱點(diǎn),被廣泛應(yīng)用于各個(gè)領(lǐng)域[5-7]。近年來,研究人員先后提出了Fast R-CNN[8]、Faster R-CNN[9]、YOLO[10-12]、SSD[13]等 優(yōu)秀的深度學(xué)習(xí)目標(biāo)檢測(cè)算法。其中SSD 算法因其在檢測(cè)速度與精度上都表現(xiàn)優(yōu)秀,被眾多學(xué)者加以研究和應(yīng)用。文獻(xiàn)[14]基于該算法對(duì)城市戶外廣告面板進(jìn)行檢測(cè),文獻(xiàn)[15]基于該算法對(duì)煤礦井下帶式輸送機(jī)表面異物進(jìn)行檢測(cè),文獻(xiàn)[16]基于該算法對(duì)野生大熊貓視頻進(jìn)行檢測(cè),文獻(xiàn)[17]基于該算法對(duì)地鐵安檢圖像中的物品進(jìn)行檢測(cè)。這些工作針對(duì)特定場(chǎng)景對(duì)SSD 算法做了相應(yīng)的改進(jìn),都取得了不錯(cuò)的檢測(cè)效果。
在疫情防控條件下,口罩檢測(cè)任務(wù)涉及到的場(chǎng)景復(fù)雜多樣,如人臉特征被遮擋難以檢測(cè)、目標(biāo)尺度不一、小目標(biāo)檢測(cè)效果差等,并且正確與錯(cuò)誤佩戴口罩特征差異小,對(duì)算法的細(xì)節(jié)特征學(xué)習(xí)和處理能力要求更高,SSD 算法對(duì)小目標(biāo)的檢測(cè)效果也不理想。針對(duì)上述問題,本文對(duì)SSD 算法進(jìn)行改進(jìn),利用特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network,F(xiàn)PN)[18]與協(xié)調(diào)注意力機(jī)制[19]增強(qiáng)算法的特征提取和對(duì)小目標(biāo)的檢測(cè)能力。同時(shí),針對(duì)算法正負(fù)樣本不平衡的問題,對(duì)算法的分類分?jǐn)?shù)和IoU 分?jǐn)?shù)進(jìn)行合并表示,將QFL 作為新的損失函數(shù),提出一種新的口罩佩戴檢測(cè)算法。
SSD 是目標(biāo)檢測(cè)領(lǐng)域的經(jīng)典算法之一,目前仍是主流的目標(biāo)檢測(cè)算法。SSD 的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。SSD 網(wǎng)絡(luò)是基于全卷積網(wǎng)絡(luò)結(jié)構(gòu),它將基礎(chǔ)網(wǎng)絡(luò)VGG16[20]的全連接層替換為卷積層,并在VGG16網(wǎng)絡(luò)末端添加了幾個(gè)使特征圖尺寸逐漸減小的輔助性卷積層,用于提取不同尺度的特征圖。SSD 以Conv4_3、FC7、Conv8_2、Conv9_2、Conv10_2 和Conv11_2 層的輸出作為不同尺度的特征圖進(jìn)行檢測(cè),其相對(duì)應(yīng)特征圖的尺寸分別為38×38、19×19、10×10、5×5、3×3 和1×1,分別來處理不同大小的對(duì)象,提高了預(yù)測(cè)速度和精度。
圖1 SSD 網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 SSD network structure
SSD 借鑒了Faster R-CNN 算法的Anchor 機(jī)制,對(duì)提取特征圖的每個(gè)位置上都預(yù)設(shè)了固定數(shù)量的不同長(zhǎng)寬比的先驗(yàn)框,網(wǎng)絡(luò)可以直接在特征圖上采樣,提取候選框進(jìn)行預(yù)測(cè),在保持實(shí)時(shí)檢測(cè)速度的同時(shí),提高了模型的定位準(zhǔn)確度。
SSD 算法使用損失函數(shù)對(duì)模型參數(shù)進(jìn)行優(yōu)化和更新。SSD 的損失函數(shù)為位置誤差(locatization loss)與置信度誤差(confidence loss)的加權(quán)和,其公式如式(1)所示:
其中:x表示預(yù)測(cè)為某一類別的概率;c為置信度;l為預(yù)測(cè)框;g為真實(shí)框;Lconf(x,c)和Lloc(x,l,g)分別為置信度損失和定位損失;α為拉格朗日乘子。
SSD 網(wǎng)絡(luò)結(jié)合來自不同分辨率的多個(gè)特征映射的預(yù)測(cè),然而,淺層特征圖缺乏較強(qiáng)的語義信息,在一定程度上會(huì)影響檢測(cè)性能。深層提取的特征較為抽象,包含的小目標(biāo)信息有限。因此,在較為復(fù)雜的場(chǎng)景中,人臉尺寸大小各異,SSD 算法對(duì)口罩佩戴的檢測(cè)效果不理想,特別是小目標(biāo)人臉。
特征金字塔網(wǎng)絡(luò)(FPN)是一個(gè)自頂向下的網(wǎng)絡(luò),通過上采樣將包含更多抽象和語義信息的高級(jí)特征層引入到低級(jí)特征層中,一定程度上彌補(bǔ)了不同特征圖之間的語義差異,在基本不增加原有模型計(jì)算量的情況下大幅提升了物體檢測(cè)的性能,其結(jié)構(gòu)如圖2 所示。
圖2 特征金字塔網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of feature pyramid network
為了增強(qiáng)算法對(duì)小目標(biāo)的檢測(cè)性能,提高算法對(duì)細(xì)節(jié)特征的學(xué)習(xí)和處理能力,使算法可以更有效地利用細(xì)節(jié)特征信息,尤其是提高對(duì)口罩佩戴錯(cuò)誤情況的檢測(cè)能力,受到FPN 網(wǎng)絡(luò)結(jié)構(gòu)的啟發(fā),本文引入CA(Coordinate Attention)模塊改進(jìn)了算法的網(wǎng)絡(luò)結(jié)構(gòu)。改進(jìn)后的SSD 網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 改進(jìn)的SSD 網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Improved SSD network structure
首先利用FPN 網(wǎng)絡(luò)增強(qiáng)算法的特征提取能力,提高算法對(duì)小目標(biāo)的檢測(cè)性能。本文在Conv4_3、FC7、Conv8_2、Conv9_2 層構(gòu)建出自頂向下的反路徑,使用1×1 卷積核對(duì)特征進(jìn)行降維,以256 個(gè)固定通道獲得不同尺度的特征映射。之后,通過反卷積操作對(duì)高層特征圖進(jìn)行上采樣,并通過元素添加的方式,將處理后的特征圖與SSD 中相應(yīng)的特征圖合并。為了消除上采樣的混疊效應(yīng),之后并不直接使用合并后的特征圖進(jìn)行檢測(cè),而是對(duì)合并后的特征圖做3×3 的卷積運(yùn)算。由此,構(gòu)建一個(gè)自頂向下的特征金字塔網(wǎng)絡(luò),通過上采樣將包含更多抽象和語義信息的高級(jí)特征層引入到低級(jí)特征層中,彌補(bǔ)了不同特征圖之間的語義差異,可以提升對(duì)小尺度目標(biāo)的檢測(cè)的能力。
此外,在佩戴口罩時(shí)人臉的部分特征被遮蓋,因此口罩檢測(cè)對(duì)算法細(xì)節(jié)學(xué)習(xí)和處理的能力要求較高,特別是在口罩佩戴錯(cuò)誤與口罩佩戴正確的特征差異較小。為了進(jìn)一步提高算法對(duì)細(xì)節(jié)的學(xué)習(xí)和處理能力,在網(wǎng)絡(luò)中添加了協(xié)調(diào)注意力CA 模塊,其模塊結(jié)構(gòu)如圖4 所示。CA 模塊通過坐標(biāo)信息嵌入和坐標(biāo)注意力生成兩個(gè)步驟,對(duì)通道關(guān)系和遠(yuǎn)程依賴關(guān)系進(jìn)行編碼。利用CA 模塊可以提高模型的感受野,加強(qiáng)對(duì)人臉口罩佩戴信息的表達(dá),進(jìn)一步提高對(duì)口罩佩戴檢測(cè)尤其是口罩佩戴錯(cuò)誤檢測(cè)的準(zhǔn)確性。
圖4 CA 模塊結(jié)構(gòu)Fig.4 CA module structure
通過這種設(shè)計(jì)可以使得淺層特征圖具有較強(qiáng)的語義信息,增強(qiáng)了算法的特征提取能力,使算法可以充分利用不同尺度特征圖的信息,提高SSD 算法在復(fù)雜場(chǎng)景下對(duì)佩戴口罩目標(biāo)的檢測(cè)能力,改善了算法對(duì)不同尺度目標(biāo)的檢測(cè)能力,提升算法的整體檢測(cè)精度。
SSD 預(yù)設(shè)大量先驗(yàn)框,在訓(xùn)練時(shí)會(huì)產(chǎn)生更多負(fù)樣本,正負(fù)樣本難以平衡。在SSD 算法中采用了難例挖掘的策略來保持正負(fù)樣本比例為1∶3,但這種方式忽視了大量簡(jiǎn)單負(fù)樣本對(duì)模型訓(xùn)練的影響,無法使模型得到充分的訓(xùn)練。對(duì)于SSD 算法存在這些的問題,需要有針對(duì)性地對(duì)其進(jìn)行改進(jìn)。
在2017 年,LIN 等[21]提出了Focal Loss 函數(shù),其表達(dá)式如式(2)所示:
其中:pt是不同類別的分類概率;(1-pt)γ稱為調(diào)制系數(shù),使用γ來調(diào)整調(diào)制系數(shù)。
Focal Loss 可以通過調(diào)制系數(shù)控制簡(jiǎn)單樣本的權(quán)重,減少了易分類樣本在訓(xùn)練中所占的權(quán)重,使得模型在訓(xùn)練時(shí)更專注于難分類的樣本。
雖然Focal Loss 可以解決訓(xùn)練過程中正負(fù)樣本不平衡的問題,但是算法在訓(xùn)練過程中,一部分分類分?jǐn)?shù)低的真正的負(fù)樣本,由于預(yù)測(cè)了一個(gè)分?jǐn)?shù)極高但不可信的IoU,導(dǎo)致其在極大值抑制時(shí),排到了一個(gè)分類分?jǐn)?shù)較低IoU 分?jǐn)?shù)高的真正的正樣本前面,這樣對(duì)結(jié)果會(huì)產(chǎn)生一定的影響。
為解決上述問題,Quality Focal Loss(QFL)[22]函數(shù)對(duì)FL 進(jìn)行了擴(kuò)展改進(jìn)。本文借助QFL 的思想,將SSD 網(wǎng)絡(luò)分類預(yù)測(cè)的分?jǐn)?shù)和IoU 分?jǐn)?shù)進(jìn)行合并表示,即將分類向量在真實(shí)框類別處的值表示為其相對(duì)應(yīng)的IoU 得分。通過這種方式,便將分類和IoU 分?jǐn)?shù)合并為一個(gè)變量,如圖5 所示。這種方式可以解決算法訓(xùn)練和測(cè)試階段中的不一致性,并以端到端方式進(jìn)行訓(xùn)練,避免了出現(xiàn)上述影響算法性能的情況。
圖5 輸出表示Fig.5 Output representation
在改動(dòng)的同時(shí),借助QFL 損失函數(shù)對(duì)正負(fù)樣本進(jìn)行平衡,QFL 公式如式(3)所示。這樣便可以同時(shí)兼顧到對(duì)正負(fù)樣本權(quán)重的平衡,使網(wǎng)絡(luò)得到充分的訓(xùn)練,進(jìn)一步提升算法對(duì)口罩佩戴檢測(cè)的準(zhǔn)確性。
QFL 擴(kuò)展了Focal Loss 的2 個(gè)部分:1)將交叉熵部分-loga(pt)擴(kuò)展到了完整的-((1-y)loga(1-σ) +yloga(σ))版本;2)調(diào)制系數(shù)(1-pt)β推廣為|y-σ|β(β≥0),即σ與連續(xù)的質(zhì)量標(biāo)簽y?[0,1]之間的絕對(duì)距離,σ為sigmoid 函數(shù)的輸出,式(3)中使用絕對(duì)值|·|來保證非負(fù)。這里QFL 的全局最小解即是y=σ,這樣交叉熵部分變?yōu)橥暾慕徊骒兀瑫r(shí)調(diào)節(jié)因子變?yōu)榫嚯x絕對(duì)值的冪次函數(shù)。QFL 可以通過調(diào)整參數(shù)β來調(diào)整正負(fù)樣本的權(quán)重。通過多次實(shí)驗(yàn),本文采用β=2 效果最優(yōu)。
本文的實(shí)驗(yàn)基于Pytorch 框架,編程語言為python3.7,操作系統(tǒng)為Ubuntu16.04,GPU 為NVIDIA Tesla P40,集成開發(fā)環(huán)境為PyCharm,網(wǎng)絡(luò)的輸入大小為300×300,初始學(xué)習(xí)率設(shè)置為0.000 1,采用StepLR調(diào)整策略調(diào)整學(xué)習(xí)率,調(diào)整倍數(shù)gamma=0.92,調(diào)整間隔為step_size=1。
目前有關(guān)人臉佩戴口罩的數(shù)據(jù)集較少,且場(chǎng)景較為單一,普遍缺少口罩佩戴錯(cuò)誤的樣本,因此本文使用自制數(shù)據(jù)集,通過網(wǎng)絡(luò)搜索和個(gè)人采集,自制共計(jì)2 050張圖片的口罩佩戴檢測(cè)數(shù)據(jù)集。其中1 600張作為訓(xùn)練集,450 張作為測(cè)試集,在訓(xùn)練時(shí),隨機(jī)將訓(xùn)練集中10%的數(shù)據(jù)作為驗(yàn)證集。
數(shù)據(jù)集中共包含佩戴口罩、未佩戴口罩以及口罩佩戴錯(cuò)誤3 種情況,涉及高鐵、商場(chǎng)、防疫檢查點(diǎn)等不同場(chǎng)景。數(shù)據(jù)集依照PASCAL VOC 數(shù)據(jù)集格式,使用LabelImg 工具進(jìn)行手工標(biāo)注。數(shù)據(jù)集中各個(gè)類別的標(biāo)簽數(shù)量如表1 所示。
表1 各類別標(biāo)簽數(shù)量Table1 Number of labels by category
數(shù)據(jù)集及標(biāo)注示例如圖6 所示。針對(duì)數(shù)據(jù)集數(shù)據(jù)量不夠高,并且口罩佩戴錯(cuò)誤的樣本數(shù)量相對(duì)較少的問題,實(shí)驗(yàn)采用裁剪、旋轉(zhuǎn)、色彩變換等隨機(jī)數(shù)據(jù)增強(qiáng)方法用來對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行擴(kuò)充,數(shù)據(jù)增強(qiáng)示例如圖7 所示。在增加了數(shù)據(jù)量以及錯(cuò)誤佩戴口罩樣本的數(shù)量的同時(shí),還可以緩解在訓(xùn)練過程中的過擬合現(xiàn)象,提升算法性能以及魯棒性。數(shù)據(jù)增強(qiáng)后口罩佩戴數(shù)據(jù)集的信息如表2 所示。
表2 口罩佩戴數(shù)據(jù)集Table 2 Mask wearing datasets
圖6 數(shù)據(jù)集及標(biāo)注示例Fig.6 Dataset and annotation examples
圖7 原圖與變換后圖像對(duì)比Fig.7 Comparison between original image and transformed images
本文使用平均精度(Average Precision,AP)和平均精度均值(mean Average Precision,mAP)作為口罩檢測(cè)模型的性能評(píng)價(jià)指標(biāo)。AP 值從準(zhǔn)確率P和召回率R兩個(gè)指標(biāo)來衡量模型檢測(cè)的準(zhǔn)確性。準(zhǔn)確率表示實(shí)際是正類并且被預(yù)測(cè)為正類的樣本占所有預(yù)測(cè)正樣本的比例,如式(4)所示;召回率則表示實(shí)際是正類并且被預(yù)測(cè)為正類的樣本占所有實(shí)際為正類樣本的比例,如式(5)所示:
其中:TTP表示被檢測(cè)正確的正樣本;FFP表示被檢測(cè)錯(cuò)誤的正樣本;FFN表示被檢測(cè)錯(cuò)誤的負(fù)樣本。
AP 由準(zhǔn)確率-召回率曲線積分計(jì)算。AP 的值越高,模型表現(xiàn)越好,其計(jì)算公式如式(6)所示。mAP則是各個(gè)類別AP 的平均值,用來衡量多個(gè)目標(biāo)的平均檢測(cè)精度,mAP 的高低可以體現(xiàn)模型對(duì)所有類別檢測(cè)綜合性能的高低。
對(duì)于實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)顯示,每次AJAX請(qǐng)求為盾構(gòu)機(jī)標(biāo)識(shí)ID和當(dāng)前時(shí)間戳TIMESTAMP,服務(wù)器端接收參數(shù)之后,從Redis數(shù)緩存中查詢出數(shù)據(jù),并以AJAX請(qǐng)求中常用的JSON數(shù)據(jù)傳輸格式返回?cái)?shù)據(jù),對(duì)實(shí)時(shí)監(jiān)測(cè)頁面進(jìn)行局部的數(shù)據(jù)更新,從而達(dá)到盾構(gòu)運(yùn)行數(shù)據(jù)實(shí)時(shí)變化的目的。AJAX數(shù)據(jù)請(qǐng)求流程如圖7。
訓(xùn)練過程中訓(xùn)練損失隨迭代次數(shù)的變化如圖8所示。通過對(duì)比可以看出,改進(jìn)后SSD 算法在引入QFL 損失之后,使口罩佩戴檢測(cè)模型得到了充分的訓(xùn)練,在訓(xùn)練時(shí)的損失變化與原SSD 相比,損失的變化下降更快一些,并且更加穩(wěn)定。
圖8 訓(xùn)練損失變化對(duì)比Fig.8 Comparison of training loss changes
改進(jìn)SSD 算法檢測(cè)P-R 曲線如圖9 所示。從P-R 曲線圖中可以計(jì)算出,佩戴口罩、未佩戴口罩、口罩佩戴錯(cuò)誤3 種類別的AP 值分別達(dá)到了96.55%、96.89%、95.39%,最終算法的mAP 達(dá)到了96.28%。與原SSD 算法相比,mAP 提升了5.62%。為綜合評(píng)估本算法的性能,使用本實(shí)驗(yàn)中的數(shù)據(jù)集與其他主流的目標(biāo)檢測(cè)算法進(jìn)行了對(duì)比實(shí)驗(yàn),具體實(shí)驗(yàn)結(jié)果如表3 所示。
圖9 各類目標(biāo)P-R 曲線Fig.9 P-R curve of various targets
表3 不同檢測(cè)算法性能對(duì)比Table 3 Performance comparison of different detection algorithms %
可以看出,對(duì)于口罩檢測(cè)中的3 種類別的AP 值以及mAP,改進(jìn)后的算法均高于RetinaNet 和Faster-RCNN。相比YOLOv3,改進(jìn)后的SSD 算法佩戴口罩的AP 值低于YOLOv3,但是未佩戴口罩和口罩佩戴錯(cuò)誤的AP 值都高于YOLOv3,mAP 值也較優(yōu)。本文設(shè)計(jì)增強(qiáng)了算法的特征提取能力,對(duì)細(xì)節(jié)特征處理的更好,對(duì)于口罩佩戴的各類情況,尤其是針對(duì)口罩佩戴錯(cuò)誤的情況,檢測(cè)效果更好。通過對(duì)比進(jìn)一步證明了算法的有效性。
為驗(yàn)證算法的實(shí)時(shí)性,運(yùn)用各算法對(duì)測(cè)試集的圖片進(jìn)行檢測(cè),樣本數(shù)設(shè)置為1,對(duì)各算法的檢測(cè)速率進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表4 所示。
表4 不同算法檢測(cè)速率對(duì)比Table 4 Comparison of detection rates of different algorithms
本文所設(shè)計(jì)的算法在提升了檢測(cè)精度的情況下與原始SSD 算法相比,檢測(cè)速度降低了2.4 frame/s,平均檢測(cè)速率達(dá)到了28.9 frame/s,仍具有良好的實(shí)時(shí)性。
實(shí)際檢測(cè)效果對(duì)比如圖10 所示,其中,圖10(a)為原版SSD 的檢測(cè)效果,圖10(b)為改進(jìn)后SSD 在相同場(chǎng)景中的檢測(cè)效果。
圖10 改進(jìn)算法的檢測(cè)效果對(duì)比Fig.10 Comparison of detection effect of improved algorithm
為驗(yàn)證改進(jìn)算法的有效性,對(duì)改進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu)的算法進(jìn)行了消融實(shí)驗(yàn)。實(shí)驗(yàn)分別設(shè)置兩組對(duì)照模型,一組為原始的SSD 網(wǎng)絡(luò)模型,另一組則是引入FPN 和CA 模塊改進(jìn)后的SSD 模型,其余實(shí)驗(yàn)設(shè)置均相同,實(shí)驗(yàn)結(jié)果如表5 所示。通過對(duì)比可以看出,改進(jìn)SSD 算法3 種類別的AP 值分別達(dá)到了96.25%、94.43%和93.49%,mAP 達(dá)到了94.72%,相較于原始SSD 提升了4.06%。
表5 消融實(shí)驗(yàn)結(jié)果對(duì)比Table 5 Comparison of ablation experimental results %
此外,本文采用的損失函數(shù),可以通過調(diào)節(jié)β的取值控制正負(fù)樣本的權(quán)重。表6 所示為在對(duì)改進(jìn)算法針對(duì)不同的β值進(jìn)行對(duì)照實(shí)驗(yàn)。
表6 β 取值對(duì)比結(jié)果Table 6 β value comparison results %
從表6 可以看出,當(dāng)β取值為0 時(shí),mAP 的值降低明顯,這是因?yàn)榇藭r(shí)損失函數(shù)不再起到調(diào)節(jié)正負(fù)樣本權(quán)重的效果。當(dāng)其取值為2 時(shí),實(shí)驗(yàn)效果最佳。當(dāng)β的值降低為1 或提高到3 時(shí),mAP 均有一定程度的降低。如果持續(xù)增加β的取值到4 時(shí),與取2.5 時(shí)相比,mAP 的值降低到了94.77%。所以,通過對(duì)比實(shí)驗(yàn)可以得出,對(duì)正負(fù)樣本權(quán)重的調(diào)節(jié)應(yīng)合理控制,過分增大或減小調(diào)制參數(shù)均會(huì)對(duì)算法的性能造成影響。因此,本文實(shí)驗(yàn)的最終取值為β=2。
為配合疫情防控,本文提出一種基于改進(jìn)SSD的口罩佩戴檢測(cè)算法。通過重構(gòu)特征提取網(wǎng)絡(luò),加強(qiáng)了淺層特征圖的語義,提升了算法在復(fù)雜場(chǎng)景下對(duì)不同尺度目標(biāo)的檢測(cè)能力,同時(shí)將分類預(yù)測(cè)分?jǐn)?shù)和IoU 分?jǐn)?shù)進(jìn)行合并,在損失函數(shù)中引入QFL 損失,解決了算法中正負(fù)樣本不平衡的問題,使模型更容易收斂。實(shí)驗(yàn)結(jié)果表明,與原始算法相比該算法具有良好準(zhǔn)確性,能夠滿足疫情防控下的實(shí)際需求,實(shí)現(xiàn)在現(xiàn)實(shí)場(chǎng)景下全面準(zhǔn)確地對(duì)佩戴口罩行為進(jìn)行檢測(cè)。下一步將對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),優(yōu)化網(wǎng)絡(luò)參數(shù),提高網(wǎng)絡(luò)的檢測(cè)速度,在保持較高檢測(cè)精度的同時(shí),提升口罩佩戴檢測(cè)的實(shí)時(shí)性。