亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于改進(jìn)YOLOv8的火情智能檢測(cè)算法

2024-06-11 00:00:00葉偉華劉海雄胡蓉

軟件工程 2024年5期

關(guān)鍵詞：YOLOv8;目標(biāo)檢測(cè);火情檢測(cè);深度學(xué)習(xí);注意力機(jī)制

中圖分類號(hào)：TP391 文獻(xiàn)標(biāo)志碼：A

0 引言（Introduction）

火情檢測(cè)是一項(xiàng)具有重要意義的任務(wù)，它能夠保護(hù)人類的生命和財(cái)產(chǎn)安全，及時(shí)發(fā)現(xiàn)并采取措施防止火情蔓延是非常必要的[1]。目前，應(yīng)用范圍較廣的火情檢測(cè)技術(shù)主要通過傳感器檢測(cè)火情的發(fā)生[2]，但這些方法存在探測(cè)范圍有限、無法及時(shí)預(yù)警和需要定期維護(hù)等缺點(diǎn)[3]。基于此，本文提出了一種融合注意力機(jī)制及多尺度特征信息的YOLOv8[4]火情智能檢測(cè)算法。首先，以YOLOv8n作為框架在Neck部分使用CBAM（Convolutional Block Attention Module），幫助模型更加準(zhǔn)確地檢測(cè)和定位火情。其次，為了更好地獲取并融合多尺度的火焰主體信息，在Backbone上使用了空洞空間卷積池化金字塔模塊，使模型能夠針對(duì)性地學(xué)習(xí)特征。最后，為了幫助模型更有效地學(xué)習(xí)，在Neck部分添加使用BiFPN模塊，以此獲得更好的表征能力，從而實(shí)現(xiàn)對(duì)火情的精確檢測(cè)。

1 基于計(jì)算機(jī)視覺的火情檢測(cè)（Fire detectionbased on computer vision）

近年來，計(jì)算機(jī)視覺和自然語言處理算法被廣泛應(yīng)用于各行各業(yè)[5]。目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺算法的一個(gè)主要應(yīng)用，被應(yīng)用于航空航天探測(cè)、交通安全、工業(yè)設(shè)備產(chǎn)品檢測(cè)等領(lǐng)域[6]，并且在火情檢測(cè)領(lǐng)域也有不少的應(yīng)用與研究[7]。汪睿卿等[8]設(shè)計(jì)了細(xì)節(jié)特征融合模塊用于提取特征，以此提升火情檢測(cè)的精度。金仙力等[9]使用改進(jìn)的三幀差分法配合改進(jìn)的自適應(yīng)高斯混合聚類GMM算法進(jìn)行煙霧和火焰的檢測(cè)，從而提升算法的實(shí)時(shí)性和檢測(cè)性能。LU等[10]基于多任務(wù)學(xué)習(xí)對(duì)火情進(jìn)行檢測(cè)，融合每個(gè)任務(wù)的優(yōu)勢(shì)提升檢測(cè)的準(zhǔn)確度。張融等[11]結(jié)合目標(biāo)檢測(cè)網(wǎng)絡(luò)FCOS（Fully Convolutional One-Stage）和GhostNet特征提取網(wǎng)絡(luò)檢測(cè)火情。KHAN 等[12]利用MobileNetV2模型的預(yù)訓(xùn)練卷積層和全連接層解決森林火情的定位和分類問題。張為等[13]在特征提取網(wǎng)絡(luò)中添加DenseNet以增強(qiáng)特征復(fù)用，從而更好地檢測(cè)火情。雖然這些檢測(cè)方法在一定程度上實(shí)現(xiàn)了火情檢測(cè)的自動(dòng)化，但是在檢測(cè)精度方面仍有待提升。

2 YOLOv8算法（YOLOv8 algorithm）

YOLOv8算法是目前應(yīng)用較為廣泛的一階段目標(biāo)檢測(cè)模型[14]，按照網(wǎng)絡(luò)的寬度與深度從小到大排序依次分為YOLOv8s[15]、YOLOv8n[16]、YOLOv8m[17]、YOLOv8l[18] 和YOLOv8x[19]。YOLOv8模型主要由Input、Backbone、Neck和Head四部分構(gòu)成。Input部分主要負(fù)責(zé)對(duì)原始數(shù)據(jù)進(jìn)行處理和增強(qiáng);Backbone部分主要負(fù)責(zé)對(duì)輸入圖像進(jìn)行特征提取，其淺層網(wǎng)絡(luò)負(fù)責(zé)提取目標(biāo)邊緣等底層特征，深層網(wǎng)絡(luò)負(fù)責(zé)構(gòu)建高級(jí)語義信息;Neck部分主要負(fù)責(zé)對(duì)特征圖進(jìn)行多尺度特征融合;Head部分負(fù)責(zé)進(jìn)行最終的回歸預(yù)測(cè)。YOLOv8經(jīng)歷了多個(gè)版本的優(yōu)化，研究人員在持續(xù)改進(jìn)其結(jié)構(gòu)的同時(shí)又保持了卓越的速度，以提升模型性能。這些改進(jìn)使得YOLOv8成為一個(gè)穩(wěn)健、可靠的目標(biāo)檢測(cè)模型。YOLOv8n模型是YOLOv8系列中最基礎(chǔ)的網(wǎng)絡(luò)之一，其具有較高的精度和較快的檢測(cè)速度，因此YOLOv8n更適合應(yīng)用于火情的檢測(cè)。

3 基于改進(jìn)YOLOv8 的火情智能檢測(cè)算法（Intelligent fire detection algorithm based onimproved YOLOv8）

為了應(yīng)對(duì)現(xiàn)有火情檢測(cè)方法易受外部條件影響、準(zhǔn)確率低的缺點(diǎn)，本文提出了基于改進(jìn)YOLOv8的火情智能檢測(cè)算法。首先，通過引入CBAM[20]獲取通道信息和空間相關(guān)的位置信息;其次，使用空洞空間卷積池化金字塔模塊[21]對(duì)給定的輸入以不同采樣率的空洞卷積進(jìn)行采樣，即以多個(gè)比例捕獲圖像的上下文信息;最后，在Neck部分使用BiFPN模塊[22]，使模型能夠針對(duì)性地學(xué)習(xí)特征。基于改進(jìn)YOLOv8的火情智能檢測(cè)算法網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。

3.1CBAM 注意力模塊

為了幫助模型更加準(zhǔn)確地定位和檢測(cè)火情，在Neck部分添加了CBAM，其不僅關(guān)注通道維度上的信息，還考慮了空間位置上的相關(guān)信息，這有助于模型更準(zhǔn)確地定位和識(shí)別感興趣的對(duì)象，CBAM結(jié)構(gòu)如圖2所示。CBAM 由兩個(gè)子模塊組成：通道注意力模塊（Channel Attention Module，CAM）和空間注意力模塊（Spatial Attention Module，SAM）。

3.1.1 通道注意力模塊（CAM）

CAM通過對(duì)特征圖在通道維度上進(jìn)行平均池化和全連接網(wǎng)絡(luò)處理，以學(xué)習(xí)通道之間的相互關(guān)系，CAM 基本架構(gòu)如圖3所示。首先，將特征圖F并行輸入MaxPool層和AvgPool層中;其次，經(jīng)過Shared MLP模塊將通道數(shù)壓縮為原來的1/r倍，再擴(kuò)張到原通道數(shù)，經(jīng)過ReLU激活函數(shù)后，將兩個(gè)輸出結(jié)果進(jìn)行逐元素相加;最后，通過Sigmoid激活函數(shù)得到最終的結(jié)果，其公式如下：

其中：F 為輸入的特征表示，σ 為Sigmoid激活函數(shù)。

通過計(jì)算通道的重要性權(quán)重，對(duì)不同通道的特征進(jìn)行加權(quán)融合，使網(wǎng)絡(luò)能夠自適應(yīng)地選擇和強(qiáng)化重要的通道特征，抑制不重要的通道特征。

3.1.2 空間注意力模塊（SAM）

SAM通過在空間維度上應(yīng)用卷積層學(xué)習(xí)特征圖中每個(gè)空間位置的權(quán)重，SAM 的基本架構(gòu)如圖4所示。首先，將經(jīng)過CAM模塊得到的輸出結(jié)果通過MaxPool層和AvgPool層得到兩個(gè)特征圖;其次，經(jīng)過Concat操作將兩個(gè)特征圖進(jìn)行拼接;最后，經(jīng)過卷積核后通過Sigmoid激活函數(shù)得到最終的結(jié)果，其公式如下：

SAM可以捕捉到不同空間位置之間的相關(guān)性，并根據(jù)特定任務(wù)的需求，自適應(yīng)地調(diào)整特征圖的空間分布，有助于網(wǎng)絡(luò)更好地關(guān)注重要的空間位置，提高模型的檢測(cè)性能。本文“4.4.1”節(jié)的實(shí)驗(yàn)表明，CBAM能夠提升模型的火情檢測(cè)準(zhǔn)確率。

3.2 空洞空間卷積池化金字塔模塊

為了幫助模型提取多尺度的信息，從而更加精準(zhǔn)地進(jìn)行檢測(cè)及定位，在Backbone部分使用空洞空間卷積池化金字塔模塊?？斩纯臻g卷積池化金字塔模塊使用具有不同采樣率的多個(gè)并行空洞卷積層，為每個(gè)采樣率提取的特征在單獨(dú)的分支中進(jìn)一步處理，并融合后生成最終結(jié)果。該模塊通過不同的空洞率構(gòu)建不同感受野的卷積核，用來獲取多尺度物體信息，空洞空間卷積池化金字塔模塊結(jié)構(gòu)圖如圖5所示。本文“4.4.2”節(jié)的實(shí)驗(yàn)表明，空洞空間卷積池化金字塔模塊能夠提升模型的火情檢測(cè)精度。

3.3BiFPN模塊

早期的物體檢測(cè)算法通常是在主干部分的最后一層特征添加檢測(cè)頭進(jìn)行物體檢測(cè)，通常，此類算法無法有效地表征各個(gè)尺度的物體，因此提出了特征金字塔網(wǎng)絡(luò)（FPN）。在YOLOv8中采用的是路徑聚合網(wǎng)絡(luò)PANet，PANet的基本結(jié)構(gòu)如圖6（a）所示。PANet的核心思想是構(gòu)建一個(gè)自下而上的特征金字塔，以獲取不同尺度的特征表示。但是，由于它只是Fig.5 Structure diagram of Atrous spatial pyramid pooling module簡(jiǎn)單地將不同尺度的特征調(diào)整成固定大小后進(jìn)行簡(jiǎn)單的求和，因此忽略了不同尺度信息對(duì)特征融合貢獻(xiàn)程度的差異。為了解決以上問題，本文引入了BiFPN模塊，通過引入雙向路徑和跨層連接融合更多的特征信息，使用動(dòng)態(tài)的特征權(quán)重調(diào)整方式，使模型能夠關(guān)注到更多重要的層，BiFPN的基本結(jié)構(gòu)如圖6（b）所示。本文“4.4.3”節(jié)的實(shí)驗(yàn)表明，BiFPN模塊能夠提升模型的火情檢測(cè)精度。

4 實(shí)驗(yàn)結(jié)果分析（Experimental results analysis）

4.1 火情數(shù)據(jù)集

本文使用的火情數(shù)據(jù)集均來自互聯(lián)網(wǎng)，并對(duì)其中標(biāo)注不清、漏標(biāo)的數(shù)據(jù)進(jìn)行重新標(biāo)注。火情數(shù)據(jù)集示例如圖7所示，數(shù)據(jù)集包含工業(yè)園區(qū)、森林及城市建筑等不同場(chǎng)景下的火情圖像數(shù)據(jù)。針對(duì)原始圖像較少的問題，利用數(shù)據(jù)增強(qiáng)技術(shù)對(duì)圖片進(jìn)行裁剪、旋轉(zhuǎn)、拼接、加入噪聲以及強(qiáng)增對(duì)比度等方法擴(kuò)大數(shù)據(jù)集，共得到2 056張圖片，形成小型火情圖像數(shù)據(jù)集。按照8∶1∶1的比例劃分，得到訓(xùn)練集數(shù)據(jù)1 644張，測(cè)試集數(shù)據(jù)206張，驗(yàn)證集數(shù)據(jù)206張。

4.2 評(píng)價(jià)指標(biāo)

為了對(duì)本文提出的模型進(jìn)行性能評(píng)估，進(jìn)而對(duì)算法進(jìn)行優(yōu)化，提高模型的準(zhǔn)確率和泛化能力，具體采用精確率（Precision）、召回率（Recall）、mAP@0.5和mAP@0.5-0.95四個(gè)指標(biāo)對(duì)模型性能進(jìn)行分析評(píng)估。

4.3 不同目標(biāo)檢

測(cè)算法的結(jié)果比較為了驗(yàn)證本文提出的方法在火情目標(biāo)檢測(cè)上的先進(jìn)性和適用性，在火情數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)，并與YOLO系列的其他模型進(jìn)行比較，不同算法的火情檢測(cè)結(jié)果的定量比較如表1所示。

表1展示了各種目標(biāo)檢測(cè)算法應(yīng)用于火情數(shù)據(jù)集的檢測(cè)結(jié)果對(duì)比，本文方法與其他算法相比取得了最高的精確率值（69.7%），最高的mAP@0.5值（68.7%）以及最高的mAP@0.5-0.95值（36.7%），4個(gè)指標(biāo)比基準(zhǔn)算法YOLOv8n分別提高了1.4百分點(diǎn)、4.3百分點(diǎn)、5.1百分點(diǎn)和1.6百分點(diǎn)。與YOLO系列的一些主流算法YOLOv5m、YOLOv5l、YOLOv6和YOLOv8m相比，本文方法在精確率上分別提升4.0百分點(diǎn)、1.2百分點(diǎn)、10.1百分點(diǎn)和5.1百分點(diǎn)，mAP@0.5指標(biāo)值相較于YOLOv5s的同類指標(biāo)值提高了7.5百分點(diǎn)，分別比YOLOv6和YOLOv8m的同類指標(biāo)值提高了11.9百分點(diǎn)和3.1百分點(diǎn)。以上結(jié)果驗(yàn)證了本文方法具有較高的可行性。

4.4 消融實(shí)驗(yàn)

本文通過消融實(shí)驗(yàn)研究注意力機(jī)制、空洞空間卷積池化金字塔模型和BiFPN 模塊的重要性，實(shí)驗(yàn)結(jié)果如表2和表3所示。

4.4.1 注意力機(jī)制的作用

本文在Neck部分使用CBAM 幫助模型更加精準(zhǔn)地定位火情發(fā)生的位置，它不僅能捕獲跨通道的信息，還能捕獲方向感知和位置感知的信息。如表3所示，在添加CBAM 后，召回率、mAP@0.5和mAP@0.5-0.95分別提升了4.6百分點(diǎn)、3.5百分點(diǎn)和0.5百分點(diǎn)。如表2所示，本文還比較了一些其他主流的注意力機(jī)制，實(shí)驗(yàn)結(jié)果表明，CBAM 的效果明顯優(yōu)于其他注意力機(jī)制的效果。

4.4.2 空洞空間卷積池化金字塔的作用

火情發(fā)生的場(chǎng)景非常多且容易受到周圍環(huán)境的影響。為了更好地檢測(cè)火情，在Backbone中使用了空洞空間卷積池化金字塔模塊。空洞空間卷積池化金字塔模塊通過不同的空洞率構(gòu)建不同感受野的卷積核，用來獲取多尺度物體信息，有助于更加準(zhǔn)確地檢測(cè)和定位火災(zāi)。從表3中的數(shù)據(jù)可以看出，使用了空洞空間卷積池化金字塔模塊后，召回率、mAP@0.5和mAP@0.5-0.95分別提升了4.6百分點(diǎn)、3.1百分點(diǎn)和0.5百分點(diǎn)，但精確率略有下降。

4.4.3BiFPN模塊的作用

本文使用的BiFPN模塊可以通過優(yōu)化特征融合、信息傳遞以及調(diào)整特征權(quán)重提高模型的感知能力，進(jìn)而提高檢測(cè)結(jié)果的準(zhǔn)確性。從表3中的數(shù)據(jù)可以看出，使用BiFPN模塊后，召回率、mAP@0.5和mAP@0.5-0.95分別提升了9.9百分點(diǎn)、4.2百分點(diǎn)和0.9百分點(diǎn)，但精確率略有下降。

4.5 實(shí)驗(yàn)結(jié)果分析

圖5展示了本文提出的火情智能檢測(cè)算法使用在火情數(shù)據(jù)集上的檢測(cè)結(jié)果。在不同的場(chǎng)景下，模型均能準(zhǔn)確地檢測(cè)出火情。

為了驗(yàn)證本文提出的方法能夠更有效地檢測(cè)出火災(zāi)場(chǎng)景，實(shí)驗(yàn)分別選取了數(shù)據(jù)集中不同場(chǎng)景下的圖像進(jìn)行對(duì)比。在有多個(gè)火源的場(chǎng)景中，要想檢測(cè)出多個(gè)火源是比較困難的。如圖9所示，本文方法可以檢測(cè)出盡可能多的火源，并能做到準(zhǔn)確迅速定位。

在火情發(fā)生的初期檢測(cè)出火情是十分重要的。然而，對(duì)小火苗的檢測(cè)十分困難，容易受到周圍環(huán)境的干擾，導(dǎo)致檢測(cè)效果差。如圖10所示，本文方法能夠在周圍環(huán)境復(fù)雜的情況下，有效地檢測(cè)出小火苗，具有良好的魯棒性。

5 結(jié)論（Conclusion）

為了提高火情檢測(cè)精度，本文提出了一種基于改進(jìn)YOLOv8的火情智能檢測(cè)算法。首先，使用CBAM 獲取方向相關(guān)的位置信息，幫助模型更加準(zhǔn)確地檢測(cè)和定位火情;其次，添加由不同空洞卷積組成的空洞空間卷積池化金字塔模塊獲取多尺度信息，提升模型的檢測(cè)精度;最后，使用BiFPN模塊幫助模型針對(duì)性地學(xué)習(xí)特征，關(guān)注更加重要的區(qū)域。在火情數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明，相較于其他先進(jìn)的目標(biāo)檢測(cè)算法，本文算法在火情檢測(cè)上的效果最優(yōu)，可以有效地檢測(cè)出火情。

作者簡(jiǎn)介：

葉偉華（1991-），男，本科，高級(jí)工程師。研究領(lǐng)域：人工智能，軟件工程。

劉海雄（2000-），男，碩士生。研究領(lǐng)域：深度學(xué)習(xí)，圖像處理。

胡蓉（1974-），女，博士，教授。研究領(lǐng)域：圖像處理和模型識(shí)別。