李 琳,曹麗英
(吉林農(nóng)業(yè)大學(xué) 信息技術(shù)學(xué)院,吉林 長春 130118)
隨著我國經(jīng)濟(jì)建設(shè)飛速發(fā)展,人們生活水平不斷提高,天然氣普及到家家戶戶,各種家電層出不窮,導(dǎo)致對(duì)柴草的需求一再減少,農(nóng)田里的秸稈無處銷售,農(nóng)民朋友便選擇燃燒秸稈[1]。但燃燒秸稈對(duì)環(huán)境影響極為嚴(yán)重,不僅容易引起“火燒連營”的火災(zāi)事故,燃燒產(chǎn)生的煙灰更污染了空氣,降低可見度,極易引起交通事故,不完全燃燒產(chǎn)生的氣體會(huì)引發(fā)人體呼吸道疾病。因此,如何在火焰和煙霧形成早期進(jìn)行檢測(cè)具有重大的理論和實(shí)際意義[2]。
農(nóng)田火災(zāi)的監(jiān)控系統(tǒng)多數(shù)來自于農(nóng)田中高塔上的攝像頭和無人機(jī)等設(shè)備,而這種圖像中往往包括多種物體,比如建筑、道路、汽車和作物等,并且圖像的清晰度受天氣、光照等因素影響[3]。除此之外,圖像中的煙霧和火焰相對(duì)于整幅圖像來說很小,而且背景也很復(fù)雜。
傳統(tǒng)的煙火檢測(cè)方法主要采用傳感器等技術(shù),但是安裝大量傳感器的成本很高,野外放置易受灰塵、氣流和人為因素的干擾,因此檢測(cè)精度較低。煙霧檢測(cè)在國內(nèi)外已經(jīng)做了大量研究,并且基于圖像的煙霧檢測(cè)方法也在不斷提出,主要研究方向是結(jié)合煙火圖像的動(dòng)靜態(tài)特征進(jìn)行檢測(cè)[4]。典型的動(dòng)靜態(tài)特征包括目標(biāo)顏色、運(yùn)動(dòng)方向、運(yùn)動(dòng)范圍和時(shí)間軌跡等[5]。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究的重要領(lǐng)域,相比于傳統(tǒng)算法,深度學(xué)習(xí)算法可降低硬件成本,不依賴人工特征工程。目前已有學(xué)者將深度學(xué)習(xí)應(yīng)用于煙霧檢測(cè)方向,王中林[6]使用改進(jìn)的支持向量機(jī)進(jìn)行煙霧檢測(cè);馮路佳等人[7]通過將提取到的運(yùn)動(dòng)背景放入卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)中進(jìn)行煙霧檢測(cè);段鎖林等人[8]通過對(duì)火焰區(qū)域進(jìn)行RGB灰度處理進(jìn)行火焰區(qū)域檢測(cè)。
本文結(jié)合深度學(xué)習(xí),使模型可以自我學(xué)習(xí)煙霧和火焰的特征,同時(shí)利用視頻監(jiān)控設(shè)備和無人機(jī)等設(shè)備對(duì)農(nóng)田中的秸稈燃燒行為進(jìn)行數(shù)據(jù)采集,及時(shí)對(duì)農(nóng)田中秸稈燃燒產(chǎn)生的煙霧和火焰進(jìn)行檢測(cè),可以在秸稈燃燒初期進(jìn)行相應(yīng)的檢測(cè),從而實(shí)現(xiàn)快速、大范圍的煙火警告。此外,該方法安裝和使用成本適中,有利于進(jìn)行推廣。Single Shot MultiBox Detector(SSD)算法[9]是目前深度學(xué)習(xí)目標(biāo)檢測(cè)中較優(yōu)秀的算法之一,在保證了精度的同時(shí),又提高了檢測(cè)速度,可以達(dá)到實(shí)時(shí)檢測(cè)的需求。
SSD是目前主要的檢測(cè)框架之一,該方法于2016年由Wei Liu提出,是基于單個(gè)神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法,可以一次完成目標(biāo)定位與分類?;A(chǔ)網(wǎng)絡(luò)參考了VGG16網(wǎng)絡(luò),為了連接基礎(chǔ)網(wǎng)絡(luò)的特征映射圖而補(bǔ)充了輔助卷積層。預(yù)測(cè)卷積層是預(yù)測(cè)特征映射圖每個(gè)點(diǎn)的矩形框信息和所屬類別信息,從不同層獲取特征并進(jìn)行預(yù)測(cè),隨著層次結(jié)構(gòu)的增加,語義變得更加復(fù)雜,SSD網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。SSD算法使用直接卷積的方式對(duì)特征圖進(jìn)行預(yù)測(cè)并獲取結(jié)果。SSD特有的網(wǎng)絡(luò)結(jié)構(gòu)使得采用3×3×q的卷積核即可對(duì)m×n×q的特征圖進(jìn)行檢測(cè)[10],從而減少計(jì)算量。SSD使用低層特征圖檢測(cè)小目標(biāo),高層特征圖檢測(cè)大目標(biāo)。
圖1 SSD網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 SSD network structure
SSD在預(yù)測(cè)時(shí)參考了Faster R-CNN[11]中候選框的方法,但為了減小訓(xùn)練時(shí)的難度,設(shè)置了比Faster R-CNN更少的4個(gè)先驗(yàn)框,有效提高目標(biāo)檢測(cè)速度。SSD算法雖然能夠多層次提取特征,但是隨著層次加深,形狀易發(fā)生變化的目標(biāo)語義會(huì)變得更加抽象,特征提取難度大大增加,因此實(shí)現(xiàn)不同尺度多種語義層次的特征提取,才能真正意義上幫助模型提升檢測(cè)精準(zhǔn)度。SSD算法在進(jìn)行小目標(biāo)檢測(cè)時(shí)效果一般,常常出現(xiàn)漏檢現(xiàn)象。
為了使SSD算法更好地契合農(nóng)田煙火檢測(cè)場(chǎng)景,解決SSD對(duì)小目標(biāo)檢測(cè)精度不高、訓(xùn)練過程易產(chǎn)生梯度下降和梯度爆炸等問題,對(duì)經(jīng)典SSD網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行修改:在經(jīng)典SSD模型的基礎(chǔ)網(wǎng)絡(luò)VGG16的每2個(gè)卷積層中引入殘差網(wǎng)絡(luò)(Residual Network,ResNet)結(jié)構(gòu)的思想,共組成4個(gè)ResNet+VGG16的結(jié)構(gòu);結(jié)合特征金字塔網(wǎng)絡(luò)的融合思想,增強(qiáng)SSD網(wǎng)絡(luò)對(duì)圖像信息進(jìn)行表達(dá)輸出,更好地展現(xiàn)出圖像各個(gè)維度的信息,提升小目標(biāo)的檢測(cè)效率,使用組歸一化替代批量歸一化避免數(shù)據(jù)量小對(duì)模型的影響,改進(jìn)后的SSD網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 改進(jìn)SSD網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Improved SSD network structure
在進(jìn)行煙火目標(biāo)檢測(cè)時(shí),先驗(yàn)框的設(shè)置極其重要,先驗(yàn)框尺寸為:
(1)
1.2.1 引入ResNet模塊
ResNet是在深度學(xué)習(xí)中用于提取主干特征的一種網(wǎng)絡(luò)模型。在CNN中,網(wǎng)絡(luò)層數(shù)越多,模型對(duì)事物的表征能力越強(qiáng),但同時(shí)會(huì)產(chǎn)生性能快速下降的情況,這種情況稱為“退化”。為解決該問題,ResNet網(wǎng)絡(luò)應(yīng)運(yùn)而生[12]。提出殘差的概念,殘差結(jié)構(gòu)有2種,本文引入的殘差結(jié)構(gòu)如圖3所示。
圖3 殘差結(jié)構(gòu)Fig.3 Residual structure
殘差模塊的數(shù)學(xué)公式為:
f(x)=h(x)-x,
(2)
式中,f(x)為殘差模塊中的殘差;x為殘差模塊的輸入部分;h(x)為經(jīng)過第1次線性變化并通過激活函數(shù)處理的輸出結(jié)果。
改進(jìn)SSD網(wǎng)絡(luò)模型將待預(yù)測(cè)的圖片進(jìn)行多層次卷積時(shí),在VGG16網(wǎng)絡(luò)的每2次卷積中進(jìn)行殘差學(xué)習(xí),由于存在前后維度不一致的情況,此時(shí)使用步長為2的池化層進(jìn)行降采樣操作,可以避免無用參數(shù)對(duì)時(shí)間復(fù)雜度的影響,有效提高特征整合度。
1.2.2 引入特征金字塔思想
特征金字塔網(wǎng)絡(luò)是一種高效提取圖片多維度特征的方法,可以使不同尺度特征圖之間互相融合,將淺層細(xì)節(jié)與高層語義結(jié)合并提高圖像識(shí)別率,同時(shí)對(duì)小目標(biāo)有更高的特征映射分辨率[13-16],可以解決經(jīng)典SSD算法不能區(qū)分不同維度特征信息的缺點(diǎn),但由于農(nóng)田復(fù)雜的背景會(huì)對(duì)目標(biāo)分辨率產(chǎn)生干擾,給FPN特征提取帶來困難。為解決該問題,本文在引入FPN思想時(shí)對(duì)FPN結(jié)構(gòu)進(jìn)行調(diào)整,改進(jìn)后結(jié)構(gòu)如圖4所示。
圖4 改進(jìn)特征金字塔網(wǎng)絡(luò)Fig.4 Improved feature pyramid network
改進(jìn)后的FPN結(jié)構(gòu)可以進(jìn)行跨層級(jí)連接,將高層級(jí)特征跨層與低層級(jí)特征融合,使用雙線性插值代替臨近插值,得到更優(yōu)秀的上采樣效果。
改進(jìn)SSD網(wǎng)絡(luò)模型對(duì)Conv7采用雙線性插值方法進(jìn)行上采樣操作,與Conv4_3進(jìn)行特征融合作為Conv4_3的特征圖,同理將Conv8_2進(jìn)行上采樣與Conv7進(jìn)行融合作為Conv7的特征圖,將經(jīng)過卷積的Conv11_2,Conv10_2,Conv9_2,Conv8_2與融合后的Conv7和Conv4_3組成一個(gè)新的特征金字塔通過非極大值抑制進(jìn)行預(yù)測(cè)。
1.2.3 歸一化方法
經(jīng)典SSD算法進(jìn)行歸一化處理時(shí)使用批量歸一化(Batch Normalization,BN)[17]。BN在對(duì)大量數(shù)據(jù)進(jìn)行歸一化處理時(shí)效果較好,能夠有效減少訓(xùn)練過程中產(chǎn)生的誤差,但在對(duì)少量數(shù)據(jù)進(jìn)行歸一化時(shí),其訓(xùn)練產(chǎn)生的誤差會(huì)隨著數(shù)據(jù)量減少而逐漸增大[18]。為了使模型在數(shù)據(jù)量較少的情況下也能有效減少誤差,本文采用組歸一化(Group Normalization,GN)實(shí)現(xiàn)模型的訓(xùn)練。GN將數(shù)據(jù)進(jìn)行分組,每個(gè)組中的數(shù)據(jù)進(jìn)行歸一化,最后將各組結(jié)果合并,其數(shù)學(xué)表達(dá)式為:
(3)
(4)
式中,σ為標(biāo)準(zhǔn)差;μ為均值;x為待歸一化處理的數(shù)據(jù)。S在GN中定義如式(4)所示,其中C/G代表通道數(shù)量。
本文實(shí)驗(yàn)在64位Windows10操作系統(tǒng)下,運(yùn)行內(nèi)存32 GB,GPU為GeForce RTX 2080Ti(11 GB顯存),處理器為Inter(R) Core(TM) i9-10900K CPU@3.00 GHz。采用Python3.7和Tensorflow 1.10.0框架實(shí)現(xiàn)模型的搭建以及模型的訓(xùn)練及驗(yàn)證。
由于截至目前還沒有比較權(quán)威的煙霧和火焰檢測(cè)標(biāo)準(zhǔn)數(shù)據(jù)集,因此本實(shí)驗(yàn)數(shù)據(jù)部分來自網(wǎng)絡(luò)圖片平臺(tái),部分來自項(xiàng)目拍攝,其中包括在自然環(huán)境下,田間高塔定點(diǎn)拍攝圖像和無人機(jī)拍攝圖像,經(jīng)人工篩選,共計(jì)3 500張,圖片樣本如圖5所示。通過LabelImg圖像標(biāo)注工具中的矩形框?qū)D像進(jìn)行人工標(biāo)注,標(biāo)注時(shí)盡量沿待檢測(cè)煙霧和火焰邊緣進(jìn)行標(biāo)注,以免進(jìn)行模型訓(xùn)練時(shí)不能夠準(zhǔn)確地學(xué)習(xí)到煙霧和火焰的特征,避免模型不易飽和、誤檢率高的問題。
圖5 圖像樣本集Fig.5 Image sample set
在SSD模型中,數(shù)據(jù)增強(qiáng)是一種有效增加數(shù)據(jù)集樣本數(shù)量的方式,從而提升模型的泛化能力以及魯棒性[19]。數(shù)據(jù)增強(qiáng)可以將現(xiàn)有圖像進(jìn)行縮放操作,對(duì)圖像中的小目標(biāo)進(jìn)行放大可以更明顯地觀察其內(nèi)在結(jié)構(gòu),提高小目標(biāo)檢測(cè)效果。數(shù)據(jù)增強(qiáng)還可以通過裁剪方式,保留待檢測(cè)目標(biāo)未被遮擋的部分。本文采用如圖6所示的隨機(jī)縮放、隨機(jī)旋轉(zhuǎn)和隨機(jī)翻轉(zhuǎn)等方式對(duì)數(shù)據(jù)進(jìn)行增強(qiáng)。當(dāng)隨機(jī)生成的裁剪框與目標(biāo)的交并比(Intersection over Union,IOU)不滿足要求,則要求刪除;如IOU滿足但目標(biāo)中心點(diǎn)不包含在隨機(jī)裁剪框也要求刪除,經(jīng)過數(shù)據(jù)增強(qiáng)后數(shù)據(jù)集擴(kuò)充至7 000張圖片。
(a) 隨機(jī)縮放
(b) 隨機(jī)旋轉(zhuǎn)
(c) 隨機(jī)翻轉(zhuǎn)
整體實(shí)驗(yàn)過程如圖7所示。
圖7 實(shí)驗(yàn)流程Fig.7 Experimental flow chart
將數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和測(cè)試集,分別包含5 400張和1 600張圖片。訓(xùn)練集用于網(wǎng)絡(luò)模型的訓(xùn)練,測(cè)試集用于確定模型后進(jìn)行測(cè)試實(shí)驗(yàn)。
實(shí)驗(yàn)采用隨機(jī)梯度下降的方法來訓(xùn)練優(yōu)化模型[20]。該方法可以在每次迭代過程中只選取一個(gè)隨機(jī)樣本數(shù)據(jù)用來更新模型參數(shù),因此迭代次數(shù)大幅提升,但每次的學(xué)習(xí)是非??焖俚?,并且可以進(jìn)行在線更新。
首先將數(shù)據(jù)集分辨率統(tǒng)一為300 pixel×300 pixel,然后使用訓(xùn)練集來訓(xùn)練網(wǎng)絡(luò)模型。將激活函數(shù)學(xué)習(xí)率設(shè)置為e-4,學(xué)習(xí)率衰減因子設(shè)置為0.97,最大迭代步數(shù)為2×104,訓(xùn)練過程中每進(jìn)行1×103次迭代后將所得模型進(jìn)行保存,當(dāng)訓(xùn)練結(jié)束后將目標(biāo)檢測(cè)準(zhǔn)確度作為評(píng)判標(biāo)準(zhǔn)來選取最優(yōu)模型。使用測(cè)試集對(duì)模型進(jìn)行驗(yàn)證實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。
在本實(shí)驗(yàn)中,使用每秒傳輸幀數(shù)(Frames pre Second,F(xiàn)PS)、平均精度均值(Meanaverage Precision,mAP)和平均精度(Average Precision,AP)作為目標(biāo)檢測(cè)評(píng)估參數(shù)[21]。FPS表示1 s能夠處理的圖片數(shù)量,值越大說明算法的識(shí)別速度越快,mAP是目標(biāo)檢測(cè)算法中常用的綜合評(píng)估多個(gè)類別下的平均準(zhǔn)確率,AP是衡量單個(gè)類別下算法的準(zhǔn)確率。AP和mAP為:
AP=∑precision/N,
(5)
mAP=∑AP/M,
(6)
式中,precison表示正確檢測(cè)圖像數(shù)量在算法檢測(cè)出圖像數(shù)量中的占比;N為目標(biāo)類別圖片總數(shù);M為類別總數(shù)。
本文在經(jīng)典SSD網(wǎng)絡(luò)模型的基礎(chǔ)網(wǎng)絡(luò)中引入殘差模塊,將改進(jìn)后的SSD模型與經(jīng)典SSD模型使用相同訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,當(dāng)模型達(dá)到飽和后使用相同測(cè)試數(shù)據(jù)集進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表1所示。
表1 改進(jìn)SSD模型與經(jīng)典SSD模型性能對(duì)比Tab.1 Performance comparison between improved SSD model and classical SSD model
由表1可以看出,改進(jìn)SSD模型與經(jīng)典SSD模型相比較,訓(xùn)練時(shí)間有明顯縮短,并且在檢測(cè)速度上提升極為明顯,識(shí)別準(zhǔn)確率也高于經(jīng)典SSD模型。
經(jīng)典SSD模型使用多尺度特征融合方式從不同層抽取不同尺度特征進(jìn)行預(yù)測(cè),無上采樣過程;FPN結(jié)合多尺度特征融合思想,將頂層通過上采樣與低層特征進(jìn)行跨層級(jí)融合,且每層都進(jìn)行獨(dú)立預(yù)測(cè)。本實(shí)驗(yàn)在改進(jìn)SSD模型中引入FPN并與原有的多尺度特征圖進(jìn)行對(duì)比,共進(jìn)行3次測(cè)試,測(cè)試結(jié)果如表2所示。
表2 FPN與多尺度特征圖性能對(duì)比Tab.2 Performance comparison between FPN and multiscale feature map
由表2可以看出,在改進(jìn)SSD模型中結(jié)合FPN思想后使模型檢測(cè)精度有較大提升,由于FPN中上采樣使得頂層與低層融合,因此在檢測(cè)速度上稍遜于多尺度特征圖。
在模型訓(xùn)練時(shí),對(duì)數(shù)據(jù)進(jìn)行歸一化的方法極其重要。本次實(shí)驗(yàn)在引入FPN的改進(jìn)SSD模型中分別使用組歸一化和批量歸一化2種歸一化方法對(duì)相同數(shù)據(jù)集進(jìn)行對(duì)比測(cè)試,測(cè)試結(jié)果如表3所示。
表3 組歸一化與批量歸一化性能對(duì)比Tab.3 Performance comparison between GN and BN
由表3可以看出,使用組歸一化替代批量歸一化,在數(shù)據(jù)量較小時(shí),識(shí)別準(zhǔn)確率更高。
為比較改進(jìn)后的SSD模型更適用于農(nóng)田場(chǎng)景下的煙火圖像檢測(cè),在本次實(shí)驗(yàn)中使用改進(jìn)SSD模型分別與經(jīng)典SSD模型、YOLOv3模型、Faster R-CNN模型使用相同數(shù)據(jù)集進(jìn)行模型訓(xùn)練,訓(xùn)練過程中每進(jìn)行1×103次迭代后將所得模型進(jìn)行保存,經(jīng)過2×104次迭代后,4種模型分別生成20個(gè)模型,模型準(zhǔn)確率曲線和損失曲線如圖8和圖9所示。
圖8 模型準(zhǔn)確率Fig.8 Model accuracy
圖9 模型損失曲線Fig.9 Model loss curve
模型訓(xùn)練的實(shí)質(zhì)是從不斷迭代的過程中尋找最小損失值的過程。由圖8可以看出,隨著迭代次數(shù)增加模型準(zhǔn)確率不斷提高,最終趨于穩(wěn)定。由圖9可以看出,YOLOv3,F(xiàn)aster R-CNN,經(jīng)典SSD和改進(jìn)SSD 四種模型分別在0.5×104,0.7×104,0.7×104和1.0×104次迭代時(shí)損失曲線趨于平緩,并且分別在1.5×104,1.6×104,1.8×104和1.3×104次迭代時(shí)損失曲線趨于收斂,模型達(dá)到飽和,此時(shí)模型準(zhǔn)確率最高,因此選擇這4個(gè)模型進(jìn)行后續(xù)測(cè)試實(shí)驗(yàn)。從準(zhǔn)確率曲線和損失曲線中可以看出,改進(jìn)后的SSD模型收斂速度更快,收斂效果更好,準(zhǔn)確度更高。
為了驗(yàn)證本文提出的改進(jìn)SSD神經(jīng)網(wǎng)絡(luò)模型能夠有效識(shí)別圖片中的煙火小目標(biāo),將改進(jìn)的SSD模型與經(jīng)典SSD模型、YOLOv3模型和Faster R-CNN模型使用相同的測(cè)試數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),并對(duì)得到的結(jié)果進(jìn)行分析,實(shí)驗(yàn)結(jié)果如圖10所示。
圖10 煙火目標(biāo)檢測(cè)效果Fig.10 Smoke and flame detection effect
由圖10可以看出,4種模型均能夠?qū)D片中的煙霧圖像進(jìn)行檢測(cè),改進(jìn)SSD模型能夠有效對(duì)圖片中的煙霧和火焰目標(biāo)進(jìn)行檢測(cè),其他3種模型均存在較為明顯的漏檢現(xiàn)象;圖片中煙火圖像相對(duì)較小,YOLOv3模型、Faster R-CNN模型和經(jīng)典SSD模型未能有效識(shí)別,而本文所采用的模型能更好地識(shí)別小目標(biāo)。不同煙火檢測(cè)模型的測(cè)試結(jié)果統(tǒng)計(jì)如表4所示。
表4 煙火目標(biāo)檢測(cè)模型對(duì)比Tab.4 Comparison of smoke and flame target detection models
通過使用不同的網(wǎng)絡(luò)模型對(duì)相同測(cè)試集圖片中煙霧、火焰圖像檢測(cè)生成的結(jié)果進(jìn)行分析,可得到如下結(jié)論:
① 從對(duì)圖片中圖像較小的火焰識(shí)別結(jié)果來看,引入殘差思想后的SSD模型結(jié)合FPN可以有效地將淺層細(xì)節(jié)與高層語義相結(jié)合,并使用組歸一化方法進(jìn)而大幅度提升圖像中較小火焰識(shí)別的精準(zhǔn)度。與YOLOv3模型相比,在煙霧識(shí)別上AP值提升20.4%,在火焰識(shí)別上AP值提升16.6%。與Faster R-CNN模型相比,在煙霧識(shí)別上AP值提升21.6%,在火焰識(shí)別上AP值提升19.1%。與經(jīng)典SSD網(wǎng)絡(luò)模型相比,在煙霧識(shí)別上AP值提升18.0%,在火焰識(shí)別上AP值提升17.6%。
② 在使用相同測(cè)試集進(jìn)行實(shí)驗(yàn)的情況下,改進(jìn)SSD模型相對(duì)于YOLOv3模型、Faster R-CNN模型和經(jīng)典SSD模型在檢測(cè)準(zhǔn)確度上均有較大提升,實(shí)驗(yàn)結(jié)果表明,mAP值分別提高了18.5%,20.3%和17.7%。
③ 從圖像檢測(cè)速度來看,YOLOv3模型比經(jīng)典SSD模型和Faster R-CNN模型的效率更高,由于本文提出的模型在經(jīng)典SSD模型的結(jié)構(gòu)上進(jìn)行改進(jìn),速度提升更為明顯,改進(jìn)后的SSD算法FPS比YOLOv3模型高18,比Faster R-CNN模型高30,比經(jīng)典SSD模型高24。
本文提出了一種基于改進(jìn)SSD算法的煙火圖像檢測(cè)方法,可以在農(nóng)田秸稈燃燒等行為產(chǎn)生煙霧和火焰的初期進(jìn)行有效的監(jiān)測(cè),為有關(guān)環(huán)保部門及時(shí)提供預(yù)警。煙火識(shí)別的核心問題在于提取有效的煙霧和火焰的特征。在使用深度學(xué)習(xí)對(duì)煙霧火焰檢測(cè)分類的基礎(chǔ)上,解決了傳統(tǒng)CNN計(jì)算量大、占用存儲(chǔ)空間大和計(jì)算時(shí)間長的問題。將改進(jìn)后的SSD煙火檢測(cè)模型與YOLOv3模型、Faster R-CNN模型和經(jīng)典SSD模型進(jìn)行仿真實(shí)驗(yàn),可以看出改進(jìn)后模型對(duì)煙火目標(biāo)檢測(cè)更精確,尤其對(duì)小目標(biāo)的識(shí)別定位更加精準(zhǔn),同時(shí)在檢測(cè)速度方面有較大提升。在接下來的研究中將繼續(xù)擴(kuò)充數(shù)據(jù)集并對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行更深層次優(yōu)化,使模型達(dá)到更加優(yōu)秀的效果。