曲妍姝 崔永毅 孫國慶 李龍山
一、引言
目前,圖像型火災(zāi)檢測方法主要有兩大類:基于傳統(tǒng)圖像處理的火災(zāi)檢測和基于深度學(xué)習(xí)的火災(zāi)檢測。前者特征處理一般都需要人工干預(yù)完成,利用人類的經(jīng)驗(yàn)來選取好的特征,由于受特征選取是否合理的影響,會使得其識別準(zhǔn)確率有所限制。而后者則是預(yù)先設(shè)計(jì)一個(gè)網(wǎng)絡(luò)模型,然后直接將原始圖像數(shù)據(jù)送至網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,利用訓(xùn)練好的模型來對待測圖像進(jìn)行識別工作。將深度學(xué)習(xí)技術(shù)應(yīng)用于圖像識別領(lǐng)域,可在很大程度上避免特征提取過程中的盲目性,且在理論上可提取到更多更深層次的特征,如此極大地提高了火災(zāi)圖像識別的準(zhǔn)確率。
二、圖像預(yù)處理
火災(zāi)發(fā)生的環(huán)境較為復(fù)雜,采集到的圖像會受到各種各樣的噪聲污染和某種程度的損壞,因此需要對圖像預(yù)處理以降低圖像所受到的影響。本文采用圖像增強(qiáng)方式進(jìn)行預(yù)處理?;馂?zāi)圖像增強(qiáng)的目的是為了突出圖像中火焰區(qū)域特征,去除或削弱背景中可能對火焰形成干擾的區(qū)域信息,使其更適合后續(xù)的識別。在火災(zāi)圖像中,火焰區(qū)域周圍經(jīng)常會出現(xiàn)零星的火星,這會給后續(xù)火災(zāi)識別帶來困難。通過實(shí)驗(yàn),中值濾波可以較為有效的去除這部分噪聲干擾。經(jīng)過平滑濾波后會造成圖像的輪廓不明顯、邊界模糊。為了增強(qiáng)圖像的邊緣,使圖像邊緣變得清晰,我們采用圖像銳化技術(shù)來加強(qiáng)火災(zāi)圖像的細(xì)節(jié)描述。利用圖像的頻率特性,使用高通濾波方法濾除低頻分量,實(shí)現(xiàn)對火災(zāi)圖像的銳化。
三、深度學(xué)習(xí)識別方法
本文采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行火災(zāi)識別。卷積神經(jīng)網(wǎng)絡(luò)主要由特征學(xué)習(xí)和分類識別兩大部分組成。常見的卷積神經(jīng)網(wǎng)絡(luò)由輸入層、卷積層、激活層、池化層、全連接層和最后的輸出層構(gòu)成。
3.1卷積層
在卷積層中,層與層之間相互連接的特征圖由一個(gè)或者多個(gè)卷積核通過卷積運(yùn)算提取像素級圖像特征。在圖像處理中,一幅數(shù)字圖像可以看作是一個(gè)二維空間的離散函數(shù)。在二維圖像作為輸入時(shí),相應(yīng)地卷積運(yùn)算可以用公式(1)和(2)表達(dá):
式中, 代表輸入圖像, 表示卷積核, 為核的大小,一般 , 。 代表輸出圖像, 代表輸出圖像中的一個(gè)元素。
卷積運(yùn)算相當(dāng)于用一個(gè)可訓(xùn)練的卷積核對圖像進(jìn)行濾波。假設(shè)一幅圖像的尺寸為 ,卷積核的尺寸為 。在計(jì)算時(shí),卷積核與圖像的每個(gè) 大小的圖像區(qū)域相乘,相當(dāng)于把該 區(qū)域的圖像特征提取出來。一小塊一小塊的提取出圖像的局部特征,每經(jīng)過一次卷積核的濾波都會映射出一張新的二維特征圖像。圖1顯示出利用兩種常用算子作為卷積核進(jìn)行卷積計(jì)算得到的特征圖。
3.2激活層
激活層的作用是在所有的隱藏層之間添加一個(gè)激活函數(shù)。添加適當(dāng)?shù)募せ詈瘮?shù)后,神經(jīng)網(wǎng)絡(luò)的功能會變得更加強(qiáng)大。一般使用非線性函數(shù)作為激活函數(shù),因?yàn)樵趯?shí)際應(yīng)用中,絕大部分?jǐn)?shù)據(jù)都是非線性分布的。這樣才能使深度神經(jīng)網(wǎng)絡(luò)具備非線性映射學(xué)習(xí)能力。常用的激活函數(shù)有很多,選擇的激活函數(shù)是否適當(dāng)對最終的深度神經(jīng)網(wǎng)絡(luò)模型影響極大。本文選擇Sigmoid函數(shù)和tanh函數(shù)作為激活函數(shù)。我們嘗試使用不同的激活函數(shù)建立模型,以期找到對我們工作最有利的激活函數(shù)。
3.3池化層
池化層對原始特征層的信息進(jìn)行壓縮,是卷積神經(jīng)網(wǎng)絡(luò)中重要的一步。池化可以看作卷積神經(jīng)網(wǎng)絡(luò)中一種提取輸入數(shù)據(jù)核心特征的方式,不僅實(shí)現(xiàn)了對原始數(shù)據(jù)的壓縮,還大量減少了參與模型計(jì)算的參數(shù)。池化的方法有很多,最常用是平均池化法和最大池化法。一般是在連續(xù)的卷積層之間插入池化層。池化層可以把相似的特征合并起來,有效防止過度擬合。
池化相當(dāng)于對圖像按某種算法進(jìn)行了壓縮。一般來說,均值池化得到的特征數(shù)據(jù)對背景信息更敏感,而最大池化得到的特征數(shù)據(jù)對紋理信息更加敏感。
3.4全連接層
全連接層實(shí)質(zhì)就相當(dāng)于一個(gè)分類器。經(jīng)多個(gè)卷積層和池化層后,連接著1個(gè)或1個(gè)以上的全連接層。全連接層之前的卷積層作用本質(zhì)是提取特征,而全連接層的作用是分類。經(jīng)過多次卷積、激活和池化后,特征學(xué)習(xí)部分會輸出許多特征圖,每個(gè)特征圖只具有整體圖的一個(gè)重要特征。這就需要添加一個(gè)或多個(gè)全連接層對所有特征進(jìn)行整合。利用邏輯回歸將上層抽取出來的特征向量按不同權(quán)重映射為一個(gè)特征向量。這個(gè)向量匯總了整體圖像的所有特征信息,經(jīng)過激活之后,作為輸入進(jìn)入分類層。在分類層中經(jīng)過統(tǒng)計(jì)計(jì)算,輸出輸入圖像歸屬于某種類別的概率,完成圖像識別。
四、實(shí)驗(yàn)及結(jié)論
本文選擇PyTorch框架搭建卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行火災(zāi)識別。由于目前缺乏大家公認(rèn)的用于火災(zāi)圖像識別的公開測試集。本文實(shí)驗(yàn)用火焰視頻一部分從網(wǎng)絡(luò)上下載,另一部分利用實(shí)驗(yàn)室進(jìn)行了火災(zāi)模擬實(shí)驗(yàn)并錄制了視頻。利用訓(xùn)練好的模型,我們選取一些視頻文件進(jìn)行火災(zāi)識別。結(jié)果表明:對火焰特征明顯的火災(zāi)識別率相對較高,如典型的液體或固體火災(zāi)。對酒精或煤氣等火焰透明的火災(zāi)識別率不理想。蠟燭、打火機(jī)、火柴等在穩(wěn)定燃燒時(shí)識別率較高,但在剛開始點(diǎn)燃的不穩(wěn)定燃燒階段容易被誤判為火災(zāi)。車燈、電燈、手電筒等干擾源在靜止時(shí)識別率也較高,但車燈或手電筒在運(yùn)動(dòng)時(shí)識別率低一些,高速運(yùn)動(dòng)甚至抖動(dòng)時(shí)更容易被誤判為火災(zāi)。采用不同的神經(jīng)網(wǎng)絡(luò)架構(gòu)對訓(xùn)練和識別有一定影響,但目前尚未找到規(guī)律,有待于今后進(jìn)一步研究?;馂?zāi)數(shù)據(jù)集對訓(xùn)練模型和識別測試影響較大,受訓(xùn)練和識別時(shí)間限制,單純加大數(shù)據(jù)集不是好方法,應(yīng)該設(shè)法構(gòu)建更加科學(xué)合理的有效的火災(zāi)數(shù)據(jù)集。這些都是今后需要進(jìn)一步努力的方向。
作者簡介:
1.曲妍姝,2001年1月,女,漢,遼寧省大連市,本科,沈陽航空航天大學(xué),學(xué)生。
2.崔永毅,1965.2,男,漢族,籍貫,沈陽,學(xué)歷,碩士,工作單位,沈陽航空航天大學(xué),職稱,副教授,研究方向:滅火技術(shù)、火災(zāi)圖像檢測。
3.孫國慶,1999.10.01,男,滿族,山東諸城,本科,沈陽航空航天大學(xué),學(xué)生。
4.李龍山,2000.09.06,男,漢,天津市武清區(qū),本科,沈陽航空航天大學(xué),學(xué)生。