劉紅燕 李 謹(jǐn) 唐 振 賴 哲
(珠海供電局,廣東 珠海 519000)
在很長一段時(shí)間內(nèi),對煙火進(jìn)行識別所采用設(shè)備均為傳感器,強(qiáng)調(diào)通過傳感器對火焰燃燒給溫度、顆粒物密度產(chǎn)生的影響進(jìn)行檢測,根據(jù)參數(shù)變化情況得出最終結(jié)論。但傳統(tǒng)方法在成本、智能程度還有覆蓋面積等方面的表現(xiàn)均無法滿足當(dāng)今社會(huì)要求,基于此,研究人員提出引入深度學(xué)習(xí)法,依托YOLOv3將目標(biāo)檢測相關(guān)問題向回歸問題進(jìn)行轉(zhuǎn)化,在改進(jìn)損失函數(shù)、網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,對邊界框所具有可靠性進(jìn)行預(yù)測的方式,使物體識別精度最大程度接近理想水平。研究成果可為研發(fā)巡檢機(jī)器人、全新安防設(shè)備等工作助力,隨著火情防控力度得到提高,搶險(xiǎn)能力自然可得到保證。
以往對圖像進(jìn)行識別的算法,均要人工篩選并對特征進(jìn)行提取,只有在確定圖像特征后,才能對其進(jìn)行識別。常見提取識別方法包括以下幾種:其一,先通過區(qū)域分割的方式,提取各亮點(diǎn)區(qū)及疑似區(qū)域?qū)?yīng)邊界鏈碼,再對各區(qū)域?qū)?yīng)圓形度進(jìn)行計(jì)算,借助BP神經(jīng)網(wǎng)絡(luò)展開檢測并得出最終結(jié)論。其二,對火焰候選區(qū)域所表現(xiàn)出空間、時(shí)間特征進(jìn)行提取,利用改進(jìn)所得紋理描述法對地形特征進(jìn)行統(tǒng)計(jì),借助BP神經(jīng)網(wǎng)絡(luò)完成識別工作。其三,由高斯分塊模型負(fù)責(zé)劃分動(dòng)態(tài)區(qū)域,由統(tǒng)計(jì)顏色概率的模型負(fù)責(zé)對各區(qū)域所表現(xiàn)出顏色特征進(jìn)行提取,同時(shí)對疑似區(qū)域進(jìn)行分割,根據(jù)各區(qū)域圓形度對其內(nèi)部是否有火焰、火災(zāi)存在進(jìn)行判斷。
上述方法均要提前完成處理和分割圖像的操作,從而確保所得到煙霧、火焰特征具有實(shí)際意義,但相關(guān)算法均無法被用來對低紋理、中紋理圖像特征進(jìn)行準(zhǔn)確提取,極易出現(xiàn)漏檢或是誤檢的情況。將深度學(xué)習(xí)用于圖像識別,可確保所得到算法具有自我學(xué)習(xí)的能力,對復(fù)雜圖像特征進(jìn)行提取的速度也會(huì)得到顯著提升,與手工篩選相比,由智能算法對特征進(jìn)行提取,通常更利于事物本質(zhì)的表達(dá)。有學(xué)者選擇利用傳統(tǒng)算法,深度學(xué)習(xí)算法,Dense-SIFT算法,分別對高大空間內(nèi)部煙火進(jìn)行檢測,對檢測結(jié)果進(jìn)行分析可知,在隱層數(shù)量固定的前提下,深度學(xué)習(xí)算法所取得效果較其他算法更為理想。另外,相關(guān)研究還對ResNet、AlexNet和VGG等模型進(jìn)行了運(yùn)用,根據(jù)識別早期煙霧及火焰的結(jié)果可知,全新模型在識別精度方面均較傳統(tǒng)模型更為理想,現(xiàn)階段,國內(nèi)外學(xué)者均將目光聚焦于煙火目標(biāo)檢測,力求能夠獲得與以往不同的全新算法,為防控火情等工作的開展助力。
YOLOv3由預(yù)測層、特征提取網(wǎng)絡(luò)構(gòu)成,其中,預(yù)測層的數(shù)量為3個(gè),可被用來對物體類別、所處位置進(jìn)行直接預(yù)測。YOLOv3的創(chuàng)新之處在于以融合多尺度特征為前提,得出最終預(yù)測結(jié)論,可使顆粒度特征得到最大程度保留,即使檢測對象存在被遮擋或大小不同的情況,同樣可保證檢測結(jié)果具備理想精度。而利用Residual對特征提取網(wǎng)絡(luò)進(jìn)行處理的目的,主要是對參數(shù)量、模型復(fù)雜程度加以控制,此舉一方面能夠增強(qiáng)收斂效果,另一方面可使深層網(wǎng)絡(luò)較易出現(xiàn)梯度消失情況的問題得到解決。全卷積網(wǎng)絡(luò)所包括卷積層的數(shù)量為53個(gè),將LeakyRelu作為激活函數(shù),利用Residual對各卷積層進(jìn)行有效連接,確保初始數(shù)據(jù)能夠跳過指定層而到達(dá)網(wǎng)絡(luò)層,在保證預(yù)測精度的前提下,縮短預(yù)測時(shí)長。
目標(biāo)檢測對象以檢測目標(biāo)存在顯著差異或較為復(fù)雜的場景為主,對相關(guān)數(shù)據(jù)進(jìn)行采集時(shí),研究人員應(yīng)該重視以下內(nèi)容:一是目標(biāo)場景。對煙火進(jìn)行檢測的環(huán)境往往較為復(fù)雜,通常存在建筑遮擋或光照差異大的情況,要想使模型盡快適應(yīng)不同場景并完成預(yù)測工作,關(guān)鍵是要對采集數(shù)據(jù)的環(huán)節(jié)進(jìn)行優(yōu)化,增加數(shù)據(jù)集所存儲(chǔ)數(shù)據(jù)的數(shù)量及復(fù)雜程度。二是目標(biāo)多樣性。即使檢測目標(biāo)固定,在不同角度對其進(jìn)行拍攝所得圖片往往也會(huì)存在一定差異,鑒于此,在實(shí)地采集數(shù)據(jù)的環(huán)節(jié),研究人員應(yīng)考慮不同視角,確保設(shè)計(jì)所得模型能夠從不同角度對檢測目標(biāo)進(jìn)行判斷,并得出準(zhǔn)確結(jié)果。
以圖1為例,研究人員借助數(shù)據(jù)增強(qiáng)算法,分別對圖片進(jìn)行了剪切、調(diào)節(jié)色域、變換角度以及縮放處理,對處理所得圖片進(jìn)行合并的方式,使檢測物體背景得到豐富。雖然物體形態(tài)、背景亮度存在細(xì)微差異,但其本質(zhì)仍然為煙霧、火焰。
圖1 對圖片數(shù)據(jù)進(jìn)行增強(qiáng)的效果對比
傳統(tǒng)檢測器無法杜絕誤定位的情況發(fā)生,而改用高斯建??捎行Ы鉀Q該問題,高斯建模所預(yù)測對象以邊界框置信度為主,對邊界框相關(guān)信息進(jìn)行獲取的方式,為算法所具有精度提供保證。該模型的特點(diǎn)是利用正態(tài)分布曲線,對事物進(jìn)行精確量化。為保證所建立模型可發(fā)揮應(yīng)有作用,有關(guān)人員應(yīng)重視以下內(nèi)容:灰度直方圖所反映信息以圖像出現(xiàn)特定灰度值的頻次、概率密度為主,若圖像背景區(qū)域與目標(biāo)區(qū)域存在較大差異,對應(yīng)灰度直方圖往往會(huì)呈現(xiàn)出雙峰谷的形狀,雙峰分別對應(yīng)目標(biāo)和中心灰度。一般來說,只需將多峰特性視為高斯分布疊加,就可以使圖像分割問題迎刃而解。該文所研究算法利用t,t,t,t對邊界框坐標(biāo)進(jìn)行表達(dá),研究人員可利用高斯分布函數(shù)對以上數(shù)據(jù)進(jìn)行建模,從而判斷邊界框是否具備良好可靠性。若將測試輸入設(shè)定為,高斯模型設(shè)定為,則可利用公式(1)對高斯參數(shù)進(jìn)行表示。
式中:為高斯參數(shù);為高斯函數(shù)對應(yīng)數(shù)據(jù)具體數(shù)量。()為的平均值。∑()代表的方差。
為準(zhǔn)確判斷邊界框定位是否可靠,該模型將對特征圖所包含邊界框坐標(biāo)的平均值及方差進(jìn)行預(yù)測。研究人員以該算法檢測層所表現(xiàn)出結(jié)構(gòu)特點(diǎn)為依據(jù),提出利用以下方法對高斯參數(shù)加以處理,如公式(2)所示。式中:t、t、t、t分別為各坐標(biāo)分量對應(yīng)高斯分布的平均數(shù)值,即預(yù)測坐標(biāo)分量。∑、∑、∑、∑分別為坐標(biāo)分量對應(yīng)高斯方差,通常被用來衡量坐標(biāo)分量定位所具有不確定性。
考慮到本次高斯建模的主體為邊界框坐標(biāo),通常只需對相關(guān)損失函數(shù)進(jìn)行重設(shè)即可,類別損失函數(shù)、目標(biāo)損失函數(shù)均不需要加以調(diào)整。基于邊界框相關(guān)數(shù)值對損失函數(shù)進(jìn)行重設(shè)所得結(jié)果如公式(3)所示。
在該函數(shù)表達(dá)式中,L代表坐標(biāo)分量對應(yīng)損失函數(shù)(坐標(biāo)分量用t代表)。對其他損失函數(shù)進(jìn)行計(jì)算的方法,可沿用L所用算法。代表圖片橫向網(wǎng)格數(shù)(寬度)。代表圖片縱向網(wǎng)格數(shù)(高度)。代表錨框數(shù)量。為損失函數(shù)具體數(shù)量。μt(x)代表算法檢測層所輸出數(shù)值,即在網(wǎng)格(,)中錨框?qū)?yīng)t坐標(biāo)?!?span id="lv53xvh" class="emphasis_italic">t(x)同樣代表檢測層所輸出數(shù)值,其所描述對象為坐標(biāo)t所具有不確定性。x ijk代表坐標(biāo)分量對應(yīng)標(biāo)簽值。
式中:代表尺度權(quán)重,通常以訓(xùn)練過程中物體的尺寸進(jìn)行分配。δ 為網(wǎng)格(,)中錨框與相關(guān)標(biāo)簽值的交集,若該交集可達(dá)到最大值,則可將δ 參數(shù)設(shè)定為1,若交集未達(dá)到最大值,通常將該參數(shù)設(shè)定為0。的取值是10。
在確定以上參數(shù)值后,研究人員便可根據(jù)類別分?jǐn)?shù)、邊界框所具有不確定性、目標(biāo)分?jǐn)?shù)完成檢測任務(wù),本次試驗(yàn)所采用檢測標(biāo)準(zhǔn)如公式(6)所示。
C=()×(Class)×(1-Uncertainy) (6)式中:C代表監(jiān)測標(biāo)準(zhǔn)。()代表目標(biāo)分?jǐn)?shù)。(Class)代表物體對應(yīng)分?jǐn)?shù)。Uncertainy代表邊界框所具有不確定性的平均數(shù)值,其取值范圍為0~1,若類別分?jǐn)?shù)、目標(biāo)分?jǐn)?shù)確定,邊界框可靠性將與不確定性成反比,即:邊界框可靠性可隨著不確定性的降低而提高。
研究表明,傳統(tǒng)檢測器無法徹底杜絕誤定位(即假陽例)情況出現(xiàn)?;馂?zāi)往往具有極易被場景所干擾、類型相對復(fù)雜等特點(diǎn),對其進(jìn)行檢測時(shí),出現(xiàn)誤定位的概率較大,對自動(dòng)滅火平臺(tái)來說,一旦有誤定位情況存在,極易使自身出現(xiàn)闖入火災(zāi)、意外制動(dòng)或其他過度反應(yīng),甚至造成碰撞、錯(cuò)誤報(bào)警乃至爆炸的嚴(yán)重后果。鑒于此,利用高斯函數(shù)對損失函數(shù)進(jìn)行設(shè)計(jì),獲得相應(yīng)的邊界框模型極為重要,這是因?yàn)楦咚菇?杀挥脕韺吔缈蛩哂锌煽啃赃M(jìn)行預(yù)測,并根據(jù)置信度函數(shù)對其損失進(jìn)行計(jì)算,定位精度自然可得到顯著提高。對該模型加以應(yīng)用,不僅能夠降低誤定位的概率,還可以避免自動(dòng)滅火平臺(tái)陷入危險(xiǎn),最大化地實(shí)現(xiàn)其價(jià)值。
該試驗(yàn)所用SE-Net可被拆分成Excitation及Squeeze,其作用主要是增強(qiáng)模型敏感度,提高模型識別channel精度,同時(shí)對特征通道所存在依賴關(guān)系進(jìn)行構(gòu)建。Excitation的作用主體為全局特征,具體來說,就是利用全連接層對參數(shù)量、學(xué)習(xí)難度加以控制,確保所得到channel權(quán)重與實(shí)際情況相符。而Squeeze的核心功能是對特征圖進(jìn)行轉(zhuǎn)換,從而獲得具有全局感受野的數(shù)值。正是因?yàn)樘卣魈崛【W(wǎng)絡(luò)的加入,才使該文所設(shè)計(jì)算法能夠通過預(yù)測得出準(zhǔn)確結(jié)果。考慮到Residual層主要負(fù)責(zé)對各層特征進(jìn)行融合,研究人員最終決定以Residual層為載體,在嵌入SE-Net的基礎(chǔ)上,根據(jù)全局池化平均值對特征圖進(jìn)行輸出的通道數(shù)量進(jìn)行設(shè)定,確保所獲得子結(jié)構(gòu)擴(kuò)大特征圖感知范圍。
另外,由于需要對圖片局部信息與特征進(jìn)行快速獲取,研究人員還在網(wǎng)絡(luò)結(jié)構(gòu)中新增了SPP塊。SPP塊可被拆分成4個(gè)分支,具體包括Residual層1個(gè)、最大池化層3個(gè),各分支的位置關(guān)系為并行。事實(shí)證明,對網(wǎng)絡(luò)模型進(jìn)行上述調(diào)整,可增強(qiáng)其對局部特征進(jìn)行獲取的能力,同時(shí)可以增強(qiáng)特征圖感受,能夠準(zhǔn)確判別火焰所存在微小差別,樣本所存在檢測目標(biāo)差異大、類別不均等問題迎刃而解,該模型對特征進(jìn)行表達(dá)的效果也將更接近研究預(yù)期。
獲取試驗(yàn)數(shù)據(jù)集的途徑為公開數(shù)據(jù)集、互聯(lián)網(wǎng)圖片與視頻,研究人員共截取了12000張圖片,在對所截取圖片數(shù)據(jù)進(jìn)行增強(qiáng)處理的基礎(chǔ)上,將其劃分成煙霧數(shù)據(jù)集、火焰數(shù)據(jù)集兩類,煙霧數(shù)據(jù)集又分為白色煙霧、黑色煙霧,而火焰數(shù)據(jù)集所包括數(shù)據(jù),主要為室內(nèi)/室外在白天及黑天的火焰,這樣設(shè)計(jì)的目的有兩個(gè),一是確保數(shù)據(jù)集具備良好的泛化能力,二是做到精確識別不同場景。分別利用smoke、fire標(biāo)注圖片煙霧區(qū)、火焰區(qū),標(biāo)注格式以PASALVOC為主,隨后,經(jīng)由隨機(jī)函數(shù)對數(shù)據(jù)集進(jìn)行劃分,獲得研究所需測試集、訓(xùn)練集,二者所包括圖片總量的比值為1∶4,其中,訓(xùn)練集又分為驗(yàn)證集、訓(xùn)練集兩部分,二者所包括圖片總量的比值為1∶9。
該算法向預(yù)訓(xùn)練網(wǎng)絡(luò)進(jìn)行遷移,采用對前端特征進(jìn)行凍結(jié)的方式,達(dá)到提取網(wǎng)絡(luò)的效果,再以測試集、訓(xùn)練集為依據(jù),調(diào)整剩余網(wǎng)絡(luò)參數(shù),使其具有實(shí)際研究意義。事實(shí)證明,遷移學(xué)習(xí)可使數(shù)據(jù)所具有泛化能力得到顯著提高,訓(xùn)練環(huán)節(jié)用時(shí)隨之減少。假設(shè)SGD動(dòng)量為0.9,對應(yīng)IOU閾值是0.5,學(xué)習(xí)率初始值為0.001。
該試驗(yàn)所使用系統(tǒng)版本為Ubuntu18.04,開發(fā)框架為Pytorch,同時(shí)配備16G內(nèi)存,在基于數(shù)據(jù)集對檢測樣本進(jìn)行采集的前提下,利用遷移學(xué)習(xí)完成訓(xùn)練網(wǎng)絡(luò)模型操作,可得出“在迭代次數(shù)達(dá)到200次時(shí),損失值變化幅度有所減小”的結(jié)論。
對火災(zāi)檢測算法進(jìn)行評價(jià)的核心指標(biāo)為真陽例率,即對全部火災(zāi)圖片進(jìn)行檢測所得存在火災(zāi)情況的圖片占比。另外,還可將樣本劃分成假陰例與真陰例,通常用及加以表示。研究結(jié)果表明,對數(shù)據(jù)進(jìn)行增強(qiáng)處理后,該算法對應(yīng)值較初始數(shù)值提高了約1.3%,對應(yīng)查準(zhǔn)率可達(dá)96.6%左右,與此同時(shí),研究人員還對傳統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了調(diào)整,改進(jìn)所得算法對應(yīng)至較初始數(shù)值提高了約2.7%,對應(yīng)查準(zhǔn)率高達(dá)97.1%。若以傳統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)為參照物,經(jīng)過數(shù)據(jù)增強(qiáng)、結(jié)構(gòu)改進(jìn)處理的網(wǎng)絡(luò)結(jié)構(gòu),其值較初始數(shù)值共提高了約5.5%,對應(yīng)查準(zhǔn)率在97.8%左右。結(jié)合消融試驗(yàn)所得結(jié)果可知,以數(shù)據(jù)增強(qiáng)為前提,改進(jìn)損失函數(shù)可使算法值提高約2.3%,若僅對數(shù)據(jù)進(jìn)行增強(qiáng),而不對損失函數(shù)進(jìn)行調(diào)整,改進(jìn)算法值較SPP結(jié)構(gòu)提高約1.6%,較SE-Net算法提高約2.2%,較綜合算法提高約2.7%??紤]到煙霧的表現(xiàn)形態(tài)并不固定,極易被色調(diào)、天空背景以及外界光照度所影響,利用該算法識別煙霧的精度,通常無法達(dá)到火焰識別所具有精度,這點(diǎn)需要尤為注意。
綜上所述,以YOLOv3為基礎(chǔ),通過調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)的方式,使網(wǎng)絡(luò)具備快速理解局部信息的能力,有助于模型對火焰所存在微小差異進(jìn)行準(zhǔn)確區(qū)分,樣本所存在目標(biāo)差異明顯、類別不均等問題也可得到有效解決。在對損失函數(shù)加以改進(jìn)的前提下,將邊界框所具有可靠性納入預(yù)測范圍,可使負(fù)樣本數(shù)量得到減少,數(shù)據(jù)集所表現(xiàn)出泛化能力隨之提高。通過增強(qiáng)數(shù)據(jù)的方式改進(jìn)數(shù)據(jù)集所產(chǎn)生積極影響,主要是能夠使預(yù)測精度最大程度接近預(yù)期水平,未來相關(guān)內(nèi)容仍然是研究重點(diǎn),應(yīng)引起重視。