崔希,劉首明
(1.江投集團(tuán)能源技術(shù)研究院,江西南昌,330000;2.國家電投集團(tuán)江西電力有限公司分宜發(fā)電廠,江西新余,336607)
人臉識(shí)別技術(shù)是圖像深度分析、圖像多維處理等領(lǐng)域內(nèi)的研究與關(guān)注重點(diǎn),也是近年來市場最為活躍的一項(xiàng)研究技術(shù)。目前,與人臉識(shí)別相關(guān)的研究已在我國醫(yī)院診療、刑事案件處理等行業(yè)內(nèi)廣泛應(yīng)用,在深入對(duì)此項(xiàng)技術(shù)的研究中發(fā)現(xiàn),人臉識(shí)別方法融合了深度視覺、圖像編程、特征提取等多種類型算法[1]。盡管我國有關(guān)產(chǎn)業(yè)在開展與此相關(guān)的研究中,已通過完善的計(jì)算機(jī)技術(shù),實(shí)現(xiàn)了對(duì)人臉的有效辨別,但由于傳統(tǒng)方法在獲取人臉信息過程中,獲取行為的實(shí)施過程會(huì)受到空間明暗程度、獲取人臉信息角度等多種因素的影響,導(dǎo)致最終識(shí)別的結(jié)果與實(shí)際結(jié)果不匹配[2]。例如,在智能電廠的夜間監(jiān)控系統(tǒng)中,人臉識(shí)別方法便會(huì)受到夜間環(huán)境昏暗的影響,導(dǎo)致識(shí)別精度與主體定位出現(xiàn)偏離[3]。而要解決與此方面相關(guān)的問題,本文在傳統(tǒng)的研究內(nèi)容基礎(chǔ)上,引進(jìn)了樸素貝葉斯算法。在提出的算法中,認(rèn)為每識(shí)別到一個(gè)人臉特征,其特征對(duì)應(yīng)的屬性均是處于一種獨(dú)立狀態(tài)的。而在完成對(duì)所有特征的獲取后,根據(jù)不同特征出現(xiàn)的條件概率融合特征,從而可以獲得一個(gè)相對(duì)清晰的人臉圖像。因此,本文將綜合樸素貝葉斯算法在應(yīng)用中所具備的優(yōu)勢,對(duì)人臉識(shí)別方法的設(shè)計(jì)展開詳細(xì)研究,并希望本文設(shè)計(jì)的方法可以真實(shí)地應(yīng)用到智能電廠,為電廠的夜間監(jiān)控可持續(xù)運(yùn)行提供技術(shù)層面指導(dǎo)。
基于某智能電廠監(jiān)控需要,在對(duì)其夜間視頻人臉識(shí)別過程中,引入樸素貝葉斯算法。首先,針對(duì)需要進(jìn)行人臉識(shí)別的視頻進(jìn)行獲取,對(duì)分宜智能電廠前端通過網(wǎng)絡(luò)攝像機(jī)對(duì)現(xiàn)場監(jiān)控視頻進(jìn)行采集[4]。網(wǎng)絡(luò)攝像機(jī)當(dāng)中包含了攝像機(jī)與上位機(jī)的所有功能,利用其中與攝像機(jī)相關(guān)的功能,實(shí)現(xiàn)對(duì)分宜智能電廠現(xiàn)場視頻圖像的獲取,并將其轉(zhuǎn)換為數(shù)字信號(hào)。再利用其與上位機(jī)功能相關(guān)的部件,針對(duì)轉(zhuǎn)換的數(shù)字信號(hào)進(jìn)行壓縮處理,并通過網(wǎng)絡(luò)通信傳輸?shù)姆绞竭M(jìn)行傳輸。每一個(gè)網(wǎng)絡(luò)攝像機(jī)都包含了一個(gè)獨(dú)立的IP地址。在經(jīng)過分宜智能電廠授權(quán)后,上位機(jī)用戶能夠通過網(wǎng)絡(luò)傳輸?shù)姆绞?,在本地或遠(yuǎn)距離實(shí)現(xiàn)對(duì)監(jiān)控視頻圖像的觀看、存儲(chǔ)以及管理等操作[5]。結(jié)合本文人臉識(shí)別方法的應(yīng)用需要,本文采用由??倒狙邪l(fā)生產(chǎn)的iDS-GPZ2486XS型號(hào)網(wǎng)絡(luò)攝像機(jī)作為本文獲取分宜智能電廠夜間監(jiān)控視頻的主要設(shè)備。該型號(hào)網(wǎng)絡(luò)攝像機(jī)支持RJ45網(wǎng)口,自適應(yīng)10M/100M網(wǎng)絡(luò)數(shù)據(jù),分辨率及幀率為主碼流 50Hz:25fps(2560×1440) 或 60Hz:30fps(2560×1440),該型號(hào)網(wǎng)絡(luò)攝像機(jī)當(dāng)中配備了PoE網(wǎng)絡(luò)接口,能夠支持802.3AF及AT協(xié)議,同時(shí)與該型號(hào)網(wǎng)絡(luò)攝像機(jī)配套的攝像頭可以做到即插即用。在第一次使用該設(shè)備時(shí),對(duì)攝像機(jī)的IP地址進(jìn)行設(shè)定,并確定視頻采集過程中的相關(guān)參數(shù)。在與網(wǎng)絡(luò)攝像機(jī)相連接的服務(wù)器上,利用該設(shè)備配套的SDK完成對(duì)視頻圖像的解析,并獲取圖像幀,用于后續(xù)對(duì)視頻中人臉的識(shí)別。
在按照上述操作,完成對(duì)智能電廠監(jiān)控夜間視頻圖像獲取后,每隔5幀完成一次對(duì)視頻人臉的識(shí)別。同時(shí),在識(shí)別的過程中,利用樸素貝葉斯算法對(duì)人臉特征進(jìn)行提取[6]。根據(jù)貝葉斯定理提取人臉特征,并給定訓(xùn)練集,再利用訓(xùn)練后獲得的學(xué)習(xí)模型,對(duì)視頻圖像中的人臉特征進(jìn)行提取。假設(shè)L(ik)表示為在某一類i訓(xùn)練樣本當(dāng)中灰度級(jí)為k的視頻圖像概率分布矩陣,結(jié)合最大后驗(yàn)概率原則,對(duì)L(ik)進(jìn)行計(jì)算,其公式為:
公式(1)中,p表示為某一類別u下的訓(xùn)練樣本v中每個(gè)位置上k’級(jí)灰度出現(xiàn)概率。在完成對(duì)L(ik)的計(jì)算后,還需要對(duì)其進(jìn)行平滑處理。由于在實(shí)際識(shí)別的過程中會(huì)受到訓(xùn)練樣本數(shù)量的限制,因此無法對(duì)每一個(gè)位置上的各個(gè)灰度級(jí)分別進(jìn)行計(jì)算,因此當(dāng)針對(duì)每一個(gè)灰度級(jí)在訓(xùn)練數(shù)據(jù)當(dāng)中,采用最大后驗(yàn)規(guī)則,找出零概率,當(dāng)零概率產(chǎn)生后會(huì)同時(shí)產(chǎn)生負(fù)無窮大值,影響到樸素貝葉斯算法的識(shí)別性能[7]。
因此,本文在利用樸素貝葉斯算法識(shí)別時(shí),利用Laplace平滑解決概率分布矩陣中產(chǎn)生零元素的問題。通過上述兩個(gè)步驟的處理后,得到一個(gè)不包含零元素的灰度級(jí)分布矩陣。為確保識(shí)別精度,在去除數(shù)字圖像噪聲后,對(duì)鄰域當(dāng)中各個(gè)圖像像素點(diǎn)的灰度信息進(jìn)行分析。由于監(jiān)控夜間視頻當(dāng)中的灰度級(jí)概率分布矩陣各個(gè)元素的關(guān)系與視頻圖像中各個(gè)像素關(guān)系相類似,并且樸素貝葉斯算法能夠?qū)⑿枰M(jìn)行識(shí)別的樣本分類并劃分到各個(gè)對(duì)應(yīng)條件概率最大的類別當(dāng)中[8]。因此,本文通過對(duì)灰度級(jí)概率分布的方式,實(shí)現(xiàn)對(duì)傳統(tǒng)識(shí)別算法的優(yōu)化,其操作可以用如下公式表示:
公式(2)中,a、b表示為空間濾波的模板尺寸,并且a、b均為奇數(shù);u表示為利用Laplace平滑解決概率分布矩陣中的元素。通過上述公式(2)計(jì)算,實(shí)現(xiàn)對(duì)分布矩陣最大值濾波處理,以此可以獲取視頻圖像上各個(gè)位置鄰域最大概率幅值。在此基礎(chǔ)上,將矩陣當(dāng)中的噪聲進(jìn)行去除處理,從而增加樸素貝葉斯算法在對(duì)夜間視頻圖像識(shí)別的適應(yīng)性,確保在視頻內(nèi)人臉圖像姿態(tài)偏轉(zhuǎn)和不同光照環(huán)境當(dāng)中都能夠得到更加準(zhǔn)確地識(shí)別結(jié)果[9]。同時(shí),為了減少本文識(shí)別方法出現(xiàn)誤檢或由于其他因素的影響造成識(shí)別結(jié)果錯(cuò)誤,本文針對(duì)檢測到的人臉進(jìn)行膚色驗(yàn)證以及人臉大小限制。當(dāng)檢測的過程中,人臉大小超出設(shè)定范圍時(shí),則后續(xù)幀將不會(huì)對(duì)該圖像進(jìn)行跟蹤;若人臉大小符合設(shè)定的標(biāo)準(zhǔn)范圍,則后續(xù)仍然按照每5幀識(shí)別一次的方式對(duì)人臉進(jìn)行識(shí)別和跟蹤,直到人臉在視頻圖像當(dāng)中消失為止。
通過本文上述論述,完成對(duì)分宜智能電廠監(jiān)控夜間視頻人臉識(shí)別,為了進(jìn)一步提高本文識(shí)別方法的分辨率,獲取到更加清晰的圖像結(jié)果。還需要對(duì)識(shí)別到的人臉圖像進(jìn)行調(diào)優(yōu)處理[10]。由于在監(jiān)控當(dāng)中人會(huì)在不同的時(shí)間出現(xiàn)多次,因此在識(shí)別后得到的數(shù)據(jù)集當(dāng)中會(huì)有大量重復(fù)類別產(chǎn)生,加重監(jiān)控識(shí)別的負(fù)擔(dān)。因此,針對(duì)這一問題,需要對(duì)重復(fù)類別進(jìn)行合并[11]。針對(duì)不同時(shí)間相同類別的圖像需要進(jìn)行合并,將矩形框當(dāng)中的樣本作為中心樣本。通過對(duì)中心樣本相似度進(jìn)行計(jì)算,并與閾值比較的方式,將屬于相同類別的圖像進(jìn)行合并,將不同類別圖像進(jìn)行分類[12]。完成合并后,利用三元組損失函數(shù)對(duì)提取識(shí)別的人臉圖像特征進(jìn)行映射,并將其映射到距離空間當(dāng)中。本文基于上述需要,采用VGG模型作為對(duì)人臉圖像調(diào)優(yōu)的初始模型,該模型的結(jié)構(gòu)參數(shù)如表1所示。
表1 VGG模型結(jié)構(gòu)參數(shù)對(duì)照表
在對(duì)人臉圖像進(jìn)行調(diào)優(yōu)的過程中,需要始終保持VGG模型的卷積層以及ConvB-1、ConvB-2層原始數(shù)據(jù)不變,僅針對(duì)其較小的學(xué)習(xí)率進(jìn)行設(shè)置,并對(duì)ConvA-2層數(shù)據(jù)進(jìn)行微調(diào)處理,同時(shí)根據(jù)上述合并、分類后得到的人臉類別結(jié)果,對(duì)相應(yīng)的輸出類別數(shù)進(jìn)行調(diào)整,以此完成對(duì)人臉視頻圖像的調(diào)優(yōu)。
為探究本文提出的基于樸素貝葉斯算法的智能電廠監(jiān)控夜間視頻人臉識(shí)別方法在實(shí)際應(yīng)用中的優(yōu)勢,選擇將每個(gè)智能電廠監(jiān)控設(shè)備采集并存儲(chǔ)的近1個(gè)月視頻圖像作為實(shí)驗(yàn)對(duì)象。已知該視頻圖像當(dāng)中共包含850個(gè)類別,其中人臉圖像共12520張。將12520張人臉圖像劃分為三組不同集合,其中第一組集合為統(tǒng)一光照下的正臉圖像集合;第二組集合為統(tǒng)一光照的正臉圖像集合,人臉圖像表情與第一組集合存在差異;第三組集合為各種不同姿態(tài)變化下的人臉圖像。同時(shí),三組集合當(dāng)中包含的姿態(tài)、光照等因素都在發(fā)生變化。利用智能電廠監(jiān)控平臺(tái),對(duì)實(shí)際場景當(dāng)中的監(jiān)控視頻數(shù)據(jù)集進(jìn)行獲取。從視頻圖像可以看出,本文實(shí)驗(yàn)當(dāng)中的智能電廠監(jiān)控主要位于不同樓道的出入口,并且攝像機(jī)的放置角度也不相同。分別利用兩種識(shí)別方法對(duì)上述獲取到的圖像集合進(jìn)行識(shí)別,本文將人臉識(shí)別分辨率作為實(shí)驗(yàn)評(píng)價(jià)指標(biāo),由于識(shí)別分辨率越高,得出的識(shí)別結(jié)果越準(zhǔn)確,而識(shí)別分辨率低,得出的識(shí)別結(jié)果準(zhǔn)確性越差,以此實(shí)現(xiàn)對(duì)兩種識(shí)別方法的識(shí)別準(zhǔn)確性驗(yàn)證。
在兩種人臉識(shí)別方法對(duì)本文上述提取的圖像集合進(jìn)行識(shí)別時(shí),隨機(jī)抽取其中5組實(shí)驗(yàn)數(shù)據(jù)并進(jìn)行比較,為了更直觀地對(duì)兩種識(shí)別方法的應(yīng)用效果進(jìn)行比較,具體實(shí)驗(yàn)結(jié)果如表2所示。
表2 兩種識(shí)別方法實(shí)驗(yàn)結(jié)果對(duì)比表
從表2中的數(shù)據(jù)可以看出,本文提出的識(shí)別方法在對(duì)圖像進(jìn)行識(shí)別時(shí),分辨率均明顯大于傳統(tǒng)識(shí)別方法。同時(shí),在實(shí)驗(yàn)過程中發(fā)現(xiàn),傳統(tǒng)識(shí)別方法在應(yīng)用過程中會(huì)受到圖像姿態(tài)、光照等外界條件因素的影響,識(shí)別準(zhǔn)確率會(huì)大大降低,進(jìn)而造成極差的識(shí)別效果。因此造成分辨率無法達(dá)到智能電廠監(jiān)控要求的標(biāo)準(zhǔn)。通過對(duì)比實(shí)驗(yàn)進(jìn)一步證明,本文提出的基于樸素貝葉斯算法的智能電廠監(jiān)控夜間視頻人臉識(shí)別方法具有較高的識(shí)別準(zhǔn)確率。
人臉識(shí)別是一種十分常見的生物特征識(shí)別技術(shù),將人臉識(shí)別應(yīng)用到分宜智能電廠當(dāng)中對(duì)于保障整個(gè)企業(yè)的公共安全和信息安全而言具有十分重要的意義?;诖?,本文通過引入樸素貝葉斯算法,提出了一種全新的人臉識(shí)別方法,并將其應(yīng)用于實(shí)際發(fā)現(xiàn),該方法能夠在改變?nèi)梭w姿態(tài)和周圍光照環(huán)境條件下,實(shí)現(xiàn)對(duì)人臉的準(zhǔn)確識(shí)別。但由于研究能力有限,在利用樸素貝葉斯算法對(duì)人臉圖像識(shí)別時(shí),需要在建立的概率分布矩陣當(dāng)中完成,因此適用性相對(duì)較弱,仍然存在改進(jìn)和提升的空間。