劉 琦
(河南警察學(xué)院,河南 鄭州 450000)
隨著技術(shù)發(fā)展,主動(dòng)配合的圖像采集及識(shí)別技術(shù)非常成熟,靜態(tài)人臉圖像識(shí)別準(zhǔn)確率更是達(dá)到99.999 9%,無(wú)限接近于100%。但是動(dòng)態(tài)人像布控中一個(gè)極為關(guān)鍵的問(wèn)題是非主動(dòng)配合人臉圖像采集的質(zhì)量問(wèn)題。路人庫(kù)中充斥著大量低質(zhì)量人臉圖片,因無(wú)法達(dá)到人臉檢測(cè)最低標(biāo)準(zhǔn)而無(wú)法充分利用。搭建低質(zhì)量人臉圖像數(shù)據(jù)庫(kù),并與相對(duì)應(yīng)高質(zhì)量人臉圖像進(jìn)行比對(duì),為下一步處理低質(zhì)量人臉圖像奠定基礎(chǔ)。
人臉識(shí)別技術(shù)發(fā)展迅速[1-3],通用的圖像質(zhì)量評(píng)估流程如圖1所示。不難發(fā)現(xiàn),當(dāng)圖像的質(zhì)量被評(píng)估為不合格后,就會(huì)被丟棄或僅僅報(bào)警處理。但是,往往路人庫(kù)中存在著豐富的低質(zhì)量圖像,無(wú)法達(dá)到檢測(cè)標(biāo)準(zhǔn)。對(duì)低質(zhì)量圖像進(jìn)行研究,融合其他技術(shù)甚至是傳統(tǒng)技術(shù),較好地解決這一問(wèn)題至關(guān)重要,具有非常重要的研究意義和實(shí)用價(jià)值。
圖1 人臉識(shí)別系統(tǒng)中質(zhì)量評(píng)估框圖
如果低質(zhì)量圖像的問(wèn)題得以解決,會(huì)為人們生活各個(gè)方面帶來(lái)更好的安全保障。例如在公安機(jī)關(guān)涉及的相關(guān)案件處理流程中,可以簡(jiǎn)化更多偵破流程,提高辦案效率。在案件偵查階段,公安機(jī)關(guān)會(huì)從監(jiān)控視頻資料中截取所需嫌疑人的人臉圖像,但大多數(shù)情況圖像的質(zhì)量極低,通過(guò)算法處理之后可以提高圖像的識(shí)別概率,從而極大地縮小目標(biāo)范圍,提高調(diào)查取證效率。在訴訟階段,可以更好地提高公訴質(zhì)量,在電視報(bào)道中可以經(jīng)常看見(jiàn),檢察機(jī)關(guān)在批捕或起訴各類犯罪案件時(shí),常因?yàn)橐曨l錄像或嫌疑人圖像的模糊無(wú)法有力地證實(shí)犯罪,極大地影響了公訴的進(jìn)程。在證據(jù)出示階段,往往由于現(xiàn)場(chǎng)勘驗(yàn)的空間狹小、光線不足等條件影響圖像質(zhì)量,從而因證據(jù)不足審判無(wú)法繼續(xù)。
綜上,低質(zhì)量圖像問(wèn)題的解決無(wú)論是對(duì)于公安系統(tǒng)案件偵破效率的提高,還是對(duì)于居民人生安全的保障來(lái)看,都起著至關(guān)重要的作用。
對(duì)于低質(zhì)量圖像,在識(shí)別時(shí)往往會(huì)出現(xiàn)模糊、有遮擋、亮度不夠等側(cè)重于主觀方面的詞匯[4-5],本文在界定低質(zhì)量圖像時(shí)則采用人臉圖像質(zhì)量評(píng)估算法來(lái)界定,當(dāng)該評(píng)估結(jié)果為“低質(zhì)量圖像”時(shí),則為本文所討論的對(duì)象。
本論文的研究對(duì)象為低質(zhì)量圖像,為更好地研究相關(guān)算法以及進(jìn)行數(shù)據(jù)庫(kù)的搭建與測(cè)試,從某地市公安局得到了涉及低質(zhì)量圖像識(shí)別的案件信息及嫌疑人圖像,以下對(duì)所收集圖像的具體情況進(jìn)行闡述。
根據(jù)某地市公安局提供信息,共得到相關(guān)案件30 起,案件信息如圖2所示,案件性質(zhì)類型涉及持刀搶劫、入室盜 竊、飛車搶奪、無(wú)名女尸身份確認(rèn)等;案件信息包括案件詳情描述、監(jiān)控視頻、人臉截圖、系統(tǒng)對(duì)比圖像等;共計(jì)得到人臉低質(zhì)量圖像273 張,根據(jù)圖像審核標(biāo)準(zhǔn)選出質(zhì)量較好的圖像47 張,供后文數(shù)據(jù)測(cè)試使用。
案件情況與篩選出的低質(zhì)量圖像匯總?cè)鐖D3所示,其中的命名方式為:首位數(shù)字為涉及案件的數(shù)字代碼、次位數(shù)字為該圖片在該案件中出現(xiàn)的順序。
圖2 案件信息
圖3 低質(zhì)量人臉圖像匯總
圖像的分類使得多個(gè)圖像根據(jù)自身特征信息劃分到不同類別,有助于圖像的檢索、收集、存儲(chǔ)與使用。相比人眼視覺(jué)效果的區(qū)分效果,科學(xué)的分類規(guī)則更能體現(xiàn)圖像的各自特征信息。
本小節(jié)針對(duì)以上所篩選出的47 張圖像,進(jìn)行不同方式的分類,為數(shù)據(jù)庫(kù)圖像信息的錄入打下基礎(chǔ)。
3.1.1 基于圖像格式的分類
圖像的格式即計(jì)算機(jī)用于存儲(chǔ)圖片的格式,格式不同,也就決定著圖像有著不同的優(yōu)缺點(diǎn),如JPG 格式圖片之所以能被廣泛地應(yīng)用,因?yàn)樗螺d速度快、文件的尺寸小,各種類型的瀏覽器均支持該圖像格式;但同時(shí)它也存在著會(huì)被壓縮耗損而降低數(shù)據(jù)質(zhì)量的缺點(diǎn)。
常見(jiàn)的圖像類型有:JPG、PNG、TIFF、SWF、BMP、PCX、TGA、WEBP、AI、EXIF、CDR、PCD、WMF、FPX、EPS、DXF、PSD、RAW、EPS、PSD、UFO 和SVG 等,本文所討論對(duì)象中有45 張JPG 格式圖像、2 張PNG 格式圖像。
3.1.2 基于圖像大小的分類
作為圖像屬性的大小與數(shù)據(jù)庫(kù)的搭建工作有著密不可分的關(guān)系,圖像大小決定了用于存儲(chǔ)該圖像文件所需要磁盤存儲(chǔ)空間的大小,它的度量單位是字節(jié),計(jì)算公式為:
文件的大小與該圖像的像素?cái)?shù)目有著直接的關(guān)系。將圖像按照大于1 G、小于1 G 大于100 k、小于100 k 分為三個(gè)等級(jí),統(tǒng)計(jì)三個(gè)等級(jí)數(shù)量分別為4 張、20 張、23 張。
3.1.3 基于圖像分辨率的分類
分辨率是生活中常常提到用來(lái)描述圖像清晰程度的專業(yè)名詞,專業(yè)來(lái)講,它是表達(dá)圖像內(nèi)所含數(shù)據(jù)量多少的一個(gè)參數(shù)。包含數(shù)據(jù)越多,文件的長(zhǎng)度越長(zhǎng),那么就能夠展現(xiàn)出該圖像更多的細(xì)節(jié);然而當(dāng)數(shù)據(jù)非常少時(shí),圖像就會(huì)隨之變得粗糙,這樣的狀況在將圖像尺寸放大時(shí)表現(xiàn)更為明顯。本文所討論的就是后者這類分辨率的低質(zhì)量圖像。根據(jù)數(shù)據(jù)的大小將所得圖像進(jìn)行了分類,分為高、中、低三個(gè)等級(jí),分別有23 張、14 張、10 張。
上述三種方式都能實(shí)現(xiàn)對(duì)圖像的分類,本論文的研究重點(diǎn)為圖像的質(zhì)量問(wèn)題,所以本設(shè)計(jì)數(shù)據(jù)庫(kù)搭建工作采用基于分辨率的分類方式進(jìn)行分類。
根據(jù)需求搭建預(yù)處理模板數(shù)據(jù)表、深度學(xué)習(xí)功能模塊數(shù)據(jù)表和人臉識(shí)別模塊數(shù)據(jù)表,如圖4、圖5、圖6所示。
圖4 預(yù)處理模塊數(shù)據(jù)表
圖5 深度學(xué)習(xí)功能數(shù)據(jù)表
圖6 人臉識(shí)別數(shù)據(jù)表
3.2.1 預(yù)處理模塊數(shù)據(jù)表
所得到的低質(zhì)量圖像的原始照片多在某些因素上被影響,其中有無(wú)法恢復(fù)的部分,比如大小、分辨率等,但部分因素造成的影響可以在預(yù)處理的流程中被處理,比如飽和度、亮度、色調(diào)等,該數(shù)據(jù)表則對(duì)圖像的具體信息進(jìn)行統(tǒng)計(jì)與存儲(chǔ)[6-8]。
3.2.2 深度學(xué)習(xí)功能數(shù)據(jù)表
該數(shù)據(jù)庫(kù)是為后續(xù)小組另一位成員算法的實(shí)現(xiàn)而搭建,該算法的核心思想為通過(guò)基于深度學(xué)習(xí)的訓(xùn)練來(lái)提升低質(zhì)量圖像與高質(zhì)量圖像的識(shí)別概率,即需要一個(gè)數(shù)據(jù)表來(lái)存儲(chǔ)兩者圖像的標(biāo)識(shí),便于數(shù)據(jù)庫(kù)的調(diào)取。
3.2.3 人臉識(shí)別數(shù)據(jù)表
提升低質(zhì)量圖像的根本目的即為獲取圖像中人員信息,便于公安機(jī)關(guān)展開對(duì)嫌疑人的抓捕工作或案件審判中的舉證工作,需創(chuàng)建人臉識(shí)別結(jié)果信息存儲(chǔ)的數(shù)據(jù)表,信息內(nèi)容包含人員的姓名、性別、民族、戶籍等相關(guān)信息。
在數(shù)據(jù)中添加數(shù)據(jù)表后,開始對(duì)數(shù)據(jù)庫(kù)的運(yùn)行做測(cè)試,部分代碼如下:
運(yùn)行結(jié)果如圖7所示,該數(shù)據(jù)庫(kù)能夠調(diào)取數(shù)據(jù)表里圖像的信息并進(jìn)行成功比對(duì),得出兩者的相似度。由此測(cè)試搭建的數(shù)據(jù)庫(kù)可以滿足需求。
圖7 運(yùn)行結(jié)果
本文對(duì)低質(zhì)量數(shù)據(jù)庫(kù)采集后如何分類,建立預(yù)處理表、功能表及識(shí)別數(shù)據(jù)表,代碼實(shí)現(xiàn)結(jié)果的測(cè)試等問(wèn)題進(jìn)行了研究與技術(shù)實(shí)現(xiàn)。本文的工作對(duì)于進(jìn)一步處理低質(zhì)量圖像起到較好的支撐作用。