陳景洲,林繼煌,張 寧,,*,謝蘭遲,黎智輝,李志剛
(1. 江西省興國縣公安局,江西 興國 342400;2. 公安部物證鑒定中心,北京100038)
在當(dāng)前偵查破案工作中,監(jiān)控視頻已經(jīng)成為繼現(xiàn)場勘查信息、手機信息之后的第三大信息來源,也是繼刑事科學(xué)技術(shù)、行動技術(shù)、網(wǎng)絡(luò)偵查技術(shù)之后的第四大偵查技術(shù)領(lǐng)域[1]。視頻中人臉圖像作為最直觀的線索,在各類案件中發(fā)揮著非常重要的作用。犯罪嫌疑人的人臉圖像,相比其它生物特征如指紋、DNA、足跡、虹膜等更為直觀,更容易讓普通人辨別,被廣泛應(yīng)用于嫌疑人識別、排查、身份辨認等過程,逐漸成為案件偵查訴訟中最常見的線索和證據(jù),為追逃、破案、尋人等應(yīng)用提供了強大技術(shù)支撐[2-4]。
隨著人臉識別技術(shù)的不斷進步,公安實際工作中已經(jīng)開始廣泛應(yīng)用人像自動識別比對系統(tǒng),將視頻截圖或特定人員人像照片在海量數(shù)據(jù)庫中快速查找、檢索、比對以確認其身份。例如,緝拿在逃罪犯時,可通過人臉識別比對系統(tǒng),加快確認嫌疑人身份,避免“人海戰(zhàn)術(shù)”的低效率;對群眾或其它部門提供的照片進行比對、檢索、篩選,幫助尋人尋親;對于一些無名尸體的照片入庫進行比對,確認其身份等。但是,在實戰(zhàn)應(yīng)用過程中,由于監(jiān)控設(shè)備經(jīng)常安裝于高點,所拍攝到的人像往往是俯視姿態(tài)而非正面姿態(tài),同時還存在人像本身的偏轉(zhuǎn),在直接利用人像比對系統(tǒng)進行檢索比對時,識別效果往往較差,比對準(zhǔn)確率不高,依然需要進行大量人工干預(yù)和排查,大大降低了偵查效率。人像姿態(tài)轉(zhuǎn)正技術(shù)是最近幾年新發(fā)展起來的一種技術(shù),可以通過單張非正面人臉圖像恢復(fù)出該人像三維模型下正臉的模擬圖像,從而提高導(dǎo)入人像比對系統(tǒng)的比對準(zhǔn)確率,將原先不可檢索運用的人像落地運用。實際案件中常常遇到需要對偏轉(zhuǎn)角度大于15°的大姿態(tài)人像進行比對,本文報道一則應(yīng)用大姿態(tài)人像轉(zhuǎn)正技術(shù)偵破的成功案例。
2017年1月以來,某縣城區(qū)貿(mào)易廣場、鳳凰大道某小區(qū)等區(qū)域陸續(xù)發(fā)生多起盜竊五羊本田等高檔摩托車案件,涉案金額27萬余元,且案發(fā)地在人流密集區(qū)域,社會影響較大。犯罪分子白天連續(xù)作案,氣焰囂張,嚴(yán)重影響人民群眾安全感和滿意度。
案件發(fā)生后,辦案民警第一時間趕赴現(xiàn)場采集涉案視頻。經(jīng)認真查看分析視頻,捕捉到嫌疑男子的人像信息。該嫌疑男子人臉圖像較清晰,但視頻拍攝角度較高、人像姿態(tài)存在傾斜,如圖1所示。
圖1 嫌疑男子人像(左:視頻截圖;右:放大后人像截圖)Fig.1 The image of the suspect (Left: the screens hot video frame of the suspect; Right: the enlarged face image of the suspect)
將該嫌疑男子圖像截取后直接導(dǎo)入某省視頻圖像綜合應(yīng)用平臺人像比對系統(tǒng)進行檢索,檢索出的結(jié)果相似度均不高,且相似度從高到低排名前二十位的目標(biāo)經(jīng)核查均排除嫌疑。
2.2.1 摳圖
將人像(包含脖子)從圖中提取出來,其余部分背景置為黑色,如圖2所示。摳圖步驟的作用在于去除非人像部分(背景)對三維人像重建的影響。
圖2 摳圖操作(左:原始圖像;右:摳圖后結(jié)果)Fig.2 Face extraction (Left: original face image; Right: the resulted image after face extracting)
2.2.2 關(guān)鍵點調(diào)整
調(diào)整右側(cè)畫面中三維人像模型(該模型由采集得到的一定規(guī)模三維人像數(shù)據(jù)統(tǒng)計建模而成)的姿態(tài)與左側(cè)視頻人像截圖姿態(tài)一致,右側(cè)畫面中只保留人像模型中所顯示的關(guān)鍵點,把左側(cè)人像中的關(guān)鍵點移動到人像對應(yīng)的位置,保存鋪點,如圖3所示。這一步驟的目的是手動標(biāo)記關(guān)鍵點位置,定位姿態(tài)并優(yōu)化主成分分析(principal components analysis,PCA)系數(shù),最后基于3D人像模型進行擬合并轉(zhuǎn)正。
2.2.3 邊緣調(diào)整
在關(guān)鍵點標(biāo)記圖像中,調(diào)整邊緣上下閾值參數(shù),獲取人像邊緣,得到的邊緣結(jié)果盡可能地保留住人像的輪廓,如圖4所示。這一步驟的目的在于控制臉型和優(yōu)化PCA系數(shù),對重建結(jié)果進行約束,防止人像重建失敗。
圖3 關(guān)鍵點調(diào)整(左:關(guān)鍵點標(biāo)記圖像;右:三維人像模型)Fig.3 Key-point alignment (Left: the resulted image of key-point alignment; Right: 3D face-image model)
圖4 邊緣調(diào)整(左:關(guān)鍵點標(biāo)記圖像;右:邊緣調(diào)整后結(jié)果)Fig.4 Edge adjustment (Left: the resulted image after key-point alignment; Right: the resulted image after edge adjustment)
2.2.4 姿態(tài)轉(zhuǎn)正
基于3D人像模型以及標(biāo)準(zhǔn)人像關(guān)鍵點位置信息,可以計算和擬合出人像關(guān)鍵點對應(yīng)的正面姿態(tài)時的位置,從而模擬出該人像三維旋轉(zhuǎn)至正面時的圖像。進行了摳圖、關(guān)鍵點調(diào)整和邊緣調(diào)整這三步預(yù)處理后,進行姿態(tài)轉(zhuǎn)正處理也即正面人像重建,重建結(jié)果如圖5所示。從圖中可以看到,單張二維半側(cè)面人臉圖像被旋轉(zhuǎn)成為一張完全正面的人臉圖像。
圖5 轉(zhuǎn)正結(jié)果(左:摳圖后圖像;右:姿態(tài)轉(zhuǎn)正后結(jié)果)Fig.5 The result after pose adjustment (Left: the result after face extracting; Right: the resulted face after pose turning to the obverse)
采用大姿態(tài)人像轉(zhuǎn)正技術(shù)處理后,導(dǎo)入某省視頻圖像綜合應(yīng)用平臺再次進行檢索比對,比中一名相似度較高的前科人員曾某(排名第2,相似度88.37%)。后經(jīng)信息研判,確定嫌疑人為曾某。辦案民警立即對嫌疑人的行蹤及其關(guān)系人開展深度研判和外圍調(diào)查,同時實施抓捕。辦案民警在某縣縣城先后抓獲曾某及其同伙謝某、王某等人,破獲這起跨三省的系列盜竊高檔摩托車案件。大姿態(tài)人像轉(zhuǎn)正技術(shù)為鎖定該系列案嫌疑人發(fā)揮了關(guān)鍵技術(shù)支撐作用。
在過去幾年里,人像識別的研究和應(yīng)用都取得了巨大進步,特別是在公安領(lǐng)域的應(yīng)用越來越深入。面向真實場景非配合、非受控環(huán)境下的人像識別成為了研究的熱點和難點。特別是受監(jiān)控設(shè)備安裝位置、人像偏轉(zhuǎn)等因素影響,獲得的人臉圖像經(jīng)常存在姿態(tài)變化的干擾,非正面姿態(tài)會造成面部信息的部分缺失,對系統(tǒng)的識別檢索造成了不利影響,極大制約了人臉圖像線索的應(yīng)用,也一直是人像識別的一個技術(shù)難題。
基于三維人像重建的人像姿態(tài)轉(zhuǎn)正技術(shù)可以解決多場景視頻下人像姿態(tài)偏轉(zhuǎn)、信息缺失等問題,實現(xiàn)多角度人像姿態(tài)轉(zhuǎn)正、人像校正和人像修復(fù)合成功能。在三維模型的幫助下,可以使待識別圖像和庫中圖像處于同一姿態(tài)。采用多姿態(tài)人像檢測與比對相關(guān)技術(shù),通過人像關(guān)鍵點定位和三維人像擬合,對人像進行三維重建,估算偏轉(zhuǎn)角度,最終恢復(fù)出該人像三維模型下正臉的模擬圖像,從而有效提升了人像識別性能?;谧藨B(tài)轉(zhuǎn)正技術(shù),還可以進一步實現(xiàn)變形人像的校正、污損人像修復(fù)重建功能。雖然有研究者嘗試通過3D人像校正等關(guān)鍵技術(shù)提高人像識別的準(zhǔn)確率,但是目前這些研究大多仍然基于實驗數(shù)據(jù)庫進行測試,并未與實戰(zhàn)使用的人像識別系統(tǒng)關(guān)聯(lián)對接,適用場景較為單一和固定,方法的綜合性、集成性、實用性還不夠強,尚未在公安實戰(zhàn)中應(yīng)用[5]。而本文所使用的是基于三維形變模型(3D morphable model,3DMM)的三維人像重建方法,三維形變模型是從單張圖像中恢復(fù)三維人像的有效工具[6-7]。本文通過實戰(zhàn)案例證明了該方法的實用性和可行性。
除了本案例,我們還選取了3例實際視頻監(jiān)控場景下的非正面圖像開展實驗研究,對已知身份人員的非正面圖像進行姿態(tài)轉(zhuǎn)正處理,比較處理前后比對結(jié)果的提升情況,結(jié)果如表1所示。從表中我們可以看到,經(jīng)過大姿態(tài)人像轉(zhuǎn)正處理后再輸入人像比對系統(tǒng),并在同一人像庫中進行檢索,其相似度和排名相比直接導(dǎo)入系統(tǒng)檢索均得到了不同程度提升。當(dāng)然,對于分辨率較低或五官模糊的圖像,其三維重建后的正面圖像也難以實現(xiàn)較好的比對結(jié)果。
表1 非正面圖像轉(zhuǎn)正處理效果比較Table 1 The comparison of face retrieval results before and after large pose 3D face reconstruction
本文所介紹的方法,可以更好地發(fā)揮人像檢索比對系統(tǒng)的效能,省去了以往大量人工干預(yù)和排查的過程,大大提升視頻人像線索利用率,提高了工作效率,節(jié)約了辦案資源,真正提升了視頻偵查工作水平。同時,這一方法緊密結(jié)合實戰(zhàn)使用的人像比對系統(tǒng),轉(zhuǎn)變了以往將原始視頻截圖直接入庫比對的“粗放型”工作模式,進一步提高了人像檢索的效率和準(zhǔn)確率,這種新的工作模式更符合實戰(zhàn)一線需求。