本文主要針對動態(tài)人臉識別系統(tǒng)誤報警率進行分析研究,通過實驗測試,提出利用報警過濾機制降低誤報警率的解決思路,并進行了驗證性測試。
人臉識別是一項熱門的生物特征識別技術(shù)。生物特征識別技術(shù)是對生物體(一般特指人)本身的生物特征來區(qū)分個體,所研究的生物特征包括臉、指紋、手掌紋、虹膜、視網(wǎng)膜、聲音、體形、個人習慣(例如簽字)等,相應的識別技術(shù)就有人臉識別、指紋識別、掌紋識別、虹膜識別、視網(wǎng)膜識別、語音識別。
廣義的人臉識別實際包括構(gòu)建人臉識別系統(tǒng)的一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、人臉識別預處理、身份確認以及身份查找等;而狹義的人臉識別特指通過人臉進行身份確認或者身份查找的技術(shù)或系統(tǒng)。
人臉識別技術(shù)相對于其他生物特征識別技術(shù)的優(yōu)勢在于其自然性和不被被測個體察覺的特點。
自然性:是指該識別方式同人類(甚至其他生物)進行個體識別時所利用的生物特征相同。例如人臉識別,人類也是通過觀察比較人臉區(qū)分和確認身份的,另外具有自然性的識別還有語音識別、體形識別等,而指紋識別、虹膜識別等都不具有自然性,因為人類或者其他生物并不通過此類生物特征區(qū)別個體。
不被察覺:對于一種識別方法很重要,這會使該識別方法不令人反感,并且因為不容易引起人的注意而不容易被欺騙。人臉識別具有這方面的特點,它完全利用可見光獲取人臉圖像信息,而不同于指紋識別或者虹膜識別,需要利用電子壓力傳感器采集指紋,或者利用紅外線采集虹膜圖像,這些特殊的采集方式很容易被人察覺,從而更有可能被偽裝欺騙。
構(gòu)成人臉識別的5步:抓取圖像、在圖像中找到臉、提取特征(建模板)、比較模板、宣布比對結(jié)果。
在算法確定的情況下,一個成功的人臉識別系統(tǒng),特別是超大規(guī)模數(shù)據(jù)庫(數(shù)百萬模板以上)系統(tǒng)的建構(gòu)與管理取決于集成商的綜合能力,包括:
1、環(huán)境控制技術(shù):圖像預處理(增強,光線補償、自動動態(tài)范圍調(diào)整等)、圖像采集技術(shù)、光照管理技術(shù)、影像設(shè)備的把握與理解、圖像質(zhì)量評價技術(shù)。
2、系統(tǒng)技術(shù):硬件設(shè)備性能與匹配、嵌入式數(shù)據(jù)庫(基于鍵值對的文件數(shù)據(jù)庫)、多引擎并行比對服務技術(shù)、數(shù)據(jù)庫技術(shù)、應用接口技術(shù)。
現(xiàn)階段國內(nèi)的大規(guī)模人臉識別應用主要集中在公安系統(tǒng)已有人像資源的建模和比對,由于人臉動態(tài)識別技術(shù)自身的復雜性,而且其對于光線、角度等外在環(huán)境要求高,因此應用效果還很有限,影響實際使用的主要有漏報率和誤報率,本文主要圍繞降低誤報率進行探討。
1、漏報率MP(S)
已列入監(jiān)視名單中的測試對象進行一次通行測試中,若系統(tǒng)未能報警或者報警結(jié)果中不包含該人員在監(jiān)視名單中的正確身份,則記為一次漏報通行測試。漏報通行測試總次數(shù)與已列入監(jiān)視名單中的測試對象通行測試總次數(shù)之比即為監(jiān)視名單漏報率。
記已列入監(jiān)視名單中的測試對象通行測試次數(shù)為R,漏報通行測試次數(shù)為M,則監(jiān)視名單漏報率MP計算方法如式(1)所示:
2、正確報警率NP(S)
已列入監(jiān)視名單中的測試對象進行一次通行測試中,若系統(tǒng)正確報警,則記為一次正確報警通行測試。正確報警通行測試總次數(shù)與已列入監(jiān)視名單中的測試對象通行測試總次數(shù)之比即為監(jiān)視名單正確報警率。
記已列入監(jiān)視名單中的測試對象通行測試次數(shù)為R,正確報警通行測試次數(shù)為N,則監(jiān)視名單正確報警率NP計算方法如下式所示:
NP=N/R*100%=1-MP
3、誤報率FP(S)
未列入監(jiān)視名單中的測試對象進行一次通行測試中,若系統(tǒng)將其識別為監(jiān)視名單中的任何身份,則記為一次誤報通行測試。誤報通行測試總次數(shù)與未列入監(jiān)視名單中的測試對象通行測試總次數(shù)之比即為非監(jiān)視名單誤報率。
記未列入監(jiān)視名單中的的測試對象通行測試次數(shù)為W,誤報通行測試次數(shù)為F,則非監(jiān)視名單誤報率FP計算方法如下式所示:
4、正確接受率CAR(S)
在假定的閾值s下,為在同一人中算法正確識別為同一人的比率。又稱為正確識別率、正確報警率、靈敏度等。
5、錯誤拒絕率FRR(S)
在假定的閾值s下,為在同一人中算法錯誤識別為不同一人的比率。又稱為拒真率、漏報率等。
6、正確拒絕率CRR(S)
在假定的閾值s下,為在不同一人中算法正確識別為不同一人的比率。也叫特異度。
7、錯誤接受率FAR(S)
在假定的閾值s下,為在不同一人中算法錯誤識別為同一人的比率。又稱為錯誤識別率、誤報率、認假率等。
在上述術(shù)語中,漏報率MP(s)、正確報警率NP(s)和誤報率FP(s)為動態(tài)人臉識別的術(shù)語;而正確接受率CAR(s)、錯誤拒絕率FRR(s)、正確拒絕率CRR(s)和錯誤接受率FAR(s)為靜態(tài)人臉識別比對的術(shù)語。
CAR(s)+ FRR(s)=1。即,正確接受率+錯誤拒絕率=100%
FAR(s)+ CRR(s)=1。即,錯誤接受率+正確拒絕率=100%
MP(s)= a*FRR(s) 其中a為視頻圖像的影響因子,a〉=1。即,漏報率=視頻因子*漏報率。
NP(s)= 1-MP(s)=1-a*FRR(s)。即正確報警率+漏報率=100%
FP(s)= F/W*100%=b*[1-FAR(s)]L≈b*L*FAR(s),其中b為視頻圖像的影響因子,a〉=1,L為監(jiān)控名單的庫容量且FAR(s)很小時。即當FAR(s)很小時,誤報率約等于視頻因子b乘以監(jiān)控名單的庫容量L和錯誤接受率FAR(s)。
在動態(tài)人臉識別的實際運用中除了追求高正確報警率(或者是低漏報率)外,低誤報率也是推廣使用動態(tài)人臉識別技術(shù)的關(guān)鍵。但是漏報率和誤報率是一對杠桿性的矛盾,降低漏報率(提高正確報警率)必將造成誤報率的提高。同時,誤報率與監(jiān)控名單的庫容量是一個成正比的關(guān)系。根據(jù)不同場景,我們做了幾個測試:
1、單一算法的誤報率
根據(jù)我們掌握的幾個算法,用二代證照片作為測試庫進行測試,結(jié)果如圖1:
圖1
圖1為ROC曲線圖,橫軸為FAR,縱軸為CAR,測評的照片庫為2.6萬組同人的二代證照片。從圖中可以看出,在FAR(S)為萬分之一的時候,其中一個算法的CAR(S)大約在76%左右,而另外兩個算法大約在72%左右。
如果我們希望正確報警率在70%以上,此時,錯誤接受率約為萬分之一,那么在1000個監(jiān)控名單的庫容量時,非監(jiān)控名單誤報率將達到10%。
反過來,如果我們要求在1000個監(jiān)控名單的庫容量時將誤報率控制在1%,那么正確報警率可能要低于60%。以上的理論值是基于假設(shè)視頻圖像能取得與靜態(tài)圖像質(zhì)量相同的人像。但實際情況要受光照、采集攝像機和網(wǎng)絡等因素的影響,效果將更差。
2、監(jiān)控名單庫容量與誤報警率的關(guān)系
我們使用同樣一段測試視頻,用算法一在閾值為0.71的情況下,用5011人、10011人和50011人等三種不同的監(jiān)控名單庫容量進行測試,具體的正確報警率和誤報警率分別如下:
算法 閾值 庫容量 正確報警數(shù)非監(jiān)控名單 監(jiān)控名單正確報警率 漏報率 誤報數(shù) 誤報警率5011 60 54.5% 45.5% 2 0.5%10011 60 54.5% 45.5% 7 1.6%50011 60 54.5% 45.5% 37 8.6%算法1 0.71
從上面的測試結(jié)果表明,正確報警率與監(jiān)控名單的庫容量基本上沒有關(guān)系,但誤報警率與監(jiān)控庫容量有很大的正相關(guān)性,監(jiān)控名單的庫容量越大,誤報警率越高。此測試結(jié)果與第一條“各種比率的關(guān)系”中誤報率FP(s)和監(jiān)控名單庫容量L的關(guān)系相符。
3、單算法通過調(diào)整閾值來控制誤報率
我們也可以通過閾值的調(diào)整來控制誤報警率,下面的例子就是我們選定算法一,在庫容量為50011萬人時,將閾值0.68提高到0.71時正確報警率和誤報警率的變化情況:
算法 閾值 正確報警數(shù) 正確報警率 誤報警數(shù) 誤報警率算法1 0.68 69 62.7% 97 22.7%算法1 0.71 60 54.5% 37 8.6%
從以上的測試結(jié)果可以看出,調(diào)整報警閾值可以控制誤報警率,但是正確報警率也隨之降低。而且控制誤報警率獲取的好處和造成正確報警率降低帶來的損失幾乎是相當?shù)摹R虼?,在傳統(tǒng)運用中,如果希望較高的正確報警率就必須承受高誤報警率;如果希望低誤報警率就必須接受低正確報警率的事實。
4、某地鐵站內(nèi)實地測試
1)測試基本環(huán)境和條件
測試監(jiān)控點:地鐵站下行扶梯
測試人員:共11人
測試姿態(tài):自然姿態(tài)
測試人員通過測試:每個測試人員通過10次,測試人員共通過110次
旅客通過人次:428人次
測試庫容量:50016人
測試庫照片質(zhì)量:身份證二代制證用照片
2)測試結(jié)論
我們在選定兩個算法并設(shè)定相應較為合理的閾值后,正確報警率(漏報率)和誤報率的情況如下表:
算法 閾值 正確報警數(shù) 正確報警率 誤報警數(shù) 誤報警率算法1 0.71 60 54.5% 37 8.6%算法2 2.7 62 56.4% 18 4.2%
從上面的測試結(jié)果表明,在正確報警率都為55%左右的情況下,算法二比算法一在誤報警率控制的更好一些,但都遠遠超過了1%的水平。
影響誤報率的因素除了基礎(chǔ)的人臉識別算法外,還包括監(jiān)控區(qū)域的光照問題、被監(jiān)控者通過監(jiān)控區(qū)域時的姿態(tài)、采集監(jiān)控者人像使用的攝像機和鏡頭,還有傳輸監(jiān)控視頻的網(wǎng)絡環(huán)境等。
人臉識別的基礎(chǔ)算法是通過提取人臉的特征模板并進行比對識別過程。不同的算法提取的特征不同,識別結(jié)果也不同,但是作為有效的算法,都追求高準確接受率的同時降低錯誤接受率。如果兩個基礎(chǔ)算法采用的是自主的、非同源的技術(shù),那么他們正確識別同一人的可能性就很大,而錯誤識別不同人時的可能性就很小?;谝陨系乃伎己驼J識,我們將非同源、高互補性的算法進行融合,建立報警過濾機制,達到降低誤報率的目的。
從理論上說,算法融合有三種模式,分別是決策層融合、比對分數(shù)層融合和特征層融合。
決策層融合:每一個算法都會給出各自的決策,決策層融合過程將這些決策綜合起來給出最后的決策。通常采用諸如投票或者加權(quán)平均等策略。
比對分數(shù)融合:每一個算法的識別過程都會給出一個比對分值,比對分數(shù)融合過程將這些分數(shù)綜合成一個最終的比對分數(shù),并根據(jù)這個分數(shù)做出決策。
特征層融合:每個算法的識別過程都會給出一組提前的特征,特征層融合過程將這些特征綜合成為一個特征集合或者特征向量,用于比對和決策。
目前我們采用決策層融合的方式建立報警過濾機制,來降低單算法的誤報率。
針對前述測試視頻,我們引入報警過濾機制進行了測試,具體的測試結(jié)果如下:
算法 閾值 正確報警數(shù) 正確報警率 誤報警數(shù) 誤報警率算法1 0.68 69 62.7% 97 22.7%3 39 35.5% 0 0 2.7 46 41.8% 0 0 2.3 51 46.4% 0 0 2.0 60 54.5% 1 0.2%1.7 64 58.2% 4 0.9%算法1提高閾值 0.71 60 54.5% 37 8.6%報警過濾算法
從以上的測試結(jié)果看,我們可以在50011人的監(jiān)控名單庫中,將誤報警率控制在千分之二的情況下,正確報警率從62.7%只降低到54.5%。比只通過調(diào)整單算法的閾值達到的效果好很多,可以說此技術(shù)在控制誤報警率上已達到實際使用的水平。
(一)對算法和閾值進一步優(yōu)化,使之達到在正確報警率基本不變的情況下,降低誤報警率。
(二)尋求更適合動態(tài)人臉識別技術(shù)的硬件設(shè)備,特別是攝像機和鏡頭,希望能進一步提高正確報警率的水平,目標是能在目前的基礎(chǔ)上提高5%的正確報警率。
(三)繼續(xù)測試能提高正確報警率的完善監(jiān)控區(qū)域光照標準,在有條件的地方,進行適當?shù)墓庠凑{(diào)整,以改善圖像質(zhì)質(zhì)量,提高正確報警率。
(四)探討與警務機制更加有效結(jié)合報警機制,如分級報警、多方式報警等。