□ 文/本刊記者 何遙
相比以往的人臉識別,深度學(xué)習(xí)算法推動的人臉識別發(fā)生了巨大變化:準確率更高,環(huán)境適應(yīng)性更強,識別種類更豐富。包括人臉識別技術(shù)在內(nèi)的生物識別技術(shù)的進步,結(jié)合紅外光、可見光技術(shù),推動主動安防時代的到來。本期欄目邀請到生物識別領(lǐng)域的幾位專家,共同探討這一主題。
本期嘉賓:
北京智慧眼科技股份有限公司董事長 邱建華
廣州像素數(shù)據(jù)技術(shù)股份有限公司董事長 姚若光
深圳市威富安防有限公司算法工程師 梁先揚
人工智能中深度學(xué)習(xí)算法的突破,使得生物識別技術(shù)極大地提高了識別率。反過來,多年積累起的海量數(shù)據(jù),為深度學(xué)習(xí)訓(xùn)練提供了燃料。公共安全中的人臉識別產(chǎn)品與應(yīng)用迎來一個新的發(fā)展期。
邱建華:智慧眼人臉識別技術(shù)采用先進的計算機視覺和機器學(xué)習(xí)技術(shù),對輸入的圖像/視頻進行分析,找到圖像/視頻中存在的人臉,并在器官特征點定位的基礎(chǔ)上,對人臉進行幾何和光照歸一化,進而提取人臉的鑒別特征,并將其與已知人臉進行對比,從而識別每個人的身份。
基于千萬級人臉圖片大數(shù)據(jù)深度學(xué)習(xí)的智慧眼人臉識別算法、活體檢測算法在業(yè)內(nèi)POC測試中位列前三,已獲得國家專利,現(xiàn)已廣泛應(yīng)用于人社、金融、教育、安防、衛(wèi)生等領(lǐng)域,為1億用戶提供身份認證服務(wù)。
邱建華
姚若光
梁先揚
智能終端——人證合一智能終端。人證合一實名制已成為我國公民在辦理很多業(yè)務(wù)時的硬性要求。智慧眼開發(fā)出來的人證核驗設(shè)備品類豐富、應(yīng)用廣泛。設(shè)備主要包括桌面式人證合一設(shè)備、手持式警務(wù)通設(shè)備、單雙屏人證核驗訪客機及高端的智能閘機終端。每一類設(shè)備都針對特定場合開發(fā),目前在網(wǎng)吧、酒店、寫字樓、政府部門、治安卡口、邊防檢查站等場合都有廣泛應(yīng)用。
靜脈識別——指靜脈識別。智慧眼指靜脈識別算法在2015/2016/2017全球指靜脈挑戰(zhàn)賽上連續(xù)三次奪得冠軍,無論是識別精度還是識別速度都處于行業(yè)領(lǐng)先地位。安博會上智慧眼展出了基于指靜脈技術(shù)開發(fā)出來的指靜脈智能門鎖、指靜脈考勤門禁終端、指靜脈采集儀以及備受關(guān)注的指靜脈精密模塊。以便有項目需求的客戶可以在現(xiàn)場找到適合自己的指靜脈產(chǎn)品;有指靜脈產(chǎn)品開發(fā)需求的客戶則可以選擇到多款適合的指靜脈精密模塊。
身份認證——人臉識別超大規(guī)模應(yīng)用。智慧眼在今年的深圳安博會上展示了在身份認證大數(shù)據(jù)方面的成果,尤其是在全國社保身份認證方面。智慧眼的身份認證業(yè)務(wù)目前已服務(wù)超過2億人,協(xié)助人社部門完成近7億生物特征庫的建設(shè),是目前國內(nèi)最大規(guī)模的人臉識別應(yīng)用;同時,智慧眼也展示了另外一個榮獲國家發(fā)改委互聯(lián)網(wǎng)+重大工程支持項目——老來網(wǎng),這是全國為數(shù)不多的官方認證的第三方身份認證機構(gòu),是智慧眼借助人社業(yè)務(wù)優(yōu)勢,借助互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)優(yōu)勢,傾力打造的老年人社會化服務(wù)云平臺。
梁先揚:智能視頻分析的瓶頸:智能視頻分析依賴于高清視頻、大數(shù)據(jù)及高性能服務(wù)器。首先是更新?lián)Q代相對滯后:在一線城市深圳仍有不少攝像機分辨率在1080p以下,甚至還有模擬攝像機。其他二三線城市更加滯后。其次是聯(lián)網(wǎng)管理不夠集中統(tǒng)一,形成信息孤島:工業(yè)園、商場、小區(qū)的監(jiān)控自成一體,與公安市政道路監(jiān)控?zé)o法共享信息,存在漏洞。再次還有成本問題:架設(shè)光纖、更換高清攝像機、配置智能分析服務(wù)器成本相對較高,存在小區(qū)業(yè)主不愿分擔(dān)升級費用,基層派出所建設(shè)經(jīng)費有限等問題。需自上而下建設(shè)推廣。
智能視頻分析的機遇:國家基于長治久安、和諧發(fā)展對智慧平安城市建設(shè)的重視:習(xí)近平總書記在十九大報告指出建設(shè)平安中國,加強和創(chuàng)新社會治理,維護社會和諧穩(wěn)定,確保國家長治久安,人民安居樂業(yè)。
隨著社會各界對智能視頻分析,特別是人臉識別技術(shù)認識的加深,人臉考勤門禁、人臉鎖、刷臉支付、無人超市、無人餐廳越來越普遍。
硬件的快速發(fā)展,GPU運算能力提升,成本下降。英偉達陸續(xù)推出嵌入式GPU TX1、TX2,谷歌、蘋果、三星、英特爾、ARM等公司也在研發(fā)GPU芯片。這為人臉識別提供了技術(shù)基礎(chǔ)。
人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。與其他生物識別技術(shù)(如指紋、虹膜、掌紋等)相比,優(yōu)勢在于其自然性和不被人察覺的特點。
姚若光:像素數(shù)據(jù)自1998年成立以來,一直專注于人像采集檢測、人臉識別技術(shù)的研究,形成了完善的人臉識別產(chǎn)品體系及應(yīng)用典范,逐步成為行業(yè)標準制定者,主編及參與了近十項行業(yè)標準的制定。主要針對已發(fā)布或即將發(fā)布的人臉識別技術(shù)相關(guān)的標準闡述了我司各類人臉識別產(chǎn)品及應(yīng)用在貫徹安防標準方面取得的研究成果,從研究的底層出發(fā)得出:基于規(guī)范、標準化的人臉圖像采集、準確的人臉圖像檢測和提取、好的人臉比對算法、成就良好的人臉識別體驗。
談人臉識別,首先有一些基礎(chǔ)的技術(shù)特點。
構(gòu)成人臉識別的5步:抓取圖像;在圖像中找到臉;提取特征(建模板);比較模板;宣布比對結(jié)果。人像采集與檢測產(chǎn)品及其關(guān)鍵點的源頭在采集,好圖像時拍出來的,不是修出來的。人臉圖像處理的四個屬性:圖像屬性;位置屬性;臉部屬性;背景屬性。處理要求:提倡全局處理;反對局部處理;慎用銳化或美化工具:過渡處理會改變?nèi)四槇D像的紋理結(jié)構(gòu)。背景處理的關(guān)鍵在于邊緣處理,特別是頭發(fā)和臉和服飾的邊緣。
人臉辨認方面,我們推出了自助庫—多算法。多算法平臺除了算法有針對性,還有針對性地建立了各種案件庫。如電白、廉江、湖南邵陽等犯案集中地區(qū)的案件庫,為各警種辦案提供了有力的比對工具。該項目運行以來,得到了各警種的好評,在實戰(zhàn)中也出了較好的成效,特別是在占案例大頭的經(jīng)濟詐騙案、信用卡詐騙案中有較為突出的效果。
視頻人臉識別涉及到算法的選擇、攝像機及鏡頭選擇與架設(shè)。視頻人臉識別方面我們有一系列的產(chǎn)品方案:
(1)動態(tài)人臉識別監(jiān)控分析系統(tǒng):
對監(jiān)獄、機場、港口、銀行;交通、運輸;商場、大型超市;金融VIP等重要地點進行的機動布控。
(2)海量錄像人臉分析系統(tǒng):
支持多路錄像同時進行人臉分析,單個主流服務(wù)器可支持32路以上人臉采集,8路以上人臉識別分析,具備強大的擴展性(具體的支持路數(shù)由服務(wù)器性能決定)。
(3)人臉識別安防機器人:
在機場、港口、會場、展館、機場、火車站、汽車站等巡邏布控,在高端小區(qū)和工業(yè)園區(qū)等日常巡邏、警戒和布控。
(4)網(wǎng)格化中心布控(centralized deployment):
我們已成功實施了廣東某火車站人臉識別布控項目,某地鐵站人像抓拍識別租賃項目,某公安布控區(qū)域布控項目,某大型公園人臉識別布控項目,等等。
(5)基于人臉的人員軌跡分析—去中心化布控。
(6)訪客/迎賓機。
從技術(shù)上而言,規(guī)范的人臉圖像采集、準確的人臉圖像檢測和提取,加上好的人臉比對算法,成就良好的人臉識別體驗。
深度學(xué)習(xí)、紅外光結(jié)構(gòu)化等技術(shù)融合發(fā)展,讓安防更智能、更適應(yīng)各種不同場景。需要人工查找分析的傳統(tǒng)安防時代正在褪卻,取而代之的是一個主動安防的時代?!叭斯ぶ悄?軟硬件一體化”成為趨勢。
梁先揚:人臉識別的發(fā)展必然會經(jīng)歷兩個時代:(1)模型驅(qū)動時代,重在研究各種復(fù)雜的數(shù)學(xué)模型,利用有限的樣本進行學(xué)習(xí),模型的好壞直接決定識別效果,局限性較大,泛化能力較弱;(2)數(shù)據(jù)驅(qū)動時代,直接基于人工神經(jīng)網(wǎng)絡(luò)的模型,利用大數(shù)據(jù)進行深度學(xué)習(xí),數(shù)據(jù)的重要性超過了模型本身,具有很強的泛化能力。
這兩種驅(qū)動具有不同的研究范式。
模型驅(qū)動:
數(shù)據(jù)驅(qū)動:
模型驅(qū)動VS數(shù)據(jù)驅(qū)動
人工神經(jīng)網(wǎng)絡(luò)(ANN)系統(tǒng)是20世紀40年代后出現(xiàn)。1990年起,王守覺院士開始神經(jīng)網(wǎng)絡(luò)模式識別新理論新技術(shù)的研究,2002年取得突破性進展,提出了“高維形象幾何仿生信息學(xué)”新理論。該理論不斷豐富和完善,獲得了13位院士極高評價和聯(lián)名推薦。
威富安防人臉識別技術(shù)創(chuàng)造了超低數(shù)據(jù)量人臉識別技術(shù) ,全球首創(chuàng)且唯一,將人臉特征有效表達為48字節(jié),存儲超低、傳輸更快、比對更快、準確率高,可實現(xiàn)超小載體存儲、超大范圍應(yīng)用。
這種人臉識別技術(shù)采用高維形象幾何仿生信息學(xué)算法突破了環(huán)境的局限。在環(huán)境采集方面,新技術(shù)在動態(tài)識別的過程中可以逐步將人的表情、姿態(tài)、光線、遮擋等干擾信息進行排除,得到一張更準確表現(xiàn)個人信息的照片,從而提升比對的成功率。
對于人臉化妝、遮擋,新技術(shù)在提取人臉特征的時候,并不是基于每一個點的精確匹配,而是將人臉分成不同區(qū)域?qū)ζ涮卣鬟M行計算,因此小范圍局部遮擋(戴眼鏡或口罩)將不作為比對的內(nèi)容,而是選擇匹配最高的區(qū)域進行綜合比對,所以對比對效果不會產(chǎn)生太大影響。
對應(yīng)于兩種驅(qū)動模式,安防的兩個時代分別是被動安防與主動安防。
(1)被動安防:人眼“觀看監(jiān)控器20分鐘,人的集中力及判斷力將會下降”;人眼“觀看監(jiān)控器30分鐘以上,將會放棄畫面變動的80%以上”;事后查看錄像回放,時效性差,無法對各種犯罪活動形成有力打擊;人工無法完成大量的實時監(jiān)控,即使是細心的注意力集中的監(jiān)控人員,也不能有效完成監(jiān)控任務(wù)。
(2)主動安防:機器自動實時進行大數(shù)據(jù)分析,自動跟黑名單進行人臉比對,7*24小時不間斷;實現(xiàn)低投入產(chǎn)生高效率,使視頻監(jiān)控網(wǎng)絡(luò)系統(tǒng)真正成為“火眼金睛”,向科技要警力,使現(xiàn)有的警力提高20倍以上;變事后分析為事前預(yù)警,變被動安防為主動安防,極大提高犯罪威懾力。
人臉識別技術(shù)的發(fā)展開啟了主動安防時代!
姚若光:傳統(tǒng)的人臉識別發(fā)展走過了一條漫長的路。最終達到的水平是在正臉、光照均勻、無遮擋、兩眼像素60pixels圖像的情況下95%@with FAT@2‰左右(FRVT 2013);用戶的總體體驗是對圖像的要求比較高,需要用戶高度配合,應(yīng)用面比較窄。
AI使人臉識別一步踏入用戶可接受的門檻。開源的AI算法訓(xùn)練平臺:通過適當?shù)臄?shù)據(jù)訓(xùn)練,可達到應(yīng)用要求,現(xiàn)在的競爭是在萬、十萬、百萬之一錯誤識別率下的正確識別率/錯誤拒絕率,互聯(lián)網(wǎng)存在的海量人臉圖像,對光照、姿態(tài)、兩眼像素、年齡、圖像清晰度等要求明顯降低,人們可以不再糾結(jié)選什么算法(視頻人臉識別對算法的要求仍是首位的)。
未來的人臉識別一定是 AI+軟件+硬件,這一點從今年的Google Home 發(fā)布會就可以充分看出來。