□ 文/本刊記者 何遙
相比以往的人臉識別,深度學習算法推動的人臉識別發(fā)生了巨大變化:準確率更高,環(huán)境適應性更強,識別種類更豐富。包括人臉識別技術在內的生物識別技術的進步,結合紅外光、可見光技術,推動主動安防時代的到來。本期欄目邀請到生物識別領域的幾位專家,共同探討這一主題。
本期嘉賓:
北京智慧眼科技股份有限公司董事長 邱建華
廣州像素數(shù)據(jù)技術股份有限公司董事長 姚若光
深圳市威富安防有限公司算法工程師 梁先揚
人工智能中深度學習算法的突破,使得生物識別技術極大地提高了識別率。反過來,多年積累起的海量數(shù)據(jù),為深度學習訓練提供了燃料。公共安全中的人臉識別產品與應用迎來一個新的發(fā)展期。
邱建華:智慧眼人臉識別技術采用先進的計算機視覺和機器學習技術,對輸入的圖像/視頻進行分析,找到圖像/視頻中存在的人臉,并在器官特征點定位的基礎上,對人臉進行幾何和光照歸一化,進而提取人臉的鑒別特征,并將其與已知人臉進行對比,從而識別每個人的身份。
基于千萬級人臉圖片大數(shù)據(jù)深度學習的智慧眼人臉識別算法、活體檢測算法在業(yè)內POC測試中位列前三,已獲得國家專利,現(xiàn)已廣泛應用于人社、金融、教育、安防、衛(wèi)生等領域,為1億用戶提供身份認證服務。
邱建華
姚若光
梁先揚
智能終端——人證合一智能終端。人證合一實名制已成為我國公民在辦理很多業(yè)務時的硬性要求。智慧眼開發(fā)出來的人證核驗設備品類豐富、應用廣泛。設備主要包括桌面式人證合一設備、手持式警務通設備、單雙屏人證核驗訪客機及高端的智能閘機終端。每一類設備都針對特定場合開發(fā),目前在網(wǎng)吧、酒店、寫字樓、政府部門、治安卡口、邊防檢查站等場合都有廣泛應用。
靜脈識別——指靜脈識別。智慧眼指靜脈識別算法在2015/2016/2017全球指靜脈挑戰(zhàn)賽上連續(xù)三次奪得冠軍,無論是識別精度還是識別速度都處于行業(yè)領先地位。安博會上智慧眼展出了基于指靜脈技術開發(fā)出來的指靜脈智能門鎖、指靜脈考勤門禁終端、指靜脈采集儀以及備受關注的指靜脈精密模塊。以便有項目需求的客戶可以在現(xiàn)場找到適合自己的指靜脈產品;有指靜脈產品開發(fā)需求的客戶則可以選擇到多款適合的指靜脈精密模塊。
身份認證——人臉識別超大規(guī)模應用。智慧眼在今年的深圳安博會上展示了在身份認證大數(shù)據(jù)方面的成果,尤其是在全國社保身份認證方面。智慧眼的身份認證業(yè)務目前已服務超過2億人,協(xié)助人社部門完成近7億生物特征庫的建設,是目前國內最大規(guī)模的人臉識別應用;同時,智慧眼也展示了另外一個榮獲國家發(fā)改委互聯(lián)網(wǎng)+重大工程支持項目——老來網(wǎng),這是全國為數(shù)不多的官方認證的第三方身份認證機構,是智慧眼借助人社業(yè)務優(yōu)勢,借助互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)技術優(yōu)勢,傾力打造的老年人社會化服務云平臺。
梁先揚:智能視頻分析的瓶頸:智能視頻分析依賴于高清視頻、大數(shù)據(jù)及高性能服務器。首先是更新?lián)Q代相對滯后:在一線城市深圳仍有不少攝像機分辨率在1080p以下,甚至還有模擬攝像機。其他二三線城市更加滯后。其次是聯(lián)網(wǎng)管理不夠集中統(tǒng)一,形成信息孤島:工業(yè)園、商場、小區(qū)的監(jiān)控自成一體,與公安市政道路監(jiān)控無法共享信息,存在漏洞。再次還有成本問題:架設光纖、更換高清攝像機、配置智能分析服務器成本相對較高,存在小區(qū)業(yè)主不愿分擔升級費用,基層派出所建設經費有限等問題。需自上而下建設推廣。
智能視頻分析的機遇:國家基于長治久安、和諧發(fā)展對智慧平安城市建設的重視:習近平總書記在十九大報告指出建設平安中國,加強和創(chuàng)新社會治理,維護社會和諧穩(wěn)定,確保國家長治久安,人民安居樂業(yè)。
隨著社會各界對智能視頻分析,特別是人臉識別技術認識的加深,人臉考勤門禁、人臉鎖、刷臉支付、無人超市、無人餐廳越來越普遍。
硬件的快速發(fā)展,GPU運算能力提升,成本下降。英偉達陸續(xù)推出嵌入式GPU TX1、TX2,谷歌、蘋果、三星、英特爾、ARM等公司也在研發(fā)GPU芯片。這為人臉識別提供了技術基礎。
人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關技術,通常也叫做人像識別、面部識別。與其他生物識別技術(如指紋、虹膜、掌紋等)相比,優(yōu)勢在于其自然性和不被人察覺的特點。
姚若光:像素數(shù)據(jù)自1998年成立以來,一直專注于人像采集檢測、人臉識別技術的研究,形成了完善的人臉識別產品體系及應用典范,逐步成為行業(yè)標準制定者,主編及參與了近十項行業(yè)標準的制定。主要針對已發(fā)布或即將發(fā)布的人臉識別技術相關的標準闡述了我司各類人臉識別產品及應用在貫徹安防標準方面取得的研究成果,從研究的底層出發(fā)得出:基于規(guī)范、標準化的人臉圖像采集、準確的人臉圖像檢測和提取、好的人臉比對算法、成就良好的人臉識別體驗。
談人臉識別,首先有一些基礎的技術特點。
構成人臉識別的5步:抓取圖像;在圖像中找到臉;提取特征(建模板);比較模板;宣布比對結果。人像采集與檢測產品及其關鍵點的源頭在采集,好圖像時拍出來的,不是修出來的。人臉圖像處理的四個屬性:圖像屬性;位置屬性;臉部屬性;背景屬性。處理要求:提倡全局處理;反對局部處理;慎用銳化或美化工具:過渡處理會改變人臉圖像的紋理結構。背景處理的關鍵在于邊緣處理,特別是頭發(fā)和臉和服飾的邊緣。
人臉辨認方面,我們推出了自助庫—多算法。多算法平臺除了算法有針對性,還有針對性地建立了各種案件庫。如電白、廉江、湖南邵陽等犯案集中地區(qū)的案件庫,為各警種辦案提供了有力的比對工具。該項目運行以來,得到了各警種的好評,在實戰(zhàn)中也出了較好的成效,特別是在占案例大頭的經濟詐騙案、信用卡詐騙案中有較為突出的效果。
視頻人臉識別涉及到算法的選擇、攝像機及鏡頭選擇與架設。視頻人臉識別方面我們有一系列的產品方案:
(1)動態(tài)人臉識別監(jiān)控分析系統(tǒng):
對監(jiān)獄、機場、港口、銀行;交通、運輸;商場、大型超市;金融VIP等重要地點進行的機動布控。
(2)海量錄像人臉分析系統(tǒng):
支持多路錄像同時進行人臉分析,單個主流服務器可支持32路以上人臉采集,8路以上人臉識別分析,具備強大的擴展性(具體的支持路數(shù)由服務器性能決定)。
(3)人臉識別安防機器人:
在機場、港口、會場、展館、機場、火車站、汽車站等巡邏布控,在高端小區(qū)和工業(yè)園區(qū)等日常巡邏、警戒和布控。
(4)網(wǎng)格化中心布控(centralized deployment):
我們已成功實施了廣東某火車站人臉識別布控項目,某地鐵站人像抓拍識別租賃項目,某公安布控區(qū)域布控項目,某大型公園人臉識別布控項目,等等。
(5)基于人臉的人員軌跡分析—去中心化布控。
(6)訪客/迎賓機。
從技術上而言,規(guī)范的人臉圖像采集、準確的人臉圖像檢測和提取,加上好的人臉比對算法,成就良好的人臉識別體驗。
深度學習、紅外光結構化等技術融合發(fā)展,讓安防更智能、更適應各種不同場景。需要人工查找分析的傳統(tǒng)安防時代正在褪卻,取而代之的是一個主動安防的時代?!叭斯ぶ悄?軟硬件一體化”成為趨勢。
梁先揚:人臉識別的發(fā)展必然會經歷兩個時代:(1)模型驅動時代,重在研究各種復雜的數(shù)學模型,利用有限的樣本進行學習,模型的好壞直接決定識別效果,局限性較大,泛化能力較弱;(2)數(shù)據(jù)驅動時代,直接基于人工神經網(wǎng)絡的模型,利用大數(shù)據(jù)進行深度學習,數(shù)據(jù)的重要性超過了模型本身,具有很強的泛化能力。
這兩種驅動具有不同的研究范式。
模型驅動:
數(shù)據(jù)驅動:
模型驅動VS數(shù)據(jù)驅動
人工神經網(wǎng)絡(ANN)系統(tǒng)是20世紀40年代后出現(xiàn)。1990年起,王守覺院士開始神經網(wǎng)絡模式識別新理論新技術的研究,2002年取得突破性進展,提出了“高維形象幾何仿生信息學”新理論。該理論不斷豐富和完善,獲得了13位院士極高評價和聯(lián)名推薦。
威富安防人臉識別技術創(chuàng)造了超低數(shù)據(jù)量人臉識別技術 ,全球首創(chuàng)且唯一,將人臉特征有效表達為48字節(jié),存儲超低、傳輸更快、比對更快、準確率高,可實現(xiàn)超小載體存儲、超大范圍應用。
這種人臉識別技術采用高維形象幾何仿生信息學算法突破了環(huán)境的局限。在環(huán)境采集方面,新技術在動態(tài)識別的過程中可以逐步將人的表情、姿態(tài)、光線、遮擋等干擾信息進行排除,得到一張更準確表現(xiàn)個人信息的照片,從而提升比對的成功率。
對于人臉化妝、遮擋,新技術在提取人臉特征的時候,并不是基于每一個點的精確匹配,而是將人臉分成不同區(qū)域對其特征進行計算,因此小范圍局部遮擋(戴眼鏡或口罩)將不作為比對的內容,而是選擇匹配最高的區(qū)域進行綜合比對,所以對比對效果不會產生太大影響。
對應于兩種驅動模式,安防的兩個時代分別是被動安防與主動安防。
(1)被動安防:人眼“觀看監(jiān)控器20分鐘,人的集中力及判斷力將會下降”;人眼“觀看監(jiān)控器30分鐘以上,將會放棄畫面變動的80%以上”;事后查看錄像回放,時效性差,無法對各種犯罪活動形成有力打擊;人工無法完成大量的實時監(jiān)控,即使是細心的注意力集中的監(jiān)控人員,也不能有效完成監(jiān)控任務。
(2)主動安防:機器自動實時進行大數(shù)據(jù)分析,自動跟黑名單進行人臉比對,7*24小時不間斷;實現(xiàn)低投入產生高效率,使視頻監(jiān)控網(wǎng)絡系統(tǒng)真正成為“火眼金睛”,向科技要警力,使現(xiàn)有的警力提高20倍以上;變事后分析為事前預警,變被動安防為主動安防,極大提高犯罪威懾力。
人臉識別技術的發(fā)展開啟了主動安防時代!
姚若光:傳統(tǒng)的人臉識別發(fā)展走過了一條漫長的路。最終達到的水平是在正臉、光照均勻、無遮擋、兩眼像素60pixels圖像的情況下95%@with FAT@2‰左右(FRVT 2013);用戶的總體體驗是對圖像的要求比較高,需要用戶高度配合,應用面比較窄。
AI使人臉識別一步踏入用戶可接受的門檻。開源的AI算法訓練平臺:通過適當?shù)臄?shù)據(jù)訓練,可達到應用要求,現(xiàn)在的競爭是在萬、十萬、百萬之一錯誤識別率下的正確識別率/錯誤拒絕率,互聯(lián)網(wǎng)存在的海量人臉圖像,對光照、姿態(tài)、兩眼像素、年齡、圖像清晰度等要求明顯降低,人們可以不再糾結選什么算法(視頻人臉識別對算法的要求仍是首位的)。
未來的人臉識別一定是 AI+軟件+硬件,這一點從今年的Google Home 發(fā)布會就可以充分看出來。