馮新淇 譚海濤 王 海 魏 寧
(南京體育學院,江蘇 南京 210000)
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、圖像處理及人工智能等信息技術(shù)的快速發(fā)展,計算機視覺(CV)領(lǐng)域技術(shù)逐漸趨于成熟,作為新興計算機視覺與模式識別交叉領(lǐng)域的生物識別技術(shù)應運而生。所謂生物識別技術(shù),是指通過計算機利用人體所固有的生理特征(指紋、虹膜、臉部、血管等)來進行個人身份鑒定的技術(shù)[1]。人臉識別算法從早期的幾何特征算法發(fā)展到現(xiàn)在的基于深度學習的算法,在大數(shù)據(jù)和神經(jīng)網(wǎng)絡技術(shù)的支持下,識別率接近百分之百。目前,人臉識別技術(shù)在全國各大高校中逐漸普及,用于教室考勤、會議簽到、考試實名驗證、門禁通行等諸多場景中。這種高效便捷且人性化的管理模式提高了管理效率,推動了高校從數(shù)字校園到智慧校園的進步。本文主要利用基于全量數(shù)據(jù)中心和特征值提取的人臉識別門禁平臺架構(gòu),解決南京體育學院兩校區(qū)人員進出通行管理的問題。
校級門禁系統(tǒng)的建設,需要建立以人員數(shù)據(jù)為基礎(chǔ),以門禁管理平臺為核心,依托智能化門禁設備和人臉識別技術(shù)完成“刷臉”通行的一系列建設流程和框架,以實現(xiàn)各類智慧應用和個性化服務。南京體育學院作為一所特殊高校,傳統(tǒng)門禁管理方案無法滿足其動態(tài)、個性化的需求,因此需要構(gòu)建一種新的系統(tǒng)來解決以下幾個問題。
校園門禁系統(tǒng)的建設與使用依賴于基礎(chǔ)數(shù)據(jù)的支撐,人員數(shù)據(jù)作為門禁系統(tǒng)建設的基礎(chǔ),其準確性和完整性至關(guān)重要。建設南京體育學院校園門禁系統(tǒng)所涉及的人員數(shù)據(jù)大致分為以下幾類:人員基礎(chǔ)信息數(shù)據(jù)、人臉數(shù)據(jù)、人員通行規(guī)則數(shù)據(jù)等。根據(jù)部門職能管理通行人員分類如下:教職工、本科生、研究生、運動員、臨時人員、校外訪客。南京體育學院作為體育類院校,信息化基礎(chǔ)薄弱、起步晚,業(yè)務系統(tǒng)建設情況參差不齊,因此一部分人員數(shù)據(jù)分散在各個業(yè)務系統(tǒng)中,軟硬件的壁壘限制了系統(tǒng)之間的數(shù)據(jù)共享,出現(xiàn)了數(shù)據(jù)差異,無法確認權(quán)威數(shù)據(jù)源;另外一部分人員不存在于任何管理系統(tǒng),人員數(shù)據(jù)處于未知的狀態(tài)。另外,根據(jù)目前的人員已知數(shù)據(jù),校內(nèi)普遍存在“一人多身份”的現(xiàn)象,如A既是研究生又是教職工,B既是運動員又是本科生。不同身份人員管理口徑不一致,通行權(quán)限也沒有明確的規(guī)則,給通行策略帶來了極大的不確定性。上述人員數(shù)據(jù)不完整、不準確,“一人多身份”,通行權(quán)限多變性等諸多問題給實現(xiàn)校園全量人員“刷臉”通行帶來了極大的挑戰(zhàn)。
校園門禁系統(tǒng)建設的核心是打造一個校級門禁管理平臺,實現(xiàn)人臉照片采集、多級授權(quán)、數(shù)據(jù)下發(fā)、通行管理等功能。學校部分業(yè)務部門已經(jīng)嘗試建設了局部的人臉識別通道,如何在建設過程中兼容已有的門禁設備,避免重復建設,也成為一個難題。項目啟動后,使用部門根據(jù)實際工作需要提出了針對南京體育學院運動員食堂等特殊場景需求,同時支持根據(jù)學校管理政策變動進行平臺對應功能調(diào)整,支持對接會議簽到、教室考勤點名等應用,對門禁平臺的可擴展性提出了更高的要求。由于人的面部特征具有易采集性,容易被竊取并模仿,可以通過人臉照片攻擊、視頻攻擊、面具攻擊、化妝攻擊或計算機三維建模等手段模擬人臉進行識別,從而威脅用戶財產(chǎn)甚至人身安全。因此,門禁平臺的兼容性、擴展性和安全性成為本次方案設計的重要考慮因素。
為保證門禁平臺的兼容性、擴展性和安全性,并解決目前面臨的人員相關(guān)數(shù)據(jù)問題,本文提出一種基于全量數(shù)據(jù)中心和特征值提取的門禁系統(tǒng)建設方案,整體建設思路與架構(gòu)如圖1所示。該架構(gòu)將源頭業(yè)務系統(tǒng)的人員數(shù)據(jù)與通行規(guī)則數(shù)據(jù)進行整合,以數(shù)據(jù)中臺為依托,匯總梳理全量人員基礎(chǔ)數(shù)據(jù)、通行白名單數(shù)據(jù)、多身份人員數(shù)據(jù),以標準API接口將源頭數(shù)據(jù)對接到門禁管理平臺,門禁平臺向下兼容不同硬件管理平臺與硬件設備,向上通過標準化接口提供多樣化擴展應用服務,并通過人臉提取特征值下發(fā)到終端的方式提升安全性。
圖1 基于全量數(shù)據(jù)中心和特征值提取的門禁系統(tǒng)建設框架
“數(shù)據(jù)中臺”這一概念的首創(chuàng)者是阿里巴巴,它是指以數(shù)據(jù)為中心,對海量數(shù)據(jù)進行采集、計算、存儲、加工,同時統(tǒng)一標準和口徑,并對外提供便捷數(shù)據(jù)服務的一種技術(shù)架構(gòu),能夠?qū)崿F(xiàn)數(shù)據(jù)對于應用業(yè)務的價值[2]。人員數(shù)據(jù)作為門禁系統(tǒng)建設的基礎(chǔ),為保證全量人員數(shù)據(jù)的規(guī)范性和標準性,特制定全校人員的統(tǒng)一編碼規(guī)范和數(shù)據(jù)標準,發(fā)布《南京體育學院人員編碼規(guī)范實施辦法(暫行)》。為保證準確性、完整性、實時性,通過數(shù)據(jù)中臺的數(shù)據(jù)同步接口將人事系統(tǒng)、教務系統(tǒng)和研究生系統(tǒng)等已有系統(tǒng)的教職工和學生基礎(chǔ)數(shù)據(jù)進行集成對接與治理,同時新建運動員管理系統(tǒng)、臨時人員管理系統(tǒng)和訪客系統(tǒng),作為運動員、臨時人員和訪客數(shù)據(jù)的權(quán)威數(shù)據(jù)源頭進行數(shù)據(jù)集成對接,整合來自各個流程平臺的線上、線下的學生請銷假、教職工返校、運動員請假等通行規(guī)則數(shù)據(jù)進行集成對接,最終由數(shù)據(jù)中臺將全量人員的基礎(chǔ)數(shù)據(jù)及權(quán)限推送到門禁平臺中,解決門禁通行中“人員身份”和“人員通行權(quán)限”的問題。
在門禁平臺根據(jù)中臺的人員基礎(chǔ)數(shù)據(jù)和通行白名單數(shù)據(jù)進行權(quán)限下發(fā)時,通常會遇到兩類問題:一是同一個人同一身份的權(quán)限來自不同的通行規(guī)則分組,并且不同分組中的規(guī)則給出的權(quán)限出現(xiàn)沖突時,平臺無法給出準確的通行權(quán)限進行下發(fā)授權(quán);二是同一個人出現(xiàn)多個身份且不同身份的通行權(quán)限出現(xiàn)沖突時,平臺根據(jù)不同身份進行分別授權(quán),最終造成只要有一個身份具有通行權(quán)限,則此人具有“刷臉”進出權(quán)限,不符合校園實際使用場景的管理。
為解決第一個“一人多權(quán)限”問題,門禁平臺在人員授權(quán)功能中設計“多數(shù)據(jù)源計算”模塊。在模塊中自定義教職工組、學生組、運動員組、白名單、黑名單、自定義人員角色分組(如開學白名單、迎新志愿者)等的規(guī)則之間的優(yōu)先級,從而利用不同分組的交集、并集組合計算出最終通行權(quán)限。
為解決第二個“一人多身份”問題,利用全量數(shù)據(jù)中心打造多身份管理平臺。多身份管理平臺對人員姓名、性別、身份證號、人臉照片(特征值)、一卡通賬號等基本屬性字段進行組合,并根據(jù)實際使用場景中的重要程度分配不同的權(quán)重,配置人員身份自動合并的初始化計算公式,如圖2所示。多身份管理平臺可以通過合并多個不同身份的人員賬號識別出唯一的自然人,分配一個新的UID(Unique Identity),而作為原有身份主鍵的學工號無法作為唯一ID識別一個自然人的身份,只能作為自然人的身份屬性數(shù)據(jù)。例如上文中提到的既是研究生又是教職工的自然人A,身份合并后生成唯一的UID作為主鍵,除了姓名、性別、身份證號等原有屬性外,學號、工號、身份類型集合也成為A新的屬性字段。然后利用數(shù)據(jù)中臺將多身份管理平臺人員多身份數(shù)據(jù)表推送到門禁平臺中,結(jié)合人員基礎(chǔ)數(shù)據(jù)和多數(shù)據(jù)源計算模塊進行組合判斷權(quán)限,從而避免因一人多個身份的通行權(quán)限不同而導致最終權(quán)限無法識別或者識別錯誤的現(xiàn)象。
圖2 多身份統(tǒng)一管理平臺
基于數(shù)據(jù)中臺打造全量人員數(shù)據(jù)中心,制定數(shù)據(jù)標準和數(shù)據(jù)規(guī)范,將源頭人員基礎(chǔ)數(shù)據(jù)和通行數(shù)據(jù)進行數(shù)據(jù)集成、清洗和整合,按照統(tǒng)一的數(shù)據(jù)標準和規(guī)范存儲,識別人員多身份信息,多數(shù)據(jù)源組合計算,生成通行白名單,為門禁平臺提供數(shù)據(jù)支撐服務。
人臉識別技術(shù)主要應用于人臉驗證(Face Verification)和人臉身份識別(Face Identification)[3]。人臉驗證用于判定兩張人臉圖像是否屬于同一個人,如門禁系統(tǒng)中的刷身份證模式,依靠人臉驗證技術(shù)證明人證一致。人臉身份識別是用于識別圖像中的人臉身份問題,如校園人臉識別門禁。兩者的本質(zhì)是等同的,且都依賴于高效的人臉特征值提取技術(shù)。特征值提取技術(shù)是指對生物特征進行取樣,提取其唯一的特征,通過計算機將該特征數(shù)字化,轉(zhuǎn)化成數(shù)字代碼,并進一步將這些代碼組合成特征模板。在交互認證時,識別系統(tǒng)獲取生物特征,通過濾波、降噪等處理算法后將該特征形成數(shù)字代碼,與數(shù)據(jù)庫中的特征模板進行比對,以確定是否匹配,從而確定身份,具有很強的安全性和可靠性。而人臉識別的原理是依據(jù)人臉特征,在原始圖像上根據(jù)人臉檢測算法得到人臉區(qū)域,再根據(jù)特征提取算法提取人臉特征,最后根據(jù)這些特征對人臉圖像進行身份識別認證[4]。
深度學習技術(shù)是以數(shù)據(jù)的原始數(shù)據(jù)形態(tài)作為算法輸入,經(jīng)過算法層層抽象,將原始數(shù)據(jù)抽象為特征表示,最后以特征到任務目標的映射作為結(jié)束,無須夾雜任何人為操作。而人臉識別技術(shù)本質(zhì)上是利用深度學習技術(shù)解決圖像特征提取問題[5]。傳統(tǒng)的人臉識別技術(shù)主要通過提取局部的、淺層的特征,如LBP、SIFT等圖像特征描述算子,然后進行多種特征的融合,利用主成分分析法(PCA)降維后再采用傳統(tǒng)的機器學習分類器進行人臉驗證,但是這種特征提取技術(shù)易受人臉圖像的光線、姿態(tài)、表情、年齡、遮蓋等噪聲影響[6]。近些年來,隨著深度學習技術(shù)的迅猛發(fā)展,人臉識別技術(shù)也取得了突破性的進展。目前深度學習能夠提取圖像深層的、抽象的、概念化的特征,與傳統(tǒng)特征描述算子提取的淺層特征相比,能夠從圖像全局的角度提取到人臉最本質(zhì)的特征,對人臉的角度、姿態(tài)、表情、光線、年齡、遮擋、背景等噪聲具有很強的抗噪能力。
基于人臉特征值提取的人臉識別技術(shù)思路,就是將人臉圖像從像素空間映射到另一個空間,并在另一個空間中做相似性計算,這是圖像識別的基本思想[7]。通過變換到另一個空間,相似的人臉圖像會聚到一起,差異性較大的人臉圖像距離會較遠。因為人臉圖像受各種因素的影響,包括角度、姿態(tài)、表情、光線、年齡、遮擋、背景等不同,造成同一個目標人臉圖像在視覺信息上存在很大的差異,這樣的圖像在原像素空間分布中很難用簡單的線或者面區(qū)分開,但是如果變換到另一個空間,就能夠很好地把他們區(qū)分開了。
因此,基于特征值提取的人臉識別技術(shù)的應用,減小了視角、背景、光線、姿態(tài)、表情、年齡、遮蓋等不同因素對人臉識別的影響,極大地提高了人臉識別的準確率,縮短了識別響應時間,提升了系統(tǒng)的安全性。
目前市面上主流的門禁建設廠家大致分為三類:傳統(tǒng)的硬件設備類廠家、人臉識別算法類廠家和門禁軟件產(chǎn)品類廠家。傳統(tǒng)的硬件設備類廠家的平臺管理功能較弱且具有排他性,人臉識別算法類廠家的中心計算模式時間延遲較高、邊緣計算模式終端照片安全性存在風險,門禁軟件產(chǎn)品類廠家無獨立硬件設備且平臺可定制化能力弱。因此,本次項目實施為滿足平臺的兼容性、擴展性和安全性,從硬件設備選擇、軟件功能定制、建設實施過程等多角度著手進行了設計與實現(xiàn),如圖3所示。
圖3 門禁管理平臺設計與實現(xiàn)
2.4.1 兼容性
一是摒棄傳統(tǒng)利用人臉采集設備進行定點拍照采集的方式,本項目部署移動端照片自助采集程序,完成照片的自助采集上傳、合規(guī)性自動校驗、后臺審核等流程后,由門禁平臺根據(jù)不同品牌的終端設備型號進行自動調(diào)整適配。二是向下兼容不同門禁設備廠家的管理平臺與終端設備,目前南京體育學院門禁管理平臺已成功與大多數(shù)主流門禁設備廠家完成管理平臺對接,也可以通過異構(gòu)管理中間件直接對接不同廠家的終端硬件設備,不具有排他性。
2.4.2 擴展性
門禁平臺可通過標準接口,向鑒權(quán)后的第三方應用提供人臉照片調(diào)用服務和AI算力服務。以會議室簽到為例,當會議室人臉識別面板具有計算能力時,門禁平臺可以提供人臉照片調(diào)用服務,將人員基礎(chǔ)數(shù)據(jù)和人臉數(shù)據(jù)提供給第三方,避免重復進行數(shù)據(jù)和人臉采集;當終端面板不具有計算能力時,由門禁平臺提供AI算力服務,終端將照片上傳到平臺,平臺將識別結(jié)果反饋到終端面板。兩種靈活的調(diào)用服務為人臉識別應用建設提供了很強的擴展性。
2.4.3 安全性
為更好地保護校園師生的人臉隱私數(shù)據(jù),保障平臺的安全性,項目在建設實施過程中將門禁設備與校園網(wǎng)所在環(huán)境進行了隔離,做到專網(wǎng)專用。人臉數(shù)據(jù)的安全性在采集、存儲、下發(fā)、調(diào)用、備份等過程中得到了充分的體現(xiàn)。師生可在了解隱私保護協(xié)議并簽署知情同意書后進行自助采集人臉數(shù)據(jù),審核通過后,后臺會對人臉庫照片進行加密存儲、統(tǒng)一管理。門禁平臺通過特征值提取服務器將照片進行特征值提取,然后將特征值通過硬件管理平臺下發(fā)到終端人臉識別設備,避免直接下發(fā)照片帶來的隱私數(shù)據(jù)泄露風險。終端設備采用人臉活體檢測技術(shù),可以有效識別照片攻擊、視頻攻擊、面具攻擊、化妝攻擊等假體攻擊行為[8]。人臉活體檢測技術(shù)旨在判斷系統(tǒng)采集的人臉數(shù)據(jù)是否為真實的人臉,以防止偽造的假體人臉攻擊帶來安全威脅,提升人臉識別安全性[9]。另外,門禁平臺在向第三方提供人臉照片或特征值調(diào)用服務時會進行盲水印處理,做到來源可溯,去向可查。門禁平臺的智能數(shù)據(jù)同步代理(Agent)會與數(shù)據(jù)中臺進行定期數(shù)據(jù)交互,人臉照片和特征值數(shù)據(jù)也會通過數(shù)據(jù)中臺進行備份,實現(xiàn)了人員基 礎(chǔ)數(shù)據(jù)和人臉數(shù)據(jù)可復用,人臉庫照片或特征值丟失后版本可回溯,提高了數(shù)據(jù)安全性。
基于全量數(shù)據(jù)中心和特征值的門禁系統(tǒng)建設在校門進出管理、學生迎新返校等諸多場景得到了應用,推進了學校治理能力的現(xiàn)代化,輔助校園智慧化、精細化管理水平的提升。但是目前該架構(gòu)還存在門禁平臺、硬件管理平臺與終端設備之間的耦合度過高,導致一方出現(xiàn)變動后對其他模塊產(chǎn)生不可預估的影響,從而影響終端人臉識別結(jié)果的問題。因此,該架構(gòu)只有在實際使用的過程中不斷磨合與改進,才能在保證門禁平臺兼容性、擴展性和安全性的基礎(chǔ)上獲得最佳的用戶體驗。