胡先智,陳 浩,梁 艷
(1.西安理工大學 信息化管理處,陜西 西安 710048;2.西安理工大學 計算機科學與工程學院,陜西 西安 710048;3.西安思源學院 理工學院,陜西 西安 710038)
人工智能(AI)[1]是新一代信息通信技術,作為“十四五”時期國家新型基礎設施建設(簡稱新基建)七大核心領域之一[2],“AI+應用”已成為各行業(yè)數(shù)字化的重要驅(qū)動。在這一新模式新業(yè)態(tài)下,高校積極開展人臉、虹膜、指紋、掌紋等人體多模態(tài)生物特征融合技術的研發(fā)與應用,圍繞教學、消費、安防、圖書、醫(yī)療、會議、考勤控等場景進行人機交互和身份認證,將大數(shù)據(jù)與多模態(tài)生物特征識別技術相結合,形成海量多模態(tài)生物特征信息[3-4]。然而,生物特征識別技術的推廣應用也產(chǎn)生一定的負面影響,尤其對師生隱私信息泄露帶來前所未有的風險挑戰(zhàn)。新冠疫情發(fā)生以來,多模態(tài)生物特征信息泄露和技術濫用等造成的信息安全問題突出,引起了國家重視。其中,將“建設安全便捷的智能社會和更高水平的平安中國”列為其重要任務之一。因此,針對高校智慧校園多模態(tài)生物特征信息安全防護問題,為加強其安全風險防范和管理能力,提出構建高校多模態(tài)生物特征信息安全防護體系,為高校、社會等提供信息安全防護參考。
隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能技術的發(fā)展,師生可方便地利用多模態(tài)生物特征信息實現(xiàn)身份識別驗證與移動互聯(lián)支付等服務,但此類識別信息的收集與頻繁共享應用[5-6],卻面臨著較大的安全問題。
(1)網(wǎng)絡安全防護技術手段不夠。網(wǎng)絡安全防護大多從多模態(tài)生物特征識別系統(tǒng)防護角度進行信息保護,缺乏邊界、業(yè)務、運維等綜合整體安全防護[7],信息隱私泄露面臨巨大挑戰(zhàn)。
(2)應用安全管理不到位。作為高敏感性的生物特征識別信息,由于應用管理機制不健全,產(chǎn)生信息泄露和被人盜取的風險。
(3)數(shù)據(jù)安全管理不足。部分高校對其安全治理需求不夠明確、尚未制定數(shù)據(jù)管理和安全相關戰(zhàn)略規(guī)劃,信息主庫面臨被外界攻擊及自身重視不力導致信息泄露的風險。
(4)基礎設施不完善,存在物理安全漏洞,導致信息篡改、竊取等風險。
多模態(tài)生物特征信息泄露,導致身份信息被盜用、篡改、竊取,行蹤被記錄、財產(chǎn)損失等安全風險,造成比較嚴重的影響,其安全風險表現(xiàn)在四個方面:
(1)多模態(tài)生物特征識別平臺的共享、融合引發(fā)信息泄露風險。隨著多模態(tài)生物特征信息采集系統(tǒng)應用,原本分散存儲的個人相關信息逐漸向平臺統(tǒng)一匯合,形成數(shù)據(jù)的“黑匣子”[8],易成為黑客、不法分子的攻擊對象。
(2)多模態(tài)生物特征識別平臺的漏洞造成信息泄露風險。多模態(tài)生物特征識別平臺存在漏洞未修復、端口開放等問題,會導致信息數(shù)據(jù)泄露、篡改、竊取等風險。
(3)多模態(tài)生物特征識別平臺的互聯(lián)互通帶來信息泄露風險。
(4)多模態(tài)生物特征識別平臺利用大數(shù)據(jù)、人工智能、與計算、物聯(lián)網(wǎng)等新技術帶來了信息泄露風險。
在人工智能背景下,高校多模態(tài)生物特征信息種類和形態(tài)呈現(xiàn)多樣化,傳統(tǒng)信息安全標準等難以維持多模態(tài)生物特征信息安全工作的開展[9]。因此,結合當前多模態(tài)生物特征信息實際應用要求和安全風險分析,以及安全防護的問題與難點,以信息系統(tǒng)安全等級保護2.0為指導標準,從基礎設施安全、網(wǎng)絡安全、數(shù)據(jù)安全、應用安全四類防護層面,提出多模態(tài)生物特征信息防護架構,如圖1所示。結合信息安全防護內(nèi)容,從統(tǒng)一的安全管理中心、信息安全運行體系等方面實現(xiàn)多模態(tài)生物特征信息安全防護措施。
圖1 多模態(tài)生物特征信息防護架構
本架構結合多模態(tài)生物特征信息安全管理和技術要求,從基礎設施、網(wǎng)絡、數(shù)據(jù)及應用等方面提出安全防護措施。重點根據(jù)不同類別,有針對性地提出多模態(tài)生物特征信息分類防護措施,解決各類信息差異化的防護問題。本架構利用“人防物防技防協(xié)防融合、因勢利導、分類治理、分級管理”的綜合防護思路,旨在解決不同類別、級別的多模態(tài)生物特征信息防護問題。
(1)人防、物防、技防、協(xié)防融合,實現(xiàn)四位一體安全防護。
(2)因勢利導。按照“兩地三中心、無感應用”容災備份模式,既關注本地信息保護,也重視異地信息采集、傳輸、遷移、交換共享與公開披露等全流程安全防護。
(3)分類治理。根據(jù)多模態(tài)生物特征信息的需求及應用場景的不同,重點對敏感數(shù)據(jù)、重要數(shù)據(jù)、一般數(shù)據(jù)進行分類的信息安全防護[10],有針對性地提出多模態(tài)生物特征信息分類治理、多重保障,確保師生信息安全、穩(wěn)定。
(4)分級管理。圍繞多模態(tài)生物特征信息全生命周期,明確差異化的多模態(tài)生物特征信息分級安全防護要求。
從物理安全、主機安全兩方面實現(xiàn)多模態(tài)生物特征信息的基礎設施安全防護,明確多模態(tài)生物特征信息物理安全要求,并從系統(tǒng)安全防護的角度實施主機安全防護。
3.1.1 物理安全
(1)機房及基礎設施管理。妥善選擇機房地址,合理劃分機房物理區(qū)域,并從使用空間、容量等方面科學布置基礎設施,滿足基礎設施擴容需求,防范物理和環(huán)境潛在風險和非授權訪問[11]。制定安全管理制度流程與規(guī)范,設立安全管理部門,明確關鍵管理人員,在運維中嚴格推動訪問控制、監(jiān)控審計、應急響應等措施落地,及時整改消除重要數(shù)據(jù)泄露、濫用等安全隱患,以確保多模態(tài)生物特征信息的物理環(huán)境安全。
(2)網(wǎng)絡設備安全管理。結合多模態(tài)生物識別業(yè)務和安全狀態(tài)需求,合理選擇網(wǎng)絡設備資源,同時對網(wǎng)絡設備訪問、協(xié)議和服務、日志、配置、軟件版本升級等進行安全管理,保障設備安全。
(3)安全設備管理。由于多模態(tài)生物特征信息基礎設施接入前后需要進行安全審核,因此,在進行成本/效益分析的基礎上,通過部署堡壘機、下一代安全網(wǎng)關、虛擬化防火墻、安全態(tài)勢感知設備、數(shù)據(jù)庫審計系統(tǒng)、日志審計系統(tǒng)等安全設備,合理劃分網(wǎng)絡設備安全防護邊界和安全區(qū)域,實現(xiàn)縱深防御、區(qū)域訪問控制和有效安全隔離,消除多模態(tài)生物特征信息面臨的各種風險。
3.1.2 主機安全
多模態(tài)生物特征識別利用機器學習為用戶、主機帶來大量的數(shù)據(jù),需要嚴格地控制對關鍵主機、端口和服務的訪問,替換服務器標識,隱藏內(nèi)部網(wǎng)絡結構,阻止 DoS攻擊和網(wǎng)絡掃描,實現(xiàn)主機在數(shù)據(jù)存儲和處理的保密性、完整性、可用性,幫助高校構建主機在資產(chǎn)管理、文件查殺、入侵檢測、漏洞掃描、安全基線、攻擊監(jiān)測等方面安全防護體系。
多模態(tài)生物特征信息網(wǎng)絡安全防護包括區(qū)域安全、網(wǎng)絡層安全。按安全等級保護和國密要求,安全區(qū)域內(nèi)的節(jié)點采用相同的安全等級和信任關系。安全網(wǎng)絡層承載安全隔離、接入控制和邊界防護,嚴格執(zhí)行相應的管控措施,進行攻防測試,確保多模態(tài)生物特征信息網(wǎng)絡安全防護。
(1)架構安全。采取合理架構,利用信息網(wǎng)絡安全傳輸策略,明確劃分多模態(tài)生物特征信息網(wǎng)絡邊界和區(qū)域。
(2)訪問管控。采用下一代安全網(wǎng)關、虛擬化防火墻、安全態(tài)勢感知設備,實現(xiàn)橫向縱向防護與安全隔離,確保多模態(tài)生物特征信息網(wǎng)絡流量訪問安全。同時,設定管理員和普通用戶的權限,對信息訪問形成日志記錄。
(3)邊界防護。對物理網(wǎng)絡和虛擬網(wǎng)絡、物理主機與虛擬機進行邊界區(qū)域安全隔離、入侵監(jiān)測。同時,建立多模態(tài)生物特征信息邊界立法及懲罰機制。在非授權的情況下,對違規(guī)使用生物特征識別信息的用戶進行懲戒。
(4)傳輸加密。利用信息加密、隱藏、水印等技術實現(xiàn)多模態(tài)生物特征信息主機、虛擬機間的保密傳輸[12],防止傳輸信息被盜取、修改等。另外,針對第三方開放應用,通過注冊認證、引擎調(diào)用口令密鑰的方式,確保多模態(tài)生物特征信息授權傳輸。
(5)網(wǎng)絡監(jiān)控。采取網(wǎng)絡態(tài)勢感知、日志審計等技術對多模態(tài)生物特征信息網(wǎng)絡的運行狀態(tài)、流量等進行監(jiān)控,消除多模態(tài)生物特征信息面臨的網(wǎng)絡問題。
多模態(tài)生物特征信息數(shù)據(jù)安全防護圍繞管理數(shù)據(jù)、業(yè)務數(shù)據(jù)、用戶鑒別信息[13-14],重點針對不同類別的多模態(tài)生物特征信息數(shù)據(jù)特征和安全防護需求,保證租戶對多模態(tài)生物特征信息數(shù)據(jù)的隱私權、所有權和控制權不受侵犯,為用戶提供最切實有效的數(shù)據(jù)保護。同時,多模態(tài)生物特征信息數(shù)據(jù)安全保護在數(shù)據(jù)分類的基礎上,圍繞同一類數(shù)據(jù)全生命周期,標記數(shù)據(jù),建立數(shù)據(jù)資產(chǎn)分級清單,按照數(shù)據(jù)級別確定安全管理策略和防護措施,明確差異化的數(shù)據(jù)分級安全防護要求,如圖2所示。
圖2 多模態(tài)生物特征信息分類分級治理防護
(1)管理數(shù)據(jù)防護。管理數(shù)據(jù)包括人員組織架構、多模態(tài)生物信息、運維、供應鏈等非結構化文檔數(shù)據(jù)。其中,管理數(shù)據(jù)在傳輸、交換共享等方面需求大且保密性、完整性要求相對較高。因此,采用數(shù)據(jù)脫敏、數(shù)據(jù)水印、數(shù)據(jù)二維碼、信息隱藏、身份識別、訪問控制等措施實現(xiàn)管理數(shù)據(jù)安全防護。
(2)業(yè)務數(shù)據(jù)防護。業(yè)務數(shù)據(jù)包括消費、門禁、考勤、圖書、醫(yī)療、會議等場景數(shù)據(jù),主要是多模態(tài)生物特征信息、文檔、時序數(shù)據(jù)、關系表數(shù)據(jù)等結構化與半結構化數(shù)據(jù),涉及多模態(tài)生物特征信息服務平臺核心內(nèi)容,其保密性和可靠性要求相對較高。因此,為了保護多模態(tài)生物特征識別業(yè)務數(shù)據(jù)在采集、傳輸、比對等環(huán)節(jié)不被泄露、篡改和非授權分析,可通過操作權限管理、接口認證、不可逆轉(zhuǎn)譯成圖像、數(shù)據(jù)加密、數(shù)字水印、虛擬專用網(wǎng)絡、安全審計、冗余備份等措施,保障業(yè)務數(shù)據(jù)的有效性、可用性、安全性。
(3)用戶鑒別信息防護。用戶鑒別信息是通過用戶/系統(tǒng)身份建立的一項信任,使用鑒別令牌、基于證書的鑒別、生物方式鑒別、認證加密或數(shù)位簽章實現(xiàn)信息鑒定。結合多模態(tài)生物特征用戶鑒別信息完整性的安全防護要求,采用簽名等技術,防止對方破解信息;采用基于共享密鑰、生物學特征、公開密鑰等身份驗證,防止偽用戶竊取信息;通過對消息進行加密,實現(xiàn)信息鑒別碼的保密認證,確保數(shù)據(jù)可用性,提高用戶隱私保護和信息傳輸安全能力。
為此設計了用戶鑒別信息隱私保護,如圖3所示。針對各種生物特征識別技術,部署算法引擎池,將各商家、算法引擎進行集中注冊和統(tǒng)一管理;采集各類生物特征信息,并建立多個特征庫的管理器,與前端應用、智能終端建立起多對多映射,按需推送相關的生物特征供前端使用,確保原始信息不被傳遞到前端,防止用戶鑒別信息隱私泄露。
圖3 用戶鑒別信息隱私防護
(4)全面生命周期防護。多模態(tài)生物特征信息安全治理包含管理、運維、風險管控、技術支撐、標準化等一系列內(nèi)容,是高校教育信息化發(fā)展到一定程度,利用已有數(shù)據(jù)推動各項業(yè)務進入一種新的數(shù)據(jù)治理形態(tài)。但在現(xiàn)有體系下全生命周期的多模態(tài)生物特征信息采集、傳輸、存儲、處理、交換共享、銷毀等階段存在安全風險,需要進行安全防護,如表1所示。
表1 多模態(tài)生物特征信息全生命周期防護
針對多模態(tài)生物特征信息鑒別、控制、審計、保護等應用安全,可部署防護墻、網(wǎng)閘、定制邊界安全防護設備,對多模態(tài)生物特征信息的訪問權限進行精細化劃分,設定不同權限等級,實現(xiàn)安全訪問控制,從而防止越權訪問和各功能區(qū)間的病毒感染;可設立多模態(tài)生物特征信息身份認證管理機制,對關鍵平臺、設備,根據(jù)信息重要程度,采用單因子或多因子認證方式;還可為每條數(shù)據(jù)賦予可信時間戳,利用區(qū)塊鏈技術防偽溯源,避免對信息篡改、竊取,保障身份認證合規(guī)性,通過管控越權來降低信息違規(guī)訪問風險[15-18]。
另外,加強關鍵網(wǎng)絡節(jié)點、攻擊行為、異常流量、信息有效性等方面檢測,加強操作系統(tǒng)安全防護,同時部署安全審計系統(tǒng),對內(nèi)網(wǎng)訪問互聯(lián)網(wǎng)行為內(nèi)容進行審計和監(jiān)控,可有效抵御外部攻擊、內(nèi)部人員私自調(diào)整賬號權限等行為。
結合該文構建的多模態(tài)生物特征信息安全防護框架,利用管理數(shù)據(jù)防護、業(yè)務數(shù)據(jù)防護、用戶鑒別信息防護、分類分級全生命周期信息防護策略與技術,實施部署多模態(tài)生物特征信息平臺如下:
硬件方面:GPU服務器(2顆英特爾至強銀牌5218處理器,256 GB 內(nèi)存,8塊1200 GB-SAS 12 Gb/s -10K rpm硬盤;4塊480G SSD硬盤,1塊NVIDIA-Tesla T4-16 GB GPU卡)。
軟件方面:Oracle 11g。
安全方面:利用SDK和特征值進行數(shù)據(jù)隱私保護;整個平臺部署云環(huán)境,通過“IP + MAC + 端口”的方式,限定可訪問后臺的終端設備。借助賬戶密碼、生物特征、二維碼、移動設備進行多因素認證;調(diào)用密鑰、數(shù)據(jù)隔離、多級授權等進行應用控制??紤]到對第三方開放共享應用,通過引擎調(diào)用口令密鑰的方式,確保合規(guī)授權。
傳輸方面:通過https進行傳輸加密。
數(shù)據(jù)備份與容災:通過Lustre和Oracle分別進行特征數(shù)據(jù)存儲,并實現(xiàn)主備存儲。
根據(jù)多模態(tài)生物特征信息平臺部署情況以及多模態(tài)生物特征信息安全防護體系架構,對師生提供的信息進行驗證和比對,同時,在不了解師生信息的情況下利用生物特征在數(shù)據(jù)庫中進行搜索其身份,從而驗證信息防護策略的應用效果。
由于區(qū)域教育發(fā)展水平不同和經(jīng)濟水平的限制,各高校多模態(tài)生物特征信息應用側(cè)重點有所不同。截止2021年3月,對高校多模態(tài)生物特征信息應用及安全防護情況進行統(tǒng)計和驗證其應用,選取了中國東部、西部、南部、北部、中部60余所高校進行了統(tǒng)計,其中世界一流大學15所,世界一流學科高校15所,非一流本科高校15所,高職院校15所,統(tǒng)計見表2。
表2 多模態(tài)生物特征信息應用及安全防護情況統(tǒng)計
從表2中可以看出,國內(nèi)高校多模態(tài)生物特征信息應用及安全防護情況:世界一流大學應用技術及安全防護走在前列, 世界一流學科高校應用技術次之,高職院校應用技術相對較弱。下面從三方面進行效果分析。
(1)應用驗證。
表2中,大部分高校利用人臉信息進行身份識別,但各高校采用文中的信息防護策略和技術也不盡相同,其中14所世界一流大學、11所世界一流學科高校比較重視信息系統(tǒng)安全等級防護,人臉特征信息沒有泄露和篡改發(fā)生,但有4所非一流本科高校、高職院校存在局部信息泄露隱患。
(2)共享與開放。
表2所統(tǒng)計高校中已建多模態(tài)生物特征信息平臺不到50%,其開放不足限制了業(yè)務場景應用。另外,由于多模態(tài)生物特征信息平臺缺乏規(guī)范性和統(tǒng)籌性,導致信息資源冗余和分散,難以形成合力應用環(huán)境。另外,部分學校在信息共享方面,通過APP接口,直接傳輸人臉照片,而不是特征值或者加密水印信息,導致信息泄露或者篡改,無法進行追蹤分析。
(3)安全防護。
結合該文所設計的多模態(tài)生物特征信息安全防護體系,針對表2中四類高校,對比分析多模態(tài)生物特征信息應用的安全防護問題,12所世界一流大學在基礎設施安全、網(wǎng)絡安全、數(shù)據(jù)安全、應用安全四類及全生命周期防護層面認識程度高,建設投入力度大,所面臨的網(wǎng)絡病毒縱向橫向攻擊、黑客攻擊、信息篡改、信息泄密等安全問題基本沒有,而6所世界一流學科高校、非一流高校所面臨的安全問題,2所高職院校由于資金投入有限,重視程度不夠,所面臨的安全問題比較嚴峻,甚至影響多模態(tài)生物特征信息的應用與推廣。
對多模態(tài)生物特征信息安全問題與風險進行了剖析,總結分析了當前多模態(tài)生物特征信息安全防護存在的問題和安全風險。針對多模態(tài)生物特征信息安全問題與風險,設計了從基礎設施安全、網(wǎng)絡安全、數(shù)據(jù)安全、應用安全四類防護層面構建多模態(tài)生物特征信息安全防護框架,將管理數(shù)據(jù)、業(yè)務數(shù)據(jù)、用戶鑒別信息、分類分級全生命周期信息防護策略與技術相結合,解決不同層次的安全問題,為高校智慧教育信息化建設提供參考和實踐指導。下一步,將進行多模態(tài)生物特征融合防假體攻擊技術方面的研究。