王志芳, 甄佳奇, 朱福珍, 宋建華
(黑龍江大學(xué)電子工程學(xué)院, 黑龍江 哈爾濱 150080)
隨著信息技術(shù)的快速發(fā)展,人們進(jìn)入了數(shù)字化和網(wǎng)絡(luò)化的時(shí)代,個(gè)人身份信息也隨之?dāng)?shù)字化和隱性化[1]。個(gè)人身份信息越來越多的關(guān)系到個(gè)人隱私、財(cái)產(chǎn)安全與社會(huì)的公平和秩序,因此快速、準(zhǔn)確、安全地在數(shù)字化環(huán)境中進(jìn)行個(gè)人身份識(shí)別與驗(yàn)證成為信息安全領(lǐng)域研究熱點(diǎn)之一,具有重要的理論意義和實(shí)用價(jià)值[2-3]。傳統(tǒng)身份認(rèn)證方式無法實(shí)現(xiàn)身份標(biāo)志信息或物品與用戶本人的唯一關(guān)聯(lián)性和不可分離性,而生物識(shí)別技術(shù)將人體生物特征作為身份標(biāo)志,兼顧了系統(tǒng)安全和用戶體驗(yàn),因此在信息安全等領(lǐng)域受到了廣泛關(guān)注。隨著生物識(shí)別技術(shù)在各個(gè)領(lǐng)域的廣泛應(yīng)用,單模態(tài)生物識(shí)別暴露了諸多問題,而多模態(tài)生物識(shí)別技術(shù)具有更優(yōu)的適用性、安全性和可靠性,成為目前生物識(shí)別技術(shù)發(fā)展的趨勢(shì)[4],也為信息安全應(yīng)用系統(tǒng)提供了更加安全和可靠的身份認(rèn)證方案。
根據(jù)融合發(fā)生的階段不同,多模態(tài)生物識(shí)別方法具體劃分為4個(gè)層次,分別為像素層、特征層、分?jǐn)?shù)層和決策層[5]。相比像素層融合,特征層融合實(shí)現(xiàn)了信息的客觀壓縮,規(guī)避了大量數(shù)據(jù)的計(jì)算,有利于實(shí)時(shí)處理;而分?jǐn)?shù)層和決策層就是將多個(gè)匹配分?jǐn)?shù)和決策按照某種規(guī)則進(jìn)行融合綜合判斷給出最終的結(jié)論。而融合的匹配分?jǐn)?shù)和決策均來自單模態(tài)生物識(shí)別系統(tǒng),這使得分?jǐn)?shù)層和決策層的性能依賴于單模態(tài)生物識(shí)別系統(tǒng),提升系統(tǒng)性能的空間有限[6-7]。而特征層融合提取決策分析所需的最大區(qū)分性類別信息,在理論上可得到最優(yōu)識(shí)別效果。因此,特征層融合算法是多模態(tài)生物識(shí)別技術(shù)中一個(gè)潛力很大的研究方向,相關(guān)文獻(xiàn)也陸續(xù)出現(xiàn)[6-8]。
目前,關(guān)注多模態(tài)生物識(shí)別技術(shù)安全問題的研究者并不多,僅有的少數(shù)文獻(xiàn)提及也是與單模態(tài)生物識(shí)別技術(shù)相同的通識(shí)問題,而關(guān)于特征層多模態(tài)生物識(shí)別安全問題的研究更鮮有出現(xiàn)。目前,特征層多模態(tài)生物識(shí)別技術(shù)多以雙模態(tài)生物識(shí)別算法為主。本文從雙特征入手,將入侵容忍的概念引入到特征層雙模態(tài)生物識(shí)別技術(shù)的安全評(píng)測(cè)中。對(duì)于一個(gè)系統(tǒng)來說,入侵是在沒有授權(quán)的情況下,對(duì)系統(tǒng)資源進(jìn)行存取、處理或破壞以使系統(tǒng)不可靠、不可用的故意行為[9]。從特征的角度來考慮,對(duì)于單模態(tài)生物識(shí)別來說,入侵行為就是竊取或偽造生物特征,這意味著該特征已經(jīng)泄露,攻擊者可以利用該特征進(jìn)入系統(tǒng)獲取所要的信息,系統(tǒng)安全和用戶隱私將無法保障[10-12]。對(duì)于雙模態(tài)生物識(shí)別技術(shù)來說,當(dāng)所有模態(tài)的特征泄露時(shí)與單模態(tài)生物識(shí)別相同,攻擊者就可以合法地進(jìn)入系統(tǒng)。但雙模態(tài)生物識(shí)別還存在另一種情況,只是一種生物特征泄露,也就意味著攻擊者拿到了一種真實(shí)的生物特征。此種情況下,系統(tǒng)是否應(yīng)該承認(rèn)攻擊者的合法身份,畢竟一種生物特征是真實(shí)的?但另一種生物特征并不是真實(shí)的,系統(tǒng)給予的判斷結(jié)果應(yīng)該是兩種特征綜合分析的結(jié)果。對(duì)于此種情況的討論,本文借用入侵容忍技術(shù)。入侵容忍主要考慮在遭到攻擊的情況下系統(tǒng)的可生存性,關(guān)注的重點(diǎn)是入侵造成的影響而不是入侵的原因[9, 13]。所謂的可生存性是指系統(tǒng)被部分入侵、性能下降的情況下,還能維持系統(tǒng)正常服務(wù)的能力。對(duì)于雙模態(tài)生物識(shí)別技術(shù),當(dāng)一種特征被竊取,另一種特征并不真實(shí)的情況下,本文提出了容忍能力評(píng)測(cè)方案,比較典型特征層雙模態(tài)生物識(shí)別算法的可生存性。
根據(jù)入侵容忍的概念,多模態(tài)生物識(shí)別系統(tǒng)的可生存性是指在生物特征被竊取的情況下,還能夠正確判定用戶的身份。給出判定結(jié)果需要一個(gè)比對(duì)的過程,也就是需要將測(cè)試樣本特征與數(shù)據(jù)庫中的模板特征進(jìn)行匹配。而由于生物特征具有模糊性,也就是采集的生物樣本每次都不可能完全一樣,比如指紋每次按壓的力度、角度做不到完全一樣,人臉不同時(shí)刻拍照時(shí)的表情,姿態(tài)也做不到完全相同,因此生物特征的匹配是采用閾值匹配,換句話說,2個(gè)生物特征之間的距離小于閾值被認(rèn)為2個(gè)生物特征是來自同一個(gè)用戶,大于閾值被認(rèn)為2個(gè)生物特征來自不同的用戶。在此基礎(chǔ)之上,生物識(shí)別技術(shù)針對(duì)兩種應(yīng)用模式有兩套對(duì)應(yīng)的性能評(píng)價(jià)指標(biāo)。
識(shí)別和認(rèn)證是生物識(shí)別技術(shù)的兩個(gè)應(yīng)用模式[14]。識(shí)別是一對(duì)多的匹配,測(cè)試樣本特征與注冊(cè)的所有模板特征進(jìn)行比對(duì),按照某種距離測(cè)度給出識(shí)別結(jié)果。只要該測(cè)試樣本特征與注冊(cè)模板中的任意一個(gè)能夠匹配,則識(shí)別成功,也就是所謂的一對(duì)多。反之,則認(rèn)為識(shí)別失敗。由此可見,識(shí)別模式強(qiáng)調(diào)的是身份的合法性,只要具有合法的身份,無論是否與用戶自己的模板特征相匹配都可以得到系統(tǒng)的授權(quán)。驗(yàn)證模式則是一對(duì)一的匹配,測(cè)試樣本特征必須與擁有該樣本的用戶注冊(cè)的模板特征相匹配才被認(rèn)為正確匹配,也就是驗(yàn)證成功。若測(cè)試樣本特征與其他用戶的注冊(cè)模板相匹配,則被認(rèn)為錯(cuò)誤匹配,也就是驗(yàn)證失敗。因此,驗(yàn)證模式是一對(duì)一的匹配,更適于算法性能的評(píng)價(jià)。
根據(jù)2種應(yīng)用模式從而有了2對(duì)性能評(píng)價(jià)指標(biāo):錯(cuò)誤接受率(false accept rate, FAR)和錯(cuò)誤拒絕率(false reject rate, FRR),錯(cuò)誤匹配率(false match rate, FMR)和錯(cuò)誤匹配率(false non-match rate, FNMR)[14]。其中,FAR和FRR是針對(duì)識(shí)別模式,FMR和FNMR是針對(duì)驗(yàn)證模式。本文關(guān)注特征層雙模態(tài)生物識(shí)別算法,因此選用FMR和FNMR兩個(gè)性能參數(shù)。FMR和FNMR的計(jì)算需要將樣本分為2個(gè)集合:用戶的訓(xùn)練樣本集和用戶的測(cè)試樣本集。則FMR和FNMR計(jì)算公式為
式中,樣本類間距離是指不同用戶特征之間的距離;樣本類內(nèi)距離是指同一用戶特征之間的距離。
目前,多模態(tài)生物識(shí)別的研究多以雙模態(tài)生物識(shí)別為主,也就是融合兩種生物特征進(jìn)行身份識(shí)別。本文以雙模態(tài)生物識(shí)別算法為例,對(duì)入侵容忍問題進(jìn)行分析。表1為雙模態(tài)生物特征A和B不同情況下給出判定結(jié)果后所對(duì)應(yīng)的評(píng)價(jià)性能參數(shù)。當(dāng)2種特征都是真的,判定正確匹配,或者兩種特征都是假的,判定錯(cuò)誤匹配,這兩種情況沒有任何異議,用“√”來標(biāo)記。若兩種特征都是真的,當(dāng)錯(cuò)誤匹配時(shí)很顯然應(yīng)歸屬于錯(cuò)誤誤匹配率了,對(duì)應(yīng)參數(shù)就是FNMR。同理,當(dāng)兩種特征都是假的而被判定正確匹配時(shí)對(duì)應(yīng)的參數(shù)就是FMR了。這4種情況很容易歸屬,可當(dāng)兩種特征有真有假時(shí),無論判定結(jié)果是正確匹配還是錯(cuò)誤匹配,都很難去界定對(duì)應(yīng)的參數(shù),在表中用“√”表示。此時(shí),相比單個(gè)用戶的判定結(jié)果是否正確,整體算法的可生存性更引人關(guān)注。
表1 雙模態(tài)生物特征真假分析
多模態(tài)生物識(shí)別的優(yōu)勢(shì)正是體現(xiàn)在這個(gè)“多”上面,多種生物特征的參與提高了系統(tǒng)的適用性、可靠性和安全性。然而,當(dāng)其中一種模態(tài)的生物特征被竊取時(shí),系統(tǒng)的識(shí)別性能會(huì)受到什么樣的影響?系統(tǒng)的安全性會(huì)受到什么影響?目前幾乎沒有文獻(xiàn)涉及過此問題,更沒有給出定量的指標(biāo)來評(píng)測(cè)這個(gè)問題。理想情況下,部分特征被竊取后融合算法盡可能地保持與無特征被竊取情況相同,這樣能夠保證攻擊者即使得到用戶的一種樣本特征,與沒有得到用戶樣本特征進(jìn)入系統(tǒng)的難度大致相同,也就是系統(tǒng)還能基本完成系統(tǒng)功能。因此,部分樣本特征被竊取情況對(duì)于多模態(tài)生物識(shí)別算法在區(qū)分性上有更高的要求,盡量避免出現(xiàn)錯(cuò)誤匹配。本文從系統(tǒng)安全出發(fā),關(guān)注FMR的變化程度,首先定義了FMR的積分差作為精確容侵能力度量,設(shè)計(jì)評(píng)測(cè)方案,對(duì)典型特征層雙模態(tài)生物識(shí)別算法進(jìn)行評(píng)測(cè)。
從安全的角度來考慮算法的性能,用戶更為關(guān)心攻擊者攻破系統(tǒng)的可能性,對(duì)應(yīng)的參數(shù)也就是FMR。因此,本文以FMR為性能評(píng)價(jià)參數(shù),測(cè)試樣本特征部分被竊取的情況下算法功能完成的情況,也就是算法容侵能力的測(cè)試。如何進(jìn)一步定量的衡量算法的容侵能力,本文首先定義算法的安全威脅參數(shù)。
定義1某種多模態(tài)生物識(shí)別算法的安全威脅參數(shù)定義為
(1)
式中,t為匹配閾值;Ω為可能的匹配閾值的范圍;g(t)為該算法的FMR曲線。
定義D實(shí)際上是計(jì)算FMR曲線在閾值范圍Ω的定積分,相對(duì)于單一的某個(gè)閾值下的FMR,D更準(zhǔn)確更全面地反映了識(shí)別算法的整體安全性。在實(shí)際計(jì)算中,閾值的取值是離散的,設(shè)閾值取值序列為x0,x1,…,xn,如圖1所示,安全威脅參數(shù)可轉(zhuǎn)化為
(2)
在實(shí)際測(cè)試中,在匹配之前已將融合特征進(jìn)行了歸一化,從而歸一化匹配閾值的范圍為[0,1]。
圖1 離散安全威脅參數(shù)定義Fig.1 Definition of discrete security threat parameter
當(dāng)樣本特征部分被竊取時(shí),攻擊者拿到部分特征的情況下,希望融合算法還能夠?qū)⒐粽咦R(shí)破,即要求融合算法在樣本特征部分竊取情況下,FMR上升速度不能過快,仍然保持與正常情況相當(dāng)?shù)膮^(qū)分性。為了度量這一點(diǎn),本文進(jìn)一步提出了容侵能力度量準(zhǔn)則。
定義2某種多模態(tài)生物識(shí)別算法的容侵能力度量定義為
(3)
式中,Dn和Dl分別表示正常情況下和樣本特征部分竊取情況下該算法的安全威脅參數(shù);gn(xi)和gl(xi)分別表示正常情況下和樣本特征部分竊取情況下該算法的FMR曲線。實(shí)際上,V即為兩種情況下FMR曲線之間的面積,如圖2所示。
圖2 容侵能力度量定義Fig.2 Definition of intrusion tolerance capability measurement
V反映了融合算法識(shí)別性能受樣本特征部分竊取的影響程度,該值越小表示融合算法的容侵能力越高,等于0是容侵能力最佳的理想情況,即算法的性能不受樣本特征被竊取的影響,該算法的安全性也就越高。上述2個(gè)度量的引入使得能夠有效對(duì)融合算法的總體識(shí)別性能進(jìn)行量化的評(píng)估,對(duì)融合算法在樣本特征部分竊取情況下容侵能力下降程度進(jìn)行定量的分析。
目前,特征層多模態(tài)生物識(shí)別技術(shù)多以雙模態(tài)生物識(shí)別算法為主。因此,以雙模態(tài)生物識(shí)別算法為例給出測(cè)試結(jié)果。傳統(tǒng)的特征層雙模態(tài)生物識(shí)別算法有兩類:串聯(lián)融合和加權(quán)融合[5-6]。串聯(lián)融合就是將2種模態(tài)特征向量串聯(lián)成一個(gè)長(zhǎng)向量,這樣帶來的計(jì)算量非??捎^。而加權(quán)融合是將2種模態(tài)特征向量分別乘以權(quán)值后再疊加,但權(quán)值的選擇是個(gè)備受爭(zhēng)議的問題。典型相關(guān)分析(canonical correlation analysis, CCA)屬于并聯(lián)方式,但與加權(quán)融合模式不同,并沒有提前將2種特征進(jìn)行融合,整個(gè)算法既是融合過程,也是分類過程[15]。復(fù)數(shù)融合是一種新興的融合模式,其將2種模態(tài)特征向量分別作為實(shí)部和虛部組成復(fù)數(shù)特征向量,再對(duì)復(fù)數(shù)特征向量進(jìn)行分類。這樣既解決了串聯(lián)帶來的巨大計(jì)算量,同時(shí)又避免了權(quán)值的選擇問題[16-20]。
fk=
(4)
因此,根據(jù)式(4)得到的融合特征維數(shù)為d=max{d1,d2}。
CCA算法按照相同的方式統(tǒng)一特征維數(shù),其通過2個(gè)數(shù)據(jù)集之間的線性變換來提取典型變量,利用典型變量間的相關(guān)系數(shù)來表征數(shù)據(jù)集間的相關(guān)性,從而找到兩個(gè)投影方向使得兩個(gè)數(shù)據(jù)集投影后具有最大的相關(guān)性。投影方向α和β的求解可通過式(5)的最大化得到。
(5)
式中,Sxy為訓(xùn)練樣本集x和y的互協(xié)方差矩陣;Sxx和Syy分別為樣本集x和y的協(xié)方差矩陣。
復(fù)數(shù)融合模式按照加權(quán)融合相同的方式統(tǒng)一特征維數(shù),則復(fù)數(shù)融合方式的第k個(gè)融合特征fk為
(6)
式中,i為虛數(shù)單位。
通常情況下,串聯(lián)融合和加權(quán)融合方式得到融合特征之后按照某種距離測(cè)度進(jìn)行匹配從而得到驗(yàn)證結(jié)果,而CCA算法整體既是融合過程也是分類的過程。復(fù)數(shù)融合方式得到融合特征后還需要再利用復(fù)數(shù)分類器進(jìn)行再次分類給出最后的驗(yàn)證結(jié)果。文獻(xiàn)[16]最早提出復(fù)數(shù)融合并給出了復(fù)數(shù)Fisher鑒別分析算法(complex fisher discriminant analysis,CFDA)算法,利用復(fù)數(shù)向量融合使用不同特征提取方法得到的人臉特征進(jìn)而分類識(shí)別。CFDA的目標(biāo)函數(shù)為
(7)
式中,Sb和Sw分別為樣本類間散度矩陣和樣本類內(nèi)散度矩陣;H為共軛轉(zhuǎn)置符號(hào)。當(dāng)wHSww=0且wHSbw≠0時(shí),目標(biāo)函數(shù)達(dá)到最大值。正是基于上述思想,復(fù)數(shù)普通向量(complex common vector, CCV)算法被提出[17],目標(biāo)函數(shù)為
(8)
式中,St為總體散度矩陣??紤]到非線性特征的存在,基于核函數(shù)的復(fù)數(shù)雙模態(tài)生物識(shí)別算法復(fù)數(shù)核主成分分析(complex kernel principal component analysis, CKPCA)和復(fù)數(shù)核Fisher鑒別分析(complex kernel fisher discriminant analysis, CKFDA)相繼出現(xiàn)[18-19],算法的目標(biāo)試圖將原始訓(xùn)練樣本通過某個(gè)非線性映射映射到某一高維特征空間,并在該空間中實(shí)現(xiàn)線性主成分分析和Fisher鑒別分析,目標(biāo)函數(shù)分別為
(9)
(10)
式中,R=K-1mK-K1m+1mK1m,K為樣本核矩陣,1m為m×m元素都為1的矩陣(m為樣本總個(gè)數(shù));Kb和Kw分別為基于核函數(shù)的類間散度矩陣和類內(nèi)散度矩陣,本文測(cè)試采用高斯核函數(shù)。
復(fù)數(shù)局部保射投影(complex locality preserving projection,CLPP)算法是讓原始樣本同類的數(shù)據(jù)點(diǎn)間距離較近的點(diǎn),在經(jīng)過映射到低維空間后兩點(diǎn)間的距離被壓縮的很近,該方法能夠很好地保持原始數(shù)據(jù)同類間的非線性結(jié)構(gòu),因此在經(jīng)過映射后能夠充分利用同類間的非線性結(jié)構(gòu)保持其相似性[20]。這種映射克服了傳統(tǒng)線性分析算法不能保留高維數(shù)據(jù)中流形結(jié)構(gòu)的缺點(diǎn),同時(shí)還克服了非線性映射后很難獲得在低維樣本空間上的簡(jiǎn)潔特征表示的困難。其目標(biāo)函數(shù)為
(11)
式中,Sij表示互為近鄰的兩個(gè)數(shù)據(jù)點(diǎn)之間的相似度。
本文采用中科院自動(dòng)化所(Institute of Automation,Chinese Academy of Sciences, CASIA)公開虹膜數(shù)據(jù)庫,奧利維提研究實(shí)驗(yàn)室(Olivetti Research Laboratory, ORL)人臉數(shù)據(jù)庫和耶魯(Yale)人臉數(shù)據(jù)庫。CASIA虹膜數(shù)據(jù)庫包括108個(gè)虹膜個(gè)體,每個(gè)虹膜分兩個(gè)階段采集7幅圖像,共756幅虹膜圖像。ORL人臉數(shù)據(jù)庫由劍橋大學(xué)AT&T實(shí)驗(yàn)室創(chuàng)建,包含40人,每人采集10幅圖像,共400幅人臉圖像,其中包括了姿態(tài)、表情和面部飾物的變化。Yale人臉數(shù)據(jù)庫由耶魯大學(xué)計(jì)算視覺與控制中心創(chuàng)建,包含15人,每人采集11幅圖像,共165幅人臉圖片,同樣包含光照、表情和姿態(tài)的變化。
對(duì)第3.1節(jié)中所述的特征層雙模態(tài)生物識(shí)別算法進(jìn)行評(píng)測(cè):串聯(lián)算法,加權(quán)算法,CFDA算法,CCV算法,CKPCA算法,CKFDA算法,CCA算法,CLPP算法。在加權(quán)算法中,由于虹膜識(shí)別相較于人臉識(shí)別在準(zhǔn)確率方面性能更優(yōu),因此在權(quán)值分配上偏重于虹膜特征,以期望虹膜特征的區(qū)分性能在融合特征中起到重要作用,本文實(shí)驗(yàn)中2種特征的權(quán)值取為θ1=0.3,θ2=0.7。同時(shí),也添加了加法算法的實(shí)驗(yàn)對(duì)比,將人臉特征和虹膜特征權(quán)值設(shè)置相同,也就是權(quán)值取為θ1=θ2=0.5,作為加權(quán)算法的一個(gè)特例也參與評(píng)測(cè)。因此,本文是對(duì)以上9種算法給出評(píng)測(cè)結(jié)果。
表2給出了實(shí)驗(yàn)1中9種融合算法在樣本特征泄露情況和正常情況下不同閾值的FMR、對(duì)應(yīng)的容侵能力度量V及程序運(yùn)行時(shí)間。
表2 實(shí)驗(yàn)1參數(shù)比較
在計(jì)算量方面,實(shí)驗(yàn)對(duì)比的9種算法原理各不相同,因此在計(jì)算量方面也相差較大。本文實(shí)驗(yàn)采用Matlab R2017b,計(jì)算機(jī)處理器Intel(R) Core(TM) i7-7700HQ CPU@2.80GHz 2.81GHz,內(nèi)存8GB。由于串聯(lián)、加法和加權(quán)3種方法融合之后不再對(duì)融合特征添加分類器,因此在9種算法中時(shí)間最短。其中,加法和加權(quán)兩種融合算法得到的特征相比串聯(lián)特征的維數(shù)更小,因此時(shí)間上最短。CCA算法比較特殊,與加權(quán)、復(fù)數(shù)融合方式不同,并不對(duì)兩種模態(tài)特征直接做操作,算法執(zhí)行的過程就是融合和分類的過程,因此時(shí)間也較短。而其他算法中,CKPCA和CKFDA兩種算法在進(jìn)行核函數(shù)計(jì)算生成核矩陣的過程中需要樣本間兩兩遍歷所有組合,大維數(shù)核矩陣的求解花費(fèi)時(shí)間也長(zhǎng),造成兩種算法時(shí)間較長(zhǎng),尤其CKFDA是CKPCA的基礎(chǔ)上又進(jìn)行了FDA,因此時(shí)間最長(zhǎng)。CFDA、CCV和CLPP運(yùn)行時(shí)間處于中間。
圖3給出了實(shí)驗(yàn)1中9種融合算法在2種情況下FMR隨閾值大小變化而變化的對(duì)比情況。隨著閾值的增大,FMR也隨之增大,這是因?yàn)闃颖绢愰g距離小于閾值可能性就增加了,進(jìn)而樣本類間距離中小于閾值的個(gè)數(shù)將會(huì)增大,必然會(huì)使得FMR增大。然而,正常情況和泄露情況FMR增長(zhǎng)的速率并不相同。從表2具體數(shù)值可看出,相同閾值下,串聯(lián)、加法、加權(quán)、CFDA算法、CKPCA算法5種算法正常情況和泄漏情況FMR數(shù)值相似,進(jìn)一步可看出相同閾值差值得到的FMR差值也是相似的,這也驗(yàn)證了圖3中4種算法對(duì)應(yīng)FMR增長(zhǎng)曲線的相似性,從而表2給出的容侵能力度量V也是非常接近的。CCV算法和CCA算法正常情況下FMR增長(zhǎng)速度相比泄露情況下FMR的增長(zhǎng)速度過快,導(dǎo)致2種情況FMR相差較大,從而得到的容侵能力度量V也較大。從圖3不難看出CKFDA算法和CLPP算法相對(duì)于其他7種算法在正常情況下和泄露情況下2條FMR曲線非常接近,尤其CLPP算法趨近于理想狀況。CKFDA算法繼承了實(shí)數(shù)域KFDA算法的優(yōu)勢(shì),在增大類間距離的同時(shí)縮小類內(nèi)距離,利用核函數(shù)將低維空間線性不可分問題轉(zhuǎn)化為高維空間線性可分問題,提取更具有區(qū)分性的樣本非線性特征。而CLPP算法更關(guān)注局部特征,保證在高維流形中相鄰的樣本在降維后的空間中也相鄰,克服了線性算法不能保留高維數(shù)據(jù)中流形結(jié)構(gòu)的缺點(diǎn),充分利用同類間的非線性結(jié)構(gòu),在抵抗偽造特征攻擊的表現(xiàn)更佳。從表2可以更方便地看出CLPP算法容侵能力度量最低。因此,從實(shí)驗(yàn)1的實(shí)驗(yàn)結(jié)果來看,如果從安全角度考慮融合算法,CLPP算法是較好的選擇。
圖3 實(shí)驗(yàn)1算法容侵能力比較Fig.3 Intrusion tolerance capability comparison of experiment 1
表3給出了實(shí)驗(yàn)2中9種融合算法在樣本特征泄露情況和正常情況下不同閾值的FMR,對(duì)應(yīng)的容侵能力度量V以及程序運(yùn)行時(shí)間。計(jì)算機(jī)配置與實(shí)驗(yàn)1相同,9種算法程序運(yùn)行時(shí)間差異與實(shí)驗(yàn)1也基本相同,但因?yàn)閅ale庫的樣本數(shù)比ORL庫樣本少,因此表3中各算法運(yùn)行時(shí)間都比表2中運(yùn)行時(shí)間少。
表3 實(shí)驗(yàn)2參數(shù)比較
圖4給出了實(shí)驗(yàn)2中9種融合算法在2種情況下FMR隨閾值大小變化而變化的對(duì)比情況。從表3和圖4的實(shí)驗(yàn)結(jié)果,可看到實(shí)驗(yàn)2和實(shí)驗(yàn)1有相同的結(jié)論。相同閾值下,串聯(lián)、加法、加權(quán)、CFDA算法、CKPCA算法5種算法正常情況和泄漏情況FMR數(shù)值相似,得到的容侵能力度量也是相近的。CCV算法和CCA算法在實(shí)驗(yàn)2中正常情況下FMR增長(zhǎng)速度相比泄露情況下FMR的增長(zhǎng)速度同樣過快,導(dǎo)致2種情況FMR相差較大,從而得到的容侵能力度量V也較大。相比實(shí)驗(yàn)1,圖4中CKFDA算法和CLPP算法在正常情況下和泄露情況下兩條FMR曲線更加接近,尤其CLPP算法兩條曲線幾乎重合。因此,從實(shí)驗(yàn)1和實(shí)驗(yàn)2的實(shí)驗(yàn)結(jié)果來看,如果從安全角度考慮融合算法,CLPP算法是較好的選擇。
圖4 實(shí)驗(yàn)2算法容侵能力比較Fig.4 Intrusion tolerance capability comparison of experiment 2
本文探討了特征層多模態(tài)生物識(shí)別算法的安全問題,針對(duì)多特征中部分特征被竊取情況,引入入侵容忍概念,定義了安全威脅參數(shù)和容侵能力度量,提出了容侵能力評(píng)測(cè)方案,以人臉和虹膜為研究對(duì)象,對(duì)串聯(lián)算法、加權(quán)算法、加法算法、CFDA算法、CCV算法、CKPCA算法、CKFDA算法、CCA算法和CLPP算法9種特征層雙模態(tài)生物識(shí)別算法進(jìn)行了評(píng)測(cè)。兩組實(shí)驗(yàn)結(jié)果都表明CCV算法和CCA對(duì)于樣本泄露造成的影響比較敏感,而CKFDA算法和CLPP算法對(duì)于樣本特征被竊取情況的魯棒性更高,保持了較高的安全性。