楊·道格拉斯,麗貝卡·巴拉貝卡,卡洛斯·伊格納西奧·古鐵雷斯,邁克爾·查科夫斯基
(美國蘭德公司)
與指紋和虹膜識(shí)別非常相似,F(xiàn)RTs 是一種生物識(shí)別系統(tǒng),它依賴于模式識(shí)別來匹配給定數(shù)據(jù)集中的人臉。換言之,有關(guān)一個(gè)人身體的數(shù)字化信息是從圖像或視頻中提取出來的,并與其他面部圖像或其他傳記信息相關(guān)聯(lián)。鑒于這些能力,本文介紹了一種二維啟發(fā)式方法來描述FRTs 中的準(zhǔn)確性和隱私性權(quán)衡。接著討論了這項(xiàng)技術(shù)對隱私和偏見的影響。
在本報(bào)告中,我們使用“準(zhǔn)確性”一詞來指代FRTs 進(jìn)行圖像比較和正確識(shí)別人的能力。選擇該定義的原因是,我們希望遵循測試和實(shí)施FRTs 的政府機(jī)構(gòu)使用的分類法。我們還認(rèn)識(shí)到FRTs 的性能準(zhǔn)確性包括多個(gè)方面:最大化真實(shí)肯定、最小化錯(cuò)誤肯定和錯(cuò)誤否定。這些都對隱私和偏見有影響。
在對文獻(xiàn)進(jìn)行回顧之后,我們確定了一種二維啟發(fā)式方法,以對比潛在的隱私問題和對FRTs 準(zhǔn)確性的影響。第一個(gè)維度描述了受試者了解FRTs 系統(tǒng)并同意配合使用的程度:同意或不同意。在同意的情況下,受試對象知道他們的圖像已被捕獲并通過自愿提供信息進(jìn)行合作。由于拍攝對象靜止不動(dòng),取下臉部遮蓋物并直視攝像機(jī),因此可以得到更高質(zhì)量的圖像。相反,在不同意的情況下,受試對象沒有機(jī)會(huì)拒絕捕獲其圖像。在這種情況下,通常會(huì)出現(xiàn)阻礙視線或姿勢變化的情況,從而降低FRTs 的準(zhǔn)確性。
啟發(fā)式對比的第二個(gè)方面是將面部驗(yàn)證與身份識(shí)別進(jìn)行對比。人臉驗(yàn)證是將一張人臉的參考圖像與另一張人臉的參考圖像,即聲稱身份人的參考圖像進(jìn)行一對一的比較。此外,人臉識(shí)別涉及兩個(gè)數(shù)據(jù)集的搜索。它可以在一個(gè)數(shù)據(jù)集中的人臉中搜索另一數(shù)據(jù)集中的人臉,也可以從另一數(shù)據(jù)集中的一個(gè)數(shù)據(jù)集中搜索任意數(shù)量的記錄。在此報(bào)告中,我們將一對多和多對多標(biāo)識(shí)歸為一類:一些對多。這個(gè)映射關(guān)系與FRTs 系統(tǒng)的準(zhǔn)確性和偏差有關(guān),因?yàn)槟壳坝糜谝粚σ蛔R(shí)別的算法比多對多識(shí)別的算法更準(zhǔn)確。
表1 所示的矩陣可以幫助我們評估錯(cuò)誤與隱私和偏見潛在相互作用。例如,它表明左上象限中的用例可能比右下象限中的用例具有更高的準(zhǔn)確性。因此,這種二維分類可以作為一組判斷FRTs 系統(tǒng)是否具有高精度的標(biāo)準(zhǔn)。
表1 按同意和匹配類型分列的人臉識(shí)別技術(shù)使用案例
在這項(xiàng)研究中,我們將隱私定義為一個(gè)人控制自己信息的能力。它對個(gè)人和國家的重要性是不可否認(rèn)的。根據(jù)《聯(lián)合國人權(quán)宣言》,隱私權(quán)是一項(xiàng)人權(quán)。它的保護(hù)可以起到平衡國家間權(quán)力的作用,被認(rèn)為是一種受保護(hù)的公民自由。
在實(shí)踐中,隱私權(quán)的概念可能由于下文的原因而難以實(shí)現(xiàn)。例如,國土安全部(DHS)指出,它被授權(quán)從“聲稱是美國公民和進(jìn)入美國的旅行者的美國入境申請者”那里收集生物特征信息。但根據(jù)喬治城大學(xué)法律中心隱私與技術(shù)中心的一份報(bào)告,國會(huì)“從未明確授權(quán)使用人臉識(shí)別技術(shù)從美國公民那里收集生物特征”。
對隱私的關(guān)注,尤其是對監(jiān)視的保護(hù),可能導(dǎo)致人們改變其行為。當(dāng)被問及這些問題時(shí),美國受訪者表示,他們想要隱私并關(guān)心隱私。歐盟的受訪者強(qiáng)烈地不信任機(jī)構(gòu),他們更傾向于保護(hù)隱私。有關(guān)美國政府監(jiān)控的新聞報(bào)道可能會(huì)對記者的言論、網(wǎng)絡(luò)行為和宗教表達(dá)產(chǎn)生寒蟬效應(yīng)。對監(jiān)視的長期影響研究發(fā)現(xiàn),盡管人們能夠適應(yīng)侵入式監(jiān)視,但他們發(fā)現(xiàn)它是“煩惱、擔(dān)憂、焦慮甚至憤怒”的原因。在一項(xiàng)研究中,受試者甚至放棄了自己喜歡的活動(dòng)和愛好,以表現(xiàn)出某種形式的對觀察者所能看到東西的控制。此外,監(jiān)視并不能保證產(chǎn)生好的行為或阻止壞的行為。例如,閉路電視在犯罪方面的效力因環(huán)境而異。
考慮到公眾對隱私和監(jiān)視的關(guān)注,在決定如何實(shí)施FRTs 時(shí),獲得同意是一個(gè)重要的考慮因素。對不同意提供信息的人使用FRTs,無論是收集還是以后分享,都會(huì)產(chǎn)生短期和長期的負(fù)面影響。它可能導(dǎo)致結(jié)果不準(zhǔn)確或被誤解,例如,被列入拒絕某人權(quán)利的黑名單中。鑒于收集到的這些信息一般不公開,可能不會(huì)告知錯(cuò)誤肯定事件的當(dāng)事人為什么會(huì)被標(biāo)記,從而使他們無法利用補(bǔ)救或申訴機(jī)制來反駁和解決誤解。
FRTs 也可以用來提供一些好處。如果請求某一福利的人不同意拍照,那么他們將不會(huì)有可用于成功配對的面部照片。例如,有些旅行需要護(hù)照,如果想進(jìn)行這種旅行的人從未申請或提供符合申請護(hù)照要求的照片,那么他們就不會(huì)同意在檢查護(hù)照的數(shù)據(jù)集中擁有照片,因此將被拒絕進(jìn)行該旅行。
在部署新技術(shù)時(shí),特別是在安全環(huán)境中,政府機(jī)構(gòu)可能需要考慮保護(hù)隱私和提供安全之間的內(nèi)在權(quán)衡。隱私工程領(lǐng)域近年來不斷發(fā)展,它解決了將隱私保護(hù)構(gòu)建到軟件和硬件中的問題。我們探索了隱私工程,以確定如何獲得FRTs 的安全優(yōu)勢,同時(shí)仍將隱私構(gòu)建到以安全為中心的系統(tǒng)中。盡管隱私工程包含多種工具和技術(shù),但我們重點(diǎn)關(guān)注在FRTs 系統(tǒng)上實(shí)現(xiàn)隱私工程的三個(gè)方面:
(1)數(shù)據(jù)保護(hù)側(cè)重于通過使用加密或分離系統(tǒng)角色或任務(wù)來保護(hù)現(xiàn)有數(shù)據(jù)。這確保了數(shù)據(jù)的完整性,并且只有預(yù)期和授權(quán)的查看者才能讀取信息。它在防止惡意收集信息方面特別有用。
(2)數(shù)據(jù)最小化、縮減和匿名化側(cè)重于減少可用信息量,甚至是授權(quán)用戶。相關(guān)方法的示例包括差分隱私和匿名化。
(3)數(shù)據(jù)透明度和可糾正性是一種訪問和控制技術(shù),強(qiáng)調(diào)受試者在確定和理解如何處理其數(shù)據(jù)方面的作用。復(fù)雜的用戶訪問和隱私控制選項(xiàng)包括向公眾提供通知和選擇。此外,如有需要,還應(yīng)提供糾正信息的機(jī)會(huì)。盡管有通知和選擇,但個(gè)人對其數(shù)據(jù)的控制最終可能取決于政府機(jī)構(gòu)如何選擇平衡隱私和安全。
前兩個(gè)方面(數(shù)據(jù)保護(hù)和數(shù)據(jù)最小化、縮減和匿名化)僅在系統(tǒng)實(shí)施者和開發(fā)人員的控制之內(nèi)。數(shù)據(jù)透明性和可糾正性還必須由系統(tǒng)開發(fā)人員和實(shí)施人員來建立,但是這些技術(shù)為主題提供了更多的機(jī)會(huì)來讓受試者了解和更正關(guān)于自己持有和使用的數(shù)據(jù)。
人們試圖保護(hù)隱私的一種方法是“入侵”FRTs。FRTs 無法幸免于通過各種攻擊媒介破壞其有效性的努力。根據(jù)實(shí)施這些行為人的意圖,它們可以被視為一種手段,通過使攝像機(jī)難以掃描一個(gè)人的面部來保護(hù)隱私,或者通過偽造一個(gè)人的面部特征來為非法行為提供便利。本節(jié)描述了以避免檢測或模擬為目的對FRTs 進(jìn)行黑客攻擊的技術(shù)。
檢測回避也被稱為躲避或生物特征模糊,它可以增加對象的物理外觀和用于識(shí)別他們的圖像收集之間的差異。目前,幾乎所有的檢測回避技術(shù)都依賴于面部特征的臨時(shí)或永久的物理修飾或隱藏。
臨時(shí)性技術(shù)(例如,放置社交可接受的障礙物或假發(fā))會(huì)降低FRTs 系統(tǒng)檢測匹配身份的能力。一些研究強(qiáng)調(diào)了眼鏡在檢測回避中的作用。身份照片中有眼鏡的受試者一旦摘下眼鏡,就有可能避開FRTs。眼鏡還可以設(shè)計(jì)成通過使用特定的顏色模式,通過以新穎的方式吸收和反射自然光的材料或通過發(fā)出使照相機(jī)系統(tǒng)蒙蔽的紅外光來誤導(dǎo)FRTs。
使用臨時(shí)或永久性補(bǔ)妝也會(huì)降低FRTs 的有效性。Guodong Guo 和他的同事創(chuàng)建了一個(gè)分類法,描述了化妝如何在一個(gè)人的面部特征中產(chǎn)生對比。分類法包括膚色,可以通過改變膚色來改變?nèi)说耐獗矸N族;皮膚光滑度和質(zhì)地,對其進(jìn)行修飾可改變疤痕、丘疹和皺紋的外觀;皮膚的高光,可以突顯臉部的不同元素。
整容手術(shù)是一種永久性改變?nèi)说奶卣鞑⑻魬?zhàn)FRTs 準(zhǔn)確性的技術(shù)。根據(jù)FRTs 方法和手術(shù)類型的不同,正確識(shí)別接受過整形手術(shù)的人的能力可能會(huì)有很大差異。例如,耳整形術(shù)后的識(shí)別率約為56%至90%,而皮膚整形后的識(shí)別率則約為5%至95%。
模仿或欺騙是減少冒名頂替者和目標(biāo)之間面部差異的行為。其目的可能是訪問系統(tǒng)或誤導(dǎo)當(dāng)局以為某個(gè)目標(biāo)同時(shí)存在于多個(gè)位置。盡管技術(shù)可能類似于檢測回避技術(shù),但假冒似乎是更具挑戰(zhàn)性的。關(guān)于此主題的研究描述了四種欺騙身份的技術(shù):照片、視頻、蒙版和變形。
2.6.1 照片
照片欺騙是最流行的技術(shù),因?yàn)樗苋菀讓?shí)現(xiàn)且便宜。它只需要用戶獲得目標(biāo)的照片并將其呈現(xiàn)給FRTs 系統(tǒng)。這種方法的缺點(diǎn)包括缺乏三維信息和手拿圖片時(shí)引起的振動(dòng)。此外,照片不太可能模仿活人的某些特征,如眼睛和嘴巴的運(yùn)動(dòng),在文獻(xiàn)中被稱為“生動(dòng)性”。克服這一缺點(diǎn)的一種方法是切開眼睛和嘴巴的孔,這使模仿者能夠賦予圖片“自然”的運(yùn)動(dòng)。
2.6.2 視頻
高解析度屏幕上顯示目標(biāo)的高質(zhì)量視頻可以替代目標(biāo)的照片。與照片不同,視頻中的面部特征不太可能是靜態(tài)的。如果FRTs 系統(tǒng)在其身份驗(yàn)證中結(jié)合了生動(dòng)性,則一個(gè)人眨眼、執(zhí)行面部表情和呼吸的視頻對于驗(yàn)證非常有用。但是,這些好處依賴于獲得面部特征清晰可見的視頻素材。
2.6.3 面具
最具挑戰(zhàn)性的欺騙技術(shù)是構(gòu)造和呈現(xiàn)一個(gè)三維面具。3-D 掃描和打印技術(shù)的發(fā)展提供了必要的工具,可以促進(jìn)這種模擬假冒的產(chǎn)生。冒名頂替者面臨的主要問題是,如果沒有目標(biāo)的合作,則幾乎不可能獲得構(gòu)建準(zhǔn)確表示所需的信息。一些FRTs 系統(tǒng)通過請求一系列動(dòng)作或動(dòng)作密碼與被試進(jìn)行交互,而面具技術(shù)可以阻止這些動(dòng)作。在FRTs 中添加其他生物特征識(shí)別可能會(huì)反擊這種黑客攻擊。
2.6.4 變形
最后一種攻擊被稱為變形,在這種攻擊中,一個(gè)人的照片與相貌相似的人的照片相結(jié)合。在他們的研究中,羅伯遜、克萊默和伯頓假設(shè)了一個(gè)場景,在這個(gè)場景中,有人用兩個(gè)人的變形照片更新他們的政府身份,這樣這兩個(gè)人都可以使用新的文件。
在機(jī)器學(xué)習(xí)中,尤其是在人臉識(shí)別中,偏見是一個(gè)日益受到關(guān)注的問題。偏見是指不合理的傾向,有利于或不利于一個(gè)群體而不是另一個(gè)群體。特別令人關(guān)注的是對某些群體的非法、不道德和不受歡迎的偏見。少數(shù)民族和團(tuán)體如果認(rèn)為自己可能與大多數(shù)人或其他受到嚴(yán)格審查的社區(qū)格格不入,可能會(huì)避免公開發(fā)表言論或采取其他行為。在FRTs 中,面部的物理特征(如眼睛形狀或膚色)會(huì)使偏見持續(xù)存在。眾所周知,算法偏見的例子存在于不同的政策領(lǐng)域,如刑事司法和疾病監(jiān)測。有偏見的FRTs結(jié)果可能導(dǎo)致各種潛在的危害,如缺乏同意、針對人群、測量錯(cuò)誤和故意針對等。
鑒于FRTs 通常依賴于用數(shù)據(jù)“訓(xùn)練”的算法來關(guān)注特定的特征,不同的配置和操作方法在執(zhí)行FRTs“目標(biāo)”操作時(shí)會(huì)不成比例地影響群體。在本節(jié)中,我們將討論這樣的交叉過程。
監(jiān)督學(xué)習(xí)技術(shù)通常用于編程FRTs,它依賴于手動(dòng)預(yù)標(biāo)記的數(shù)據(jù)來“教導(dǎo)”算法它們應(yīng)該關(guān)注的特性。因此,訓(xùn)練數(shù)據(jù)中的偏見會(huì)導(dǎo)致有偏見的輸出。例如,如果一組面部照片包含的特定種族或具有特定面部特征的人太少,F(xiàn)RTs算法將永遠(yuǎn)無法“學(xué)習(xí)”識(shí)別他們。
研究表明,訓(xùn)練數(shù)據(jù)中的人口統(tǒng)計(jì)偏見會(huì)影響FRTs 識(shí)別人的表現(xiàn)。其中一項(xiàng)分析探討了人口統(tǒng)計(jì)信息在一套商業(yè)上可獲得的FRTs 工具中的作用。結(jié)果表明,女性、黑人和年輕人的臉總是被錯(cuò)誤識(shí)別。特別是,F(xiàn)RTs 中的種族偏見被稱為“其他種族效應(yīng)”,此前類似的研究發(fā)現(xiàn),人類能夠更好地識(shí)別自己種族的面孔。菲利普斯和他的同事將研究出的算法與以西亞或東亞國家為中心的訓(xùn)練數(shù)據(jù)進(jìn)行比較,發(fā)現(xiàn)算法分別匹配了更多的白人或東亞人的面孔。事實(shí)上,多份報(bào)告發(fā)現(xiàn),許多FRTs 對深色人臉的識(shí)別能力較差。在另一項(xiàng)研究中,研究人員發(fā)現(xiàn),三種商業(yè)性的FRTs 專注于性別分類微軟認(rèn)知服務(wù)公司(microsoftcognitive Services)、IBM 沃森公司(IBM Watson)和faces++,它們在男性和膚色較淺的人身上表現(xiàn)最好。這些FRTs 在深色皮膚的女性身上表現(xiàn)最差。該研究的作者還得出結(jié)論,幾個(gè)公開的面部圖像數(shù)據(jù)集不成比例地包含許多淺膚色的皮膚和較少的深色皮膚的面孔,尤其是深色皮膚的女性面孔。
在訓(xùn)練完一個(gè)FRTs 后,它被應(yīng)用到目標(biāo)數(shù)據(jù)上,目標(biāo)數(shù)據(jù)是一組標(biāo)記或識(shí)別的人臉圖像,給定一個(gè)被攝體圖像或一組圖像,F(xiàn)RTs 搜索潛在的匹配。一個(gè)重要的考慮因素是這個(gè)數(shù)據(jù)集的來源和組成。例如,人臉數(shù)據(jù)集可能旨在代表感興趣的目標(biāo)人群,或由從公眾中抽取的人臉組成。矛盾的是,當(dāng)使用更多有限的參考數(shù)據(jù)集時(shí),結(jié)果偏差的風(fēng)險(xiǎn)可能更大。例如,如果面部數(shù)據(jù)集包含面部照片,則逮捕率上的種族偏見可能會(huì)導(dǎo)致面部照片中的人口統(tǒng)計(jì)偏斜。這將增加在參考數(shù)據(jù)集中過分代表的種族和族裔群體中面部匹配率過高的可能性。結(jié)果,這將使過度代表的群體受到不必要的審查,從而對其造成傷害,并將損害實(shí)施計(jì)劃旨在保護(hù)廣大公眾。事實(shí)上,針對特定群體的數(shù)據(jù)可能會(huì)過多。例如,由于逮捕率不相稱,面部照片數(shù)據(jù)庫可能包含不成比例的更多深色面孔。
目標(biāo)數(shù)據(jù)集中不匹配的面部圖像的人口統(tǒng)計(jì)構(gòu)成(換句話說,存在匹配圖像的“背景”)也會(huì)影響算法性能。最后,盡管FRTs 精度隨著大量訓(xùn)練數(shù)據(jù)的提高而提高,但隨著目標(biāo)數(shù)據(jù)集大小的增加而降低。
FRTs 基于比較面部圖像并估計(jì)匹配可能性的算法。盡管可以假定這種基于計(jì)算機(jī)的技術(shù)是絕對可靠的,或者至少比人類不易受到偏見的影響,但實(shí)際上,算法可能包含隱藏的偏見,這些偏見反映了人類創(chuàng)造者的經(jīng)驗(yàn)、特征甚至偏好。例如,作者可能編寫了一種算法來為其模型中的某些數(shù)據(jù)特征分配不適當(dāng)?shù)臋?quán)重、忽略或誤解。而且,這些選擇可能是完全未知的。由于算法不透明或缺乏用于識(shí)別和匹配人臉的特征的透明度,可能會(huì)導(dǎo)致無意或故意的傷害。
關(guān)于在FRTs 中確保公平性的爭論主要圍繞著消除無意中的偏見。但是通過開發(fā)算法或數(shù)據(jù)集可以故意將偏見引入FRTs 中,從而使結(jié)果與種族相關(guān)。在一個(gè)非FRTs 的例子中, Tufekci提出了基于算法的雇傭可能基于通勤距離。盡管通勤距離看似無害,但它可以利用美國存在的極端居民隔離現(xiàn)象。用于FRTs 的類似算法可能會(huì)使結(jié)果偏向于不成比例地包括或排除某些群體,例如,推進(jìn)意識(shí)形態(tài)議程或利用政治兩極分化破壞社會(huì)穩(wěn)定。
應(yīng)該評估所有技術(shù)系統(tǒng)的隱私和偏見,包括可能出于安全目的而部署的FRTs 系統(tǒng)。本報(bào)告提出的啟發(fā)式方法提供了一種識(shí)別隱私和偏見問題的方法??偨Y(jié)本報(bào)告介紹的信息后,圖1展示了每種情況下潛在的隱私隱患和估計(jì)的準(zhǔn)確性級別,其中包括潛在的偏見。例如,當(dāng)將同意的面部圖像與單張照片進(jìn)行比較時(shí),準(zhǔn)確性通常應(yīng)該很高,而隱私隱患也應(yīng)該很低。
圖1 人臉識(shí)別技術(shù)的準(zhǔn)確性和隱私性權(quán)衡
FRTs 系統(tǒng)的部署和使用方式的其他要素也很重要,例如系統(tǒng)對旨在擊敗它的技術(shù)的敏感性。后續(xù)章節(jié)在兩個(gè)用例中更詳細(xì)地介紹了這些元素。通過這些用例的“深入探究”,我們確定了可能標(biāo)志著需要增強(qiáng)隱私技術(shù)或減少偏見策略的危險(xiǎn)信號(hào)。