張瓊 王敬澤
摘要:本文從交互設計的角度出發(fā),剖析人臉識別技術的基本功能與設計可能,為設計師提供基于人臉識別技術的產(chǎn)品設計思路。文章通過總結人臉識別技術的六個設計影響因素,將人臉識別技術劃分為易理解的四個層次:功能層、行為層、感知層和反饋層。功能層中將人臉識別的基本功能進行分解為檢測功能與比對功能;行為層提出了人臉識別的交互設計流程閉環(huán)及影響用戶交互行為的多種因素;感知層分別論述了機和人的感知能力所面臨的諸多影響因素及基本解決思路;反饋層對比分析了直接映射和間接映射兩種反饋設計方式的優(yōu)勢與不足,最后得到人臉識別技術的層次化分析結論。文章可為廣大設計師提供基于人臉識別技術的設計方法參考。
關鍵詞:人臉識別;交互設計;層次化分析
中圖分類號:TB47 文獻標識碼:A
文章編碼:1672-7053(2020)05-0026-03
1相關概念解析
1.1.交互設計
交互設計是定義和設計人工系統(tǒng)行為的領域。它定義了兩個或兩個以上的交互個體之間的通信內(nèi)容和結構,以便它們能夠相互協(xié)作以達到共同的目的?;釉O計以“將信息技術嵌入充滿社會復雜性的物質世界”為中心,在人、產(chǎn)品和服務之間創(chuàng)造和建立有意義的關系。交互系統(tǒng)設計的目標可以從“可用性”和“用戶體驗”兩個層面來分析,重點是面向用戶的需求。
1.2人臉識別技術
人臉識別是計算機視覺的重要應用之一,廣義的人臉識別包含圖像采集、人臉檢測、人臉對齊、特征表示等過程。盡管現(xiàn)階段國內(nèi)外的人臉識別相關研究已經(jīng)進行得較為深入,但現(xiàn)存的大部分相關論文均帶有極強的技術性傾向,對于設計師而言缺乏閱讀友好性。文章從交互設計的角度出發(fā),以人臉識別技術(二維人臉識別技術)為例,利用層次化分析方法從設計師視角出發(fā),對人臉識別技術的多種設計可能及限制因素進行剖析。
2影響人臉識別技術互動的因素
基于人臉識別技術的交互活動,是人與機器、環(huán)境相互作用的結果。在互動過程中,用戶特征、設備性能、交互環(huán)境、交互動機、用戶行為、反饋布局都是影響人臉識別互動的重要因素。
2.1用戶特征
攝像頭能否持續(xù)穩(wěn)定地檢測用戶面貌,是決定交互流程能否正常進行的先決條件。攝像頭檢測結果受到光線條件和遮擋條件等影響。其中,遮擋條件既包括物理障礙物,也包括用戶自身穿戴的具備遮擋性質的裝飾物,如發(fā)型、眼鏡、帽子、圍巾等。此外,用戶自身的生理條件也是制約攝像頭檢測的條件之一,如用戶的身高、體態(tài)等。人臉檢測設備的擺放高度、用戶物理活動范圍的劃分、虛境互動界面的布局,都需根據(jù)目標用戶群體的實際情況進行合理設計。
2.2設備性能
設備性能影響人臉識別系統(tǒng)的處理速度和準確度。目前,市場上的攝像頭魯棒性維持在一個穩(wěn)定水平,在同等條件下,各類攝像頭的檢測穩(wěn)定程度趨于一致,其性能的主要差別在于設備像素高低、是否具有內(nèi)置麥克風支持語音功能等,主要影響人臉識別互動是否可附加、拓展設計更多樣的互動形式。
2.3交互環(huán)境
交互環(huán)境是影響人臉識別互動的重要因素。交互環(huán)境由多種環(huán)境條件構成,包括光照條件、人流條件、場地條件等?;璋档墓庹諚l件下,攝像頭極易無法正常工作。人流條件和場地條件是人臉識別檢測的重要干擾因素。人流量密集的場地,用戶與用戶的面部之間易造成遮擋,引發(fā)斷檢或誤檢情況。因此,開闊的互動場地,有助于保障用戶活動范圍及用戶人身安全。
交互環(huán)境同時影響人臉識別的參與人數(shù)與互動形式。在光照條件與場地面積近似的前提下,人流密集的場地,一般采用多人互動、簡易交互流程的交互設計方式,烘托群體互動的熱鬧氛圍。人流較少的場地,可考慮采用單人互動、復雜交互流程的交互設計方式,增添單人互動的游戲趣味性。
2.4交互動機
交互動機是促使用戶嘗試、執(zhí)行、維持交互行為的主觀動力。交互動機受到交互環(huán)境、項目內(nèi)容、交互流程、獎勵機制的影響。具有趣味性的交互環(huán)境布景及項目內(nèi)容能夠激發(fā)用戶的主觀參與性與互動沉浸感,順暢的交互流程與具有鼓勵性的獎勵機制能夠維持長久用戶的交互行為,促進用戶個人成就感與滿足感的達成,提供良好的參與體驗。
2.5用戶行為
用戶面部具有高度非剛性的特點,用戶的俯仰、轉頭、表情變化等行為都會造成其面部的形狀變化與角度變化。在設備性能基本持平、技術手段尚不完善的前提下,難以由設備迭代和技術更新解決該問題,需要轉而從用戶行為設計入手。由于用戶的行為具有隨意性與不確定性,因此,在考慮到用戶的自然行為習慣,選取貼合其認知的交互行為的前提下,對交互動作的動作幅度與變化角度的設計都應當有較為明顯的區(qū)別,避免因雷同動作造成的誤檢等情況。
2.6反饋布局
1)映射反饋。直接映射符合用戶的直接生活經(jīng)驗和物理世界認知,雖然更易被用戶所理解和接受,但也缺乏了相應的游戲趣味性。而間接映射正是因為不符合用戶的直接生活經(jīng)驗和物理世界認知,更易帶給用戶新鮮感,更易營造奇幻迥異的氣氛和環(huán)境,實境與虛境的差異性賦予了間接映射極大的設計空間。合理地應用自然化的間接映射,能夠幫助設計師融合直接映射易理解的優(yōu)勢與間接映射自身充滿趣味l生的優(yōu)點,完成別具一格的優(yōu)秀設計。
2)界面布局。人臉識別互動具有非接觸性的特點。用戶在物理世界產(chǎn)生位移時,其映射形象可能與系統(tǒng)界面元素產(chǎn)生重疊,形成斷檢。對引導元素、互動元素與裝飾元素進行合理布局,能夠最大限度避免上述問題。裝飾元素的布局應當采用邊緣化、弱遮擋的形式,利用虛境環(huán)境的邊界限制暗示物理世界活動范圍,同時將視覺呈現(xiàn)的中心留給具有引導意義的提示元素和具備游戲趣味的互動元素,便于用戶快速獲取關鍵反饋信息。界面元素的大小、形狀、顏色、醒目程度、出現(xiàn)順序也應當根據(jù)交互流程嚴謹設計,根據(jù)其重要程度規(guī)劃其距離視覺中心的遠近距離,有序顯示,避免位置重疊、圖像閃現(xiàn)、平均分布等布局問題。
3基于交互設計的人臉識別技術層次化分析
3.1功能層分析
人臉識別的交互流程主要分為三個階段:人臉檢測、人臉對齊/特征提取、面貌識別。這三個階段可以組成一個完整的交互閉環(huán):用戶→攝像頭拍攝用戶面貌→數(shù)據(jù)傳入計算機→處理/比對→計算機做出相應行為/信息反饋。人臉識別在這個基本的交互閉環(huán)中,顯現(xiàn)出了它的兩種基本功能:檢測功能與比對功能。
3.1.1檢測功能
人臉識別技術的檢測功能,是指利用攝像頭采集圖像數(shù)據(jù),精準辨識、定位人臉圖像位置。檢測功能的實質是兩次判定,第一次判定有無,第二次則判定位置。檢測功能的實質,是訓練功能與特征拾取表達功能的集合。
1)訓練功能。俗語說“千人千面”,就字面意思而言,人臉識別還存在著“一人千面”的有趣情況。由于人臉具有高度非剛性的特點,會隨著其水平轉動、俯仰動作、表情變化等產(chǎn)生各類遮擋或形變,攝像頭拍攝到的圖像只是人臉在某一段時間內(nèi)的連續(xù)定格,每一時刻的定格圖像都可能會存在差異。計算機需要自行判斷這一系列的圖像是否為均為人臉,才能維持檢測功能的有效性,這時就需要訓練功能的幫助。“訓練”的過程,就是讓計算機根據(jù)已有的人臉特征進行自主學習,提取、對比、判斷其他圖片是否也存在相似特征,從而判斷出該圖片是否也屬人臉。人臉識別往往擁有許多數(shù)據(jù)庫或圖片庫,庫預先將數(shù)張“人臉”與“非人臉”的圖片提供給計算機進行辨認和學習。大量對比后,計算機最終能夠智能地總結、提取“人臉”類圖片的特征。
2)特征拾取。二維人臉識別技術的特征拾取表達方式目前主要有三種。其一,以“點”定位表現(xiàn)人臉位置;其二,以“框”定位表現(xiàn)人臉位置;其三,提取人臉68特征點形成特征網(wǎng),定位表現(xiàn)人臉位置。采用點定位與框定位的人臉貼圖方式時,人臉貼圖不具有縱深,用戶左右轉動面部時,貼圖的角度不變,不能隨人臉水平轉動角度變形適應,適合多人、面具匹配精準度要求較低的互動場所;提取68特征點的定位方式,人臉貼圖具有一定的縱深,人臉水平轉動一定角度時,能夠自動形變,適應匹配該角度的人臉,適合少人或單人、對面具匹配精準度要求較高的互動場所。人臉是極具個性化的肢體部分,能夠提供給設計師的特色信息也有多種,根據(jù)不同的應用場合及人群,合理選用不同的特征拾取辦法,能夠最大程度節(jié)約設計成本,提高設計效率。
3.1.2比對功能
“檢測”進行的是“人”類與“非人”類的比對,“比對”則主要是進行“人”類中個體的差異l生比對。在檢測功能中,計算機需要自主判斷圖像數(shù)據(jù)是否為人臉,如是,則在屏幕上定位人臉的位置,如否,則不進行定位;在比對功能中,(已經(jīng)確認攝像頭采集的圖片數(shù)據(jù)A與圖片數(shù)據(jù)B均為人臉)則需要重點判斷人臉圖像A與人臉圖像B究竟是不同的人,還是同一人臉在不同時間段的位置變化。在強調安全職能領域的應用中,看重檢測和比對結果,強調真實性與一致性,弱化美觀性;在泛娛樂領域的應用中,人臉識別的比對職能弱化,檢測職能放大,檢測結果的嚴謹性要求降低,美觀性和娛樂性的要求提高,允許設計師對人臉識別結果進行形象美化設計。
3.2行為層分析
用戶的每個交互動作都是一段“過程”?!斑^程”意味著“變化性”和“不確定性”?!白兓浴迸c“不確定性”又為設計師提供了設計與規(guī)劃的空間。最大限度考慮“變化性”帶來的多種可能,就可以最大限度地減少“不確定性”造成的干擾,提升人臉識別系統(tǒng)的可用性,交互流程的穩(wěn)定性,保證用戶的交互體驗。
3.2.1交互行為
部分體感檢測設備,如Kinect,交互肢體物理位移或角度變換的幅度較大,其交互肢體的運動角度、縱深深度、位移速度等均可能成為觸發(fā)交互指令的條件,易被傳感器捕捉和精確檢測。而人臉識別技術將主要的交互肢體設定為面部。面部交互行為存在位移幅度小、旋轉角度細微、肢體特征提取方式特殊等特點。設計師需要在全面了解人臉識別的交互流程的基礎上,精確分析和解構交互流程,考慮到不同的干擾因素。
3.2.2無意識行為
在人臉識別互動過程中,除去必要的交互行為,用戶還可能出現(xiàn)的多種其他無意識行為,這就要求設計師需要盡可能全面地考慮到用戶行為的多種可能,每一種被設計師遺漏的用戶行為可能性都有可能導致交互的癱瘓。設計師可以利用視覺符號、美術形象、交互引導等,對用戶的多種行為可能進行預估、設計、規(guī)劃,減少用戶的誤操作,引導用戶順利、正確地完成預期的交互流程。
3.2.3行為限制因素
從客觀角度來說,用戶行為的規(guī)劃空間,可以以交互過程中用戶行為受到的限制性因素多少來進行判定。用戶行為的限制性因素可能來源于場地干擾、人群流量及檢測設備等,原因與表現(xiàn)的映射大體為:(1)設備檢測功能——限制用戶互動部位;(2)設備檢測范圍——限制用戶移動區(qū)域;(3)場地光照——設備靈敏程度——限制用戶動作快慢;(4)場地人流——設備抗擾能力——影響用戶交互耐心;(5)設備即時反饋靈敏度——影響用戶停留時長。
此外,其他一些主觀因素也同樣會影響用戶的交互行為。用戶自身是否遵循場地規(guī)則、是否跟隨預設的引導提示進行交互、在同一場交互體驗中是否多次反復出入檢測區(qū)等等,都可能會阻礙交互流程的順利進行。此時就要求設計師結合前文所剖析的計算機比對功能綜合考量,靈活設計。
3.3感知層分析
3.3.1計算機感知
是指設備能夠感知到外部信息的多少,受到設備檢測功能、設備檢測范圍、設備靈敏程度、設備魯棒性等多種條件的制約。但在同種條件下,同種設備的感知能力總體處于一個較為穩(wěn)定的水平。在人臉識別的檢測環(huán)節(jié),攝像頭對人臉的檢測結果受光照條件和遮擋條件的影響較大。遮擋條件包括障礙物遮擋、人臉水平轉動遮擋等多種遮擋形式。在交互環(huán)節(jié),受攝像頭檢測速率和準確程度的影響,攝像頭檢測速率越快、準確程度越高,計算機的感知能力就越好,越能快速、準確地操作反饋。設計師的設計往往受到設備實際性能的限制,應當根據(jù)實際需求合理規(guī)劃互動場所,科學選擇相應設備,規(guī)避上述影響因素可能帶來的不良后果。