金松國(guó)
(江蘇大學(xué)京江學(xué)院,江蘇 鎮(zhèn)江 212013)
非接觸式界面技術(shù)已被廣泛的應(yīng)用在于殘疾人的通信和交互工具手段。但是,在當(dāng)前的大流行情況下,作為非接觸,非面對(duì)面界面的功能似乎也開(kāi)始發(fā)揮了重要作用。此外,由于近幾年在不斷地研究諸如殘疾人的導(dǎo)航之類的技術(shù)的開(kāi)發(fā),因此期望通研究過(guò)視線追蹤提高非接觸界面技術(shù)。
過(guò)去開(kāi)發(fā)的一些系統(tǒng)是將電極放在臉上以監(jiān)視眼睛的運(yùn)動(dòng)的階段[1]。隨著計(jì)算機(jī)硬件和AI技術(shù)的最新進(jìn)展,視覺(jué)的人機(jī)界面(HCI)解決方案變得越來(lái)越流行,通過(guò)基于面部或面部特征跟蹤的非接觸式HCI[2]開(kāi)始支持殘疾人。這些解決方案可以提供高精度和低成本,從而減少了用戶與硬件的直接接觸。眼位技術(shù)還應(yīng)用于殘障用戶的應(yīng)用程序,例如眼部鼠標(biāo)和鍵盤(pán),移動(dòng)用戶界面(UI)[3,4]和日常生活輔助系統(tǒng)[5]。預(yù)計(jì)它將在最近的社會(huì)現(xiàn)象中作為控制系統(tǒng)發(fā)揮重要作用。
本文所提出的情境感知多分類器檢測(cè)并跟蹤眼睛特征,跟蹤眼睛運(yùn)動(dòng)來(lái)預(yù)測(cè)圖像幀的視線。為穩(wěn)定跟蹤,應(yīng)用了高斯濾波器并對(duì)其進(jìn)行了后處理,采用ASSL來(lái)測(cè)試各種情況下的眼睛鼠標(biāo)功能,并在眼睛特征跟蹤中提供了有效的界面功能以進(jìn)行屏幕上的光標(biāo)控制。
在本文中,我們提出了一種基于眼睛跟蹤方法的眼睛鼠標(biāo)系統(tǒng),該方法使用空間情境感知的多區(qū)域識(shí)別算法。為了進(jìn)一步提高準(zhǔn)確性,本論文當(dāng)中采用了ASSL方法。本文主要包括以下三部分:眼睛區(qū)域檢測(cè),注視跟蹤和鼠標(biāo)控制。此外,為提高眼睛區(qū)域檢測(cè)的準(zhǔn)確性,將所提出的方法應(yīng)用于眼睛區(qū)域檢測(cè)單元。本文提出了一種基于情境識(shí)別的AdaBoost多域分類器算法,將其作為眼動(dòng)光標(biāo)控制的精確定位和檢測(cè)方法。輸入圖像時(shí),將執(zhí)行圖像預(yù)處理,并通過(guò)應(yīng)用高斯濾波器來(lái)消除噪點(diǎn)。并且,通過(guò)逐步比較圖像的各個(gè)區(qū)域,找到用于凝視跟蹤的眼睛區(qū)域的位置。進(jìn)而,對(duì)于實(shí)時(shí)凝視跟蹤和光標(biāo)控制,通過(guò)卡爾曼濾波器預(yù)測(cè)下一個(gè)位置并生成每個(gè)特征點(diǎn)的運(yùn)動(dòng)矢量,來(lái)執(zhí)行眼睛區(qū)域的特征點(diǎn)跟蹤。
對(duì)于非接觸式界面的實(shí)時(shí)凝視跟蹤和光標(biāo)控制,在檢測(cè)到眼睛區(qū)域后,將應(yīng)用卡爾曼濾波器來(lái)減少下一幀中眼睛特征元素的搜索時(shí)間。眼睛鼠標(biāo)的性能受跟蹤區(qū)域的大小,匹配模板的大小和復(fù)雜性,預(yù)測(cè)的目標(biāo)特征點(diǎn)的準(zhǔn)確性,特征點(diǎn)的速度以及目標(biāo)特征點(diǎn)的影響。跟蹤區(qū)域的大小是根據(jù)目標(biāo)跟蹤點(diǎn)的速度來(lái)確定的。當(dāng)目標(biāo)特征點(diǎn)快速移動(dòng)時(shí),應(yīng)使用較大的跟蹤區(qū)域,相反目標(biāo)特征點(diǎn)緩慢移動(dòng)時(shí),應(yīng)使用較小的跟蹤區(qū)域進(jìn)行估計(jì)。在前幾幀中,將目標(biāo)眼睛特征組件的位置平均,設(shè)置為中性區(qū)域的中心,并獲得該組件的大小和移動(dòng)速度。當(dāng)在連續(xù)幀中成功識(shí)別出眼睛區(qū)域的位置時(shí),系統(tǒng)進(jìn)入跟蹤階段。當(dāng)估計(jì)下一幀中目標(biāo)眼睛分量的近似位置時(shí),根據(jù)當(dāng)前狀態(tài)向量執(zhí)行該操作,并根據(jù)預(yù)期點(diǎn)的坐標(biāo),可將跟蹤區(qū)域縮小為目標(biāo)對(duì)象檢測(cè)的關(guān)注區(qū)域。在該系統(tǒng)中,可以提高眼睛區(qū)域的跟蹤速度。
為了實(shí)時(shí)執(zhí)行有效的實(shí)時(shí)注視跟蹤功能,首先要檢測(cè)眼睛的位置。收集眼睛區(qū)域樣本的數(shù)據(jù)庫(kù),并從眼睛區(qū)域樣本生成特征向量文件。第二是收集樣本數(shù)據(jù)庫(kù),而不是眼睛區(qū)域,以設(shè)置參數(shù)并學(xué)習(xí),通過(guò)預(yù)測(cè)用于光標(biāo)指向的眼睛運(yùn)動(dòng)的位置來(lái)收集訓(xùn)練數(shù)據(jù)。為了學(xué)習(xí)情境感知的多重識(shí)別器,創(chuàng)建了1022個(gè)正樣本圖像和2000個(gè)負(fù)樣本(沒(méi)有眼睛),其中包括眼睛區(qū)域。圖像包括112個(gè)具有擺角的圖像。應(yīng)用ASSL方法通過(guò)從訓(xùn)練數(shù)據(jù)集中刪除噪聲樣本來(lái)提高準(zhǔn)確性。
本文采用菲茨定律分析用戶界面結(jié)果。菲茨定律用于點(diǎn)擊和拖放圖形用戶界面的設(shè)計(jì)建模中,以模擬與屏幕指向相關(guān)的速度精度,其中起始對(duì)象0與目標(biāo)對(duì)象0相同。用10個(gè)測(cè)試人員進(jìn)行了實(shí)驗(yàn),隨機(jī)生成了5個(gè)目標(biāo)對(duì)象圖案。目標(biāo)物體的寬度定義為10、20和30像素。為了簡(jiǎn)化測(cè)試,目標(biāo)位置以圓圈形式表示。測(cè)試結(jié)果可以看出,目標(biāo)物體越大,到達(dá)時(shí)間越短。我們可以計(jì)算到達(dá)目標(biāo)物體時(shí)的難度。該值顯示了到物體的距離(D)和物體的寬度(W)之間的相關(guān)性。該值可以使用Fitts的ID(Index of Difficulty)難度指數(shù)計(jì)算得出。目標(biāo)對(duì)象的圓圈大小越大,難度指數(shù)(ID)越小,圓圈大小越小,ID越大。根據(jù)菲茨定律,距離越短,圓越大,界面越快。表1和表2比較了鼠標(biāo)指針和眼睛鼠標(biāo)指針之間的接口速度。
表1 眼睛鼠標(biāo)的速度
表2 鼠標(biāo)指針?biāo)俣?/p>
從實(shí)驗(yàn)結(jié)果可以看出,當(dāng)接近對(duì)象時(shí),由眼睛鼠標(biāo)產(chǎn)生的軌跡比常規(guī)計(jì)算機(jī)鼠標(biāo)的軌跡相對(duì)快,并且有希望用作非接觸界面。
在本文中,提出了一種多眼檢測(cè)功能,用于估計(jì)視線并基于屏幕光標(biāo)調(diào)整主動(dòng)和半監(jiān)督學(xué)習(xí)。本文使用一個(gè)多域分類器來(lái)估計(jì)眼睛區(qū)域,該分類器使用網(wǎng)絡(luò)攝像頭和ASSL算法進(jìn)行眼睛跟蹤的眼睛情境感知,并應(yīng)用卡爾曼濾波器和高斯模型來(lái)提高實(shí)時(shí)跟蹤性能。實(shí)驗(yàn)結(jié)果證實(shí),它在眼指向方面表現(xiàn)出優(yōu)異的性能,并且難度與目標(biāo)尺寸成反比。當(dāng)對(duì)象的大小較大時(shí),界面響應(yīng)速度會(huì)更快,并且可以看到,所提出系統(tǒng)的UI中的指向速度比鼠標(biāo)跟蹤要快。預(yù)期它不僅可以用作殘疾人的導(dǎo)航系統(tǒng),而且可以用作防御流行病中的重要技術(shù)。