余斐斐 米楠
摘要:對(duì)于AR研究而言,視線追蹤是其技術(shù)的關(guān)鍵,我們?cè)谝苿?dòng)設(shè)備上整合計(jì)算機(jī)畫(huà)面與現(xiàn)實(shí)景象的能力正在發(fā)展之中,這種開(kāi)發(fā)功能前景無(wú)限,它能拓展人類(lèi)與周?chē)h(huán)境互動(dòng),從環(huán)境中學(xué)習(xí)以及娛樂(lè)的能力。
關(guān)鍵詞:增強(qiáng)現(xiàn)實(shí);視線追蹤;應(yīng)用
增強(qiáng)現(xiàn)實(shí)(Augmented Reality簡(jiǎn)稱(chēng)AR)技術(shù)是近年來(lái)的一個(gè)研究熱點(diǎn),有著廣泛的應(yīng)用前景。它是對(duì)現(xiàn)實(shí)世界的補(bǔ)充,使得虛擬物體從感官上成為周?chē)鎸?shí)環(huán)境的組成部分。與傳統(tǒng)的虛擬現(xiàn)實(shí)(Virtual Reality簡(jiǎn)稱(chēng)VR)不同,增強(qiáng)現(xiàn)實(shí)只是實(shí)現(xiàn)對(duì)現(xiàn)實(shí)環(huán)境的增強(qiáng),加深了對(duì)現(xiàn)實(shí)環(huán)境的感受。在實(shí)際的AR體驗(yàn)中,因?yàn)槿说挠^察視線會(huì)不斷地變化,AR系統(tǒng)需要實(shí)時(shí)的根據(jù)用戶(hù)的視場(chǎng)重新建立位置坐標(biāo)系,進(jìn)行追蹤。而視線追蹤技術(shù)就是實(shí)時(shí)地跟蹤用戶(hù)頭部的位置和視線方向,根據(jù)這些信息來(lái)確定虛擬物體在真實(shí)空間坐標(biāo)中的位置,并將它實(shí)時(shí)地顯示在顯示器中的正確位置。
一、視線追蹤技術(shù)及其特點(diǎn)
(一)視線追蹤技術(shù)概述。
視線追蹤也稱(chēng)為眼動(dòng)追蹤,它被認(rèn)為是研究視覺(jué)信息加工的有效手段。利用專(zhuān)用設(shè)備來(lái)記錄學(xué)習(xí)者的眼球運(yùn)動(dòng)(Eve-Movement,簡(jiǎn)稱(chēng)眼動(dòng))情況,可以作為分析學(xué)習(xí)者內(nèi)部心理活動(dòng)情況的依據(jù)。關(guān)于視線追蹤技術(shù)的研究己有較長(zhǎng)歷史,目前它己在多個(gè)領(lǐng)域得到廣泛應(yīng)用。例如用于圖片廣告研究(網(wǎng)頁(yè)評(píng)估、設(shè)計(jì)評(píng)估等)、動(dòng)態(tài)分析(航空航天、體育運(yùn)動(dòng)、汽車(chē)、飛機(jī)駕駛等)、產(chǎn)品測(cè)試(可用性測(cè)試)、場(chǎng)景研究(商場(chǎng)購(gòu)物、店鋪裝演、家居環(huán)境等)和人機(jī)交互等多個(gè)領(lǐng)域。此外,視線追蹤在智能計(jì)算機(jī)、智能家電、虛擬現(xiàn)實(shí)和數(shù)字游戲等領(lǐng)域也有很好的應(yīng)用前景。
在眼動(dòng)實(shí)驗(yàn)研究中,當(dāng)被試對(duì)視覺(jué)信息進(jìn)行提取時(shí),其注視時(shí)間、注視次數(shù)、注視點(diǎn)序列、眼跳距離、回視次數(shù)、瞳孔直徑等通常被視為思維和心理加工的重要參數(shù)。因此,通過(guò)對(duì)被試在學(xué)習(xí)過(guò)程中的實(shí)時(shí)眼動(dòng)信息進(jìn)行觀測(cè),可用于分析和引導(dǎo)其學(xué)習(xí)的依據(jù)。眼動(dòng)模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運(yùn)動(dòng)(pursuit movement)。其中,持續(xù)一段時(shí)間、相對(duì)穩(wěn)定的眼球運(yùn)動(dòng)稱(chēng)為注視;眼球快速運(yùn)動(dòng)時(shí)導(dǎo)致視覺(jué)區(qū)域的聚焦點(diǎn)產(chǎn)生變化,這種行為稱(chēng)為眼跳;眼睛緩慢、平滑地追蹤某個(gè)緩慢運(yùn)動(dòng)的目標(biāo),則稱(chēng)為追隨運(yùn)動(dòng)。通過(guò)分析眼動(dòng)模式和相關(guān)參數(shù),可以獲得很多重要的信息。例如,眼跳速度會(huì)隨著疲倦程度的增加而降低,而隨著學(xué)習(xí)任務(wù)難度的增加而增加;眨眼速度和眼睛睜開(kāi)程度的降低則可能意味著疲倦的加重。因此,可以據(jù)此來(lái)確定學(xué)習(xí)者的學(xué)習(xí)精神狀態(tài),或?qū)ζ鋵W(xué)習(xí)過(guò)程進(jìn)行分析,從而采取相應(yīng)的學(xué)習(xí)策略或干預(yù)措施。
(二)視線追蹤系統(tǒng)的類(lèi)型及其特點(diǎn)。
人眼的注視點(diǎn)主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點(diǎn)的精確位置。國(guó)內(nèi)外將視覺(jué)跟蹤技術(shù)按照借助的媒介分為硬件和軟件兩種。以硬件為基礎(chǔ)的視線跟蹤的基本工作原理是利用圖像處理技術(shù),通過(guò)攝像機(jī)攝入瞳孔反射的紅外線記錄視線變化,達(dá)到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專(zhuān)用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機(jī),這種情形用戶(hù)使用較不舒適。通過(guò)軟件實(shí)現(xiàn)的視線跟蹤方法,對(duì)用戶(hù)沒(méi)有干擾,首先利用攝像機(jī)獲取頭部、臉部或眼睛圖像,再經(jīng)過(guò)軟件分析對(duì)視線定位與跟蹤。由于不需要佩戴任何裝置,用戶(hù)的自由度舒適度較好。
人與計(jì)算機(jī)交互是研究人與計(jì)算機(jī)之間溝通的技術(shù),將視線跟蹤、語(yǔ)音識(shí)別、手勢(shì)輸入、感覺(jué)反饋等引入人機(jī)交互,提高了交互的自然性和高效性。視線追蹤技術(shù)同樣引發(fā)了人機(jī)交互系統(tǒng)的改革,鼠標(biāo)、觸控板的消失,及通過(guò)追蹤人眼視線,用眼神來(lái)操作電腦、輸入文字、玩游戲。
二、視線追蹤技術(shù)在AR增強(qiáng)現(xiàn)實(shí)研究中的應(yīng)用
(一)顯示技術(shù)。
AR的簡(jiǎn)單定義就是將計(jì)算機(jī)生成的虛擬數(shù)字信息疊加到現(xiàn)實(shí)的生活場(chǎng)景中。這個(gè)“疊加”是需要通過(guò)顯示設(shè)備作為中介來(lái)實(shí)現(xiàn)。
增強(qiáng)現(xiàn)實(shí)系統(tǒng)中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設(shè)備。目前,一般的增強(qiáng)現(xiàn)實(shí)系統(tǒng)主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個(gè)基本環(huán)節(jié)構(gòu)成:虛擬信息顯示通道、真實(shí)環(huán)境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現(xiàn)實(shí)系統(tǒng)所用的浸沒(méi)式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶(hù)交互的最終接口,根據(jù)其中真實(shí)環(huán)境的表現(xiàn)方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學(xué)原理的光學(xué)透視式頭盔顯示器兩類(lèi)。
光學(xué)透視技術(shù)是通過(guò)安裝在設(shè)備眼前的光學(xué)透鏡來(lái)呈現(xiàn)出真實(shí)和虛擬世界。首先計(jì)算機(jī)生成的虛擬信息經(jīng)過(guò)光學(xué)系統(tǒng)放大后反射后進(jìn)入視野,透過(guò)透鏡又能直接看到現(xiàn)實(shí)場(chǎng)景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實(shí)現(xiàn)AR的效果。視頻透視技術(shù)是借助安裝在頭顯上的攝像頭來(lái)捕捉獲取外部真實(shí)環(huán)境,計(jì)算機(jī)將數(shù)字模擬信息疊加到攝像機(jī)的視頻信號(hào)上,再將真實(shí)場(chǎng)景和虛擬場(chǎng)景進(jìn)行融合。相比較光學(xué)透視技術(shù),它的視角場(chǎng)更大,而且不受外界的強(qiáng)光干擾。不過(guò)一旦攝像機(jī)與用戶(hù)的視點(diǎn)不能保持完全重合,會(huì)產(chǎn)生一些偏差。
(二)跟蹤注冊(cè)技術(shù)。
基于計(jì)算機(jī)視覺(jué)的注冊(cè)技術(shù)主要是指利用計(jì)算機(jī)視覺(jué)獲取真實(shí)場(chǎng)景的信息后,經(jīng)過(guò)圖像處理方面的知識(shí)來(lái)識(shí)別和跟蹤定位真實(shí)場(chǎng)景。細(xì)分可以劃為基于傳統(tǒng)標(biāo)志的注冊(cè)算法和基于自然特征點(diǎn)無(wú)標(biāo)志注冊(cè)算法?;谟?jì)算機(jī)視覺(jué)的注冊(cè)技術(shù)的精度較高,但是對(duì)計(jì)算量非常大,而且算法復(fù)雜,對(duì)系統(tǒng)的要求非常高。
為了取長(zhǎng)補(bǔ)短,得到更加精確的注冊(cè)結(jié)果,現(xiàn)在有結(jié)合兩種技術(shù)的混合注冊(cè)方法。通常是先由跟蹤傳感器大概估計(jì)位置姿態(tài),再通過(guò)視覺(jué)法進(jìn)一步精確調(diào)整定位。一般采用的復(fù)合法有視覺(jué)與電磁跟蹤結(jié)合、視覺(jué)與慣導(dǎo)跟蹤結(jié)合、視覺(jué)與GPS跟蹤結(jié)合等。
三、結(jié)論
在國(guó)外,增強(qiáng)現(xiàn)實(shí)早已在醫(yī)學(xué)、遙操作、制造與維修、可視化與教育培訓(xùn)、娛樂(lè)、軍事訓(xùn)練等領(lǐng)域取得了成功應(yīng)用。在國(guó)內(nèi),不少單位和個(gè)人對(duì)增強(qiáng)現(xiàn)實(shí)中的關(guān)鍵技術(shù)和算法進(jìn)行了研究,并且以牙科醫(yī)學(xué)、設(shè)備維修等許多背景得到了初步應(yīng)用研究。但國(guó)內(nèi)的研究目前仍多限于實(shí)驗(yàn)階段,與國(guó)外的應(yīng)用水平還有一定距離。
目前,隨著增強(qiáng)現(xiàn)實(shí)的快速發(fā)展,出現(xiàn)了許多新的研究方向,如新的顯示方式、照片真實(shí)感圖形繪制、調(diào)節(jié)現(xiàn)實(shí)、基于網(wǎng)絡(luò)的增強(qiáng)現(xiàn)實(shí)和針對(duì)戶(hù)外隨身增強(qiáng)現(xiàn)實(shí)系統(tǒng)的技術(shù)等等。其中涉及到的技術(shù)包括基于圖像的繪制(IBMR)、多通道信息融合、普適計(jì)算技術(shù)、顯示設(shè)備和跟蹤設(shè)備的隨身便攜化等。隨著系統(tǒng)性能的提高、操作過(guò)程的簡(jiǎn)化和設(shè)備成本的降低,增強(qiáng)現(xiàn)實(shí)會(huì)在越來(lái)越多的領(lǐng)域得到廣泛應(yīng)用。
參考文獻(xiàn):
[1]奚惠寧等.視線追蹤應(yīng)用技術(shù)的專(zhuān)利分析[J].電視技術(shù),2013(S2)。
[2]黃志方等.視線追蹤技術(shù)在網(wǎng)絡(luò)信息檢索中的應(yīng)用研究綜述[J].信息資源管理學(xué)報(bào),2011(2)。
[3]鐘慧娟,劉肖琳,吳曉莉.增強(qiáng)現(xiàn)實(shí)系統(tǒng)及其關(guān)鍵技術(shù)研究[J].計(jì)算機(jī)仿真,2008(1)。