文 樹子
語(yǔ)音識(shí)別技術(shù)目前已經(jīng)可以識(shí)別較短的詞語(yǔ)。
設(shè)備的性能越來越強(qiáng),但是體積卻越來越小,這已經(jīng)成為了未來幾年內(nèi)移動(dòng)智能終端發(fā)展的趨勢(shì)。與此同時(shí),因?yàn)橐苿?dòng)智能終端的體積縮小,很多傳統(tǒng)的操作設(shè)備,包括全鍵盤、指點(diǎn)桿等等,一些可以應(yīng)用在較小終端上的操作設(shè)備開始嶄露頭角。
這項(xiàng)技術(shù)已經(jīng)開始普遍地被應(yīng)用到智能手機(jī)上,iPhone就是其中的代表。在iPhone使用了兩點(diǎn)觸控技術(shù)之后,人們發(fā)現(xiàn),原來觸摸屏還可以這樣使用。而隨后蘋果更是在其系列產(chǎn)品iPod touch、Macbook和iPad上使用了兩點(diǎn)觸控技術(shù)。這其實(shí)只是多點(diǎn)觸控的初級(jí)階段,即識(shí)別亮點(diǎn)輸出,但這已經(jīng)給用戶帶來了莫大的使用便利。
通過多點(diǎn)觸控技術(shù),用戶只需要用簡(jiǎn)單的手指動(dòng)作就實(shí)現(xiàn)復(fù)雜的命令。R. Clayton Miller甚至發(fā)明了一種叫做 10/GUI的界面,讓用戶可以只用手指就能控制整個(gè)設(shè)備的使用,在電腦屏幕上,有十個(gè)可見的小圓點(diǎn)代表使用者的十個(gè)手指,當(dāng)人們的手指擠壓或移動(dòng)時(shí),就能夠執(zhí)行打開程序、滾動(dòng)頁(yè)面的操作。
多點(diǎn)觸控在實(shí)際應(yīng)用中其實(shí)分為兩個(gè)層次,首先是主控芯片同時(shí)采集多點(diǎn)信號(hào),然后才是判斷每路手指觸摸信號(hào)的意圖。微軟的Surface Computer已經(jīng)能夠同時(shí)對(duì)多個(gè)觸點(diǎn)產(chǎn)生反應(yīng)。而紐約大學(xué)的研究人員Jefferson Han還采用了受抑內(nèi)全反射技術(shù)(frustrated total internal reflection;FTIR),在36×27英寸大小背投影的屏幕上實(shí)現(xiàn)同時(shí)利用四只手指以及多人手指進(jìn)行接口的互動(dòng)。
2009年4月1日愚人節(jié)當(dāng)天,瀏覽器廠商Opera發(fā)布了一條“新聞”,聲稱其推出最新技術(shù),允許用戶在攝像頭面前做各種表情以控制瀏覽器的操作,就像Opera的鼠標(biāo)手勢(shì)一樣,這項(xiàng)技術(shù)將包含到Opera 10中。用戶通過面部表情讓瀏覽器前進(jìn),后退,上下滾動(dòng),縮放,以及刷新頁(yè)面等。當(dāng)時(shí)甚至有不少媒體對(duì)此信以為真。當(dāng)然,后來這被證明是愚人節(jié)的一則玩笑。
其實(shí),Opera這個(gè)玩笑并非空穴來風(fēng)。此前Opera已經(jīng)真正地實(shí)現(xiàn)了用鼠標(biāo)進(jìn)行“手勢(shì)控制”,只不過是用鼠標(biāo)在屏幕上實(shí)現(xiàn)二維空間中的動(dòng)作控制。另一方面,通過使用無線手柄操作,任天堂的Wii游戲機(jī)實(shí)現(xiàn)了三維空間中的手勢(shì)感應(yīng),隨后不久,多家廠商和運(yùn)營(yíng)商都推出了利用無線手柄實(shí)現(xiàn)的體感游戲,這就是手勢(shì)感應(yīng)的初步應(yīng)用。
多點(diǎn)觸摸屏將在移動(dòng)終端上越來越普及。
不過,目前的手勢(shì)感應(yīng)普遍需要借助一個(gè)與設(shè)備通過無線或者有線連接的手柄類的終端才能實(shí)現(xiàn)。如果只需要通過設(shè)備上的攝像頭或是別的硬件就可以感應(yīng)到使用者的手勢(shì)動(dòng)作并體現(xiàn)出用戶的使用意圖,那么移動(dòng)智能終端的操作模式必將開啟一個(gè)新紀(jì)元。
語(yǔ)音識(shí)別以語(yǔ)音為研究對(duì)象,它是語(yǔ)音信號(hào)處理的一個(gè)重要研究方向,是模式識(shí)別的一個(gè)分支,涉及到生理學(xué)、心理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)以及信號(hào)處理等諸多領(lǐng)域,甚至還涉及到人的體態(tài)語(yǔ)言(如人在說話時(shí)的表情、手勢(shì)等行為動(dòng)作可幫助對(duì)方理解),其最終目標(biāo)是實(shí)現(xiàn)人與機(jī)器進(jìn)行自然語(yǔ)言通信。
相比前兩項(xiàng)技術(shù),語(yǔ)音識(shí)別技術(shù)的發(fā)展相對(duì)來說更加成熟和普及。目前語(yǔ)音識(shí)別技術(shù)主要分為兩個(gè)階段。第一階段也就是初級(jí)階段,需要比對(duì)用戶留下的原音和使用時(shí)輸入的語(yǔ)音,以此來判別用戶的指令。這種類型的語(yǔ)音識(shí)別技術(shù)因?yàn)樾枰捌谟脩暨M(jìn)行一定程度的“訓(xùn)練”,即錄下需要使用的指令,使用起來有些不便,所以已經(jīng)基本被淘汰?,F(xiàn)在的語(yǔ)音識(shí)別技術(shù)處于第二階段,即不用提前訓(xùn)練就可以識(shí)別用戶的簡(jiǎn)單指令,同時(shí)還會(huì)學(xué)習(xí)用戶的口音和使用習(xí)慣,如目前諾基亞不少手機(jī)上都已經(jīng)具備了這一功能,微軟的Windows操作系統(tǒng)也開始配備了語(yǔ)音識(shí)別功能。
不過,目前的語(yǔ)音識(shí)別技術(shù)在識(shí)別較長(zhǎng)的語(yǔ)句時(shí)還存在一些問題,這也意味著目前語(yǔ)音技術(shù)只能用于操作而不能用于輸入。但是我們相信,能夠作為輸入工具取代鍵盤,將是語(yǔ)音識(shí)別在智能終端上未來的發(fā)展方向。
視覺跟蹤技術(shù)是依賴高清晰度攝像機(jī)和不可見紅外光源來達(dá)到探測(cè)人眼方向的目的,這一技術(shù)曾經(jīng)被運(yùn)用在佳能膠片單鏡頭反光相機(jī)上,但是因?yàn)樵靸r(jià)比較高,而且使用性能并不穩(wěn)定,因此并沒有引入到數(shù)碼單鏡頭反光相機(jī)上。這種跟蹤技術(shù)還會(huì)經(jīng)常被用于科學(xué)研究和廣告調(diào)研,以此確定用戶的興趣點(diǎn)所在。
對(duì)于用戶操作電腦來說,視覺跟蹤技術(shù)可以使用戶操作電腦的速度大幅度加快。但是目前來說,這項(xiàng)技術(shù)大多用于為殘障人士提供服務(wù)。GUIDe(視覺加強(qiáng)用戶界面設(shè)計(jì))研究致力于向大眾普及的視覺跟蹤技術(shù),其中包括了一款名為“Eyepoint”的軟件,能夠讓使用者將雙手放在一塊板子上,眼睛聚焦屏幕上的一個(gè)點(diǎn)以后,這個(gè)點(diǎn)周圍的區(qū)域就會(huì)放大,然后用手去擠壓那塊板就能讓程序運(yùn)行。
我們可以想象,當(dāng)這一技術(shù)運(yùn)用在移動(dòng)智能終端上的時(shí)候,我們只需要“看”一下就能操作,甚至可以用眨眼的動(dòng)作來完成操作,這樣的人機(jī)交互將會(huì)顯得更加智能。
用人眼控制已經(jīng)算是很“未來”的控制方式了,而用腦波控制可能就是目前還只會(huì)出現(xiàn)在科幻電影里的控制模式了。
只用想一想要干什么,移動(dòng)設(shè)備就能幫你完成,這種人機(jī)交互操作速度可以說就在一閃念之間。目前這種技術(shù)已經(jīng)出現(xiàn),腦控計(jì)算機(jī)交互(BCI)將神經(jīng)細(xì)胞的脈沖直接反映到電子屏幕或者機(jī)器設(shè)備上。這一技術(shù)幫助了許多身體不方便的人,包括大腦中風(fēng)患者、肌萎縮側(cè)索硬化癥患者等等不能自由移動(dòng)身體的人。但是現(xiàn)有的腦波控制系統(tǒng)的輸入端非常不適合于移動(dòng)終端使用,比如需要通過在大腦里植入電極來提供大腦的清晰神經(jīng)信號(hào),其他非植入性掃描技術(shù)則需要在大腦皮層上帶上帶電極的帽子。顯而易見,這些技術(shù)目前還不能適用于普通的移動(dòng)終端用戶。
我們可以試想一下,如果可以在移動(dòng)智能設(shè)備上配備便攜的腦波讀取設(shè)備,比如類似于耳機(jī)的接觸探頭,然后直接用腦部活動(dòng)控制設(shè)備的使用,這將會(huì)是多么美妙的用戶體驗(yàn)。