趙有強
(西華大學,四川 成都 610039)
?
基于視覺的手勢識別在軟件中的應用
趙有強
(西華大學,四川 成都 610039)
在計算機高速發(fā)展的今天,計算機已經成為了人們生活中的一部分。同時,用戶對軟件的要求越來越高,如何實現人機更好的交互,帶給用戶更好的體驗,已經成為現在一個軟件必須考慮甚至是吸引客戶的關鍵。基于視覺的手勢識別的技術,是實現新一代人機交互不可缺少的一項關鍵技術,使用計算機通過攝像頭理解人們的手勢并做出相應的反應,使人們擺脫了傳統(tǒng)的鍵盤鼠標,通過這種技術,可以更好的實現人機的交互,從而給用戶更好的體驗。手勢識別技術,由簡單粗略的到復雜精細的,大致可以分為三個等級:二維手型識別、二維手勢識別、三維手勢識別。本文主要介紹了手勢識別技術的分類、基本原理及簡單其應用。
人機交互;手勢識別;軟件應用
1.1 二維手型識別。二維手型識別,也可稱為靜態(tài)二維手勢識別,識別的是手勢中最簡單的一類。這種技術在獲取二維信息輸入之后,可以識別幾個特定的靜態(tài)手勢,比如握拳或者五指張開。在使用了他們的軟件之后,用戶可以用幾個預先設定好的手型來控制播放器?!办o態(tài)”是這種二維手勢識別技術的重要特征,這種二維的手型識別只能識別靜態(tài)的手勢,而不能感知手勢的“持續(xù)變化”,只能識別幾個靜態(tài)的特定手勢,如果換成其他的手勢,那么就沒有作用了。所以這種技術說到底是一種模式匹配技術,通過一些計算機視覺算法來分析圖像,和預設的圖像模式進行比對,從而理解這種手勢的含義,進而執(zhí)行相應的操作或者實現相應的功能。
1.2 二維手勢識別。二維手勢識別,和二維手型識別相比較,更新一些,可以說是二維手型識別的改進版,但是它仍然基本不包含和深度相關的信息,仍停留在二維的層面上。二維的手勢識別技術,可以識別一些簡單的二維手勢動作,我們可以用(X坐標,Y坐標)來表示坐標系,擁有了動態(tài)的特征,可以追蹤手勢的運動,進而識別將手勢和手部運動結合在一起的復雜動作。這樣一來,我們就把手勢識別的范圍真正拓展到二維平面了。運用這種技術,我們不僅可以通過手勢來控制計算機播放/暫停某些應用型的軟件功能,比如音樂播放等,我們還可以實現前進/后退/向上翻頁/向下滾動這些需求二維坐標變更信息的復雜操作了。比如實現PPT的播放功能等。
1.3 三維手勢識別。三維手勢識別需要的輸入是包含有深度的信息,可以識別各種手型、手勢和動作。相比于前兩種二維手勢識別技術,三維手勢識別不能再只使用單個普通攝像頭,因為單個普通攝像頭無法提供深度信息。要得到深度信息需要特別的硬件,目前世界上主要有3種硬件實現方式:結構光(Structure Light)、光飛時間(Time of Flight)、多角成像(Multi-camera)。然后在運用相應的先進的計算機視覺軟件算法,就可以實現三維手勢識別。
1.4 手勢識別的原理。要想完成一次手勢的識別,那么,一個基于視覺手勢識別系統(tǒng)的構成應包括:圖像的采集,預處理,特征提取和選擇,分類器的設計,以及手勢識別幾個步驟。首先通過攝像機獲取視頻數據流,系統(tǒng)根據手勢輸入的交互模型檢測數據流里是否有手勢出現,如果有,則把該手勢從視頻信號中切分出來,然后選擇手勢并分析,分析過程包括特征檢測和模型參數估計,分析完成后,根據模型參數對手勢進行分類并根據需要生成手勢描述。最后,系統(tǒng)根據生成的描述去驅動具體應用。其中預處理時手勢的分割,特征提取和選擇,以及手勢識別采用的算法是最關鍵的三個點。
1.4.1 手勢分割?,F在的分割方法大致可以分為三類:一是基于直方圖的分割,即閾值法,通常取灰度直方圖;二是基于局部區(qū)域信息的分割,如基于邊緣和基于區(qū)域;三是基于顏色等一些物理特征的分割方法。
1.4.2 特征提取和選擇。手勢本身具有豐富的形變,運動以及紋理特征,選取合理的特征對于手勢的識別至關重要。目前,常用的手勢特征有:輪廓、邊緣、圖像矩、圖像特征向量以及區(qū)域直方圖特征等。
《基于計算機視覺的手勢識別研究》中提到了多尺度模型,它采用這種模型提取手勢的指尖的數量和位置,將指尖和掌心連線,采用距離公式計算各指尖到掌心的距離,再采用反余弦公式計算各指尖與掌心連線間的夾角,將距離和夾角作為選擇的特征。對于靜態(tài)手勢識別而言,邊緣信息是比較常用的特征。
1.4.3 手勢識別。目前,靜態(tài)手勢識別技術主要有三類:第一類為模板匹配技術,主要是把待識別的手勢特征參數和預先設定的模板特征參數進行匹配,通過兩種相似度來識別。第二類為統(tǒng)計分析技術,這種技術從原始數據中提取特定的特征向量,對這些特征向量進行分類,然后在進行分類識別。第三類為神經網絡技術,常用的是BP神經網絡(Error Back Propagation Neural Network 誤差反向傳播神經網絡)。
不管是二維的手勢識別技術還是三維的手勢識別技術,都被運用在了市場上很多的軟件和設備上。
從企業(yè)范圍來看,運用二維手型識別的代表公司是以前被Google收購的Flutter。運用二維手勢識別的代表公司是來自以色列的PointGrab,EyeSight、ExtremeReality以及南京的Zienon。運用三維手勢識別技術的代表公司PrimeSense、SoftKinetic及Leap Motion。
從應用上來看,和VR結合的uSens凌感、PrimeSense公司為大名鼎鼎的微軟家XBOX 360所做的Kinect一代等都是運用了手勢識別技術。
從設備上來看,無論是在電視機上的運用,還是在汽車上的運用,手勢識別技術已經出現在了我們的身邊,雖然現在很多還只是初步的,為了賺一個喙頭。但是,在科技高速發(fā)展的今天,相信廣泛的應用這項技術已經不遠了,而且必將帶給我們良好的體驗。
[1] 劉俊梅,阮秋琦.一種復雜背景下的手勢分割新方法[J].北京電子科技學院學報,2006,14(2):23-26.
[2] 江鐵成.基于視覺手勢識別技術的實踐研究[J].合肥師范學院學報,2016(03)
[3] 郭雷,動態(tài)手勢識別技術綜述[J].軟件導刊,2015(07)
[4] 李映輝,史卓,安亞磊.基于Leap Motion的三維手勢識別方法[J].現代計算機:專業(yè)版,2016(14)
[5] 陳衛(wèi)國,基于計算機視覺的手勢識別研究.廣西大學,2006
趙有強(1993-),男,漢族,四川瀘州人,本科在校生,西華大學。
TP391.4
A
1671-1602(2016)20-0014-01