亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于手勢識別的人機交互技術(shù)研究

        2016-02-19 21:51:07吳彩芳謝鈞周開店
        計算機時代 2016年2期
        關(guān)鍵詞:手勢識別人機交互總結(jié)

        吳彩芳+謝鈞+周開店

        DOI:10.16644/j.cnki.cn33-1094/tp.2016.02.009

        摘 ?要: 手勢交流是一種自然直觀的交互方式,研究手勢識別能夠有力的推動人機交互技術(shù)的發(fā)展。回顧了手勢識別的發(fā)展歷程,列舉了一些影響力較大的手勢識別技術(shù),概括了手勢識別的現(xiàn)狀,說明了靜態(tài)手勢識別和動態(tài)手勢識別的含義;總結(jié)了常用的幾類手勢識別方法,包括基于模板匹配技術(shù)、基于概率統(tǒng)計技術(shù)和基于數(shù)據(jù)分類技術(shù),分別對其中經(jīng)典的算法進行闡述;并對人機交互領(lǐng)域的下一步研究工作做出了展望。

        關(guān)鍵詞: 手勢識別; 綜述; 人機交互; 總結(jié)

        中圖分類號:TP391.4 ? ? ? ? ?文獻標志碼:A ? ? 文章編號:1006-8228(2016)02-29-04

        Overview of human-computer interaction technology based on gesture recognition

        Wu Caifang, Xie Jun, Zhou Kaidian

        (School of Command Information System, PLA University of Science and Technology, Nanjing, Jiangsu 210007, China)

        Abstract: Gesture is a natural and intuitive communication mode, and the study of gesture recognition can strongly stimulate the development of human-computer interaction. In this paper, the development history of gesture recognition technology is reviewed, several influential gesture recognition techniques are listed; the present status of gesture recognition is summarized; the definition of the static gesture recognition an dynamic gesture recognition are explained. ?the frequently-used methods of hand gesture recognition are also summarized, including the template matching technology, gesture recognition based on probability statistics and data classification techniques. Finally, the next step in the field of human-computer interaction research work is prospected.

        Key words: gesture recognition; overview; human-computer interaction; summarize

        0 引言

        隨著計算機和互聯(lián)網(wǎng)的迅速普及,人機交互活動逐漸成為人們?nèi)粘I畹闹匾M成部分。研究自然人機交互方式可以降低操作本身難度,避免身體單一部位的勞動,可降低患頸椎病、腰間盤突出等疾病的幾率。傳統(tǒng)的人機交互方式,比如鍵盤、鼠標、遙控、觸摸屏等,都需要人去適應(yīng)機器,需要人按照預(yù)先設(shè)定的規(guī)范去操作,而現(xiàn)今技術(shù)的發(fā)展使得人機交互的方式有了更多的選擇。基于手勢識別的人機交互以直接操作為主,使人機交互技術(shù)從以機器為中心逐步轉(zhuǎn)移到以人為中心,符合人的交流習(xí)慣。因此,手勢識別正逐漸被開發(fā)和應(yīng)用于工程中。

        1 手勢識別概述

        手勢識別最早是由Grimes等人利用數(shù)據(jù)手套實現(xiàn)的,他們因此獲得了AT&T“數(shù)據(jù)手套”專利[1]。臺灣大學(xué)的Liang等人設(shè)計的手勢識別系統(tǒng)通過單個VPL數(shù)據(jù)手套實現(xiàn)了對臺灣手語課本字條的識別,準確率達到99.2%[2]。Intel的OpenCv手勢識別系統(tǒng),實現(xiàn)了與位置無關(guān)的基于立體視覺和Hu矩特征的識別。哈爾濱工業(yè)大學(xué)的高文等人用18個CyberGlove型號的數(shù)據(jù)手套,結(jié)合ANN與HMM模型訓(xùn)練手勢,實現(xiàn)了對孤立詞的識別,識別率超過90%[3]。清華大學(xué)的祝遠新、徐光祐等給出的基于視覺的識別技術(shù),能夠識別12種動態(tài)孤立手勢,識別率達90%[4]。上海大學(xué)的段洪偉用LS-SVM算法實現(xiàn)了對靜態(tài)手勢識別,并使用HMM模型實現(xiàn)了動態(tài)手勢的識別[5]。北京大學(xué)的張凱、葛文兵等人利用平面立體匹配算法得到三維手勢信息,實現(xiàn)了基于立體視覺的手勢識別[6]??偠灾?,手勢識別研究可以分為兩種:基于數(shù)據(jù)手套的手勢識別和基于視覺的手勢識別。

        基于數(shù)據(jù)手套的手勢識別需要操作者佩戴數(shù)據(jù)手套,通過它上面的傳感器獲取人手信息及手指運動軌跡和時序信息,計算機對獲取的數(shù)據(jù)進行分析識別,達到人機交互的效果[7]。雖然這種識別方法識別精度高,速度快,但是設(shè)備價格高,使用舒適感差,不是自然的人機交互方式?;谝曈X的手勢識別是通過攝像機采集包含操作者手勢的圖像序列,通過圖像分析進行識別。設(shè)備便宜易獲得,操作簡便[8]。如今攝像頭不再局限于僅僅獲取場景的二維圖,還可以獲取場景的深度信息。例如微軟的體感設(shè)備Kinect可以同時獲取場景的彩色圖像、深度圖像、人體骨骼數(shù)據(jù)等,利于分割出目標物體,并且其識別過程不受光照強度、背景、物體顏色、紋理等影響,具有很好的魯棒性[9]。因此,基于視覺的手勢識別越來越受到研究者的關(guān)注。

        2 常見的手勢識別技術(shù)

        手勢識別技術(shù)目前主要分三大類:基于模板匹配技術(shù)、基于概率統(tǒng)計技術(shù)和基于數(shù)據(jù)分類技術(shù)。模板匹配方法是先將圖像序列轉(zhuǎn)換為一組靜態(tài)形狀模式,然后在識別過程中與預(yù)先存儲的行為模板進行比較,最后從中選擇相似度最接近的已知模板所屬類別作為被測動作的識別結(jié)果。例如,Bobick等人將目標的運動信息轉(zhuǎn)化為MEI(運動能量圖像)和MHI(運動歷史圖像)兩個二維模板,采用馬氏距離度量測試樣本與模板之間的相似度[10]。該方法的優(yōu)點是計算復(fù)雜度低,實現(xiàn)簡單,缺點是無法解決運動時間快慢的影響。基于模板的技術(shù)主要有模板匹配方法、動態(tài)時間規(guī)整以及動態(tài)規(guī)劃方法等?;诟怕式y(tǒng)計的手勢識別方法是將概率統(tǒng)計的方法應(yīng)用到運動序列中,將其中間經(jīng)歷的動作定義為一個狀態(tài)之間是按照某種特定的順序所排列的,狀態(tài)和狀態(tài)間的轉(zhuǎn)移用概率來表示?;诟怕式y(tǒng)計的技術(shù)有隱馬爾科夫模型、動態(tài)貝葉斯網(wǎng)絡(luò)以及條件隨機場等方法。基于數(shù)據(jù)分類的技術(shù)有神經(jīng)網(wǎng)絡(luò)、支持向量機等。

        2.1 動態(tài)時間規(guī)整算法

        動態(tài)時間規(guī)整算法(DTW),是把時間規(guī)整與距離測度計算結(jié)合起來的一種非線性技術(shù),是一種經(jīng)典的模板匹配算法,最初用在孤立詞的語音識別中,可以解決序列長短不一的模板匹配問題。DTW算法涉及兩個序列,一個是模板序列,一個是待測序列,主要思想是利用動態(tài)規(guī)劃方法尋找一條科學(xué)的時間校準匹配路徑,而匹配路徑就是序列上點與點的映射關(guān)系。對于時間軸存在差異的兩條序列,DTW算法可以消除時間軸上的差別,使它們之間的失真度達到最小,其方法是對序列進行全局或局部擴展、壓縮或者變形,跟另外一個序列的時間軸重疊度達到最大[11]。

        設(shè)待測手勢序列為X=(x1,x2,…,xn),手勢模板序列為Y=(y1,y2,…,ym),n和m表示手勢幀的時序標號,構(gòu)造一個矩陣C,矩陣中任一元素c(xi,yj)表示待測手勢序列中第幀的特征向量與模板序列中第幀的特征向量之間的距離。一般情況下,xi和yj越為相似,則c(xi,yj)的值越小,也就是這兩個特征向量的距離越短,我們稱代價小。反之向量間的距離越大,代價越大。這樣問題就可以轉(zhuǎn)化為在該矩陣中尋找一種路徑,使X和Y之間的距離最小。這條路徑同時滿足以下條件:路徑起點是矩陣的左下角,終點是矩陣右上方;路徑上直接相連的任意兩點在矩陣中是相鄰的;路徑具有非遞減性n1?n2?…?nL且m1?m2?…?mL。一條合法的X和Y之間的路徑P的總代價cp(X,Y)定義為:

        一條和之間最優(yōu)化的平均路徑p*是在所有可能的路徑中代價最小的路徑。則X與Y 之間的DTW距離DTW(X,Y)就定義為平均路徑p*的代價。

        使用DTW算法進行手勢識別,首先需要對模板進行訓(xùn)練,為每個手勢提取特征,歸一化處理成一個序列作為模板。DTW算法將待測手勢與模板手勢庫中的每一個模板進行匹配,DTW距離最小的模板作為識別結(jié)果返回。

        2.2 隱馬爾科夫模型

        和DTW算法進行比較,HMM具有明顯的優(yōu)點,其可同時對時空特性及其相關(guān)性建立模型,具有性能良好的時變數(shù)據(jù)匹配性。

        在隱馬爾科夫模型中存在著兩個隨機的過程:一個是可觀察的狀態(tài),一個是隱藏狀態(tài)。兩個過程之間存在著一定的關(guān)系,隱過程必須通過觀察序列表現(xiàn)出來。一個HMM可用一個5元組{N,M,π,A,B}表示,其中N表示隱藏狀態(tài)的數(shù)量,M表示可觀測狀態(tài)的數(shù)量,π={πi}為初始狀態(tài)概率,A={aij}為隱藏狀態(tài)的轉(zhuǎn)移矩陣P(xt(i)|xt-1(j)),B={bjk}表示某個時刻因隱藏狀態(tài)而可觀察的狀態(tài)的概率,即輸出概率矩陣,P(ot(i)|xt(j))。

        由于手勢是一個連續(xù)的過程,所以宜采用連續(xù)密度隱馬爾科夫模型。連續(xù)密度隱馬爾可夫模型的每個狀態(tài)的概率密度函數(shù)是由個連續(xù)高斯密度函數(shù)描述,即CDHMM模型的狀態(tài)輸出采用多維高斯概率密度分布:

        其中N(o,μjk,∑jk)為多維高斯概率密度函數(shù),o為觀察適量序列(o1,o2,…,oT),即從Kinect中提取的特征矢量序列,T為觀察矢量序列的時間長度,μjk和∑jk為第k個高斯混合度的均值矢量和協(xié)方差矩陣,參數(shù)cjk是混合權(quán)重,滿足約束條件。

        使用HMM經(jīng)常要解決以下三類基本問題。

        ⑴ 估值問題:已知模型HMM,計算某一給定可觀察狀態(tài)序列的概率。這類問題通常使用前向算法(forward algorithm)來解決。

        ⑵ 解碼問題:根據(jù)可觀察狀態(tài)的序列找到一個最可能的隱藏狀態(tài)序列。這類問題通常使用維特比算法(viterbi algorithm)來解決。

        ⑶ 學(xué)習(xí)問題:這是最難的HMM應(yīng)用。也就是根據(jù)觀察序列和其代表的隱狀態(tài),估算該連續(xù)型隱馬爾科夫模型參數(shù)。使得CDHMM模型能夠最好的描述我們所見的這個現(xiàn)象規(guī)律。這類問題通常使用前向后向算法(forward-backward algorithm)來解決[12]。

        使用CDHMM進行手勢識別,首先需要訓(xùn)練HMM模型。每種手勢對應(yīng)一個HMM模型。提取代表某手勢的特征向量,作為訓(xùn)練HMM模型的觀察序列,使用前向后向算法訓(xùn)練出HMM模型。在進行手勢識別的時候,先將待測手勢提取特征向量,使用前向算法分別求每個HMM模型產(chǎn)生該手勢的序列的概率,則使得這個概率最大的HMM模型對應(yīng)的手勢即為識別出的結(jié)果。HMM需要假設(shè)觀察序列是基于條件獨立的,這種不確切的假設(shè)導(dǎo)致其不能表示時間序列中的上下文依賴關(guān)系以及序列間的特征多重重疊。

        [獲取數(shù)據(jù)][預(yù)處理][特征提取][CDHMM

        模型庫][Viterbi

        算法][識別結(jié)果] [訓(xùn)練][識別]

        圖1 ?使用隱馬爾科夫進行手勢識別的流程圖

        2.3 姿勢序列有限狀態(tài)機的識別方法

        林水強等人使用有限狀態(tài)機的方法有效識別人體動作,這種方法也可借鑒到手勢識別中[13]。將手勢動作分解成對應(yīng)的關(guān)節(jié)點的連續(xù)運動軌跡,在運動軌跡中選出幾個離散的關(guān)鍵點,不同的運動軌跡可以由不同的關(guān)鍵點組合代表,每個關(guān)鍵點代表一個姿勢狀態(tài),動態(tài)手勢的識別由識別狀態(tài)轉(zhuǎn)移的過程實現(xiàn)。根據(jù)這種思想,提出姿勢序列有限狀態(tài)機的識別方法識別預(yù)定義的手勢動作,姿勢序列表示一個動態(tài)手勢由多個靜態(tài)手勢在時間軸上描述的一組運動序列,姿勢序列有限狀態(tài)機描述了每個動態(tài)手勢的有限狀態(tài)以及各個狀態(tài)之間的轉(zhuǎn)移過程。定義姿勢序列有限狀態(tài)機為A,它可以用一個五元組表示:

        A=(S,∑,δ,s0,F(xiàn))

        其中,S表示狀態(tài)集{s0,s1,…,sn,f0,f1},其對動態(tài)手勢的每個特定的姿勢狀態(tài)進行描述;∑表示輸入的手部節(jié)點特征向量和限制參數(shù)字母表{u,┐p,┐t},其中符號“┐”表示邏輯否定;δ為轉(zhuǎn)移函數(shù),定義為S×∑→S,表示姿勢序列FSM從當前狀態(tài)轉(zhuǎn)移到后繼狀態(tài);s0表示開始狀態(tài);F={f0,f1}為最終狀態(tài)集合,分別表示識別成功狀態(tài)和識別無效狀態(tài)。

        字母表∑中,變量u代表某個動態(tài)手勢類型對應(yīng)的所有手部節(jié)點特征向量V的集合,特征向量表示手運動軌跡在空間網(wǎng)格中的離散點域規(guī)則,通過點域規(guī)則可以構(gòu)造出動態(tài)手勢的軌跡正則表達式。

        路徑限制p={xyz|x∈[xmin,xmax],y∈[ymin,ymax],z∈[zmin,zmax]}對特定的姿勢進行關(guān)鍵點的范圍控制,在任何情況下超出預(yù)定義路徑范圍,即┐p為真,則被標記為無效狀態(tài)。

        時間戳t∈[tstart,tend]規(guī)定了手勢在當前狀態(tài)到后繼狀態(tài)轉(zhuǎn)移所需要的時間,若手勢的某個狀態(tài)在規(guī)定的時間內(nèi)未轉(zhuǎn)移到后繼有效狀態(tài),即┐t為真,則跳轉(zhuǎn)到無效狀態(tài)。每個動態(tài)手勢由幾個典型的靜態(tài)手勢構(gòu)成,靜態(tài)手勢對應(yīng)已定義的狀態(tài)量,每種狀態(tài)量由關(guān)鍵點特征數(shù)據(jù)在空間網(wǎng)格中計算得到,動態(tài)手勢狀態(tài)轉(zhuǎn)移必須滿足路徑限制p和時間戳t的條件,從而識別動態(tài)手勢。通過五元組可以描述姿勢序列有限狀態(tài)機的各項屬性特性以及每一步轉(zhuǎn)移過程。

        在初始狀態(tài)s0下,按照待測手勢達到第一個有效狀態(tài)s1,如果下一時刻的手勢仍然在預(yù)定義的范圍內(nèi),則達到后繼有效狀態(tài)sk。以此類推,直至達到成功狀態(tài)f0,即手勢識別成功。在任意有效狀態(tài)下,如果行為超出路徑限制或者時間戳范圍,則直接標記該序列手勢為無效狀態(tài),即手勢識別失敗。在達到任意結(jié)束狀態(tài)后,當前的姿勢序列有限狀態(tài)機運行完畢,重新初始化進行下一組動作手勢的識別。

        3 結(jié)束語

        當今智能設(shè)備充斥在人們生活的各個角落,人機交互技術(shù)的發(fā)展使得這些設(shè)備的性能越來越流暢,因此手勢識別作為人機交互技術(shù)的重要組成部分而成為研究熱點。本文研究了手勢識別技術(shù),詳細介紹了動態(tài)時間規(guī)整算法、隱馬爾科夫算法、姿勢序列有限狀態(tài)機法。下一步在提高手勢識別率方面,要研究使某一手勢識別算法的識別率最大化的多種手勢特征的特征選擇和優(yōu)化處理問題;在手勢多樣化方面,要研究結(jié)合動態(tài)手勢和靜態(tài)手勢的復(fù)雜手勢的識別方法。隨著人臉識別、語音識別、眼球追蹤等模式識別技術(shù)如雨后春筍般出現(xiàn),人機交互有了更加廣泛的詮釋方式,研究結(jié)合多種識別技術(shù)設(shè)計出更加自然流暢的人機交互系統(tǒng)也是很重要的工作。

        參考文獻(References):

        [1] Grimes G J. Digital data entry glove interface device[P]. US

        Patent, 4,414,537, Bell Tele Phone Laboratories, November 1983.

        [2] R-H Liang, M Ouhyoung. A real-time continuous gesture

        recognition system for sign language.In: Proc of the 3rd Intel Conf on Automatic Face and Gesture Recognition. Nara, Japan: IEEE Computer Society,1998:558-565

        [3] 吳江琴,高文,陳熙霖.基于數(shù)據(jù)手套的漢語手指字母的識別[J].

        模式識別與人工智能,1999.12(1):74-78

        [4] 任海兵,祝遠新,徐光祐等.基于視覺手勢識別的研究綜述[J].

        電子學(xué)報,2000.2:118-121

        [5] 段洪偉,陳一民,林鋒.基于LSSVM靜態(tài)手勢識別[J].計算機

        工程與設(shè)計,2004.12.

        [6] 張凱,葛文兵,汪國平,董士海.基于立體視覺的自然手勢識別[A].

        第一屆建立和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議論文集[C],2005.

        [7] HolgerKenn, Friedrich Van Megen, and Robert Sugar. A

        glove-based gesture interface for wearable computing applications.Applied Wearable Computing(IFAWC),2007 4th International Forum ?on,2007:1-10

        [8] 孔曉明,陳一民,陳養(yǎng)彬等.基于視覺的動態(tài)手勢識別[J].計算

        機工程與設(shè)計,2005.26(11):76-78

        [9] Stefan Stegmueller. Hand and finger tracking with Kinect

        depth data,2011.http://candescentnui.codeplex.com.

        [10] Davis J W, Bibick A F. The representation and

        recognition of human movement using temporal templates[A]. Proceedings of IEEE Conference on Computer Vision andPattern Recognition[C]. San Juan, PR, USA: IEEE Press,1997:928-934

        [11] 姚桂林,姚鴻勛,姜峰.一種基于DTW/ISODATA算法的多

        層分類器手語識別方法[J].計算機工程與應(yīng)用,2005.41(8):45-47

        [12] 常亞南.基于HMM的動態(tài)手勢識別[D].華南理工大學(xué),2012.

        [13] 林水強,吳亞東,余芳,楊永華.姿勢序列有限狀態(tài)機動作識別

        方法[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2014.26(9):5-6

        猜你喜歡
        手勢識別人機交互總結(jié)
        基于手勢識別的工業(yè)機器人操作控制方法
        基于紅外的非接觸式手勢識別系統(tǒng)設(shè)計
        基于嵌入式的智能手表設(shè)計
        某型柴油機虛擬維修系統(tǒng)研究
        孕足月低位水囊引產(chǎn)聯(lián)合靜滴縮宮素的臨床觀察及總結(jié)
        小學(xué)數(shù)學(xué)教師專業(yè)發(fā)展之我見
        長期留置導(dǎo)尿管病人護理的探討
        今日健康(2016年12期)2016-11-17 13:20:04
        人機交互課程創(chuàng)新實驗
        計算機教育(2016年7期)2016-11-10 09:01:27
        復(fù)雜背景下的手勢識別方法
        關(guān)于中考作文的一點建議(一)
        国产xxx69麻豆国语对白| 亚洲国产综合专区在线电影| 欧美亚洲国产精品久久久久| 国产av自拍在线观看| 国产一区二区三区激情视频| 好紧好爽免费午夜视频| 亚洲国产韩国欧美在线| 欧美韩国精品另类综合| 国产成人综合亚洲国产 | 日本午夜国产精彩| 日韩精品极品免费观看| 国产av剧情精品麻豆| 在线精品亚洲一区二区动态图| 国产女厕偷窥系列在线视频| 亚洲av熟妇高潮30p| 久久国产高潮流白浆免费观看| 国产免费成人自拍视频| 18禁止看的免费污网站| 国产高颜值大学生情侣酒店| 丝袜欧美视频首页在线| 丰满人妻一区二区三区精品高清| av黄色在线免费观看| 亚洲熟妇久久精品| 久久久久亚洲av无码专区桃色| 免费无码黄网站在线观看| 人妻在线有码中文字幕 | 国产亚洲精品第一综合麻豆| AV无码人妻一区二区三区牛牛| 一个人午夜观看在线中文字幕 | 免费视频成人 国产精品网站| 久久亚洲国产高清av一级| 少妇激情av一区二区三区| 樱桃视频影视在线观看免费| 国产偷国产偷亚洲欧美高清| 中文字幕一区二区区免| 丰满少妇按摩被扣逼高潮| 久久不见久久见中文字幕免费| 久久99精品久久久久久齐齐百度 | 亚洲国产精品无码成人片久久| 任你躁国产自任一区二区三区 | 亚洲va中文字幕无码毛片|