徐倩倩,陳平平
(廣州中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程學(xué)院,廣州 510006)
基于深度技術(shù)手勢(shì)的圖像分類(lèi)方法研究
徐倩倩,陳平平
(廣州中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程學(xué)院,廣州510006)
規(guī)定6種常見(jiàn)的手勢(shì),如圖1所示。
圖1 6種規(guī)定手勢(shì)圖像
利用Kinect傳感器硬件和上述的程序獲取規(guī)定6種規(guī)定手勢(shì)的深度圖像如圖2所示。
圖2 深度手勢(shì)圖像
3.1閾值分割
所謂閾值分割方法就是確定某個(gè)閾值Th,根據(jù)圖像中每個(gè)像素的灰度值大于或小于該閾值Th,來(lái)進(jìn)行圖像分割。閾值方法的數(shù)學(xué)模型如下[3]:
根據(jù)上式可知,閾值方法的核心就是閾值Th的確定方法。
3.2實(shí)驗(yàn)結(jié)果
以手勢(shì)1深度圖像進(jìn)行直方圖分析為例,其他手勢(shì)圖像以此類(lèi)推。對(duì)圖3進(jìn)行灰度值分析,可獲得如圖4的灰度直方圖,通過(guò)觀察圖3可知,深度手勢(shì)圖像中手勢(shì)的顏色幾乎接近白色,即灰度值在255附近,由圖4分析可得,在灰度值255存在一波峰波谷并且區(qū)間范圍較小,這個(gè)區(qū)間就是深度手勢(shì)圖像區(qū)域,故只要找到第一個(gè)波峰,這個(gè)波峰的灰度值就是深度手勢(shì)圖像的分割閾值。按照此辦法,尋找圖3的分割閾值為灰度值222,對(duì)圖3進(jìn)行閾值分割后如圖5所示,由此可見(jiàn)閾值分割算法對(duì)于深度手勢(shì)圖像具有較好的分割效果。
傅里葉描述符的主要思想是利用表示形狀整體頻率分量的一組數(shù)字來(lái)描述輪廓特征。傅里葉描述主要包括兩個(gè)方面:首先,需要定義一個(gè)曲線表達(dá)式。其次利用傅里葉理論將其展開(kāi)。傅里葉描述分為累加角函數(shù)和橢圓傅里葉描述等,由于橢圓描述符能保持曲線在二維空間的描述,所以本文采用橢圓傅里葉描述符對(duì)手勢(shì)圖像進(jìn)行描述。橢圓傅里葉描述符可定義為:
其中:
分別取規(guī)定手勢(shì)的深度圖像各10幅,并使用MATLAB求其橢圓傅里葉描述符,然后取手勢(shì)橢圓傅里葉描述符的前25數(shù)值,并求每種手勢(shì)10幅圖像的平均值,數(shù)據(jù)如表1所示。
圖3 深度手勢(shì)1圖像
圖4 深度手勢(shì)1圖像的直方圖
圖5 深度手勢(shì)1圖像的分割效果
以表1橢圓傅里葉描述符作為標(biāo)準(zhǔn)樣品,每種手勢(shì)再取5幅深度圖像作為測(cè)試樣品,利用歐幾里得距離公式計(jì)算其相異度,作為手勢(shì)分類(lèi)的依據(jù)。不同手勢(shì)的相異度如表2所示,相同手勢(shì)的相異度如表3所示。
由結(jié)果可知,測(cè)試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)之間的相異度越小,說(shuō)明手勢(shì)即可分類(lèi)為那一種,例如,表3中,手勢(shì)1與測(cè)試1的相異度為1.523,小于規(guī)定的量值(本文規(guī)定為2.5),即可接受為手勢(shì)1,而測(cè)試5中手勢(shì)1的相異度為3.689,大于2.5,不可接受,所以拒絕,即不是手勢(shì)1,以此類(lèi)推。
表1 6種橢圓傅里葉描述符平均后數(shù)據(jù)
表2 不同手勢(shì)的相異度
表3 相同手勢(shì)的相異度
Kinect傳感器是基于視覺(jué)手勢(shì)識(shí)別系統(tǒng)的較好的圖像采集工具。而采用橢圓傅里葉描述符對(duì)處理后的深度手勢(shì)圖像進(jìn)行描述,橢圓傅里葉描述符可以保持曲線在二維空間的描述[4]。通過(guò)計(jì)算橢圓描述符相異度的計(jì)算,橢圓描述符對(duì)于手勢(shì)具有較好的分類(lèi)效果。通過(guò)分析可得,不同手勢(shì)圖像的橢圓傅里葉描述符的差異性基本超過(guò)2.5,具有較大的差異性。而相同手勢(shì)的不同圖像的差異性較小。
[1]王輝.基于視覺(jué)的實(shí)時(shí)手勢(shì)跟蹤與識(shí)別及其在人機(jī)交互的應(yīng)用:[浙江大學(xué)碩士學(xué)位論文].杭州:浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)工程學(xué)院,2008,3-4.
[2]Pavlovic V I,Sharma R,Huang T S.Visual interpretation of hand gestures for human-computer interaction:a review.IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):677-695.
[3]江立.基于CAS-GLOVE數(shù)據(jù)手套的手勢(shì)識(shí)別技術(shù)研究:[北京交通大學(xué)碩士學(xué)位論文].北京:計(jì)算機(jī)與信息技術(shù)學(xué)院,2006,12-14.
[4]莫舒.基于視覺(jué)的手勢(shì)分割算法的研究:[華南理工大學(xué)碩士學(xué)位論文].廣州:華南理工大學(xué)電子與信息學(xué)院,2012,5-6.
Kinect Sensor;Depth of the Images;threshold Segmentation;Elliptical Fourier Descriptors
Research on the Classification Method of Gesture Image Based on the Depth Technical
XU Qian-qian,CHEN Ping-ping
(College of Information Engineering,Guangzhou University of Chinese Medicine,510006)
1007-1423(2015)19-0020-04
10.3969/j.issn.1007-1423.2015.19.005
徐倩倩(1992-),女,安徽安慶人,碩士研究生,學(xué)生,研究方向?yàn)閳D形圖像學(xué)、多媒體信息處理
2015-04-29
2015-06-20
利用微軟的Kinect傳感器采集手勢(shì)圖像,通過(guò)微軟提供的軟件開(kāi)發(fā)工具包接口,將采集的手勢(shì)圖像轉(zhuǎn)換為深度手勢(shì)圖像,并加強(qiáng)目標(biāo)區(qū)域的灰度級(jí),即手勢(shì)區(qū)域的灰度值[1]。由于深度圖像包含距離信息,同時(shí)又因?yàn)槿嗽谟檬謩?shì)示意信息時(shí),往往會(huì)將手向前伸展,這樣,手勢(shì)距離Kinect傳感器的攝像頭更近,和人體的絕大部分不在一個(gè)平面上,也就是說(shuō)手勢(shì)部分灰度值將異于身體的其他部分,這樣只要采用閾值分割算法就可以將手勢(shì)從背景中分離出來(lái)。
Kinect傳感器;深度圖像;閾值分割;橢圓傅里葉描述符
國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(No.201310572016)
陳平平(1980-),女,廣東梅州人,碩士,副教授,研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)
Uses Microsoft's Kinect sensor to capture gesture image.Through the software development tools packet interface which provided by Microsoft,changes the gesture image into depth gesture image acquisition,and strengthens the gray level value of the target area.Since the depth image contains distance information,and when people express information gestures,often will stretched forward the hands,so the gesture is closer to the camera Kinect sensor,and the vast majority of the human body is not in a plane on,that gesture is different from other parts of the gray values of the body,so long as the use of threshold segmentation algorithm can be separated from the background gesture.