亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于手部關(guān)鍵點(diǎn)檢測的手勢識別研究

        2022-08-12 01:53:30王森寶楊晉驍王子昂李世堯秦娟石艷梅
        電腦與電信 2022年5期
        關(guān)鍵詞:關(guān)鍵點(diǎn)區(qū)域檢測

        王森寶 楊晉驍 王子昂 李世堯 秦娟 石艷梅

        (天津理工大學(xué)集成電路科學(xué)與工程學(xué)院,天津 300384)

        1 引言

        手勢可以表達(dá)豐富的含義,廣泛應(yīng)用于人們?nèi)粘I钪?,隨著機(jī)器學(xué)習(xí)的不斷發(fā)展,巧妙利用多媒體機(jī)器學(xué)習(xí)模型應(yīng)用框架并對其識別算法進(jìn)行改進(jìn)是現(xiàn)在手勢識別的一個大趨勢。手勢識別在現(xiàn)代社會中具有廣泛應(yīng)用,對于AR特效,可以進(jìn)行短視頻、直播等娛樂交互場景,基于指尖點(diǎn)檢測和指骨關(guān)鍵點(diǎn)檢測,可實(shí)現(xiàn)手部特效、空間作畫等多種創(chuàng)意玩法,豐富交互體驗(yàn);在手勢進(jìn)行自定義識別的過程中,根據(jù)手部骨節(jié)坐標(biāo)信息,可靈活定義業(yè)務(wù)場景中需要用到的手勢,例如面向智能家電、可穿戴等硬件設(shè)備的操控類手勢,面向內(nèi)容審核場景的特殊手勢等。

        在傳統(tǒng)方法中,手勢識別算法通常依賴硬件設(shè)備或者基于視覺方法進(jìn)行識別[1]。Jayashree Pansare 等人創(chuàng)新性地采用網(wǎng)絡(luò)攝像機(jī)進(jìn)行實(shí)時手勢識別[2],潘志庚等人提出了基于Kinect 和膚色檢測算法結(jié)合的手勢識別系統(tǒng)[3],譚臺哲等人采用深度信息與膚色信息結(jié)合的方法[4],減少了硬件設(shè)備的影響,并且具有更高的魯棒性。此外,James Rwigema等人提出的一種差分進(jìn)化方法來優(yōu)化參數(shù)[5],但以上基于傳統(tǒng)模型的識別方法或多或少都有著受環(huán)境影響大、精度不夠高、識別速度慢等弊端。

        針對以上問題,本文基于魯棒預(yù)測控制的方法,使用手部關(guān)鍵點(diǎn)檢測迭代改進(jìn)算法,可以盡可能減少復(fù)雜環(huán)境的影響并實(shí)現(xiàn)具有較高精度的快速檢測。該方法采集包括指尖、各節(jié)指骨連接處等22個特征點(diǎn)的信息,其中包括精準(zhǔn)定位手部的21個主要骨節(jié)點(diǎn)描述指尖、各節(jié)指骨的坐標(biāo)信息,以及1個特征點(diǎn)標(biāo)記圖像采集獲取人手畫面的背景點(diǎn)。通過在標(biāo)準(zhǔn)數(shù)據(jù)集與自制數(shù)據(jù)集上進(jìn)行測試,該算法提高了有效性和精準(zhǔn)度。

        2 基本原理

        2.1 目標(biāo)選定

        在整個識別過程中需要對攝像頭所捕捉到的區(qū)域進(jìn)行信息的提取,只有提取到正確的信息才能進(jìn)一步判斷,并獲得輸出結(jié)果。信息的提取需要確定候選區(qū)域。對于候選區(qū)域的產(chǎn)生本文采用的方法是選擇性搜索[6]。

        2.2 降噪處理

        在圖像處理的過程中,當(dāng)獲取到的手勢信息轉(zhuǎn)換成可用計算機(jī)處理的數(shù)字圖像時,其手勢圖像在生成、傳輸或變換過程中會受到各種因素的干擾和影響,其畫質(zhì)將會因噪聲而在不同程度上出現(xiàn)畸變[7],因此需要先對圖像進(jìn)行預(yù)處理。預(yù)處理是對圖像做一些諸如降維、降噪的操作,主要是為后續(xù)處理提供一個大小合適的、盡可能去除無用信息的圖像。本文對噪聲的處理是使用魯棒預(yù)測控制,進(jìn)行魯棒預(yù)測控制會大幅提高其精準(zhǔn)度[8],降低噪聲對獲取圖像的影響,就可以增加部分關(guān)鍵點(diǎn)難以檢測出來的手勢圖像,擴(kuò)充識別手勢庫。

        2.3 手勢識別

        手勢識別是整體設(shè)計中關(guān)鍵的一環(huán),手勢識別的方法有很多種,不同的識別方法所建立的模型不盡相同。相對于常見且較為耗時的神經(jīng)網(wǎng)絡(luò)法[9]以及傳統(tǒng)的模板匹配法[10],本文基于手掌二維定位向量法設(shè)計手腕定位方法[11],由于正常人的五指指根以及各個關(guān)節(jié)處到手掌中心之間的距離基本相等,因而可以手腕為原點(diǎn),定位手腕為原點(diǎn)坐標(biāo),通過各個關(guān)節(jié)與手腕的角度數(shù)學(xué)運(yùn)算,對伸直手指個數(shù)進(jìn)行識別;通過角度運(yùn)算結(jié)果進(jìn)一步確定是哪根手指伸直或彎曲,由此判定相應(yīng)的手勢信息。此種方法最大的優(yōu)點(diǎn)是適用性強(qiáng),可準(zhǔn)確識別出多種手勢。

        3 基于關(guān)鍵點(diǎn)檢測的手勢識別

        手勢圖像識別首先采集圖像,其次確定候選框,進(jìn)而應(yīng)用關(guān)鍵點(diǎn)進(jìn)行算法識別。

        3.1 圖像獲取

        由于檢測圖像中存在的物體具有局部區(qū)域相似性(顏色、紋理等),所以適當(dāng)情況下需要進(jìn)行區(qū)域生長(或合并),可以有效提取圖像中信息。使用攝像頭進(jìn)行圖像采集,常用的方法有滑動窗口[12]與選擇性搜索。其中滑動窗口法是通過對輸入圖像采用不同大小的窗口進(jìn)行滑動,并采用非極大值抑制的方法進(jìn)行篩選的全局性搜索算法。但是在本實(shí)驗(yàn)之中,進(jìn)行手勢識別具有較高的實(shí)時性,滑窗法有局限性,所以在此不適用。而選擇性搜索可為物體檢測算法提供候選區(qū)域,其速度快,召回率高。產(chǎn)生初始的分割區(qū)域,然后使用相似度計算方法合并一些小的區(qū)域。通過不斷地迭代,候選區(qū)域列表中的區(qū)域越來越大,進(jìn)而完成候選區(qū)域的選擇。本文采用選擇性搜索。其算法的具體流程如圖1所示。

        圖1 圖像獲取流程

        進(jìn)行相似度的衡量時,算法主要考慮四種相似性度量,取值都在[0,1],值越大就說明越相似。它們分別是顏色相似性scolour(ri,rj)、紋理相似性stexture(ri,rj)、尺寸相似性ssize(ri,rj)和重疊相似性sfill(ri,rj),合并只能在近鄰的兩個區(qū)域間進(jìn)行,遠(yuǎn)離的兩個區(qū)域不能合并(其中ri,rj分別是候選區(qū)域中各點(diǎn)的橫坐標(biāo)與縱坐標(biāo))。

        最終相似度的度量總標(biāo)準(zhǔn)是上述四個度量的組合:

        不斷進(jìn)行區(qū)域合并,直至候選區(qū)域選擇完畢,獲取候選區(qū)域中的圖像。

        3.2 基于魯棒預(yù)測控制的降噪

        根據(jù)魯棒性的定義可知,控制系統(tǒng)由于工作狀況變動、外部干擾以及建模誤差,會產(chǎn)生一定的不確定性,精準(zhǔn)性模型很難被獲取到。而基于手勢關(guān)鍵點(diǎn)的手勢識別對依據(jù)關(guān)鍵點(diǎn)而判斷出來的彎曲或伸直狀態(tài)是尤為重要的。原算法是將采集的圖像送入手部關(guān)鍵點(diǎn)檢測器,以得到許多粗略的關(guān)鍵點(diǎn)檢測結(jié)果,關(guān)鍵點(diǎn)的3D 位置被重新投影到2D 圖片,將其和關(guān)鍵點(diǎn)結(jié)合可以訓(xùn)練網(wǎng)絡(luò)。由于原方法中噪聲的影響降低了手勢圖像的檢測精確度,故本文采取魯棒預(yù)測控制,對訓(xùn)練網(wǎng)絡(luò)進(jìn)行降噪處理。關(guān)于有界噪聲問題[13],外部噪聲的線性不確定系統(tǒng)可表示為:

        其中xk是系統(tǒng)狀態(tài),xk∈Rn;uk是系統(tǒng)輸入uk∈Rm;ωk是外部噪聲,ωk∈Rr(其中Rn,Rm,Rr是取值空間)在這里外部噪聲大多來源于周圍環(huán)境噪聲,值雖然未知但是這里假定有界。

        在整個迭代優(yōu)化過程中,對其進(jìn)行優(yōu)化控制處理[14],本文的優(yōu)化控制使用Min-max方法[15],考慮了由不確定性引起的“最壞”的情況,如果系統(tǒng)能在這種“最壞”的情況下穩(wěn)定運(yùn)行,則對于未來發(fā)生的任何一種不確定性,系統(tǒng)仍然可以穩(wěn)定運(yùn)行。其計算依據(jù):

        其中xk+N是終端狀態(tài),xk+N∈XN為終端約束條件,JN(xk+N)為終端代價函數(shù),N為預(yù)測時域,Q,R分別為相關(guān)權(quán)重。

        可以通過枚舉法得到W的頂點(diǎn),枚舉法列出所有頂點(diǎn)所要滿足的約束以保證“最壞”情況下約束滿足,但是約束數(shù)量會急劇增加,所以在經(jīng)典控制論中使用閉環(huán)回路往往可以實(shí)現(xiàn)更好的控制效果[16]。

        本文的手勢識別的模型預(yù)測采用反饋校正的方法實(shí)現(xiàn)閉環(huán)回路[17]。反饋的關(guān)鍵是利用可測量的系統(tǒng)狀態(tài)信息,對原預(yù)測系統(tǒng)進(jìn)行校正。

        3.3 手勢分類識別

        基于手部關(guān)鍵點(diǎn)的手勢分類識別由三個關(guān)鍵步驟組成,分別是:獲取二維角度、判斷手指是否彎曲、圖像識別結(jié)果輸出。本文以手勢分類識別為主線將其設(shè)計的主要思想進(jìn)行詳細(xì)分析,其手勢分類識別的流程如圖2所示。

        圖2 手勢分類識別流程圖

        1962年,Hu首次提出圖像識別的幾何矩理論,并證明了所提出的7個矩對圖像的平移、旋轉(zhuǎn)和比例變化均保持不變,再根據(jù)Hu氏理論,通過各種不同級別的幾何矩的數(shù)學(xué)組合,得到7個特征量。

        在識別中主要采用模板匹配法,將輸入圖像與模板(點(diǎn)、曲線或形狀)匹配,并根據(jù)匹配相似性進(jìn)行分類。坐標(biāo)距離、點(diǎn)集距離等,輪廓邊緣匹配、彈性圖匹配等都可以用于匹配度計算。模板匹配法的優(yōu)點(diǎn)是在小樣本的情況下速度非??欤瑢τ诠庹?、背景變化的適應(yīng)性較好,應(yīng)用范圍廣,但分類精度不高,可以識別手勢的類型有限,適用于小樣本、形狀變化小等情形。

        定義了輸入手勢圖像與10 個模板手勢圖像中任一手勢之間的距離DM。

        其中,Gi為輸入手勢的7 個矩特征分量,為模板手勢的Hu矩特征分量,ωi為各特征分量的權(quán)值,為了調(diào)節(jié)特征向量中各矩分量數(shù)量級的不一致,在實(shí)際實(shí)驗(yàn)中取ωi的值為104、1010、1015、1016。DM即為輸入手勢與模板手勢的特征距距離,DM越小表示越接近識別結(jié)果,即找到與輸入手勢特征距離最小的模板手勢,那么這個手勢即為識別結(jié)果。

        3.4 產(chǎn)生二維向量角度

        將手部分為21個關(guān)鍵點(diǎn),如圖3所示。定義21個關(guān)鍵點(diǎn)進(jìn)行二維向量的角度計算,并且計算得到大拇指、食指、中指、無名指、小拇指五個手指的角度。

        圖3 手部21個關(guān)鍵點(diǎn)

        其中二維角度計算的具體算法步驟如下:首先設(shè)置兩個向量v1,v2并對兩個向量的x,y軸賦予初始值;然后對兩個向量運(yùn)算后的結(jié)果取反余弦弧度值和角度值。再對特定的手指進(jìn)行相應(yīng)的維度計算,最后將得到的結(jié)果替換第一步中設(shè)置的兩個向量的初始值,進(jìn)行相應(yīng)的角度求解,從而得到5個手指的相應(yīng)角度值。

        3.5 判斷手指是否彎曲

        在識別過程中每一個手指都最多有兩個狀態(tài),也就是彎和直。通過對不同手指是否彎曲進(jìn)行具體判決,并將五個手指不同的組合方式表達(dá)出不同意思。因此,所有可能的情況共計:25=32 種。

        經(jīng)過查閱相關(guān)手語資料[18],發(fā)現(xiàn)其中有16種組合是絕大多數(shù)群體所通用的手勢,經(jīng)過識別之后在大眾生活中有較高的辨識度,可以進(jìn)行相對廣泛的應(yīng)用,表1 列出16 種手勢的中文含義、手指對應(yīng)彎直狀態(tài)。其手勢如圖4所示。

        表1 識別手勢匯總表

        圖4 手勢識別圖像

        判斷是否彎曲,要定義相對應(yīng)的閾值,超過某個閾值就會判定為改變狀態(tài)。

        余下16種手指彎直組合,是當(dāng)前社會中使用不太廣泛、群眾接受度不高的手勢;但是仍然具有識別價值,在人工智能快速發(fā)展的背景下,豐富交互體驗(yàn)顯得尤為重要;在手勢進(jìn)行自定義識別的過程中,可靈活定義業(yè)務(wù)場景中需要用到的手勢,并且也可以通過機(jī)器認(rèn)定的某些特性手勢進(jìn)行一些便捷操作和進(jìn)程控制。

        3.6 圖像識別

        使用者在鏡頭前擺出相關(guān)的手勢后,算法進(jìn)行檢測,直到失去對手的跟蹤為止,初始狀態(tài)識別像素點(diǎn)上的基本信息,之后對原始圖像點(diǎn)的信息進(jìn)行綜合處理[19]。

        計算機(jī)讀取輸入的圖像信息,在每個輸入圖像上運(yùn)行即進(jìn)行目標(biāo)檢測,完成畫面捕捉,將捕捉的BGR格式圖像轉(zhuǎn)換為RGB 格式圖像。從RGB 格式圖像中提取使用者的手勢,與手勢庫中手勢進(jìn)行對比,將識別結(jié)果返回到窗口,完成圖像識別。

        在其中要設(shè)置手部檢測的最小置信度值,大于這個數(shù)值被認(rèn)為是成功的檢測,默認(rèn)為0.5;同時還有目標(biāo)跟蹤模型的最小置信度值,大于這個數(shù)值將被視為已成功跟蹤的手部,這里也默認(rèn)為0.5。這里采用視頻流的方法來進(jìn)行圖像結(jié)果的輸出。

        3.7 實(shí)驗(yàn)結(jié)果與分析

        本次實(shí)驗(yàn)使用的計算機(jī)系統(tǒng)是windows10 運(yùn)行環(huán)境使用PyCharm社區(qū)版。

        通過對10 名實(shí)驗(yàn)者每個手勢進(jìn)行30 次識別測試,獲得部分手勢識別結(jié)果數(shù)據(jù),將數(shù)據(jù)進(jìn)行統(tǒng)計與分析計算,獲得所定義手勢的平均識別率。手勢識別結(jié)果如表2所示。

        表2 手勢識別結(jié)果

        文獻(xiàn)[21]基于人體膚色的方法進(jìn)行的實(shí)時手勢識別,在復(fù)雜背景下容易跟丟,導(dǎo)致識別不理想。本文所提方法,在實(shí)際的環(huán)境中手勢識別成功率平均值在94.5%以上,基于手部關(guān)鍵點(diǎn)的二維向量角度精準(zhǔn),識別結(jié)果可信度高。該方法也存在手勢動作不標(biāo)準(zhǔn)造成識別結(jié)果錯誤的缺點(diǎn)。

        本文是通過條件判斷組合來實(shí)現(xiàn)手勢的定義。在計算手勢角度值時,由于實(shí)際的手差異性和角度范圍,導(dǎo)致最終角度計算的誤差,所以無法對手部的細(xì)微變化進(jìn)行檢測。在實(shí)驗(yàn)檢測過程中可能會出現(xiàn)由于角度計算精確度不夠而導(dǎo)致識別錯誤,將會使得多種相近的手勢輸出同樣的結(jié)果,從而影響手勢庫的手勢數(shù)量,降低了代碼的實(shí)用性。

        4 結(jié)論

        本文首先對手勢識別的基本原理進(jìn)行介紹,之后介紹了手勢識別的基本流程,同時對識別代碼中所涉及的具體手勢進(jìn)行詳細(xì)的介紹。最后通過實(shí)驗(yàn)者進(jìn)行識別測試實(shí)驗(yàn),根據(jù)實(shí)驗(yàn)數(shù)據(jù)分析出最終識別效果,以及目前該方法識別失敗的可能原因與局限性。

        手勢識別作為機(jī)器與人類交互的自然方式,應(yīng)用廣泛。下一步工作將開展基于深度學(xué)習(xí)的手勢識別,進(jìn)一步提高手勢識別的成功率,做硬件移植應(yīng)用,并在保證成功率的前提下減少高計算成本和運(yùn)行時間,減少手勢識別的局限性。

        猜你喜歡
        關(guān)鍵點(diǎn)區(qū)域檢測
        聚焦金屬關(guān)鍵點(diǎn)
        肉兔育肥抓好七個關(guān)鍵點(diǎn)
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        小波變換在PCB缺陷檢測中的應(yīng)用
        關(guān)于四色猜想
        分區(qū)域
        基于嚴(yán)重區(qū)域的多PCC點(diǎn)暫降頻次估計
        電測與儀表(2015年5期)2015-04-09 11:30:52
        醫(yī)聯(lián)體要把握三個關(guān)鍵點(diǎn)
        国产高清不卡二区三区在线观看 | 国产成品精品午夜视频| 午夜国产精品一区二区三区| 国产精品人成在线观看免费 | 无码国产精品一区二区vr老人| 国产va在线播放| 国产一区二区三区18p| 人妻中文字幕乱人伦在线| www国产无套内射com| 中文字幕久久久人妻无码| 黄页免费人成网址大全| 久久人人爽人人爽人人片av高请 | 四虎影视国产在线观看精品| 91国产超碰在线观看| 日本黑人亚洲一区二区 | 无码人妻品一区二区三区精99| 亚洲高清国产品国语在线观看| av黄色大片久久免费| 亚洲熟妇av一区| 一二三四在线视频社区3| 中文熟女av一区二区| 国产91色综合久久高清| 九九热线有精品视频86| 国产一区二区精品尤物| 亚洲一区二区三区毛片| 伊人久久精品无码av一区| 无套内谢的新婚少妇国语播放| 亚洲欧美日韩中文综合在线不卡| 国产三级av大全在线爽| 中文字幕一区日韩精品| 国产一级特黄无码免费视频| 人妻少妇精品视频中文字幕国语| 男人的天堂一区二av| 精品无码久久久久成人漫画| 精品视频专区| 国产夫妻精品自拍视频| 亚洲乱色伦图片区小说| 天天爽夜夜爽人人爽曰喷水| 人妻中出中文字幕在线| 三级全黄裸体| 日本少妇人妻xxxxx18|