亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于Leap Motion手語語音轉(zhuǎn)換的設(shè)計(jì)與實(shí)現(xiàn)

2020-05-15 15:00:25姜檬郭仁春李俊龍王志淳

無線互聯(lián)科技 2020年7期

姜檬郭仁春李俊龍王志淳

摘? ?要：文章介紹了基于Leap Motion手語語音轉(zhuǎn)換的原理以及在實(shí)際中如何實(shí)現(xiàn)應(yīng)用，其能夠?qū)⑹终Z手勢翻譯成所需語言，并且以語音的形式傳遞消息，實(shí)現(xiàn)為聾啞人“發(fā)聲”的目的。Leap Motion手語語音轉(zhuǎn)換的硬件部分采用Leap Motion體感控制器，能夠?qū)崟r(shí)采集人手指的坐標(biāo)、加速度、方向等動態(tài)手勢的運(yùn)動信息。軟件采用Unity 3D三維引擎，提供了開發(fā)手勢識別的SDK，并給出了一些基本手的模型，在Unity 3D中完成由手勢到文字，再到語音的轉(zhuǎn)換。

關(guān)鍵詞：動態(tài)手勢識別;厲動;Unity 3D

1? ? 手勢識別

手勢識別是手語語音轉(zhuǎn)換的首要步驟，包括手勢的采集與手勢識別。手勢的釆集廣泛使用的方法有數(shù)據(jù)手套[1]、專業(yè)的視頻釆集攝像機(jī)等[2]。而手勢識別的研究方向有兩個(gè)：一個(gè)是靜態(tài)手勢識別，另一個(gè)是動態(tài)手勢識別。靜態(tài)手勢識別始于20世紀(jì)初，主要利用獲取到的單個(gè)時(shí)間點(diǎn)的手勢圖像中手的形狀、手指的姿態(tài)等信息進(jìn)行手勢表達(dá)含義的識別[3]。相比于靜態(tài)手勢識別，動態(tài)手勢識別要稍晚一些，需要對連續(xù)一段時(shí)間的手勢圖像信息進(jìn)行圖像處理，通過獲取處理后的連續(xù)時(shí)間內(nèi)手、手指的位置、速度等數(shù)據(jù)信息來識別手勢表達(dá)的意義[4]。

本文提出的基于Leap Motion的手語語音轉(zhuǎn)換是基于視覺（圖像）的手勢識別系統(tǒng)[5]，采用的手勢識別系統(tǒng)是Leap Motion體感控制器，是支持C#語言的三維引擎，且提供了手勢開發(fā)的軟件開發(fā)工具包（Software Development Kit，SDK），為手勢定義成文字提供了便利條件。本文是使用C#語言對手語語音轉(zhuǎn)換進(jìn)行開發(fā)的。

2? ? Leap Motion手語語音轉(zhuǎn)換的原理

2.1? Leap Motion功能介紹

本文采用的Leap Motion是Leap公司最新研發(fā)的體感控制器，是一款微米級3D手動交互設(shè)備，十分小巧且應(yīng)用廣泛。當(dāng)手在傳感器上方活動時(shí)能夠?qū)崿F(xiàn)對手和手指的運(yùn)動追蹤。能夠追蹤到一個(gè)人10根手指的三維坐標(biāo)信息且位置精度高達(dá)0.01 mm，具有150°的超寬幅空間視場，能夠以高達(dá)每秒200幀以上的速度追蹤一個(gè)人的手部移動。延遲比顯示器的刷新率還要低，特別適合做手語翻譯器。

Leap Motion內(nèi)置兩個(gè)紅外攝像頭，從不同角度捕捉兩張畫面，重建出手掌在真實(shí)世界三維空間的運(yùn)動信息。檢測的范圍大體在傳感器上方25～600 mm之間，檢測的空間大體是一個(gè)倒四棱錐體。

Leap Motion的系統(tǒng)采用了右手笛卡爾坐標(biāo)系，返回的數(shù)值都是以真實(shí)世界的毫米為單位。如圖1所示，原點(diǎn)在Leap Motion 控制器的中心，X軸和Z軸在器件的水平面上，X軸和設(shè)備的長邊平行，Z軸和短邊平行。Y軸是垂直的，以正值增加形式朝上。

Leap Motion能夠?qū)崟r(shí)監(jiān)測信息。使用過程中，Leap Motion傳感器會定期發(fā)送關(guān)于手的運(yùn)動信息，每份信息稱為“幀”，Leap Motion傳感器會給所有手指手掌的列表和信息分配一個(gè)唯一標(biāo)識（ID），在手掌、手指或手持的工具保持在視野范圍內(nèi)時(shí)，不會改變。一旦手從設(shè)備的視野中丟失，再次被發(fā)現(xiàn)時(shí)就會重新為視野中的手分配一個(gè)全新的ID號。

2.2? Leap Motion手語語音轉(zhuǎn)換設(shè)計(jì)原理

本文對Leap Motion手語語音轉(zhuǎn)換的研究分為5個(gè)部分，即真實(shí)世界的手勢、手勢識別、屏幕中的模型手、自定義手勢代表的文字、文字轉(zhuǎn)化成語音，如圖2所示。

以“耶”的手勢為例，當(dāng)Leap Motion設(shè)備安裝完成并運(yùn)行之后，在鏡頭視野范圍之內(nèi)做“耶”的手勢，如圖3（左）所示。手的姿態(tài)通過紅外攝像頭采集到電腦上，形成如圖3（中）所示的紅外圖像，由于是雙紅外攝像頭，會形成兩張視角有一定偏差的圖像，根據(jù)這兩張圖像，可以計(jì)算出手姿態(tài)的三維信息，包括手指、手掌的位置、速度、方向和加速度。將數(shù)據(jù)傳給系統(tǒng)提供的三維手模型，屏幕上就會同步出現(xiàn)一個(gè)虛擬的三維手，如圖3（右）所示，其動作與真實(shí)手基本一致。

要自定義手勢代表的文字，調(diào)用Unity 3D中提供的手勢開發(fā)的SDK，編寫程序?qū)Α耙钡氖謩荻x成文字并在屏幕中展示該文字。最后將文字轉(zhuǎn)化成語音，利用系統(tǒng)自帶的語音庫Speechlib方法將文字轉(zhuǎn)化成語音，運(yùn)行代碼，就會有“耶”的聲音發(fā)出。

3? ? 在Unity 3D中實(shí)現(xiàn)手語、文字和語音的轉(zhuǎn)換

3.1? 手勢實(shí)現(xiàn)的原理

將a定義為右手拇指第三指節(jié)的長度，將此長度設(shè)置為參考長度。當(dāng)手指指尖與手掌中心的距離大于3個(gè)參考長度規(guī)定為張開手指，當(dāng)手指指尖與手掌中心的距離小于1個(gè)參考長度規(guī)定為握住手指。用參考長度作為判據(jù)，分別計(jì)算各個(gè)手指的指尖到手掌中心的距離，就可以識別手的某一姿態(tài)，如圖4（左）所示。

例如手勢“耶”的定義是：食指、中指指尖與手掌中心的距離大于3個(gè)參考長度，即b>3a。拇指、無名指、小指指尖與手掌中心的距離小于1個(gè)參考長度，即c

3.2? 手勢轉(zhuǎn)換成文字的實(shí)現(xiàn)過程

下載并安裝Leap Motion設(shè)備的SDK及驅(qū)動軟件，之后插入Leap Motion設(shè)備，電腦右下角狀態(tài)欄會顯示“Leap Motion Controller is on”，此時(shí)硬件安裝完畢。確?？梢哉Ｊ褂肔eap Motion設(shè)備之后，在Unity 3D中定義各種手勢所代表的文字。運(yùn)行程序后將真實(shí)手勢放在Leap Motion設(shè)備的識別范圍內(nèi)，屏幕中會出現(xiàn)與真實(shí)手相同手勢的模型手，相應(yīng)的文字同時(shí)顯示在屏幕上。

3.3? 文字到語音的轉(zhuǎn)換

Speechlib是Windows系統(tǒng)自帶的語音庫。將下載的Interop.SpeechLib.dll粘貼到unity中新建的Plugins文件夾下，即可將此語音庫引入U(xiǎn)nity中。在編譯環(huán)境中輸入‘using SpeechLib;這段代碼后，即可引入支持語音合成（Text to Speech，TTS）的核心類：SpVoice類。通過SpVoice對象調(diào)用TTS引擎。

具體實(shí)現(xiàn)以“耶”的手勢為例，當(dāng)滿足“耶”的手勢之后，實(shí)例化一個(gè)SpVoice對象v，調(diào)用該對象的Speak函數(shù)v.Speak（“耶”），系統(tǒng)就可以發(fā)出該手勢所對應(yīng)的聲音了。

4? ? 結(jié)語

本文首先介紹了Leap Motion的基本功能，接下來給出了手語語音轉(zhuǎn)換實(shí)現(xiàn)的基本步驟，即硬件應(yīng)用Leap Motion在Unity 3D的環(huán)境下對手勢進(jìn)行編程、定義手勢、轉(zhuǎn)換成語音，基本實(shí)現(xiàn)了手勢到語音的轉(zhuǎn)換。

[參考文獻(xiàn)]

[1]王鵬.動態(tài)手勢識別研究[D].大連：大連理工大學(xué)，2013.

[2]SHUKLA J，DWIVEDI A.A method for hand gesture recognition[C].Bangkok：Fourth International Conference on Communication Systems & Network Technologies IEEE，2014.

[3]HASANUZZAMAN M D，ZHANG T，AMPORNARAMVETH V，et al.Adaptive visual gesture recognition for human-robot interaction using knowledge-based software platform[J].Robotics and Autonomous Systems，2007（1）：643-657.

[4]任磊.基于Leap Motion的動態(tài)手勢識別研究[D].大連：大連理工大學(xué)，2015.

[5]楊全，彭進(jìn)業(yè).基于深度圖像信息的手語識別算法[J].計(jì)算機(jī)應(yīng)用，2013（10）：2882-2885.

Design and implementation of voice conversion based on Leap Motion sign language

Jiang Meng， Guo Renchun， Li Junlong， Wang Zhichun

（Shenyang University of Chemical Technology， Shenyang 110142， China）

Abstract：This paper introduces the principle of sign-language conversion based on Leap Motion and how to implement it in practice. It can translate gestures into the required language and transmit messages in the form of speech， so as to achieve the purpose of “voice” for deaf-mute people. The hardware part of sign-language speech conversion based on Leap Motion uses motion-sensing controller called Leap Motion， which can collect the motion information of the fingers coordinate， acceleration， direction and other dynamic gestures in real time. The software uses Unity 3D engine，? provides an SDK for developing gesture recognition， as well as some basic hand models for converting gestures to text and then to speech in Unity 3D.

Key words：dynamic gesture recognition; Leap Motion; Unity 3D