摘? 要: 當(dāng)前我國(guó)人工智能技術(shù)水平有了長(zhǎng)足的進(jìn)步,給人民群眾的日常生活帶來了較大的便利,故而在人機(jī)交互技術(shù)方面的需求也不斷上漲。手勢(shì)是人類使用頻率最高的肢體語(yǔ)言之一,運(yùn)用手勢(shì)進(jìn)行溝通顯得直觀有效、自然簡(jiǎn)潔,而在機(jī)器學(xué)習(xí)背景之下,結(jié)合人工智能技術(shù)完成對(duì)人體手勢(shì)的識(shí)別就成了當(dāng)前的重要研究問題?;诖耍疚母攀隽藱C(jī)器學(xué)習(xí)的基本內(nèi)涵及種類,并分析了手勢(shì)識(shí)別技術(shù)中的要點(diǎn),以求為人工智能的發(fā)展提供理論上的支持。
關(guān)鍵詞: 人工智能;機(jī)器學(xué)習(xí);手勢(shì)識(shí)別
中圖分類號(hào): TP301? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? DOI:10.3969/j.issn.1003-6970.2020.10.032
本文著錄格式:徐琛玥. 機(jī)器學(xué)習(xí)背景下手勢(shì)識(shí)別技術(shù)探究[J]. 軟件,2020,41(10):132134
【Abstract】: At present, the level of artificial intelligence technology in China has made great progress, which brings great convenience to people's daily life, so the demand for human-computer interaction technology is also rising. Gesture is one of the most frequently used body language. Using gesture to communicate is intuitive, effective, natural and concise. Under the background of machine learning, the combination of artificial intelligence technology to complete the recognition of human gesture has become an important research issue. Based on this, this paper summarizes the basic connotation and types of mechanical learning, and analyzes the key points of gesture recognition technology, in order to provide theoretical support for the development of artificial intelligence.
【Key words】: Artificial intelligence; Machine learning; Gesture recognition
0? 引言
當(dāng)前諸如模板匹配、人工神經(jīng)網(wǎng)絡(luò)以及隱馬爾科夫模型這類背景下的手勢(shì)識(shí)別算法有著較為廣泛的飲用,但其計(jì)算顯得較為復(fù)雜,相比之下基于機(jī)器學(xué)習(xí)的手勢(shì)識(shí)別有著較為現(xiàn)主要的優(yōu)勢(shì),能夠提取多層網(wǎng)絡(luò)簡(jiǎn)化的高價(jià)值信息,所取得的識(shí)別效果更佳。
1? 機(jī)器學(xué)習(xí)的基本內(nèi)涵及種類
機(jī)器學(xué)習(xí)涉及到了不同領(lǐng)域的相關(guān)知識(shí),且將這類知識(shí)進(jìn)行了有效的整合,主要是研究計(jì)算機(jī)怎樣對(duì)人類的學(xué)習(xí)行為進(jìn)行正確的模擬,并根據(jù)人類的經(jīng)驗(yàn)來掌握相應(yīng)的技能及知識(shí),再經(jīng)過不斷學(xué)習(xí)之后改良與優(yōu)化人類的知識(shí)結(jié)構(gòu)。在進(jìn)行機(jī)器學(xué)習(xí)時(shí),人類所擁有的經(jīng)驗(yàn)基本上能夠類比于及計(jì)算機(jī)中的數(shù)據(jù)信息、人類所掌握的學(xué)習(xí)水平則能夠類比于計(jì)算機(jī)中的學(xué)習(xí)算法,人類所具備的知識(shí)結(jié)構(gòu)則能夠類比于計(jì)算機(jī)中的模型。那么便能夠得知,機(jī)器學(xué)習(xí)主要是指在計(jì)算機(jī)中深入分析海量數(shù)據(jù)信息,根據(jù)自身的學(xué)習(xí)算法來明確數(shù)據(jù)信息中所蘊(yùn)含的基本特點(diǎn)及規(guī)律,并在持續(xù)的學(xué)習(xí)過程之中獲得相應(yīng)的經(jīng)驗(yàn)及知識(shí)模型,進(jìn)而能夠預(yù)測(cè)未知的數(shù)據(jù)信息。
根據(jù)機(jī)器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)信息是否已經(jīng)完成標(biāo)準(zhǔn),可以劃分成半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及監(jiān)督學(xué)習(xí)三種類型。其中監(jiān)督學(xué)習(xí)主要是指所標(biāo)注的數(shù)據(jù)信息與訓(xùn)練數(shù)據(jù)信息之間能夠達(dá)成某種統(tǒng)一,一般劃分成分類及回歸兩種種類。諸如KNN算法、SVM算法、邏輯回歸算法以及決策樹等屬于分類算法的范疇;多項(xiàng)式回歸、線性回歸以及嶺回歸則屬于回歸算法的范疇。而無監(jiān)督學(xué)習(xí)主要是指并不依賴與標(biāo)注信息,而是直接分析相應(yīng)的訓(xùn)練數(shù)據(jù)信息,并對(duì)其中所體現(xiàn)出來的規(guī)律進(jìn)行總結(jié),明確其分布情況,進(jìn)而將這類數(shù)據(jù)信息劃分成不同的簇。諸如主成分分析法(Principal Component Analysis,PAC)以及K-means算法都是無監(jiān)督學(xué)習(xí)中的關(guān)鍵算法,能夠有效聚類相應(yīng)的數(shù)據(jù)信息。半監(jiān)督學(xué)習(xí)則是將監(jiān)督學(xué)習(xí)以及無監(jiān)督學(xué)習(xí)之間的基本特征進(jìn)行了有機(jī)的融合,這主要是因?yàn)樵趯?shí)際統(tǒng)計(jì)相應(yīng)數(shù)據(jù)信息時(shí),無法確保所有數(shù)據(jù)信息都能夠具備相應(yīng)的標(biāo)簽,為了讓所有數(shù)據(jù)信息的作用能夠得到最大化地發(fā)揮,半監(jiān)督學(xué)習(xí)算法應(yīng)運(yùn)而生。諸如半監(jiān)督支持向量機(jī)算法(SVMs)以及graph-basedmethods圖論算法都是半監(jiān)督學(xué)習(xí)中的常見算法。
2? 基于膚色的多手勢(shì)圖像精準(zhǔn)分割算法技術(shù)要點(diǎn)
膚色作為人類較為鮮明且直觀的特點(diǎn),與其余手勢(shì)特點(diǎn)有所不同,它不會(huì)受到來自大小、方向以及形狀這類因素的干擾,在對(duì)相關(guān)手勢(shì)進(jìn)行旋轉(zhuǎn)、縮放以及平移時(shí),膚色特點(diǎn)具備了較強(qiáng)的魯棒性,因此采取多手勢(shì)圖像能夠?qū)δw色進(jìn)行精準(zhǔn)的分割,實(shí)現(xiàn)手勢(shì)識(shí)別的根本目的。這一算法的技術(shù)要點(diǎn)如下:
2.1? 手勢(shì)圖像預(yù)處理
當(dāng)獲取了相應(yīng)的手勢(shì)圖像之后,很容易會(huì)受到來自噪聲的不利影響,讓分割與識(shí)別手勢(shì)圖像的精準(zhǔn)程度有所降低,故而在分割與識(shí)別手勢(shì)圖像之前應(yīng)當(dāng)進(jìn)行相應(yīng)的預(yù)處理。應(yīng)用較為廣泛的預(yù)處理方式有去噪方法以及形態(tài)學(xué)處理方法。
第一,去噪方法。當(dāng)試用圖像采集設(shè)施來對(duì)手勢(shì)圖像進(jìn)行采集時(shí)會(huì)出現(xiàn)數(shù)量眾多的噪聲,這樣一來所獲取圖像的質(zhì)量無法得到保障,因此對(duì)其進(jìn)行去噪的操作勢(shì)在必行。要想實(shí)現(xiàn)去噪的目的,可以選擇兩種濾波器來進(jìn)行去噪處理。首先是高斯濾波器,在對(duì)圖像進(jìn)行采集時(shí),高斯白噪聲是出現(xiàn)頻率最高的噪聲,通過高斯濾波器的應(yīng)用能夠?qū)崿F(xiàn)良好的去噪目的。高斯濾波器是一種線性濾波器,根據(jù)高斯分布原理能夠明確采集圖像的像素?cái)?shù)值,這樣一來就能夠有效避免各類噪聲的產(chǎn)生。高斯濾波器所遵循的二維高斯函數(shù)如下:
其中h(x, y)主要是指高斯濾波器在(x, y)這一坐標(biāo)中的實(shí)際數(shù)值,σ則表示了標(biāo)準(zhǔn)差。
其次是中值濾波器,它是一種非線性濾波器,能夠統(tǒng)計(jì)并排列組合周圍所產(chǎn)生的像素點(diǎn),并選擇其中值來當(dāng)做最佳的像素值,進(jìn)而讓孤立無援的噪聲點(diǎn)得以消除,進(jìn)而實(shí)現(xiàn)去噪的目的。
第二,形態(tài)學(xué)處理方法。當(dāng)完成對(duì)手勢(shì)圖像的去噪操作之后,所獲取圖像之中會(huì)出現(xiàn)一定的殘缺以及空隙,通過形態(tài)學(xué)處理方法的應(yīng)用,就能夠讓圖像之中的毛刺、孤立點(diǎn)、填充小孔得以消除。形態(tài)學(xué)處理方法主要有以下幾種操作方式:
一是膨脹。這一操作的目的主要是讓物體能夠與其背景點(diǎn)進(jìn)行有效的合并,使得目標(biāo)物體的面積得以增大,從而實(shí)現(xiàn)對(duì)目標(biāo)區(qū)域中相應(yīng)縫隙及空洞得以填充。二是腐蝕。這一操作的目的主要是消除物體周圍的邊界點(diǎn),使得目標(biāo)物體的面積得以減少,從而實(shí)現(xiàn)對(duì)目標(biāo)區(qū)域中的孤立點(diǎn)得以消除。
2.2? 明確收拾圖像最小面積外接矩形
進(jìn)行手勢(shì)分割操作主要是為了讓手勢(shì)不受到背景的干擾,有效提升識(shí)別結(jié)果的準(zhǔn)確程度。一般而言手勢(shì)圖像存在著個(gè)凸多邊形的凸包,而其外接矩形則主要包含了最小面積外接矩形MABR(Minimum Area Bounding Rectangle)以及最小綁定矩形MBRMBR(Minimum Bounding Rectangle)。針對(duì)最小綁定矩形應(yīng)當(dāng)充分考慮到其輪廓基本特征來明確矩形頂點(diǎn),進(jìn)而建立相應(yīng)的矩形手勢(shì)來完成分割,但通過這一方式所獲得的手勢(shì)圖像依然會(huì)包含一定的背景,且手勢(shì)面積遠(yuǎn)遠(yuǎn)小于矩形面積。針對(duì)最小面積外接矩形應(yīng)當(dāng)在沿用上述手段的前提之下,盡可能地增加手勢(shì)面積。
2.3? 做好手勢(shì)圖像輪廓提取工作
當(dāng)完成對(duì)手勢(shì)圖像的預(yù)處理之后,工作人員就可以對(duì)其中的輪廓數(shù)據(jù)信息進(jìn)行提取,輪廓信息有著較為豐富的手勢(shì)特點(diǎn),能夠?qū)κ謩?shì)的角度進(jìn)行獲取,對(duì)前景以及背景進(jìn)行有效的區(qū)分。當(dāng)前應(yīng)用較為廣泛的手勢(shì)圖像輪廓提取方式主要是八鄰域檢測(cè)法,其模板如圖1所示。
這一方法的主要步驟如下:
對(duì)手勢(shì)圖像進(jìn)行全面的掃描,直至尋找到完美地前景像素點(diǎn);對(duì)搜索方向進(jìn)行初始化;根據(jù)這一方向?qū)⑶熬跋袼攸c(diǎn)移動(dòng)到下一個(gè)區(qū)域的像素點(diǎn)之中;如若確定這一像素點(diǎn)屬于輪廓點(diǎn)的范疇,那么就能夠?qū)@一手勢(shì)圖像的輪廓進(jìn)行提取,如若并不屬于,那么就要進(jìn)行下一步的工作;繼續(xù)對(duì)搜索方向進(jìn)行更新,直至確定像素點(diǎn)屬于輪廓點(diǎn)的范疇;停止工作。最終獲得的手勢(shì)圖像輪廓如圖2所示。
3? 結(jié)語(yǔ)
綜上所述,人工智能在實(shí)際生活中的不同領(lǐng)域都有著較為廣泛的應(yīng)用,為各行各業(yè)帶來了較大的便利。機(jī)器學(xué)習(xí)便是人工智能中的重要組成部分,在機(jī)器學(xué)習(xí)背景之下,通過手勢(shì)識(shí)別技術(shù)的應(yīng)用,能夠讓人民群眾在進(jìn)行人機(jī)交互時(shí)更為簡(jiǎn)便,不再依賴于鍵盤、觸摸屏以及鼠標(biāo)這類與終端直接接觸的設(shè)備,進(jìn)而有效提升人機(jī)交互的效率及質(zhì)量。要想讓手勢(shì)識(shí)別結(jié)果足夠精準(zhǔn),相關(guān)工作人員就必須明確該技術(shù)中的相關(guān)要點(diǎn),采取合理的措施來減少手勢(shì)識(shí)別結(jié)果受到各類因素的干擾。這樣一來就會(huì)讓手勢(shì)識(shí)別技術(shù)得到良好的發(fā)展,有效推動(dòng)社會(huì)科學(xué)技術(shù)水平的不斷進(jìn)步。
參考文獻(xiàn)
[1]江元, 楊波, 趙東來, 等. 基于時(shí)間序列分析及機(jī)器學(xué)習(xí)的移動(dòng)網(wǎng)絡(luò)業(yè)務(wù)量預(yù)測(cè)技術(shù)[J]. 物聯(lián)網(wǎng)技術(shù), 2020, 10(6): 42-45.
[2]戚天梅, 過弋, 王吉祥, 等. 基于機(jī)器學(xué)習(xí)的外匯新聞情感分析[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2020, 41(6): 1742-1748.
[3]蒲曉蓉, 陳柯成, 劉軍池, 等. COVID-19中國(guó)診療方案的機(jī)器學(xué)習(xí)智能分析方法[J/OL]. 生物醫(yī)學(xué)工程學(xué)雜志: 1-8[2020-06-19]. http://kns.cnki.net/ kcms/detail/51.1258.R. 20200611.1510.018.html.
[4]趙天偉, 林莉, 張東輝, 等. 機(jī)器學(xué)習(xí)在無損檢測(cè)中的應(yīng)用案例淺析[J]. 無損探傷, 2020, 44(3): 1-4+11.
[5]曾路, 汪浩. 基于機(jī)器學(xué)習(xí)的虛擬儀器軟件缺陷預(yù)測(cè)模型研究[J]. 自動(dòng)化與儀器儀表, 2020(5): 59-62.
[6]甘天江, 傅友華, 王海榮. 毫米波大規(guī)模MIMO系統(tǒng)中基于機(jī)器學(xué)習(xí)的自適應(yīng)連接混合預(yù)編碼[J]. 信號(hào)處理, 2020, 36(5): 677-685.
[7]余傳明, 李浩男, 安璐. 基于深度學(xué)習(xí)的領(lǐng)域知識(shí)對(duì)齊模型研究:知識(shí)網(wǎng)絡(luò)視角[J]. 情報(bào)學(xué)報(bào), 2020, 39(5): 521- 533.
[8]歐俊臣, 沙玲, 楊淞文. 基于MCTS和卷積神經(jīng)網(wǎng)絡(luò)的五子棋策略研究[J]. 軟件, 2020, 41(4): 160-164.
[9]石桐歌, 孟祥宇, 王朋嬌. 我國(guó)機(jī)器人教育現(xiàn)狀分析與發(fā)展趨勢(shì)研究[J]. 軟件, 2020, 41(2): 113-118.
[10]王雪, 郭佳偉, 郝天琦, 等. 依托大數(shù)據(jù)、人工智能技術(shù)的醫(yī)工科研平臺(tái)創(chuàng)業(yè)項(xiàng)目研究[J]. 軟件, 2019, 40(11): 49-51.