摘 要:本文主要介紹了SIFT算法結(jié)合人體姿態(tài)估計的應(yīng)用,在人體學(xué)習(xí)運動的過程中,系統(tǒng)實時捕捉用戶動作,利用火柴人進行用戶動作模擬。通過對比各個訓(xùn)練動作的特征,對用戶的錯誤動作進行提示,并給出合理建議。
關(guān)鍵詞:SIFT;人體姿態(tài)估計;神經(jīng)網(wǎng)絡(luò)
一、簡介
近年來在生活的各個方面,或多或少都有人工智能的體現(xiàn)。除了生活必要方面,互聯(lián)網(wǎng)軟件的發(fā)展也有助于人們的精神文明建設(shè)和培養(yǎng)。利用軟件對用戶運動的監(jiān)測也逐漸興起。
二、研究背景
在軟件中,針對用戶體驗角度而言,傳統(tǒng)的運動方式一般是用戶結(jié)合教學(xué)視頻進行學(xué)習(xí)。用戶打開感興趣的模塊,點擊想要學(xué)習(xí)的課程,便可以進行學(xué)習(xí)。這種教學(xué)模式一定程度上雖然已經(jīng)較為方便,但其局限性在于用戶不能看到自己的學(xué)習(xí)情況,動作正誤等,對于其學(xué)習(xí)效果就不能得到保證。
如果在學(xué)習(xí)過程中,系統(tǒng)可以捕捉用戶學(xué)習(xí)視頻,并進行分析,進而提示用戶動作情況、錯誤信息等,便有利于用戶對自己的動作及時進行矯正。站在用戶的角度,這種學(xué)習(xí)模式很大程度上滿足了用戶的需求,學(xué)習(xí)軟件亦可以更加智能,對用戶的歷史學(xué)習(xí)數(shù)據(jù)進行分析,找出用戶學(xué)習(xí)特點,根據(jù)其個人情況,提出個性化建議等。
三、算法分析與實現(xiàn)
對于捕捉到的用戶學(xué)習(xí)視頻,應(yīng)剔除背景,想人體模型提取出來,并且尋找出人體各個關(guān)鍵部位,從而進行相對位置分析。
(一)視頻預(yù)處理
對于攝像頭錄制的視頻,應(yīng)當(dāng)先分割成若干圖片,分割是按照幀進行處理。對于每一張圖片,結(jié)合人體大致形狀,將背景素材剔除。這樣,便于后期對人體關(guān)鍵點的提取。
(二)關(guān)鍵點提取
對于剔除背景后的圖片,應(yīng)當(dāng)提取人體關(guān)鍵部位。結(jié)合SIFT算法,將每個點表示為八維向量,每個點的八維向量順序不同、模長不同,便可以作為唯一標(biāo)識符。八維向量模型如圖1
(三)神經(jīng)網(wǎng)絡(luò)訓(xùn)練
對于所提取的人體部位數(shù)據(jù),可能會存在較大的誤差。所以將圖片數(shù)據(jù)放入卷積神經(jīng)網(wǎng)絡(luò),進行迭代訓(xùn)練。在網(wǎng)絡(luò)學(xué)習(xí)過程中調(diào)用激活函數(shù),增強模型的魯棒性;使得模型不過分依賴所給數(shù)據(jù),從而具有更廣泛的應(yīng)用范圍。
(四)人體動作火柴人模擬
對于提取出來的關(guān)鍵點,結(jié)合人體關(guān)鍵身體部位,進行火柴人模擬。一方面,方便用戶清晰看到自己動作的框架,可以及時發(fā)現(xiàn)錯誤;另一方面,系統(tǒng)根據(jù)各個身體部位的位置關(guān)系,找出一系列的典型錯誤,經(jīng)過串行的判斷條件,得出當(dāng)前動作的錯誤個數(shù)與種類,從而對用戶動作進行打分,給出合理的改進建議。
四、結(jié)語
在實際應(yīng)用場景中,系統(tǒng)錄制用戶動作進行分析,很大程度上方便了用戶的學(xué)習(xí)過程。對于用戶學(xué)習(xí)動作錯誤情況提示,不僅可以采用界面文字提示,也可以采用語音提示的方式,讓用戶感受到“私人教練”的體驗,達到邊學(xué)習(xí)邊反饋的功能。
參考文獻
[1]張慶輝,萬晨霞,秦淑英,卞山峰.基于卷積神經(jīng)網(wǎng)絡(luò)的道路目標(biāo)檢測算法[J].計算機工程與設(shè)計,2019,40(07):2052-2058.
[2]張闖,楊咸兆,徐齊全,陳蘇婷.基于SIFT特征的哈??焖贆z索與圖像匹配[J].現(xiàn)代電子技術(shù),2019,42(12):127-131.
[3]馮健穎.基于卷積神經(jīng)網(wǎng)絡(luò)的人體姿態(tài)估計研究[D].哈爾濱工業(yè)大學(xué),2018.
作者簡介:
李婷婷(1997~)本科,研究方向為軟件工程。