章明星
本文在對(duì)人體運(yùn)動(dòng)跟蹤方法及視覺(jué)運(yùn)動(dòng)捕捉技術(shù)難點(diǎn)進(jìn)行分析的基礎(chǔ)上,提出了精確度更高的視覺(jué)捕捉系統(tǒng)設(shè)計(jì)方案,能夠取得良好的效果。
目前,在人體運(yùn)動(dòng)分析領(lǐng)域和攝像領(lǐng)域,視覺(jué)捕捉技術(shù)有著十分廣泛的應(yīng)用范圍,是當(dāng)前研究的熱點(diǎn)課題之一。在視覺(jué)捕捉系統(tǒng)的支持下,該技術(shù)能夠?qū)\(yùn)動(dòng)中的物體進(jìn)行跟蹤定位,從而獲得其三維運(yùn)動(dòng)軌跡,并通過(guò)數(shù)字解析過(guò)程,實(shí)現(xiàn)對(duì)運(yùn)動(dòng)過(guò)程的捕捉。運(yùn)用視覺(jué)捕捉技術(shù),能夠?qū)ξ矬w的運(yùn)動(dòng)特診進(jìn)行準(zhǔn)確把握,得出其在三維空間內(nèi)特定參數(shù),從而了解到精確的運(yùn)動(dòng)狀況。在以計(jì)算機(jī)圖形學(xué)為理論基礎(chǔ)的同時(shí),在空間內(nèi)設(shè)置多個(gè)相關(guān)技術(shù)設(shè)備,用于對(duì)運(yùn)動(dòng)物體的跟蹤,最終以圖形的形式,將運(yùn)動(dòng)狀況加以記錄,所得到的運(yùn)動(dòng)信息較為不容易失真,因而在攝像技術(shù)中能夠有良好的應(yīng)用前景。
人體運(yùn)動(dòng)跟蹤方法
為了完成人體運(yùn)動(dòng)分析,首先要做到科學(xué)的跟蹤定位,對(duì)于連續(xù)的圖像幀,互相之間應(yīng)具備相匹配的特征,主要包括運(yùn)動(dòng)方向、速度、形態(tài)及方位等,這樣才能獲得完整的運(yùn)動(dòng)數(shù)據(jù)。在運(yùn)動(dòng)跟蹤的方案設(shè)計(jì)上,應(yīng)用較廣泛的數(shù)學(xué)模型有動(dòng)態(tài)貝葉斯網(wǎng)絡(luò),卡爾曼濾波,以及粒子濾波等方法。由于跟蹤定位的對(duì)象各不相同,根據(jù)其各自的特征,可分別采用模型跟蹤方法,區(qū)域跟蹤方法,活動(dòng)輪廓線跟蹤方法,特征跟蹤方法等[1]。 如果使用模型跟蹤法,在人體運(yùn)動(dòng)目標(biāo)的表達(dá)上,傳統(tǒng)的處理手段有三種,即圖模型、二維模型以及三維模型;如果使用區(qū)域跟蹤方法,則需考慮整體跟蹤和局部跟蹤的不同;如果使用活動(dòng)輪廓線跟蹤方法,在運(yùn)動(dòng)目標(biāo)的表達(dá)上,主要手段為封閉的曲線范圍,隨著目標(biāo)的移動(dòng)變化,這一封閉的曲線范圍可進(jìn)行自動(dòng)更新。在最新的范圍曲線跟蹤算法當(dāng)中,首先確定空間(x,y,t),然后構(gòu)造一個(gè)曲面,并對(duì)初始曲線進(jìn)行設(shè)置,此時(shí)曲線應(yīng)為水平方向,得到關(guān)于該曲線的能量函數(shù),包圍移動(dòng)體區(qū)域,此時(shí)運(yùn)動(dòng)目標(biāo)的運(yùn)動(dòng)變化,能夠反映到能量函數(shù)的曲線上,當(dāng)運(yùn)動(dòng)目標(biāo)區(qū)達(dá)到最小時(shí),函數(shù)曲線將靠近運(yùn)動(dòng)目標(biāo)區(qū),實(shí)現(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的跟蹤定位;如果使用特征跟蹤法,首先應(yīng)完成特征提取,然后再進(jìn)行特征匹配,從靜態(tài)圖像當(dāng)中,可提取相應(yīng)的人體特征,而在序列圖像之間,可對(duì)這些特征進(jìn)行匹配,實(shí)現(xiàn)完整的跟蹤過(guò)程。
視覺(jué)運(yùn)動(dòng)捕捉技術(shù)難點(diǎn)
目前,視覺(jué)運(yùn)動(dòng)捕捉技術(shù)的應(yīng)用仍然存在較多的難點(diǎn),盡管視覺(jué)捕捉技術(shù)的研究工作始終熱度不減,對(duì)視頻運(yùn)動(dòng)的分析也越來(lái)越深入,但從取得的開(kāi)發(fā)成果來(lái)觀察,由于多種客觀因素的作用,在掌握人體運(yùn)動(dòng)數(shù)據(jù)的過(guò)程中,整個(gè)過(guò)程依然十分復(fù)雜,操作在難度上還是具有一定的挑戰(zhàn)性。其中,最主要的難點(diǎn)在于,人體作為運(yùn)動(dòng)跟蹤的目標(biāo),其本身具有較強(qiáng)的復(fù)雜性,運(yùn)動(dòng)所涉及的要素也較多,因而在自攝像到成像的整個(gè)過(guò)程當(dāng)中,極易造成原有信息的丟失。在研究階段,研究人員遇到的研究瓶頸則主要有:第一,人體構(gòu)造的柔性特征,與此同時(shí)人體的運(yùn)動(dòng)狀況也屬于非剛性運(yùn)動(dòng);第二,高維表達(dá)問(wèn)題,,對(duì)運(yùn)動(dòng)過(guò)程進(jìn)行跟蹤時(shí),需對(duì)運(yùn)動(dòng)中的各要素進(jìn)行仿真模擬,應(yīng)如何精確再現(xiàn)人體的運(yùn)動(dòng)過(guò)程,即如何構(gòu)建人體模型;第三,在視頻中,由于運(yùn)動(dòng)狀況與理論中的理想狀態(tài)有很大不同,人體極有可能被附近環(huán)境掩蓋,或自本身存在遮擋部分,這種情況下就無(wú)法獲得完整的人體運(yùn)動(dòng)數(shù)據(jù),破壞跟蹤定位的精準(zhǔn)度,從而給模型的重建造成困難;第四,在從三維到二維的投影過(guò)程中,往往會(huì)導(dǎo)致深度歧義,對(duì)三維的運(yùn)動(dòng)目標(biāo)進(jìn)行投影,所得到的二維圖像并不能完全再現(xiàn)原有的運(yùn)動(dòng)狀況,許多深度信息將會(huì)丟失[2]。如果使用單個(gè)攝像機(jī)進(jìn)行攝像,這一問(wèn)題的嚴(yán)重性尤為明顯,根據(jù)這種情況下所得到的視頻,試圖完成運(yùn)動(dòng)三維信息的推導(dǎo),往往失真程度極高。對(duì)于這類問(wèn)題的解決,通常采取逆向的研究方法,通過(guò)多種技術(shù)手段,將復(fù)雜的問(wèn)題簡(jiǎn)化,或者在先驗(yàn)知識(shí)的指導(dǎo)下,盡量圓滿地解決這一問(wèn)題。
視覺(jué)捕捉系統(tǒng)設(shè)計(jì)探討
在本次研究中,為了提高跟蹤定位的精確度,將選擇桿狀模型用來(lái)模擬人體骨架,同時(shí)為了便于完成視覺(jué)處理,還將使用HSI色彩模型。通過(guò)關(guān)節(jié)點(diǎn)的運(yùn)用,可連接形成人體模型,從而得到更適用于數(shù)學(xué)處理的剛體集合,每一個(gè)剛體,都可利用不同的線段加以描述,通過(guò)這樣的模型轉(zhuǎn)換,原本復(fù)雜的運(yùn)動(dòng)將大大簡(jiǎn)化,以骨架運(yùn)動(dòng)的形式進(jìn)入建模和分析階段。在整個(gè)人體模型中,共包含18個(gè)關(guān)節(jié)點(diǎn),為了便于研究,本文中稱其為特征點(diǎn)。在不同的特征點(diǎn)之間,所構(gòu)成的線段即代表剛體。這樣一來(lái),無(wú)論在任何時(shí)間點(diǎn),都不會(huì)導(dǎo)致形變。同時(shí),由于這些線段代表的是人體骨架,因此可通過(guò)解剖學(xué)理論,了解到互相間的大小比例關(guān)系,將難點(diǎn)順利轉(zhuǎn)化為先驗(yàn)知識(shí)。在模型選用上,雖然RGB有更加廣泛的應(yīng)用,且易于硬件實(shí)現(xiàn)。但如果光照強(qiáng)度發(fā)生變化,同樣一種顏色,所得到的RGB值差別顯著,造成色彩信息的失真。但在視覺(jué)捕捉技術(shù)的應(yīng)用領(lǐng)域,由于色彩信息的醒目性,常常將其作為跟蹤的特征信息,因而需避免亮度的干擾,此時(shí)HSI模型的適用性更強(qiáng)[3]。在HSI模型中,其中H表示色調(diào),S表示飽和度,I表示亮度。
在本次研究中,將采用Kalman 濾波與Camshift 相結(jié)合的跟蹤算法,能夠綜合二者的優(yōu)勢(shì)。通過(guò)對(duì)運(yùn)動(dòng)圖像的觀察,可對(duì)目標(biāo)物體的方位進(jìn)行測(cè)定,在每一幀圖像中,可獲得其相應(yīng)的位置信息數(shù)據(jù),這樣就可還原人體的完整運(yùn)動(dòng)軌跡。在獲知前期人體位置信息數(shù)據(jù)的情況下,可利用Kalman 濾波,對(duì)本幀圖像進(jìn)行預(yù)測(cè),得出目標(biāo)出現(xiàn)的大概位置,然后再使用Camshift算法使信息精確化,即在可能出現(xiàn)的區(qū)域當(dāng)中,得到目標(biāo)的準(zhǔn)確位置。要完成精確度較高的視覺(jué)運(yùn)動(dòng)捕捉過(guò)程,可遵循以下步驟:首先,最好使用多個(gè)攝像機(jī),得到視頻數(shù)據(jù)流;其次,通過(guò)二維跟蹤技術(shù),對(duì)特征點(diǎn)進(jìn)行準(zhǔn)確計(jì)算,從而得出二維運(yùn)動(dòng)序列;最后,利用攝像機(jī),對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行標(biāo)定,實(shí)現(xiàn)三維重建,完成整個(gè)視覺(jué)運(yùn)動(dòng)捕捉過(guò)程。
在整個(gè)視覺(jué)捕捉系統(tǒng)當(dāng)中,共包括四個(gè)不同模塊,分別為視頻采集、跟蹤定位、模型重建以及顯示,這四個(gè)模塊分別具備不同的功能。
視頻采集模塊??墒褂闷胀ǖ臄z像頭,對(duì)人體運(yùn)動(dòng)的整個(gè)過(guò)程進(jìn)行拍攝,得到運(yùn)動(dòng)的初始視頻。在人體的關(guān)節(jié)部位,分別使用不同的顏色進(jìn)行標(biāo)記,以示區(qū)分,標(biāo)記時(shí)應(yīng)注意所使用的顏色應(yīng)與背景色彩相異,使標(biāo)記色塊成為其他任意三種顏色的區(qū)域。對(duì)于視頻的背景特征,可不做特殊要求。
跟蹤模塊。通過(guò)預(yù)測(cè)機(jī)制,盡量避免運(yùn)動(dòng)目標(biāo)被附近環(huán)境掩蓋的現(xiàn)象,對(duì)模型及運(yùn)動(dòng)目標(biāo)的特征進(jìn)行研究和分析,使用Kalman進(jìn)行預(yù)測(cè)的同時(shí),結(jié)合
Camshift算法的使用,以色彩信息為標(biāo)識(shí)特征,進(jìn)行信息跟蹤。針對(duì)各幀圖像,對(duì)其色塊中心數(shù)據(jù)進(jìn)行提取,建立圖像坐標(biāo),此時(shí)就可得到色塊運(yùn)動(dòng)序列,獲知關(guān)節(jié)點(diǎn)的運(yùn)動(dòng)特征。
重建模塊。完成二維圖像坐標(biāo)后,接下來(lái)向三維坐標(biāo)進(jìn)行映射。在完成攝像機(jī)標(biāo)定之后,可根據(jù)人體生理約束,利用攝像機(jī)成像原理,對(duì)二維數(shù)據(jù)進(jìn)行映射,使其在三維空間得以重建。
顯示模塊。通過(guò)OpenGL ,可用來(lái)代表特征點(diǎn)的三維坐標(biāo),這樣就可利用更加精確的數(shù)據(jù),實(shí)現(xiàn)人體運(yùn)動(dòng)的視覺(jué)捕捉過(guò)程。
為了對(duì)本次研究的可行性進(jìn)行驗(yàn)證,使用普通攝像頭,對(duì)手臂的運(yùn)動(dòng)軌跡進(jìn)行拍攝。在OpenGL 中,手臂的三維模型得以建立,通過(guò)200幀以上的跟蹤定位,多數(shù)情況下,誤差可控制在一個(gè)像素以內(nèi),取得了理想的試驗(yàn)結(jié)果。
綜上所述,可知在視覺(jué)捕捉技術(shù)的應(yīng)用領(lǐng)域逐漸擴(kuò)大的發(fā)展趨勢(shì)中,為了更好實(shí)現(xiàn)其跟蹤及再現(xiàn)的功能,技術(shù)本身的精確性、可靠性等仍有較大的可提升空間,面臨的技術(shù)挑戰(zhàn)仍然較多。本文通過(guò)對(duì)視覺(jué)捕捉技術(shù)在攝像技術(shù)的應(yīng)用進(jìn)行深入的探究和分析,指出了視覺(jué)捕捉技術(shù)的優(yōu)勢(shì)及發(fā)展困境。本文對(duì)人體運(yùn)動(dòng)跟蹤方法進(jìn)行了較為詳盡的說(shuō)明,分別介紹了模型跟蹤方法,區(qū)域跟蹤方法,活動(dòng)輪廓線跟蹤方法,特征跟蹤方法,闡述了視覺(jué)運(yùn)動(dòng)捕捉技術(shù)難點(diǎn),并在此基礎(chǔ)上,提出了視覺(jué)捕捉系統(tǒng)設(shè)計(jì)方案。
(作者單位:蘇州工藝美術(shù)職業(yè)技術(shù)學(xué)院)