鄒文君 肖永君
摘 要: 由于目標(biāo)輪廓提取方法一直存在正確姿態(tài)輪廓提取不準(zhǔn)確的問題,提出兩種新的運動動作圖像正確姿態(tài)輪廓提取對比方法。通過相鄰幀差法對運動動作圖像正確姿態(tài)區(qū)域進(jìn)行提取,在此基礎(chǔ)上介紹了snake模型方法,其將運動動作圖像正確姿態(tài)輪廓的提取問題轉(zhuǎn)換成求解能量函數(shù)的極小化問題。分析了水平集方法,將演化曲線隱性地描述成運動動作圖像上的三維連續(xù)函數(shù)曲面的零水平集,當(dāng)水平集函數(shù)為0時,得到的結(jié)果即為輪廓提取結(jié)果。通過實驗對比所提兩種方法的有效性,發(fā)現(xiàn)snake模型方法的輪廓提取效果、完成性和信息丟失程度雖然優(yōu)于其他方法,但劣于水平集方法。
關(guān)鍵詞: 運動動作提??; 動作圖像; 能量函數(shù); 水平集; 正確姿態(tài); 輪廓提取
中圖分類號: TN911.73?34; TP391.41 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)15?0065?04
Comparative study on extraction methods of correct pose contour in moving action image
ZOU Wenjun, XIAO Yongjun
(Institute of Technology, East China Jiaotong University, Nanchang 330100, China)
Abstract: The traditional method of target contour extraction has the problem of incorrect pose contour extraction. Two new comparative methods of correct posture contour extraction for moving action image are proposed, in which the adjacent frame difference method is used to extract the correct pose region of the moving action image. The snake model method is introduced to convert the correct pose contour extraction from moving action image into the solving of energy function minimization. The level set method is analyzed, in which the evolution curve is implicitly described as the zero level set of the 3D continuous function surface on the moving action image. When the level set function is zero, the obtained result is deemed as the contour extraction result. By comparing the effectiveness of the two methods, it is found that the snake model method is better than other methods in the aspects of contour extraction effect, completeness and information loss rate, but is inferior to the level set method.
Keywords: moving action extraction; motion image; energy function; level set; correct posture; contour extraction
目標(biāo)輪廓提取就是在一段視頻序列的每幀圖像中精確找到所感興趣的運動目標(biāo)的輪廓[1?2]。隨著運動比賽競爭的越發(fā)激烈,運動員對自身動作準(zhǔn)確度的要求越來越高[3?4]。因此,研究一種輪廓提取方法對運動動作圖像正確姿態(tài)輪廓進(jìn)行提取具有重要意義,能夠為運動員的訓(xùn)練提供技術(shù)支持[5?6]。
文獻(xiàn)[7]提出一種離散可變模型對目標(biāo)輪廓進(jìn)行提取,通過圖像的外部約束令輪廓曲線保持在圖像邊緣處,通過圖像內(nèi)部約束對輪廓曲線形狀進(jìn)行調(diào)整。該方法實現(xiàn)過程簡單,但提取的輪廓結(jié)果不可靠。文獻(xiàn)[8]提出一種基于帶電粒子模型的目標(biāo)輪廓提取方法,帶電粒子模型實質(zhì)上是基于物理的能夠用于圖像恢復(fù)的可變形模型,用帶正電的能夠自由運動的粒子描述目標(biāo)輪廓,在各像素處放置一個帶有負(fù)電靜止不動的粒子,粒子電量和圖像梯度成正比,將全部粒子能量的和看作系統(tǒng)能量,使能量達(dá)到最小即可獲取目標(biāo)輪廓曲線。該方法較為有效,但容易受到噪聲的干擾。文獻(xiàn)[9]提出一種基于最小作用曲面與圖像二分法的目標(biāo)輪廓提取方法,對最小作用曲面性質(zhì)進(jìn)行分析,在此基礎(chǔ)上,將一幅圖像劃分為兩幅小圖像,以一種簡單方式解決了目標(biāo)輪廓曲線的提取,但通過該方法提取的輪廓曲線誤差較大。文獻(xiàn)[10]提出一種具有仿射不變性的目標(biāo)輪廓提取方法,介紹了仿射變換參數(shù)的一種規(guī)范化方法,引入形殊線,通過形殊線獲取兩個輪廓圖之間的旋轉(zhuǎn)變換參數(shù),通過遺傳算法對仿射變換參數(shù)進(jìn)行求解,從而完成目標(biāo)輪廓的提取,該方法提取精度高,但所需時間較長。
針對上述方法的弊端,提出兩種新的運動動作圖像正確姿態(tài)輪廓提取對比方法,通過相鄰幀差法對運動動作圖像正確姿態(tài)區(qū)域進(jìn)行提取,在此基礎(chǔ)上,介紹了snake模型方法和水平集方法。通過實驗對比所提的兩種方法的有效性,發(fā)現(xiàn)snake模型方法的輪廓提取效果、完成性和信息丟失程度雖然優(yōu)于其他方法,但劣于水平集方法。
當(dāng)前輪廓提取方法有很多,而運動動作正確姿態(tài)輪廓提取對運動員的訓(xùn)練非常關(guān)鍵,需選用一種高效、可靠的方法,下面對運動動作圖像感興趣區(qū)域進(jìn)行提取,在此基礎(chǔ)上介紹兩種有效的輪廓提取方法,對兩種方法進(jìn)行對比,選擇較好的方法實現(xiàn)運動動作圖像正確姿態(tài)的輪廓提取。
運動動作圖像感興趣區(qū)域的提取為輪廓提取的基礎(chǔ),本節(jié)選用相鄰幀差法完成感興趣區(qū)域的提取。
Snake模型是由一組控制點構(gòu)成的,是一種常用的輪廓提取方法,其實質(zhì)是一條被控制的連續(xù)曲線,主要和圖像力及來自外部的限制力有關(guān),用[Xs=xs,ys]進(jìn)行描述,參數(shù)[xs],[ys]代表snake的位置,可寫成如下能量函數(shù):
式中:[αxs2]代表彈性能量,為[x]一階導(dǎo)數(shù)的模;[βxs2]代表彎曲能量,為[x]二階導(dǎo)數(shù)的模;[Eextxs]代表外部力。彈性能量與彎曲能量被稱作內(nèi)部力,內(nèi)部力決定了運動動作圖像正確姿態(tài)輪廓線的彈性形變,外部力推動snake模型靠近預(yù)期局部最小值。選擇合理的參數(shù)[α]和[β],使得能量函數(shù)[E]達(dá)到極小值,則相應(yīng)的[xs]即為提取的運動動作圖像正確姿態(tài)輪廓。
在snake模型中,外部通常取控制點或連線所處位置的運動動作圖像局部特征,本節(jié)選擇梯度作為該特征,則有:
[Eextx,y=-?Gσx,y*Iix,y2] (4)
式中:[Gσ]代表二維高斯平滑方程的標(biāo)準(zhǔn)差為[σ];[?]用于描述梯度操作算子。
將運動動作圖像正確姿態(tài)輪廓的提取問題轉(zhuǎn)換成求解能量函數(shù)[E]的極小化問題。最小化能量方程需符合歐拉方程:
[αxs-βx-?Eext=0] (5)
式中:[α],[β]均為常數(shù),可將式(5)看作力平衡方程。
為了對歐拉方程進(jìn)行求解,將[x]看作變量是[t]與[s]的動態(tài)方程,即:
[xts,t=αxs,t-βxs,t-?Eext] (6)
在[xs,t]穩(wěn)定的狀態(tài)下,[xts,t]項消失,從而求解出式(5),而式(6)可利用離散化迭代求解。
Snake模型具有易于實現(xiàn)的優(yōu)點,但對運動動作圖像正確姿態(tài)初始輪廓很敏感,也就是初始輪廓曲線需接近圖像期望邊緣,同時在一定程度上會收斂到局部極值點,甚至發(fā)散。
Snake模型是利用最小化能量函數(shù)構(gòu)建的,而幾何活動輪廓模型則利用水平集方法構(gòu)建,該方法可有效處理曲線的拓?fù)渥兓掖嬖诜€(wěn)定唯一的數(shù)值解。
水平集方法的基本思想是將演化曲線[C]隱性地描述成運動動作圖像上的三維連續(xù)函數(shù)[?x,y,t]曲面的零水平集。如圖2所示,虛線以上的部分代表二維曲線演化,虛線以下的部分代表較其高一維的三維水平集函數(shù)變化,銜接兩個過程的虛線代表該過程是在隱性過程下實現(xiàn)的。
水平集函數(shù)[?x,y,t]可描述如下:
[?x,y,t:R2×0,T→R] (7)
式中:[0≤t
水平集函數(shù)[?x,y,t=0]在速度場[F]的作用下開始進(jìn)化:
[???t=Fk??] (8)
式中:[Fk]用于描述速度函數(shù);[?]用于描述水平集函數(shù)。在通過水平集方法對運動動作圖像正確姿態(tài)輪廓進(jìn)行提取前,將水平集函數(shù)初始化成符號距離函數(shù)。在進(jìn)行迭代的過程中,需保證[??=1],從而與演化曲線[C]一一對應(yīng)。
通過符號距離函數(shù)對初始水平集函數(shù)[?x,y,0]進(jìn)行描述:
[?x,y,C=dx,y,C, xisinsideC0, xisonC-dx,y,C, xisntinsideC] (9)
式中[dx,y,C]用于描述點[x,y]與曲線[C]之間的距離。速度函數(shù)可定義如下:
[F=e-?Gσ*I1-εκ] (10)
式(10)是依據(jù)運動動作圖像的梯度特征定義的。[F]用于描述驅(qū)動水平集函數(shù)的演化,其隱性表示閉合曲線也隨之演化,直至[F]為0時停止,從而實現(xiàn)運動動作圖像正確姿態(tài)輪廓的提??;[κ]用于描述曲率;[ε]代表[0,1]范圍內(nèi)的常數(shù);[Gσ*I]用于描述運動動作圖像與標(biāo)準(zhǔn)差是[σ]的高斯平滑濾波器的卷積,其中[κ]可通過下式求出:
[κ=??????=?x?2y-2?xy?x?y+?yy?2x?2x+?2y32] (11)
式中[??]用于描述水平集函數(shù)梯度范數(shù)。
式(10)可通過差分法求解:
[?n+1=?n-Δt?F???] (12)
速度函數(shù)[F]與運動動作圖像信息相應(yīng)。
為了驗證和對比提出的兩種輪廓提取方法的有效性,本文將某體育院校學(xué)生作為研究對象,將仿射不變性方法作為對比,對運動動作圖像正確姿態(tài)輪廓進(jìn)行提取。
圖4描述了采集的運動動作圖像原圖,圖5描述的是通過snake模型方法得到的運動動作圖像正確姿態(tài)輪廓提取結(jié)果,圖6描述的是水平集方法得到的運動動作圖像正確姿態(tài)輪廓提取結(jié)果,圖7描述的是通過仿射不變性方法得到的運動動作圖像正確姿態(tài)輪廓提取結(jié)果。
圖7中,因為運動動作圖像正確姿態(tài)背景的灰度對比度小,得到的像素數(shù)較少,導(dǎo)致姿態(tài)輪廓不完整,存在明顯的空洞。圖5和圖6的輪廓提取效果較好,得到的運動動作圖像正確姿態(tài)輪廓較為完整,而圖6較圖5的邊緣更加光滑,說明snake模型方法和水平集方法的輪廓提取效果均較好,水平集方法的輪廓提取性能較snake模型更好。
為了量化評估snake模型方法、水平集方法和仿射不變性方法的性能,本文引入子塊數(shù)比與目標(biāo)輪廓有效面積比兩個指標(biāo)。針對運動動作圖像正確姿態(tài)輪廓的提取,預(yù)期目標(biāo)為得到單一連通的完整輪廓塊,所以非連通子塊個數(shù)越少,則提取的輪廓越完整。受噪聲、遮擋等因素的干擾,運動動作圖像中一定會出現(xiàn)信息丟失的情況,體現(xiàn)在經(jīng)處理的二值化圖像中就是原本灰度是1的地方出現(xiàn)了灰度是0的信息丟失區(qū),所以可通過計算灰度是1的面積比率對方法得到有效信息的能力進(jìn)行評價。
分別采用snake模型方法、水平集方法和仿射不變性方法對同一序列運動動作圖像進(jìn)行正確姿態(tài)輪廓提取,得到的非連通子塊個數(shù)、有效面積比的比較結(jié)果如表1所示。
表1中有效面積方差就是各個有效面積與平均有效面積之差的平方的平均數(shù)。分析表1可以看出,將一段運動動作圖像序列分成32幀、46幀和60幀,經(jīng)snake模型方法處理后,32幀序列時其非連通子塊個數(shù)為4個,雖然略低于水平集方法,但遠(yuǎn)遠(yuǎn)低于仿射不變性方法;snake模型方法的46幀序列時,略高于水平集方法,但明顯低于仿射不變性方法;snake模型方法的60序列幀對應(yīng)的非連通子塊個數(shù)為3個,雖然略高于水平集方法,但明顯低于仿射不變性方法。說明本文提出的snake方法和水平集方法的非連通子塊數(shù)量較低,提取輪廓更加完整。snake模型方法和水平集方法的有效面積比均值高于仿射不變性方法,而方差則小于仿射不變性方法,這說明snake方法和水平集方法丟失的信息相對較少。綜上所述,本文提出的snake模型方法和水平集方法具有更好的輪廓提取效果。
為了選擇一種有效的運動動作圖像正確姿態(tài)輪廓提取方法,為運動員的訓(xùn)練提供可靠依據(jù),本文提出兩種新的運動動作圖像正確姿態(tài)輪廓提取對比方法,通過相鄰幀差法對運動動作圖像正確姿態(tài)區(qū)域進(jìn)行提取,在此基礎(chǔ)上,介紹了snake模型方法和水平集方法。通過實驗對比所提的兩種方法的有效性,發(fā)現(xiàn)snake模型方法的輪廓提取效果、完成性和信息丟失程度雖然優(yōu)于其他方法,但劣于水平集方法。
參考文獻(xiàn)
[1] 許琳娟,曹文洪,劉春晶.基于圖像處理的泥沙輪廓提取對比分析[J].中國水利水電科學(xué)研究院學(xué)報,2015,13(1):28?33.
XU Linjuan, CAO Wenhong, LIU Chunjing. The comparison and analysis of sediment contour extraction based on image processing [J]. Journal of China Institute of Water Resources and Hydropower Research, 2015, 13(1): 28?33.
[2] 王騰.優(yōu)秀跳遠(yuǎn)運動員助跑最后三步扒地和蹬地技術(shù)動作形式和作用研究[J].搏擊(體育論壇),2015,7(3):57?58.
WANG Teng. On the forms and functions of pawing and stom?ping during the last three steps for excellent long jump athletes [J]. Technique of practical fighting, 2015, 7(3): 57?58.
[3] 苗樹艷,金忠.一種面向三維人臉識別的同一截面有效輪廓線提取算法[J].計算機應(yīng)用與軟件,2015,32(10):244?247.
MIAO Shuyan, JIN Zhong. A 3D face recognition?oriented extraction algorithm for effective contours on same section [J]. Computer applications and software, 2015, 32(10): 244?247.
[4] 杜美.第12屆全運會男子跳遠(yuǎn)運動員起跳技術(shù)的運動學(xué)研究[J].體育科技,2015,36(4):21?22.
DU Mei. Kinematic analysis of take?off technique of men′s long jump in the 12th National Games [J]. Sport science and technology, 2015, 36(4): 21?22.
[5] 董本志,康欣,任洪娥.植物葉片輪廓特征提取方法研究[J].計算機工程與應(yīng)用,2015,51(8):143?147.
DONG Benzhi, KANG Xin, REN Honge. Plant leaves contour feature extraction method [J]. Computer engineering and applications, 2015, 51(8): 143?147.
[6] 王培珍,丁海濤,劉純利,等.基于結(jié)構(gòu)元的煤顯微圖像輪廓提取算法[J].煤炭學(xué)報,2014,39(z1):285?288.
WANG Peizhen, DING Haitao, LIU Chunli, et al. Coal microscope image contour extraction algorithm based on structuring elements [J]. Journal of China coal society, 2014, 39(S1): 285?288.
[7] 陳敏,王濤,錢競光.我國優(yōu)秀男子蹦床運動員網(wǎng)上起跳動作技術(shù)特征分析[J].南京體育學(xué)院學(xué)報(自然科學(xué)版),2014,13(4):44?48.
CHEN Min, WANG Tao, QIAN Jingguang. Our elite trampoline athletes in action technical characteristics off [J]. Journal of Nanjing Institute of Physical Education (natural science), 2014, 13(4): 44?48.
[8] 江山.基于形體輪廓特征提取的運動動作標(biāo)志分析[J].科技通報,2015,31(8):84?86.
JIANG Shan. Movement action mark analysis based on body contour feature extraction [J]. Bulletin of science and technology, 2015, 31(8): 84?86.
[9] 家建奎,齊敏,李珂.基于塊處理的直線型標(biāo)志符高精度輪廓提取技術(shù)研究[J].電子設(shè)計工程,2014,22(20):164?167.
JIA Jiankui, QI Min, LI Ke. The research about high precise extraction of linear mark outline based on block operation algorithm [J]. Electronic design engineering, 2014, 22(20):164?167.
[10] 陳陽,陳霞,汪軍.基于圖像處理的織物覆蓋系數(shù)檢測[J].西安工程大學(xué)學(xué)報,2016,30(1):16?20.
CHEN Yang, CHEN Xia, WANG Jun. Inspection on the cover factors of fabric based on image processing [J]. Journal of Xian Polytechnic University, 2016, 30(1): 16?20.