林淵燦,陳鍛生,胡小平
(華僑大學計算機科學與技術學院,福建 泉州 362021)
嵌入尺度可變均值漂移算法的粒子濾波方法
林淵燦,陳鍛生,胡小平
(華僑大學計算機科學與技術學院,福建 泉州 362021)
將尺度可變均值漂移算法嵌入到粒子的擴散過程中,引導粒子擴散到后驗概率密度函數的高密度區(qū),提出一種嵌入尺度可變均值漂移算法的粒子濾波跟蹤方法.利用對數極坐標圖像的尺度不變性,在粒子擴散過程中同時進行位置、尺度空間漂移.實驗表明,該方法不僅能順利跟蹤非連續(xù)尺度變化目標,而且需要更少的粒子數.
粒子濾波;均值漂移算法;尺度可變;對數極坐標;目標跟蹤
均值漂移算法(Mean-Shift,MS)[1]和粒子濾波(Particle Filter,PF)[2]是實時目標跟蹤技術中廣泛采用的兩種方法.PF是一種非線性、參數化的目標跟蹤方法,適用于非線性動態(tài)系統(tǒng),能夠跟蹤部分遮擋,甚至完全遮擋的目標.MS具有簡單、快速、強魯棒性等特點,只在位置子空間內搜索最優(yōu)目標估計值,不存在有效的核窗尺寸更新模型.當目標尺度發(fā)生變化時,特別是在目標放大的情況下[3],MS的跟蹤效果很差.Maggio等[4]提出PF和MS結合的跟蹤方法(簡稱HT).即將MS嵌入到PF的粒子擴散過程中,用MS指導粒子在位置子空間中進行漂移,使得擴散后的粒子群聚集在后驗概率密度函數的高密度區(qū),有效地減少粒子數;同時,它利用PF的狀態(tài)轉移模型對目標的尺寸進行預測,能夠跟蹤尺度連續(xù)變化的目標.但當目標進行非連續(xù)尺度變化時,HT的狀態(tài)轉移模型無法預測目標的尺度信息,導致跟蹤失敗.Han等[5]提出了一種尺度可變均值漂移算法(簡稱KBT-VRM).它通過對數極坐標變換[6],將目標尺度變換轉換為在對數極坐標下的平移變換,使得目標的位置變化和尺度變化統(tǒng)一到MS算法框架中,實現對尺度變化目標的跟蹤.與MS一樣,KBT-VRM也無法跟蹤有遮擋的目標.為解決該問題,本文提出一種嵌入尺度可變均值漂移算法的粒子濾波方法(簡稱PF-KBT-VRM).
狀態(tài)轉移方程的形式對最終跟蹤效果的影響很大.文中提出一種改進的自適應狀態(tài)轉移模型,以文[4]的狀態(tài)轉移模型為基礎,加入前一時刻運動趨勢信息項ΔSt-1.即
假設用橢圓近似目標區(qū)域,t時刻的第i個候選區(qū)域表示為St,i=(x,y,hx,hy).其中:x,y為橢圓中心,hx,hy分別為橫軸、縱軸的半軸長.一個候選區(qū)域的核直方圖(B)可定義為
由于遮擋、背景干擾等因素,候選區(qū)域的邊緣像素不太可靠,相應的權重值應該較小.一般選用中心區(qū)域權重較大,邊緣區(qū)域權重較小的核函數,如高斯核或者Epanichnikov核等.后者的導數為一個常量,可以簡化均值漂移向量的計算.因此,采用Epanichnikov核,其表達式為
候選區(qū)域與目標的相似度,用候選區(qū)域核直方圖與目標核直方圖之間的Bhattacharyya距離(DB)[7]來度量,則有
式(4)中:ρ為候選區(qū)域核直方圖;q為目標區(qū)域的核直方圖.由于光照變化、攝像角度、相機參數變化,以及目標進行非平面旋轉等因素的影響,目標的外觀會隨著時間的推移會不斷變化.為了反映目標外觀的變化,采用文[8]的自適應目標表示模型,即
式(5)中:Et(S)為時刻t目標狀態(tài)的估計值,β為遺忘系數.
這個自適應的目標模型實際上是一個遺忘過程.隨著時間的推進,舊目標模型對新目標模型的影響越來越小.為了提高自適應目標模型的魯棒性,避免在跟蹤失敗時進行模型更新,可以設置一個閾值PT,只有在當前幀狀態(tài)估計值與目標的相似度大于PT時,才進行目標模型更新.
提出的算法的一次迭代過程,有以下5個步驟:(1)重采樣;(2)根據式(1)進行狀態(tài)轉移;(3)對每個粒子進行尺度可變均值漂移;(4)計算每個粒子與目標的相似度,更新各個粒子的權重,計算當前幀的估計值;(5)更新目標表示模型.
實驗中,各個參數設定:bt初始值為0.25,β值為0.01,PT為0.7,Ns為768,Nθ為576;HT的Nk和n(粒子數)分別為65,80;PF-KBT-VRM的Nk和n(粒子數)分別為20,15.
為了驗證所提方法能夠成功跟蹤非連續(xù)尺度變化目標和有遮擋目標,分別在3個自拍的視頻數據上進行實驗.3個實驗均選用具有視覺均勻特性的HMMD顏色空間.與MPEG-7相同,選取Hue,Sum,Diff 3個分量,各個分量的量化等級:Hue為18,Sum為8,Diff為4.在部分遮擋,甚至完全遮擋情況下,所提方法的跟蹤結果如圖1(a)所示.在目標進行非連續(xù)尺度變化時,所提方法和HT方法的跟蹤結果,如圖1(b),(c)所示.圖1(b),(c)中:上、下視頻分別為HT和PF-KBT-VRM的跟蹤結果;圖1(b),(c)的視頻分別是在白天和晚上拍攝的,目標的尺寸剛開始保持不變,接著目標的尺寸不斷增大.
圖1 視頻跟蹤結果比較Fig.1 Comparison of video face tracking
從圖1(b),(c)可以看出,在目標尺寸不變的情況下,所提出的PF-KBT-VRM跟蹤算法和文[4]中的HT方法都能夠成功跟蹤.然而,在目標尺寸突然變大的非連續(xù)變化情況下,HT方法出現跟蹤失敗,而PF-KBT-VRM仍然能夠正常跟蹤,如圖1(b)中的幀編號206的視頻和圖1(c)中幀編號115,123,131的視頻所示.
PF-KBT-VRM和HT兩種方法在視頻2,3上各自跟蹤結果與真實目標的相似度曲線,如圖2所示.圖2中:n為視頻幀編號;DB為跟蹤結果核直方圖與目標核直方圖的Bhattacharyya距離.從圖2可以看出,在目標尺寸不變時,兩種跟蹤方法的性能很接近;然而,在目標尺寸突然變大的非連續(xù)變化情況下,HT方法的跟蹤性能明顯低于提出的PF-KBT-VRM方法的跟蹤性能.
圖2 跟蹤結果與真實目標狀態(tài)的相似度曲線Fig.2 Similarity curves of object tracking and their real states
視頻2,3的粒子群尺寸分布的方差,如圖3所示.圖3中:橫軸為幀編號(n),縱軸為當前幀所有粒子橫軸半軸長的方差(σ).從圖3可知,剛開始一段時間內,目標的尺寸保持不變,使得狀態(tài)轉移模型中的和變量趨于零.也就是說,粒子經過狀態(tài)轉移后,尺寸基本沒變,而加上粒子濾波中的重采樣過程,粒子群將發(fā)生“退化”現象,所有粒子的尺寸基本一致.因此,在視頻2,3中,當目標的尺寸突然變大時,所有粒子的尺寸依然保持不變且基本等于上一幀目標的尺寸,從而導致跟蹤的失敗.
圖3 粒子群尺寸分布的方差Fig.3 Variance of particle scales
從圖3可以看出,在目標尺寸保持不變一段時間后,所有粒子尺寸的方差趨于零,即各個粒子的尺寸基本一樣.提出的PF-KBT-VRM方法嵌入的是具有尺度變化能力的MS方法,因此,在狀態(tài)轉移模型無法預測目標尺寸的情況下,各個粒子仍然能夠自適應地更新各自的窗寬,實現對非連續(xù)尺度變化目標的有效跟蹤.
粒子濾波跟蹤結果的尺寸取決于粒子群的尺寸分布.在正常情況下,粒子群的尺寸在整個尺寸空間中隨機分布.為了使得跟蹤結果的尺寸接近于真實目標的尺寸,除了給接近真實目標尺寸的粒子賦以更高的權重外,還應該使得盡可能多的粒子分布在真實目標尺寸附近.如果粒子數目越多,那么分布在真實目標尺寸附近的粒子數也就越多,最后跟蹤結果的尺寸也越接近于真實尺寸.這也就是在一般情況下粒子數目越多,粒子濾波跟蹤效果越好的原因.
在HT方法中,由于嵌入的是傳統(tǒng)的MS算法,因此在粒子漂移過程中,MS算法不能夠指導粒子漂向真實目標尺寸的周圍.PF-KBT-VRM方法中,由于嵌入的是尺度可變的MS算法,在粒子漂移過程中,尺度可變MS算法不僅在位置空間上進行漂移,同時也在尺度空間上進行漂移,能夠指導大部分粒子漂向真實目標尺寸附近.因此,雖然所提方法在3個實驗中均只采用20個粒子,而HT方法卻采用了80個粒子,由于尺度可變MS算法的指導,PF-KBT-VRM中的大部分粒子分布在真實目標尺寸附近,使得PF-KBT-VRM在使用更少粒子的情況下反而取得比HT更好的跟蹤結果.
提出的跟蹤方法假設目標的外觀變化在幀與幀之間比較輕微,傳統(tǒng)均值漂移算法和嵌入傳統(tǒng)均值漂移算法的粒子濾波方法同樣也必須在這個前提下才能有效地跟蹤目標.該假設前提大大縮小了提出方法的適用范圍.在下一步的工作中,將進一步研究如何有效地更新目標表觀模型,實現對旋轉目標、明顯表觀變化目標的跟蹤.
[1]COMANICIU D,RAMESH V,MEER P.Kernel-based object tracking[J].Pattern Analysis and Machine Intelligence,2003,25(5):564-577.
[2]ISARD M,BLAKE A.Condensation:Conditional density propagation for visual tracking[J].International Journal of Computer Vision,1998,29(1):5-28.
[3]PENG Ning-song,YANGJie,LIU Zhi.Performance analysis for tracking of variable scale objects using mean-shift algorithm[J].Optical Engineering,2005,44(7):070505.
[4]MAGGIO E,CAVALLARO A.Hybrid particle filter and mean shift tracker with adaptive transition model[C]//IEEE Signal Processing Society International Conference on Acoustics,Speech,and Signal Processing.Philadelphia:IEEE,2005:19-23.
[5]HAN R,J ING Z,LI Y.Kernel based visual tracking with variant spatial resolution model[J].Electronics Letters,2008,44(8):517-518.
[6]SCHWARTZ E L.Anatomical and physiological correlates of visual computation from striate to infero-temporal cortex[J].IEEE Transactions on Systems,Man and Cybernetics,1984,14(2):257-271.
[7]KAILATH T.The divergence and bhattacharyya distance measures in signal delection[J].IEEE Transactions on Communication Technology,1967,15(1):52-60.
[8]NUMMIARO K,KOLL ER-MEIERB E,VAN GOOL L.An adaptive color-based particle filter[J].Image and Vision Computing,2003,22(1):99-110.
[9]張波.基于粒子濾波的圖像跟蹤算法研究[D].上海:上海交通大學,2007.
A Particle Filter Method Embedded with a Variable Scale Mean-Shift Algorithm
LIN Yuan-can,CHEN Duan-sheng,HU Xiao-ping
(College of Computer Science and Technology,Huaqiao University,Quanzhou 362021,China)
Embedding variable scale mean-shift algorithm into particle diffusion process,particles are diffusion into the high density area of the post probability density function,this paper proposed a particle filter tracking method embedded with a variable scale mean-shift algorithm.The scale invariable characters of image in logarithmic polar coordinates was used in the particle diffusion process,in which position space and scale space are shifted at the same time.The experiment shows the method can not only track object smoothly with discontinuous scale variation,but also need less particles.
particle filter;mean-shift;variable scale;logarithmic polar coordinate;object tracking
TP 391.41
A
1000-5013(2010)04-0408-05
(責任編輯:魯斌 英文審校:吳逢鐵)
2009-05-19
陳鍛生(1959-),男,教授,主要從事圖像處理與計算機視覺的研究.E-mail:dschen@hqu.edu.cn.
福建省科技計劃重點項目(2008I0021);福建省自然科學基金計劃資助項目(2009J01289)