王 旭,劉 毅,李國(guó)燕
(天津城建大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,天津 300384)
E-mail :wangx_0@sian.com
隨著計(jì)算機(jī)圖像處理技術(shù)的快速發(fā)展,運(yùn)動(dòng)目標(biāo)跟蹤算法研究已經(jīng)成為國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)[1,2].并在軍事國(guó)防、安防監(jiān)控、人機(jī)交互等領(lǐng)域都有著廣泛應(yīng)用[3].
目前較為主流的目標(biāo)跟蹤算法一般包括機(jī)器學(xué)習(xí)類[4,5]算法和基于傳統(tǒng)圖像處理類算法[6]等,深度學(xué)習(xí)運(yùn)動(dòng)目標(biāo)跟蹤算法在檢測(cè)準(zhǔn)確率上占有較大優(yōu)勢(shì).Danelljan等[7]提出C-COT算法,為了應(yīng)對(duì)不同卷積層分辨率不同的問(wèn)題,進(jìn)行連續(xù)空間域插值轉(zhuǎn)換操作,在訓(xùn)練之前通過(guò)頻域隱式插值將特征圖插值到連續(xù)空域,方便集成多分辨率特征圖,從而保持定位的高精度,但由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練較為復(fù)雜,計(jì)算效率低,因此檢測(cè)實(shí)時(shí)性較差.
傳統(tǒng)基于相關(guān)濾波方法的運(yùn)動(dòng)目標(biāo)跟蹤具有速度快、精確度高等特點(diǎn),非常適合嵌入到中小型設(shè)備中進(jìn)行計(jì)算.Henriques等[8]提出的KCF算法通過(guò)使用方向梯度直方圖并結(jié)合核函數(shù)進(jìn)行加速,在速度和精度上較傳統(tǒng)相關(guān)濾波方法均有所提高.
但基于相關(guān)濾波方法的運(yùn)動(dòng)目標(biāo)跟蹤算法仍面臨一些問(wèn)題.如當(dāng)運(yùn)動(dòng)目標(biāo)發(fā)生較大形變時(shí)難以對(duì)其尺度進(jìn)行有效估計(jì),或運(yùn)動(dòng)中出現(xiàn)短暫遮擋、干擾等情況時(shí),算法容易丟失當(dāng)前跟蹤目標(biāo).
本文提出采用改進(jìn)后的灰度方向直方圖fHOG特征結(jié)合顏色特征對(duì)目標(biāo)進(jìn)行特征融合采樣,提高模型表達(dá)能力;針對(duì)遮擋丟失等問(wèn)題,提出通過(guò)運(yùn)動(dòng)方向場(chǎng)結(jié)合區(qū)域響應(yīng)程度對(duì)目標(biāo)狀態(tài)進(jìn)行評(píng)估,調(diào)整模型更新機(jī)制并在運(yùn)動(dòng)慣性下對(duì)短暫消失后的目標(biāo)嘗試找回;最后引入自適應(yīng)尺度因子對(duì)目標(biāo)尺度進(jìn)行分析,提高算法適應(yīng)能力.
在運(yùn)動(dòng)目標(biāo)跟蹤算法研究中,一般通過(guò)對(duì)給定的樣本進(jìn)行特征學(xué)習(xí)來(lái)構(gòu)建一個(gè)相關(guān)濾波器h,在檢測(cè)過(guò)程中將待測(cè)區(qū)域中的候選信號(hào)f與濾波器h進(jìn)行卷積運(yùn)算:
g=f*h
(1)
得到候選區(qū)域的相關(guān)響應(yīng)g,由于濾波器h是由給定目標(biāo)的特征學(xué)習(xí)得到,因此被跟蹤的目標(biāo)位置區(qū)域得到響應(yīng)輸出g應(yīng)服從二維高斯分布.
通過(guò)循環(huán)位移策略對(duì)被跟蹤目標(biāo)選取進(jìn)行密集采樣,訓(xùn)練出相關(guān)濾波器h將具有更好性能.且采樣過(guò)程可以根據(jù)循環(huán)矩陣原理變換到信號(hào)的頻域進(jìn)行快速計(jì)算,通過(guò)離散傅里葉變換進(jìn)行對(duì)角化:
(2)
核函數(shù)方法是一種強(qiáng)大的計(jì)算以及優(yōu)化策略,它從理論上提供了一個(gè)從線性到非線性的連接以及對(duì)于高維空間中向量?jī)?nèi)積運(yùn)算可以被轉(zhuǎn)化到低維空間中進(jìn)行計(jì)算.
相關(guān)濾波算法中常用高斯核函數(shù):
(3)
在相關(guān)濾波算法(KCF)中,利用當(dāng)前目標(biāo)位置的特征信息構(gòu)建相關(guān)濾波器h,由循環(huán)位移策略得到大量樣本xi,并通過(guò)脊回歸方法建立目標(biāo)函數(shù):
f(xi)=wTφ(xi)
(4)
(5)
式中φ(xi)為樣本xi的高維非線性變換,w為分類器的相關(guān)參數(shù),yi為樣本標(biāo)簽,λ為目標(biāo)損失函數(shù)中的正則化懲罰項(xiàng)參數(shù).通過(guò)最小二乘法對(duì)上式進(jìn)行優(yōu)化,導(dǎo)數(shù)為0時(shí)w的約束條件為:
w=(XHX+λI)-1XHy
(6)
式中X為樣本x特征所構(gòu)造的循環(huán)矩陣,將上述相關(guān)公式進(jìn)行帶入后得:
(7)
(8)
引入核函數(shù)策略后,由于w是可以通過(guò)φ(xi)的線型組合來(lái)表示,給定濾波器系數(shù)為α,則w可表示為:
(9)
將目標(biāo)函數(shù)中的w進(jìn)行替換后,優(yōu)化問(wèn)題即轉(zhuǎn)換為對(duì)濾波器系數(shù)α的求解,此時(shí)引入核函數(shù)策略,利用核函數(shù)
K(x,x′)=<φ(x),φ(x′)>
(10)
來(lái)處理高維空間中向量點(diǎn)積運(yùn)算,大幅降低計(jì)算復(fù)雜度.此時(shí)對(duì)α的求解轉(zhuǎn)換為
α=(K+λI)-1y
(11)
式中α為w的參數(shù)矩陣,K為核矩陣,且由于循環(huán)矩陣的性質(zhì)得
(12)
(13)
(14)
式中σ為核函數(shù)參數(shù),*表示為復(fù)頻域共軛,F(xiàn)-1表示離散傅里葉逆變換.
當(dāng)分類器訓(xùn)練完成后,將新一幀圖像的區(qū)域特征z作為輸入來(lái)描述其對(duì)應(yīng)的相關(guān)響應(yīng),并進(jìn)行離散傅里葉變換后可以得到:
(15)
在計(jì)算過(guò)程中,對(duì)待測(cè)區(qū)域的相關(guān)濾波響應(yīng)值進(jìn)行分析,得到響應(yīng)最大區(qū)域即為被跟蹤目標(biāo)的新位置.
目前目標(biāo)跟蹤算法中使用的主要特征包括:灰度特征、顏色特征、紋理特征以及形狀特征等.這些特征從不同角度對(duì)圖像的一些信息進(jìn)行量化與描述,產(chǎn)生特征算子的表達(dá)能力各有側(cè)重.
傳統(tǒng)相關(guān)濾波算法多采用圖像的方向梯度直方圖(HOG)特征,雖然這種特征能較好應(yīng)對(duì)圖像對(duì)于光照和顏色的變化,具有一定魯棒性,但是當(dāng)目標(biāo)發(fā)生形變時(shí)該特征的表達(dá)能力有所下降,難以保證算法性能.
本文考慮采用fHOG特征和顏色特征的圖像特征融合策略,增強(qiáng)對(duì)被跟蹤區(qū)域的信息表達(dá)能力.
fHOG特征在基于HOG特征原理的基礎(chǔ)上去除了其Block策略并加入梯度方向敏感性分析,并通過(guò)相應(yīng)行列累加對(duì)特征維度進(jìn)行優(yōu)化.具體步驟如下:
1)圖像預(yù)處理時(shí)采用Gamma校正等方法對(duì)輸入圖像進(jìn)行顏色空間中的歸一化操作并進(jìn)行去噪聲處理,以減少無(wú)關(guān)因素造成干擾.
2)計(jì)算像素點(diǎn)梯度值,圖像中像素點(diǎn)的水平和豎直梯度可以通過(guò)梯度算子卷積進(jìn)行求解,水平方向使用[-1,0,1]的梯度算子,豎直方向?yàn)閇-1,0,1]T的梯度算子,得到兩個(gè)方向上的梯度分量可表示為
Gx(x,y)=H(x+1,y)-H(x-1,y)
(16)
Gy(x,y)=H(x,y+1)-H(x,y-1)
(17)
通過(guò)水平和豎直方向上的梯度分量求得像素點(diǎn)的梯度值大小和方向?yàn)?/p>
(18)
(19)
式中G(x,y)為像素點(diǎn)的梯度值大小,α(x,y)為像素點(diǎn)的梯度方向.
3)梯度特征映射構(gòu)建直方圖,HOG特征采用無(wú)符號(hào)映射策略,在得到直方圖后將多個(gè)單元Cell合并為一個(gè)計(jì)算塊Block,并對(duì)Block進(jìn)行歸一化截?cái)嗵幚?在fHOG特征提取過(guò)程中,去除了將多個(gè)Cell合成Block的操作.fHOG特征提取方法中的31維特征可以理解為有符號(hào)18維方向梯度特征與無(wú)符號(hào)9維方向梯度特征結(jié)合圖像單元Cell與其所在鄰域單元的梯度能量分析.
fHOG特征能較好表達(dá)圖像區(qū)域的紋理信息,但是由于其對(duì)物體形變能力的適應(yīng)性較低,本文考慮引入圖像的顏色特征進(jìn)行特征融合,在被跟蹤目標(biāo)發(fā)生一定變化時(shí)仍能保證收集其有效信息進(jìn)行追蹤.
對(duì)于在顏色特征提取方法,不同顏色空間中的描述方法不同.與RGB顏色空間和HSV顏色空間的描述方法類似,CN顏色空間對(duì)常用顏色進(jìn)行了差異化的分類,可以認(rèn)為是將RGB顏色空間映射為一個(gè)具有11個(gè)通道的圖像顏色空間模型中.CN顏色空間的通道一般分為:紅、黃、藍(lán)、綠、橙、粉、紫、棕、黑、白、灰.這種操作雖然能使圖像的顏色表達(dá)更加豐富,但是對(duì)計(jì)算量的要求較高,且大多數(shù)圖像在顏色空間中的各通道中一般成極不均勻分布,因此對(duì)這種顏色特征數(shù)據(jù)進(jìn)行PCA降維后,得到2或3個(gè)主要成分仍然保證圖像顏色信息的完整性.本文采用對(duì)CN顏色特征進(jìn)行主成分分析后降低至2維度的特征方法進(jìn)行特征提取.
在目標(biāo)跟蹤過(guò)程中,由于視頻序列場(chǎng)景中可能出現(xiàn)一些環(huán)境變化或目標(biāo)遮擋變形等情況.傳統(tǒng)相關(guān)濾波跟蹤算法運(yùn)行過(guò)程中,受到上述干擾時(shí),圖像特征的相關(guān)響應(yīng)水平降低,此時(shí)計(jì)算當(dāng)前序列中目標(biāo)位置不可靠風(fēng)險(xiǎn)較大.因此本文提出采用一種結(jié)合響應(yīng)閾值判別與方向場(chǎng)的策略對(duì)存在丟失風(fēng)險(xiǎn)的目標(biāo)嘗試找回.
算法模型進(jìn)行更新時(shí),傳統(tǒng)相關(guān)濾波算法一般采用線性差值的方法對(duì)濾波器各參數(shù)進(jìn)行更新
(20)
(21)
式中η為算法的更新速率,i為當(dāng)前序列索引.由于目標(biāo)遮擋等情況的發(fā)生,一旦相關(guān)響應(yīng)程度較低即當(dāng)前目標(biāo)位置不確定性較大、跟蹤處于高風(fēng)險(xiǎn)狀態(tài)時(shí),此時(shí)仍對(duì)相關(guān)區(qū)域進(jìn)行更新會(huì)造成遮擋物信息對(duì)被跟蹤目標(biāo)的特征模型與濾波器參數(shù)造成一定污染,使跟蹤選框產(chǎn)生漂移,造成在遮擋結(jié)束時(shí)容易丟失被跟蹤的目標(biāo).
此處引入被跟蹤目標(biāo)的響應(yīng)因子,通過(guò)分析當(dāng)前區(qū)域進(jìn)行相關(guān)響應(yīng)后的響應(yīng)圖譜,對(duì)當(dāng)前目標(biāo)跟蹤狀態(tài)進(jìn)行估計(jì).一般情況下,選定區(qū)域越靠近真實(shí)跟蹤目標(biāo)時(shí),跟蹤精度較高,此時(shí)相關(guān)響應(yīng)峰值比較尖銳.如果出現(xiàn)響應(yīng)結(jié)果成平滑的多峰分布或波動(dòng)較為明顯時(shí),目標(biāo)位置的跟蹤可信度較低.本文通過(guò)最大響應(yīng)與峰值能量結(jié)合的方式對(duì)跟蹤目標(biāo)的狀態(tài)進(jìn)行分析,構(gòu)建描述被跟蹤目標(biāo)的丟失可能性大小的目標(biāo)響應(yīng)因子.
(22)
式中Pi為第i幀序列中目標(biāo)區(qū)域的響應(yīng)因子,max(f(xi))為相關(guān)濾波響應(yīng)圖譜中的峰值,μi和σi分別表示響應(yīng)均值與標(biāo)準(zhǔn)差.
當(dāng)響應(yīng)因子大于給定閾值時(shí),此時(shí)目標(biāo)的跟蹤狀態(tài)較好,應(yīng)對(duì)外觀模型進(jìn)行相應(yīng)更新.響應(yīng)因子小于給定閾值時(shí)應(yīng)暫停對(duì)外觀模型的更新以免將干擾因素更新到模型中去.
(23)
式中ηi為第i幀視頻序列更新率,δ為給定更新速率,T為響應(yīng)閾值.
在一般情況下,當(dāng)運(yùn)動(dòng)目標(biāo)發(fā)生遮擋時(shí),其運(yùn)動(dòng)的方向和趨勢(shì)在相鄰幀中的變化幅度相對(duì)較小.本文考慮為跟蹤目標(biāo)引入能描述其運(yùn)動(dòng)方向和趨勢(shì)的方向場(chǎng)參數(shù),并通過(guò)目標(biāo)未發(fā)生遮擋或嚴(yán)重形變時(shí)的位置信息對(duì)其方向場(chǎng)直方圖進(jìn)行更新,方便目標(biāo)找回.
Di={d1,d2,…,d8}
(24)
式中Di為被跟蹤目標(biāo)在第i幀時(shí)的方向場(chǎng),d1,d2,…,d8為該目標(biāo)當(dāng)前時(shí)刻各方向的運(yùn)動(dòng)趨勢(shì),原理參考前文fHOG特征直方圖映射時(shí)對(duì)像素梯度的計(jì)算,方向場(chǎng)采用相關(guān)響應(yīng)滿足閾值條件下的相鄰序列圖像中目標(biāo)位置的差分計(jì)算運(yùn)動(dòng)方向與趨勢(shì)大小并構(gòu)建方向特征.
方向場(chǎng)策略通過(guò)對(duì)目標(biāo)位置坐標(biāo)變化的分析和計(jì)算,估算被跟蹤目標(biāo)的運(yùn)動(dòng)方向與運(yùn)動(dòng)趨勢(shì).當(dāng)目標(biāo)跟蹤過(guò)程中響應(yīng)因子高于閾值時(shí),則在調(diào)整模型更新速率的同時(shí),對(duì)最近一幀正常跟蹤目標(biāo)位置通過(guò)方向場(chǎng)信息進(jìn)行延伸,并對(duì)其鄰域范圍進(jìn)行有側(cè)重的采樣工作,使被跟蹤目標(biāo)遭遇嚴(yán)重形變、遮擋等情況后也能在干擾結(jié)束后嘗試將其找回.
在傳統(tǒng)相關(guān)濾波跟蹤算法中,采樣選框的大小是固定不變的,即在視頻序列的跟蹤過(guò)程中,算法一直采用同樣尺寸的選框?qū)D像特征進(jìn)行提取.固定選區(qū)策略的局限性在于一旦被跟蹤目標(biāo)發(fā)生尺度變化,算法準(zhǔn)確性將受到很大影響.如果目標(biāo)的尺度減小,則選框中收集到的特征信息混入了周邊負(fù)樣本區(qū)域的噪聲,影響相關(guān)濾波器參數(shù)的更新;如果目標(biāo)的尺度增大,則當(dāng)前選框所收集到的特征信息不足以描述被跟蹤目標(biāo)的全部特性,此時(shí)超出選框的正樣本特征信息會(huì)被劃分為負(fù)樣本信息并對(duì)濾波器參數(shù)進(jìn)行更新,造成跟蹤過(guò)程極不穩(wěn)定.
本文通過(guò)先對(duì)被跟蹤目標(biāo)的丟失概率進(jìn)行分析,在被跟蹤目標(biāo)的特征信息與濾波器響應(yīng)后,被跟蹤目標(biāo)響應(yīng)因子較高時(shí),其位置可靠性較高,此時(shí)對(duì)選區(qū)進(jìn)行自適應(yīng)尺度估計(jì),防止目標(biāo)發(fā)生較大形變或被遮擋對(duì)目標(biāo)的跟蹤尺度造成影響.
本文采用等差步長(zhǎng)的方法定義尺度范圍,第i幀序列的尺度變化因子為:
scalesi=1+am,m=-N,-N+1,…,0,1,…,N-1,N
(25)
式中a為變化步長(zhǎng),取值在0到1之間,當(dāng)m<0時(shí),scalesi<1此時(shí)算法對(duì)選定區(qū)域按照比例進(jìn)行縮減并重新采樣;當(dāng)m>0時(shí),scalesi>1此時(shí)算法對(duì)選定區(qū)域按照比例進(jìn)行放大.當(dāng)目標(biāo)沒(méi)有處于形變和遮擋狀態(tài)時(shí),按照步長(zhǎng)對(duì)縮放后的區(qū)域重新采樣,并與相關(guān)濾波器進(jìn)行響應(yīng),計(jì)算出取得最大響時(shí)的尺度因子scalesi并對(duì)目標(biāo)選區(qū)尺度做出相應(yīng)調(diào)整.
為了更好對(duì)比算法性能,本研究采用OTB-50上的數(shù)據(jù)集進(jìn)行仿真[9],實(shí)驗(yàn)環(huán)境為CPU為Intel Core i5,內(nèi)存為8G,操作系統(tǒng)為WIN7旗艦版,算法仿真通過(guò)MATLAB程序?qū)崿F(xiàn).本文通過(guò)定性與定量?jī)蓚€(gè)方面對(duì)算法性能進(jìn)行測(cè)試,在對(duì)傳統(tǒng)KCF算法進(jìn)行仿真和優(yōu)化改進(jìn)的同時(shí)也選取了其他比較具有代表性的目標(biāo)跟蹤算法進(jìn)行對(duì)比.選擇的對(duì)比算法有跟蹤學(xué)習(xí)檢測(cè)算法Tracking-Learning-Detection(TLD)[10]、壓縮跟蹤算法(CT)[11]、以及相關(guān)濾波CSK算法[12].
在仿真實(shí)驗(yàn)中,本文通過(guò)不同灰度的選框標(biāo)識(shí)出各算法當(dāng)前序列所跟蹤到的目標(biāo)位置,其中用0灰度選框區(qū)域表示CSK算法結(jié)果、64灰度選框區(qū)域表示CT算法結(jié)果、128灰度選框區(qū)域表示TLD算法結(jié)果、192灰度選框表示相關(guān)濾波算法KCF結(jié)果、255灰度選框區(qū)域表示經(jīng)過(guò)本文優(yōu)化改進(jìn)后的相關(guān)濾波算法(在后文圖中用Ours表示)結(jié)果.
圖1為在視頻序列basketball中的部分跟蹤結(jié)果.該序列環(huán)境變化比較復(fù)雜,背景與跟蹤目標(biāo)的顏色或紋理特征比較接近,且視頻序列涉及光照變化、目標(biāo)遮擋和目標(biāo)旋轉(zhuǎn)形變等多種因素影響.當(dāng)環(huán)境紋理較為復(fù)雜時(shí),TLD算法作為一種通過(guò)分析光流變化對(duì)目標(biāo)進(jìn)行識(shí)別跟蹤的算法,在復(fù)雜條件下光流信息和相應(yīng)特征的復(fù)雜程度較高,且目標(biāo)運(yùn)動(dòng)過(guò)程中出現(xiàn)形變遮擋等情況,迭代特征信息易受到環(huán)境干擾,導(dǎo)致跟蹤誤差較大,出現(xiàn)目標(biāo)丟失等情況.CSK算法雖然是一種基于相關(guān)濾波的方法,但是由于只采用單一的灰度特征,因此圖像的顏色信息不能被更好收集,跟蹤中也會(huì)出現(xiàn)目標(biāo)丟失情況.CT算法通過(guò)對(duì)特征進(jìn)行壓縮提高計(jì)算速度,但在檢測(cè)過(guò)程中會(huì)犧牲一定精度.KCF方法在目標(biāo)發(fā)生尺度變化或形變后會(huì)出現(xiàn)一些偏差,尤其在目標(biāo)與相似事物發(fā)生短暫遮擋交叉等情況時(shí),由于在前一幀目標(biāo)位置附近進(jìn)行特征篩選,導(dǎo)致交叉重疊的類似事物容易被誤檢為跟蹤目標(biāo),并可能影響后期整體跟蹤性能.本文算法能更有效的對(duì)目標(biāo)進(jìn)行跟蹤.在目標(biāo)發(fā)生小范圍形變、旋轉(zhuǎn)或尺度變化時(shí),由于融合特征對(duì)目標(biāo)信息的表達(dá)更加豐富,提高算法在復(fù)雜環(huán)境下的分類能力.當(dāng)目標(biāo)與相似事物發(fā)生交叉重疊時(shí),如283幀中的重疊位置,各傳統(tǒng)算法在檢測(cè)中發(fā)生不同程度位置偏移,本文算法結(jié)合融合特征來(lái)分析運(yùn)動(dòng)方向場(chǎng)特性,對(duì)目標(biāo)的運(yùn)動(dòng)趨勢(shì)進(jìn)行估計(jì),防止跟蹤窗口發(fā)生偏移影響迭代,且判別過(guò)程中加入了尺度自適應(yīng)分析,提高目標(biāo)特征可靠性,便于更準(zhǔn)確對(duì)目標(biāo)位置進(jìn)行判斷.
圖1 視頻序列basketball中各算法結(jié)果
圖2為跟蹤目標(biāo)在運(yùn)動(dòng)過(guò)程中出現(xiàn)被遮擋情況的視頻序列jogging中部分檢測(cè)結(jié)果.目標(biāo)被完全遮擋前各算法均能較為準(zhǔn)確判斷目標(biāo)位置,在目標(biāo)被全部遮擋的情況下,此時(shí)對(duì)目標(biāo)模型更新的特征可靠性較低,由于部分算法應(yīng)對(duì)特征選框中信息發(fā)生突變時(shí),缺乏對(duì)目標(biāo)特征信息可靠性的分析和判別,只選擇接受特征信息并進(jìn)行更新和迭代,因此CT、CSK、KCF算法中均出現(xiàn)遮擋在結(jié)束后丟失跟蹤目標(biāo)的現(xiàn)象,并導(dǎo)致了跟蹤目標(biāo)發(fā)生了改變.序列第71幀中目標(biāo)被遮擋,各算法跟蹤區(qū)域信息發(fā)生較大變化,此時(shí)發(fā)生目標(biāo)丟失的可能性較大.由于本文算法的目標(biāo)找回策略,在跟蹤目標(biāo)特征發(fā)生較大變化時(shí),算法對(duì)當(dāng)前位置的特征信息可靠性進(jìn)行分析,自適應(yīng)判別能否對(duì)跟蹤選區(qū)中的信息進(jìn)行更新,防止突發(fā)遮擋等情況對(duì)跟蹤目標(biāo)的特征造成污染,且根據(jù)目標(biāo)當(dāng)前運(yùn)動(dòng)方向信息對(duì)目標(biāo)位置進(jìn)行分析,便于在短暫遮擋結(jié)束后對(duì)跟蹤目標(biāo)進(jìn)行找回,防止目標(biāo)丟失.
對(duì)于旋轉(zhuǎn)和尺度變化,圖3為視頻序列dudek和carscale中的部分結(jié)果,其中dudek視頻中涉及目標(biāo)與鏡頭均有較快速移動(dòng)和目標(biāo)形變等更為復(fù)雜的因素.當(dāng)目標(biāo)發(fā)生尺度變化時(shí),由于CT、CSK和KCF算法均沒(méi)有自適應(yīng)的尺度變換機(jī)制,導(dǎo)致固定區(qū)域內(nèi)的信息全部更新到目標(biāo)特征集合中.如果跟蹤目標(biāo)尺度減小,則大量背景特征信息保存到該選區(qū)中,并被誤判為目標(biāo)特征進(jìn)行更新.如果目標(biāo)尺度增加,則固定選區(qū)不能完整收集跟蹤目標(biāo)的全部特征信息,造成數(shù)據(jù)缺失,導(dǎo)致跟蹤的準(zhǔn)確性較低.本文算法通過(guò)尺度自適應(yīng)分析調(diào)整跟蹤選框大小,在確認(rèn)跟蹤位置可靠程度較高時(shí)對(duì)選框尺度進(jìn)行自適應(yīng)調(diào)整,方便收集跟蹤目標(biāo)的全部信息,并結(jié)合融合后的特征進(jìn)行分析迭代,使得檢測(cè)結(jié)果更加準(zhǔn)確.
圖2 視頻序列jogging中各算法結(jié)果
圖3 視頻序列dudek和carscale中各算法結(jié)果
由圖3中序列carscale部分結(jié)果可知,視頻中存在目標(biāo)遮擋、目標(biāo)快速移動(dòng)、鏡頭快速移動(dòng)以及尺度變化等多種因素,場(chǎng)景較為復(fù)雜,如序列第167幀中出現(xiàn)的遮擋物對(duì)各算法均產(chǎn)生不同程度影響.由于目標(biāo)的移動(dòng)速度和尺度變化速率較快,且受到樹(shù)木等環(huán)境因素的影響,目標(biāo)本身的顏色紋理等特征變化較劇烈,跟蹤位置可靠性較差,各算法在跟蹤過(guò)程中均出現(xiàn)了一定誤差,其中CT、TLD和CSK出現(xiàn)目標(biāo)丟失現(xiàn)象,KCF算法雖然能判斷跟蹤目標(biāo)但是由于固定尺度和比較單一的特征分析方式,使得算法能夠提取和分析的信息有限,且噪聲影響比較嚴(yán)重,因此結(jié)果存在一定偏差.本文算法特征融合后信息表達(dá)能力較強(qiáng),有一定抗干擾能力,且在位置可靠性較差時(shí)結(jié)合目標(biāo)運(yùn)動(dòng)方向進(jìn)行綜合分析,提高復(fù)雜背景下的檢測(cè)能力,為防止特征信息溢出,本文算法對(duì)尺度變化速率設(shè)置了一定閾值,雖然對(duì)檢測(cè)結(jié)果造成了一定影響,相比其他對(duì)比算法本文算法檢測(cè)結(jié)果在車身中間位置且有效區(qū)域重合度最高.相比各傳統(tǒng)算法,本文算法跟蹤效果較好.
為了使結(jié)果更加全面,本文通過(guò)算法精度和算法成功率對(duì)各算法性能進(jìn)行評(píng)估.精度(precision plot)主要指預(yù)測(cè)位置中心點(diǎn)與測(cè)試數(shù)據(jù)集中標(biāo)注的中心位置間的歐式距離,以像素為單位進(jìn)行計(jì)算,通過(guò)目標(biāo)跟蹤時(shí)被跟蹤目標(biāo)左上角的坐標(biāo)數(shù)據(jù)和選框大小計(jì)算得出.成功率(success plot)指跟蹤目標(biāo)位置數(shù)據(jù)與所在測(cè)試數(shù)據(jù)集上位置標(biāo)注數(shù)據(jù)的重合程度.在測(cè)試結(jié)果中,SRE模式為在視頻初始化時(shí)對(duì)目標(biāo)位置進(jìn)行一定偏移,即測(cè)試初始化時(shí)存在一定偏差情況下的目標(biāo)跟蹤性能,通過(guò)進(jìn)行12次測(cè)試(8個(gè)方向4個(gè)尺度)檢測(cè)被測(cè)算法的魯棒性.TRE模式在視頻序列時(shí)間軸上找到20個(gè)點(diǎn)作為起始點(diǎn)進(jìn)行測(cè)試,通過(guò)不同起始位置對(duì)目標(biāo)進(jìn)行跟蹤,最后通過(guò)反復(fù)試驗(yàn)得出算法跟蹤精度和成功率.如圖4-圖7所示.
通過(guò)本文算法與其他各算法的比較可得,本文算法在跟蹤成功率和跟蹤精度上性能相對(duì)較好.由于本文算法采用融合特征進(jìn)行分析,并結(jié)合可靠性判別機(jī)制和結(jié)合方向場(chǎng)的找回策略,使得算法應(yīng)對(duì)復(fù)雜場(chǎng)景或容易發(fā)生結(jié)果漂移情況時(shí)能較準(zhǔn)確的定位目標(biāo)位置,跟蹤成功率和精度曲線的線下面積相對(duì)其他算法均為最大.通過(guò)數(shù)據(jù)分析并平均化計(jì)算后,相比較傳統(tǒng)相關(guān)濾波算法KCF,本文算法在檢測(cè)成功率和跟蹤精度上分別提高了18.49%和9.54%,相比TLD算法在檢測(cè)成功率和跟蹤精度上分別提高了45.31%和33.16%.在計(jì)算效率上,由于改進(jìn)算法引入多特征融合、丟失目標(biāo)找回策略以及尺度自適應(yīng)分析,算法在計(jì)算速度較傳統(tǒng)KCF算法有所下降,但和TLD算法相當(dāng),仍具有一定實(shí)時(shí)性.
圖4 TRE模式下各算法的跟蹤成功率
Fig.4 Success plots of TRE
圖5 TRE模式下各算法的跟蹤精度
Fig.5 Precision plots of TRE
圖6 SRE模式下各算法的跟蹤成功率
Fig.6 Success plots of SRE
圖7 SRE模式下各算法的跟蹤精度
Fig.7 Precision plots of SRE
表1 算法實(shí)時(shí)性性能表
改進(jìn)算法通過(guò)將改進(jìn)方向梯度直方圖與顏色特征進(jìn)行特征融合,并結(jié)合方向場(chǎng)和響應(yīng)因子構(gòu)建目標(biāo)丟失找回策略,最后加入自適應(yīng)尺度分析對(duì)跟蹤選框大小進(jìn)行自適應(yīng)更新,從而提升算法精確性.通過(guò)實(shí)驗(yàn)與各常用跟蹤算法進(jìn)行對(duì)比,結(jié)果表明本文算法雖然計(jì)算量增加導(dǎo)致實(shí)時(shí)處理能力有所下降,但在目標(biāo)跟蹤精度和成功率上分別較傳統(tǒng)KCF算法提高了18.49%和9.54%,具有較好綜合性能和實(shí)用價(jià)值.