孫子文 夏 良
(中國人民解放軍陸軍炮兵防空兵學院信息工程系 合肥 230031)
目標跟蹤目前在視頻監(jiān)控、車輛導航、人機交互、智能交通、運動分析和姿態(tài)估計等民用領(lǐng)域,以及視覺制導、目標定位和火力控制等軍事領(lǐng)域均有重要的應(yīng)用價值。近年來,雖然目標跟蹤有了較大發(fā)展,但是其仍然面臨復雜背景、目標變化和快速運動等諸多難題,目前仍是具有挑戰(zhàn)性的工作,是計算機視覺領(lǐng)域中研究的熱點問題。
目前,目標跟蹤領(lǐng)域中的研究者已經(jīng)提出了出眾多目標跟蹤方法,其核心組件是表觀模型,包括產(chǎn)生式模型和判別式模型兩類,與其相應(yīng)的目標跟蹤方法分別稱為產(chǎn)生式跟蹤和判別式跟蹤。產(chǎn)生式跟蹤僅僅使用目標表觀特征跟蹤目標,其比較有代表性的方法有IVT跟蹤[1]、L1跟蹤[2]。判別式跟蹤把目標跟蹤看作二分類問題,它不但利用目標表觀信息而且也利用目標的背景信息,對復雜背景表現(xiàn)更為魯棒,在視覺跟蹤中逐漸占據(jù)了主流地位。其比較有代表性的方法有MIL跟蹤[3]、TLD跟蹤[4]、隨機森林跟蹤[5]、基于SVM跟蹤[6]、相關(guān)濾波跟蹤[7]和深度跟蹤[8]。
近些年,基于結(jié)構(gòu)化SVM的目標跟蹤由于其優(yōu)異的性能而受到了廣泛關(guān)注。但是通過對其采樣過程的實驗分析發(fā)現(xiàn),大多數(shù)的采樣框與目標框的中心距離較遠,且重疊的面積較少或者沒有。少部分的采樣框與目標框的中心距離較近,且重疊的面積較大。因此通過實驗分析可知,基于結(jié)構(gòu)化SVM的目標跟蹤中存在著采樣樣本不均衡的問題。針對存在的這個問題,本文以現(xiàn)有的結(jié)構(gòu)化SVM跟蹤算法為基礎(chǔ),提出了一種基于模糊結(jié)構(gòu)化SVM的目標跟蹤模型,對每個不同的采樣樣本施加于相應(yīng)的重要度,并基于對偶坐標下降原理對模型進行求解,實驗結(jié)果顯示相較于基準跟蹤器DLSSVM[9]跟蹤算法,在精確率和成功率兩個指標上均有明顯的提高。
Lin等提出用模糊支持向量機[10]進行分類,即選擇一個適當?shù)碾`屬度函數(shù),根據(jù)隸屬度函數(shù)得到每個訓練樣本點(xi,yi)的隸屬度值ui( )0<ui≤1 ,ui即表示樣本xi對類別yi的從屬程度。于是訓練集就變成了模糊化訓練樣本集S={( xi,yi,ui),i=1,2,...,N } 。其中,xi∈RN是訓練樣本集,yi∈{- 1,+1}是樣本標簽,0<ui≤1是模糊隸屬度函數(shù)取值范圍。則求解最優(yōu)超平面的優(yōu)化問題則變?yōu)?/p>
其中,C為懲罰因子且滿足C>0;ξi表示松弛變量。
由式(1)可以看出,每個樣本點xi所對應(yīng)的模糊隸屬度ui被嵌入了目標函數(shù)當中。因此,C·ui表示對錯分點的重視程度,C·ui越小,則損失參數(shù)ξi對目標函數(shù)值的影響越小,樣本點xi越不重要。相反,C·ui越大,對應(yīng)樣本越重要,xi被錯分的概率就越小。由此可知,應(yīng)盡可能減小噪聲點或孤立點的C·ui值,減小此類樣本點對分類超平面的影響。
受到結(jié)構(gòu)化SVM在目標檢測中應(yīng)用的啟發(fā),2011年Hare等[11]提出了基于結(jié)構(gòu)化SVM的目標跟蹤Struck。Struck把目標跟蹤看作結(jié)構(gòu)化學習問題,避免了傳統(tǒng)判別式跟蹤的中間分類環(huán)節(jié),顯著提高了目標跟蹤的性能。在利用結(jié)構(gòu)化學習器進行預測時,其目標是預測給定樣本x∈Rd的結(jié)構(gòu)化輸出y∈Y,其中Y可以是任意結(jié)構(gòu)輸出空間。在基于結(jié)構(gòu)化SVM的目標跟蹤中,Y是矩形框空間,它的任一元素用(x,y,w,h)表示,其中(x,y)表示矩形框的中心位置,w和h分別表示矩形框的寬和高。假設(shè)訓練數(shù)據(jù)為表示矩形框y在圖像x上的特征向量,則可以通過式(3)學習一個參數(shù)為w的分類器。
本文針對存在的采樣樣本不均衡問題,提出一種基于模糊結(jié)構(gòu)化SVM模型,該模型描述如下:
其中,C、ξi、Ψi(y)和 L(yi,y)的含義如式(4)中所示,ui在此表示采樣樣本的重要程度,ui越大表示樣本重要程度越高,對其分錯的懲罰系數(shù)也就越大。ui越小表示樣本重要程度越低,對其分錯的懲罰系數(shù)也就越小。
在目標周圍進行采樣的過程中,所得到采樣框均勻地分布在目標框的周圍,本文根據(jù)兩方面設(shè)計采樣樣本的重要度函數(shù),一方面根據(jù)樣本框中心點與目標框中心點之間的距離設(shè)計,另一方面根據(jù)樣本框與目標框的重疊度進行設(shè)計。
表1給出了本文方法、DLSSVM和Struck等三種基于結(jié)構(gòu)化SVM跟蹤器在OTB100[12]數(shù)據(jù)集上的OPE性能指標比較結(jié)果。從表1可以看出,在Precision和Success兩項指標上,本文提出的方法均明顯優(yōu)于其它跟蹤器。由表1中的比較結(jié)果可以看出:本文方法不僅在性能上有明顯提升,而且對目標跟蹤速度幾乎沒有影響。
表2給出了本文方法與基準跟蹤器DLSSVM在不同挑戰(zhàn)性視頻中的比較結(jié)果。由表2可以看出,本文方法在背景混雜、目標形變、遮擋和運動模糊等挑戰(zhàn)性視頻中均有顯著提升,這一結(jié)果表明了本文方法的有效性。
表1 三種基于結(jié)構(gòu)化SVM的跟蹤器在OTB100數(shù)據(jù)集上的OPE性能與速度指標
表2 本文方法與基準跟蹤器DLSSVM在不同屬性視頻中的表現(xiàn)比較
基于結(jié)構(gòu)化SVM的目標跟蹤中存在著采樣樣本不均衡的問題。針對這個問題,本文以現(xiàn)有的結(jié)構(gòu)化SVM跟蹤算法為基礎(chǔ),提出了一種基于模糊結(jié)構(gòu)化SVM的目標跟蹤模型,對每個采樣樣本施加于相應(yīng)的重要度,并基于對偶坐標下降原理對模型進行求解。實驗結(jié)果顯示相較于基準跟蹤器DLSSVM跟蹤算法,在精確率和成功率兩個指標上均有明顯的提高,在背景混雜、目標形變、遮擋和運動模糊等屬性視頻中跟蹤性能提升明顯。