劉聃琦
摘 要 如何讓計算機(jī)代替人眼學(xué)會“看”,是一門至關(guān)重要的科學(xué),這門科學(xué)就是計算機(jī)視覺。作為計算機(jī)視覺中的一項重要任務(wù),一個熱點(diǎn)之一,目標(biāo)跟蹤具有重要的應(yīng)用價值。影響目標(biāo)穩(wěn)定跟蹤的因素有很多,想在任何影響下都能穩(wěn)定跟蹤在領(lǐng)域內(nèi)是一項重大的挑戰(zhàn)。相關(guān)濾波跟蹤算法具有較高的跟蹤精度以及優(yōu)秀的跟蹤處理速度,然而在目標(biāo)有尺度變化或者受到遮擋時的跟蹤效果不是很理想。針對這兩個問題,本文提出一種基于核相關(guān)濾波并融合HOG特征與SIFT特征的跟蹤算法。該算法能在一定程度上解決目標(biāo)尺度變化劇烈以及短暫遮擋后目標(biāo)框漂移的問題。
關(guān)鍵詞 目標(biāo)跟蹤;相關(guān)濾波;尺度自適應(yīng);抗遮擋;特征融合
1相關(guān)濾波跟蹤原理
1.1 相關(guān)濾波
在信號領(lǐng)域,兩個信號的相似程度稱之為相關(guān)性。將相關(guān)的概念運(yùn)用到跟蹤里,就是得到一個模板跟蹤器,將模板與跟蹤目標(biāo)進(jìn)行相關(guān)檢測,最終得到最相關(guān)的目標(biāo)區(qū)域完成跟蹤[1]。
1.2 核相關(guān)濾波
實際問題大多都是非線性回歸問題,直接求解非線性問題非常困難,所以經(jīng)常使用非線性變換將現(xiàn)實中的這類問題轉(zhuǎn)化為核空間的線性問題來簡化。這個非線性變換可以用一個變換函數(shù)來實現(xiàn)將低維空間映射到高維核空間。
核相關(guān)濾波跟蹤算法首先對第一幀圖像提取HOG特征進(jìn)行建模,再將目標(biāo)樣本循環(huán)采樣構(gòu)成樣本循環(huán)矩陣,用所得到的樣本與期望響應(yīng)進(jìn)行訓(xùn)練得到核相關(guān)濾波器,最后用濾波器對后續(xù)目標(biāo)幀進(jìn)行核相關(guān)運(yùn)算得到目標(biāo)響應(yīng)圖。
1.3 缺陷分析
當(dāng)目標(biāo)有明顯尺度變化情況,或者目標(biāo)被遮擋時,會影響到模板更新,也會造成目標(biāo)框漂移跟蹤不穩(wěn)定的問題。
采用的特征是單一的HOG特征,依賴跟蹤目標(biāo)的空間布局,不適應(yīng)目標(biāo)形變。
2結(jié)合SIFT的核相關(guān)濾波算法
SIFT特征是一種穩(wěn)定的特征描述。本文融合SIFT特征對運(yùn)動目標(biāo)跟蹤算法進(jìn)行優(yōu)化。
2.1 SIFT算法概述
SIFT特征對圖像的旋轉(zhuǎn)、縮放、亮度變化都有適應(yīng)能力,在視角變化、仿射變換、噪音等影響因素下也能保持特征描述的穩(wěn)定性。
SIFT特征信息特征庫豐富,能進(jìn)行快速準(zhǔn)確的匹配達(dá)到實時性。SIFT特征描述量大,可以很方便地與其他特征向量進(jìn)行匹配[2]。
2.2 SIFT算法理論基礎(chǔ)
(1)高斯尺度空間
圖像的模糊程度可以模擬視網(wǎng)膜對于不同距離物體的成像效果。人距離物體越近其尺寸越大,圖像也越模糊,這就是高斯尺度空間。
稱為尺度空間因子,其值越大圖像越模糊,對應(yīng)的尺度越大。代表圖像的高斯尺度空間。
(2)空間極值檢測
每個像素點(diǎn)要和同一尺度空間和相鄰尺度空間的相鄰點(diǎn)進(jìn)行比較。該點(diǎn)要與3*3鄰域內(nèi)的三個尺度空間的相鄰點(diǎn)作比較,共26個像素點(diǎn)。
(3)求取特征點(diǎn)主方向
計算以特征點(diǎn)為中心,每個點(diǎn)的梯度的模以及方向可通過下面公式求得:
梯度方向的直方圖橫坐標(biāo)為梯度方向的角度,縱坐標(biāo)為對應(yīng)方向梯度幅值的累加,直方圖的峰值則為特征點(diǎn)主方向。
(4)特征描述
關(guān)鍵點(diǎn)旋轉(zhuǎn)后以主方向為中心取16*16的鄰域點(diǎn),每個像素都表示為一個幅值和一個方向,最后利用高斯窗口對每4*4進(jìn)行加權(quán)運(yùn)算得到16個描述子來描述特征,每個描述子有8個方向的梯度信息,最后產(chǎn)生128維的特征描述向量。
2.3 算法綜述
本文提出一種基于核相關(guān)濾波并融合SIFT特征的運(yùn)動目標(biāo)跟蹤算法。首先,保持運(yùn)用HOG特征對第一幀圖像的目標(biāo)區(qū)域進(jìn)行特征描述,對目標(biāo)圖像進(jìn)行循環(huán)采樣,得到的樣本再與所框選目標(biāo)的期望響應(yīng)進(jìn)行訓(xùn)練得到相關(guān)濾波模板;運(yùn)用該模板對下一幀圖像進(jìn)行最大響應(yīng)跟蹤并更新模板參數(shù);當(dāng)目標(biāo)受到遮擋或者尺度變化過大時,停止更新模板并提取目標(biāo)區(qū)域的SIFT特征,直至遮擋結(jié)束或者目標(biāo)恢復(fù),利用SIFT特征找到丟失的目標(biāo),再恢復(fù)原利用HOG特征的相關(guān)濾波進(jìn)程繼續(xù)跟蹤[3]。
參考文獻(xiàn)
[1] Henriques J. F.,Caseiro R.,Martins P.,et al. Exploiting the circulant structure of tracking-by-detection with kernels[C]. European conference on computer vision. Springer Berlin Heidelberg,2012:702-715.
[2] Henriques J. F.,Caseiro R.,Martins P.,et al. High-speed tracking with kernelized correlation filters[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2015,37(3):583-596.
[3] 吳昭童.基于相關(guān)濾波的目標(biāo)穩(wěn)定跟蹤技術(shù)研究[D].北京:中國科學(xué)院大學(xué),2019.