解博江 朱晶晶
(黃河交通學(xué)院智能工程學(xué)院,河南 焦作454950)
視頻目標(biāo)跟蹤在智慧城市、智能交通、醫(yī)療輔助、人機(jī)交互等領(lǐng)域具有非常重要的應(yīng)用,是計(jì)算機(jī)視覺與模式識(shí)別的一個(gè)重要的研究課題[1]。目前,研究視頻目標(biāo)跟蹤的算法眾多,可分為生成式[2]與判別式[3]方法。其中生成式方法首先建立目標(biāo)表觀模型,通過對(duì)視頻中每一幀圖像按照一定的策略搜索,以此得到與表觀模型最為相近的區(qū)域,作為目標(biāo)所在位置。而判別式方法則把目標(biāo)跟蹤看成一個(gè)典型的分類問題,其核心思想是建立目標(biāo)和背景差異模型,訓(xùn)練出一個(gè)分類器,能夠從圖像信息中區(qū)分出目標(biāo)與背景,從而確定目標(biāo)位置,達(dá)到跟蹤效果。相關(guān)濾波是一種典型的判別式跟蹤方法,Bolme 等[4]人首次將相其引入到視頻目標(biāo)跟蹤領(lǐng)域中,并以最小二乘的方式對(duì)濾波模板進(jìn)行訓(xùn)練,最終形成了最小輸出均方誤差和跟蹤方法,以其較高的跟蹤速度與精度,引起了眾多學(xué)者的廣泛關(guān)注。文獻(xiàn)[5]提出的時(shí)空?qǐng)鼍案櫡椒?,從概率論的角度?duì)相關(guān)濾波方法進(jìn)行封裝,同時(shí)融入了時(shí)空上下文信息,并且在模板更新中考慮到了目標(biāo)尺度變化問題。文獻(xiàn)[6]提出了循環(huán)結(jié)構(gòu)核跟蹤方法,該方法用核化嶺回歸的方式來(lái)訓(xùn)練濾波模板,從而增加視頻目標(biāo)跟蹤中模板在光照、遮擋等情況下的適用性。文獻(xiàn)[7]在將單通道核相關(guān)濾波器拓展為多通道,有效解決了復(fù)雜多維度特征的使用問題,通過方向梯度直方圖特征代替簡(jiǎn)單像素灰度特征,提出了核相關(guān)濾波器。上述所提及的跟蹤方法,都是直接對(duì)彩色圖像序列進(jìn)行灰度化處理,然后提取其特征。這就導(dǎo)致了顏色信息的嚴(yán)重缺失,造成了對(duì)快速運(yùn)動(dòng)及形變目標(biāo)的描述能力不足,表現(xiàn)為跟蹤精度的下降,特別是在視頻亮度不高的情況下,容易引起誤差量的增大并累積,最終導(dǎo)致目標(biāo)的漂移。為此,本文提出使用加權(quán)融合的HSV 顏色空間信息與HOG 特征進(jìn)行級(jí)聯(lián)去表征目標(biāo),并通過構(gòu)建核相關(guān)濾波器實(shí)現(xiàn)對(duì)目標(biāo)的有效跟蹤。
相關(guān)濾波考慮到視頻目標(biāo)序列具有較強(qiáng)的相關(guān)性,認(rèn)為視頻中同一目標(biāo)在連續(xù)的兩幀圖像中位置及尺度變化不會(huì)太大,因此可以利用當(dāng)前已知的目標(biāo)圖像序列來(lái)訓(xùn)練模板。用得到的訓(xùn)練模板和當(dāng)前的圖像進(jìn)行相關(guān)運(yùn)算,使響應(yīng)值達(dá)到最大的地方就目標(biāo)所在的位置。計(jì)算過程如式(1)所示。
其中,x 為當(dāng)前幀圖像,w為訓(xùn)練得到的模板,兩者進(jìn)行的運(yùn)算為互相關(guān)運(yùn)算,y 為當(dāng)前幀中目標(biāo)所在位置的響應(yīng)函數(shù)。
X、Y 分別為輸入前m 幀圖像樣本xi和其對(duì)應(yīng)的回歸目標(biāo)yi所組成的兩個(gè)向量,XH是X 的復(fù)共軛轉(zhuǎn)置,I 為單位矩陣。如果直接通過(5)式求解w系數(shù),計(jì)算量較大。通過循環(huán)移位的方式對(duì)輸入的前一幀圖像構(gòu)建循環(huán)矩陣代替前m 幀圖像進(jìn)行訓(xùn)練,充分利用任意循環(huán)矩陣都可以被傅里葉變換矩陣對(duì)角化這一特殊性質(zhì),簡(jiǎn)化訓(xùn)練求解過程。利用循環(huán)矩陣的性質(zhì)可解得:
對(duì)式兩端同時(shí)進(jìn)行FFT 變換并應(yīng)用循環(huán)矩陣性質(zhì)可得到所訓(xùn)練濾波模板的閉合解。
HSV 顏色模型是通過三種屬性- 色度、飽和度和明度來(lái)對(duì)一幅彩色圖像信息進(jìn)行描述描述,三者分別反映圖像的色調(diào),圖像色彩的深淺程度以及色彩明亮程度。這種色彩描述方式相比常用的RGB 模型更接近人的視覺感觀,而且HSV 色彩空間對(duì)光照的變化具有良好的魯棒性,所以比較適合對(duì)光照變化情況下的彩色圖像信息進(jìn)行描述。由RGB 到HSV 顏色模型的轉(zhuǎn)換可以看出H、S、V 三通道信息相互獨(dú)立,其中V 分量在一定程度上能反應(yīng)圖像的灰度信息,而H 和S 分量則反映顏色信息。
實(shí)驗(yàn)選取了Benchmark 視頻庫(kù)中的四段目標(biāo)發(fā)生快速運(yùn)動(dòng)及形變的彩色視頻序列,并在不同亮度條件下,將KCF 與本文所提出的三通道加權(quán)融合的HSVKCF 進(jìn)行對(duì)比測(cè)試,結(jié)果如圖1 所示。
圖1 KCF 與本文方法跟蹤效果對(duì)比圖
圖1 中a、b 兩組為對(duì)應(yīng)著原始亮度與降低20%亮度后的圖像序列。在視頻1 的a 組中,運(yùn)動(dòng)員在快速運(yùn)動(dòng)時(shí)產(chǎn)生形變,使用KCF 的跟蹤方法跟蹤框出現(xiàn)一定的偏移,跟蹤精度降低,而本算法能夠保持較好的跟蹤效果。視頻1 的b 組視頻,整體亮度降低,此時(shí),KCF 算法在跟蹤時(shí)跟蹤框出現(xiàn)了較大的偏移,隨著時(shí)間的推移,跟蹤誤差不斷增大,最終出現(xiàn)跟蹤失敗。本文算法因?yàn)槿谌際SV 三通道顏色信息,跟蹤效果較好。在視頻2 的a組中,跟蹤的目標(biāo)出現(xiàn)了快速移動(dòng)移動(dòng),同時(shí)有尺度的變化,KCF 算法在跟蹤時(shí),跟蹤框出現(xiàn)偏移,b 組的視頻亮度低的情況下,這種更加凸顯了偏移量,隨著模板誤差的累積,最終跟蹤失敗;而本文所提出的算法受視頻亮度的影響較少,故依然能準(zhǔn)確的跟蹤目標(biāo)。在以上測(cè)試視頻中,由于目標(biāo)發(fā)生快速運(yùn)動(dòng)及形變,引起KCF 的跟蹤精度出現(xiàn)不同程度的下降,尤其是在低亮度情況下更為明顯,融入HSV 三通道顏色信息的HSVKCF 對(duì)視頻亮度變化不敏感,而且對(duì)快速運(yùn)動(dòng)及形變的目標(biāo)有更好的跟蹤效果。
典型相關(guān)濾波類算法在跟蹤速度及精度上具有一定的優(yōu)勢(shì),但對(duì)彩色圖像序列進(jìn)行處理時(shí),為了提高計(jì)算效率,通常直接將其顏色信息舍去,導(dǎo)致目標(biāo)發(fā)生快速運(yùn)動(dòng)以及形變時(shí),出現(xiàn)了跟蹤精度下降的現(xiàn)象,特別是在視頻亮度不高的情況下更為嚴(yán)重。本文從有效利用顏色信息的角度出發(fā),采用HSV 三通道加權(quán)級(jí)聯(lián)HOG 特征去有效表征目標(biāo),并構(gòu)建核相關(guān)濾波器達(dá)到跟蹤的目的。為了驗(yàn)證算法的有效性,對(duì)本文提出的HSVKCF 與常見的相關(guān)濾波算法做了兩組對(duì)比性試驗(yàn),結(jié)果表明融入顏色信息后HSVKCF 對(duì)與快速運(yùn)動(dòng)及形變的目標(biāo)有更高的跟蹤精度,并且對(duì)視頻亮度變化敏感度較低。