韋超現(xiàn)
(南寧師范大學(xué),廣西 南寧 530000)
圖像跟蹤技術(shù)是將物體的邊界信息作為一個關(guān)鍵特性加入多幀圖像跟蹤標(biāo)簽中[1]。許多問題在計算機(jī)視覺中發(fā)生,如移動目標(biāo)識別,但是在對圖像目標(biāo)跟蹤過程時,由于環(huán)境、背景以及目標(biāo)的復(fù)雜不確定性,容易導(dǎo)致物體移動時,目標(biāo)圖像模具粘貼和顫抖[2]。在這種情況下,如何有效地實現(xiàn)運動圖像在視覺傳達(dá)下的目標(biāo)跟蹤標(biāo)記,是該領(lǐng)域中要解決的問題,已經(jīng)有很多學(xué)者對此進(jìn)行了廣泛的討論。
文獻(xiàn)[3]利用RGB顏色空間變換HSV空間圖像的亮度V分量,建立RGB圖像的背景掩膜,獲取二進(jìn)制圖像,建立坐標(biāo)系,獲取最小矩形特征向量,加入約束條件,并根據(jù)參數(shù)校準(zhǔn),實現(xiàn)動態(tài)樣例構(gòu)建。該方法能夠快速跟蹤圖像特征目標(biāo),但該方法未考慮前景圖像輪廓權(quán)值問題,圖像特征目標(biāo)跟蹤準(zhǔn)確性較低。文獻(xiàn)[4]根據(jù)多尺度小波變換,得到運動前景目標(biāo)信息提取的特點,采用卡爾曼濾波對粒子進(jìn)行預(yù)測和校正,將當(dāng)前觀測到的信息輸入粒子濾波過程中,通過均值和協(xié)方差估計對粒子狀態(tài)進(jìn)行預(yù)測,使動態(tài)粒子更接近于概率分布,從而提高運動目標(biāo)的跟蹤精度。該方法可以有效地跟蹤視頻運動目標(biāo),但該方法計算量大,圖像特征目標(biāo)跟蹤效率較低。
針對上述問題,提出了基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法。采用稀疏表示策略采集多幀圖像的特征目標(biāo),利用高斯分布建立圖像運動模型,再根據(jù)灰度投影法進(jìn)行特征提取,對圖像各個幀間的特征點匹配,獲得多幀圖像的輪廓跟蹤目標(biāo)并運算出前景輪廓的目標(biāo)函數(shù)權(quán)重,實現(xiàn)多幀圖像特征目標(biāo)跟蹤。實驗結(jié)果表明,該方法提取的多幀圖像目標(biāo)特征精度較好,跟蹤準(zhǔn)確率較高,能夠有效降低多幀圖像特征目標(biāo)跟蹤時間。
計算機(jī)技術(shù)獲取和處理視覺圖像信息的功能越來越廣泛。雖然強(qiáng)大的視覺系統(tǒng)可以處理、分析和理解視覺信息,但是沒有實現(xiàn)圖像自主視覺[5]。采用稀疏表示方法,從多幅視頻圖像中采集有效的目標(biāo)特征,視頻圖像的特征選擇過程如下式
(1)
式(1)中,A∈K×(m+n)作為多幀圖像轉(zhuǎn)換為32*32像素大小的圖像。字典是通過將其校驗為列向量來構(gòu)造的。m與n作為字典對應(yīng)的正負(fù)模板個數(shù),K作為多幀圖像的特征維數(shù),s作為稀疏系數(shù)向量,λ1作為權(quán)重因子,p∈m+n作為字典中每個原子的屬性,+1作為原子中的正模板屬性,-1作為原子中的負(fù)模板屬性,s內(nèi)的非零元素作為多幀圖像特征選擇的依據(jù),多幀圖像投影矩陣S的i行和l列元素的表達(dá)式為
(2)
式(2)中,si1表示為稀疏系數(shù)向量s內(nèi)的第i1個元素,通過方程(2)將字典A與候選采樣x兩者投影到相同判別空間中,完成多幀圖像目標(biāo)特征的采集,多幀圖像降維后的字典A′和候選狀態(tài)x′的表達(dá)式如下
A′=SA,x′=Sx
(3)
根據(jù)式(3)可以對K維多幀圖像進(jìn)行高效的特征識別[6]。通過一系列多幀圖像的目標(biāo)觀測值O1:t={o1,o2,…,ot}來估計當(dāng)前多幀圖像的目標(biāo)狀態(tài),并利用方程(4)來運算多幀圖像目標(biāo)狀態(tài)xt的后驗概率。
(4)
式(4)中,p(xt|xt-1)所描述的是視頻圖像的兩個相鄰幀之間的目標(biāo)運動模型。p(xt-1|O1:t-1)所描述的是t-1時刻多幀圖像目標(biāo)狀態(tài)xt的后驗概率。p(ot|xt)所描述的是似然函數(shù)。它闡述了候選狀態(tài)和目標(biāo)模板之間的近似程度。利用高斯分布建立視頻圖像的運動模型,其表達(dá)式為
p(xt|xt-1)=N(xt,xt-1,ψ)
(5)
在式(5)中,N(· )作為高斯分布,ψ作為對角協(xié)方差矩陣,xt-1作為t-1時間段內(nèi)圖像目標(biāo)狀態(tài)多幀圖像第j個候選目標(biāo)狀態(tài)xj的似然函數(shù)表達(dá)式如下
(6)
為了提取多幀圖像的目標(biāo)特征,首先需要對多幀圖像的灰度和細(xì)節(jié)特征進(jìn)行小波分析,然后利用灰度投影法提取多幀圖像的目標(biāo)特征,用圖像目標(biāo)前景和圖像目標(biāo)背景的分類問題代替多幀的特征跟蹤問題,分離圖像目標(biāo)前景和圖像目標(biāo)背景范圍的系數(shù),根據(jù)圖像特征分布方差的比值函數(shù)判斷目標(biāo)前景和目標(biāo)背景范圍。
假設(shè)輸入校正后的灰度圖像為hx(a,b),多幀圖像的兩個特征:灰度細(xì)節(jié)塔Px(u)和細(xì)節(jié)金字塔Qx(u,g)用多尺度描述。為了改善多幀圖像的特點,在視覺傳達(dá)下,對多幀圖像進(jìn)行多幀處理用尺度差分法代替卷積過程,其公式為
(7)
式(7)中,tw所描述的是特征對比度測量值,δy所描述的是影響視頻圖像的目標(biāo)范圍大小,δu所描述的是影響視頻圖像的抑制區(qū)域大小[7]。
在提取多幀圖像灰度和細(xì)節(jié)特征的目標(biāo)特征時,需要設(shè)定Px(y)和Px(u)代表H(u)插值和H(y)尺度的目標(biāo)范圍,得出公式為
(8)
設(shè)定Z(l,r)作為第x1幀視頻圖像中(l,r)像素的灰度值,ga作為x2幀視頻圖像之間的平移估計,gb作為k+m幀視頻圖像之間的平移估計,按照平移估計值合理運算出x3幀視頻圖像的特征目標(biāo),其表達(dá)式為
認(rèn)知與計算的實踐轉(zhuǎn)向中,圖靈提出了一種客觀的,易于操作的檢驗方法。在他看來,如果一臺經(jīng)過編程的計算機(jī)能夠與一個有理性思維能力的人談?wù)撊魏卧掝},而用戶判斷不出他是在與一個人交談還是在與一臺機(jī)器交談,那就可以說這臺計算機(jī)是具有智能的。這就是“圖靈測驗”。
Nx(,r)=|Z(l,r)-ga-gb|
(9)
(10)
式(10)中:F(x)代表灰度特征顯著圖的歸一化函數(shù)為,F(xiàn)(x)代表細(xì)節(jié)特征顯著圖的歸一化函數(shù),F(xiàn)(x)代表運動特征顯著圖的歸一化函數(shù),最終提取到多幀圖像特征值為Ux。因此,利用Ux結(jié)果可以提取出具有目標(biāo)特征的多幀圖像,通過上述步驟,完成多幀圖像特征目標(biāo)的提取。
在對視覺傳達(dá)下多幀圖像特征目標(biāo)跟蹤的過程中,根據(jù)所獲特征目標(biāo)及上述多幀圖像背景高斯分布的參數(shù)模型,實時匹配多幀圖像的特征點,獲得多幀圖像的輪廓軌跡追蹤目標(biāo)[8]。具體流程如下:
(11)
(12)
(13)
假設(shè)圖像中運動對象模型的速度是一個變量,運動區(qū)域外矩形框左上角和右下角坐標(biāo)系中運動模型的速度也是一個變量,然后在α-β-γ濾波器內(nèi),狀態(tài)方程的公式即
(14)
(K+1)=(K)+α[(K+1+K)]
(15)
(16)
(17)
依據(jù)上述公式可知,目標(biāo)函數(shù)優(yōu)化前景區(qū)域的所有輪廓標(biāo)記公式為
(18)
目標(biāo)函數(shù)權(quán)重ci主要根據(jù)相應(yīng)的前景圖像輪廓線的表面積與所有前視輪廓的總面積之比來確定的。根據(jù)權(quán)值結(jié)果,在視覺傳達(dá)下對多幀圖像實施特征目標(biāo)跟蹤,由此實現(xiàn)多幀圖像特征目標(biāo)跟蹤。
為了驗證基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法的有效性,進(jìn)行仿真。實驗數(shù)據(jù)選用具有235幀的flying多幀圖像數(shù)據(jù),圖像特征目標(biāo)選定為場景中的翅膀部分。在Matlab環(huán)境下搭建多幀圖像真實性建模仿真平臺。在實驗過程中,使用佳能5D相機(jī)拍攝了一系列的多幀模型序列圖像,焦距60mm,圖像分辨率2707×1772ppi。分別采用所提方法與文獻(xiàn)[3]方法、文獻(xiàn)[4]方法對提取的多幀圖像目標(biāo)特征進(jìn)行對比。對比結(jié)果如圖1所示。
圖1 不同方法提取的多幀圖像目標(biāo)特征
從圖1中可以看出,文獻(xiàn)[3]方法提取的多幀圖像目標(biāo)錯誤特征較多,其多幀圖像目標(biāo)特征提取精度較差,文獻(xiàn)[4]方法提取的多幀圖像目標(biāo)特征數(shù)量較少,無法準(zhǔn)確地提取到多幀圖像特征目標(biāo),而所提方法能夠準(zhǔn)確地提取多幀圖像目標(biāo)特征。由此可知,所提方法提取的多幀圖像目標(biāo)特征精度較好,因為本文根據(jù)多幀圖像背景高斯分布的參數(shù)模型,對多幀圖像的特征點實時匹配,從而能夠準(zhǔn)確地提取多幀圖像目標(biāo)特征,增強(qiáng)多幀圖像目標(biāo)特征提取精度。
為了驗證基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法的跟蹤時間,分別采用文獻(xiàn)[3]方法、文獻(xiàn)[4]方法與所提方法對多幀圖像特征目標(biāo)跟蹤時間進(jìn)行對比,結(jié)果如圖2所示。
圖2 不同方法多幀圖像特征目標(biāo)跟蹤時間
分析圖2可知,文獻(xiàn)[3]方法的平均多幀圖像特征目標(biāo)跟蹤時間為20s,文獻(xiàn)[4]方法的平均多幀圖像特征目標(biāo)跟蹤時間為26s,而所提方法的平均多幀圖像特征目標(biāo)跟蹤時間僅為7s。由此可知,所提方法的跟蹤時間最短,因為本文主要采用灰度投影法,能夠快速提取多幀圖像的目標(biāo)特征,降低多幀圖像特征目標(biāo)跟蹤時間。
為了驗證基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法的跟蹤準(zhǔn)確性,利用式(19)計算不同方法的多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率,其表達(dá)式為:
(19)
式(19)中,PS表示為正確跟蹤匹配的多幀圖像幀數(shù),ZS表示為總多幀圖像幀數(shù)。對比文獻(xiàn)[3]方法、文獻(xiàn)[4]方法與所提方法多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率,對比結(jié)果如圖3所示。
圖3 不同方法多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率
通過圖3可知,當(dāng)多幀圖像幀數(shù)為250幀時,文獻(xiàn)[3]方法的平均多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率為62%,文獻(xiàn)[4]方法的平均多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率為70%,而所提方法的平均多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率為90%,由此可知,所提方法的多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率最高,因為本文主要根據(jù)前景圖像輪廓線的表面積與所有前視輪廓的總面積之比,確定權(quán)值結(jié)果,從而提高多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率。
為了解決多幀圖像目標(biāo)特征提取精度差、跟蹤準(zhǔn)確率低、跟蹤時間長的問題。提出了基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法。采用稀疏表示策略采集多幀圖像的特征目標(biāo),利用高斯分布建立圖像運動模型,根據(jù)灰度投影法提取目標(biāo)特征,匹配運動圖像幀間的特征點,得到多幀圖像的輪廓跟蹤目標(biāo),求解前景輪廓的目標(biāo)函數(shù)權(quán)重,實現(xiàn)多幀圖像特征目標(biāo)跟蹤。實驗結(jié)果表明,所提方法提取的多幀圖像目標(biāo)特征精度較好,能夠提高多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率、降低跟蹤時間。