李文峰
(青島酒店管理職業(yè)技術(shù)學(xué)院 基礎(chǔ)部體育教研室, 山東 青島 266100)
互聯(lián)網(wǎng)技術(shù)以及計(jì)算機(jī)技術(shù)的飛速發(fā)展,促使多媒體技術(shù)中的視頻數(shù)據(jù)呈爆發(fā)式增長(zhǎng)[1-2].相對(duì)于靜態(tài)圖像而言,視頻中包含各種類(lèi)型的數(shù)據(jù),表達(dá)形式更加直接,是獲取信息的重要來(lái)源.面對(duì)大量的視頻數(shù)據(jù),如何快速、有效地模擬短跑圖視頻中特征點(diǎn)的紋理、形狀和運(yùn)動(dòng)等底層特征成為視頻處理領(lǐng)域研究的熱點(diǎn)[3].已有相關(guān)短跑圖視頻中特征點(diǎn)軌跡模擬方法的研究較多,但是在復(fù)雜的場(chǎng)景下,長(zhǎng)時(shí)間且可靠的短跑圖視頻中特征點(diǎn)軌跡模擬仍然是一個(gè)具有挑戰(zhàn)性的問(wèn)題.由于先驗(yàn)知識(shí)的缺乏以及目標(biāo)運(yùn)動(dòng)過(guò)程中不同因素的存在,促使視頻特征點(diǎn)準(zhǔn)確模擬變得困難.針對(duì)短跑圖視頻中特征點(diǎn)軌跡模擬問(wèn)題,還存在目標(biāo)數(shù)量未知、虛假觀測(cè)等多種不確定性因素,促使目標(biāo)和觀測(cè)間數(shù)據(jù)關(guān)聯(lián)變得更加困難.
為了更好地解決上述問(wèn)題,本文結(jié)合模糊決策,提出了一種基于模糊決策的短跑圖視頻中特征點(diǎn)軌跡模擬方法.仿真實(shí)驗(yàn)結(jié)果表明,所提方法不僅能夠有效提升短跑圖視頻中特征點(diǎn)軌跡模擬精確度,同時(shí)還能夠有效降低計(jì)算復(fù)雜度和絕對(duì)誤差.
短跑圖視頻中特征點(diǎn)軌跡模擬是計(jì)算視覺(jué)研究中一個(gè)重要的課題.在復(fù)雜環(huán)境下各個(gè)運(yùn)動(dòng)目標(biāo)的模擬問(wèn)題中,雖然可以準(zhǔn)確模擬目標(biāo)在第一幀圖像中的具體位置信息,但是無(wú)法獲取和目標(biāo)存在關(guān)聯(lián)的先驗(yàn)信息.通常情況下,起始位置信息主要是人工在第一幀圖像中利用矩形標(biāo)記框進(jìn)行過(guò)標(biāo)記.雖然通過(guò)第一幀圖像能夠確定運(yùn)動(dòng)目標(biāo)的具體坐標(biāo)信息,但是由于缺少對(duì)先驗(yàn)知識(shí)的缺乏,導(dǎo)致復(fù)雜場(chǎng)景下的短跑圖視頻中特征點(diǎn)軌跡模擬成為一個(gè)調(diào)整性問(wèn)題.
針對(duì)復(fù)雜場(chǎng)景下的短跑圖視頻中特征點(diǎn)軌跡模擬問(wèn)題,結(jié)合模糊決策[4],提出一種短跑圖視頻中特征點(diǎn)跟蹤方法,具體流程如圖1所示.
在起始幀給出目標(biāo)位置以及目標(biāo)區(qū)域進(jìn)行局部圖像采集,將其設(shè)定為訓(xùn)練樣本.利用隨機(jī)森林算法對(duì)訓(xùn)練樣本中的顏色特征以及梯度特征中的信息進(jìn)行訓(xùn)練.另外,對(duì)光流跟蹤塊的起始位置進(jìn)行初始化處理.然后,繼續(xù)采集圖像下一幀重疊部分的圖像塊,通過(guò)隨機(jī)森林算法分別計(jì)算不同圖像外觀特征的投票可信度.利用有效光流跟蹤塊和目標(biāo)中心位置間的偏移向量對(duì)目標(biāo)尺度進(jìn)行估計(jì).全部估計(jì)出的現(xiàn)階段目標(biāo)狀態(tài),采用當(dāng)前位置以及其附近區(qū)域隨機(jī)采集到的新訓(xùn)練樣本對(duì)隨機(jī)森林算法在線(xiàn)更新,同時(shí),更新光流跟蹤塊的起始位置[5].當(dāng)下一幀圖像到來(lái)時(shí),繼續(xù)重復(fù)上述操作過(guò)程.
圖1 短跑圖視頻中特征點(diǎn)跟蹤流程圖
外觀特征投票主要是通過(guò)隨機(jī)森林算法形成,利用對(duì)應(yīng)特征得到目標(biāo)運(yùn)動(dòng)中心位置偏移向量[6].設(shè)定訓(xùn)練樣本集為
S0={(x1,y1),(x2,y2),…,(xn,yn)}
(1)
其中
xi=(v1,v2,…,vd)
(2)
式中,xi代表第i個(gè)訓(xùn)練樣本的特征向量.
針對(duì)分類(lèi)問(wèn)題,訓(xùn)練樣本的屬性標(biāo)簽yi代表類(lèi)別信息,采用離散數(shù)值表示.其中分支節(jié)點(diǎn)輸出判別函數(shù)的設(shè)定表示如下:
f(x,θj)={0,1},j=0,1,…,2m-1-1
(3)
(4)
(5)
假設(shè)通過(guò)訓(xùn)練樣本子集S1或者S2的信息能夠進(jìn)行精準(zhǔn)的信息預(yù)測(cè),以此為依據(jù)形成對(duì)應(yīng)的葉子節(jié)點(diǎn).假設(shè)不能夠做出有效預(yù)測(cè),則形成內(nèi)部分支節(jié)點(diǎn)[7-8],然后利用隨機(jī)優(yōu)化方法對(duì)函數(shù)空間進(jìn)行優(yōu)化處理,選出其中最優(yōu)的分支節(jié)點(diǎn)輸出判別函數(shù),對(duì)分支節(jié)點(diǎn)的輸入訓(xùn)練樣本子集進(jìn)行分割,即
(6)
式中,?代表空集.重復(fù)上述操作過(guò)程,直到滿(mǎn)足最終的終止條件.
對(duì)于訓(xùn)練樣本I而言,將隨機(jī)森林算法中決策樹(shù)的分支節(jié)點(diǎn)輸出設(shè)定為判別函數(shù),則有
(7)
Lab顏色特征主要通過(guò)式(8)計(jì)算獲取
(8)
其中9個(gè)不同方向的梯度特征可以通過(guò)以下公式獲取,即
(9)
O(i,j)=arctan(dy(i,j)/dx(i,j))
(10)
Ign=M(i,j)×φ[O(i,j)=n]
(11)
算法中的各個(gè)參數(shù)主要通過(guò)訓(xùn)練過(guò)程進(jìn)行確定,其中訓(xùn)練目標(biāo)通過(guò)目標(biāo)表示.當(dāng)確定短跑圖視頻中的目標(biāo)函數(shù)[9]后,可以將學(xué)習(xí)問(wèn)題轉(zhuǎn)換為目標(biāo)函數(shù)的最優(yōu)問(wèn)題.針對(duì)于分類(lèi)問(wèn)題,主要使用信息增益作為目標(biāo)函數(shù).其中編號(hào)為j的分支節(jié)點(diǎn)所對(duì)應(yīng)的信息熵計(jì)算式為
(12)
通過(guò)式(12),能夠得到信息增益的計(jì)算式
(13)
在時(shí)空信息中分別提取短跑圖視頻中的特征度量目標(biāo)以及觀測(cè)間的距離,采用模糊決策計(jì)算運(yùn)動(dòng)目標(biāo)的模糊隸屬度,即
(14)
在此基礎(chǔ)上,采用模糊綜合函數(shù)對(duì)兩種隸屬度進(jìn)行融合,得到最終的模糊綜合隸屬度.
將大量的數(shù)據(jù)挖掘方法以及模糊決策相結(jié)合,采用14個(gè)紋理特征向量對(duì)紋理多角度進(jìn)行細(xì)致的描述,獲取模糊形式背景.采用模糊決策形成對(duì)應(yīng)的紋理關(guān)聯(lián)規(guī)則,通過(guò)紋理關(guān)聯(lián)特征快速、有效地挖掘視頻紋理特征,可以有效實(shí)現(xiàn)短跑圖視頻中特征點(diǎn)軌跡模擬,具體操作過(guò)程為:初始視頻→鏡頭分割→圖像分塊→紋理特征向量→模糊決策→關(guān)聯(lián)規(guī)則挖掘→特征軌跡模擬.
1) 短跑圖視頻鏡頭分割.
2) 通過(guò)邊緣分割法對(duì)短跑圖視頻中初始片段v進(jìn)行鏡頭分割,得到鏡頭v={s1,s2,…,sM1}.其中,M1代表鏡頭的總數(shù).
3) 由于相同鏡頭中各個(gè)視頻幀之間存在較強(qiáng)的關(guān)聯(lián)性,將各個(gè)鏡頭分別以每9幀的方式依次劃分為不同的視頻片段,同時(shí)選取各個(gè)視頻中第一幀視頻作為短跑圖視頻中的關(guān)鍵幀;另外,同時(shí)鏡頭獲取的視頻片段總數(shù)是不同的.
4) 對(duì)各個(gè)視頻中的關(guān)鍵幀進(jìn)行規(guī)格為8×8大小的圖像分塊,計(jì)算獲取不同圖像塊的14個(gè)紋理特征向量,將關(guān)鍵幀中全部圖像塊設(shè)定為對(duì)象集,將各個(gè)圖像塊的14個(gè)紋理特征向量設(shè)定為屬性集,組成模糊形式背景F1.
5) 通過(guò)模糊形式背景F1組建關(guān)鍵幀的模糊決策概念,同時(shí)進(jìn)一步形成對(duì)應(yīng)的紋理特征.
6) 通過(guò)關(guān)聯(lián)規(guī)則提取不同關(guān)鍵幀的紋理特征.
7) 由于各個(gè)視頻片段中各個(gè)視頻幀具有較強(qiáng)的關(guān)聯(lián)性,通過(guò)視頻關(guān)鍵幀的紋理關(guān)聯(lián)規(guī)則,挖掘短跑圖視頻中的其他紋理特征[10],操作步驟和關(guān)鍵幀紋理特征挖掘一致.
8) 繼續(xù)重復(fù)步驟3)到步驟6),直到完全短跑圖視頻中全部視頻幀的特征點(diǎn)提取.
9) 通過(guò)特征點(diǎn)提取結(jié)果,實(shí)現(xiàn)短跑圖視頻中特征點(diǎn)軌跡模擬.
為了驗(yàn)證所提基于模糊決策的短跑圖視頻中特征點(diǎn)軌跡模擬方法,仿真實(shí)驗(yàn)在內(nèi)存為4 G,硬盤(pán)為480 G的Dell臺(tái)式機(jī)上進(jìn)行,操作系統(tǒng)為Windous 7,主要采用Matlab以及Python編程實(shí)現(xiàn).另外,設(shè)定視頻的長(zhǎng)度分別為90幀、120幀、150幀、180幀、200幀、360幀、480幀、600幀、1 200幀和2 400幀.
將文[4]和文[5]中的方法分別與本文方法進(jìn)行短跑圖視頻中特征點(diǎn)軌跡模擬,將模擬精確度設(shè)定為測(cè)試指標(biāo),具體實(shí)驗(yàn)對(duì)比結(jié)果如表1所示.分析表1中的實(shí)驗(yàn)數(shù)據(jù)可知,隨著視頻長(zhǎng)度的不斷增加,各個(gè)方法的短跑圖視頻中特征點(diǎn)軌跡模擬精確度也在不斷發(fā)生變化.從實(shí)驗(yàn)數(shù)據(jù)中可以看出,所提方法的短跑圖視頻中特征點(diǎn)軌跡模擬精確度明顯更高,同時(shí)也證明所提方法能夠準(zhǔn)確模擬短跑圖視頻中特征點(diǎn)軌跡.
表1 所提方法與文獻(xiàn)方法短跑圖視頻中特征點(diǎn)軌跡模擬精確度的比較
利用圖2給出的3種不同方法的計(jì)算復(fù)雜度,并分析相關(guān)實(shí)驗(yàn)數(shù)據(jù)可知,各個(gè)方法的計(jì)算復(fù)雜度隨著測(cè)試樣本數(shù)量的增加而增加,但是所提方法的計(jì)算復(fù)雜度明顯更低,說(shuō)明所提方法能夠有效降低計(jì)算復(fù)雜度.為了更進(jìn)一步驗(yàn)證所提方法的有效性,進(jìn)行實(shí)驗(yàn)測(cè)試,對(duì)比不同方法的絕對(duì)誤差,具體對(duì)比結(jié)果如表2所示.
圖2 不同方法的計(jì)算復(fù)雜度
表2 所提方法與文獻(xiàn)方法的絕對(duì)誤差變化情況的比較
從表2中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法的絕對(duì)誤差明顯低于文[4]和文[5]方法,表明所提方法能夠獲取更加滿(mǎn)意的特征點(diǎn)軌跡模擬結(jié)果.
針對(duì)傳統(tǒng)的短跑圖視頻中特征點(diǎn)軌跡模擬方法存在問(wèn)題,提出了一種基于模糊決策的短跑圖視頻中特征點(diǎn)軌跡模擬方法.仿真實(shí)驗(yàn)結(jié)果表明,所提方法能夠有效提升短跑圖視頻中特征點(diǎn)軌跡模擬精確度,降低計(jì)算復(fù)雜度以及絕對(duì)誤差,能夠獲取較為滿(mǎn)意的短跑圖視頻中特征點(diǎn)軌跡模擬結(jié)果.