朱姣潔
【摘要】? ? 為了降低由于內(nèi)容過(guò)渡引起的視頻關(guān)鍵幀提取誤差,提出基于內(nèi)容的動(dòng)畫視頻關(guān)鍵幀提取技術(shù)研究。以視頻內(nèi)容為依據(jù),對(duì)動(dòng)畫視頻劃分為若干個(gè)子鏡頭,對(duì)劃分后的子鏡頭視頻圖像進(jìn)行歸一化處理,降低由于灰度差異引起的關(guān)鍵幀識(shí)別錯(cuò)誤,根據(jù)漸變特征,剔除歸一化后視頻圖像中的漸變幀,最后對(duì)各個(gè)子鏡頭進(jìn)行關(guān)鍵幀識(shí)別與提取。并進(jìn)行實(shí)驗(yàn)測(cè)試,實(shí)驗(yàn)結(jié)果表明,所提方法進(jìn)行關(guān)鍵幀提取時(shí),漏選幀數(shù)低于2幀,錯(cuò)幀數(shù)低于3幀,具有較高的提取效果。
【關(guān)鍵詞】? ? 視頻內(nèi)容? ? 動(dòng)畫視頻? ? 關(guān)鍵幀? ? 漸變幀
引言:
近些年來(lái),視頻動(dòng)畫的制作精度逐漸提高,視頻文件的大小也不斷增加,在此環(huán)境下,各種視頻壓縮技術(shù)應(yīng)運(yùn)而生,為動(dòng)畫視頻的傳播交流提供了良好基礎(chǔ),并在一定程度上推進(jìn)了動(dòng)畫視頻的發(fā)展,使其在各種網(wǎng)絡(luò)和存儲(chǔ)媒介中廣泛存在[1]。為了實(shí)現(xiàn)在海量視頻內(nèi)容中快速高效地完成對(duì)所需內(nèi)容的查找,標(biāo)引和檢索問(wèn)題逐漸受到人們的關(guān)注[2]。在傳統(tǒng)視頻檢索方法中,主要是通過(guò)關(guān)鍵字為進(jìn)行檢索,不但在耗時(shí)方面存在較大弊端,同時(shí)檢索結(jié)果也不盡如人意。隨著專家學(xué)者們的研究不斷深入,基于內(nèi)容的視頻檢索方法被提出,并成為研究熱點(diǎn)[3]。其中,基于視頻關(guān)鍵幀的檢索最為受到關(guān)注,在這一方法中,關(guān)鍵幀提取是關(guān)鍵技術(shù)[4]。因此,對(duì)于關(guān)鍵幀的準(zhǔn)確識(shí)別、提取成為現(xiàn)階段備受關(guān)注的問(wèn)題[5]。
基于此,本文提出基于內(nèi)容的動(dòng)畫視頻關(guān)鍵幀提取技術(shù)研究。將內(nèi)容作為對(duì)視頻內(nèi)容劃分的依據(jù),在此基礎(chǔ)上,對(duì)視頻通過(guò)對(duì)視頻進(jìn)行歸一化處理、剔除過(guò)渡幀的方式,提高關(guān)鍵幀的識(shí)別精度,提高關(guān)鍵幀的提取效果。并進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證了所提方法的可行性。
一、基于內(nèi)容的視頻鏡頭劃分
本文以內(nèi)容差異性最大,也就是相關(guān)性最小的內(nèi)容作為分隔鏡頭的節(jié)點(diǎn)。首先,對(duì)動(dòng)畫視頻內(nèi)容數(shù)據(jù)X={x1,x2,...,xi}構(gòu)建內(nèi)容差異函數(shù),獲得視頻內(nèi)容數(shù)據(jù)的相關(guān)性λij,
其中,ε(λ)為動(dòng)畫視頻相關(guān)性性計(jì)算函數(shù),當(dāng)xj不是xi的視頻中時(shí)間近鄰時(shí)內(nèi)容時(shí),取λij=0。那么,由所有動(dòng)畫視頻內(nèi)容數(shù)據(jù)相關(guān)性權(quán)值λij,可以組成的矩陣則表示為λ=(λij)。這樣,得到的動(dòng)畫視頻中,內(nèi)容數(shù)據(jù)點(diǎn)xi和它鄰域數(shù)據(jù)點(diǎn)之間的相關(guān)性關(guān)系。以此為基礎(chǔ),根據(jù)計(jì)算出的相關(guān)性結(jié)果,將視頻內(nèi)容劃分為N個(gè)子鏡頭,為后續(xù)的動(dòng)畫視頻關(guān)鍵幀提取提供基礎(chǔ)。
二、動(dòng)畫視頻關(guān)鍵幀提取
2.1視頻圖像歸一化處理
在進(jìn)行關(guān)鍵幀提取之前,需要對(duì)動(dòng)畫視頻子鏡頭的圖像進(jìn)行歸一化處理。本文主要是對(duì)灰度進(jìn)行歸一化處理,對(duì)動(dòng)畫視頻子鏡頭的圖像中出現(xiàn)的灰度不均部分進(jìn)行補(bǔ)償,使在關(guān)鍵幀識(shí)別和提取時(shí),動(dòng)畫視頻子鏡頭的圖像灰度保持統(tǒng)一。假設(shè)動(dòng)畫視頻子鏡頭的圖像像素為a×b,灰度為A(x,y),1≤x≤a,1≤y≤b。則灰度均值和方差分別為
通過(guò)該方法,將動(dòng)畫視頻子鏡頭的圖像灰度均值和方差設(shè)定為固定值,以此降低在后續(xù)關(guān)鍵幀提取過(guò)程中由于視頻圖像灰度差異較大引起的識(shí)別錯(cuò)誤。
2.2漸變幀檢測(cè)與剔除
根據(jù)漸變過(guò)程幀特征,對(duì)動(dòng)畫視頻子鏡頭的信息數(shù)據(jù)進(jìn)行編碼,編碼參數(shù)分別設(shè)定為視頻圖像亮度變化梯度、視頻聲音變化梯度、梯度變化連續(xù)時(shí)間、梯度變化前后差異,式4是動(dòng)畫視頻子鏡頭中漸變過(guò)程幀的計(jì)算方式。
其中,L表示視頻圖像亮度變化梯度評(píng)價(jià)結(jié)果,S表示視頻聲音變化梯度評(píng)價(jià)結(jié)果,T表示梯度變化連續(xù)時(shí)間評(píng)價(jià)結(jié)果,C表示梯度變化前后差異評(píng)價(jià)結(jié)果,P表示交叉結(jié)果。根據(jù)其計(jì)算出子鏡頭中的漸變過(guò)程幀,降低在關(guān)鍵幀提取過(guò)程中的干擾,提高提取結(jié)果的可靠性。
2.3關(guān)鍵幀識(shí)別與提取
在上述對(duì)動(dòng)畫視頻處理基礎(chǔ)上,對(duì)子鏡頭關(guān)鍵幀進(jìn)行識(shí)別,對(duì)于各子鏡頭,首先將鏡頭的起始幀作為基準(zhǔn)幀,計(jì)算后續(xù)各幀與基準(zhǔn)幀之間的特征進(jìn)行計(jì)算
在進(jìn)行子鏡頭檢測(cè)時(shí),由于各子鏡頭的內(nèi)容不同,因此,需要根據(jù)其內(nèi)容設(shè)置不同的閾值。本文采用自動(dòng)選取閾值的方法對(duì)閾值進(jìn)行設(shè)定,以此實(shí)現(xiàn)對(duì)子鏡關(guān)鍵幀的有效識(shí)別。閾值的計(jì)算方式可以表示為
其中,ε表示所有相鄰幀間特征之和。通過(guò)這種方式,實(shí)現(xiàn)對(duì)動(dòng)畫視頻子鏡頭關(guān)鍵幀的特征識(shí)別,將滿足閾值范圍的幀作為關(guān)鍵幀進(jìn)行提取。
三、試驗(yàn)測(cè)試
為了測(cè)試本文提出的關(guān)鍵幀提取技術(shù)的實(shí)際性能,進(jìn)行了實(shí)驗(yàn)測(cè)試。同時(shí),為了確保實(shí)驗(yàn)結(jié)果的可靠性,分文分別采用文獻(xiàn)[2]提出的基于直方圖計(jì)算與分析的視頻關(guān)鍵幀選取方法以及文獻(xiàn)[3]提出的基于K均值聚類的視頻關(guān)鍵幀提取技術(shù)同時(shí)進(jìn)行測(cè)試,通過(guò)對(duì)比三種方法的實(shí)驗(yàn)結(jié)果,對(duì)本文方法的性能進(jìn)行分析。
3.1實(shí)驗(yàn)環(huán)境
實(shí)驗(yàn)環(huán)境為32位Windows 8操作系統(tǒng),4GB內(nèi)存。實(shí)驗(yàn)數(shù)據(jù)共設(shè)置5組時(shí)長(zhǎng)不等動(dòng)畫視頻,具體的實(shí)驗(yàn)數(shù)據(jù)如表1 所示。分別采用三種方法對(duì)視頻的關(guān)鍵幀進(jìn)行提取,同時(shí),為對(duì)提取結(jié)果進(jìn)行量化分析,分別以關(guān)鍵幀的漏選數(shù),選錯(cuò)數(shù)作為指標(biāo),對(duì)測(cè)試結(jié)果進(jìn)行對(duì)比。
3.2實(shí)驗(yàn)結(jié)果
在上述實(shí)驗(yàn)環(huán)境下,本文首先對(duì)比了三種方法下,關(guān)鍵幀提取的漏選情況,其結(jié)果如圖1所示。
通過(guò)圖1可看出,在三種關(guān)鍵幀提取方法下,文獻(xiàn)[2]和文獻(xiàn)[3]的漏選數(shù)量始終高于本文方法,且最高漏選數(shù)到達(dá)4幀,而在本文方法的提取結(jié)果中,漏選數(shù)始終穩(wěn)定在2幀以內(nèi),且對(duì)視頻3和視頻5的漏選數(shù)為0,實(shí)現(xiàn)了100%的關(guān)鍵幀提取。說(shuō)明本文方法具有較高的關(guān)鍵幀識(shí)別和提取能力。這主要是因?yàn)楸疚姆椒▽⒁曨l以內(nèi)容為基礎(chǔ)進(jìn)行鏡頭劃分,降低了關(guān)鍵幀提取過(guò)程中計(jì)算的負(fù)擔(dān),提高計(jì)算精度,降低漏選情況的發(fā)生。
四、結(jié)束語(yǔ)
本文提出基于內(nèi)容的動(dòng)畫視頻關(guān)鍵幀提取技術(shù)研究,實(shí)現(xiàn)了高準(zhǔn)確率,高精度的關(guān)鍵幀提取,有效降低了漏選和錯(cuò)選的情況,對(duì)于該領(lǐng)域的應(yīng)用具有一定實(shí)際價(jià)值。
參? 考? 文? 獻(xiàn)
[1]仲夢(mèng)潔,張艷彬. 基于視覺(jué)顯著性車輛監(jiān)控視頻關(guān)鍵幀提取方法[J]. 計(jì)算機(jī)技術(shù)與發(fā)展,2019,29(06):164-169.
[2]Jorge Michel Díaz Rodriguez,姚品,萬(wàn)旺根. 基于直方圖計(jì)算與分析的視頻關(guān)鍵幀選取方法[J]. 電子測(cè)量技術(shù),2019,42(19):170-175.
[3]張一凡,李家辰,曠遠(yuǎn)有, 等. 基于K均值聚類的視頻關(guān)鍵幀提取技術(shù)研究[J]. 電腦與信息技術(shù),2021,29(01):13-16.
[4]蘇筱涵. 深度學(xué)習(xí)視角下視頻關(guān)鍵幀提取與視頻檢索研究[J]. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2020, 000(05):65-66.
[5]韓震博. 基于雙向自適應(yīng)時(shí)空切片的關(guān)鍵幀提取算法[J]. 現(xiàn)代計(jì)算機(jī),2021, 000(05):57-61.