徐文臣,陳前斌
(重慶郵電大學(xué) 通信與信息工程學(xué)院,重慶 400065)
一部完整的視頻節(jié)目序列一般不會(huì)由單一的場(chǎng)景構(gòu)成。H.264標(biāo)準(zhǔn)中采用了預(yù)測(cè)編碼算法,在基于同一個(gè)場(chǎng)景時(shí),其中的物體變化較小,能有效進(jìn)行預(yù)測(cè);但在不同場(chǎng)景間,差異可能變得很大,即場(chǎng)景的轉(zhuǎn)換將破壞相鄰兩幀之間的相關(guān)性,后一個(gè)場(chǎng)景幀如果繼續(xù)依靠前一個(gè)場(chǎng)景幀來(lái)進(jìn)行預(yù)測(cè)編碼,會(huì)導(dǎo)致壓縮后圖像質(zhì)量下降和編碼資源浪費(fèi),這就需要進(jìn)行場(chǎng)景轉(zhuǎn)換檢測(cè)并作相應(yīng)處理,來(lái)提高編碼效率和編碼質(zhì)量。
視頻場(chǎng)景轉(zhuǎn)換主要包括突變、消融和淡入淡出等類型[1]。目前主要的場(chǎng)景轉(zhuǎn)換檢測(cè)方法有基于塊匹配檢測(cè)、基于邊緣輪廓檢測(cè)和基于灰度直方圖檢測(cè)等[2-6]?;诨叶戎狈綀D的方法是通過(guò)對(duì)比當(dāng)前幀與參考幀的灰度直方圖來(lái)進(jìn)行檢測(cè)的。單一場(chǎng)景下兩幀灰度值差異較小,而當(dāng)灰度值發(fā)生突變時(shí),就說(shuō)明可能有場(chǎng)景轉(zhuǎn)換?;叶戎狈綀D法在檢測(cè)時(shí)間與準(zhǔn)確性上都能取得較好的結(jié)果,并且簡(jiǎn)單易實(shí)現(xiàn),在實(shí)際應(yīng)用中比較常見(jiàn)[7]。筆者也采用灰度直方圖方法對(duì)場(chǎng)景轉(zhuǎn)換進(jìn)行檢測(cè)。
視頻場(chǎng)景轉(zhuǎn)換檢測(cè)一般可采用YUV模型,便于對(duì)場(chǎng)景切換點(diǎn)進(jìn)行準(zhǔn)確判斷。由于色度分量U和V的直方圖分布很窄,通常只采用圖像亮度分量Y的直方圖作為尋找鏡頭切換的依據(jù)。
某視頻序列中第n幀和第n+1幀中所有像素點(diǎn)的灰度差值計(jì)算公式為
式中:fn(i,j)和 fn+1(i,j)為第 n 和第 n+1 幀中像素(i,j)的灰度值,fd(i,j)為兩幀對(duì)應(yīng)點(diǎn)(i,j)的灰度差。 則相鄰兩幀之間的總幀差為
式中:M,N為圖像的長(zhǎng)度和寬度。同一個(gè)場(chǎng)景中相鄰兩幀對(duì)對(duì)應(yīng)點(diǎn)的灰度差值總和fd較小,而不同場(chǎng)景fd較大。當(dāng)fd大于某個(gè)閾值時(shí),可判斷出鏡頭發(fā)生切變。該方法原理簡(jiǎn)單,便于實(shí)現(xiàn),對(duì)簡(jiǎn)單的視頻具有良好的突變檢測(cè)效果。
灰度法的不足在于:對(duì)場(chǎng)景內(nèi)物體運(yùn)動(dòng)、光線條件的劇烈變化很敏感,易導(dǎo)致誤檢,降低了算法的檢測(cè)精度。
直方圖可以反映一幅圖像的灰度或者顏色分布情況,也可判斷出圖像之間的相似度,并以此來(lái)判斷是否有場(chǎng)景轉(zhuǎn)換。當(dāng)發(fā)生場(chǎng)景轉(zhuǎn)換時(shí),前后兩幀的直方圖往往會(huì)發(fā)生明顯變化。
較常用的直方圖有以下幾種:
1)直接使用直方圖差值的絕對(duì)值來(lái)計(jì)算前后兩幀之間的差值。第n幀和第n+1幀的幀間差[4]為
式中:N為圖像的顏色等級(jí)數(shù),Hn(i)為第n幀圖像彩色直方圖中顏色值為i的像素的總數(shù)。
2)采用 χ2檢測(cè)方法[8],目的是為了強(qiáng)化出場(chǎng)景突變發(fā)生時(shí)的差異。
該方法不僅可以有效降低物體運(yùn)動(dòng)所造成的影響,而且可以突顯突變的特性。
3)局部區(qū)域直方圖的方法,將一幀分為16個(gè)小的區(qū)域,分別和下一幀對(duì)應(yīng)區(qū)域比較差異,并且為了防止區(qū)域內(nèi)因物體移動(dòng)所造成誤差太大而引起的誤判,在由16個(gè)區(qū)域差值中取較小的8個(gè)差值計(jì)算平均,作為兩幀間的平均差值。再通過(guò)實(shí)驗(yàn)得到一個(gè)閾值,如果平均差值超過(guò)閾值,則判斷發(fā)生了場(chǎng)景轉(zhuǎn)換[8]。
4)帶權(quán)值直方圖
在圖像中,某些顏色分量所占比重很大,在計(jì)算幀間差時(shí)此顏色分量就應(yīng)賦予較大的權(quán)值。因此有了帶權(quán)直方圖
式中:α,β,γ分別代表圖像中紅、綠及藍(lán)色分量對(duì)應(yīng)的顏色直方圖的權(quán)值。
直方圖反映的是圖像整體的顏色分布,不考慮像素的位置信息,因此它對(duì)場(chǎng)景內(nèi)物體的運(yùn)動(dòng)并不敏感,在一定程度上克服了灰度法的缺點(diǎn)。但它只是相對(duì)于圖像整體顏色信息的一種描述,并沒(méi)有表示出顏色的位置信息,即兩副完全無(wú)關(guān)的圖像也可能擁有完全相同的直方圖信息,這種情況出現(xiàn)時(shí),就無(wú)法有效檢測(cè)出場(chǎng)景轉(zhuǎn)換。
綜合對(duì)灰度法和直方圖法分析可知,灰度差和直方圖在利用圖像的特征方面具有一定的互補(bǔ)性,因此需要對(duì)兩種方法進(jìn)行綜合考慮制定算法。
筆者采用歸一化的灰度直方圖來(lái)對(duì)相鄰兩幀進(jìn)行比較。該算法計(jì)算視頻序列中所有視頻幀的灰度直方圖,進(jìn)行歸一化處理后,再采用了雙閾值進(jìn)行比較。算法設(shè)置2個(gè)閾值T1和T2(T1 第n幀與前一幀各像素點(diǎn)灰度值的絕對(duì)差值之和為 式中:H(i,j,n)表示第 n 幀的中(i,j)處的灰度值。 對(duì) H(n)進(jìn)行歸一化處理得 式中:分母表示該幀前面所有幀的灰度值的均值。當(dāng)判斷發(fā)生了場(chǎng)景轉(zhuǎn)換時(shí),從轉(zhuǎn)換后的第一幀開始n就重新計(jì)數(shù),即Hl(n)表示在同一個(gè)場(chǎng)景中的歸一化值。 式中:G(l)表示相隔為l幀的累積幀差。 當(dāng) Hl(n) 當(dāng)檢測(cè)出場(chǎng)景轉(zhuǎn)換后,把轉(zhuǎn)換后的第一幀設(shè)置為初始幀,重新統(tǒng)計(jì)該場(chǎng)景的灰度差值的和,直到檢測(cè)出下一個(gè)場(chǎng)景轉(zhuǎn)換。在本算法中,T1設(shè)為1.3,T2設(shè)為2.3,能得到比較好的檢測(cè)效果。 對(duì)實(shí)驗(yàn)結(jié)果采用兩個(gè)通用的檢測(cè)效率衡量指標(biāo)[5,8]進(jìn)行分析 實(shí)驗(yàn)結(jié)果如表1所示。可見(jiàn),當(dāng)片段中場(chǎng)景轉(zhuǎn)換很快并且是在幾乎同樣昏暗的背景下發(fā)生時(shí),比較難以檢測(cè);當(dāng)圖像中的物體有較劇烈運(yùn)動(dòng)時(shí)可能會(huì)造成誤判。此外,均取得了較好的效果。 表1 實(shí)驗(yàn)結(jié)果統(tǒng)計(jì) 筆者在沒(méi)有增加太多算法復(fù)雜度的情況下,提出了基于灰度直方圖的場(chǎng)景轉(zhuǎn)換檢測(cè)算法,結(jié)合雙閾值來(lái)進(jìn)行檢測(cè)場(chǎng)景轉(zhuǎn)換,并且通過(guò)實(shí)驗(yàn)取得了比較滿意的準(zhǔn)確率和查全率,為以后對(duì)視頻序列的分析和處理打下了基礎(chǔ)。與其他算法相比,該算法復(fù)雜度較低,易于實(shí)現(xiàn),在檢測(cè)中能達(dá)到一般的視頻檢測(cè)要求。但該算法仍無(wú)法解決閃光效果引起的誤差及目標(biāo)運(yùn)動(dòng)較大的問(wèn)題,尚需深入研究,以進(jìn)一步提高檢測(cè)的精準(zhǔn)度。 [1]紀(jì)志勝,周軍.基于模型的視頻漸變鏡頭檢測(cè)方法[J].電視技術(shù),2009,33(1):88-90. [2]LIENHART R W.Reliable transition detection in videos:a survey and practitioner′s guide[J].International Journal of Image and Graphics(IJIG),2001,1(3):469-486. [3]LUPATINI G,SARACENO C,LEONARDI R.Scene break detection:a comparison[C]//SILBERSCHATZ A.Proc.Eighth Int.Workshop on Continuous Media Databases and Applications.Florida:IEEE Press,1998:34-41. [4]朱曦,林行剛.視頻鏡頭時(shí)域分割方法的研究[J].計(jì)算機(jī)學(xué)報(bào),2004,27(8):1027-1035. [5]江偉,劉群,吳渝.與紋理和直方圖特征相融合的鏡頭邊界檢測(cè)方法[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2009(1):100-104. [6]劉玲玲,張?jiān)葡?基于壓縮域的場(chǎng)景變換檢測(cè)[J].電視技術(shù),2003(4):13-14. [7]CHOWDHURY M U,RAHMAN R,SANA J,et al.Fast scene change detection based histogram[C]//IEEE/ACIS International Conference on Computer and Information Science,2007.[S.l.]:IEEE Press,2007:229-233. [8]NAGASAKA A,TANAKA Y.Automatic video indexing and full-video search for object appearances[C]//Proc.the IFIPTC2/WG 2.6 Second Working Conference on Visual Database Systems II.Amsterdam,The Netherlands:North-Holland Publishing Co.,1991:113-127. [9]朱興全,薛向陽(yáng),吳立德.一種自動(dòng)門限選取的視頻shot分割方法[J].計(jì)算機(jī)研究與發(fā)展,2000,37(1):80-85. [10]周藝華,曹元大,張洪欣.一種通用的漸變鏡頭檢測(cè)方法[J].計(jì)算機(jī)應(yīng)用研究, 2006,23(2):250.4 實(shí)驗(yàn)結(jié)果
5 小結(jié)