桑愛(ài)軍, 于 歡,2, 張漢宇
(1.吉林大學(xué) 通信工程學(xué)院, 吉林 長(zhǎng)春 130022; 2.上海無(wú)線電設(shè)備研究所, 上海 201109 )
隨著人們對(duì)安全意識(shí)的增強(qiáng),監(jiān)控視頻的普及程度越來(lái)越高[1-4].如何能夠提高監(jiān)控視頻的編碼效率,是該領(lǐng)域所面臨的一系列重要挑戰(zhàn).通常監(jiān)控視頻[5-7]有以下特點(diǎn):固定的攝像頭位置,光線變化呈一定規(guī)律性,場(chǎng)景變化少.根據(jù)這些特點(diǎn),人們主要采用面向?qū)ο蟮木幋a方法[8-11]、基于感興趣區(qū)域的編碼優(yōu)化方法和背景參考圖像的編碼優(yōu)化方法[12-15]來(lái)解決監(jiān)控視頻中的編碼問(wèn)題.監(jiān)控視頻一般工作時(shí)間都是持續(xù)的,并且時(shí)間很長(zhǎng),為了減少監(jiān)控視頻工作的時(shí)間,選擇合適的編碼技術(shù)進(jìn)行編碼在實(shí)際應(yīng)用中有很重要的意義.AVS監(jiān)控伸展檔次,即AVS-S,在該框架中有背景幀(G幀)和背景預(yù)測(cè)幀(S幀),其中G幀是幀內(nèi)預(yù)測(cè)編碼時(shí)所使用的背景圖像,用來(lái)顯示場(chǎng)景信息,為S幀提供背景信息;S幀大大提高了監(jiān)控視頻的編碼效率.該方法主要是通過(guò)消除監(jiān)控視頻中的背景冗余實(shí)現(xiàn)的.
本文在AVS-S的編碼框架之下,提出一種新的背景幀更新方法,即迭代更新均值法(iterative update average,IUA),該方法進(jìn)一步加強(qiáng)了背景信息的完整性和提高了背景幀的質(zhì)量,提升了監(jiān)控視頻的編碼效率.
在任意一監(jiān)控視頻中,取某一像素點(diǎn)在一定范圍的連續(xù)幀內(nèi)的全部像素值組成集合A,則集合A內(nèi)的所有數(shù)據(jù)是一組分類數(shù)據(jù).分類數(shù)據(jù)是統(tǒng)計(jì)學(xué)中一種反映事物類別的數(shù)據(jù),是離散數(shù)據(jù).集合A中不同性質(zhì)的數(shù)據(jù)之間相互獨(dú)立,同一性質(zhì)的數(shù)據(jù)之間具有相關(guān)性,因此可以根據(jù)數(shù)據(jù)之間的關(guān)系完成對(duì)集合A的分組.分組后集合A中包括眾數(shù)組和非眾數(shù)組,通過(guò)異眾比率可以判定每個(gè)數(shù)組的性質(zhì).
異眾比率是指非眾數(shù)出現(xiàn)的頻數(shù)占總頻數(shù)的比例,即
(1)
其中:V0表示異眾比率;f0為眾數(shù)組的頻數(shù);N為總頻數(shù).當(dāng)V0越小時(shí),非眾數(shù)組的頻數(shù)在總頻數(shù)中占比越小,說(shuō)明眾數(shù)組中的像素值是背景像素值的概率越大;當(dāng)V0越大時(shí),眾數(shù)組的頻數(shù)在總頻數(shù)中占比越小,說(shuō)明眾數(shù)組中的像素值成為前景像素值的概率越大.保留背景像素值,建立最終的背景模型.
在監(jiān)控視頻編碼的過(guò)程中,背景幀的質(zhì)量越好,最終的編碼效率越高.而影響背景幀質(zhì)量的因素有以下兩種:
1)訓(xùn)練集長(zhǎng)度將會(huì)影響背景幀的質(zhì)量.要想提高背景模型的質(zhì)量和不斷改善建模的效果,就要有充足的可參考實(shí)驗(yàn)數(shù)據(jù)和足夠長(zhǎng)的訓(xùn)練集長(zhǎng)度,G幀更新的方法正好可以滿足這兩點(diǎn)要求.但是由于運(yùn)動(dòng)目標(biāo)出現(xiàn)的不確定性,所以對(duì)建模效果也會(huì)有不同程度的影響.因此背景模型的質(zhì)量與訓(xùn)練集的長(zhǎng)度不成正比.
2)前景目標(biāo)的運(yùn)動(dòng)速度將會(huì)影響背景幀的質(zhì)量.在測(cè)試視頻中,物體停留在某一像素點(diǎn)區(qū)域的時(shí)間由物體的運(yùn)動(dòng)速度決定,對(duì)建模效果也會(huì)有不同程度的影響,物體運(yùn)動(dòng)越快,影響越小,反之則相反.故要消除慢速運(yùn)動(dòng)的物體對(duì)背景模型的影響更困難.
迭代更新均值法通過(guò)眾數(shù)將數(shù)據(jù)進(jìn)行分組.根據(jù)異眾比率判定該組數(shù)據(jù)的狀態(tài),并根據(jù)像素點(diǎn)狀態(tài)的不同選擇不同的處理方法,得到最終的背景模型.
根據(jù)對(duì)當(dāng)前像素點(diǎn)的性質(zhì)進(jìn)行判定的結(jié)果共有三種,分別是僅受光照、受快速運(yùn)動(dòng)物體以及慢速運(yùn)動(dòng)物體影響的像素點(diǎn).僅受光照影響的像素點(diǎn)的影響因素為光照的自然變化;快速運(yùn)動(dòng)的物體經(jīng)過(guò)像素點(diǎn)停留時(shí)間短,對(duì)建模效果影響小;慢速運(yùn)動(dòng)物體與快速運(yùn)動(dòng)物體情況相反.迭代更新均值法對(duì)不同性質(zhì)的像素點(diǎn)采用相對(duì)應(yīng)的處理方法,盡可能減少對(duì)建模效果的影響,保留更為準(zhǔn)確的背景像素值.
“這種說(shuō)法屬于偷換概念?!焙笔≈嗅t(yī)醫(yī)院老年病科學(xué)科主任醫(yī)師譚子虎介紹說(shuō),冬天因?yàn)闀裉?yáng)少導(dǎo)致人體骨骼出現(xiàn)的鈣流失等問(wèn)題,完全可以通過(guò)春、夏、秋3個(gè)季節(jié)彌補(bǔ)回來(lái)。骨頭變脆是一個(gè)長(zhǎng)時(shí)間漸變的過(guò)程。冬天骨折多可能與冬季地面變得堅(jiān)硬,且與人們衣服穿得比較厚、行動(dòng)笨拙,在冰雪天容易滑倒有關(guān),中老年人尤其如此。因而,冬天比其他季節(jié)更容易讓人滑倒和骨折,但并不能因此就說(shuō)冬天骨頭會(huì)變脆。
1)初始化.創(chuàng)建數(shù)據(jù)集,其長(zhǎng)度為M,數(shù)據(jù)集用來(lái)存放前M幀數(shù)據(jù),即
I={It(x,y),It+1(x,y),…,It+M-1(x,y)} .
其中,It(x,y)表示t時(shí)刻(x,y)處的像素值,從I中求得眾數(shù),將其記為T.
2)選擇閾值.記μ為均值,σ2為方差,則對(duì)應(yīng)的正態(tài)分布為
(2)
根據(jù)正態(tài)分布的3σ準(zhǔn)則,x分布在(μ-3σ,μ+3σ)的概率為0.997 4,故將作為3σ閾值來(lái)判定像素點(diǎn)性質(zhì),閾值設(shè)置為14.
3) 數(shù)據(jù)判定及分組.當(dāng)前像素值It(x,y)根據(jù)式(3)判定其狀態(tài),若式(3)成立,則Ft(x,y)記為1,否則記為0.其中,F(xiàn)t(x,y)見(jiàn)文獻(xiàn)[16],為當(dāng)前像素點(diǎn)狀態(tài)判定標(biāo)志,該標(biāo)志的值用于后續(xù)的背景像素點(diǎn)的判定.
(It(x,y)-T)2<14.
(3)
4)求得當(dāng)前像素點(diǎn)的背景像素值.若當(dāng)前滿足式(3)的像素點(diǎn)數(shù)大于訓(xùn)練集長(zhǎng)度L的一半時(shí),則將滿足式(3)的所有像素的均值作為背景像素值;若滿足式(3)的像素點(diǎn)數(shù)小于訓(xùn)練集長(zhǎng)度L的一半且存在連續(xù)30幀,F(xiàn)t(x,y)的數(shù)值均為1,則判定當(dāng)前位置有運(yùn)動(dòng)物體長(zhǎng)時(shí)間停留;將Ft(x,y)=0的所有像素值的均值作為背景像素值,否則背景像素值為訓(xùn)練集中該像素點(diǎn)所有像素值的均值.
5)循環(huán)步驟1)~4)直至遍歷訓(xùn)練集所有像素點(diǎn),得到最終的背景模型.
迭代更新均值法中當(dāng)前像素點(diǎn)的長(zhǎng)度為K,而訓(xùn)練集的長(zhǎng)度為L(zhǎng)(K 選擇不同長(zhǎng)度的訓(xùn)練集和判定像素值狀態(tài)的數(shù)據(jù)集,長(zhǎng)度分別用L和K表示,本實(shí)驗(yàn)取L為100,200,K為10,50,在此數(shù)據(jù)條件下觀察背景模型效果.圖1~圖3分別是視頻訓(xùn)練集Classover,Crossroad和Overbridge在此數(shù)據(jù)下的實(shí)驗(yàn)仿真結(jié)果,圖中方框是不同訓(xùn)練集、不同訓(xùn)練長(zhǎng)度及不同當(dāng)前像素點(diǎn)條件下得到的運(yùn)動(dòng)目標(biāo). 圖1 訓(xùn)練集Classover下的背景模型 圖2 訓(xùn)練集Crossroad下的背景模型 圖3 訓(xùn)練集Overbridge下的背景模型 通過(guò)直觀地觀察和客觀的實(shí)驗(yàn)結(jié)果分析可以得出,在當(dāng)前像素點(diǎn)的長(zhǎng)度和訓(xùn)練集長(zhǎng)度分別為K=50,L=200條件下,可以獲得最佳的背景模型效果.因此迭代更新均值法中的參數(shù)選取為L(zhǎng)=200,K=50. 在AVS-S框架中,選取分段加權(quán)滑動(dòng)平均值法(SWRA)、均值法(AV)以及混合高斯背景建模法(GMM)在訓(xùn)練集長(zhǎng)度為200所生成的背景模型,同迭代更新均值法(IUA)所生成的背景模型進(jìn)行比較,如圖4~圖6所示,圖中方框?yàn)椴煌椒ㄔ诓煌?xùn)練集條件下得到的運(yùn)動(dòng)目標(biāo).從圖中可看出,IUA所生成的背景模型在主觀質(zhì)量上要優(yōu)于其他方法所生成的背景模型,并且SWRA方法生成的背景模型要優(yōu)于AV和GMM方法.為了更進(jìn)一步地觀察背景幀質(zhì)量對(duì)監(jiān)控視頻編碼效率的影響,對(duì)編碼效率進(jìn)行以下數(shù)據(jù)分析. 本文實(shí)驗(yàn)中全部測(cè)試視頻來(lái)自PKU-SVD-A,仿真軟件為AVS-S編解碼軟件的官方版本RM09.13-v3.將AVS-S框架下的IUA和SWRA以及AVS基準(zhǔn)檔次在不同監(jiān)控視頻下進(jìn)行編碼效率對(duì)比.碼率與峰值信噪比的關(guān)系曲線如圖7所示,生成率失真曲線相關(guān)數(shù)據(jù)以及實(shí)驗(yàn)參數(shù)設(shè)置見(jiàn)文獻(xiàn)[16].根據(jù)圖7可以得出,在三種不同監(jiān)控視頻下,IUA編碼性能優(yōu)于其他兩種編碼方法,其中峰值信噪比越大編碼性能越好,碼率是單位時(shí)間內(nèi)視頻傳輸?shù)臄?shù)據(jù)量,單位為Kb/s,碼率值越大,視頻中信息量越大.對(duì)三種編碼方式進(jìn)行數(shù)值分析,如表1所示,評(píng)價(jià)指標(biāo)為BDBR和BD-PSNR[17].BDBR表示在相等的峰值信噪比下,在率失真曲線中畫一條水平線,得到的兩種方法碼率節(jié)省情況,即水平方向分析編碼性能;BD-PSNR表示在相同的碼率下,在率失真曲線中畫一條垂直線,得到的兩種方法峰值信噪比差異,即垂直方向分析編碼性能.客觀分析與直觀觀察結(jié)果保持一致,通過(guò)表1分別計(jì)算三種視頻中得出的BDBR和BD-PSNR平均值,得出本文方法的G幀比SWRA方法平均節(jié)省碼率12.402%,平均峰值信噪比提高0.363 dB;同理,與AVS基準(zhǔn)檔次相比平均節(jié)省碼率43.283%,平均峰值信噪比提高1.186 dB. 圖4 不同方法在訓(xùn)練集Crossroad下所生成的背景模型 圖5 不同方法在訓(xùn)練集Overbridge下所生成的背景模型 圖6 不同方法在訓(xùn)練集Classover下所生成的背景模型 圖7 不同訓(xùn)練集下編碼性能對(duì)比 表1 本文方法與各編碼方法比較 在AVS的編碼框架下,本文提出一種新的G幀更新方法,即迭代更新均值法.該方法可以很好地區(qū)分不同運(yùn)動(dòng)速度的物體,從而得到視頻中較為完整的背景信息,提高了背景幀的質(zhì)量,并且在同等碼率和相同峰值信噪比的條件下,G幀更新方法的編碼效率要優(yōu)于AVS基準(zhǔn)檔次方法和分段加權(quán)滑動(dòng)平均值法,是一種更加高效的編碼方法.3 實(shí)驗(yàn)結(jié)果及分析
4 結(jié) 論