陳 超,楊克儉
(武漢理工大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院,湖北 武漢 430063)
近年來,隨著硬件設(shè)備成本大大降低,智能視頻監(jiān)控系統(tǒng)得到了日益廣泛的研究與應(yīng)用,智能視頻監(jiān)控技術(shù)也得到了越來越多科研工作者的關(guān)注。運動目標(biāo)檢測技術(shù)是智能視頻監(jiān)控技術(shù)中的核心部分,常用的運動目標(biāo)檢測方法有光流法、時間差分法和背景差分法。光流法[1]利用運動目標(biāo)隨時間變化的光流特性進(jìn)行運動檢測,但其抗噪性能差,且計算相當(dāng)復(fù)雜 ,很難滿足視頻監(jiān)控系統(tǒng)實時性的要求。時間差分法又稱幀差法[2],它通過對相鄰幀對應(yīng)像素的差分來提取圖像中的運動區(qū)域,能夠很好地適應(yīng)光照的變化,對背景的變化也有很好的自適應(yīng)性。但用時間差分法提取出的運動區(qū)域往往會出現(xiàn)空洞現(xiàn)象,且對于運動緩慢的目標(biāo)很難檢測出來。背景差分法通過將輸入的每一視頻幀和通過訓(xùn)練得到的背景圖像進(jìn)行差分來檢測運動目標(biāo)??紤]到背景不可能完全固定,一個好的背景模型應(yīng)該能夠反映出背景隨時間的推移發(fā)生的變化。因此,背景差分法的關(guān)鍵不在于差分,而在于背景模型的建立與更新。常用的背景建模方法有單高斯模型法[3]和混合高斯模型法[4]。與混合高斯模型法相比,單高斯模型法的時間效率更高。在室內(nèi)以及背景較為穩(wěn)定的室外環(huán)境下,單高斯模型法可以很好地檢測出運動目標(biāo)。本文針對傳統(tǒng)的單高斯模型中的拖尾、鬼影問題,在背景的更新策略方面做了一些改進(jìn),有效地解決了這些問題。在更新率的選取方面也提出了一些自己的看法,使得高斯模型具有更好的穩(wěn)定性和收斂性。在陰影抑制方面,將基于色度畸變和一階梯度信息的陰影消除方法相結(jié)合,取得了較好的效果。
高斯模型法來源于高斯分布,其基本原理為:視頻圖像由于受到外界因素的影響,各個像素點的像素值隨時間的推移會有一些擾動,這個擾動近似滿足高斯分布。當(dāng)有物體經(jīng)過時,像素值的變化就會很大,物體經(jīng)過的地方像素點的像素值不服從高斯分布。利用某一時刻某像素點的像素值是否滿足高斯分布可以判斷該點是否為背景點。
單高斯分布背景模型適用于單模態(tài)背景情形,以下是利用單高斯分布背景模型進(jìn)行運動檢測的過程:首先,對一段時間內(nèi)的視頻序列圖像進(jìn)行訓(xùn)練,從而建立每個像素點的顏色分布初始高斯模型 η(x,μ0,σ0)。假設(shè)這段時間內(nèi)有0-(T-1)共T幀圖像,則有:
此后為每幀圖像的每個像素點建立高斯模型η(xt,μt,σt)。其中,下標(biāo) t表示幀序號,xt為像素點的當(dāng)前像素值,μt為當(dāng)前像素點高斯模型的均值,σt為當(dāng)前像素點高斯模型的均反差。 若 η(xt,μt,σt)≤Tp(這里 Tp 為概率閾值),則該點被判定為前景點,否則為背景點(這時又稱xt與 η(xt,μt,σt)相匹配)。 在實際應(yīng)用中,可以用等價的閾值替代概率閾值。記dt=|xt-μt|,在常見的一維情形中,則常根據(jù) dt/σt的取值設(shè)置前景檢測閾值:若 dt/σt>T(根據(jù)高斯分布的特性,T值在2到3之間,具體數(shù)值需經(jīng)過實驗選取),則該點被判定為前景點,否則為背景點。用公式表示為:
背景不可能是完全固定的,隨時間的推移會發(fā)生一些變化。一個好的背景模型應(yīng)該能夠反映出背景的這些變化,否則就可能產(chǎn)生誤檢。因此,需要對背景模型進(jìn)行實時更新。單高斯分布背景模型的更新即指各像素點高斯分布參數(shù)的更新。傳統(tǒng)的高斯模型更新方法是引入表示更新快慢的常數(shù)——更新率α,則該點高斯分布參數(shù)的更新可表示為:
傳統(tǒng)的高斯模型更新方法對均值和均方差采用相同的更新率,沒有考慮到高斯模型的均值和均方差各自不同的特點[5],是不合理的。當(dāng)更新率取值較小時,模型的穩(wěn)定性好,但收斂性較差,不能很快地適應(yīng)光照的變化。當(dāng)更新率取值較大時,模型的收斂性較好,能很快地適應(yīng)光照的變化,但模型的穩(wěn)定性又會變得很差。因此提出了一種新的更新策略:對于均值和均方差采用不同的更新率αμ和ασ,改進(jìn)后的高斯分布參數(shù)的更新可表示為:
對更新率的選取給出了參考意見:取αμ=0.01,當(dāng)1/t>0.001 時 , 取 ασ=0.01; 當(dāng) 1/t≤0.001 時 , 取 ασ=0.001。這樣,由于αμ取值始終較大,模型能夠很好地適應(yīng)光照的變化。在開始訓(xùn)練的一段時間里,ασ取值較大,模型具有很好的收斂性;在訓(xùn)練一段時間后,ασ取值又較小,使模型具有很好的穩(wěn)定性。
背景模型對運動目標(biāo)要有較強(qiáng)的抗干擾能力。因為在背景模型的更新過程中,對背景模型上的每點而言都是受到了一個顏色序列的“訓(xùn)練”,不論實際場景中該點是處于靜止背景還是在運動目標(biāo)上。靜止的背景或目標(biāo)的這種“訓(xùn)練”是我們所希望的,而運動目標(biāo)的“訓(xùn)練”則是不希望看到的。特別是當(dāng)運動物體尺度較大或運動較慢時,這種長時間的“訓(xùn)練”可能會引起錯誤的檢測結(jié)果,如在運動目標(biāo)的尾部產(chǎn)生“空洞”,特別是兩個顏色相近的物體交錯而過時更加明顯。
傳統(tǒng)的背景模型的更新策略不加判斷地將整個當(dāng)前幀用于背景的更新,而沒有考慮到運動目標(biāo)對于背景的影響。這樣運動目標(biāo)會部分地融入背景,造成更新后的背景和實際背景的誤差,造成所謂的 “拖尾”現(xiàn)象。KOLLER等人對傳統(tǒng)的高斯模型的更新策略作了一些改進(jìn),在背景模型的更新過程中剔除掉運動目標(biāo),而只讓背景點參與更新[6]。KOLLER等人的高斯分布參數(shù)的更新策略可表述為:
KOLLER等人的算法有效地避免了運動目標(biāo)參與更新對背景造成的干擾問題,消除了“拖尾”現(xiàn)象,但又產(chǎn)生了新的問題。由于只讓背景點參與更新,當(dāng)物體的運動狀態(tài)發(fā)生變化,即當(dāng)前景目標(biāo)從運動變?yōu)殪o止而融入背景或者背景目標(biāo)從靜止變?yōu)檫\動而轉(zhuǎn)化為前景時,背景模型不能得到及時的更新,導(dǎo)致背景圖像上還保留著物體運動狀態(tài)發(fā)生改變前的信息,從而產(chǎn)生所謂的“鬼影”現(xiàn)象[7]。
針對該問題,本文提出一種新的背景模型更新策略:考察一段時間內(nèi)的圖像序列,記錄變化區(qū)域內(nèi)的像素點連續(xù)作為前景點的幀數(shù)。如果幀數(shù)超過一定范圍,就有理由相信,原來處于該像素點處的物體的運動狀態(tài)已經(jīng)發(fā)生變化。這時,就用該像素點的像素值取代背景模型中對應(yīng)像素點的像素值。改進(jìn)后的背景模型的更新策略可具體描述為:利用式(1)判斷當(dāng)前幀的每一個像素點為前景點還是背景點,同時為每一個像素點設(shè)置幀計數(shù)器C。當(dāng)像素點為背景點時,將幀計數(shù)器置0,采用式(8)、式(9)的策略對背景進(jìn)行更新。當(dāng)像素點為前景點時,將該像素點的幀計數(shù)器C加1,然后將C與預(yù)先設(shè)定的幀計數(shù)器閾值CT進(jìn)行比較 (CT的選取與運動目標(biāo)的大小和運動速度有關(guān),運動目標(biāo)越小,速度越快,CT取值應(yīng)越??;運動目標(biāo)越大,速度越慢,CT取值越大)。若C
背景差分法的缺陷是陰影點常常被誤檢為運動點,從而嚴(yán)重干擾了運動目標(biāo)的分割與提取。由于陰影具有與運動目標(biāo)相同的運動特征,陰影消除成為運動目標(biāo)檢測與提取的難點。CUCCHIARA等提出了一種在 HSV顏色空間內(nèi)去除陰影的方法[8],JIANG等采用基于陰影強(qiáng)度與幾何特征的三步陰影檢測算法剪除陰影[9],KUMAR等提出基于不同彩色空間檢測前景物體及其陰影的方法[10]。本文將基于YUV顏色空間色度畸變和一階梯度模型的陰影檢測算法結(jié)合起來消除陰影,取得了較好效果。
YUV是被歐洲電視系統(tǒng)所采用的一種顏色編碼方法,其中Y表示亮度,UV代表色差,U和V是構(gòu)成彩色的兩個分量。YUV顏色空間的一個重要特性是其亮度信號Y和色度信號U、V相分離。這一特性可以很好地應(yīng)用于陰影的檢測與消除。應(yīng)用式(12)可以很容易地將圖像從RGB顏色空間轉(zhuǎn)換到Y(jié)UV顏色空間。
基于YUV顏色空間色度畸變的陰影檢測方法的原理是:陰影區(qū)域和它所對應(yīng)的背景區(qū)域的亮度會有較大變化,但其色度幾乎保持不變或有微小的變化。這樣,根據(jù)當(dāng)前幀中某像素點和它所對應(yīng)的背景中的像素點的色度變化大小就可以檢測出該像素點是否屬于陰影點?;赮UV顏色空間色度畸變的陰影檢測方法的步驟為:
(1)應(yīng)用式(12)將當(dāng)前幀圖像x從 RGB顏色空間轉(zhuǎn)換到 YUV顏色空間,記 Ix=(Yx,Ux,Vx);
(2)應(yīng)用式(12)將背景圖像b從RGB顏色空間轉(zhuǎn)換到 YUV顏色空間,記Ib=(Yb,Ub,Vb);
(3)分別計算Ix和Ib在UV平面上的投影,分別記為Ix′和 Ib′;
(4)利用式(13)計算向量 OIx′和 OIb′之間的夾角余弦cosθ;
(5)利用式(14)判斷像素點是否屬于陰影點。
[11]求出角度再與閾值進(jìn)行比較,使用了反余弦函數(shù)。本文根據(jù)兩向量之間的夾角θ∈[0,180],且θ的余弦值在該區(qū)間內(nèi)單調(diào)遞減這一性質(zhì),僅需求出兩向量夾角余弦,然后與設(shè)定的閾值T進(jìn)行比較,簡化了運算。
當(dāng)目標(biāo)和陰影的顏色差別明顯時,基于YUV顏色空間色度畸變的陰影檢測方法能夠很好地分離目標(biāo)和陰影。但當(dāng)目標(biāo)和陰影的顏色幾乎相同時,基于YUV顏色空間色度畸變的陰影檢測方法就不再有效了[12]。此時,利用圖像的一階梯度信息可以有效地區(qū)分出陰影和目標(biāo)區(qū)域?;谝浑A梯度模型的陰影檢測方法過程如下:
(1)采用Sobel算子計算背景圖像中的每一個像素點在x、y方向的梯度,分別記為 bxi和 byi(i=R,G,B);
(2)計算背景圖像的像素值均方差i=R,G,B)。
(3)采用Sobel算子計算當(dāng)前幀圖像中的每一個像素點在 x、y方向的梯度,分別記為 ix和 iy(i=R,G,B)。(4)利用式(15)判斷像素點是否屬于陰影點。
基于YUV顏色空間色度畸變的陰影檢測方法和基于一階梯度模型的陰影檢測方法有它們各自的適用范圍,將二者結(jié)合起來使得算法具有更好的適應(yīng)性。如果某點同時滿足式(14)、式(15)中的第一個條件,則判定該點為陰影點,否則為目標(biāo)點。
用基于改進(jìn)的單高斯模型的運動目標(biāo)檢測方法在AMD Athlon(tm)64 X2 Dual core processor 4 800+2.50 GHz、1.00 GB內(nèi)存的計算機(jī)上對視頻序列進(jìn)行處理,得到以下結(jié)果。
圖1為運用KOLLER等人的算法消除傳統(tǒng)高斯模型中的“拖尾”現(xiàn)象的效果圖。其中圖1(a)表示視頻中某一幀的實時圖像;圖1(b)表示應(yīng)用傳統(tǒng)高斯模型得到的運動物體的掩膜圖像,可以看到有嚴(yán)重的“拖尾”現(xiàn)象;圖1(c)表示應(yīng)用KOLLER等人的算法得到的運動物體的掩膜圖像,“拖尾”問題得到了很好的解決。
圖2為運用基于改進(jìn)的單高斯模型的運動目標(biāo)檢測方法去除KOLLER算法中的“鬼影”現(xiàn)象的效果圖。其中圖2(a)表示視頻中某一幀的實時圖像;圖2(b)表示應(yīng)用KOLLER算法得到的運動物體的掩膜圖像,可以看到有嚴(yán)重的“拖尾”現(xiàn)象;圖2(c)表示應(yīng)用基于改進(jìn)的單高斯模型運動目標(biāo)檢測方法得到的運動物體的掩膜圖像,“鬼影”問題得到了很好的解決。
圖3為基于YUV顏色空間色度畸變和一階梯度模型的陰影檢測方法去除陰影的效果圖。其中圖3(a)表示視頻中帶有明顯陰影的兩幀圖像;圖3(b)表示帶有陰影的運動物體的掩膜圖像;圖3(c)表示應(yīng)用本文中陰影去除算法去除陰影后得到的運動物體的掩膜圖像。
針對傳統(tǒng)的單高斯模型法的不足,提出了一種基于改進(jìn)的單高斯模型的運動目標(biāo)檢測方法。通過為每一個像素點設(shè)置一個幀計數(shù)器,很好地解決了應(yīng)用傳統(tǒng)單高斯模型進(jìn)行目標(biāo)檢測時的“拖尾”、“鬼影”問題。針對傳統(tǒng)高斯模型更新方法中更新率選取的不合理性,提出了一種新的更新率選取策略,使得模型在訓(xùn)練的開始階段具有良好收斂性,能夠迅速逼近最合理的模型,在訓(xùn)練一段時間后,模型又能夠保持較好的穩(wěn)定性。針對陰影對于運動目標(biāo)提取的干擾問題,將基于YUV顏色空間色度畸變和一階梯度模型的陰影檢測方法結(jié)合起來去除陰影,使得提取出的運動目標(biāo)的輪廓更為精確。算法簡單有效,可以充分滿足視頻監(jiān)控系統(tǒng)實時性的要求。實驗證明,基于改進(jìn)的單高斯模型的運動目標(biāo)檢測方法在室內(nèi)環(huán)境和背景較為穩(wěn)定的室外環(huán)境中都能取得良好效果。
參考文獻(xiàn)
[1]FEJES S,DAVIS L S.What can projections of flow fields tell us about the visual motion[C].Proceeding of International Conference on Computer Vision,Bombay,India.1998:979-986.
[2]PARAGIS N,DERICHE R.Geodesic active contours and level sets for the detection and tracking of moving objects[J].IEEE Transactions on Pattern Analysis and Machine Interface,2000,22(3):266-228.
[3]WREN C,AZARHAYEJANI A,DARRELL T,et al.Pfinder:real-time tracking of the human body[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):780-785.
[4]STAUFFER C,GRIMSON W.Adaptive background mixture models for real-time tracking[C].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Fort Collins,Colorado,USA,1999:246-252.
[5]劉潔,張東來.關(guān)于自適應(yīng)高斯混合背景模型的更新算法的研究[J].微計算機(jī)信息,2006,22(8):241-242.
[6]KELLER D,WEBER J,HUANG T,et al.Towards robust automatic traffic scene analysis in real-time[C].The 12th International Computer Vision&Image Processing Conference,1994:126-131.
[7]王小平,張麗杰,常佶.基于單高斯背景模型運動目標(biāo)檢測方法的改進(jìn)[J].計算機(jī)工程與應(yīng)用,2009,45(21):118-120.
[8]CUCCHIARA R,GMNA C,PICCARDI M,et al.Detecting moving objects,ghosts and shadow in video streams[J].IEEE Transactions Pattern Analysis and Machine Intelligence,2003,25(10):1377-1342.
[9]JIANG C,WARD M.Shadow identification[C].IEEE Conference on Computer Vision and Pattern Recognition,1992:606-612.
[10]KUMAR P,SENGUPTA K,LEE A.A comparative study of different color spaces f or foreground and shadow detection color spaces for foreground and shadow detection for traffic monitoring system[C].The IEEE 5th International Conference.on Intelligent Transportation System,2002,3(6):100-105.
[11]劉雪,常發(fā)亮,王華杰.運動目標(biāo)檢測中的陰影去除方法[J].微處理機(jī),2008,10(5):116-117.
[12]王華偉,李翠華,施華,等.基于HS V空間和一階梯度的陰影剪除算法[J].計算機(jī)工程與應(yīng)用,2005,41(8):43-44.