潘欣艷,徐榮青,崔媛媛,王玉杰,關 麗,王斌斌
(南京郵電大學 光電工程學院,江蘇 南京 210046)
在智能視頻監(jiān)控和運動分析應用中,一個基礎而又關鍵的任務是從視頻序列中實時地檢測出運動目標。視頻運動目標檢測的主要目的是從視頻序列中提取出運動目標并獲得其特征信息,如顏色和輪廓等[1]。目前運動目標檢測算法主要有光流法、背景差分法和幀差分法等。其中,背景差分法是目前研究最多、應用最廣泛的一種方法[2]。混合高斯模型魯棒性比較高,能夠較好地處理規(guī)律變化的動態(tài)背景,但是它對突發(fā)事件(如光照突變)的響應速度比較慢,容易受到背景噪聲干擾的影響,從而造成無法正確地提取運動目標。近年來,一些研究人員對高斯模型法提出了改進方法,效果仍不理想。本文提出了一種融合混合高斯模型和邊緣檢測的運動目標檢測算法。該算法首先對混合高斯背景模型的更新機制進行了改進,并對模型加入了幀間處理使其可以適應突變,得到初步的運動目標;再結合Canny邊緣檢測算子和金字塔運算得到運動目標輪廓,經(jīng)過填充、形態(tài)學處理后再次得到運動目標圖像,將兩次得到的運動目標作“與運算”,提取出最終的運動目標。實驗結果表明,本文提出的算法可以較好地提取運動目標輪廓,有效抑制陰影與噪聲的影響,并能適應突變情況。
基于高斯混合模型的背景建模方法最初由STAUFFER和GRIMSON于1999年提出[6-7]。對于圖像序列中的像素點的歷史觀測值集合為{X1,X2,…,Xt},可以得到該像素值在當前幀的概率密度函數(shù):
其中,k為高斯分布的個數(shù) (經(jīng)驗值為 3~5),n表示 x的維數(shù),wi,t為在t時刻的混合高斯模型中第 i個高斯成分的 權 重 ,μi,t及 Σi,t分 別 為 第 i個 高 斯 成 分 的 均 值 和 協(xié) 方差,σi,t為標準差,I 為單位矩 陣。
高斯混合背景建模算法根據(jù)當前像素值與模型中的k個高斯分布的匹配情況對模型進行更新。如果像素值在某高斯分布均值的2.5倍方差范圍之內(nèi),則表示與該分布成功匹配。如果當前像素值與k個高斯分布都不匹配,則用一個新的高斯分布取代權重值最小的分布,新的分布的均值即為當前的像素值,同時為它分配一個較大的初始協(xié)方差和一個較小的初始權重值[8]。如果存在與之匹配的高斯分布,則對各個分布的權重值作如下調(diào)整:
其中,α為學習率,其值在0~1之間。
對于與當前像素值匹配的高斯分布,Mi,t=1,否則,Mi,t=0。這樣,通過式(4)將導致匹配的高斯分布權重值增加,而不匹配的高斯分布權重值減小。對于與當前像素值匹配的高斯分布,將其參數(shù)作如下調(diào)整:
其中:
對于沒有匹配的高斯分布,其參數(shù)皆保持不變。前景檢測的過程在模型更新之前進行。如果在當前根據(jù)ω/σ值排序后的背景描述的B個高斯分布中,至少有一個高斯分布與當前像素值匹配,則當前像素為一個背景像素,否則,判定其為前景像素。
由式(4)~式(7)可知,隨著訓練數(shù)據(jù)數(shù)目t的增加,模型參數(shù)將趨于穩(wěn)態(tài),使當前的觀測值Xt對估計的影響減弱。針對這一問題,對參數(shù)進行改進,將α和ρ都取為固定的值,這樣既能避免上述情況,又可減少算法的運算量。實驗結果顯示,選擇α=0.005,ρμ=0.0015效果為佳。
理、可行、適切的管理,這一過程涉及教師的培養(yǎng)、招聘、考核、培訓、晉升的多個方面,應該是教師成長的全過程管理。
隨著背景越來越穩(wěn)定,方差會越來越小,場景中的變化很容易造成誤檢。參照參考文獻[9]提出的算法,本文對方差進行自適應的更新,即令方差更新因子ρ乘一個系數(shù) κ,其中 κ=Xt-μi,t。 然而,當 κ 很小時,會使方差加速減小,因此再設置一個閾值δ2>25,可有效地避免方差過小。改進后的更新公式為:
混合高斯背景模型的更新機制對背景變化緩慢的情況能很好地處理,但是對于突變情況 (如光照突變),會將大多數(shù)像素誤檢為前景,從而造成無法正確地提取運動目標。由于光照突變具體表現(xiàn)為整體灰度值的變化,即當前幀與所得到的背景平均灰度值之間的差值變化,因此,可以計算這個差值,如果它大于一定的閾值,則對整幅圖像所有的像素中權重最大的高斯分布參數(shù)進行替換,用當前幀圖像像素值代替μ0,w0取較大的值以保證新的分布成為穩(wěn)定的背景成分。本文σ0=20。
通過改進的混合高斯模型算法可以得到一個初步的運動目標,并標記為運動目標a,以備與基于邊緣檢測所得運動目標相結合,得到更精確的運動目標。
由于陰影及背景噪聲的影響,單純使用混合高斯模型所提取出的運動目標輪廓不準確。為了在運動物體分割中得到精確的對象輪廓,本文結合空間分割結果來優(yōu)化物體區(qū)域。一個好的邊緣檢測算子應具有3個指標:好的邊緣檢測結果、好的定位特性和單邊緣響應?;谶@3個指標,Canny提出了一種最優(yōu)逼近算子——Canny邊緣檢測算子。該算法描述如下:
(1)用高斯濾波模板進行卷積以消除噪聲,平滑圖像。
(2)用一階偏導計算梯度的幅值和方向。
(3)對梯度幅值進行非極大值抑制,在梯度方向上獲取梯度幅值最大的邊緣點。如果某個像素的灰度值與其梯度方向上前后兩個像素的灰度值相比不是最大的,則認為該點不是邊緣點。
(4)遲滯處理,用雙閾值算法檢測和連接邊緣。認為所有梯度大于高閾值的一定是邊緣點,凡是小于低閾值的一定不是邊緣點;如果梯度值大于低閾值而小于高閾值,則根據(jù)該像素的鄰域像素進行判斷,如果鄰域中存在梯度大于高閾值的像素,就認為該點是邊緣點,否則不是邊緣點。采用這種方法可以更好地抑制孤立噪聲。
圖1所示為本文提出的邊緣檢測與混合高斯模型相融合的運動目標檢測算法流程圖。在時間域上,對GMM(混合高斯算法)進行改進之后,提取到初步運動目標a。在空間域上,利用Canny邊緣檢測算子獲得當前幀圖像和背景圖像的邊緣輪廓,相減得到粗糙的運動目標邊緣輪廓,對其進行金字塔運算得到精確的運動目標輪廓,經(jīng)形態(tài)學處理后可針對同一幀圖像再次提取到運動目標b。將兩次得到的運動目標 a和 b作“與運算”,提取出最終的運動目標。
圖1 本文算法流程圖
下面給出運動目標b的提取方法。
邊緣是由圖像的局部變化決定的,因此邊緣檢測結果對圖像噪聲相當敏感。為了減少物體邊緣圖像中的噪聲,在邊緣檢測之前應盡量排除那些與運動物體無關的背景區(qū)域??梢栽趯D像進行Canny邊緣檢測之前先平滑圖像,以減少圖像中的噪聲污染。但是,這樣做并不能較好地消除噪聲污染,因此,本文引入了金字塔運算。
在金字塔圖像中,不同尺度的圖像提供不同的特征信息,在細尺度下的圖像主要顯示細節(jié)信息,粗尺度圖像主要提供圖像的全局信息。將當前幀邊緣輪廓與背景邊緣輪廓相減所得的運動目標邊緣輪廓進行多級金字塔分解后,得到了邊緣輪廓的多尺度表達。噪聲主要表現(xiàn)為不規(guī)則的點,因此在粗尺度下,噪聲污染將基本清除。再將粗尺度的邊緣輪廓向上采樣,由于所得到的圖像輪廓會存在間斷,因此應使用閉運算進行邊緣連接,這樣可以得到精確的運動目標邊緣輪廓。然后填充運動目標輪廓,將面積小于一定閾值的連通成分當作噪聲去除。經(jīng)形態(tài)學處理之后就得到初步運動目標b。
將運動目標b與前面改進的GMM算法得到的運動目標a作與運算,提取出最終的運動目標。
實驗在Intel(R)雙核Duo CPU2 T5870@2.00 GHz CPU、2 GB內(nèi)存、Windows XP操作系統(tǒng)、VC++6.0的環(huán)境下,基于Intel開源庫OpenCV編程實現(xiàn)。
為了驗證本文算法的有效性和適應性,本實驗選取了室外和室內(nèi)兩組視頻序列,實驗結果如圖2和圖3所示。圖2(a)是室外視頻序列的第 576幀,圖2(b)為使用傳統(tǒng)混合高斯模型提取的運動目標圖像,圖2(c)為本文算法得到的目標圖像。從圖2可以看出,由于光照變化、戶外噪聲以及陰影因素的影響,使用混合高斯模型提取的運動目標并不理想,本文算法可以很好地處理噪聲,得到的運動目標完整、輪廓清晰。
圖3(a)為室內(nèi)視頻序列的第 250幀,圖 3(b)為使用傳統(tǒng)混合高斯模型提取的運動目標圖像,圖3(c)為本文算法得到的目標圖像。由于室內(nèi)存在反光鏡,當人走進時,會導致光線變化,使用混合高斯模型并不能很好地處理突變,造成大量誤檢。應用本文算法后,能夠提取出準確、完整的運動目標。
本文提出了一種融合邊緣檢測和混合高斯模型的運動目標檢測算法。針對傳統(tǒng)的混和高斯模型不能很好地適應突變的情況,在時間域上,對混合高斯模型參數(shù)進行重新選擇,對更新機制進行改進,并加入幀間處理,得到初步的運動目標(標記為a)。由于陰影、噪聲等的影響,運動目標a的輪廓仍然不夠清晰。因此,在空間域上,結合Canny邊緣檢測算子和金字塔運算得到運動目標輪廓,經(jīng)形態(tài)學處理后再次得到運動目標圖像(標記為b)。將兩次得到的運動目標a和b作“與運算”,提取出最終的運動目標。實驗表明,本文算法能適應突變情況,并能有效抑制陰影和噪聲的影響,提高了運動目標檢測的精確度。
[1]趙文哲,秦世引.視頻運動目標檢測方法的對比分析[J].科技導報,2009,27(10):65-70.
[2]甘新勝,趙書斌.基于背景差的運動目標檢測方法對比分析[J].指揮控制與仿真,2008,30(3):45-50.
[3]LEE D S.On line adaptive Gaussian mixture learning for video applications[C].Statistical Methods in Video Processing,LNCS3247, 2004,3247:105-116.
[4]Arandjelovic O, CIPOLLA R.Incrementallearning of temporally -coherent Gaussian mixture models [C].Proceedings of British Machine Vision Conference, Oxford,UK,2005:759-768.
[5]陳祖爵,陳瀟君,何鴻.基于改進的混合高斯模型的運動目標檢測[J].中國圖象圖形學報,2007,12(9):1586-1589.
[6]STAUFFER C,GRIMSON W E L.Adaptive background mixture models for real-time tracking[C].Proceedings of IEEE InternationalConference on ComputerVision and Pattern Recognition.Fort Collins: IEEE Press, 1999: 246-252.
[7]STAUFFER C,GRIMSON W E L.Learning patterns of activity using real-time tracking[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22(8):747-757.
[8]SCHINDLER K,Wang Hanzi.Smooth forground-background segmentation for video processing[J].Lecture Notes in Computer Science, 2006, 3852:581-590.
[9]李亞玲,徐榮青,聶桂軍,等.適應場景光照變化的運動目標檢測算法 [J].計算機技術與發(fā)展,2011.21(2):140-142.