郭 曉,郭曉金
(重慶郵電大學(xué)信號(hào)與信息處理實(shí)驗(yàn)室,重慶 400065)
基于時(shí)空的混合高斯背景建模的運(yùn)動(dòng)目標(biāo)檢測(cè)
郭 曉,郭曉金
(重慶郵電大學(xué)信號(hào)與信息處理實(shí)驗(yàn)室,重慶 400065)
針對(duì)攝像機(jī)固定下的復(fù)雜背景環(huán)境,提出一種基于時(shí)空的自適應(yīng)混合高斯背景建模方法,克服了經(jīng)典混合高斯模型(Gaussian Mixture Model,GMM)中只考慮單個(gè)像素的獨(dú)立性而忽略相鄰像素間的空間域相關(guān)性。首先采用混合高斯模型對(duì)每個(gè)像素在時(shí)間域上進(jìn)行學(xué)習(xí),然后利用相鄰像素的自信息對(duì)背景及前景目標(biāo)進(jìn)行二次聚類,以修正錯(cuò)誤的判斷。實(shí)驗(yàn)結(jié)果表明,與經(jīng)典混合高斯背景算法相比,提出的方法目標(biāo)檢測(cè)結(jié)果更加完整,具有更強(qiáng)的魯棒性和很好的應(yīng)用前景。
混合高斯模型;空間域;自信息;聚類
計(jì)算機(jī)視覺(jué)是一門研究利用計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)類似人類視覺(jué)系統(tǒng)理解客觀世界的、新興的、多學(xué)科交叉的學(xué)科,涉及圖像處理、計(jì)算機(jī)圖形學(xué)、模式識(shí)別和人工智能等。近十幾年來(lái)在數(shù)字視頻處理、智能監(jiān)控和醫(yī)療診斷等領(lǐng)域具有廣泛的應(yīng)用價(jià)值和潛在的經(jīng)濟(jì)價(jià)值。智能監(jiān)控系統(tǒng)中,將運(yùn)動(dòng)目標(biāo)分割出來(lái)在現(xiàn)實(shí)生活中具有重要的應(yīng)用價(jià)值,如車輛檢測(cè)、目標(biāo)跟蹤和行為理解等。因此如何實(shí)時(shí)、準(zhǔn)確、可靠地將運(yùn)動(dòng)目標(biāo)從背景中分離出來(lái)是研究中的難點(diǎn)。針對(duì)攝像頭固定的情況下,背景減除法是其中研究較為廣泛的方法,其關(guān)鍵是背景的構(gòu)建。
Wren等人為了建立有效的背景模型[1],首先利用單個(gè)像素的灰度值在時(shí)間軸上的統(tǒng)計(jì)特性提出了單高斯的背景模型。Stauffer和Grimson在單高斯背景模型的基礎(chǔ)上,針對(duì)復(fù)雜場(chǎng)景中像素的多峰情況提出了一種混合高斯背景模型[2],并采用在線K均值近似更新背景模型。此后的研究者對(duì)混合高斯背景模型做了各種的改進(jìn)[3-5]。如Zivkovic等提出了一種用遞歸方程更新背景模型和自適應(yīng)選擇混合高斯個(gè)數(shù)的建模算法[6-7],有效減少了程序運(yùn)行時(shí)間,并且分割效果也有所改善。王永忠等人利用像素在時(shí)間域上的分布,結(jié)合非參密度估計(jì)方法統(tǒng)計(jì)鄰域像素在空域上的分布信息,提出了一種自適應(yīng)混合高斯時(shí)空背景建模[8],改進(jìn)了傳統(tǒng)混合高斯背景模型對(duì)非平穩(wěn)場(chǎng)景的穩(wěn)健性。
上述各種方法針對(duì)Stauffer等人提出的經(jīng)典自適應(yīng)混合高斯背景模型做了各種改進(jìn),并取得了較好的效果。在經(jīng)典自適應(yīng)混合高斯模型中分析了視頻幀中每個(gè)像素在時(shí)間軸上統(tǒng)計(jì)特性,并默認(rèn)每個(gè)像素之間是嚴(yán)格獨(dú)立的,而忽略同一幀上相鄰像素之間的相關(guān)性,在這方面研究者們利用視頻幀的一些空間特征信息做了很多研究工作,如圖像的灰度信息、紋理信息和梯度信息等[9-10]。因此如果能有效地融合空間域信息,將獲得更為魯棒的背景模型和完整的目標(biāo)分割結(jié)果。本文基于此提出一種基于時(shí)空的自適應(yīng)混合高斯背景模型,首先采用混合高斯模型對(duì)連續(xù)幀上的每個(gè)像素進(jìn)行學(xué)習(xí),得到粗略的運(yùn)動(dòng)目標(biāo)分割結(jié)果,然后在每幀上利用相鄰像素的自信息對(duì)背景和目標(biāo)進(jìn)行二次聚類。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的經(jīng)典自適應(yīng)混合高斯背景模型相比,本文方法分割出的運(yùn)動(dòng)目標(biāo)更完整,且邊界輪廓較精確。
在Stauffer等人提出的自適應(yīng)混合高斯背景模型中,考慮到背景像素值的多模態(tài)情況,根據(jù)單高斯分布的思想,用K個(gè)單高斯分布來(lái)表示復(fù)雜場(chǎng)景中像素值的狀態(tài),K一般取為3~5,K表示處理波動(dòng)能力的強(qiáng)弱,其值越大,處理波動(dòng)能力越強(qiáng),相應(yīng)的處理時(shí)間也就越長(zhǎng)[2]。
1)模型的定義
若每個(gè)像素點(diǎn)顏色取值用變量Xt表示,則其概率密度函數(shù)可用K個(gè)三維高斯函數(shù)表示為
2)模型的更新
混合高斯模型的更新較為復(fù)雜,主要包括高斯參數(shù)的更新和選取最合適的匹配。首先對(duì)K個(gè)高斯分布按照wk,t/σk,t從大到小進(jìn)行排序。將獲得的新像素值按照式(3)進(jìn)行判斷,若與多個(gè)高斯分布像匹配,則選取最大的一個(gè)wk,t/σk,t相匹配,并按以各式進(jìn)行參數(shù)更新。如果與K個(gè)高斯分布都不匹配,則以該像素值為均值,賦予一個(gè)較小的權(quán)值和一個(gè)較大的方差的高斯分布。
式中:ξ一般取值為3±0.5。與像素Xt相匹配的混合高斯參數(shù)按如下公式更新參數(shù)
在更新完各個(gè)高斯分布參數(shù)后,重新對(duì)wk,t/σk,t按由大到小進(jìn)行排序,越大表明更符合背景像素值的時(shí)變特性,在引入權(quán)值和閾值T的基礎(chǔ)上,將滿足式(7)的前B個(gè)模型作為背景模型,滿足K-B個(gè)高斯分布的則定為前景目標(biāo)
式中:閾值T表示背景高斯成分在整個(gè)像素的概率分布中所占的比例最小,T值較小則退化為單高斯分布的背景模型,T值較大則為混合高斯分布的背景模型。T取值一般為0.7左右。
Stauffer等人提出的經(jīng)典混合高斯模型中,對(duì)每個(gè)像素在時(shí)間域上進(jìn)行學(xué)習(xí),并且假設(shè)各像素間是彼此獨(dú)立的,而忽略了各像素在空間上的鄰域信息,而且由于圖像中獲得的像素值通常會(huì)受到隨機(jī)噪聲和背景相對(duì)運(yùn)動(dòng)的影響,這將會(huì)導(dǎo)致分割出的前景目標(biāo)不完整,且存在空洞現(xiàn)象。本文針對(duì)上述不足,對(duì)時(shí)間域上分割出的運(yùn)動(dòng)目標(biāo)進(jìn)行空間域上的二次聚類(如圖1所示),以糾正錯(cuò)誤的判斷。提出了一種利用3×3鄰域窗口中像素的自信息進(jìn)行二次聚類,依次遍歷每幀中的所有像素點(diǎn)。
圖1 像素xi,j的3×3窗口鄰域
首先定義像素xi,j的自信息為I,I=-logp(xi,j)。R(L)為像素xi,j的 8 鄰域窗口,d(xi,j)為像素xi,j與 8 鄰域的信息差,定義為
根據(jù)較小鄰域內(nèi)具有極度相似性,可知如果某像素點(diǎn)的較小鄰域內(nèi)大部分像素是前景,則該像素點(diǎn)極有可能是前景像素,反之則為背景像素。若像素xi,j被決定為前景像素,而其8鄰域像素大多數(shù)為背景像素,則滿足d(xi,j)≤0,則像素xi,j趨向于背景像素;相反,若像素xi,j被決定為背景像素,而它的8鄰域像素大多數(shù)為前景像素,則滿足d(xi,j)>0,則像素xi,j趨向于前景像素。其中T1為判決閾值,若滿足式(10),則該像素點(diǎn)被聚類為前景;反之,被判為背景。
為了測(cè)試本文基于時(shí)空的混合高斯背景建模方法的有效性,在 Microsoft Visual Studio 2008平臺(tái)上,利用OpenCV2.1開發(fā)工具進(jìn)行了多組實(shí)驗(yàn)仿真。在所有測(cè)試序列中Stauffer經(jīng)典的GMM算法中的混合高斯模型參數(shù)分別為:α=0.05,K=3,δinit=100,ωinit=0.05,T=0.7,ξ=2.5。本文提出的基于時(shí)空的高斯混合模型,對(duì)時(shí)間域分割結(jié)果進(jìn)行二次聚類時(shí),采用像素的8鄰域自信息進(jìn)行二次分割。若滿足式(10)則聚類為前景,否則為背景,閾值T取值為0.7。測(cè)試視頻序列1和2都是XVID視頻壓縮格式,幀率為20幀/秒(f/s),像素為320×240。圖2和圖3分別為視頻序列1中的第584幀和視頻序列2中的第292幀的運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果。從圖2和圖3中可以看出雖然Stauffer經(jīng)典的GMM對(duì)環(huán)境變化具有一定的自適應(yīng)性,但檢測(cè)結(jié)果仍存在大量的誤判,使分割目標(biāo)存在空洞和邊緣不完整等現(xiàn)象。而本文提出的基于時(shí)空的自適應(yīng)混合高斯建模能夠明顯改善檢測(cè)結(jié)果,不僅使檢測(cè)結(jié)果更加完整,而且使分割結(jié)果邊緣更加精確。
圖2 視頻序列1運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果及比較(截圖)
本文提出一種基于時(shí)空的混合高斯背景模型,首先從時(shí)間軸上采用混合高斯模型進(jìn)行分割,然后利用鄰域像素的自信息進(jìn)行二次聚類,改善了經(jīng)典混合高斯模型中只考慮單個(gè)像素的獨(dú)立性的缺點(diǎn)。經(jīng)過(guò)在多個(gè)視頻序列上與經(jīng)典混合高斯模型算法相比較,實(shí)驗(yàn)證明該方法的有效性,提高了檢測(cè)結(jié)果的完整性和精確性。
圖3 視頻序列2運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果及比較(截圖)
:
[1]WREN C R,AZARBAYEJANI A,DARRELL T,et a1.Real-time tracking of the human body[J].Pattern Analysis and Machine Intelligence,1997,19(7):780-785.
Moving Object Detection Based on Temporal-spatial Mixture Gaussian Background Model
GUO Xiao,GUO Xiaojin
(Chongqing Key Laboratory of Signal and Information Processing,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)
A temporal-spatial mixture Gaussian background model is proposed which overcome the standard GMM where each pix is only considered independently but ignoring the spatial domain correlation between neighboring pixels.Based on the temporal distribution model learned by Gaussian mixture model,self-information of neighboring pixels are clustering for background and foreground object to correct an error of judgment.Experimental results show that detected objects with the proposed is more completed,and has stronger robustness application prospects.
Gaussian mixture model;spatial domain;self-information;clustering
TN911.73;TP391
A
【本文獻(xiàn)信息】郭曉,郭曉金.基于時(shí)空的混合高斯背景建模的運(yùn)動(dòng)目標(biāo)檢測(cè)[J].電視技術(shù),2013,37(3).
重慶市科委自然科學(xué)基金項(xiàng)目(CSTC,2011BB2143)
郭 曉(1986— ),女,碩士生,主要研究方向?yàn)閳D像視頻處理;
郭曉金(1974— ),博士,副教授,碩士生導(dǎo)師,主要研究方向?yàn)楣饫w、無(wú)線傳感網(wǎng)絡(luò)與智能通信儀表等。
責(zé)任編輯:任健男
2012-09-26