李搏軒,沈永良,胡 月
(黑龍江大學 電子工程學院,哈爾濱 150080)
?
混合高斯模型與三幀差分法相結合的建模新算法
李搏軒,沈永良*,胡月
(黑龍江大學 電子工程學院,哈爾濱 150080)
摘要:針對三幀差分法所存在的不足,提出一種改進的基于混合高斯模型與三幀差分相結合的建模方法。為每一個背景像素建立多維混合高斯模型,融入三幀差分法實時判定背景區(qū)域和運動區(qū)域,使之去除三幀差分帶來的空洞現(xiàn)象,并且加入可跟隨目標移動的外接矩形框,在其內(nèi)生成高斯模型,從而減少因高斯模型的介入導致計算量過大的問題,節(jié)省運算時間,并且達到理想的除噪效果以及排除外界不必要的干擾等。通過實驗進行驗證分析,實驗結果表明:該方法相比三幀差分法具有更好的除噪效果和減少更多的計算量,適用于實時的單目標檢測。
關鍵詞:混合高斯模型;三幀差分法;背景建模;外接矩形框;單目標
0引言
運動目標檢測技術是智能視頻監(jiān)控技術中的核心部分,常用的運動目標檢測方法有光流法[1-2]、幀差法[3]和背景差分法[4]。3 種目標檢測方法各有優(yōu)缺點,其中三幀差分法以其計算量小和檢測效果相對較好等優(yōu)點而普遍運用。但是檢測的目標帶有空洞現(xiàn)象以及背景噪聲過大成為其最大的缺點,因此許多國內(nèi)外學者采用背景差分與幀間差分相結合的方法來彌補其缺點,取得了一些效果?;旌细咚贡尘澳P妥钤缬蒘tauffer等[5]提出,該算法是一種基于背景建模的方法,他們首次提出了用K(通常取3~7)個不同的高斯分布去給每個像素建模,很好地描述了復雜的背景,在視頻監(jiān)控領域發(fā)揮了很大的優(yōu)勢,提出的應用混合高斯模型建立背景的技術得到廣泛認可,這種算法能抑制外部干擾引起的噪聲,如光照強度變化、植物隨風擺動等,但當背景光照突然發(fā)生大范圍變化時,該算法很難識別出前景目標,并且該算法還有計算量大、時效性較低的缺點。文獻[6]提出的運動目標檢測方法是結合了混合高斯背景模型和三幀差分法,并運用相應面積法對檢測結果進行鑒別分析。文獻[7]使用的自適應背景模型結合了混合高斯模型與幀間差分法,針對不同區(qū)域采用不同學習率,有效地提升了處理外界干擾的能力。同時采用三幀差分法,利用其對運動物體的敏感性,實現(xiàn)對背景模型的選擇性更新,克服了運動目標對背景模型的干擾,但三幀差分法魯棒性較差,容易引入噪聲干擾。文獻[8]提出自適應混合高斯背景模型對運動目標進行檢測,采用的是四鄰域參數(shù)在線更新,八鄰域削弱噪聲,此算法不僅提高了參數(shù)更新率,而且提升計算效率,節(jié)省空間內(nèi)存。但是此算法并沒有實現(xiàn)對背景模型的選擇性更新,不能消除緩慢運動目標對背景模型的影響。文獻[9]采用的方法是為每個像素點加入?yún)⒖贾担嵘吮尘澳P偷淖赃m應性,但在一定程度上加大了計算量。
雖然以上算法提升了運動目標檢測的效率,但并沒解決引入混合高斯模型以下問題: ①當背景中長時間靜止的物體突然發(fā)生未知變化時,利用混合高斯模型背景建模進行前景檢測,容易發(fā)生漏檢和誤檢的情況; ②混合高斯模型背景建模不能將背景顯露區(qū)域與運動目標區(qū)域有效的分隔開;③當運動目標區(qū)域由靜止開始發(fā)生緩慢位移時,此算法容易將背景檢測區(qū)檢測為前景,產(chǎn)生“影子”現(xiàn)象;④混合高斯模型要求對視頻幀中每個像素點建模,這使得其計算量加大,對視頻監(jiān)控系統(tǒng)要求的時效性產(chǎn)生影響。
本文采用混合高斯模型與三幀差分相結合來改善第一個問題,利用引入的可移動的外接矩形框來改善后3個問題。在傳統(tǒng)算法基礎之上,加之可移動外接矩形框,并只在矩形框內(nèi)生成高斯模型,有效地去除噪聲干擾等,提高了運算效率,節(jié)省了由于混合高斯模型的介入所導致的計算量過大問題。使得混合高斯模型具有更好的魯棒性和實時性。
1混合高斯模型的建立
當存在光照變化、陰影以及景物移動等情況時,單高斯模型無法準確地描述背景分布[10]。此時,對于任意一個圖像點,需要用多個獨立的高斯分布加以描述(假設多個因素的影響是彼此獨立的),筆者稱之為混合高斯模型,其分布密度為:
(1)
式中ωi為加權系數(shù),它應該滿足約束條件:
(2)
(3)
通常至少用3個獨立的高斯分布(本文采用3個)來描述一個像點的灰度統(tǒng)計分布。其中用于背景描述的高斯分布至少應該有兩個,并要給予較大的權值,并使其方差較小。對用于運動前景描述的高斯分布,則應該給予較小的權值,并有相對較大的方差。這樣可用權值與方差的比值,通過:
(4)
來判斷一個像素點究竟是背景還是前景。設定一個閾值P,如果pi
2混合高斯模型與三幀差分相結合的背景建模
2.1三幀差分法
幀差法是圖像序列運動對象檢測最常用的一種方法。由于相鄰兩幀的時間間隔很小,因此背景像素的灰度可以認為是相同的。不同僅是運動物體的位置發(fā)生了變化,因此相鄰幀之間的差分,能夠揭示運動物體的存在。其最大的特點是計算簡單,速度快,且環(huán)境光照變化不敏感。
1)計算第一幀和第二幀的差分:
(5)
2)計算第二幀和第三幀的差分:
(6)
(7)
(8)
由于相鄰兩幀的時間間隔很小,因此,幀差法對于光照變化不敏感。此外它的實現(xiàn)也較簡單,且不需要存儲背景圖像。但是,當在實際應用中存在攝像機抖動、陰影、其他對象遮擋、背景擾動(樹木的搖曳、風吹窗簾的擺動等)以及噪聲干擾等情況,使得各幀圖像之間的背景的像素灰度發(fā)生較大變化時,檢測的準確性會受到較大的影響。因此須考慮如何去除干擾因素的影響,從而得到魯棒的檢測結果。
2.2三幀差分法與混合高斯模型相結合的背景建模
針對三幀差分的不足,采用三幀差分法與混合高斯模型相結合,來提高其魯棒性以及對噪聲的抗干擾能力。對于通過三幀差分被確定為運動區(qū)域的像素點和它的前個高斯分布進行匹配,其中高斯分布按照ωi,t,k/σi,t,k的大小,從大到小排列,匹配公式為[9]:
(9)
如果xi,t與它的模型存在匹配,則認為該變化點為背景點。如果與所有的高斯模型都不匹配,則可確定這個點是由目標運動引起的真實運動,為前景點。
2.3算法流程
算法流程圖見圖1。
圖1 算法流程圖Fig.1 Algorithm flow chart
3改進的基于混合高斯模型與三幀差分法相結合建模算法
3.1外接矩形框思想
圖像處理過程中,外接矩形框的思想經(jīng)常被用于目標鎖定、區(qū)域劃分等,文獻[13]提出了基于運動區(qū)域的運動目標提取法,就涉及到了矩形框的思想,文中運動區(qū)域的確定就是依靠矩形框來實現(xiàn)的。在運動目標檢測過程中,利用三幀差分法能夠較完整地提取中間幀圖像的運動目標輪廓,且不易受干擾噪聲影響等特點,將三幀差分法檢測到的運動目標信息全部包含在一個外接矩形框中,這樣可將運動目標的區(qū)域輪廓局限在這個矩形框內(nèi),然后在確定的運動區(qū)域內(nèi)對混合高斯模型和三幀差分圖像進行結合,從而避免了背景裸露、噪聲干擾等對目標檢測結果的影響,提高了檢測精度。
3.2本文算法
首先通過三幀差分法,檢測到需要的運動目標,通過對檢測到的運動目標進行中值濾波以及形態(tài)學濾波(膨脹),以便后續(xù)處理。然后運用OPenCV中的cvFindContours 函數(shù)[14],獲得每一幀圖像中運動目標的輪廓(通過5×5的中值濾波已消除噪聲),對每一幀圖像的運動目標左上角點和右下角點進行遍歷,取左上角點坐標中x+y之和最小的坐標點為該幀圖像運動目標的左上角點,取右下角點中x+y之和最大的坐標點為該幀圖像運動目標的右下角點,最終將每幀圖像中對檢測到的運動目標的外接矩形框合成為一個,并將檢測到的運動物體包含在矩形框內(nèi),再將該矩形框設置為ROI(即感興趣區(qū)域),使高斯模型在遍歷時,只更新和生成這個ROI區(qū)域,從而減少計算時間,提高運算效率。最后通過cvzero函數(shù)清除上一幀圖像中的矩形框,對每幀圖像都采用此做法。即得到可跟隨運動目標移動的外接矩形框。因此,在外接矩形框內(nèi)達到混合高斯模型與三幀差分相結合的目的,只需計算外接矩形框以內(nèi)生成運動目標即可,使計算量減少,有效地抑制了噪聲等干擾,而且彌補了三幀差分法所帶來的空洞現(xiàn)象。
3.3實驗結果及分析
本文算法在vs2005上進行了測試,通過對攝像機拍攝的320×240的序列圖像進行了計算處理,分別將該算法與三幀差分法和帶有混合高斯模型的背景差分進行比較。本文所有的實驗均在AMD A8-4500M處理器、4G內(nèi)存的PC機上進行(圖2~圖6)。
圖2 第25幀F(xiàn)ig.2 The 25th frame
圖3 第50幀F(xiàn)ig.3 The 50th frame
圖4 第61幀F(xiàn)ig.4 The 61th frame
圖5 第84幀F(xiàn)ig.5 The 84th frame
圖6 第152幀F(xiàn)ig.6 The 152th frame
分別在視頻序列的第25、50、61、84、152幀進行比較,從中不難看出,三幀差分法始終帶有空洞和噪聲現(xiàn)象,而帶有混合高斯模型的背景差分則去除了空洞和大量的噪聲,但由于計算量過大導致在生成過程中可能會有誤檢,難免會帶有一些噪聲干擾。而本文所提出的算法,在同幀圖像中檢測效果良好,無論目標運動或靜止都無其他噪聲生成,達到除噪效果而且減少了計算量,提高了運算效率。
4結論
針對混合高斯模型計算量過大的不足,筆者提出了一種改進的背景建模算法。通過算法驗證:該方法相比高斯背景建模,具有更好的實時性以及除噪效果,能夠有效地解決視頻序列中運動目標由計算量大而導致背景更新速度慢的問題,適用于實時的單目標檢測和跟蹤。
參考文獻:
[1]BPeil.FARP: Mining fuzzy association rules from a probabi-listic quantitative database[J]. Information Sciences,2013,29(19):249-268.
[2]鄭盼麗,戴牡紅,譚一云,等.自動生成數(shù)據(jù)挖掘算法的研究與應用[J]. 計算機科學,2012,39(13) : 171-173.
[3]張志鋒,馬軍霞. 基于三段式編碼GA的連續(xù)屬性關聯(lián)規(guī)則挖掘方法[J]. 科學技術與工程,2012,12(26) : 6640-6643.[4]Massim Y.Efficient immune algorithm for optimal allocations in series-parallel continuous manufacturing systems[J].Journalof Intelligent Manufacturing,2012,23(5) : 1603-1619.
[5]Stauffer C,Grimson W. Adaptive background mixture models for real time tracking[J]. In Computer Vision and Pattern Recognition, 1999,43(16):198-208
[6]Tai F,Yu X,Ye W. Rmote live demon stration system underlimited bandwidth[J].Journal of Computer Applications,2009,29(6) : 381-383.
[7]Jiang Y, Jiang J, Zhang Y. A novel fuzzy multi objective model using adaptive genetic algorithm based on cloud theory for service restoration of shipboard power systems[J]. Power Systems,IEEE Transactions on,2012,27( 2) : 612 -620.
[8]Vidal T.A hybrid genetic algorithm with adaptive diversitymanagement for a large class of vehicle routing problems with time-windows[J].Computers & Operations Research,2012,38(9):124-130.
[9]Yin G,Chen Y. The analysis of affecting factors of playing delay in P2P live[J].Journal of Inner Mongolia Agricultural University,2012,33( 5) : 219-221.
[10] 趙榮椿,趙忠明.數(shù)字圖像處理與分析[M].北京:清華大學出版社,2013:417-424.
[11] Senst T, Evangelio R H, Sikora T. Detecing people carrying objects based on an optical flow motion model[C]//Washington. DC: IEEE Computer Society,2011: 301-306.
[12] 宋雪樺, 陳瑜, 耿劍鋒, 等. 基于改進的混合高斯背景模型的運動目標檢測[J]. 計算機工程與設計, 2010,31(21): 168-170.
[13] 郭寶龍, 侯葉. 基于圖切割的圖像自動分割方法[J]. 模式識別與人工智能,2011,24(5):604-609.
[14] Gary Bradski & Adrian Kaebler.Learning OpenCV[M].于仕琪,劉瑞禎,譯.北京:清華大學出版社,2009:246-271.
New algorithm based on Gaussian mixture model and three frame difference method
LI Bo-Xuan,SHEN Yong-Liang*,HU Yue
(Collegeofelectronicengineering,HeilongjiangUniversity,Harbin150080,China)
Abstract:An improved model based on Gaussian mixture model is proposed which is combined with three frame difference method, aiming at the shortcomings of the three frame difference method.We establish multidimensional Gaussian mixture model for each background pixels to remove the cavitations and add three frame difference method to Real-time determine the background area and sports area. An external rectangular box is added which can follow the target's movement and in which Gaussian mixture model is generated. This method can reduce the large calculating quantity and save operation time for the intervention of Gaussian mixture model, get ideal effect of noise cancellation and eliminate the unnecessary interference. Through the experimental validation and analysis, it turns out that compared with three frame difference method, this method has better effect on noise cancellation and can decrease more computing. It is suitable for the real-time target detection.
Key words:Gaussian mixture model; three frame difference method;background model; external rectangle frame; single target
DOI:10.13524/j.2095-008x.2016.01.011
收稿日期:2015-09-10;
修訂日期:2015-12-07
基金項目:國家自然科學基金青年科學基金資助項目(61503127)
作者簡介:李搏軒(1990-),男,黑龍江哈爾濱人,碩士研究生,研究方向:智能檢測與圖像處理,E-mail:Boxuan_Lee@163.com;*通訊作者:沈永良(1964-),男,黑龍江雙鴨山人,教授,研究方向:智能檢測與自動化儀器,E-mail:shen-yl@163.com。
中圖分類號:TP391.41
文獻標志碼:A
文章編號:2095-008X(2016)01-0054-06