魏 捷
(同濟大學 電子與信息工程學院,上海 201804)
目標識別的目的在于從采集到的視頻序列中提取出運動目標。傳統(tǒng)的運動目標識別算法主要有以下3種:背景差分法、幀間差分法以及光流法。其中背景差分法利用已提取的參考背景幀與當前幀進行差分并通過閾值判斷來提取運動目標,該方法的優(yōu)點是能夠較為完整地獲取運動目標,缺點是對場景中由光照引起的動態(tài)變化比較敏感。幀間差分法對相鄰的兩幀或三幀圖像進行差分處理,通過行閾值判斷分割出圖像中的運動區(qū)域。它具有運算速度快、實現(xiàn)簡單、對動態(tài)場景有較好適應(yīng)性等優(yōu)點,但提取出的運動目標區(qū)域完整性較差,很容易在運動區(qū)域內(nèi)部產(chǎn)生空洞。光流法反映了場景中每一點的亮度變化趨勢,不需要知道任何場景先驗信息便能檢測獨立運動的對象,但此方法的抗噪性差并且計算量大,需要硬件支持不適宜實時檢測[1]。
運動目標檢測[2]任務(wù)主要分為兩部分,第 1部分是劃分運動區(qū)域和靜止區(qū)域即區(qū)分前景與背景,第 2部分是背景幀的像素更新算法。具體流程如圖1所示。
預(yù)處理的主要工作是去除原始圖像序列中部分不相關(guān)的信息以便后續(xù)圖像處理工作,同時把彩色圖像轉(zhuǎn)化為灰度值圖像序列。
首先提取相鄰兩幀圖像Ik(i, j)、Ik-1(i, j )進行差分,記IZ(k,k-1)=|Ik-Ik-1|。然后當前幀Ik(i, j)與背景幀Bk( i, j)進行差分,記IBk=|Ik-Bk|。初步劃分運動區(qū)域,對IZ(k,k-1)進行二值化膨脹腐蝕處理結(jié)果記為B1。對IB(k,k-1)進行二值化和膨脹處理結(jié)果記為B2。記B3=B1∪B2,B3中灰度為 0的即背景像素點記為Bb,灰度為255的即為運動像素點Bm。
幀間差分[3]容易在運動目標內(nèi)部產(chǎn)生空洞,提取出的運動區(qū)域比實際的區(qū)域小。背景差分可以較為完整的提取運動區(qū)域,但受到光線等因素的影響會產(chǎn)生額外的雜點。所以在做兩者做與運算之前對B2做腐蝕的形態(tài)學運算,腐蝕運算可以有效遏制部分雜點對判斷區(qū)域的影響。幀間差分法[4]可以完整的檢測出運動區(qū)域的外延部分,所以在做B1、B2與運算的時候可以彌補B2腐蝕運算時損失的外邊緣部分。最后運算結(jié)果的完整性在可以接受范圍內(nèi),僅僅在實際運動區(qū)域運動之外還有部分因光線影響產(chǎn)生的雜點。
在實驗中發(fā)現(xiàn)視頻采集時如果外界環(huán)境沒有明顯變化時,文中上述融合算法有較為不錯的目標識別效果。在實驗環(huán)境受到光線影響時,比如圖像采集過程有云層遮擋陽光導致環(huán)境亮度明顯改變[5]。在此類情況下FD算法的查全率只有0.393 4,使得在此基礎(chǔ)上建立的融合算法結(jié)果精度相應(yīng)降低,針對這個問題文中提出利用平均灰度計算判決閾值的方法,試驗結(jié)果證明該算法可以有效解決亮度變化對目標識別的影響。
計算背景圖像的平均灰度,計算區(qū)域為Bb記為:
計算當前幀的平均灰度,計算區(qū)域為Bb記為:
這里把平均灰度的差作為運動區(qū)域提取的參考閾值,在此基礎(chǔ)上重新采樣背景差分域。
其中Bb表示背景區(qū)域,Bm表示運動區(qū)域。重新采樣的目的在于對光感雜點進行二次過濾,近一步提高區(qū)域提取的精確性。
按權(quán)重更新背景區(qū)域。公式為Bk=(1-a)·Bk-1+aIk??紤]到被遮蔽的部分無法用當前幀的像素信息進行更新,更新機制采用參考原有像素信息結(jié)合灰度值變化進行更新。運動區(qū)域按權(quán)重和平均灰度值差更新。公式為Bk=(1-b) Bk-1+bIk( T1-T2)。
除去運動物體,在獲取的圖像中還存在著很多細小的殘留噪聲,即便是物體本身也可能是不完整的,甚至物體內(nèi)部還存在著被漏檢的空洞。由于背景上物體的輕微擾動及噪聲的影響,往往會使一些屬于背景上的像素點被誤檢為前景的運動目標。為了消除這些影響,首先對上一步獲得的差分圖像采用中值濾波和數(shù)學形態(tài)學腐蝕、膨脹等處理,填充圖像內(nèi)部空洞,去除圖像中細小噪聲及小面積的非人體運動部分,從而得到完整的運動目標提取完整運動目標。在閾值分割時,目標區(qū)域與背景區(qū)域的像素值相近時,差分出的前景區(qū)域可能會出現(xiàn)突刺散點,所以利用開啟運算濾掉突刺,切斷細長搭接利用閉合運算填充缺口或孔洞,搭接短的間斷其較好地反映出運動目標在當前圖像中的位置從而提取完整的運動目標。
實驗硬件環(huán)境為Pentium(R) 4 CPU 2.8 GHz 512 MBit內(nèi)存;軟件環(huán)境:Windows XP、MATLAB R2006b,測試程序以 15 F/s的幀率獲取尺寸為320×240的視頻序列圖像能夠滿足實時處理的要求。
為定量分析算法性能,使用準確率P、查全率R和Jaccard系數(shù)Jc3個指標對各種算法檢測結(jié)果進行比較。設(shè)TP表示正確檢測目標像素數(shù);FP表示將背景像素錯檢為目標像素的個數(shù),即造成虛警的誤檢像素數(shù);FN表示將目標像素錯檢為背景像素的個數(shù),即漏檢像素數(shù)。準確率P、查全率R和Jc分別定義為:
準確率P反映虛警率,值越大虛警率越低;查全率R反映目標分割的完整性,值越大完整性越高;Jc權(quán)衡準確率和查全率,反映算法的綜合性能。文中對連續(xù)30幀的圖像進行處理。利用基準圖像和各個方法檢測結(jié)果,計算測試序列的3個指標值,結(jié)果如表1所示。
表1 算法檢測性能比較
分析試驗結(jié)果由圖2可知,F(xiàn)G算法方法會在運動區(qū)域內(nèi)部產(chǎn)生空洞,即車頂和車頭部分。而 FD算法在與路面顏色較近的車玻璃區(qū)域有較大的誤判。針對傳統(tǒng)檢測算法自身的不足和缺陷,提出的算法可以很好的解決單純使用幀間差分法產(chǎn)生的內(nèi)部空洞問題。當場景亮度有明顯變化時,可以看到FD算法出現(xiàn)較大偏差,而平均灰度值算法的引入在一定程度上解決了亮度跳變對結(jié)果的影響。
文中融合了平均灰度算法,使用當前統(tǒng)計值代替理論值進行計算,達到了提高識別精度的目的。實驗結(jié)果與預(yù)期理論分析基本一致。
實驗結(jié)果表明 FD算法的虛警率低,分割完整性最差為0.393 4。FG算法的虛警率最高為0.118 2,全查率比較理想為0.665 3。融合算法集合前兩種算法的優(yōu)點,虛警率0.898 6,全查率0.572 9。在后處理之后算法的Jaccard提高到0.739 4。
提出的算法與傳統(tǒng)算法相比可以較快速的檢測出運動圖像,算法運算量較小,不需要很大的存儲空間,適用于實時監(jiān)測系統(tǒng)。算法可以適應(yīng)光線的變化,并能在短時間內(nèi)重建背景參考圖像,所以該算法可用于室外場所圖像處理工作。
此外,提出的算法還存在一些問題:例如當場景中目標有較多重合時對運動目標處理較差,需要研究更好的模型來解決目標之間相互遮擋的問題;另外對部分運動物體與背景圖像灰度相近時,誤判率偏高。在這些方面還有很多問題需要繼續(xù)研究。
圖2 實驗結(jié)果
[1] 姜旭,朱燦焰.視頻處理技術(shù)在智能交通系統(tǒng)的應(yīng)用[J].通信技術(shù),2010,43(01):99-102.
[2] SIEBEL N T, MAYBANK S. The ADVISOR Visual Surveillance System[J]. In Proceedings of the ECCV 2004 Workshop,2004,34(03):103-111.
[3] 于雪蓮,宋洋,劉曉紅.運動目標檢測和目標區(qū)域的估算[J].通信技術(shù),2011,44(05):119-121.
[4] 薛麗霞,羅艷麗,王佐成.基于幀間差分的自適應(yīng)運動目標檢測方法[J].計算機應(yīng)用研究,2011,28(04):1551-1553.
[5] 戶磊,劉渭濱,邱亞欽,等.光照變化下的運動目標檢測方法[J].中國科技論文在線,2011,6(04):280-286.