◎潘梁靜
(商丘職業(yè)技術學院基礎部,河南 商丘 476100)
運動目標檢測方法多應用于從視頻監(jiān)控環(huán)境中提取出處于運動狀態(tài)的前景(運動目標),并將其相對靜止的背景圖像中分離出來,實現(xiàn)復雜動態(tài)場景中的運動目標提取與分割[1-3]。將運動目標識別方法應用到居家安全防護中,可以及時發(fā)現(xiàn)獨居老人的運動狀態(tài),提早防范并以最快速度達到制止與降低其損害發(fā)生的目的,也能降低人力監(jiān)控成本。
當前運動目標檢測常見算法包括背景差分法、幀間差分法、光流法[4-6]。其中,背景差分法的時間復雜度較小,能夠快速檢測與識別出運動目標,但需要提前人工設置背景圖像或者依托統(tǒng)計模型自適應設置背景圖像,對運動目標的空間信息利用不夠,提取出的運動目標的輪廓不連續(xù)、不完整[5]。幀間差分法利用視頻中幀圖像的空間特征對運動目標進行檢測與提取,但缺少對圖像內(nèi)部特征像素點的關注與提取,提取出的運動目標輪廓同樣存在不完整問題[7]。區(qū)別于背景差分法與幀間差分法對視頻幀圖像內(nèi)部信息的忽視,美國學者Hom 和Schunch 提出了光流法,對圖像中運動目標所在像素點的動態(tài)行為等作為運動目標檢測的依據(jù),著眼于從視頻圖像內(nèi)部信息層面對運動目標的運動狀態(tài)、軌跡等進行跟蹤,進而識別出運動目標。所謂光流是指空間中物體被觀測面上的像素點運動產(chǎn)生的瞬時速度場,包含了物體表面結構和動態(tài)行為等重要信息?;诠饬鞣ǖ倪\動目標檢測采用了運動目標隨時間變化的光流特性,由于光流不僅包含了被觀測物體的運動信息,還攜帶了物體運動和景物三維結構的豐富信息,這種方法不僅適用于運動目標的檢測,還可以在運動目標跟蹤方面使用,甚至在攝像頭存在運動的情況下也能檢測出獨立運動的目標[8]。但是在實際的應用中,由于遮擋、多光源、透明性及噪聲等原因,光流法的基本假設條件之一:光流場基本方程——灰度守恒通常無法滿足,不能正確求出光流場,算法計算過程也相當復雜,計算量巨大,不能滿足運動目標實時檢測識別的要求[9]。綜上,從實際應用角度來看,幀差法和背景減法相結合的運動檢測方法是使用最廣泛的一種方法[2]。結合幀差法和背景減法有效地消除了光線突變和陰影,但是對于灰度值接近背景的前景目標檢測效果不理想。
總之,當前運動目標檢測與識別仍然存在如下問題有待研究:(1)在運動目標分割過程中,背景的提取與更新是比較關鍵的步驟。如果背景靜止不變,則運動目標分割相對容易實現(xiàn),然而,多數(shù)情況下,背景是動態(tài)變化的,常存在物體的移入或移出,如果不能很好地處理背景中的干擾現(xiàn)象,則作為前景的運動物體的檢測必將受到影響。(2)視頻場景中光線變化問題(漸變、突變、反光等),同樣會影響背景的提取與更新。必須不斷地對背景進行實時估計,才能更好地完成運動目標的檢測。(3)背景物體的干擾運動。背景中存在的如風中樹葉的搖動、水面波光的閃動、車窗玻璃的反光以及天氣的變化等許多細微活動,同樣會影響到運動目標的檢測。該研究主要對上述問題加以解決,提高運動目標識別的精度與效率。
早期的混合高斯模型法容易受到光影影響導致將光線或陰影分割成前景部分,針對此問題通常是對陰影部分做偵測,將陰影值部分去除,達到前景運動目標大致輪廓提取的目的,其缺點為容易受到背景快速變動影響,或有無反射與強光照射時,將光線等判斷成目標對象移動等狀況[8]。為了解決這樣的問題,借由高斯濾波法提取前景運動目標,達到消除多余噪音且不過多破壞運動目標輪廓的目的;接著針對可能有破碎或是斷裂情況的處理采用膨脹與侵蝕的形態(tài)學處理,先以膨脹進行修補運算,再利用侵蝕獲得原本大致輪廓圖。同時,針對背景對象快速移動時,強風致使背景有窗簾飄動或落葉等導致背景誤判為前景對象這類情況,采用輪廓面積最大區(qū)塊作為完整的運動目標輪廓圖,實現(xiàn)對運動目標的準確識別。具體實現(xiàn)流程如圖1 所示。
圖1 運動目標檢測基本流程圖
在視頻圖像中如何去追蹤出運動目標的移動及輪廓是該研究內(nèi)容的重點,取得輪廓的完整性同時也影響了整個研究的準確性,利用適應性背景相減法旨在將前景運動目標及背景分離出來,利用獲得的背景信息作為背景模型并利用背景相減法達到能區(qū)分出前景及背景的效果。
該方法的缺點在于,可能在背景對象變動過快或是風吹導致物品飄動時,前景提取存在誤判的情形[10],該研究對此方法加以改進,針對前景陰影的圖像信息做進一步提取,提出一種不易受到光影變化影響的方法?;旌细咚鼓P停℅aussian Mixture Model,GMM)是由單一高斯分布模型所改良而來,常用于語音識別、機器學習及圖像處理中,其定義的公式如(1)式:
其中XT為圖像矩陣{x(t),...,x(t-T)},T 為周期,BG 為背景,F(xiàn)G 為前景,為平均值,為標準差,其參數(shù)算法在周期T 內(nèi)的如下列(2)(3)(4)所示:
通過混合高斯模型對輸入圖像(圖2)做長時間背景適應的訓練,從而提取出完整的背景圖(圖3),并以此背景圖作為背景模型,當有對象經(jīng)過時,便判斷為前景(圖4),如長時間未移動的對象也將在時間適應下被當為背景。以事先提取好的背景作為第一幀,并以背景相減法的概念去判斷前景,基于此得出大致前景對象,以便后續(xù)對運動目標進行識別。
圖2 輸入來源圖像圖
圖3 混合高斯模型適應下的背景圖
圖4 使用混合高斯模型法得出前景(值255)與陰影(值127)部分圖
形態(tài)學處理在圖像處理中相當常見[11],該研究將其用于對所要追蹤的運動目標輪廓進行更準確的描繪。首先將混合高斯模型所提取出的與背景分開的前景圖像信息灰階圖進行處理,先以高斯濾波法對噪聲加以消除,得出運動目標的大略輪廓圖;再利用膨脹與侵蝕法對運動目標顏色與背景相同時所導致輪廓不完全連接的現(xiàn)象做處理;最后對完整運動目標連通部分尋找最大輪廓面積,作為識別出的運動目標。
2.2.1 高斯濾波
高斯濾波法(Gaussian Blur),也稱為高斯平滑法,常用來模糊或柔化圖像,或是去除圖像中多余的噪聲。圖像的高斯濾波過程即對圖像與正態(tài)分布進行卷積計算,其所使用的高斯濾波像素權重分布矩陣為基本3*3 矩陣,如式(5)[12]:
高斯濾波法的優(yōu)點在于能夠在取得前景后,對圖像中的噪聲進行有效消除(圖5),且對運動目標輪廓存在的諸如破碎或是斷裂等情況不過分消除,減少噪聲對運動目標輪廓軌跡的干擾與影響,提高運動目標輪廓提取的完整性(圖6)。
圖5 使用高斯濾波法消除多余的細微噪聲圖
圖6 高斯濾波下提取的運動目標完整輪廓圖
2.2.2 膨脹與侵蝕
膨脹與侵蝕為形態(tài)學處理中常用的方法,主要用于解決圖像中的目標對象輪廓斷裂等問題。當運動目標顏色與背景顏色相似時,可能會產(chǎn)生將運動目標判定為背景或陰影一部分等現(xiàn)象,導致輪廓的完整性有缺失。該研究將膨脹與侵蝕處理應用到運動目標輪廓提取中,通過膨脹與侵蝕對運動目標輪廓進行更細節(jié)的處理[13]。
在設置膨脹參數(shù)時,一方面考慮到能夠修補運動目標輪廓破碎與斷裂,一方面又要避免過于膨脹的情況。經(jīng)過不斷嘗試,運動目標高度在不超出邊界情況下,最大即為輸入圖像來源的高度。因此可以采用輸入圖像高度值的百分之一取四舍五入至整數(shù)位的值作為膨脹參數(shù),圖像來源高度為480,故膨脹參數(shù)設置為長寬均為5。
在設置侵蝕參數(shù)時,由于需要通過膨脹去修補破碎情況,再侵蝕還原的過程下其參數(shù)值不得大于膨脹參數(shù)值,而此形態(tài)學膨脹處理主要目的也是在于膨脹修補。鑒于此,根據(jù)前面膨脹的參數(shù)值減一作為侵蝕參數(shù),較符合整個運動目標輪廓提取且不過多侵蝕導致輪廓斷裂情況發(fā)生的目標[14]。其中侵蝕參數(shù)設置為4。如圖7 與8 為膨脹與侵蝕處理前后的運動目標。
圖7 膨脹與侵蝕處理前的運動目標圖
2.2.3 最大面積判斷
圖8 膨脹與侵蝕處理后的運動目標圖
在對運動目標圖像進行形態(tài)學處理后,處理結果中仍然存在如背景對象快速變動時被誤判成前景區(qū)塊的問題。借由計算輪廓面積去排除這類情形,采用尋找輪廓法,首先對該圖像內(nèi)所有對象輪廓進行提取并記錄在輪廓矩陣中,再利用提取出的輪廓矩陣計算區(qū)塊面積[15]。面積計算公式如(6):
如圖9 所示為圖像中所提取的運動目標,除揮棒的運動目標外,因風吹飄動的窗簾也被誤判為前景;圖10 為由最大面積判斷后的運動目標輪廓,其將誤判為前景的飄動窗簾加以剔除,實現(xiàn)了對運動目標的準確提取與識別。
圖9 背景窗簾飄動誤判為前景圖
圖10 經(jīng)由最大面積尋找后得出運動目標輪廓圖
測試所使用系統(tǒng)硬件設備是CPU 為Intel Core i5-4570@3.20GH,RAM 為8GB 的個人電腦,操作系統(tǒng)為Microsoft Windows7 專業(yè)版,系統(tǒng)開發(fā)工具采用VisualStdio 2010C/C++程序語言,搭配OpenCV2.4.9 版電腦視覺程序庫一同開發(fā)研究而成。
在性能評估上,將筆者提出的運動目標檢測方法與GMM、Zivkovic 版本的GMM(Z-GMM)進行比較,以某監(jiān)控系統(tǒng)實時拍攝的視頻為數(shù)據(jù)源,驗證運動目標檢測的效率與精度。每個程序模塊皆由MS Visual C++進行編譯并且使用單進程執(zhí)行,整個實驗所用的設備為Intel Core i7-2640M(2.8Gz)。在實驗數(shù)據(jù)上,將GMM 模塊的參數(shù)設置為K=3,Tσ=3,且η=0.01;在提出的運動目標檢測方法上,參數(shù)設置為△b=256/N,a0=0.01,a1=a/2,β=1-a0。算法的閾值在兩方法上皆設置為TF=0.25。圖11 中的第一行為部分輸入圖像,為驗證運動目標檢測算法的精度,該研究設計了多樣化的場景(共計4 個video),增加了圖像中運動目標檢測的復雜度,其中(a)&(b)為video1,(c)&(d)為video2,(e)&(f)為video3,(g)&(h)為video4。
如表1 所示為測試數(shù)據(jù)。
表1 測試數(shù)據(jù)表
利用GMM、ZGMM,提出方法對圖像進行前景切割與運動目標檢測,結果如圖11 所示,圖中,行1:輸入圖像;行2:標準前景切割結果;行3-6:GMM、ZGMM、筆者所提方法(Fixed-point 實現(xiàn)、N=16)以及筆者所提方法(Fixed-point 實現(xiàn)、N=32)的前景切割結果。由圖中可知,基于混合高斯模型的運動目標檢測方法在運動目標輪廓提取完整性、噪聲去除等方面具有較好的視覺效果。
圖11 前景切割結果比較圖
對GMM、ZGMM,提出方法進行前景切割與運動目標檢測的時間統(tǒng)計,分析不同方法的時效性,其結果如表2 所示(以GMM 的速度作為基準速度100%進行比較。單位:FPS)。根據(jù)對比可知,基于混合高斯模型的運動目標檢測方法計算效率較高,比Z-GMM 快1.3 倍,比GMM 快3.7倍。對此情況進行分析,高計算效率的出現(xiàn)是由于算法使用了內(nèi)存空間來換取處理時間。在程序執(zhí)行期間,會有較頻繁的內(nèi)存空間存取的現(xiàn)象。
該研究旨在對監(jiān)控系統(tǒng)中的運動目標進行識別,在對光流法與膚色等追蹤方式研究的基礎上,為了能更準確提取出運動目標位置與輪廓,采用了較快速的混合高斯模型法。早期的高斯模型存在容易受到光影影響導致將光線或陰影分割成前景部分的問題,為了改善該方法缺點,提出了高斯濾波、膨脹與侵蝕及面積計算等方式,以提高運動目標輪廓獲取的完整性與準確性。