方 勇,張建軍
(國網(wǎng)蘭州供電公司,甘肅 蘭州 730050)
隨著監(jiān)控場景安全性的不斷提高,智能視頻監(jiān)控受到越來越多的關(guān)注。智能視頻監(jiān)控系統(tǒng)可以較為智能地分析視頻圖像,獲取監(jiān)控場景中的信息[1]。運動目標(biāo)檢測是實現(xiàn)智能視頻監(jiān)控的基礎(chǔ),其研究具有重要的現(xiàn)實意義。通過參考文獻(xiàn)可知,目前較為常用的有三種方式各有優(yōu)缺點,背景減除法適用于靜態(tài)背景檢測[2]。光流法計算復(fù)雜,性能差[3]。幀差法提取輪廓,檢測區(qū)域不完整[4]。在此基礎(chǔ)上,提出了一種結(jié)合時空馬爾可夫隨機(jī)場(Spatial Temporal Markov Random Field,STMRF)模型和高斯混合模型(Gaussian Mixture Model,GMM)的運動目標(biāo)檢測方法。進(jìn)行STMRF訓(xùn)練時利用GMM參數(shù)更新算法計算鄰域圖像分割區(qū)域的均值和方差,利用時空鄰域標(biāo)記場設(shè)置勢函數(shù)。通過仿真驗證了該方法的可行性。
考慮到目標(biāo)檢測過程中相鄰幀之間的密切關(guān)系,建立了STMRF模型。視頻中目標(biāo)的運動與前后幀的序列圖像高度相關(guān)。傳統(tǒng)馬爾可夫隨機(jī)場目標(biāo)分割的一大缺陷是缺乏視頻序列的時間維信息[5]。文中提出的時空馬爾可夫隨機(jī)場模型考慮了空間域中相鄰像素之間的相關(guān)性,在時域中增加了相鄰幀像素之間的運動相關(guān)信息[6]。利用時空二階鄰域系統(tǒng),定義了像素空間鄰域勢團(tuán)和時間鄰域勢團(tuán)。如圖1所示。
圖1 模型求解流程
能量函數(shù)擴(kuò)展為如式(1)所示。
(1)
在式中,Vc(·)為勢函數(shù);ω為像素分類的標(biāo)記場;c為與M相關(guān)的勢群,M是N×N上的鄰域系統(tǒng);C為M中全部勢團(tuán)集合。
在勢團(tuán)c定義中增加了像素點i在時間序列上相鄰幀的二維鄰域勢團(tuán)。STMRF模型如圖2所示。
圖2 STMRF模型
假設(shè)有二維平面圖像S,si為S={s1,s2,…,sM×N}集合中的像素點,數(shù)量為M×N,圖像觀測數(shù)據(jù)為F,為f={f1,f2,…,fM×N},存在像素點集r={r1,r2,…,rM×N},像素分類標(biāo)記場為ω={ωs1,ωs2,…,ωsM×N},ωs∈{1,2,…,L-1},類別總數(shù)L。
似然函數(shù)P(F|ω)符合高斯分布,如式(2)所示[7]。
(2)
在式中,μ和σ分別為高斯函數(shù)的均值和標(biāo)準(zhǔn)差。
對其取對數(shù),如式(3)所示[8]。
(3)
(4)
(5)
在式中,It為像素值(當(dāng)前幀)。
因為先驗概率P(ω)與MRF模型匹配,所以MRF等價于Gibbs隨機(jī)場,能量函數(shù)定義后就可以求出P(ω)[10]。
F為二維平面相對于鄰域系統(tǒng)M的馬爾可夫隨機(jī)場,僅當(dāng)F的聯(lián)合分布是M相關(guān)勢團(tuán)的Gibbs分布。二維圖像標(biāo)記場的計算如式(6)所示[11]。
(6)
在式中,Z為歸一化函數(shù);T是Temperature的簡寫,一般情況下T=1。
目標(biāo)檢測流程如下:
步驟1:讀取圖像并進(jìn)行參數(shù)初始化,包括迭代收斂時間、均值、方差、圖像標(biāo)記場[12]。
步驟2:劃分訓(xùn)練區(qū)域,對前N幀的μ和σ2進(jìn)行初始化,使用GMM參數(shù)更新方法進(jìn)行計算。
步驟3:對前N幀標(biāo)記場的全局能量進(jìn)行依次計算,如式(7)所示[13]。
(7)
在式中,S為平面點集;F為觀測圖像數(shù)據(jù);ω為像素分類的標(biāo)記場,ωs∈{1,2,…,L-1},L為類別總數(shù)。
判斷該值與當(dāng)前標(biāo)記場的差值是否超過設(shè)置的閾值。如果Δ≥Ek-Ek-1,則轉(zhuǎn)至下一步,并將閾值設(shè)置為0.01[14]。
步驟4:如果前后標(biāo)記場的全局能量變化非常大,使用式(8)計算當(dāng)前幀各像素局部能量[15]。
(8)
對局部能量累積值是否超隨機(jī)值進(jìn)行判斷,如超過,保存當(dāng)前標(biāo)記場的值ωs=i。
步驟5:如果前后標(biāo)記場的全局能量趨于平衡,則算法結(jié)束(即Δ 圖3所示為改進(jìn)STMRF模型的目標(biāo)檢測流程。 圖3 目標(biāo)檢測流程 仿真設(shè)備為聯(lián)想PC,操作系統(tǒng)為Windows 10 64位旗艦版,Intel i52450m CPU,頻率2.5 GHz,內(nèi)存8GB,算法程序采用Visual Studio平臺的OpenCV庫實現(xiàn)。為了驗證該方法的優(yōu)越性和有效性,將該方法與高斯混合模型和模糊C-均值聚類(FCM)進(jìn)行了比較。仿真數(shù)據(jù)來自KTH、Weizmann視頻數(shù)據(jù)庫,通過數(shù)據(jù)庫片段進(jìn)行測試。仿真主要分析了目標(biāo)檢測的錯誤率和運行時間。 圖4 (a)是來自KTH 視頻數(shù)據(jù)庫的行走視頻片段第180幀、195幀和205幀的截圖。視頻幀高120像素,寬160像素,幀速率為每秒25幀,比特率為861 kbps。對視頻進(jìn)行文中方法、GMM方法和FCM方法的目標(biāo)檢測。圖4(b)為GMM方法檢測的運動目標(biāo),圖4(c)為FCM方法檢測的運動目標(biāo),圖4(d)為文中方法檢測的運動目標(biāo)。 從圖4可以看出,與GMM方法和FCM方法相比,文中方法的檢測結(jié)果更清晰,檢測錯誤率最低。從檢測錯誤率的計算結(jié)果來看,該方法比其他方法對目標(biāo)的檢測更準(zhǔn)確,檢測錯誤率約在2%左右,GMM方法的檢測錯誤率在11%左右。FCM方法的檢測錯誤率約在6%左右。表1所示不同方法檢測錯誤率的結(jié)果比較。 表1 檢測錯誤率結(jié)果對比1 圖4 不同方法目標(biāo)檢測結(jié)果對比1 圖5所示,不同方法目標(biāo)檢測的運行時間比較結(jié)果。從圖5可以看出,文中方法的運行時間最長,與GMM方法的運行時間相差不大,而FCM方法的運行時間最短。這是因為文中方法在時間維度上增加了多幀計算,從而增加了計算時間。 圖5 不同方法目標(biāo)檢測的運行時間對比1 圖4 (a)為來自Weizmann視頻數(shù)據(jù)庫行走視頻片段第21幀、28幀和36幀的截圖。視頻幀高144像素,寬180像素,幀速率為每秒25幀,比特率為15552 kbps。對視頻進(jìn)行文中方法、GMM方法和 FCM 方法的目標(biāo)檢測。圖5(b)為GMM方法檢測的運動目標(biāo),圖5(c)為FCM方法檢測的運動目標(biāo),圖5(d)為文中方法檢測的運動目標(biāo)。 從圖6可以看出,與GMM方法和FCM方法相比,文中方法的檢測結(jié)果更清晰,檢測錯誤率最低。從檢測錯誤率的計算結(jié)果來看,該方法比其他方法對目標(biāo)的檢測更準(zhǔn)確,檢測錯誤率在2.5%左右,GMM方法檢測錯誤率在9.5%左右,F(xiàn)CM方法檢測錯誤率在6.5%左右。表2所示不同方法檢測錯誤率的結(jié)果比較。 圖6 不同方法目標(biāo)檢測結(jié)果對比2 表2 檢測錯誤率結(jié)果對比2 圖7所示為不同方法目標(biāo)檢測運行時間的比較結(jié)果。從圖7可以看出,文中方法的運行時間最長,與GMM方法相差不大,F(xiàn)CM方法的運行時間最短。這是因為文中方法在時間維度上增加了多幀計算,從而增加了計算時間。 圖7 不同方法目標(biāo)檢測的運行時間對比2 從以上實驗結(jié)果可以看出,相比于傳統(tǒng)的GMM方法和FCM方法,該方法能夠檢測復(fù)雜背景下的運動目標(biāo),具有更好的檢測效果和較強(qiáng)的魯棒性。 提出了一種時空馬爾可夫隨機(jī)場模型和高斯混合模型相結(jié)合的運動目標(biāo)檢測方法。在訓(xùn)練時空馬爾可夫隨機(jī)場模型時,采用高斯混合模型的參數(shù)更新算法計算鄰域圖像分割區(qū)域的均值和方差,并通過時空鄰域標(biāo)記場設(shè)置勢函數(shù)。結(jié)果表明,與傳統(tǒng)的GMM和FCM目標(biāo)檢測方法相比,文中方法能夠檢測復(fù)雜背景下的運動目標(biāo),檢測效果更好,有較好的魯棒性。受目前實驗室硬件和數(shù)據(jù)規(guī)模的影響,文中方法僅研究目標(biāo)檢測方法。在此基礎(chǔ)上,后續(xù)將對目標(biāo)跟蹤和行為識別等做進(jìn)一步研究。3 仿真結(jié)果與分析
3.1 仿真參數(shù)
3.2 結(jié)果與分析
4 結(jié) 論