唐開悅,王思涵
(廣西師范大學(xué),廣西 桂林 541006)
計(jì)算機(jī)技術(shù)和多媒體技術(shù)在近年來(lái)飛速發(fā)展,提高了圖像目標(biāo)檢測(cè)技術(shù)在各個(gè)領(lǐng)域中的應(yīng)用性能[1]。在計(jì)算機(jī)視覺領(lǐng)域中圖像目標(biāo)檢測(cè)方法成為重要研究?jī)?nèi)容,在工程和科學(xué)中具有重要的研究?jī)r(jià)值,被廣泛地應(yīng)用在視頻壓縮、智能監(jiān)控、醫(yī)學(xué)診斷、智能機(jī)器人、虛擬現(xiàn)實(shí)和人機(jī)交互等領(lǐng)域中[2-3]。人體的運(yùn)動(dòng)過(guò)程包含了大量的視覺信息,研究人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)的檢測(cè)具有較大的應(yīng)用價(jià)值和現(xiàn)實(shí)意義[4]。
程全[5]等人提出基于分塊投影匹配的人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)檢測(cè)方法,該方法通過(guò)分塊投影匹配方法估計(jì)全局運(yùn)動(dòng)參數(shù),利用估計(jì)參數(shù)對(duì)圖像背景進(jìn)行補(bǔ)償處理,根據(jù)背景減除法提取圖像中存在的運(yùn)動(dòng)目標(biāo),實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)檢測(cè),該方法無(wú)法消除圖像中存在的陰影,存在圖像清晰度低的問題。左軍輝[6]等人提出基于改進(jìn)背景減法的人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)檢測(cè)方法,該方法采用GMM圖像塊均值方法在背景建模階段重構(gòu)背景模型,結(jié)合小波半軟閾值函數(shù)和數(shù)學(xué)形態(tài)學(xué)在目標(biāo)檢測(cè)階段對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行去噪處理,通過(guò)自適應(yīng)背景更新方法更新背景,實(shí)現(xiàn)人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)的檢測(cè),該方法在背景建模階段無(wú)法消除陰影區(qū)域和非陰影區(qū)域之間存在的邊界線,導(dǎo)致檢測(cè)過(guò)程的位置誤差較大。王思明[7]等人提出基于BRISK算法的人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)檢測(cè)方法,該方法結(jié)合歐式距離和k近鄰算法進(jìn)行特征匹配,對(duì)順序抽樣一致性算法進(jìn)行改進(jìn),提純特征點(diǎn),實(shí)現(xiàn)背景運(yùn)動(dòng)補(bǔ)償,采用形態(tài)學(xué)對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行分割,利用BRISK算法實(shí)現(xiàn)目標(biāo)檢測(cè),由于運(yùn)動(dòng)目標(biāo)附近存在陰影,增加了該方法提取特征點(diǎn)所用的時(shí)間,存在檢測(cè)效率低的問題。
為了解決上述方法中存在的問題,提出多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法。
多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法通過(guò)高斯背景模型分離圖像背景區(qū)域和目標(biāo)區(qū)域。
1)背景初始化
采用K個(gè)高斯分布對(duì)圖像中的像素顏色信息進(jìn)行描述,利用高斯密度函數(shù)對(duì)各個(gè)分布進(jìn)行描述,每個(gè)分布之間都是獨(dú)立的[8]。設(shè)Xt代表的是像素點(diǎn)在t時(shí)刻的觀測(cè)值;η(Xt,μi,t,∑i,t)代表的是第i個(gè)高斯分布對(duì)應(yīng)的概率密度函數(shù),其表達(dá)式如下
η(Xt,μi,t,∑i,t)=
(1)
式中,μi,t代表的是第i個(gè)高斯分布在t時(shí)刻對(duì)應(yīng)的均值;∑i,t代表的是第i個(gè)高斯分布在t時(shí)刻對(duì)應(yīng)的協(xié)方差。
設(shè)P(Xt)描述的是t時(shí)刻目標(biāo)圖像觀測(cè)點(diǎn)對(duì)應(yīng)的概率密度函數(shù),其值可通過(guò)下述公式計(jì)算得到
(2)
式中,wi,t代表的是第i個(gè)高斯分布在t時(shí)刻對(duì)應(yīng)的權(quán)值。
多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法采用基于統(tǒng)計(jì)的方法在背景建模初期對(duì)模型進(jìn)行初始化處理。將前N幀不含檢測(cè)目標(biāo)的圖像像素對(duì)應(yīng)的平均值作為初始化圖像的觀測(cè)值,減少背景建模過(guò)程中受其它因素的干擾。
設(shè)μ0代表的是在初始背景估計(jì)過(guò)程中某點(diǎn)對(duì)應(yīng)的均值,其計(jì)算公式如下
(3)
式中,N描述的是圖像幀數(shù)。
(4)
2)高斯分布模型匹配
讀取新的人體運(yùn)動(dòng)圖像后,逐一匹配K個(gè)高斯分布模型和每個(gè)像素點(diǎn)Xt,判定依據(jù)為
|Xt-μi.t-1|≤2.5σi
(5)
式中,2.5σi代表的是匹配閾值。如果滿足上式表明該點(diǎn)為背景;如果不滿足為運(yùn)動(dòng)目標(biāo)。
3)高斯分布模型更新
通過(guò)對(duì)方差、均值和權(quán)值的更新實(shí)現(xiàn)高斯分布模型的更新。
利用下式更新權(quán)值
(6)
式中,α代表的是學(xué)習(xí)率。
通過(guò)下述公式對(duì)均值和方差進(jìn)行更新
(7)
其中,參數(shù)ρ的計(jì)算公式如下
(8)
4)背景生成
(9)
假設(shè)多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像為局部平穩(wěn)的,統(tǒng)計(jì)信息在圖像非陰影區(qū)域和陰影區(qū)域中的相似度較高,匹配I分量圖中非陰影區(qū)域與陰影區(qū)域的灰度,補(bǔ)償陰影區(qū)域的亮度。
結(jié)合陰影投射方向和陰影區(qū)域獲得鄰近非陰影區(qū)域,設(shè)Qn代表的是非陰影區(qū)域集合,其表達(dá)式如下
Qn={p|0 (10) 式中,p代表的是陰影投射方向中存在的點(diǎn);Ωs代表的是圖像中的陰影區(qū)域;d(p,Ωs)代表的是陰影區(qū)域Ωs與點(diǎn)p之間存在的距離;dist代表的是距離閾值。 獲得圖像非陰影區(qū)域和陰影區(qū)域后,根據(jù)映射策略利用下式補(bǔ)償陰影區(qū)域的灰度值 (11) 式中,I代表的是陰影區(qū)域補(bǔ)償前對(duì)應(yīng)的灰度值;I′代表的是陰影區(qū)域補(bǔ)償后對(duì)應(yīng)的灰度值;A代表的是亮度補(bǔ)償強(qiáng)度系數(shù);σs代表的是陰影區(qū)域?qū)?yīng)的方差;ms代表的是陰影區(qū)域?qū)?yīng)的均值;σn代表的是非陰影區(qū)域?qū)?yīng)的方差;mn代表的是非陰影區(qū)域?qū)?yīng)的均值。 陰影對(duì)圖像產(chǎn)生影響,改變了其飽和度、色調(diào)和亮度,因此陰影區(qū)域的真實(shí)色彩不能只通過(guò)亮度得到補(bǔ)償,多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法采用下述補(bǔ)償策略對(duì)S分量圖和H分量圖中存在的非陰影區(qū)域和陰影區(qū)域進(jìn)行匹配 (12) (13) 式中,S(i,j)、H(i,j)分別代表的是陰影區(qū)域在補(bǔ)償前和補(bǔ)償后對(duì)應(yīng)的飽和度;mn、ms分別代表的是非陰影區(qū)域在補(bǔ)償前和補(bǔ)償后對(duì)應(yīng)的色調(diào)值;B、C分別代表的是圖像色調(diào)和圖像飽和度在補(bǔ)償過(guò)程中的強(qiáng)度系數(shù)。 在上述過(guò)程的基礎(chǔ)上補(bǔ)償圖像陰影區(qū)域中的各個(gè)分量,將HSI(Hue Saturation Intensity ,色調(diào)飽和度)空間中存在的H、S、I分量轉(zhuǎn)換到RGB空間中,實(shí)現(xiàn)圖像陰影區(qū)域的消除?;叶韧蛔儸F(xiàn)象經(jīng)常存在于圖像的陰影和非陰影區(qū)域中,消除陰影后兩個(gè)區(qū)域之間在圖像中仍然呈現(xiàn)一條明顯的邊界線[9],多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法完成陰影補(bǔ)償后,通過(guò)中值濾波處理消除陰影邊界處存在的邊緣效應(yīng),使陰影區(qū)域經(jīng)過(guò)補(bǔ)償后可以平滑的過(guò)渡到非陰影區(qū)域。 在二階自回歸模型的基礎(chǔ)上建立運(yùn)動(dòng)模型 Xt-Xt-1=Xt-1-Xt-2+Ut (14) 式中,Xt代表的多自由度人體運(yùn)動(dòng)目標(biāo),其表達(dá)式如下 (15) 多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法選擇灰度分布對(duì)多自由度人體運(yùn)動(dòng)目標(biāo)進(jìn)行描述,對(duì)參考目標(biāo)與目標(biāo)樣本進(jìn)行對(duì)比,根據(jù)對(duì)比結(jié)果建立觀測(cè)模型。 (16) 式中,C代表的是歸一化常數(shù);l代表的是人體運(yùn)動(dòng)目標(biāo)對(duì)應(yīng)的中心(x,y);h代表的是目前區(qū)域的大??;k(·)代表的是核函數(shù);δ(·)代表的是Kronecker Delta函數(shù)。 在目標(biāo)中心與區(qū)域中心重合的基礎(chǔ)上選取固定區(qū)域,最大限度地使固定區(qū)域與目標(biāo)吻合,因此在不同方向的固定區(qū)域中,距離中心較近的像素越有可能屬于目標(biāo)[10]。通過(guò)上述分析可知,當(dāng)區(qū)域中的像素位置高于設(shè)定的范圍時(shí),多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法選擇負(fù)指數(shù)分布對(duì)像素屬于目標(biāo)的概率進(jìn)行描述 (17) 式中,參數(shù)θ的取值為1;|·‖代表的是距離范數(shù);Td代表的是閾值。 (18) (19) 在上式的基礎(chǔ)上構(gòu)建觀測(cè)概率模型 (20) 式中,λ為控制參數(shù)。設(shè)t代表的是目標(biāo)在圖像中的平均狀態(tài);為觀測(cè)概率,可在觀測(cè)概率模型的基礎(chǔ)上計(jì)算得到,構(gòu)建人體運(yùn)動(dòng)目標(biāo)的目標(biāo)更新模型,利用目標(biāo)更新函數(shù)實(shí)現(xiàn)多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)的檢測(cè) (21) 為了驗(yàn)證多自由度人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)檢測(cè)方法的整體有效性,需要對(duì)多自由度人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)檢測(cè)方法進(jìn)行測(cè)試。本次測(cè)試的實(shí)驗(yàn)平臺(tái)為CPU2.1GHz,2GB RAM計(jì)算機(jī)?;贛ATLAB7.11平臺(tái)實(shí)現(xiàn)圖像顯示,在Visual Studio 2010 MFC平臺(tái)中通過(guò)攝像頭獲取圖像。分別采用多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法(方法1)、基于分塊投影匹配的人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)檢測(cè)方法(方法2)和基于改進(jìn)背景減法的人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)檢測(cè)方法(方法3)進(jìn)行測(cè)試,對(duì)人體運(yùn)動(dòng)動(dòng)態(tài)目標(biāo)進(jìn)行檢測(cè)之前,需要對(duì)圖像進(jìn)行預(yù)處理,不同方法的圖像處理結(jié)果如圖1所示。 圖1 不同方法的圖像預(yù)處理結(jié)果 圖1(a)為方法1對(duì)人體運(yùn)動(dòng)動(dòng)態(tài)圖像處理后的結(jié)果,可以看出處理后的圖像清晰度較高,不存在模糊區(qū)域和陰影區(qū)域。圖1(b)為方法2對(duì)人體運(yùn)動(dòng)動(dòng)態(tài)圖像處理后的結(jié)果,該方法對(duì)圖像進(jìn)行處理后圖像中還存在大面積的模糊區(qū)域。圖1(c)為方法3對(duì)人體運(yùn)動(dòng)動(dòng)態(tài)圖像處理后的結(jié)果,采用該方法對(duì)圖像進(jìn)行預(yù)處理時(shí)無(wú)法消除圖像中存在的陰影部分。對(duì)比方法1、方法2和方法3的測(cè)試結(jié)果可知,方法1預(yù)處理后的人體運(yùn)動(dòng)動(dòng)態(tài)圖像的清晰度較高,因?yàn)樵摲椒ㄍㄟ^(guò)高斯模型進(jìn)行背景建模,在目標(biāo)區(qū)域中結(jié)合數(shù)學(xué)形態(tài)處理和小區(qū)域去除方法根據(jù)陰影區(qū)域飽和度高和亮度值低的特性確定陰影區(qū)域,并通過(guò)匹配補(bǔ)償去除圖像中存在的陰影,提高了人體運(yùn)動(dòng)動(dòng)態(tài)圖像的清晰度。 將位置誤差作為測(cè)試指標(biāo)對(duì)方法1、方法2和方法3進(jìn)行測(cè)試,測(cè)試結(jié)果如圖2所示。 圖2 不同方法的位置誤差 分析圖2中的數(shù)據(jù)可知,方法2對(duì)人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)進(jìn)行檢測(cè)時(shí),當(dāng)圖像幀數(shù)為40frames時(shí)位置誤差飛速增加,因?yàn)樵摲椒o(wú)法消除圖像中的模糊區(qū)域,導(dǎo)致在目標(biāo)跟蹤過(guò)程中的位置誤差較大。方法3對(duì)人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)進(jìn)行檢測(cè)時(shí),隨著圖像幀數(shù)的增加位置誤差不斷增加,因?yàn)樵摲椒ㄔ谀繕?biāo)跟蹤過(guò)程中將陰影區(qū)域誤當(dāng)做目標(biāo),增大了位置誤差。采用方法1對(duì)人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)進(jìn)行檢測(cè)時(shí)的位置誤差較小,因?yàn)樵摲椒ㄍㄟ^(guò)降低陰影區(qū)域的飽和度,提高陰影區(qū)域的亮度值,消除圖像中存在的陰影,降低了目標(biāo)跟蹤過(guò)程中產(chǎn)生的位置誤差。 為了進(jìn)一步驗(yàn)證方法1、方法2和方法3的整體有效性,通過(guò)運(yùn)行時(shí)間測(cè)試不同方法的檢測(cè)效率,結(jié)果如3所示。 圖3 不同方法的運(yùn)行時(shí)間 分析圖3中的數(shù)據(jù)可知,隨著圖像幀數(shù)的增加,方法1、方法2和方法3檢測(cè)多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)所用的時(shí)間不斷增加,但方法1所用的時(shí)間仍少于方法2和方法3所用的時(shí)間,因?yàn)榉椒?完成陰影補(bǔ)償后,為了減弱邊緣效應(yīng),對(duì)陰影邊界進(jìn)行中值濾波處理,使陰影區(qū)域經(jīng)過(guò)補(bǔ)償后可以平滑的過(guò)渡到非陰影區(qū)域,提高了圖像的清晰度,更好的體現(xiàn)了目標(biāo)在圖像中的細(xì)節(jié)信息,縮短了檢測(cè)所用的時(shí)間,提高了方法1的檢測(cè)效率。 在人體運(yùn)動(dòng)視覺分析中人體運(yùn)動(dòng)目標(biāo)檢測(cè)是重要內(nèi)容,在計(jì)算機(jī)視覺領(lǐng)域中成為人們研究的熱點(diǎn)。人體運(yùn)動(dòng)目標(biāo)檢測(cè)具有極大的經(jīng)濟(jì)價(jià)值和廣泛的應(yīng)用前景,被應(yīng)用在人體運(yùn)動(dòng)細(xì)節(jié)分析、高級(jí)人機(jī)交互和智能安全監(jiān)控等領(lǐng)域中。目前人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法存在圖像清晰度低、位置誤差大和檢測(cè)效率低的問題,提出多自由度人體運(yùn)動(dòng)動(dòng)態(tài)圖像目標(biāo)檢測(cè)方法,在圖像預(yù)處理過(guò)程中結(jié)合數(shù)學(xué)形態(tài)處理和小區(qū)域去除方法消除目標(biāo)周圍存在的陰影,根據(jù)像素在圖像中的灰度分布實(shí)現(xiàn)人體運(yùn)動(dòng)動(dòng)態(tài)圖像的目標(biāo)檢測(cè),解決了當(dāng)前方法中存在的問題和難點(diǎn),為人體運(yùn)動(dòng)視覺分析技術(shù)的發(fā)展奠定了基礎(chǔ)。3.2 目標(biāo)檢測(cè)
4 實(shí)驗(yàn)結(jié)果與分析
5 結(jié)束語(yǔ)