宣曉剛,劉偉峰
(杭州電子科技大學自動化學院系統(tǒng)科學與控制工程研究所,浙江杭州310018)
行人檢測與估計在智能交通中具有廣泛的應(yīng)用,并且在公共安全方面都有著廣泛的用途。基于視頻的行人檢測與估計問題可以歸為兩點:背景消減,行人的特征提取方法。主要的研究方法有:相鄰幀間差分法是在連續(xù)的圖像序列中,從差分圖像上檢測運動變化區(qū)域,對連續(xù)兩幀視頻圖像進行相減得根據(jù)變化區(qū)域的灰度信息恢復(fù)原來的運動目標[1]。光流法根據(jù)光流法獲得特征光流后,應(yīng)將其分割成代表不同目標的類[2]。根據(jù)同一目標上的點的光流近似,不同目標上的點的光流不同,以及同一目標上的點的分布具有一定的規(guī)律的特點,可以采用最小相似性規(guī)則的聚類分析算法,進行聚類分析從而得到運動物體。背景差分法在當前的應(yīng)用開發(fā)中比較常用[3],它的原理是:首先提取場景中的背景圖像,然后把當前幀與背景圖像做差分[4],本文對得到的差分圖像進行灰度化,之后可以得到比較完整的運動目標。
假設(shè)Ii(x,y)表示第i幀視頻圖像象素點為(x,y)位置的象素灰度值,視頻背景圖像定義為視頻中對象固定不變的場景物體和目標,而視頻前景可以看作為由移動目標構(gòu)成的圖像,假設(shè)背景圖像為Bi(x,y),那么前景圖像Mi(x,y)可以簡單表示為:
即一幅圖像由前景圖像和背景圖像組成,本文主要是對前景運動目標感興趣。
利用運動目標運行一段時間的序列圖像進行平均而得到背景圖像,計算表達式為:
B(x,y)表示背景圖像,Ii(x,y)表示第 i幀序列圖像在象素點(x,y)的灰度值,N表示幀數(shù)。
使用前面取出的背景圖像,將所要處理的前景圖像各象素值減去對應(yīng)背景圖像的象素點的灰度值[5,6],取值范圍為0至255。設(shè)定合適閾值。當差值大于閾值時置為0,全小于閾值時置為255。用表示實時實際圖像,B(x,y)表示背景圖像,他們之間的偏差為Mi(x,y),T為閾值,表示為[7]:
經(jīng)過兩幀之間逐象素地相減,在理想的情況下,會出現(xiàn)不等于0的點的位置即行人區(qū)域和等于0的點的位置即背景區(qū)域[8]。
有限混合模型是一種混合統(tǒng)計的建模工具,混合模型研究的問題可以歸類為兩點[9]:混合成份個數(shù)估計,混合模型參數(shù)估計,本文采用高斯混合模型方法,它可表示為:
式中,z={zi},i=1,…,n表示觀測數(shù)據(jù),θ是參數(shù)集,表示如下幾個參數(shù):高斯混合權(quán)重Π1,…,Πm,高斯均值μ1,…,μm和高斯協(xié)方差陣P1,…,Pm。本文目的是從觀測數(shù)據(jù)中估計權(quán)重,均值和協(xié)方差3類混合參數(shù)。
由于行人個數(shù)位置,這意味著混合分布個數(shù)m是未知的,為此,引入貝葉斯信息準則來估計高斯混合分布元個數(shù),該準則可表示為:
式中,m是分布元個數(shù),L(.)是參數(shù)似然函數(shù)。學習過程用Gibss采用算法[9]。
通過背景消減獲得的提取行人圖像,然后應(yīng)用文獻9提出的無監(jiān)督學習算法,采用matlab程序算法,調(diào)整權(quán)重,進行無監(jiān)督學習。然后根據(jù)以下兩個判斷是否為人形:
(1)權(quán)重Π是否大于閾值權(quán)重,若小于,則判定為干擾,舍去;
(2)學習后橢圓形長軸和短軸的比值,是否在所定義的范圍內(nèi),并且計算長軸與Y方向(縱向)夾角,判斷該角是否小于定義的閾值范圍。
本文采用的一段850幀的視頻場景如圖1所示,每幀圖像的大小為720×576象素點的大小,背景有建筑物、自然植物;場景中有行人和其他移動車輛行駛,場景有行人走過,行人個數(shù)是隨時間變化的。
圖1 仿真場景
首先獲取背景圖像,采用圖像幀的背景學習算法,獲得的背景圖像如圖2所示,可以看出,背景圖像和真實的背景圖像非常接近,選擇第713幀圖像作為待檢圖像如圖3所示,采用背景消減方法獲得的前景行人圖像如圖4所示。
采用本文的檢測方法檢測行人個數(shù),對圖4學習的結(jié)果如圖5所示,由于干擾點的影響,要從中檢測出行人個數(shù),首先需要排除這些干擾點的影響,混合模型的個數(shù)一般選擇行人個數(shù)的2倍以上;并且由于行人個數(shù)未知(也就是混合分布元個數(shù)未知),為此,混合分布元的個數(shù)從2到6變化,相應(yīng)的BIC指標變化如圖6所示,采用BIC估計混合分布元的個數(shù),當混合模型個數(shù)為6時,BIC準則取值最小,不同分布元個數(shù)時的150步迭代學習過程如圖7所示,從大約從第20個迭代步開始穩(wěn)定,并且混合模型個數(shù)為6時的BIC準則最小。
3類行人檢測數(shù)據(jù)如表1所示,即權(quán)重,長短軸角度,長短軸比檢測行人,根據(jù)經(jīng)驗值檢測閾值分別如下:權(quán)重閾值W=0.01,長短軸夾角閾值85~95°,長短軸比閾值10~25,可以看出,判斷出的行人個數(shù)為3個,行人的位置可以用高斯分布的均值來代替。
表1 行人參數(shù)混合參數(shù)檢測表
本文研究了基于是視頻的行人檢測與估計方法,首先提取背景圖像,采用背景消減的算法,提取前景圖像;最后采用基于混合模型學習算法的檢測統(tǒng)計對圖像進行車輛檢測和車輛數(shù)統(tǒng)計。
[1] 王衛(wèi)鋒,王錕,郝志峰.基于視頻的車流量統(tǒng)計算法[J].科學技術(shù)與工程,2011,11(17):4 080-4 087.
[2] 施家棟,王建中,王紅茹.基于光流的人體運動實時檢測方法[J].北京理工大學報,2008,28(9):794-797.
[3] 趙冠華,馮曉毅,王虎,等.結(jié)合對稱差分法和背景減法的目標檢測方法[J].計算機工程與應(yīng)用,2010,46(3):145-147.
[4] 周西漢,劉勃,周荷琴.一種基于對稱差分和背景消減的運動檢測方法[J].計算機仿真,2005,22(4):117-123.
[5] 胡燕,嵇啟春,李智杰,等.視頻監(jiān)控中背景的提取和更新算法[J].計算技術(shù)與自動化,2009,29(1):142-144.
[6] 連曉峰,張弢,戴軍,等.基于視頻流的運動人體檢測方法研究[J].北京工商大學學報(自然科學版),2009,7(6):40-44.
[7] 朱礦軍,張海珍,曲孝利.一種基于視頻虛擬檢測線的交通流參數(shù)檢測方法[J].城市交通,2006,4(3):70-73.
[8] 陳冬良,楊東勇.基于全方位視覺的運動目標檢測與定位方法[J].計算機仿真,2010,27(10):223-229.
[9] 劉偉峰,楊愛蘭.基于BIC準則和Gibbs采樣的有限混合模型無監(jiān)督學習算法[J].電子學報,2011,39(1):134-139.