周佳敏
(武漢理工大學(xué),湖北 武漢 430070)
行人檢測在視頻監(jiān)控、虛擬現(xiàn)實技術(shù)等領(lǐng)域有廣泛的應(yīng)用,也是計算機(jī)視覺和模式識別領(lǐng)域的重要研究方向。由于行人姿態(tài)、服飾的差異性增加了行人檢測的難度。而人體的輪廓受這種因素的干擾較少,可以提供描述行人較為魯棒的特征。Dalal[1]等提出的梯度方向直方圖特征,利用局部邊緣梯度分布特征來表征行人,具有優(yōu)良的檢測性能。
盡管HOG特征表現(xiàn)出優(yōu)異的檢測性能,其特征向量的維數(shù)過高使得特征計算和在線檢測時間過長。本文提出結(jié)合行人頭部與腿部圖像區(qū)域作為感興趣區(qū)域進(jìn)行檢測,精確識別出行人目標(biāo)。
將一副待檢圖像分成N個單元,稱為”Cell”,由若干個單元可組合成一個塊,稱為”Block”,整幅圖像由一定數(shù)目的塊組成,塊與塊之間允許重疊。通過統(tǒng)計各個塊內(nèi)各單元在各個方向上的梯度分布,即構(gòu)成了該圖像的HOG特征,其計算過程如下。
采用梯度算子計算圖像的水平方向梯度和垂直方向梯度。
將梯度方向分為若干個子區(qū)間,對單元內(nèi)每個像素點(diǎn),以各像素點(diǎn)的梯度值為權(quán)重,對其梯度方向所屬子區(qū)間進(jìn)行投票加權(quán)。
對梯度強(qiáng)度在塊內(nèi)做歸一化[4]處理,可以減少局部光照以及前景、背景對比度的變化對直方圖特征的影響。HOG特征就是塊中所有單元的直方圖所組成的一個向量。
通過樣本圖像分析發(fā)現(xiàn),行人腿部所在的圖像區(qū)域,背景通常是平坦的路面,并且腿部的輪廓邊緣具有明顯的垂直對稱性,其在某些梯度方向上會出現(xiàn)一定的峰值,其HOG特征與背景差別較大。因此,本文首先針對行人腿部采用HOG特征進(jìn)行檢測。
由于行人腳與地面接觸,行人的腿部區(qū)域一般會出現(xiàn)在圖像的下半部分區(qū)域,因此本文主要對待檢圖像的下半部分進(jìn)行掃描,具體檢測步驟如下:
1)獲取待檢圖像,并取圖像的下半部分區(qū)域作為行人腿部掃描區(qū)域;
2)按照大小為16*16個像素窗口遍歷待檢圖像,計算得到掃描區(qū)域內(nèi)所有塊的HOG特征向量并存入一個14*39的二維數(shù)組中,數(shù)組中每個元素指向一個塊的36維HOG特征向量。
3)以大小為64*64,步長為8個像素的檢測窗口遍歷待檢圖像,此時不需獨(dú)立計算每個檢測窗口的HOG特征,只要對二維數(shù)組進(jìn)行正確的索引找到該區(qū)域所對應(yīng)塊的HOG特征向量。
4)加載訓(xùn)練得到的腿部識別分類器,對檢測窗口進(jìn)行判別。
經(jīng)過分析可知,無論行人呈現(xiàn)出何種不同的姿態(tài),行人頭部輪廓變動性很小,且呈現(xiàn)出一定的形狀,而且行人的頭部不易被遮擋,在檢測過程中很容易被檢測出來。因此本文采用模板匹配對頭部進(jìn)行檢測。其檢測過程如下:
1)針對頭部輪廓構(gòu)建一個“Ω”形位圖模板,將頭部輪廓模板與Sobel邊緣圖像做乘積,將分?jǐn)?shù)計算的最大值視為符合頭部區(qū)域。
2)由于現(xiàn)實場景有復(fù)雜的背景[5]存在,對圖像進(jìn)行邊緣檢測時可能會干擾模板匹配過程,采用Canny算子和形態(tài)學(xué)邊緣檢測算子融合的方法實現(xiàn)頭部邊緣檢測。
3)通過計算模板與待檢測窗口的距離變換圖像的Chamfer[3]距離來衡量兩者之間的相似程度,如果待匹配的圖像中沒有頭部,則求得的Chamfer距離通常會遠(yuǎn)大于在圖像中有頭部的Chamfer距離。
在本文的行人檢測過程中,首先對腿部進(jìn)行檢測并實現(xiàn)對腿部的初步定為,然后進(jìn)一步使用模板匹配對候選行人頭部檢測,只有當(dāng)頭部和腿部同時存在該區(qū)域中,才能認(rèn)為所識別的目標(biāo)為行人。
為了驗證部位組合檢測方法的有效性,本文對樣本集中的圖像進(jìn)行了處理分析,主要比較了本文的部位組合算法與HOG算法在樣本集的檢測性能,其中HOG算法的檢測率為76.1%,本文部位組合算法檢測率達(dá)到了96.7%。
本文提出了一種基于部位組合特征的行人檢測方法,首先對腿部進(jìn)行檢測,定位出候選行人區(qū)域,再根據(jù)頭部輪廓不易變動的特點(diǎn),利用模板匹配的方法對行人頭部進(jìn)一步檢測。實驗表明,本文的方法能夠有效地檢測出現(xiàn)實場景中的行人。
[1]蘇松志.行人檢測若干關(guān)鍵技術(shù)研究[D].廈門:廈門大學(xué),2011.
[2]郭烈.利用腿部區(qū)域HOG特征的行人檢測方法[J].計算機(jī)工程與應(yīng)用,2013,49(1):217-221.
[3]杜友田.基于視覺的人的運(yùn)動識別綜述[J].電子學(xué)報,2007,35(1):84-90.
[4]黃茜.基于梯度向量直方圖的行人檢測[J].科學(xué)技術(shù)與工程,2009,9(13):3646-3651.
[5]潘鋒.基于支持向量機(jī)的復(fù)雜背景下的人體檢測[J].中國圖像圖像學(xué)報,2005,10(2):183-186.