程凡永,羅海波,阮志強(qiáng)
(閩江學(xué)院 福建省信息處理與智能控制重點(diǎn)實(shí)驗(yàn)室,福州350108)
基于快速區(qū)域定位和二重間隔分布機(jī)的行人檢測(cè)
程凡永,羅海波,阮志強(qiáng)
(閩江學(xué)院 福建省信息處理與智能控制重點(diǎn)實(shí)驗(yàn)室,福州350108)
為實(shí)現(xiàn)快速和代價(jià)敏感性的行人檢測(cè),設(shè)計(jì)了基于 BING目標(biāo)檢測(cè)和二重間隔分布機(jī)的行人檢測(cè)框架.首先利用 BING特征進(jìn)行快速目標(biāo)篩選,在此基礎(chǔ)上提出了啟發(fā)式的目標(biāo)區(qū)域定位算法,通過目標(biāo)選擇和區(qū)域定位策略來獲取行人所在的區(qū)域.區(qū)域定位減少了分類器的搜索空間,只需將二重間隔分布機(jī)對(duì)定位區(qū)域進(jìn)行目標(biāo)檢測(cè)即可獲得行人檢測(cè)的結(jié)果,提高了行人檢測(cè)的效率和速度.
快速檢測(cè); 區(qū)域定位; 行人檢測(cè)
行人檢測(cè)是一個(gè)具有重要實(shí)際應(yīng)用價(jià)值的研究方向,行人姿態(tài)的多樣性和障礙遮擋等復(fù)雜環(huán)境給這個(gè)問題帶來了很大的挑戰(zhàn)[1].HOG特征通過刻畫梯度圖像的分布來描述行人的姿態(tài)取得了很大的成功,成為了行人檢測(cè)中最具代表性的特征表示方法[2].行人檢測(cè)中最常用的分類器是SVM[3],基于HOG特征和SVM 分類器的行人檢測(cè)方法取得了很好的行人檢測(cè)效果.我們也采用這個(gè)方法進(jìn)行了行人檢測(cè)實(shí)驗(yàn),實(shí)驗(yàn)中發(fā)現(xiàn),無論是行人圖像還是行人圖像的HOG特征圖像,它們的均值圖像都能很好的描述行人的輪廓信息.基于這個(gè)顯著的特點(diǎn),我們將融合樣本均值特征的二重間隔分布機(jī)[4]替代 SVM 應(yīng)用到行人檢測(cè)框架中,這樣可以充分利用特征圖像的統(tǒng)計(jì)特征來正則化分類器,增強(qiáng)分類器的泛化性能.
目前,很多流行的檢測(cè)算法都是采用特征窗口滑動(dòng)加分類器識(shí)別的方法,檢測(cè)窗口要遍歷整個(gè)圖像,檢測(cè)過程需要耗費(fèi)很長(zhǎng)的時(shí)間,這就限制了強(qiáng)表示能力的特征和強(qiáng)檢測(cè)器的使用.因此在應(yīng)用二重間隔分布機(jī)訓(xùn)練的強(qiáng)檢測(cè)器對(duì)目標(biāo)進(jìn)行檢測(cè)之前,一個(gè)很關(guān)鍵的步驟是目標(biāo)區(qū)域的快速定位,快速目標(biāo)區(qū)域定位減小了檢測(cè)窗口的遍歷區(qū)域,能夠提高后續(xù)目標(biāo)檢測(cè)的效率和速度.常用的目標(biāo)區(qū)域定位方法有:Selective Search[5]通過區(qū)域?qū)蛹?jí)合并的策略來實(shí)現(xiàn)目標(biāo)區(qū)域的篩選和定位,但由于目標(biāo)區(qū)域生成數(shù)量過多且需要對(duì)圖像進(jìn)行分割,因此存在目標(biāo)區(qū)域生成時(shí)間較長(zhǎng)的缺點(diǎn); 程明明提出的基于二進(jìn)制歸一化梯度特征的目標(biāo)檢測(cè)方法 BING Objectness[6]通過訓(xùn)練的目標(biāo)模板和位運(yùn)算卷積實(shí)現(xiàn)了目標(biāo)的快速篩選,能獲得很高的目標(biāo)檢測(cè)率,利用篩選出的目標(biāo)可以進(jìn)行目標(biāo)區(qū)域的定位.
本文采用基于二進(jìn)制歸一化梯度特征(BING)的快速目標(biāo)篩選算法來檢測(cè)和估計(jì)出圖像中的目標(biāo)區(qū)域,之后采用二重間隔分布機(jī)在目標(biāo)區(qū)域內(nèi)進(jìn)行行人檢測(cè)來實(shí)現(xiàn)快速行人檢測(cè)的目標(biāo).本方法在滿足一定檢測(cè)速度的前提下,有效地提高了模型的泛化性能,并能通過代價(jià)敏感性的方法有效地克服樣本數(shù)量及代價(jià)的不平衡所導(dǎo)致的檢測(cè)率不平衡問題.下面介紹BING快速目標(biāo)檢測(cè)算法的視覺機(jī)理和算法流程.
認(rèn)知心理學(xué)和神經(jīng)生物學(xué)的研究揭示人類在辨識(shí)目標(biāo)之前會(huì)有很強(qiáng)的感知目標(biāo)的能力.基于對(duì)人類反應(yīng)時(shí)間的觀察和生物學(xué)信號(hào)傳送時(shí)間的估計(jì),人類注意力理論認(rèn)為人類的視覺系統(tǒng)只詳細(xì)地處理觀察到圖像的部分區(qū)域,對(duì)其他的區(qū)域幾乎不作處理[7,8].這進(jìn)一步揭示了,在識(shí)別目標(biāo)之前,人類的視覺系統(tǒng)會(huì)有一個(gè)簡(jiǎn)單的目標(biāo)定位的過程.程明明根據(jù)這個(gè)視覺機(jī)理的啟發(fā),提出了一個(gè)簡(jiǎn)單有效的歸一化梯度特征來篩選目標(biāo).當(dāng)邊界封閉的目標(biāo)圖像被縮小到一個(gè)固定的尺寸后(例如,8× 8個(gè)像素的大小),歸一化梯度(NG)具有很大相關(guān)性.BING特征就是基于這一目標(biāo)視覺特征的相似性而被提出的[6].為學(xué)習(xí)到一個(gè)可以量化圖像的目標(biāo)得分的分類器,需要將目標(biāo)圖像和非目標(biāo)圖像縮放到8× 8的大小,之后將圖像的歸一化梯度拉成一個(gè)64維的向量來學(xué)習(xí)一個(gè)輸出目標(biāo)得分的SVM分類器.訓(xùn)練完分類器以后,對(duì)于未知的圖像,將它縮放后的歸一化梯度特征送入分類器就可以輸出圖像的目標(biāo)得分,根據(jù)得分就可以對(duì)圖像是否為目標(biāo)進(jìn)行判斷.更進(jìn)一步,程明明又提出了歸一化梯度特征的二進(jìn)制版本,稱之為二進(jìn)制歸一化梯度(BING).這種二進(jìn)制歸一化梯度特征的一個(gè)優(yōu)點(diǎn)是可以通過位運(yùn)算實(shí)現(xiàn)二進(jìn)制數(shù)值的卷積,能快速地計(jì)算圖像窗口的目標(biāo)得分,極大地提高計(jì)算速度.
目標(biāo)一般都是直立的,并有封閉的邊界和中心位置.當(dāng)將包含目標(biāo)的圖像窗口縮小成固定大小(8× 8)的時(shí)候,圖像窗口的歸一化梯度特征就變成了一個(gè)很好的能區(qū)分目標(biāo)的特征.歸一化梯度特征能夠很好地保持圖像封閉的邊界特征,可以用來區(qū)分目標(biāo)與非目標(biāo).首先輸入圖像被縮放到不同的量化尺寸,并計(jì)算每個(gè)縮放圖的歸一化梯度特征.這些不同大小的歸一化梯度特征圖中,一個(gè)8× 8窗口內(nèi)的數(shù)值就是對(duì)應(yīng)于該窗口圖像的維數(shù)為64的歸一化梯度特征(NG 特征).NG 特征具有以下優(yōu)點(diǎn):
(1)對(duì)目標(biāo)的位置、尺度、長(zhǎng)寬比具有很好的穩(wěn)定性,當(dāng)目標(biāo)發(fā)生移動(dòng)、縮放、長(zhǎng)寬比變化的時(shí)候,相應(yīng)的NG特征變化很小.
(2)計(jì)算效率高,有應(yīng)用于實(shí)時(shí)檢測(cè)和大規(guī)模圖像集目標(biāo)檢測(cè)的潛力.
圖1 目標(biāo)檢測(cè)濾波器
NG特征具有這些優(yōu)點(diǎn),但同時(shí)也會(huì)帶來目標(biāo)識(shí)別能力的下降,不過這可以通過后續(xù)的特定目標(biāo)檢測(cè)器來解決.用VOC2007數(shù)據(jù)集中標(biāo)定的目標(biāo)圖像的NG特征作為正樣本,隨機(jī)選擇的不包含目標(biāo)的圖像的NG特征作為負(fù)樣本,訓(xùn)練出的線性模型64ω∈? (可視化圖如圖1所示)即可用來篩選目標(biāo).
為了檢測(cè)出一副圖像中的目標(biāo)區(qū)域,我們需要按照預(yù)定義的量化窗口數(shù)(不同尺度和長(zhǎng)寬比的窗口)對(duì)圖像進(jìn)行掃描.用訓(xùn)練得到的模型 與掃描窗口的歸一化梯度特征進(jìn)行內(nèi)積即可求得該窗口的得分值
其中sl、gl、l、i、(x,y)分別表示得分值、NG特征、位置、尺度大小、窗口位置.
除此以外,對(duì)尺度大小為i的窗口通過一個(gè)線性模型校準(zhǔn)便可得到最后輸出值
其中vi和ti分別是尺度i的權(quán)重系數(shù)和偏置.雖然上述校準(zhǔn)步驟速度很快,但是僅在最后對(duì)篩選目標(biāo)進(jìn)行重排序的時(shí)候采用了這種校準(zhǔn)方法.
為進(jìn)一步提高檢測(cè)的速度,程明明通過采用數(shù)值的二值化近似,提出了一個(gè)NG特征的加速版,稱為二進(jìn)制歸一化梯度(BING)特征,用來加速特征提取和預(yù)測(cè)的過程.通過訓(xùn)練數(shù)據(jù)學(xué)習(xí)到的線性模型可以被近似地表示為一系列基的線性組合
其中Nω是基向量的數(shù)量,是一個(gè)基向量,βj∈?是相應(yīng)的系數(shù).進(jìn)一步,每個(gè)基向量可以用二進(jìn)制向量和它的補(bǔ)來表示:一個(gè)二進(jìn)制特征b可以通過按位與和位計(jì)數(shù)來與線性模型實(shí)現(xiàn)內(nèi)積操作,也就是獲得測(cè)試目標(biāo)得分的預(yù)測(cè)操作
這樣,關(guān)鍵的問題就是有效地計(jì)算 NG 特征的二進(jìn)制表示.每一個(gè) NG特征的元素都用一個(gè)字節(jié)來存貯,可以通過這個(gè)字節(jié)的前Ng個(gè)位來近似.因此,一個(gè)64維的 NG 特征可以用Ng個(gè)BING特征來近似表示
其中BING特征依據(jù)它們?cè)谧止?jié)中的比特位的不同具有不同權(quán)重.通常情況下,要獲取一個(gè)64維的BING特征需要遍歷 NG特征的 64個(gè)存儲(chǔ)位置,計(jì)算效率不高.通過總結(jié) BING特征的特性,程明明提出了BING特征的遞推算法,可以有效地計(jì)算提取BING特征矩陣.最后,一個(gè)對(duì)應(yīng)于BING特征為bk,l的圖像窗口的得分值可以通過
快速求得.可以發(fā)現(xiàn)上述目標(biāo)得分值能通過按位與和位1計(jì)數(shù)器快速獲得,這個(gè)操作極大地提高了檢測(cè)的速度,為后續(xù)處理提供了基礎(chǔ).
前面通過使用 BING特征和位操作實(shí)現(xiàn)了目標(biāo)的快速檢測(cè),下面需要根據(jù)檢測(cè)出的目標(biāo)進(jìn)行區(qū)域定位,通過區(qū)域定位減少后續(xù)目標(biāo)識(shí)別的搜索空間,為后面使用復(fù)雜特征或者采用強(qiáng)分類器的檢測(cè)方法奠定基礎(chǔ).
如圖 2所示,整個(gè)檢測(cè)過程包括三個(gè)部分:
(1)目標(biāo)篩選.將待選圖像進(jìn)行BING特征提取,利用學(xué)習(xí)到的目標(biāo)檢測(cè)模型和位操作進(jìn)行快速的目標(biāo)檢測(cè)和篩選,篩選出的目標(biāo)如圖 2中的頂部圖像中的矩形框所示(最外面的矩形框除外).
圖2 檢測(cè)算法流程圖
(2)區(qū)域定位.根據(jù)篩選到的目標(biāo)的位置,設(shè)計(jì)適當(dāng)?shù)乃惴▉矶ㄎ荒繕?biāo)區(qū)域,定位的目標(biāo)區(qū)域如圖 2中的頂部圖像中最外面的矩形框所示,這就大大降低了搜索空間.
(3)行人目標(biāo)檢測(cè).在定位區(qū)域內(nèi)利用訓(xùn)練出的二重間隔分布機(jī)進(jìn)行行人檢測(cè)獲得行人的尺度和位置.
其中目標(biāo)篩選檢測(cè)器的學(xué)習(xí)方法和檢測(cè)目標(biāo)的方法包含:
(1)目標(biāo)篩選檢測(cè)器學(xué)習(xí).通過將 VOC2007數(shù)據(jù)集中標(biāo)定的目標(biāo)作為正樣本,隨機(jī)選擇的非目標(biāo)圖像作為負(fù)樣本,用Liblinear算法學(xué)習(xí)得到目標(biāo)檢測(cè)器.
(2)檢測(cè)器的二進(jìn)制近似.根據(jù)式(3)可以求得近似目標(biāo)篩選檢測(cè)器,通常設(shè)置
(3)待檢圖像的BING特征提取.對(duì)待檢圖像進(jìn)行BING特征提取,通常設(shè)置
(4)目標(biāo)篩選.按照式(6)計(jì)算目標(biāo)的得分值,并將得分值進(jìn)行降序排列,通常 BING檢測(cè)出目標(biāo)數(shù)量為2000左右,設(shè)置適當(dāng)?shù)拈撝岛鸵?guī)則可以減少目標(biāo)數(shù)量.
完成目標(biāo)的檢測(cè)后,區(qū)域定位的方法通常有兩種:
(1)簡(jiǎn)單的區(qū)域合并法.
依據(jù)得分值選擇適當(dāng)比例的篩選目標(biāo),利用長(zhǎng)寬比進(jìn)行二次篩選和融合,可以得到數(shù)量較少的篩選目標(biāo).對(duì)這些目標(biāo)進(jìn)行區(qū)域合并,合并策略是取所有目標(biāo)的左側(cè)和上側(cè)坐標(biāo)的最小值作為目標(biāo)區(qū)域的左上坐標(biāo),右側(cè)和下側(cè)坐標(biāo)的最大值作為目標(biāo)區(qū)域的右下坐標(biāo).例如,最左上目標(biāo)的坐標(biāo)為右下目標(biāo)的坐標(biāo)為則合并區(qū)域的坐標(biāo)為
(2)區(qū)域生成法.
設(shè)Rk為第k個(gè)篩選目標(biāo)的位置,是每個(gè)篩選目標(biāo)位置像素的函數(shù)[9]:
其中篩選目標(biāo)的得分sk被歸一化到區(qū)間[0,1].對(duì)所有的篩選目標(biāo),定義每個(gè)像素出現(xiàn)的頻數(shù)為
其中K為篩選目標(biāo)的數(shù)目.再對(duì)S(i,j)選取閾值 進(jìn)行二值化,即
設(shè)測(cè)試圖像的分辨率大小為W×H,把B(i,j)的所有行進(jìn)行逐行累加,形成W維列向量U,其中第i行的累加方法為
將行累加向量U中的所有W個(gè)元素按由小到大的順序排序,將第ρW個(gè)元素的值設(shè)為ρ0,其中,比例系數(shù) ρ∈[0,1].并以ρ0為閾值對(duì)行累加向量U進(jìn)行二值化:
比例系數(shù) 可以控制定位區(qū)域的大小,需要根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行確定.同理,對(duì)B(i,j)逐列求和并二值化,得到H維行向量V.獲得B(i,j)的行累加和列累加后,可以通過計(jì)算M=U×V來定位目標(biāo)區(qū)域.
我們首先提取VOC2007數(shù)據(jù)集的BING特征來訓(xùn)練目標(biāo)篩選分類器,之后提取INRIA數(shù)據(jù)集的HOG特征來訓(xùn)練二重間隔分布機(jī)和代價(jià)敏感性二重間隔分布機(jī)用于進(jìn)行行人檢測(cè).
VOC2007圖像數(shù)據(jù)集一共包含9963幅圖像,含有20個(gè)視覺物體類別,分別屬于交通工具、家居用品、動(dòng)物、人類、車輛等,它是一個(gè)富有挑戰(zhàn)性的數(shù)據(jù)集,圖像場(chǎng)景豐富,涵蓋了室內(nèi)外場(chǎng)景以及尺度、視角、光照、姿態(tài)等顯著差異.除此以外,每幅圖像中物體類別的多類性及數(shù)目的不確定性都增加了視覺物體分類的難度,從而也相應(yīng)地增大了行人檢測(cè)的難度.本節(jié)中,我們利用 VOC2007數(shù)據(jù)集和文[6]中的方法來訓(xùn)練目標(biāo)篩選分類器.
圖 3為目標(biāo)篩選的召回率/窗口曲線圖.可以發(fā)現(xiàn),隨著窗口數(shù)的增多,召回率升高,當(dāng)窗口數(shù)增大到 100的時(shí)候,人的召回率可以達(dá)到 70%左右; 當(dāng)窗口數(shù)增大到400的時(shí)候,人的召回率可以達(dá)到85%左右.實(shí)驗(yàn)中,我們采用了BING中默認(rèn)的窗口數(shù),把檢測(cè)到的目標(biāo)按照得分值降序排列后,通過選取排名靠前的若干個(gè)目標(biāo)來完成目標(biāo)篩選和區(qū)域定位.例如,通過選取排名第 5~20的符合行人比例的目標(biāo)進(jìn)行簡(jiǎn)單的區(qū)域定位的結(jié)果如圖4所示.由圖4可以看出,通過這樣的簡(jiǎn)單區(qū)域合并,能顯著地減小后續(xù)目標(biāo)識(shí)別過程的搜索空間,特別是對(duì)背景簡(jiǎn)單圖片的效果更為明顯.
我們采用了INRIA行人數(shù)據(jù)集來訓(xùn)練二重間隔分布機(jī)和代價(jià)敏感性二重間隔分布機(jī).INRIA數(shù)據(jù)集包含 2416個(gè)96× 160大小的行人圖像,這些圖像剪切自很多包含人類活動(dòng)的照片,另外還包含原始的1218個(gè)不包含人的圖像.將行人圖像只保留4到67列和4到131行,剪切成64× 128大小,作為正樣本圖像,從 1218個(gè)不包含人的圖像集中的每個(gè)圖像上選取 10個(gè)64× 128大小的圖像塊作為負(fù)樣本圖像,總共有12180個(gè)負(fù)樣本圖像.測(cè)試圖像也是取自INRIA數(shù)據(jù)集,包含1126個(gè)64× 128大小的正測(cè)試圖像和 6090個(gè)64× 128大小的負(fù)測(cè)試圖像.獲得訓(xùn)練集和測(cè)試集圖像以后,分別提取它們的 HOG特征作為訓(xùn)練樣本和測(cè)試樣本,用來訓(xùn)練和測(cè)試二重間隔分布機(jī)和代價(jià)敏感性二重間隔分布機(jī).學(xué)習(xí)機(jī)中的參數(shù)通過五折交叉驗(yàn)證來確定,代價(jià)敏感參數(shù)需要根據(jù)正樣本的誤分類率和性能曲線確定.
圖3 召回率/窗口曲線圖
圖4 區(qū)域定位圖
圖5 代價(jià)敏感曲線
根據(jù)二重間隔分布機(jī)中均值間隔的代價(jià)敏感性[4],在對(duì)錯(cuò)分正樣本進(jìn)行再訓(xùn)練的過程中,如果正樣本的誤檢率達(dá)不到預(yù)期要求,可以通過代價(jià)敏感參數(shù)進(jìn)行調(diào)節(jié).如圖5所示,TrainAcc 表示在訓(xùn)練集上的 Acc(準(zhǔn)確率)曲線,TestAcc 表示在測(cè)試集上的 Acc 曲線,其他的曲線標(biāo)注也是類似的,TPR是行人樣本的檢測(cè)率,TNR是非行人樣本的檢測(cè)率,G-mean是 TPR和 TNR的幾何平均數(shù),橫坐標(biāo)是代價(jià)敏感參數(shù),縱坐標(biāo)是各個(gè)評(píng)價(jià)指標(biāo)的取值.在區(qū)間[1,16](代價(jià)敏感參數(shù)的真實(shí)值為 20.3×(p-1))上,隨著代價(jià)敏感參數(shù)的增大,TPR曲線呈波動(dòng)上升趨勢(shì),TNR曲線呈波動(dòng)緩慢下降趨勢(shì),整體的準(zhǔn)確率變化不大.如果超出了這個(gè)區(qū)間,代價(jià)敏感參數(shù)繼續(xù)增大,TNR曲線急速下降,TPR曲線緩慢上升,整體準(zhǔn)確率將會(huì)大幅度下降.在代價(jià)敏感參數(shù)的變化過程中,三條曲線在p=16附近相交,這說明了在該點(diǎn)附近檢測(cè)性能達(dá)到一個(gè)平衡狀態(tài),即該點(diǎn)為平衡點(diǎn).當(dāng)反復(fù)訓(xùn)練達(dá)不到指定的正樣本檢測(cè)率時(shí),可以通過調(diào)整檢測(cè)模型的代價(jià)敏感參數(shù)來提高正樣本的檢測(cè)率.在實(shí)驗(yàn)過程中,默認(rèn)的檢測(cè)模型采用平衡點(diǎn)的值作為代價(jià)敏感參數(shù).
通過 BING框架完成目標(biāo)篩選和區(qū)域定位后,可以使用學(xué)習(xí)到的代價(jià)敏感性二重間隔分布機(jī)來進(jìn)行行人檢測(cè),經(jīng)過非最大值抑制后,得到最終的檢測(cè)結(jié)果如圖6所示.
從圖 2所示的目標(biāo)檢測(cè)流程可以看出,在BING+DDM 的目標(biāo)檢測(cè)框架中,掃描的圖像像素?cái)?shù)量約為原圖像像素的一半.在多尺度檢測(cè)條件下,滑動(dòng)窗分類器的規(guī)模和窗口的數(shù)量與圖像像素呈線性關(guān)系,所以檢測(cè)器檢測(cè)目標(biāo)的速度提高了一倍左右.考慮到目標(biāo)篩選和區(qū)域定位所花費(fèi)的少量時(shí)間,最終的平均識(shí)別速度約提高了 0.7倍,后續(xù)可以通過多線程以及并行計(jì)算的方法來進(jìn)一步提升檢測(cè)速度,滿足實(shí)際應(yīng)用的實(shí)時(shí)性需求.
圖6 檢測(cè)結(jié)果
本文采用了BING特征和位操作實(shí)現(xiàn)卷積的方法來加速行人檢測(cè)的過程.BING特征是梯度特征的一個(gè)二進(jìn)制近似,將學(xué)習(xí)到的目標(biāo)檢測(cè)器也進(jìn)行二進(jìn)制近似,這樣二進(jìn)制特征與分類器的內(nèi)積計(jì)算就可以通過位運(yùn)算實(shí)來現(xiàn),能快速地計(jì)算出一副圖像中候選目標(biāo)的位置及其得分值.通過對(duì)部分篩選出的目標(biāo)進(jìn)行區(qū)域合并,可以快速地獲得行人目標(biāo)的區(qū)域定位,進(jìn)而減少后續(xù)行人檢測(cè)的搜索空間,提高了行人檢測(cè)的效率和速度.在最后的行人檢測(cè)過程中,引入了二重間隔分布機(jī)來提高檢測(cè)器的泛化性能,更進(jìn)一步,針對(duì)行人樣本的間隔分布和檢測(cè)率的不平衡問題,采用了代價(jià)敏感性二重間隔分布來進(jìn)一步提高檢測(cè)器的平衡性和穩(wěn)定性.實(shí)驗(yàn)結(jié)果表明,利用BING特征進(jìn)行目標(biāo)篩選和區(qū)域定位可以有效地提高后續(xù)二重間隔分布機(jī)的檢測(cè)速度和效率,二重間隔分布機(jī)的引入也提高了檢測(cè)器的泛化性能和均衡性.
[1]Dollár P,Wojek C,Schiele B,et al.Pedestrian detection: an evaluation of the state of the art.[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2012,34(4): 743~761
[2]Dalal N,Triggs B.Histograms of oriented gradients for human detection[J].Computer Vision and Pattern Recognition,2005(1): 886~893
[3]Vapnik,Vladimir N.The nature of statistical learning theory[J].IEEE Transactions on Neural Networks,1995,8(6):988~999
[4]Cheng F,Zhang J,Li Z,et al.Double distribution support vector machine[J].Pattern Recognition Letters,2017,88: 20~25
[5]Uijlings J R,Sande K E,Gevers T,et al.Selective Search for Object Recognition[J].International Journal of Computer Vision,2013,104(2):154~171
[6]Cheng M M,Zhang Z,Lin W Y,et al.BING: Binarized Normed Gradients for Objectness Estimation at 300fps[C].IEEE Conference on Computer Vision and Pattern Recognition.IEEE Computer Society,2014: 3286~3293
[7]Mangun G R.Neural mechanisms of visual selective attention[J].Psychophysiology,1995,32(1): 4
[8]Wolfe J M,Horowitz T S.What attributes guide the deployment of visual attention and how do they do it?[J].Nature Reviews Neuroscience,2004,5(6):495
[9]劉 濤,吳澤民,姜青竹,等.基于似物性的快速視覺目標(biāo)識(shí)別算法[J].計(jì)算機(jī)科學(xué),2016,43(7): 73~76
Pedestrian Detection based on Fast Region Location and Double Distribution Support Vector Machine
CHENG Fanyong,LUO Haibo,RUAN Zhiqiang
(Fujian Provincial Key Laboratory of Information Processing and Intelligent Control,Minjiang University,Fuzhou 350108,China)
In order to quickly and cost-sensitively detect pedestrian,this paper designed pedestrian detection model based on BING and Double Distribution Support Vector Machine (DDM).Based on objectiveness proposals from BING feature,heuristic region location algorithm was proposed.The region including pedestrian can be obtained by objectness select and region location algorithm.Region location effectively reduced the search space of DDM,therefore DDM only scan the location region to detect pedestrian to obtain detection result and position.Region location improves the efficiency and speed of pedestrian detection.
fast detection,region location,pedestrian detection
TP391.4 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1672-5298(2017)02-0027-06
2017-02-10
福建省重點(diǎn)實(shí)驗(yàn)室開放課題(MJUKF201737); 閩江學(xué)院教改項(xiàng)目(MJW201142103,MJW201122064); 閩江學(xué)院育苗項(xiàng)目(YKY13007);福建省科技廳項(xiàng)目(2017H0029); 國(guó)家自然科學(xué)基金面上項(xiàng)目(61672216)
程凡永(1982- ),男,山東沂水人,博士,閩江學(xué)院講師.主要研究方向: 圖像處理與模式識(shí)別
湖南理工學(xué)院學(xué)報(bào)(自然科學(xué)版)2017年2期