高 華,鄔春學,魯 俊
(上海理工大學 光電信息與計算機工程學院,上海 200093)
?
基于動態(tài)加權(quán)可變形部件模型的行人檢測
高華,鄔春學,魯俊
(上海理工大學 光電信息與計算機工程學院,上海 200093)
近年來具有代表性的工作之一是Felzenszwalb等人提出的可變形部件模型。文中從可變形部件模型中存在的一些問題展開討論,并提出了一種基于動態(tài)加權(quán)可變形部件模型的行人檢測算法。在各個部件的檢測中使用動態(tài)調(diào)整權(quán)值的方法獲得更加準確的判斷,從而識別處于復雜環(huán)境中的行人。實驗結(jié)果表明,該方法能夠有效識別復雜環(huán)境中傳統(tǒng)DPM方法難以識別的行人。
行人檢測;可變形部件模型;動態(tài)加權(quán)
行人檢測技術(shù)是模式識別與計算機視覺中的一個重要課題,其在安防系統(tǒng)、人體行為理解、行人運動分析等領(lǐng)域均有重要應(yīng)用。隨著計算機視覺的發(fā)展,行人檢測技術(shù)已經(jīng)有了較大的進步,從特征提取到分類和定位方面均有多個研究分支。其中,DPM(Deformable Part Model)[1]是布朗大學的Felzenszwalb等人在2010年提出的基于部件的物體檢測算法,目前已成為檢測效果較為出色的幾種算法之一。DPM考慮物體是由多個部分組成的,因此由部件和整體的組合能夠更好的描述一個物體,設(shè)計了根濾波器和部件濾波器來分別從整體和局部檢測物體的特征,最后將根和部件進行整合表征整個物體。
自2005年以來,行人檢測方面的研究發(fā)展迅速[2]。Dalal等人[3]在2005年提出一種HOG(Histograms of Oriented Gradients, 梯度方向直方圖)+SVM(Support Vector Machine, 支持向量機)的行人檢測算法,該算法計算了行人整體的HOG特征,組成高維數(shù)據(jù)使用SVM進行訓練分類,以達到較高的檢測精度,但該方法是基于整體的特征,對于身體形狀變化較大的行人檢測精度并不理想;另外也有基于SIFT特征[4]和Haar小波特征[5]的行人檢測方法,也取得了良好的效果;X Ren等人[6]針對HOG中紋理和邊緣等特性的利用不充分的問題,提出了一種基于稀疏編碼直方圖的行人檢測,在特征提取上進行了改進,使得目標檢測識別效果有了一定改善;近年來基于神經(jīng)網(wǎng)絡(luò)和深度學習的行人檢測發(fā)展迅速,NVIDIA公司使用GPU進行深度學習[7],已達到較高的檢測精度的實時處理要求。
在行人被遮擋時的檢測方面,Tang S等人[8]于2014年發(fā)表了一篇檢測行人間重疊的檢測算法,該算法基于可變形部件特性,訓練了重疊行人的檢測模型,能較好地檢測到兩人重疊時被遮擋的行人;Hsiao E等人[9]也在此基礎(chǔ)上設(shè)計了檢測方法,能檢測重疊的行人和物體。
DPM中使用的各個部件權(quán)值穩(wěn)定,這就導致行人被人或物體遮擋和行人處于復雜背景下時,由于整體濾波響應(yīng)值不高,所以行人容易被忽略。本文在此問題上設(shè)計了一種動態(tài)加權(quán)算法,可在只檢測出行人一部分部位的情況下進行加權(quán)組合,得到理想的最終分數(shù),獲知其較準確的位置。
2.1可變形部件模型
可變形部件模型定義了一個模糊的根濾波器和若干個更高分辨率下的部件濾波器,假設(shè)F是大小為w′h的濾波器。首先對圖像縮放并計算HOG特征,構(gòu)建圖像特征金字塔H,p=(x,y,l)表示特征金字塔中l(wèi)層圖像特征的(x,y)位置的特征元素,f(H,p,w,h)表示在特征金字塔H中以p處特征元素為左上角、大小為w′h的檢測窗口所有特征向量串聯(lián)起來的高維特征。則濾波器在此檢測窗口的得分可表示為F×f(H,p,w,h),文中可使用F×f(H,p)來表示此得分,因F中已隱含w和h兩個值。
物體的檢測綜合得分為根濾波器和若干部件濾波器得分之和,再減去各個部件經(jīng)過形變的懲罰分數(shù),表示為
(1)
其中,di是一個四維向量,指定了變形代價;fd(dx,dy)=(dx,dy,dx2,dy2)是變形特征;b為偏移量。
2.2部件動態(tài)加權(quán)可變形部件模型
在可變形部件模型中,部件的權(quán)值在使用分類器訓練時就已確定,并隱含在濾波器中。由于行人最后的總體得分是根和部件的簡單疊加,這就導致行人檢測過程中的最終得分依賴于全部的部件濾波器,在行人的身體部分被遮擋或只有半身露出時獲得的分數(shù)并不高,因此易被漏檢。
圖1 DPM漏檢情況
實驗發(fā)現(xiàn),DPM在正面人體檢測中獲得較好的檢測結(jié)果時,一般是在身體部位全部或者絕大部分檢測出來的情況下。這就使得被遮擋時行人部分部件得分削減嚴重,最后的得分較低。為解決這一問題,本文將動態(tài)調(diào)整部件的權(quán)重,使得被有效檢測出的部件能更多的貢獻綜合得分。
基于部件動態(tài)加權(quán)的可變形部件模型定義了可變的權(quán)重W=(w1,…,wn),在部件獲得較高的檢測分數(shù)的情況下調(diào)整部件的權(quán)重使得行人的最終檢測分數(shù)提高。根和部件的得分可表示為n+1元組S=(s0,s1,…,sn),其中s0為根的得分,s1,…,sn分別為n個部件經(jīng)過形變懲罰后得分。W的動態(tài)調(diào)整過程表示為
(2)
通過分類器檢測訓練樣本中的正樣本和負樣本得到部件的閾值T,設(shè)定部件得分超過閾值的數(shù)目>2來判定是否調(diào)整閾值,是為了避免單個部件對行人檢測起到?jīng)Q定性作用。如一個與行人頭部類似的物體得分較高,有可能會使其權(quán)重為1,將大幅提高誤檢率。各個部件調(diào)整后的權(quán)重為其得分在所有部件得分中的比重,是基于重要部件得分較高,因此更能夠起到?jīng)Q定作用的事實。
采用部件動態(tài)加權(quán)的可變形部件模型更好的突出了行人的部件特征,當行人的部件檢測結(jié)果較為理想的情況下,增加其權(quán)值使行人檢測總體結(jié)果更加可信。
實驗采用的環(huán)境為Intel(R)Core(TM)i3-4150雙核處理器,4GB內(nèi)存,Windows7 64Byte旗艦版。算法使用GRAZ_01數(shù)據(jù)集[10]中的部分正常行人和行人被遮擋的圖像進行行人檢測。
實驗證明,在行人之間相互遮擋和行人被物體所遮擋的情況下,均能較好的識別被遮擋行人。
在行人遮擋嚴重,如圖2(a)中右二行人的情況下,由于部件檢測得分多數(shù)不理想,所以無法采用調(diào)整權(quán)值的方式進行檢測,最終導致行人漏檢。
通過調(diào)整閾值的方法在GRAZ_01數(shù)據(jù)集[10]上進行準確率與召回率測試,分別采用DPM和本文方法進行行人檢測,測試所得準確率與召回率曲線如圖3所示。實驗表明,使用本方法在保證召回率的情況下有較高的準確率。
圖2 檢測結(jié)果對比
圖3 準確率與召回率曲線
本文對DPM算法的檢測過程做了簡要分析,提出可變形部件模型在行人被部分遮擋情況下存在的問題:行人被遮擋時整體得分會有一定損失,加之被遮擋部件檢測分數(shù)較低,導致行人整體得分被削減,造成行人漏檢的情況。針對此問題提出一種部件權(quán)值動態(tài)調(diào)整方法,將得分高于閾值的部件權(quán)值提高,以提高被部分遮擋行人的檢測整體得分。由于人體的部件特征是較整體特征更加細致的表達,所以,高可信度的部件本身也就在一定程度上代表了高可信度的行人整體,使用增加權(quán)值的方法更加符合人體視覺的工作原理。實驗證明本文方法能有效檢測出被遮擋情況下的行人。
由于行人整體得分一般較部件得分更高,所以在一些行人被物體遮擋嚴重的情況下,雖使用本方法能提高得分,但并不能彌補整體檢測分數(shù)的不足,在這種條件下如何有效的檢測出行人,還有待進一步研究。
[1]FelzenszwalbPF,GirshickRB,McAllesterD,etal.Objectdetectionwithdiscriminativelytrainedpart-basedmodels[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2010,32(9):1627-1645.
[2]DollarP,WojekC,SchieleB,etal.Pedestriandetection:Anevaluationofthestateoftheart[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2012,34(4):743-761.
[3]DalalN,TriggsB.Histogramsoforientedgradientsforhumandetection[C].IEEEComputerSocietyConferenceonComputerVisionandPatternRecognition,2005.
[4]LoweDG.Distinctiveimagefeaturesfromscale-invariantkeypoints[J].InternationalJournalofComputerVision,2004,60(2):91-110.
[5]ViolaP,JonesMJ,SnowD.Detectingpedestriansusingpatternsofmotionandappearance[J].InternationalJournalofComputerVision,2005,63(2):153-161.
[6]RenX,RamananD.Histogramsofsparsecodesforobjectdetection[C].Penna:2013IEEEConferenceonComputerVisionandPatternRecognition(CVPR),2013.
[7]NVIDIA.GPUs-theengineofdeeplearning[EB/OL]. (2009-12-23)[2015-11-11].https://developer.nvidia.com/deep-learning.
[8]TangS,AndrilukaM,SchieleB.Detectionandtrackingofoccludedpeople[J].InternationalJournalofComputerVision,2014,110(1):58-69.
[9]HsiaoE,HebertM.Occlusionreasoningforobjectdetectionunderarbitraryviewpoint[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2014, 36(9):1803-1815.
[10]FusseneggerM,OpeltA,PinzA,etal.Objectrecognitionusingsegmentationforfeaturedetection[C].London:Proceedingsofthe17thInternationalConferenceonPatternRecognition, 2004.
Pedestrian Detection Based on Deformable Part Model with Dynamic Weights Adjustment
GAO Hua, WU Chunxue, LU Jun
(School of Optical-Electronic and Computer Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China)
Pedestrian detection is an active research in computer vision. One of the representative works in pedestrian detection in recent years is the deformable part model (DPM). In this paper we discuss the disadvantages in DPM, and propose a new method based on the dynamic weight adjustment in DPM. The weight of the parts in DPM is adjusted dynamically to obtain more reliable results for identifying pedestrians in complex environments. Experiments show that this method can identify pedestrian more effective than the traditional DPM in complex environments.
pedestrian detection; deformable part model; dynamic weights adjustment
2015- 12- 15
國家自然科學基金資助項目(61202376);上海市教育基金會晨光計劃項目(10CG49);上海市教委科研創(chuàng)新項目(13YZ075)
高華(1989-),女,碩士研究生。研究方向:數(shù)字圖像處理。鄔春學(1964-),男,博士,教授。研究方向:物聯(lián)網(wǎng)與計算機控制技術(shù)。
10.16180/j.cnki.issn1007-7820.2016.09.001
TP391.41
A
1007-7820(2016)09-001-03