李玲,王江濤
?
基于分步降維HOG-LBP特征的行人頭部分類算法
李玲,王江濤
(淮北師范大學 物理與電子信息學院,安徽 淮北 235000)
傳統(tǒng)的基于PCA-HOG特征的行人頭部分類算法存在降維后的子空間鑒別性不足的問題.為此,提出一種基于分步降維HOG-LBP特征的行人頭部分類算法.首先,利用樣本類別標簽構(gòu)建2類樣本的HOG特征集合,在這2類特征集合中分別執(zhí)行PCA降維,然后將所得的特征與LBP紋理特征進行級聯(lián)得到最終的頭部描述算子,最后通過訓練SVM分類器對實際樣本集進行分類.實驗結(jié)果表明,與傳統(tǒng)PCA降維方法相比,該方法可有效提高行人頭部的分類性能.
HOG;LBP;PCA;頭部檢測
一直以來,行人檢測都是模式識別與計算機視覺領(lǐng)域的研究熱點,而頭部作為行人的重要局部特征,對正確檢測出行人起到重要的作用.
近年來,眾多研究人員提出多種不同的特征表達方法來進行行人檢測,其中應(yīng)用最廣泛的是2005年由Dalal和Triggs提出的方向梯度直方圖(HOG)描述算子[1].該算子通過統(tǒng)計局部區(qū)域內(nèi)的梯度方向分布來表達圖像中目標的外形輪廓,目前已被廣泛地應(yīng)用在圖像處理與計算機視覺領(lǐng)域中[2-7].隨著研究的不斷深入,與HOG融合的特征算法相繼出現(xiàn),文獻[8]提出將局部HOG特征與Haar特征級聯(lián)起來對行人進行分類的方法.盡管HOG得到廣泛的關(guān)注,但是存在特征維數(shù)高的缺點,導致訓練分類器性能欠佳.除了HOG特征外,LBP特征是當前的另外一種流行特征描述算子,它可對局部目標的紋理特征進行有效表達,且已被廣泛用于車牌識別及文字識別等領(lǐng)域.Ahonen[9]等人將LBP特征應(yīng)用于人臉識別且取得了良好的效果.而文獻[10]則給出一種方向梯度直方圖與紋理特征融合的方法來解決圖像檢索問題,此方法取得了較單一的特征更好的檢索性能.
本文設(shè)計了一種將HOG特征和LBP特征相級聯(lián)的行人頭部特征表達方法.在構(gòu)建HOG特征時,分別建立正負樣本的HOG特征集合,通過分步地在2個特征集合上進行PCA處理得到降維子空間.將降維后的HOG特征與相對應(yīng)的LBP特征進行級聯(lián)構(gòu)建行人頭部描述算子,最后通過SVM訓練分類器實現(xiàn)人體頭部分類.實驗表明,所設(shè)計的描述算子可以顯著提高行人頭部檢測性能.
1特征的相關(guān)描述
1.1HOG特征
一般來說,邊緣方向分布或者梯度方向分布可以很好地表征局部目標的輪廓和形狀.基于此,Dalal 和Triggs提出了HOG描述算子來對物體進行表達,并取得了優(yōu)異的效果.對待檢測圖像進行HOG特征構(gòu)建的步驟大致如下:
(1)如果待測圖像不是灰度圖像,則先對其進行灰度化處理;
(2)計算圖像每個像素的梯度(包括大小和方向),位于像素點的梯度可以表達為
(3)將圖像劃分成多個小塊cells;
1.2LBP特征
局部二值模式(Local Binary Patter,LBP)主要用來描述圖像的局部紋理特征模式,它具有灰度不變性和旋轉(zhuǎn)不變性等顯著優(yōu)點.目前,LBP特征已被廣泛應(yīng)用到車牌識別、人臉識別和指紋識別等領(lǐng)域.
傳統(tǒng)的LBP特征構(gòu)建過程(見圖1):首先設(shè)定一個固定大小33的鄰域窗口,令窗口的中心像素點的值為閾值,然后將其周圍的8個像素點的值與其進行比較.如果周圍像素值大于閾值則令其為1,否則為0,最后根據(jù)比較結(jié)果可以得到一個8bit無符號數(shù),該無符號數(shù)即中心像素點的LBP編碼值.
圖1 提取LBP特征
由圖1可見,像素點最終可以用一串二進制序列表示為(01001100)2=76,即中心像素點的LBP編碼值,對圖像每個像素點求LBP特征值,最后統(tǒng)計所有編碼值的直方圖即可得到LBP特征.
2分步降維HOG-LBP級聯(lián)特征的構(gòu)建
2.1分步降維HOG
在使用HOG特征時,其面臨著特征維數(shù)多、計算量大,導致訓練分類器復(fù)雜度高的問題.對于此問題,常采用PCA算法來對HOG特征降維.PCA是一種當前應(yīng)用最廣泛的無監(jiān)督降維方法,其核心思想是保留最新信息量的同時將高維數(shù)據(jù)投影到一個低維空間.PCA降維的步驟如下:
(7)
(8)
(9)
(11)
(4)將訓練樣本在新的特征空間投影
(12)
PCA可以很好地保留樣本特征間的共性信息,但由于其無監(jiān)督特性,沒有考慮異類樣本間的鑒別性.因此,采用PCA得到的降維空間不能保證異類樣本在該空間中的鑒別性.
為了克服該問題,與傳統(tǒng)的PCA降維方法不同,本文采用不對正負樣本整體執(zhí)行PCA降維,而是分別在正負樣本集合內(nèi)進行2次PCA降維的策略.對于正樣本集合來說,在該集合進行PCA降維得到正樣本間最具共性的特征,當負樣本投影到該空間時,其將保持與正樣本間的鑒別性.同樣的,在負樣本集合內(nèi)部進行PCA降維時,將得到負樣本間最具共性的低維信息;當正樣本投影到該空間時,將保持與負樣本間的鑒別性.
經(jīng)過處理后,可以得到2個投影子空間,分別為S1={d11,d12,d13,...,d1},S2={d21,d22,d23,...,d2},將2個子空間進行連接得到一個新的特征空間S={ d11,d12,d13,...,d1,d21,d22,d23,...,d2},對于待分類的樣本在這個特征空間進行投影,最終得到分步降維后的HOG特征(見圖2).
圖2 分步降維HOG-LBP級聯(lián)特征的構(gòu)建
2.2HOG-LBP級聯(lián)特征
在對目標圖像進行特征表達時,不同的特征之間往往是互補的,采用多特征可以進一步地提高檢測的魯棒性.LBP特征作為一種紋理描述算子,在目標檢測中已顯示出優(yōu)良的性能.將降維后的HOG特征與LBP特征結(jié)合,可以在得到方向梯度信息的基礎(chǔ)上獲取頭部的紋理信息L={d31,d32,d33,...,d3},從而提高在復(fù)雜背景中人體頭部檢測率.以此為出發(fā)點,本文采用將分步降維后HOG特征和LBP特征級聯(lián)的方法來構(gòu)建頭部圖像描述算子E={ d11,d12,d13,...,d1,d21,d22,d23,...,d2,d31,d32,d33,...,d3},這種方法不僅有效地降低了HOG的大量冗余信息,實現(xiàn)信息有效壓縮,而且考慮了特征的多樣性.
分步降維HOG-LBP級聯(lián)特征的構(gòu)建過程見圖2,正負樣本分別進行降維得到2個特征空間,二者結(jié)合構(gòu)成新的特征再與LBP特征級聯(lián),最后將所得特征與樣本標簽一起經(jīng)SVM訓練得到人頭分類器.當給定一待分類樣本,將其特征送入分類器即可得到分類結(jié)果.
3實驗及分析
通過對現(xiàn)實場合下采集的樣本圖像進行分類實驗,來評估HOG-LBP級聯(lián)特征的性能.為驗證該方法的有效性,將該方法在配置為intel處理器,CPU主頻為3.40 GHz,RAM為4.00 G的機器上采用MATLAB平臺編寫算法.實驗中所用的樣本取自某公交車監(jiān)控圖像序列,正樣本集合通過手工截取人體頭部圖像來獲得,而負樣本圖像則為在沒有行人的圖像中隨機截取構(gòu)建.訓練樣本中包括500張正樣本(人體頭部模型),3 500張負樣本(非人體頭部模型),而測試樣本包括60張正樣本,245張負樣本.部分正負樣本示例見圖3,為簡化計算將所有樣本大小歸一化為64×64.
圖3 部分正負樣本
在構(gòu)建HOG特征時,采用如下參數(shù)設(shè)置:每個cell的大小設(shè)為8×8,每個cell梯度方向為9,滑動步長為8,2×2個cell構(gòu)成一個Block,從而每個Block特征維數(shù)為36維,最終得到HOG特征維數(shù)為1 764.
在對HOG特征進行降維時,令正樣本集合所得投影空間維數(shù)為維,負樣本集合所得投影空間維數(shù)為,則最后得到的分步降維HOG特征維數(shù)為.
在計算樣本圖像的LBP特征時,采用分塊均勻模式LBP特征(Uniform LBP)構(gòu)建方法,通過該方法對任一局部區(qū)域可以得到一個59維的特征向量.將樣本圖像分成個局部區(qū)域,則總的LBP特征維數(shù)為
(13)
采用2.2中所給出的方法,將降維后的HOG特征與LBP特征相級聯(lián)集合得到樣本圖像的描述特征E,其維數(shù)為,得到每個樣本的級聯(lián)特征后即可訓練SVM分類器進行分類決策.
鑒于SVM分類器的優(yōu)異性能,實驗中采用SVM分類器來對測試樣本進行分類,SVM分類器采用的核函數(shù)為徑向基函數(shù).為了能對不同特征的分類性能進行對比,實驗中分別使用傳統(tǒng)的PCA降維后的HOG特征和LBP特征,這2種特征的級聯(lián)特征以及本文所提出特征進行分類實驗.分類結(jié)果見表1.
表1 不同特征組合下的性能分類比較 %
表1給出了各種分類器對測試樣本的正確分類率,其中特征維數(shù)的選取根據(jù)主成份所占能量比來確定.由正確分類率數(shù)值可以看出,隨著選取特征主成份所占能量比的不斷增大,傳統(tǒng)的PCA-HOG和LBP分類準確率保持穩(wěn)定的水平,當兩者進行特征級聯(lián)后,分類正確率隨著能量比的增大逐漸提高,當達到總能量的95%時,分類精度最高.在4種特征表達方法中,本文的方法取得了最高的正確分類率.實驗結(jié)果表明,采用分步降維HOG-LBP級聯(lián)特征可以有效地提高頭部圖像的特征表達性能.
4結(jié)束語
在注意到傳統(tǒng)的PCA降維方法沒有考慮樣本標簽信息的基礎(chǔ)上,本文提出一種分別在正負樣本集合內(nèi)對HOG特征進行降維的方法,以提高降維后特征的鑒別性能.該方法將分步降維后的HOG特征與LBP特征相級聯(lián)得到樣本圖像的特征描述子.對實際場合中的樣本采用SVM分類器進行分類的結(jié)果表明,所設(shè)計的特征描述算子可以進一步提高特征表達性能.
[1] Dala N,Triggs B.Histograms of oriented gradients for human detection[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition.San diega IEEE,2005:886-893
[2] Ninomiya H,Ohki H,Gyohten K.An evaluation on robustness and brittleness of HOG feature of human detection [C]// 17thKorea-Japan Joint Workshop on Frontiers of Computer Vision.Ulsan IEEE,2011
[3] 顧炯,趙曙光,王宏斌.基于Joint HOG特征復(fù)雜場景下的頭肩檢測[J].電子設(shè)計工程,2012,20(7):58-62
[4] 孫麗娟,張立材.基于邊緣梯度方向直方圖的靜態(tài)手語識別[J].微電子學與計算機,2010(3):148-150
[5] 李林,張麗紅.基于改進梯度方向直方圖的多尺度的行人檢測[J].計算機應(yīng)用,2013,32(A2):168-170
[6] 劉威,段成偉,遇冰,等.基于后驗 HOG 特征的多姿態(tài)行人檢測[J].電子學報,2015,43(2):217-224
[7] 李星,郭曉松,郭君斌.基于HOG特征和SVM的前向車輛識別方法[J].計算機科學,2013,40(11A):329-332
[8] Geismann P,Schneider G.A two-staged approach to vision-based pedestrian recognition using Haar and HOG features[C]// IEEE Intelligent Vehicles Symposium.IEEE,2008:554-559
[9] Ahonen T,Hadid A,Pietikinen M.Face Description with Local Binary Patterns:Application to Face Recognition[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2006,28(12):2037-2041
[10] Yu J,Qin Z C,Wan T,et al.Feature integration analysis of bag-of-features for image retrieval[J].Neurocomputing,2013,120(23):355-364
Pedestrian head classification algorithm with two-step dimension reduction HOG- LBP feature
LI Ling,WANG Jiang-tao
(School of Physical and Electronic Information,Huaibei Normal University,Huaibei 235000,China)
Traditional pedestrian head classification algorithm based on PCA-HOG feature has the problem of degradation of the discrimination in the subspace.In order to handle this problem,the pedestrian head classification is completed based on the proposed two-step dimension reduction HOG- LBP feature.Firstly,two category of HOG sample set are obtained according to the sample labels.The PCA algorithm is carried out on each sample set step by step.Then the LBP texture features are combined with the dimension reduced HOG feature to form the final head descriptor.Lastly,experiments were performed by SVM classifier on practical test samples,and the experimental results show that,comparing with the traditional PCA algorithm,the presented HOG-LBP features can effectively improve the classification performance of pedestrian head.
HOG;LBP;PCA;head detection
1007-9831(2016)07-0029-05
TP391.41
A
10.3969/j.issn.1007-9831.2016.07.008
2016-05-17
國家自然科學基金資助項目(61203272);安徽省高校優(yōu)秀青年人才支持計劃重點項目(gxyqZD2016113);安徽省自然科學基金項目(1508085MF116);淮北師范大學教學研究項目(jy15128)
李玲(1992-),女,安徽滁州人,在讀碩士研究生,從事圖像處理、模式識別方面的研究.E-mail:1784656698@qq.com
王江濤(1979-),男,山東濰坊人,副教授,博士,從事視頻處理、計算機視覺方面的研究.E-mail:jiangtaoking@126.com