胡 杰,劉志成,楊慧萍,李澤西
(武漢理工大學 汽車工程學院,湖北 武漢 430070)
基于Harr-NMF特征的車輛檢測算法研究
胡 杰,劉志成,楊慧萍,李澤西
(武漢理工大學 汽車工程學院,湖北 武漢 430070)
為了提高車輛檢測的準確率和效率,為智能交通系統(tǒng)提供可靠的參考信息,針對傳統(tǒng)Harr特征車輛檢測算法存在特征向量維數(shù)過大、訓練時間過長的問題,提出采用非負矩陣分解Harr特征得到低維的Harr-NMF特征,對Harr-NMF特征分類并由Adaboost算法訓練得到基于Harr-NMF特征的車輛分類器,對車身進行有效識別。針對實車測試時出現(xiàn)的重復檢測、錯誤檢測等問題,進一步優(yōu)化了算法。測試結果表明,改進后的算法提高了車輛檢測率并有效降低了誤檢率。
智能交通;車輛檢測;Harr-NMF特征;Adaboost算法
為緩解日益嚴重的交通壓力,加強道路監(jiān)控,智能交通受到越來越多的重視。智能交通以視頻采集到的圖像為分析對象,通過對視頻中特定區(qū)域的圖像進行分析得到道路交通信息。然而無論是對道路的車流量、車型、道路擁堵狀況的預估,還是將采集到的信息給駕駛員作駕駛預判等,都離不開對道路車輛的檢測[1]。
車輛檢測作為目標檢測的一個分支研究領域,不斷涌現(xiàn)出了新的研究方法。文獻[2]提出利用幀差法提取視頻中不同的幀序列進行對比,這種方法的原理簡單、計算量小,但受周圍環(huán)境因素影響較大、對噪聲敏感,魯棒性不強。文獻[3]提出光流法進行檢測,這種方法對噪聲的敏感較低,但計算量較大,實時性差。近年來,隨著機器學習的發(fā)展,目前車輛檢測系統(tǒng)一般分為外觀特征提取和分類學習兩部分,常用的外觀特征有Harr特征[4]、形狀特征[5]、顏色特征[6]以及方向梯度直方圖(Histograms of Oriented Gradient,HOG)[7]等。常用的分類方法有人工神經(jīng)網(wǎng)絡(Neural Network,NN)[8]、聚類算法(如k-means算法)[9]以及集成算法(如Adaboost集成學習)[10]。
本文重點研究在于基于傳統(tǒng)Harr特征,提出利用非負矩陣分解Harr特征進行降維(Harr-NMF)[11],提取訓練樣本的Harr-NMF特征得到基于車身特征的弱分類器,并由AdaBoost訓練,加權將弱分類器構造為強分類器,級聯(lián)得到24×24的汽車車身分類器。針對分類器所產(chǎn)生的錯誤檢測進行噪聲消除,對產(chǎn)生的重復檢測進行重復性判定。實驗表明,經(jīng)過降維的Harr特征訓練時間要明顯比傳統(tǒng)的Harr特征訓練時間短。對分類器進行有效的重檢、錯檢判別之后,達到了比較滿意的檢測率。
Harr特征是利用簡單的矩陣組合來描述一幅圖像的特征。在利用Harr特征進行圖像描述時,主要可以用圖1中四種特征模板,它們可以很好地描述一幅圖像的基本屬性,比如線性特征、邊緣特征、對角線特征和中心特征等。這些特征模板在一幅圖像中的大小是變化的,而Harr特征的特征值就是黑色矩形方塊的像素值減去白色矩形方塊的像素值?;诖?,可以通過改變特征模板的種類、大小和在一幅圖像中的位置來得到圖像的Harr特征。
圖1 Harr特征的四種模板
在進行計算時,Harr特征的數(shù)量極大,例如一幅24 ×24像素的灰度圖像可以形成的特征向量的維數(shù)高達162 336維,并且在計算的過程中有大量的重復計算,高維的Harr特征值計算直接導致了訓練時間的大量增加。為了解決這一個問題,本文提出利用非負矩陣分解(Non-negative Matrix Factorization,NMF)對高維特征向量進行降維。
NMF是一種在矩陣中所有元素均為非負數(shù)約束條件之下的矩陣分解方法。Harr-NMF特征計算如下所示:
(1)設H是長為L的Harr特征向量,將其取絕對值然后轉化為m×n的矩陣C,其中L=m×n,m>n。
(2)對轉化后得到的矩陣C進行秩為r的NMF分解:
其中W和H分別是m×r和n×r的非負的基矩陣和系數(shù)矩陣,r<<m;
(3)對W和H的每一個列向量vi作歸一化處理,即:
(4)將所有的列向量級聯(lián)成Harr-NMF特征。本文中,歸一化之后的訓練樣本為24×24像素大小,L=162 336,m= 5 073,n=32,r=3,Harr-NMF特征的長度為15 315,NMF對圖像的噪聲有一定的穩(wěn)定性,通過分解得到的基矩陣和系數(shù)矩陣對保留了原矩陣的主要特征,因此Harr-NMF特征在很好的保留了Harr特征特性的基礎上,通過極大地減少Harr特征維數(shù)來減少后續(xù)算法的計算時間。
在得到訓練樣本的Harr-NMF特征后,通過利用Adaboost算法對大量的正負樣本進行學習。Adaboost算法根據(jù)得到的Harr-NMF特征利用弱分類器將樣本進行分類,在每次的迭代過程中選取分類錯誤率最小的弱分類器作為本次迭代的最優(yōu)分類器,并為最優(yōu)弱分類器賦以權重。并根據(jù)上一次的分類結果更新每個樣本的權值,提高錯誤樣本權重并降低正確訓練樣本權重。把經(jīng)過多次迭代之后得到一系列弱分類器級聯(lián)生成決策分類器。Adaboost算法訓練分類器的方法如下:
設樣本空間為X、迭代次數(shù)為T、樣本類別為Y、訓練樣本數(shù)為N和訓練樣本集S:
示負樣本,+1代表正樣本。
初始時對每個輸入的訓練樣本分配相同的權重,設初始權值為D1(xi)=1/N,則Dt(xi)表示第t輪中樣本xi的權重,其中t=1,2,...,T。根據(jù)訓練樣本權重分布對樣本特征進行學習,獲得最優(yōu)弱分類器hi(xi),的最小容許誤差為εt,εt可由式(4)計算得到:
然后,利用容許誤差計算本輪最佳弱分類器ht(xi)的權重αt:
根據(jù)本次迭代得到的最優(yōu)弱分類器hi(xi)、權重αt和分類的結果,更新訓練樣本的權重,更新的樣本分布為:
其中,Zt為歸一化因子,使經(jīng)過T輪循環(huán)后,獲得T個最優(yōu)弱分類器,將ht(xi)按照其權重級聯(lián)起來得到強分類器H(x):
Adaboost算法流程如圖2所示:
圖2 Adaboost算法流程示意圖
級聯(lián)分類器是將算法訓練得到的一系列弱分類器級聯(lián)起來得到識別準確率很高的強分類器。弱分類器排列時,相對簡單的分類器排在前面,這樣在檢測的開始階段大量的負樣本會被排除,從而縮短檢測時間。
從圖3級聯(lián)分類器的構成可以看出,通過訓練得到的強分類器是一顆退化的決策樹。在進行車輛檢測時,檢測窗口必須全部通過弱分類器才能被判定為正樣本,每個分類器幾乎可以讓所有的正樣本通過,而一旦某個窗口被某個弱分類器判定為負樣本就會終止判斷過程,并進入到下一個檢測流程中。因此最后一個分類器留下來的目標就是檢測目標。
圖3 級聯(lián)分類器構造示意圖
訓練樣本和測試樣本來自于武漢市道路交通,通過百度地圖全景模式功能截取240×240大小的圖像,充分考慮到了各種路況下正樣本和負樣本的比例,得到訓練樣本集和測試樣本集。其中車輛分布在正樣本圖像正中,負樣本是不包含車輛的道路背景圖,比如車道線、紅綠燈和交通指示牌等。
為了縮短訓練時間,將所有正樣本歸一化大小到24×24大小,并進行圖像灰度化。圖4為部分正負樣本,圖5為部分灰度化后的正負樣本。
圖4 部分正負樣本示例
圖5 部分灰度化正負樣本示例
本文測試平臺為Visual Studio 2013,測試計算機配置為Inter(R)Core(TM)i3-2100,主頻為3.10GHz,內(nèi)存為8GB。利用訓練出來的車身分類器進行實測。算法的整體流程圖如圖6所示。
圖6 算法的整體流程
分別對提取的Harr特征與Harr-NMF特征進行分類訓練,計算訓練時間,對分類器進行實測。在兩種特征所形成分類器的車輛檢測率相當?shù)那闆r下,通過本文選取的正負樣本提取出Harr特征的訓練時間要遠遠大于Harr-NMF特征的訓練時間。對比測試結果見表1。
表1 兩種特征訓練時間與檢測率對比
圖7是基于兩種特征的部分檢測情況。圖7(1)是基于Harr特征分類器的初步檢測結果,圖7(2)是基于Harr-NMF特征分類器的初步檢測結果。除了前方遠距離被遮擋車輛有少量漏檢的情況外,參考在實際行駛中這部分漏檢車對我們作用不大,可以忽略。因此認為,基于傳統(tǒng)Harr特征的車身分類器和基于Harr-NMF特征的車身分類器在檢測效果相當?shù)那闆r下,后者分類器的訓練速度更快。
圖7 兩種特征檢測結果對比圖
在Harr-NMF特征計算中,降維參數(shù)r的取值對檢測結果有很大的影響,r值越大,Harr信息保留得越完整,但是特征維數(shù)越大,訓練時間越長;r值越小,Harr特征壓縮越劇烈,圖像丟失的信息越嚴重。本文中Harr特征的原始維數(shù)為L=162 336,m=5 073,n=32,r值分別取1,2,3,4。
經(jīng)過測試,Harr-NMF對應的特征維數(shù)、檢測率以及訓練時間見表2。從表2中可以看出,在r=2或r=3時,在特征維數(shù)、分類器的檢測性能和訓練時間中取得了較好的平衡,本文取r=3。
表2 不同r值的特征維數(shù)和性能比較
但是實測中也存在著一輛車被重復檢測和一些錯誤檢測的問題等。針對這些問題,本文對初步檢測結果進行了進一步改進。
在車輛初步檢測過程中,發(fā)現(xiàn)同一輛車被檢測到兩次的問題。針對這一問題,本文通過式(8)判定二者是否重合:
其中,r1,r2分別為圓O1,圓O2的半徑,(x1,y1),(x2,y2)為圓心坐標,max(r1,r2)為重合度閾值,當兩者關系滿足上述條件時,判斷檢測目標為相同目標。圖8(1)為初步測試結果,圖中左側車輛被分類器重復檢測了兩次,對該被測車輛進行重復性判定之后,測試優(yōu)化結果如圖8(2)所示。對比兩次測試結果,發(fā)現(xiàn)采用重復性判定后重復檢測問題得到明顯改善。
圖8 重復識別測試結果對比圖
測試時發(fā)現(xiàn)有時會出現(xiàn)誤檢的情況,誤檢區(qū)域一般為道路上的一些建筑。但是一般情況下車身像素與車身周圍道路像素差別較大。為了消除誤檢區(qū)域,首先計算圓形區(qū)域均值像素P1,然后擴大圓形區(qū)域,計算擴大之后圓形區(qū)域的均值像素P2,比較兩次均值像素的差值P,給定均值像素閾值。經(jīng)過多次測試,給定擴大圓形區(qū)域為1.1倍,給定均值像素的差值P=10。即擴大后的兩次圓形區(qū)域的均值像素值差小于10時,判斷檢測目標為誤檢目標。圖9(1)為初步測試結果,中間黑色車輛的前方有一個誤檢目標。根據(jù)均值像素差值消除該錯檢的結果如圖9(2)所示。對比兩次測試結果,誤檢目標得到消除。
圖9 錯誤識別測試結果對比圖
本文在基于傳統(tǒng)Harr特征檢測的基礎上,提出利用非負矩陣分解法對高維特征向量進行降維,在滿足檢測性能的基礎上,極大地縮短了樣本的訓練周期。將提取的Harr-NMF特征進行分類并由Adaboost訓練,級聯(lián)得到基于Harr-NMF特征的車身級聯(lián)分類器。該分類器與基于Harr特征分類器的檢測率差別很小,但是訓練時間大大縮短。針對在實車測試時出現(xiàn)的重檢、錯檢等情況,提出重合度閾值判定重復檢測和均值像素閾值判斷錯檢。實驗表明,該方法具有較高的檢測準確率,可以作為車輛檢測的一種方法作進一步的研究。在接下來的研究過程中,應著重研究在夜晚、陰雨天氣、車輛發(fā)生遮擋等情況時的檢測方法以及加快算法移植到硬件平臺上。
[1]韓藝.基于視頻圖像的運動車輛檢測與跟蹤算法研究[D].哈爾濱:哈爾濱工業(yè)大學,2015.
[2]Wixson L.Detecting salient motion by accumulating directionally-consistent flow[A].The Proceedings of the Seventh IEEE International Conference on Computer Vision,IEEE[C].1999.
[3]Moscheni F,Bhattacharjee S,Kunt M.Spatio-temporal segmentation based on region merging[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,1998,20(9):897-915.
[4]Viola Paul,Jones Michael J.Robust Real-time Object Detection[R].Cambridge Research Laboratory,2001.
[5]Wu B,Nevatia R.Simultaneous Object Detection and Segmentation by Boosting Local Shape Feature based Classifier[A].2007IEEE Conference on Computer Vision and Pattern Recognition[C].2007.
[6]曾波波,王貴錦,林行剛.基于顏色自相似度特征的實時行人檢測[J].清華大學學報(自然科學版),2012,50(4):571-574.
[7]Dalal N,Triggs B.Histograms of oriented gradients for human detection[A].Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition[C].San Diego,USA,2005.
[8]Zhao L,Thorpe C E.Stereo and neural network-based pedestrian detection[J].IEEE Transactions on Intelligent Transportation Systems,2000,1(3):148-154.
[9]王千,王成,馮振元,等.K-means聚類算法研究綜述[J].電子設計工程,2012,20(7):21-24.
[10]Freund Y,Schapire R E.A decision theoretic generalization of on-line learning and an application to boosting[A].European Conference on ComputationalLearning Theory[C]. Springer-Verlag,1995.
[11]Jones M J,Viola P.Method and system for object detection in digital images:US,US7099510[P].2006.
Study on Vehicle Inspection Algorithm Based on Harr-NMF Feature
Hu Jie,Liu Zhicheng,Yang Huiping,Li Zexi
(School of Automobile Engineering,Wuhan University of Technology,Wuhan 430070,China)
In this paper,in order to improve the accuracy and efficiency in vehicle inspection to provide reliable reference information for the intelligent traffic system,and in light of the problems of the traditional vehicle inspection algorithm based on the Harr feature,we proposed to decompose the Harr feature by a non-negative matrix to yield a lower-dimension Harr-NMF feature.Next we categorized the Harr-NMF feature and obtained through Adaboost training the Harr-NMF based vehicle classifier for the effective identification of the vehicle body.At the end,in view of the problems encountered in an empirical practice of the method,we further optimized the algorithm.
intelligent traffic;vehicle inspection;Harr-NMF feature;Adaboost algorithm
F224;F407.472
A
1005-152X(2017)08-0117-05
2017-07-05
國家重點研發(fā)計劃項目“滿足國IV標準的摩托車排放控制后處理系統(tǒng)技術研究”(2016YFC0204905)
胡杰(1984-),男,湖北武漢人,博士,副教授,主要研究方向:智能網(wǎng)聯(lián)汽車與內(nèi)燃機;劉志成(1993-),通訊作者,男,湖北荊州人,碩士研究生,主要研究方向:智能網(wǎng)聯(lián)汽車。
doi∶10.3969/j.issn.1005-152X.2017.08.027