程淑紅, 高 許, 周 斌(. 燕山大學(xué) 電氣工程學(xué)院, 河北 秦皇島 066004;2. 秦皇島中信戴卡股份有限公司 博士后工作站, 河北 秦皇島 066004)
汽車(chē)在日常生活及交通運(yùn)輸中發(fā)揮著重要作用,而交通管理卻面臨著嚴(yán)重的挑戰(zhàn)。因此,智能交通系統(tǒng)[1~4]這一集多種先進(jìn)技術(shù)于一身的全方位、高效率的綜合交通管理系統(tǒng)成為交通管理部門(mén)的最佳選擇。而車(chē)型識(shí)別[5,6]是智能交通系統(tǒng)中一個(gè)擁有很好應(yīng)用前景的技術(shù)。Rao Y B[7]設(shè)計(jì)了多攝像機(jī)視頻監(jiān)控系統(tǒng);王瑞[8]增加了聲頻傳感器用來(lái)采集聲頻數(shù)據(jù)。雖然數(shù)據(jù)采集方式的改進(jìn)能夠優(yōu)化數(shù)據(jù)源,但是單一方面的優(yōu)化并不能有效地提高車(chē)型識(shí)別率?;诖?研究人員不得不從其他方面入手來(lái)提高車(chē)型識(shí)別率。被檢測(cè)車(chē)輛的特征提取是整個(gè)車(chē)型識(shí)別過(guò)程中的關(guān)鍵步驟,所以又有許多學(xué)者通過(guò)改進(jìn)特征提取的方法來(lái)提高車(chē)型識(shí)別率: Wang T T[9]提取了顏色直方圖特征作為特征量參與車(chē)型識(shí)別;而 Liu S M[10]使用蛇模型提取完整的輪廓曲線特征。改進(jìn)后的特征提取量不再是長(zhǎng)度、面積等基本特征量,而是能夠更加靈活、有效地代表汽車(chē)形狀的新型特征量。然而他們僅僅在特征提取方面做了改進(jìn),形式單一,并沒(méi)有涉及到其它方面的優(yōu)化,這樣雖然能夠使車(chē)型識(shí)別率提高一些,但并不能取得很好的結(jié)果。Priyadharshini R A[11]使用Gabor和Log-Gabor兩種算法同時(shí)對(duì)車(chē)型識(shí)別進(jìn)行對(duì)比試驗(yàn),最終驗(yàn)證Log-Gabor能夠更好地完成車(chē)型識(shí)別,取得較高的識(shí)別率; Zhu G Y則使用了支持向量機(jī)(support vector machines,SVM)并對(duì)其進(jìn)行優(yōu)化[12],提出ε臨近分類(lèi)支持向量機(jī),使得每個(gè)類(lèi)權(quán)重不均勻的問(wèn)題得到解決。算法和分類(lèi)器的優(yōu)化大大的提高了車(chē)型識(shí)別率,但是僅僅對(duì)算法或分類(lèi)器進(jìn)行優(yōu)化而沒(méi)解決特征量單一化的問(wèn)題是無(wú)法很好地完成車(chē)型識(shí)別的,其識(shí)別過(guò)程也會(huì)存在抗干擾能力差、不穩(wěn)定等問(wèn)題,無(wú)法更加有效地從復(fù)雜的環(huán)境中識(shí)別出車(chē)輛的類(lèi)型。
本文提出了一種基于多特征提取和SVM參數(shù)優(yōu)化的車(chē)型識(shí)別方法:首先提取了多類(lèi)特征量并進(jìn)行融合;然后用粒子群算法對(duì)SVM參數(shù)進(jìn)行優(yōu)化;最后,將融合后的檢測(cè)結(jié)果與單一特征量的檢測(cè)結(jié)果相對(duì)比來(lái)說(shuō)明本方法的優(yōu)越性、高效性和可行性。
幾何特征是最先觀察到的特征,本文選取了周長(zhǎng)、面積和長(zhǎng)寬比作為幾何特征來(lái)對(duì)車(chē)輛進(jìn)行識(shí)別[13]。周長(zhǎng)特征是將車(chē)輛所在區(qū)域的輪廓像素點(diǎn)總數(shù)量作為特征量;面積特征是將車(chē)輛所在區(qū)域的像素點(diǎn)總數(shù)作為特征量;長(zhǎng)寬比是指車(chē)輛所在區(qū)域的最小矩形的長(zhǎng)和寬的比值:
(1)
式中:f(x1)和f(x2)分別是運(yùn)動(dòng)區(qū)域最右側(cè)和最左側(cè)像素點(diǎn)與對(duì)應(yīng)行第0列像素點(diǎn)之間的距離;f(y1)和f(y2)分別是運(yùn)動(dòng)區(qū)域最下面和最上面像素點(diǎn)與對(duì)應(yīng)列第0行像素點(diǎn)之間的距離。
紋理特征能夠表現(xiàn)出圖像表面或結(jié)構(gòu)之間的差異,是一種比較穩(wěn)定的特征[14]。本文利用統(tǒng)計(jì)灰度直方圖的方式,選擇了均值、標(biāo)準(zhǔn)偏差、熵、平滑度和一致性作為車(chē)輛的紋理特征,分別用式(2)~式(6)表示為:
(2)
(3)
(4)
(5)
(6)
式中:L為灰度級(jí)總數(shù);zi為第i個(gè)灰度級(jí);p(zi)為灰度為zi的概率值;m為均值;μ和σ分別為標(biāo)準(zhǔn)偏差和方差;e為熵;S為平滑度;U為一致性。
局部特征也是描述圖像信息的一種常用方法,常用來(lái)表示局部特征的算子主要有:Harris算子、SURF(speed up robust feature)算子和HOG[15]算子等。本文采用HOG算子進(jìn)行局部特征提取。
HOG是由Dalal等提出的一種表述圖像局部信息的方式,提取圖像HOG的過(guò)程為:將一幅圖像分割成很多個(gè)小的區(qū)域,計(jì)算每個(gè)小區(qū)域內(nèi)各個(gè)像素點(diǎn)的梯度直方圖(histogram of oriented gradient,HOG),得到每個(gè)小區(qū)域的梯度直方圖,再把所有小區(qū)域進(jìn)行組合,得到一幅完整圖像的HOG特征。提取HOG特征的流程如圖1所示。
圖1 HOG特征提取過(guò)程
可以看出,提取HOG特征需要經(jīng)過(guò)5個(gè)步驟:
1)彩色空間歸一化。在實(shí)際應(yīng)用中只對(duì)灰度圖像進(jìn)行歸一化處理即可;
2)梯度計(jì)算。 計(jì)算灰度圖像中每個(gè)像素點(diǎn)的梯度值并得到整個(gè)圖像的梯度信息。假設(shè)一幅圖像為f(x,y),對(duì)于圖像上的任何一個(gè)像素點(diǎn)的梯度可以用式(7)表示為:
(7)
式中:Gx和Gy分別為圖像上任意像素點(diǎn)的水平梯度和垂直梯度。則該點(diǎn)的梯度的大小和方向分別用式(8)和式(9)表示為:
|
(8)
(9)
3)統(tǒng)計(jì)梯度直方圖。如圖2所示,將含有車(chē)輛的窗口區(qū)域分成多個(gè)塊區(qū)域(block),再將每個(gè)塊區(qū)域分成4個(gè)較小的區(qū)域(cell),把每個(gè)cell再被分割成8×8的最小區(qū)域,并計(jì)算最小區(qū)域內(nèi)每個(gè)像素的梯度。在0°~180°區(qū)間上平均分成9個(gè)方向區(qū)間,則得到的每個(gè)區(qū)間的大小為20°,然后將cell中的全部像素點(diǎn)的梯度方向累加到相對(duì)應(yīng)的區(qū)間上,每個(gè)cell均可獲得一個(gè)9維的特征向量,將相鄰的4個(gè)cell看成一個(gè)塊區(qū)域,則任意一個(gè)塊區(qū)域可獲得一個(gè)36特征向量;
4)歸一化處理。對(duì)塊區(qū)域的梯度直方圖進(jìn)行對(duì)比度歸一化處理;
5)HOG特征向量。把經(jīng)過(guò)歸一化之后的各塊的全部直方圖連接組成一整幅圖像的HOG特征。
本文主要對(duì)視頻圖像中的小轎車(chē)、小貨車(chē)和面包車(chē)進(jìn)行識(shí)別,如圖3所示。樣本采集是在真實(shí)的交通場(chǎng)景中完成的,相機(jī)用三腳架固定在橋梁上,從道路的正上方進(jìn)行連續(xù)拍攝;初始樣本視頻每幀圖像大小為720像素×480像素,幀速為25幀/s;測(cè)試樣本視頻每幀圖像大小為1 280像素×720像素,幀速為25幀/s;實(shí)驗(yàn)軟件平臺(tái)為Matlab 7.0運(yùn)行平臺(tái)。對(duì)視頻圖像進(jìn)行特征參數(shù)提取得到車(chē)輛樣本,其中小轎車(chē)、小貨車(chē)、面包車(chē)圖像分別為140幅、60幅、60幅,將這些圖像作為樣本集,測(cè)試樣本集和訓(xùn)練樣本集各占二分之一。
圖3 車(chē)輛類(lèi)型
將采集的3種車(chē)型的樣本圖片經(jīng)過(guò)灰度化、二值化、中值濾波和雙邊濾波去除圖片噪聲、邊緣提取和形態(tài)學(xué)處理等處理過(guò)程可得到如圖4所示的處理結(jié)果圖。
圖4 樣本圖像處理結(jié)果
圖4(a)為小轎車(chē)、小貨車(chē)和面包車(chē)的灰度圖像;對(duì)分割出來(lái)的二值化圖像圖4(b)和邊緣圖像圖4(c)進(jìn)行幾何特征提取,可以獲得車(chē)輛的周長(zhǎng)、面積、長(zhǎng)寬比、緊密度、矩形度;對(duì)圖4(d)前景車(chē)輛進(jìn)行紋理特征和HOG特征提取,從而得到車(chē)輛的幾何特征、紋理特征和HOG特征參數(shù),用于后期識(shí)別檢測(cè)。
對(duì)于非線性的樣本,支持向量機(jī)[16]可以實(shí)現(xiàn)將非線性樣本轉(zhuǎn)換到一個(gè)新的特征空間,在此空間可以將非線性樣本轉(zhuǎn)換為線性可分的樣本。一般情況下,通過(guò)引入一個(gè)非線性變換函數(shù)K(xi,xj)來(lái)將非線性問(wèn)題轉(zhuǎn)換為線性問(wèn)題進(jìn)行處理,K(xi,xj)可以是核函數(shù)。
分類(lèi)判別函數(shù)中只包含輸入樣本和支持向量的內(nèi)積運(yùn)算,所以,在特征空間進(jìn)行內(nèi)積運(yùn)算就可以得到分類(lèi)結(jié)果,即最優(yōu)分類(lèi)函數(shù)的輸出。對(duì)于非線性的情況,可以選擇合適的內(nèi)積函數(shù)將樣本映射到一個(gè)特征空間,再按照線性情況的方法進(jìn)行求解,常用來(lái)表示內(nèi)積函數(shù)的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù),其表達(dá)式分別見(jiàn)式(10)~式(13)。有:
K(xi,xj)=xi·xj
(10)
K(xi,xj)=(xi·xj+c)d
(11)
(12)
K(xi,xj)=tanh(a
(13)
式中:xi,xj為2種點(diǎn)集或者兩類(lèi)訓(xùn)練樣本;c為常數(shù);d為正整數(shù);σ為控制核函數(shù)高寬; <>代表內(nèi)積運(yùn)算;a為一個(gè)標(biāo)量;r為位移參數(shù)。式(13)中,當(dāng)a和r分別取不同值時(shí),Sigmoid核函數(shù)有著不同的性質(zhì)[17]。
支持向量機(jī)模型的好壞與懲罰因子、選擇的核函數(shù)以及選擇的核參數(shù)的大小有關(guān),所以選擇一個(gè)正確的核函數(shù)是至關(guān)重要的。本文選擇了徑向基核函數(shù),因?yàn)榕c其它3種核函數(shù)相比較而言,線性核函數(shù)只是徑向基核函數(shù)的一種特殊情況,適應(yīng)范圍比較小;多項(xiàng)式和Sigmoid核函數(shù)需要設(shè)置的參數(shù)比較多,使用起來(lái)比較繁雜且耗時(shí)較長(zhǎng);徑向基核函數(shù)既能很好地服務(wù)于支持向量機(jī),又只需要設(shè)置一個(gè)參數(shù),簡(jiǎn)單實(shí)用且時(shí)效性好。
為了獲得較高的分類(lèi)準(zhǔn)確率,除了選擇合適的內(nèi)積函數(shù)之外還需要對(duì)其核參數(shù)g和懲罰因子C進(jìn)行優(yōu)化,本文分別選用網(wǎng)格搜索法、遺傳算法和粒子群算法對(duì)支持向量機(jī)的核參數(shù)g和懲罰因子C進(jìn)行優(yōu)化,結(jié)果如表1所示。
表1 SVM最優(yōu)參數(shù)
運(yùn)用表1中的最優(yōu)參數(shù)優(yōu)化支持向量機(jī),并對(duì)樣本進(jìn)行分類(lèi)識(shí)別,其樣本分類(lèi)準(zhǔn)確率如表2 所示。對(duì)比3種方法得到的結(jié)果可知,采用粒子群算法識(shí)別準(zhǔn)確率最高,而且網(wǎng)格搜索法需要遍歷所有數(shù)據(jù),當(dāng)數(shù)據(jù)過(guò)多時(shí),使用網(wǎng)格搜索法耗時(shí)太長(zhǎng),所以,本文選擇粒子群算法對(duì)參數(shù)進(jìn)行優(yōu)化。
表2 樣本分類(lèi)準(zhǔn)確率 (%)
針對(duì)采集樣本,分別提取車(chē)輛的單一特征及組合特征利用優(yōu)化SVM進(jìn)行車(chē)型識(shí)別,其識(shí)別準(zhǔn)確率如表3所示。從表中的識(shí)別準(zhǔn)確率對(duì)比可知,組合特征識(shí)別率高于單一特征的識(shí)別率,但是幾何組合與紋理組合的車(chē)型識(shí)別率也并不理想。為了獲得更高效準(zhǔn)確的識(shí)別方法,在上述的組合特征中加入了HOG特征構(gòu)建多特征組合矢量矩陣,其中各個(gè)特征的權(quán)重都相等,其識(shí)別準(zhǔn)確率如表4所示。
表3 紋理及幾何特征識(shí)別準(zhǔn)確率 (%)
表4 多特征組合識(shí)別準(zhǔn)確率 (%)
由表3和表4可知,利用幾何、紋理和HOG特征組合能夠更全面地描述車(chē)輛外在的信息,提高了車(chē)型識(shí)別準(zhǔn)確率。為了進(jìn)一步驗(yàn)證本文提出方法的優(yōu)越性、高效性和可行性,使用相同的方法再次采集一組車(chē)輛樣本測(cè)試數(shù)據(jù)進(jìn)行實(shí)際分類(lèi)和預(yù)測(cè)實(shí)驗(yàn),其中利用粒子群算法對(duì)SVM參數(shù)進(jìn)行優(yōu)化后可得C=1.196 9,g=5.987 69。測(cè)試樣本的實(shí)際分類(lèi)和預(yù)測(cè)分類(lèi)圖如圖5所示。
圖5 測(cè)試樣本的實(shí)際分類(lèi)和預(yù)測(cè)分類(lèi)
圖5中給出了小貨車(chē)、面包車(chē)和小轎車(chē)的預(yù)測(cè)和實(shí)際2種測(cè)試集分類(lèi)圖形。2種圖形重合率越高,說(shuō)明預(yù)測(cè)準(zhǔn)確率越高。所以對(duì)圖5進(jìn)行數(shù)據(jù)統(tǒng)計(jì)可得到測(cè)試樣本整體的識(shí)別結(jié)果,如表5所示。由表5和圖5可以看出車(chē)型識(shí)別的準(zhǔn)確率,其中小轎車(chē)的識(shí)別效果最好,小貨車(chē)的識(shí)別效果最差。除此之外,3種車(chē)型總體的識(shí)別準(zhǔn)確率為90.769 2%,比初始樣本(表2)的準(zhǔn)確率還要高出0.1%。
表5 測(cè)試樣本識(shí)別結(jié)果
本文主要進(jìn)行了基于視頻圖像的車(chē)輛檢測(cè)和車(chē)型識(shí)別問(wèn)題的研究,提出了一種基于多特征提取和SVM參數(shù)優(yōu)化的車(chē)型識(shí)別方法。實(shí)驗(yàn)結(jié)果表明:1)單一種類(lèi)的組合特征的識(shí)別準(zhǔn)確率明顯高于單一特征的識(shí)別準(zhǔn)確率;2)多種類(lèi)的組合特征的識(shí)別準(zhǔn)確率高于單一種類(lèi)的組合特征的識(shí)別準(zhǔn)確率;3)與其他幾種SVM參數(shù)優(yōu)化算法相比,粒子群優(yōu)化算法能夠取得更好的效果。本文也有需要改進(jìn)之處。比如:只考慮白天環(huán)境下的車(chē)輛檢測(cè)而未考慮夜晚的情況;沒(méi)有考慮兩輛車(chē)相互遮擋時(shí)的情況;識(shí)別準(zhǔn)確率沒(méi)能達(dá)到100%。這些問(wèn)題將在進(jìn)一步的研究中得到解決。
[參考文獻(xiàn)]
[1] 劉昕, 王殿海, 王新穎, 等. 基于IPv6的智能交通信息采集與處理方法[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版), 2010, 40(5):1226-1229.
[2] Qin Y, Yuan B J, Pi S. Research on framework and key technologies of urban rail intelligent transportation system [C]//Proceedings of the 2015 International Conference on Electrical and Information Technologies for Rail Transportation (2nd). Zhuzhou:Springer Berlin Heidelberg, 2016:729-736.
[3] Ludanek H. Ludanek on ICT and intelligent transportation systems[J].EricssonReview, 2016, 93(1): 30-39.
[4] Moral-Munoz J A, Cobo M J, Chiclana F,etal. Analyzing Highly Cited Papers in Intelligent Transportation Systems[J].IEEETransactionsonIntelligentTransportationSystems, 2016, 17(4):993-1001.
[5] Zhao J, Liu Z J. Research on Vehicle Type Recognition based on Data surveying[J].ScienceandTechnology, 2016, 9(2):319-330.
[6] Wang Y, Zhou J L. Vehicle type recognition in WSN based on ITESP algorithm[C]//10th IEEE International Conference on Ubiquitous Intelligence and Computing (UIC 2013) and 10th IEEE International Conference on Autonomic and Trusted Computing (ATC 2013).Vietrisul Mare, Italy, 2013:668-671.
[7] Rao Y B. Automatic vehicle recognition in multiple cameras for video surveillance[J].VisualComputer,2015, 31(3):271-280.
[8] 王瑞, 王康晏, 馮玉田, 等. 復(fù)雜場(chǎng)景下聲頻傳感器網(wǎng)絡(luò)核稀疏表示車(chē)輛識(shí)別[J]. 西安電子科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015, 42(4):115-120.
[9] Wang T T, Xiu C B, Cheng Y. Vehicle Recognition Based on Saliency Detection and Color Histogram[C]//27th Chinese Control and Decision Conference (CCDC 2015), Qingdao, 2015.
[10] Liu S M, Huang Y P, Zhang R J. On-Road Vehicle Recognition Using the Symmetry Property and Snake Models[J].InternationalJournalofAdvancedRoboticSystems,2013,10:1-9.
[11] PriyadharshiniR A, Arivazhagan S, Sangeetha L. Vehicle Recognition based on Gabor and Log-Gabor Transforms[C]//2014 IEEE International Conference on Advanced Communication, Control and Computing Technologies(ICACCCT 2014). Tamil Nadu, India, 2015.
[12] Zhu G Y, Huang D, Zhang P,etal. E-Proximal support vector machine for binary classification and its application in vehicle recognition[J].Neurocomputing, 2015, 161: 260-266.
[13] 王恒奎, 邊耐欣, 王文, 等. 基于Trimmed NURBS 曲面幾何特征的數(shù)字化自適應(yīng)采樣[J]. 計(jì)量學(xué)報(bào), 2002, 23(4):272-275.
[14] 王崇文, 李見(jiàn)為, 林國(guó)清. 一種新的復(fù)合指紋匹配法[J]. 計(jì)量學(xué)報(bào), 2004, 25(1):77-80.
[15] Li B, Huo G. Face recognition using locality sensitive histograms of oriented gradients[J].Optics,2016, 127(6):3489-3494.
[16] 孟宗,季艷,谷偉明, 等. 基于支持向量機(jī)和窗函數(shù)的DEMD端點(diǎn)效應(yīng)抑制方法[J]. 計(jì)量學(xué)報(bào), 2016, 37(2):180-184.
[17] 劉明. 支持向量機(jī)中Sigmoid核函數(shù)的研究[D]. 西安:西安電子科技大學(xué),2009.