紀(jì) 野, 李玉惠, 王 蒙
(1.昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500; 2.云南省智能交通系統(tǒng)工程技術(shù)研究中心 智能圖像處理研究室,云南 昆明 650500)
基于卷積神經(jīng)網(wǎng)絡(luò)的車型識(shí)別方法研究*
紀(jì) 野1,2, 李玉惠1,2, 王 蒙1,2
(1.昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院,云南昆明650500;2.云南省智能交通系統(tǒng)工程技術(shù)研究中心智能圖像處理研究室,云南昆明650500)
針對(duì)高速公路環(huán)境下的車型識(shí)別問(wèn)題,利用深度學(xué)習(xí)Caffe框架中的AlexNet和傳統(tǒng)方法支持向量機(jī)(SVM),分別對(duì)車輛圖像進(jìn)行網(wǎng)絡(luò)訓(xùn)練與測(cè)試,得到兩種車型識(shí)別方法的準(zhǔn)確率并進(jìn)行比較驗(yàn)證。實(shí)驗(yàn)結(jié)果表明:卷積神經(jīng)網(wǎng)絡(luò)的分類方法具有較高的車型識(shí)別精度,車型識(shí)別準(zhǔn)確率高。
深度學(xué)習(xí); 車型識(shí)別; 卷積神經(jīng)網(wǎng)絡(luò); 支持向量機(jī); AlexNet
視頻監(jiān)控系統(tǒng)作為交通監(jiān)管的一種重要手段,已被廣泛應(yīng)用于現(xiàn)代交通管理的各個(gè)領(lǐng)域。車型識(shí)別方法在采集車輛信息、判別違章肇事車輛中成為了智能交通的重要內(nèi)容。卷積神經(jīng)網(wǎng)絡(luò)[1~3]可將原始數(shù)據(jù)直接作為輸入,避免了傳統(tǒng)識(shí)別算法中額外的數(shù)據(jù)預(yù)處理過(guò)程。傳統(tǒng)識(shí)別方法中,陳曦等人利用支持向量機(jī)(support vector machine,SVM)進(jìn)行心電圖(ECG)傳感器信號(hào)身份識(shí)別[4]準(zhǔn)確率高,該方法適用于車型識(shí)別;紀(jì)野等人利用有監(jiān)督Kohonen網(wǎng)絡(luò)對(duì)車輛三維幾何特征識(shí)別車型[4]。本文分別采用了基于SVM的網(wǎng)絡(luò)、深度學(xué)習(xí)Caffe框架中的AlexNet兩種分類方法對(duì)車輛圖像進(jìn)行網(wǎng)絡(luò)訓(xùn)練與測(cè)試,得到兩種車型識(shí)別方法的準(zhǔn)確率并進(jìn)行比較驗(yàn)證實(shí)驗(yàn),驗(yàn)證了卷積神經(jīng)網(wǎng)絡(luò)的分類方法識(shí)別準(zhǔn)確率高。
1.1 基于SVM的網(wǎng)絡(luò)分類[5]
SVM算法原理:對(duì)于樣本集(xi,yi),i=1,2,…,n;xi∈Rn;yi∈{-1,1},構(gòu)造分類面:WX+b=0,可將兩類樣本無(wú)錯(cuò)誤區(qū)分,使兩類之間距離最大。W,X為n維向量,線性判別函數(shù)一般形式為g(x)=Wx+b,用同倍縮放W,b的方法進(jìn)行歸一化,使離分類面最近的樣本滿足|g(x)|=1,兩類所有樣本均滿足|g(x)|≥1,兩類樣本分類間隔為2/‖W‖。
1.2 卷積神經(jīng)網(wǎng)絡(luò)分類
首先,卷積神經(jīng)網(wǎng)絡(luò)針對(duì)車型圖片數(shù)據(jù)建立訓(xùn)練模型,特征提取過(guò)程在模型訓(xùn)練過(guò)程中進(jìn)行。然后,數(shù)據(jù)預(yù)處理將圖片中的主要信息最大化,并對(duì)圖片進(jìn)行分類標(biāo)簽,訓(xùn)練出模型,最后,通過(guò)測(cè)試集進(jìn)行分類準(zhǔn)確率驗(yàn)證。
卷積神經(jīng)網(wǎng)絡(luò)算法原理:
1)前向傳播:本文討論的是多類問(wèn)題,共c類,N個(gè)訓(xùn)練樣本
(1)
(2)
3)卷積層:在一個(gè)卷積層,上一層的特征map被一個(gè)可學(xué)習(xí)的卷積核進(jìn)行卷積,然后通過(guò)一個(gè)激活函數(shù),就可以得到輸出特征map。每一個(gè)輸出map可能是組合卷積多個(gè)輸入maps的值
(3)
式中Mj為選擇的輸入map的集合。
(4)
1.3 AlexNet結(jié)構(gòu)流程
通過(guò)圖形可視化工具將Caffe使用的AlexNet結(jié)構(gòu)流程如圖1,由于網(wǎng)絡(luò)結(jié)構(gòu)稍復(fù)雜,省略了部分卷積層和池化層的核數(shù)量模塊。
圖1 AlexNet結(jié)構(gòu)流程
2.1 數(shù)據(jù)集
實(shí)驗(yàn)采用已經(jīng)建好的高速公路車型圖片數(shù)據(jù)集,所有原始數(shù)據(jù)均采集于高速公路卡口實(shí)際監(jiān)控過(guò)程中的真實(shí)照相設(shè)備。為了確保實(shí)驗(yàn)的可靠性,人工將各個(gè)卡口的高清圖片進(jìn)行標(biāo)注,分別為卡車、客車、微面、小車4類圖像。共采集不同尺度、光照、角度的車輛圖片共86 775張,其中,小車54 690張,微面15 693張,卡車11 732張,客車4 663張,根據(jù)比例選取其中的10 %作為驗(yàn)證集,其余90 %作為訓(xùn)練集。由于每張圖片的大小不一,為了滿足深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)的輸入要求,實(shí)驗(yàn)中,4種車型均歸一化為高×寬為256×256同一尺度。圖2給出了數(shù)據(jù)集的具體情況,部分車型如圖3。
2.2 實(shí)驗(yàn)結(jié)果分析
數(shù)據(jù)集中所有彩色圖像均為真實(shí)采集的原圖像,并未
圖2 數(shù)據(jù)集
圖3 部分車型
進(jìn)行任何處理,可以看到抓拍圖片的水印,但并未對(duì)最終的識(shí)別準(zhǔn)確率帶來(lái)較大影響,各類車型識(shí)別結(jié)果精度均達(dá)到90 %以上。以圖4樣本車型中的一張小車圖片為例闡述第一層卷積的特征基。2種分類方法對(duì)應(yīng)4種車型分類準(zhǔn)確率的比較結(jié)果如表1所示。
圖4 小車第一層卷積特征基
針對(duì)已有高速公路車型圖片數(shù)據(jù)集,通過(guò)兩種分類方法的實(shí)驗(yàn)結(jié)果比較驗(yàn)證,卷積神經(jīng)網(wǎng)絡(luò)優(yōu)于傳統(tǒng)分類方法,識(shí)別準(zhǔn)確率高。
表1 4種車型在兩種分類下的準(zhǔn)確率 %
[1] 鄧 柳,汪子杰.基于深度卷積神經(jīng)網(wǎng)絡(luò)的車型識(shí)別研究[J].計(jì)算機(jī)應(yīng)用研究,2016,33(3):930-932.
[2] LeCun Y,Boser B,Denker J S,et al.Backpropagation applied to handwritten zip code recognition[J].Neural Computation,1989,1(4):541-551.
[3] Krizhevsky A,Hinton G E,Sutskever I.ImageNet classification with deep convolutional neural networks[C]∥Int’l Conf on Neural Information Processing Systems,2012:1097-1105.
[4] 陳 曦,陳冠雄,沈海斌.基于SVM的ECG傳感器信號(hào)身份識(shí)別方法[J].傳感器與微系統(tǒng),2014,33(10):40-42.
[5] 紀(jì) 野,李玉惠,李 勃,等.有監(jiān)督Kohonen網(wǎng)絡(luò)的車型識(shí)別方法[J].傳感器與微系統(tǒng),2016,35(8):12-14.
[6] Simard P Y,Steinkraus Dave,Platt J C.Best practices for convolutional neural networks applied to visual document analysis[C]∥Proceedings of the International Conference on Document Analysis and Recognition,2003:958-962.
Researchonvehicletyperecognitionmethodbasedonconvolutionalneuralnetwork*
JI Ye1,2, LI Yu-hui1,2, WANG Meng1,2
(1.SchoolofInformationEngineeringandAutomation,KunmingUniversityofScienceandTechnology,Kunming650500,China;2.IntelligentImageProcessingResearchDepartment,IntelligentTransportationSystemEngineeringTechnologyResearchCenterofYunnanProvince,Kunming650500,China)
Aiming at vehicle type identification problem in highway environment,use Caffe AlexNet in deep learning framework and the traditional method of support vector machine(SVM),vehicle images are trained and tested, get accuracy of two vehicle models recognition method is carried out comparison and verification.
deep learning; vehicle type identification; convolutional neural network; support vector machine(SVM); AlexNet
10.13873/J.1000—9787(2017)11—0042—02
TP 183
A
1000—9787(2017)11—0042—02
2016—10—14
國(guó)家自然科學(xué)基金資助項(xiàng)目(61363043,61563025)
紀(jì) 野(1990-),男,碩士研究生,主要研究方向?yàn)閳D像處理。
李玉惠,通訊作者,E—mail:1484946977@qq.com。