徐紹凱 陳尹 趙林娟 姜代紅
摘 要:研究車牌識別技術時,存在著識別準確率波動較大,準確率較低等問題。為提高車牌識別準確率,提出了一種改進的卷積神經(jīng)網(wǎng)絡算法,在卷積神經(jīng)網(wǎng)絡模型的基礎上對其層次、參數(shù)進行改進,通過設置對照實驗獲得較好的訓練參數(shù)數(shù)值,使改進的卷積神經(jīng)網(wǎng)絡對車牌識別的準確率有一定提升。根據(jù)實驗方案,對全連接神經(jīng)網(wǎng)絡、LeNet-5,以及改進的卷積神經(jīng)網(wǎng)絡在識別準確率方面進行對比實驗,實驗數(shù)據(jù)表明,改進的卷積神經(jīng)網(wǎng)絡在識別準確率方面高于全連接神經(jīng)網(wǎng)絡和LeNet-5。
關鍵詞:機器學習;車牌識別;卷積神經(jīng)網(wǎng)絡
中圖分類號:TP183 文獻標識碼:A
Abstract:In the study of license plate recognition technology,there are some problems,such as large fluctuation of recognition accuracy,low accuracy and so on.In order to improve the accuracy of license plate recognition,an improved convolutional neural network algorithm is proposed.On the basis of the convolutional neural network model,the hierarchy and parameters are optimized.Better training parameters are obtained by setting the control experiment,which enables the improved convolutional neural network to improve the accuracy of license plate recognition to a certain extent.According to the experimental scheme,a comparison experiment is carried out on the recognition accuracy of fully connected neural network,LeNet-5 and improved convolutional neural network.The experimental data shows that the improved onvolutional neural network is better than the other two neural networks in recognition accuracy.
Keywords:machine learning;license plate recognition;convolutional neural network
1 引言(Introduction)
全球的經(jīng)濟發(fā)展迅速,汽車數(shù)量不斷增加,交通堵塞、交通事故多發(fā)、交通環(huán)境日趨惡化等問題是各個國家都無法忽視的,智能交通系統(tǒng)(簡稱ITS)[1]開始進入人們的視線。車牌識別技術(簡稱LPR)作為ITS領域中不可或缺的一部分發(fā)揮著越來越重要的作用。
由于缺乏大規(guī)模圖像數(shù)據(jù)庫和硬件性能不足,造成了早期的CNN不能處理復雜問題。近年來由于硬件技術上的突破和越來越多的大規(guī)模圖像數(shù)據(jù)庫被人民建立,CNN逐漸成為人工智能方面研究熱點,隨著對其不斷的研究,許多新的結構被人們提出。近年比較有名的CNN結構有ResNet[2]、AlexNet[3]、VGGNet[4]、GoogleNet[5]等。在應用方面上,圖像識別方面[6],動態(tài)視頻分析[7]、自然語言處理[8]等方面都取得了很多成果。由于CNN在圖片識別方面具有很好的性能,所以將CNN應用到LPR領域。
本文首簡單介紹卷積神經(jīng)網(wǎng)絡的結構,提出了幾種改進方案對卷積神經(jīng)網(wǎng)絡的結構進行了改進,對于改進后的卷積神經(jīng)網(wǎng)絡結構進行介紹和分析,改進后的卷積神經(jīng)網(wǎng)絡解決了識別準確率低的問題。設計了實驗方案,實驗對比了改進卷積神經(jīng)網(wǎng)絡與、文獻[9]中的卷積神經(jīng)網(wǎng)絡和全連接神經(jīng)網(wǎng)絡識別準確率,得出了改進后的卷積神經(jīng)網(wǎng)絡在識別準確率方面有所提升的結論
2 卷積神經(jīng)網(wǎng)絡結構(Convolution neural network structure)
卷積神經(jīng)網(wǎng)絡是近年來興起的人工神經(jīng)網(wǎng)絡的一個特例,在圖片和語言識別領域取得了較多的研究成果。這種技術被廣泛傳播和應用,最常見的應用是在計算機圖像識別方面,藥物發(fā)現(xiàn)、動態(tài)視頻分析、自然語言處理也都使用了這門技術。
卷積神經(jīng)網(wǎng)絡不再是對圖片的一個個像素點進行處理,而是使用卷積核對一塊像素區(qū)域進行掃描,這種方法是為了加強圖像信息的連續(xù)性,加深神經(jīng)網(wǎng)絡對圖像的理解。經(jīng)典的卷積神經(jīng)網(wǎng)絡主要由三個部分組成:輸入層為第一部分,兩層卷積層和降采樣層構成第二部分,卷積層計算特征圖公式如式(1)所示:
3 改進后的卷積神經(jīng)網(wǎng)絡(Improved convolution neural network)
3.1 設計方案
針對我國車牌中存在10個數(shù)字和24個字母(不包含I、O)的情況,我們將神經(jīng)網(wǎng)絡的輸出層中的神經(jīng)元個數(shù)改為34,對識別準確率方面提出以下方法進行改進:
(1)參照Lenet-5卷積神經(jīng)網(wǎng)絡結構添加C5層。
(2)在卷積層和降采樣層之間添加標注化層。
(3)調(diào)整C5層的卷積核個數(shù)。
3.2 網(wǎng)絡結構
改進后的卷積神經(jīng)網(wǎng)絡層次如圖2所示。輸入層為第一部分,由卷積層、激活函數(shù)、標準批處理層、池化層這三部分組成第二部分。全連接層、Softmax層和輸出層構成第三部分。
改進后的卷積神經(jīng)網(wǎng)絡結構如圖3所示,改進后的卷積神經(jīng)網(wǎng)絡結構各層介紹:(1)輸入層為字符的圖片,圖片大小32×32;(2)C1為卷積層,輸入圖片經(jīng)過該層后得到6張28×28的特征圖,該層中共用了6個大小為5×5的過濾器;(3)S2為池化層,6張C1層處理得出的的特征圖經(jīng)過池化變成大小為 28×28 的特征圖,每個過濾器大小為2×2;(4)C3為卷積層,池化處理過的圖片經(jīng)過C3層后得到16個10×10的特征圖,每個過濾器大小為5×5,共16×6個卷積核;(5)S4為為池化層,16張C3層處理得出的的特征圖經(jīng)過池化變成大小為5×5的特征圖,每個過濾器大小為2×2;(6)C5層為卷積層,池化處理過的圖片經(jīng)過C3層后得到120個1×1的特征圖,每個過濾器大小為5×5;(7)F6層為全連接層,C5層的120個特征圖經(jīng)過F6層后得到120×1×1共120個神經(jīng)元,輸出節(jié)點數(shù)為84個;(9)輸出層包含34個神經(jīng)元,對應著34個字符的輸出。
3.3 實驗結果
實驗環(huán)境:GPU為NVIDIA GTX960M獨立顯示芯片,2G獨立顯存;CPU為Intel i5-6300HQ,主頻2.30GHz、4GB內(nèi)存、4核;64位Microsoft Windows 10操作系統(tǒng),MatlabR2017b編程語言。DeepLearnToolbox-master深度學習算法軟件包,使用GPU計算。在Chars74K數(shù)據(jù)集中選取36040張字符圖像,每個字符1060張,共34個字符(10類數(shù)字字符,24類字母字符,除去字母O和I)。
3.3.1 標準化層對識別準確率的影響
實驗對象:卷積神經(jīng)網(wǎng)絡與改進卷積神經(jīng)網(wǎng)絡。實驗結果如表1所示。
從表中可以看出在相同的參數(shù)下,加入標準化層與未加入標準化層的卷積神經(jīng)網(wǎng)絡在識別率上由94.12%提高到了94.95%。由此可以看出標準化層對卷積神經(jīng)網(wǎng)絡在識別準確率方面有一定提升。
3.3.2 C5層和C5層卷積核個數(shù)對識別率的影響
實驗對象:卷積神經(jīng)網(wǎng)絡與含C5層的卷積神經(jīng)網(wǎng)絡。實驗結果如表2所示。
從表中可以看出在相同的參數(shù)下,加入C5卷積層與未加入C5卷積層的卷積神經(jīng)網(wǎng)絡在識別率上由94.12%提高到了94.83。根據(jù)該實驗數(shù)據(jù)可以得出C5卷積層在提高識別準確率方面有著一定效果。
實驗對象:C5層卷積核個數(shù)。實驗結果如表3所示。
從表中可以看出C5層卷積核個數(shù)對識別準確率有著一定的影響,隨著卷積核個數(shù)的提高識別準確率也隨之提高,這體現(xiàn)了在輸出層的神經(jīng)元個數(shù)增加后,識別精度隨著卷積核數(shù)增加而提高,但當卷積核數(shù)增加到一定數(shù)目時,識別精度不會提高。
3.3.3 三種神經(jīng)網(wǎng)絡的對比
實驗對象:全連接神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡與改進卷積神經(jīng)網(wǎng)絡。參數(shù)設置:迭代次數(shù)30,學習率0.003,實驗數(shù)據(jù)集:4200張樣本圖片。實驗結果如表4所示。
從表中可以看出改進后的卷積神經(jīng)網(wǎng)絡與全連接神經(jīng)網(wǎng)絡相比識別準確率提高了約10%,與卷積神經(jīng)網(wǎng)絡相對比識別準確率提高了約2%。
3.3.4 三種神經(jīng)網(wǎng)絡準確率對比圖
圖4表示的是這三種神經(jīng)網(wǎng)絡在相同迭代次數(shù)下的準確率對比圖,長劃線類型曲線代表全連接神經(jīng)網(wǎng)絡的準確率變化圖,系統(tǒng)點線類型曲線代表LeNet-5神經(jīng)網(wǎng)絡的準確率變化圖,長劃線—點線類型代表改進后的卷積神經(jīng)網(wǎng)絡準準確率變化圖。由圖4可知,卷積神經(jīng)網(wǎng)絡在圖像識別方面確實優(yōu)于全連接神經(jīng)網(wǎng)絡,而改進后的卷積神經(jīng)網(wǎng)絡的識別準確率最好。
4 結論(Conclusion)
本文對卷積神經(jīng)網(wǎng)絡對車牌識別方面進行了深入的研究。為了提高車牌識別準確率,我們對卷積神經(jīng)網(wǎng)絡的層次結構進行改進,改進后的卷積神經(jīng)網(wǎng)絡經(jīng)過試驗中參數(shù)的調(diào)整準確率達到了96.24%,相較于經(jīng)典的卷積神經(jīng)網(wǎng)絡準確率提高了大約2%。
參考文獻(References)
[1] 趙娜,袁家斌,徐晗.智能交通系統(tǒng)綜述[J].計算機科學,2014,41(11):7-11;45.
[2] HE K,ZHANG X,REN S,et al.Deep residual learning for image recognition[EB/OL].https://arx-iv.org/abs/1512.03385,2016-12-10.
[3] Ding,H.Li,C.Hu,et al.ALEXNET FEATURE EXTRACTION AND MULTI-KERNEL LEARNING FOR OBJECTORIENTEDCLASSIFICATION[J].ISPRS-International Archives of the Photogrammetry,Remote Sensing and SpatialInformationSciences,2018,XLII-3.
[4] SIMONYAN K,ZISSERMAN A.Very deep convolutional networks for largescale image recognition[EB/OL].https://arxiv.org/abs/1409.1556,2016-12-10.
[5] Pengjie Tang,Hanli Wang,Sam Kwong.G-MS2F:GoogLeNet based multistage feature fusion of deep CNN for scene recognition[J].Neurocomputing,2017,225(15):188-197.
[6] 易超人,鄧燕妮.多通道卷積神經(jīng)網(wǎng)絡圖像識別方法[J].河南科技大學學報(自然科學版),2017,38(03):41-44;5-6.
[7] 單勇,程環(huán)環(huán),張曉燕.基于多觀察層次動態(tài)貝葉斯網(wǎng)絡的視頻行為分析[J].電路與系統(tǒng)學報,2012,17(06):124-131.
[8] 奚雪峰,周國棟.面向自然語言處理的深度學習研究[J].自動化學報,2016,42(10):1445-1465.
[9] 趙志宏,楊紹普,馬增強.基于卷積神經(jīng)網(wǎng)絡LeNet-5的車牌字符識別研究[J].系統(tǒng)仿真學報,2010,22(03):638-641.
作者簡介:
徐紹凱(1997-),男,本科生.研究領域:軟件開發(fā),人工智能.
陳 尹(1997-),男,本科生.研究領域:軟件開發(fā),人工智能.
趙林娟(1993-),女,本科生.研究領域:軟件開發(fā),人工智能.
姜代紅(1969-),女,博士,教授.研究領域:數(shù)據(jù)庫,人工智能.