胡智鵬(北華大學(xué) 信息技術(shù)與傳媒學(xué)院,吉林 吉林 132013)
?
基于人工神經(jīng)網(wǎng)絡(luò)的車牌識別探究
胡智鵬
(北華大學(xué) 信息技術(shù)與傳媒學(xué)院,吉林 吉林 132013)
摘 要:近年來,隨著人們生活水平的提高,交通道路中的車輛數(shù)量也日益增多,如何快速有效的管制交通顯得尤為重要。為了解決交通管制問題,越來越多的研究者將目光轉(zhuǎn)向以計算機為基礎(chǔ)的自動控制系統(tǒng)。自動車牌識別系統(tǒng)是近幾年研究的熱點話題,本文在這項工作中,提出了基于人工神經(jīng)網(wǎng)絡(luò)的車輛牌自動識別系統(tǒng)。在系統(tǒng)中,使用已知車輛圖片,對車牌指定區(qū)域進行算法識別,算法能夠識別的字符包括單個漢字、字母和數(shù)字,在車牌定位上利用Canny邊緣檢測算子和斑點染色法測定,斑點的著色方法應(yīng)用于投資回報率的性狀分離。最后,通過使用平均絕對偏差公式提取字符特征,利用反向傳播多層感知器神經(jīng)網(wǎng)絡(luò)對數(shù)字字符進行分類。
關(guān)鍵詞:車牌識別;人工神經(jīng)網(wǎng)絡(luò);模糊著色;字符識別
隨著科技的進步人們生活水平的提高,私家車的數(shù)量也正在日益增加。在城市車輛管理中對車輛及其車牌的識別要求越來越多,為了能夠快速準確的識別車牌號碼,多數(shù)學(xué)者將目光轉(zhuǎn)向以計算機為基礎(chǔ)的自動車牌識別系統(tǒng)的開發(fā)[1]。在這項研究中,本文提出了一個較為高效的基于人工神經(jīng)網(wǎng)絡(luò)的自動車牌牌照識別系統(tǒng),系統(tǒng)由三部分組成,首先從車牌圖像中對車牌區(qū)域進行定位,然后從車牌圖像中分割出車牌圖像,最后識別出車牌圖像的分割特征。
車牌識別系統(tǒng)的第一階段就是從車輛圖像中找到車牌位置。該板塊區(qū)域由藍色背景和白色字符組成,在此版塊中,藍色和白色兩種顏色之間的轉(zhuǎn)換是非常密集的。我們發(fā)現(xiàn)該地區(qū)中包括過渡點最多,分離找到的板塊區(qū)域。
用Canny邊緣檢測算子[2]在車輛分離圖像中獲得相應(yīng)過渡點。這里,Canny邊緣檢測器使用一個濾波器基于一階導(dǎo)數(shù)的高斯平滑。對平滑后的圖像消除噪聲,接下來的工作就是找到邊緣強度的圖像梯度。在這個過程中,算法需要逐個計算出梯度的邊緣強度,再結(jié)合版塊邊緣點,找出過渡點最為密集的區(qū)域,這個區(qū)域即為目標版塊區(qū)域。根據(jù)邊緣圖,確定過渡點之間藍色和白色的顏色特征。
在分割過程中加強灰度車牌圖像的處理,因為對比度的差異發(fā)生在相機的圖像上。此外,將不需要的臟區(qū)域分割存儲。
在這項工作中,通過施加對比度擴展和中值濾波技術(shù)對灰度圖像增強,通過圖像和噪聲的對比度,可將白色背景下的臟區(qū)域完全消除。圖像增強后,對斑點實施著色方法來確定有效字符的邊界。
擴展圖像的對比度,就意味著對圖像的直方圖均衡化[3]。換句話說,通過對比度擴展使圖像銳化。圖像的灰度直方圖是圖像中灰度值的分布,直方圖均衡化是一種目前較為流行的技術(shù),作用是改善一個貧窮的對比圖像的外觀。
中值濾波主要用于消除不必要的噪聲區(qū)域。這種濾波方法,實際上是通過周圍的圖像構(gòu)建3X3矩陣,其中,矩陣的維數(shù)可以根據(jù)噪聲電平進行調(diào)整。
本文使用BLOB著色算法[4]在二值圖像區(qū)域構(gòu)建框架。該算法使用一個特殊的升形模板掃描圖像從左至右,從上到下,通過掃描確定獨立的區(qū)域,再獲得連接到四個方向的背景區(qū)域。這里,四個方向上的斑點著色算法使用二進制編碼的車牌圖像獲取特征。最后,從車牌區(qū)域的圖像獲得的分段字符。
在這項工作中,分段的字符分別表示為漢字、數(shù)字和字母。為了達成這個目的,將車牌圖像分為兩個區(qū)域:第一個區(qū)域由一個漢字和一個字母組成,表示城市交通代碼;第二個區(qū)域由五位數(shù)字或字母組成。在這一過程中,需要對實驗圖像進行掃描,掃描的形式為從左向右水平掃描,記錄空格位置,如果空格的值高于該字符區(qū)域的閾值,則該位置即為分割位置。
將之前獲得的分割字符圖像分別保存為文件。通過使用兩個單獨的人工神經(jīng)網(wǎng)絡(luò)對圖像進行識別,增加識別成功率。分類前,先要進行特征提取,特征提取為我們提供了一個圖像分割最重要的信息,此信息可以作為一個特征向量。使用特征向量對全局和局部特征的字符編碼,為后面字符比較做準備。在所提出的方法中,本文使用平均絕對偏差算法的虹膜圖像的特征向量進行編碼。
在這項工作中,數(shù)字圖像分為4x5像素尺寸的子圖像和字母圖像分為5x5像素尺寸的圖像,每個子圖像都有獨特的提取特征。將整個特征向量應(yīng)用于人工神經(jīng)網(wǎng)絡(luò)作為字符分類的輸入。
在字符識別方面,我們首先要對漢字、數(shù)字和字母進行分類,本文使用兩個單獨的人工神經(jīng)網(wǎng)絡(luò)對圖像進行識別增加成功率。在構(gòu)建架構(gòu)時,兩者都有相同的架構(gòu),只有輸入號碼不同。使用兩個單獨的人工神經(jīng)網(wǎng)絡(luò)識別的原因是提升識別相似度較高的數(shù)字和字母,如“0”,“o”,“O”和“z”,“Z”等的準確度。
在該方法中,使用一個多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)模型來進行特征分類。MLP處理單元被安排在三層:輸入層,隱層(有助于網(wǎng)絡(luò)計算更復(fù)雜的關(guān)聯(lián))和輸出層。在輸入層中的每個神經(jīng)元被直接饋送到隱藏層神經(jīng)元獲得一系列的權(quán)重,各節(jié)點的權(quán)重和輸入的產(chǎn)品的總和進行計算,通過一系列的權(quán)重,將計算結(jié)果直接饋送到輸出層神經(jīng)元。在隱藏層中,計算出輸出層中每個節(jié)點的權(quán)值和隱層神經(jīng)元輸出的總和。如果計算出的輸出值與期望值之間的誤差超過了誤差率,則訓(xùn)練(通過使用新的權(quán)重改變權(quán)重和計算新的輸出)過程開始,這個訓(xùn)練過程可以通過獲得所有輸入組合的期望誤差率來完成。
實驗采用259個車輛圖像,系統(tǒng)最大迭代次數(shù)為5000代,當(dāng)系統(tǒng)到達用戶定義的最小錯誤率時,將停止迭代。此應(yīng)用程序的最小錯誤率為0.001。實驗結(jié)果顯示,247個車牌在圖像識別系統(tǒng)中被正確識別,系統(tǒng)的整體識別率為95.36%。雖然系統(tǒng)的正確識別率較高,但是在實驗過程中,由于系統(tǒng)設(shè)計較為復(fù)雜,系統(tǒng)在車牌識別上耗時較多,如何能夠簡化系統(tǒng),提升車牌識別速度,這將是本文下一步的工作。
參考文獻:
[1]吳紅梅,陳繼榮,鹿曉亮.一種新的車牌字符分割方法[J].計算機仿真,2007(02).
[2]梁中巖,張三元.一種用于車牌識別的融合特征提取方法[J].信息化研究,2015(06).
[3]張劍.車牌識別中字符識別的研究[J].信息技術(shù),2011(09).
[4]魏武,黃心漢,張起森,王敏,王明俊.基于模板匹配和神經(jīng)網(wǎng)絡(luò)的車牌字符識別方法[J].模式識別與人工智能,2001(01).
DOI:10.16640/j.cnki.37-1222/t.2016.13.129