摘 要:對(duì)車(chē)牌識(shí)別(LPR)系統(tǒng)中字符分割與字符識(shí)別方法進(jìn)行探討#65377;根據(jù)車(chē)牌字符的特點(diǎn),首先利用投影法采用水平掃描和垂直掃描進(jìn)行字符分割,接著對(duì)字符圖像進(jìn)行歸一化處理,實(shí)現(xiàn)對(duì)字符的完全分割#65377;在此基礎(chǔ)上,利用BP神經(jīng)網(wǎng)絡(luò)識(shí)別算法實(shí)現(xiàn)車(chē)牌字符的識(shí)別,從而提高系統(tǒng)的識(shí)別速度和識(shí)別率#65377;數(shù)字仿真的識(shí)別結(jié)果驗(yàn)證了該方法的正確性和有效性#65377;
關(guān)鍵詞:車(chē)牌識(shí)別(LPR);字符分割;字符識(shí)別; BP網(wǎng)絡(luò)
中圖分類(lèi)號(hào):TP391.41文獻(xiàn)標(biāo)識(shí)碼:A
1 引 言
隨著國(guó)民經(jīng)濟(jì)的不斷發(fā)展,國(guó)內(nèi)的高速公路,收費(fèi)站#65380;停車(chē)場(chǎng)越來(lái)越多,為了加強(qiáng)這一領(lǐng)域的管理自動(dòng)化,智能交通系統(tǒng) (Intelligent Transportation Systems, ITS) 的發(fā)展也就顯得日益迫切#65377;車(chē)牌識(shí)別(License Plate Recognition, LPR) 是ITS 的一個(gè)重要組成部分,它能從一幅圖像中自動(dòng)提取車(chē)牌圖像,自動(dòng)分割字符圖像,進(jìn)而對(duì)字符進(jìn)行識(shí)別#65377;車(chē)牌識(shí)別系統(tǒng)的成功開(kāi)發(fā)必將大大加速I(mǎi)TS 的進(jìn)程#65377;智能車(chē)牌自動(dòng)識(shí)別是一項(xiàng)利用車(chē)輛的動(dòng)態(tài)視頻或靜態(tài)圖像進(jìn)行車(chē)牌號(hào)碼#65380;車(chē)牌顏色自動(dòng)識(shí)別的神經(jīng)網(wǎng)絡(luò)識(shí)別技術(shù)[1]#65377; 其硬件基礎(chǔ)一般包括觸發(fā)設(shè)備(監(jiān)測(cè)車(chē)輛是否進(jìn)入視野)#65380;攝像設(shè)備#65380;照明設(shè)備#65380;圖像采集設(shè)備#65380;識(shí)別車(chē)牌號(hào)碼的處理機(jī)(如計(jì)算機(jī))等,其軟件核心包括車(chē)牌定位算法#65380;車(chē)牌字符分割算法和神經(jīng)網(wǎng)絡(luò)字符識(shí)別算法等#65377;
2 智能車(chē)牌自動(dòng)識(shí)別系統(tǒng)
一個(gè)完整的車(chē)牌識(shí)別系統(tǒng)應(yīng)包括車(chē)輛檢測(cè)#65380;圖像采集#65380;車(chē)牌識(shí)別等幾部分#65377;字符分割和字符識(shí)別是智能車(chē)牌自動(dòng)識(shí)別過(guò)程中的兩個(gè)關(guān)鍵步驟,已有的處理方法或多或少地都存在一定的不足和局限性#65377;文獻(xiàn)[2]采用閾值分割的方法分割車(chē)牌字符,僅僅考慮了圖像的灰度信息,忽略了空間信息,難以解決背景復(fù)雜的圖像分割問(wèn)題;文獻(xiàn)[3][4]采用邊緣檢測(cè)方法測(cè)得車(chē)牌邊緣,分割車(chē)牌字符,該方法要求圖像邊緣的連續(xù)性好,但是實(shí)際系統(tǒng)中攝像頭拍攝的車(chē)牌邊框往往是時(shí)斷時(shí)續(xù)的;另外,Paolo Comelli以收費(fèi)站實(shí)時(shí)拍攝的汽車(chē)準(zhǔn)靜態(tài)圖象為處理對(duì)象[5],但系統(tǒng)的成功實(shí)現(xiàn)大大受益于國(guó)外牌照的規(guī)范統(tǒng)一#65377;本文主要對(duì)字符分割和字符識(shí)別方法進(jìn)行探討#65377;
計(jì)算技術(shù)與自動(dòng)化2007年6月第26卷第2期張 劍等:一種基于字符分割與字符識(shí)別的LPR方法
3 車(chē)牌字符分割
3.1 車(chē)牌區(qū)域特征
根據(jù)1992年中華人民共和國(guó)機(jī)動(dòng)車(chē)號(hào)牌GA36-92標(biāo)準(zhǔn),汽車(chē)前車(chē)牌有以下特征:
1)外廓尺寸:440×140(mm);
2)顏色:小功率汽車(chē)所用的藍(lán)底白字牌照,大功率汽車(chē)所用的黃底黑字牌照,軍用或警用的白底黑字#65380;紅字牌照及國(guó)外駐華機(jī)構(gòu)用的黑底白字牌照;
3)標(biāo)準(zhǔn)樣式:·x1x2·x3x4x5x6x7,其中x1是各省#65380;直轄市的簡(jiǎn)稱(chēng),如“京\"#65380;“津\"#65380;“滬\"#65380;“魯\"等,x2是大寫(xiě)英文字母,如“A\",“B\",“C\"等,x3x4x5x6x7可能是英文字母A-Z,也可能是阿拉伯?dāng)?shù)字0-9,每個(gè)字寬45mm,字長(zhǎng)90mm,間隔符寬10mm,每個(gè)單元間隔12mm#65377;
所有牌照?qǐng)D像都有一些共同特征,歸納如下:
1)圖像上有大量長(zhǎng)短不一類(lèi)似直線(xiàn)與長(zhǎng)方形的區(qū)域,還有一些灰度特征類(lèi)似于文字區(qū)域的汽車(chē)廠(chǎng)商標(biāo)志區(qū)域,如奧迪車(chē)的圖像類(lèi)似于4個(gè)O組成的標(biāo)志#65377;
2)車(chē)牌文字周?chē)幸粋€(gè)類(lèi)似于長(zhǎng)方形的邊框,其厚度不一,而且有斷裂處,有時(shí)候彎曲度比較大#65377;
3)文字大小統(tǒng)一,排列成行,由于拍攝原因有一定程度傾斜,文字與背景之間有明顯灰度比#65377;
3.2 車(chē)牌字符分割方法
系統(tǒng)在讀進(jìn)來(lái)的圖像(如圖2)中一般會(huì)含有多個(gè)數(shù)字,識(shí)別的時(shí)候只能根據(jù)每個(gè)字符的特征來(lái)進(jìn)行判斷,所以還要進(jìn)行字符分割的工作,這一步工作就是把圖像中的字符獨(dú)立的分割出來(lái)#65377;字符分割是字符識(shí)別的基礎(chǔ),它決定孤立字符的狀況#65377;
通常的字符切分有以下幾種方法:
1)間距#65380;間隙切分法
利用字符間隙(相鄰字符間的間隔)和字符間距(相鄰字符中心的距離)進(jìn)行字符切分#65377;這里要求字符的寬度和字符間隙基本相同,故對(duì)輸入圖像質(zhì)量的依賴(lài)性很大#65377;
2) 投影法
利用水平和垂直投影來(lái)進(jìn)行字符切分#65377;水平投影特征是每一行中心黑色素點(diǎn)的總和;垂直投影特征是每一列中心黑色素點(diǎn)的總和#65377;這種切分有速度快的特點(diǎn),但對(duì)不規(guī)范的字符會(huì)出現(xiàn)誤切分的情況#65377;
3)識(shí)別切分法
其切分標(biāo)準(zhǔn)是識(shí)別的信度,其信度由單字符識(shí)別模塊給出[6]#65377;一般,識(shí)別信度還可以由后處理的詞法#65380;句法#65380;語(yǔ)義分析給出#65377;
本文主要利用二值化后的投影信息,輔以各種判斷條件來(lái)進(jìn)行字符分割,也就是上面介紹的第二種方法#65377;由于車(chē)牌字符區(qū)有一定的高度,所以事先進(jìn)行水平投影,這樣可以利用水平投影信息將相當(dāng)一部分非字符候選點(diǎn)抹去,再經(jīng)過(guò)歸一化使之成為規(guī)范圖像輸出給字符識(shí)別部分#65377;
3.3 字符分割的具體算法
第1步,先自下向上對(duì)圖像進(jìn)行逐行掃描直至遇到第一個(gè)黑色的像素點(diǎn)#65377;記錄下來(lái)#65377;然后再由上向下對(duì)圖像進(jìn)行逐行掃描直至找到第一個(gè)黑色像素,這樣就找到圖像大致的高度范圍#65377;
第2步,在這個(gè)高度范圍之內(nèi)在自左向右逐列進(jìn)行掃描,遇到第一個(gè)黑色像素時(shí)認(rèn)為是字符分割的起始位置,然后繼續(xù)掃描,直至遇到有一列中沒(méi)有黑色像素,則認(rèn)為這個(gè)字符分割結(jié)束,然后繼續(xù)掃描,按照上述的方法一直掃描直至圖像的最右端#65377;這樣就得到了每個(gè)字符的比較精確寬度范圍#65377;
第3步,在已知的每個(gè)字符比較精確的寬度范圍內(nèi),按照第一步的方法,分別進(jìn)行自上而下和自下而上的逐行掃描來(lái)獲取每個(gè)字符精確的高度范圍#65377;
3.4 過(guò)寬塊和過(guò)窄塊的處理
具體過(guò)程如下:
1)求出區(qū)域的平均寬度,算法類(lèi)似于求字符的平均寬度,或是以字符寬度代替區(qū)域的平均寬度#65377;
2)分析過(guò)大的區(qū)域,看其是否由兩個(gè)字符組成,如是則將其分成兩塊區(qū)域#65377;
3)分析過(guò)小的區(qū)域,看其是否可以跟左右區(qū)域合并#65377;
通過(guò)以上步驟可以得到分割的字符,然后對(duì)字符定出鄰接矩形,對(duì)其歸一化處理#65377;
3.5 圖像的歸一化處理
因?yàn)閽呙柽M(jìn)來(lái)的圖像中字符大小存在較大的差異,而相對(duì)來(lái)說(shuō),統(tǒng)一尺寸的字符識(shí)別的標(biāo)準(zhǔn)性更強(qiáng),準(zhǔn)確率自然也更高,標(biāo)準(zhǔn)化圖像就是要把原來(lái)各不相同的字符統(tǒng)一到同一尺寸,在本系統(tǒng)中是統(tǒng)一到同一高度,然后根據(jù)高度來(lái)調(diào)整字符的寬度#65377;具體算法如下:先得到原來(lái)字符的高度,并與系統(tǒng)要求的高度做比較,得出要變換的系數(shù),然后根據(jù)得到的系數(shù)求得變換后應(yīng)有的寬度#65377;在得到寬度高度之后,把新圖像里面的點(diǎn)按照插值的方法映射到圖像中#65377;車(chē)牌字符歸一化結(jié)果如圖3所示#65377;
4 車(chē)牌字符識(shí)別
字符識(shí)別方法目前主要有基于模板匹配算法和基于人工神經(jīng)網(wǎng)絡(luò)算法#65377;基于模板匹配算法首先把待識(shí)別字符二值化并將其尺寸大小縮放為字符數(shù)據(jù)庫(kù)中模板的大小,然后與所有的模板進(jìn)行匹配,最后選最佳匹配作為結(jié)果#65377;由于這種匹配算法穩(wěn)定性較差#65380;時(shí)間花費(fèi)也較大,因此在此基礎(chǔ)上提出了基于關(guān)鍵點(diǎn)的匹配算法#65377;此算法先對(duì)待識(shí)別字符進(jìn)行關(guān)鍵點(diǎn)提取,然后對(duì)關(guān)鍵點(diǎn)去噪,最后再確定字符的分類(lèi)#65377;這種匹配算法只利用了字符的關(guān)鍵點(diǎn)進(jìn)行匹配,因此提高了識(shí)別速度又具有較高的識(shí)別率#65377;基于人工神經(jīng)網(wǎng)絡(luò)的算法主要有兩種:一種是先對(duì)待識(shí)別字符進(jìn)行特征提取,然后用所獲得的特征來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)分類(lèi)器;另一種方法是直接把待處理圖像輸入網(wǎng)絡(luò),由網(wǎng)絡(luò)自動(dòng)實(shí)現(xiàn)特征提取直至識(shí)別出結(jié)果#65377;前一種方法識(shí)別結(jié)果與特征提取有關(guān),而特征提取比較耗時(shí),因此特征提取是關(guān)鍵#65377;后一種方法無(wú)須特征提取和模板匹配,隨著相關(guān)技術(shù)的進(jìn)步,這種方法更實(shí)用#65377;鑒于以上兩種識(shí)別方法的比較,本文采用基于人工神經(jīng)網(wǎng)絡(luò)進(jìn)行字符識(shí)別#65377;
4.1 人工神經(jīng)網(wǎng)絡(luò)的概述
人工神經(jīng)網(wǎng)絡(luò)是指利用工程技術(shù)手段模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能的一種技術(shù),它的目的是使機(jī)器具有人腦那樣的感知#65380;學(xué)習(xí)和推理功能[7]#65377;
神經(jīng)網(wǎng)絡(luò)用于圖像識(shí)別具有以下優(yōu)點(diǎn):神經(jīng)網(wǎng)絡(luò)的信息分布式存儲(chǔ)于聯(lián)結(jié)權(quán)值系數(shù)中,使網(wǎng)絡(luò)具有很高的容錯(cuò)性,而圖像識(shí)別中往往存在噪聲或輸入圖像部分損失,因此神經(jīng)網(wǎng)絡(luò)可以較好地解決圖像識(shí)別問(wèn)題#65377;另外,神經(jīng)網(wǎng)絡(luò)的自組織和自學(xué)習(xí)功能,大大放松了傳統(tǒng)圖像識(shí)別方法所需的約束條件,使其對(duì)圖像識(shí)別問(wèn)題顯示出極大的優(yōu)越性#65377;
網(wǎng)絡(luò)不僅有輸入節(jié)點(diǎn),輸出節(jié)點(diǎn),而且有隱層節(jié)點(diǎn)(可以是一層或多層),如圖4所示#65377;對(duì)于輸入信號(hào),要先向前傳播到隱節(jié)點(diǎn),經(jīng)過(guò)作用函數(shù)后,再把隱節(jié)點(diǎn)的輸出信息傳播到輸出節(jié)點(diǎn),最后給出輸出結(jié)果#65377;節(jié)點(diǎn)作用函數(shù)通常選取Sigmoid函數(shù):
4.2BP神經(jīng)網(wǎng)絡(luò)算法
BP算法的過(guò)程,由正向傳播和反向傳播組成#65377;在正向傳播過(guò)程中,輸入信息從輸入層經(jīng)隱單元層逐層處理,并傳向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)#65377;如果在輸出層不能得到期望的輸出,則轉(zhuǎn)入反向傳播,將誤差信號(hào)沿原來(lái)的連接通路返回,通過(guò)修改各層神經(jīng)元的權(quán)值,使得誤差信號(hào)最小#65377;神經(jīng)網(wǎng)絡(luò)的反饋調(diào)節(jié),在誤差信號(hào)的反向傳播中,網(wǎng)絡(luò)不斷地修正各個(gè)節(jié)點(diǎn)的權(quán)值#65377;
設(shè)有n個(gè)節(jié)點(diǎn)的BP網(wǎng)絡(luò),采用S型激勵(lì)函數(shù)#65377;為簡(jiǎn)單起見(jiàn),可以假設(shè)網(wǎng)絡(luò)只有一個(gè)輸出y,任一節(jié)點(diǎn)的輸出為Oi,并設(shè)有N個(gè)樣本(xk,yk),k=1,2,3,…,N,對(duì)某一輸入xk,網(wǎng)絡(luò)的輸出為yk,節(jié)點(diǎn)i的輸出為Oik,節(jié)點(diǎn)j的輸入為:
使用平方型誤差函數(shù):
其中,yk為網(wǎng)絡(luò)之實(shí)際輸出,定義如下:
設(shè)計(jì)BP網(wǎng)絡(luò)的關(guān)鍵之處在于高效的特征提取方法#65380;大量有代表性的訓(xùn)練樣本#65380;高速穩(wěn)定收斂的學(xué)習(xí)方法#65377;
4.3 識(shí)別效果
由于缺少配套的圖像采集設(shè)備,所采集到的車(chē)輛圖像不十分理想,并且得到的圖像是在陰雨天氣下拍攝的,所以在識(shí)別過(guò)程中難免會(huì)出現(xiàn)誤差#65377;此外,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)也有待優(yōu)化,需要進(jìn)一步探討和研究#65377;對(duì)于圖1所示車(chē)牌圖像,其識(shí)別效果如圖5所示,能夠完全實(shí)現(xiàn)車(chē)牌字符的識(shí)別#65377;
圖5 識(shí)別效果[JZ)]
5 結(jié) 論
智能車(chē)牌自動(dòng)識(shí)別技術(shù)主要包括圖像預(yù)處理#65380;車(chē)牌的定位與分割#65380;字符分割和字符識(shí)別四大部分,本文著重對(duì)字符分割與字符識(shí)別方法進(jìn)行了探討#65377;
字符分割是將車(chē)牌區(qū)域分割成單個(gè)字符#65377;本文采用水平掃描和垂直掃描進(jìn)行字符分割,獲得較好的效果#65377;字符識(shí)別是對(duì)分割的字符進(jìn)行識(shí)別,這里采用BP神經(jīng)網(wǎng)絡(luò)算法,提高系統(tǒng)的識(shí)別速度和識(shí)別率#65377;
智能車(chē)牌自動(dòng)識(shí)別系統(tǒng)是解決公路交通配套設(shè)施效率瓶頸問(wèn)題的有效措施之一,具有廣泛的應(yīng)用前景和商業(yè)價(jià)值,必將為我國(guó)公路交通事業(yè)的發(fā)展做出更為重大的貢獻(xiàn)#65377;
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。
計(jì)算技術(shù)與自動(dòng)化2007年2期