王孟濤
目前基于LeNet5網(wǎng)絡(luò)結(jié)構(gòu)的車(chē)牌圖形識(shí)別算法存在識(shí)別誤差大、效率低等缺點(diǎn)。本文對(duì)原算法進(jìn)行了改進(jìn),具體做法是轉(zhuǎn)化車(chē)牌圖像大小、刪除LeNet5網(wǎng)絡(luò)中的C5層、修改輸出層的神經(jīng)元數(shù)量等。經(jīng)驗(yàn)證,算法在識(shí)別率和時(shí)間效率上均得到有效提高。
LeNet-5卷積神經(jīng)網(wǎng)絡(luò)原理
改進(jìn)的LeNet5網(wǎng)絡(luò)結(jié)構(gòu)
對(duì)原LeNet5網(wǎng)絡(luò)提出以下幾點(diǎn)改進(jìn):
①輸入圖片歸一化為32×16像素:中國(guó)車(chē)牌字符長(zhǎng)度和寬度為90 mm×45mm。減小輸入圖像尺寸能夠減少模型訓(xùn)練參數(shù),提高網(wǎng)絡(luò)運(yùn)算效率。
②使用ReLU激活函數(shù):有利于緩和模型的梯度消失。
③取消C5層:將LeNet5網(wǎng)絡(luò)原C5層改為F6層,減少模型總體的訓(xùn)練參數(shù)數(shù)量。
④加入Dropout。將失活率設(shè)置為0.5,減少參數(shù)更新的個(gè)數(shù),防止模型過(guò)擬合。
⑤將車(chē)牌字符漢字與數(shù)字/字母分開(kāi)識(shí)別。
改進(jìn)后的LeNet5網(wǎng)絡(luò)結(jié)構(gòu)與傳統(tǒng)LeNet5網(wǎng)絡(luò)結(jié)構(gòu)的對(duì)比如表1所示。
車(chē)牌識(shí)別策略
①圖片預(yù)處理:增強(qiáng)原始車(chē)牌圖片對(duì)比度,消除圖片的噪聲。
②車(chē)牌定位:使用基于二值圖像的形態(tài)學(xué)區(qū)域填充進(jìn)行車(chē)牌定位。
③字符分割:采用垂直投影法對(duì)車(chē)牌字符進(jìn)行分割。通過(guò)對(duì)二值化的車(chē)牌圖像進(jìn)行垂直投影,分析圖像像素的分布情況,再根據(jù)閾值切割車(chē)牌字符。
④字符識(shí)別:將分割后的車(chē)牌字符圖像輸入到網(wǎng)絡(luò)模型中。
實(shí)驗(yàn)與結(jié)論
通過(guò)網(wǎng)絡(luò)收集不同環(huán)境條件的國(guó)內(nèi)車(chē)牌圖像作為數(shù)據(jù)集。進(jìn)一步進(jìn)行圖像處理得到7 877張車(chē)牌字符圖像作為改進(jìn)后網(wǎng)絡(luò)的訓(xùn)練樣本。訓(xùn)練集中4 285張為數(shù)字和字母圖片,3 232張為漢字圖片;測(cè)試集包含360張圖片,200張數(shù)字和字母圖片,160張漢字圖片。
實(shí)驗(yàn)表明,改進(jìn)后的LeNet5網(wǎng)絡(luò)對(duì)于車(chē)牌中漢字識(shí)別率達(dá)到99 %,數(shù)字和字母識(shí)別率達(dá)到99.5 %,算法對(duì)于單張圖片識(shí)讀時(shí)間為2.748 ms。綜上,改進(jìn)后算法有效提高了車(chē)牌字符識(shí)別的準(zhǔn)確率,同時(shí)提高了算法運(yùn)算效率。