姜改新
摘 要:對于車牌識別過程中的字符識別問題,提出了基于模板匹配和SVM(支持向量機)的方法,這兩種方法各自有自己的特點,識別率都比較高。本文給出了這兩種方法的性能比較,可以在具有不同需求的情況下采用不同算法。
關鍵詞:模板匹配;SVM;字符識別;性能對比
1 引言
隨著生活水平的提高的汽車行業(yè)的發(fā)展,家用汽車和其他類型的汽車越來越多,在很多方面造成了監(jiān)管不便的問題。汽車的車牌號就猶如人的身份證件號一樣是汽車唯一的身份識別信息,在交通系統(tǒng),住宅小區(qū),事業(yè)單位和學校等等許多地方為了信息監(jiān)測和安全防范都需要檢驗汽車的身份信息,單單靠人工的方式識別顯然十分困難,車牌識別系統(tǒng)的出現(xiàn)在一定程度上為汽車信息識別提供了很大的便利,應用市場也十分廣泛。車牌識別系統(tǒng)的流程一般是首先進行車牌圖像的獲取,然后對圖像進行預處理,而車牌定位、車牌字符分割和字符識別這幾個部是比較核心的步驟,本文對字符識別這一部分提供了模板匹配和支持向量機這兩種算法,給出了特點的介紹和性能的比較。
2 支持向量機
支持向量機方法的基本模型是定義在特征空間上的間隔最大線性分類器,學習的目標是在特征空間中找到一個分類超平面,能夠將實例分到不同的類。分類特征要求分類內(nèi)部樣本距離足夠小,類間樣本距離足夠大。根據(jù)以上原理構造的SVM判別函數(shù)為:
a為約束函數(shù)的解,y是出入樣本的值,為核函數(shù)。
步驟:
(1)對測試樣本進行預處理,使其便于獲得特征;(2)再對字符圖像求其特征參數(shù);(3)根據(jù)SVM方法進行判別。
SVM著重于最小化訓練集的結構誤差,識別效率高,識別速度快,測試誤差小,而且還具有較強的泛化能力,但是SVM是基于小樣本統(tǒng)計理論的基礎上的,對于數(shù)據(jù)量很大的訓練樣本,SVM的訓練時間比較長。
3 模板匹配算法
我國普通汽車車牌的字符共有七位,第一位是各省或者直轄市的漢字簡稱,然后第二位是A~Z的字母,后五位是數(shù)字和字母的混合搭配,由于字符特征差距較大,采用不同的模板分別識別,提高了效率和準確性。在進行模板匹配之前,為了提高抗干擾能力,已經(jīng)對圖像進行了濾波去噪和二值化等操作。模板匹配操作步驟如下:
字符切割后,為了便于字符的識別,消除字符的大小對識別的影響,提高識別的精度,將每個字符的圖片進行歸一化,歸一化包括位置歸一化和大小歸一化。常用的歸一化有兩種方法:一種是將字符圖像的外邊框按比例線性放大或縮小到規(guī)定尺寸;另一種是根據(jù)水平和垂直兩個方向像素的分布進行大小歸一化。
相似度計算方法選用最小距離相似度計算方法:
匹配二維離散圖像中對應像素點p(x,y)和q(s,t),它們的歐式距離,也就是幾何距離為:
圖像總像素的歐氏距離和為:
計算出總的歐氏距離D,將結果存放在數(shù)組中,然后找到數(shù)組中的最小值,對應的圖像就是匹配的字符。相對于神經(jīng)網(wǎng)絡算法,該模板匹配不需要特征提取過程,字符圖像直接用作特征進行處理,具有最高相似度的即為識別結果,適用于大多數(shù)的識別,簡單易行,并且可以并行處理。然而,模板只能識別相同的大小,相同類型的字符,不具有旋轉不變性,尺寸不變,且計算量較大,速度較慢。對于特別小的圖像,因為小的圖像像素點比較少,導致相關性被極大的縮小,使得對特征的識別不明顯,對結果產(chǎn)生很大的影響。右圖為模板匹配法識別結果。
4 結語
字符識別是車牌識別過程中較為核心的一個步驟,該實驗總共有圖庫400張,其中訓練集中有300張,測試集中有100張。經(jīng)過測試,由結果得到支持向量機算法和模板匹配法對漢字字符的識別率高達90%以上,對字母和數(shù)字的識別率則是更高,在現(xiàn)實的應用中具有很好的效果。
參考文獻:
[1]劉永春.基于SVM的車牌字符識別算法研究[J].四川理工學院學報,2012(08).
[2]任德昊,陳超,李文藻.基于Gabor變換和支持向量機的手寫體字符識別算法[J].成都信息工程學院學報,2009(08).
[3]史忠植.人工智能[M].機械工業(yè)出版社,2016(01).