張秀玲, 齊 晴, 侯代標, 程艷濤, 付 棟
(燕山大學 a. 河北省工業(yè)計算機控制工程重點實驗室; b. 國家冷軋板帶裝備及工藝工程技術研究中心, 河北 秦皇島 066004)
?
混合優(yōu)化的RBF網(wǎng)絡車牌字符識別
張秀玲a,b, 齊 晴a, 侯代標a, 程艷濤a, 付 棟a
(燕山大學 a. 河北省工業(yè)計算機控制工程重點實驗室; b. 國家冷軋板帶裝備及工藝工程技術研究中心, 河北 秦皇島 066004)
應用RBF神經(jīng)網(wǎng)絡對車牌字符進行識別.在網(wǎng)絡中心參數(shù)確定階段,對每類字符分別采用最近鄰聚類和k-均值聚類相結(jié)合的算法來確定隱層中心值,從而解決傳統(tǒng)k-均值聚類算法中初始聚類中心需要被人為確定的問題;中心寬度通常通過公式來確定,為了消除此方法對中心值的依賴性,選擇遺傳算法對中心寬度進行優(yōu)化;輸出層連接權值則采用違逆法確定.仿真結(jié)果表明,設計的RBF神經(jīng)網(wǎng)絡可以有效地識別字符.
車牌; 字符識別; 徑向基函數(shù)神經(jīng)網(wǎng)絡(RBFNN); 聚類; 遺傳算法
隨著模式識別技術的發(fā)展,車牌字符識別已經(jīng)成為智能交通系統(tǒng)的重要組成部分[1],而字符識別的準確與否是評判系統(tǒng)性能的重要指標.對于車牌字符識別,目前最常用的方法是基于模板匹配的方法和基于神經(jīng)網(wǎng)絡的方法兩大類.前者多利用了字符的輪廓、網(wǎng)格、投影等統(tǒng)計特征,相似字符區(qū)分能力差,且因特征數(shù)據(jù)維數(shù)過大會導致識別速度慢;而后者在神經(jīng)網(wǎng)絡中,由于各個神經(jīng)元的結(jié)構(gòu)與功能較為簡單[2],具有一定的自適應的學習與組織能力,可以通過調(diào)整連接權值完成分類、識別等復雜的功能,因此,神經(jīng)網(wǎng)絡可對筆畫模糊的字符準確識別,是一種應用廣泛的識別方法[3-4],但是存在網(wǎng)絡輸入數(shù)據(jù)的選擇和網(wǎng)絡結(jié)構(gòu)設計等問題.常用神經(jīng)網(wǎng)絡有BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡等[5-6].RBF網(wǎng)絡的關鍵是對隱層神經(jīng)元參數(shù)的確定,隱層神經(jīng)元個數(shù)對網(wǎng)絡抗干擾能力有重大影響,如何確定隱層中心值最重要,若所選中心值不夠準確,則無法實現(xiàn)隱層到輸出層的映射關系;隱層中心寬度也在一定程度上影響網(wǎng)絡的分類能力.因此本文應用聚類與遺傳相結(jié)合的算法對RBF神經(jīng)網(wǎng)絡進行優(yōu)化設計,對每類字符分別采用最近鄰聚類和k-均值聚類[7]相結(jié)合的算法來確定隱層中心值,使用遺傳算法對中心寬度進行優(yōu)化,最后對分割的字符進行識別.
RBF神經(jīng)網(wǎng)絡字符識別流程圖如圖1所示.
圖1 RBF神經(jīng)網(wǎng)絡字符識別流程圖
字符識別前需要歸一化及特征提取,本文只對基于梯度直方圖[8-9]的特征提取法進行介紹,過程如下:
(1) 首先將灰度字符圖像分成細胞(cell)和塊(block).
(2) 計算灰度圖中單個像素的梯度值,公式如下所示,其中gx(x,y)表示水平梯度,gy(x,y)表示垂直梯度.gx(x,y)通過算子[-1,0,1]與圖像卷積求得,gy(x,y)通過算子[-1,0,1]T求得.
(1)
(3) 計算單個細胞以及塊的梯度直方圖特征從而構(gòu)成整個圖像的灰度梯度直方圖特征.
RBF神經(jīng)網(wǎng)絡拓撲圖如圖2所示,它是具有三層結(jié)構(gòu)的網(wǎng)絡,其工作原理如下:首先特征向量通過輸入神經(jīng)元被傳遞到隱層節(jié)點;然后隱層節(jié)點通過徑向基函數(shù)對輸入向量進行非線性運算.圖2中,ri(x)表示徑向基函數(shù),通常選高斯函數(shù)為映射函數(shù),公式如下:
(2)
式中,x是輸入向量;ci是第i個隱層神經(jīng)元中心值;σi為隱層中心寬度,可通過下式求得:
(3)
式中,d表示任意兩個隱層神經(jīng)元中心值最大歐氏距離;m是隱層神經(jīng)元個數(shù).
最后隱層輸出通過輸出權值映射到輸出層神經(jīng)元,網(wǎng)絡輸出為
(4)
式中,yk代表輸出層單個神經(jīng)元響應;p表示神經(jīng)元總數(shù);wik代表輸出權值[10-11].
圖2 RBF神經(jīng)網(wǎng)絡結(jié)構(gòu)拓撲圖
本文設計兩個網(wǎng)絡用于漢字和后6位字符的識別.在RBF網(wǎng)絡中,需要利用無標簽數(shù)據(jù)來計算構(gòu)成隱層的高斯單元參數(shù),因此在本文中首先分別對每類字符采用最近鄰聚類和k-均值聚類相結(jié)合的算法來確定隱層中心值,從而解決聚類算法中初始中心需要被人為確定的問題;中心寬度選擇遺傳算法對其進行優(yōu)化;輸出層連接權值則采用違逆法確定.
3.1 最近鄰聚類確定初始聚類中心
① 依次計算每類字符中單個特征向量與其余向量的歐式距離和,并存入矩陣DIT中.
② 確定DIT中最小值dit及其對應的向量ci,并將其存入初始聚類矩陣C中.
③ 依次計算特征向量與ci的歐式距離,若該歐式距離小于距離ditmean,則該向量屬于聚類中心ci,并將該輸入向量刪除.ditmean計算公式如下,其中n為每類字符樣本個數(shù).
(5)
④ 將剩余的向量重新進行迭代循環(huán),直到向量個數(shù)小于閾值thre為止,設thre=5.
3.2k-均值聚類確定最終聚類中心
① 將前一節(jié)確定的各類字符聚類中心分別作為k-均值聚類算法的初始聚類中心[12].
② 將各特征向量分派到與其距離最近的聚類中心數(shù)據(jù)集中,并對誤差平方和進行計算:
(6)
③ 計算各數(shù)據(jù)集中向量均值,以該均值為新聚類中心并由式(7)計算誤差平方和enew.
④ 對enew與e做差,如果差的絕對值比設定的閾值小,轉(zhuǎn)至步驟⑤,否則轉(zhuǎn)至步驟②;
⑤ 輸出k個聚類中心值,將每個聚類中心所包含的訓練數(shù)據(jù)的個數(shù)從多到少依次累加,若累加和大于所有訓練數(shù)據(jù)的90%,則將這些數(shù)據(jù)所對應中心作為該類字符的最終聚類中心.
3.3 遺傳算法確定隱層中心寬度
一般情況下,隱層中心寬度的確定常采用式(3)進行,但是當隱層中心值的選取不太合理時,整個網(wǎng)絡的分類效果將會受到影響,故本文選用遺傳算法[13-14]確定中心寬度.選擇網(wǎng)絡實際輸出與標準輸出的均方誤差來構(gòu)造適應度函數(shù).在隱層中心值已知、中心寬度設為優(yōu)化變量且標準輸出確定的情況下,輸出權值可由下式求得,
(7)
(8)
(9)
那么網(wǎng)絡的實際輸出為:
(10)
式中,H為隱層輸出矩陣;W為連接權值矩陣;D為標準輸出矩陣.
本文中每類字符樣本數(shù)均為100個,每類20個字符當做訓練樣本,80個字符做測試樣本,通過遺傳算法工具箱來優(yōu)化中心寬度,用GA對中心寬度進行構(gòu)造適應度函數(shù),并在其他參數(shù)求取算法相同的條件下對中心寬度采用式(3)確定的網(wǎng)絡進行測試,比較識別結(jié)果.并將適應度函數(shù)編寫為M文件,并對GUI界面中有關參數(shù)(交叉、變異概率)設定,利用MATLAB中的GUI界面開發(fā)工具箱設計了一個車牌識別系統(tǒng)界面.
4.1 分別對字母、數(shù)字和漢字優(yōu)化和識別
在字母、數(shù)字識別試驗中,由于數(shù)字1的寬度比其余字符要小,因此可以通過字符的寬度來區(qū)分,故數(shù)字1 不在本次識別范圍之內(nèi). 通過前面算法得到RBF網(wǎng)絡輸入層神經(jīng)元數(shù)為180,隱層神經(jīng)元數(shù)為68,輸出層神經(jīng)元數(shù)為33,GA優(yōu)化過程及優(yōu)化結(jié)果如圖3所示,從圖3a中可知當遺傳算法運行到35代多時,優(yōu)化函數(shù)達到極小值,其中最優(yōu)適應度達到0.004 285 5,平均適應度值為0. 008 785 3.本文在其他參數(shù)求取算法相同的條件下對中心寬度采用式(3)確定的網(wǎng)絡進行測試,字符部分識別結(jié)果如表1所示.對比表1兩種算法的字符識別率可知,采用式(3)確定中心寬度的RBF網(wǎng)絡對0、2、R的識別率要遠低于遺傳算法確定中心寬度的神經(jīng)網(wǎng)絡,因此可通過調(diào)整中心寬度的方法來增強網(wǎng)絡的泛化性能.由于實驗條件所限,本文實驗數(shù)據(jù)沒有太多的漢字樣本,只提取了三類漢字樣本,分別是津、冀、魯,每類漢字樣本數(shù)為100,對三類漢字進行了識別,通過前面算法得到輸入層神經(jīng)元數(shù)為180,隱層神經(jīng)元數(shù)為6,輸出層神經(jīng)元數(shù)為3,GA優(yōu)化過程及優(yōu)化結(jié)果如圖4所示,從圖4a中可知當遺傳算法運行到50多代時,優(yōu)化函數(shù)達到極小值,其中最優(yōu)適應度達到0,平均適應度值為0. 001 178 5.三類漢字識別結(jié)果如表2所示,表中測試樣本個數(shù)分別為80個.文中設計的RBF神經(jīng)網(wǎng)絡分為訓練階段和測試階段,實驗結(jié)果表明,只要訓練好數(shù)據(jù)之后,在測試階段的字符識別會很快,效率很高,也具有一定的實時性.
圖3 識別數(shù)字字母的RBF網(wǎng)絡中心寬度GA優(yōu)化過程及結(jié)果
字符中心寬度不同的網(wǎng)絡識別率%中心寬度一定的網(wǎng)絡識別率%095.085.0210076.2396.096.0496.097.5510098.7695.098.7797.596.0897.598.7字符中心寬度不同的網(wǎng)絡識別率%中心寬度一定的網(wǎng)絡識別率%9100100A98.798.7B100100C96.097.5D96.098.7E98.798.7R95.091.2
表2 漢字樣本識別率統(tǒng)計
圖4 識別漢字的RBF網(wǎng)絡中心寬度GA優(yōu)化過程及優(yōu)化結(jié)果
4.2 基于MATLAB環(huán)境的車牌識別GUI界面搭建
實際的車牌識別系統(tǒng)包括車牌定位、字符分割、字符識別功能.由于這三個功能相對獨立,為了使仿真結(jié)果有更好的直觀性,利用MATLAB中的GUI界面開發(fā)工具箱設計了一個車牌識別系統(tǒng)界面.車牌識別系統(tǒng)界面如圖5所示.
圖5 車牌識別GUI界面
本文采用最近鄰聚類與k-均值聚類算法相結(jié)合來確定隱層神經(jīng)元中心值的方法,解決了傳統(tǒng)k-均值聚類算法中需要人為確定初始聚類中心的問題;采用遺傳算法對隱層中心寬度進行優(yōu)化,解決了當隱層中心值的選取不太合理時,整個網(wǎng)絡的分類效果將會受到較大影響的問題.仿真實驗結(jié)果表明,該算法設計的字符網(wǎng)絡識別精度高,具有良好的應用前景.
[ 1 ] 李志強,李永斌. 車牌識別技術的發(fā)展及研究現(xiàn)狀[J]. 科技信息, 2012(5):110-125. (LI Z Q, LI Y B.The Development and research status of license plate recognition technology[J]. Science & Technology Information, 2012(5):110-125.)
[ 2 ] 李小平,任江興,楊德剛,等. 車牌識別系統(tǒng)中若干問題的探討[J]. 北京理工大學學報, 2001,21(1):116-119. (LI X P, REN J X, YANG D G, et al. Study on automobile license plate identification systems[J]. Journal of Beijing Institute of Technology, 2001,21(1):116-119.)
[ 3 ] 鄒明明,盧迪. 基于改進模板匹配的車牌字符識別算法實現(xiàn)[J]. 國外電子測量技術, 2010(1):59-61. (ZOU M M, LU D. Recognition algorithm of car license plate characters based on modified template match[J]. Foreign Electronic Measurement Technology, 2010,29(1):59-61.)
[ 4 ] CHOUDHARY A, RISHI R. Improving the character recognition efficiency of feed forward BP neural network[J]. International Journal of Computer Science & Information Technology, 2011,3(1).
[ 5 ] 孟繁靜,王連明. 視頻人臉識別系統(tǒng)中的最佳人臉捕獲[J]. 東北師大學報(自然科學版), 2015,47(3):90-95. (MENG F J, WANG L M. Optimal face capture in video-based face recognition system[J]. Journal of Northeast Normal University(Natural Science Edition), 2015,47(3):90-95.)
[ 6 ] 劉文偉,李琳,張洪劍,等. 基于神經(jīng)網(wǎng)絡的復雜過程系統(tǒng)模型辨識[J]. 沈陽大學學報, 2009,21(2):102-104. (LIU W W, LI L, ZHANG H J, et al. Model identification of complex process systems based on neural networks[J]. Journal of Shenyang University, 2009,21(2):102-104.)
[ 7 ] 劉明術. 基于K-均值聚類的混合聚類算法[J]. 安慶師范學院學報(自然科學版), 2016,22:40-42. (LIU M S. Hybrid clustering algorithm based on thek-means clustering[J]. Journal of Anqing Teachers College(Natural Science Edition), 2016,22:40-42.)
[ 8 ] LUO H B, YU X, LIU H, et al. A method for real-time implementation of HOG feature extraction[J]. Proceedings of SPIE, 2011,8193(4):819302-819302-7.
[ 9 ] 殷羽,鄭宏,高婷婷,等. 基于聯(lián)合HOG特征的車牌識別算法[J]. 計算機工程與設計, 2015(2):476-481. (YIN Y, ZHENG H, GAO T T, et al. Algorithm of license plate recognition based on joint HOG feature[J]. Computer Engineering and Design, 2015(2):476-481.)
[10] SHAN B. Vehicle license plate recognition based on text-line construction and multilevel RBF neural network[J]. Journal of Computers, 2011,6(2):246-253.
[11] 周騰. 基于RBF神經(jīng)網(wǎng)絡的車牌識別技術的研究[D]. 哈爾濱: 哈爾濱理工大學, 2012:41-50. (ZHOU T. Research on technology of license plate Recognition Based on RBF neural network[D]. Harbin: Harbin University of Science and Technology, 2012:41-50.)
[12] 王賽芳,戴芳,王萬斌,等. 基于初始聚類中心優(yōu)化的K-均值算法[J]. 計算機工程與科學, 2010,32(10):105-107. (WANG S F, DAI F, WANG W B. AK-means algorithm based on the optimal initial clustering center[J]. Computer Engineering & Science, 2010,32(10):105-107.)
[13] DING S, XU L, SU C, et al. An optimizing method of RBF neural network based on genetic algorithm[J]. Neural Computing and Applications, 2012,21(2):333-336.
[14] 姜鵬飛,蔡之華. 基于遺傳算法和梯度下降的RBF神經(jīng)網(wǎng)絡組合訓練方法[J]. 計算機應用, 2007,27(2):366-368. (JIANG P F, CAI Z H. Combined algorithms for training RBF neural networks based on genetic algorithms and gradient descent[J]. Computer Applications, 2007,27(2):366-368.)
【責任編輯: 李 艷】
License Plate Recognition of RBF Neutral Network Based on Mixed Optimization
ZhangXiulinga,b,QiQinga,HouDaibiaoa,ChengYantaoa,FuDonga
(a. Key Laboratory of Industrial Computer Control Engineering of Hebei Province; b. National Engineering Research Center for Equipment and Technology of Cold Strip Rolling, Yanshan University, Qinhuangdao 066004, China)
RBF neural network is used to identify characters of license plate. In the network center parameter determination stage, the nearest neighbor clustering algorithm and thek-mean clustering algorithm are used to determine the center of the hidden layer for each class of characters, so as to solve the problem that initial cluster center in the traditionalk-means clustering algorithm needs to be artificially determined; Normally, central width is determined by the formula, in order to eliminate its dependence on the center value, the genetic algorithm is selected to optimize the center width. The weights of the hidden layer and output layer are determined by violating law. The simulation results show that the designed RBF neural network can effectively recognize the characters.
license plate; character recognition; RBFNN; clustering; genetic algorithm
2016-10-21
河北省自然科學基金-鋼鐵聯(lián)合研究基金資助項目(E2015203354); 河北省高校創(chuàng)新團隊領軍人才培育計劃資助項目(LJRC013); 河北省教育廳科學研究計劃河北省高等學校自然科學研究重點項目(ZD2016100); 河北省高等教育學會高等教育科學研究課題重點課題(GJXHZ2015-1); 燕山大學研究生教育教學教學改革項目(JG201610).
張秀玲(1968-),女,山東章丘人,燕山大學教授,博士.
2095-5456(2017)02-0113-05
TP 183
A