張小春,任開春,曹龍漢,張興起,張遷
(重慶通信學(xué)院 軍事電力工程系,重慶 400035)
智能交通系統(tǒng)(Intelligent Traffic System,ITS)作為目前世界交通運(yùn)輸領(lǐng)域的前沿研究課題己經(jīng)成為交通管理發(fā)展的主要方向,并已廣泛應(yīng)用于高速公路收費(fèi)站、智能小區(qū)、電子警察等領(lǐng)域。ITS的核心是汽車牌照自動(dòng)識(shí)別技術(shù)(License Plate Recognition,LPR)。LPR系統(tǒng)分為兩個(gè)步驟:一是對牌照的精確定位,二是字符的識(shí)別?;谏窠?jīng)網(wǎng)絡(luò)的模式識(shí)別方法是字符識(shí)別領(lǐng)域的一個(gè)重要研究方向。但目前大部分都是基于BP(Back Propagation)網(wǎng)絡(luò)進(jìn)行的。BP網(wǎng)絡(luò)的主要缺點(diǎn)是易受干擾、難以確定隱層節(jié)點(diǎn)數(shù)、易陷入局部極值點(diǎn)。而對于徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò),由于結(jié)構(gòu)簡單、徑向?qū)ΨQ、光滑性好,可以保證學(xué)習(xí)速度快,且能實(shí)現(xiàn)全局最優(yōu)。本文通過一種動(dòng)態(tài)K-均值聚類算法的RBF網(wǎng)絡(luò)對車牌數(shù)字進(jìn)行了識(shí)別,試驗(yàn)結(jié)果表明,網(wǎng)絡(luò)學(xué)習(xí)速度快,正確率較高,抗干擾力較強(qiáng),具有一定應(yīng)用價(jià)值。
RBF神經(jīng)網(wǎng)絡(luò)[1]是一種前饋型神經(jīng)網(wǎng)絡(luò),包含1個(gè)具有徑向基函數(shù)神經(jīng)元的隱層和1個(gè)具有線性神經(jīng)元的輸出層。RBF神經(jīng)網(wǎng)絡(luò)模型如圖1所示。
式中:dj為 隱單元函數(shù)寬度。顯然,dj越 小,徑向基函數(shù)的寬度也就越小,基函數(shù)就越具有選擇性。高斯函數(shù)模型如圖2所示。
于是,圖1中的RBF神經(jīng)網(wǎng)絡(luò)的第k個(gè)輸出就可以表示為
式中:wkj表示第j個(gè)隱層神經(jīng)元與第k個(gè)神經(jīng)元的連接權(quán)值,輸入層與隱層之間的所有權(quán)值固定為1。圖1中輸出層節(jié)點(diǎn)中的Σ表示輸出層神經(jīng)元采用線性激活函數(shù)。
K-均值聚類算法是一種自組織學(xué)習(xí)選取徑向基函數(shù)中心的方法,徑向基函數(shù)的中心值可以移動(dòng),并通過自組織學(xué)習(xí)確定其位置,從而使徑向基函數(shù)的中心位于輸入空間重要的區(qū)域。然而K-均值聚類算法的性能受到許多因素的影響,需要大量試驗(yàn)來確定K值的選擇及初始化參數(shù)的選擇,因而本文選取了另外一種動(dòng)態(tài)K-均值算法。其算法實(shí)現(xiàn)步驟如下。
第1步:隨機(jī)選取1個(gè)輸入向量作為初始時(shí)的聚類中心,此時(shí)中心個(gè)數(shù)q=1,設(shè)置距離門限值ρ、正學(xué)習(xí)步長ηk和反學(xué)習(xí)步長ηr,且滿足0<ηr< ηk< 1,令 s=1。
第2步:計(jì)算第s個(gè)輸入向量Ins與所有已知聚類中心Cj的距離dj。
式中:q是當(dāng)前聚類中心的個(gè)數(shù);n是第s個(gè)輸入向量的維數(shù),同時(shí)也是隱含層第j個(gè)中心的維數(shù)。
3)同業(yè)競爭:在國內(nèi),由于品牌建設(shè)落后,引領(lǐng)作用不強(qiáng)。眾多隴藥中,有影響力的佛慈制藥、太寶制藥、奇正藏藥等少數(shù)品牌,與國內(nèi)十大中藥品牌的“北京同仁堂”“云南白藥”等相比仍有較大差距。在國外,最大的競爭對手是日本、德國及韓國。日本現(xiàn)已成為除中國之外, 開展中草藥研究歷史久、范圍廣、水平高、從事人數(shù)多的國家。日本的中藥企業(yè)以大企業(yè)為主, 產(chǎn)業(yè)集中度高。德國憑借其高技術(shù)和加工生產(chǎn)能力,成為目前世界產(chǎn)銷植物藥最多的國。
第4步:比較dk與距離門限值ρ,若dk>ρ,則增加一個(gè)新的中心,即q=q+1,中心值就為該輸入向量;若dk<ρ,則按照RPCL方法修正獲勝中心與次勝中心,其它中心保持不變。
第5步:s=s+1。若s>輸入樣本數(shù)量,表示已經(jīng)找到全部聚類中心C,算法結(jié)束,否則轉(zhuǎn)到第2步。
輸入層與輸出層的神經(jīng)元數(shù)目由問題本身的性質(zhì)決定,輸入層神經(jīng)元個(gè)數(shù)由待識(shí)別字符所提取的粗網(wǎng)格特征的維數(shù)大小確定[2]。在本車牌數(shù)字識(shí)別系統(tǒng)中,已經(jīng)手工用畫圖工具將車牌中的數(shù)字切割出來,生成尺寸大小不一的24位點(diǎn)陣位圖,從0~9的每一個(gè)數(shù)字都取了9個(gè)樣本,切割完成的車牌樣本命名為00.bmp,01.bmp,…,89.bmp,如圖3所示。
再通過程序?qū)γ總€(gè)圖像進(jìn)行處理,生成歸一化的16×16點(diǎn)陣大小字符,以每個(gè)像素點(diǎn)為一個(gè)網(wǎng)格,因而輸入層神經(jīng)元個(gè)數(shù)取為256。
人工神經(jīng)網(wǎng)絡(luò)對模式的分類可以采用“M中取1”的方式來表示目標(biāo)向量,因此,網(wǎng)絡(luò)輸出層神經(jīng)元的數(shù)目即為待識(shí)別的類別數(shù)M,輸出層的每一個(gè)神經(jīng)元就代表一個(gè)目標(biāo)種類。在本系統(tǒng)中,也采用“M中取l”的方式來表示目標(biāo)向量。本系統(tǒng)將輸入樣本進(jìn)行10個(gè)結(jié)果的輸出,即0~9,這樣,網(wǎng)絡(luò)輸出層神經(jīng)元個(gè)數(shù)即為10。
確定隱函數(shù)中心Cj采用動(dòng)態(tài)K-均值聚類算法,如上文所述。
半徑dj決 定了RBF單元接受域的大小,對網(wǎng)絡(luò)的精度有極大的影響,半徑選擇的基本原則是使所有RBF隱單元的接受域之和覆蓋整個(gè)訓(xùn)練樣本空間。對樣本空間分好類以后,dj計(jì)算根據(jù)如下k鄰近的方法。
式中:x(k)和Cj的維數(shù)相同;x(k)即為距離Cj最近的K個(gè)點(diǎn)[3-4]。
通過線性最小二乘法來訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò)便可以得到隱層與輸出層之間的連接權(quán)值。初始化時(shí),先設(shè)定樣本模式計(jì)數(shù)器p和訓(xùn)練次數(shù)q為1,誤差E置為0,試驗(yàn)的誤差閾值Emin設(shè)為0.05,初始學(xué)習(xí)率設(shè)定在0~1之間的值。本文共有訓(xùn)練樣本數(shù)為P=90。故網(wǎng)絡(luò)總誤差為
在神經(jīng)網(wǎng)絡(luò)模型確定后,將測試樣本輸入網(wǎng)絡(luò)進(jìn)行識(shí)別測試。每輸入一個(gè)車牌數(shù)字圖片后,經(jīng)過程序的自動(dòng)處理,將生成16×16的點(diǎn)陣圖像作為輸入特征矢量,經(jīng)過隱層和輸出層的計(jì)算后就可以得到每個(gè)字符的分類號(hào),將這個(gè)分類號(hào)與輸入特征矢量自帶的分類號(hào)比較,相等則識(shí)別正確,反之則識(shí)別錯(cuò)誤。
系統(tǒng)訓(xùn)練誤差曲線如圖4所示。
基于RBF神經(jīng)網(wǎng)絡(luò)的車牌數(shù)字識(shí)別系統(tǒng)操作界面如圖5所示。
為了測試系統(tǒng)的整體性能,特在實(shí)際交通道路上抓拍了273張不同的車牌圖像,其中,含3個(gè)數(shù)字的車牌數(shù)目共計(jì)174個(gè),含4個(gè)數(shù)字的車牌數(shù)目共計(jì)87個(gè),含5個(gè)數(shù)字的車牌數(shù)目共計(jì)12個(gè)。經(jīng)過對車牌的分割處理,得到數(shù)目分布不均的從0到9的車牌數(shù)字共計(jì)930個(gè)。用此樣本對所得車牌數(shù)字進(jìn)行了識(shí)別,結(jié)果見表1。
由表1可以看出,識(shí)別正確率在90.6%~98.9%之間,平均正確率為95.91%。若考慮每一個(gè)車牌數(shù)字出現(xiàn)的概率后,即按照式(6)計(jì)算有
表1 識(shí)別結(jié)果
式中:p1i為數(shù)字出現(xiàn)的概率;p2i為每個(gè)數(shù)字單獨(dú)識(shí)別的正確率;p為綜合識(shí)別正確率,則由表1計(jì)算出綜合識(shí)別正確率為p=95%。
數(shù)字識(shí)別系統(tǒng)對數(shù)字0~9的部分識(shí)別效果見表2。
表2 部分識(shí)別效果
表3所示為系統(tǒng)對帶噪聲、模糊、拍攝角度不好的圖片的識(shí)別結(jié)果,右側(cè)所示圖片為經(jīng)過算法自動(dòng)處理后的圖片,目視可知干擾都比較大,但是由于RBF神經(jīng)網(wǎng)絡(luò)的高度非線性化和高識(shí)別率,這些照片仍然得出了正確結(jié)果。
表3 對部分帶噪聲和模糊圖片的識(shí)別結(jié)果
本文通過K-均值聚類算法實(shí)現(xiàn)了RBF神經(jīng)網(wǎng)絡(luò)對車牌數(shù)字的識(shí)別。本系統(tǒng)經(jīng)過對每個(gè)數(shù)字的訓(xùn)練后,能夠?qū)斎氲能嚺茢?shù)字做到比較精確的識(shí)別,具有較高的識(shí)別準(zhǔn)確率,區(qū)分字符能力較強(qiáng),不易受噪聲影響,在交通檢測、停車場、和高速公路超速檢測等方面有較高實(shí)用性和現(xiàn)實(shí)意義。
[1]魏海坤.神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)的理論與方法[M].北京:國防工業(yè)出版社,2005:55-62.Wei Haikun. Theory and Method of Artificial Neural Networks Design[M]. Beijing:China National Defense Industry Press,2005:55-62.(in Chinese)
[2]高雋. 人工神經(jīng)網(wǎng)絡(luò)原理及仿真實(shí)例[M].北京:機(jī)械工業(yè)出版社,2010:98-102.Gao Jun. Artificial Neural Networks:Theory and Simulation Examples[M].Beijing:China Machine Press,2010:98-102. (in Chinese)
[3]KERRY L C. Intelligent Transportation Systems [J].Better Roads,2005,75(7):75-76.
[4]李國友,姚磊,李惠光,等. 基于優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)模式識(shí)別新方法[J]. 系統(tǒng)仿真學(xué)報(bào),2006,18(1):181-184.Li Guoyou,Yao Lei,Li Huiguang,et al. A New Method of Pattern Recognition Based on Optimized RBF Neural Networks [J]. Journal of System Simulation,2006,18(1):181-184. (in Chinese)
[5]趙秀麗,李廷軍,金慧琴,等. 基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)字模式識(shí)別方法[J].海軍航空工程學(xué)報(bào),2004,19(1):191-192.Zhao Xiuli,Li Tingjun,Jin Huiqin, et al. A Way of Recognition Based on RBF Neural Network [J].Journal of Naval Aeronautical Engineering Institute,2004,19(1):191-192. (in Chinese)
[6]張秀玲,李海濱. 基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)字模式識(shí)別方法[J]. 模式識(shí)別與人工智能,2002,15(1):93-97.Zhang Xiuling,Li Haibin. A Digit Recognition Method Based on RBF Network [J]. Pattern Recognition and Artificial Intelligence,2002,15(1):93-97. (in Chinese)