程 茜
(西安歐亞學(xué)院 金融學(xué)院,陜西 西安 710065)
城市智能交通的發(fā)展,使得汽車牌照的自動識別成為研究熱點,而隨著車流量的不斷增加,對車牌自動識別提出了越來越高的應(yīng)用需求。車牌自動識別的實現(xiàn)通常由四個部分完成,其中車牌字符的自動識別為整個系統(tǒng)的核心,直接影響車牌識別系統(tǒng)的性能,因此高性能高效率的車牌自動識別算法對城市智能交通具有重要的研究和應(yīng)用價值。
為此,學(xué)者提出各種有效算法,文獻(xiàn)[1]提出高斯金字塔與HOG特征相結(jié)合算法,提取細(xì)節(jié)特征和主體特征,通過提取HOG特征拓展特征維數(shù),并采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識別;文獻(xiàn)[2]提取二值化車牌圖像的字符結(jié)構(gòu)特征和像素特征,采用SVM對降維特征初始分類,并通過二次識別相似字符。文獻(xiàn)[3]采用參數(shù)優(yōu)化改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識別,以改善字符識別效率;文獻(xiàn)[4]綜合模板匹配及車牌字符集特征,改進(jìn)模板匹配方法并結(jié)合分級思想,克服單一模板識別率低的缺陷;文獻(xiàn)[5]針對形似字符的錯分類問題,提出由粗到精的多層車牌字符識別方法;文獻(xiàn)[6]提取字符的彎曲度、凹凸等形狀特征進(jìn)行車牌識別。
我國車牌字符中漢字筆畫繁多特征提取難,當(dāng)受天氣、光照影響及車牌存在污染時,漢字的識別尤為困難,比較成功的已有算法可分為基于筆畫結(jié)構(gòu)和基于統(tǒng)計特征[7-8],但結(jié)構(gòu)特征對行車環(huán)境及字符污損等干擾敏感,而統(tǒng)計特征具有平移和旋轉(zhuǎn)等的不變性,對行車環(huán)境及字符污損等情況的抗干擾能力強,文獻(xiàn)[9]提出采用分形維數(shù)和隱馬爾可夫(Hidden Markov,HM)特征的基于統(tǒng)計特征的識別方法,但該識別方法還存在特征維數(shù)較高導(dǎo)致信息冗余計算量大和多分類器融合導(dǎo)致識別時間增加、硬件性能要求高等問題,不利于車牌字符的快速精確識別。
為此,提出基于HM統(tǒng)計特征降維和改進(jìn)概率神經(jīng)網(wǎng)絡(luò)(PNN)的車牌字符快速精確識別算法,算法采用非負(fù)矩陣分解對隱馬爾可夫高維統(tǒng)計特征降維以消除特征信息冗余,通過改進(jìn)PNN訓(xùn)練樣本選取,提高PNN分類器的分類精確性并減少算法對硬件性能需求,對比實驗驗證了算法的有效性。
車牌圖像包含信息較少,且其內(nèi)容間的相關(guān)性與隱馬爾可夫統(tǒng)計特性相符合[9],因此可以通過隱馬爾可夫特征進(jìn)行字符識別,其特征提取流程[9],如圖1所示。
圖1 HM特征提取流程Fig.1 Computing Flow Hidden Markov Feature
根據(jù)特征提取流程,如圖1所示。HM特征提取方法為:
(1)將車牌圖像降噪后進(jìn)行分塊,塊間不重復(fù),塊大小為(8×8)像素,進(jìn)行DCT變換將分塊變換到頻域空間處理;
(2)根據(jù)式(1)計算圖像塊變換后頻域數(shù)據(jù)的橫向和縱向差異矩陣:
式中:F(x,y)—像素能量。然后對差異矩陣進(jìn)行按閾值截取處理,即:
式中:F(x,y)—式(1)中計算的 FT(x,y)或者 Fv(x,y),根據(jù)文獻(xiàn)[8]設(shè)置閾值T=3。
(3)計算狀態(tài)轉(zhuǎn)移矩陣得到高維隱馬爾科夫統(tǒng)計特征。
為了更好的可分類性,HM特征矩陣通常需要較高的維數(shù),從而導(dǎo)致消耗增加和信息余,為此,采用快速非負(fù)矩陣分解(Nonnegative Matrix Factorization,NMF)[10]提取高維隱馬爾可夫特征矩陣中更精確反映字符特征的基矩陣,從而即實現(xiàn)降維又提高特征的分類性能。
NMF是在非負(fù)約束下的矩陣分解新方法,在數(shù)據(jù)壓縮降維、特征提取方面具有較好的應(yīng)用。NMF“局部構(gòu)成整體”的思想對識別存在遮擋和污損等的車牌圖像有明的優(yōu)勢[10]。
(n×m)維的非負(fù)矩陣V可以分解為兩個非負(fù)矩陣W和H的乘積,即:
式中:W—(n×r)維;H—(r×m)維;r—基矩陣維數(shù)。式(3)說明矩陣V中的某列向量表示為左矩陣W列向量加權(quán)和,而加權(quán)系數(shù)為右矩陣H中對應(yīng)列向量,W稱為矩陣V的基矩陣而H為系數(shù)矩陣。
其中,當(dāng)且僅當(dāng)在V=W·H時式(4)取最小值0。式(4)優(yōu)化問題描述為:在非負(fù)約束V≥0,W≥0和H≥0下,使目標(biāo)函數(shù)D(D||WH)最小,則根據(jù)乘法迭代算法可得式(2)的更新迭代規(guī)則為:
NMF的實現(xiàn)可以采用最優(yōu)化方法,文中使用K-L離散度作為最優(yōu)化問題的目標(biāo)函數(shù),即:
重復(fù)式(5)和式(6)直至算法滿足收斂條件,即可得到所需的非負(fù)矩陣W和H。
根據(jù)式(5)和式(6)得出的NMF的計算復(fù)雜度較高,為(m+n)·r,因此需要設(shè)計快速NMF算法。
對式(3)兩邊左乘VT得到VTV=VTWH,則有:
式中:K=VTV,Y=VTW。式(7)與式(3)的系數(shù)矩陣H保持一致,因此,可以采用式(7)通過對矩陣K進(jìn)行非負(fù)矩陣分解而計算H。由于K是由非負(fù)矩陣V內(nèi)乘得到,因而其也保持元素的非負(fù)特性。但變換后,原矩陣V維數(shù)變?yōu)樾戮仃嚨膍×m,由于隱馬爾可夫特征矩陣的高維特性,其n>>m,從而有r·(m+m)<<r·(n+m),減少了計算量和存儲需求。
利用快速NMF算法對第2節(jié)中提取的車牌字符294維HM特征進(jìn)行NMF分析,提取其系數(shù)矩陣作為最終的識別特征,以有效去除特征相關(guān)量。對于提取的HM特征矩陣Hnew,基于快速NMF的特征降維表示為:
傳統(tǒng)PNN方法模式分類層的節(jié)點數(shù)與訓(xùn)練樣本相關(guān)[6],大訓(xùn)練樣本會造成不必要的細(xì)小分類??紤]到車牌字符為特定的若干字符,文中改進(jìn)PNN在模式分類層僅使用大訓(xùn)練樣本中特征顯著的代表性節(jié)點,其步驟為:
步驟1:根據(jù)特定車牌字符集,將每一個字符的樣本特征組成特征向量,計算不同向量之間的向量距離及最大距離Lmax;
步驟2:以閾值T=0.5×Lmax統(tǒng)計特征向量與樣本的距離,以距離小于T的向量數(shù)為樣本的向量密度,得到一維密度矩陣;
步驟3:統(tǒng)計密度大于平均密度的訓(xùn)練樣本組成新訓(xùn)練集。取新集合中最大密度樣本為起始代表,然后以起始代表為度量,取與其距離大于預(yù)設(shè)閾值且在剩余訓(xùn)練集中最大密度樣本為第二個樣本代表;
步驟4:以第二代表點為度量點,在新訓(xùn)練集剩余集合中重復(fù)步驟3,直到無新樣本代表產(chǎn)生,以新樣本代表集進(jìn)行PNN訓(xùn)練和最終識別,從而提高PNN的識別性能和識別效率。
為驗證文中算法的有效性,以存在光照不均、遮擋和污損情況的實際拍攝車牌圖像為實驗數(shù)據(jù),部分圖像,如圖2所示。在Inte(R)CoreTMi5-7400HQCPU,內(nèi)存4Gbyte的計算機硬件下進(jìn)行實驗。樣本圖像分成無污損清晰圖像、存在污損和光照不均且增高斯噪聲圖像、存在污損且進(jìn)行了平衡旋轉(zhuǎn)遮擋等嚴(yán)重干擾的圖像三組。
圖2 實驗中使用的部分車牌圖像Fig.2 Part of the License Plate Image Used in the Experiment
將文中方法(算法1)與改進(jìn)模板匹配法(算法2)[1]、高維特征及原始PNN識別方法(算法3)進(jìn)行車牌字符識別準(zhǔn)確率對比實驗。訓(xùn)練樣本中漢字和英文字母圖像各800幅,數(shù)字圖像2000幅,識別階段選擇漢字和英文字母圖像各300幅,數(shù)字圖像500幅,實驗結(jié)果,如表1所示。
表1 識別性能對比實驗結(jié)果(%)Tab.1 Results Comparison of Recognition Performance Experiments(%)
從實驗結(jié)果可以看出,圖像質(zhì)量較好的第一組圖像,三種方法都取得較好的識別準(zhǔn)確率;第二組圖像,算法與算法3都取得較好的識別結(jié)果,主要因為統(tǒng)計特征對光照不均、圖像污損及旋轉(zhuǎn)平移等干擾不敏感,而文中算法識別準(zhǔn)確率更高,因為采用NMF對高維HM特征降維后,在減少存儲空間需求的同時,消除特征間的信息冗余,使得特征描述更加精確;在第三組圖像中,算法識別準(zhǔn)確率優(yōu)勢更加明顯,主要因為采用NMF進(jìn)行特征降維后,新特征包含了NMF的“局部表過整體”的思想,使得特征對污損和遮擋圖像的依然保持較高識別準(zhǔn)確率。
實驗在三組圖像數(shù)據(jù)下的算法的部分實驗結(jié)果,如圖3所示??梢钥闯觯诓煌墓庹諚l件、車牌圖像旋轉(zhuǎn)、污損情況下,這里算法都取得較好的識別結(jié)果。需要注意的是,圖3實驗結(jié)果還需要圖像降噪預(yù)處理、字符分割定位及相似字符二次識別等功能的輔助。
圖3 文中算法車牌圖像識別結(jié)果Fig.3 Recognition Results of the Proposed Method
對識別準(zhǔn)確率實驗中使用的訓(xùn)練樣本根據(jù)第四節(jié)改進(jìn)PNN算法步驟,使用451個樣本代表進(jìn)行改進(jìn)PNN訓(xùn)練,然后用500幅車牌圖像進(jìn)行識別速率測試實驗。將文中算法與算法3、降維特征及原始PNN方法(算法4)兩個組合識別方法進(jìn)行比較,實驗中,每一個算法進(jìn)行50次識別實驗,并取最終的平均值進(jìn)行比較,實驗結(jié)果顯示,算法平均運行時間為10.962s,算法3的平均運行時間為31.196s,算法4的平均運行時間為19.226s??梢钥闯?,文中算法的運行時間顯著優(yōu)于另外兩種算法,說明特征降維和代表點改進(jìn)PNN有效提高算法的運行效率,盡管基于NMF的特征降維會產(chǎn)生時間消耗,但其帶來識別階段大量運行時間的節(jié)省。綜合對比實驗結(jié)果,通過特征降維和改進(jìn)PNN,算法在車牌識別準(zhǔn)確率和識別效率上都有了顯著提高。
為實現(xiàn)復(fù)雜光照及存在遮擋和污損等情況下車牌識別,提出基于隱馬爾可夫特征降維和改進(jìn)PNN的車牌字符快速精確識別算法,算法通過特征降維消除高維矩陣信息冗余,并提高特征描述準(zhǔn)確性,通過改進(jìn)PNN訓(xùn)練模式,進(jìn)一步提高算法的分類性能。對比實驗結(jié)果驗證了算法的有效性。