吳曉剛,汪靜
(1.興義民族師范學(xué)院信息技術(shù)學(xué)院,興義562400;2.同濟(jì)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,上海201804)
目前國內(nèi)外車牌文字圖像識(shí)別的主要方法有模糊聚類[1]、基于模板匹配[2]和人工神經(jīng)網(wǎng)絡(luò)[3]等算法?;谀0迤ヅ浜湍:垲惖乃惴▽?shí)現(xiàn)簡單且當(dāng)字符較規(guī)整時(shí)識(shí)別率高,但對(duì)于一些因光照不均或污損遮擋的文字,在實(shí)際應(yīng)用中效果不理想。人工神經(jīng)網(wǎng)絡(luò)尤其深度神經(jīng)網(wǎng)絡(luò)對(duì)硬件的要求較高。針對(duì)此類模糊車牌文字識(shí)別一些學(xué)者作了研究,如文獻(xiàn)[4]提供了一種基于主成分特征重建圖像的車牌文字識(shí)別方法。
本文在具有三種否定的模糊集IFScom[5]理論基礎(chǔ)上,提出了一種基于IFScom 貼近度的模糊車牌文字識(shí)別方法。該算法針對(duì)模糊文字像素空間分布特點(diǎn),結(jié)合IFScom 貼近度包含中介否定信息來描述模糊污損圖像的灰度特性。通過理論和實(shí)驗(yàn)分析,在對(duì)模糊圖像文字的識(shí)別中,計(jì)算的準(zhǔn)確率和效率有明顯提高。
定義1[5]設(shè)A 是論域X 的模糊子集,其隸屬函數(shù)為A(x),l∈(0.5,1)。
(1)若映射滿足f┑:{A(x)|x∈X}→[0,1],f┑(A(x))=1-A(x),則f┑確定了論域X 上的一模糊子集,稱為A 的對(duì)立否定集,記作A┑。當(dāng)A(x)∈[0,1-l]或A(x)∈(l,1];
(2)若映射f~:{A(x)|x∈X}→[0,1],滿足:
則該映射f┑(A(x))=1-A(x)確定了X 上的模糊子集A 的中介否定集,記作A~。
(3)設(shè)A 是論域X 上的一個(gè)的模糊集,?x∈X,稱A┐為A 的矛盾否定集,若A┐(x)=(A┑∪A~(x)=A┑(x)∨A~(x)=max(A┑(x),A~(x))。
定義1 為區(qū)分矛盾否定運(yùn)算┐、對(duì)立否定運(yùn)算┑和中介否定運(yùn)算~的模糊集IFScom。
貼近度反應(yīng)了兩個(gè)模糊集的貼近程度或相似程度。以下給出公理化的定義和可計(jì)算的貼近度。
定義2[6]設(shè)F(X)是論域X 上的模糊集,若映射σ:F(X)×F(X)→[0,1],(A,B)|→σ(A,B)∈[0,1],滿足:
(1)σ(A,A)=1,?A,B ∈F(X),
(2)σ(A,B)=σ(B,A),?A,B ∈F(X),
(3)A?B ?C ?σ(A,C)?σ(A,B)∧σ(B,C),
則稱σ(A,B)為A 與B 的貼近度。
定義3 設(shè)A、B 是論域X 上的具有三種否定的模糊集IFScom,?x∈X,映射
稱N(A,B)為模糊集IFScom 上A 與B 的貼近度。
定義4[7]設(shè)A、B 是論域X 上的IFScom 模糊集,,映射
稱為IFScom 模糊集A 與B 的格貼近度。
顯然式(1)(2)均滿足公理化定義2。實(shí)際應(yīng)用中,可以根據(jù)具體情況來選擇IFScom 貼近度或格貼近度計(jì)算。
車牌文字圖像的點(diǎn)的密度與其周圍點(diǎn)的位置和灰度值相關(guān)[8],通常文字像素點(diǎn)周圍的像素點(diǎn)越多,則組成“文字”的可能性越大,反過來該像素點(diǎn)可能是“噪聲”。以下給出一種基于像素點(diǎn)空間分布的密度函數(shù),點(diǎn)密度函數(shù)定義如下:
定義5設(shè)X為文字像素集,xi,xj分別表示X 中像素點(diǎn)i,j 的灰度(灰度級(jí)為0-255,0 和255 分別表示該像素點(diǎn)為白色和黑色),則對(duì)于每個(gè)像素點(diǎn)xi,其點(diǎn)密度函數(shù)zi定義為:
式(3)中,0 ≤zi≤1,當(dāng)zi=0 表示xi是黑或白的孤立點(diǎn),zi=1 表示該點(diǎn)像素灰度級(jí)與周圍點(diǎn)是相同的。把它當(dāng)作點(diǎn)分布的模糊隸屬度。
基于模糊集IFScom 貼近度的車牌文字模糊識(shí)別的原理如下:對(duì)給定的待識(shí)別對(duì)象集合U中的每個(gè)對(duì)象u,建立特性指標(biāo)向量u=(u1,u2,…,up)。若識(shí)別對(duì)象集合u的n個(gè)類別均為u上的一個(gè)模糊集IFScom,記作A1,A2,…,Ap,模糊識(shí)別就是把對(duì)象u=(u1,u2,…,up)劃歸到與其最相似的一個(gè)類別Ai中(1≤i≤n)。建立模糊模式的隸屬函數(shù)特征,計(jì)算出具有三種否定的IFScom模糊集的貼近度,按照最大貼近度原則判斷對(duì)象u 歸屬于哪一個(gè)類別。算法的主要流程圖如圖1。
圖1 模糊車牌識(shí)別算法流程圖
通過計(jì)算比較模糊字符集與標(biāo)準(zhǔn)字符向量特征的貼近度,找到貼近度最大的輸出類別。
為了方便,本次實(shí)驗(yàn)以常見的藍(lán)底小車牌照為例(如圖2):一般有七個(gè)字符,包括首位漢字及后面的6位字母或數(shù)字。建立了24 個(gè)漢字、26 個(gè)字母與10 個(gè)數(shù)字總共60 個(gè)標(biāo)準(zhǔn)字符的特征向量,其他車牌字符集的方法與此相同。
圖2 待識(shí)別車牌圖像
實(shí)驗(yàn)步驟如下:
(1)由于車牌文字的寬高比接近1:2,對(duì)所有標(biāo)準(zhǔn)車牌字符集Fi(i=1,2…60) 分割成8×4 方塊點(diǎn)陣。
(2)對(duì)每個(gè)方塊中像素點(diǎn)出現(xiàn)的清晰度利用式(3)計(jì)算其隸屬度uij(i,j為所在的行列)。分別得到標(biāo)準(zhǔn)車牌文字A1(本例為字符F)與待識(shí)別模糊車牌文字A的向量特征關(guān)系矩陣如下:
圖3 車牌字符的8×4分塊
(3)字符像素集A 的對(duì)立否定A┑是完全不屬于該字符集,而部分污損或不完全的模糊字符像素屬于中介否定集,根據(jù)模糊集IFScom 定義,計(jì)算出A1的中介否定隸屬度(中介否定參數(shù)λ=0.75):
同上方法計(jì)算待識(shí)別車牌字符像素集A的中介否定隸屬度:
(4)將字符關(guān)系矩陣(8×4)按照行列展開成一維特征向量,根據(jù)式(1)分別計(jì)算標(biāo)準(zhǔn)字符集Ai(i=1,2,…60 )與待識(shí)別字符A 的貼近度N(Ai,A),結(jié)果N(A1,A)最大,因此待識(shí)別的字符是圖3 中的字母F。
(5)重復(fù)執(zhí)行以上步驟,可以得到完整的模糊車牌文字如圖4。
圖4 模糊車牌識(shí)別結(jié)果
為對(duì)比本文采用模糊集IFScom 具有三種否定貼近度方法的效果,選取標(biāo)準(zhǔn)和模糊車牌圖片與文獻(xiàn)[4]的主成分特征重建PCF 方法、文獻(xiàn)[8]的格貼近度GCD方法作對(duì)比實(shí)驗(yàn),得到表1 的準(zhǔn)確率。
表1 車牌文字識(shí)別的準(zhǔn)確率對(duì)比
從表1 可以看出對(duì)于標(biāo)準(zhǔn)清晰的車牌,三種算法的準(zhǔn)確率為100%。對(duì)于模糊污損車牌文字的識(shí)別率本文方法有一定的提高,主要的原因是具有三種否定的貼近度充分考慮了污損文字的中介模糊信息。
本文給出了一種基于IFScom 貼近度的模糊圖像文字識(shí)別方法。該方法通過建立文字像素點(diǎn)的分布隸屬度來描述字符的特征指標(biāo),利用具有三種否定模糊集IFScom 貼近度包含中介否定來刻畫污損圖像的灰度模糊特征。通過理論和實(shí)驗(yàn)表明,該算法可用于解決實(shí)際車牌識(shí)別中的一些模糊或不完全文字問題,具有一定的實(shí)際意義。