余 彪 ,萬水龍,劉 進(jìn) ,王強德
(1.中國人民解放軍92493部隊,遼寧 葫蘆島 125000;2.中國人民解放軍91960部隊,廣東 汕頭 515074;3.南京航空航天大學(xué),江蘇 南京 210016)
分類識別是印章圖像處理的最終目的,分類的準(zhǔn)確與否、識別率的高低是其中的重要評判標(biāo)準(zhǔn)[1]。只有提取到印章圖像的關(guān)鍵特征,才有可能改進(jìn)分類的準(zhǔn)確度,而識別率的提高就要求選擇一款性能良好的分類器。矩函數(shù)對圖像形狀能進(jìn)行有效的描述,因而得到迅速發(fā)展,如Tchebichef矩、Krawtchouk矩、Zemike矩和Legendre矩[2],其中Krawtchouk矩是基于離散域的正交矩,不存在數(shù)字過程中的近似誤差和計算中的坐標(biāo)變換問題。參考文獻(xiàn)[3]將Krawtchouk矩用于對運動目標(biāo)進(jìn)行分類,有效地提高了分類的準(zhǔn)確率。與此同時,人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Network)自提出以來就得到了快速發(fā)展,其中徑向基函數(shù)RBF(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)具有良好的非線性映射、自學(xué)習(xí)能力和收斂性,因此被越來越多地運用于對目標(biāo)的分類當(dāng)中,取得了較好的分類效果[4-6]。
基于此,本文提出一種基于Krawtchouk矩和RBF神經(jīng)網(wǎng)絡(luò)的印章圖像分類識別方法。首先提取出標(biāo)準(zhǔn)印章圖像的Krawtchouk矩不變量,將其作為RBF神經(jīng)網(wǎng)絡(luò)的原始訓(xùn)練樣本;然后提取全部待鑒印章圖像的Krawtchouk矩不變量,將其作為RBF神經(jīng)網(wǎng)絡(luò)的輸入量進(jìn)行分類識別。實驗表明,使用Krawtchouk矩來描述印章圖像的特征并通過RBF神經(jīng)網(wǎng)絡(luò)來對其進(jìn)行分類識別,相對于參考文獻(xiàn)[4]中的KPCA-RBF法和參考文獻(xiàn)[6]中的Brushlet-RBF法,其分類更準(zhǔn)確,識別率更高。
Krawtchouk矩是以Krawtchouk多項式為基礎(chǔ)的一種正交矩。一般來說,n階Krawtchouk多項式定義為:
其中,x,n=0,1,…,N;N>0;p∈(0,1);2F1(a,b;c;z)是超函數(shù)。
其中,Krawtchouk多項式的加權(quán)表達(dá)式為:
其中,
現(xiàn)用 Krawtchouk矩來描述一幅大小為M×N的圖像f(x,y):
其中,
Krawtchouk矩不變量具有平移、旋轉(zhuǎn)、尺度不變性,可表示為:
其中,
利 用q01、q10、q11、q02、q20、q12、q217 個 不 變 量 構(gòu) 造 一 個不變向量Q來描述一幅圖像,其中q01、q10與圖像內(nèi)容無關(guān),所以本文選擇其余5個變量:
通過式(12)構(gòu)成的特征向量對印章圖像進(jìn)行特征提取。
RBF神經(jīng)網(wǎng)絡(luò)由輸入端、隱藏段和輸出端3部分組成,具體的結(jié)構(gòu)如圖1所示。輸入端將輸入信號傳輸?shù)诫[藏段,隱藏段再通過基函數(shù)的響應(yīng)激烈程度給予輸出端相應(yīng)的輸出信號。其中,輸入端的節(jié)點數(shù)對應(yīng)于輸入向量的維數(shù),隱藏段的節(jié)點數(shù)要視實際情況而定,輸出端的節(jié)點數(shù)按分類的類別總數(shù)來確定。
圖1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
一般來說,徑向基函數(shù)選取高斯函數(shù),其具體形式為:
其中,Q為輸入向量,ui為隱藏節(jié)點i的中心向量,σi為相應(yīng)的寬度,‖Q-ui‖為歐式范數(shù)。
輸出端第j個節(jié)點的輸出值yi為:
其中,j=1,…,m為輸出端節(jié)點,wij為隱藏段第i個節(jié)點到輸出端第j個節(jié)點的連接權(quán)值。
令d為訓(xùn)練樣本的期望輸出值,則可知:
RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程一般分為選取中心、確定寬度和導(dǎo)出連接權(quán)值3部分。選取中心的方法通常采用K-means 聚類、ROLS(Recumive Orthogonal Least Square)法和自組織聚類等,然后根據(jù)標(biāo)準(zhǔn)樣本來確定寬度,最后通過誤差導(dǎo)出隱藏段各節(jié)點到輸出端各節(jié)點的連接權(quán)值。
本文算法的具體描述如下:
(1)根據(jù)印章圖像的特點,對于第一個輸入向量Q1=(q11,q02,q20,q12,q21)來說,此時RBF網(wǎng)絡(luò)的隱藏段只有一個節(jié)點,中心為Q1?,F(xiàn)設(shè)定一個參數(shù)a(該參數(shù)會根據(jù)實驗結(jié)果進(jìn)行適當(dāng)調(diào)整),對于第二個輸入向量Q2,計算其與Q1之間的歐氏距離D,若D>a,則 Q2也成為一個中心;若D≤a,則 Q1為此處的中心。對于第n個輸入向量Qn,此時已有M個中心,現(xiàn)分別計算Qn與這M個中心的歐式距離,其中D0為其中的最小值,若D0>a,則 Qn成為新一個中心;若D0≤a,則中心數(shù)仍為M個。
(2)因為本文選取的徑向基函數(shù)為高斯函數(shù),所以可通過式(16)直接求取寬度:
(3)隱藏段至輸出端的連接權(quán)值可直接用ROLS法求得:
算法實現(xiàn)的具體過程如下。
(1)提取標(biāo)準(zhǔn)印章圖像的Krawtchouk矩不變量,將其作為RBF神經(jīng)網(wǎng)絡(luò)的原始訓(xùn)練樣本。
(2)提取全部待鑒印章圖像的Krawtchouk矩不變量,通過RBF神經(jīng)網(wǎng)絡(luò)對其進(jìn)行分類。
(3)分類結(jié)果分為正確、錯誤和可疑3類,并在實驗中分別用阿拉伯?dāng)?shù)字1、-1和0表示。
具體的流程圖如圖2所示。
圖2 RBF神經(jīng)網(wǎng)絡(luò)分類流程圖
為了驗證本文提出的基于Krawtchouk矩和RBF的印章圖像分類識別方法的分類識別情況,針對大量不同類型的印章圖像做了實驗,并與參考文獻(xiàn)[4]中的KPCA-RBF法和參考文獻(xiàn)[6]中的Brushlet-RBF法進(jìn)行了比較,發(fā)現(xiàn)本文方法優(yōu)勢明顯。實驗是在Intel(R)Core(TM)i3 CPU 2.4 GHz/1.92 GB內(nèi)存/Matlab 2009a環(huán)境中運行的。
圖3 印章圖像實驗用圖
表2 RBF神經(jīng)網(wǎng)絡(luò)分類識別結(jié)果
印章圖像(323×324)在5種不同條件下所蓋印出來的效果如圖3所示。先進(jìn)行去噪、分割及配準(zhǔn)等預(yù)處理,然后通過Krawtchouk矩不變量提取圖像特征,結(jié)果數(shù)據(jù)如表1所示。再利用RBF神經(jīng)網(wǎng)絡(luò)來進(jìn)行訓(xùn)練,RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中輸入端節(jié)點數(shù)選為5,輸出端節(jié)點數(shù)選為3,最后再將所有待鑒印章圖像通過該網(wǎng)絡(luò)來分類識別,結(jié)果數(shù)據(jù)如表 2所示,其中 1代表正確,0代表可疑,-1代表錯誤。
表1 印章圖像的特征向量參數(shù)
圖4所示印章圖像中后3幅圖像對原圖中的字體、形狀或面積進(jìn)行了一定的變動,并將得到的印章通過用力過大、用力過小、用力不均、缺上角、缺下角等方式產(chǎn)生實驗用的全部待鑒印章圖像,按照先后順序編號為1~5,6~10,11~15,16~20,然后將其輸入 RBF 神經(jīng)網(wǎng)絡(luò)來對其進(jìn)行分類識別,結(jié)果如表3所示。
圖4 待鑒印章圖像
表3 各類方法效率比較
從表2可以看出,本文方法、KPCA-RBF法和Brushlet-RBF法對于原始印章圖像及變換了圖像形狀的分類均取得了較好的結(jié)果,但是對于只改變了字體或字體間間距的圖像來說,本文方法具有明顯的優(yōu)勢。由表3可以看出,本文提出的Krawtchouk-RBF法相對于KPCA-RBF法和Brushlet-RBF法來說,其分類識別的正確率更高。
本文提出了一種基于Krawtchouk矩和RBF神經(jīng)網(wǎng)絡(luò)的印章圖像分類識別方法。首先提取標(biāo)準(zhǔn)印章圖像的Krawtchouk矩不變量,將其作為RBF網(wǎng)絡(luò)的原始訓(xùn)練樣本;然后提取全部待鑒印章圖像的Krawtchouk矩不變量,將其作為RBF神經(jīng)網(wǎng)絡(luò)的輸入量進(jìn)行分類識別。針對實際印章圖像做了大量的實驗,并與參考文獻(xiàn)[4]中的KPCA-RBF法和參考文獻(xiàn)[6]中的Brushlet-RBF法進(jìn)行了對比,結(jié)果表明,本文的方法分類更準(zhǔn)確,識別率更高。
[1]何瑾,劉鐵根,周怡潔,等.基于邊緣差異的印鑒自動鑒別[J].儀 器 儀 表 學(xué) 報 ,2010,31(1):85-91.
[2]CHONG C W,RAVEENDRAN P,MUKUNDAN R.Translation and scale invariants of Legendre moments[J].Pattern Recongniton,2004(37):119-129.
[3]王曉靜,原達(dá),李道凱.基于krawtchouk矩的運動目標(biāo)分類[J].計算機工程與設(shè)計,2012,33(5):1890-1894.
[4]楊俊,陳賢富.基于KPCA和RBF網(wǎng)絡(luò)的文本分類研究[J].微電子學(xué)與計算機,2010,27(3):122-125.
[5]王行甫,覃啟賢,程用遠(yuǎn),等.一種改進(jìn)的徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測算法[J].計算機系統(tǒng)應(yīng)用,2012,21(8):214-217.
[6]李曉輝,謝建紅,高鑫.基于 Brushlet和 RBF網(wǎng)絡(luò)的SAR圖像分類[J].微計算機信息,2009,25(2-3):295-297.