王曉娟,楊永昕(.四川外國語大學(xué) 重慶南方翻譯學(xué)院,重慶 400;. 中國兵器工業(yè)北方勘察設(shè)計(jì)研究院有限公司,石家莊 0500)
?
Hopfield網(wǎng)絡(luò)對手寫體數(shù)字識別的改進(jìn)方法
王曉娟1,楊永昕2
(1.四川外國語大學(xué) 重慶南方翻譯學(xué)院,重慶 401120;2. 中國兵器工業(yè)北方勘察設(shè)計(jì)研究院有限公司,石家莊 050011)
摘 要:計(jì)算機(jī)的功能非常強(qiáng)大,在處理圖片方面也具有很好的性質(zhì)。手寫體圖片的研究,在考古等方面有著重要的作用。本文的手寫體圖片是經(jīng)多數(shù)人書寫,保證了樣本的差異性。在圖片識別處理時(shí),選用了識別性能較強(qiáng)的離散Hopfield網(wǎng)絡(luò),并針對Hopfield網(wǎng)絡(luò)的特點(diǎn),對手寫體圖片的進(jìn)行中心歸一化處理的改進(jìn),提高了識別效率。
關(guān)鍵詞:中心歸一化;Hopfield網(wǎng)絡(luò);圖像識別
神經(jīng)網(wǎng)絡(luò)是應(yīng)用很廣的一門學(xué)科,是因?yàn)槠溆兄陨淼膬?yōu)越性:神經(jīng)網(wǎng)絡(luò)是自適應(yīng)的[1],它能從數(shù)據(jù)中自動地學(xué)習(xí)到解決問題的知識。神經(jīng)網(wǎng)絡(luò)具有容錯(cuò)性[2],既能夠處理與訓(xùn)練集中相同的數(shù)據(jù),又能夠處理不完整的數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)能夠獲取系統(tǒng)中復(fù)雜輸入變量的相互關(guān)系。神經(jīng)網(wǎng)絡(luò)的識別方法可以看成是一種介于統(tǒng)計(jì)模式識別[3]與結(jié)構(gòu)模式識別[4]之間的方法,既具有統(tǒng)計(jì)模式識別的優(yōu)點(diǎn),又吸收了結(jié)構(gòu)模式識別的長處。Hopfield神經(jīng)網(wǎng)絡(luò)的一個(gè)很重要的網(wǎng)絡(luò),本文主要研究其在手寫體數(shù)字識別方面的作用。
2.1 離散 Hopfield網(wǎng)絡(luò)的工作原理
Hopfield網(wǎng)絡(luò)是單層全反饋網(wǎng)絡(luò)[5]。根據(jù)激活函數(shù)的不同,可分為離散型Hopfield網(wǎng)絡(luò)和連續(xù)性Hopfield網(wǎng)絡(luò)。本文用的是離散型Hopfield網(wǎng)絡(luò)。它的激活函數(shù)為二值性函數(shù),即ai=sgn(ni),i=1,2,…r。輸入輸出為{0,1}的網(wǎng)絡(luò),主要用于聯(lián)想記憶。該網(wǎng)絡(luò)為單層全反饋網(wǎng)絡(luò),所以每個(gè)神經(jīng)元的輸入和其他神經(jīng)元的輸出是相連的,所以,其輸入數(shù)目和神經(jīng)元的輸出數(shù)目是相等的。即輸入和輸出都有s個(gè)。
2.2 離散Hopfield網(wǎng)絡(luò)的海布學(xué)習(xí)規(guī)則[5]
在離散Hopfield網(wǎng)絡(luò)的訓(xùn)練過程中,運(yùn)用的是海布調(diào)節(jié)規(guī)則:當(dāng)神經(jīng)元輸入與輸出節(jié)點(diǎn)的狀態(tài)相同(即同時(shí)興奮或抑制)時(shí),從第j個(gè)神經(jīng)元到第i個(gè)神經(jīng)元之間的連接強(qiáng)度增強(qiáng),否則減弱。海布規(guī)則是一種無指導(dǎo)的學(xué)習(xí)算法。
本文所用的手寫體都是在XP系統(tǒng)的畫板里面輸入的,且數(shù)字的像素是28×28,也就是說,每個(gè)手寫體數(shù)字都是一個(gè)28×28的矩陣。
3.1 圖片處理前
當(dāng)我們不對圖片進(jìn)行處理的時(shí)候,用離散Hopfield網(wǎng)絡(luò),我們給出網(wǎng)絡(luò)對手寫體數(shù)字識別的正確情況。
表1 Hopfield網(wǎng)絡(luò)各個(gè)數(shù)字的識別正確率
從上表可以看出,識別結(jié)果并不理想。數(shù)字3、8、9不能被識別,2、3、0的識別正確率也只有20%。
3.2 圖片處理后
本文中,這些手寫體圖片都是在電腦XP系統(tǒng)的畫圖工具人為輸入的。圖像的大小都是28×28。由于輸入時(shí),圖片在所輸入?yún)^(qū)域位置不一樣,圖片本身的大小也不一樣,而這對識別的結(jié)果的好壞有直接的影響。所以,本文就這兩方面做了改進(jìn)。具體的做法是,先提取圖片數(shù)字的邊緣,即數(shù)字的最左、最右、最上、最下的邊界點(diǎn),這樣我們就把圖片中有數(shù)字的區(qū)域提取了出來,之后把提取的部分?jǐn)U大成我們定義的標(biāo)準(zhǔn)尺寸。然后將擴(kuò)大后的圖片放在我們固定大小的模板上。這樣經(jīng)過處理后,圖片的數(shù)字都在一定區(qū)域內(nèi)。而且圖片并不失真。
對圖片進(jìn)行中心歸一化后,我們用已經(jīng)訓(xùn)練好的Hopfield網(wǎng)絡(luò)檢驗(yàn)識別情況,識別結(jié)果若下表
表2 Hopfield網(wǎng)絡(luò)各個(gè)數(shù)字的識別正確率
我們對比表1和表2,可以看出,對圖片進(jìn)行歸一中心化處理后,識別的正確率明顯提高了,比未處理的圖片各個(gè)數(shù)字的正確率都有提高,達(dá)到了我們的預(yù)期效果。
參考文獻(xiàn):
[1]蔡慧娟,范志宏.基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制[J].電子科學(xué)期刊,2008.
[2]張濤.人工神經(jīng)網(wǎng)絡(luò)容錯(cuò)性分析與設(shè)計(jì)的理論和應(yīng)用[D].清華大學(xué),1999.
[3]Chi Hau Chen,PeiGee Peter Ho. Statistical pattern recogni tion in remote sensing [J].Pattern Recognition,2008.
[4]譚建榮,岳小莉,陸國棟.圖形相似的基本原理、方法及其在結(jié)構(gòu)模式識別中的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2002.
[5]從爽.面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用(3版)[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2003:118,160.
DOI:10.16640/j.cnki.37-1222/t.2016.12.118
作者簡介:王曉娟(1985-),女,河北張家口人,研究生,助教,研究方向:神經(jīng)網(wǎng)絡(luò)。