余聶芳
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過(guò)對(duì)生物神經(jīng)系統(tǒng)的模擬,憑借自適應(yīng)學(xué)習(xí)以及自動(dòng)處理等功能,可達(dá)到預(yù)期目的。脫機(jī)手寫(xiě)漢字識(shí)別難度較大,為提高識(shí)別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對(duì)脫機(jī)手寫(xiě)漢字進(jìn)行識(shí)別。以小字符集漢字識(shí)別為例,針對(duì)反向傳播法中存在的缺陷,如收斂速度過(guò)慢,易陷入局部最小點(diǎn)等,對(duì)其算法進(jìn)行了改進(jìn),取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進(jìn) 脫機(jī)手寫(xiě)漢字識(shí)別 誤差函數(shù)
中圖分類(lèi)號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2014)01(b)-0047-01
漢字識(shí)別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識(shí)別;第二種是手寫(xiě)漢字,分聯(lián)機(jī)手寫(xiě)和脫機(jī)手寫(xiě)兩類(lèi),前者準(zhǔn)確率較高,后者則偏低,是當(dāng)前的研究重點(diǎn)。作為模式識(shí)別的重要組成部分,漢字識(shí)別技術(shù)應(yīng)用廣泛,但由于涉及圖像處理、人工智能、計(jì)算機(jī)、數(shù)字信號(hào)處理等多種技術(shù),加上漢字的復(fù)雜繁多,使得漢字識(shí)別存在著很大困難,如尤其是相似字,使得識(shí)別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯(cuò)誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來(lái)的,通過(guò)對(duì)生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡(jiǎn)單元件連接構(gòu)成,具有非線(xiàn)性和容錯(cuò)性,從能力特征來(lái)講,具有自適應(yīng)和自組織性。其優(yōu)勢(shì)主要體現(xiàn)在:能夠模仿人腦進(jìn)行聯(lián)想記憶;對(duì)存儲(chǔ)的信息進(jìn)行分類(lèi)識(shí)別;能夠自動(dòng)總結(jié)歸納經(jīng)驗(yàn)。在長(zhǎng)期的實(shí)踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語(yǔ)音處理、機(jī)器人研究、模式識(shí)別等諸多領(lǐng)域都有廣泛應(yīng)用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識(shí)別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機(jī)器學(xué)習(xí)能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進(jìn)行反向傳遞、修正誤差,通過(guò)結(jié)構(gòu)和權(quán)值將頗為復(fù)雜的非線(xiàn)性映射關(guān)系表達(dá)出來(lái)。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計(jì)算過(guò)程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個(gè)階段,一是正向傳播,二是反向傳播,在第一個(gè)階段,將信號(hào)輸進(jìn)系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進(jìn)行處理,主要是加權(quán)求和、激勵(lì)函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過(guò)內(nèi)部逐層處理,傳到輸出層,將實(shí)際的輸出值和預(yù)期值相比,若超過(guò)了規(guī)定的誤差范圍,就開(kāi)始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應(yīng)的權(quán)值進(jìn)行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識(shí)別中的實(shí)際應(yīng)用
2.1 缺陷
(1)站在數(shù)學(xué)的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線(xiàn)性?xún)?yōu)化算法的一種,以至于局部極小值大的問(wèn)題很難得到解決,在實(shí)際計(jì)算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進(jìn)行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒(méi)有可靠的保證。若解決的問(wèn)題比較復(fù)雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點(diǎn)
在確定訓(xùn)練集之后,輸入層和輸出層的結(jié)點(diǎn)數(shù)目也相應(yīng)的確定下來(lái),然而中間層及選取層內(nèi)結(jié)點(diǎn)時(shí),缺乏足夠的理論作指導(dǎo),中間層的結(jié)點(diǎn)數(shù)直接影響著網(wǎng)絡(luò)的學(xué)習(xí)效率和復(fù)雜程度,因此,在選取中間層變得結(jié)點(diǎn)時(shí),也應(yīng)做一定的改進(jìn),積極建立相關(guān)的指導(dǎo)理論。
3 結(jié)語(yǔ)
針對(duì)脫機(jī)手寫(xiě)漢字識(shí)別技術(shù)存在的難度,可運(yùn)用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實(shí)際應(yīng)用中,收斂速度過(guò)慢以及局部最小點(diǎn)問(wèn)題對(duì)BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵(lì)函數(shù)、誤差函數(shù)等方面對(duì)其算法加以改進(jìn),以達(dá)到提升脫機(jī)手寫(xiě)漢字識(shí)別速度和精確度的目的。
參考文獻(xiàn)
[1] 張中.漢字識(shí)別技術(shù)綜述[J].語(yǔ)言文學(xué)應(yīng)用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及其在手寫(xiě)體漢字識(shí)別中的應(yīng)用[J].江西師范大學(xué)學(xué)報(bào),2009,33(5):598-603.endprint
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過(guò)對(duì)生物神經(jīng)系統(tǒng)的模擬,憑借自適應(yīng)學(xué)習(xí)以及自動(dòng)處理等功能,可達(dá)到預(yù)期目的。脫機(jī)手寫(xiě)漢字識(shí)別難度較大,為提高識(shí)別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對(duì)脫機(jī)手寫(xiě)漢字進(jìn)行識(shí)別。以小字符集漢字識(shí)別為例,針對(duì)反向傳播法中存在的缺陷,如收斂速度過(guò)慢,易陷入局部最小點(diǎn)等,對(duì)其算法進(jìn)行了改進(jìn),取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進(jìn) 脫機(jī)手寫(xiě)漢字識(shí)別 誤差函數(shù)
中圖分類(lèi)號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2014)01(b)-0047-01
漢字識(shí)別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識(shí)別;第二種是手寫(xiě)漢字,分聯(lián)機(jī)手寫(xiě)和脫機(jī)手寫(xiě)兩類(lèi),前者準(zhǔn)確率較高,后者則偏低,是當(dāng)前的研究重點(diǎn)。作為模式識(shí)別的重要組成部分,漢字識(shí)別技術(shù)應(yīng)用廣泛,但由于涉及圖像處理、人工智能、計(jì)算機(jī)、數(shù)字信號(hào)處理等多種技術(shù),加上漢字的復(fù)雜繁多,使得漢字識(shí)別存在著很大困難,如尤其是相似字,使得識(shí)別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯(cuò)誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來(lái)的,通過(guò)對(duì)生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡(jiǎn)單元件連接構(gòu)成,具有非線(xiàn)性和容錯(cuò)性,從能力特征來(lái)講,具有自適應(yīng)和自組織性。其優(yōu)勢(shì)主要體現(xiàn)在:能夠模仿人腦進(jìn)行聯(lián)想記憶;對(duì)存儲(chǔ)的信息進(jìn)行分類(lèi)識(shí)別;能夠自動(dòng)總結(jié)歸納經(jīng)驗(yàn)。在長(zhǎng)期的實(shí)踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語(yǔ)音處理、機(jī)器人研究、模式識(shí)別等諸多領(lǐng)域都有廣泛應(yīng)用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識(shí)別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機(jī)器學(xué)習(xí)能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進(jìn)行反向傳遞、修正誤差,通過(guò)結(jié)構(gòu)和權(quán)值將頗為復(fù)雜的非線(xiàn)性映射關(guān)系表達(dá)出來(lái)。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計(jì)算過(guò)程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個(gè)階段,一是正向傳播,二是反向傳播,在第一個(gè)階段,將信號(hào)輸進(jìn)系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進(jìn)行處理,主要是加權(quán)求和、激勵(lì)函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過(guò)內(nèi)部逐層處理,傳到輸出層,將實(shí)際的輸出值和預(yù)期值相比,若超過(guò)了規(guī)定的誤差范圍,就開(kāi)始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應(yīng)的權(quán)值進(jìn)行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識(shí)別中的實(shí)際應(yīng)用
2.1 缺陷
(1)站在數(shù)學(xué)的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線(xiàn)性?xún)?yōu)化算法的一種,以至于局部極小值大的問(wèn)題很難得到解決,在實(shí)際計(jì)算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進(jìn)行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒(méi)有可靠的保證。若解決的問(wèn)題比較復(fù)雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點(diǎn)
在確定訓(xùn)練集之后,輸入層和輸出層的結(jié)點(diǎn)數(shù)目也相應(yīng)的確定下來(lái),然而中間層及選取層內(nèi)結(jié)點(diǎn)時(shí),缺乏足夠的理論作指導(dǎo),中間層的結(jié)點(diǎn)數(shù)直接影響著網(wǎng)絡(luò)的學(xué)習(xí)效率和復(fù)雜程度,因此,在選取中間層變得結(jié)點(diǎn)時(shí),也應(yīng)做一定的改進(jìn),積極建立相關(guān)的指導(dǎo)理論。
3 結(jié)語(yǔ)
針對(duì)脫機(jī)手寫(xiě)漢字識(shí)別技術(shù)存在的難度,可運(yùn)用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實(shí)際應(yīng)用中,收斂速度過(guò)慢以及局部最小點(diǎn)問(wèn)題對(duì)BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵(lì)函數(shù)、誤差函數(shù)等方面對(duì)其算法加以改進(jìn),以達(dá)到提升脫機(jī)手寫(xiě)漢字識(shí)別速度和精確度的目的。
參考文獻(xiàn)
[1] 張中.漢字識(shí)別技術(shù)綜述[J].語(yǔ)言文學(xué)應(yīng)用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及其在手寫(xiě)體漢字識(shí)別中的應(yīng)用[J].江西師范大學(xué)學(xué)報(bào),2009,33(5):598-603.endprint
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過(guò)對(duì)生物神經(jīng)系統(tǒng)的模擬,憑借自適應(yīng)學(xué)習(xí)以及自動(dòng)處理等功能,可達(dá)到預(yù)期目的。脫機(jī)手寫(xiě)漢字識(shí)別難度較大,為提高識(shí)別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對(duì)脫機(jī)手寫(xiě)漢字進(jìn)行識(shí)別。以小字符集漢字識(shí)別為例,針對(duì)反向傳播法中存在的缺陷,如收斂速度過(guò)慢,易陷入局部最小點(diǎn)等,對(duì)其算法進(jìn)行了改進(jìn),取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進(jìn) 脫機(jī)手寫(xiě)漢字識(shí)別 誤差函數(shù)
中圖分類(lèi)號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2014)01(b)-0047-01
漢字識(shí)別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識(shí)別;第二種是手寫(xiě)漢字,分聯(lián)機(jī)手寫(xiě)和脫機(jī)手寫(xiě)兩類(lèi),前者準(zhǔn)確率較高,后者則偏低,是當(dāng)前的研究重點(diǎn)。作為模式識(shí)別的重要組成部分,漢字識(shí)別技術(shù)應(yīng)用廣泛,但由于涉及圖像處理、人工智能、計(jì)算機(jī)、數(shù)字信號(hào)處理等多種技術(shù),加上漢字的復(fù)雜繁多,使得漢字識(shí)別存在著很大困難,如尤其是相似字,使得識(shí)別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯(cuò)誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來(lái)的,通過(guò)對(duì)生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡(jiǎn)單元件連接構(gòu)成,具有非線(xiàn)性和容錯(cuò)性,從能力特征來(lái)講,具有自適應(yīng)和自組織性。其優(yōu)勢(shì)主要體現(xiàn)在:能夠模仿人腦進(jìn)行聯(lián)想記憶;對(duì)存儲(chǔ)的信息進(jìn)行分類(lèi)識(shí)別;能夠自動(dòng)總結(jié)歸納經(jīng)驗(yàn)。在長(zhǎng)期的實(shí)踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語(yǔ)音處理、機(jī)器人研究、模式識(shí)別等諸多領(lǐng)域都有廣泛應(yīng)用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識(shí)別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機(jī)器學(xué)習(xí)能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進(jìn)行反向傳遞、修正誤差,通過(guò)結(jié)構(gòu)和權(quán)值將頗為復(fù)雜的非線(xiàn)性映射關(guān)系表達(dá)出來(lái)。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計(jì)算過(guò)程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個(gè)階段,一是正向傳播,二是反向傳播,在第一個(gè)階段,將信號(hào)輸進(jìn)系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進(jìn)行處理,主要是加權(quán)求和、激勵(lì)函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過(guò)內(nèi)部逐層處理,傳到輸出層,將實(shí)際的輸出值和預(yù)期值相比,若超過(guò)了規(guī)定的誤差范圍,就開(kāi)始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應(yīng)的權(quán)值進(jìn)行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識(shí)別中的實(shí)際應(yīng)用
2.1 缺陷
(1)站在數(shù)學(xué)的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線(xiàn)性?xún)?yōu)化算法的一種,以至于局部極小值大的問(wèn)題很難得到解決,在實(shí)際計(jì)算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進(jìn)行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒(méi)有可靠的保證。若解決的問(wèn)題比較復(fù)雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點(diǎn)
在確定訓(xùn)練集之后,輸入層和輸出層的結(jié)點(diǎn)數(shù)目也相應(yīng)的確定下來(lái),然而中間層及選取層內(nèi)結(jié)點(diǎn)時(shí),缺乏足夠的理論作指導(dǎo),中間層的結(jié)點(diǎn)數(shù)直接影響著網(wǎng)絡(luò)的學(xué)習(xí)效率和復(fù)雜程度,因此,在選取中間層變得結(jié)點(diǎn)時(shí),也應(yīng)做一定的改進(jìn),積極建立相關(guān)的指導(dǎo)理論。
3 結(jié)語(yǔ)
針對(duì)脫機(jī)手寫(xiě)漢字識(shí)別技術(shù)存在的難度,可運(yùn)用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實(shí)際應(yīng)用中,收斂速度過(guò)慢以及局部最小點(diǎn)問(wèn)題對(duì)BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵(lì)函數(shù)、誤差函數(shù)等方面對(duì)其算法加以改進(jìn),以達(dá)到提升脫機(jī)手寫(xiě)漢字識(shí)別速度和精確度的目的。
參考文獻(xiàn)
[1] 張中.漢字識(shí)別技術(shù)綜述[J].語(yǔ)言文學(xué)應(yīng)用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及其在手寫(xiě)體漢字識(shí)別中的應(yīng)用[J].江西師范大學(xué)學(xué)報(bào),2009,33(5):598-603.endprint