馮文革 李琳 雷軍麗
摘要:目前,基于神經(jīng)模擬網(wǎng)絡(luò)應(yīng)用技術(shù)方案的辨識(shí)匹配算法層出不窮,其已經(jīng)成為各行各業(yè)廣泛應(yīng)用的數(shù)字化技術(shù)之一。在針對(duì)手工書寫體數(shù)字進(jìn)行辨識(shí)匹配的過(guò)程中,相關(guān)應(yīng)用算法主要以反向傳播神經(jīng)模擬網(wǎng)絡(luò)類型為主。然而,該網(wǎng)絡(luò)類型本身訓(xùn)練時(shí)間相對(duì)較長(zhǎng),同時(shí)有可能出現(xiàn)局部最小的弊端。為避免此類問(wèn)題影響實(shí)際辨識(shí)匹配效果,需要基于神經(jīng)模擬網(wǎng)絡(luò)進(jìn)一步探索相關(guān)應(yīng)用算法,使手工書寫體數(shù)字能夠得到高效率、高質(zhì)量辨識(shí)匹配。本文主要針對(duì)基于神經(jīng)模擬網(wǎng)絡(luò)的手工書寫體數(shù)字辨識(shí)匹配算法設(shè)計(jì)進(jìn)行深入研究,以供參考。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);手寫體數(shù)字;識(shí)別算法
數(shù)字辨識(shí)匹配算法當(dāng)前應(yīng)用范圍較廣,在各種信息化平臺(tái)中均存在基礎(chǔ)需求。通過(guò)結(jié)合神經(jīng)模擬網(wǎng)絡(luò)解決方案,能夠快速對(duì)手工書寫體數(shù)字進(jìn)行辨識(shí)匹配,有效降低錯(cuò)誤率,增強(qiáng)工作效率。通過(guò)對(duì)神經(jīng)模擬網(wǎng)絡(luò)手工書寫體數(shù)字辨識(shí)匹配算法進(jìn)行分析,能夠明確其主要概念與設(shè)計(jì)細(xì)節(jié),有利于強(qiáng)化整體應(yīng)用效果,對(duì)未來(lái)進(jìn)一步開展手工書寫體數(shù)字辨識(shí)匹配具有正面影響意義。
1 神經(jīng)模擬網(wǎng)絡(luò)與反向傳播辨識(shí)匹配應(yīng)用算法基礎(chǔ)概念簡(jiǎn)述
1.1神經(jīng)模擬網(wǎng)絡(luò)
神經(jīng)模擬網(wǎng)絡(luò)又被稱作人工神經(jīng)模擬網(wǎng)絡(luò)類型,即ANN。其自上世紀(jì)八十年代開始出現(xiàn)研究熱潮,主要針對(duì)信息處理角度進(jìn)行探究。ANN對(duì)信息內(nèi)容的處理方式主要通過(guò)抽象人腦運(yùn)轉(zhuǎn)邏輯、建立基礎(chǔ)模型的措施完成,其可以將多種主要連接方案整合為主體網(wǎng)絡(luò),進(jìn)而達(dá)到高效率應(yīng)用的目標(biāo)。ANN在工程學(xué)界被稱作類神經(jīng)模擬網(wǎng)絡(luò)的一種,主要代表運(yùn)算應(yīng)用模型方案,通過(guò)海量的處理節(jié)點(diǎn)并聯(lián)而成,與人類大腦的神經(jīng)模擬元存在一定程度的相似性[1]。常規(guī)情況下,處理節(jié)點(diǎn)自身能夠代表特定條件的輸出應(yīng)用函數(shù),即激勵(lì)函數(shù)。兩個(gè)節(jié)點(diǎn)之間建立連接關(guān)系即可代表對(duì)單一連接用信號(hào)的加權(quán)數(shù)據(jù),即權(quán)重。這一結(jié)構(gòu)能夠組成ANN記憶,最終為輸出內(nèi)容提供基礎(chǔ)處理?xiàng)l件。網(wǎng)絡(luò)本身權(quán)重?cái)?shù)據(jù)與激勵(lì)函數(shù)若存在差異,則邏輯策略也會(huì)出現(xiàn)差異。因此,神經(jīng)模擬網(wǎng)絡(luò)的算法具有多樣化應(yīng)用特征。
1.2反向傳播辨識(shí)匹配算法
反向傳播辨識(shí)匹配算法屬于經(jīng)典手工書寫體數(shù)字辨識(shí)匹配解決方案,其具有前向應(yīng)用特征,主要包含三個(gè)基礎(chǔ)層次,即輸入、隱含、輸出。通常情況下,該網(wǎng)絡(luò)隱含層可以設(shè)置為單層或多層兩種,各層需要由單一或多個(gè)節(jié)點(diǎn)組成,同層節(jié)點(diǎn)之內(nèi)不允許建立連接,層與層之間的節(jié)點(diǎn)需要保證全連接狀態(tài)。反向傳播神經(jīng)模擬網(wǎng)絡(luò)的應(yīng)用核心便是反向傳播算法,這一算法由正向傳遞與誤差反向傳播組成。在正向傳播過(guò)程中,輸入的信息內(nèi)容需要從輸入?yún)^(qū)域、隱含層逐步計(jì)算,最終輸入至輸出層面。但是,其應(yīng)用階段受到基本原理的限制,經(jīng)常需要消耗大量時(shí)間,同時(shí)有可能陷入局部最小值狀態(tài)。因此,需要基于全新改進(jìn)版神經(jīng)模擬網(wǎng)絡(luò)方案,對(duì)手工書寫體數(shù)字的辨識(shí)匹配算法進(jìn)行革新處理,使其能夠擺脫原有反向傳播網(wǎng)絡(luò)限制,達(dá)到理想優(yōu)化目標(biāo),進(jìn)一步提高整體辨識(shí)匹配效率與質(zhì)量。
2 基于神經(jīng)模擬網(wǎng)絡(luò)方案設(shè)計(jì)匹配算法研究
2.1初始階段化轉(zhuǎn)變種族群落內(nèi)容
在改進(jìn)神經(jīng)模擬網(wǎng)絡(luò)手寫數(shù)字辨識(shí)匹配算法的過(guò)程中,需要首先處理種族群落初始階段化轉(zhuǎn)變模塊。常規(guī)情況下,針對(duì)不存在先驗(yàn)知識(shí)內(nèi)容的優(yōu)化性問(wèn)題,經(jīng)典遺傳ANN算法主要利用隨機(jī)方式處理產(chǎn)生階段。這種方式雖然效率較高,但會(huì)導(dǎo)致完成初始階段化轉(zhuǎn)變的群體出現(xiàn)一定程度的盲目特性,同時(shí)也不利于篩選具有代表特征的群體。因此,在改進(jìn)過(guò)程中需要利用正交設(shè)計(jì)方式,對(duì)種族群落進(jìn)行科學(xué)初始階段化轉(zhuǎn)變。利用此類方法初始階段化轉(zhuǎn)變的群體能夠有效代表所有可能性組合,同時(shí)也可以提高數(shù)值的優(yōu)化特性,使其搜索效率得到顯著提升[2]。通過(guò)應(yīng)用正交方式初始階段化轉(zhuǎn)變?nèi)后w,還可以使初始種族群落內(nèi)容具有高魯棒性與高統(tǒng)計(jì)合理性,有利于后續(xù)進(jìn)一步展開辨識(shí)匹配操作。
2.1.1構(gòu)建正交設(shè)計(jì)矩陣類型
常規(guī)情況下,正交矩陣的規(guī)劃措施較為豐富,為確保后續(xù)手工書寫體數(shù)字能夠得到高效率、高質(zhì)量辨識(shí)匹配,本次改進(jìn)應(yīng)當(dāng)重視設(shè)計(jì)方法的計(jì)算便捷特性。通過(guò)將Q設(shè)置為基因變量變化水平數(shù),N設(shè)置為基因個(gè)數(shù),可以總結(jié)正交設(shè)計(jì)矩陣為 ,同時(shí) 。在這一矩陣前提下,針對(duì)正交設(shè)計(jì)的矩陣基本列進(jìn)行構(gòu)造處理時(shí),基礎(chǔ)算法如下:
For k=1 to J do
Begin
For i=1 to QJ do
mod Q
End
在構(gòu)造非基本列的過(guò)程中,其基礎(chǔ)算法如下:
For k=2 to J do
Begin
For s=1 to j-1 do
Or t=1 to Q-1 do
End
在構(gòu)建完成后,需要對(duì)ai,j進(jìn)行+1處理,使l≤i≤M,l≤j≤N。
2.1.2開始生成初始階段種族群落
在完成種族群落的初始階段化轉(zhuǎn)變操作后,由于無(wú)法明確反向傳播網(wǎng)絡(luò)本身所具有的權(quán)重?cái)?shù)據(jù)與閾值數(shù)據(jù),同時(shí)也無(wú)法了解全局最小信息。因此,初始種族群落的實(shí)際染色體內(nèi)容將會(huì)呈現(xiàn)均勻分布狀態(tài),其在可行解的空間內(nèi)具有一定程度的合理性。通過(guò)將xi設(shè)定為第i個(gè)基礎(chǔ)因素,即可使單一染色體能夠?qū)?yīng)N個(gè)基礎(chǔ)因素。這些因素本身存在連續(xù)性特征與變化性特征,因此必須將各個(gè)因素進(jìn)行離散化轉(zhuǎn)變,使其能夠成為有限個(gè)數(shù)量值。在實(shí)際執(zhí)行階段,需要將xi的區(qū)間[l,u]分割為Q個(gè)基礎(chǔ)水平,進(jìn)而獲得初始種族群落,即 。Ti,j本身屬于初始種族群落矩陣內(nèi)T元素的實(shí)際數(shù)值,而δ為實(shí)際數(shù)據(jù)較低的隨機(jī)數(shù)字,常規(guī)情況下需要保證 。針對(duì)手寫數(shù)字辨識(shí)匹配應(yīng)用測(cè)試樣品進(jìn)行訓(xùn)練的反向傳播網(wǎng)絡(luò)類型,其需要大量的訓(xùn)練網(wǎng)絡(luò)權(quán)重?cái)?shù)據(jù)與閾值數(shù)據(jù)。在這種情況下,N的數(shù)值會(huì)存在過(guò)大問(wèn)題,最終導(dǎo)致M的數(shù)據(jù)增大。這種規(guī)模龐大的矩陣作為初始應(yīng)用種族群落會(huì)嚴(yán)重消耗存儲(chǔ)空間,同時(shí)也會(huì)增加算法進(jìn)行迭代的總時(shí)長(zhǎng)[3]。因此,需要從T中利用隨機(jī)處理方式選擇n個(gè)具有不同行為的個(gè)體元素作為初始應(yīng)用種族群落,確保后續(xù)能夠達(dá)到理想辨識(shí)匹配目標(biāo)。
2.2針對(duì)父系應(yīng)用個(gè)體元素進(jìn)行篩選
篩選父系應(yīng)用個(gè)體元素的過(guò)程中,應(yīng)用賭輪盤處理方式進(jìn)行操作容易導(dǎo)致神經(jīng)模擬網(wǎng)絡(luò)優(yōu)化出現(xiàn)收斂過(guò)快的負(fù)面問(wèn)題。因此,在改進(jìn)算法中為確保群體多樣性能夠符合需求,需要盡可能減少算法的實(shí)際收斂速度,避免其出現(xiàn)過(guò)快弊端。在選擇階段,針對(duì)低于平均適應(yīng)度的個(gè)體元素需要進(jìn)行淘汰處理。被淘汰的個(gè)體元素可以從T內(nèi)部隨機(jī)選擇單行作為新型個(gè)體元素,同時(shí)提高δ的實(shí)際變化范圍。為確保種族群落能夠達(dá)到優(yōu)秀的多樣性,需要在低于平均適應(yīng)度個(gè)體元素?cái)?shù)量低于1/4種族群落整體數(shù)量時(shí),采用保持處理措施,使其數(shù)量能夠穩(wěn)定在該層次,實(shí)現(xiàn)最佳處理效果。
3 算法應(yīng)用案例方針?lè)治?/p>
在針對(duì)改進(jìn)算法進(jìn)行測(cè)試的過(guò)程中,主要采用USPS手寫類型數(shù)字應(yīng)用測(cè)試樣品作為基礎(chǔ)實(shí)驗(yàn)應(yīng)用數(shù)據(jù),應(yīng)用測(cè)試樣品總量為1200個(gè)。單一應(yīng)用測(cè)試樣品數(shù)據(jù)內(nèi)存儲(chǔ)16X16的圖像應(yīng)用測(cè)試樣品,同時(shí)將ANN的實(shí)際輸入成熟設(shè)置為512,部署0~9個(gè)類別,共10種。由于類別為10種,因此需要將輸出的成熟設(shè)置為10,并根據(jù)經(jīng)驗(yàn)隱含層部署 。在該部署內(nèi)容中,I代表輸入層實(shí)際神經(jīng)模擬元數(shù)量,Q代表輸出層實(shí)際神經(jīng)模擬元數(shù)量,n需要在0~10內(nèi)進(jìn)行選取[4]。在實(shí)驗(yàn)階段,隱含層實(shí)際數(shù)量需要設(shè)置為20,同時(shí)訓(xùn)練目標(biāo)為0.05。反向傳播網(wǎng)絡(luò)類型需要應(yīng)用L-M的訓(xùn)練處理方案,改進(jìn)的參數(shù)為種族群落規(guī)模25、交叉概率0.8、迭代數(shù)量70、權(quán)重?cái)?shù)值與閾值取值范圍[-4,4]、水平數(shù)量10。通過(guò)對(duì)兩種基礎(chǔ)應(yīng)用算法進(jìn)行對(duì)比,結(jié)果如表1所示,能夠發(fā)現(xiàn)改進(jìn)版算法相對(duì)于經(jīng)典反向傳播算法具有更快的處理速度。手寫數(shù)字內(nèi)容的辨識(shí)匹配精確程度與應(yīng)用測(cè)試樣品數(shù)量存在關(guān)聯(lián),因此需要通過(guò)增加應(yīng)用測(cè)試樣品量的方式,使手寫數(shù)字辨識(shí)匹配效果能夠達(dá)到理想目標(biāo)。改進(jìn)版神經(jīng)模擬網(wǎng)絡(luò)手寫數(shù)字算法能夠以較短的訓(xùn)練時(shí)間完成整體規(guī)劃,具有良好的應(yīng)用效果。
結(jié)論:
綜上所述,基于神經(jīng)模擬網(wǎng)絡(luò)訓(xùn)練的手工書寫體數(shù)字辨識(shí)匹配具有良好的應(yīng)用效果。通過(guò)對(duì)其設(shè)計(jì)方式進(jìn)行分析,能夠明確基礎(chǔ)應(yīng)用原理,有利于未來(lái)進(jìn)一步改進(jìn)相關(guān)細(xì)節(jié),使其可以適應(yīng)工作需求變化,實(shí)現(xiàn)理想部署目標(biāo)。
參考文獻(xiàn)
[1]陳巖,李洋洋,余樂(lè),等.基于卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識(shí)別系統(tǒng)[J].微電子學(xué)與計(jì)算機(jī),2018,405(02):71-74.
[2]蔣銳鵬,姑麗加瑪麗·麥麥提艾力,安麗娜.基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識(shí)別[J].計(jì)算機(jī)技術(shù)與發(fā)展,2020,274(02):100-103.
[3]茹曉青,華國(guó)光,李麗宏,等.基于形變卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識(shí)別研究[J].微電子學(xué)與計(jì)算機(jī),2019,36(04):53-57.
[4]宋曉茹,吳雪,高嵩,等.基于深度神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識(shí)別模擬研究[J].科學(xué)技術(shù)與工程,2019,019(005):193-196.
基金項(xiàng)目:基于HLS的手寫體數(shù)字識(shí)別。編號(hào):2020HYA01001.教育部科技發(fā)展中心立的項(xiàng)。