陳 悅 ,黃寄洪
(1.2.梧州學(xué)院 信息與電子工程學(xué)院,廣西 梧州 543002)
由于在拍照文檔、證件、票據(jù)、郵政信封、手稿文書等光學(xué)字符識別(Optical character recognition,OCR)系統(tǒng)以及手寫文字輸入設(shè)備中的廣泛應(yīng)用,自上個(gè)世紀(jì)80年代以來,手寫漢字識別一直是模式識別的一個(gè)重要研究領(lǐng)域。手寫體漢字識別可以分為脫機(jī)(Offline)識別和聯(lián)機(jī)(Online)識別兩大類,聯(lián)機(jī)識別所處理的手寫文字是通過觸摸屏或數(shù)字手寫板等設(shè)備獲取到的在線實(shí)時(shí)書寫的文字信號,而脫機(jī)手寫文字識別所處理的手寫文字是通過掃描儀或攝像頭等圖像捕捉設(shè)備獲取到的手寫文字圖片。由于識別的對象不同,使得這兩類手寫識別技術(shù)所采用的方法和策略也不盡相同。前者的識別對象是一系列按時(shí)間先后排列的采樣點(diǎn)信息,而后者則是丟失了書寫筆順信息的二維像素信息,由于沒有筆順信息,加上在不同光照、分辨率、書寫紙張等條件下進(jìn)行圖像采集,難免會受到噪聲干擾。一般來說,脫機(jī)手寫文字識別比聯(lián)機(jī)手寫文字識別更加困難,本文研究的是脫機(jī)手寫漢字識別。
盡管經(jīng)過了多年的研究發(fā)展,手寫漢字識別目前仍然是一個(gè)極具挑戰(zhàn)性的模式識別問題[1],主要表現(xiàn)在:第一,漢字個(gè)數(shù)多,僅1980年制定的國標(biāo)GB2312-80編碼就定義了多達(dá)6763類常用漢字,而在2000年發(fā)布的國標(biāo)GB18010-2000則大幅度擴(kuò)展了字符集,定義了27533類漢字編碼標(biāo)準(zhǔn),因此漢字識別問題屬于超大規(guī)模數(shù)據(jù)集的模式識別問題。第二,字形變化多,相比較于印刷體漢字,手寫字體的書寫缺乏規(guī)范性,隨意性較大而且變化也多樣,如常用的橫、豎、撇、捺、點(diǎn)等筆劃容易變形為其他筆劃,此外不同人的書寫風(fēng)格各有特點(diǎn)也造成手寫體的變化多種多樣。第三,漢字相似字多,例如:“己-已” “囗-口” “淚-汩-汨”“菜-萊”“睢-雎”“汆-氽”等,這些高度相似的漢字給計(jì)算機(jī)自動(dòng)識別帶來極大的挑戰(zhàn)。
經(jīng)過研究學(xué)者們的不懈努力,近年來手寫漢字識別取得了極大的進(jìn)展,基于鑒別特征提取方法(Discriminative feature learning,DFE)和鑒別學(xué)習(xí)二次判決函數(shù)(Discriminative learning quadratic discriminant function,DLQDF)分類器,在極具挑戰(zhàn)的脫機(jī)手寫漢字?jǐn)?shù)據(jù)集CASIA-HWDB[2]的DB1.1上,手寫單字識別取得的最高識別率是[3]92.08%;在國際文檔分析與識別大會漢字單字識別競賽(ICDAR 2013 Competition DB)中最高識別率是92.72%。但是近年來基于傳統(tǒng)的“預(yù)處理+特征提取+分類器”的手寫漢字識別框架遇到了瓶頸,識別正確率難以得到較大幅度的提升,隨著深度學(xué)習(xí)的興起以及不斷發(fā)展[4-6],特別是深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)[7-8]、深度置信網(wǎng)絡(luò)(Deep belief network,DBN)[4]、深度遞歸神經(jīng)網(wǎng)絡(luò)(Deep recurrent neural network,DRNN)[9]等深度模型在圖像識別及計(jì)算機(jī)視覺各領(lǐng)域大量突破性成果的涌現(xiàn),相關(guān)的方法也被逐步應(yīng)用到手寫體文字識別領(lǐng)域[10-12],并取得了不少突破性發(fā)展,例如自2011年起,連續(xù)兩屆的ICDAR(International Conference on Document Analysis and Recognition)手寫漢字識別比賽的獲勝者都是采用基于深度學(xué)習(xí)或神經(jīng)網(wǎng)絡(luò)的方法[13-14],在2013年的ICDAR手寫漢字比賽中,來自富士通公司的團(tuán)隊(duì)采用改進(jìn)的CNN網(wǎng)絡(luò),獲得了脫機(jī)手寫漢字識別的第一名,因此基于深度學(xué)習(xí)的方法所取得的結(jié)果大幅度領(lǐng)先傳統(tǒng)的方法,顯示出深度學(xué)習(xí)的強(qiáng)大潛力。
基于深度學(xué)習(xí)的手寫漢字識別方法相比傳統(tǒng)方法有了質(zhì)的提高,但離終極目標(biāo)100%識別正確率還是有一定的差距,而且這只是在給定的標(biāo)準(zhǔn)數(shù)據(jù)集下得到的最好結(jié)果,因此不斷提高手寫漢字的識別率將是今后很長一段時(shí)間內(nèi)的研究重點(diǎn)和難點(diǎn)?;谏疃葘W(xué)習(xí)方法識別率的提高通??梢酝ㄟ^優(yōu)化漢字特征提取、加深深度學(xué)習(xí)網(wǎng)絡(luò)的層數(shù)、加大深度學(xué)習(xí)每一層網(wǎng)絡(luò)的規(guī)模以及增加學(xué)習(xí)樣本來實(shí)現(xiàn),本文提出一種方法,可以在不對特征提取方法、深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)、學(xué)習(xí)樣本數(shù)量做優(yōu)化的情況下,僅利用相似漢字之間內(nèi)在的相似性特性來提高識別正確率,實(shí)驗(yàn)結(jié)果表明該方法能夠有效提高識別正確率。
用于圖像識別的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)一般按照輸入層、卷積層、數(shù)據(jù)采樣層、全連接層、輸出層這樣的基本結(jié)構(gòu)進(jìn)行設(shè)計(jì)[15],其中輸入層接受的是二維圖像數(shù)據(jù),為了盡可能減少不必要的干擾因素,輸入圖像首先應(yīng)該經(jīng)過噪聲去除、歸一化、二值化甚至特征提取等預(yù)處理操作。卷積層使用多個(gè)卷積核對輸入的二維圖像數(shù)據(jù)進(jìn)行卷積操作,每一個(gè)卷積核對應(yīng)一個(gè)或者是一類的漢字特征,卷積之后的結(jié)果還是二維圖像。為了防止過度擬合,對于尺寸較大的二維圖像輸出結(jié)果還需要進(jìn)行池化和以一定概率隨機(jī)斷開輸入神經(jīng)元的數(shù)據(jù)采樣操作,這部分操作放在數(shù)據(jù)采樣層進(jìn)行處理。由于卷積和池化操作的輸出仍然是二維圖像,因此卷積層和數(shù)據(jù)采樣層可以串聯(lián)多層,把上一層的輸出作為下一層的輸入。全連接層的輸入是一維向量,因此從最后一層卷積層或者數(shù)據(jù)采樣層的輸出圖像需要重整為一維向量輸入到全連接層中,與卷積層類似,全連接層同樣可以添加多層。輸出層輸出分類結(jié)果,由于漢字識別屬于多分類問題,因此輸出層是一個(gè)能實(shí)現(xiàn)多分類的分類器,如softmax回歸、多分類支持向量機(jī)等。
手寫漢字識別是一個(gè)多分類問題,采用單層多分類器進(jìn)行漢字識別的優(yōu)點(diǎn)在于處理過程簡單和規(guī)整,在訓(xùn)練階段,每一個(gè)類別都被平等地對待,每一個(gè)樣本都被不加區(qū)分地進(jìn)行學(xué)習(xí);在分類階段,一個(gè)輸入樣本經(jīng)多分類器處理后的輸出就是最終的分類類別。然而不同的類別之間的差異并不是均勻的,特別是對于漢字來說,不同漢字之間有的差別非常大,有的卻很小,因此把大量差別不均勻的不同漢字混合在一起進(jìn)行訓(xùn)練學(xué)習(xí),結(jié)果將會是對于特征明顯的、與其他漢字差別較大的漢字識別效果會很好,但是對于特征不明顯的、容易混淆的漢字的分辯能力會因大規(guī)模無差別的學(xué)習(xí)而被削弱,從而導(dǎo)致把相似的兩個(gè)或者幾個(gè)漢字相互錯(cuò)誤分類。解決問題的一個(gè)方法是,對相近的兩個(gè)或者幾個(gè)類別設(shè)計(jì)專門的小類別分類器,這樣一來分類器就可以聚焦在不多的兩個(gè)或幾個(gè)類別的差異上,從而可以提高識別率。要將一個(gè)待分類漢字樣本正確輸送到所對應(yīng)的小分類器進(jìn)行識別需要分兩步走,第一步是使用粗粒度的分類器對待分類樣本進(jìn)行初次分類,如果該漢字樣本被錯(cuò)誤分類也會以較大的大概率被分類到與它相似的其他漢字類別上,因此可以對漢字集進(jìn)行分析,找出全部的相似字集,然后對每一個(gè)相似字集訓(xùn)練專門的細(xì)粒度分類器;第二步根據(jù)初次分類的結(jié)果確定待分類漢字所對應(yīng)的相似字集,然后使用相應(yīng)的細(xì)粒度分類器進(jìn)行最終的分類。由于細(xì)粒度分類器的分類正確率更高,所以能夠糾正相當(dāng)多一部分原先通過大規(guī)模無差別學(xué)習(xí)得到的分類器進(jìn)行分類造成的錯(cuò)誤,從而提高總體識別正確率。
2.2.1粗細(xì)粒度分類器
基于粗細(xì)粒度深度學(xué)習(xí)的手寫漢字識別分類器由粗、細(xì)粒度兩種深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合而成,其中粗粒度卷積神經(jīng)網(wǎng)絡(luò)由漢字集的全體訓(xùn)練樣本學(xué)習(xí)得到;細(xì)粒度卷積神經(jīng)網(wǎng)絡(luò)由各個(gè)相似字集訓(xùn)練樣本分別學(xué)習(xí)得到,有多少個(gè)相似字集就學(xué)習(xí)得到多少個(gè)細(xì)粒度分類器;不在任何一個(gè)相似字集中的所有漢字構(gòu)成一個(gè)非相似字集,在該字集中的漢字被認(rèn)為互不相似,該字集的全部訓(xùn)練樣本也學(xué)習(xí)得到一個(gè)非相似字集分類器。
2.2.2識別流程
待識別漢字樣本進(jìn)行識別的時(shí)候首先經(jīng)過粗粒度分類器進(jìn)行識別,如果分類后的結(jié)果被判定為落在某個(gè)相似字集內(nèi)(包括正確識別的情況),則使用相應(yīng)的細(xì)粒度分類器進(jìn)行二次識別,否則如果不落在任何一個(gè)相似字集內(nèi),則輸入到非相似字集分類器進(jìn)行二次識別,二次識別后的結(jié)果就是該漢字最終的識別結(jié)果,識別流程如圖1所示。
圖1 手寫漢字識別流程圖
2.2.3 相似字集的確定
兩個(gè)漢字的相似程度可以通過比較兩個(gè)漢字向量化之后的距離來確定,為了找到能夠量化漢字集內(nèi)漢字兩兩之間相似程度的相似度矩陣,相應(yīng)的計(jì)算復(fù)雜度是全體漢字個(gè)數(shù)的平方。另一種確定兩個(gè)漢字相似程度的方法是利用訓(xùn)練好的分類器對兩個(gè)漢字的測試樣本進(jìn)行識別,相互錯(cuò)誤識別的結(jié)果越多也就意味著兩個(gè)漢字的相似程度越高,以至分類器難以區(qū)分;同樣對全體漢字測試樣本進(jìn)行識別,識別錯(cuò)誤結(jié)果的分布即構(gòu)成了相似度矩陣。如表1所示,水平方向的數(shù)值是某個(gè)漢字通過訓(xùn)練好的分類器識別為其他漢字的數(shù)量,將正方形數(shù)字區(qū)域沿著“左上-右下”方向的對角線疊加后去除對角線上的數(shù)值,剩下的三角區(qū)域即可作為衡量漢字兩兩之間相似程度的三角矩陣。
表1 識別結(jié)果分布(每種漢字10個(gè)測試樣本)
通過一定的算法,可以把互為相似的一系列漢字找到,這些漢字構(gòu)成一個(gè)相似字集,重復(fù)這個(gè)過程,直到把所有相似字集都找到為止。
2.2.4 識別率提高的條件
一個(gè)待識別的漢字樣本使用傳統(tǒng)分類器進(jìn)行識別的結(jié)果可以分成三種情況,一是正確識別;二是錯(cuò)誤識別但識別為相似字集中的某個(gè)漢字;三是錯(cuò)誤識別并且識別為相似字集外的某個(gè)漢字。對于沒有相似字的漢字只需要把第二和第三種情況的相似字集改為非相似字集即可。在原分類器的基礎(chǔ)上結(jié)合細(xì)粒度分類器的手寫漢字識別方法對上述三種情況的影響是:對于原正確識別的樣本依舊被正確識別;原錯(cuò)誤識別但識別為相似字集中某個(gè)漢字的樣本有相當(dāng)多一部分能夠被糾正;原錯(cuò)誤識別并且識別為相似字集外某個(gè)漢字的樣本無法糾正,但也不影響識別率。盡管該方法也可能把原來正確識別的樣本變成錯(cuò)誤識別,但由于這種可能性較低,基本不會降低第一種情況的識別率,加上對第二種情況糾正的樣本數(shù)量比糾錯(cuò)數(shù)量要多,因此該方法能夠有效地提高識別正確率。以下給出識別率能夠提高的條件以及提高的數(shù)值。
假設(shè)使用某分類器對某漢字手寫測試樣本進(jìn)行識別的正確率為p1,識別錯(cuò)誤但識別為其他(非)相似字集內(nèi)漢字的錯(cuò)誤率為n1,識別錯(cuò)誤且不識別為(非)相似字集內(nèi)漢字的錯(cuò)誤率為n2,則
p1+n1+n2=1
(1)
以該分類器作為粗粒度分類器。在待識別漢字所在的相似字集上訓(xùn)練得到的細(xì)粒度分類器對該漢字的測試樣本進(jìn)行識別的正確率為p2,則粗細(xì)粒度分類器結(jié)合之后的最終識別正確率為
(p1+n1)×p2
(2)
由(1)、(2)兩式可得
(1-n2)×p2
(3)
令(1-n2) ×p2>p1,可得p2-p1>p2×n2,由此可知,對某漢字識別正確率提高的條件是:細(xì)粒度分類器的識別正確率p2要比粗粒度分類器的識別正確率p1大p2×n2。因?yàn)閜2<1,所以如果p2-p1>n2也可以推出p2-p1>p2×n2。
假設(shè)總字集中共有N個(gè)不同的漢字,對于這N個(gè)不同漢字的測試樣本,其中第i個(gè)漢字的樣本在粗、細(xì)粒度分類器(對于無相似字的樣本則對應(yīng)非相似字集分類器)上的識別正確率分別為p1i、p2i,由(3)式可得使用粗細(xì)粒度分類器識別的正確率為(1-n2i) ×p2i, 假設(shè)不同漢字的測試樣本數(shù)量都一樣,則總的識別正確率提高的百分比為
(4)
(5)
實(shí)驗(yàn)訓(xùn)練及測試數(shù)據(jù)來源于中科院自動(dòng)化研究所的脫機(jī)手寫漢字CASIA-HWDB1.1(DB1.1)數(shù)據(jù)集[2],DB1.1總共包含GB2312-80標(biāo)準(zhǔn)level-1的3755個(gè)漢字,因?yàn)楸緦?shí)驗(yàn)需要驗(yàn)證的效果和字集規(guī)模大小無關(guān),為了節(jié)省實(shí)驗(yàn)時(shí)間僅選擇部分漢字(140個(gè))進(jìn)行實(shí)驗(yàn),選擇的140個(gè)漢字為“的一是了我不人在他有這個(gè)上們來到時(shí)大地為子中你說生國年著就那和要她出也得里后自以會家可下而過天去能對小多然于心學(xué)么之都好看起發(fā)當(dāng)沒成只如事把還用第樣道想作種開美總從無情己面最女但現(xiàn)前些所同日手又行意動(dòng)方期它頭經(jīng)長兒回位分愛老因很給名法間斯知世什兩次使身者被高已親其進(jìn)此話常與活正感”。每個(gè)漢字有240個(gè)訓(xùn)練樣本以及60個(gè)測試樣本,這些訓(xùn)練樣本以及測試樣本來自300位志愿者的手寫漢字。
實(shí)驗(yàn)使用的工具是Keras[16], Keras是一個(gè)高層神經(jīng)網(wǎng)絡(luò)API,Keras由純Python編寫而成并基Tensorflow、Theano以及CNTK后端。
3.2.1 粗粒度深度卷積神經(jīng)網(wǎng)絡(luò)
粗粒度分類器設(shè)計(jì)為依次由輸入層、32個(gè)3×3大小的卷積核構(gòu)成的卷積層、2×2大小的池化層、64個(gè)3×3大小的卷積核構(gòu)成的卷積層、2×2大小的池化層、以25%概率隨機(jī)斷開輸入神經(jīng)元的隨機(jī)采樣層、128個(gè)神經(jīng)元構(gòu)成的全連接層、以50%概率隨機(jī)斷開輸入神經(jīng)元的隨機(jī)采樣層、以softmax作為激活函數(shù)的140個(gè)神經(jīng)元構(gòu)成的全連接輸出層所組成,除了輸出層以softmax作為激活函數(shù)以外,其余所有的卷積層和全連接層均使用relu函數(shù)作為激活函數(shù),網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)如圖2所示。
圖2 粗粒度深度卷積神經(jīng)網(wǎng)絡(luò)
3.2.2 細(xì)粒度深度卷積神經(jīng)網(wǎng)絡(luò)
細(xì)粒度分類器設(shè)計(jì)為依次由輸入層、5×5大小的卷積核構(gòu)成的三層卷積層(卷積核數(shù)量分別為:32、64、64,每個(gè)卷積層后面都跟有2×2大小的池化層、以20%概率隨機(jī)斷開輸入神經(jīng)元的隨機(jī)采樣層)、128個(gè)神經(jīng)元構(gòu)成的全連接層、以50%概率隨機(jī)斷開輸入神經(jīng)元的隨機(jī)采樣層、以softmax作為激活函數(shù)的全連接輸出層所組成,除了輸出層以softmax作為激活函數(shù)以外,其余所有的卷積層和全連接層均使用relu函數(shù)作為激活函數(shù),網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)如圖3所示。
圖3 細(xì)粒度深度卷積神經(jīng)網(wǎng)絡(luò)
3.3.1 粗粒度分類器的識別率
粗粒度深度卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過多次迭代以及反復(fù)精細(xì)化調(diào)節(jié)的訓(xùn)練之后,在測試樣本集上的識別正確率穩(wěn)定在85.8%左右,如圖4所示,當(dāng)繼續(xù)增加迭代次數(shù)以及精細(xì)化調(diào)節(jié)之后已經(jīng)不能對識別率有進(jìn)一步的提高了,因此85.8%的識別正確率是在該網(wǎng)絡(luò)結(jié)構(gòu)下能達(dá)到的最高或者接近最高的識別正確率。
圖4 識別率隨迭代次數(shù)增加的變化
3.3.2相似度矩陣以及相似字集
基于粗粒度深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),對140個(gè)漢字總共33600個(gè)訓(xùn)練樣本的數(shù)據(jù)集采用五折交叉驗(yàn)證的方式進(jìn)行訓(xùn)練以及識別,找到識別結(jié)果分布矩陣,去掉“左上-右下”對角線上的值之后再把上三角矩陣的值疊加到下三角矩陣,得到了140個(gè)漢字的相互錯(cuò)誤識別三角矩陣,用圖像把三角矩陣顯示出來,如圖5所示,每一個(gè)黑點(diǎn)代表兩個(gè)漢字之間相互錯(cuò)誤識別的數(shù)量,顏色越深代表錯(cuò)誤識別的數(shù)量越多,也就意味著這兩個(gè)漢字的相似程度越高。
圖5 140個(gè)漢字的相互錯(cuò)分類分布圖
最終在從140個(gè)漢字組成的漢字集中找到前18組最相似的字集,分別為:子-了,她-地,下-不,過-這-進(jìn),去-會,對-時(shí),看-著-者,從-以,無-天,手-于,頭-大-長,回-國,給-經(jīng),間-同,知-和-如,世-也,已-己,活-話。
3.3.3 細(xì)粒度分類器的識別率
細(xì)粒度深度卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過多次迭代以及反復(fù)精細(xì)化調(diào)節(jié)的訓(xùn)練之后,在18組相似字集的測試樣本集上能夠達(dá)到的識別正確率分別為:子-了97.5%,她-地90.8%,下-不95.8%,過-這-進(jìn)96.1%,去-會95.8%,對-時(shí)91.7%,看-著-者87.3%,從-以96.7%,無-天96.6%,手-于96.7%,頭-大-長98.3%,回-國94.2%,給-經(jīng)94.9%,間-同96.6%,知-和-如94.5%,世-也95.8%,已-己76.7%,活-話75.8%。
18個(gè)相似字集總共40個(gè)漢字,余下的100個(gè)漢字組成非相似字集,非相似字集分類器選用和粗粒度深度卷積神經(jīng)網(wǎng)絡(luò)相同的結(jié)構(gòu),經(jīng)過多次迭代以及反復(fù)精細(xì)化調(diào)節(jié)的訓(xùn)練之后,在測試樣本集上能夠達(dá)到的識別正確率為90.8%。
3.3.4 聯(lián)合分類器的識別率
把粗細(xì)粒度深度卷積神經(jīng)網(wǎng)絡(luò)聯(lián)合起來進(jìn)行手寫漢字識別,識別正確率由原來的85.8%提高至87.4%,盡管識別率已有了顯著提高,但距離傳統(tǒng)方法在DB1.1數(shù)據(jù)集上得到最好結(jié)果的92.08%仍有不小差距,這是由于構(gòu)成聯(lián)合分類器的粗粒度以及細(xì)粒度分類器本身的識別率不高所導(dǎo)致的,接下來要驗(yàn)證粗細(xì)粒度深度學(xué)習(xí)識別方法在基于更高識別率的粗、細(xì)粒度分類器上的更好表現(xiàn)。
3.3.5 聯(lián)合分類器識別率的進(jìn)一步提高
(1)粗粒度分類器和細(xì)粒度分類器保持使用原來的結(jié)構(gòu),而非相似字集分類器則在原結(jié)構(gòu)基礎(chǔ)上加多一層卷積層,從而使得深度神經(jīng)網(wǎng)絡(luò)的深度加深,此時(shí)的聯(lián)合分類器的識別率由原來的87.4%提高至90.1%,而相比于粗粒度分類器的85.8%更是提高了不少。
(2)在上述(1)的基礎(chǔ)上,粗粒度分類器加多一層卷積層,粗粒度分類器的識別率從85.8%提高至92.3%,已經(jīng)高于傳統(tǒng)識別方法的最高識別率,聯(lián)合分類器的識別率則提高至92.4%,提升幅度較(1)的情形要小很多,原因在于此時(shí)的粗、細(xì)粒度分類器的結(jié)構(gòu)已經(jīng)大致相同,因此要獲得比粗粒度分類器高出更多的識別率就需要對細(xì)粒度分類器的結(jié)構(gòu)進(jìn)行進(jìn)一步的改進(jìn),比如增加深度或者使用更多的訓(xùn)練樣本,這也意味著更高的學(xué)習(xí)代價(jià)——訓(xùn)練時(shí)間更長、需要的計(jì)算資源也更多,但基于粗細(xì)粒度的深度學(xué)習(xí)方法較其他方法更有優(yōu)勢的地方在于構(gòu)成聯(lián)合分類器的粗、細(xì)粒度分類器是互不相干可以獨(dú)立訓(xùn)練的個(gè)體,細(xì)粒度分類器只需要在少數(shù)的幾個(gè)類別中訓(xùn)練,即便需要把深度卷積網(wǎng)絡(luò)的復(fù)雜度提高,把訓(xùn)練樣本的數(shù)量加大,也不會造成過高的時(shí)間開銷。
實(shí)驗(yàn)結(jié)果表明,基于粗細(xì)粒度的深度卷積神經(jīng)網(wǎng)絡(luò)用于手寫漢字識別的實(shí)驗(yàn)結(jié)果符合理論預(yù)期,能夠達(dá)到提高識別正確率的目的。