陽哲
(四川大學計算機學院,成都 610065)
卷積神經(jīng)網(wǎng)絡(luò)在印章編號識別中的應(yīng)用
陽哲
(四川大學計算機學院,成都610065)
卷積神經(jīng)網(wǎng)絡(luò);印章編號;識別
印章做為一種重要的鑒定和簽署的文具,在日常生活中應(yīng)用廣泛。每一枚印章都會有一個獨一無二的編號,作為印章的標識。在實際生活中,我們往往需要輸入印章的編號來查詢印章的基本信息,但是目前都是通過手動輸入印章的編號來查詢。隨著深度學習的火熱發(fā)展,近幾年深度學習在人工智能領(lǐng)域取得很大的進展,尤其是在語音識別和圖像識別中取得很好的效果。而卷積神經(jīng)網(wǎng)絡(luò)做為一種深度的監(jiān)督學習下的機器學習模型,其在圖像識別領(lǐng)域的應(yīng)用已經(jīng)越來越廣泛,因此本文提出了基于卷積神經(jīng)網(wǎng)絡(luò)的印章編號識別算法。
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),它的特點是其前饋神經(jīng)元可以響應(yīng)一部分范圍內(nèi)的周圍單元[1],因此適應(yīng)于大型圖像處理。卷積神經(jīng)網(wǎng)絡(luò)可以識別有變化的模式,對幾何圖形變形具有魯棒性,較一般神經(jīng)網(wǎng)絡(luò)具有以下優(yōu)點:(1)輸入圖像和網(wǎng)絡(luò)的拓撲結(jié)構(gòu)可能剛好吻合;(2)特征提取和模式分類同時進行;(3)權(quán)值共享技術(shù)大大減少了網(wǎng)絡(luò)的訓練參數(shù),從而使網(wǎng)絡(luò)的結(jié)構(gòu)更加簡單,適應(yīng)性更強[2]。
1.1卷及神經(jīng)網(wǎng)絡(luò)的歷史
卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計源自于活生物體視覺機制的發(fā)現(xiàn)。20世紀60年代,Hubel和Wiesel發(fā)現(xiàn)動物的視覺皮質(zhì)中包含了許多細胞,這些細胞組成了感受野,其功能是探測細微的光線和覆蓋視覺的子區(qū)域。20世紀80年代,F(xiàn)ukushima基于感受野概念提出了神經(jīng)認知機,這個可以看做是卷積神經(jīng)網(wǎng)絡(luò)的第一個實現(xiàn)網(wǎng)絡(luò),也是感受野在神經(jīng)網(wǎng)絡(luò)領(lǐng)域的首次應(yīng)用。
1.2卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)是一個多層次的前饋式神經(jīng)網(wǎng)絡(luò),每層由多個二維平面組成,每個平面由多個獨立神經(jīng)元組成。一個完整的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1 所示。
從圖1 可以看出,卷積神經(jīng)網(wǎng)絡(luò)一般包含卷積層,分段抽樣層和全連接層。其中卷積層由若干卷積單元組成,每個卷積單元的參數(shù)都是通過反向傳播算法優(yōu)化得到的。卷積運算的目的是提取輸入的不同特征,第一層卷積層可能只能提取一些低級的特征如邊緣、線條和角等層級,更多層的網(wǎng)絡(luò)能從低級特征中迭代提取更復雜的特征。而在圖像識別中,卷積操作就是用一個卷積核在圖像矩陣上游走,在對應(yīng)位置元素相乘,再把相乘的結(jié)果相加,最后相加的結(jié)果形成新的圖像矩陣,游走完成后即完成了對原始圖像的卷積變換,形成此卷積核下的特征提取,具體如圖2 所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖2 卷積操作
分段抽樣層的作用則是二次特征提取,通常在卷積層之后會得到維度很大的特征,將需要特征切成幾個區(qū)域,取該區(qū)域的最大值或者平均值,從而得到新的,維度較小的特征[3]。而分段抽樣操作也叫池化操作,具體如圖3 所示。
圖3 池化操作
全連接層采用的是Softmax回歸,該層就是以卷積神經(jīng)網(wǎng)絡(luò)提取到的圖片特征做為輸入,然后根據(jù)這些特征則可以做一個數(shù)據(jù)訓練分類器。因為邏輯回歸一般用來進行二值分類,也就是說邏輯回歸的結(jié)果只能是0或者1;而印章編號是0~9的阿拉伯數(shù)字,一共需要分成10個類別,所以全連接層必須采用Softmax回歸,Softmax的結(jié)構(gòu)如圖4所示:
圖4 Softmax分類器的結(jié)構(gòu)
1.3卷積神經(jīng)網(wǎng)絡(luò)算法偽代碼
卷積神經(jīng)網(wǎng)絡(luò)算法的偽代碼如下:
(1)對輸入的印章編號圖片做卷積操作,形成若干個卷積核。
(2)對卷積操作形成的特征層進行二次特征提取操作。
(3)重復步驟(1)和步驟(2),直至獲取到具有足夠畸變?nèi)萑棠芰Φ奶卣鳌?/p>
(4)根據(jù)步驟(3)得到的特征做一個分類器,從而解決印章編號的識別問題。
可以用多個印章編號來訓練一個卷積神經(jīng)網(wǎng)絡(luò),而該網(wǎng)絡(luò)可以對印章編號中的數(shù)字進行分類,從而識別出印章編號中的阿拉伯數(shù)字,訓練的過程大致分為以下幾個步驟:
①從留底印文中提取出編號,用這些編號訓練一個稀疏編碼器C1;
②以C1做為第一個卷積層,從原始編號中做卷積特征提??;
③在C1的后面添加一個分段抽樣層S1,對C1所提取的特征做池化計算;
④以最后一個池化層的輸出做為印章編號的分類器,即將印章編號中的數(shù)字按0~9進行分類,從而識別出印章編號中的數(shù)字。
實驗環(huán)境為MATLAB,實驗的訓練數(shù)據(jù)集是來自留底印文中的印章編號,而測試數(shù)據(jù)集則來自蓋在支票或者文件上的印章編號。留底印文如圖5 所示。
圖5 留底印文
圖5 中的印文是RGB模式,RGB模式又稱為三原色模型。這是一種加色模式,將紅、綠、藍三原色的色光以不同的比例相加,以產(chǎn)生多種多樣的顏色。因此可以先將圖片分離為紅、綠、藍三個通道,然后通過像素值的分布來設(shè)定一個閾值,用于分割提取印章編號。將印章圖片進行RGB通道分離后得到像素值的分布如圖6所示:
圖6 印文像素值分布圖
因此可以通過閾值分割的辦法提取出印章的編號。提取得到的印章編號如圖7所示。
圖7 留底印文的編號
將具有m個訓練樣本的訓練集合{(x(1),y(1)),…,(x(m),y(m))}(其中,y(i)∈{0,…,9})放入卷積神經(jīng)網(wǎng)絡(luò)中進行訓練,通過訓練可以得到的特征如圖8所示。
圖8 訓練印章編號得到的特征
卷積神經(jīng)網(wǎng)絡(luò)是當前最熱門的深度學習算法之一,其在圖像識別和語音識別已經(jīng)取得了顯著的效果。通過卷積和分段取樣操作,卷積神經(jīng)網(wǎng)絡(luò)具有權(quán)值共享的特性,這就使得卷積神經(jīng)網(wǎng)絡(luò)在處理大型圖像時有著先天性的優(yōu)勢。印章編號的識別本質(zhì)上是一個阿拉伯數(shù)字的分類問題,而卷積神經(jīng)網(wǎng)絡(luò)則擅長處理圖像分類問題。因此本文嘗試將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到印章編號的識別中,提出了基于卷積神經(jīng)網(wǎng)絡(luò)的印章編號識別算法。在識別方形章的編號上取得了很好的效果,但是由于在實際應(yīng)用中圓形章的編號呈弧形狀,而不像方形章一樣呈直線狀,這給提取和識別印章編號帶來了不便。因此,下一步需要重點解決識別圓形章和橢圓形章的印章編號的問題。
[1]Convolutional Neural Networks(LeNet)-DeepLearning 0.1 Documentation[OL].DeepLearning 0.1.LISA Lab.[2013-08-31].http:// deeplearning.net/tutorial/lenet.html
[2]徐珊珊,劉應(yīng)安,徐昇.基于卷積神經(jīng)網(wǎng)絡(luò)的木材缺陷識別[J].山東大學學報(工學版),2013,43(2):28-33.
[3]卷積神經(jīng)網(wǎng)絡(luò)[OL].wikipedia.[2012-12-11].https://zh.wikipedia.org/wiki/%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB% 8F%E7%BD%91%E7%BB%9C
Convolution Neural Network;Seal Number;Recognition
Application of Convolution Neural Network in Seal Number Identification
YANG Zhe
(College of Computer Science,Sichuan University,Chengdu 610065)
陽哲(1990-),男,湖南邵陽人,碩士研究生,研究方向為機器智能
2015-12-31
2016-01-13
卷積神經(jīng)網(wǎng)絡(luò)算法在圖像識別中有著廣泛的應(yīng)用,但是目前在印章識別領(lǐng)域的應(yīng)用還不是很多。因此可以將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到印章識別中,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的印章編號識別算法。
Convolution neural network algorithm has been widely used in image recognition,but currently used in the field of seal of recognition is not a lot.Presents a seal number recognition algorithm based on convolution neural network.