亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于全卷積網(wǎng)絡(luò)的數(shù)字儀表字符識別方法

        2018-04-02 08:25:06蔡夢倩張蕾王炎莫娟
        現(xiàn)代計(jì)算機(jī) 2018年2期
        關(guān)鍵詞:特征

        蔡夢倩,張蕾,王炎,莫娟

        (四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)

        0 引言

        如今,數(shù)字儀表在各行各業(yè)都有著廣泛的應(yīng)用,由于歷史遺留原因、成本控制考慮、設(shè)計(jì)需要等因素,仍有相當(dāng)一部分的儀表不提供與計(jì)算機(jī)進(jìn)行數(shù)據(jù)通信的接口,需要人工錄入儀表讀數(shù)。人工錄入儀表讀數(shù)需要消耗大量的人力和時間,且結(jié)果易受認(rèn)為因素的干擾。相比之下,根據(jù)實(shí)時監(jiān)控捕獲儀表圖像,再利用字符識別方法識別儀表圖像中的讀數(shù)就顯得更加便捷。

        數(shù)字儀表中的讀數(shù)通常包含多個字符,傳統(tǒng)方法[1-2]首先通過定位確定字符串的位置,再將字符串分割為單個字符后進(jìn)行識別。整個過程比較繁雜,且識別結(jié)果容易受預(yù)處理過程中定位和分割效果的影響。如果我們對數(shù)字儀表圖像實(shí)現(xiàn)像素級的預(yù)測,預(yù)測結(jié)果同時包含位置信息和類別信息,我們就可以綜合二者直接得到字符串的結(jié)果。

        本文提出一種基于全卷積網(wǎng)絡(luò)的數(shù)字儀表字符串識別方法。該方法通過全卷積網(wǎng)絡(luò)實(shí)現(xiàn)了圖到圖的像素級預(yù)測,同時實(shí)現(xiàn)了字符的定位、分割與識別。并且,通過加權(quán)混合特征學(xué)習(xí)融合了全卷積網(wǎng)絡(luò)中多尺度多層級的特征,使預(yù)測結(jié)果很好地綜合了位置信息和分類信息,從而得到準(zhǔn)確的字符串識別結(jié)果。我們采用了包含有多類數(shù)字儀表的數(shù)據(jù)集來展示基于加權(quán)混合特征學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)方法在數(shù)字儀表字符串識別上的出色表現(xiàn)。實(shí)驗(yàn)結(jié)果表明,該方法能夠在省略復(fù)雜的預(yù)處理過程的前提下,由數(shù)字儀表圖像直接得到儀表中字符串的識別結(jié)果。

        本文的主要貢獻(xiàn)如下:

        (1)我們提出了一種基于加權(quán)混合特征學(xué)習(xí)的全卷積網(wǎng)絡(luò)H-Meter,利用像素級的預(yù)測解決了數(shù)字儀表字符串的識別問題;

        (2)通過加權(quán)融合全卷積網(wǎng)絡(luò)中多尺度多層級特征的方式,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),使像素級預(yù)測結(jié)果在位置信息和識別信息上都有很好的表現(xiàn),提高字符串的識別的準(zhǔn)確率;

        (3)應(yīng)用相關(guān)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明基于加權(quán)混合特征的全卷積網(wǎng)絡(luò)能夠直接、準(zhǔn)確的識別字符串。

        1 相關(guān)工作

        一直以來,對于數(shù)字儀表字符識別的研究工作都十分豐富.這些工作所提出的方法基本都包含三個階段:字符區(qū)域定位、字符分割和字符識別。

        字符的定位和分割通常通過一定的閾值對圖像做二值化處理,對二值化后的圖像進(jìn)行行掃描和列掃描,利用行掃描和列掃描的結(jié)果確定字符串的邊界以及字符串中每個字符的分界點(diǎn)[14-17]。這種預(yù)處理方法容易受到噪聲的影響,從而無法獲得正確的字符分割結(jié)果。

        在字符識別階段,通常采用兩種方法:模板匹配方法[14-15,17]和神經(jīng)網(wǎng)絡(luò)方法[3,18]。模板匹配通過人工的字符模板進(jìn)行字符識別,神經(jīng)網(wǎng)絡(luò)方法通過訓(xùn)練進(jìn)行特征提取實(shí)現(xiàn)字符識別。相比之下,模板匹配方法的抗噪能力較弱,例如,不均勻光照、角度傾斜等因素可能會導(dǎo)致字符形變或缺損,在這些情況下,模板匹配方法的識別率就會受到嚴(yán)重的影響。在實(shí)際應(yīng)用的過程中,這些干擾因素是難免的,這就使得神經(jīng)網(wǎng)絡(luò)方法更具優(yōu)越性。但是,無論是模板匹配方法,還是神經(jīng)網(wǎng)絡(luò)方法都會受到預(yù)處理結(jié)果的影響。

        本文提出的基于全卷積網(wǎng)絡(luò)的數(shù)字儀表字符串識別方法,通過圖到圖的預(yù)測,不依賴于預(yù)處理方法,直接實(shí)現(xiàn)字符的定位、分割與識別。并結(jié)合加權(quán)混合特征學(xué)習(xí),使了全卷積網(wǎng)絡(luò)在數(shù)字儀表圖像上具有更好的預(yù)測效果和更強(qiáng)的魯棒性。

        2 基于加權(quán)混合特征學(xué)習(xí)的全卷積網(wǎng)絡(luò)

        在本節(jié)中,主要介紹一種基加權(quán)混合特征學(xué)習(xí)的全卷積網(wǎng)絡(luò),并將其應(yīng)用于數(shù)字儀表字符串識別中。

        2.1 基于加權(quán)混合特征學(xué)習(xí)的全卷積網(wǎng)絡(luò)

        總結(jié)傳統(tǒng)方法解決數(shù)字儀表字符串識別的思路:首先,需要確定每個字符的位置;然后,再對每個字符進(jìn)行逐一識別。如果我們能夠用一個方法同時解決這兩個問題,將極大簡化數(shù)字儀表字符串識別的解決過程。

        2015年,J.Long等人利用卷積層替代傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)中的全連接層以得到圖到圖的預(yù)測的方法[7],很好地解決語義分割問題。如果利用全卷積網(wǎng)絡(luò)對原始數(shù)字儀表圖像實(shí)現(xiàn)像素級的預(yù)測,使得預(yù)測結(jié)果與原始圖像中的元素一一對應(yīng);那么,我們就可以根據(jù)預(yù)測結(jié)果的分布情況確定背景區(qū)域和各個字符區(qū)域,并根據(jù)每個字符區(qū)域內(nèi)的預(yù)測結(jié)果確定該字符的分類。由此,設(shè)計(jì)了用于解決數(shù)字儀表字符串識別的全卷積網(wǎng)絡(luò)。

        該網(wǎng)絡(luò)通過卷積層和池化層進(jìn)行特征提取[5]。由于圖像有其固有特性,圖像一部分的統(tǒng)計(jì)特性也可作用于其他部分上,這意味著對于圖像上所有的區(qū)域,我們都能使用同樣的學(xué)習(xí)特征[8]。通過借鑒視覺神經(jīng)系統(tǒng)中感受野的概念,利用卷積核大小為3×3的卷積層不斷地學(xué)習(xí)圖像不同尺度的特征,卷積層的權(quán)值共享和局部連接的特性,大大減少了網(wǎng)絡(luò)的計(jì)算量。再通過池化層對數(shù)據(jù)進(jìn)行降維操作,該網(wǎng)絡(luò)采用最大池化方法,也就是計(jì)算鄰域內(nèi)特征點(diǎn)的最大值,來得到輸入的概要統(tǒng)計(jì),這些概要統(tǒng)計(jì)不僅相比輸入具有低得多的維度,而且保持了輸入的特征不變性,進(jìn)一步減少了網(wǎng)絡(luò)的計(jì)算量。卷積層和池化層的相關(guān)參數(shù)信息如表1所示。

        表1 網(wǎng)絡(luò)的層級信息

        為了能產(chǎn)生圖到圖的像素級預(yù)測,需要保證網(wǎng)絡(luò)的預(yù)測結(jié)果要與原輸入圖像元素對應(yīng),即預(yù)測結(jié)果為與輸入圖像尺寸一致的預(yù)測圖。在每一層卷積之前都對輸入進(jìn)行padding操作,保證卷積層的輸入輸出圖像尺寸一致;利用卷積核大小為1×1的卷積層替代全連接層得到圖像級預(yù)測結(jié)果,即網(wǎng)絡(luò)結(jié)構(gòu)中不包含全連接層;在最后一層卷積層后添加反卷積層實(shí)現(xiàn)上采樣操作將由于池化層下采樣操作逐層變小的特征圖恢復(fù)到原圖尺寸,這一過程看作是一個“反向卷積”的過程,其反卷積核的參數(shù)也是可學(xué)習(xí)的。最后,通過Softmax層對每一個像素實(shí)現(xiàn)分類。

        綜上所述,我們就實(shí)現(xiàn)了可以得到數(shù)字儀表圖像的像素級預(yù)測的全卷積網(wǎng)絡(luò)F-Meter,可以用于直接提取數(shù)字儀表中字符串的識別結(jié)果。

        2.2 加權(quán)混合特征學(xué)習(xí)

        當(dāng)我們直接使用F-Meter進(jìn)行數(shù)字儀表字符串的識別時,我們會發(fā)現(xiàn)預(yù)測結(jié)果在位置信息上的表現(xiàn)并不理想。這是因?yàn)橹苯訉⑻卣鲌D放大到原輸入圖像的尺寸,會導(dǎo)致其變得非常模糊。為了解決這個問題,我們將網(wǎng)絡(luò)較低層級的輸出特征也直接作為預(yù)測結(jié)果的參考。雖然,網(wǎng)絡(luò)較低層級還不能夠很好地提取識別信息,但是,其輸出特征對于局部信息有很好地保留,有助于提升預(yù)測結(jié)果在位置上的表現(xiàn)。

        我們連接了Conv1_2、Conv2_2、Conv3_3和Conv4_3到融合層,實(shí)現(xiàn)網(wǎng)絡(luò)對多尺度多層級混合特征的學(xué)習(xí),再利用融合層輸出的融合特征進(jìn)行預(yù)測。在融合方式上,我們選用加權(quán)融合(weighted-fusion)的方式,以防止過多的參考低層特征反而影響預(yù)測結(jié)果在識別信息上的表現(xiàn)。首先,我們會對Conv1_2、Conv2_2、Conv3_3和Conv4_3輸出特征分別進(jìn)行加權(quán)融合,融合后的特征作為各個層的層級特征(Level Feature)。然后,對層級特征進(jìn)行上采樣操作,保證所有的層級特征的尺寸都與原輸入圖像的尺寸一致。最后,將尺寸一致的層級特征進(jìn)行加權(quán)融合得到融合特征,并通過Softmax分類層得到分類結(jié)果。圖1展示了加權(quán)混合特征學(xué)習(xí)的過程。

        3 實(shí)驗(yàn)與結(jié)果

        在本節(jié)中,我們使用本文所提出基于混合特征學(xué)習(xí)的全卷積網(wǎng)絡(luò)H-Meter識別數(shù)字儀表中的字符串,并在包含有多類數(shù)字儀表的數(shù)據(jù)集[12]上測試了我們的方法。

        3.1 度量標(biāo)準(zhǔn)

        本文所提出方法的性能通過字符的精度P(Precision)和召回率R(Recall)來度量。將字符根據(jù)真實(shí)類別與預(yù)測類別字符的組合劃分為四類:真正例、假正例、真反例、假反例。精度,亦稱查準(zhǔn)率,在字符識別問題中代表被正確預(yù)測地某類字符的數(shù)目占被預(yù)測為該類字符的數(shù)目的比例。召回率,亦稱查全率,代表被正確預(yù)測地某類字符的數(shù)目占該類字符真實(shí)數(shù)目的比例。精度和召回率的公式定義如下:

        精度和召回率是一對矛盾的度量.一般來說,精度高時,召回率往往偏低;而召回率高時,精度往往偏低。為了能夠綜合考慮精度和召回率,我們還通過精度與召回率的調(diào)和平均F1度量來進(jìn)行模型間的評估,F(xiàn)1的公式定義如下:

        由于本文所提出的方法直接實(shí)現(xiàn)字符串端到端的預(yù)測,所以我們也通過字符串的準(zhǔn)確率A(Accuracy)來反映其性能。字符串的準(zhǔn)確度代表被正確預(yù)測的字符串的數(shù)目占字符串總數(shù)目的比例,其公式定義如下:

        其中,TrueStr代表被正確預(yù)測的字符串,F(xiàn)alseStr代表被錯誤預(yù)測的字符串。

        圖1 加權(quán)混合特征學(xué)習(xí)過程

        3.2 數(shù)據(jù)集

        我們將在包含有多類數(shù)字儀表的數(shù)據(jù)集上測試我們的方法。該數(shù)據(jù)集[12]由趙凱等人收集整理,共計(jì)11385個樣本,其中包含5類數(shù)字儀表樣本,不同類別的儀表樣本包含的字符串長度和字體都有所不同,這些樣本是灰度化的3通道圖片,圖片的尺寸50×160,圖3展示了數(shù)據(jù)集的部分樣本。

        我們將在包含有多類數(shù)字儀表的數(shù)據(jù)集上測試我們的方法。該數(shù)據(jù)集[12]由趙凱等人收集整理,共計(jì)11385個樣本,其中包含5類數(shù)字儀表樣本,不同類別的儀表樣本包含的字符串長度和字體都有所不同,這些樣本是灰度化的3通道圖片,圖片的尺寸50×160,圖3展示了數(shù)據(jù)集的部分樣本。

        圖2 數(shù)據(jù)集中的部分樣本示例

        由示例樣本可以看出數(shù)字儀表數(shù)據(jù)集中大量存在光照差異、字符串傾斜、字符扭曲等現(xiàn)象,增加了數(shù)字儀表的字符識別的難度。但是,經(jīng)過實(shí)驗(yàn)表明,本文所提出模型依舊能夠準(zhǔn)確、高效地識別數(shù)字儀表識別中的字符串。

        3.3 后處理

        由于H-Meter實(shí)現(xiàn)圖到圖的預(yù)測,其預(yù)測結(jié)果為11×50×160的矩陣,對應(yīng)11個分類(10個數(shù)字類和1個背景類),為了從矩陣中字符串結(jié)果作為最終輸出,我們需要利用算法1進(jìn)行字符串提取。

        算法1預(yù)測矩陣字符串提取算法

        輸入:預(yù)測矩陣Matrix,閾值t;

        輸出:數(shù)字字符串結(jié)果Str.

        將Matrix小于t的元素置0;

        for 10個數(shù)字i

        subMatrix=Matrix(i,50,160);/* 提取 Matrix中數(shù)字 i對應(yīng)的部分*/

        查找subMatrix中的連通區(qū)域作為字符團(tuán),舍棄掉過小的團(tuán);

        for subMatrix中團(tuán)的個數(shù)K

        Str←i;/*將第k個字符團(tuán)的值加入到字符串中*/

        end for

        end for

        對Loc中的坐標(biāo)進(jìn)行排序;

        根據(jù)Loc中坐標(biāo)的排序,獲得順序正確的字符串Str。

        3.4 實(shí)驗(yàn)結(jié)果

        本小節(jié)利用兩組實(shí)驗(yàn)來驗(yàn)證我們提出的方法的可行性和準(zhǔn)確性該數(shù)據(jù)集并沒有劃分訓(xùn)練集和測試集,所以我們按照1:9的比例將數(shù)據(jù)集隨機(jī)的劃分為測試集和驗(yàn)證集。其中,測試集包含1139張數(shù)字儀表圖片,訓(xùn)練集包含10246張數(shù)字儀表圖片。

        實(shí)驗(yàn)1驗(yàn)證層級特征融合的必要性。在這個實(shí)驗(yàn)中,我們比較了2.1中所提到的不包含層級特征融合的全卷積網(wǎng)絡(luò)F-Meter和基于加權(quán)混合特征融合的全卷積網(wǎng)絡(luò)H-Meter,并在表2中列出了二者在測試集上的字符精度、召回率、F1度量和字符串準(zhǔn)確率。精度、召回率和F1度量取各個字符類的均值。

        表2 

        實(shí)驗(yàn)結(jié)果表明,H-Meter在字符精度、召回率、F1度量和字符串準(zhǔn)確率上都要遠(yuǎn)高于F-Meter,證明網(wǎng)絡(luò)較低層級雖然還不能夠很好地提取抽象特征,但是其對于局部信息有很好地保留,合理地融合較低層級的特征輸出對于最終結(jié)果的提升有很大幫助。

        實(shí)驗(yàn)2驗(yàn)證加權(quán)混合特征學(xué)習(xí)的有效性。我們對比了基于平均混合特征學(xué)習(xí)的全卷積網(wǎng)絡(luò)和基于加權(quán)混合特征學(xué)習(xí)的全卷積網(wǎng)絡(luò)在預(yù)測結(jié)果上的表現(xiàn),并結(jié)合精度、召回率等性能度量進(jìn)行比較比較?;谄骄旌咸卣鲗W(xué)習(xí)的全卷積網(wǎng)絡(luò),通過對池化層的特征輸出進(jìn)行不斷地上采樣操作并累加的方式實(shí)現(xiàn)。

        表3 

        實(shí)驗(yàn)結(jié)果表明,雖然同樣融合了較低層級的特征,但是,平均混合特征學(xué)習(xí)在測試集上的表現(xiàn)遠(yuǎn)不如加權(quán)混合特征學(xué)習(xí)在測試集上的表現(xiàn),甚至過度的依賴低層特征影響了識別結(jié)果。所以,對于較低層級的特征也要有學(xué)習(xí)的進(jìn)行融合。

        4 結(jié)語

        本文提出了一種基于全卷積網(wǎng)絡(luò)的數(shù)字儀表字符識別方法.通過圖像端到端像素級的預(yù)測,能夠省去繁瑣的字符識別預(yù)處理過程,直接得到字符串的識別結(jié)果。實(shí)驗(yàn)結(jié)果表明,本文提出的數(shù)字儀表字符方法能夠準(zhǔn)確、高效地識別自然場景下儀表中的字符串。

        參考文獻(xiàn):

        [1]T.E.de Campos,B.R.Babu,M.Varma.Character Recognition in Natural Images[J].In Proceedings of the International Conference on Computer Vision Theory and Applications,Lisbon,Portugal,February 2009

        [2]T.Yamaguchi,Y.Nakano,M.Maruyama,H.Miyao,T.Hananoi.Digit Classification on Signboards for Telephone Number Recognition[J].In ICDAR,pages 359-363,2003.

        [3]Yujie Liu,He Huang,Jinde,Cao,Tingwen Huang.Convolutional Neural Networks-Based Intelligent Recognition of Chinese License Plates.[J]Soft Computing,2017,2(2):1-17.

        [4]P.Dollar,C.L.Zitnick.Fast Edge Detection Using Structured Forests.PAMI,2015

        [5]K.Simonyan,A.Zisserman.Very Deep Convolutional Networksfor Large-Scale Image Recognition[J].In ICLR,2015.

        [6]G.Bertasius,J.Shi,L.Torresani.Deepedge:A Multiscale Bifurcated Deep Network for Top-Down Contour Detection[J].In CVPR,2015.

        [7]J.Long,E.Shelhamer,T.Darrell.Fully Convolutional Networks for Semantic Segmentation[J].In CVPR,2015.

        [8]http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial l

        [9]S.Xie,Z.Tu.Holistically-Nested Edge Detection.In Proc[J].ICCV,pages 1395-1403,2015.

        [10]P Sermanet,S Chintala,Y LeCun.Convolutiona l Neural Networks Applied to House Numbers Digit Classification[J].Pattern Recognition.In ICPR.

        [11]Lecun,Y.;Bottou,L.;Bengio,Y.;Haffner,P.Gradient-Based Learning Applied to Document Recognition[J].In Proceedings of the IEEE.pages.2278-2324,1998.

        [12]http://o7zt4a6os.bkt.clouddn.com/digit_data.zip

        [13]https://github.com/SHUCV/digit

        [14]G Qingyu,G Yongfeng.Digital Meter Identify Based on Local Orientation[J].In International Conference on Intelligent Computation Technology and Automation,pages 110-113,2010.

        [15]Wei,Bi Gui;Chang,Qing;Yan,Cai Yun;Zhang,Guo Zhen.Recognition System for Digital Meter Dynamic Display from Video Based on MATLAB[J].In Advanced Materials Research.pages 2183-2186.

        [16]Tu,Zhen Yuan;Ning,Fang Hua;Yu,Wu Jia.Study about Recognition of Digital Meter Dial Reading Based on SVM[J].In Applied Mechanics and Materials.pages 194-197.

        [17]Bin,Ma;Xiangbin,Meng;Xiaofu,Ma;Wufeng,Li;Linchong,Hao;Dean,Jiang.Digital Recognition Based on Image Device Meters.[J].In Second WRI Global Congress on Intelligent Systems.pages 326-330.2010.

        [18]Zhao,Li-meng,Zhang,Yun-zhou,Bai,Qiu-shi,Qi,Zi-xin,Zhang,Xin-tong.Research of Digital Meter Identifier Based on DSP and Neural Network[J].In IEEE International Workshop on Imaging Systems and Techniques.pages 402-406.2009.

        猜你喜歡
        特征
        抓住特征巧觀察
        離散型隨機(jī)變量的分布列與數(shù)字特征
        具有兩個P’維非線性不可約特征標(biāo)的非可解群
        月震特征及與地震的對比
        如何表達(dá)“特征”
        被k(2≤k≤16)整除的正整數(shù)的特征
        不忠誠的四個特征
        詈語的文化蘊(yùn)含與現(xiàn)代特征
        新聞傳播(2018年11期)2018-08-29 08:15:24
        抓住特征巧觀察
        基于特征篩選的模型選擇
        国产最新地址| 亚洲av永久无码精品网站| 一区二区三区国产亚洲网站| 日产一区日产2区日产| 亚洲av日韩av永久无码下载| 亚洲精品无码久久久久去q| 日本在线观看| 无码av永久免费大全| 日本二区三区视频在线观看| 一区二区三区高清在线观看视频| 成人国产精品一区二区视频 | 欧美日韩一区二区三区在线观看视频| 中文人妻熟妇乱又伦精品| 国产亚洲av综合人人澡精品| 久久国产品野战| 激情免费视频一区二区三区| 日产乱码一二三区别免费l| 丁香花在线影院观看在线播放 | 久草国产手机视频在线观看| 在线观看国产成人自拍视频| 亚洲精品成人无码中文毛片| 欧美国产亚洲日韩在线二区| 色婷婷综合一区二区精品久久| 日本一区二区免费看片| 日本av在线一区二区| 欧美金发尤物大战黑人| 女的把腿张开男的猛戳出浆| 亚洲精品女人天堂av麻| 综合五月激情二区视频| 无码专区久久综合久中文字幕| 亚洲不卡无码高清视频| 女同另类一区二区三区| 日韩欧美亚洲国产精品字幕久久久 | 一色桃子中文字幕人妻熟女作品 | 午夜天堂精品久久久久| 俺来也俺去啦久久综合网| 日韩极品视频在线观看免费| 国产熟女一区二区三区不卡| 午夜成人鲁丝片午夜精品 | 精品久久久久久777米琪桃花| 国产丝袜精品丝袜一区二区|