童文超,舒小華,龍永紅,肖習(xí)雨
(湖南工業(yè)大學(xué) 電氣與信息工程學(xué)院,湖南 株洲 412007)
LED顯示儀表的字符識(shí)別方法
童文超,舒小華,龍永紅,肖習(xí)雨
(湖南工業(yè)大學(xué) 電氣與信息工程學(xué)院,湖南 株洲 412007)
針對(duì)LED顯示儀表,提出了一種字符識(shí)別方法。字符分割采用邊緣檢測(cè)、直線檢測(cè)和灰度投影相結(jié)合的方法,可快速提取目標(biāo)字符,將數(shù)字和小數(shù)點(diǎn)分開識(shí)別,并改進(jìn)了基于數(shù)字筆畫統(tǒng)計(jì)特征的自適應(yīng)閾值數(shù)字識(shí)別方法。試驗(yàn)結(jié)果表明,本識(shí)別算法的識(shí)別率能達(dá)到95%以上,且算法耗時(shí)較低,說明此算法的準(zhǔn)確率較高、實(shí)時(shí)性較好。
字符分割;幾何特征;統(tǒng)計(jì)特征;字符識(shí)別
LED數(shù)字顯示計(jì)量設(shè)備具有可靠性高、精度高、操作簡(jiǎn)單等特點(diǎn),被廣泛應(yīng)用于自動(dòng)化生產(chǎn)線、加油站、水質(zhì)監(jiān)測(cè)、化工生產(chǎn)以及環(huán)境監(jiān)測(cè)等領(lǐng)域。LED數(shù)顯設(shè)備的識(shí)別技術(shù),是實(shí)現(xiàn)各種數(shù)顯設(shè)備互聯(lián)和集成,實(shí)現(xiàn)管控一體化,提高智能化管理水平的關(guān)鍵。如自動(dòng)抄表系統(tǒng)[1-3]就是利用網(wǎng)絡(luò)與供電局的營業(yè)收費(fèi)系統(tǒng)相連,實(shí)現(xiàn)抄表收費(fèi)一體化。
字符提取和識(shí)別模塊是儀表自動(dòng)校正和儀表數(shù)據(jù)自動(dòng)錄入系統(tǒng)的核心。目前,字符分割方法主要有:邊緣檢測(cè)、背景減法、顏色聚類、筆畫聚類等。字符識(shí)別方法主要是基于字符的兩類特征:幾何特征和統(tǒng)計(jì)特征,如模板匹配、機(jī)器學(xué)習(xí)、基于模糊理論的識(shí)別方法、特征向量法、穿線法等。文獻(xiàn)[4]提出了復(fù)雜彩色背景下的文字標(biāo)題識(shí)別系統(tǒng),該系統(tǒng)是針對(duì)字符顏色單一,與背景有明顯差異的情況,采用顏色聚類、直線檢測(cè)和自偏移矩形窗檢測(cè)相結(jié)合的方法來提取字符。文獻(xiàn)[5]設(shè)計(jì)了一種基于手機(jī)終端的LED字符識(shí)別系統(tǒng),該系統(tǒng)利用數(shù)字筆畫與背景的差異,采用基于封閉圖形的筆畫聚類方法來提取目標(biāo)字符,采用機(jī)器學(xué)習(xí)機(jī)制來識(shí)別字符。文獻(xiàn)[6]設(shè)計(jì)了自動(dòng)識(shí)別數(shù)字測(cè)量?jī)x器數(shù)據(jù)系統(tǒng),利用Sobel邊緣檢測(cè)方法提取字符整體區(qū)域,再用三重卷積分割出字符的筆畫,采用基于數(shù)字筆畫幾何特征的穿針法來識(shí)別數(shù)字字符。文獻(xiàn)[7]提出了用掃描線的一階差分來掃描每一行的紋理特征,根據(jù)LED區(qū)域的紋理特征(亮暗切換的變換特征)與其他區(qū)域的特征差異來定位LED區(qū)域。文獻(xiàn)[8]提出了HSV空間的閾值分割方法,即從H, S, V三個(gè)通道得到3個(gè)閾值后,進(jìn)行3次閾值分割,試驗(yàn)結(jié)果顯示,該方法能消除部分噪聲的干擾,分割效果也有明顯改善。文獻(xiàn)[9]提出利用Sobel垂直和水平邊緣檢測(cè)方法來提取LED區(qū)域。
當(dāng)字符與背景的差異不太明顯,有陰影或者光照不均,成像設(shè)備的分辨率較低時(shí),容易導(dǎo)致圖像的噪聲點(diǎn)較多,數(shù)字筆畫易丟失;還有當(dāng)數(shù)字字符不是垂直顯示時(shí),字符投影覆蓋了小數(shù)點(diǎn),這都使得字符識(shí)別率較低。針對(duì)以上問題,本文提出一種LED顯示儀表的識(shí)別方法。該方法分為3個(gè)部分: LED區(qū)域分割、字符分割和字符識(shí)別,LED區(qū)域分割采用基于亮度變化的邊緣檢測(cè)方法,字符分割采用邊緣檢測(cè)和區(qū)域掃描相結(jié)合的方法,字符識(shí)別是利用字符筆畫的統(tǒng)計(jì)特征。該識(shí)別方法能有效提高識(shí)別準(zhǔn)確率,降低算法耗時(shí)。
2.1 LED區(qū)域分割
LED區(qū)域分割的方法主要有:閾值分割、區(qū)域生長(zhǎng)、紋理掃描、邊緣檢測(cè)等。由于LED區(qū)域位于整個(gè)設(shè)備的中部,周圍的背景復(fù)雜,閾值分割難以滿足分割的要求,紋理掃描在時(shí)間上消耗較長(zhǎng),因此,本文利用基于亮度變化的邊緣檢測(cè)方法來分割LED區(qū)域。文獻(xiàn)[9]所提的Sobel邊緣檢測(cè)算法與本文算法分割LED區(qū)域的效果對(duì)比見圖1。
圖1 LED區(qū)域分割效果圖Fig.1 The segmenting effect of LED region
由圖1可以看出,Sobel邊緣檢測(cè)算法只能大概地檢測(cè)出LED區(qū)域的邊界,而本文的方法能精確地檢測(cè)出LED區(qū)域的邊界,這樣利于提取LED區(qū)域。從上面的檢測(cè)結(jié)果中,可以得到LED矩形區(qū)域的2對(duì)橫縱坐標(biāo),根據(jù)這2對(duì)坐標(biāo)將LED屏幕從原圖中切割出來,LED區(qū)域的提取效果如圖2所示。
圖2 LED區(qū)域提取圖Fig.2 Region extraction of LED
2.2 字符分割
在LED區(qū)域,目標(biāo)數(shù)字與背景對(duì)比比較明顯,因此,該圖像的灰度直方圖會(huì)出現(xiàn)明顯的雙峰。但現(xiàn)場(chǎng)采集的圖像噪聲較大,如采用最佳閾值分割算法來提取目標(biāo)字符,它的分割效果不理想,因?yàn)樵撍惴▽?duì)噪聲敏感,數(shù)字筆畫二值化后,會(huì)出現(xiàn)部分信息丟失的情況,如圖3所示。針對(duì)非均勻光照的字符圖像,文獻(xiàn)[10]采用局部均值分割圖像的二值化方法,該方法能降低圖像處理的耗時(shí),但其對(duì)噪聲較敏感。本文將邊緣檢測(cè)與區(qū)域掃描方法相結(jié)合的方法對(duì)數(shù)字筆畫進(jìn)行二值化處理。首先,在RGB空間內(nèi)對(duì)圖像進(jìn)行梯度計(jì)算,根據(jù)計(jì)算得到的梯度圖像,初步勾畫出字符的邊緣;其次,選擇適當(dāng)?shù)拇皩拻呙柘鄳?yīng)的筆畫區(qū)域,刪除噪聲影響下的偽筆畫邊緣;最后,對(duì)已確定的有效筆畫區(qū)域進(jìn)行填充。試驗(yàn)結(jié)果表明,本文方法對(duì)噪聲不太敏感,且在由于陰影、光照條件較差、噪聲背景干擾等原因使得筆畫圖像不清晰的情況下,也能獲得較好的分割效果。根據(jù)二值化后的圖像特征,再利用水平投影和垂直投影來分割單個(gè)字符。二值化后的圖像和垂直投影圖像分別見圖4和5。
圖3 最佳閾值分割算法Fig.3 Optimal threshold segmentation
圖4 本文算法效果圖Fig.4 The result diagram of the proposed algorithm
圖5 垂直投影圖Fig.5 Vertical projection image
由圖4和5可以看出,由于LED區(qū)域的數(shù)字是傾斜顯示的,導(dǎo)致該圖像的垂直投影會(huì)出現(xiàn)小數(shù)點(diǎn)被覆蓋,或者數(shù)字投影和小數(shù)點(diǎn)投影相連,而無明顯分界點(diǎn)的現(xiàn)象,因此,小數(shù)點(diǎn)無法被分割出來,使數(shù)字識(shí)別結(jié)果出現(xiàn)錯(cuò)誤。
由于小數(shù)點(diǎn)所占的像素少,容易受到噪聲的干擾。因此,小數(shù)點(diǎn)的確定和識(shí)別需要單獨(dú)處理。針對(duì)上述問題,文獻(xiàn)[9]提出了先計(jì)算出每個(gè)字符的寬度,再通過統(tǒng)計(jì)各個(gè)字符的寬度和字符間的距離來確定小數(shù)點(diǎn)的存在和所處的位置。故本文采用文獻(xiàn)[9]的方法將小數(shù)點(diǎn)分割出來。
2.3 字符識(shí)別
字符特征主要分為兩類:統(tǒng)計(jì)特征和結(jié)構(gòu)特征。
1)小數(shù)點(diǎn)識(shí)別
小數(shù)點(diǎn)的識(shí)別是利用其統(tǒng)計(jì)特征和結(jié)構(gòu)特征。將分割出來的小數(shù)點(diǎn)圖像分別作水平和垂直投影,根據(jù)小數(shù)點(diǎn)水平和垂直投影形狀相同的原則,排除噪聲干擾。該方法能有效地檢測(cè)出小數(shù)點(diǎn),且抗噪能力較好。試驗(yàn)結(jié)果表明,該方法拒絕識(shí)別率和錯(cuò)誤識(shí)別率都較低,說明了基于小數(shù)點(diǎn)的幾何特征和統(tǒng)計(jì)特征的投影識(shí)別方法是可行的、有效的。小數(shù)點(diǎn)識(shí)別效果圖見圖6。
圖6 小數(shù)點(diǎn)識(shí)別圖Fig.6 Recognition of decimal point
2)數(shù)字識(shí)別
LED顯示的數(shù)字字符的統(tǒng)計(jì)特征比較明顯,利用字符筆畫的統(tǒng)計(jì)特征可以將字符有效的筆畫識(shí)別出來。統(tǒng)計(jì)筆畫采用自適應(yīng)的閾值判定所檢測(cè)的筆畫的有效性,該計(jì)算過程簡(jiǎn)單,只有計(jì)算筆畫有效區(qū)域的面積和算數(shù)運(yùn)算(減法運(yùn)算),因此,該方法的魯棒性和時(shí)效性較高。結(jié)合數(shù)字的統(tǒng)計(jì)特征和多線程思想,數(shù)字識(shí)別算法流程見圖7。圖中,n0為單個(gè)字符中部區(qū)域的白色像素點(diǎn)個(gè)數(shù);nl為單個(gè)字符左半?yún)^(qū)域的白色像素點(diǎn)個(gè)數(shù);nr為單個(gè)字符右半?yún)^(qū)域的白色像素點(diǎn)個(gè)數(shù) ;nu為單個(gè)字符上半?yún)^(qū)域的白色像素點(diǎn)個(gè)數(shù);nd為單個(gè)字符下半?yún)^(qū)域的白色像素點(diǎn)個(gè)數(shù);n11/2為單個(gè)字符上半?yún)^(qū)域左半?yún)^(qū)的白色像素點(diǎn)個(gè)數(shù);nr1/2為單個(gè)字符上半?yún)^(qū)域右半?yún)^(qū)的白色像素點(diǎn)個(gè)數(shù);nu1/2為單個(gè)字符上半?yún)^(qū)域上半?yún)^(qū)的白色像素點(diǎn)個(gè)數(shù);nd1/2為單個(gè)字符上半?yún)^(qū)域下半?yún)^(qū)的白色像素點(diǎn)個(gè)數(shù);T為閾值,其數(shù)值為一筆的有效筆畫所含的白色像素點(diǎn)個(gè)數(shù)。
圖7 數(shù)字識(shí)別流程圖Fig.7 Number recognition flow chart
該識(shí)別系統(tǒng)采用VC 6.0編程實(shí)現(xiàn),系統(tǒng)識(shí)別界面如圖6所示。試驗(yàn)圖像集來源于工業(yè)現(xiàn)場(chǎng),由63幅LED圖像組成。試驗(yàn)結(jié)果見表1。
圖8 識(shí)別模塊界面Fig.8 Recognition module interface
表1 試驗(yàn)結(jié)果Table1 The result of experiment
由試驗(yàn)結(jié)果可知,數(shù)字字符和小數(shù)點(diǎn)的識(shí)別率在95%以上,且拒識(shí)別率不到4%,算法運(yùn)行的平均時(shí)間為1300ms,這說明算法的識(shí)別率較高,整個(gè)系統(tǒng)耗時(shí)也較短。
隨著機(jī)器視覺和數(shù)字圖像處理技術(shù)的發(fā)展,自動(dòng)智能抄表設(shè)備將會(huì)成為工業(yè)生產(chǎn)和日常生活的常用智能設(shè)備。因此,本文提出了一種LED顯示儀表的字符識(shí)別方法。試驗(yàn)結(jié)果表明,該系統(tǒng)的識(shí)別率較高,能達(dá)到95%以上,且算法耗時(shí)也有一定改善。本方法主要用于識(shí)別LED顯示的數(shù)字字符,有一定局限性。下一步的研究工作是提高識(shí)別算法的魯棒性和實(shí)時(shí)性,同時(shí)將完善多種儀表區(qū)分、識(shí)別等功能,促進(jìn)智能抄表技術(shù)適應(yīng)更多的使用環(huán)境,提高儀表校正和儀表數(shù)據(jù)的錄入效率。
[1]Ghugardare R P,Narote S P,Mukherji P,et al. Optical Character Recognition System for Seven Segment Display Image of Measuring Instruments[C]// 2009 IEEE Region 10 Conference. [S. l.]:IEEE,2009:1-6.
[2]Algeria F C,Serra A C.Automatic Calibration of Analog and Digital Measuring Instruments Using Computer Vision [J]. IEEE Transaction on Instrumentation and Measurement,2000,49(1):94-99.
[3] 譚 義. 機(jī)器視覺的數(shù)顯儀表讀數(shù)研究及應(yīng)用[D]. 廣東:廣東工業(yè)大學(xué),2007. Tan Yi. Number Instrument Reading Research and Application Based on Machine Vision[D]. Guangdong:Guangdong University of Technology,2007.
[4]Katsuyama Y,Minagawa A,Hotta Y,et al. A Study on Caption Recognition for Multi-Color Characters on Complex Background[C]//2012 IEEE International Symposium on Multimedia. [S. l.]:IEEE,2012:401-408.
[5]Shen Huiying,Coughlan J. Reading LCD/LED Displays with a Camera Cell Phone[C]//2006 Conference on Computer Vision and Pattern Recognition Workshop. [S. l.]:IEEE,2006:1-6.
[6]Liang Chao,Yang Wenming,Liao Qingmin. An Automatic Interpretation Method for LCD Images of Digital Measuring Instruments[C]//2011 4th International Congress on Image and Signal Processing. [S. l.]:IEEE,2011:1826-1829.
[7] 荊倩倩. 電表抄表中的識(shí)別算法研究[D]. 長(zhǎng)春:吉林大學(xué),2011. Jing Qianqian. The Research of Recognition Algorithm for Ammeter[D]. Changchun:Jilin University,2011.
[8] 李曉東,李志強(qiáng),雷曉平,等. 彩色數(shù)字儀表圖像二值化技術(shù)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010,20(4):120-123. Li Xiaodong,Li Zhiqiang,Lei Xiaoping,et al. A Research of Thresholding Technology for Color Image of Digital Instrument[J]. Computer Technology and Development,2010,20(4):120-123.
[9] 唐軼峻,申小陽,朱雯蘭,等. 基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)顯儀表數(shù)字字符識(shí)別系統(tǒng)[J].電測(cè)與儀表,2005,42(477):42-45. Tang Yijun,Shen Xiaoyang,Zhu Wenlan,et al. Recognition System for Character of Numeral Instrument Dynamic Displayed Based on BP Neural Network[J]. Electrical Measurement & Instrumentation,2005,42(477):42-45.
[10]黃蒞辰,張 劍,周 游,等.基于非均勻光照下文本圖像二值化改進(jìn)算法[J].湖南工業(yè)大學(xué)學(xué)報(bào),2013,27 (6):40-45. Huang Licheng, Zhang Jian, Zhou You, et al. An Improved Image and Text Binarization Algorithm Based on Non-Uniform Illumination[J]. Journal of Hunan University of Technology,2013,27(6):40-45.
(責(zé)任編輯:鄧 彬)
The Method of Character Recognition Displaying on LED
Tong Wenchao,Su Xiaohua,Long Yonghong, Xiao Xiyu
(School of Electrical and Information Engineering,Hunan University of Technology,Zhuzhou Hunan 412007,China)
Aiming at LED display meter, put forward a character recognition method. Its character segmentation applied edge detection, line detection and gray projection to rapidly extract target character. It recognized number and decimal point separately and improves the self-adaptive threshold number recognition based on the statistical feature of numerical strikes. Experimental result indicates that the accuracy of the proposed recognition algorithm reaches over 95% and the time-consuming is short, which demonstrates the algorithm of high accuracy and good real-time.
character segmentation;geometrical feature;statistical characteristic;character recognition
TP273
:A
:1673-9833(2014)01-0067-04
2013-11-30
童文超(1988-),男,江西上饒人,湖南工業(yè)大學(xué)碩士生,主要研究方向?yàn)閿?shù)字圖像處理,機(jī)器視覺,
E-mail:tongwenchao888@163.com
10.3969/j.issn.1673-9833.2014.01.014