常淑英,臧永杰,戴士杰
(1.天津電子信息職業(yè)技術(shù)學(xué)院 機電技術(shù)系,天津 300132;2.中國石油集團渤海石油裝備公司 第一機械廠防腐公司,河北滄州 062658;3.河北工業(yè)大學(xué) 機器人及自動化研究所,天津 300130)
鐵路貨車編碼識別技術(shù)是鐵路智能控制工程中的一項關(guān)鍵技術(shù),其識別過程大致分為3個步驟即編碼定位、字符分割和字符識別.其中編碼定位是將含有編碼的圖像有效區(qū)域分割出來;字符分割是將定位后的字符串進行切分,分割成單個字符圖像;字符識別是將單個字符圖像經(jīng)過適當(dāng)?shù)淖R別算法進行識別.3個步驟中,字符分割的準確率直接影響到識別系統(tǒng)的識別率和識別速度.因此,研究能將鐵路貨車編碼有效分割的字符分割方法是非常有意義的.
如何準確而迅速地找出列車編碼的位置并進行有效的分割是整個識別系統(tǒng)所要研究的關(guān)鍵問題.目前提出來的研究方法也很多,主要是基于灰度特征分析的方法,因為基于彩色信息的方法計算量大并且受圖像亮度影響大.比較成熟的有統(tǒng)計投影直方圖[1]、邊界跟蹤法和區(qū)域增長法,在這3種分割算法中,邊界跟蹤法和區(qū)域增長法都是針對原圖像而言的,不同之處是邊界跟蹤法是尋找字符的邊界,而區(qū)域增長法是尋找整個的字符,這兩種方法對噪聲要求比較高,稍有噪聲就會產(chǎn)生很大的失真、不穩(wěn)定.所以本文結(jié)合列車編碼圖像的突出特征基礎(chǔ)上,借鑒了投影直方圖法對字符進行分割,同時在閾值的選取上經(jīng)過統(tǒng)計分析做了一些改進.下面將對實現(xiàn)有效分割的過程進行較詳細的說明.
編碼定位是編碼識別系統(tǒng)的基礎(chǔ),它可以幫助我們從一個復(fù)雜背景的圖像找到感興趣的編碼區(qū)域.為了準確的對編碼加以定位,首先需要對采集到的圖像進行各種預(yù)處理.一般來說,首先將采集到的BMP圖像轉(zhuǎn)化為灰度圖像,接著針對圖像中的噪聲進行中值濾波處理,然后利用二值化算法將圖像進行閾值分割,分別得到了編碼像素和背景像素.經(jīng)過處理后的圖像有利于單個字符的分割.文中采用了基于水平掃描與垂直投影的算法來實現(xiàn)貨車編碼定位,如圖1所示是對不同車型的貨車進行了編碼的有效定位.
字符分割是將字符串中的每一個字符準確分割出來.由于本文研究的貨車編碼的每個字符都是通過鏤空的模板噴刷的,它們不可避免存在如下一些問題:1)字符斷裂,一個字符有多個分支構(gòu)成;2)字符粘連,單一連通成分包含多個字符;3)字符斷裂和粘連同時發(fā)生;4)編碼字符背景復(fù)雜;5)字符傾斜等等.這些實際問題對車號的分割和識別造成了極大的干擾.從上節(jié)貨車編碼定位的效果中可以看出,真正的對每一個字符進行正確定位分割很難.如圖2所示,很容易把一個字符分成兩個字符或者把兩個字符當(dāng)成一個字符,這對后期的識別也帶來了很大的阻礙.
為了能準確分割和識別編碼,在分割前,對編碼進行膨脹運算,以防止字符斷裂和粘連對分割造成影響.
膨脹運算在數(shù)學(xué)形態(tài)學(xué)中的作用是把圖像周圍的背景點合并到物體中.如果兩個物體之間距離比較近,那么膨脹運算可能會使這兩個物體連同在一起.膨脹對填補圖像分割后物體中的空洞很有用.由于字符存在斷裂問題,采用數(shù)學(xué)形態(tài)學(xué)的膨脹對編碼進行進一步處理,處理的結(jié)果如圖3所示.
字符分割的算法很多,通常根據(jù)處理對象的不同有許多相應(yīng)的方法.為實現(xiàn)準確的分割,有關(guān)物體的總體知識和先驗信息是很有用的,根據(jù)包含在圖像中的有效信息,可以制定相應(yīng)的判決準則和控制策略,使其完成自動分割.
本文借鑒了投影直方圖法對字符進行分割,并在閾值的選取上經(jīng)過統(tǒng)計分析做了一些改進,使其能準確的分割字符.投影直方圖算法的原理是計算字符子圖像方向的投影直方圖,選取直方圖中高度小于某一閾值的“波谷”作為字符分割點.具體的方法如下:
第1步,先自下而上對圖像進行逐行掃描,直到遇見第一個黑色像素點,并記錄下來.然后再由上而下對圖像進行逐行掃描,直到找到第1個黑色像素點,如此就能找到圖像高度的大致范圍.
第2步,在此高度范圍內(nèi)由左向右逐列進行掃描,當(dāng)遇見第一個黑色像素時就認為它是字符分割的起始位置,而后繼續(xù)掃描,直到遇見某一列中無黑色像素,此時就認為這個字符分割結(jié)束.然后繼續(xù)掃描,依照上述方法一直掃描直到圖像的最右端.這樣即可得到每個字符的較精確的寬度范圍.
第3步,在每個字符比較精確的寬度范圍內(nèi),按照第一步的方法,分別進行由上而下和由下而上的逐行掃描來獲取每個字符精確的高度范圍,為后面字符歸一化和字符識別打好基礎(chǔ).
圖1 列車編碼定位結(jié)果Fig.1 Effect of position to Train's code
圖2 字符斷裂分割結(jié)果Fig.2 Effect of fracture character segmentation
圖3 膨脹圖像及投影直方圖Fig.3 Expansion of the image and histogram of projection
第4步,編碼的分割利用編碼定位圖像分別在垂直和水平方向進行投影,在垂直和水平軸上形成有一定規(guī)律的“波峰—波谷—波峰”分布,其中,“波谷”與“波峰”之間就是分割處.如圖4所示,本文所述方法的分割效果要高于常見的區(qū)域增長法以及邊界跟蹤方法的分割效果.
圖4 字符分割Fig.4 Character segmentation
為了驗證所提算法的有效性和可靠性,現(xiàn)場采集了各種光照條件下的100幅圖像,如:白天的、夜晚的、字符清晰的、字符有缺損的等等,并進行實驗,實驗結(jié)果如表1所示.表1為單字符分割與識別結(jié)果,在100幅圖像的700個字符中,利用投影直方圖法成功分割620個,正確率為88.6%,區(qū)域增長法分割成功500個,準確率為71.4%,邊界跟蹤法分割成功520個,準確率為74.3%.可見,投影直方圖法優(yōu)于區(qū)域增長法和邊界跟蹤法.之所以能達到如此高的識別準確率,是由于在分割過程中糾正了許多識別錯誤,所以準確率很高.
本文利用在對字符有效定位的基礎(chǔ)上,結(jié)合數(shù)學(xué)形態(tài)學(xué)對斷裂字符進行膨脹運算,采用投影直方圖處理方法對貨車編碼的每個字符進行分割,使得字符的分割及識別的正確率和適應(yīng)性都得到了提高.后期實驗說明該系統(tǒng)是具有高效性、魯棒性的識別系統(tǒng).
表1 單個字符分割識別結(jié)果Tab.1 Results on character segmentation and recognition
[1]謝盛嘉,梁競敏.車牌識別系統(tǒng)的設(shè)計與實現(xiàn) [J].微計算機信息,2010,1:17-18.
[2]Lia C L,Hui K C.Feature recognition by template matching[J].Computers and Graphics,2000(24):569-582.
[3]Zabulisa X,Papara M,Chatziargyrioua.Detection of densely dispersed spherical bubbles in digital images based on a template matching technique application to wet foams[J].Colloids and Surfaces A,2007(309):96-106.
[4]梁永貴,林江莉,陳科.車牌圖像中字符分割方法 [J].微計算機信息,2009(24):116-118.
[5]艾海舟,武勃.圖像處理、分析與機器視覺 [M].北京:人民郵電出版社,2003:391-394.
[6]劉成安,孫濤.車牌自動定位與識別方法研究 [J].微計算機信息,2007(9-1):263-264.