鐘佩甫,劉二林,翟文強
(蘭州交通大學機電工程學院,蘭州 730070)
近年來,計算機視覺技術在各行各業(yè)的應用越來越廣泛,能夠產(chǎn)生類似人類視覺的功能,可以對物體進行快速的定位和識別,準確度較高,使用方便,目前廣大國內(nèi)外學者在相關領域進行了大量研究。高速列車車號識別的流程包括圖像預處理、車號定位、字符分割和字符識別等重要環(huán)節(jié),而車號定位是車號識別的前提和基礎,定位的準確性和實時性直接決定著后續(xù)的識別結果[1]。因此,車號定位對于車號識別來說尤為重要。傳統(tǒng)的射頻技術對機車、貨車車號識別的方法已經(jīng)無法滿足高速列車車號的識別要求,況且目前對高速列車車號定位和識別的研究還比較少。目前應用較多的一些定位方法有深度學習方法[2]、數(shù)學形態(tài)學法[3-4]、BP神經(jīng)網(wǎng)絡方法[5]、灰度投影法[6]、特征提取法[7]、模板概率密度函數(shù)法[8]、相鄰像素差異值法[9]。這些方法的優(yōu)點和缺點比較明顯,但有些方法存在定位精度低或計算復雜性較大等問題,應用到高速列車車號定位中具有不確定性。近年來,圖像處理中數(shù)學形態(tài)學的應用已經(jīng)成為圖像處理研究的重要領域,將其與投影法相結合應用到高速列車車號定位研究中有重大意義。因此本文提出了一種基于數(shù)學形態(tài)學和投影法的高速列車車號快速定位方法,利用數(shù)學形態(tài)學方法和投影法相結合準確定位出車號位置。該方法具有準確率高、速度快、魯棒性好的特點。
數(shù)學形態(tài)學以膨脹、腐蝕為基礎,結合在一起可構成為開、閉運算。形態(tài)學主要是為了獲得更完美的目標區(qū)域,可以去除干擾,平滑邊界,鄰域連通,填補空洞。
X為目標圖像,Y為結構元素。X被Y膨脹寫作X⊕Y,⊕為膨脹運算符,膨脹運算定義為:
X被Y膨脹的過程可以解釋為:Y的映像位移a,映射平移后X與Y的映像相交不為空集,Y的原點組成的集合,就是膨脹元素的集合。
X被Y腐蝕寫作XΘY,腐蝕的運算符號記為Θ,腐蝕運算定義為:
用Y對X進行腐蝕的過程可以解釋為,X位移a,Y依然完全包括在X中Y的原點所組成的集合。
開運算就是先對目標圖像進行腐蝕操作,之后再進行膨脹操作;閉運算就是先對目標圖像進行膨脹操作,之后再進行腐蝕操作。在整個膨脹和腐蝕運算過程中使用的結構元素可以相同。開運算符記作“°”,X用Y來開啟為X°Y,公式如下:
開運算的作用:消除較小噪聲,可以分離相連或相近的物體,在較大物體形狀不明顯被改變的情況下平滑邊界。閉運算的記為“·”,X用Y來閉合為X·Y公式為:
閉運算的作用是填充物體內(nèi)部小缺口,連接相鄰輪廓,在物體的形狀和面積不明顯被改變的情況下平滑邊界。
高速列車車號定位流程主要包括車號圖像預處理、車號圖像粗定位和車號圖像精確定位,如圖1所示。
圖1 車號定位流程圖
根據(jù)數(shù)字圖像處理原理,采集的高速列車車號圖像,先對彩色圖像進行壓縮減小運算量、再進行灰度化處理、圖像去噪、圖像增強等一系列處理,以便縮小和優(yōu)化圖像數(shù)據(jù),以便后續(xù)能夠準確獲取車號位置。
車號彩色圖像分為3個分量R、G、B,分別顯示出紅綠藍等各種顏色,圖像灰度化就是將3個分量相等的過程。灰度值越大的像素值比較亮,反之比較暗。對車號彩色圖像壓縮后再進行灰度化處理,彩色圖像灰度化常用的方法有最大值法、加權平均值法和平均值法等[10]。
(1)最大值法。求出R、G、B三個分量的最大值,將此值分別賦值給3個分量,3個分量的值都等于最大值,即:
這種方法得到的圖像像素值較大,灰度圖像亮度較高高,圖2(a)所示為最大值法處理后的圖像。
圖2 常用的灰度化方法
(2)加權平均值法。對R、G、B三個分量給一定的權值加權平均,即:
R、G、B的權值分別為wR、wG、wB,一情況下,權值不同得到的灰度圖像不同。由于人眼對綠色的最為敏感,紅色次之,對藍色的敏感性最低,因此使將得到較易識別的灰度圖像[11]。一般得到的灰度圖像效果最好的3個值分別為0.3、0.59、0.11,圖2(b)所示為加權平均值法處理后的圖像。
(3)平均值法。R、G、B三個分量值等于其和的平均值。即:
這種方法產(chǎn)生的灰度圖像相對比較柔和,相當于加權平均值法中一種特殊的取值,3個權值都為0.333,圖2(c)所示為平均值法處理后的圖像。
由上述分析和處理的圖像可知,采取加權平均值法可得到比較理想的結果。
對車號定位系統(tǒng)來說,采集的車號圖像在受到光照、天氣、傳輸?shù)惹闆r的影響下,存在車號圖像的質(zhì)量不高,所以需要圖像增強技術提高圖像質(zhì)量。圖像增強主要解決由于車號圖像的灰度級范圍較小造成的對比度較低的問題,目的就是將輸出圖像的灰度級放大到一定的程度,使得圖像中的細節(jié)看起來更加分明。圖像對比度增強有幾種常用的方法,如線性變換、分段線性變換、直方圖正規(guī)化、局部自適應直方圖均衡化等。在圖像中,如果大部分像素點的像素值都集中在高灰度值和低灰度值的區(qū)間范圍內(nèi),則可以通過對比度拉伸來擴大灰度范圍的區(qū)間,從而提高圖像對比度。以上常規(guī)算法效果不是很好,本文應用了一種自適應的對比度增強算法,可以對不同狀況下的車號圖像處理達到自適應增強的目的,有利于后續(xù)車號定位處理。圖3所示為圖像增強前后的對比。
圖3 圖像增強前后對比
高速列車車號圖像在采集和傳輸過程中容易產(chǎn)生噪聲,常用的圖像濾波算法有中值濾波、高斯濾波和均值濾波等方法。這些方法盡管可以很好地去除噪聲,但是使車號圖像邊緣和號字符的邊緣變得模糊。而雙邊濾波具有雙重濾波作用,它在很好地保持輪廓的邊緣特征的同時能消除噪聲。因此,采用雙邊濾波進行去噪處理。圖4所示為采用不同方法去噪的圖像對比。
車號粗定位,是指針對預處理之后的車號灰度圖像,再進行二值化、濾波、數(shù)學形態(tài)學處理、區(qū)域篩選等操作,以優(yōu)化和簡化圖像數(shù)據(jù),縮小車號所在范圍,獲得車號最終候選區(qū)域,便于之后準確定位車號。
圖4 圖像去噪不同方法對比
在圖像處理中,圖像二值化的主要意圖使圖像中數(shù)據(jù)量大大減少,減小計算量。圖像二值化的原理為:用特定的方法選取某個灰度值T作為閾值,像素灰度值小于T的設成0,即黑色,大于T設成255,即白色,整個圖像呈現(xiàn)出黑白兩種效果。假如f(x,y)為輸入圖像,二值化處理后輸出圖像為g( )x,y,二值化基本原理如下:
其中,閾值如何選取是二值化處理的關鍵。Otsu算法,可以通過選取某個閾值,使亮度不同的背景和前景達到最佳的分離狀態(tài)。Otsu方法又叫最大類間差方法(大律法),通過統(tǒng)計整個圖像的直方圖性來實現(xiàn)全局閾值T的自動選取。Otsu算法對車號圖像進行閾值分割,該算法計算過程簡單,是一種常用的閾值分割的穩(wěn)定算法。
4.2.1 圖像濾波處理
形態(tài)學濾波是利用形態(tài)學運算的優(yōu)良特性,主要采用形態(tài)學閉運算、開運算進行濾波處理。形態(tài)學濾波時,可以選擇不同方向、大小、形狀的結構元素達到不同的效果。二值化后的圖像還存在多種噪聲點和大量的非車號區(qū)域,利用噪聲處與結構元素的明顯差異應用形態(tài)學閉運算、開運算保留那些與結構元素相吻合的部分,去除背景或目標內(nèi)的噪聲。根據(jù)高速列車車號字符特征可以看出,每個字符間距相對較小,先進行膨脹運算可以將車號字符部分連接起來,再進行腐蝕運算處理,將連接不起來的非車號候選區(qū)域進行清除,圖5(a)所示為濾波處理后的車號圖像。
4.2.2 獲取連通區(qū)域
濾波處理后的車號圖像,還不具備車號連通區(qū)域的特點,部分區(qū)域內(nèi)部還有孔洞,以及形狀不規(guī)則、存在小噪聲點,與近似白色矩形區(qū)域的車號候選區(qū)域有較大的差距。單純膨脹運算或腐蝕運算會改變目標的大小,而閉、開運算可以更好地保持目標的形狀和大小。利用膨脹、腐蝕、開運算和閉運算的優(yōu)良特性,選取合適的結構元素,獲取更標準的車號候選區(qū)域,經(jīng)過一系列形態(tài)學運算處理獲得車號白色連通區(qū)域即為候選區(qū)域,如圖5(b)所示。
4.2.3 去除非車號區(qū)域
車號候選區(qū)域中存在大量白色非車號區(qū)域,根據(jù)車號先驗知識將這些不符合車號區(qū)域面積范圍和長寬比例的非車號矩形區(qū)域去掉,減少車號候選區(qū)域數(shù)目,粗略定位出車號位置,以減小后續(xù)處理的運算量,圖5(c) 所示為去除部分小區(qū)域的車號候選區(qū)域,圖5(d) 所示為去除所有非車號區(qū)域得到最終車號區(qū)域??梢娭皇O路从耻囂柼卣鞯膮^(qū)域,減少了背景對后續(xù)區(qū)域分析的干擾。
圖5 形態(tài)學處理
找出最終車號區(qū)域輪廓左上點和右下點或者左下點和右上點,獲得外接矩形對角線頂點標定車號位置,獲取粗定位車號圖像,如圖6所示。
圖6 定位車號
在以上運算的基礎上,結合投影法和車號字符先驗特征去除無關車號字符,確定車號左右邊界,從而精確地定位車號區(qū)域。首先通過垂直投影從左往右對粗定位車號圖像進行逐列掃描,將每一列的值相加,得到一維函數(shù)g(xi)。使二維函數(shù)轉變?yōu)橐痪S函數(shù),如下所示:
根據(jù)車號先驗知識得知,車號由6個阿拉伯數(shù)字組成,其在垂直方向投影的間距基本是恒定的,跟非車號字符區(qū)域差距比較明顯,車號字符位于粗定位車號的左側、中間或者右側區(qū)域,通過垂直投影,利用車號字符區(qū)域波谷-波峰-波峰密集特點定位車號字符左邊界或右邊界,最終獲取精確車號圖像,如圖7所示。
圖7 獲取車號圖像
本文對高速列車車號定位方法進行研究,利用數(shù)學形態(tài)學方法和投影法相結合準確定位出車號位置。數(shù)學形態(tài)學抗噪聲能力強,但獲得的候選連通區(qū)域中存在大量偽車號區(qū)域,通過形態(tài)學運算篩選出車號區(qū)域,即車號區(qū)域的粗定位。對粗定位的車號區(qū)域的二值圖像進行行列掃描,得到垂直投影和水平投影,通過水平投影分析判斷車號的上、下邊界是否正確,通過垂直投影分析確定車號的左右邊界,從而獲取精確的車號區(qū)域。