方 凱
(中國鐵道科學研究院 電子計算技術研究所,北京 100081)
用于動車組故障檢測的車號識別算法
方 凱
(中國鐵道科學研究院 電子計算技術研究所,北京 100081)
列車車號是其身份的唯一標識,動車組運行故障動態(tài)圖像檢測系統(TEDS)根據列車車號在圖像庫中找尋該列車拍攝的歷史圖像,以其比對現場采集圖像,從而實現對運行列車狀態(tài)的實時監(jiān)測。然而動車組目前尚未安裝射頻識別電子標簽,鑒于此,利用視頻分析技術對動車組車號圖像進行自動識別成為亟需解決的問題。文章提出一種基于語義共生概率的模板匹配算法對車號字符進行識別。實驗結果表明,本算法對車號的識別正確率和有效性滿足鐵路總公司的相關要求,保障了TEDS的工作效果。
動車組運行故障動態(tài)圖像檢測系統;車牌定位分割;模板匹配;車號識別
高速鐵路已成為當今旅客出行的重要交通工具,如何實時監(jiān)測高速鐵路動車組的運行安全顯得尤為重要。現有的監(jiān)控方式為入庫地溝式靜態(tài)監(jiān)控,缺乏運行過程中的動態(tài)監(jiān)控,這將導致動車組可能長距離帶病行進,從而增加事故發(fā)生的概率。高速行進中的動車,其關鍵部件易受到石塊等異物的強力撞擊,加之由于長期承受傳動力及制動力,其螺栓可能發(fā)生不同程度的松動,因此行進中的動態(tài)監(jiān)控對于保障動車運營安全起到至關重要的作用。鑒于此,鐵路部門提出了動車組運行故障動態(tài)圖像檢測系統(TEDS,Trouble of moving EMU Detection System)[1~3]。該系統需要通過車輛的車號標識和索引,在列車圖像庫中找尋其歷史圖像,實現圖像異常分析和預警。然而,目前動車組并未安裝射頻識別電子標簽,很難自動依據列車車號尋找其相應的歷史列車圖像。鑒于此,利用視頻分析技術對動車組車號圖像進行動識別成為亟需解決的問題。
本文提出一種用于動車組故障檢測的車號識別算法,其車號識別流程如圖1所示,步驟是:(1)自適應綜合列車車號圖像的灰度水平差分值和灰度垂直差分值,定位分割圖像中的列車車號區(qū)域;(2)對該區(qū)域進行Hough變換,得到其傾斜角度并進行相應的水平校正;(3)結合特定領域知識,采用一種基于語義共生概率的模板匹配算法對車號字符進行識別。鑒于車號作為車輛唯一標識的特性,通過識別得到的車號信息在動車圖像庫中找尋其歷史圖像,與現場采集的列車圖像進行故障比對,實現列車運行狀態(tài)的實時監(jiān)測和自動報警。
圖1 動車組車號識別流程
1.1 車號定位分割
車號區(qū)域的準確定位是車號字符識別的前提條件。本文基于灰度圖像水平差分和垂直差分圖像的相關特點,從列車圖像中進行車號區(qū)域的定位和分割。
(1)對圖像進行預處理,采用中值濾波剔除其中的噪聲點,并結合直方圖均衡化對其進行顏色均衡;(2)采用自適應閾值法二值化圖像,提取其灰度水平差分和垂直差分;(3)根據水平方向的灰度差分直方圖粗定位車號字符區(qū)域;(4)利用垂直差分圖像,投影映射的相關特征對車號候選區(qū)域進行精細定位,從而得到準確的車號水平和垂直范圍。
車號圖像中,字符區(qū)域與無字符區(qū)域的灰度特征存在相對較大的差值,而且車號圖像區(qū)域較之其他區(qū)域具有更豐富的邊緣特征。為此,對列車車號灰度圖像進行水平差分累加運算,以突出邊緣信息:
其中,f(x,y) 為圖像灰度值,HD(x,y) 表示差分累加結果,x、y 分別為圖像橫、縱坐標值,d 為偏移量。
將累加得到的差分圖像進行二值化處理,可以得到邊緣圖像,具體方法如下:
其中,T為圖像二值化的閾值。
以動車組車號圖像CRH380E 為例,圖2 顯示了車號圖像的二值化處理流程,以及腐蝕操作后的圖像。
圖2 動車組車號定位圖像處理流程
1.2 車號傾斜校正
基于已經定位的車號字符區(qū)域,進行Hough變換,得到圖像中的兩條平行線,計算平行線的斜率;根據所得斜率確定水平傾斜角度,進行上下邊界的水平校正,如圖3所示。
圖3 動車組車號傾斜校正處理流程
Hough變換旨在將圖像空間映射到變換后的參數空間中。如圖像空間中的一條直線,在Hough變換后的二維圖像空間里表示為:x·cosθ+y·sinθ=ρ,其中,ρ 和θ(0<θ<2π)為參數,即一條處于圖像空間中的直線被映射到參數空間中的一點(ρ,θ)?;谶@一點,將直線的檢測問題轉換為參數空間尋找局部最大值的問題。一般車號的水平傾斜角度不會超過一個范圍(±25。),這樣可以縮短Hough變換的計算時間,也在一定上程度了提高了校正的準確性。
1.3 車號字符識別
1.3.1 車號字符分割
我們將圖像的各列像素數據進行疊加得到水平方向上的投影,將圖像各行的像素進行疊加,得到豎直方向上的投影,如圖4所示。從圖中可以看出,水平方向上,車號區(qū)域的投影呈現出“波峰-波谷”多次交替現象,此外,與波峰各不相同的特征對比,各個波谷所處的位置大體一致。這在實際情況下也不難解釋:車號的字符有各種變化,從而使得各個峰值的變換各異;而字符中間的空白區(qū)域卻全是背景(除非存在污漬),因此其水平投影的位置基本保持一致。同理可見,豎直投影也會呈現出相似的特征。由此可知,依據車號區(qū)域的水平投影和豎直投影可以很好地將車號字符進行分割。
圖4 圖像在水平方向上的投影
1.3.2 車號字符識別
對于車號數據,相鄰車號字符之間存在很強的上下文語義相關性[4~6]。傳統的模板匹配算法[4]僅考慮了特征域中模板圖像與目標圖像的相似性,而將圖像在空間域中的語義關系完全忽略掉。為了彌補傳統方法的上述缺陷,本文基于特定領域知識,改進了模板圖像和目標圖像的相似性定義方法,從而得到一種更加準確的模板匹配算法。實驗結果表明,本算法能高效地完成字符模板匹配,并且針對目標圖像出現遮擋問題、油跡污染、光照情況不可控的情況仍可達到比較高的故障識別率。
1.3.3 基于語義共生概率的模板匹配算法
本文提出一種基于語義共生概率的模板匹配算法,該算法不僅考慮到車號字符與模板在特征域上的相似性,而且還結合了CRH動車組的車號排序規(guī)則[7],分析鄰近字符的語義共現概率關系。
(1)利用平均絕對差算法[8~9](MAD,Mean Absolute Differences)衡量車號字符圖像u與字符模板庫中第k個字符vk的匹配程度:
對兩幅圖像進行歸一化,形成一個大小為N · N的圖像。模板匹配是將模板vk疊放在車號字符圖像u上,通過比較vk和u的相似性,完成模板匹配過程。該方法利用圖像本身具有的灰度統計信息來衡量圖像之間的相似程度,精度較高,但對于尺度變化、旋轉以及不均勻光照等因素比較敏感。
(2)根據CRH動車組的車號排序規(guī)則,構建鄰域字符u和u+1之間的共生概率p(u,u+1)。動車組的型號和編號規(guī)則如圖5所示。
圖5 CRH動車組車號編號規(guī)則
由上述規(guī)則可以看出,“C”“R”“H”3個字符的共生概率相對較大,而“C”“S”的共生概率就比較小。綜合考慮車號字符與模板圖像在特征與相似性以及車號字符鄰域之間的語義共生概率,本文定義了模板圖像與任一字符圖像的相似性衡量函數,其中,vk和u與公式(3)定義一致,u+1為字符u的鄰域字符:
基于語義共生概率的模板匹配算法旨在結合上下文語義特征,在目標圖像中尋找匹配區(qū)域。這里以字符“8”和“B”為例,當其鄰域字符出現“3”,即使其特征域中更相似于“B”,結合特定領域的共生概率p(u,vk),共同約束也將其匹配到“8”;反之亦然。具體流程算法實現如表1所示:(1)利用平均絕對差算法(MAD)和衡量法計算字符與模板圖像庫中的每個模板視覺特征相似性D(u,vk)。(2)根據CRH動車組的車號排序規(guī)則,構建字符之間的語義共生概率p(u,u+1)。(3)基于語義共生概率的模板匹配算法,完成車號字符的識別。
表1 基于上下文語義信息的模板匹配算法流程
從多個方面對用于動車組故障檢測的車號識別算法性能進行評估:(1)利用TEDS軌邊車號采集像機采集的車號圖像進行算法性能的評價;(2)考察模板匹配算法的閾值對識別性能的影響;(3)分析傳統模板算法與基于特定領域知識的模板匹配算法的性能比較;(4)利用圖示的方式,展示TEDS中本算法的車號識別性能。
2.1 模板匹配性能
為了評價模板匹配的性能,我們使用SR=[BG∩BM]/[BG∪BM]衡量準確性,其中,BG和BM分別表示模板圖像在目標圖像的準確位置和匹配位置,如圖6 所示。為了很好地評價本算法,本文將數據集隨機劃分5 次并重復相應的實驗,取多次實驗的平均值。算法軟件運行環(huán)境為:Matlab7.0 和Windows XP;硬件環(huán)境是:Pentium-4 3.0 G 計算機、1 G 內存。平均匹配準確率定義為:,N是運行次數。匹配準確率接近于99.8%。
圖6 模板圖像在目標圖像中的準確位置和匹配位置的3種相互關系
2.2 閾值參數的性能影響
本節(jié)分析模板匹配算法的閾值參數對于故障識別性能的影響,具體的性能比較如表2所示。不難看出,閾值對故障識別性能確實有一定的影響,當模板匹配選取較小的閾值時,車號識別準確性較低。主要原因是閾值較低時,依賴特征相似性很難得到準確的字符模板圖像,因此借助特定領域知識,更難得到準確字符。而隨著模板匹配的閾值逐步增加,車號識別準確率也在穩(wěn)步提升。但當閾值大于一定值后,閾值繼續(xù)增加,識別性能增加不大。模板匹配采用較低的閾值時,雖然降低了漏報的可能性,但是卻提高了誤報率;而當閾值較高時,其漏報率將會增加,也在一定程度上降低了算法的性能。為此,綜合分析上述兩個閾值,本算法選取較好的故障識別性能閾值參數,即模板匹配算法選取閾值為0.8。
表2 不同閾值對車號識別率的影響
2.3 算法性能比較
對比分析傳統模板匹配算法與基于特定領域知識的模板匹配算法的車號識別性能。從表3中可以看出,傳統的模板匹配算法雖然可以進行車號識別,但是其準確率還有待提高,主要原因是由于拍攝的光線、天氣、油污等問題,使得單純依賴于特征相似性的字符識別準確率較低,而且其性能在很大程度上受到模板的影響,且匹配計算量大,速度慢,實時性不強。本文提出的一種基于語義共生概率的模板匹配算法,通過自適應融合特征域相似性和空間域語義共生關系,進行車號字符匹配,從表中可以看出對于所有的匹配閾值,其字符匹配性能均有所提升,因此可以在很大程度上提升動車運行過程中的安全監(jiān)控質量。
表3 不同模板匹配算法對車號識別率的影響
2.4 車號字符識別性能
本文算法的識別性能如圖7所示。
圖7 車號識別結果
我們將所提出的車號識別算法運用于動車組動態(tài)故障檢測。每輛車的平均處理時間為5 min,圖8為檢測結果示例圖。
圖8 動車組動態(tài)故障檢測結果示例圖
本文提出了一種基于語義共生概率的模板匹配算法,用于動車組運行故障的車號識別系統。實驗結果表明,本算法對車號的識別正確率和有效性都滿足鐵路總公司的相關要求,保障了TEDS的工作效果。
[1]李 駿.動車組運行故障動態(tài)圖像檢測系統(TEDS)設計與實現[D].北京:北京郵電大學,2012.JUN L.The Design and Implementation of TEDS System[D].Beijing:Beijing University of Posts and Telecommunications,2012.
[2]許艷峰.動車組故障軌邊圖像自動檢測系統圖像對比算法研究[J].鐵路計算機應用,2013,22(5):23-26.XU Y F.Research on image contrasting algorithm for TEDS [J].Railway Computer Application,2013,22(5):23-26.
[3]趙俊彥,任崇巍.關于動車組故障對邊圖像檢測系統的設計[J].鐵道機車車輛,2011,31(6):19-22.ZHAO J Y.Design of EMU Fault Imagine Edge Detection System [J].Railway Locomotive &Car,2011,31(6):19-22.
[4]周景超,陳 鋒.車牌字符分割的研究和實現[J].計算機工程,2006,32(5):239-243.ZHOU J C.Study and Implementation of Vehicle Plate Characteristics Segment[J].Computer Engineering,2006,32(5):239-243.
[5]王少杰,朱志剛.貨運列車車型車號自動分割和識別算法[J].模式識別與人工智能,1998,11(3):328-334.WANG S J.Automatic segmentation and recognition of freight train characters[J].Pattern Recognition and Artificial Intelligence,1998,11(3):328-334.
[6]劉祖勝,方 凱,劉碩研.用于動車組故障檢測的圖像識別算法[J].鐵路計算機應用,2015,12(24):1-4.LIU Z S.Image recognition algorithm for EMU trouble detection[J].Railway Computer Application.2015,12(24):1-4.
[7]陳春雷,王陽萍.基于視頻列車車號識別系統的研究[J].蘭州交通大學學報.2007,26(6):99-103.CHEN C L.Research on Recognition System of Train Character Based on Video[J].Journal of Lanzhou Jiaotong University,2007,26(6).
[8]YU Z.Object Matching Using Deformable Templates [J].IEEE Trans.On Pattern Analysis and Machine Intelligence,1996,18(3):267-278.
[9]陳 智.圖像匹配技術研究 [D].武漢:華中師范大學,2006.CHEN Z.Research on image matching technology [D].Wuhan:Central China Normal University,2006.
責任編輯 楊琍明
表3 列車交路優(yōu)化方案
不同于單線獨立運營場景,互聯互通下網絡化行車交路更為復雜,運營組織更靈活。本文選取兩條互聯互通的城市軌道交通線路作為研究對象,提出了交路方案的設計思路,并以候車時間最小化、換乘客流最小化、企業(yè)運營成本最小化為目標建立了交路方案多目標優(yōu)化模型,通過簡化處理可以利用計算機優(yōu)化軟件進行求解。最后,通過實際案例分析驗證了模型的有效性。雖然研究對象界定為兩條線路互聯互通,但為更復雜的多線路互聯互通網絡化列車交路方案的后續(xù)研究奠定了基礎。
參考文獻:
[1]付慧伶,聶 磊,楊 浩.基于備選集的高速鐵路列車開行方案優(yōu)化方法研究[J].鐵道學報,2010,32(6):1-8.
[2]王艷艷.城市軌道交通列車交路方案優(yōu)化模型研究[J].西華大學學報,2013,32(5):42-44.
[3]凌 俊,胡 雄,何紅弟.城市軌道交通非高峰期列車交路方案優(yōu)化[J].鐵道科學與工程學報,2015,12(1):190-195.
[4]王媛媛,倪少權.城市軌道交通大小交路模式列車開行方案的優(yōu)化[J].鐵道學報,2013,35(7):1-8.
責任編輯 陳 蓉
Train identifcation algorithm for EMU trouble detection
FANG Kai
( Institute of Computing Technologies,China Academy of Railway Sciences,Beijing 100081,China)
The train number is a unique identifcation of the train.The Trouble of moving EMU Detection System (TEDS) is aimed to detect the trouble of moving EMU images based on the matching between present image and previous one which searches in the image database of the train number.However the RFID electronic tag does not installed in the EMU.Hence,the EMU train number recognition has become urgent to solve the problem.The article proposed a template matching algorithm based on semantic symbiosis probability to identify the train number.The experimental results showed that the correct rate and effectiveness of the proposed approach could conform with the regulation of China Railways,ensure the effect of TEDS.
TEDS;train number location and segmentation;template matching;train identifcation
U266.2∶U284.55
A
1005-8451(2016)05-0014-05
2015-10-08
中國鐵道科學研究院基金資助項目(2013YJ05)。
方 凱,副研究員。