王勝春,戴 鵬,袁偉民,杜馨瑜,王 昊
(1.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 基礎(chǔ)設(shè)施檢測(cè)研究所,北京 100081;2.北京航天飛騰裝備技術(shù)有限責(zé)任公司,北京 100094)
鐵路是一種有效的陸地運(yùn)輸方式,軌道作為車(chē)輪滾動(dòng)的主要支持部件,由于列車(chē)制動(dòng)、過(guò)載、鋼軌金屬疲勞以及惡劣行車(chē)環(huán)境的影響,各種鋼軌表面缺陷頻發(fā),嚴(yán)重時(shí)甚至?xí)?dǎo)致列車(chē)脫軌。根據(jù)美國(guó)聯(lián)邦鐵路管理局對(duì)客貨共線鐵路事故數(shù)據(jù)庫(kù)的統(tǒng)計(jì),從2007年到2016年的數(shù)據(jù)表明,近1/2的鐵路事故是由鋼軌和扣件缺陷引起的,如圖1所示。
圖1 鐵路事故原因統(tǒng)計(jì)
因此,及時(shí)發(fā)現(xiàn)軌道缺陷是確保鐵路運(yùn)輸安全的關(guān)鍵。隨著現(xiàn)代鐵路技術(shù)的飛速發(fā)展,傳統(tǒng)的人工檢測(cè)方法由于誤差大、效率低、勞動(dòng)密集型、高管理成本等缺點(diǎn),已經(jīng)不能滿(mǎn)足“更準(zhǔn)、更快、更智能”的檢測(cè)要求。在這樣的背景下,鋼軌缺陷智能識(shí)別技術(shù)的研究顯得尤為迫切。
鋼軌表面由于直接和車(chē)輪接觸摩擦,很容易導(dǎo)致表面?zhèn)麚p。近幾年來(lái),基于機(jī)器視覺(jué)的檢測(cè)系統(tǒng)已經(jīng)被廣泛應(yīng)用于鋼軌表面缺陷的識(shí)別,如圖2所示。通過(guò)1對(duì)安裝在列車(chē)底部的成像設(shè)備來(lái)獲取軌道圖像,然后利用圖像處理和模式識(shí)別方法實(shí)現(xiàn)鋼軌缺陷的檢測(cè)。大多缺陷檢測(cè)的研究工作,檢測(cè)結(jié)果僅為“正?!被颉爱惓!?,并不關(guān)注缺陷的細(xì)分類(lèi)[1-3]。鋼軌表面缺陷包括表面剝離、軋傷、擦傷等缺陷,此外,泥漿、水漬和油斑造成的污跡以及鋼軌表面打磨造成的顆粒狀噪聲、鋼軌間的軌縫等信息,不可避免地也會(huì)對(duì)檢測(cè)結(jié)果造成干擾和誤判。因此,對(duì)識(shí)別到的缺陷進(jìn)一步細(xì)分類(lèi)是十分必要的,有利于去除干擾信息,降低系統(tǒng)誤報(bào)率。
圖2 基于機(jī)器視覺(jué)的鋼軌表面缺陷檢測(cè)和分類(lèi)
粗糙集理論是一種處理模糊和不確定問(wèn)題的數(shù)學(xué)分析方法。它可以基于已知的數(shù)據(jù),不依賴(lài)任何先驗(yàn)知識(shí),通過(guò)計(jì)算數(shù)據(jù)之間的依賴(lài)程度來(lái)發(fā)現(xiàn)隱含的知識(shí),提取內(nèi)在的分類(lèi)規(guī)則。粗糙集理論提供了一種新的分類(lèi)方法,并已成功應(yīng)用于各個(gè)分類(lèi)任務(wù)[4-6]。參見(jiàn)圖2,基于粗糙集理論可以從不同類(lèi)別的缺陷樣本數(shù)據(jù)中提取分類(lèi)規(guī)則,并將其應(yīng)用于鋼軌缺陷分類(lèi)任務(wù)中。
文獻(xiàn)[8]提出了一種鋼軌表面分析系統(tǒng)(Rail Surface Analyze System,RSAS),實(shí)現(xiàn)了鋼軌表面缺陷的實(shí)時(shí)檢測(cè)。利用RSAS對(duì)數(shù)百萬(wàn)的鋼軌圖像(圖像尺寸為 1 160×60 pixels)進(jìn)行分析發(fā)現(xiàn),檢測(cè)結(jié)果除了真實(shí)的缺陷,還存在大量的誤報(bào)??梢詫⑦@種發(fā)生在鋼軌表面的缺陷總結(jié)為3種類(lèi)型,即表面剝離、軋傷和擦傷,同時(shí)將引起誤報(bào)的干擾概括為污跡、噪聲和軌縫,如圖3所示。鋼軌表面剝離的圖像灰度較暗,且相對(duì)平滑;軋傷一般面積較大,呈圓形且圖像灰度較亮一些;擦傷顏色較暗且表面不平滑。對(duì)于干擾而言,污跡表面平滑且灰度接近鋼軌表面的灰度均值;噪聲干擾灰度值變化較大,呈帶狀分布;軌縫灰度值很低且呈細(xì)長(zhǎng)的條形狀。
圖3 缺陷類(lèi)型和干擾類(lèi)型
根據(jù)上述對(duì)表面缺陷的特征分析可知,通過(guò)構(gòu)造幾何形狀特征和灰度統(tǒng)計(jì)特征對(duì)各類(lèi)缺陷進(jìn)行分類(lèi)是可行的?;赗SAS提供的檢測(cè)結(jié)果,構(gòu)造快速的鋼軌表面缺陷特征提取方法,主要分為2個(gè)部分:基于缺陷幾何形狀的特征提取以及基于缺陷灰度統(tǒng)計(jì)分布的特征提取。
基于幾何形狀的特征提取計(jì)算簡(jiǎn)單,具有較強(qiáng)的識(shí)別缺陷的能力。根據(jù)上述對(duì)缺陷特征的討論,可以選擇缺陷區(qū)域的高度、寬度、高寬比和面積作為分類(lèi)的幾何形狀特征。
1)高度HUD。軌縫和軋傷區(qū)域具有較高的高度,而其他缺陷類(lèi)型與之沒(méi)有直接的關(guān)系。
2)寬度WUD。一般而言,擦傷的寬度范圍最大,軋傷次之,而軌縫的寬度則非常細(xì)小。
3)高寬比RUD。軌縫的高寬比較大,而軋傷的高寬比則近似為1。
4)面積PUD。軋傷具有較大的面積,而軌縫的面積相對(duì)較小。
圖4為鋼軌表面缺陷的灰度值分布,其中矩形框?yàn)殇撥壢毕輽z測(cè)結(jié)果。由圖可知,不同缺陷類(lèi)型的灰度分布具有顯著的差異,因此基于灰度的統(tǒng)計(jì)分布特性提取圖像的特征,并將其用于缺陷的分類(lèi)是切實(shí)可行的[7]。
圖4 鋼軌表面缺陷的灰度值分布
1)缺陷區(qū)域的灰度平均值μUD。軌縫與污跡的灰度均值較小,剝離掉塊和噪聲的灰度均值較大,而軋傷與擦傷的灰度均值大多位于二者之間。
2)缺陷區(qū)域的灰度標(biāo)準(zhǔn)差σUD。σUD反映了缺陷的平滑程度,擦傷和軌縫較大,軋傷和剝離掉塊次之,污跡相對(duì)較小。
3)缺陷區(qū)域的灰度均值和整幅鋼軌圖像灰度均值之差ΔμUD。ΔμUD表示缺陷區(qū)域與整幅鋼軌圖像的色差,可以有效克服環(huán)境光照不均、相機(jī)過(guò)曝光以及欠曝光造成的影響。
4)缺陷區(qū)域的灰度標(biāo)準(zhǔn)差與均值之比σCUD,σCUD=σUD/μUD。對(duì)于某些灰度標(biāo)準(zhǔn)差或均值發(fā)生交叉混疊的缺陷,如擦傷和軋傷,僅靠標(biāo)準(zhǔn)差或均值難以將其區(qū)分,而二者的比值σCUD則線性可分。
粗糙集理論由波蘭科學(xué)家PAWLAK于1982年提出,作為一種數(shù)學(xué)理論和數(shù)據(jù)分析技術(shù),用于解決不確定的模糊分類(lèi)和預(yù)測(cè)問(wèn)題[8-10]。利用粗糙集理論實(shí)現(xiàn)分類(lèi)的主要思想是使用訓(xùn)練決策系統(tǒng)從數(shù)據(jù)中抽取有效的分類(lèi)規(guī)則,之后建立測(cè)試決策系統(tǒng)來(lái)驗(yàn)證規(guī)則的有效性。
在使用粗糙集分析之前首先建立缺陷分類(lèi)的決策系統(tǒng)KRS,記作
KRS=(U,R,V,f)
(1)
其中U表示由RSAS系統(tǒng)檢測(cè)到的鋼軌表面缺陷的集合,記作
U={x1,x2,…,xm}
(2)
式中:m為鋼軌表面缺陷的總個(gè)數(shù);x1,x2,…,xm為鋼軌表面缺陷。
R表示檢測(cè)對(duì)象的特征屬性集,R=C∪D。其中C表示條件屬性集,由上一節(jié)中定義的幾何形狀和灰度統(tǒng)計(jì)特征rj(j=1,2,…,n)構(gòu)成,記作C={r1,r2,……,rn};D為決策屬性集,由缺陷的不同類(lèi)型c構(gòu)成,記作D={c}。
V表示條件和決策屬性的值域,記作
rj∈Vrj,c∈Vc(1≤j≤n)
(3)
f:U×R→V稱(chēng)作信息映射函數(shù),為每一個(gè)分類(lèi)對(duì)象分配相應(yīng)的屬性值,記作
f(xi,rj)=fi,j,f(xi,c)=yi(1≤i≤m,1≤j≤n)
(4)
根據(jù)映射函數(shù)f,為缺陷對(duì)象分配條件屬性和決策屬性,建立決策分類(lèi)的決策表,見(jiàn)表1。這里條件屬性映射函數(shù)f(xi,rj)=fi,j表示缺陷特征提取,而決策屬性映射函數(shù)f(xi,c)=yi則表示缺陷的分類(lèi)。
表1 表面缺陷分類(lèi)決策表
決策系統(tǒng)可分為2部分:訓(xùn)練子系統(tǒng)和測(cè)試子系統(tǒng)。利用訓(xùn)練子系統(tǒng)提取缺陷分類(lèi)的規(guī)則,測(cè)試子系統(tǒng)則驗(yàn)證分類(lèi)性能。需要注意的是,在獲得分類(lèi)規(guī)則之前,必須完成數(shù)據(jù)的離散化和屬性約簡(jiǎn)。
圖5 基于粗糙集理論的缺陷分類(lèi)流程
圖5描述了基于粗糙集理論的缺陷分類(lèi)的完整流程。首先,待分類(lèi)的缺陷數(shù)據(jù)通過(guò)信息功能映射到?jīng)Q策表中,決策表被劃分為訓(xùn)練決策子系統(tǒng)和測(cè)試決策子系統(tǒng)。其次,采用合適的數(shù)據(jù)離散化方法(如等間隔區(qū)間劃分)將決策系統(tǒng)的屬性值進(jìn)行離散化處理。根據(jù)訓(xùn)練決策子系統(tǒng),通過(guò)屬性重要度分析完成屬性的約減并提取缺陷分類(lèi)規(guī)則。最后,將分類(lèi)規(guī)則應(yīng)用于測(cè)試子系統(tǒng)中用來(lái)驗(yàn)證分類(lèi)規(guī)則的正確性和有效性。
試驗(yàn)數(shù)據(jù)來(lái)自于集通線上采集的鋼軌圖像經(jīng)RSAS系統(tǒng)分析后的檢測(cè)結(jié)果,總計(jì)檢出 1 846 個(gè)疑似表面缺陷。通過(guò)人工復(fù)核,從檢測(cè)結(jié)果中選取 1 000 個(gè)對(duì)象建立分類(lèi)決策系統(tǒng),試驗(yàn)數(shù)據(jù)組成結(jié)構(gòu)為:400處剝離掉塊、100處軋傷、200處擦傷、100處軌縫、100處噪聲干擾以及100處污跡。根據(jù) 1 000 處缺陷數(shù)據(jù)構(gòu)造分類(lèi)決策表,見(jiàn)表2。
表2 集通線表面缺陷分類(lèi)決策
為了提取和驗(yàn)證分類(lèi)規(guī)則,將決策表分成2部分,即600個(gè)訓(xùn)練缺陷數(shù)據(jù)和400個(gè)測(cè)試缺陷數(shù)據(jù)。
ROSETTA是一種常用的粗糙集數(shù)據(jù)分析工具,具有數(shù)據(jù)導(dǎo)入導(dǎo)出、補(bǔ)全、離散化、知識(shí)約簡(jiǎn)、分類(lèi)、規(guī)則提取等功能。按照上文描述的缺陷分類(lèi)流程,利用ROSETTA工具提取分類(lèi)規(guī)則。
1)將缺陷數(shù)據(jù)的訓(xùn)練決策表的數(shù)據(jù)信息導(dǎo)入到ROSETTA工具中;
2)選擇等間隔區(qū)間劃分(Equal Frequency Binning)算法將連續(xù)的屬性值劃分為等間隔的數(shù)據(jù)區(qū)間,實(shí)現(xiàn)數(shù)據(jù)離散化;
3)選擇遺傳算法(Genetic Algorithm)實(shí)現(xiàn)屬性重要度分析和約簡(jiǎn);
4)從約簡(jiǎn)后的訓(xùn)練決策表中得到672條分類(lèi)規(guī)則,部分規(guī)則如表3所示。
表3 分類(lèi)規(guī)則
將訓(xùn)練得到的分類(lèi)規(guī)則應(yīng)用于包含400個(gè)缺陷對(duì)象的測(cè)試決策子系統(tǒng),以驗(yàn)證分類(lèi)精度。為了評(píng)價(jià)方法的正確性和有效性,這里給出準(zhǔn)確率(Precision Rate,簡(jiǎn)稱(chēng)PR)和召回率(Recall Rate,簡(jiǎn)稱(chēng)RR)的定義為
式中:TPi表示i類(lèi)分類(lèi)結(jié)果中分類(lèi)正確的數(shù)目;FPi表示i類(lèi)分類(lèi)結(jié)果中誤分的數(shù)目,即把其他非i類(lèi)型錯(cuò)分為i類(lèi)型;FNi表示i類(lèi)分類(lèi)結(jié)果中漏分的數(shù)目,即把i類(lèi)型錯(cuò)分為其他非i類(lèi)型。
表4為基于快速特征提取方法的粗糙集缺陷分類(lèi)結(jié)果??芍?,對(duì)各個(gè)類(lèi)型的分類(lèi)都取得了令人滿(mǎn)意的結(jié)果,且整體分類(lèi)精度為90.8%。相比之下,由于剝離掉塊和軌縫的灰度統(tǒng)計(jì)和幾何形狀特征顯著,因此分類(lèi)精度高,更容易識(shí)別,而噪聲分布較為隨機(jī)且形狀不定,導(dǎo)致分類(lèi)精度較低。
表4 缺陷分類(lèi)結(jié)果
本文將粗糙集理論應(yīng)用于鋼軌表面缺陷分類(lèi),提出了基于缺陷幾何特征和灰度統(tǒng)計(jì)特征的快速特征提取方法,用于構(gòu)造粗糙集決策系統(tǒng)的屬性集。使用粗糙集分析工具驗(yàn)證了特征屬性的有效性,并取得了90.8%的分類(lèi)精度,可以有效排除軌縫、噪聲、污跡等干擾信息,降低缺陷檢測(cè)的誤報(bào)率。由于鋼軌表面缺陷種類(lèi)多樣,各缺陷類(lèi)型形狀、紋理、色調(diào)各不相同,因此,為了進(jìn)一步提高分類(lèi)的準(zhǔn)確性,未來(lái)的工作需要進(jìn)一步對(duì)鋼軌表面缺陷分類(lèi)的特征提取方法進(jìn)行研究。