,
(西南交通大學(xué) 電氣工程學(xué)院,成都 610031)
等電位線,也稱定位支座電氣連接跳線,當(dāng)其出現(xiàn)缺失、散股、斷裂故障時(shí),將造成定位器抬升,進(jìn)而列車受電弓會(huì)對(duì)定位支座造成電化學(xué)腐蝕,久之將使得定位器斷裂脫落,致使打弓、鉆弓等故障發(fā)生,影響行車運(yùn)營(yíng)安全,因此有必要對(duì)其進(jìn)行故障識(shí)別。
現(xiàn)有的非接觸式檢測(cè)方法自動(dòng)化程度較低,故障的識(shí)別主要依靠人工判斷,不能及時(shí)實(shí)現(xiàn)故障的檢測(cè)和判斷,效率低。目前,圖像自動(dòng)檢測(cè)技術(shù)可實(shí)現(xiàn)接觸網(wǎng)幾何參數(shù)和受電弓磨損的檢測(cè)[1]、高速鐵路接觸網(wǎng)支撐裝置耳片斷裂檢測(cè)[2],以及鐵路絕緣子片間夾雜異物檢測(cè)[3]等。
目前,國(guó)內(nèi)外提出了大量的接觸網(wǎng)非接觸式圖像檢測(cè)方法。文獻(xiàn)[4]采用基于目標(biāo)特征點(diǎn)標(biāo)識(shí)匹配的視覺(jué)檢測(cè)方法實(shí)現(xiàn)了對(duì)大風(fēng)環(huán)境下接觸網(wǎng)接觸導(dǎo)線、承力索及吊弦等接觸懸掛關(guān)鍵部位橫向、抬升偏移及扭轉(zhuǎn)姿態(tài)角的在線檢測(cè)。文獻(xiàn)[5]基于Harris角點(diǎn)與譜聚類實(shí)現(xiàn)了絕緣子的抗旋轉(zhuǎn)匹配和故障檢測(cè)。文獻(xiàn)[6]使用金字塔近鄰平均算法和小波奇異值法檢測(cè)接觸網(wǎng)絕緣子故障。
本文提出一種基于機(jī)器視覺(jué)的等電位線散股檢測(cè)方法,可實(shí)現(xiàn)該類故障的非接觸式檢測(cè),克服傳統(tǒng)人工檢測(cè)方法工作量大、危險(xiǎn)性高且檢測(cè)效率低下的缺點(diǎn)。
等電位線在待檢測(cè)圖像中目標(biāo)較小,對(duì)于拍攝參數(shù)較為敏感,且由于它并非剛性結(jié)構(gòu),特征不固定,因此通過(guò)對(duì)其所連接的定位器支座的識(shí)別定位間接實(shí)現(xiàn)等電位線的定位及提取。本文采用基于模式識(shí)別的目標(biāo)檢測(cè)算法,通過(guò)提取圖像的方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征,訓(xùn)練AdaBoost級(jí)聯(lián)分類器與支持向量機(jī)分類器來(lái)區(qū)分圖像中的目標(biāo)與非目標(biāo)區(qū)域,實(shí)現(xiàn)等電位線的初定位,進(jìn)而完成故障診斷。該檢測(cè)算法的流程如圖1所示。
圖1 等電位線散股故障檢測(cè)算法流程
HOG特征的核心思想是用光強(qiáng)梯度或邊緣方向的分布信息來(lái)描述所檢測(cè)物體的外形[7]。把整幅圖像劃分成大小一樣的單元格(通常稱為cell),然后在每個(gè)單元格內(nèi)生成方向梯度直方圖,所檢測(cè)目標(biāo)的描述子就可以用所有直方圖的組合來(lái)表示。為提高準(zhǔn)確率,可以通過(guò)計(jì)算圖像中一個(gè)較大區(qū)域(通常稱為block塊)的局部直方圖,有效地利用重疊部分的邊緣信息,用這個(gè)歸一化每個(gè)塊中的直方圖。和其他的描述子相比,在物體方向不變的情況下,HOG特征提取得到的描述子保持了物體的幾何和光學(xué)轉(zhuǎn)換的不變性[8]。
本文的正樣本統(tǒng)一歸一化為64像素×64像素大小的圖片,由于相鄰的塊之間可以存在細(xì)胞單元的重復(fù),因此每張正樣本中包含7×7個(gè)塊。將一個(gè)正樣本圖像中所有塊的特征向量連接在一起得到整個(gè)圖像的HOG特征向量。
HOG特征提取算法[9]的步驟如下:
1)將圖像劃分為大小相同的正方形單元格(cell)(8×8)像素。
2)計(jì)算所有單元格內(nèi)的梯度直方圖(9 bin)。
3)將每4個(gè)相鄰的單元格合并為一個(gè)塊(block)。
4)將同一塊中4個(gè)單元格的梯度直方圖連接在一起,形成一個(gè)9×4=36維的特征向量。
5)對(duì)該特征向量進(jìn)行歸一化,從而消除光照與對(duì)比度的影響。
6)將圖像中所有塊的特征向量連接在一起得到整幅圖像的HOG特征向量。
AdaBoost級(jí)聯(lián)分類器[10]由一系列的分類器串聯(lián)組成。分類器的輸出是被所有分類器都判決為正的樣本。在實(shí)際應(yīng)用中,只有少量的目標(biāo)樣本需要通過(guò)所有級(jí)的分類器,因?yàn)槟繕?biāo)樣本只占整體樣本很小的比例,非目標(biāo)樣本在級(jí)聯(lián)分類器的前端被濾除,因而級(jí)聯(lián)結(jié)構(gòu)能夠大大地減少運(yùn)算量[11-12]。AdaBoost級(jí)聯(lián)分類器的結(jié)構(gòu)組成如圖2所示,算法訓(xùn)練分類器流程如圖3所示。
圖2 級(jí)聯(lián)分類器的構(gòu)成
圖3 AdaBoost算法訓(xùn)練分類器流程
訓(xùn)練分類器首先要采集正負(fù)樣本,本文收集的圖像是通過(guò)檢測(cè)車頂上的高速攝像機(jī)對(duì)沿途的接觸網(wǎng)進(jìn)行拍攝得到的全局或者局部圖,從每張圖像中截取訓(xùn)練分類器所需要的正負(fù)樣本。正樣本文件里應(yīng)存放只包含等電位線的圖像,負(fù)樣本文件里的圖片可以為任意圖像,但這些圖像中不應(yīng)該包括待檢測(cè)的等電位線。
本文共采集了等電位線金屬鉤部分方向向左的圖像200張,向右的圖像200張。正樣本庫(kù)建立好后把所有圖片都修改為64像素×64像素大小。圖片的大小會(huì)影響級(jí)聯(lián)分類器訓(xùn)練的速度和時(shí)間,同時(shí)也會(huì)影響訓(xùn)練的效果。本文采集的正樣本如圖4所示。
圖4 正樣本
負(fù)樣本共采集圖像500張,最優(yōu)的負(fù)樣本圖像中是包括接觸網(wǎng)圖像中除去等電位線部分的所有局部圖。在用基本分類器對(duì)負(fù)樣本進(jìn)行再次分類時(shí),在每張圖像上隨機(jī)選取子窗口作為負(fù)樣本,即一張圖像上計(jì)算機(jī)自動(dòng)采集多個(gè)負(fù)樣本。每一層參加訓(xùn)練的負(fù)樣本數(shù)為3 000張。負(fù)樣本數(shù)量和形態(tài)越多,訓(xùn)練完成的分類器定位的效果會(huì)越好,但是訓(xùn)練的速度也會(huì)越慢。負(fù)樣本不需要?dú)w一化,這是因?yàn)椴煌袼卮笮〉腻e(cuò)誤樣本有著不同的圖像信息,隨機(jī)采集不同像素大小的圖像作為負(fù)樣本時(shí),就可以獲得局部和全局的圖像信息,這樣得到的錯(cuò)誤樣本更具有魯棒性,會(huì)使分類器訓(xùn)練的效果更好。本文采集的負(fù)樣本如圖5所示。
本文設(shè)置的分類器的訓(xùn)練級(jí)數(shù)最多16級(jí)。其中前面4級(jí)訓(xùn)練較快,從第5級(jí)開始由于樣本特征和分類器結(jié)構(gòu)復(fù)雜度增加,訓(xùn)練速度越來(lái)越慢。不同樣本的分類器訓(xùn)練的時(shí)間長(zhǎng)短不一樣,本文訓(xùn)練的分類器時(shí)間偏久,這是由于光照、拍攝角度等原因?qū)е抡?fù)樣本圖像灰度值相差很大,以及檢測(cè)目標(biāo)即等電位線處的結(jié)構(gòu)形態(tài)比較復(fù)雜。
AdaBoost級(jí)聯(lián)分類器訓(xùn)練完成后,即可對(duì)檢測(cè)目標(biāo)等電位線進(jìn)行識(shí)別定位。本文訓(xùn)練的2個(gè)AdaBoost級(jí)聯(lián)分類器初定位等電位線的效果如圖6所示。
由圖6可知,本文訓(xùn)練的分類器雖然能準(zhǔn)確地定位到等電位線部分,但是會(huì)產(chǎn)生誤匹配。產(chǎn)生誤匹配的原因有很多,如正樣本圖像的數(shù)量較少或者正樣本沒(méi)有包括各種光照條件下的圖像,負(fù)樣本形態(tài)少、種類少等,但這些因素對(duì)定位效果影響不會(huì)特別大。為了降低誤匹配率,采用增加支持向量機(jī)(Support Vector Machine,SVM)分類器的方法。
支持向量機(jī)借助于最優(yōu)化方法來(lái)解決機(jī)器學(xué)習(xí)問(wèn)題,是機(jī)器學(xué)習(xí)領(lǐng)域的一項(xiàng)新技術(shù)[13],是統(tǒng)計(jì)學(xué)習(xí)理論中出現(xiàn)最晚但性能非常好的一種方法[14]。傳統(tǒng)的機(jī)器學(xué)習(xí)算法,像Boosting算法等都需要復(fù)雜的代數(shù)推理過(guò)程,而支持向量機(jī)算法完全不同[15]。訓(xùn)練分類器本質(zhì)上是一個(gè)二值分類的問(wèn)題,然而支持向量機(jī)則把該問(wèn)題映射到一個(gè)無(wú)限大的超平面或者說(shuō)高維的空間里,在新的領(lǐng)域進(jìn)行分類[16]。假設(shè)訓(xùn)練樣本為(xiyi),i=1,2,…,l,x∈d,yi∈{-1,1},分類超平面wx+b=0,在滿足:
yi[(w·xi)+b]-1≥0
(1)
的情況下,分類面具備分類間隔,且能對(duì)所有樣本進(jìn)行正確分類[17]。
可以計(jì)算出分類間隔為:
(2)
要求最小化‖w‖,則求解最優(yōu)分類超平面問(wèn)題就可以表示成約束優(yōu)化問(wèn)題,即在式(1)的約束下,最小化函數(shù)[18]:
(3)
引入Lagrange函數(shù):
(4)
其中,ai>0為L(zhǎng)agrange系數(shù)。將上述問(wèn)題轉(zhuǎn)化為對(duì)偶問(wèn)題[17]:
(5)
(6)
本文的SVM學(xué)習(xí)目標(biāo)是解決訓(xùn)練數(shù)據(jù)集線性不可分時(shí)尋找最優(yōu)分類超平面的問(wèn)題,引入非負(fù)松弛變量ξi,i=1,2,…,l,分類超平面的最優(yōu)化問(wèn)題為:
(7)
其對(duì)偶問(wèn)題為對(duì)α求解下列函數(shù)的最大值:
(8)
其中,C>0為誤差懲罰參數(shù),ξi為非負(fù)松弛變量,用來(lái)訓(xùn)練樣本線性不可分[17-18]。
a可利用序列最小最優(yōu)算法求出,然后根據(jù)式(8)求出w,進(jìn)而通過(guò):
(9)
求出b,從而得到分類平面,解決分類問(wèn)題。
本文中SVM分類器訓(xùn)練采用的正樣本和AdaBoost分類器訓(xùn)練的正樣本相同,負(fù)樣本為級(jí)聯(lián)的AdaBoost分類器誤匹配的窗口圖像。正負(fù)樣本各400張圖像,同樣通過(guò)提取HOG特征訓(xùn)練AdaBoost級(jí)聯(lián)和SVM混合分類器。
將AdaBoost級(jí)聯(lián)分類器分錯(cuò)的錯(cuò)誤樣本加入到之前的負(fù)樣本中,用正樣本和新的負(fù)樣本進(jìn)行支持向量機(jī)分類器的訓(xùn)練。本次訓(xùn)練的分類器定位誤匹率較低,基本能準(zhǔn)確地定位出等電位線部位。選擇1個(gè)局部圖像和2個(gè)全局圖像為代表,單一的AdaBoost級(jí)聯(lián)分類器和添加SVM的混合分類器的定位對(duì)比結(jié)果如圖7所示,其中左側(cè)為單一分類器的定位結(jié)果,右側(cè)為增加SVM后的混合分類器的定位結(jié)果。
如圖7各子圖中的左圖所示,單一的AdaBoost級(jí)聯(lián)分類器能夠定位出等電位線,但同時(shí)誤匹配較多,不能在此定位基礎(chǔ)上進(jìn)一步地對(duì)故障進(jìn)行識(shí)別。
本文用混合分類器方法對(duì)武廣高鐵沿線由接觸網(wǎng)成像檢測(cè)車拍攝到的100張高鐵接觸網(wǎng)支撐懸掛裝置圖像進(jìn)行實(shí)驗(yàn)檢測(cè),能正確定位的圖像數(shù)目是98,正確率為98%。如圖7各子圖右圖所示,該方法能夠準(zhǔn)確定位到等電位線且?guī)缀鯖](méi)有誤匹配。由于等電位線本身特征復(fù)雜,而且攝像機(jī)拍攝的圖像并不能包括所有光照條件下和各個(gè)方向角度下的等電位線,因此不能完全無(wú)誤地定位等電位線。
等電位線的故障一般就是出現(xiàn)散股,正常等電位線和散股等電位線的對(duì)比如圖8所示。
圖8 正常和散股等電位線
對(duì)定位到的等電位線圖像做進(jìn)一步的圖像分割,提取出等電位線,這樣能減少其他干擾因素,使等電位線的故障檢測(cè)更加簡(jiǎn)單方便。
由于攝像機(jī)拍攝圖片時(shí),拍攝的距離和角度不一樣,因此得到的圖片像素值不一樣。為了準(zhǔn)確地找到等電位線像素值和的判據(jù),以等電位線左邊的螺絲釘為參照物,先進(jìn)行圖像面積歸一化處理,即使得每張圖像中左邊同一位置的螺釘所占像素值相等,這樣才能保證以等電位線像素和為故障判據(jù)的合理性。然后利用大津法得到等電位線的粗略提取,為減小等電位線周圍的其他干擾因素,使用數(shù)字形態(tài)學(xué)的一些方法精確提取出等電位線。等電位線提取流程如圖9所示。
圖9 等電位線提取流程
大津法[19]的基本思想是:將圖像分割成兩組,一組灰度對(duì)應(yīng)目標(biāo),另一組灰度對(duì)應(yīng)背景,兩組灰度值的類內(nèi)方差最小,兩組的類間方差最大。這種方法是全局閾值自動(dòng)選擇的最優(yōu)方法。
用上文所述方法精確提取出的等電位線部分如圖10所示。
圖10 散股與正常等電位線提取
等電位線正常的時(shí)候是緊緊團(tuán)在一起的一簇繩,故障的時(shí)候繩子之間會(huì)松動(dòng),因而出現(xiàn)故障的等電位線總面積(像素個(gè)數(shù)總和)會(huì)大于正常時(shí)的面積。本文通過(guò)對(duì)提取出的等電位線部分先進(jìn)行二值膨脹,把散股出現(xiàn)的孔洞填滿,然后計(jì)算每張等電位線的總面積,給出等電位線是否散股的面積判據(jù)。
本文總共計(jì)算了100張正常等電位線的面積,對(duì)20張出現(xiàn)散股故障的等電位線的面積,數(shù)據(jù)如圖11所示。
圖11 故障和正常等電位線面積對(duì)比
圖11數(shù)據(jù)顯示正常等電位線面積分布在8 667~13 878之間,出現(xiàn)散股故障的等電位線面積分布在13 228~19 068之間。給出的評(píng)論等電位線是否散股的判據(jù)如下:
本文使用Opencv和Matlab實(shí)驗(yàn)平臺(tái),用上文給出的判據(jù)對(duì)武廣高鐵沿線由接觸網(wǎng)成像檢測(cè)車拍攝到的100張高鐵接觸網(wǎng)支撐懸掛裝置圖像進(jìn)行實(shí)驗(yàn)檢測(cè),檢測(cè)結(jié)果如表1所示。
表1 等電位線故障檢測(cè)數(shù)據(jù)
由實(shí)驗(yàn)結(jié)果可以看到,在檢測(cè)的100張圖像中,有一張正常的等電位線被識(shí)別為出現(xiàn)散股故障,一張無(wú)法判斷。這是因?yàn)榈入娢痪€是被纏繞在金屬鉤上的,由于纏繞施工或者圖像拍攝不清晰部分等電位線提取的效果不理想,因此會(huì)產(chǎn)生極少數(shù)圖像誤判斷或者無(wú)法判斷的情況。
本文利用基于HOG特征提取的AdaBoost級(jí)聯(lián)分類器和支持向量機(jī)分類器實(shí)現(xiàn)等電位線圖像的初定位。通過(guò)對(duì)圖像進(jìn)行面積歸一化處理,使用大津法和數(shù)字形態(tài)學(xué)處理方法成功地提取出等電位線部分。最后對(duì)等電位線部分進(jìn)行二值膨脹計(jì)算等電位線總的面積,給出一個(gè)判斷等電位線是否散股的面積判據(jù)。實(shí)驗(yàn)結(jié)果表明,本文采用的等電位線故障檢測(cè)方法具有較高的檢測(cè)精度,可以大大降低接觸網(wǎng)運(yùn)營(yíng)與維護(hù)的工作強(qiáng)度,具有一定的推廣價(jià)值。
[1] 韓志偉,劉志剛,張桂南,等.非接觸式弓網(wǎng)圖像檢測(cè)技術(shù)研究綜述[J].鐵道學(xué)報(bào),2013,35(6):40-47.
[2] 韓 燁,劉志剛,韓志偉,等.基于SIFT特征匹配的高速鐵路接觸網(wǎng)支撐裝置耳片斷裂檢測(cè)研究[J].鐵道學(xué)報(bào),2014,36(2):31-36.
[3] 楊紅梅,劉志剛,韓志偉,等.基于仿射不變矩的電氣化鐵路絕緣子片間夾雜異物檢測(cè)[J].鐵道學(xué)報(bào),2013,35(4):30-36.
[4] 周 偉,田紅旗.接觸風(fēng)偏檢測(cè)的亮度矩尋優(yōu)分割算法[J].中南大學(xué)學(xué)報(bào),2013,44(4):1708-1713.
[5] 張桂南,劉志剛.基于角點(diǎn)匹配與譜聚類的接觸網(wǎng)絕緣子破損/夾雜異物故障檢測(cè)[J].儀器儀表學(xué)報(bào),2014,35(6):1370-1377.
[6] 張桂南,劉志剛,韓 燁,等.接觸網(wǎng)棒式絕緣子故障檢測(cè)的快速模糊匹配方法[J].鐵道學(xué)報(bào),2013,35(5):27-33.
[7] 楊興彤.基于AdaBoost和SVM的圖像檢索研究[D].太原:太原理工大學(xué),2013.
[8] 周科嘉.基于HOG特征和模板匹配的行人檢測(cè)與跟蹤研究[D].長(zhǎng)春:吉林大學(xué),2015.
[9] LI Xuchun,WANG Lei,Sung E.AdaBoost with SVM-based Component Classifiers[J].Engineering Applications of Artificial Intelligence,2008,21(5):785-795.
[10] DALAL N,TRIGGS B.Histograms of Oriented Gradients for Human Detection[C]//Proceedings of IEEE International Conference on Computer Vision and Pattern Recognition.Washington D.C.,USA:IEEE Press,2005:886-893.
[11] 柳 鋒,朱慶生,楊世泉,等.一種改進(jìn)的級(jí)聯(lián)AdaBoost分類器[J].計(jì)算機(jī)應(yīng)用,2007,27(12):3029-3030.
[12] 柳 鋒.柑橘潰瘍病檢測(cè)系統(tǒng)的研究與實(shí)現(xiàn)[D].重慶:重慶大學(xué),2009.
[13] 梁力文.基于支持向量機(jī)的小波濾噪短波近紅外光譜在藥品定量分析中的研究[D].長(zhǎng)春:吉林大學(xué),2009.
[14] 楊曉元,郭 璇,張敏情.特征選擇在隱秘圖像檢測(cè)中的應(yīng)用[J].計(jì)算機(jī)工程,2008,34(8):159-161.
[15] 騰文凱.支持向量機(jī)反問(wèn)題及其解法[D].保定:河北大學(xué),2005.
[16] PLATTJ C.Fast Training of Support Vector Machines Using Sequential Minimal Optimization[M].Cambridge,USA:MIT Press,1999.
[17] 周 鵬.基于紋理分析的煤與非煤物的圖像識(shí)別算法研究[D].沈陽(yáng):東北大學(xué),2009.
[18] 韓敘東.基于支持向量機(jī)的水電故障分類器的設(shè)計(jì)與實(shí)現(xiàn)[D].沈陽(yáng):東北大學(xué),2007.
[19] 李了了,鄧善熙,丁興號(hào).基于大津法的圖像分塊二值化算法[J].微計(jì)算機(jī)信息,2005,21(8):76-77.