金煒東,張志軍,唐 鵬
(1.西南交通大學(xué) 電氣工程學(xué)院,四川 成都 611756;2.南寧學(xué)院 中國-東盟綜合交通國際聯(lián)合實驗室,廣西 南寧 530200)
電氣化鐵路設(shè)備安全狀態(tài)監(jiān)測中,接觸網(wǎng)狀態(tài)監(jiān)測及其故障檢測備受關(guān)注。高速鐵路接觸網(wǎng)系統(tǒng)中的吊弦是承力索和接觸線間的連接部件,因長時間受力拉伸、震動、磨損與環(huán)境腐蝕較易導(dǎo)致吊弦故障。目前對吊弦狀態(tài)的辨識主要依賴人工檢視,因此效率低、周期長。對吊弦狀態(tài)進行快速、準(zhǔn)確地自動辨識成為亟待解決的問題。隨著智能視頻分析技術(shù)的長足發(fā)展,基于視頻圖像分析的接觸網(wǎng)狀態(tài)檢測已成發(fā)展趨勢。高速列車通過安裝車載接觸網(wǎng)運行狀態(tài)檢測裝置(3C)對接觸網(wǎng)進行拍攝,采集接觸網(wǎng)圖像。吊弦圖像由接觸網(wǎng)圖像通過目標(biāo)檢測算法定位截取生成。吊弦圖像有如下特點:
(1)吊弦目標(biāo)占比極小,背景占比大。coco數(shù)據(jù)集中定義小目標(biāo)尺寸為32×32(1024個像素點),而吊弦目標(biāo)一般不超過500個像素點。由于吊弦故障形態(tài)多樣,故定位框尺寸又不可設(shè)定過小。
(2)背景復(fù)雜且易對吊弦識別造成干擾,如吊弦被支架、受電弓等設(shè)備遮擋。
(3)故障狀態(tài)與正常狀態(tài)形態(tài)相似。
(4)吊弦故障形態(tài)多樣。
目前的Faster R-CNN、YOLO等目標(biāo)檢測算法以及各種分類網(wǎng)絡(luò)在設(shè)計之初并未針對接觸網(wǎng)這種高背景比例、特殊形狀的待檢測對象進行優(yōu)化處理,因此現(xiàn)有的目標(biāo)檢測方法與分類網(wǎng)絡(luò)對于吊弦的識別精度較低。
目前基于神經(jīng)網(wǎng)絡(luò)吊弦狀態(tài)識別,一般采用現(xiàn)有的目標(biāo)檢測算法或分類網(wǎng)絡(luò)。文獻[1]采用Faster R-CNN級聯(lián)的方式識別高速鐵路接觸網(wǎng)等電位線,使用第一級對等電位線進行定位,用第二級學(xué)習(xí)等電位線的故障特征,使用5層ZF網(wǎng)絡(luò)進行特征提取。文獻[2]使用多算法融合圖像處理技術(shù),使用ResNet-18作為特征提取網(wǎng)絡(luò),使用Faster R-CNN提取感興趣區(qū)域(ROI)。文獻[3]在高鐵接觸網(wǎng)定位器的檢測和識別中使用Faster R-CNN算法。文獻[4]設(shè)計了平衡注意力特征金字塔網(wǎng)絡(luò)來預(yù)測矩形框的位置,使用Faster R-CNN檢測算法對吊弦狀態(tài)進行識別,ResNet-101與Faster R-CNN的結(jié)合使用使MAP達到了86.8。上述研究大多采用Faster R-CNN[5]算法,但算法和其使用的主干網(wǎng)絡(luò)并未針對接觸網(wǎng)這種高背景比例、特殊形狀的檢測對象進行優(yōu)化處理。文獻[6]在對緊固件進行故障分類時設(shè)計了一個簡單的分類網(wǎng)路,網(wǎng)絡(luò)由4個卷積層和2個全連接層組成。文獻[7]提出6層卷積層和2個全連接層組成的特征提取網(wǎng)絡(luò)對等電位線進行特征提取。淺層網(wǎng)絡(luò)特征提取能力與復(fù)雜特征擬合能力弱,不適用于特征提取困難且形態(tài)多樣的細小目標(biāo)識別。
在現(xiàn)有研究的基礎(chǔ)上,針對現(xiàn)有目標(biāo)檢測方法對高背景比例樣本檢測性能受限的問題,本文提出一種基于改進寬殘差結(jié)構(gòu)的吊弦狀態(tài)辨識分類網(wǎng)絡(luò),稱為VRNet。VRNet將寬殘差結(jié)構(gòu)與注意力模型相結(jié)合,并將改進的寬殘差結(jié)構(gòu)取代VGG-16中的普通卷積,形成了適用于處理吊弦數(shù)據(jù)的分類網(wǎng)絡(luò)。VRNet提升了吊弦分類實驗的精度,且因網(wǎng)絡(luò)中使用了Ghost輕量級機制,減少了模型參數(shù)量和運算量,提高了處理效率。
殘差結(jié)構(gòu)[8]的出現(xiàn)解決了深層網(wǎng)絡(luò)的訓(xùn)練退化問題,促使網(wǎng)絡(luò)向更深層次發(fā)展。但隨著網(wǎng)絡(luò)深度的不斷增加,特征的利用率降低,僅少數(shù)特征層能學(xué)到有用特征。寬殘差結(jié)構(gòu)[9](Wide Residual)是在殘差結(jié)構(gòu)(Residual)的基礎(chǔ)上擴展了網(wǎng)絡(luò)寬度,不僅具有殘差結(jié)構(gòu)的優(yōu)勢,而且淺層的寬殘差網(wǎng)絡(luò)便能達到深層殘差網(wǎng)絡(luò)的效果[9]。其結(jié)構(gòu)與殘差結(jié)構(gòu)相同,如圖1所示。
圖1中,x為輸入;F(x)+x為輸出??旖萋窂綄⑤斎牒愕扔成涞捷敵?。第K層與第K+1層的關(guān)系為
xK+1=xK+F(xK,wK)
( 1 )
l層到L層間的學(xué)習(xí)過程為
( 2 )
通過導(dǎo)數(shù)鏈?zhǔn)椒▌t可得反向傳播梯度為
( 3 )
根據(jù)吊弦圖像數(shù)據(jù)特征對寬殘差結(jié)構(gòu)進行改進。首先將SE注意力機制[10]嵌入至寬殘差結(jié)構(gòu)內(nèi)部,如圖2所示。SE注意力機制可以學(xué)習(xí)全局信息選擇性地強調(diào)圖像的信息特征并抑制無用的特征[10],因此適用于處理吊弦這種高背景占比的數(shù)據(jù)。由于網(wǎng)絡(luò)寬度的增加導(dǎo)致模型參數(shù)量的增加,為降低參數(shù)量,提高識別效率,本文使用輕量級Ghost[11]模塊取代了寬殘差結(jié)構(gòu)中的普通卷積(Conv為普通卷積),參數(shù)量和運算量明顯降低。將該結(jié)構(gòu)作為特征提取模塊(稱為VR),結(jié)構(gòu)如圖2所示,其中k為寬殘差的擴展系數(shù)。
圖2 VR特征提取模塊結(jié)構(gòu)
整體結(jié)構(gòu)以VGG-16[12]為基礎(chǔ),改變了原VGG中普通卷積堆疊的平原結(jié)構(gòu),將普通卷積替換為VR特征提取模塊(圖2所示),層次更深的寬殘差網(wǎng)絡(luò)在每一階段能夠提取到更魯棒的特征[13]。為減少參數(shù)量與運算量,只保留一個全連接層。進行Dropout正則化[14]處理,最終形成本文的VRNet分類網(wǎng)絡(luò)。
1.2.1 SE注意力機制特征強化
吊弦圖片的背景占比大,接觸網(wǎng)線路較為復(fù)雜,并且隨著網(wǎng)絡(luò)寬度的擴展,一些通道不能提供識別吊弦狀態(tài)所需的信息。
SE注意力機制利用通道關(guān)系,使用全局信息選擇性地突出有價值的通道特征。其實質(zhì)為使用一個兩層神經(jīng)網(wǎng)絡(luò)生成c個權(quán)重(神經(jīng)網(wǎng)絡(luò)由兩層全連接層組成,c為原特征通道數(shù),權(quán)重為0~1的系數(shù)),將c個權(quán)重系數(shù)分別分配到原特征的每層通道上,達到區(qū)分各層通道重要性的目的。
圖3 注意力機制對吊弦的特征強化
注意力機制強化吊弦特征的實現(xiàn)如圖3所示,X為注意力機制處理前的吊弦特征,SE首先利用全局平均池化將特征X的每個通道壓縮成一個實數(shù),因此池化后的維度和通道數(shù)相同。
( 4 )
式中:W、H為特征的寬、高。
將全局平局池化后的一維特征值作為每個通道的權(quán)重系數(shù)。
s=σ(g(z,W))=σ(W2σ(W1z))
( 5 )
式中:σ指經(jīng)過Relu操作,W1、W2皆為全連接操作。W1對全局池化后的c維吊弦特征進行降維全連接操作,W2對降維后的特征上升至原維度,然后將恢復(fù)維度后的吊弦特征經(jīng)過sigmoid歸一化為c個0~1的權(quán)重系數(shù)。在W1、W2全連接層與整體網(wǎng)絡(luò)同時參與訓(xùn)練,不斷更新全連接層參數(shù),使其分辨信息重要性的能力不斷增強。
最后,將c個權(quán)重分配至原吊弦特征的每個通道上,完成權(quán)重的重新標(biāo)定。
yc=s·xc
( 6 )
c為特征通道數(shù),與原吊弦特征xc相比,被重新標(biāo)定了權(quán)重的新特征,yc更加突出吊弦圖像中的重要信息。
為驗證SE注意力機制的作用,分別使用加入注意力模塊的模型與未加入注意力模塊的模型對測試集數(shù)據(jù)進行識別,將特定層處理結(jié)果分別做可視化處理(對比的可視化特征圖為同一層的處理結(jié)果)。處理結(jié)果如圖4所示,從處理結(jié)果可以發(fā)現(xiàn),未加入SE注意力機制的模型處理結(jié)果明顯丟失了部分吊弦信息。
圖4 模型測試結(jié)果可視化
1.2.2 利用Ghost降低參數(shù)量
由于對網(wǎng)絡(luò)在寬度上進行了擴展,使得計算量和參數(shù)量較大。本文使用Ghost輕量級模塊,在保證精度的前提下大幅降低了計算量和參數(shù)量。
普通卷積對數(shù)據(jù)進行特征提取時,可視化特征圖中一些特征圖相似度較高,可以對部分卷積進行Cheap operation[11]操作得到這些冗余的特征。如圖5所示,利用普通卷積生成必要特征,然后對這些特征進行Cheap operation操作生成相似特征,將兩部分特征疊加,通過該思想生成的特征的參數(shù)量要遠小于使用大量卷積核所產(chǎn)生的參數(shù)量。
圖5 Ghost
本文網(wǎng)絡(luò)中,將改進的寬殘差模塊中的3×3卷積全部替換為Ghost模塊,同時將Shortcut中的1×1卷積替換為Ghost模塊。實驗結(jié)果表明,在測試集上未造成明顯精度損失,參數(shù)量和運算量大幅降低。
特征提取網(wǎng)絡(luò)的深度、寬度和參數(shù)設(shè)置直接影響分類網(wǎng)絡(luò)的性能。文獻[15]證明了深度的重要性。文獻[16]使用Lebesgue可積函數(shù)逼近的方法定量分析了網(wǎng)絡(luò)寬度對網(wǎng)絡(luò)表達能力的影響。
對于任意Lebesable可積函數(shù)f,ε>0存在一個寬度dm≤n+4的網(wǎng)絡(luò)y,使網(wǎng)絡(luò)表示的函數(shù)Fy滿足
( 7 )
式( 7 )說明,如果寬度小于n,則網(wǎng)絡(luò)的表達能力和特征提取能力將大幅減弱[16]。
寬殘差網(wǎng)絡(luò)在殘差網(wǎng)絡(luò)的基礎(chǔ)上將通道數(shù)擴展k倍,從而拓寬了網(wǎng)絡(luò)寬度。被拓寬了通道數(shù)的殘差結(jié)構(gòu)更有利于生成語義信息豐富的特征圖。本文選擇basic-wide寬殘差結(jié)構(gòu)并將擴展因子k設(shè)定為8。將改進的寬殘差結(jié)構(gòu)(VR特征提取模塊,見圖2)嵌入VGG-16中,輸入通道數(shù)依次設(shè)定為16、32、64,故擴展后的輸入通道數(shù)依次為128、256、512,很大程度還原了VGG-16的寬度。最后加入Dropout正則化以減少過擬合,增加網(wǎng)絡(luò)泛化能力,并在結(jié)尾僅設(shè)定1個全連接層(FC)。相比于VGG-16的3個全連接層大幅削減了參數(shù)量。輸入通道與VR特征提取模塊的設(shè)計見表1。
表1 VRNet結(jié)構(gòu)
安裝于高速列車頂端的車載接觸網(wǎng)運行狀態(tài)檢測裝置對接觸網(wǎng)進行實時拍攝,使用yolov3目標(biāo)檢測算法對接觸網(wǎng)圖像中的吊弦進行定位截取生成吊弦數(shù)據(jù)庫。吊弦圖片像素尺寸為64×160(RGB圖像),吊弦狀態(tài)分為三類,分別為正常(Good)、松脫(Loose)、斷裂(Broken)。吊弦狀態(tài)如圖6所示。其中正常吊弦和部分故障吊弦為視頻中利用目標(biāo)檢測算法截取的原圖。
圖6 吊弦數(shù)據(jù)
但故障樣本較少,為解決訓(xùn)練集數(shù)據(jù)量不平衡問題,對正常樣本進行故障仿真,使其逼近各類故障形態(tài)。數(shù)據(jù)集見表2,共收集各類吊弦樣本7539張,訓(xùn)練集各類樣本數(shù)量均勻,防止模型學(xué)習(xí)失衡;測試集各類樣本數(shù)量均衡,保證了測試結(jié)果的可靠性。
表2 數(shù)據(jù)集 張
實驗所使用的硬件:inter i7-9750H CPU,NVIDIA GeForce GTX 1660 Ti GPU顯存6GB。訓(xùn)練和測試使用框架為GPU版Pytorch。
由于吊弦數(shù)據(jù)是通過使用YOLO目標(biāo)檢測算法對視頻文件中的接觸網(wǎng)圖像檢測生成,其他的電連接線樣本由手動截取生成,故樣本尺寸大小不一。訓(xùn)練前由transform進行預(yù)處理,統(tǒng)一尺寸為64×160。學(xué)習(xí)率lr=0.01,使用SGD作為優(yōu)化器。損失函數(shù)為交叉熵損失函數(shù)。
各組對比實驗所使用的模型均在相同條件下訓(xùn)練完成。
設(shè)定寬殘差結(jié)構(gòu)擴展系數(shù)k,k=1,4,8,10(系數(shù)為1代表原殘差網(wǎng)絡(luò),系數(shù)不為1代表不同寬度的寬殘差網(wǎng)絡(luò)),得到不同的網(wǎng)絡(luò)寬度,將4種不同寬度的網(wǎng)絡(luò)做對比實驗,實驗結(jié)果見表3。
表3 寬殘差擴展系數(shù)對比 %
由對比實驗可以看出,當(dāng)k=8時吊弦分類網(wǎng)絡(luò)的分類效果最優(yōu),分類準(zhǔn)確率優(yōu)于普通殘差網(wǎng)絡(luò)。
加入注意力機制的VRNet與去掉注意力的VRNet在通道擴展系數(shù)k=8條件下VRNet (8)、VRNet(SE) (8)精度分別為95.9%、97.0%的對比實驗結(jié)果見表4。實驗表明引入注意力機制加強了網(wǎng)絡(luò)的分類能力。
改進的寬殘差結(jié)構(gòu)取代VGG-16的卷積堆疊的平原結(jié)構(gòu),該操作使參數(shù)量與運算量大幅增加,為節(jié)省計算資源VRNet只保留了一層全連接層,并使用Ghost機制代替了寬殘差結(jié)構(gòu)中的普通卷積。本文分別計算了VGG-16、寬殘差網(wǎng)絡(luò)Wide_ResNet50、未使用Ghost機制VRNet和使用Ghost機制的VRNet的參數(shù)量與運算量,見表4。Ghost操作大幅降低了參數(shù)量與運算量。
表4 輕量級處理對比實驗結(jié)果
選擇經(jīng)典網(wǎng)絡(luò)VGG-16、ResNet-50、ResNext-50、SENet以及寬殘差網(wǎng)絡(luò)與本文的VRNet進行綜合對比實驗。性能指標(biāo)以分類精度為主,實驗結(jié)果見表5。
表5 分類精度對比 %
實驗結(jié)果顯示,在眾多的網(wǎng)絡(luò)模型中,VRNet的吊弦分類精度為97%,在吊弦狀態(tài)辨識任務(wù)中的表現(xiàn)優(yōu)于包括VGG-16、ResNet、Wide_ResNet在內(nèi)的經(jīng)典分類網(wǎng)絡(luò)。
圖7分別為VRNet與ResNet-50的檢測效果,圖7示例代表一些被支架或受電弓等設(shè)施遮擋而無法顯示完整且背景復(fù)雜的吊弦。在此類復(fù)雜數(shù)據(jù)中,一般網(wǎng)絡(luò)分類效果差,而VRNet分類網(wǎng)絡(luò)將正常與故障吊弦進行了準(zhǔn)確辨識(紅色框代表吊弦檢測為故障狀態(tài),綠色框代表吊弦檢測為正常狀態(tài))。
圖7 檢測效果對比
針對高速鐵路接觸網(wǎng)吊弦識別精度低的問題,本文提出VR特征提取結(jié)構(gòu)和VRNet分類網(wǎng)絡(luò)。針對吊弦樣本的特殊性,選用寬殘差結(jié)構(gòu)作為分類網(wǎng)絡(luò)的基本組成單元,在其中嵌入SE注意力機制強化重要特征,并使用Ghost機制降低模型參數(shù)量,以此形成VR特征提取結(jié)構(gòu)。使用VGG-16作為網(wǎng)絡(luò)的基本結(jié)構(gòu),用VR結(jié)構(gòu)代替大量卷積的平鋪結(jié)構(gòu),構(gòu)成了VRNet分類網(wǎng)絡(luò)。
VRNet分類網(wǎng)絡(luò)有效提高了吊弦狀態(tài)識別精度,解決了現(xiàn)有方法對吊弦狀態(tài)識別效果較差的問題,使得車載接觸網(wǎng)運行狀態(tài)檢測裝置能夠更準(zhǔn)確地識別出鐵路沿線的故障吊弦,為接觸網(wǎng)吊弦的自動檢修提供高效可靠的支持。結(jié)合相關(guān)科研項目中的實踐,本文模型在實際應(yīng)用中表現(xiàn)出更優(yōu)的性能。接觸網(wǎng)故障自動識別技術(shù)與裝備的發(fā)展和不斷成熟,將有力解決人工巡檢的困難,大幅減少低精度設(shè)備因誤檢給檢修人員造成的誤導(dǎo),節(jié)省人力物力,縮短檢修周期,為保障鐵路安全運行發(fā)揮應(yīng)有作用。