白青林
(北京市軌道運營有限公司,北京 102412)
為更好地滿足乘客需求,必須在現(xiàn)有技術與運行模式的基礎上對城市軌道交通進行優(yōu)化[1]。北京大興機場線設計時速為160km,是全球時速最快的地鐵線路,是城市軌道交通一種新的突破。為保證地鐵的安全可靠穩(wěn)定運行,需要牽引供電系統(tǒng)可靠工作,而剛性接觸網(wǎng)是系統(tǒng)的重要組成部分,也是實現(xiàn)機車可靠供電的關鍵部件[2]。
由于剛性接觸網(wǎng)隨著地鐵運行時間的延續(xù),運行壓力不斷增加,其運行狀態(tài)下滑嚴重,從而導致不同類型的故障出現(xiàn),因此需要對剛性接觸網(wǎng)進行實時檢測,為檢修維護提供重要支撐尤其重要。其中剛性接觸網(wǎng)的懸掛狀態(tài)檢測更是重中之重,剛性接觸網(wǎng)懸掛狀態(tài)將直接決定剛性接觸網(wǎng)的工作性能,進而影響弓網(wǎng)受流質量,若剛性接觸網(wǎng)懸掛狀態(tài)不佳,將會威脅地鐵的穩(wěn)定運行[3-4]。
文章以北京大興機場線中的剛性接觸網(wǎng)為研究對象,基于圖像識別技術,引入深度學習理論對剛性接觸網(wǎng)懸掛狀態(tài)進行檢測,建立包含深度學習的剛性接觸網(wǎng)懸掛狀態(tài)檢測流程,并通過現(xiàn)場實驗,與傳統(tǒng)的圖像檢測方式進行對比來驗證該方法的準確性與優(yōu)越性,從而為快速地鐵的剛性接觸網(wǎng)懸掛狀態(tài)檢測提供一種新的嘗試。
卷積神經(jīng)網(wǎng)絡(Convolution Neural Notwork,CNN)作為四大深度學習模型之一,在計算機視覺領域有著廣泛的應用。CNN主要由三部分組成,第一部分為輸入層,實現(xiàn)原始圖像數(shù)據(jù)的輸入;第二部分由卷積層和池化層組成,實現(xiàn)對輸入數(shù)據(jù)的特征提取;第三部分由全連接層和分類器組成,實現(xiàn)全連接的多層感知[5-6]。
卷積層:對圖像和濾波矩陣做內積運算的過程稱為卷積操作。通過改變卷積層深度等參數(shù)實現(xiàn)圖像特征提取。卷積運算公式如下:
池化層:一般存在于連續(xù)的卷積層間,通過對輸入的特征圖進行“壓縮”來減小下一層計算量,避免過擬合。平均池化和最大值池化為常用的兩種池化方式,池化運算公式如下:
式中:down函數(shù)為下采樣運算,將i-1層輸出特征圖xi分割為n×n的特征圖塊,并對其進行最大值或均值化處理,使得特征圖維度變?yōu)樵紙D塊的1/n2。
全連接層:其一般位于CNN的尾部,作用是對整個網(wǎng)絡的特征進行線性組合,計算公式如下:
式中:Wij為i-1層的第i個節(jié)點和i層第j個節(jié)點間的權重;b為i層第j個節(jié)點的偏置。
CNN本質上為實現(xiàn)輸入和輸出間的映射,利用已知模式對CNN進行訓練,使其具有輸入輸出間的映射能力,整個學習過程和人工神經(jīng)網(wǎng)絡類似,可歸納為向前傳播、反向傳播和權值更新部分[7]。
整個CNN的學習過程如下。(1)初始化網(wǎng)絡:對CNN的權重、偏置系數(shù)等參數(shù)進行隨機初始化;(2)向前傳播:將訓練樣本數(shù)據(jù)作為CNN輸入,獲得CNN的預測值;(3)誤差求解:計算實際值和預測值間的誤差;(4)反向傳播:根據(jù)所求解的誤差值,對各層網(wǎng)絡的權重和偏置的偏導數(shù)進行求解,實現(xiàn)對網(wǎng)絡參數(shù)的更新;(5)重復步驟2和4。
Faster R-CNN算法是在改進Fast R-CNN的基礎上提出的,由于Fast R-CNN是通過選擇搜索算法實現(xiàn)候選框的特取,因此非常耗時[8]。而Faster R-CNN通過區(qū)域建議網(wǎng)絡(RPN)完成對候選框的特取,也可看成是RPN+Faster R-CNN的結合體,區(qū)域建議網(wǎng)絡采用卷積核為3×3的卷積層在特征圖上做滑窗處理,進而確定候選框的位置。
剛性接觸網(wǎng)懸結構復雜,包含諸多部件,各部件雖然功能不同,但相互協(xié)作、相互耦合,共同保證了剛性接觸網(wǎng)的運行狀態(tài)。剛性接觸網(wǎng)的主要部件及功能如表1所示。
利用接觸網(wǎng)剛性懸掛監(jiān)測裝置(4C),對地鐵運行軌道途中的剛性接觸網(wǎng)進行拍攝,所得到的剛性接觸網(wǎng)懸定位裝置、支撐裝置、接觸懸掛、附加懸掛等的實際圖像,為后續(xù)圖像處理、故障識別提供基礎。
表1 剛性接觸網(wǎng)主要部件及功能明細表
對剛性接觸網(wǎng)圖像中的故障進行識別需完成兩項工作,一是建立樣本模板,二是對圖像進行故障識別。具體流程如圖1所示。(1)待檢測圖像的采集:針對某鐵路路線,采集1500張圖像;(2)圖像預處理:對圖像進行像素處理,并對各位置進行框圖標注;(3)訓練集和測試集的劃分:劃分訓練集和測試集;(4)共享卷積層特征信息提?。簩D片數(shù)據(jù)輸入預訓練網(wǎng)絡,以此獲取圖片的特征圖譜;(5)區(qū)域建議:根據(jù)提取的特征,采用RPN網(wǎng)絡尋找相應數(shù)量的候選框圖;(6)分類和回歸:根據(jù)前向和反向傳播,完成網(wǎng)絡參數(shù)調整,并判斷部件類別。
圖1 樣本建模實現(xiàn)流程
Faster R-CNN算法需要對兩種不同任務的訓練模型進行訓練,交替訓練和近似聯(lián)合訓練是Faster R-CNN算法的兩種常用訓練方式。
交替訓練首先對區(qū)域建議網(wǎng)絡進行訓練,并將訓練好的參數(shù)作為Fast R-CNN的初始化參數(shù),同時將RPN的輸出作為Fast R-CNN的輸入,通過多次迭代來訓練網(wǎng)絡。
近似聯(lián)合訓練為另外一種訓練模式,不同于交替訓練中分別對RPN和Faster R-CNN進行訓練的方式,由于每次隨機梯度下降迭代時,RPN產(chǎn)生的proposal在前向傳播時為固定值,因此可提前計算并設置該值,進而對Faster R-CNN網(wǎng)絡進行訓練。反向傳播時,將RPN的誤差和Faster R-CNN的誤差結合,并且對RPN產(chǎn)生的cls_score忽略不計,進而更新參數(shù)。該設置可以保證反向傳播時,網(wǎng)絡只能獲得一個解析解[9-10]。與交替訓練模式相比,近似聯(lián)合訓練模式具有內存較少、訓練時間短等優(yōu)勢,故采用近似聯(lián)合訓練模式。
選取北京線路大興機場線接觸網(wǎng)系統(tǒng)作為訓練對象,采集2000張4C高清、正常運行狀態(tài)下的圖像作為訓練樣本,分別選取另3條鐵路運營線路作為測試線路,各采集400張圖片作為測試樣本。同時,對標注過程中的一些模糊信息進行篩選,采用圖像處理技術(灰度處理、降噪處理等)豐富樣本數(shù)據(jù)。
選用Caffe深度學習框架,其擁有較多經(jīng)典模型,且方便在模塊基礎上根據(jù)需要進行擴展,同時還具有運行速度較快的特點。硬件運行環(huán)境為Intel CoreI5-6300HQ,NVIDIA GTX1050Ti,4G顯存。訓練樣本集為2000張,測試樣本集為400×3張。
采用600張測試集輸入構建的檢測模型,測試檢測算法的結果,檢測效果如圖2所示。
圖2 檢測結果
由圖2檢測結果可知,基于深度學習的剛性接觸網(wǎng)懸掛狀態(tài)檢測算法能夠準確識別剛性接觸網(wǎng)懸掛裝置中的缺陷,600張故障圖片中,準確識別出389張故障圖片,故障識別率為64.83%,且計算速度較快。為驗證該算法的廣泛適用性,對各部件選取了25張具有明顯故障的圖片,對剛性接觸網(wǎng)懸掛裝置各部件缺陷故障識別率進行統(tǒng)計,對圖像進行識別,統(tǒng)計各部件的識別結果,統(tǒng)計結果如圖3和表2所示。
圖3 故障識別結果
表2 剛性接觸網(wǎng)主要部件故障識別率
由表2可知,針對剛性接觸網(wǎng)主要部件的故障識別率存在差異,具體可知對定位線夾、中心錨結線夾等部件的識別率較高,對中間接頭、接地線夾等部件的識別率較低,是后期優(yōu)化檢測方法的重點;各部件故障檢測率的平均識別率為64%,與600張剛性接觸網(wǎng)故障檢測結果相近,表明檢測結果可信度較高。
為驗證基于深度學習的剛性接觸網(wǎng)懸掛狀態(tài)檢測算法的優(yōu)越性,設置實驗,將本算法同應用廣泛的YOLO、SSD目標檢測算法進行了對比,選取400張測試圖像,測試結果如表3所示。
表3 不同檢測算法下的定位結果
由表3可知,文章采用的基于Faster R-CNN模型的目標檢測算法與YOLO算法、SSD算法相比,定位精度分別提高了8%和4%,體現(xiàn)了本算法的優(yōu)越性。
文章介紹了一種基于深度學習的剛性接觸網(wǎng)懸掛狀態(tài)檢測算法。測試結果表明,基于Faster R-CNN模型的目標檢測算法定位精度分別比YOLO算法和SSD算法提高了8%和4%,具有較好的準確性和運行效率。同時,針對不同線路的采集圖像進行測試,檢測結果表明不同線路下,此方法均能較好地定位六大區(qū)域部件,具有較好的通用性,為快速地鐵的剛性接觸網(wǎng)懸掛狀態(tài)檢測提供了一種新的嘗試。