嚴鵬,廖峪,陳偉庚,劉曉江,楊長衛(wèi)
(1.西南交通大學,四川 成都 610031;2.中國鐵路廣州局集團有限公司 深圳工程建設指揮部,廣東 深圳 518000;3.中國中鐵二局第四工程有限公司,四川 成都 610306)
我國高速鐵路正在快速發(fā)展,預計到2020 年將達到3.0 萬km[1]。然而,隨著高鐵運營里程的逐漸增大,基礎設施病害問題已成為威脅運營安全的焦點,如何準確、及時發(fā)現(xiàn)病害則是迫切需要解決的難題[2-5]。近年來,隨著人工智能和大數(shù)據(jù)分析技術(shù)的快速發(fā)展,人臉、指紋、虹膜等智能識別理論與技術(shù)已漸趨成熟,在機場與車站安檢、網(wǎng)絡支付、上班考勤等方面得到廣泛應用,解決了傳統(tǒng)技術(shù)難以突破的關(guān)鍵技術(shù)難題[6-7]。
基礎理論的發(fā)展有助于科學技術(shù)的進步,現(xiàn)階段人臉識別技術(shù)的核心是圖像識別算法?;趫D像識別算法,以接觸網(wǎng)懸掛狀態(tài)及缺陷為對象,闡述圖像識別技術(shù)在高速鐵路基礎設施狀態(tài)檢測方面的應用。
針對接觸網(wǎng)懸掛狀態(tài)及缺陷的智能檢測工作大致可劃分為大數(shù)據(jù)處理、智能驗損兩大部分,具體架構(gòu)見圖1。大數(shù)據(jù)處理部分主要是針對海量的缺陷照片,進行高效、安全的存儲和特征分析管理,采用Hadoop架構(gòu)來實現(xiàn)計算機集群對海量數(shù)據(jù)分布式計算。在智能檢測方面,主要采用基于圖像識別和百層神經(jīng)網(wǎng)絡的人工智能技術(shù);通過自主研發(fā)的NBK-INTARI 神經(jīng)網(wǎng)絡技術(shù)開展圖片增強、邊緣檢測、特征提取及缺陷特征等工作,將分析結(jié)果與數(shù)據(jù)庫關(guān)聯(lián),進而對實測存在缺陷的圖片進行快速識別。
圖1 接觸網(wǎng)懸掛狀態(tài)及缺陷智能檢測工作架構(gòu)
人工神經(jīng)網(wǎng)絡是目前在人工智能領域應用最為廣泛的數(shù)學分析模型。其中,前向BP 神經(jīng)網(wǎng)絡則是應用最多的神經(jīng)網(wǎng)絡方式,具有自學習、自適應、非線性映射及容錯率高等優(yōu)點,能夠解決傳統(tǒng)方法無法解決的具體問題。BP 神經(jīng)網(wǎng)絡大致可劃分為輸入層、隱含層及輸出層,其基本原理[8-10]如下:
為輸出層向。
在輸入層,輸入節(jié)點僅將輸入信息通過激活函數(shù)f(u)的作用傳播到隱藏層節(jié)點上,研究選擇的激活函數(shù)為sigmoid,則其表達式為:
設w是輸入層-隱藏層、隱藏層-輸出層間權(quán)值,其向量為隱藏層節(jié)點的輸出以O表示:
輸出層節(jié)點的輸出以P表示:
輸出誤差δ為:
式中:T為輸出節(jié)點的目標值。對于隱藏層節(jié)點有:
式中:δi為隱藏層節(jié)點i的誤差項;ai為隱藏層節(jié)點i的輸出值;wki是節(jié)點i到下一層節(jié)點k的連接權(quán)值;δk是節(jié)點i到下一層節(jié)點k的誤差項。更新每個鏈接上的權(quán)值為:
式中:wji節(jié)點i到節(jié)點j的權(quán)重;η為學習速率常數(shù);δj是節(jié)點j的誤差項;xji是節(jié)點i傳遞給節(jié)點j的輸入。
豐富、完善的缺陷數(shù)據(jù)庫是開展智能驗損的基礎,課題組針對接觸網(wǎng)懸掛狀態(tài)及缺陷,與鐵路局集團公司開展具體工作,收集、整理了針對腕臂底座、套管雙耳、定位線夾、長定位立柱等57 個部件共178 種典型缺陷,并成功實現(xiàn)了識別,部分缺陷識別照片見圖2。
圖2 部分缺陷識別照片
根據(jù)現(xiàn)場調(diào)研結(jié)果發(fā)現(xiàn),接觸網(wǎng)懸掛狀態(tài)檢測工作大部分在夜晚開展,難以有效保證部分構(gòu)件的清晰度。因此,針對弱光環(huán)境下開展圖像增強,將部件的細節(jié)進行增強,突出重點關(guān)注部分,適當減弱周圍環(huán)境,為后續(xù)提高圖像識別的準確率做準備。課題組采用頻域增強方法,通過將圖像空間域轉(zhuǎn)換到特定的變換域內(nèi),并且在此變換域中完成變換后的系數(shù)操作與處理,然后再將其逆變換到圖像空間域[11-15]。
假設圖像空間域?(x,y)變換后的頻域函數(shù)為F(x,y),傳遞函數(shù)為H(u,v),從空間域到變換域的函數(shù)過程表述為:
逆變換的函數(shù)過程為:
式中:?(u,v)為在頻域內(nèi)系數(shù)處理之后的圖像頻譜;g(x,y)為圖像增強處理后的輸出圖像。在實際操作中,可根據(jù)具體的需求而設置不同的傳遞函數(shù)H(u,v)。
選取現(xiàn)場實測圖片(見圖3),經(jīng)過增強后(見圖4)可知,增強后接觸網(wǎng)部件的圖像更突出,邊緣更清晰,目標圖像與背景分界明顯。
圖3 原始圖像
圖4 增強后圖像
接觸網(wǎng)懸掛系統(tǒng)存在大量的細部構(gòu)件,如何能夠精準識別接觸網(wǎng)系統(tǒng)的缺陷至關(guān)重要。研究采用百余層的神經(jīng)網(wǎng)絡算法和特征金字塔模型,自主研發(fā)了重復區(qū)域融合算法,充分考慮接觸網(wǎng)零部件特征,對部件進行快速鎖定(見圖5)。在此基礎上,將神經(jīng)網(wǎng)絡傳統(tǒng)的前向傳播方式升級為反向傳播,通過調(diào)整網(wǎng)絡輸出與原始值間的誤差來訓練與改變權(quán)值,進而提高識別準確性。大量現(xiàn)場實測結(jié)果表明,現(xiàn)階段只能通過對接觸網(wǎng)同一部件來自不同角度的7 張圖片實現(xiàn)構(gòu)件的精準識別,準確率在90%以上。
圖5 精準定位與缺陷識別
準確性和時效性是人工智能技術(shù)的兩大核心指標。在整個識別過程中,將第1 次識別結(jié)果投入到下一次訓練樣本中,以快速擴大輸入層樣本的數(shù)量,制定適合接觸網(wǎng)缺陷識別的學習策略,加快學習模型的收斂速度,減少學習時間。研究對比分析了常數(shù)型、AdaDec 和AdaMix 3 種學習策略對深度學習模型收斂性的影響。假定工況信息如下:訓練樣本集為8 000 幅接觸網(wǎng)原始圖像,測試樣本為1 500 幅接觸網(wǎng)原始圖像,迭代次數(shù)最大值為35。重構(gòu)誤差分析見圖6。
由圖6 可知,隨著迭代次數(shù)的增加,常數(shù)型、AdaDec 和AdaMix 的重構(gòu)誤差逐漸降低,最后趨于穩(wěn)定。
圖6 重構(gòu)誤差分析
為了系統(tǒng)說明圖像識別技術(shù)在高速鐵路基礎設施檢測中的優(yōu)勢,以1 000 km 的鐵路線路為例,假定每隔20 m 設立1 根供電桿,高速綜合檢測車針對每根供電桿拍攝20 張圖片,累計100 萬張圖片。課題組前期對此進行了大量調(diào)研和訪談,基本掌握缺陷識別現(xiàn)狀:需25 個圖像分析員連續(xù)工作60 d,平均每分鐘識別2~3 張圖片(識別速度為20~30 s/張),難以對病害達到及時發(fā)現(xiàn)、及時處理的要求;識別的穩(wěn)定性較差,識別人員工作疲勞易造成缺陷識別的遺漏,影響識別質(zhì)量。
針對同樣的工作量,課題組采取人工智能識別,運算速度大幅度提升,識別速度為0.25 s/張, 3 d 完成計算。通過人工智能方式,單張識別速度提升近100 倍,總體識別速度提升500 倍。
基于目前較為成熟的圖像識別算法,以接觸網(wǎng)懸掛狀態(tài)及缺陷為對象,闡述圖像識別技術(shù)在高速鐵路基礎設施檢測方面的應用。結(jié)果表明:圖像識別技術(shù)在高速鐵路基礎設施智能化檢測方面具有一定的普適性,能夠創(chuàng)造大量的虛擬勞動力,克服人工疏忽等主觀因素,工作效率有效提升。
人工智能技術(shù)是一項極為復雜的前沿技術(shù),需要開展更為細致、深入、系統(tǒng)的研究,不斷優(yōu)化完善相關(guān)模型。在后續(xù)研究中,準確性與時效性將是人工智能應用持續(xù)追求的目標。