馮慶勝,牛學慧
(大連交通大學 電氣信息工程學院,大連116028)
在高速列車運行中,受電弓拉弧存在會增大受電弓滑板和接觸網(wǎng)的損耗,影響列車穩(wěn)定運行,最終可能會影響整個列車安全運行狀態(tài)。因此,對受電弓拉弧的監(jiān)測是列車安全狀態(tài)監(jiān)測的重要部分。受電弓拉弧產(chǎn)生和消失的時機具有很大的隨機性,而且周圍的干擾環(huán)境比較復雜,所以弓網(wǎng)監(jiān)控數(shù)據(jù)圖像是否有拉弧比較困難。隨著高速鐵路供電安全檢測監(jiān)測(6C 系統(tǒng))系統(tǒng)的提出,越來越多學者開始關(guān)注受電弓拉弧檢測方面的研究。文獻[1]運用邊緣檢測、圖像自適應(yīng)閾值分割等方法對弓網(wǎng)拉弧強度檢測進行研究;文獻[2]結(jié)合圖像處理技術(shù)等算法,檢測出拉弧的位置;文獻[3]利用紫外輻射能來檢測受電弓拉弧的強度;文獻[4]以Haar 特征為基礎(chǔ)設(shè)計了一套受電弓視頻智能監(jiān)控算法;文獻[5-6]利用SSD 算法分別對航空發(fā)動機內(nèi)部缺陷和道路目標進行檢測與識別?,F(xiàn)有方法大多只采用傳統(tǒng)的圖像處理算法判斷運行狀態(tài)是否存在拉弧,弓網(wǎng)狀態(tài)檢測流程復雜,檢測速度慢,難以滿足高速列車受電弓拉弧實時檢測分析。近兩年卷積神經(jīng)網(wǎng)絡(luò)在目標檢測中取得的成績顯著,越來越多目標檢測算法應(yīng)用到高速鐵路系統(tǒng)故障檢測領(lǐng)域。針對現(xiàn)有弓網(wǎng)拉弧檢測存在的問題,本文將通過圖像處理算法與SSD目標檢測算法相結(jié)合,運用輕量級的MobileNet-SSD模型對受電弓拉弧圖像進行目標檢測,檢測精度高,硬件資源消耗低,檢測速度快,便于加載到列車車載設(shè)備中,能滿足現(xiàn)場受電弓拉弧在線檢測要求,受電弓拉弧檢測結(jié)構(gòu)如圖1所示。
圖1 SSD 受電弓拉弧檢測結(jié)構(gòu)圖Fig.1 SSD pantograph arc detection structure diagram
SSD(single shot multibox detector)目標檢測框架[7]是在ECCV2016 會議上提出的,通過把Faster R-CNN 的候選區(qū)域anchor 機制和YOLO 的回歸思想結(jié)合在一起得到的模型,其網(wǎng)絡(luò)模型檢測在目標檢測速度上比Faster R-CNN 快,在檢測精度上比YOLO 高,把兩者的優(yōu)點進行了比較好的結(jié)合。SSD把原始輸入圖像縮放為固定大小作為卷積神經(jīng)網(wǎng)絡(luò)模型的輸入,300×300 網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,其基礎(chǔ)網(wǎng)絡(luò)使用了VGG16 網(wǎng)絡(luò)結(jié)構(gòu)。SSD 把VGG16 全連接方式的2 個網(wǎng)絡(luò)層的FC6 層、FC7 層改為卷積層,然后繼續(xù)添加若干卷積層直到Conv10_2 層,最后接一個Pooling 層。當定義完網(wǎng)絡(luò)結(jié)構(gòu)后,SSD 網(wǎng)絡(luò)采用了特征金字塔結(jié)構(gòu)對物體進行回歸檢測,及檢測時會利用多個不同卷積層產(chǎn)生的特征圖,提取特征層作為Detection 層的輸入。在不同尺寸的特征圖上產(chǎn)生多個Prior box,假設(shè)特征圖大小為m×m,一張?zhí)卣鲌D上產(chǎn)生了k 個Prior box,一個Prior box對應(yīng)產(chǎn)生c 個分類和4 個邊框信息。
圖2 SSD 網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 SSD network structure diagram
當SSD 網(wǎng)絡(luò)模型對數(shù)據(jù)集進行回歸訓練,是同時對目標的種類和目標位置進行訓練的。在整個訓練過程中也會產(chǎn)生損失量,其網(wǎng)絡(luò)模型的總目標損失函數(shù)是由置信損失函數(shù)(conf)和位置損失函數(shù)(loc)組成,其兩者的加權(quán)求和得到式(1)為
式中:x 參數(shù)表示實際檢測框和默認框是否匹配成功;參數(shù)α 用來平衡置信損失和位置損失;c 是分類置信度;l 代表預(yù)測框;g 代表真實標簽框;N 是與該類別的校準框匹配的默認框數(shù)量。
MobileNet 網(wǎng)絡(luò)[8]是一個典型的輕量級網(wǎng)絡(luò),它將傳統(tǒng)的標準卷積分解為兩部分,包括深度卷積和點向卷積。深度卷積對輸入的特征圖產(chǎn)生單一的輸出,然后使用點向卷積大小為1×1 的卷積核與輸入的特征圖進行卷積運算,最后產(chǎn)生深度層的輸出,卷積網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 卷積網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.3 Convolutional network structure diagram
傳統(tǒng)標準卷積被分解為深度卷積和點向卷積,計算量如公式(2)所示,如果按照3×3 的卷積核進行計算量的計算,通過公式計算可得MobileNet 網(wǎng)絡(luò)計算量減小了8~9 倍。由于網(wǎng)絡(luò)計算量小,模型的尺寸小,所以檢測模型網(wǎng)絡(luò)對硬件系統(tǒng)要求比較低,方便在移動設(shè)備上應(yīng)用。
當前卷積神經(jīng)網(wǎng)絡(luò)計算量大,越來越復雜,把卷積神經(jīng)網(wǎng)絡(luò)加載到移動車載設(shè)備中去,則對硬件設(shè)備有很高的要求。結(jié)合受電弓拉弧檢測模型應(yīng)用場景,選擇一個比較輕量化的模型,便于加載到列車上是很有必要的。MobileNet-SSD[9]模型如圖4所示,將MobileNet 網(wǎng)絡(luò)與SSD 基本模型組合,通過卷積分解操作計算輸出,模型計算量和參數(shù)量大大減少,模型的尺寸也縮小了。本網(wǎng)絡(luò)模型包含了MobileNet 占用空間小的優(yōu)勢,又包含了SSD 速度快的優(yōu)點。
圖4 MobileNet-SSD 網(wǎng)絡(luò)模型Fig.4 MobileNet-SSD network model
本文受電弓拉弧檢測所用的圖片數(shù)據(jù)集全部提取于攝像頭監(jiān)控的視頻,該攝像頭安裝在受電弓的前方。共提取了受電弓圖片6000 張,其中包含沒有受電弓拉弧5000 張和存在受電弓拉弧1000 張。弓網(wǎng)圖像隨機抽取測試圖像1200 張,訓練圖像4800 張。為了保證在不同的環(huán)境下都能對受電弓拉弧準確的檢測,提高模型的魯棒性和檢測精度,對檢測模型訓練集和測試集都做了圖像預(yù)處理[10]操作。圖像處理后手動運用LabelImg 標注工具對樣本進行標注,標注是框出受電弓拉弧所產(chǎn)生的位置,并制作成數(shù)據(jù)集。在對弓網(wǎng)數(shù)據(jù)進行訓練模型時,如果受電弓沒有產(chǎn)生拉弧,則標為normal 正常;如果存在拉弧,則標為abnormal 異常。
由于天氣、機器抖動、隧道燈光、電磁干擾等原因容易產(chǎn)生干擾噪聲,影響目標檢測的檢測精度。因此,在訓練集中加入強光、旋轉(zhuǎn)、暗光、模糊噪聲、椒鹽噪聲等,來模擬列車受電弓運行在不同環(huán)境中和受到的各種干擾如圖5所示。通過使用圖像處理后擴充的數(shù)據(jù)集訓練模型,可增強受電弓拉弧檢測模型的魯棒性。
圖5 圖像處理后結(jié)果Fig.5 Results of image processing
目前大部分圖像在濾波之前,都需要先將圖像灰度化,然后再運用各種濾波算法進行圖像濾波分析。但是弓網(wǎng)灰度化之后會導致部分顏色信息丟失,影響后續(xù)的受電弓拉弧目標檢測。本文為了保留圖像的彩色信息,采用彩色圖像空間平滑濾波和銳化方法對待測數(shù)集集進行預(yù)處理,以此來減小圖像噪聲,增強檢測圖像目標的特征信息,提高受電弓拉弧檢測平均精度。
本文處理弓網(wǎng)彩色圖像時用空間掩模平滑,圖像處理時用處理灰度圖像的相同方法來表達,只是替代單個像素。令Sxy表示彩色圖像中以(x,y)為中心的鄰域中的一組坐標。在該鄰域中,向量的平均值為
式中:K 是鄰域中像素的數(shù)量,附加的向量特性為
當平滑弓網(wǎng)彩色圖像時,線性空間濾波一般包括3 個步驟,首先是抽取3 個分量圖像;然后分別過濾每個分量圖像;最后重建濾波過的弓網(wǎng)圖像。本文弓網(wǎng)圖像使用的是拉普拉斯算子。通過向量分析,1 個向量Laplace 算子定義為1 個向量,其分量等于輸入向量的標量分量的Laplace 算子。
在RGB 彩色制式中,向量c 的Laplace 算子為
式(5)可以看出,彩色圖像的拉普拉斯算子可以由每個分量圖像的拉普拉斯算子計算得出。拉普拉斯銳化原理是某像素與它所在的領(lǐng)域內(nèi)的像素的平均灰度作比較,當區(qū)域內(nèi)中心像素灰度高于或低于其他像素平均灰度時,其區(qū)域內(nèi)的中心像素灰度會提高或降低處理,這就是圖像的銳化處理。數(shù)據(jù)圖像平滑濾波、銳化后的結(jié)果如圖6所示。
圖6 平滑濾波和銳化后結(jié)果Fig.6 Smoothing filtering and sharpening results
本文受電弓拉弧檢測實驗的仿真環(huán)境參數(shù)如表1所示。
表1 仿真設(shè)備環(huán)境參數(shù)Tab.1 Simulation equipment environmental parameters
本文使用平均精度均值mAP(mean average precision)作為受電弓拉弧目標檢測中衡量檢測性能的指標。平均精度均值是多個類別平均精度的均值,Precision、Recall、AP 計算公式如下:
受電弓拉弧檢測性能的評價,不僅需要較高的檢測精度,還需要較高的檢測速度,這樣才能在大量的數(shù)據(jù)集中快速檢測出弓網(wǎng)狀態(tài)是否存在拉弧。本實驗采用FPS(每秒幀率)用于評價受電弓拉弧的檢測速度。
SSD 算法模型對受電弓拉弧檢測性能無論是檢測精度還是檢測速度都有一定的改善,尤其是檢測速度得到了很大的提升。通過測試可以看出改進SSD 算法模型可以準確地定位出目標的位置。本文實驗的結(jié)果分為正常無拉弧和異常有拉弧2 類。每次實驗網(wǎng)絡(luò)模型訓練將迭代100000 次,設(shè)置初始學習率為0.0002。本文做了2 個對比實驗,一是在測試圖像沒有進行預(yù)處理的情況下,不同目標檢測算法之間的檢測性能對比;二是用本文SSD 目標檢測模型分析對比測試圖像預(yù)處理和預(yù)處理的目標檢測性能。
本次實驗在只對訓練集圖像進行加噪等預(yù)處理,擴充了數(shù)據(jù)集,對測試目標圖像集未使用圖像預(yù)處理的情況下,F(xiàn)aster R-CNN、SSD、YOLO 和本文改進SSD 對受電弓拉弧檢測性能對比如表2所示。
表2 不同算法檢測性能的對比Tab.2 Comparison of detection performance of different algorithms
在相同的數(shù)據(jù)集和訓練迭代次數(shù)下運用不同的網(wǎng)絡(luò)模型進行比較。從表2 中可以看出,F(xiàn)aster R-CNN 平均精度均值mAP 為81.14%,高于SSD、YOLO 及本文算法的檢測精度,但FPS 太低。相比于其他3 種檢測算法,YOLO 算法檢測精度mAP 最低。本文改進SSD 算法的mAP 為81.29%,相比于原始SSD 和YOLO 的檢測精度mAP 相差不大,但是相比較其他3 種算法圖像傳輸速率FPS 方面有了很大的提升,F(xiàn)PS 提升為45 幀/s,該算法在拉弧實時檢測方面具有很大的速度優(yōu)勢。通過運用本文SSD 算法對受電弓拉弧進行檢測,當檢測結(jié)果正常受電弓沒有拉弧時,檢測結(jié)果為normal。當檢測異常受電弓有拉弧時,檢測結(jié)果為abnormal,圖像檢測結(jié)果如圖7所示。
圖7 圖像檢測結(jié)果Fig.7 Image inspection result
本次實驗通過彩色圖像平滑和銳化相結(jié)合,對待檢測的受電弓拉弧數(shù)據(jù)集進行預(yù)處理,并且使用了上節(jié)本文改進的SSD 算法。圖像處理后的檢測結(jié)果如表3所示,可以看出當弓網(wǎng)數(shù)據(jù)集結(jié)合圖像預(yù)處理的方法,確實能夠提高改進SSD 算法的檢測精度,當測試集通過平滑加銳化處理后經(jīng)過訓練,平均檢測精度mAP 提高了2.46%。由此可知,數(shù)據(jù)集中由于各種原因確實存在許多噪聲,這些噪聲干擾目標檢測的結(jié)果,將圖像預(yù)處理適當?shù)慕Y(jié)合可以提高算法的檢測效果。從而驗證了數(shù)據(jù)集通過彩色圖像平滑加銳化的方法,保留了原圖彩色信息,增強了特征信息,可以提高受電弓拉弧的檢測精度。
表3 圖像處理后檢測結(jié)果對比Tab.3 Comparison of test results after image processing
實驗結(jié)果表明,SSD 算法模型通過將基礎(chǔ)網(wǎng)絡(luò)替換為MobileNet 網(wǎng)絡(luò),提高了對受電弓拉弧圖像檢測速度和精度,再結(jié)合彩色圖像平滑濾波和拉普拉斯銳化,進一步提高了目標圖像的檢測精度,并且提高了對復雜環(huán)境不同光照干擾下的魯棒性和泛化能力。
本文針對復雜環(huán)境下受電弓拉弧在線檢測難的問題,首先通過采用幾種深度學習檢測算法模型對受電弓拉弧檢測比較分析,得出利用改進SSD 算法對受電弓拉弧的檢測精度高,計算量小,并且檢測速度快;然后通過對測試數(shù)據(jù)圖像進行平滑濾波加銳化預(yù)處理,結(jié)果顯示對待檢測數(shù)據(jù)預(yù)處理可以提高檢測精度。本文實驗結(jié)果驗證了圖像處理與深度學習相結(jié)合的受電弓拉弧檢測模型有效性,檢測速度快,計算量小,便于加載到列車中應(yīng)用,同時具有一定的魯棒性和實用性,為今后高速列車弓網(wǎng)拉弧狀態(tài)弧檢測提供了新思路。