夏鯤
西安工程大學后勤管理處(集團) 陜西 西安 710048
我國公路總里程數(shù)約520萬公里,含公路隧道21316處、2199.93萬延米,傳統(tǒng)的人工病害檢測已不能滿足階段性的養(yǎng)護需求,但目前的自動化病害檢測仍然存在較大的缺陷,不能投入實際的隧道養(yǎng)護工作。針對上述問題,本研究采用HR-Net[1]的第一階段的特征提取網(wǎng)絡作為病害檢測網(wǎng)絡的主干分支,該種網(wǎng)絡結(jié)構(gòu)提取高分辨率的圖像特征并進行不同尺度特征交換與融合。但是原始的HR-Net參數(shù)數(shù)量較多,網(wǎng)絡運算量過大雖準確率較高但檢測效率不適用于本任務;實驗表明,本文提出的檢測網(wǎng)絡,檢測時間比原始HR-Net減少了25%,但是檢測準確率與mIoU等指標并沒有特別明顯的下降。
在隧道病害圖像中,病害像素的占比少于20%,較細微的裂縫僅占5%甚至更低[2],若使用常規(guī)的卷積神經(jīng)網(wǎng)絡檢測,病害特征通過連續(xù)多次的下采樣或者池化運算[3-4]會受到特征混淆,造成假陽性的檢測結(jié)果。
HR-Net是于cvpr2019年提出的全新的特征提取的骨架網(wǎng)絡,它不同于傳統(tǒng)的骨架網(wǎng)絡通過一支串聯(lián)的多個深度的卷積層和池化層特征流去提取高度抽象的語義特征,而是設計了四支并聯(lián)的由高到低不同分辨率的特征流去進行特征提取,其中的高分辨率(1/4輸入圖像尺寸)的特征流保留圖像的低層語義信息,網(wǎng)絡中其他三支融較低分辨率(1/8、1/16、1/32輸入圖像尺寸)的特征流依次提取不同尺度的高層語義信息。該設計解決了傳統(tǒng)骨架網(wǎng)絡再進行特征提取中由于多次的卷積或者池化運算會丟失低層次語義信息的問題,因為其內(nèi)部始終保留了一個較大分辨率的特征用來保存低層次語義信息同時融合了其他分支的高層次語義。該骨架網(wǎng)絡可以解決隧道病害檢測中的特征混淆造成的假陽性檢測結(jié)果。
本文設計的HR-Net(1se)網(wǎng)絡結(jié)構(gòu)如圖1所示,特征提取模塊為使用了1/4、1/8、1/16分支的HR-Net的第一個stage,為了更好地融合特征,同時提升特征的抽象性加入了SE[5]模塊進行特征增強,之后通過1×1的卷積模塊進行特征融合并對病害像素和背景像素進行分類,病害像素標記為1背景像素為0,分類結(jié)果即為病害檢測的輸出結(jié)果。
圖1 病害檢測網(wǎng)絡結(jié)構(gòu)圖
為了優(yōu)化特征融合,同時解決二分類像素樣本不均衡問題,本文在特征融合運算時加入了SE(squeezeandexcitation)模塊對病害特征進行增強,以提升病害特征的權(quán)重降低背景特征的權(quán)重。SE模塊由Hu等人提出,結(jié)構(gòu)如圖2所示,
圖2 SE-模塊結(jié)構(gòu)
特征X(H’×W’×C’)首先經(jīng)過Ftr卷積運算后轉(zhuǎn)換為特征U(H×W×C)通過壓縮運算Fsq將C個通道每一個大小為H×W特征通過平均池化運算壓縮成了C個1×1的特征通過激勵運算后得到每一個通道對應的權(quán)重,再將權(quán)重通過尺度變換賦予特征U形成帶有通道權(quán)重的特征X’,即對原特征X應用了通道注意力機制。
目前鮮有基于隧道檢測車所拍攝的隧道病害圖像的公開數(shù)據(jù)集。因此,本研究使用第三方的“LabelMe”標注軟件對采集到的隧道病害圖像進行標注并創(chuàng)建了實驗數(shù)據(jù)集。步驟如下,首先將隧道圖像分發(fā)給豐富經(jīng)驗的檢測人員進行病害初篩,然后由專門的標注人員將初篩后圖像中的病害在LabelMe中用接近病害寬度的畫筆進行描繪標注。由于數(shù)據(jù)集的圖像長度過長(4000×1000),為了保證訓練時提取的病害特征不產(chǎn)生幾何畸變,同時降低顯存的消耗,本研究將原始圖像裁剪至4×1000×1000。裁剪后的圖像數(shù)量為5120張,按照8:1:1的比例分別劃分為訓練集、驗證集以及測試集。
本研究提出隧道病害檢測網(wǎng)絡結(jié)構(gòu)基于PyTorch深度學習框架搭建,運行的軟、硬件環(huán)境為Ubuntu操作者系統(tǒng)、CPU:IntelXeon2.60GHz、內(nèi)存128G以及4張NVIDIARTX3080顯卡(顯存8G)。訓練的實驗參數(shù)設置如下,優(yōu)化器使用Adam,初始的學習率被設置為0.0001,batchsize根據(jù)圖像尺寸、模型尺寸與顯存大小,設置為16,迭代次數(shù)設置為30000次。
在結(jié)果評價中,本研究采用5 個指標,像素準確率(PA)、召回率(Recall)、平均交并比(mIoU)、Kappa以及單張推理時間(Time)。其中前4個反映了模型的檢測能力,第5個為檢測效率。
本文檢測目標為隧道內(nèi)的裂縫。圖像尺寸為1024×1000,在進入網(wǎng)絡訓練前會進行鏡像、多角度翻轉(zhuǎn)以及加入高斯白噪聲的數(shù)據(jù)增廣處理以擴充數(shù)據(jù)集。
從圖3中可以看到在第1行圖中4個算法都可以很好地完成裂縫檢測任務,并沒有將圖像中部的環(huán)向施工縫誤檢為病害。在第2行、第3行圖像中裂縫較細時,U-Net和DANet出現(xiàn)了漏檢,其中第2行圖像的Y型裂縫的連接處虛線標識框內(nèi)均出現(xiàn)了檢測出的裂縫斷開的情況。第3行圖像的中虛線框中也有類似的情況,特別在U-Net出現(xiàn)了3處漏檢。第4行圖像中,雖然裂縫都被各算法完整檢測,但在真實值虛線框中手工標注的裂縫是有一個細小的分叉點,本算法可獲取該病害細節(jié),但是U-Net和DANet均將分叉處背景檢測為裂縫,導致分叉被裂縫像素填充,造成了誤檢的情況。
圖3 各算法對隧道病害的檢測結(jié)果
檢測結(jié)果如表1所示,本研究算法和原型網(wǎng)絡HR-Net這類可保留高分辨率語義特征的語義分割網(wǎng)絡在隧道裂縫檢測的優(yōu)勢。其中HR-Net在除了推理時間的各項指標中均取得了最佳的得分,證明了高分辨率語義特征提取網(wǎng)絡在語義分割的任務中優(yōu)勢明顯。經(jīng)典的U-Net雖然分數(shù)最低,但是耗時是最少的,同時也具有可接受的準確率。HR-Net(1se)沒有超過HR-Net的分數(shù),但是其耗時比HR-Net減少了接近25%,也具有較高的檢測準確率,從表中數(shù)據(jù)可以體現(xiàn)本網(wǎng)絡具有較高的檢測效率。
表1 不同語義分割算法的比較
針對隧道裂縫檢測車圖像采集條件不理想造成特征混淆從而引起誤檢的問題,本研究提出了一種檢測網(wǎng)絡HR-Net(1se),對檢測車圖像中的隧道裂縫有較好的檢測效果。首先將HR-Net的特征提取網(wǎng)絡進行了精簡,留下了一個stage并保留三條特征提取分支;其次在網(wǎng)絡末端的,通過SE模塊,使用注意力機制去強化融合前各特征提取分支的輸出特征,以增強特征的抽象能力及降低數(shù)據(jù)分布不均衡的影響,使輸出的檢測結(jié)果可保留更多的病害細節(jié)特征。
通過在創(chuàng)建的隧道病害數(shù)據(jù)集上展開的對比實驗,結(jié)果表明HR-Net在兩類數(shù)據(jù)集上均取得到了最高的準確率(PA)與平均交并比mIoU,但是耗時也是最高的。本研究提出的算法在兩類驗證實驗中中PA比HR-Net僅低不超過1%,mIoU不超過1%,但耗時卻少了25%,同時其他指標遠高于其他兩個對比算法,證明該方法在隧道病害檢測中具有較高的效率。通過實驗可說明,本研究符合自動化檢測算法的精度要求,可適用于隧道養(yǎng)護的應用場景。