韋春桃,朱旭陽,張冬梅
(重慶交通大學(xué) 土木工程學(xué)院,重慶 400074)
20世紀(jì)中葉以來,隨著橋梁建設(shè)的規(guī)模越來越大,對(duì)橋梁的安全性、耐久性進(jìn)行周期性檢測(cè)顯得尤為關(guān)鍵[1]。橋梁裂縫的出現(xiàn)會(huì)造成橋梁結(jié)構(gòu)承載能力下降,引發(fā)諸多橋梁病害。因此,橋梁裂縫檢測(cè)已成為橋梁養(yǎng)護(hù)的重要研究課題之一。
隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,基于圖像的無損檢測(cè)技術(shù)已經(jīng)成為國(guó)內(nèi)外橋梁裂縫檢測(cè)的研究熱點(diǎn)。常用的數(shù)字圖像處理方法有最小代價(jià)路徑搜索法[2]、三維多特征檢驗(yàn)法[3]、K-means聚類分割法[4]等。上述方法能彌補(bǔ)傳統(tǒng)人工檢測(cè)主觀性強(qiáng)、勞動(dòng)密度大的缺點(diǎn)[5],但需要人工設(shè)計(jì)特征,模型泛化性能不佳。
深度學(xué)習(xí)的興起進(jìn)一步推進(jìn)了橋梁裂縫無損檢測(cè)技術(shù)的發(fā)展。蔡逢煌等[6]提出基于YOLOv3的橋梁表面裂痕檢測(cè)算法。吳向東等[7]提出基于神經(jīng)網(wǎng)絡(luò)與條件隨機(jī)場(chǎng)的裂縫檢測(cè)算法。近年來,許多優(yōu)秀的目標(biāo)檢測(cè)模型[8-10]在實(shí)際場(chǎng)景的應(yīng)用中取得了良好的效果,但是橋梁裂縫圖像紋理復(fù)雜多樣、分布無規(guī)律,目標(biāo)檢測(cè)模型的先驗(yàn)框選取策略無法滿足所有裂縫圖像的尺寸要求,導(dǎo)致檢測(cè)結(jié)果存在嚴(yán)重的漏檢和誤檢現(xiàn)象,并且此類模型的參數(shù)量巨大難以部署到移動(dòng)設(shè)備中,不利于實(shí)際的工程應(yīng)用。
針對(duì)上述問題,本文設(shè)計(jì)了一種基于深度分類的輕量級(jí)格網(wǎng)橋梁裂縫檢測(cè)技術(shù)。通過格網(wǎng)化處理方法配合深度分類模型實(shí)現(xiàn)對(duì)橋梁裂縫圖像的高精度檢測(cè)。采用全局平均池化與基于批歸一化層的通道減枝技術(shù)對(duì)深度分類模型進(jìn)行輕量化改進(jìn),為基于深度學(xué)習(xí)的橋梁裂縫檢測(cè)系統(tǒng)進(jìn)行邊緣部署提供了思路。
當(dāng)前主流的目標(biāo)檢測(cè)模型,均采用預(yù)先設(shè)定先驗(yàn)框的方法對(duì)目標(biāo)進(jìn)行識(shí)別檢測(cè),該方法應(yīng)用于一般場(chǎng)景的目標(biāo)檢測(cè)任務(wù)時(shí)具有良好的檢測(cè)效果。但是,如圖1所示,不同于一般檢測(cè)目標(biāo),橋梁裂縫圖像紋理復(fù)雜多樣,分布無規(guī)律,通過設(shè)定有限個(gè)先驗(yàn)框尺寸無法較好包含所有的橋梁裂縫目標(biāo),雖然預(yù)測(cè)框會(huì)根據(jù)損失函數(shù)進(jìn)行調(diào)整,但是仍然會(huì)存在嚴(yán)重的漏檢和誤檢現(xiàn)象。
圖1 橋梁裂縫圖像、先驗(yàn)框設(shè)定以及目標(biāo)檢測(cè)模型的檢測(cè)效果
文獻(xiàn)[11]的研究表明,橋梁裂縫圖像局部的語義信息不會(huì)因?yàn)閳D像被分割而發(fā)生改變,分割后每個(gè)含有裂縫的子圖像中依然保留有原始且完整的裂縫語義信息,能夠被深度學(xué)習(xí)模型學(xué)習(xí)與識(shí)別。根據(jù)這一特點(diǎn),本文設(shè)計(jì)了格網(wǎng)化處理方法,通過將裂縫圖像劃分到大小相同的網(wǎng)格內(nèi),規(guī)范圖像中橋梁裂縫的位置分布,以此來解決目標(biāo)檢測(cè)模型應(yīng)用于橋梁裂縫檢測(cè)時(shí)存在的漏檢和誤檢問題。
格網(wǎng)化處理方法,首先對(duì)原始圖像進(jìn)行重采樣,將原始圖像變換為長(zhǎng)寬相等的圖像,以便于劃分的格網(wǎng)能夠完整包含整幅圖像。然后,將變換后圖像劃分為n×n長(zhǎng)寬相等的網(wǎng)格,并賦予每一網(wǎng)格位置信息Pij,其中i,j分別為網(wǎng)格的橫向坐標(biāo),縱向坐標(biāo) (i,j∈n,n∈N*), 規(guī)范橋梁裂縫在圖像中的位置分布。最后,將格網(wǎng)化后的圖像輸入分類模型,對(duì)識(shí)別為裂縫圖像的網(wǎng)格根據(jù)位置信息進(jìn)行標(biāo)注實(shí)現(xiàn)對(duì)橋梁裂縫的檢測(cè)。
格網(wǎng)劃分在不同數(shù)據(jù)集中最優(yōu)的n取值可能不同,為了能夠客觀確定n的取值,使模型達(dá)到最佳的檢測(cè)效果,通過遍歷正整數(shù)區(qū)間選取最佳取值。由于n取值過小時(shí),無法區(qū)別裂縫區(qū)域與背景區(qū)域達(dá)到對(duì)裂縫位置的詳細(xì)定位。而n取值過大時(shí),會(huì)存在模型計(jì)算量過大的問題。故遍歷的正整數(shù)區(qū)間設(shè)置為(5≤n≤10)。在遍歷過程中引入準(zhǔn)確率Sn評(píng)價(jià)不同n取值時(shí)的模型性能來選擇最優(yōu)的n取值。準(zhǔn)確率Sn的表達(dá)式如式(1)所示
(1)
其中,n×n是格網(wǎng)化處理所劃分的網(wǎng)格個(gè)數(shù),n的取值范圍是 (5≤n≤10,n∈N*),T表示模型正確識(shí)別為裂縫圖像與背景圖像的個(gè)數(shù)。
本文結(jié)合1.1節(jié)所設(shè)計(jì)的格網(wǎng)化處理方法與深度分類模型提出了一種格網(wǎng)橋梁裂縫檢測(cè)技術(shù),具體實(shí)現(xiàn)流程如圖2所示。首先對(duì)輸入的原始圖像進(jìn)行格網(wǎng)化處理,劃分為n×n個(gè)邊長(zhǎng)相等的網(wǎng)格,規(guī)范裂縫圖像的位置分布并分配給每個(gè)網(wǎng)格位置信息。然后將分屬于不同網(wǎng)格的圖像輸入深度分類模型,通過卷積層、池化層以及非線性激活函數(shù)對(duì)輸入圖像進(jìn)行特征提取并根據(jù)提取得到的特征識(shí)別橋梁裂縫圖像與背景圖像。最后根據(jù)預(yù)先分配的位置信息將識(shí)別為裂縫的圖像在原始圖像中標(biāo)注出來實(shí)現(xiàn)橋梁裂縫檢測(cè)。
圖2 網(wǎng)格化橋梁裂縫檢測(cè)技術(shù)
圖3 VGG網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)分布
VGG網(wǎng)絡(luò)是牛津大學(xué)和谷歌共同開發(fā)的一種深度卷積神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)如圖3所示,由5個(gè)卷積模塊構(gòu)成,每個(gè)卷積模塊中包含了卷積層(convolutional layer,Conv)和最大池化層(maxpooling layer,MaxPool),最后連接三層全連接層(fully connected layer,F(xiàn)C)實(shí)現(xiàn)對(duì)目標(biāo)的識(shí)別分類。VGG模型在多個(gè)遷移學(xué)習(xí)任務(wù)中的表現(xiàn)要優(yōu)于GoogLeNet,擁有更好的魯棒性且模型結(jié)構(gòu)簡(jiǎn)單更適合部署于實(shí)際的工程項(xiàng)目中。相比于AlexNet,VGG模型采用多個(gè)3×3的卷積核代替AlexNet中較大卷積核(11×11,7×7,5×5),在保證具有相同感受野的條件下,減少模型參數(shù),提升網(wǎng)絡(luò)深度和識(shí)別精度[12]。基于上述原因,本文選擇VGG11模型作為分類模型,但是該模型不能直接應(yīng)用于實(shí)際的橋梁表面裂縫檢測(cè),主要原因是VGG11模型的參數(shù)量巨大,對(duì)硬件存儲(chǔ)空間的要求高,而實(shí)際的橋梁裂縫檢測(cè)工程大多需要將模型部署到邊緣計(jì)算設(shè)備、嵌入式設(shè)備、移動(dòng)設(shè)備等硬件資源受限的設(shè)備上。故本文通過分析VGG11模型的參數(shù)分布,使用全局平均池化和基于批歸一化層的通道剪枝技術(shù)對(duì)模型進(jìn)行輕量化改進(jìn)使模型更適合實(shí)際的工程應(yīng)用。
由圖3的VGG11網(wǎng)絡(luò)參數(shù)分布可知,模型的參數(shù)主要集中在全連接模塊(FC Block)的前兩層FC中,故使用全局平均池化(golbal average pooling,GAP)替換這兩層FC以減少模型參數(shù)。如圖4所示,不同于FC需要將當(dāng)前層的每一個(gè)節(jié)點(diǎn)與上一層的每個(gè)節(jié)點(diǎn)相連綜合前一層的特征,GAP將Conv輸出的特征圖以自身為單位進(jìn)行映射,映射結(jié)果為一個(gè)特征點(diǎn)。
假設(shè)最后一次卷積得到的特征圖大小為D×D×M,展開(Flatten)后便擁有D×D×M個(gè)節(jié)點(diǎn),其中D表示特征圖的長(zhǎng)和寬,M表示特征圖的通道數(shù),當(dāng)前全連接層有N個(gè)節(jié)點(diǎn)時(shí),F(xiàn)C的參數(shù)量為D×D×M×N。而GAP是以自身為單位進(jìn)行映射,故不需要計(jì)入?yún)?shù)量可以起到大幅減少參數(shù)量的目的,并且保留了原有的語義信息可以保證模型的正確識(shí)別。
圖4 全連接層(左),全局平均池化(右)
本文只需對(duì)橋梁裂縫和背景區(qū)域兩種類別進(jìn)行分類,故模型在應(yīng)用過程中,會(huì)存在大量參數(shù)冗余。通道剪枝是一種有效的模型壓縮方法,通過對(duì)不重要的神經(jīng)元、濾波器或者通道進(jìn)行剪枝,有效壓縮模型的參數(shù)量和計(jì)算量。因而本文采用通道剪枝技術(shù)對(duì)模型進(jìn)行輕量化改進(jìn)。該方法主要包含3個(gè)步驟:①對(duì)模型進(jìn)行稀疏訓(xùn)練,獲得權(quán)值稀疏的神經(jīng)網(wǎng)絡(luò)模型;②根據(jù)權(quán)值重要性對(duì)模型進(jìn)行剪枝,剔除權(quán)值重要性程度低的通道;③微調(diào)剪枝后模型恢復(fù)模型分類精度[13]。
2.2.1 稀疏化訓(xùn)練
對(duì)模型進(jìn)行剪枝操作前,需要通過稀疏化訓(xùn)練使網(wǎng)絡(luò)中作為重要性指標(biāo)的參數(shù)在訓(xùn)練后趨向于0或者等于0,增大重要性指標(biāo)之間的差異性,以便于模型剪枝時(shí)對(duì)卷積通道的篩選。
傳統(tǒng)剪枝算法僅依靠參數(shù)自身的信息,難以客觀判斷其重要性,容易造成參數(shù)誤剪,影響模型性能。批歸一化(batch normalization,BN)可以將輸入數(shù)據(jù)的分布情況統(tǒng)一為均值為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布,加速網(wǎng)絡(luò)收斂和改進(jìn)模型泛化性能,其中的縮放因子更是額外引入的可學(xué)習(xí)變量能夠作為重要性指標(biāo)客觀評(píng)價(jià)通道的重要性程度[14],故在VGG11模型的每一層Conv后添加一層BN層,并將其中的縮放因子作為通道重要性指標(biāo)衡量卷積通道的重要性。BN層的計(jì)算公式如式(2)所示
(2)
(3)
在訓(xùn)練期間,通過在損失函數(shù)L中增加一個(gè)關(guān)于γ(k)的L1正則項(xiàng),對(duì)模型進(jìn)行稀疏化。引入正則化系數(shù)S增大縮放因子γ(k)之間的差異性,以便更好篩選出重要性較低的通道進(jìn)行剪枝處理。損失函數(shù)公式如式(4)所示
(4)
g(γ)=|γ|
(5)
其中,x,y表示訓(xùn)練數(shù)據(jù)和標(biāo)簽,W表示模型權(quán)重,S表示正則化系數(shù),S越大約束力度越大,g(γ) 表示對(duì)縮放因子γ(k)進(jìn)行L1正則化處理,計(jì)算過程如式(5)所示。
2.2.2 剪枝與微調(diào)
如圖5所示,在完成稀疏訓(xùn)練之后,BN層中的縮放因子分布差異明顯,重要性程度低的通道縮放因子趨近于0。通過設(shè)定全局閾值th對(duì)縮放因子小于該值的通道進(jìn)行剪枝,th=sortp(N), 其中sortp(.)表示對(duì)集合N中的元素進(jìn)行排序并取P位置的數(shù)值,P表示需要剪枝的通道數(shù)的百分比,N表示所有縮放因子γ的集合 {γ(1),γ(2),…,γ(k)}。
圖5 基于BN層的通道剪枝
最后,將剪枝后的模型進(jìn)行微調(diào)再訓(xùn)練,恢復(fù)模型準(zhǔn)確率。
本文數(shù)據(jù)集由大疆精靈4自帶的相機(jī)在重慶馬桑溪長(zhǎng)江大橋采集,控制無人機(jī)在橋梁裂縫的附近懸停,調(diào)整相機(jī)鏡頭與橋梁裂縫表面平行,并懸停于橋梁裂縫表面30 cm,讓無人機(jī)沿裂縫方向平穩(wěn)飛行,連續(xù)拍照。通過上述方法得到500張高分辨率橋梁裂縫圖像,然后通過滑動(dòng)窗口法[15]分割采集到的數(shù)據(jù)集得到10 000張裂縫圖像作為原始數(shù)據(jù)集。分別使用圖像標(biāo)注工具Labelimg對(duì)原始數(shù)據(jù)集進(jìn)行人工標(biāo)注作為目標(biāo)檢測(cè)模型訓(xùn)練和測(cè)試的數(shù)據(jù)集;按數(shù)據(jù)集圖像中是否含有裂縫圖像劃分為裂縫圖像和背景圖像作為分類模型的數(shù)據(jù)集。圖6為橋梁裂縫數(shù)據(jù)集的部分樣本圖像及無人機(jī)圖像。
圖6 橋梁裂縫數(shù)據(jù)集的部分樣本圖像及無人機(jī)圖像
實(shí)驗(yàn)的硬件環(huán)境為:Intel Core i7-9750 h CPU,NVIDIA GeForce GTX 1660Ti GPU;軟件環(huán)境為:Windows 10操作系統(tǒng),CUDA 10.0,cuDNN 7.6.4,Visual Studio 2019,OpenCV 3.4,python 3.6.5,pytorch 1.7.1。
本實(shí)驗(yàn)研究基于深度分類的輕量級(jí)格網(wǎng)橋梁裂縫檢測(cè)技術(shù)的優(yōu)越性。采用精確度P、召回率R、F1得分以及模型參數(shù)量等多個(gè)指標(biāo)進(jìn)行衡量。精確度P和召回率R的計(jì)算公式如下
(6)
(7)
其中,TP表示正確識(shí)別出正確樣本的個(gè)數(shù),F(xiàn)P表示將錯(cuò)誤的樣本識(shí)別為正確樣本的個(gè)數(shù),F(xiàn)N表示將正確的樣本識(shí)別為錯(cuò)誤樣本的個(gè)數(shù)。
為了全面評(píng)估模型,本文綜合精確度和召回率使用F1得分對(duì)模型進(jìn)行更加客觀的評(píng)價(jià)。F1得分計(jì)算公式如下
(8)
將VGG11模型最后FC Block中的前兩層FC替換為GAP,設(shè)置初始學(xué)習(xí)率為0.0002,訓(xùn)練和測(cè)試時(shí)每個(gè)批次中訓(xùn)練樣本的數(shù)量(Batch size)為32,使用Adam優(yōu)化器,迭代次數(shù)(Epoch)設(shè)置為50。在此條件下分別訓(xùn)練原始VGG11模型和改進(jìn)后模型VGG-GAP。在精確度,模型參數(shù)量?jī)蓚€(gè)方面進(jìn)行對(duì)比。結(jié)果見表1,將模型的FC替換為GAP后,模型參數(shù)量得到大幅縮減,為原始模型的15%。在識(shí)別精確度方面,比原始模型提升了0.3%,這說明GAP在減少模型參數(shù)量的同時(shí)可以在一定程度上抑制模型的過擬合,提高了模型的準(zhǔn)確率和魯棒性。
表1 全局平均池化對(duì)模型性能的影響
本文采用基于BN層的剪枝技術(shù)壓縮模型。該技術(shù)主要分為3個(gè)步驟:①利用L1正則化對(duì)模型進(jìn)行稀疏訓(xùn)練,獲得權(quán)值稀疏的神經(jīng)網(wǎng)絡(luò)模型;②將BN層中的縮放因子γ作為衡量卷積通道重要性的指標(biāo)對(duì)模型進(jìn)行剪枝,剔除重要性程度低的通道;③微調(diào)剪枝后模型恢復(fù)模型精度。其中正則化系數(shù)S和剪枝率(Percent)是影響剪枝結(jié)果的兩個(gè)重要因素。故對(duì)這兩個(gè)參數(shù)的設(shè)置進(jìn)行實(shí)驗(yàn),分別研究不同正則化系數(shù)、不同剪枝率對(duì)模型性能的影響,選取最佳參數(shù)構(gòu)建模型。
3.4.1 不同正則化系數(shù)對(duì)模型影響
在模型訓(xùn)練過程中,正則化系數(shù)S會(huì)影響對(duì)縮放因子的約束力度,會(huì)給模型訓(xùn)練的結(jié)果帶來不同程度的影響。為考察其影響程度,本實(shí)驗(yàn)在不同正則化系數(shù)下對(duì)模型進(jìn)行訓(xùn)練。
設(shè)置正則化系數(shù)S分別為:0、0.001、0.0001、0.000 01,對(duì)模型的損失函數(shù)和精確度的變化情況進(jìn)行統(tǒng)計(jì),設(shè)置初始學(xué)習(xí)率為0.0002,迭代次數(shù)(Epoch)設(shè)置為50。實(shí)驗(yàn)結(jié)果如圖7所示,當(dāng)正則化系數(shù)S為0.001時(shí),訓(xùn)練結(jié)束后模型精確度比其它條件下低了3個(gè)百分點(diǎn),模型的損失函數(shù)波動(dòng)巨大,收斂速度緩慢,收斂后比其它條件下的損失函數(shù)高了0.05。由此可得,正則化系數(shù)S過高時(shí),對(duì)縮放因子γ約束過大,不利于模型的訓(xùn)練導(dǎo)致模型的精確度下降,訓(xùn)練收斂后損失函數(shù)變大。在正則化系數(shù)S設(shè)置為0.0001和0.000 01時(shí),模型性能與正常訓(xùn)練時(shí)效果相近,故在保證性能相近和縮放因子(γ)分布稀疏化明顯的情況下,選擇正則化系數(shù)S為0.0001對(duì)模型進(jìn)行稀疏化訓(xùn)練。
圖7 不同正則化系數(shù)對(duì)模型性能的影響
3.4.2 不同剪枝率對(duì)模型影響
在正則化系數(shù)S為0.0001的條件下,本實(shí)驗(yàn)設(shè)置0~90%十組不同剪枝率對(duì)經(jīng)過稀疏化訓(xùn)練后得到的模型進(jìn)行剪枝處理,研究不同剪枝率情況下的模型性能以選取減枝效果最佳的剪枝率。實(shí)驗(yàn)結(jié)果見表2,隨著剪枝率的提升,模型的參數(shù)量得到有效的縮減。甚至在剪枝率為20%~40%時(shí),由于模型參數(shù)量減少,抑制模型過擬合,微調(diào)再訓(xùn)練后的模型精度超過了未剪枝的模型。當(dāng)剪枝率設(shè)置為90%時(shí),模型參數(shù)量?jī)H有0.34 MB,遠(yuǎn)小于原始模型,模型識(shí)別的精確度卻僅比原始模型降低了0.47%仍然可以滿足對(duì)橋梁裂縫的高精度識(shí)別。綜合考慮模型參數(shù)量和模型精確度,最終選用剪枝率為90%對(duì)模型進(jìn)行減枝。
表2 不同剪枝率下模型的測(cè)試結(jié)果
為了驗(yàn)證基于卷積神經(jīng)網(wǎng)絡(luò)的輕量級(jí)格網(wǎng)橋梁裂縫檢測(cè)技術(shù)的優(yōu)越性,使用改進(jìn)后的輕量級(jí)格網(wǎng)化橋梁裂縫檢測(cè)模型(M_model)與兩階段目標(biāo)檢測(cè)模型Faster rcnn,單階段目標(biāo)檢測(cè)模型YOLOv4以及基于原始VGG11的格網(wǎng)化橋梁裂縫檢測(cè)模型(M_model-VGG11),在橋梁裂縫檢測(cè)應(yīng)用中的檢測(cè)效果進(jìn)行對(duì)比測(cè)試。分別使用預(yù)先標(biāo)注的目標(biāo)檢測(cè)數(shù)據(jù)集和目標(biāo)分類數(shù)據(jù)集對(duì)目標(biāo)檢測(cè)模型和本文方法進(jìn)行訓(xùn)練。訓(xùn)練時(shí),迭代次數(shù)設(shè)置為50,初始學(xué)習(xí)率設(shè)置為0.0002。使用本文方法時(shí),考慮到雖然格網(wǎng)化處理方法劃分的n取值越大劃分的結(jié)果越詳細(xì)但是網(wǎng)格內(nèi)的裂縫圖像包含的特征越少會(huì)影響模型的精確度并且會(huì)增大計(jì)算量,而n的取值過小時(shí),無法較好的區(qū)別裂縫區(qū)域與背景區(qū)域達(dá)到對(duì)裂縫位置詳細(xì)定位的效果,綜合考慮這兩個(gè)因素并結(jié)合1.1節(jié)中的評(píng)價(jià)標(biāo)準(zhǔn),設(shè)置M_model 中的n取值為10進(jìn)行實(shí)驗(yàn)。訓(xùn)練完成后各模型測(cè)試后的性能統(tǒng)計(jì)結(jié)果見表3。
表3 不同模型的橋梁裂縫檢測(cè)效果對(duì)比
由表3可知,本文方法精確度P和召回率R的綜合評(píng)價(jià)指標(biāo)F1得分達(dá)到了0.97,比Faster rcnn模型提高了0.3,更是比YOLOv4模型提高了0.51。在模型參數(shù)量方面,相比于原始模型M_model-VGG11的255 MB,F(xiàn)aster rcnn的523 MB以及YOLOv4的244 MB,本文所用模型僅有0.34 MB遠(yuǎn)小于上述所有模型。由此可得,本文所提方法在橋梁裂縫檢測(cè)場(chǎng)景任務(wù)中檢測(cè)精度更高,模型參數(shù)量更小。
結(jié)合圖8的檢測(cè)效果圖做進(jìn)一步分析可知,單階段目標(biāo)檢測(cè)模型YOLOv4在應(yīng)用于橋梁裂縫檢測(cè)時(shí)雖然檢測(cè)的精確度較高,檢測(cè)出的裂縫位置基本正確,但是由于先驗(yàn)框選取策略不適用于紋理復(fù)雜,分布無規(guī)律的橋梁裂縫檢測(cè)場(chǎng)景,所以存在有嚴(yán)重的裂縫目標(biāo)漏檢現(xiàn)象。兩階段目標(biāo)檢測(cè)模型Faster rcnn將檢測(cè)過程分為兩部分,首先通過區(qū)域生成網(wǎng)絡(luò)(region proposal network,RPN)生成大量的先驗(yàn)框(Anchor box),然后對(duì)先驗(yàn)框位置區(qū)域進(jìn)行調(diào)整與分類。這一過程雖然有效提高了模型應(yīng)用于橋梁裂縫檢測(cè)時(shí)的召回率,能夠檢測(cè)出圖像中大部分的裂縫區(qū)域,但是仍然存在少部分裂縫目標(biāo)漏檢的現(xiàn)象,且在第一張效果圖中錯(cuò)誤的將積灰區(qū)域誤檢為裂縫區(qū)域。結(jié)合格網(wǎng)化處理的深度分類模型M_model-VGG11能夠正確、完整檢測(cè)出所有橋梁裂縫圖像中的裂縫區(qū)域且檢測(cè)結(jié)果更加詳細(xì),標(biāo)注框定更加規(guī)范。本文所用模型M_model的檢測(cè)效果與M_model-VGG11基本相同。綜上所述,本文設(shè)計(jì)的基于深度分類的輕量級(jí)格網(wǎng)橋梁裂縫檢測(cè)技術(shù)在橋梁裂縫檢測(cè)場(chǎng)景中擁有良好的檢測(cè)效果,為基于深度學(xué)習(xí)的橋梁裂縫檢測(cè)系統(tǒng)進(jìn)行邊緣部署提供了思路。
圖8 不同模型的橋梁裂縫檢測(cè)效果可視化
本文提出了一種基于深度學(xué)習(xí)的輕量級(jí)格網(wǎng)橋梁裂縫檢測(cè)技術(shù)。根據(jù)橋梁裂縫圖像的圖像特征,設(shè)計(jì)格網(wǎng)化處理方法,規(guī)范橋梁裂縫在圖像中的位置分布,結(jié)合高性能的深度分類模型實(shí)現(xiàn)對(duì)橋梁裂縫的高精度檢測(cè)。通過分析VGG11模型的參數(shù)量分布,使用GAP和基于BN層的通道剪枝對(duì)模型進(jìn)行輕量化改進(jìn),顯著減少了模型的參數(shù)量,為基于深度學(xué)習(xí)的橋梁裂縫檢測(cè)系統(tǒng)進(jìn)行邊緣部署提供了思路。實(shí)驗(yàn)結(jié)果表明,本文提出的裂縫檢測(cè)技術(shù)相較于Faster rcnn,YOLOv4的F1得分分別提高了0.3和0.53,改進(jìn)前后模型的參數(shù)量分別為247.2 MB和0.62 MB。