摘要:大型混凝土結(jié)構(gòu)的災(zāi)難性事故多由微小裂縫發(fā)展而成,在混凝土結(jié)構(gòu)服役期間對(duì)其進(jìn)行裂縫檢測(cè)十分重要。目前基于深度學(xué)習(xí)的混凝土裂縫無(wú)損檢測(cè)算法飛速發(fā)展,但大多未考慮裂縫信息的本身特點(diǎn),檢測(cè)的準(zhǔn)確性仍有進(jìn)一步提升空間。為此,提出了一種針對(duì)混凝土裂縫無(wú)損檢測(cè)的改進(jìn)ResNet方法,以殘差神經(jīng)網(wǎng)絡(luò)ResNet為裂縫檢測(cè)的基礎(chǔ)模型,插入注意力機(jī)制模塊,提高模型表征能力,使其能夠有效捕捉裂縫圖像中的重要特征信息,從而提高檢測(cè)的準(zhǔn)確性和魯棒性。同時(shí),采用遷移學(xué)習(xí)的策略,將ResNet模型在復(fù)雜數(shù)據(jù)集上的訓(xùn)練成果遷移到裂縫數(shù)據(jù)集,節(jié)約了訓(xùn)練時(shí)間和計(jì)算資源。結(jié)果表明:改進(jìn)后的ResNet算法的裂縫檢測(cè)準(zhǔn)確率高達(dá)98.80%,比原始ResNet算法準(zhǔn)確率提升了3.24%。相關(guān)經(jīng)驗(yàn)可供類(lèi)似改進(jìn)算法的構(gòu)建參考。
關(guān) 鍵 詞:混凝土裂縫; 裂縫檢測(cè); 殘差神經(jīng)網(wǎng)絡(luò); 注意力機(jī)制; 遷移學(xué)習(xí)
中圖法分類(lèi)號(hào): TV331;TP18;TP391.4
文獻(xiàn)標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2024.09.028
0 引 言
混凝土因其原材料豐富、施工簡(jiǎn)便、造價(jià)低等諸多優(yōu)點(diǎn)而被廣泛應(yīng)用于基礎(chǔ)建設(shè)中,但受疲勞應(yīng)力[1]、循環(huán)荷載[2]等因素的影響,混凝土表面極易產(chǎn)生裂縫。裂縫是混凝土結(jié)構(gòu)最常見(jiàn)的一種病害,其存在會(huì)嚴(yán)重影響建筑物的功能性、耐久性和安全性,更有甚者發(fā)生坍塌等災(zāi)難性事故[3-4],故裂縫檢測(cè)是混凝土結(jié)構(gòu)安全檢查的一項(xiàng)重要任務(wù)。
以往混凝土結(jié)構(gòu)的裂縫檢測(cè)主要依賴(lài)于人工,不僅費(fèi)時(shí)費(fèi)力,無(wú)法客觀評(píng)估裂縫發(fā)展?fàn)顩r,還會(huì)出現(xiàn)錯(cuò)檢漏檢的現(xiàn)象,所以,依賴(lài)于機(jī)器的裂縫檢測(cè)手段更受青睞。目前,依賴(lài)于機(jī)器的混凝土結(jié)構(gòu)裂縫檢測(cè)方法主要分為有損檢測(cè)和無(wú)損檢測(cè)兩大類(lèi)。有損檢測(cè)手段如振弦式傳感器、光纖光柵傳感器[5]等,需要預(yù)先確定開(kāi)裂測(cè)點(diǎn),且檢測(cè)面積不大,在實(shí)際應(yīng)用過(guò)程中已被逐步擯棄。無(wú)損檢測(cè)手段通過(guò)無(wú)人機(jī)[6-8]等圖像收集技術(shù)采集混凝土結(jié)構(gòu)的表面圖像,再利用數(shù)字圖像處理方法[9-12]或深度學(xué)習(xí)的方法進(jìn)行裂縫檢測(cè)。
有學(xué)者將Canny、Gabor算子等邊緣檢測(cè)算法應(yīng)用于裂縫識(shí)別中,通過(guò)調(diào)整閾值,成功識(shí)別圖像中的裂縫特征[13-15]。還有學(xué)者則采用濾波算法對(duì)裂縫圖像進(jìn)行去噪,進(jìn)一步結(jié)合圖像分割算法,獲取更加精細(xì)的裂縫參數(shù)[16]。通過(guò)調(diào)研發(fā)現(xiàn),上述算法多是針對(duì)某一具體檢測(cè)場(chǎng)景而設(shè)計(jì),人工干預(yù)較多,嚴(yán)重依賴(lài)工程師的知識(shí)儲(chǔ)備和調(diào)參經(jīng)驗(yàn),隨著工程場(chǎng)景越來(lái)越復(fù)雜多變,這類(lèi)方法的弊端也逐漸顯現(xiàn),魯棒性和泛化能力較差。
近年來(lái),得益于計(jì)算機(jī)算力和存儲(chǔ)空間的跨越式提升,基于深度學(xué)習(xí)的算法[17-22]被相繼提出。相較于傳統(tǒng)圖像處理算法,這類(lèi)算法無(wú)需手動(dòng)提取特征,且在性能和效果上有了巨大飛躍,但絕大部分研究都未考慮裂縫信息本身的特點(diǎn),從而導(dǎo)致識(shí)別效果未能繼續(xù)提升。因此,需要改進(jìn)深度卷積網(wǎng)絡(luò)的模型架構(gòu),使其關(guān)注裂縫圖像的重要特征,忽略不必要的特征,減小裂縫信息在傳遞過(guò)程中的損耗,進(jìn)一步提升模型表征能力。
針對(duì)上述問(wèn)題,本文提出了一種針對(duì)混凝土裂縫無(wú)損檢測(cè)的改進(jìn)ResNet方法,在ResNet網(wǎng)絡(luò)的基礎(chǔ)上,插入了注意力機(jī)制模塊,使ResNet網(wǎng)絡(luò)能夠在學(xué)習(xí)過(guò)程中自動(dòng)學(xué)習(xí)到更具有判別性的特征信息,有效捕捉圖像中的重要特征信息,使其能夠更好地適應(yīng)混凝土結(jié)構(gòu)表面裂縫檢測(cè)任務(wù),從而提高檢測(cè)的準(zhǔn)確性和魯棒性。同時(shí),本文創(chuàng)新地運(yùn)用了遷移學(xué)習(xí)的方法,將在ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練的ResNet模型遷移到混凝土結(jié)構(gòu)表面裂縫檢測(cè)任務(wù)上,避免了從頭開(kāi)始訓(xùn)練模型所需的大量數(shù)據(jù)和計(jì)算資源,同時(shí)保留了ResNet模型在圖像特征提取方面的優(yōu)勢(shì)。
1 裂縫檢測(cè)模型構(gòu)建
1.1 殘差神經(jīng)網(wǎng)絡(luò)
殘差神經(jīng)網(wǎng)絡(luò)(residual neural network,以下簡(jiǎn)稱(chēng)ResNet)是2015年由微軟實(shí)驗(yàn)室[23]提出的一種用于圖像分類(lèi)的深度學(xué)習(xí)方法,以解決卷積神經(jīng)網(wǎng)絡(luò)隨深度的增加,而分類(lèi)效果卻變差的問(wèn)題[20]。在沒(méi)有殘差的網(wǎng)絡(luò)中,隨著網(wǎng)絡(luò)層數(shù)的加深,模型的表征能力越來(lái)越強(qiáng),但實(shí)際訓(xùn)練效果與模型表征能力不成正比,這是因?yàn)榘l(fā)生了梯度消失或梯度爆炸。ResNet的目的在于使模型隨著網(wǎng)絡(luò)層數(shù)的加深,訓(xùn)練效果可以獲得正向增長(zhǎng)。
以一個(gè)兩層的神經(jīng)網(wǎng)絡(luò)為例,如圖1所示,左圖是一個(gè)普通神經(jīng)網(wǎng)絡(luò),其主路徑為向該網(wǎng)絡(luò)輸入一個(gè)x,經(jīng)過(guò)兩個(gè)卷積層(Weight layer)與一次ReLU非線性激活后,輸出一個(gè)F(x),再將F(x)作為新的輸入,經(jīng)歷下一輪ReLU非線性激活。右圖比左圖多了一個(gè)跳躍連接,將該神經(jīng)網(wǎng)絡(luò)輸入的x拷貝到神經(jīng)網(wǎng)絡(luò)的深層,與該神經(jīng)網(wǎng)絡(luò)輸出的F(x)相加后,共同作用在后續(xù)ReLU非線性激活函數(shù)上,構(gòu)成一個(gè)殘差塊。這是一條“捷徑”,意味著輸入的x不僅要經(jīng)歷普通神經(jīng)網(wǎng)絡(luò)的主路徑,以輸出的F(x)影響深層神經(jīng)網(wǎng)絡(luò),也要經(jīng)歷這條“捷徑”,對(duì)深層的神經(jīng)網(wǎng)絡(luò)產(chǎn)生直接影響。
該具有跳躍連接的神經(jīng)網(wǎng)絡(luò)即為殘差塊,若干殘差塊即構(gòu)成殘差神經(jīng)網(wǎng)絡(luò)ResNet。根據(jù)網(wǎng)絡(luò)層數(shù)的不同,ResNet又可以細(xì)分為ResNet18、ResNet34、ResNet50、ResNet101、ResNet152等不同變體,它們的區(qū)別主要在于網(wǎng)絡(luò)深度和參數(shù)量的不同。ResNet后面的數(shù)字表示該網(wǎng)絡(luò)所含卷積層數(shù)量,卷積層越多,網(wǎng)絡(luò)越深,計(jì)算參數(shù)也越多。不同深度的ResNet模型在不同任務(wù)中可能會(huì)有不同表現(xiàn),需要根據(jù)具體的應(yīng)用場(chǎng)景來(lái)選擇合適的模型。其中,ResNet18和ResNet34是比較淺的網(wǎng)絡(luò),適合用于小規(guī)模數(shù)據(jù)集的訓(xùn)練;ResNet50、ResNet101和ResNet152則是比較深的網(wǎng)絡(luò),適合用于大規(guī)模數(shù)據(jù)集的訓(xùn)練。本文預(yù)實(shí)驗(yàn)所用ImageNet數(shù)據(jù)集以及后續(xù)裂縫檢測(cè)的裂縫數(shù)據(jù)集中均包含上萬(wàn)張樣本圖片,因此選用適合大規(guī)模數(shù)據(jù)集的ResNet50、ResNet101或ResNet152是比較合理的。同時(shí),在這3種ResNet網(wǎng)絡(luò)中,ResNet50網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)較淺、參數(shù)量較少、計(jì)算復(fù)雜度低,在計(jì)算資源有限的情況下,ResNet50更容易訓(xùn)練和部署。綜上,本文選用ResNet50建立殘差神經(jīng)網(wǎng)絡(luò)模型,以節(jié)省計(jì)算資源和訓(xùn)練時(shí)間。
ResNet50模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。該模型處理流程共分為6個(gè)階段:第一階段對(duì)圖像進(jìn)行一次卷積和最大池化;第二階段至第五階段分別對(duì)圖像進(jìn)行3,4,6,3個(gè)殘差塊的卷積操作,每個(gè)階段都具有兩種不同的基本殘差塊——卷積塊(Conv Block)和標(biāo)識(shí)塊(Identity Block,ID Block),每個(gè)殘差塊進(jìn)行3次卷積操作,其中Conv Block輸入和輸出的維度是不一樣的,它的作用是改變網(wǎng)絡(luò)的維度,所以不能連續(xù)串聯(lián),ID Block輸入維度和輸出維度相同,可以串聯(lián),用于加深網(wǎng)絡(luò);第六階段對(duì)圖像進(jìn)行一次全局平均池化并展平輸出,進(jìn)而對(duì)圖像進(jìn)行分類(lèi)。
1.2 注意力機(jī)制模塊
傳統(tǒng)的ResNet模型在大規(guī)模圖像分類(lèi)任務(wù)上表現(xiàn)出色,但在特定任務(wù)上可能存在性能瓶頸。本文在ResNet網(wǎng)絡(luò)的基礎(chǔ)上,插入了注意力機(jī)制模塊,以進(jìn)一步提升深度學(xué)習(xí)模型在混凝土結(jié)構(gòu)表面裂縫檢測(cè)任務(wù)中的性能。
注意力機(jī)制模塊主要由兩個(gè)子模塊組成:通道注意力模塊和空間注意力模塊。通道注意力模塊旨在自適應(yīng)地學(xué)習(xí)不同通道之間的重要性,并將這些重要通道的特征進(jìn)行加權(quán)融合,其原理如下:給定輸入特征圖X,首先使用最大池化和平均池化操作聚合特征圖的空間信息,生成兩個(gè)不同的空間描述符:Fcmax和Fcavg,分別表示平均池化特征和最大池化特征。然后將兩個(gè)描述符輸送到共享全連接層,壓縮輸入特征圖的空間維數(shù),逐元素求和合并,生成通道注意力映射Mc,如圖3所示。
通道注意力機(jī)制可以表達(dá)為
Mc=σ{MLP[MaxPoolX]+MLP[AvgPoolX]}
=σ{W1[W0Fcmax]+W1[W0Fcavg]}(1)
式中:σ表示sigmoid激活函數(shù);MLP表示共享全連接層;MaxPool為最大池化操作;AvgPool表示平均池化操作;W0和W1是共享全連接層的權(quán)重。
空間注意力模塊旨在自適應(yīng)地學(xué)習(xí)不同空間位置的重要性,并將這些重要位置的特征進(jìn)行加權(quán)融合,其原理如下:給定輸入特征圖X,分別通過(guò)一個(gè)最大池化層和一個(gè)平均池化層得到兩個(gè)空間維度上的全局特征描述符Fsmax和Fsavg。然后,將這兩個(gè)全局特征描述符連接并通過(guò)一個(gè)卷積層和激活函數(shù),得到空間注意力映射Ms,如圖4所示。
空間注意力機(jī)制可以表達(dá)為
Ms=σf7×7MaxPoolX;AvgPoolX
=σf7×7Fsmax;Fsavg(2)
將通道注意力模塊和空間注意力模塊順序放置(也可平行放置,但順序排列較平行排列效果更優(yōu)),將輸入特征圖X與通道注意力映射Mc相乘,得到加權(quán)后的特征圖Xca,再將Xca作為輸入特征圖與空間注意力映射Ms相乘,得到加權(quán)后的特征圖Xsa,如圖5所示,最后即得到注意力機(jī)制模塊的輸出特征圖,用于后續(xù)的特征提取和分類(lèi)任務(wù)。注意力機(jī)制模塊的插入使得ResNet網(wǎng)絡(luò)能夠在學(xué)習(xí)過(guò)程中自動(dòng)學(xué)習(xí)到更具有判別性的特征表示,有效捕捉圖像中的重要特征信息,使其能夠更好地適應(yīng)混凝土結(jié)構(gòu)表面裂縫檢測(cè)任務(wù),從而提高檢測(cè)的準(zhǔn)確性和魯棒性。
1.3 遷移學(xué)習(xí)
在某些機(jī)器學(xué)習(xí)場(chǎng)景中,直接對(duì)目標(biāo)任務(wù)從頭開(kāi)始進(jìn)行訓(xùn)練的成本太高,又或者是目標(biāo)任務(wù)所能提供的樣本數(shù)據(jù)太少,不足以支撐機(jī)器學(xué)習(xí)得到好的效果。如本文的研究對(duì)象——混凝土結(jié)構(gòu)表面裂縫無(wú)損檢測(cè),當(dāng)前尚無(wú)一套樣本豐富的混凝土表面裂縫數(shù)據(jù)集,因此我們期望能夠?qū)⒃诰哂谐渥銟颖镜娜蝿?wù)中預(yù)先訓(xùn)練好的模型,即在ImageNet上訓(xùn)練好的ResNet模型,直接應(yīng)用于新的目標(biāo)任務(wù),即混凝土結(jié)構(gòu)表面裂縫無(wú)損檢測(cè)。
ImageNet[24]是目前世界上最大的圖像識(shí)別數(shù)據(jù)庫(kù),具有1 000類(lèi)共計(jì)1 431 167張圖像及其相應(yīng)的標(biāo)簽。鑒于其樣本量足、種類(lèi)豐富的特點(diǎn),在圖像處理領(lǐng)域,ImageNet是用作網(wǎng)絡(luò)預(yù)訓(xùn)練最受歡迎的數(shù)據(jù)集,訓(xùn)練出的參數(shù)可靠性強(qiáng)、通用性廣。本文同樣選擇ImageNet作為殘差神經(jīng)網(wǎng)絡(luò)模型的預(yù)訓(xùn)練數(shù)據(jù)集,其中訓(xùn)練集有1 281 167張圖像和標(biāo)簽,每類(lèi)約1 300張,驗(yàn)證集有50 000張圖像和標(biāo)簽,每類(lèi)50張,測(cè)試集有100 000張圖像和標(biāo)簽,每類(lèi)100張。訓(xùn)練ImageNet數(shù)據(jù)集時(shí),共設(shè)置訓(xùn)練輪數(shù)100輪。由訓(xùn)練結(jié)果可知,殘差神經(jīng)網(wǎng)絡(luò)ResNet50在ImageNet上的最高準(zhǔn)確率可達(dá)76.13%,保存該輪訓(xùn)練得到的參數(shù),以備在后文裂縫檢測(cè)中快速啟用。
遷移學(xué)習(xí)[25]根據(jù)其學(xué)習(xí)對(duì)象的不同,可以分為樣本遷移、特征遷移和參數(shù)/模型遷移[26]。對(duì)于本文建立的殘差神經(jīng)網(wǎng)絡(luò)ResNet50模型,采用參數(shù)/模型遷移方法,該方法有3種遷移思路:① 載入網(wǎng)絡(luò)模型后訓(xùn)練所有參數(shù),② 載入網(wǎng)絡(luò)模型后只訓(xùn)練最后幾層參數(shù),③ 載入網(wǎng)絡(luò)模型后凍結(jié)原網(wǎng)絡(luò)模型卷積層的所有參數(shù),僅改變最后一個(gè)全連接層。3種遷移思路各有優(yōu)劣,如表1所列。
本文采取第3種遷移思路,即把最后一層替換成自己的分類(lèi)器,將ImageNet數(shù)據(jù)集的多分類(lèi)問(wèn)題改為裂縫檢測(cè)的二分類(lèi)問(wèn)題,剩下的網(wǎng)絡(luò)結(jié)構(gòu)當(dāng)作特征提取器,提取其在ImageNet數(shù)據(jù)集上的訓(xùn)練成果,如圖6所示。依據(jù)如下:① 訓(xùn)練時(shí)間和計(jì)算資源:由于凍結(jié)了原始網(wǎng)絡(luò)模型的卷積層參數(shù),只需要訓(xùn)練最后一個(gè)全連接層,因此訓(xùn)練時(shí)間和計(jì)算資源需求較少,適合于資源受限的情況;② 底層特征提取器保留:在訓(xùn)練過(guò)程中,底層的卷積層參數(shù)被凍結(jié),因此模型可以保留原始網(wǎng)絡(luò)模型在底層提取的特征,這有助于模型更好地適應(yīng)原模型的特征空間,提高模型的泛化能力;③ 適應(yīng)性:雖然只調(diào)整了最后一個(gè)全連接層的參數(shù),但模型依然可以在新任務(wù)上進(jìn)行微調(diào),因此能夠充分利用原模型在大規(guī)模數(shù)據(jù)集上學(xué)習(xí)到的特征,并將其遷移到新任務(wù)中。
2 混凝土裂縫無(wú)損檢測(cè)實(shí)驗(yàn)
如前文所述,殘差神經(jīng)網(wǎng)絡(luò)ResNet學(xué)習(xí)手段已經(jīng)在ImageNet上取得了不錯(cuò)的圖像分類(lèi)效果,如何將其學(xué)習(xí)成果遷移到裂縫數(shù)據(jù)集也已進(jìn)行了闡述。接下來(lái)需要開(kāi)展的工作包括:構(gòu)建混凝土結(jié)構(gòu)的裂縫數(shù)據(jù)集,以及將殘差神經(jīng)網(wǎng)絡(luò)ResNet在ImageNet上的預(yù)訓(xùn)練成果遷移到裂縫數(shù)據(jù)集進(jìn)行訓(xùn)練,并在ResNet的基礎(chǔ)上,插入注意力機(jī)制模塊,通過(guò)實(shí)驗(yàn)檢驗(yàn)改進(jìn)后的混凝土裂縫檢測(cè)模型的準(zhǔn)確率。
2.1 構(gòu)建裂縫數(shù)據(jù)集
本文獲取了由458張高分辨率圖像(4 032×3 024像素)組成的樣本,由于樣本數(shù)量有限,對(duì)原始數(shù)據(jù)進(jìn)行裁剪,生成了20 000張有裂縫的混凝土結(jié)構(gòu)圖像和20 000張無(wú)裂縫的圖像,每個(gè)圖像都是227×227像素的RGB圖像,由此構(gòu)建了一個(gè)混凝土裂縫圖像數(shù)據(jù)集。
將混凝土裂縫圖像數(shù)據(jù)按6∶2∶2的比例隨機(jī)放入訓(xùn)練集(train)、驗(yàn)證集(val)、測(cè)試集(test)這3個(gè)文件夾。訓(xùn)練集和驗(yàn)證集文件夾下屬各有兩個(gè)文件夾,一個(gè)用于收錄正樣本(positive),即有裂縫的混凝土結(jié)構(gòu)圖像;另一個(gè)用于收錄負(fù)樣本(negative),即無(wú)裂縫的混凝土結(jié)構(gòu)圖像,測(cè)試集中正負(fù)樣本混雜,無(wú)需單獨(dú)分類(lèi),用于最后的裂縫檢測(cè)。數(shù)據(jù)集結(jié)構(gòu)如圖7所示。
部分有裂縫的混凝土結(jié)構(gòu)圖像樣本和無(wú)裂縫的混凝土結(jié)構(gòu)圖像樣本如圖8所示,可以看出,本文構(gòu)建的裂縫數(shù)據(jù)集包含多種形狀和寬度的裂縫,樣本具有很好的隨機(jī)性和內(nèi)容豐富性。
2.2 混凝土裂縫無(wú)損檢測(cè)結(jié)果
將在ImageNet上預(yù)訓(xùn)練過(guò)的殘差神經(jīng)網(wǎng)絡(luò)作為起點(diǎn),改變其全連接層,由預(yù)訓(xùn)練時(shí)的多分類(lèi)問(wèn)題修改為裂縫檢測(cè)的二分類(lèi)問(wèn)題(有裂縫或無(wú)裂縫)后,將其遷移至裂縫數(shù)據(jù)集進(jìn)行訓(xùn)練,并使用隨機(jī)旋轉(zhuǎn)、隨機(jī)水平和垂直翻轉(zhuǎn)以及隨機(jī)顏色抖動(dòng)等圖像增強(qiáng)功能來(lái)增強(qiáng)訓(xùn)練數(shù)據(jù)并幫助模型泛化。此外,將每個(gè)通道歸一化,有助于神經(jīng)網(wǎng)絡(luò)訓(xùn)練,從而進(jìn)一步提高混凝土裂縫檢測(cè)模型的準(zhǔn)確性。本次共設(shè)置10輪訓(xùn)練,該模型在裂縫數(shù)據(jù)集上的表現(xiàn)可用每一輪訓(xùn)練時(shí)裂縫數(shù)據(jù)訓(xùn)練集和驗(yàn)證集上的損失(loss)和準(zhǔn)確率(accuracy)來(lái)評(píng)估,如圖9所示。圖中,ResNet表示未經(jīng)過(guò)預(yù)訓(xùn)練且未設(shè)置注意力模塊的原始裂縫檢測(cè)模型,Pretrained表示經(jīng)過(guò)預(yù)訓(xùn)練但未設(shè)置注意力模塊的裂縫檢測(cè)模型,Improved表示經(jīng)過(guò)預(yù)訓(xùn)練且插入注意力模塊的裂縫檢測(cè)模型,即本文提出的改進(jìn)ResNet方法。
由圖9可知,以驗(yàn)證集的準(zhǔn)確率和損失為評(píng)價(jià)標(biāo)準(zhǔn),改進(jìn)后的ResNet裂縫檢測(cè)模型在第一輪訓(xùn)練時(shí)就表現(xiàn)良好,準(zhǔn)確率為98.08%,這是遷移學(xué)習(xí)時(shí)使用了ResNet在ImageNet上預(yù)訓(xùn)練參數(shù)的結(jié)果;訓(xùn)練至第六輪時(shí)效果最好,準(zhǔn)確率高達(dá)98.80%,比原始ResNet算法的最高準(zhǔn)確率提升了3.24%,證明了注意力機(jī)制模塊有效地提高了模型表征能力,使其能夠有效地捕捉裂縫圖像中的重要特征信息,從而提高了檢測(cè)的準(zhǔn)確性和魯棒性。以該輪訓(xùn)練結(jié)果為裂縫檢測(cè)的依據(jù),從測(cè)試集中隨機(jī)選取6張圖片進(jìn)行裂縫檢測(cè),得到了非常正確的檢測(cè)結(jié)果,如圖10所示。
除對(duì)測(cè)試集中的低分辨率圖片進(jìn)行裂縫檢測(cè)以外,本文對(duì)數(shù)據(jù)集以外混凝土結(jié)構(gòu)表面裂縫的高分辨率圖片也進(jìn)行了檢測(cè)?;舅悸窞?,將需要進(jìn)行檢測(cè)的裂縫圖像分為若干個(gè)補(bǔ)丁級(jí)圖塊,圖塊大小由上文提及的裂縫數(shù)據(jù)集內(nèi)圖像像素決定,即227×227,利用前文訓(xùn)練好的模型對(duì)每一個(gè)圖塊進(jìn)行分類(lèi),將有裂縫的圖塊紅色高亮顯示,無(wú)裂縫的圖塊作綠色顯示,從而實(shí)現(xiàn)高分辨率圖像的裂縫檢測(cè)。檢測(cè)效果如圖11所示,紅色線框表示該圖塊為假性negative,即將有裂縫圖塊識(shí)別為無(wú)裂縫圖塊,綠色線框表示假性positive,即將無(wú)裂縫圖塊識(shí)別為有裂縫圖塊。
以上檢測(cè)結(jié)果表明,該模型在數(shù)據(jù)集外的裂縫圖像上,對(duì)補(bǔ)丁級(jí)裂縫依然有不錯(cuò)的檢測(cè)效果。需要注意的是,上述算法不能直接在像素級(jí)別將裂縫從圖像中提取出來(lái),這種基于深度學(xué)習(xí)的裂縫識(shí)別算法還需結(jié)合圖像分割技術(shù)[27]才能完成裂縫的像素級(jí)提取。但相比于傳統(tǒng)的數(shù)字圖像處理技術(shù)[28-29],本文提出的基于ResNet和遷移學(xué)習(xí)的混凝土結(jié)構(gòu)表面裂縫無(wú)損檢測(cè)方法無(wú)需對(duì)原始圖像進(jìn)行任何預(yù)處理,如手動(dòng)過(guò)濾圖像中的背景和噪音等,僅僅需要將訓(xùn)練樣本按訓(xùn)練目標(biāo)分類(lèi),就能使裂縫識(shí)別取得很好的效果,證明了該方法具有一定先進(jìn)性。
3 結(jié) 語(yǔ)
本文提出一種混凝土裂縫無(wú)損檢測(cè)的改進(jìn)ResNet方法,建立了殘差神經(jīng)網(wǎng)絡(luò)模型,以該模型為訓(xùn)練手段,在開(kāi)源數(shù)據(jù)集ImageNet上進(jìn)行預(yù)訓(xùn)練,并將其訓(xùn)練成果遷移至混凝土結(jié)構(gòu)表面裂縫數(shù)據(jù)集,然后在ResNet的基礎(chǔ)上插入注意力機(jī)制模塊,進(jìn)一步提升了深度學(xué)習(xí)模型在混凝土結(jié)構(gòu)表面裂縫檢測(cè)任務(wù)中的性能。
結(jié)果表明,改進(jìn)后的ResNet算法其裂縫檢測(cè)準(zhǔn)確率高達(dá)98.80%,比原始ResNet算法的準(zhǔn)確率提升了3.24%,證明了該算法應(yīng)用于混凝土結(jié)構(gòu)表面裂縫無(wú)損檢測(cè)的優(yōu)越性和先進(jìn)性。
參考文獻(xiàn):
[1] 羅福海,張保軍,夏界平.水布埡大壩施工期面板裂縫成因分析及處理措施[J].人民長(zhǎng)江,2011,42 (1):50-53.
[2] 高珊,袁磊,李文淵,等.循環(huán)荷載作用下預(yù)應(yīng)力混凝土U型梁縱向裂縫試驗(yàn)研究[J].成都大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,42(1):98-103.
[3] 梁月英.混凝土壩裂縫危害性分析方法研究[D].南京:河海大學(xué),2007.
[4] 肖詩(shī)榮,魏瑞琦,李瑩,等.意大利瓦依昂滑坡研究綜述[J].人民長(zhǎng)江,2023,54 (4):130-140.
[5] 朱珊,周文杰,李曉瑩.混凝土健康監(jiān)測(cè)技術(shù)綜述[J].建筑結(jié)構(gòu),2022,52(增1):2248-2252.
[6] 丁威,俞珂,舒江鵬.基于深度學(xué)習(xí)和無(wú)人機(jī)的混凝土結(jié)構(gòu)裂縫檢測(cè)方法[J].土木工程學(xué)報(bào),2021,54(增1):1-12.
[7] 余加勇,李鋒,薛現(xiàn)凱,等.基于無(wú)人機(jī)及Mask R-CNN的橋梁結(jié)構(gòu)裂縫智能識(shí)別[J].中國(guó)公路學(xué)報(bào),2021,34(12):80-90.
[8] 陳金橋.基于無(wú)人機(jī)圖像的混凝土橋梁表觀病害識(shí)別研究[D].南京:東南大學(xué),2022.
[9] 蔣文波,羅秋容,張曉華.基于數(shù)字圖像的混凝土道路裂縫檢測(cè)方法綜述[J].西華大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,37(1):75-84.
[10]許薛軍,張肖寧.基于數(shù)字圖像的混凝土橋梁裂縫檢測(cè)技術(shù) [J].湖南大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,40 (7):34-40.
[11]MUNAWAR H S,HAMMAD A W A,HADDAD A,et al.Image-based crack detection methods:a review[J].Infrastructures,2021,6(8):115-127.
[12]ABOU-KHOUSA M A,RAHMAN M S U,DONNELL K M,et al.Detection of surface cracks in metals using microwave and millimeter-wave nondestructive testing techniques:a review[J].IEEE Transactions on Instrumentation and Measurement,2023,72:1-18.
[13]陳偉,范新南,李敏,等.基于Gabor算子的人工蜂群算法大壩裂縫檢測(cè)[J].微處理機(jī),2015,36(4):32-38.
[14]張大偉,許夢(mèng)釗,馬莉,等.水下大壩裂縫圖像分割方法研究[J].軟件導(dǎo)刊,2016,15(9):170-172.
[15]LI G,ZHAO X X,DU K,et al.Recognition and evaluation of bridge cracks with modified active contour model and greedy search-based support vector machine[J].Automation in Construction,2017,78:51-61.
[16]馬嘉文.基于圖像處理的大壩裂縫檢測(cè)算法研究[D].哈爾濱:哈爾濱工程大學(xué),2019.
[17]CHA Y J,CHOI W,BYKZTRK O.Deep learning-based crack damage detection using convolutional neural networks[J].Computer-Aided Civil and Infrastructure Engineering,2017,32(5):361-378.
[18]HU G X,HU B L,YANG Z,et al.Pavement crack detection method based on deep learning models[J].Wireless Communications and Mobile Computing,2021,27:1-13.
[19]ZHANG A,WANG K C P,F(xiàn)EI Y,et al.Deep learning-based fully automated pavement crack detection on 3D asphalt surfaces with an improved crackNet[J].Journal of Computing in Civil Engineering,2018,32(5):04018041.
[20]王麗蘋(píng),高瑞貞,張京軍,等.基于卷積神經(jīng)網(wǎng)絡(luò)的混凝土路面裂縫檢測(cè)[J].計(jì)算機(jī)科學(xué),2019,46(增2):584-589.
[21]孟詩(shī)喬,張嘯天,喬甦陽(yáng),等.基于深度學(xué)習(xí)的網(wǎng)格優(yōu)化裂縫檢測(cè)模型研究[J].建筑結(jié)構(gòu)學(xué)報(bào),2020,41(增2):404-410.
[22]李巖,楊豪杰,劉輝,等.基于深度學(xué)習(xí)的混凝土裂縫檢測(cè)研究[J].信息技術(shù)與信息化,2021(12):233-236.
[23]HE K,ZHANG X,REN S,et al.Deep residual learning for image recognition[C]∥Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition,2016:770-778.
[24]DENG J,DONG W,SOCHER R,et al.ImageNet:a large-scale hierarchical image database[C]∥Proceedings of 2009 IEEE Conference on Computer Vision and Pattern Recognition,2009:248-255.
[25]ZHUANG F,QI Z,DUAN K,et al.A comprehensive survey on transfer learning[J].Proceedings of the IEEE,2021,109(1):43-76.
[26]PAN S J,YANG Q.A Survey on transfer learning[J].IEEE Transactions on Knowledge and Data Engineering,2010,22(10):1345-1359.
[27]劉鵬.基于圖像處理的混凝土預(yù)制構(gòu)件裂縫檢測(cè)系統(tǒng)研究[D].西安:西安建筑科技大學(xué),2018.
[28]譚曉晶,許國(guó)山,宋軍,等.基于數(shù)字圖像處理技術(shù)的混凝土表面裂縫識(shí)別[J].低溫建筑技術(shù),2020,42(8):11-13.
[29]尹蘭.基于數(shù)字圖像處理技術(shù)的混凝土表面裂縫特征測(cè)量和分析[D].南京:東南大學(xué),2007.
(編輯:胡旭東)
Non-destructive detection of concrete cracks based on improved ResNet method
CHENG Long1,2,ZHANG Jingying3,4,XU Zhao1,5
(1.School of Civil Engineering,Southeast University,Nanjing 211102,China; 2.China ANNENG Group Second Engineering Corporation,Changzhou 213000,China; 3.College of Water Conservancy and Hydropower Engineering,Hohai University,Nanjing 210098,China; 4.National Key Laboratory of Water Disaster Prevention,Hohai University,Nanjing 210098,China; 5.National Local Joint Engineering Research Center of Intelligent Construction and Maintenance,Nanjing 211189,China)
Abstract:
The catastrophic accidents of large concrete structures are mostly caused by small cracks,so it is very important to detect cracks during the service life of concrete structures.At present,the non-destructive detection algorithm for concrete cracks based on deep learning is developing rapidly,but most of them do not take the characteristics of crack information into account,so the detection accuracy still has room for further improvement.In this paper,an improved ResNet method for non-destructive detection of concrete cracks was proposed.Namely the residual neural network ResNet was used as the basic model of crack detection,and the attention mechanism module was inserted to improve the model representation ability,so that it can effectively capture the important feature information in the crack image,and improve the accuracy and robustness of the detection.At the same time,the transfer learning strategy was used to transfer the training results of the ResNet model on the complex data set to the crack data set,saving training time and computing resources.The results showed that the accuracy of the improved ResNet algorithm for crack detection was as high as 98.80 %,which was 3.24 % higher than that of the original ResNet algorithm.The relevant experience can be a reference in the construction of similar improved algorithms.
Key words:
crack of concrete; crack detection; residual neural network; attention mechanism; transfer learning