方 亮, 周 云, 唐志泉
(1. 湖南大學(xué) 土木工程學(xué)院, 湖南 長沙 410082; 2. 湖南大學(xué) 工程結(jié)構(gòu)損傷診斷湖南省重點(diǎn)實(shí)驗(yàn)室, 湖南 長沙 410082; 3. 湖南農(nóng)業(yè)大學(xué) 水利與土木工程學(xué)院, 湖南 長沙 410128; 4. 湖南大學(xué) 信息科學(xué)與工程學(xué)院, 湖南 長沙 410082)
鋼筋銹蝕是混凝土結(jié)構(gòu)中長期存在的一種病害,它嚴(yán)重影響工程結(jié)構(gòu)的受力性能,縮短結(jié)構(gòu)的使用壽命,并造成巨大的經(jīng)濟(jì)浪費(fèi)和嚴(yán)重的環(huán)境污染.據(jù)中國科學(xué)院“我國腐蝕狀況及控制戰(zhàn)略研究”重大咨詢項(xiàng)目的研究結(jié)果,我國2014年的腐蝕成本高達(dá)2.1萬億元,相當(dāng)于當(dāng)年GDP的3.34%[1].建立鋼筋混凝土結(jié)構(gòu)銹蝕危機(jī)預(yù)警機(jī)制以及耐久性評估系統(tǒng)[2],一直是工程界致力解決的問題之一.在傳統(tǒng)的銹蝕鋼筋檢測方法中,直接觀測法[3]主要是鑿去局部保護(hù)層并暴露出鋼筋后,結(jié)合人工目測法評估銹蝕程度,工作效率低,主觀性大;常用的物理或電化學(xué)無損檢測方法,諸如:聲發(fā)射法、紅外熱成像法、半電池電位法等,易受環(huán)境因素干擾產(chǎn)生誤差,多用于鋼筋銹蝕的定性評價[4].近年來,基于人工智能(AI)的深度學(xué)習(xí)理論及機(jī)器視覺技術(shù)在土木工程領(lǐng)域的應(yīng)用取得了長足的發(fā)展[5],為解決混凝土結(jié)構(gòu)銹蝕損傷診斷提供了新途徑.許多研究人員在工程調(diào)查和試驗(yàn)研究基礎(chǔ)上,利用混凝土保護(hù)層銹脹裂縫寬度與鋼筋銹蝕程度之間的相關(guān)性,對鋼筋銹蝕進(jìn)行定量評估[3].冷艷玲等[6]建立了根據(jù)銹脹裂縫寬度預(yù)測鋼筋銹蝕率的BP神經(jīng)網(wǎng)絡(luò)模型,將銹脹裂縫寬度作為輸入層代入模型中,得到了較理想的鋼筋銹蝕率預(yù)測結(jié)果.劉斌云等[7]利用人工蜂群算法(artificial bee colony,ABC)優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型,通過銹脹裂縫寬度,對構(gòu)件銹蝕程度進(jìn)行預(yù)測,并與實(shí)驗(yàn)數(shù)據(jù)進(jìn)行對比,結(jié)果良好.甘海龍等[8]進(jìn)行了基于神經(jīng)網(wǎng)絡(luò)技術(shù),預(yù)測銹脹開裂后混凝土中鋼筋銹蝕量的研究,認(rèn)為銹脹開裂后,混凝土中的鋼筋銹蝕量與鋼筋直徑的相關(guān)性最高.
隨著深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNNs)被開發(fā)用于計(jì)算機(jī)視覺中的圖像分類和目標(biāo)檢測[9-10],該技術(shù)被迅速且廣泛地用于結(jié)構(gòu)損傷檢測及量化評估.為了提高CNNs的學(xué)習(xí)能力,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),降低計(jì)算難度,Szegedy等[11]提出了一個22層的深度GoogLeNet模型,該網(wǎng)絡(luò)由多個Inception模塊級聯(lián)而成,包括4個提取多尺度特征的分支,提高了網(wǎng)絡(luò)對多尺度性的適應(yīng)性,并且進(jìn)行合理降維,降低了計(jì)算的復(fù)雜程度.Inception網(wǎng)絡(luò)已經(jīng)迭代到第四代,檢測能力得到進(jìn)一步提高.增加網(wǎng)絡(luò)深度可以在較少的迭代次數(shù)下收斂得到更好的結(jié)果,并進(jìn)一步提高網(wǎng)絡(luò)的泛化能力.但是,網(wǎng)絡(luò)加深會引起梯度爆炸和梯度消失,從而導(dǎo)致網(wǎng)絡(luò)退化和訓(xùn)練錯誤.He等[12]提出的殘差網(wǎng)絡(luò)(residual network,ResNet),解決了深層網(wǎng)絡(luò)的梯度退化問題,使構(gòu)建超深層網(wǎng)絡(luò)成為可能.其核心思想是通過將低層的特征恒等映射到高層結(jié)構(gòu)中,緩解了增加層數(shù)帶來的梯度消失問題,從而使深層網(wǎng)絡(luò)極快地收斂并且保持高準(zhǔn)確率.Cha等[13]提出了一種基于區(qū)域-卷積神經(jīng)網(wǎng)絡(luò)(R-CNN)的結(jié)構(gòu)視覺檢測方法,對包括鋼筋銹蝕在內(nèi)的5種結(jié)構(gòu)損傷進(jìn)行有效分類和檢測.童晶等[2]利用數(shù)字圖像相關(guān)(digital image correlation,DIC)技術(shù),研究了氯鹽環(huán)境中,通電加速銹蝕條件下,鋼筋混凝土梁表面廣義主應(yīng)變場的時變演化規(guī)律,為量化表征鋼筋混凝土結(jié)構(gòu)的銹脹開裂全過程提供了依據(jù).王達(dá)磊等[14]將圖像分割方法與機(jī)器學(xué)習(xí)相結(jié)合,對不同腐蝕程度的鋼結(jié)構(gòu)進(jìn)行分類,得到了較合理的結(jié)果.
總結(jié)已有研究可以發(fā)現(xiàn),基于深度學(xué)習(xí)的結(jié)構(gòu)銹蝕損傷檢測技術(shù),主要在鋼結(jié)構(gòu)中快速發(fā)展并取得了許多有益成果.對于鋼筋混凝土結(jié)構(gòu)銹蝕損傷檢測,尤其是在現(xiàn)場環(huán)境下直接對鋼筋的銹蝕程度進(jìn)行定量評價,還有許多技術(shù)空白.本研究針對鋼筋表面銹蝕分布隨機(jī)性很強(qiáng)的特點(diǎn),在直接觀測法的基礎(chǔ)上,利用計(jì)算機(jī)視覺技術(shù),對不同銹蝕率的鋼筋進(jìn)行分類檢測.考慮到銹蝕鋼筋圖像特征不易提取,進(jìn)行細(xì)粒度圖像分類難度較大,本次采用一種Adam算法優(yōu)化的殘差網(wǎng)絡(luò)模型,以直徑12 mm和直徑14 mm的銹蝕鋼筋作為研究對象,結(jié)合圖像增強(qiáng)技術(shù),進(jìn)行銹蝕鋼筋表面特征學(xué)習(xí),最終實(shí)現(xiàn)按鋼筋銹蝕率的分類識別.通過對比實(shí)驗(yàn),驗(yàn)證所提方法具有訓(xùn)練和識別速度快、識別率較高、易于實(shí)現(xiàn)等優(yōu)點(diǎn).本研究目前尚在實(shí)驗(yàn)室模擬條件下完成,但作為利用深度學(xué)習(xí)方法解決工程實(shí)際問題的一種探索性研究,為進(jìn)一步開發(fā)原位檢測中鋼筋銹蝕程度的準(zhǔn)確定量評價方法,提供了實(shí)驗(yàn)依據(jù)和數(shù)據(jù)支持.
為模擬實(shí)際工程情況,本研究所用的銹蝕鋼筋試件,取自氯鹽環(huán)境中通電加速銹蝕的鋼筋混凝土板構(gòu)件.鋼筋混凝土板的設(shè)計(jì)和制作參照《混凝土結(jié)構(gòu)設(shè)計(jì)規(guī)范》(GB50010—2010)[15]之規(guī)定.板內(nèi)配置HRB500級(d=14 mm)和HRB400級(d=12 mm)兩種鋼筋,并連接電源正極,外置不銹鋼棒連接電源負(fù)極.通電過程中定時噴灑NaCl溶液保持潮濕,并通過調(diào)節(jié)可變阻維持電流密度基本恒定在(0.15±0.02)mA/cm2.通電加速銹蝕方案及現(xiàn)場照片見圖1.通電加速銹蝕試驗(yàn)過程詳見文獻(xiàn)[16].完成通電加速銹蝕以及相關(guān)力學(xué)性能測試后,將銹蝕鋼筋從鋼筋混凝土板中取出(圖2),并切割成10~15 cm長的試件.為獲得準(zhǔn)確鋼筋銹蝕量數(shù)據(jù),避免因銹蝕產(chǎn)物堆積對鋼筋銹蝕程度評價的影響,采用稀鹽酸清洗配合鋼絲刷打磨的方法,祛除鋼筋表面的殘余混凝土和銹蝕產(chǎn)物.對除銹后的鋼筋試件逐個進(jìn)行稱重,按公式(1)計(jì)算其質(zhì)量損失率即鋼筋銹蝕率.
圖1 鋼筋混凝土板通電加速銹蝕實(shí)驗(yàn)
圖2 銹蝕鋼筋
(1)
式中:η是鋼筋的銹蝕率,%;m是實(shí)測除銹鋼筋的質(zhì)量,g;m0是未銹蝕鋼筋理論質(zhì)量,g;m,m0通過鋼筋段的實(shí)測長度乘以理論線密度得到.
工程中,采用直接法檢測混凝土結(jié)構(gòu)內(nèi)鋼筋銹蝕狀況時,根據(jù)《混凝土結(jié)構(gòu)現(xiàn)場檢測技術(shù)標(biāo)準(zhǔn)》(GB/T50784—2013)[17]規(guī)定,先剔除混凝土保護(hù)層,暴露出待觀測鋼筋的部分表面,再清除銹蝕鋼筋表面銹蝕產(chǎn)物,然后對鋼筋銹蝕情況進(jìn)行綜合分析判定(圖3).本次試驗(yàn)進(jìn)行圖像采集時,為模擬實(shí)際工作情況,每次拍攝除銹后的鋼筋的部分表面.
圖3 工程現(xiàn)場銹蝕鋼筋照片
鋼筋試件的圖像采集系統(tǒng)如圖4所示.采用白色遮光板搭建采集箱,正面設(shè)出入口;箱內(nèi)底部正中為帶凹槽的樣品臺,用于放置待拍攝的鋼筋試件;XG-U300C型工業(yè)相機(jī)安裝于樣品臺正上方,鏡頭距離鋼筋試件中心150 mm;采集箱內(nèi)側(cè)四壁同一水平位置上安裝LED燈條,形成四邊形光源,照射角為90°;工業(yè)相機(jī)最高分辨率2 048×1 536,像素尺寸為2.0 μm×2.0 μm,其傳感器類型為逐行掃描CMOS,傳感器光學(xué)尺寸為1/2″,拍攝背景選擇對比度大的白色;圖像處理硬件環(huán)境:Intel Core i7 8750H CPU,NVIDIA GTX 1050Ti.
圖4 圖像采集方案
為全面反映銹蝕鋼筋表面特征,拍攝鋼筋試件時,以鋼筋試件的2根縱肋位于同一水平面時為基準(zhǔn),每拍攝1張照片,將試件沿縱軸順時針旋轉(zhuǎn)90°.每根鋼筋試件共拍攝4張照片,分別為S1,S2,S3和S4面.由于拍攝的原始高光譜圖像的分辨率較大,為去除無鋼筋的背景圖像,將像素為2 048×1 536的鋼筋照片,固定裁切成像素為1 910×450的圖片.兩種直徑的銹蝕鋼筋試件的圖片示例如圖5所示.
圖5 鋼筋試件(S1到S4面)圖片示例
通過加速銹蝕試驗(yàn),本次研究共獲得銹蝕鋼筋試件1 478根,其中直徑14 mm的HRB500級鋼筋試件484根,直徑12 mm的HRB400級鋼筋試件994根.鋼筋試件的銹蝕率為1.45%~56.10%.
考慮實(shí)際工程中大量既有結(jié)構(gòu)中鋼筋可能的銹蝕程度,以及鋼筋銹蝕程度現(xiàn)場定量評價的精度需求,本文按銹蝕率將不同銹蝕程度的鋼筋試件分成11類.其中銹蝕率區(qū)間[0, 30%)均等的分成10類,區(qū)間寬度為3%;而銹蝕率區(qū)間[30%,100%)單獨(dú)歸為1類.給每個銹蝕類別定義一個標(biāo)簽,共11個標(biāo)簽,分別是:第Ⅰ類[0%, 3%)、第Ⅱ類[3%, 6%)、第Ⅲ類[6%, 9%)、第Ⅳ類[9%, 12%)、第Ⅴ類[12%, 15%)、第Ⅵ類[15%, 18%)、第Ⅶ類[18%, 21%)、第Ⅷ類[21%, 24%)、第Ⅸ類[24%, 27%)、第Ⅹ類[27%, 30%)和第Ⅺ類[30%, 100%).不同類別的銹蝕鋼筋試件的數(shù)量如圖6所示.
圖6 銹蝕鋼筋的分類與數(shù)量
本次實(shí)驗(yàn)將采用殘差網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí)和檢測.試驗(yàn)前,需要針對采集到的鋼筋圖片進(jìn)行拼接和壓縮預(yù)處理.具體做法是將同一根鋼筋試件相鄰兩個面的圖片,沿高度方向拼接成一張像素為1 910×900的圖片,然后壓縮成像素為955×450的圖片.經(jīng)過預(yù)處理后的一張圖片即成為本次試驗(yàn)的一個圖像數(shù)據(jù)樣本,且圖像數(shù)據(jù)樣本的分類方法與鋼筋試件的一致.以銹蝕率5.76%直徑12 mm的HRB400鋼筋為例,預(yù)處理后的圖像數(shù)據(jù)樣本詳見圖7.采用該處理方式的原因:①不同銹蝕程度的鋼筋表面銹蝕坑洞分布是隨機(jī)的,僅憑借鋼筋一個面的圖像難以有效衡量整根鋼筋銹蝕率,最終使得網(wǎng)絡(luò)檢測效果低下.②直接觀測法中,鑿開保護(hù)層后,可觀測到的鋼筋表面范圍一般約為180°,部分位于構(gòu)件邊緣的鋼筋可觀測到的范圍約為270°.因鋼筋表面具有縱向條形和斜向月牙形兩種肋紋,使可觀測的鋼筋表面肋紋特征具有隨機(jī)性.將圖片進(jìn)行兩兩拼接后獲得的4種情況,能最大限度地包括銹蝕鋼筋可能呈現(xiàn)出的表面狀態(tài);③卷積神經(jīng)網(wǎng)絡(luò)的卷積核是正方形的,并且其在長和寬兩個維度都進(jìn)行步進(jìn)式滑動卷積.單張長條形圖片長寬比太大,拼接后的圖片可以增強(qiáng)目標(biāo)在視野中所占比例,以期讓卷積核在兩個維度都能方便地獲得感興趣區(qū)域(region of interest,ROI).
采用殘差網(wǎng)絡(luò)進(jìn)行鋼筋銹蝕率識別在數(shù)據(jù)集上存在幾個難點(diǎn):第一,實(shí)際工程中,鋼筋的銹蝕率在[0, 100%)區(qū)間并非均勻分布,這種樣本的失衡容易導(dǎo)致訓(xùn)練失偏.第二,殘差網(wǎng)絡(luò)屬于有監(jiān)督的深度卷積神經(jīng)網(wǎng)絡(luò),大量帶標(biāo)簽的訓(xùn)練數(shù)據(jù)是建立分類模型的前提.而鋼筋銹蝕標(biāo)簽的采集過程較繁瑣,且耗時較長,難以采集到十分充足的訓(xùn)練數(shù)據(jù).針對深度學(xué)習(xí)中普遍存在因數(shù)據(jù)量少導(dǎo)致無法訓(xùn)練出合格的深度識別模型的問題[18],目前有效的解決方法是進(jìn)行數(shù)據(jù)增強(qiáng).數(shù)據(jù)增強(qiáng)的基本前提是卷積神經(jīng)網(wǎng)絡(luò)的平移不變性,具體而言,即CNNs對位移、視角、大小和光照等因素(或上述因素的組合)具有平移不變性[19].這種特性也是由卷積神經(jīng)網(wǎng)絡(luò)中的卷積操作和最大池化操作的特性決定的.運(yùn)用數(shù)據(jù)增強(qiáng)技術(shù)可以成倍地增加訓(xùn)練數(shù)據(jù)量,并增加樣本的多樣性,進(jìn)而提升模型的泛化能力.
本次所采用的數(shù)據(jù)增強(qiáng)方法包括對預(yù)處理后的數(shù)據(jù)進(jìn)行:水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)和旋轉(zhuǎn)變換,并且在變換后的圖片中引入輕微的噪聲擾動.實(shí)際工程中拍攝的鋼筋照片也可能帶有許多的噪聲,這些噪聲是許多隨機(jī)的、離散的、孤立的像素,會對人眼的圖像信息分析產(chǎn)生干擾.圖像的噪聲十分復(fù)雜,通常被認(rèn)為是一個多維的隨機(jī)過程,往往可以借助概率分布函數(shù)和概率密度函數(shù)來描述.為了模擬真實(shí)工程中拍攝的圖片,也為了在數(shù)據(jù)增強(qiáng)中加入不確定性[20],本次數(shù)據(jù)增強(qiáng)采用的是加入輕微高斯噪聲.
高斯隨機(jī)變量x的概率密度函數(shù)表達(dá)如公式(2)所示:
(2)
式中:p(x)是概率密度函數(shù);μ是均值;σ是標(biāo)準(zhǔn)差.
添加高斯噪聲是指將函數(shù)p(x)產(chǎn)生的均值為μ,標(biāo)準(zhǔn)差為σ的高斯分布的樣本,分別添加到原始圖片的R,G,B這三個基本顏色分量上,其中x一般是以時間為種子的隨機(jī)數(shù).圖8展示的是直徑12 mm銹蝕率5.76%的鋼筋試件,S1-S2面圖像數(shù)據(jù)增強(qiáng)后的結(jié)果.圖8a和圖8b是分別將圖片沿水平方向和豎直方向翻轉(zhuǎn)180°后添加高斯噪聲,圖8c是將圖片沿水平方向翻轉(zhuǎn)后再沿豎直方向翻轉(zhuǎn),并添加高斯噪聲.
本次試驗(yàn)預(yù)處理后獲得的原始圖像數(shù)據(jù)樣本共計(jì)5 912張,其中:直徑12 mm鋼筋試件的樣本3 976張,直徑14 mm鋼筋試件的樣本1 936張.通過數(shù)據(jù)增強(qiáng)技術(shù),使數(shù)據(jù)量擴(kuò)充到4倍.最終本次實(shí)驗(yàn)的數(shù)據(jù)集包含樣本23 648張,其中:直徑12 mm鋼筋試件的樣本15 904張;直徑14 mm鋼筋試件的樣本7 744張.
卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和推測過程可以歸納為從帶標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)高維且抽象的特征,并泛化到同類型的未知數(shù)據(jù).視覺任務(wù)需要更加深層的網(wǎng)絡(luò)提取更高維的特征.理論上,深層網(wǎng)絡(luò)的解空間包括了淺層網(wǎng)絡(luò)的解空間.換言之,網(wǎng)絡(luò)層數(shù)越多就意味著能提取到的不同等級的特征越豐富,也越能提取到抽象的語義信息.但是隨著卷積網(wǎng)絡(luò)層數(shù)的增加,網(wǎng)絡(luò)會出現(xiàn)梯度彌散或梯度爆炸和網(wǎng)絡(luò)退化兩個問題.這會使深層網(wǎng)絡(luò)的訓(xùn)練效果比淺層網(wǎng)絡(luò)的差,也更難訓(xùn)練.實(shí)際上,隨著模型層級的增加,模型的精準(zhǔn)度會不斷提升,但是當(dāng)層級增加到一定數(shù)量以后,訓(xùn)練精準(zhǔn)度會出現(xiàn)一個斷崖式的下跌.
ResNet的思想是假設(shè)在一個模型中,有一個網(wǎng)絡(luò)層是最優(yōu)網(wǎng)絡(luò)層,那么此層之后的網(wǎng)絡(luò)層就是冗余層.如果這些冗余層能夠完成輸入和輸出的恒等映射,那么這些冗余層也會輸出全局最優(yōu)解.在網(wǎng)絡(luò)訓(xùn)練的過程中會自適應(yīng)地學(xué)習(xí)出哪些層是恒等層.至此,神經(jīng)網(wǎng)絡(luò)的層數(shù)可以超越之前的約束,達(dá)到幾十層、上百層甚至千層,為高級語義特征提取和分類提供了可行性.
如圖9所示,殘差網(wǎng)絡(luò)中的恒等殘差塊中存在一個跳躍連接,即每層的輸出不是輸入的映射,而是映射和輸入的疊加.假設(shè)需要的映射是H(x),將疊加的非線性網(wǎng)絡(luò)層擬合另一個殘差映射F(x):=H(x)-x.那么需要的映射可以表示為F(x)+x.值得注意的是殘差映射F(x)比需要的映射H(x)更容易優(yōu)化.因?yàn)榧僭O(shè)在恒等映射是最優(yōu)的這種極端情況下,殘差網(wǎng)絡(luò)只需要將殘差映射F(x)的值設(shè)為“0”,即不需要使用疊加的非線性網(wǎng)絡(luò)層去擬合恒等映射.此外,跳躍連接可以直接跳過一個或多個層,而不需要引入額外的參數(shù)和計(jì)算.根據(jù)文獻(xiàn)[12]的研究結(jié)果可知:①深度殘差網(wǎng)絡(luò)易于優(yōu)化,與此同時,簡單疊加幾層
圖9 兩層恒等殘差塊示意圖
的相應(yīng)網(wǎng)絡(luò),會隨著深度的增加出現(xiàn)較高的訓(xùn)練誤差;②深度殘差網(wǎng)絡(luò)由于深度大大增加,較容易提升分類準(zhǔn)確率,效果比以前的網(wǎng)絡(luò)好很多.值得注意的是,文獻(xiàn)[12]中identity塊的堆疊層只有兩層或三層,實(shí)際上更多層也是可以的.
本文使用ResNet50進(jìn)行銹蝕率的識別,“50”是殘差網(wǎng)絡(luò)的層數(shù).圖10顯示ResNet50中每個恒等殘差塊中卷積核的排序是:1×1,3×3和1×1.第一層1×1的卷積核能減少輸入特征的通道數(shù),最后一層1×1的卷積核能增加輸出特征的通道數(shù),從而保證通過瓶頸層(bottleneck)前后的通道數(shù)一致,并且減少中間層3×3的卷積核的計(jì)算量.ResNet50的網(wǎng)絡(luò)結(jié)構(gòu)如圖11所示,ResNet50首先對輸入進(jìn)行卷積計(jì)算,之后使用設(shè)計(jì)好的4個殘差塊, 4個殘差塊依次疊加3,4,6,3次,最后進(jìn)行全連接到11個浮點(diǎn)數(shù)上,經(jīng)過歸一化形成11個類別各自的概率.
圖10 ResNet50中三層恒等殘差塊示意圖
圖11 ResNet50結(jié)構(gòu)圖
將待訓(xùn)練與測試的圖像數(shù)據(jù)樣本組成一個數(shù)據(jù)集,并如2.2節(jié)所述,將數(shù)據(jù)集內(nèi)的樣本依照銹蝕率的大小分成11類,并輸入Adam算法優(yōu)化過的ResNet50模型進(jìn)行訓(xùn)練與測試.具體操作方法是將該數(shù)據(jù)集平分成5份,每次挑選其中一份作為測試集,其余作為訓(xùn)練集.如此無重復(fù)地挑選并測試5次,使每個樣本均作為測試集測試過一次.最后綜合5次測試結(jié)果計(jì)算評價指標(biāo),以評估方法的有效性.本次實(shí)驗(yàn)選擇“分類準(zhǔn)確率”作為評價指標(biāo),該指標(biāo)的計(jì)算方法如式(3)所示:
(3)
式中:A表示分類準(zhǔn)確率;Scorrect表示分類正確的樣本數(shù);Stotal表示總樣本數(shù).
訓(xùn)練模型時,采用Adam算法對網(wǎng)絡(luò)權(quán)重進(jìn)行迭代優(yōu)化.多次計(jì)算,選擇最優(yōu)參數(shù).設(shè)置初始學(xué)習(xí)率為0.000 1,梯度及其平方的移動平均值的系數(shù)設(shè)置為默認(rèn)值(0.9,0.999),L2懲罰設(shè)置為0,每次迭代計(jì)算的樣本大小batch_size設(shè)置為32,循環(huán)訓(xùn)練的次數(shù)設(shè)置為100次.隨著迭代次數(shù)的增加,計(jì)算并記錄分類準(zhǔn)確率和損失函數(shù)的趨勢.本次實(shí)驗(yàn),分別對數(shù)據(jù)增強(qiáng)前后的樣本形成的數(shù)據(jù)集,以及兩種鋼筋圖片混合前后的樣本形成的數(shù)據(jù)集進(jìn)行了訓(xùn)練,并分析了實(shí)驗(yàn)結(jié)果.
本次研究的是一個多分類的問題,選擇交叉熵作為損失函數(shù).損失函數(shù)用于估計(jì)模型的預(yù)測值與真實(shí)值之間的差異.它是一個非負(fù)的實(shí)值函數(shù).訓(xùn)練模型的過程就是利用梯度下降優(yōu)化算法不斷迭代計(jì)算,使損失函數(shù)越來越小.交叉熵?fù)p失函數(shù)通常用于分類問題,尤其是使用神經(jīng)網(wǎng)絡(luò)進(jìn)行分類時[21].公式(4)給出了多分類問題交叉熵?fù)p失函數(shù)的一般形式.
(4)
Adam算法具有實(shí)現(xiàn)簡單,計(jì)算高效,對內(nèi)存需求少并且能自動調(diào)節(jié)學(xué)習(xí)率等優(yōu)點(diǎn),因此本文采用Adam算法迭代優(yōu)化ResNet50學(xué)習(xí)鋼筋銹蝕率的分類.以數(shù)據(jù)增強(qiáng)后直徑12 mm鋼筋的圖像樣本構(gòu)成的數(shù)據(jù)集(15 904張)為例,將圖片小批量送入模型學(xué)習(xí),對迭代過程的精度和損失函數(shù)的變化進(jìn)行記錄和趨勢分析,其結(jié)果如圖12所示.
圖12 直徑12 mm鋼筋數(shù)據(jù)集迭代結(jié)果
從圖12可以看出,訓(xùn)練過程中,損失函數(shù)總體呈下降趨勢,這表示通過每次小批量的學(xué)習(xí),模型的預(yù)測輸出和真實(shí)值之間的偏差在降低;迭代次數(shù)-準(zhǔn)確率曲線隨著迭代次數(shù)的增加上升,這表明模型隨著參數(shù)更新過程泛化能力得到提高,從而能精確地對測試集中的銹蝕鋼筋進(jìn)行分類.同時,觀測到準(zhǔn)確度曲線的曲率在變小,最初的30次迭代準(zhǔn)確度就已經(jīng)提升了50%,達(dá)到80%左右,而最后的30次迭代準(zhǔn)確度提升不到1%.這表明隨著迭代次數(shù)增加,準(zhǔn)確度提升的難度變大,模型越難學(xué)習(xí)到新的知識.最后30次的學(xué)習(xí)體現(xiàn)出模型得到充分的學(xué)習(xí),其實(shí)驗(yàn)結(jié)果能代表模型充分收斂后的分類表現(xiàn).過多的訓(xùn)練次數(shù)并沒有使得準(zhǔn)確率大幅下降.雖然當(dāng)?shù)?xùn)練80次時,針對測試集的分類準(zhǔn)確率發(fā)生了波動,此時模型錯過全局最優(yōu)解,但是由于殘差網(wǎng)絡(luò)的結(jié)構(gòu)特性,訓(xùn)練很快得到糾正,并沒有出現(xiàn)網(wǎng)絡(luò)退化的現(xiàn)象.最終當(dāng)數(shù)據(jù)集迭代學(xué)習(xí)100次時,測試集中分類準(zhǔn)確率達(dá)到98.2%,并且在數(shù)據(jù)集上收斂成功.
為了驗(yàn)證所提模型的有效性,本次研究還設(shè)計(jì)了基于不同的深度學(xué)習(xí)模型對相同數(shù)據(jù)集的分類訓(xùn)練,其結(jié)果如表1所示.通過對比結(jié)果可知,采用Adam優(yōu)化的ResNet50的模型進(jìn)行圖像分類的準(zhǔn)確率最高.
本次試驗(yàn)共計(jì)23 648個圖像數(shù)據(jù)樣本,根據(jù)樣本中包含的鋼筋直徑類型和是否使用數(shù)據(jù)增強(qiáng)技術(shù),可以組合生成6個數(shù)據(jù)集,如表2所示.將這6個數(shù)據(jù)集先后放入Adam優(yōu)化的ResNet50的網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,并保持超參一致,最后以分類準(zhǔn)確率、預(yù)測偏高率和預(yù)測偏低率作為評估標(biāo)準(zhǔn).實(shí)驗(yàn)結(jié)果詳見表2.
表2 銹蝕鋼筋圖像分類結(jié)果
首先驗(yàn)證框架中的數(shù)據(jù)增強(qiáng)對于模型學(xué)習(xí)和檢測能力的提升.對比觀察表2數(shù)據(jù)增強(qiáng)前后的結(jié)果可知,采用數(shù)據(jù)增強(qiáng)后的照片作為樣本進(jìn)行分類的準(zhǔn)確率,比采用數(shù)據(jù)增強(qiáng)前的原照片提升了5%左右.可見增加樣本數(shù)量能提升模型學(xué)習(xí)鋼筋銹蝕特征的能力,進(jìn)而提升檢測效果.同時,數(shù)據(jù)增強(qiáng)前的預(yù)測偏高率和預(yù)測偏低率大致相同,并且數(shù)據(jù)增強(qiáng)后也能得到相同的結(jié)論,說明數(shù)據(jù)增強(qiáng)并沒有改變數(shù)據(jù)集中各類樣本的分布,不會導(dǎo)致模型失偏.
其次驗(yàn)證框架對于單一直徑類型的銹蝕鋼筋的分類能力.通過觀察表2可以發(fā)現(xiàn),采用數(shù)據(jù)增強(qiáng)技術(shù)后,模型對于直徑12或14 mm的銹蝕鋼筋的分類準(zhǔn)確率均保持在98%以上,這說明本文提出的框架適應(yīng)實(shí)際工程中的不同直徑的銹蝕鋼筋分類,這一結(jié)果支撐本文框架的工程化.雖然直徑12 mm鋼筋的圖像樣本數(shù)量約是直徑14 mm鋼筋的兩倍多,但前者分類的準(zhǔn)確率略低于后者.這一結(jié)果可能是因?yàn)橹睆?4 mm的鋼筋直徑更大,在照片中占據(jù)的像素點(diǎn)更多,而與分類無關(guān)的背景所占的像素點(diǎn)更少.因此每一張照片蘊(yùn)含的信息量更豐富,使模型更能學(xué)習(xí)到銹蝕的高維特征.
最后,驗(yàn)證一個框架同時分類多種直徑的銹蝕鋼筋的能力.如表2所示,對數(shù)據(jù)增強(qiáng)后包含兩種鋼筋直徑圖像樣本的數(shù)據(jù)集,模型的檢測能力是最強(qiáng)的,分類準(zhǔn)確率達(dá)到98.8%.這一現(xiàn)象是由兩種原因?qū)е碌?第一,深層網(wǎng)絡(luò)和多尺寸數(shù)據(jù)集相互作用的結(jié)果.多尺寸的鋼筋的銹蝕情況幫助了模型學(xué)習(xí)銹蝕的特征,殘差網(wǎng)絡(luò)的深層網(wǎng)絡(luò)和跳躍連接設(shè)計(jì)使得模型在足夠多的訓(xùn)練輪次中學(xué)習(xí)到了這些混合的特征并沒有導(dǎo)致網(wǎng)絡(luò)退化.第二,更多的樣本量.兩個尺寸樣本集的疊加使得數(shù)據(jù)規(guī)模是兩者之和,更多的數(shù)據(jù)量理論上能訓(xùn)練泛化性能更好的模型.這一結(jié)論使本文框架能同時檢測多種直徑鋼筋的銹蝕程度,這將在實(shí)際工程中更有意義.
1) 本研究基于殘差網(wǎng)絡(luò)模型,設(shè)計(jì)了應(yīng)用于除銹鋼筋表面形態(tài)圖像數(shù)據(jù)的自動快速分類方法,結(jié)合銹蝕鋼筋質(zhì)量損失率,創(chuàng)新性地將鋼筋表面形態(tài)圖像分類與鋼筋銹蝕率定量評價關(guān)聯(lián)起來,為幫助實(shí)現(xiàn)工程現(xiàn)場環(huán)境中,鋼筋銹蝕程度的定量評價提供了新思路和實(shí)驗(yàn)研究基礎(chǔ).
2) 本研究按鋼筋銹蝕率不同共分為11類,其中前10類涵蓋銹蝕率區(qū)間[0, 30%),每類區(qū)間寬度均為3%,能較好地滿足實(shí)際工程中鋼筋銹蝕程度定量評價的精度要求.
3) 本研究通過優(yōu)化殘差網(wǎng)絡(luò)模型、數(shù)據(jù)增強(qiáng)和參數(shù)調(diào)節(jié)等方法,提高對銹蝕鋼筋表面特征的學(xué)習(xí)能力,進(jìn)而改善分類準(zhǔn)確率.實(shí)驗(yàn)結(jié)果表明,本次所提方法,對6類包含不同直徑和銹蝕率的鋼筋圖像樣本數(shù)據(jù)集,11類的分類準(zhǔn)確率均在93%以上,最高可達(dá)98.8%,能較好地適應(yīng)鋼筋類型較復(fù)雜的實(shí)際情況.