亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)YOLOv5 的路面裂縫檢測方法*

        2024-04-18 05:08:46王向前成高立夏曉華
        電子技術(shù)應(yīng)用 2024年3期
        關(guān)鍵詞:實(shí)驗(yàn)檢測模型

        王向前,成高立,胡 鵬,夏曉華

        (1.陜西高速機(jī)械化工程有限公司,陜西 西安 710038;2.長安大學(xué) 公路養(yǎng)護(hù)裝備國家工程研究中心,陜西 西安 710064)

        0 引言

        近年來,我國公路蓬勃發(fā)展,公路保養(yǎng)維護(hù)任務(wù)貫穿路面整個(gè)使用階段[1]。在裂縫出現(xiàn)初期及時(shí)實(shí)現(xiàn)病害檢測并修復(fù),可有效地減緩或防止初期裂縫的惡化,對于提高路面使用壽命、保障行車安全具有重要意義。

        路面裂縫檢測方法主要有3 種:傳統(tǒng)的人眼觀察識(shí)別方法主觀性強(qiáng);常規(guī)圖像處理方法存在開發(fā)成本大、檢測精度不高等問題;卷積神經(jīng)網(wǎng)絡(luò)相較于常規(guī)圖像處理方法具有泛化性好、開發(fā)成本低等優(yōu)點(diǎn),但存在模型體積較大、檢測精度有待提高的問題。文獻(xiàn)[2]通過實(shí)驗(yàn)表明R-CNN 系列、SPP-net 和SSD 等現(xiàn)有卷積神經(jīng)網(wǎng)絡(luò)模型體積較大;文獻(xiàn)[3]證明YOLO 的參數(shù)量較上述目標(biāo)檢測算法較少。但YOLO[3-4]系列算法在實(shí)際應(yīng)用中依然存在模型體積大、裂縫檢測精度不高等問題[5]。

        因此,為減少YOLO 系列模型體積,本文首先利用輕量級(jí)網(wǎng)絡(luò)MobileNetv3 代替YOLOv5 的主干網(wǎng)絡(luò)[6-7]。其次,為提高模型的表征能力,在其主干網(wǎng)絡(luò)末端加入嵌有Transformer[8]的C3TR 模塊。此外,文獻(xiàn)[9]在YOLOv4 中加入卷積注意力模塊(Convolutional Block Attention Module,CBAM)[10]、文獻(xiàn)[11]在Faster-RCNN 中加入CBAM 模塊,對細(xì)小裂縫的檢測能力都有提升。鑒于此,在C3TR 模塊后引入CBAM 模塊。最后,將CIOU損失函數(shù)替換為回歸性能較好的損失函數(shù)(Efficient Intersection-Over-Union,EIOU)[12],提升模型的魯棒性。

        1 航拍路面圖像的裂縫檢測方法

        1.1 裂縫檢測方法

        本文提出一種基于輕量化網(wǎng)絡(luò)的無人機(jī)航拍圖像裂縫檢測方法,如圖1 所示。通過無人機(jī)搭載云臺(tái)相機(jī)采集瀝青路面圖像,并對其進(jìn)行預(yù)處理,包括數(shù)據(jù)幀截取、剔除相似度高的圖像。用LabelImg 標(biāo)注工具標(biāo)記圖像,并對數(shù)據(jù)進(jìn)行增強(qiáng),建立瀝青路面裂縫數(shù)據(jù)集,接著隨機(jī)劃分訓(xùn)練集、驗(yàn)證集。訓(xùn)練集用于模型訓(xùn)練;驗(yàn)證集用于模型性能驗(yàn)證;測試集用于檢驗(yàn)?zāi)P偷念A(yù)測效果。

        圖1 瀝青路面裂縫檢測方法

        1.2 YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)

        YOLOv5 是one-stage 目標(biāo)檢測算法的典型代表,其網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。

        圖2 YOLOv5 模型結(jié)構(gòu)

        YOLOv5 在YOLOv4 基礎(chǔ)上對網(wǎng)絡(luò)層、數(shù)據(jù)預(yù)處理、損失函數(shù)、訓(xùn)練策略和模型優(yōu)化等層面進(jìn)行了優(yōu)化。YOLOv5 中有5 種網(wǎng)絡(luò)深度和寬度不同的模型,面對不同場景具有更好的適應(yīng)性。YOLOv5 使用了Leaky ReLU 激活函數(shù)和空間金字塔池化融合(Spatial Pyramid Pooling Fusion,SPPF)[13],池化速度得到了提升。采用路徑聚合網(wǎng)絡(luò)(Path Aggregation Network,PAN)和特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network,FPN)[14-15]結(jié)構(gòu)實(shí)現(xiàn)不同尺度特征間的融合。此外,YOLOv5 中采用Mosaic方法對輸入數(shù)據(jù)采用隨機(jī)旋轉(zhuǎn)、抖動(dòng)、縮放和裁剪等方式進(jìn)行增強(qiáng)。YOLOv5 中對損失函數(shù)進(jìn)行正則化優(yōu)化,增強(qiáng)了網(wǎng)絡(luò)檢測小目標(biāo)的性能。YOLOv5 采用余弦退火學(xué)習(xí)率調(diào)度策略[16]進(jìn)行訓(xùn)練調(diào)度,能有效地避免過擬合。YOLOv5 還采用TorchScript 對模型進(jìn)行自動(dòng)優(yōu)化,使模型在CPU 和GPU 上運(yùn)行更加高效。

        2 YOLOv5 網(wǎng)絡(luò)優(yōu)化

        2.1 MobileNetv3 網(wǎng)絡(luò)

        深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)模型體積通常較大,不易在邊緣化設(shè)備上部署。為解決這一問題,將YOLOv5 的主干網(wǎng)絡(luò)替換為MobileNetv3 網(wǎng)絡(luò),以降低模型大小。MobileNetv3 是一種采用深度可分離卷積等輕量化技術(shù)的卷積神經(jīng)網(wǎng)絡(luò)。深度可分離卷積通過逐通道卷積和逐點(diǎn)卷積兩個(gè)步驟來實(shí)現(xiàn)卷積操作,如圖3 所示。它使用3 個(gè)相同的卷積核對3 個(gè)通道同時(shí)進(jìn)行卷積運(yùn)算,最后使用一個(gè)卷積核對前3 個(gè)卷積的結(jié)果進(jìn)行卷積運(yùn)算。相比于普通標(biāo)準(zhǔn)卷積,深度可分離卷積參與運(yùn)算的參數(shù)更少。

        圖3 深度可分離卷積

        2.2 CBAM 模塊

        在卷積神經(jīng)網(wǎng)絡(luò)中,注意力可以增強(qiáng)模型對目標(biāo)特征的關(guān)注,從而提高檢測性能。CBAM 模塊是一種混合注意力模塊,結(jié)構(gòu)如圖4 所示,包括空間注意力模塊(Spatial Attention Module,SAM)和通道注意力模塊(Channel Attention Module,CAM)。SAM 和CAM 以串行方式連接,CAM 先處理通道信息,SAM 則在CAM 的輸出上進(jìn)行操作。CAM 部分使用最大池化和平均池化操作后,通過共享參數(shù)的神經(jīng)網(wǎng)絡(luò)生成兩個(gè)權(quán)重向量,相加后得到一個(gè)通道維度的注意力權(quán)重。這個(gè)權(quán)重被應(yīng)用到原始輸入特征圖上,自適應(yīng)地調(diào)整不同通道的重要性。SAM 部分的輸入來自CAM 的輸出,首先對輸入進(jìn)行最大池化和平均池化操作,然后將結(jié)果堆疊成一個(gè)特征圖。再通過卷積層將其壓縮為一個(gè)通道數(shù)為1 的特征圖。這個(gè)特征圖的sigmoid 函數(shù)計(jì)算生成了空間維度上的注意力權(quán)重,它被應(yīng)用到輸入特征圖上以獲得具有空間信息的特征圖。CBAM 有助于更好地捕捉裂縫特征信息,從而提高模型的表征能力,進(jìn)而提高檢測性能。

        圖4 CBAM 注意力機(jī)制模塊結(jié)構(gòu)

        2.3 C3TR 模塊

        C3TR 模塊是基于Transformer 的算法,在區(qū)分目標(biāo)特征和背景特征方面具有強(qiáng)大的優(yōu)勢,將其嵌入到DNN中使網(wǎng)絡(luò)擁有更強(qiáng)的特征提取能力。Transformer 是一種基于編碼器-解碼器結(jié)構(gòu)的網(wǎng)絡(luò)結(jié)構(gòu)[17],如圖5 所示,由6 個(gè)相同的編碼器、解碼器串聯(lián)而成。

        圖5 Transformer 網(wǎng)絡(luò)結(jié)構(gòu)

        編碼器由堆疊式多頭注意力機(jī)制和前饋神經(jīng)網(wǎng)絡(luò)(Feed Forward Neutral Network,FFN)構(gòu)成。多頭注意力機(jī)制由自注意力機(jī)制構(gòu)成,不僅關(guān)注當(dāng)前結(jié)點(diǎn)處特征,還能兼顧全局特征之間的相關(guān)性。FFN 則不斷更新來自上層多頭注意力輸出的信息。

        2.4 損失函數(shù)優(yōu)化

        損失函數(shù)在目標(biāo)檢測中衡量模型預(yù)測值和真實(shí)值之間的差異,其選擇是至關(guān)重要的。好的損失函數(shù)可使網(wǎng)絡(luò)準(zhǔn)確、快速地檢測出目標(biāo)。

        YOLOv5 采用復(fù)合式損失函數(shù),由定位損失、置信度損失和類別損失三者的加權(quán)和構(gòu)成。原始的YOLOv5損失函數(shù)CIOU 兼顧了預(yù)測框和真實(shí)框之間的重疊度、中心點(diǎn)距離以及寬高比例等因素,但采用寬高比例來實(shí)現(xiàn)寬高的牽制,導(dǎo)致預(yù)測框不能同時(shí)增大或縮小,從而阻礙了模型的快速收斂。為此,將CIOU 替換為EIOU 損失函數(shù),其利用真實(shí)寬高來實(shí)現(xiàn)寬高的牽制,提高了模型的收斂速度和檢測精度。

        融合了上述方法之后,前12 層為MobileNetv3 結(jié)構(gòu),第13 層、14 層、15 層分別為C3TR 模塊、CBAM 模塊、SPPF 模塊。

        3 實(shí)驗(yàn)

        3.1 數(shù)據(jù)集制作與實(shí)驗(yàn)環(huán)境搭建

        數(shù)據(jù)集的制作包含瀝青路面圖像采集、裂縫標(biāo)記和圖像增強(qiáng)3 部分。其中,SG906 PR0 無人機(jī)搭載云臺(tái)相機(jī)共采集2 000 張分辨率為1 920×1 080 的道路裂縫圖像。隨后,隨機(jī)挑選出1 311 張圖像作為測試集,并從余下的圖像中選擇相似度不高的271 張圖像,并采用LabelImg 工具進(jìn)行標(biāo)記,部分示例如圖6 所示。之后,采用旋轉(zhuǎn)、縮放等多種增強(qiáng)方式對數(shù)據(jù)進(jìn)行5 倍擴(kuò)充,擴(kuò)充后的數(shù)據(jù)集規(guī)模達(dá)1 626 張圖像。最后,將訓(xùn)練集和驗(yàn)證集按9∶1 的比例隨機(jī)劃分,最終訓(xùn)練集有1 464 張圖像,驗(yàn)證集有162 張圖像。

        圖6 部分?jǐn)?shù)據(jù)集示例

        消融實(shí)驗(yàn)在臺(tái)式機(jī)上進(jìn)行,實(shí)驗(yàn)環(huán)境如表1 所示。

        表1 實(shí)驗(yàn)環(huán)境

        3.2 評(píng)價(jià)指標(biāo)

        實(shí)驗(yàn)采用平均精度均值(mean Average Precision,mAP)、模型大小和檢測速度(FPS)作為評(píng)價(jià)指標(biāo)。其中,mAP由精確率(P)和召回率(R)兩個(gè)指標(biāo)組成,如式(1)~式(3)。另外,F(xiàn)PS 是指模型在測試集上每秒完成預(yù)測的圖像數(shù)量。模型大小則是指模型文件的大小,通常使用MB 或GB 作為單位。

        式中,TP 為裂縫被識(shí)別為裂縫的樣本數(shù),TN 為背景被識(shí)別為背景的樣本數(shù),F(xiàn)P 為背景被識(shí)別為裂縫的樣本數(shù),F(xiàn)N 為裂縫被識(shí)別為背景的樣本數(shù)。本文在置信度閾值為0.5 時(shí)進(jìn)行mAP 值的比較,當(dāng)預(yù)測框和真實(shí)框的交叉比(Intersection of Union,IoU)大于0.5 時(shí),則確定當(dāng)前樣本為裂縫;當(dāng)兩框的IoU 大于0 小于0.5 時(shí),確定當(dāng)前樣本為背景;當(dāng)兩框的IoU 為0 時(shí),表示沒有真實(shí)框。

        3.3 網(wǎng)絡(luò)參數(shù)設(shè)置

        網(wǎng)絡(luò)訓(xùn)練中使用梯度下降算法優(yōu)化模型權(quán)重參數(shù),采用SGD 優(yōu)化器更新參數(shù),不斷減小真實(shí)值和預(yù)測值之間的差異,提升檢測性能。初始學(xué)習(xí)率為0.001,采用余弦退火策略調(diào)整學(xué)習(xí)率,先增后減,加速模型收斂并避免過擬合。Batch-size(每個(gè)訓(xùn)練批次處理的圖像數(shù)量)為16,worker(多線程)設(shè)置為4,以提高訓(xùn)練速度。共進(jìn)行500 個(gè)epoch 的訓(xùn)練,輸入圖像分辨率設(shè)為640×640。模型采用遷移學(xué)習(xí)策略,首先在DOTA[5]數(shù)據(jù)集上預(yù)訓(xùn)練權(quán)重,再通過權(quán)重共享微調(diào)到本文數(shù)據(jù)集。

        3.4 消融實(shí)驗(yàn)

        本次消融實(shí)驗(yàn)設(shè)置了5 組實(shí)驗(yàn),分別驗(yàn)證了添加輕量級(jí)網(wǎng)絡(luò)MobileNetv3、C3TR 模塊、CBAM 模塊和替換CIOU 損失函數(shù)4 種方法對裂縫檢測性能的影響,訓(xùn)練過程如圖7 所示,圖7(a)表示訓(xùn)練批次-損失值曲線,圖7(b)表示訓(xùn)練批次-精度曲線。消融實(shí)驗(yàn)結(jié)果如表2 所示。不同實(shí)驗(yàn)的部分檢測效果如圖8 所示。

        表2 消融實(shí)驗(yàn)結(jié)果

        圖7 消融實(shí)驗(yàn)訓(xùn)練過程

        圖8 消融實(shí)驗(yàn)部分檢測結(jié)果

        由表2 可知,實(shí)驗(yàn)2 在實(shí)驗(yàn)1 的基礎(chǔ)上,使用Mobile-Netv3 作為YOLOv5 主干網(wǎng)絡(luò),模型大小減小了55%,檢測速度提高,但檢測精度下降5.7%。實(shí)驗(yàn)3 在實(shí)驗(yàn)2 的基礎(chǔ)上嵌入C3TR 模塊,模型大小和檢測速度基本不變,但檢測精度提高了2.9%。實(shí)驗(yàn)4 在實(shí)驗(yàn)3 的基礎(chǔ)上引入CBAM 模塊,模型大小基本不變,檢測精度提高了0.8%。實(shí)驗(yàn)5 在實(shí)驗(yàn)4 的基礎(chǔ)上使用EIOU 損失函數(shù),檢測精度提高了3.2%,而檢測速度未受影響。綜上所述,MobileNetv3 降低了模型大小并提高了檢測速度,但犧牲了一些檢測精度。C3TR 模塊、CBAM 模塊和EIOU 損失函數(shù)都對提高檢測精度有幫助,而且計(jì)算成本相對較低,適用于邊緣化設(shè)備。

        3.5 對比實(shí)驗(yàn)

        為驗(yàn)證本文改進(jìn)方法的有效性,將其與YOLOv5、Faster-RCNN[18-20]模型、YOLOX[21]模型和Efficientdet[22]模型進(jìn)行對比,對比結(jié)果如表3 所示。

        表3 不同模型對路面裂縫的檢測效果

        結(jié)果表明,本文提出的改進(jìn)方法相較于Faster RCNN 模型、YOLOX 模型和Efficientdet 模型,在mAP@0.5、模型大小和檢測速度3 方面都表現(xiàn)更好,驗(yàn)證了本文改進(jìn)方法的有效性。

        4 結(jié)論

        本文提出一種基于MobileNetv3 輕量化網(wǎng)絡(luò)的無人機(jī)航拍圖像裂縫檢測方法,旨在實(shí)現(xiàn)準(zhǔn)確且高效的路面裂縫檢測。該方法利用輕量化的Mobilenetv3 網(wǎng)絡(luò)作為YOLOv5 主干網(wǎng)絡(luò),降低了模型的大小,從而更容易在移動(dòng)平臺(tái)上部署。此外,引入了C3TR 模塊和CBAM 模塊,增強(qiáng)了網(wǎng)絡(luò)對裂縫特征的提取能力,并采用EIOU 損失函數(shù)提高模型的魯棒性。通過消融實(shí)驗(yàn)和與其他目標(biāo)檢測模型的對比,證明了該改進(jìn)方法的有效性,具備在路面裂縫檢測領(lǐng)域廣泛應(yīng)用的潛力,為路面養(yǎng)護(hù)提供了重要支持。

        猜你喜歡
        實(shí)驗(yàn)檢測模型
        一半模型
        記一次有趣的實(shí)驗(yàn)
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        做個(gè)怪怪長實(shí)驗(yàn)
        3D打印中的模型分割與打包
        NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
        亚洲av无码国产精品色午夜软件| 无码伊人久久大蕉中文无码| 色婷婷综合一区二区精品久久| 中文字幕人妻久久久中出| 久久99精品久久久久久噜噜| 中年熟妇的大黑p| 亚洲AV无码国产永久播放蜜芽| 在线视频一区二区三区中文字幕| 国产三级不卡一区不卡二区在线| 国产精品久久久久久一区二区三区| 亚洲国产精品久久久久秋霞影院| 手机看片国产日韩| 美女被搞在线观看一区二区三区| 亚洲美女av一区二区在线| 亚洲熟妇av日韩熟妇在线| 亚洲成a人片在线观看久| 色偷偷av一区二区三区人妖| 人妻少妇中文字幕,久久精品| 伊人久久大香线蕉av色| 大胆欧美熟妇xxbbwwbw高潮了| 制服丝袜人妻中出第一页| 久久一区二区av毛片国产| 国产美女精品视频线免费播放软件| 国产va免费精品观看| 国产精品乱子伦一区二区三区 | 春色成人在线一区av| 国产成人av区一区二区三| 隔壁老王国产在线精品| 久久棈精品久久久久久噜噜| 国产成人综合久久精品推荐免费 | 毛片网站视频| 精品国产一区二区三区男人吃奶 | 亚洲成a人片在线观看无码| 久久久亚洲精品午夜福利| 国产成人精品一区二区不卡| 无码人妻精品一区二区三区9厂| 亚洲国产av一区二区三区四区| av毛片在线播放网址| 亚洲高清国产一区二区| 野狼第一精品社区| 日韩欧美在线观看成人|