亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于GoogLeNet-CBAM船載圖像的滑坡識別方法

        2025-07-13 00:00:00郭江波李浩然洗進(jìn)業(yè)祝敏剛
        水利水電快報 2025年6期
        關(guān)鍵詞:特征模型

        0 引言

        滑坡災(zāi)害是河岸消落帶常見的自然災(zāi)害,對社會、經(jīng)濟和生態(tài)造成重大損失[1-2]。受水位波動的影響,這些地區(qū)容易發(fā)生山體滑坡,威脅到河流附近的道路、水路、水電站及水庫的安全[3-4]。因此,及時準(zhǔn)確地識別和監(jiān)測滑坡區(qū)域尤為重要。目前識別滑坡的方式包括地形分析、遙感技術(shù)和地質(zhì)調(diào)查。然而這些方法在應(yīng)對不斷變化的地質(zhì)條件方面仍存在諸多不足。例如,在準(zhǔn)確性和實時識別方面,傳統(tǒng)方法對特征提取的要求較高,需要高質(zhì)量的數(shù)據(jù)和詳細(xì)的注釋,應(yīng)用難度大大增加。遙感技術(shù)具有時效性強、覆蓋范圍廣和成本效益高等優(yōu)點,是滑坡識別領(lǐng)域的熱門研究方向[5-6]。盡管衛(wèi)星遙感在快速評估滑坡變化方面取得了一定成果,為滑坡識別提供了宏觀的視角[7-9],但其對河流兩岸地形深度的感知角度有限。單獨使用遙感數(shù)據(jù)時,在峽谷狹長河道中可能識別不準(zhǔn)確。相比之下,船載圖像可以從剖面視圖提供更清晰的滑坡圖像,有助于發(fā)現(xiàn)遙感圖像難以識別到的滑坡。船載圖像識別技術(shù)通過在船只上安裝高分辨率相機,沿河航行時拍攝兩岸地形,與傳統(tǒng)遙感影像相比,能提供更為詳盡的信息,在滑坡的早期預(yù)警和監(jiān)測方面表現(xiàn)優(yōu)越,且具備時空連續(xù)性的優(yōu)勢,能夠動態(tài)監(jiān)測地表變化[10]

        本文提出了一種基于多尺度特征融合的船載圖像庫區(qū)滑坡識別方法,結(jié)合了GoogLeNet網(wǎng)絡(luò)和空間-通道注意力機制(CBAM)。通過挖掘不同尺度特征之間的潛在相關(guān)性,融合多個不同大小卷積核的運算結(jié)果,以實現(xiàn)多尺度特征的協(xié)同效應(yīng)。該方法不僅可以提取不同尺度上的宏觀和微觀信息,還能通過跨尺度卷積捕捉它們之間的相互關(guān)系,從而融合宏觀和微觀層面之間的信息。本文將多尺度特征融合和空間-通道注意力機制應(yīng)用于船載圖像中的滑坡識別,成功構(gòu)建了一個較精確的識別模型,可為類似的研究提供一定參考。

        1 理論介紹

        1.1 GoogLeNet

        目前,常用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)架構(gòu)包括Alex-Net、VGG、GoogLeNet和ResNet等。GoogLeNet的Inception模塊通過組合多個不同尺寸的卷積核( 1×1 、3×3 和 5×5 以及最大池化層,從而在保持網(wǎng)絡(luò)深度的同時優(yōu)化計算效率[1]。這種多尺度并行卷積的設(shè)計,使得網(wǎng)絡(luò)能夠捕捉到圖像中的多層次特征信息,從宏觀到微觀,不同尺度的特征得以充分融合,從而提高了網(wǎng)絡(luò)的特征表達(dá)能力。同時,通過在每個Inception模塊中使用 1×1 卷積核,顯著減少了網(wǎng)絡(luò)的計算量和參數(shù)數(shù)量,實現(xiàn)了高效的計算性能。每一層卷積層之后都加入了激活函數(shù),選擇ReLU函數(shù)作為激活單元,其表達(dá)式如式(1)所示。

        GoogLeNet在保持計算資源消耗較低的同時,能夠進(jìn)行高效的特征提取和融合,特別適用于計算資源有限的實際應(yīng)用場景。鑒于此,本文選用GoogLeNet作為基準(zhǔn)網(wǎng)絡(luò)結(jié)構(gòu),為船載圖像庫區(qū)滑坡識別提供技術(shù)支持。模型網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

        圖1Inception模塊結(jié)構(gòu)Fig.1Inception module structure

        1.2空間-通道注意力機制(CBAM)

        空間-通道注意力機制(ConvolutionalBlockAt-tentionModule,CBAM)是一種用于增強卷積神經(jīng)網(wǎng)絡(luò)性能的注意力機制模塊[12]。它通過在每個卷積塊后引入注意力機制,動態(tài)調(diào)整特征圖的通道注意力和空間注意力,從而提升網(wǎng)絡(luò)在各種視覺任務(wù)中的表現(xiàn)。CBAM模塊包含兩個關(guān)鍵部分:通道注意力模塊(ChannelAttentionModule,CAM)和空間注意力模塊(SpatialAttentionModule,SAM)。通道注意力模通過全局平均池化和全連接層來學(xué)習(xí)每個通道的重要性權(quán)重,從而增強有用特征通道的響應(yīng),并抑制無用特征通道的響應(yīng)??臻g注意力模塊則通過利用通道間的相關(guān)性來增強有用特征的空間位置,增強特征圖的空間重要性。

        給定輸人特征圖 X∈Rc×H×W ,其中 c 是通道數(shù), H 和 W 是特征圖的高度和寬度。通道注意力模塊的輸出 XCAM 可以通過以下公式計算得到:

        XCAM=X?σ{MLP[AvgPool(x)]}

        式中: AvgPool 為全局平均池化操作; MLP 為多層感知機,通常包括至少一個全連接層和ReLU激活函數(shù); σ 為Sigmoid函數(shù),用于將輸出限制在[0,1]范圍內(nèi)。

        空間注意力模塊根據(jù)輸入特征圖的空間位置動態(tài)調(diào)整注意力權(quán)重,增強有用特征的空間位置,提升網(wǎng)絡(luò)在視覺任務(wù)中的性能表現(xiàn),其輸出 XSAM 可以通過式(3)計算得到:

        XSAM=X?γ{MLP[MaxPool(x)]}

        式中:MaxPool是全局最大池化操作; MLP 為多層感知機; γ 為 Sigmoid 函數(shù)。

        CBAM模塊(圖2)的引人可以有效提升卷積神經(jīng)網(wǎng)絡(luò)的表達(dá)能力和感知范圍,特別適用于需要更好特征表達(dá)和空間定位的視覺任務(wù)。

        圖2 CBAM結(jié)構(gòu)Fig.2 CBAM structure

        1.3GoogLeNet與CBAM注意力網(wǎng)絡(luò)

        將GoogLeNet結(jié)構(gòu)與CBAM注意力機制的網(wǎng)絡(luò)架構(gòu)用于船載圖像庫區(qū)滑坡識別,為進(jìn)一步增強網(wǎng)絡(luò)的表達(dá)和特征融合能力,引入了CBA模塊,結(jié)合通道注意力和空間注意力機制,動態(tài)調(diào)整特征圖的通道和空間維度權(quán)重,從而有效提升網(wǎng)絡(luò)的性能表現(xiàn)。

        在GoogLeNet與CBAM注意力網(wǎng)絡(luò)結(jié)構(gòu)中,僅使用 7×7 和 3×3 的卷積核而不使用 5×5 ,是因為 3×3 卷積核在多層疊加時能達(dá)到與 5×5 相似的感受野,同時計算效率更高,參數(shù)量更少;而 7×7 卷積核只用于初始層,可以快速捕捉大范圍特征,擴大感受野。這種組合既保留了模型的高效性,又兼顧了特征提取的豐富性。GoogLeNet與CBAM注意力網(wǎng)絡(luò)的具體結(jié)構(gòu)如表1所示。

        2 案例研究

        2.1 案例介紹

        三峽庫區(qū)是中國主要的生態(tài)脆弱區(qū)之一。該區(qū)域處于大巴山褶皺沖斷帶、川東褶皺沖斷帶和川鄂湘黔隆升褶皺帶3個構(gòu)造單元的交匯處,屬于中緯度地區(qū)的濕潤熱帶季風(fēng)氣候。由于降雨量豐富且分布不均,三峽庫區(qū)易發(fā)生干旱、內(nèi)澇等災(zāi)害[13]

        研究區(qū)域位于三峽庫區(qū)。選擇三峽庫區(qū)巫山段約30km 作為評估區(qū)域,用于評估本文所提出的滑坡識別方法性能。該案例數(shù)據(jù)來自Li等[14]研究中的公開數(shù)據(jù)集ship4landslide(https://doi. Δ)rg/10.6084/m9 figshare.21626339.v1),數(shù)據(jù)集中共收集了127個滑坡圖像樣本和767個非滑坡圖像樣本,見圖3。

        表1GoogLeNet與CBAM注意力網(wǎng)絡(luò)Tab.1GoogLeNet and CBAM attention network
        圖3數(shù)據(jù)集中不同船載圖像示例
        Fig.3Examplesofdifferentshipborneimagesinthe dataset

        2.2試驗條件與結(jié)果分析

        試驗使用的硬件和軟件環(huán)境如下:編程語言為Python3.9,內(nèi)存為32GB,顯卡為NVIDIAGeForceGTX3070Ti,配置CUDA和cuDNN以利用GPU加速深度學(xué)習(xí)計算,優(yōu)化器選用Adam優(yōu)化器,學(xué)習(xí)率為0.0003。在分類任務(wù)中,損失值是預(yù)測概率分布與真實值之間的距離,這需要交叉熵?fù)p失函數(shù)來計算差距。交叉熵?fù)p失函數(shù)見式(4):

        式中: n 為輸出類別; yi 為真實概率分布; 為預(yù)測概率分布。

        模型的準(zhǔn)確性評估采用準(zhǔn)確率(Accuracy)、精確度(Precision)召回率(Recall)和F1得分(F1Score)4種指標(biāo)。準(zhǔn)確率表示正確預(yù)測與總樣本的比例,召回率是所有正類別樣本被正確識別為正類別的比例。

        式中: TP 表示正確預(yù)測為正類的樣本數(shù); TN 表示正確預(yù)測為負(fù)類的樣本數(shù); FP 表示錯誤預(yù)測為正類的樣本數(shù); FN 表示錯誤預(yù)測為負(fù)類的樣本數(shù)。

        在試驗中, 70% 的滑坡數(shù)據(jù)集用于訓(xùn)練,其余的30% 用于測試。本文選用VGG19、GoogLeNet、Res-Net50 和DenseNet53模型作為對照組,所有模型均未進(jìn)行預(yù)訓(xùn)練,并使用相同的訓(xùn)練配置進(jìn)行比較。

        GoogLeNet-CBAM的識別準(zhǔn)確率達(dá)到了95.93% ,如圖4所示。與其他模型相比,它在準(zhǔn)確率、精度和F1得分方面表現(xiàn)最佳,而召回率略低于VGG19,即與VGG19模型相比,GoogLeNet-CBAM更容易將一幅非滑坡圖像錯誤分類為滑坡圖像,這可能是因為GoogLeNet的Inception模塊和CBAM注意力機制在特征提取時更加關(guān)注顯著特征,提升了精度,但可能忽略了部分邊緣或不明顯的正樣本,導(dǎo)致部分正樣本被漏檢??傮w上看,GoogLeNet-CBAM在準(zhǔn)確率、精確度和F1分?jǐn)?shù)方面均表現(xiàn)出顯著優(yōu)勢。

        圖4不同模型的預(yù)測結(jié)果指標(biāo)Fig.4Predictionresultsmetricsofdifferent models

        GoogLeNet-CBAM的混淆矩陣如表2所示。模型將10張滑坡圖像誤分為非滑坡圖像,這些代表性的錯誤匯總在圖5中。在圖5(a)中,可以看到正樣本(滑坡圖像)被誤分為非滑坡圖像。這類圖像的滑坡坡腳部分與河岸的消落帶相似,特別是在顏色上,與周圍地區(qū)缺乏明顯的形態(tài)差異,因此容易被錯誤分類。同時,圖5(b)展示了部分與之相似的非滑坡圖片,這些圖片也顯示出類似的特征,進(jìn)一步說明了模型在區(qū)分滑坡和非滑坡圖像方面的挑戰(zhàn)性。

        圖5測試集中正樣本誤被分為非滑坡的代表性圖 Fig.5Representative images of positive samples in thetestsetmisclassifiedasnon-landslides

        總體來說,GoogLeNet-CBAM通過多尺度特征提取,增強了滑坡圖像的特征表達(dá)和泛化能力,盡管其在滑坡圖像識別方面表現(xiàn)優(yōu)異,但由于不同尺度特征融合不足,其召回率低于VGG19。因此在后續(xù)的研究中,計劃進(jìn)一步改進(jìn)模型,以減少這種誤分類情況。例如,可以通過采用形態(tài)區(qū)分能力更強的注意力機制和提取能力更強的主干網(wǎng)絡(luò)結(jié)構(gòu)來提高模型的分類能力,增強模型在復(fù)雜環(huán)境中的識別能力,從而提高滑坡識別的準(zhǔn)確性和可靠性。

        3結(jié)論

        (1)本文提出了一種基于多尺度特征融合的船載圖像庫區(qū)滑坡識別方法。該方法結(jié)合了GoogLeNet網(wǎng)絡(luò)和空間-通道注意力機制(CBAM),顯著增強了滑坡圖像的特征表達(dá)和泛化能力。通過融合不同大小的卷積核,實現(xiàn)了多尺度特征的協(xié)同效應(yīng),有效彌合了宏觀和微觀層面之間的信息鴻溝。

        (2)該方法在滑坡圖像識別中效果顯著,識別準(zhǔn)確率達(dá)到了 95.93% 。相比其他模型如VGG19、Res-Net50和DenseNet53、GoogLeNet-CBAM在總體準(zhǔn)確率、精確度和F1得分方面表現(xiàn)最佳;盡管其召回率略低于VGG19,但在滑坡識別任務(wù)中仍展示了卓越的性能,且與基礎(chǔ)模型GoogLeNet相比,加入CBAM后性能有了顯著提升,充分證明了注意力機制在滑坡識別中的重要作用。

        (3)與傳統(tǒng)滑坡識別方法相比,該方法在模型預(yù)測精度上取得了顯著改進(jìn),驗證了多尺度特征融合和注意力機制在提升滑坡識別準(zhǔn)確性方面的重要性。未來的研究將進(jìn)一步改進(jìn)模型,采用更強的形態(tài)區(qū)分能力的注意力機制和主干網(wǎng)絡(luò)結(jié)構(gòu),以減少誤分類情況,提高滑坡識別的準(zhǔn)確性和可靠性。

        參考文獻(xiàn):

        [1]陳陸軍,易武,黃曉虎,等.譚家河滑坡監(jiān)測與精細(xì)化預(yù)警 模型研究[J].水利水電快報,2024,45(2):34-43.

        [2]LI C D,CRISS RE,F(xiàn)U Z Y,et al.Evolution characteristics and displacement forecasting model of landslides with stairstep sliding surface along the Xiangxi River,Three Gorges Reservoir Region,China[J].Engineering Geology,2021, 283 :105961.

        [3]湯羅圣.三峽庫區(qū)堆積層滑坡穩(wěn)定性與預(yù)測預(yù)報研究 [D].武漢:中國地質(zhì)大學(xué)(武漢),2013.

        [4]李德營.三峽庫區(qū)具臺階狀位移特征的滑坡預(yù)測預(yù)報研 究[D].武漢:中國地質(zhì)大學(xué)(武漢),2010.

        [5]MARCO S,LAURA L,VALENTINA M,et al. Remote sensing for landslide investigations:An overview of recent achievements and perspectives[J].Remote Sensing,2014,6 (10) :9600 -9652.

        [6]ZHONG C,LIU Y,GAO P,et al. Landslide mapping with remote sensing: challenges and opportunities[J]. International Journal ofRemote Sensing,2020,41(4) :1555 -1581.

        [7]趙蓓蓓,黃海峰,鄧永煌,等.基于 Sentinel-1A的三峽庫 區(qū)范家坪滑坡InSAR監(jiān)測分析[J].人民長江,2022,53 (10) :103 -107.

        [8]婁連惠,劉強,譚玉敏.基于高分辨率 SAR 的三峽庫區(qū)地 表形變分析——以巴東城區(qū)為例[J].人民長江,2021,52 (5) :114 -119.

        [9]李振洪,張成龍,陳博,等.一種基于多源遙感的滑坡防災(zāi) 技術(shù)框架及其工程應(yīng)用[J].地球科學(xué),2022,47(6):1901 -1916.

        [10]JIN D,LI J,GONG J,et al. Shipborne mobile photogrammetry for 3D mapping and landslide detection of the water - level fluctuation zone in the Three Gorges Reservoir Area, China[J]. Remote Sensing,2021:13(5):1007.

        [11]SZEGEDY C,LIU W,JIA Y,et al. Going deeper with convolutions[C]//IEEE.2015 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).New York: IEEE, 2015.

        [12]WOO S,PARK J,LEE J Y,et al. CBAM: Convolutional Block Attention Module[C]//FERRARIV,Hebert M, SMINCHISESCU C,etal.Computer Vision- ECCV.Ber

        onshipborne images and deep learning models:a case study intheThree Gorges Reservoir Area in China[J].Landslides,2022,20:547-558.

        (編輯:高小雲(yún))

        Landslide recognition method for shipborne images based on GoogLeNet-CBAM

        GUO Jiangbo1,LI Haoran' ,XIAN Jinye2,ZHU Mingang3 (1.ShaniEenggdceCdi'utyn versityofGeosciences(Wuhan),Wuhan430O4,China;3.POWERChinaUrbanPlaningamp;DesignInstituteCo.,Ltd.Guangzhou 511466,China)

        Abstract:Aiming at the common landslide disasters in the riverbank subsidence zones,we proposed a shipbore landslide detection method basedonmulti-scale feature fusion(GoogLeNet)and ConvolutionalBlock AtentionModule (CBAM).Using GoogLeNet asthe base network structure,the method employed Inception modules for paralel convolutionof multi-scale features toeffctivelycapture multi-levelfeature information from macro to micro scales.Furthermore,the CBAM module dynamicalladjusted channel and spatial dimension weightsof feature maps,significantly enhancing the network's expressive power and the saliency of landslide regions.Experimental results demonstrated that the proposed method achieves a high accuracy of 95.93% inthe recognition of landslide images in Wushan section of the Three Gorges Reservoir Area,which was about 3O kilometers. Compared with other models such as VGG19,ResNet50, and DenseNet53,the method showed asignificant improvements inaccuracy,precision,andF1 score.Despiteaslightly lower recallrate compared to VGG19,theoverall performance was outstanding.The research resultscan provide a technical support for geological disaster prevention and management.

        Key words:multi-scale feature fusion;GoogLeNet;CBAM;shipborme image;landslide recognition;remote sensing technology

        猜你喜歡
        特征模型
        一半模型
        抓住特征巧觀察
        重要模型『一線三等角』
        新型冠狀病毒及其流行病學(xué)特征認(rèn)識
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達(dá)“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        黑人免费一区二区三区| 亚洲∧v久久久无码精品| 四虎影视国产在线观看精品| 日韩精品一区二区三区中文9| 亚洲乱妇熟女爽到高潮视频高清| 夜夜高潮夜夜爽国产伦精品| 丰满爆乳一区二区三区| 国产精品成人av电影不卡| 中文字日产幕码三区做法| 久久久久88色偷偷| 成人亚洲性情网站www在线观看| 国产精品色内内在线播放| 日本一区二区三区综合视频| 日韩av午夜在线观看| 久久久久国产精品免费免费搜索| 亚洲AV日韩Av无码久久| 三级国产高清在线观看| 日本又色又爽又黄的a片18禁| 蜜桃臀无码内射一区二区三区| 色窝综合网| 最近更新中文字幕一区二区| 欧美牲交a欧美牲交aⅴ免费真| 丰满岳乱妇在线观看中字无码| 中文字幕在线人妻视频| 成人大片免费观看视频| 末发育娇小性色xxxx| 亚洲第一无码精品久久| 日本中文字幕官网亚洲| 天堂中文а√在线| 精品一区二区三区无码视频| 国产一区二区三区视频大全| 国产乱精品女同自线免费| 中文字幕+乱码+中文字幕一区| 亚洲综合色区无码专区| 国产在线观看黄片视频免费| 粗大的内捧猛烈进出看视频| 精品一品国产午夜福利视频| 中文字幕在线人妻视频| 东北女人啪啪对白| 免费观看又色又爽又黄的韩国| 国产桃色精品网站|