廉慧潔,王維高,朱軍,唐苒然,謝亞坤
1. 西南交通大學(xué) 地球科學(xué)與環(huán)境工程學(xué)院,成都 610097;
2. 四川省交通勘察設(shè)計研究院有限公司,成都 610031
公路作為國家經(jīng)濟(jì)建設(shè)和國防建設(shè)中最重要的基礎(chǔ)設(shè)施之一,其地位及作用越來越顯著,是國民經(jīng)濟(jì)發(fā)展的重要支撐(李朝鋒,2006)。以往公路數(shù)據(jù)的采集方式包括實地采集、文字資料獲取、移動車載掃描等手段,但存在成本較高或效率低的問題。隨著遙感技術(shù)的迅猛發(fā)展,遙感影像中的公路網(wǎng)已成為公路信息系統(tǒng)的巨大數(shù)據(jù)源,信息化、智能化成為公路信息獲取的必然趨勢(項皓東,2013;林報嘉等,2020;魯?shù)螺x,2020)。因此,如何利用高分辨率遙感影像進(jìn)行自動化的公路信息提取具有重要的理論和現(xiàn)實意義。
傳統(tǒng)的道路提取方法主要包括基于像元的和面向?qū)ο蟮膬煞N?;谙裨倪b感影像道路提取方法是以單個像元為最小處理單位,通過對各像元灰度值與道路灰度閾值進(jìn)行對比從而進(jìn)行道路信息提??;左娟和李勇軍(2013)利用遙感影像的紋理特征和光譜特征提取了較為完整的道路骨干形態(tài),但仍然無法消除樹木和建筑物等環(huán)境因素的影響。基于像元的道路提取方法簡單易實現(xiàn),但提取結(jié)果有較大的噪聲,智能化程度低(Wang 等,2014;Shi 等,2014;Shanmugam 和 Kaliaperumal,2016)。面向?qū)ο蟮牡缆诽崛》椒ㄍㄟ^將影像看作多個具有相近性質(zhì)的對象集合進(jìn)行道路提?。↘umar 等,2014);周愛霞等(2017)在eCognition 遙感圖像處理平臺上對IKONOS 影像進(jìn)行了面向?qū)ο蟮牡缆诽崛?。面向?qū)ο蟮牡缆诽崛》椒ㄔ诳乖胄陨嫌幸欢ㄌ嵘崛⌒Ч膬?yōu)劣很大程度上取決于影像分割結(jié)果的質(zhì)量(張永宏等,2018;王卓等,2020)??傊瑐鹘y(tǒng)方法需要人工分析道路特征并制定語義約束規(guī)則集,多針對圖像清晰、背景簡單且道路類型單一的遙感圖像,對高層次知識的利用程度偏低,影像分類的智能化、自動化程度不高(王偉超和鄒維寶,2013)。
近年來,隨著人工智能技術(shù)的發(fā)展,遙感影像處理有了新的研究方式?;谏疃葘W(xué)習(xí)的目標(biāo)提取方法與傳統(tǒng)方法最大的區(qū)別在于不需人為給出道路特征,在背景復(fù)雜多樣、圖像特征類似且道路類型多變的遙感圖像中也能夠得到較高的提取精度(宋廷強(qiáng)等,2021)。魏清等(2019)針對樹木陰影等自然環(huán)境的影響問題,將卷積神經(jīng)網(wǎng)絡(luò)和數(shù)學(xué)形態(tài)學(xué)算法相結(jié)合進(jìn)行自動化道路提取。Mnih(2013)利用一種基于圖像塊(patch-based)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行道路提取,取得了較好的道路提取效果。目前,在圖像分割領(lǐng)域最為常用的U-Net(u-shaped network)模型,以獨特的“U”形對稱結(jié)構(gòu)、精準(zhǔn)的跨越連接結(jié)構(gòu)以及高效的上采樣手段使得其不僅能夠彌補(bǔ)全卷積神經(jīng)網(wǎng)絡(luò)(fully convolutional network,F(xiàn)CN)池化過程中的信息損失,還能夠?qū)崿F(xiàn)多尺度圖像信息的融合,改造性強(qiáng)且訓(xùn)練速度快(楊佳林等,2021)。該方法雖然獲得了較好的道路信息提取效果,但存在神經(jīng)網(wǎng)絡(luò)隱藏層信息利用不充分的問題。公路在功能應(yīng)用、路線設(shè)計及分級標(biāo)準(zhǔn)方面與普通道路具有明顯差異性,直接應(yīng)用會導(dǎo)致公路線路提取精度較低。
因此,本文提出一種基于改進(jìn)U-Net 模型的高分影像公路線路提取方法,通過多方面分析公路與普通道路區(qū)別,引入注意力機(jī)制,建立適用于公路線路信息的改進(jìn)U-Net 網(wǎng)絡(luò)模型,并以實際案例區(qū)域建立公路線路信息提取數(shù)據(jù)集;同時在相同實驗條件下,對比FCN-8s(Long 等,2015;Alam 等,2021)、U-Net、SegNet(Badrinarayanan 等,2017)三種遙感影像語義分割領(lǐng)域常用模型對于公路線路的提取精度,以證明改進(jìn)方法的有效性。
本文提出一種基于改進(jìn)U-Net 模型的公路線路提取方法,如圖1 所示。該方法分為兩個部分:①從功能、線路設(shè)計、分級標(biāo)準(zhǔn)、構(gòu)造及橫斷面四個方面剖析公路線路特征,厘清公路的定義、類別及公路與道路的區(qū)別,對公路線路特征進(jìn)行總結(jié),作為公路線路信息提取的理論基礎(chǔ),建立公路線路信息提取數(shù)據(jù)集;②以U-Net 模型為基礎(chǔ),結(jié)合公路線路特征,聯(lián)合通道與空間注意力機(jī)制建立本研究模型,提取影像中公路信息的上下文特征,增強(qiáng)網(wǎng)絡(luò)在公路線路信息提取過程中空間和通道維度上的優(yōu)勢特征,同時抑制干擾特征。
圖1 基于改進(jìn)U-Net 模型的公路提取技術(shù)路線Fig.1 Technical route of highway extraction based on improved U-Net model
遙感影像識別地物利用的是目標(biāo)地物對電磁波信息的不同反射特性,因此,明確目標(biāo)地物的各種特性對于遙感影像解譯工作十分重要。地物在圖像中特征表達(dá)所組成的先驗知識,為計算機(jī)對目標(biāo)地物的自動提取提供了必要條件。由于基于深度學(xué)習(xí)的公路提取方法需要以大量數(shù)據(jù)為基礎(chǔ),公路線路特征分析也為本文公路線路數(shù)據(jù)集的構(gòu)建提供了理論基礎(chǔ)。
從廣義上來講公路是道路的一種,但公路數(shù)據(jù)具有其自身的特殊性,依照國家公路工程技術(shù)標(biāo)準(zhǔn),公路是主要供汽車行駛的連接城市與城市、城市與鄉(xiāng)村、鄉(xiāng)村與鄉(xiāng)村的道路。其中,公路和城市道路最常被混淆,因此,本文首先從功能、路線設(shè)計、分級標(biāo)準(zhǔn)和構(gòu)造及橫斷面四個方面對公路與道路的區(qū)別進(jìn)行分析,如表1 所示。
表1 公路與城市道路的區(qū)別Tab.1 The difference between highway and city road
對于不同分辨率的影像,公路具有不同的特征表達(dá)。中低分辨率遙感影像中公路基本都呈現(xiàn)為長條狀甚至線狀,且只有較寬的公路能被成功辨別,對于一些較窄的隱藏在郊區(qū)或山嶺之間的公路無法做到有效提??;高分辨率遙感影像中公路表現(xiàn)出了更多的細(xì)節(jié)特征。因此,本文從物理和圖像特征兩個方面分析高分辨率影像中的公路。
2.1.1 物理特征
路基路面:不同等級公路路基路面稍有差別但都平坦堅硬,滿足強(qiáng)度、穩(wěn)定性和耐久性的要求;一般采用瀝青混凝土和水泥混凝土,其中,三級及以下公路可采用瀝青碎石,四級及以下公路可采用砂石。
線路設(shè)計:公路具有一定的寬度和車道數(shù),但不同等級公路的車道數(shù)、路基寬度和路肩寬度不同,不同的車道寬度也對應(yīng)不同的行駛速度;里程一般較長,涉及省市較多,尤其是國省道干線的建設(shè),一般需要跨越幾個省市;每條公路直線部分都有長度限制,曲線部分圓最小半徑也有規(guī)定(表2)。
表2 不同等級公路線路設(shè)計的區(qū)別Tab.2 The difference of different grade highway network design
交叉路口:高速公路與各級公路交叉必須使用立體交叉;個別因與連接重要交通源的公路相交而成為其支線的高速公路應(yīng)設(shè)置互通式立體交叉。
沿線設(shè)施:一般包括交通安全設(shè)施、服務(wù)設(shè)施和管理設(shè)施三種;不同等級的公路對應(yīng)不同配置。
2.1.2 圖像特征
幾何特征:公路總體呈細(xì)長直線形態(tài),長度遠(yuǎn)大于寬度,寬度變化較小且一定程度上反映公路等級;彎曲程度在一定范圍內(nèi),但依山而建的公路常出現(xiàn)劇烈的轉(zhuǎn)彎。
輻射特征:公路內(nèi)部區(qū)域灰度相對均勻,紋理較為一致,與周圍區(qū)域灰度差異明顯;具有兩條明顯的平行邊緣;不同材質(zhì)的公路呈現(xiàn)出的光譜特征有一定差異。
拓?fù)涮卣鳎汗防锍梯^長,具有較好的連通性,很少出現(xiàn)突然中斷的現(xiàn)象;交叉相連形成網(wǎng)狀結(jié)構(gòu);平面交叉以十字交叉、T 形交叉和環(huán)形交叉為主;立體交叉以分離式立體交叉和互通式立體交叉為主(圖2)。
圖2 常見公路平面交叉Fig.2 Common highway grade crossing
上下文特征:公路周圍區(qū)域的能夠輔助識別公路的特征,如公路的寬度、密集度和彎曲程度在田野、山嶺和接近城市的區(qū)域不盡相同;公路周圍區(qū)域連續(xù)的植被或建筑物信息也能為公路識別提供幫助。
本文將注意力模型添加在Encoder 部分中,卷積層提取圖像特征后由注意力模塊為各特征分配權(quán)重,從而引導(dǎo)模型較多地關(guān)注公路線路信息并抑制干擾特征。同時,神經(jīng)網(wǎng)絡(luò)底層提取出的特征較為簡單,僅關(guān)注局部信息,且語義特征相對低級,而高層通過將底層特征進(jìn)行組合能夠表達(dá)較為高級的語義概念,因此,將注意力模塊與高層卷積模塊相連,通過關(guān)注有用的關(guān)鍵特征來提升公路線路信息的提取精度。
本文提出一種改進(jìn)的U-Net 網(wǎng)絡(luò)結(jié)構(gòu),如圖3所示。該結(jié)構(gòu)是一種端到端的對稱結(jié)構(gòu),由編碼和解碼兩部分組成。其中,編碼部分以VGG16 作為網(wǎng)絡(luò)的基線結(jié)構(gòu),主要作用是特征提取,在此過程中特征圖的大小會不斷被壓縮;同時,在不同尺度的特征圖中引入注意力模塊,通過不斷調(diào)整權(quán)重對高層語義特征進(jìn)行注意力分配,達(dá)到強(qiáng)調(diào)關(guān)鍵信息抑制無關(guān)信息的目的。解碼部分則與原生U-Net 網(wǎng)絡(luò)一致,通過上采樣恢復(fù)圖像尺度和池化過程中的損失信息,同時,將不同尺度中獲取的上下文信息在上采樣過程中不斷融合,進(jìn)一步提高網(wǎng)絡(luò)對公路線路信息的特征提取能力。
圖3 改進(jìn)U-Net 網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 The improved U- Net network structure
注意力機(jī)制的基本原理是想讓系統(tǒng)獲得忽略無關(guān)信息而關(guān)注重點信息的能力,模仿人類大腦的視覺注意力機(jī)制,即人在看圖像時注意力自動聚焦于感興趣對象的心理調(diào)節(jié)機(jī)制(劉航和汪西莉,2020)。由于以公路為目標(biāo)的遙感影像中,公路僅呈現(xiàn)出一段細(xì)長形態(tài),而背景信息覆蓋區(qū)域較大,即公路與背景信息樣本不平衡,模型從樣本數(shù)據(jù)集中學(xué)到的背景信息更多,所以會導(dǎo)致其對目標(biāo)信息的提取精度下降。鑒于此,提出一種融合空間與通道的注意力模塊,如圖4 所示。通過注意力模塊捕捉公路空間上下文特征及不同通道的重要性權(quán)重,并根據(jù)權(quán)重信息自適應(yīng)調(diào)節(jié)對重點區(qū)域的關(guān)注程度,同時弱化背景區(qū)域的干擾。
圖4 融合通道與空間的注意力結(jié)構(gòu)Fig.4 Integrating the attention structure of channel and space
2.2.1 通道注意力模塊
特征圖的不同通道對應(yīng)了不同的卷積核的組合,通道注意力是給不同的卷積過程賦予不同的關(guān)注度。該模塊結(jié)構(gòu)如圖5 所示。
圖5 通道注意力結(jié)構(gòu)Fig.5 Channel attention structure
輸入特征圖形狀為H×W×C,經(jīng)過最大池化與平均池化后對其進(jìn)行1×1 卷積操作,得到兩個1×1×C的特征向量。將它們分別送入一個兩層的神經(jīng)網(wǎng)絡(luò)進(jìn)行處理得到新的特征向量,其中,處理不同特征向量的卷積模塊的參數(shù)是共享的。將特征向量相加并使用Sigmoid 函數(shù)進(jìn)行激活可以得到不同通道的權(quán)重,最終與輸入特征對應(yīng)相乘即可賦予不同通道的公路特征不同權(quán)重。通道注意力的計算公式:
式中,Wc(F)為通道注意力權(quán)重;σ為Sigmoid 激活函數(shù);Conv1*1為卷積核大小為1 的卷積;AvgPool為空間平均池化;MaxPool 為空間最大池化;F為輸入特征圖;為帶通道注意力的特征圖。
2.2.2 空間注意力模塊
空間注意力模塊主要關(guān)注的是空間位置信息,該模塊處理流程與通道注意力處理流程類似,如圖6 所示。
圖6 空間注意力結(jié)構(gòu)Fig.6 Spatial attention structure
首先,對輸入大小為H×W×C的添加了通道注意力的特征圖進(jìn)行全局池化與最大池化,得到兩個形狀為H×W×1 的特征圖。然后,從通道維度對兩個特征圖進(jìn)行拼接;接著特征圖要經(jīng)過一次卷積核為7×7 的卷積操作,并用Sigmoid 函數(shù)激活。最后,將權(quán)Wp()與輸入特征對應(yīng)相乘即可賦予不同空間位置的公路特征不同權(quán)重??臻g注意力的計算:
式中,Wc()為空間注意力權(quán)重;Conv7*7為卷積核大小為7 的卷積;Concat 為維度拼接操作;AvgPool 為通道平均池化;MaxPool 為通道最大池化;為帶有通道注意力的輸入特征圖;為帶空間注意力的特征圖。
為驗證改進(jìn)方法的有效性,以重慶市的南岸區(qū)和巴南區(qū)為實驗區(qū)域,建立公路線路信息提取數(shù)據(jù)集,如圖7 所示。南岸區(qū)位于長江南岸,是重慶市主城區(qū)組成部分;巴南區(qū)位于主城區(qū)南部。二者的交通基礎(chǔ)設(shè)施近年來發(fā)展迅速,其中,巴南區(qū)境內(nèi)有國道210線、渝黔高速公路、上界高速公路、渝沙高速公路、繞城高速公路等多條國(省)道交通干線。
從天地圖衛(wèi)星獲取對應(yīng)的高分辨率遙感影像共22 張,空間分辨率為1.19 m,包含R、G、B 波段,背景信息較為復(fù)雜,以郊區(qū)、山區(qū)和農(nóng)村為主。根據(jù)公路線路特征分析結(jié)果,利用Labelme 進(jìn)行數(shù)據(jù)標(biāo)注,剔除沒有公路目標(biāo)和其他質(zhì)量不高的樣本以對數(shù)據(jù)進(jìn)行清洗;同時,通過過采樣對公路目標(biāo)占比較大的樣本對進(jìn)行重復(fù)利用,通過欠采樣對背景占比較大的樣本對進(jìn)行去除,以此對樣本進(jìn)行平衡。另外,通過人為地對訓(xùn)練數(shù)據(jù)添加轉(zhuǎn)換或擾動來對已有數(shù)據(jù)集進(jìn)行擴(kuò)展,以提高訓(xùn)練樣本的多樣性,解決訓(xùn)練數(shù)據(jù)缺乏的問題,提升模型的泛化性和準(zhǔn)確性。道路數(shù)據(jù)存在明顯的拓?fù)涮卣鳎@要求在對數(shù)據(jù)集進(jìn)行增廣時,要考慮可能導(dǎo)致道路斷裂的操作,必須保證其形態(tài)的完整性和元素之間的必要聯(lián)系。主要對數(shù)據(jù)進(jìn)行了水平翻轉(zhuǎn)、豎直翻轉(zhuǎn)及對角翻轉(zhuǎn)的操作達(dá)到擴(kuò)展數(shù)據(jù)集的目的。經(jīng)過數(shù)據(jù)增強(qiáng)之后,最終得到訓(xùn)練樣本2164 張,每張影像和標(biāo)簽的尺寸為512×512×3。結(jié)合設(shè)備性能和標(biāo)簽質(zhì)量,最終挑選出樣本數(shù)據(jù)1300 對按照6∶2∶2 的比例劃分為三個部分,訓(xùn)練樣本780 張,驗證樣本和測試樣本各260 張。
當(dāng)數(shù)據(jù)集較小時,模型常出現(xiàn)在訓(xùn)練集上效果好,在測試集上效果差的現(xiàn)象,即過擬合。為了防止模型過擬合,除了數(shù)據(jù)清洗與數(shù)據(jù)增強(qiáng),還使用了Dropout 正則化法和早停法。Dropout正則化法是通過隨機(jī)刪除一些神經(jīng)元來降低神經(jīng)元之間的依賴性,提高模型的泛化能力;Dropout的大小一般與網(wǎng)絡(luò)維度有關(guān),神經(jīng)元之間聯(lián)系較多的兩個隱藏層容易發(fā)生過擬合,可以設(shè)置較小的概率值,隱藏單元較少時則相反。早停法是通過監(jiān)測模型在驗證集上的表現(xiàn)選擇模型訓(xùn)練停止時間,以此避免繼續(xù)訓(xùn)練導(dǎo)致過擬合的問題。數(shù)據(jù)集較小,模型容易出現(xiàn)過擬合,因此,Dropout值設(shè)置為0.3。本文選擇的監(jiān)測對象為驗證集損失,當(dāng)驗證集損失連續(xù)3 個Epoch 不下降時,學(xué)習(xí)率減半,連續(xù)10 輪沒有下降則停止訓(xùn)練;其他超參數(shù)經(jīng)過網(wǎng)絡(luò)模型設(shè)計及對比實驗,初始學(xué)習(xí)率設(shè)置為0.0001,訓(xùn)練批次大小為4,迭代次數(shù)為100 次。
交并比(intersection over union,IoU)既可以考慮到錯誤檢測,也可以兼顧到遺漏檢測,已經(jīng)成為語義分割的標(biāo)準(zhǔn),因此,利用IoU 進(jìn)行精度評估??傮w像元精度(overall accuracy,OA)作為全局精度評價方法也作為評價方法之一。除此之外,有常用評價標(biāo)準(zhǔn)F1 分?jǐn)?shù)、精確度P及召回率R。如
式中,TP、FN、FP 和TN 為通過比較提取的公路像元和地面真實點來分類的像元結(jié)果,具體含義如表3 所示。
表3 像元分類結(jié)果圖例說明Tab.3 Legend illustration of the pixel classification results
為了驗證改進(jìn)方法的有效性,從定性和定量兩方面對公路線路提取結(jié)果進(jìn)行分析,并將改進(jìn)方法與遙感影像語義分割領(lǐng)域常用的三種神經(jīng)網(wǎng)絡(luò)模型算法進(jìn)行對比。
3.4.1 公路線提取結(jié)果分析
1)定性分析
為了全面呈現(xiàn)改進(jìn)方法在不同背景、密度下的公路線路提取結(jié)果,本文從不同建筑密度和公路線路復(fù)雜程度對深度學(xué)習(xí)提取結(jié)果進(jìn)行了可視化展示,如圖8 所示。從第一、二行影像可以看出,對于少量建筑、單一線路的公路場景,改進(jìn)方法與添加注意力模塊前的U-Net、FCN-8s 和SegNet 效果基本等同,但改進(jìn)方法提取出的公路邊緣較FCN-8s更為光滑。第三、四行影像代表少量建筑、復(fù)雜線路的公路場景,此時改進(jìn)方法相對于FCN-8s 和SegNet 優(yōu)勢明顯,具有更低的誤檢率。隨著背景復(fù)雜程度提高,周圍建筑物等帶來的影像逐漸凸顯,如第五、六行影像所示,相對于其他深度學(xué)習(xí)方法,改進(jìn)方法出現(xiàn)漏檢誤檢和噪聲斑點的情況更少。經(jīng)分析可知,這是由于本文提出的聯(lián)合空間與通道的注意力模塊(圖4)進(jìn)一步強(qiáng)調(diào)了神經(jīng)網(wǎng)絡(luò)在公路信息提取過程中空間和通道維度的優(yōu)勢特征,抑制了周圍建筑和其他地物帶來的干擾特征,從而使得其在周圍地物影響較大的情況下也能聚焦于公路線路目標(biāo)的提取。第七、八行影像的公路線路展現(xiàn)出了復(fù)雜的拓?fù)潢P(guān)系,建筑物密度也相對更高,此時改進(jìn)方法相對于其他方法優(yōu)勢則更加明顯,尤其在交叉路口等體現(xiàn)拓?fù)潢P(guān)系的部分,所提取的公路形態(tài)更加完整,公路邊緣更為光滑且斑點噪聲明顯減少,在漏檢率方面也具有較明顯的效果提升。
圖8 公路線路提取結(jié)果Fig.8 Results of the highway extraction
綜上,對于少量建筑、單一線路的簡單公路場景,各方法的提取精度都較高,改進(jìn)方法存在微小優(yōu)勢。隨著建筑物密度逐漸增大,公路拓?fù)涮卣髦饾u展現(xiàn),場景復(fù)雜程度逐漸提高,公路線路提取精度有所下降,但改進(jìn)方法相對于添加注意力模塊前的U-Net、FCN-8s 和SegNet 仍表現(xiàn)出明顯優(yōu)勢,證明本文加入的注意力機(jī)制確實能夠引導(dǎo)模型關(guān)注公路線路信息并抑制干擾特征,且對不同場景下的公路線路提取均有提升效果。
2)定量分析
為了得到更可靠的對比結(jié)果,利用前文所述提出的精度評價指標(biāo)對模型訓(xùn)練結(jié)果進(jìn)行評價,如表4 所示。兩種方法的精確度、召回率、F1 分?jǐn)?shù)、交并比和總體像元精度都達(dá)到了80%以上,說明測試數(shù)據(jù)集在訓(xùn)練模型上取得了較好的實驗效果。同時,加入注意力模塊后的每個指標(biāo)值都有提升,交并比提高了2.09%,F(xiàn)1 分?jǐn)?shù)提高了1.26%,精確度提高了2.63%,證明本文提出的聯(lián)合空間與通道的注意力模塊能夠強(qiáng)調(diào)公路線路信息提取中的關(guān)鍵特征,抑制干擾特征,對公路線路信息的提取有提升效果。
表4 加入注意力模塊前后模型精度對比Tab.4 Accuracy comparison before and after adding the attention module%
3.4.2 模型對比分析
為了驗證本文選擇U-Net 作為基礎(chǔ)模型的正確性,列出了FCN-8s、U-Net、SegNet 在本研究公路線路提取任務(wù)中的精度指標(biāo)(表5)。評價指標(biāo)表現(xiàn)為,相對于FCN-8s 和SegNet,U-Net 最高:在召回率上分別提高了8.25%、6.72%;在F1 分?jǐn)?shù)上分別提高了4.44%、4.48%;在交并比上分別提高了7%、5.65%。這證明U-Net 網(wǎng)絡(luò)是三種網(wǎng)絡(luò)中,最適合本研究語義結(jié)構(gòu)簡單且訓(xùn)練數(shù)據(jù)集較小的公路線路信息提取的網(wǎng)絡(luò)。
表5 FCN-8s、U-Net、SegNet 精度對比Tab.5 Accuracy Comparison of FCN-8s,U-Net,and SegNet%
區(qū)別于普通道路提取,本文以提取公路線路信息為出發(fā)點,從功能、線路設(shè)計、分級標(biāo)準(zhǔn)、構(gòu)造及橫斷面四個方面剖析公路線路特征,厘清公路的定義、類別,以及公路與道路的區(qū)別。以U-Net 網(wǎng)絡(luò)模型為基礎(chǔ),結(jié)合通道與空間注意力機(jī)制建立一種新的網(wǎng)絡(luò)模型,進(jìn)一步強(qiáng)調(diào)神經(jīng)網(wǎng)絡(luò)在公路信息提取過程中通道和空間維度的優(yōu)勢特征,抑制干擾特征。通過實驗證明,改進(jìn)方法是可行的。
本文提出的引入注意力機(jī)制的公路線路信息提取方法,利用通道與空間的注意力模塊提取影像中公路線路信息,引導(dǎo)模型較多地關(guān)注公路線路信息并抑制干擾特征,提高了網(wǎng)絡(luò)的深層次特征表達(dá),有效解決影像中公路線路與背景信息不平衡的問題,為公路線路信息化管理提供數(shù)據(jù)支撐。