基于多尺度指導(dǎo)的遙感影像建筑物提取網(wǎng)絡(luò)

2024-08-23 00:00:00宋寶貴石衛(wèi)超余快

無線電工程 2024年7期

摘要：從遙感影像中提取建筑物是計算機(jī)視覺領(lǐng)域的一項基本任務(wù)。近年來，基于深度學(xué)習(xí)的方法已成為遙感影像中自動提取建筑物的主流方法。由于建筑物結(jié)構(gòu)復(fù)雜、尺度多樣等特點，從遙感影像中準(zhǔn)確高效地提取建筑物仍然是一個挑戰(zhàn)。針對建筑物尺度多樣導(dǎo)致在提取過程中無法同時兼顧小型和大型建筑物的問題，提出一種基于多尺度指導(dǎo)的遙感影像建筑物提取網(wǎng)絡(luò)。通過４條路徑分別提取小尺度、大尺度以及其他尺度特征，通過基于交互的尺度指導(dǎo)模塊和可選擇核（ＳｅｌｅｃｔｉｖｅＫｅｒｎｅｌ，ＳＫ）卷積模塊分別對特征進(jìn)行指導(dǎo)和優(yōu)化特征，融合不同路徑提取的特征預(yù)測建筑物信息。分別在ＷＨＵ數(shù)據(jù)集和ｉｎｒｉａ數(shù)據(jù)集上評估提出網(wǎng)絡(luò)的有效性，對比實驗結(jié)果表明，所提出的網(wǎng)絡(luò)在ＷＨＵ數(shù)據(jù)集上的交并比（ＩｎｔｅｒｓｅｃｔｉｏｎｏｖｅｒＵｎｉｏｎ，ＩｏＵ）較網(wǎng)絡(luò)ＳｅｇＮｅｔ、ＥＮｅｔ、ＭＭＢ-Ｎｅｔ、Ｒｅｆｉｎｅ-ＵＮｅｔ、ＭＡＰ-Ｎｅｔ分別提高２．３７％、１．４８％、１．０５％、０．８３％、０．５９％，在ｉｎｒｉａ數(shù)據(jù)集上ＩｏＵ較其他網(wǎng)絡(luò)分別提高３．６５％、４．９３％、２．４２％、１．８２％、１．２１％。結(jié)果顯示，所提出的網(wǎng)絡(luò)是一種有效、提取結(jié)果完整性更高、魯棒性更強的目標(biāo)提取網(wǎng)絡(luò)。

關(guān)鍵詞：深度學(xué)習(xí)；遙感影像；建筑物提??；多尺度指導(dǎo)

中圖分類號：ＴＰ７５１文獻(xiàn)標(biāo)志碼：Ａ開放科學(xué)（資源服務(wù)）標(biāo)識碼（ＯＳＩＤ）：

文章編號：１００３－３１０６（２０２４）０７－１６９４－０８

０引言

建筑物是城市遙感影像中人工物體的主要內(nèi)容，與人類活動息息相關(guān)。有效地提取建筑物對城市規(guī)劃、發(fā)展、建設(shè)以及地理數(shù)據(jù)庫更新等發(fā)揮著重要作用。隨著遙感技術(shù)的發(fā)展，遙感影像分辨率越來越高，獲得的目標(biāo)更加清晰，相關(guān)研究也不斷增加。

近年來，針對遙感影像建筑物提取，人們提出大量的方法，主要分為２類：一類為基于傳統(tǒng)的方法，如基于紋理和基于閾值的方法［１－４］，通常需要手動處理和選擇特征。但這種方法提取效果較差，而且非常低效，需要耗費過多人力和物力。另一類為基于深度學(xué)習(xí)的方法。隨著卷積神經(jīng)網(wǎng)絡(luò)（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ，ＣＮＮ）［５－７］到全卷積神經(jīng)網(wǎng)絡(luò)（ＦｕｌｌｙＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋ，ＦＣＮ）［８－１０］的演變，基于深度學(xué)習(xí)的語義分割方法開始被提出并收獲了較好的結(jié)果。隨后，其變體也由于具有良好的性能而受到廣泛認(rèn)可，如編碼器－解碼器結(jié)構(gòu)［１１－１２］。為了充分發(fā)揮深度學(xué)習(xí)的優(yōu)勢，Ｑｉｕ等［１３］利用空洞空間卷積池化金字塔（ＡｔｒｏｕｓＳｐａｔｉａｌＰｙｒａｍｉｄＰｏｏｌｉｎｇ，ＡＳＰＰ）和改進(jìn)的深度可分離卷積提取建筑物的多尺度特征；Ｚｈｕ等［１４］采用多條路徑分別提取不同分辨率的特征以提取建筑物的多尺度信息。楊棟杰等［１５］利用通道注意力和多尺度特征融合注意力提高建筑物提取的性能。盡管這些方法提高了建筑物提取的精度，但是對于建筑物的多尺度信息提取不夠充分，同時會引入大量冗余信息。

因此設(shè)計了一個基于多尺度指導(dǎo)的建筑物提取網(wǎng)絡(luò)，通過路徑間相互指導(dǎo)分別提取小尺度、大尺度以及其他尺度的建筑物信息。同時，利用可選擇核（ＳｅｌｅｃｔｉｖｅＫｅｒｎｅｌ，ＳＫ）卷積模塊優(yōu)化提取特定尺度下的多尺度信息，有效提高了建筑物提取的精度和效率，使遙感影像下建筑物提取結(jié)果更加可靠和高效。

１方法

１．１多尺度指導(dǎo)建筑物提取網(wǎng)絡(luò)

針對高分辨率遙感影像建筑物提取提出一種多尺度指導(dǎo)方法，如圖１所示，該網(wǎng)絡(luò)包含４條路徑Ｌ１、Ｌ２、Ｌ３、Ｌ４，分別提取小尺度、大尺度和其他尺度的建筑物信息。通過多條路徑不僅可以保留建筑物的細(xì)節(jié)特征，還提取了建筑物的語義特征，同時具有較大的感受野。然后將多條路徑提取的建筑物特征進(jìn)行融合，通過上采樣恢復(fù)到輸入分辨率大小，獲得最終的預(yù)測圖。

通過輸入Ｉ，分辨率大小為２５６ｐｉｘｅｌ×２５６ｐｉｘｅｌ×３的通道，得到每條路徑上的特征圖Ｆ１、Ｆ２、Ｆ３、Ｆ４，分別為１２８ｐｉｘｅｌ×１２８ｐｉｘｅｌ×６４通道、６４ｐｉｘｅｌ×６４ｐｉｘｅｌ×１２８通道、３２ｐｉｘｅｌ × ３２ｐｉｘｅｌ × ２５６通道、１６ｐｉｘｅｌ ×１６ｐｉｘｅｌ×５１２通道。對于同一條路徑上的特征圖，分辨率大小和通道數(shù)保持一致。分辨率較大的特征圖具有更多的細(xì)節(jié)特征，但是感受野較小；分辨率較小的特征圖感受野更廣闊，但是丟失較多的細(xì)節(jié)特征。鑒于此，將Ｌ１路徑用于提取小尺度建筑物，Ｌ４路徑用于提取大尺度建筑物，Ｌ２、Ｌ３兩條路徑共同提取其他尺度建筑物。在特征提取階段，通過輸入模塊將Ｉ轉(zhuǎn)化為大小１２８ｐｉｘｅｌ×１２８ｐｉｘｅｌ×６４通道的特征圖，用于減少訓(xùn)練的參數(shù)。利用卷積塊提取特征，每個卷積塊包括４個卷積核３×３卷積層。在分路徑階段，使用平行模塊保留原始路徑信息，下采樣模塊生成新路徑信息。基礎(chǔ)塊細(xì)節(jié)如圖２所示，其中輸入模塊包括２個３×３卷積層和一個最大池化層，經(jīng)過第一個卷積層，將大小為２５６ｐｉｘｅｌ×２５６ｐｉｘｅｌ×３通道的輸入通道數(shù)調(diào)整為６４，第二層卷積輸出大小保持不變，最后經(jīng)過最大池化層，特征圖大小變?yōu)椋保玻?ｐｉｘｅｌ×１２８ｐｉｘｅｌ×６４通道；下采樣模塊包括一個最大池化層和一個１ ×１卷積層，經(jīng)過最大池化層，特征圖大小變?yōu)樵瓉淼囊话耄缓笸ㄟ^１×１卷積將通道數(shù)調(diào)整為輸入的２倍；平行模塊由一個３×３卷積層構(gòu)成，通過此模塊生成的特征圖與輸入特征圖的大小和通道數(shù)一致；其中每個模塊中的卷積層后均包含一個ＲｅＬＵ激活函數(shù)和ＢＮ層。

特征提取后，將Ｌ２、Ｌ３路徑提取的特征圖進(jìn)行融合得到路徑Ｌ２３，融合過程如下：

Ｌ２３＝ＢＲ（（Ｃｏｎｖ１ ×１（Ｃａｔ（Ｌ２，Ｕｐ（Ｌ３））））），（１）

式中：Ｕｐ表示２倍上采樣，Ｃａｔ表示通道維度上的拼接函數(shù)，Ｃｏｎｖ１×１表示１×１的卷積層，ＢＲ表示ＢＮ層和ＲｅＬＵ層。然后通過指導(dǎo)模塊，Ｌ１路徑指導(dǎo)Ｌ４路徑特征圖的生成；Ｌ１路徑和Ｌ４路徑共同指導(dǎo)Ｌ２３路徑特征圖的生成。使得Ｌ１、Ｌ２３、Ｌ４能夠分別捕獲到小尺度建筑物信息、其他尺度建筑物信息、大尺度建筑物信息。

由于不同路徑間特征圖分辨率不同，因此指導(dǎo)模塊包括２個過程：自上而下指導(dǎo)和自下而上指導(dǎo)。自上而下指導(dǎo)過程表示將指導(dǎo)特征圖分辨率下采樣到被指導(dǎo)特征圖分辨率大小進(jìn)行指導(dǎo)，由圖１中自上而下指導(dǎo)模塊表示；自下而上指導(dǎo)過程表示將被指導(dǎo)特征圖上采樣到指導(dǎo)特征圖分辨率大小然后被指導(dǎo)，由圖１中自下而上指導(dǎo)模塊表示。前者用于增強被指導(dǎo)特征圖對應(yīng)尺度的特征信息，后者為被指導(dǎo)特征彌補細(xì)節(jié)信息，同時將對應(yīng)路徑的特征圖恢復(fù)到被指導(dǎo)特征圖分辨率大小。指導(dǎo)過程如下：

Ｌ＾４＝Ｇｕｉｄｅ（Ｄｏｗｎ（Ｌ１），Ｌ４），（２）

Ｌ～４＝Ｇｕｉｄｅ（Ｌ１，Ｕｐ（Ｌ４）），（３）

式中：Ｇｕｉｄｅ表示指導(dǎo)模塊，具體結(jié)構(gòu)在１．２節(jié)介紹；Ｄｏｗｎ表示下采樣，Ｕｐ表示上采樣。式（２）表示自上而下指導(dǎo)過程，式（３）表示自下而上指導(dǎo)過程。

自上而下過程指導(dǎo)完成后，使用ＳＫ卷積模塊優(yōu)化指導(dǎo)后的特征圖，然后進(jìn)行自下而上指導(dǎo)過程，同樣指導(dǎo)結(jié)束后利用ＳＫ卷積模塊優(yōu)化特征圖，ＳＫ卷積模塊的細(xì)節(jié)在１．３節(jié)展示。優(yōu)化完成后，利用Ａｄｄ函數(shù)直接將３個提取不同尺度的特征圖融合，最后通過上采樣和Ｓｉｇｍｏｉｄ操作得到最終預(yù)測圖，大小為２５６ｐｉｘｅｌ×２５６ｐｉｘｅｌ×１通道。

１．２基于交互的尺度指導(dǎo)模塊

文獻(xiàn)［１６］提出的尺度指導(dǎo)模塊，獨立提取了不同尺度的信息。然而，該模塊在指導(dǎo)過程中忽視了不同尺度物體存在重疊性，導(dǎo)致被指導(dǎo)特征對應(yīng)尺度信息部分被抑制，進(jìn)而無法有效提取對應(yīng)尺度建筑物信息。如小尺度特征圖中包含大尺度特征的部分信息，在指導(dǎo)大尺度特征圖生成過程中，會抑制大尺度特征圖中的這些特征，因此指導(dǎo)結(jié)果不理想。針對該問題，本文提出了一個基于交互的尺度指導(dǎo)模塊。該模塊在尺度指導(dǎo)模塊的基礎(chǔ)上，充分利用指導(dǎo)特征與被指導(dǎo)特征的交互信息。在小尺度特征指導(dǎo)大尺度特征時，利用大尺度特征抑制小尺度特征中提取的少量大型建筑物區(qū)域，增強小型建筑物區(qū)域；將增強后的小尺度特征進(jìn)一步指導(dǎo)大尺度特征，得到指導(dǎo)后的特征尺度針對性更強，包含對應(yīng)尺度的建筑物信息更全面。具體結(jié)構(gòu)如圖３所示。

圖３（ａ）中輸入為小尺度特征Ｆｓ和大尺度特征Ｆｂ，通過一個１ ×１卷積層和Ｓｉｇｍｏｉｄ激活函數(shù)得到二值圖Ｓ１、Ｂ１，通過式（４）得到Ｂ。首先，將Ｂ１進(jìn)行１－Ｂ１操作，使作為權(quán)重圖的Ｂ２對于大尺度特征具有更小的激活值；其次將Ｂ２與Ｓ１逐元素相乘，得到的權(quán)重圖Ｓ對大尺度特征信息給予更低的關(guān)注，而對小尺度特征信息具有更高的關(guān)注；最后，將優(yōu)化的權(quán)重圖Ｓ與Ｂ１逐元素相乘，分別增強和抑制Ｂ１中小型建筑物特征信息和大型建筑物特征信息，生成對大尺度特征信息關(guān)注更多的權(quán)重圖Ｂ。其中Ｍｕｌ函數(shù)表示直接相乘。

在特征提取過程中，淺層特征由于具有更多的細(xì)節(jié)信息，適用于提取小尺度特征信息；深層特征由于具有更大的感受野，可以提取大尺度建筑物信息；而對于其他尺度建筑物信息，使用中間２層提取。因此，在指導(dǎo)其他尺度特征生成時，利用大尺度特征和小尺度特征共同指導(dǎo)，故圖３（ｂ）中輸入為３個特征圖，分別為小尺度特征Ｆｓ、大尺度特征Ｆｂ和其他尺度特征Ｆｍ。首先將小尺度特征圖和大尺度特征圖拼接到一起，通過１ ×１卷積和Ｓｉｇｍｏｉｄ激活函數(shù)得到權(quán)重圖Ｂｓ１，其他過程和圖３（ａ）中相似，具體實現(xiàn)如下：

Ｂ＝Ｍｕｌ（Ｂ１，１－Ｍｕｌ（Ｓ１，１－Ｂ１）），（４）

Ｍ＝Ｍｕｌ（Ｍ１，１－Ｍｕｌ（Ｂｓ１，１－Ｍ１））。（５）

１．３ＳＫ卷積模塊

在本文網(wǎng)絡(luò)中引入ＳＫ卷積模塊，用于優(yōu)化各條路徑提取的建筑物特征。該模塊最初在文獻(xiàn)［１７］中提出，不僅可以自主選擇感受野，同時可以提取多尺度特征。具體結(jié)構(gòu)如圖４所示，包括分離、融合和選擇３個步驟。首先通過空洞率分別為１、２的２個３×３卷積將特征圖分離；然后將分離后的特征直接相加融合，經(jīng)過全局平均池化和全連接層后通道數(shù)變?yōu)檩斎胪ǖ罃?shù)的２倍；接著利用Ｓｏｆｔｍａｘ函數(shù)，如圖４中黃色部分，將相同通道計算對應(yīng)的權(quán)重，得到２個相同通道互補的權(quán)重向量；最后將互補的權(quán)重向量分別作用于分離過程生成的２個特征圖，相加得到最終的特征圖。

本文網(wǎng)絡(luò)通過ＳＫ卷積模塊優(yōu)化特征信息，經(jīng)過尺度指導(dǎo)模塊后，各條路徑提取的特征圖具有不同的尺度。不同路徑的特征圖通過ＳＫ卷積模塊自主選擇感受野，同時也提取了相應(yīng)路徑下的多尺度信息。文中在每一個指導(dǎo)模塊之后均使用ＳＫ卷積模塊進(jìn)行優(yōu)化，因此，每條路徑包括２個ＳＫ卷積模塊。

２實驗

２．１實驗數(shù)據(jù)

為了驗證本文模型的有效性，選?。祝龋?數(shù)據(jù)集［１８］和ｉｎｒｉａ數(shù)據(jù)集［１９］進(jìn)行訓(xùn)練和測試。ＷＨＵ數(shù)據(jù)集來自武漢大學(xué)ＧＰＣＶ團(tuán)隊，采用航空數(shù)據(jù)集作為實驗數(shù)據(jù)；ｉｎｒｉａ數(shù)據(jù)集包括５個不同區(qū)域的數(shù)據(jù)，不同區(qū)域之間建筑物特點各異，可以有效評估模型的泛化能力。

在訓(xùn)練階段，由于資源設(shè)備有限，將訓(xùn)練數(shù)據(jù)分割為２５６ｐｉｘｅｌ×２５６ｐｉｘｅｌ大小，然后將分割后數(shù)據(jù)中沒有建筑物的影像和標(biāo)簽去除，得到最終訓(xùn)練數(shù)據(jù)。

２．２評價指標(biāo)

針對模型預(yù)測的結(jié)果，采用精確率（Ｐｒｅｃｉｓｉｏｎ）、召回率（Ｒｅｃａｌｌ）、Ｆ１分?jǐn)?shù)（Ｆ１）、交并比（ＩｎｔｅｒｓｅｃｔｉｏｎｏｖｅｒＵｎｉｏｎ，ＩｏＵ）作為評價指標(biāo)。計算如下：

Ｐｒｅｃｉｓｉｏｎ＝ＴＰ/ＴＰ＋ＦＰ，（６）

Ｒｅｃａｌｌ＝ＴＰ/ＴＰ＋ＦＮ，（７）

Ｆ１＝２ × Ｐｒｅｃｉｓｉｏｎ × Ｒｅｃａｌｌ/Ｐｒｅｃｉｓｉｏｎ＋Ｒｅｃａｌｌ，（８）

ＩｏＵ＝ＴＰ/ＴＰ＋ＦＰ＋ＦＮ，（９）

式中：ＴＰ表示預(yù)測結(jié)果和標(biāo)簽均為建筑物；ＦＰ表示預(yù)測結(jié)果為非建筑物，標(biāo)簽為建筑物；ＴＮ表示預(yù)測結(jié)果和標(biāo)簽為非建筑物；ＦＮ表示預(yù)測結(jié)果為建筑物，標(biāo)簽為非建筑物。

遙感影像下建筑物提取屬于二分類問題，提取類別為建筑物和非建筑物２類。針對模型，實驗以ＰｙＴｏｒｃｈ為框架，在ＮＶＩＤＩＡＧｅＦｏｒｃｅＲＴＸ３０６０設(shè)備上構(gòu)建模型。訓(xùn)練過程中，超參數(shù)迭代次數(shù)設(shè)置為２００，初始學(xué)習(xí)率為０．０００１，ＢａｔｃｈＳｉｚｅ為４，驗證集上ＢａｔｃｈＳｉｚｅ為２，采用多步長Ｍｕｌｔｉ-ＳｔｅｐＬＲ動態(tài)調(diào)整網(wǎng)絡(luò)更新學(xué)習(xí)率，通過Ａｄａｍ優(yōu)化器迭代優(yōu)化損失函數(shù)。采用文獻(xiàn)［２０］中的損失函數(shù)評價預(yù)測結(jié)果和真實值之間的差異，具體如式（１０）所示：

Ｌ（ｐｒｅｄｉｃｔ，ｌａｂｅｌ）＝ α１ＢＣＥ（ｐｒｅｄｉｃｔ，ｌａｂｅｌ）＋α２Ｄｉｃｅ（ｐｒｅｄｉｃｔ，ｌａｂｅｌ），（１０）

式中：α１、α２為超參數(shù)，分別取值０．８、０．２。

２．３實驗結(jié)果

在ＷＨＵ數(shù)據(jù)集和ｉｎｒｉａ數(shù)據(jù)集上將模型和多個語義分割網(wǎng)絡(luò)進(jìn)行對比實驗，其中包括語義分割模型ＳｅｇＮｅｔ、ＥＮｅｔ［２１］以及近２年建筑物提取領(lǐng)域提出的模型ＭＭＢ-Ｎｅｔ［２２］、Ｒｅｆｉｎｅ-ＵＮｅｔ和ＭＡＰ-Ｎｅｔ。

２．３．１ＷＨＵ數(shù)據(jù)集實驗結(jié)果

使用在ＷＨＵ訓(xùn)練集上訓(xùn)練好的模型對測試集進(jìn)行預(yù)測，輸入大小為５１２ｐｉｘｅｌ×５１２ｐｉｘｅｌ×３通道，輸出為建筑物提取預(yù)測圖。實驗中所有的網(wǎng)絡(luò)均在相同的設(shè)備以及超參數(shù)下進(jìn)行，部分預(yù)測結(jié)果如圖５所示。

本文提出的基于多尺度指導(dǎo)的建筑物提取網(wǎng)絡(luò)模型采用多路徑結(jié)構(gòu)，利用改進(jìn)的指導(dǎo)模塊，減少路徑提取特征圖的冗余信息，指引每條路徑提取相應(yīng)尺度的建筑物信息。然后通過ＳＫ卷積模塊優(yōu)化對應(yīng)尺度的特征，使提取的特征不僅可以自由選擇感受野，也擁有豐富的多尺度信息。通過圖５可以發(fā)現(xiàn)，第一行中藍(lán)色框部分顯示本文提出的模型提取的小型建筑物邊界更光滑，與標(biāo)簽匹配度更高；第三行中藍(lán)色框部分表明本文模型提取的大型建筑物較ＭＭＢ-Ｎｅｔ、Ｒｅｆｉｎｅ-ＵＮｅｔ完整性更高，提取的邊界較模型ＳｅｇＮｅｔ、ＥＮｅｔ與ＭＡＰ-Ｎｅｔ更完整；第二行和第四行中紅色框表明對于影像中形狀變化較大的建筑物，本文模型提取結(jié)果邊界更完善。綜合表明，在ＷＨＵ建筑物數(shù)據(jù)集上效果優(yōu)于其他模型，提出的方法具有更多的細(xì)節(jié)信息，連續(xù)性較好，而且小型建筑物遺漏更少。該模型可以有效提取遙感影像下的建筑物，建筑物提取精度定性分析如表１所示。

由表１可以看出，本文網(wǎng)絡(luò)提取結(jié)果在Ｆ１上比其他５個網(wǎng)絡(luò)分別提高１．３１％、０．８２％、０．５８％、０．４６％、０．３２％，ＩｏＵ分別提高２．３７％、１．４８％、１．０５％、０．８３％、０．５９％，與可視化結(jié)果一致，本文網(wǎng)絡(luò)綜合性能較其他對比網(wǎng)絡(luò)更優(yōu)。

２．３．２ｉｎｒｉａ數(shù)據(jù)集實驗結(jié)果

使用在ｉｎｒｉａ數(shù)據(jù)集上訓(xùn)練好的模型對測試集進(jìn)行預(yù)測，輸入大小為５１２ｐｉｘｅｌ×５１２ｐｉｘｅｌ×３通道，輸出為建筑物預(yù)測圖?？梢暬Y(jié)果如圖６所示。其中包括５個區(qū)域ａｕｓｔｉｎ、ｃｈｉｃａｇｏ、ｋｉｔｓａｐ、ｔｙｒｏｌ和ｖｉｅｎｎａ的影像，分別對應(yīng)每一行。５個區(qū)域的建筑物特點各異，ａｕｓｔｉｎ和ｃｈｉｃａｇｏ區(qū)域建筑物分布均勻，ｃｈｉｃａｇｏ區(qū)域建筑物呈列排布，ｔｙｒｏｌ區(qū)域建筑物大小變化較大分布無規(guī)律，ｖｉｅｎｎａ區(qū)域建筑物形狀變化較大。圖中第一行、第三行和第四行紅色框部分表明，對于規(guī)則的建筑物，本文網(wǎng)絡(luò)提取的建筑物輪廓更清楚和光滑；而第五行紅色框中對于復(fù)雜的建筑物，本文網(wǎng)絡(luò)預(yù)測結(jié)果更接近標(biāo)簽形狀。

綜合表明，對比網(wǎng)絡(luò)提取結(jié)果完整性較差，本文網(wǎng)絡(luò)提取結(jié)果更準(zhǔn)確。在ｉｎｒｉａ數(shù)據(jù)集上，所提網(wǎng)絡(luò)與其他對比網(wǎng)絡(luò)的定量實驗結(jié)果如表２所示。

由表２可以看出，本文提出的網(wǎng)絡(luò)在４個評價指標(biāo)上均優(yōu)于對比網(wǎng)絡(luò)。對比結(jié)果顯示本文網(wǎng)絡(luò)的Ｆ１比其他５個網(wǎng)絡(luò)分別提高２．５５％、３．４％、１．７６％、１．３７％、０．９８％，ＩｏＵ分別提高３．６５％、４．９３％、２．４２％、１．８２％、１．２１％。結(jié)果顯示，本文提出的方法和其他５種網(wǎng)絡(luò)相比性能更佳，魯棒性更強。

２．３．３消融實驗結(jié)果

自上而下指導(dǎo)模塊和自下而上指導(dǎo)模塊分別通過分辨率向下兼容和向上兼容指導(dǎo)特定尺度特征生成；ＳＫ卷積模塊通過優(yōu)化指導(dǎo)后特征，從而提升網(wǎng)絡(luò)特征提取能力。本節(jié)通過在ＷＨＵ數(shù)據(jù)集上進(jìn)行消融實驗驗證上述３個模塊對模型性能影響，結(jié)果如表３所示。

①自上而下指導(dǎo)模塊。該模塊通過指導(dǎo)特征圖下采樣對被指導(dǎo)特征圖進(jìn)行指導(dǎo)，增強相關(guān)尺度特征信息，抑制不相關(guān)尺度特征信息。采用相同的訓(xùn)練集、驗證集、測試集和訓(xùn)練參數(shù)驗證該模塊性能。在ＷＨＵ數(shù)據(jù)集上的驗證結(jié)果如表３第二行所示，與第一行相比，精確率和召回率均有提升，ＩｏＵ提高０．２８％。結(jié)果表明，自上而下指導(dǎo)模塊有助于建筑物的分割，對于建筑物誤檢更少。

②自下而上指導(dǎo)模塊。該模塊通過被指導(dǎo)特征圖上采樣后被指導(dǎo)特征圖指導(dǎo)，可以彌補被指導(dǎo)特征圖下采樣后丟失的細(xì)節(jié)信息。驗證結(jié)果如表３第四行和第五行所示，通過比較第一行和第四行，ＩｏＵ提高０．２４％，精確率和召回率均有提升，而精確率提升幅度更大。第二行和第五行相比，ＩｏＵ提升０．３８％，精確率同樣提升空間更大。實驗結(jié)果表明，自下而上指導(dǎo)模塊恢復(fù)更多的空間細(xì)節(jié)，提高了建筑物分割的完整性。

③ＳＫ卷積模塊。ＳＫ卷積模塊為不同的卷積核分配相應(yīng)的權(quán)重，達(dá)到控制感受野和優(yōu)化特征的目的。表３的第三行和第六行驗證該模塊的有效性，通過比較第二行和第三行，ＩｏＵ提升０．３３％，比較第五行和第六行，ＩｏＵ提升０．２３％。綜合表明，ＳＫ卷積模塊進(jìn)一步優(yōu)化了指導(dǎo)后的特征圖，從而提升建筑物檢測表現(xiàn)。

通過以上消融實驗可以發(fā)現(xiàn)，本文提出的自上而下指導(dǎo)模塊、自下而上指導(dǎo)模塊以及ＳＫ卷積模塊對于網(wǎng)絡(luò)表達(dá)能力和提取性能都至關(guān)重要。通過２個不同過程的指導(dǎo)以及指導(dǎo)后的優(yōu)化，能有效提升建筑物提取能力。

３結(jié)束語

針對高分辨率遙感影像建筑物提取中大型建筑物完整性較低、小型建筑物容易丟失等問題，本文提出了基于多尺度指導(dǎo)的建筑物提取網(wǎng)絡(luò)。網(wǎng)絡(luò)包括４條路徑，分別用于提取不同尺度的建筑物信息，通過指導(dǎo)模塊和ＳＫ卷積模塊生成３類特征圖。淺層路徑用于提取小尺度特征，深層路徑用于提取大尺度特征，中間２條路徑提取其他尺度特征。通過融合以及上采樣多條路徑生成的特征圖得到最終預(yù)測圖，不僅在分割大型建筑物時具有更高的完整性，同時建筑物漏檢誤檢更少。通過對比實驗，在ＷＨＵ數(shù)據(jù)集和ｉｎｒｉａ數(shù)據(jù)集上，本文提出的網(wǎng)絡(luò)均優(yōu)于其他５種網(wǎng)絡(luò)，表明此網(wǎng)絡(luò)性能更好，泛化能力更強；進(jìn)行的消融實驗表明各模塊對于網(wǎng)絡(luò)性能的提升至關(guān)重要，共同促進(jìn)網(wǎng)絡(luò)提取建筑物能力。但是本文網(wǎng)絡(luò)還需進(jìn)一步改進(jìn)，提升分割建筑物邊界的能力，后續(xù)將朝著此方向努力。

參考文獻(xiàn)

［１］ＣＯＴＥＭ，ＳＡＥＥＤＩＰ．ＡｕｔｏｍａｔｉｃＲｏｏｆｔｏｐＥｘｔｒａｃｔｉｏｎｉｎＮａｄｉｒＡｅｒｉａｌＩｍａｇｅｒｙｏｆＳｕｂｕｒｂａｎＲｅｇｉｏｎｓＵｓｉｎｇＣｏｒｎｅｒｓａｎｄＶａｒｉａｔｉｏｎａｌＬｅｖｅｌＳｅｔＥｖｏｌｕｔｉｏｎ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＧｅｏｓｃｉｅｎｃｅａｎｄＲｅｍｏｔｅＳｅｎｓｉｎｇ，２０１３，５１（１）：３１３－３２８.

［２］ＬＩＥ，ＦＥＭＩＡＮＩＪ，ＸＵＳＢ，ｅｔａｌ．ＲｏｂｕｓｔＲｏｏｆｔｏｐＥｘｔｒａｃｔｉｏｎｆｒｏｍＶｉｓｉｂｌｅＢａｎｄＩｍａｇｅｓＵｓｉｎｇＨｉｇｈｅｒＯｒｄｅｒＣＲＦ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＧｅｏｓｃｉｅｎｃｅａｎｄＲｅｍｏｔｅＳｅｎｓｉｎｇ，２０１５，５３（８）：４４８３－４４９５．

［３］ＺＨＯＮＧＳ，ＨＵＡＮＧＪ，ＸＩＥＷ．ＡＮｅｗＭｅｔｈｏｄｏｆＢｕｉｌｄｉｎｇＤｅｔｅｃｔｉｏｎｆｒｏｍａＳｉｎｇｌｅＡｅｒｉａｌＰｈｏｔｏｇｒａｐｈ［Ｃ］∥２００８９ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ．Ｂｅｉｊｉｎｇ：ＩＥＥＥ，２００８：１２１９－１２２２．

［４］李治，隋正偉，傅俏燕，等．基于形態(tài)學(xué)序列和多源先驗信息的城市建筑物高分遙感提取［Ｊ］．遙感學(xué)報，２０２３，２７（４）：９９８－１００８．

［５］ＨＥＫＭ，ＺＨＡＮＧＸＹ，ＲＥＮＳＱ，ｅｔａｌ．ＤｅｅｐＲｅｓｉｄｕａｌＬｅａｒｎｉｎｇｆｏｒＩｍａｇｅＲｅｃｏｇｎｉｔｉｏｎ［Ｃ］∥ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＬａｓＶｅｇａｓ：ＩＥＥＥ，２０１６：７７０－７７８．

［６］ＫＲＩＺＨＥＶＳＫＹＡ，ＳＵＴＳＫＥＶＥＲＩ，ＨＩＮＴＯＮＧＥ．ＩｍａｇｅＮｅｔＣｌａｓｓｉｆｉｃａｔｉｏｎｗｉｔｈＤｅｅｐＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋｓ［Ｊ］．ＣｏｍｍｕｎｉｃａｔｉｏｎｓｏｆｔｈｅＡＣＭ，２０１７，６０（６）：８４－９０．

［７］ＳＺＥＧＥＤＹＣ，ＬＩＵＷ，ＪＩＡＹＱ，ｅｔａｌ．ＧｏｉｎｇＤｅｅｐｅｒｗｉｔｈＣｏｎｖｏｌｕｔｉｏｎｓ［Ｃ］∥ ２０１５ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ：ＩＥＥＥ，２０１５：１－９．

［８］ＣＨＥＮＬＣ，ＰＡＰＡＮＤＲＥＯＵＧ，ＳＣＨＲＯＦＦＦ，ｅｔａｌ．ＲｅｔｈｉｎｋｉｎｇＡｔｒｏｕｓＣｏｎｖｏｌｕｔｉｏｎｆｏｒＳｅｍａｎｔｉｃＩｍａｇｅＳｅｇｍｅｎｔａｔｉｏｎ［ＥＢ／ＯＬ］．（２０１７－１２－０５）［２０２３－０６－１１］．ｈｔｔｐｓ：∥ａｒｘｉｖ．ｏｒｇ／ａｂｓ／１７０６．０５５８７．

［９］ＬＯＮＧＪ，ＳＨＥＬＨＡＭＥＲＥ，ＤＡＲＲＥＬＬＴ．ＦｕｌｌｙＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓｆｏｒＳｅｍａｎｔｉｃＳｅｇｍｅｎｔａｔｉｏｎ［Ｃ］∥ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ：ＩＥＥＥ，２０１５：３４３１－３４４０．

［１０］ＲＯＮＮＥＢＥＲＧＥＲＯ，ＦＩＳＣＨＥＲＰ，ＢＲＯＸＴ．ＵＮｅｔ：ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｆｏｒＢｉｏｍｅｄｉｃａｌＩｍａｇｅＳｅｇｍｅｎｔａｔｉｏｎ［Ｃ］∥ＭｅｄｉｃａｌＩｍａｇｅＣｏｍｐｕｔｉｎｇａｎｄＣｏｍｐｕｔｅｒａｓｓｉｓｔｅｄＩｎｔｅｒｖｅｎｔｉｏｎＭＩＣＣＡＩ２０１５．Ｍｕｎｉｃｈ：Ｓｐｒｉｎｇｅｒ，２０１５：２３４－２４１．

［１１］ＢＡＤＲＩＮＡＲＡＹＡＮＡＮＶ，ＫＥＮＤＡＬＬＡ，ＣＩＰＯＬＬＡＲ．ＳｅｇＮｅｔ：ＡＤｅｅｐＣｏｎｖｏｌｕｔｉｏｎａｌＥｎｃｏｄｅｒＤｅｃｏｄｅｒＡｒｃｈｉｔｅｃｔｕｒｅｆｏｒＩｍａｇｅＳｅｇｍｅｎｔａｔｉｏｎ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＰａｔｔｅｒｎＡｎａｌｙｓｉｓａｎｄＭａｃｈｉｎｅＩｎｔｅｌｌｉｇｅｎｃｅ，２０１７，３９（１２）：２４８１－２４９５．

［１２］ＣＨＥＮＬＣ，ＺＨＵＹＫ，ＰＡＰＡＮＤＲＥＯＵＧ，ｅｔａｌ．ＥｎｃｏｄｅｒＤｅｃｏｄｅｒｗｉｔｈＡｔｒｏｕｓＳｅｐａｒａｂｌｅＣｏｎｖｏｌｕｔｉｏｎｆｏｒＳｅｍａｎｔｉｃＩｍａｇｅＳｅｇｍｅｎｔａｔｉｏｎ［Ｃ］∥ ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＥｕｒｏｐｅａｎＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ（ＥＣＣＶ）．Ｍｕｎｉｃｈ：Ｓｐｒｉｎｇｅｒ，２０１８：８３３－８５１．

［１３］ＱＩＵＷＹ，ＧＵＬＪ，ＧＡＯＦ，ｅｔａｌ．ＢｕｉｌｄｉｎｇＥｘｔｒａｃｔｉｏｎｆｒｏｍＶｅｒｙＨｉｇｈｒｅｓｏｌｕｔｉｏｎＲｅｍｏｔｅＳｅｎｓｉｎｇＩｍａｇｅｓＵｓｉｎｇＲｅｆｉｎｅＵＮｅｔ［Ｊ］．ＩＥＥＥＧｅｏｓｃｉｅｎｃｅａｎｄＲｅｍｏｔｅＳｅｎｓｉｎｇＬｅｔｔｅｒｓ，２０２３，２０：６００２９０５．

［１４］ＺＨＵＱ，ＬＩＡＯＣ，ＨＵＨ，ｅｔａｌ．ＭＡＰＮｅｔ：ＭｕｌｔｉｐｌｅＡｔｔｅｎｄｉｎｇＰａｔｈＮｅｕｒａｌＮｅｔｗｏｒｋｆｏｒＢｕｉｌｄｉｎｇＦｏｏｔｐｒｉｎｔＥｘｔｒａｃｔｉｏｎｆｒｏｍＲｅｍｏｔｅＳｅｎｓｅｄＩｍａｇｅｒｙ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＧｅｏｓｃｉｅｎｃｅａｎｄＲｅｍｏｔｅＳｅｎｓｉｎｇ，２０２１，５９（７）：６１６９－６１８１．

［１５］楊棟杰，高賢君，冉樹浩，等．基于多重多尺度融合注意力網(wǎng)絡(luò)的建筑物提?。郏剩荩?浙江大學(xué)學(xué)報（工學(xué)版），２０２２，５６（１０）：１９２４－１９３４．

［１６］ＨＡＮＧＲＬ，ＹＡＮＧＰ，ＺＨＯＵＦ，ｅｔａｌ．ＭｕｌｔｉｓｃａｌｅＰｒｏｇｒｅｓｓｉｖｅＳｅｇｍｅｎｔａｔｉｏｎＮｅｔｗｏｒｋｆｏｒＨｉｇｈｒｅｓｏｌｕｔｉｏｎＲｅｍｏｔｅＳｅｎｓｉｎｇＩｍａｇｅｒｙ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＧｅｏｓｃｉｅｎｃｅａｎｄＲｅｍｏｔｅＳｅｎｓｉｎｇ，２０２２，６０：５４１２０１２．

［１７］ＬＩＸ，ＷＡＮＧＷＨ，ＨＵＸＬ，ｅｔａｌ．ＳｅｌｅｃｔｉｖｅＫｅｒｎｅｌＮｅｔｗｏｒｋｓ［Ｃ］∥ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥ／ＣＶＦＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＬｏｎｇＢｅａｃｈ：ＩＥＥＥ，２０１９：５１０－５１９．

［１８］ＪＩＳＰ，ＷＥＩＳＱ，ＬＵＭ．ＦｕｌｌｙＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓｆｏｒＭｕｌｔｉｓｏｕｒｃｅＢｕｉｌｄｉｎｇＥｘｔｒａｃｔｉｏｎｆｒｏｍａｎＯｐｅｎＡｅｒｉａｌａｎｄＳａｔｅｌｌｉｔｅＩｍａｇｅｒｙＤａｔａＳｅｔ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＧｅｏｓｃｉｅｎｃｅａｎｄＲｅｍｏｔｅＳｅｎｓｉｎｇ，２０１９，５７（１）：５７４－５８６．

［１９］ＭＡＧＧＩＯＲＩＥ，ＴＡＲＡＢＡＬＫＡＹ，ＣＨＡＲＰＩＡＴＧ，ｅｔａｌ．ＣａｎＳｅｍａｎｔｉｃＬａｂｅｌｉｎｇＭｅｔｈｏｄｓＧｅｎｅｒａｌｉｚｅｔｏＡｎｙＣｉｔｙ？ＴｈｅＩｎｒｉａＡｅｒｉａｌＩｍａｇｅＬａｂｅｌｉｎｇＢｅｎｃｈｍａｒｋ［Ｃ］∥２０１７ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＧｅｏｓｃｉｅｎｃｅａｎｄＲｅｍｏｔｅＳｅｎｓｉｎｇＳｙｍｐｏｓｉｕｍ（ＩＧＡＲＳＳ）．ＦｏｒｔＷｏｒｔｈ：ＩＥＥＥ，２０１７：３２２６－３２２９．

［２０］ＪＡＤＯＮＳ．ＡＳｕｒｖｅｙｏｆＬｏｓｓＦｕｎｃｔｉｏｎｓｆｏｒＳｅｍａｎｔｉｃＳｅｇｍｅｎｔａｔｉｏｎ［Ｃ］∥２０２０ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔａｔｉｏｎａｌＩｎｔｅｌｌｉｇｅｎｃｅｉｎＢｉｏｉｎｆｏｒｍａｔｉｃｓａｎｄＣｏｍｐｕｔａｔｉｏｎａｌＢｉｏｌｏｇｙ（ＣＩＢＣＢ）．ＶｉａｄｅｌＭａｒ：ＩＥＥＥ，２０２０：１－７．

［２１］ＰＡＳＺＫＥＡ，ＣＨＡＵＲＡＳＩＡＡ，ＫＩＭＳ，ｅｔａｌ．ＥＮｅｔ：ＡＤｅｅｐＮｅｕｒａｌＮｅｔｗｏｒｋＡｒｃｈｉｔｅｃｔｕｒｅｆｏｒＲｅａｌｔｉｍｅＳｅｍａｎｔｉｃＳｅｇｍｅｎｔａｔｉｏｎ［ＥＢ／ＯＬ］．（２０１６－０６－０７）［２０２３－０６－１１］．ｈｔｔｐｓ：∥ａｒｘｉｖ．ｏｒｇ／ａｂｓ／１６０６．０２１４７．

［２２］ＺＨＡＮＧＨ，ＺＨＥＮＧＸＣ，ＺＨＥＮＧＮＳ，ｅｔａｌ．ＡＭｕｌｔｉｓｃａｌｅａｎｄＭｕｌｔｉｐａｔｈＮｅｔｗｏｒｋｗｉｔｈＢｏｕｎｄａｒｙＥｎｈａｎｃｅｍｅｎｔｆｏｒＢｕｉｌｄｉｎｇＦｏｏｔｐｒｉｎｔＥｘｔｒａｃｔｉｏｎｆｒｏｍＲｅｍｏｔｅｌｙＳｅｎｓｅｄＩｍａｇｅｒｙ［Ｊ］．ＩＥＥＥＪｏｕｒｎａｌｏｆＳｅｌｅｃｔｅｄＴｏｐｉｃｓｉｎＡｐｐｌｉｅｄＥａｒｔｈＯｂｓｅｒｖａｔｉｏｎｓａｎｄＲｅｍｏｔｅＳｅｎｓｉｎｇ，２０２２，１５：８８５６－８８６９．

作者簡介

宋寶貴男，（２０００—），碩士研究生。主要研究方向：深度學(xué)習(xí)、遙感影像建筑物提取。

石衛(wèi)超男，（１９９９—），碩士研究生。主要研究方向：深度學(xué)習(xí)、遙感影像變化檢測。

余快女，（１９９９—），碩士研究生。主要研究方向：深度學(xué)習(xí)、遙感影像建筑物提取。

基金項目：國家自然科學(xué)基金青年項目（４１９０１３４１）

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于多尺度指導(dǎo)的遙感影像建筑物提取網(wǎng)絡(luò)