基于SF-Unet的高分辨率耕地遙感影像分割

2024-07-20 00:00:00秦倫明凌雪海鄒鈺潔龔楊洋邊后琴王悉

無線電工程 2024年5期

摘要：利用深度學(xué)習(xí)實現(xiàn)遙感影像耕地區(qū)域自動化檢測，取代人工解譯，能有效提升耕地面積統(tǒng)計效率。針對目前存在分割目標(biāo)尺度大且連續(xù)導(dǎo)致分割區(qū)域存在欠分割現(xiàn)象，邊界區(qū)域情況復(fù)雜導(dǎo)致邊緣分割困難等問題，提出了語義分割算法———ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ，ＴｒａｎｓＦｕｓｅａｎｄＵ-Ｎｅｔ（ＳＦ-Ｕｎｅｔ）。為強化網(wǎng)絡(luò)不同層次特征提取和信息融合能力，提升邊緣分割性能，使用Ｕ-Ｎｅｔ網(wǎng)絡(luò)替代ＴｒａｎｓＦｕｓｅ網(wǎng)絡(luò)中的ＲｅｓＮｅｔ５０模塊；將ＶｉｓｉｏｎＴｒａｎｓｆｏｒｍｅｒ（ＶｉＴ）替換為改進后的ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ網(wǎng)絡(luò)，解決大區(qū)域的欠分割問題；通過注意力機制構(gòu)建的Ｆｕｓｉｏｎ融合模塊將２個網(wǎng)絡(luò)輸出特征進行融合，增強模型對目標(biāo)的語義表示，提高分割的精度。實驗表明，ＳＦ-Ｕｎｅｔ語義分割網(wǎng)絡(luò)在ＧａｏｆｅｎＩｍａｇｅＤａｔａｓｅｔ（ＧＩＤ）數(shù)據(jù)集上的交并比（ＩｎｔｅｒｓｅｃｔｉｏｎｏｖｅｒＵｎｉｏｎ，ＩｏＵ）達到了９０．５７％，分別比Ｕ-Ｎｅｔ和ＴｒａｎｓＦｕｓｅ網(wǎng)絡(luò)提升了６．４８％和６．０９％，明顯提升了耕地遙感影像分割的準(zhǔn)確性。

關(guān)鍵詞：耕地遙感影像；語義分割；卷積神經(jīng)網(wǎng)絡(luò)；ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ

中圖分類號：ＴＰ３９１文獻標(biāo)志碼：Ａ開放科學(xué)（資源服務(wù)）標(biāo)識碼（ＯＳＩＤ）：

文章編號：１００３－３１０６（２０２４）０５－１１９７－０８

０引言

耕地是人類生存發(fā)展所需要的重要資源，快速精準(zhǔn)地獲取耕地面積是生態(tài)環(huán)境檢測、農(nóng)作物產(chǎn)量估算以及實現(xiàn)土地資源可持續(xù)發(fā)展的基礎(chǔ)。隨著計算機視覺技術(shù)的不斷進步，通過結(jié)合新技術(shù)手段對耕地面積進行快速統(tǒng)計己成為歷史發(fā)展的必然。

近年來，高分辨率遙感衛(wèi)星不斷發(fā)展，獲取高精度耕地遙感更加便捷，為國家各監(jiān)管部門提供重要的數(shù)據(jù)支撐，其提取遙感影像耕地區(qū)域采用的主要方法為人工解譯［１－２］，但人工分割的方式耗費大量人力、物力，且效率低下，因此研究如何采用自動化的方式對耕地遙感影像進行分割具有重要研究價值。

在傳統(tǒng)的耕地遙感影像分割算法領(lǐng)域，依據(jù)圖像的顏色、紋理和形狀特征等特點，大多數(shù)模型使用了基于閾值分割［３］、基于區(qū)域分割［４］、基于邊緣檢測分割［５］以及超像素［６］等方法，但總體分割精度不高，且復(fù)雜多變的遙感影像耕地區(qū)域?qū)鹘y(tǒng)分割模型性能有較大限制。

近年來，人工智能技術(shù)不斷發(fā)展，卷積神經(jīng)網(wǎng)絡(luò)（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ，ＣＮＮ）［７］因其極強的特征提取能力，能更好地利用高分辨率遙感圖像中空間信息和邊界細節(jié)，提取遙感影像中的多尺度特征信息，優(yōu)于傳統(tǒng)方法。２０１５年Ｌｏｎｇ等［８］提出的全卷積神經(jīng)網(wǎng)絡(luò)（ＦｕｌｌｙＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋ，ＦＣＮ）實現(xiàn)了像素級的分割，但實驗得到的結(jié)果較為粗糙，且并未考慮到像素與像素之間的聯(lián)系。為了減少卷積過程中空間細節(jié)的丟失，Ｕ-Ｎｅｔ［９］通過融合低層次的細節(jié)紋理信息和高層次的語義信息來達到多尺度特征融合的效果，但由于在下采樣操作時會丟失局部信息，且很難還原，分割整體性效果較差，易丟失目標(biāo)間長距離信息。

由于Ｔｒａｎｓｆｏｒｍｅｒ［１０］結(jié)構(gòu)在上下文信息提取能力上表現(xiàn)優(yōu)異，逐漸發(fā)展到圖像處理領(lǐng)域。Ｄｏｓｏｖｉｔｓｋｉｙ等提出的（ＶｉｓｉｏｎＴｒａｎｓｆｏｒｍｅｒ，ＶｉＴ）［１１］模型將Ｔｒａｎｓ-ｆｏｒｍｅｒ結(jié)構(gòu)首次應(yīng)用于圖像分類任務(wù)。針對ＶｉＴ模型只能提取單尺度特征問題，Ｌｉｕ等［１２］提出ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ模型通過ＳｈｉｆｔｅｄＷｉｎｄｏｗ來建立分層特征圖，獲取多尺度特征。ＴｒａｎｓＦｕｓｅ［１３］模型通過將Ｔｒａｎｓｆｏｒｍｅｒ和ＣＮＮ融合實現(xiàn)了一個淺層的網(wǎng)絡(luò)架構(gòu)來建模全局關(guān)系和底層細節(jié)，但Ｔｒａｎｓｆｏｒｍｅｒ結(jié)構(gòu)中全連接的注意力機制需要對整個輸入序列進行處理，這在圖像處理任務(wù)中不利于捕捉空間相關(guān)性。

本文基于以上問題，在ＴｒａｎｓＦｕｓｅ算法的基礎(chǔ)上提出的ＳＦ-Ｕｎｅｔ算法，具體如下：

① 針對耕地區(qū)域邊界分割情況復(fù)雜、分割困難等特點，使用ＵＮｅｔ網(wǎng)絡(luò)替換ＴｒａｎｓＦｕｓｅ網(wǎng)絡(luò)中的ＲｅｓＮｅｔ５０［１４］部分，通過跳躍連接增強邊界分割能力。

② 針對耕地遙感圖像中目標(biāo)尺度大、耕地區(qū)域在遙感圖像上普遍大而連續(xù)等問題，利用改進后的ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ結(jié)構(gòu)替換原來的ＶｉＴ網(wǎng)絡(luò)部分，增強模型的長距離信息提取能力，減少空間的丟失。

③ 通過添加深度監(jiān)督機制，添加額外的目標(biāo)函數(shù)對模型中間層進行監(jiān)督學(xué)習(xí)，輔助神經(jīng)網(wǎng)絡(luò)的訓(xùn)練，提高圖像分割網(wǎng)絡(luò)的性能。

１算法原理

１．１Ｔｒａｎｓｆｏｒｍｅｒ編碼器

實驗使用ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ作為Ｔｒａｎｓｆｏｒｍｅｒ編碼器的主干網(wǎng)絡(luò)，相比較ＶｉＴ作為特征提取主干網(wǎng)絡(luò)，通過ＰａｔｃｈＭｅｒｇｉｎｇ層進行下采樣，實現(xiàn)了多層特征提取結(jié)構(gòu)，盡可能減少圖像特征信息的丟失。

ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ提出窗口多頭注意力（Ｗｉｎｄｏｗ-ｂａｓｅｄＭＳＡ，Ｗ-ＭＳＡ）機制，將特征圖分割成多個窗口進行獨立的自注意力計算，使得計算復(fù)雜度與圖像窗口數(shù)量之間呈現(xiàn)線性關(guān)系，極大減少了計算量，相關(guān)的時間復(fù)雜度計算如下［１５－１６］：

Ω（ＭＳＡ）＝４ｈｗＣ２＋２（ｈｗ）２Ｃ，（１）

Ω（Ｗ-ＭＳＡ）＝４ｈｗＣ２＋２Ｍ２ｈｗＣ，（２）

式中：ｈ、ｗ、Ｃ分別表示輸入特征圖的尺寸大小和通道數(shù)，Ｍ表示窗口尺寸。

為保證各個窗口之間的聯(lián)系，在第二個階段引入了移動窗口多頭注意力（ＳｈｉｆｔｅｄＷｉｎｄｏｗ-ｂａｓｅｄＭＳＡ，ＳＷ-ＭＳＡ），通過改變窗口位置提供各個窗口之間的信息聯(lián)系。通過采用映射、注意力機制、ＭＬＰ等來獲取上下文語義信息及全局依賴關(guān)系。

一個ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ模塊如圖１所示，由進行各窗口內(nèi)自注意力計算的Ｗ-ＭＳＡ和進行窗口之間交互計算的ＳＷ-ＭＳＡ兩部分組成，在模塊間插入ＬＮ層，穩(wěn)定并加快了訓(xùn)練過程。

連續(xù)的２個ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ塊的計算如下［１７］：

ｚ＾ｌ＝Ｗ-ＭＳＡ（ＬＮ（ｚｌ－１））＋ｚｌ－１，（３）

ｚｌ＝ＭＬＰ（ＬＮ（ｚ＾ｌ））＋ｚ＾ｌ，（４）

ｚ＾ｌ＋１＝ＳＷ-ＭＳＡ（ＬＮ（ｚｌ））＋ｚｌ，（５）

ｚｌ＋１＝ＭＬＰ（ＬＮ（ｚ＾ｌ＋１））＋ｚ＾ｌ＋１，（６）

式中：ｚ＾ｌ和ｚｌ分別表示（Ｓ）ＷＭＳＡ和ＭＬＰ模塊在第ｌ個模塊的特征輸出，ｄｌ－１表示相應(yīng)ｌ－１層的輸出特征。

１．２ＣＮＮ編碼器

由于Ｕ-Ｎｅｔ模型所需數(shù)據(jù)量少、速度快、分割準(zhǔn)確率高等特點，本文將其作為ＣＮＮ編碼器部分的主干網(wǎng)絡(luò)。Ｕ-Ｎｅｔ網(wǎng)絡(luò)主要包含編碼模塊和解碼模塊兩部分，與ＦＣＮ同樣采用跳躍連接的方式，將輸入特征與同尺寸的特征圖進行聯(lián)接。與ＦＣＮ直接相加融合的方式不同，Ｕ-Ｎｅｔ采用通道拼接的方式，保留了更多的位置信息，其Ｕ-Ｎｅｔ原始網(wǎng)絡(luò)結(jié)構(gòu)如圖２所示。

圖２中編碼部分通過卷積層實現(xiàn)特征的提取，最大池化層（ＭａｘＰｏｏｌｉｎｇ）實現(xiàn)下采樣操作，ＲｅＬＵ激活函數(shù)和批量歸一化層（ＢａｔｃｈＮｏｒｍａｌｉｚａｔｉｏｎ）使訓(xùn)練參數(shù)更有效地向前傳播；解碼部分則是在上采樣的同時，通過跳躍連接的方式實現(xiàn)多維要素的融合，提高網(wǎng)絡(luò)對特征信息的提取能力，最終輸出與原圖像相同尺寸的像素級分類結(jié)果圖。Ｕ-Ｎｅｔ網(wǎng)絡(luò)在獲取更大的感受野的同時，損失了一定的特征信息，分類精確度較低。

１．３ＣＮＮ和Ｔｒａｎｓｆｏｒｍｅｒ融合模塊

為將Ｔｒａｎｓｆｏｒｍｅｒ編碼模塊和ＣＮＮ編碼模塊提取特征圖相結(jié)合，本文使用了基于空間注意力（ＳｐａｔｉａｌＡｔｔｅｎｔｉｏｎ）和通道注意力（ＣｈａｎｎｅｌＡｔｔｅｎｔｉｏｎ）相結(jié)合的Ｆｕｓｉｏｎ融合模塊，將通過注意力模塊計算之后的Ｔｒａｎｓｆｏｒｍｅｒ特征圖和ＣＮＮ特征圖進行拼接并做卷積，如圖３所示。

由于Ｔｒａｎｓｆｏｒｍｅｒ編碼模塊提取特征缺乏局部細節(jié)，因此將Ｔｒａｎｓｆｏｒｍｅｒ特征圖通過通道注意力模塊進行運算，首先對輸入特征圖進行全局最大池化和全局平均池化，再通過全連接層對通道數(shù)先降維再升維，對處理后的２個特征層進行相加，用Ｓｉｇｍｏｉｄ函數(shù)激活生成特征通道注意力特征權(quán)重。卷積特征相對于處理上下文信息能力較弱，容易包含不相關(guān)區(qū)域，因此將ＣＮＮ特征圖通過空間注意力模塊進行運算，對輸入的特征圖進行基于通道的全局最大池化和全局平均池化，將輸出進行通道拼接后通過卷積運算和Ｓｉｇｍｏｉｄ激活函數(shù)生成空間注意力特征權(quán)重。將輸入特征與對應(yīng)的特征權(quán)重相乘并拼接，通過一個卷積層得到輸出特征圖，完成Ｔｒａｎｓ-ｆｏｒｍｅｒ編碼模塊和ＣＮＮ編碼模塊的融合并輸出。

１．４ＳＦ-Ｕｎｅｔ網(wǎng)絡(luò)結(jié)構(gòu)

本文基于ＴｒａｎｓＦｕｓｅ所提出的ＣＮＮ和Ｔｒａｎｓｆｏｒｍｅｒ網(wǎng)絡(luò)相融合的思想，針對遙感耕地影像所存在的欠分割、邊界分割較差等問題，提出了ＳＦ-Ｕｎｅｔ耕地遙感圖像分割方法，其網(wǎng)絡(luò)模型結(jié)構(gòu)如圖４所示。

ＳＦ-Ｕｎｅｔ網(wǎng)絡(luò)分為ＣＮＮ編碼模塊、Ｔｒａｎｓｆｏｒｍｅｒ編碼模塊、解碼模塊、融合模塊和ＡＧ（ＡｔｔｅｎｔｉｏｎＧａｔｅｓ）［１８］模塊四部分。遙感圖像輸入網(wǎng)絡(luò)后分別通過兩路編碼，ＣＮＮ編碼模塊采用ＵＮｅｔ主干網(wǎng)絡(luò)，由４個下采樣卷積塊組成，生成５組不同尺寸大小的特征圖，通過卷積和池化等操作，獲得更大的感受野及高層次語義信息。Ｔｒａｎｓｆｏｒｍｅｒ主干網(wǎng)絡(luò)由改進的ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ構(gòu)成。由于基礎(chǔ)的ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ在生成多級特征圖時要先通過ＰａｔｃｈＰａｒｔｉｔｉｏｎ層，尺寸變?yōu)樵瓉淼模?／４，其同層次特征圖尺寸與ＵＮｅｔ不一致，在融合模塊難以進行融合。本實驗采用改進版的ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ，將通過ＰａｔｃｈＰａｒｔｉｔｉｏｎ層之后的特征層對應(yīng)于Ｕ-Ｎｅｔ網(wǎng)絡(luò)第三層，使用雙線性上采樣方式擴大特征圖，通過ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ模塊進行下采樣操作，以滿足特征層進行融合的條件。融合模塊由空間注意力和通道注意力組合而成，通過一個卷積層進行交互，融合過程不改變特征圖大小，融合之后的通道數(shù)和ＣＮＮ模塊通道數(shù)相對應(yīng)。

ＳＦ-Ｕｎｅｔ通過融合Ｕ-Ｎｅｔ和改進的ＳｗｉｎＴｒａｎｓ-ｆｏｒｍｅｒ主干網(wǎng)絡(luò)，在保留ＣＮＮ強大的局部特征提取能力的同時，加入Ｔｒａｎｓｆｏｒｍｅｒ的全局注意力機制，加強上下文信息聯(lián)系，減少空間細節(jié)的丟失，達到了較好的分割效果。

１．５深度監(jiān)督

ＳＦ-Ｕｎｅｔ模型融合了Ｔｒａｎｓｆｏｒｍｅｒ和ＣＮＮ兩部分，模型較為復(fù)雜，在模型訓(xùn)練時易產(chǎn)生梯度消失或爆炸等問題。為加快網(wǎng)絡(luò)收斂速度，提高網(wǎng)絡(luò)的識別能力，本文引入了Ｌｅｅ等［１９］提出的深度監(jiān)督機制，通過在不同深度特征層中添加額外的目標(biāo)函數(shù)對模型進行監(jiān)督，提高中間層的分類準(zhǔn)確率，從而進一步提高最終輸出的分割性能。深度監(jiān)督機制在ＳＦＵｎｅｔ網(wǎng)絡(luò)中的應(yīng)用如圖５所示。

在圖５中，Ｆ１～Ｆ５表示Ｆｕｓｉｏｎ１～Ｆｕｓｉｏｎ５融合模塊輸出，將Ｆｕｓｉｏｎ１～Ｆｕｓｉｏｎ５這５層輸出作為深度監(jiān)督的輸入，在前４個解碼器階段得到全分辨率的中間特征圖，最后一個解碼器直接輸出全分辨率特征圖。對這５個輸出特征圖使用ＢＣＥＬｏｓｓ和ＩｏＵ-Ｌｏｓｓ［２０］組合的損失函數(shù)，將所有分支的輸出結(jié)果求和取平均作為最終損失進行反向傳播［２１］，計算如下：

式中：ｙｊ、＾ｙｊ分別表示不同解碼層輸出的預(yù)測值和真實標(biāo)簽，Ｎ表示分支總數(shù)。

２實驗結(jié)果與分析

２．１實驗數(shù)據(jù)集

本文所使用的數(shù)據(jù)來自ＧＩＤ數(shù)據(jù)集，是基于我國Ｇａｏｆｅｎ-２衛(wèi)星數(shù)據(jù)而構(gòu)建的大規(guī)模高分辨率遙感圖像數(shù)據(jù)集。本文采用ＧＩＤ-１５精細土地覆蓋集（ＧＩＤ數(shù)據(jù)集），并且對數(shù)據(jù)集進行了預(yù)處理。將數(shù)據(jù)集標(biāo)簽部分進行二值化處理，耕地區(qū)域像素值為２５５，非耕地區(qū)域像素值為０。由于該數(shù)據(jù)集圖像尺寸過大，本文將大圖像進行裁剪成２５６ｐｉｘｅｌ ×２５６ｐｉｘｅｌ進行實驗，如圖６所示。圖６（ａ）為原始遙感圖像，圖６（ｂ）為遙感圖像對應(yīng)的標(biāo)簽圖像，分辨率為７２００ｐｉｘｅｌ×６８００ｐｉｘｅｌ，標(biāo)簽圖像為多分類標(biāo)簽結(jié)果圖。圖６（ｃ）為裁剪后的遙感圖像，圖６（ｄ）為裁剪后的遙感圖像對應(yīng)的二值化處理之后標(biāo)簽圖像，分辨率均為２５６ｐｉｘｅｌ×２５６ｐｉｘｅｌ。

２．２評價指標(biāo)

本實驗設(shè)置了３個評價指標(biāo)用于定量評估模型分割性能，分別是Ｄｉｃｅ系數(shù)（ＤｉｃｅＳｉｍｉｌａｒｉｔｙＣｏｅｆｆｉ-ｃｉｅｎｔ，ＤＳＣ）、交并比（ＩｎｔｅｒｓｅｃｔｉｏｎｏｖｅｒＵｎｉｏｎ，ＩｏＵ）和準(zhǔn)確率（Ａｃｃｕｒａｃｙ，Ａｃｃ），計算如下：

式中：ＴＰ（ＴｒｕｅＰｏｓｉｔｉｖｅ）表示分類正確的正類，ＦＰ（ＦａｌｓｅＰｏｓｉｔｉｖｅ）表示被錯分為正類的負類，ＴＮ（ＴｒｕｅＮｅｇａｔｉｖｅ）表示分類準(zhǔn)確的負類，ＦＮ（ＦａｌｓｅＮｅｇａｔｉｖｅ）表示被錯分為負類的正類。標(biāo)簽圖中正類表示耕地，負類表示背景。

２．３消融實驗

為了驗證ＳＦ-Ｕｎｅｔ模型方法的有效性，分別對ＣＮＮ編碼模塊、Ｔｒａｎｓｆｏｒｍｅｒ編碼模塊和融合模塊進行消融實驗。選?。眨危澹?和改進后的ＳｗｉｎＴｒａｎｓ-ｆｏｒｍｅｒ網(wǎng)絡(luò)模型分別作為ＣＮＮ和Ｔｒａｎｓｆｏｒｍｅｒ的基線模型。通過融合模塊，將并聯(lián)的２路輸出進行融合，并且在每一個融合模塊之后都輸出一個結(jié)果，如表１所示。

由表１可以看出，在Ｔｒａｎｓｆｏｒｍｅｒ和ＣＮＮ的基準(zhǔn)模型上，評價指標(biāo)ＩｏＵ僅有８１．００％和８４．０９％；二者融合之后ＩｏＵ比基準(zhǔn)模型分別提高了５．３２％和２．２３％；當(dāng)Ｆｕｓｉｏｎ融合模塊達到第五層時ＩｏＵ指標(biāo)對比基準(zhǔn)模型分別提高了１０．５７％和６．４８％。從評價指標(biāo)可以看出，Ｔｒａｎｓｆｏｒｍｅｒ和ＣＮＮ模塊的融合對比單一模型有更好的分割精度，隨著Ｆｕｓｉｏｎ分割模塊的增多，分割性能越好。消融實驗各部分的實驗結(jié)果如圖７所示。Ｔｒａｎｓｆｏｒｍｅｒ模塊采用的是改進之后的ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ網(wǎng)絡(luò)，在分割結(jié)果圖中整體性較好，內(nèi)部填充較為完整，但邊緣分割能力較弱。ＣＮＮ模塊采用的是Ｕ-Ｎｅｔ網(wǎng)絡(luò)，邊緣分割較好，但出現(xiàn)較多空洞現(xiàn)象，整體性不強。經(jīng)過５層Ｆｕｓｉｏｎ融合模塊融合之后的模型分割結(jié)果圖中噪聲較少，內(nèi)部填充相比較Ｕ-Ｎｅｔ和ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ模型更加飽滿，輪廓邊界更加清晰，通過融合２路編碼的ＳＦ-Ｕｎｅｔ模型在邊界分割和內(nèi)部填充兩方面相對原模型都有較大提高。不同層數(shù)的Ｆｕｓｉｏｎ融合模塊對模型性能提升不同，融合層數(shù)越多，分割性能越好。由圖７（ｅ）～圖７（ｉ）可以看出，Ｆｕｓｉｏｎ５的分割效果明顯優(yōu)于Ｆｕｓｉｏｎ１的分割效果。實驗證明，利用跳躍連接的方式進行特征融合，對于去除噪聲和加強邊緣分割都有積極作用。

２．４深監(jiān)督實驗結(jié)果分析

本文設(shè)計了５層輸出特征圖進行深監(jiān)督機制來解決深度模型訓(xùn)練時的優(yōu)化問題，加快了網(wǎng)絡(luò)收斂速度和識別能力。為驗證該設(shè)計的有效性，分別對不同數(shù)量特征圖進行深監(jiān)督對比試驗，Ｌｏｓｓ損失結(jié)果對比如圖８所示。圖中Ｄ＿Ｓ表示ＤｅｅｐＳｕｐｅｒｖｉ-ｓｉｏｎ，由圖８可以看出，隨著采用的深監(jiān)督層數(shù)越多，模型收斂越快，當(dāng)采用５層特征圖進行深監(jiān)督時，Ｌｏｓｓ值最低，模型分割性能達到最優(yōu)。

為了從客觀上定量進行總體評價，全尺度監(jiān)督機制結(jié)果對比如表２所示。

由表２可以看出，當(dāng)采用５層特征圖進行深監(jiān)督時，ＩｏＵ值最高，達到９０．５７％，Ｄｉｃｅ系數(shù)達到了９５．０５％，相比較Ｄ＿Ｓ１的ＩｏＵ值高了１．４４％，Ｄｉｃｅ系數(shù)高了１．７６％，在性能方面達到了最優(yōu)。實驗證明，通過添加深監(jiān)督機制，確實提高了模型性能，且隨著深監(jiān)督層數(shù)越多，模型分割性能越好。

２．５不同算法分割性能比較

為了評估ＳＦ-Ｕｎｅｔ模型方法的性能，選?。?Ｎｅｔ、ＰＳＰＮｅｔ、ＳｅｇＮｅｔ、ＴｒａｎｓＦｕｓｅ四種經(jīng)典的語義分割網(wǎng)絡(luò)進行對比試驗，所有網(wǎng)絡(luò)均在相同的軟硬件環(huán)境下進行訓(xùn)練和測試，均使用ＧＩＤ數(shù)據(jù)集進行實驗。各個網(wǎng)絡(luò)模型的分割結(jié)果如圖９所示。

耕地遙感影像因為其自身特性，往往呈片狀，大范圍內(nèi)分布，因此模型分割時農(nóng)田內(nèi)部分割效果和邊緣輪廓分割準(zhǔn)確性十分重要。由圖９可以看出，ＰＳＰＮｅｔ由于具有金字塔結(jié)構(gòu)，對于整體區(qū)域識別分割能力較強，但邊界分割較為模糊；ＳｅｇＮｅｔ和Ｕ-Ｎｅｔ都存在噪聲較大的現(xiàn)象；ＴｒａｎｓＦｕｓｅ分割效果相對較好，但依然存在部分區(qū)域未識別、分割圖中存在少部分噪點現(xiàn)象。相比之下，本文提出的ＳＦ-Ｕｎｅｔ模型分割的遙感影像圖像邊緣更加清晰、圖像完整性更高，分割性能更好。

各模型分割性能指標(biāo)對比如表３所示?？梢钥闯?，本文所提出的ＳＦ-Ｕｎｅｔ網(wǎng)絡(luò)的ＩｏＵ、Ｄｉｃｅ系數(shù)和Ａｃｃ均達到了最優(yōu)，分別達到了９０．５７％、９５．０５％和９５．３８％，相比較Ｕ-Ｎｅｔ模型提高了６．４８％、３．６９％和７．２０％；相比較其他分割模型也有較大提升。本文所提出ＳＦ-Ｕｎｅｔ模型在ＴｒａｎｓＦｕｓｅ和ＳｗｉｎＴｒａｎｓｆｕｓｅ模型方法的基礎(chǔ)上進行改進創(chuàng)新，性能優(yōu)于原網(wǎng)絡(luò)模型，實驗證明了方法的可行性，相比較其他幾種主流的分割網(wǎng)絡(luò)，在遙感影像耕地面積提取上取得了最好的效果。

３結(jié)束語

本文將Ｕ-Ｎｅｔ和ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ模型相結(jié)合，在高分辨率耕地遙感影像分割任務(wù)上，實現(xiàn)了目前深度學(xué)習(xí)方法中最優(yōu)的提取結(jié)果，該方法在數(shù)據(jù)獲取上較為簡單，在耕地區(qū)域提取精度上相對之前的方法有較大提升。

深度學(xué)習(xí)在遙感影像耕地面積提取上有較大發(fā)展空間，作為一種新興技術(shù)，仍然有很多工作需要進一步完善，如語義分割實現(xiàn)的像素級分類會導(dǎo)致出現(xiàn)較多噪點，能否有更高效的方法來去除噪點，以及小塊耕地識別困難等問題，仍然需要后續(xù)的研究工作來繼續(xù)完善。后續(xù)將對相關(guān)問題進行研究，以改進現(xiàn)有方法，從速度和精度上提升高分辨率遙感影像的耕地面積提取。

參考文獻

［１］趙少華，劉思含，毛學(xué)軍，等．新時期我國環(huán)保領(lǐng)域衛(wèi)星遙感技術(shù)的應(yīng)用與發(fā)展［Ｊ］．無線電工程，２０１７，４７（３）：１－７．

［２］黃春波，佃袁勇，周志翔，等．基于時間序列統(tǒng)計特性的森林變化監(jiān)測［Ｊ］．遙感學(xué)報，２０１５，１９（４）：６５７－６６８．

［３］ＯＴＳＵＮ．ＡＴｈｒｅｓｈｏｌｄＳｅｌｅｃｔｉｏｎＭｅｔｈｏｄｆｒｏｍＧｒａｙｌｅｖｅｌＨｉｓｔｏｇｒａｍｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｙｓｔｅｍｓ，Ｍａｎ，ａｎｄＣｙｂｅｒｎｅｔｉｃｓ，１９７９，９（１）：６２－６６．

［４］丁海勇，王雨軒，毛宇瓊，等．基于動態(tài)閾值區(qū)域分裂合并算法的高分辨率遙感圖像分割研究［Ｊ］．測繪通報，２０１６（８）：１４５－１４６．

［５］張愛華，余勝生，周敬利．一種基于邊緣檢測的局部閾值分割算法［Ｊ］．小型微型計算機系統(tǒng)，２００３，２４（４）：６６１－６６３．

［６］南柄飛，穆志純．基于ＳＬＩＣ０融合紋理信息的超像素分割方法［Ｊ］．儀器儀表學(xué)報，２０１４，３５（３）：５２７－５３４．

［７］ＬＥＣＵＮＹ，ＢＯＴＴＯＵＬ，ＢＥＮＧＩＯＹ，ｅｔａｌ．Ｇｒａｄｉｅｎｔｂａｓｅｄ"ＬｅａｒｎｉｎｇＡｐｐｌｉｅｄｔｏＤｏｃｕｍｅｎｔＲｅｃｏｇｎｉｔｉｏｎ［Ｊ］．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥ，１９９８，８６（１１）：２２７８－２３２４．

［８］ＬＯＮＧＪ，ＳＨＥＬＨＡＭＥＲＥ，ＤＡＲＲＥＬＬＴ．ＦｕｌｌｙＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓｆｏｒＳｅｍａｎｔｉｃＳｅｇｍｅｎｔａｔｉｏｎ［Ｃ］∥ ２０１５"ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ：ＩＥＥＥ，２０１５：３４３１－３４４０．

［９］ＲＯＮＮＥＢＥＲＧＥＲＯ，ＦＩＳＣＨＥＲＰ，ＢＲＯＸＴ．ＵＮｅｔ：ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓｆｏｒＢｉｏｍｅｄｉｃａｌＩｍａｇｅＳｅｇｍｅｎｔａｔｉｏｎ"［Ｃ］∥１８ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅ．Ｍｕｎｉｃｈ：Ｓｐｒｉｎｇｅｒ，２０１５：２３４－２４１．

［１０］ＶＡＳＷＡＮＩＡ，ＳＨＡＺＥＥＲＮ，ＰＡＲＭＡＲＮ，ｅｔａｌ．ＡｔｔｅｎｔｉｏｎＩｓＡｌｌＹｏｕＮｅｅｄ［ＥＢ／ＯＬ］．（２０１７－１２－０６）［２０２３－１０－２０］．ｈｔｔｐｓ：∥ａｒｘｉｖ．ｏｒｇ／ｐｄｆ／１７０６．０３７６２ｖ５．ｐｄｆ．

［１１］ＤＯＳＯＶＩＴＳＫＩＹＡ，ＢＥＹＥＲＬ，ＫＯＬＥＳＮＩＫＯＶＡ，ｅｔａｌ．ＡｎＩｍａｇｅＩｓＷｏｒｔｈ１６ × １６Ｗｏｒｄｓ：ＴｒａｎｓｆｏｒｍｅｒｓｆｏｒＩｍａｇｅ"ＲｅｃｏｇｎｉｔｉｏｎａｔＳｃａｌｅ［ＥＢ／ＯＬ］．（２０２０－１０－２２）［２０２３－１０－１５］．ｈｔｔｐｓ：∥ａｒｘｉｖ．ｏｒｇ／ａｂｓ／２０１０．１１９２９．

［１２］ＬＩＵＺ，ＬＩＮＹＴ，ＣＡＯＹ，ｅｔａｌ．ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ：ＨｉｅｒａｒｃｈｉｃａｌＶｉｓｉｏｎＴｒａｎｓｆｏｒｍｅｒＵｓｉｎｇＳｈｉｆｔｅｄＷｉｎｄｏｗｓ［Ｃ］∥２０２１ＩＥＥＥ／ＣＶＦＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒ"Ｖｉｓｉｏｎ．Ｍｏｎｔｒｅａｌ：ＩＥＥＥ，２０２１：９９９２－１０００２．

［１３］ＺＨＡＮＧＹＤ，ＬＩＵＨＹ，ＨＵＱＹ．Ｔｒａｎｓｆｕｓｅ：ＦｕｓｉｎｇＴｒａｎｓｆｏｒｍｅｒｓａｎｄＣＮＮｓｆｏｒＭｅｄｉｃａｌＩｍａｇｅＳｅｇｍｅｎｔａｔｉｏｎ［Ｃ］∥２４ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅ．Ｓｔｒａｓｂｏｕｒｇ：Ｓｐｒｉｎｇｅｒ，２０２１：１４－２４．

［１４］ＨＥＫＭ，ＺＨＡＮＧＸＹ，ＲＥＮＳＱ，ｅｔａｌ．ＤｅｅｐＲｅｓｉｄｕａｌ"ＬｅａｒｎｉｎｇｆｏｒＩｍａｇｅＲｅｃｏｇｎｉｔｉｏｎ［Ｃ］∥２０１６ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｌａｓ"Ｖｅｇａｓ：ＩＥＥＥ，２０１６：７７０－７７８．

［１５］周澤昊．基于ＳｗｉｎＳｐｅｃＴｒａｎｓｆｏｒｍｅｒ的膽管癌顯微高光譜圖像分割研究［Ｄ］．上海：華東師范大學(xué)，２０２２．

［１６］王金祥，付立軍，尹鵬濱，等．基于ＣＮＮ與Ｔｒａｎｓｆｏｒｍｅｒ的醫(yī)學(xué)圖像分割［Ｊ］．計算機系統(tǒng)應(yīng)用，２０２３，３２（４）：１４１－１４８．

［１７］王軍，高放，省海先，等．基于ＳｗｉｎＴｒａｎｓｆｏｒｍｅｒ生成對抗網(wǎng)絡(luò)的圖像生成算法［Ｊ］．小型微型計算機系統(tǒng)，２０２４，４５（１）：２４１－２４８．

［１８］ＯＫＴＡＹＯ，ＳＣＨＬＥＭＰＥＲＪ，ＬＥＦＯＬＧＯＣＬ，ｅｔａｌ．ＡｔｔｅｎｔｉｏｎＵＮｅｔ：ＬｅａｒｎｉｎｇＷｈｅｒｅｔｏＬｏｏｋｆｏｒｔｈｅＰａｎｃｒｅａｓ"［ＥＢ／ＯＬ］．（２０１８－０４－１１）［２０２３－１１－２０］．ｈｔｔｐｓ：∥ａｒｘｉｖ．ｏｒｇ／ａｂｓ／１８０４．０３９９９．

［１９］ＬＥＥＣＹ，ＸＩＥＳＮ，ＧＡＬＬＡＧＨＥＲＰ，ｅｔａｌ．ＤｅｅｐｌｙｓｕｐｅｒｖｉｓｅｄＮｅｔｓ［Ｃ］∥ ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＥｉｇｈｔｅｅｎｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅａｎｄＳｔａｔｉｓｔｉｃｓ．［Ｓ．ｌ．］：ＰＭＬＲ，２０１５：５６２－５７０．

［２０］ＷＥＩＪ，ＷＡＮＧＳＨ，ＨＵＡＮＧＱＭ．Ｆ３Ｎｅｔ：Ｆｕｓｉｏｎ，ＦｅｅｄｂａｃｋａｎｄＦｏｃｕｓｆｏｒＳａｌｉｅｎｔＯｂｊｅｃｔＤｅｔｅｃｔｉｏｎ［Ｃ］∥３４ｔｈＡＡＡＩＣｏｎｆｅｒｅｎｃｅｏｎＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ．［Ｓ．ｌ．］：ＡＡＡＩ，２０２０：１２３２１－１２３２８．

［２１］秦傳波，宋子玉，曾軍英，等．聯(lián)合多尺度和注意力－殘差的深度監(jiān)督乳腺癌分割［Ｊ］．光學(xué)精密工程，２０２１，２９（４）：８７７－８９５．

作者簡介

秦倫明男，（１９８３—），博士，講師，碩士生導(dǎo)師。主要研究方向：圖像分割、目標(biāo)檢測、多源圖像視頻信息處理、電力設(shè)備在線監(jiān)測等。

凌雪海男，（１９９７—），碩士研究生。主要研究方向：深度學(xué)習(xí)、圖像分割和計算機視覺。

鄒鈺潔女，（１９９１—），碩士，工程師。主要研究方向：電氣設(shè)備狀態(tài)檢測。

龔楊洋男，（１９９８—），碩士研究生。主要研究方向：計算機視覺、光流估計算法。

（*通信作者）邊后琴女，（１９７６—），博士，副教授。主要研究方向：智能控制、計算機視覺和模式識別等。

王悉男，（１９８０—），博士，副教授，碩士生導(dǎo)師。主要研究方向：列車智能駕駛、模型預(yù)測控制。

基金項目：國家自然科學(xué)基金面上項目（６２０７３０２４）

無線電工程2024年5期

無線電工程的其它文章: 低軌星座網(wǎng)絡(luò)的空天地一體化無線光通信資源調(diào)度方法; 基于稀疏碼多址接入技術(shù)的可見光通信系統(tǒng)性能研究; 格上身份基簡短關(guān)聯(lián)環(huán)簽名及其電子投票應(yīng)用; 基于改進ResNet的PMSM退磁與偏心故障診斷方法; 基于組合賦權(quán)TOPSIS的海上目標(biāo)威脅評估; 基于融合注意力Bi-LSTM的V2X通信阻塞預(yù)測方法

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于SF-Unet的高分辨率耕地遙感影像分割