何錦濤,張文婷,宋嘉玟,趙耀東,張 朋
西南石油大學(xué)計算機科學(xué)學(xué)院,四川 成都 610500
高分遙感影像分類是指按照某種規(guī)則將每個像素點或者每塊區(qū)域根據(jù)其在不同譜段的光譜特征、空間結(jié)構(gòu)特征或其他信息劃分為不同的類別[1],這些類別包括房屋、河流、田地等。目前大多數(shù)關(guān)于卷積神經(jīng)網(wǎng)絡(luò)在高分遙感影像分類方面的研究都實現(xiàn)了基本的分類。然而,對地形較為復(fù)雜的環(huán)境進行分類時,卷積神經(jīng)網(wǎng)絡(luò)存在特征提取精度低、模型表達和建模能力有局限性、缺少顯著標(biāo)記等問題。
本文通過對傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進行改進來完成高分辨率遙感影像的分類標(biāo)記[2]。改進的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),增添了針對特征圖的強化模塊和通道域的注意力模塊,因此模型可以實現(xiàn)對圖像更準(zhǔn)確的預(yù)測,并具有更強的泛化能力[3]。
試驗使用數(shù)據(jù)擴充和增強技術(shù)[4]對選取地的樣本圖像進行了預(yù)處理,使試驗樣本數(shù)據(jù)更加豐富,更有利于試驗的開展。試驗結(jié)果用于評價提出的改進算法的準(zhǔn)確性和有效性,并采用4種評價參數(shù)來對試驗結(jié)果進行評估。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是計算機視覺應(yīng)用所使用的一種深度學(xué)習(xí)模型,成功地應(yīng)用于當(dāng)今的信號處理、模式識別、生物醫(yī)學(xué)等領(lǐng)域。CNN將輸入圖像數(shù)據(jù)分解為不同像素大小的層,在輸入的圖像數(shù)據(jù)中學(xué)習(xí)輸入和輸出的映射關(guān)系。CNN的輸入層是由圖片像素轉(zhuǎn)化來的數(shù)組;隱藏層主要由卷積層、池化層和全連接層交替連接組成;輸出層通常是全連接層,在圖像處理問題中,輸出層使用邏輯回歸函數(shù)或softmax函數(shù)輸出分類標(biāo)簽[5]。在圖像語義分割中,輸出層直接輸出每個像素的分類結(jié)果。
在經(jīng)典的CNN模型中,輸入層輸入的數(shù)據(jù)首先進入第1個卷積層,每個卷積層帶有其特有的過濾器,是一個數(shù)字矩陣。在卷積層中,輸入的矩陣與過濾器進行卷積運算后得到一個新的矩陣,即特征圖。特征圖在池化層中進行降維操作后會進入下一個池化層,經(jīng)過卷積運算后再次被池化。由于過濾器的不同,在不同的卷積層中,過濾器會對輸入圖像進行輪廓檢測、邊緣檢測、模糊化、銳化等多種操作[6]。經(jīng)過多次卷積和池化操作后,數(shù)據(jù)抵達全連接層,全連接層通過激活函數(shù)對圖像進行分類,最終的輸出結(jié)果表示輸入圖像輸入某個類別的概率。
原始的卷積網(wǎng)絡(luò)模型存在一些缺點,主要包括:模型提取圖像特征信息的準(zhǔn)確率較低且信息之間的相關(guān)性較弱;模型不能充分挖掘圖像中多種類型的特征信息;網(wǎng)絡(luò)模型對表達能力和泛化能力較弱等。針對這些缺點,本文在原有卷積網(wǎng)絡(luò)模型的基礎(chǔ)上又增加了特征強化模塊和通道域注意力模塊,以提高卷積神經(jīng)網(wǎng)絡(luò)的性能。
原始網(wǎng)絡(luò)在對圖像進行特征提取時只是獲取了區(qū)域中非零部分的信息,模型采用空洞卷積的稀疏采樣方式會引起網(wǎng)格效應(yīng),會導(dǎo)致模型訓(xùn)練的不充分,從而缺少相關(guān)性的特征映射信息。
為了解決這個問題,本文設(shè)計了特征圖的強化模塊。該模塊的核心步驟為:將原始特征圖輸入至1×1的卷積核進行降維,再將其分別輸入至2個低擴張率的空洞卷積進行特征信息提取的學(xué)習(xí),最后輸出更具判別性的特征圖。同時,在每次卷積后增設(shè)批量處理歸一化處理層用來標(biāo)準(zhǔn)化每個卷積核的數(shù)據(jù),這提高了模型的運算效率和網(wǎng)絡(luò)的收斂速率,減少了過擬合的現(xiàn)象,提高了對鄉(xiāng)村遙感影像的特征信息提取的精度和相關(guān)性。
原始卷積神經(jīng)網(wǎng)絡(luò)隨著網(wǎng)絡(luò)層的不斷深入,模型的感受隨之?dāng)U大,對特征圖的分辨率也隨之下降,因此,在淺層網(wǎng)絡(luò)上,模型提取到的更多是圖像的細節(jié)特征,而在深層網(wǎng)絡(luò)上,模型獲取到的主要是圖像的語義特征信息。
引入通道域注意力模塊能使模型更好地融合帶有不同特征信息的特征圖。該模塊的核心步驟如下。
對于高層特征,首先將其輸入至卷積核中,對特征圖進行空間維度上的壓縮,該部分通過全局平均池化來完成;接著,模型對壓縮后的特征圖進行激活和歸一化,激活函數(shù)使用softmax函數(shù);接下來對通道進行升維,并使用ReLu函數(shù)將權(quán)重歸一化;最后,使用scale函數(shù)完成每一個通道的權(quán)重分配。
對于低層特征,首先輸入至1×1卷積核進行處理,接著在與通道權(quán)重相乘后,與高層特征一起合并輸出。
該模塊讓卷積網(wǎng)絡(luò)模型可以對信息的關(guān)鍵程度有更精準(zhǔn)的了解,更多地去關(guān)注相對重要的通道,從而提高特征的表征能力。
改進后的卷積網(wǎng)絡(luò)是基于一般的卷積網(wǎng)絡(luò)結(jié)構(gòu)進行了增添處理,改進后的模型加入了特征強化模塊和通道域注意力模塊。特征強化模塊用來提高遙感圖像特征信息的相關(guān)性和準(zhǔn)確性,同時緩解網(wǎng)格效應(yīng);通道域注意力模塊將深層特征進行輸入,低層特征進行加權(quán),有效地保存了特征圖的細節(jié)信息,且提升了卷積網(wǎng)絡(luò)的信息提取能力和精度。
改進后的卷積網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示:首先,輸入一張高分遙感影像圖進行預(yù)處理操作,包括灰度化、標(biāo)準(zhǔn)化和裁剪等;然后,通過卷積層和池化層進行特征提取和降維,并輸出步幅為4的中間結(jié)果;接著,經(jīng)過Block1、Block2、Block3,逐步提高輸出步幅,以獲取圖像的不同尺度信息和更加詳細的語義特征,在Block4中,引入了特征強化模塊對特征圖進行處理,提高其密集性和相關(guān)性,從而更好地實現(xiàn)表征性和分類效果;隨后,將特征圖進行2倍上采樣,輸入通道域注意力模塊對低層特征進行加權(quán)融合,再次進行2倍上采樣,最后進行4倍上采樣得到最終輸出結(jié)果。
圖1 改進后的卷積網(wǎng)絡(luò)結(jié)構(gòu)
本文將研究區(qū)域選取在我國海南省的瓊海沙美村,試驗?zāi)康氖菍︵l(xiāng)村生態(tài)特征進行提取和標(biāo)記。試驗選取了幾幅具有代表性的遙感影像作為試驗數(shù)據(jù)集,并基于該數(shù)據(jù)集進行模型訓(xùn)練。由于圖像數(shù)據(jù)集中的樣本過大,所以在對圖像進行特征提取之前,需要對樣本進行切割處理,本文將其切割為256×256像素大小的圖像。
由于卷積神經(jīng)網(wǎng)絡(luò)使用到的參數(shù)數(shù)量龐大,當(dāng)模型在學(xué)習(xí)訓(xùn)練的過程中數(shù)據(jù)量不足時,很容易出現(xiàn)過擬合的問題。為解決該問題,對圖像進行了數(shù)據(jù)擴充和增強,經(jīng)過處理后,數(shù)據(jù)集的數(shù)量得到了擴大,數(shù)據(jù)集的多樣性大大豐富,算法的魯棒性也得到提升。本文將數(shù)據(jù)集按照4:1的比例分為訓(xùn)練集和驗證集。訓(xùn)練的過程中使用SGD算法來更新卷積神經(jīng)網(wǎng)絡(luò)中的參數(shù):學(xué)習(xí)率初始值設(shè)置為0.01,動量設(shè)置為0.85,并且每經(jīng)過10 000輪迭代就將學(xué)習(xí)率縮小為原來的1/10,經(jīng)過40 000次迭代結(jié)束訓(xùn)練,得到改進后的卷積神經(jīng)網(wǎng)絡(luò)模型。具體的試驗流程如圖2所示。
圖2 試驗流程
試驗結(jié)果如圖3所示,圖3(a)為選取的特定地區(qū)的高分遙感影像,圖3(b)為改進的卷積神經(jīng)網(wǎng)絡(luò)處理后的圖像,其中灰色部分為提取出的目標(biāo)鄉(xiāng)村建筑的區(qū)域,可以看到改進后的卷積神經(jīng)網(wǎng)絡(luò)能夠較好地提取鄉(xiāng)村生態(tài)特征。
圖3 試驗結(jié)果
為了更全面且準(zhǔn)確地評估該算法的精確度,使用了Kappa系數(shù)、正確率、虛警率和漏檢率4種評價參數(shù)。評估依據(jù)為:4種評價參數(shù)的范圍均位于0~1,正確率和Kappa系數(shù)的值在該范圍內(nèi)越高,模型的分類效果越好;虛警率和漏檢率在該范圍內(nèi)值越低,模型的分類效果越好。每組試驗的分類準(zhǔn)確率和評價指標(biāo)如表1所示,該結(jié)果充分驗證了本文提出的改進卷積神經(jīng)網(wǎng)絡(luò)模型適用于大幅高空間分辨率遙感影像的處理,具有良好的有效性和可行性。
表1 試驗結(jié)果評價
本文使用了改進的卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)對鄉(xiāng)村遙感影像的特征提取。試驗結(jié)果表明,此方法比傳統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)信息提取的效果更好、精度更高。
本文使用海南省的鄉(xiāng)村遙感圖像作為原始樣本數(shù)據(jù),樣本數(shù)量較少,因此在試驗過程中對樣本進行了數(shù)據(jù)擴充和增強。此外,使用了特征強化模塊和通道域注意力模塊,對網(wǎng)絡(luò)模型進行較大的改進,大大提升了網(wǎng)絡(luò)對特征信息的提取能力。試驗選取的區(qū)域大多分布在農(nóng)田、草地和水域等鄉(xiāng)村典型區(qū)域,地貌特征較復(fù)雜。由于原始樣本數(shù)量的限制,模型在對鄉(xiāng)村遙感圖像的特征提取方面的表現(xiàn)沒有達到預(yù)期效果,未來在樣本數(shù)據(jù)的處理方面仍有較大改進和完善的空間,同時也可嘗試多種遙感影像特征提取技術(shù)的結(jié)合處理,以便更高效地提取出鄉(xiāng)村遙感圖像的有效特征信息。