彭俊桂 劉曉彬 黃有章
傳統(tǒng)的語義分割方法主要是通過提取圖像特征來實(shí)現(xiàn),但由于現(xiàn)實(shí)世界物體邊界關(guān)系極其復(fù)雜,空間位置分布不均勻,成像結(jié)果容易受到光線的干擾,使得語義分割任務(wù)成為一個復(fù)雜的問題。這些問題制約了語義分割的準(zhǔn)確性和效率,不能滿足遙感圖像語義分割應(yīng)用的需求,大量關(guān)鍵數(shù)據(jù)不能得到充分利用。
為改善Deeplabv3+模型的語義分割效率和精確度,并針對上述模型的不足之處提出對應(yīng)的改進(jìn)方案,提出了采用MobilenetV2作為DeeplabV3+主干網(wǎng)絡(luò)的方法,經(jīng)實(shí)驗(yàn)驗(yàn)證,在遙感圖像語義分割中具有良好的檢測性能,可以很好地應(yīng)用于工業(yè)中。
DeepLabV3+網(wǎng)絡(luò)包含了骨干網(wǎng)絡(luò)、空洞空間金字塔池化層和雙線性插值進(jìn)行上采樣模塊。此模型算法的流程是:首先遙感圖像進(jìn)入網(wǎng)絡(luò)的編碼階段進(jìn)行特征提取,在此階段圖片信息進(jìn)入改進(jìn)的ASPP層進(jìn)行多尺度特征提取和通道加權(quán)處理,獲得較好的全局和局部信息;最后是進(jìn)行解碼階段,對獲取到的信息進(jìn)行采樣恢復(fù)至原圖尺寸像素,并對每個像素點(diǎn)分類,達(dá)到語義分割效果。
DeeplabV3+原有的主干網(wǎng)絡(luò)Xception對類別多的分割任務(wù)有較好效果,但其網(wǎng)絡(luò)復(fù)雜度高、模型參數(shù)量大,由于遙感影像圖像、場景信息量大,隨著訓(xùn)練的進(jìn)行,參數(shù)量不斷加大,增加了訓(xùn)練的難度,故Xception不適合提取遙感地物特征信息,因此使用MobileNetV2替換Xception網(wǎng)絡(luò),使用輕量化網(wǎng)絡(luò)MobileNetV2作為DeepLabV3+的主干網(wǎng)絡(luò),其網(wǎng)絡(luò)體積小參數(shù)量少,可以更快速、更精準(zhǔn)地從大量遙感影像信息中提取遙感地物。引入線性瓶頸結(jié)構(gòu),構(gòu)成線性瓶頸倒殘差結(jié)構(gòu),在減少了遙感影像地物信息提取參數(shù)和計(jì)算量的同時,殘差結(jié)構(gòu)下也會減少信息丟失。MobileNetV2中添加擴(kuò)張倍數(shù)控制網(wǎng)絡(luò)大小,雖然網(wǎng)絡(luò)結(jié)構(gòu)較深,但計(jì)算量少,能節(jié)省訓(xùn)練時間和資源,對遙感影像中遙感地物特征提取有很大的優(yōu)勢。
將MobileNetV2其他參數(shù)不變,將其中3個步長為2的改為1,改變步長使輸入矩陣變小更慢,但可以使其獲取更多的特征信息。
實(shí)驗(yàn)過程在Linux操作系統(tǒng),內(nèi)存12 G,GPU(T4)設(shè)備上進(jìn)行,使用深度學(xué)習(xí)框架pytorch1.2.0和Adam優(yōu)化器來進(jìn)行迭代更新參數(shù),Adam可動態(tài)調(diào)節(jié)學(xué)習(xí)率,其中weightdecay為1e-4,初始學(xué)習(xí)率為8e-4。圖片輸入對其進(jìn)行了翻轉(zhuǎn)、旋轉(zhuǎn)、縮放和隨機(jī)打亂等操作進(jìn)行數(shù)據(jù)增強(qiáng)。
WHDLD數(shù)據(jù)集是武漢大學(xué)制作的遙感圖像分割數(shù)據(jù)集,數(shù)據(jù)覆蓋包括6類地貌:裸地、遙感地物、人行道、道路、植被以及水域。數(shù)據(jù)集中包含4 940張遙感影像及相對應(yīng)的地物分類標(biāo)記樣本。
平均像素準(zhǔn)確率(mPA)是指計(jì)算正確分類的像素與所有像素?cái)?shù)量的比值;交并比(Intersection over Union,IoU)是指某一類別預(yù)測結(jié)果與真實(shí)值的交集與并集的比值,IoU值越高說明預(yù)測結(jié)果和真實(shí)值的重合比例越高。平均交并比(mean Intersection over Union,mIoU)是對每一類的IoU求和后的再平均。
根據(jù)在WHDLD遙感圖像數(shù)據(jù)集上進(jìn)行的對比實(shí)驗(yàn),可以看出,針對模型參數(shù)大、運(yùn)行內(nèi)存量過高,難以用于工業(yè)部署等問題,可以采用MobilenetV2作為骨干網(wǎng)絡(luò),改變其步長再提升精確度的解決方案。