肖讓 唐亮 張勇
摘? 要:遙感圖像技術(shù)隨著發(fā)展,其應(yīng)用領(lǐng)域不斷擴(kuò)大,同時(shí)在各個(gè)領(lǐng)域中進(jìn)行分類,使其利用效率和應(yīng)用效果得到最大限度地提高和發(fā)揮,與實(shí)際應(yīng)用相結(jié)合,對(duì)遙感圖像分類進(jìn)行加強(qiáng)研究,也是目前重要的研究課題。在深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域,通過(guò)對(duì)典型遙感圖像模型的分析,從提高分類準(zhǔn)確率和減少訓(xùn)練時(shí)間等方面對(duì)模型進(jìn)行相應(yīng)改進(jìn)和優(yōu)化,該文就此進(jìn)行了進(jìn)一步闡述。
關(guān)鍵詞:深度神經(jīng)網(wǎng)絡(luò)? 遙感圖像? 分類研究
中圖分類號(hào):TP751 ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2020)01(a)-0022-02
1? 深度神經(jīng)網(wǎng)絡(luò)及網(wǎng)絡(luò)模型概述
1.1 深度神經(jīng)網(wǎng)絡(luò)
深度神經(jīng)網(wǎng)絡(luò)成為近年來(lái)研究的熱點(diǎn),其所涉及的領(lǐng)域包括物理生物、計(jì)算機(jī)、數(shù)學(xué)等,基于人工神經(jīng)系統(tǒng)進(jìn)行模擬的復(fù)雜數(shù)學(xué)模型,通過(guò)各種連接方式,將神經(jīng)元作為基本節(jié)點(diǎn),構(gòu)成不同的網(wǎng)絡(luò)結(jié)構(gòu)和模型,信號(hào)傳輸過(guò)程中的加權(quán)值通過(guò)神經(jīng)元之間的連接進(jìn)行表現(xiàn),由激勵(lì)函數(shù)和權(quán)重值對(duì)網(wǎng)絡(luò)輸出進(jìn)行確定[1]。
典型的神經(jīng)網(wǎng)絡(luò)要由學(xué)習(xí)規(guī)則,激活函數(shù)和結(jié)構(gòu)3個(gè)部分組成;單層神經(jīng)網(wǎng)絡(luò)主要由有限個(gè)神經(jīng)元組成;而典型的三層神經(jīng)網(wǎng)絡(luò)主要由隱含層、輸入層和輸出層構(gòu)成。根據(jù)神經(jīng)網(wǎng)絡(luò)中內(nèi)部信息流動(dòng)的方向進(jìn)行劃分,可分為兩種:前饋性和反饋型。前一種網(wǎng)絡(luò)中最廣泛應(yīng)用的是反向傳播算法,其主要分為正向傳播和反向傳播兩個(gè)步驟[2]。
在針對(duì)待解決的問(wèn)題,采用傳統(tǒng)模式進(jìn)行識(shí)別時(shí),主要通過(guò)人工設(shè)計(jì)相應(yīng)的特征,并通過(guò)特定的算法對(duì)特征進(jìn)行提取,按照所提取的特征進(jìn)行分類器輸出,并對(duì)分類器進(jìn)行訓(xùn)練,然后對(duì)測(cè)試樣本按照訓(xùn)練好的分類器進(jìn)行分類。在這種識(shí)別模式中,由于特征設(shè)計(jì)受到限制,對(duì)圖像中所蘊(yùn)含的豐富信息無(wú)法充分表達(dá),通過(guò)神經(jīng)網(wǎng)絡(luò)的應(yīng)用,從圖像中提取特征更為全面。
1.2 AlexNet網(wǎng)絡(luò)遙感模型
此模型在基于深度卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用中,在完成圖像分類和目標(biāo)定位任務(wù)方面取得了較好的應(yīng)用成果,因此受到極大的關(guān)注和重視。此網(wǎng)絡(luò)模型所使用的公開(kāi)數(shù)據(jù)集,含有2萬(wàn)多個(gè)類別的,超過(guò)1500萬(wàn)幅帶標(biāo)簽的高分率圖像;采用多個(gè)GPU應(yīng)用于訓(xùn)練過(guò)程和輸入數(shù)據(jù)處理的加速計(jì)算,可實(shí)現(xiàn)分段同步進(jìn)行訓(xùn)練,使訓(xùn)練時(shí)間有效縮短;具有的Dropout組合模型,可對(duì)不同模型進(jìn)行結(jié)果預(yù)測(cè),使測(cè)試誤差降低,但其所對(duì)單個(gè)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練所需時(shí)間較長(zhǎng),能夠使神經(jīng)遠(yuǎn)之間較為復(fù)雜的自適應(yīng)關(guān)系得到一定程度的降低,并通過(guò)被迫學(xué)習(xí),對(duì)不同的網(wǎng)絡(luò)結(jié)構(gòu)提高參數(shù)的適應(yīng)性,使網(wǎng)絡(luò)結(jié)構(gòu)的泛化能力提高。
在數(shù)據(jù)處理方式主要采用利用PCA對(duì)RGB的色彩空間進(jìn)行成分分析,以及隨機(jī)裁剪輸入的圖像兩種方式。前者通過(guò)對(duì)RGB像素集合,進(jìn)行PCA處理,主要借助于自然圖像中光照顏色和強(qiáng)度在圖像識(shí)別不變的情況下變化不定的重要屬性進(jìn)行操作,并進(jìn)行高斯擾動(dòng);后者是對(duì)訓(xùn)練圖像進(jìn)行隨機(jī)裁剪,圖像輸出大小為256×256,隨機(jī)裁剪大小設(shè)定為224×224,同時(shí)執(zhí)行水平翻轉(zhuǎn),并在測(cè)試過(guò)程需要進(jìn)行5次裁剪,包括中間、右上、右下、左上、左下,通過(guò)水平翻轉(zhuǎn),最終進(jìn)行平均值的計(jì)算。
2? 遙感圖像分類
圖像分類中因所含成分復(fù)雜、地物數(shù)量較多,根據(jù)尺度的不同進(jìn)行分類時(shí),主要采用兩種分類方式:基于像素和面向?qū)ο?。其中面向?qū)ο蟮姆诸愔?,基于深度神?jīng)網(wǎng)絡(luò)的遙感圖像對(duì)象分類,主要研究方向?yàn)樘岣叻诸惖臏?zhǔn)確率[3]。
2.1 分類模型選擇
目前隨著研究,出現(xiàn)了不同類型的卷積神經(jīng)網(wǎng)絡(luò),隨著層數(shù)不斷增多,目前網(wǎng)絡(luò)模型現(xiàn)在達(dá)到22層,在大規(guī)模的分類任務(wù)中,網(wǎng)絡(luò)越深獲得成效越好,層數(shù)增加使分類識(shí)別率提高的同時(shí),也增大了計(jì)算量,對(duì)計(jì)算資源也提出了更高的要求,另外時(shí)間成本也隨之提高,因此對(duì)于小規(guī)模任務(wù)和實(shí)時(shí)性任務(wù)而言,需要針對(duì)特定的分類任務(wù)確定相應(yīng)的平衡點(diǎn)。
在針對(duì)VGG、AlexNet、Googlenet、Lenet這4種深度神經(jīng)網(wǎng)絡(luò),進(jìn)行最適合的網(wǎng)絡(luò)進(jìn)行選擇時(shí),通過(guò)UCM公開(kāi)遙感數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí)間和分類準(zhǔn)確率的測(cè)試。從表1的數(shù)據(jù)對(duì)比可以看出,在分類準(zhǔn)確率的表現(xiàn)上,Lenet不太理想,AlexNet雖然在準(zhǔn)確率方面不如Googlenet優(yōu)異,但其訓(xùn)練時(shí)間表現(xiàn)較好,因此作為最終的遙感圖像分類網(wǎng)絡(luò)模型。
2.2 改進(jìn)的遙感圖像分類模型
在標(biāo)準(zhǔn)網(wǎng)絡(luò)結(jié)構(gòu)中主要有:3個(gè)池化層、1個(gè)softmax層、3個(gè)全連接層、5個(gè)卷積層。在深度神經(jīng)網(wǎng)格模型中,可以實(shí)現(xiàn)特征的提取,訓(xùn)練樣本的特征表達(dá)向量由此模型的最后一個(gè)全連接層進(jìn)行輸出,特征向量分類由最后一層的softmax進(jìn)行完成[4]。針對(duì)此流程可以通過(guò)SVW對(duì)最后一層進(jìn)行替換,對(duì)分類任務(wù)進(jìn)行優(yōu)化。同樣經(jīng)過(guò)數(shù)據(jù)集訓(xùn)練和測(cè)試,改進(jìn)前后的對(duì)比數(shù)據(jù)如表2所示。
從對(duì)比數(shù)據(jù)中可以看出,改進(jìn)后的網(wǎng)絡(luò)模型在分類準(zhǔn)確率上有了提升,同時(shí)訓(xùn)練時(shí)間也極大地縮短,對(duì)原模型進(jìn)行了優(yōu)化。但從整體效果來(lái)看,其分類準(zhǔn)確類依然未達(dá)到較高水平,而UCM遙感圖像數(shù)據(jù)集的訓(xùn)練樣本較少,也受到較小規(guī)模的網(wǎng)絡(luò)模型的學(xué)習(xí)特征的限制,其分類準(zhǔn)確率較低,而圖像數(shù)據(jù)集的規(guī)模因受到各因素的限制較難擴(kuò)大,因此只能通過(guò)對(duì)訓(xùn)練過(guò)程的優(yōu)化和改進(jìn),使分類準(zhǔn)確率得到提高。
所以針對(duì)此問(wèn)題,采用模型先利用其他數(shù)據(jù)進(jìn)行訓(xùn)練,再對(duì)剛開(kāi)始訓(xùn)練的網(wǎng)絡(luò)模型中的權(quán)重變量進(jìn)行賦值的方式進(jìn)行權(quán)值遷移,而賦予的權(quán)得來(lái)自于已訓(xùn)練好的網(wǎng)絡(luò)模型的權(quán)重值[5]。
3? 結(jié)語(yǔ)
基于深度神經(jīng)網(wǎng)絡(luò)的遙感圖像分類研究中,對(duì)特定領(lǐng)域的分類問(wèn)題,通過(guò)深度學(xué)習(xí)予以解決,其中訓(xùn)練數(shù)據(jù)集的建立以及分類原則至關(guān)重要,在進(jìn)行深度,神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中,網(wǎng)絡(luò)收斂速度和最終結(jié)果受參數(shù)選擇的直接影響,深度神經(jīng)網(wǎng)絡(luò)在對(duì)樣本本質(zhì)特征進(jìn)行提取時(shí),應(yīng)提高樣本的數(shù)量和質(zhì)量,由于數(shù)據(jù)集時(shí)常受到客觀條件的限制,可以利用權(quán)值遷移的輸入的方式,對(duì)網(wǎng)絡(luò)權(quán)重隨機(jī)初始化進(jìn)行替代,使訓(xùn)練效果提高。
參考文獻(xiàn)
[1] 王生生,王萌,王光耀.基于深度神經(jīng)網(wǎng)絡(luò)剪枝的兩階段遙感圖像目標(biāo)檢測(cè)[J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2019,40(2):25-30.
[2] 楊瑩,張海仙.基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類研究[J].現(xiàn)代計(jì)算機(jī),2016(5):67-71.
[3] 付偉鋒,鄒維寶.深度學(xué)習(xí)在遙感影像分類中的研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2018,35(12):7-11.
[4] 業(yè)巧林,許等平,張冬.基于深度學(xué)習(xí)特征和支持向量機(jī)的遙感圖像分類[J].林業(yè)工程學(xué)報(bào),2019,4(2):119-125.
[5] 張日升,朱桂斌,張燕琴.基于卷積神經(jīng)網(wǎng)絡(luò)的衛(wèi)星遙感圖像區(qū)域識(shí)別[J].信息技術(shù),2017(11):91-94.