胡永進(jìn), 韓 旭, 高小慧, 胡耀天
(江蘇農(nóng)林職業(yè)技術(shù)學(xué)院,江蘇句容 212400)
森林生態(tài)系統(tǒng)覆蓋了全球陸地表面的1/3,及時(shí)準(zhǔn)確掌握林地信息對(duì)環(huán)境保護(hù)具有重要作用[1-2]。不同于傳統(tǒng)的手工林地調(diào)查,遙感影像可以提高林地調(diào)查效率,有助于可以幫助快速提取地表信息分布情況。然而,由于遙感影像中地物特征復(fù)雜性,如何實(shí)現(xiàn)高精度的遙感影像林地信息提取仍然是當(dāng)前研究所面臨的難題。
利用遙感影像進(jìn)行林地信息提取方法主要包括目視解譯、像元計(jì)算、面向?qū)ο?、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)[3-5]。其中,目視解譯法需要依靠專業(yè)人員的專業(yè)知識(shí)以及經(jīng)驗(yàn)對(duì)林地進(jìn)行肉眼觀察并加以判讀,雖然此方法的準(zhǔn)確度較高,但是效率低、工作量大、成本高,難以滿足應(yīng)急處理的需求[6]。像元計(jì)算方法是通過(guò)分析遙感影像中林地的特征建立預(yù)定義波段模型來(lái)提取影像中的林地區(qū)域[7-8]。然而,這類方法將注意力集中在單個(gè)像元特征上,忽略了林地的其他相關(guān)屬性,如紋理、形狀、空間結(jié)構(gòu)、相互關(guān)系等,可能導(dǎo)致整體目標(biāo)影像被打碎,從而產(chǎn)生較為嚴(yán)重的“椒鹽現(xiàn)象”。之后,面向?qū)ο蠓椒ㄖ饾u被應(yīng)用,與像素方式不同,面向?qū)ο蟮牧值靥崛》椒ㄊ且酝|(zhì)對(duì)象作為最小分析單元,通過(guò)分析遙感影像中林地的光譜、形狀、紋理等多種特征,并借助認(rèn)知機(jī)理來(lái)選定這些特征,保證其能夠最大程度地區(qū)分遙感影像上林地信息[9-12]。但由于光學(xué)遙感影像以非均勻區(qū)域的形式表達(dá)信息,因此對(duì)林地區(qū)域的識(shí)別產(chǎn)生干擾,耕地及草地光譜特性與林地極為相似。此外,面向?qū)ο蠓椒ㄐ枰啻螌?duì)分割尺度等參數(shù)進(jìn)行不斷調(diào)整,這就使得整個(gè)過(guò)程變得復(fù)雜且耗時(shí),不適用于大批量的數(shù)據(jù)處理。此后,基于機(jī)器學(xué)習(xí)的方法被用于林地信息的提取,機(jī)器學(xué)習(xí)的方法是通過(guò)人為設(shè)計(jì)特征提取函數(shù),并通過(guò)一定的樣本學(xué)習(xí)進(jìn)行參數(shù)擬合計(jì)算樣本之間的關(guān)聯(lián)[13-14]。然而,機(jī)器學(xué)習(xí)僅限于淺層特征提取,其非線性表達(dá)能力有限,無(wú)法抽取遙感影像中林地的深層次特征。
隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的遙感影像信息提取方法也逐漸被應(yīng)用,相比于之前的傳統(tǒng)方法,這種方法不需要人工識(shí)別影像復(fù)雜的特征,而是由深度學(xué)習(xí)框架自動(dòng)去學(xué)習(xí),這也減少了工作量,提高了準(zhǔn)確率[15-16]。許多深度學(xué)習(xí)方法也被用于地表信息提取。Zhang等以對(duì)象為基本結(jié)構(gòu)建立了城市利用土地分類網(wǎng)絡(luò)模型[17]。Kussul等通過(guò)建立多尺度神經(jīng)網(wǎng)絡(luò)對(duì)地表土地覆蓋類型進(jìn)行分類[18]。Schiefer等則利用UNet網(wǎng)絡(luò)進(jìn)行了航空影像林地檢測(cè)研究[19]。Gui等建立了一種更深層次的林地提取網(wǎng)絡(luò),并通過(guò)高分1號(hào)影像進(jìn)行了試驗(yàn)[20]。盡管這些研究取得了一定的進(jìn)展,但林地于影像中的同物異譜及同譜異物現(xiàn)象更加顯著,現(xiàn)有網(wǎng)絡(luò)難以應(yīng)對(duì)這一復(fù)雜干擾。林地具有明顯的尺度差異,既包括大面積森林也包括小面積林盤(pán),當(dāng)前缺乏可用于深度學(xué)習(xí)的遙感影像林地提取數(shù)據(jù)集。
針對(duì)上述問(wèn)題,本研究提出一種用于遙感影像林地信息提取的雙支路全局局部感知網(wǎng)絡(luò)。該網(wǎng)絡(luò)從林地特征入手,在編碼階段通過(guò)全局與局部信息的提取及融合,盡可能地獲取影像不同背景下的復(fù)雜林地特征,利用深度監(jiān)督分類器進(jìn)一步提高網(wǎng)絡(luò)對(duì)于不同尺度林地的感知能力,從而建立一個(gè)新的林地提取數(shù)據(jù)集以驗(yàn)證方法的有效性。
本研究提出一種雙支路全局局部感知網(wǎng)絡(luò)模型(圖1),該模型包括編碼與解碼2個(gè)部分,是一種端到端的對(duì)稱結(jié)構(gòu)。其中,編碼部分為雙支路特征提取結(jié)構(gòu),通過(guò)2條支路信息在抽取全局與局部信息的同時(shí)兼顧不同尺度之間的聯(lián)系,進(jìn)一步提高網(wǎng)絡(luò)特征提取能力,這是網(wǎng)絡(luò)的核心部分。解碼部分為深度監(jiān)督分類器,該結(jié)構(gòu)通過(guò)多分支輔助分類充分獲取不同層次的特征映射,進(jìn)一步提高網(wǎng)絡(luò)在預(yù)測(cè)階段的判別能力。
為了在特征提取階段有效提取影像中林地信息,本研究提出一種雙支路全局局部特征提取結(jié)構(gòu),包括支路1與支路2(圖2),其中支路1主要用于提取全局語(yǔ)義特征,支路2則是利用深度殘差網(wǎng)絡(luò)(deep residual network,ResNet 101)提取局部局部特征,最后通過(guò)二者的層間關(guān)聯(lián)進(jìn)一步提高網(wǎng)絡(luò)的特征提取能力。
2.1.1 全局特征提取 如圖2-A所示,利用1×1、5×5和7×7的卷積來(lái)獲取不同視野的信息,這有助于獲取同一尺度下不同視野的上下文信息,并對(duì)其進(jìn)行初步融合以獲取更為精細(xì)化的特征,從而提高網(wǎng)絡(luò)捕獲重點(diǎn)特征的能力[21],融合得到的特征可表述為公式(1)。
Ffirst(T)=ReLU(f(3×3){Con[f(1×1)(T1),f(3×3)(T2),f(5×5)(T3)]})。
(1)
式中:Ffirst(T)指不同視野卷積初步融合的結(jié)果;Con表示連接;f(1×1)(T1)、f(3×3)(T2)、f(5×5)(T3)則分別表示不同視野下的特征提取結(jié)果;ReLU表示修正線性單元。
在獲取精細(xì)化特征的基礎(chǔ)之上,本研究引入了注意力的思想,對(duì)輸入特征進(jìn)行批標(biāo)準(zhǔn)化和激活函數(shù)(Sigmoid)激活,在輸入尺寸不發(fā)生變化的情況下增加網(wǎng)絡(luò)的寬度,引入更多的非線性特征,進(jìn)一步增強(qiáng)網(wǎng)絡(luò)的上下文表達(dá)能力,并在此基礎(chǔ)之上通過(guò)點(diǎn)乘的方式對(duì)2條分支結(jié)果進(jìn)行加權(quán)操作,以獲取最優(yōu)權(quán)重組合,提高網(wǎng)絡(luò)對(duì)于重點(diǎn)區(qū)域的關(guān)注度,如公式(2)所示。
Fsecond(T)=Mul{Ffirst(T),Sigmoid[f(1×1)(T1)]}。
(2)
式中:Fsecond(T)指特征增強(qiáng)的結(jié)果;Mul表示相乘。
2.1.2 局部特征提取 如圖2-B所示,局部特征提取主要是通過(guò)不斷的卷積對(duì)圖像細(xì)節(jié)特征進(jìn)行歸類分析,然而,隨著網(wǎng)絡(luò)層數(shù)的增加,單一的連接結(jié)構(gòu)容易導(dǎo)致梯度消失,使其在反向傳播過(guò)程中無(wú)法進(jìn)行參數(shù)優(yōu)化,因此,本研究在局部特征提取階段選用現(xiàn)有特征提取表現(xiàn)較好的Resnext101 結(jié)構(gòu)[22],該模塊通過(guò)跳躍連接的方式把輸入跨層連接到下一層,使得網(wǎng)絡(luò)的訓(xùn)練更關(guān)注于網(wǎng)絡(luò)之間的變化,相比于原來(lái)的映射,殘差映射更容易收斂且易于訓(xùn)練,通過(guò)該模塊充分獲取影像的局部特征。
2.1.3 雙支路層間特征關(guān)聯(lián)感知 如圖2-C所示。在不斷的下采樣過(guò)程中,語(yǔ)義信息不斷增強(qiáng)的同時(shí)細(xì)節(jié)信息也在不斷丟失,而現(xiàn)有的網(wǎng)絡(luò)中不同層次之間往往只有1個(gè)池化結(jié)構(gòu)進(jìn)行連接,層與層之間的特征關(guān)聯(lián)較弱,為了增強(qiáng)層與層之間的特征關(guān)聯(lián),本研究建立了一種層間特征關(guān)聯(lián)感知模塊,首先對(duì)以上輸入進(jìn)行下采樣操作,為了避免在下采樣過(guò)程中由于池化層造成的信息損失,該模塊結(jié)構(gòu)中通過(guò)步長(zhǎng)為2實(shí)現(xiàn)下采樣的目的。在進(jìn)行下采樣之后,將得出的結(jié)果與下一層次中的ResNet 101特征提取結(jié)果進(jìn)行融合,同時(shí)二者融合結(jié)果則作為下一個(gè)模塊的輸入,這種層間關(guān)聯(lián)關(guān)系可以建立一種更加緊密的層間結(jié)構(gòu),進(jìn)一步提高了網(wǎng)絡(luò)在不斷下采樣過(guò)程中的特征提取能力。
為了盡可能地減少尺度差異性的干擾,使網(wǎng)絡(luò)中的不同層次特征得到更加充分的訓(xùn)練,本研究在最終的預(yù)測(cè)模塊中提出一種深度監(jiān)督分類器。與現(xiàn)有的常用多尺度預(yù)測(cè)方式不同,該分類器通過(guò)在不同層次的網(wǎng)絡(luò)中增加輔助分類器作為網(wǎng)絡(luò)的分支對(duì)主干網(wǎng)絡(luò)進(jìn)行監(jiān)督,與多任務(wù)中的分支不同,本研究所提出的深度監(jiān)督是在同一標(biāo)簽中對(duì)不同位置的損失按系數(shù)進(jìn)行求和,盡可能地獲取不同層次的特征映射并將其應(yīng)用于最終的預(yù)測(cè)分類,且該方法僅在原網(wǎng)絡(luò)基礎(chǔ)上進(jìn)行特征輸出,幾乎不會(huì)增加額外的計(jì)算量和時(shí)間(圖3)。
常用的多尺度預(yù)測(cè)分支分別為預(yù)測(cè)分支1、預(yù)測(cè)分支2、預(yù)測(cè)分支3及預(yù)測(cè)分支4,在常用的多尺度預(yù)測(cè)基礎(chǔ)之上新添加2個(gè)監(jiān)督分支,分別為監(jiān)督分支1與監(jiān)督分支2。其中,監(jiān)督分支1是由不同尺度下直接進(jìn)行的上采樣聚合得到的結(jié)果;監(jiān)督分支2則是對(duì)包括監(jiān)督分支1在內(nèi)的所有預(yù)測(cè)結(jié)果進(jìn)行平均加權(quán)融合,使其能夠?qū)⑸喜蓸舆^(guò)程中的特征映射結(jié)合為多層次的集成特征,最后通過(guò)特征聚合獲得最終的預(yù)測(cè)結(jié)果。
數(shù)據(jù)測(cè)試是驗(yàn)證神經(jīng)網(wǎng)絡(luò)模型的關(guān)鍵方法,然而,由于當(dāng)前研究中并沒(méi)有公開(kāi)用于遙感影像林地信息提取的數(shù)據(jù)集,為驗(yàn)證本研究方法的有效性,本研究通過(guò)目視解譯法建立了一個(gè)可用于林地信息提取的數(shù)據(jù)集,該數(shù)據(jù)集的構(gòu)建過(guò)程如圖4所示,數(shù)據(jù)來(lái)源為高分辨率航空影像,全部數(shù)據(jù)標(biāo)注大約花費(fèi)2個(gè)月時(shí)間。在數(shù)據(jù)集的建立過(guò)程中主要面臨如下幾個(gè)困難:(1)遙感影像中具有較多的與林地相似的地物,如植被、耕地、草地等,這使得目視解譯中存在較大困難。(2)由于林地面積不同,于遙感影像中表現(xiàn)尺度差異性較大,既包括大面積森林也包括小面積林盤(pán),最終形成影像和標(biāo)簽共40張4 000×4 000大小圖像,影像分辨率為1 m,原始影像包含有RGB等3個(gè)波段。由于原始圖像尺寸較大,為了便于訓(xùn)練,本研究將影像裁剪為256×256圖像,同時(shí)在裁剪過(guò)程中通過(guò)隨機(jī)裁剪、旋轉(zhuǎn)、模糊及噪聲等操作進(jìn)行數(shù)據(jù)增強(qiáng),這也可以進(jìn)一步提高數(shù)據(jù)的多樣性,以提高網(wǎng)絡(luò)泛化性并減少過(guò)擬合的發(fā)生。最終形成可訓(xùn)練數(shù)據(jù)集包括3個(gè)部分,分別為9 048對(duì)訓(xùn)練數(shù)據(jù)、1 296張驗(yàn)證數(shù)據(jù)、1 460張測(cè)試數(shù)據(jù)。
3.2.1 參數(shù)設(shè)置 遙感影像林地提取試驗(yàn)平臺(tái)為Windows 10系統(tǒng),網(wǎng)絡(luò)模型主要基于PyTorch學(xué)習(xí)庫(kù)進(jìn)行搭建,Python版本為3.6,試驗(yàn)所用的硬件配置為:AMD Ryzen 7 5800X 8-Core Processor 3.80 GHz 處理器(CPU)與Nvidia GeForce RTX 3090 24 G GPU。本研究所有試驗(yàn)完成花費(fèi)約4個(gè)月時(shí)間,神經(jīng)網(wǎng)絡(luò)內(nèi)部參數(shù)通過(guò)訓(xùn)練模型迭代獲取,而訓(xùn)練時(shí)還需要人為設(shè)置部分超參數(shù)。經(jīng)過(guò)反復(fù)測(cè)試,本研究在訓(xùn)練過(guò)程中參數(shù)設(shè)置如表1所示。在訓(xùn)練過(guò)程中,筆者對(duì)驗(yàn)證數(shù)據(jù)的損失值進(jìn)行實(shí)時(shí)監(jiān)控,僅當(dāng)本輪驗(yàn)證數(shù)據(jù)損失值低于前一輪時(shí)才保存模型,以避免過(guò)擬合的發(fā)生。此外,在連續(xù)5次迭代之后,若損失值依舊沒(méi)有改善,則將學(xué)習(xí)率變?yōu)樵瓉?lái)的0.8。
表1 試驗(yàn)中超參數(shù)設(shè)置
3.2.2 損失函數(shù) 在深度學(xué)習(xí)模型中,損失函數(shù)是其中的重要組成部分,其可以計(jì)算預(yù)測(cè)值與真實(shí)值的差距,并通過(guò)差距來(lái)指導(dǎo)模型不斷進(jìn)行優(yōu)化,然而若正負(fù)樣本比例不同,則會(huì)導(dǎo)致回傳梯度均衡問(wèn)題。而遙感影像中林地則具有樣本不平衡特征,普通的損失函數(shù)會(huì)導(dǎo)致精度較低。因此,本研究在二元交叉熵函數(shù)[23]基礎(chǔ)之上引入平衡因子,如果如公式(3)所示。此外,本研究根據(jù)深度監(jiān)督分類器預(yù)測(cè)模塊中的輸出設(shè)計(jì)建立了新的損失函數(shù),結(jié)果如公式(4)所示。在圖3預(yù)測(cè)結(jié)構(gòu)中,每一層輸出皆代表不同的特征損失,同樣不同的損失也會(huì)對(duì)模型優(yōu)化產(chǎn)生不同的效果,為了充分利用這些損失,本研究將不同輸出分支的損失函數(shù)進(jìn)行融合處理,以最后的綜合表達(dá)來(lái)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)每一階段損失值的最大化利用。
(3)
(4)
式中:L為平均損失函數(shù)值;yi={0,1},表示像素類別的真實(shí)值;pi∈(0,1),表示像素類別的預(yù)測(cè)概率值;w為平衡因子,設(shè)置為0.6,代表輸入像素總數(shù)。Loss代表最終的損失,Pi_lBCE則代表6個(gè)分支的不同損失值。
遙感影像地物提取實(shí)際是圖像語(yǔ)義分割的一種應(yīng)用,所得結(jié)果通常采用圖像語(yǔ)義分割的評(píng)價(jià)方法,為定量評(píng)價(jià)本研究方法并將其與現(xiàn)有網(wǎng)絡(luò)模型進(jìn)行對(duì)比,筆者選取5種常用的語(yǔ)義分割標(biāo)準(zhǔn)對(duì)本研究方法進(jìn)行評(píng)價(jià),包括交并比(intersection over union,IOU)[公式(5)]、總精度(overall accuracy,OA)[公式(6)]、平衡分?jǐn)?shù)(F1score)[公式(7)]、Precision(P,準(zhǔn)確率)及Recall(R,召回率)[公式(8)]。
(5)
(6)
(7)
(8)
式中:TP(true positive)表示正確提取的林地像元數(shù)目;FP(false positive)表示錯(cuò)判為林地的非林地像元數(shù)目;TN(true negative)表示正確提取的非林地像元數(shù)目;FN(true negative)表示錯(cuò)判為非林地的林地像元數(shù)目。
為全面展示本研究方法優(yōu)勢(shì),選擇4種近年來(lái)常用的深度學(xué)習(xí)方法與本研究方法在相同條件下進(jìn)行對(duì)比試驗(yàn),包括OCNet[24]、Denseaspp[25]、PSP-Net[26]、UNet[27]。通過(guò)定性分析與定量分析對(duì)本研究方法進(jìn)行全面衡量。
4.1.1 定性分析 為了全面呈現(xiàn)本研究方法林地檢測(cè)結(jié)果,本研究從不同面積、場(chǎng)景密度及復(fù)雜度等方面對(duì)多種深度學(xué)習(xí)提取結(jié)果進(jìn)行了可視化展示(圖5)。圖5中第1行與第2行為面積及密度較小的林地,第3行與第4行為復(fù)雜度較大林地,第5行為大面積林地。
從圖5中第1行與第2行可以看出,對(duì)于面積及密度較小林地,所有方法基本都能夠提取出林地的主體部分。其中,OCNet雖然能夠達(dá)到與本研究方法相近的效果,但其對(duì)于邊界的處理能力較差,邊界部分存在較多的漏檢與誤檢。Denseaspp、PSP-Net 和UNet雖然可以提取出林地的主體部分,但存在更大范圍的漏檢與誤檢,這也是由于傳統(tǒng)網(wǎng)絡(luò)對(duì)于影像中林地的復(fù)雜特征缺乏足夠的判別能力導(dǎo)致的。隨著林地復(fù)雜度增加各種方法均存在不同的精度下降,如圖5中的第3,第4行所示。相比于其他方法,本研究依舊能夠保持較低的漏檢率及誤檢率,這也受益于本研究所提出的雙支路全局局部感知特征提取模塊,其通過(guò)2條不同的分支同時(shí)獲取影像中林地的全局與局部特征,能夠進(jìn)行更加充分的特征抽取,對(duì)于復(fù)雜的背景具有更強(qiáng)的判別能力。圖5中的第5行展示了大面積林地區(qū)域,從圖5可以看出,所有方法都可以提取得到大面積林地的主體部分,然而OCNet存在較多的漏檢,Denseaspp、PSP-Net 和UNet則存在大面積的誤檢情況。綜合圖5中的第1行與第2行的小尺度林地結(jié)果,可以看出本研究所提出的深度監(jiān)督分類器可以有效地對(duì)不同尺度的特征進(jìn)行充分聚合,以進(jìn)一步提升林地提取精度。
4.1.2 定量分析 為進(jìn)一步驗(yàn)證方法的有效性使對(duì)比結(jié)果更加可靠,本研究對(duì)以上多種模型進(jìn)行了定量分析,需要說(shuō)明的是,所有定量評(píng)價(jià)結(jié)果都是在相同數(shù)據(jù)集及計(jì)算機(jī)性能的情況下進(jìn)行的,結(jié)果如表2所示。與其他算法相比,本研究方法在提取遙感影像中的建筑物方面具有最佳的性能,IOU值提高1.57~8.89百分比,F(xiàn)1提高0.97~8.68,OA提高0.89~8.98百分點(diǎn),這種精度的提升是極為可觀的。除此之外,由于準(zhǔn)確率和召回率存在相互制約的關(guān)系,如何平衡二者以獲得更好的提取結(jié)果也是評(píng)判模型好壞的重要因素,二者差距也是驗(yàn)證方法是否有效的標(biāo)準(zhǔn)之一,OCNet、Denseaspp、PSP-Net、UNet方法中準(zhǔn)確率與召回率的差值分別為1.73、3.64、5.48、4.01百分點(diǎn)。而本研究方法二者差距僅為0.68百分點(diǎn),這也進(jìn)一步驗(yàn)證了本研究方法的優(yōu)勢(shì)。
表2 不同方法的林地提取結(jié)果精度對(duì)比
由于深度學(xué)習(xí)在訓(xùn)練和測(cè)試時(shí)具有一定的不確定性,即便在同一條件下2次訓(xùn)練所得到的模型結(jié)果也未必相同,而二者的差距也是方法穩(wěn)定性的重要條件之一。為了驗(yàn)證方法的穩(wěn)定性,本研究通過(guò)利用Dropout函數(shù)在測(cè)試時(shí)進(jìn)行參數(shù)的隨機(jī)丟棄,并進(jìn)行了20次獨(dú)立的蒙特卡洛試驗(yàn),蒙特卡洛試驗(yàn)是一種隨機(jī)抽樣技術(shù),可以以隨機(jī)方式測(cè)試模型精度,以判斷模型是否穩(wěn)定。對(duì)20次獨(dú)立試驗(yàn)進(jìn)行平均值和標(biāo)準(zhǔn)差計(jì)算,結(jié)果如圖6所示。20次獨(dú)立試驗(yàn)所獲得的IOU、F1、OA、P和R平均值依舊具有較高的精度,且IOU、F1和OA的標(biāo)準(zhǔn)差分別0.15、0.14和0.05,多次獨(dú)立試驗(yàn)精度間的較小標(biāo)準(zhǔn)差也進(jìn)一步驗(yàn)證了本研究方法的穩(wěn)定性。
為了探討網(wǎng)絡(luò)中不同模塊的貢獻(xiàn),在相同條件下對(duì)本研究方法進(jìn)行詳細(xì)的消融試驗(yàn),并利用相同的5個(gè)標(biāo)準(zhǔn)進(jìn)行指標(biāo)評(píng)價(jià)。本研究方法分為2個(gè)主要模塊,即雙支路特征提取結(jié)構(gòu)與深度監(jiān)督分類器。其中每個(gè)模塊又包含有不同組件,為了充分驗(yàn)證各個(gè)組件的作用,共進(jìn)行了4組消融試驗(yàn),分別驗(yàn)證全局特征、局部特征、單一尺度輸出與常用的多尺度輸出,最終結(jié)果如表3所示。
4.3.1 雙支路全局局部特征提取 該部分是本研究特征提取的核心部分,包括全局特征提取(圖2-A)、局部特征提取(圖2-B)及雙支路層間特征關(guān)聯(lián)感知(圖2-C)。為驗(yàn)證每個(gè)模塊的作用進(jìn)行了2組試驗(yàn)。首先,去除本研究的全局特征提取結(jié)構(gòu),僅利用ResNet 101作為編碼過(guò)程中的主干網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,從表3可以看出,在去掉全局特征提取之后,各項(xiàng)評(píng)價(jià)指標(biāo)皆有明顯的下降,尤其的,IOU、F1和OA分別下降了2.22百分點(diǎn)、1.95百分點(diǎn)和1.57百分點(diǎn),這也可以進(jìn)一步證明,本研究的全局特征提取結(jié)構(gòu)對(duì)于圖像特征提取是十分重要的。其次,去除本研究的局部特征提取結(jié)構(gòu),即僅利用全局特征進(jìn)行特征提取,同樣這會(huì)導(dǎo)致網(wǎng)絡(luò)對(duì)于細(xì)節(jié)信息的提取能力不足,從表3可以看出精度下降得十分明顯,IOU、F1和OA分別下降1.53百分點(diǎn)、1.69百分點(diǎn)和2.48百分點(diǎn)。綜上所述,全局特征包含更多的語(yǔ)義信息,局部特征包含有更多的細(xì)節(jié)信息,通過(guò)雙支路結(jié)構(gòu)可以將二者有效結(jié)合,進(jìn)一步提高網(wǎng)絡(luò)的特征提取能力。
表3 本研究方法中不同模塊的消融試驗(yàn)
4.3.2 深度監(jiān)督分類器 為了驗(yàn)證本研究所提出深度監(jiān)督分類器的作用,筆者對(duì)這部分進(jìn)行了2組消融試驗(yàn),分別是僅利用單一尺度作為最后的輸出和金字塔結(jié)構(gòu)中的4層尺度進(jìn)行聚合輸出。首先是單一尺度的輸出,即僅利用最后1層作為預(yù)測(cè)輸出,單層尺度的輸出無(wú)法充分利用不同層次的映射,在最后的預(yù)測(cè)階段特征融合能力明顯不足,這也是所有試驗(yàn)中表現(xiàn)最差的1組,其IOU、F1和OA分別下降2.64百分點(diǎn)、4.81百分點(diǎn)和4.00百分點(diǎn),在此基礎(chǔ)之上利用現(xiàn)有神經(jīng)網(wǎng)絡(luò)中常用的多尺度數(shù)據(jù)對(duì)本研究方法進(jìn)行試驗(yàn),盡管相對(duì)于單一尺度輸出具有明顯的效果提升,IOU、F1和OA分別提高2.11百分點(diǎn)、3.62百分點(diǎn)和3.65百分點(diǎn),這證明了多尺度的輸出是完全必要的。然而,作為網(wǎng)絡(luò)結(jié)構(gòu)的最終判別器,多尺度輸出依舊無(wú)法使網(wǎng)絡(luò)得到最充分的訓(xùn)練,而本研究通過(guò)多分支結(jié)構(gòu)建立的深度監(jiān)督分類器可以進(jìn)一步強(qiáng)化最終的分類效果,其提升也是極為明顯的,相對(duì)于多尺度輸出IOU、F1和OA分別提高1.71百分點(diǎn)、0.89百分點(diǎn)和0.96百分點(diǎn),且該分類器僅在原網(wǎng)絡(luò)基礎(chǔ)上進(jìn)行特征輸出,幾乎不會(huì)增加額外的計(jì)算量和時(shí)間。
近年來(lái),隨著深度學(xué)習(xí)的發(fā)展,CNN作為一種有效的方法被用于遙感影像中的地物信息提取。本研究提出一種基于雙支路全局局部感知網(wǎng)絡(luò)的高分影像林地信息提取方法,首先,根據(jù)林地于影像中的復(fù)雜背景特征,建立了雙支路特征提取結(jié)構(gòu),利用2條特征提取支路分別獲取影像中的全局特征與局部特征,并將二者有效結(jié)合,進(jìn)一步提升網(wǎng)絡(luò)的特征提取能力。其次,考慮到林地于影像中明顯的多尺度特征,建立深度監(jiān)督分類器,通過(guò)多個(gè)分支對(duì)主干預(yù)測(cè)實(shí)現(xiàn)監(jiān)督,在不增加計(jì)算量的情況下有效提升預(yù)測(cè)精度。本試驗(yàn)結(jié)果表明,與現(xiàn)有優(yōu)秀的神經(jīng)網(wǎng)絡(luò)方法相比,本研究方法的IOU值提高1.57~8.89百分點(diǎn),這種提升是極具挑戰(zhàn)性的。此外,通過(guò)20組獨(dú)立的蒙特卡洛試驗(yàn)深入討論了方法的穩(wěn)定性,同時(shí)通過(guò)消融試驗(yàn)充分證明了方法中各個(gè)模塊的貢獻(xiàn),以進(jìn)一步驗(yàn)證方法的有效性。
然而,對(duì)于實(shí)際的應(yīng)用林地信息提取需要更高的精度,同時(shí),進(jìn)一步研究網(wǎng)絡(luò)模型對(duì)不同數(shù)據(jù)源、不同區(qū)域的可推廣性,使林地提取結(jié)果能夠應(yīng)用于實(shí)際的林業(yè)管理中是我們將來(lái)研究所重點(diǎn)關(guān)注的問(wèn)題。