王 鑫,陳 琴
(三和數(shù)碼測(cè)繪地理信息技術(shù)有限公司 甘肅 天水 741000)
隨著人口的增長(zhǎng)和經(jīng)濟(jì)的發(fā)展,土地利用的合理規(guī)劃和管理變得越來(lái)越重要。衛(wèi)星遙感影像在土地利用分類中的應(yīng)用越來(lái)越廣泛,成為了一種重要的土地資源監(jiān)測(cè)和管理手段。土地利用分類的目的是將土地利用類型劃分為不同的類別,以便于制定相應(yīng)的管理和規(guī)劃措施。尺度是土地利用分類中一個(gè)重要的因素。尺度越大,土地利用類型的信息越模糊,分類精度越低。因此,在土地利用分類中,如何選擇適當(dāng)?shù)某叨葘?duì)于獲得高精度的分類結(jié)果至關(guān)重要。
高光譜遙感影像土地利用分類的研究面臨著復(fù)雜的非線性數(shù)據(jù)結(jié)構(gòu)、有限訓(xùn)練樣本下的維數(shù)災(zāi)難以及光譜混合等挑戰(zhàn)[1-2]。此外,高光譜遙感影像給影像的精確分類帶來(lái)了新的挑戰(zhàn)。第一個(gè)挑戰(zhàn)是嚴(yán)重的光譜變異性和空間異質(zhì)性,一些基于光譜信息的分類方法會(huì)在分類結(jié)果中造成嚴(yán)重的椒鹽噪聲[3]。另一個(gè)挑戰(zhàn)是地物空間尺度的巨大差異。因此,在面向?qū)ο蟮姆诸愔?,選擇合適的分割尺度具有挑戰(zhàn)性。因此,需要光譜-空間融合分類器,它可以同時(shí)考慮精細(xì)的光譜屬性信息和空間幾何信息。
傳統(tǒng)的高光譜空間分類方法可以通過引入空間信息來(lái)減少分類圖的椒鹽噪聲。這些方法基于兩個(gè)主要策略。第一種策略是級(jí)聯(lián)每個(gè)像素的空間特征和光譜信息作為分類器的輸入,其中空間特征包括紋理、形狀和對(duì)象特征。第二種策略是引入空間上下文信息來(lái)提高像素分類精度,這可以被認(rèn)為是一種基于后處理的分類方法。使用該策略的典型方法是基于馬爾可夫隨機(jī)場(chǎng)的方法、基于條件隨機(jī)場(chǎng)(conditional random field, CRF)的方法和擴(kuò)展形態(tài)學(xué)。盡管前面提到的高光譜遙感影像分類方法的有效性已被證明,但它們非常依賴基于領(lǐng)域知識(shí)和專家經(jīng)驗(yàn)的手工特征[4]。此外,使用手工特征作為輸入的傳統(tǒng)分類器,例如支持向量機(jī)(support vector machine, SVM)、多元線性回歸(multiple linear regression, MLR)和隨機(jī)森林(random forest, RF),可以被視為淺層網(wǎng)絡(luò),這限制了挖掘的潛力、高級(jí)語(yǔ)義特征和復(fù)雜場(chǎng)景分類方法。
深層卷積神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的特征學(xué)習(xí)能力,可以自動(dòng)挖掘深層次的空間特征,以廣泛應(yīng)用于遙感影像地物分類中。空間取塊機(jī)制只能利用局部空間信息,造成分類結(jié)果中存在嚴(yán)重錯(cuò)分的孤立區(qū)域。為克服上述問題,本文提出聯(lián)合條件隨機(jī)場(chǎng)模型和卷積神經(jīng)網(wǎng)絡(luò)的遙感影像分類方法,通過條件隨機(jī)場(chǎng)模型整合全局上下文信息緩解高光譜影像的空譜異質(zhì)性。
本文采用的卷積神經(jīng)網(wǎng)絡(luò)示意圖如圖1 所示。為防止輸入特征的空間尺度下降過快,在構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)時(shí)未采用池化操作。卷積層和池化層逐層提取深層次的空間特征,全連接層進(jìn)一步整合全局特征,最后全連接層輸出的高層語(yǔ)義信息通過分類器進(jìn)行分類。
圖1 基準(zhǔn)卷積神經(jīng)網(wǎng)絡(luò)高光譜分類示意圖
條件隨機(jī)場(chǎng)模型是Lafferty 提出的經(jīng)典概率判別模型,其最初是用來(lái)標(biāo)記序列化文本數(shù)據(jù)的統(tǒng)計(jì)模型。如圖2 所示。
圖2 條件隨機(jī)場(chǎng)模型示意圖
在二維圖像的處理中,CRF 通過概率圖模型中相鄰像素之間的邊連接關(guān)系來(lái)考慮像素之間的空間交互作用,進(jìn)而整合空間的上下文信息。在給定的定量觀測(cè)變量條件下,其直接對(duì)最大后驗(yàn)概率建模,具有更靈活的上下文信息建模能力。因此,CRF 模型廣泛應(yīng)用于遙感圖像分類等任務(wù)中。
本文提出聯(lián)合條件隨機(jī)場(chǎng)和卷積神經(jīng)網(wǎng)絡(luò)(conditional random field convolutional neural networks,CRFCNN)的全局融合分類框架。如圖3 所示?;谶x取的三維空間塊,本文首先構(gòu)建了一個(gè)深層卷積神經(jīng)網(wǎng)絡(luò)提取局部的深層次的空間特征,然后利用馬氏距離約束的CRF 模型進(jìn)一步整合空間上下文信息減少分類圖中的鼓勵(lì)區(qū)域。同時(shí)引入CRF 模型減弱空間塊尺寸對(duì)分類精度的影響。最后為緩解深層卷積神經(jīng)網(wǎng)絡(luò)海量參數(shù)和高光譜影像分類中訓(xùn)練樣本受限之間的矛盾,采用4 種虛擬樣本增強(qiáng)策略。
圖3 聯(lián)合條件隨機(jī)場(chǎng)和卷積神經(jīng)網(wǎng)絡(luò)地物分類框架
本文采用開源數(shù)據(jù)集WHU-Hi-LongKou。數(shù)據(jù)采集地點(diǎn)為湖北省龍口鎮(zhèn)典型的簡(jiǎn)單農(nóng)業(yè)場(chǎng)景,采集時(shí)間為2018 年7 月17 日,數(shù)據(jù)采集期間天氣晴朗無(wú)風(fēng),氣溫約為36 ℃,空氣相對(duì)濕度約為65%。采集平臺(tái)為大疆M600pro無(wú)人機(jī)搭載的Nano-Hyperspec-VNIR 成像光譜儀,飛行高度約為500 m,空間分辨率為0.463 m,影像尺寸為550×400 像素,在400~1 000 nm 范圍內(nèi)有170 個(gè)波段。
2.2.1 訓(xùn)練樣本設(shè)置
標(biāo)注的每個(gè)類別,隨機(jī)選擇100 個(gè)標(biāo)記像素作為訓(xùn)練集用于模型訓(xùn)練,其余像素作為測(cè)試集,用于精度測(cè)試,詳細(xì)的訓(xùn)練樣本如表1 所示。WHU-Hi-LongKou 數(shù)據(jù)中訓(xùn)練樣本占標(biāo)記像素的0.44%。
表1 訓(xùn)練樣本和測(cè)試樣本劃分
2.2.2 模型參數(shù)設(shè)置
CRFCNN 分類框架中輸入模型的空間尺寸塊為9×9,數(shù)據(jù)增強(qiáng)策略20 次,參數(shù)值根據(jù)計(jì)算資源和分類準(zhǔn)確性的經(jīng)驗(yàn)值確定。卷積神經(jīng)網(wǎng)絡(luò)分為4 個(gè)卷積核尺寸為3×3,步長(zhǎng)為1 的卷積層和兩個(gè)卷積核數(shù)量分別為128 和64 的全連接層構(gòu)成,模型訓(xùn)練中,初始學(xué)習(xí)率為0.01,衰減率為2e-4,采用Adam 進(jìn)行優(yōu)化,batch 數(shù)量設(shè)置為50,訓(xùn)練epoch為150。
視覺表現(xiàn)是評(píng)價(jià)分類方法非常重要的一個(gè)方面,圖4展示了CRFCNN 和對(duì)比方法(SVM、FNEA-OO、SVRFMC和基準(zhǔn)CNN)在WHU-Hi-LongKou 數(shù)據(jù)中的分類結(jié)果。
圖4 WHU-Hi-LongKou 數(shù)據(jù)分類結(jié)果
從分類圖中可以看出,由于不同作物之間光譜信息較為相似,僅使用光譜信息的SVM 分類結(jié)果中出現(xiàn)明顯的錯(cuò)分椒鹽噪聲現(xiàn)象。此外由于地塊邊緣農(nóng)作物較為稀疏,部分區(qū)域被誤分為雜草和道路。相比于SVM 分類結(jié)果,估計(jì)空間鄰域信息的方法(FNEA-OO、SVRFMC 和基準(zhǔn)CNN)顯示出優(yōu)異的視覺效果。FNEA-OO 分類結(jié)果相比于SVM 更為平滑,但由于道路、房屋和雜草的最佳分割尺度低于作物和水體的分割尺度,導(dǎo)致這3 類地物存在明顯的錯(cuò)分現(xiàn)象。SVRFMC 方法充分利用空間上下文信息,分類圖中的椒鹽噪聲得到極大緩解。然而由于SVM 分類器提供的一元?jiǎng)菽軠?zhǔn)確性較低,導(dǎo)致闊葉大豆、窄葉大豆和棉花之間存在一些錯(cuò)分。基準(zhǔn)CNN 方法只能利用局部空間信息,在訓(xùn)練過程中很容易陷入局部最優(yōu),導(dǎo)致分類圖中存在大量錯(cuò)分的孤立區(qū)域。CRFCNN 方法在CNN 基礎(chǔ)上融合空間上下文信息取得了最優(yōu)的目視效果,分類結(jié)果中錯(cuò)分的孤立區(qū)域顯著降低。
定量評(píng)價(jià)可以準(zhǔn)確評(píng)估分類算法的性能,其中測(cè)試樣本是通過野外實(shí)地勘察獲取的,通常不包括不確定類別像素。表2 中列出了CRFCNN 和對(duì)比方法的分類精度。分類精度和視覺表現(xiàn)類似,F(xiàn)NEA-OO、SVRFMC、CNN 和CRFCNN 分類方法的OA 比SVM 分別提升了4.53%,4.31%,3.24%和4.58%,其中CRFCNN 方法取得了最高的分類精度。除闊葉大豆外,CRFCNN 分類結(jié)果中其他作物的分類準(zhǔn)確率均在99%以上。因此實(shí)驗(yàn)結(jié)果證明CRFCNN 方法在WHU-Hi-LongKou 數(shù)據(jù)地物分類中具有優(yōu)異的性能。
表2 WHU-Hi-LongKou 數(shù)據(jù)分類精度
本文提出了聯(lián)合條件隨機(jī)場(chǎng)和卷積神經(jīng)網(wǎng)絡(luò)的分類框架CRFCNN,針對(duì)高分辨率影像的特點(diǎn),引入條件隨機(jī)場(chǎng)模型整合上下文信息,極大改善分類結(jié)果中錯(cuò)分的鼓勵(lì)區(qū)域,在高光譜影像的實(shí)驗(yàn)中表現(xiàn)出優(yōu)良的性能。但是本文的研究也存在著一些不足。例如,樣本的數(shù)量較少,無(wú)法衡量長(zhǎng)時(shí)序高光譜影像地物分類的精度。對(duì)于土地利用的劃分存在著地域性,限制了其在廣域范圍內(nèi)發(fā)揮作用。