朱 明,楊如軍,蔣宇雯
廣西自然資源信息中心,廣西 南寧 530029
甘蔗是廣西重要農(nóng)產(chǎn)品之一,20 世紀90 年代以來廣西的甘蔗種植面積一直居于全國首位,種植甘蔗對經(jīng)濟發(fā)展與農(nóng)民增收具有重要作用。及時獲取甘蔗種植區(qū)域的相關(guān)數(shù)據(jù)對于糖業(yè)宏觀調(diào)控、生產(chǎn)管理與政策制定具有重要意義[1],但長期以來廣西甘蔗的種植區(qū)域主要依靠抽樣調(diào)查統(tǒng)計,缺乏快速、準確、全面的獲取手段。近年來,高分辨率衛(wèi)星影像的光譜分辨率、空間分辨率與時間分辨率不斷提高[2],為遙感提取甘蔗種植區(qū)域的相關(guān)數(shù)據(jù)提供了堅實的基礎(chǔ)。
傳統(tǒng)利用遙感手段提取甘蔗種植區(qū)域的方法主要是綜合利用影像的光譜、紋理等特征,使用人工設(shè)計的特征參數(shù)進行分類[3-5]。這些方法主要是利用若干有限維度的淺層特征,按一定的算法與解譯規(guī)則來提取地面作物?,F(xiàn)實中地物在影像特征上存在區(qū)域差異性及表現(xiàn)的不確定性,同物異譜、同譜異物的情況較為常見[6];而且廣西甘蔗的種植區(qū)域地形復雜,地塊破碎、部分區(qū)域存在作物套種等[7]。這些不利因素增加了甘蔗種植區(qū)域提取的難度,制約了甘蔗種植面積的自動化提取精度與效率。近年來,深度學習(Deep Learning)技術(shù)[8]為大數(shù)據(jù)時代甘蔗種植區(qū)域提取提供了新的理論方法,解決了甘蔗影像特征提取、解譯等規(guī)則智能化的問題,為自動提取提供了新的解決方法與思路。
實驗區(qū)域位于廣西南寧市扶綏縣,北緯22°17′~ 23°57′、東經(jīng)107°31′~108°06′,總面積2 841 km2,是廣西甘蔗主產(chǎn)區(qū)之一,甘蔗種植范圍大,具有較高的實驗價值。
SE-CNN 的訓練需要制作大量的訓練樣本,訓練樣本的數(shù)據(jù)源主要包括高分辨率衛(wèi)星影像數(shù)據(jù)與甘蔗種植圖斑兩大類數(shù)據(jù)。實驗數(shù)據(jù)采用2000 國家大地坐標系和1985 國家高程基準。實驗區(qū)域的高分辨率衛(wèi)星影像數(shù)據(jù)選取的是2018 年融合后的“高分二號”與“北京二號”衛(wèi)星影像數(shù)據(jù),包含紅、綠、藍及近紅外等4 個波段。所有的衛(wèi)星影像數(shù)據(jù)均制作為正射影像數(shù)據(jù),影像融合后分辨率為0.8 m,平面中誤差控制在5 個像素以內(nèi),所有影像數(shù)據(jù)均未進行勻光、勻色處理(見圖1)。地理國情監(jiān)測數(shù)據(jù)選取的為2018 年數(shù)據(jù)成果中的甘蔗分類數(shù)據(jù),數(shù)據(jù)生產(chǎn)完成時間略晚于高分辨率衛(wèi)星影像數(shù)據(jù)拍攝時間。國情監(jiān)測數(shù)據(jù)比例尺為1 ∶1 萬,已通過質(zhì)檢驗收,數(shù)據(jù)精度滿足樣本制作要求。
研究小組在實驗區(qū)對訓練樣本中標注的甘蔗區(qū)域進行了外業(yè)核查,核實內(nèi)業(yè)采集的甘蔗地塊與實際情況是否一致。同時,在工作底圖上注明外業(yè)核查發(fā)現(xiàn)的采集錯誤并進行實地補測,之后通過內(nèi)業(yè)整理獲得最終樣本數(shù)據(jù)。
數(shù)據(jù)采集完成后,研究小組將所有甘蔗地塊的矢量數(shù)據(jù)轉(zhuǎn)換為圖斑柵格數(shù)據(jù),并標注柵格數(shù)據(jù)的每個像素為甘蔗分類,標注后的圖斑柵格數(shù)據(jù)與高分辨率衛(wèi)星影像疊加并裁切為訓練樣本切片,切片規(guī)格為512×512 像素。
實驗區(qū)內(nèi)甘蔗地塊的尺度差異性較大,部分甘蔗地塊與周邊作物的邊緣較為模糊。為了使SE-CNN 能夠精確地提取甘蔗種植區(qū)域,模型必須具有良好的甘蔗影像特征提取能力以及平移、旋轉(zhuǎn)不變性等特點,并且能夠解決多次下采樣與卷積導致的特征圖分辨率過低、丟失語義空間信息等問題。SE-CNN 采用了編碼—解碼結(jié)構(gòu),其中編碼模塊主要用于提取甘蔗影像特征,最終形成高維影像特征圖;解碼模塊可以在高維甘蔗特征圖的基礎(chǔ)上,依據(jù)特征圖及低層信息逐步重建甘蔗地塊的空間分辨率,最終按像素輸出甘蔗種植地塊。整個模型中所有的訓練參數(shù)主要與卷積核相關(guān),因此,在完成構(gòu)建后,SE-CNN 可以處理任意大小的高分辨率衛(wèi)星影像。
圖1 實驗區(qū)域影像樣例圖
1.2.1 編碼模塊設(shè)計
編碼模塊主要通過Inception 塊與ResNet來提取甘蔗的影像特征。在Inception 塊中使用4 種擴張率的卷積擴大SE-CNN 對影像的感知范圍,同時有效捕捉不同尺度的甘蔗影像特征。研究小組在Inception 塊中設(shè)置了1×1 卷積融合4種不同擴張率的卷積特征,實現(xiàn)了多尺度特征的融合,同時在Inception 塊之后串聯(lián)了154 層殘差網(wǎng)絡,殘差網(wǎng)絡中反復使用了1×1、3×3 與1×1 卷積模塊。這些結(jié)構(gòu)在殘差網(wǎng)絡中反復串聯(lián)、搭配,形成101 層的深度神經(jīng)網(wǎng)絡,完成對影像中甘蔗種植區(qū)域特征的深度提取。
1.2.2 解碼模塊設(shè)計
解碼模塊部分負責重建整景影像的空間分辨率,并輸出甘蔗種植區(qū)域的預測圖斑。使用卷積提取的甘蔗影像特征是高維特征,損失了甘蔗種植區(qū)域的細節(jié)信息與空間分辨率,研究小組為了在上采樣過程中恢復甘蔗種植區(qū)域的空間分辨率,通過上采樣插值來彌補卷積后丟失的空間信息,以及在上采樣后不斷融入編碼階段低層級的特征細節(jié),擴充有效特征的信息量,補充缺失的真實特征信息。最終通過分類器將解碼后的數(shù)據(jù)輸出為預測結(jié)果。
深度神經(jīng)網(wǎng)絡的訓練目的是通過誤差反向傳播算法盡可能實現(xiàn)與目標函數(shù)的擬合,本質(zhì)是求解損失函數(shù)的極小值。SE-CNN 的損失函數(shù)是以交叉熵損失函數(shù)為基礎(chǔ)設(shè)計的,甘蔗種植區(qū)域提取是二分問題,因此,研究小組在損失函數(shù)中加入了強化二分的損失函數(shù)。具體的損失函數(shù)計算公式為:
公式(1)中,L為SE-CNN 的損失函數(shù);Lc為交叉熵損失函數(shù);5? 為hinge 損失函數(shù)。
Lc的計算公式為:
公式(1)中,5? 為hinge 損失函數(shù);計算公式為:
研究小組發(fā)現(xiàn),通過運用損失函數(shù),可以在訓練過程中促使SE-CNN 側(cè)重于學習,有利于提取甘蔗種植區(qū)域的影像特征,在反復的迭代訓練后,可以讓神經(jīng)網(wǎng)絡的輸出結(jié)果盡可能擬合參考真值。
此次實驗環(huán)境為Centos 7.3 操作系統(tǒng),使用 Python 3.6.5 及TensorFlow 1.12 實 現(xiàn)SECNN,GPU 并行計算架構(gòu)為Cuda 10.0。實驗設(shè)備使用1 臺圖形工作站,CPU 為I7-9700 K、采用4 路并聯(lián)NVIDIA GeForce RTX 2080TI 顯卡,64 GB 內(nèi)存。實驗數(shù)據(jù)為15 000 張512×512像素切片,其中以80%切片作為訓練集,20%切片作為驗證集,用于檢測提取精度的數(shù)據(jù)為5 000×5 000 像素的北京二號0.8 m 高分辨率衛(wèi)星影像數(shù)據(jù),訓練過程中進行了320 次迭代訓練。
實驗中將影像劃分為甘蔗與非甘蔗2 種不同區(qū)域。為了分析對比SE-CNN 的提取精度,研究小組在實驗中采用了常用的U-Net 模型作為對比方法。從實驗區(qū)的甘蔗種植區(qū)域提取效果圖(見圖2)可以看出,SE-CNN 的提取結(jié)果更精細,能夠區(qū)分較小的田間道路,在田塊的提取上更精準。
為了更精確地分析實驗區(qū)甘蔗種植區(qū)域的提取精度,研究小組采用了總體精度、召回率、交并比以及Kappa 系數(shù)等4 種精度指標進行衡量??傮w精度為正確提取像素的比重,召回率為模型的正樣本提取能力,交并比為正確提取甘蔗部分與參考真值間并集的比例,Kappa 系數(shù)為甘蔗種植區(qū)域提取的相似程度。
SE-CNN 的甘蔗種植區(qū)域提取總體精度達到93.91%,能準確地從衛(wèi)星影像中提取各種形狀的甘蔗種植地塊(見表1)。研究小組通過橫向?qū)Ρ劝l(fā)現(xiàn),SE-CNN 的提取精度優(yōu)于常規(guī)語義分割神經(jīng)網(wǎng)絡模型,與U-Net 相比,精度、IOU 等指標提升了3%以上。這說明SE-CNN 能夠從樣本中學習與提取更多的甘蔗影像特征,并且能夠利用這些特征提高提取精度。實驗結(jié)果表明,SE-CNN 針對高分辨率遙感影像設(shè)計的結(jié)構(gòu)達到了預期目的,在同樣條件下具備較高的提取精度。
表1 實驗區(qū)2 種提取甘蔗種植區(qū)域的方法的精度對比表
遙感甘蔗區(qū)域提取本質(zhì)是對影像數(shù)據(jù)的語義分割,提高影像語義分割精度,有助于進一步提升提取精度[9]。提高基于深度學習的高分辨率衛(wèi)星影像提取的精度的關(guān)鍵在于準備數(shù)量充足、特征豐富的影像分類訓練樣本[10],并在此基礎(chǔ)上設(shè)計面向影像分類特征提取的深度神經(jīng)網(wǎng)絡結(jié)構(gòu)[11]。此次研究中,研究小組準備了1.5 萬張訓練樣本,確保SE-CNN 能夠自主學習大量的訓練樣本,以提取甘蔗種植區(qū)域的影像特征。在神經(jīng)網(wǎng)絡設(shè)計階段,研究小組結(jié)合高分辨率衛(wèi)星影像數(shù)據(jù)與甘蔗種植范圍提取任務特點,通過編碼模塊中不同擴張率的卷積組合,對不同尺度的特征進行捕捉,實現(xiàn)多尺度語義特征提取。在解碼模塊中,SECNN 提取的語義信息經(jīng)過解碼后轉(zhuǎn)化為像素級的甘蔗種植區(qū)域,并輸出最終的統(tǒng)計結(jié)果。
研究結(jié)果表明,SE-CNN 能夠準確地從高分辨率衛(wèi)星影像中提取甘蔗的種植區(qū)域,總體精度達到93.91%。但此次實驗中SE-CNN 也出現(xiàn)了部分提取錯誤的情況,這主要反映在甘蔗種植區(qū)域的邊緣(見圖3),主要是由地物壓蓋造成的。因為甘蔗生長茂盛,壓蓋了部分田間道路,導致道路的特征與甘蔗的特征非常接近,所以SECNN 誤將道路提取為甘蔗種植區(qū)域。這種情況在甘蔗長勢旺盛、植被復雜的區(qū)域更為明顯。
圖2 SE-CNN 方法與U-Net 方法提取甘蔗種植區(qū)域效果對比圖
圖3 甘蔗地塊邊緣提取錯誤示例圖
SE-CNN 能夠使用GPU 進行計算,明顯提升了處理效率,經(jīng)過人工檢核,深度學習方法基本可以滿足自動化生產(chǎn)需要。
此次的研究還存在一些不足:需要投入較多的人力采集加工訓練樣本,往后還需從提高作業(yè)效率、降低提取成本的角度考慮小樣本、高精度的樣本集與神經(jīng)網(wǎng)絡構(gòu)建方法。此次研究主要針對的是可見光及近紅外波段,如果在現(xiàn)有基礎(chǔ)上融入高光譜特征,可以進一步增加特征維度,提高甘蔗種植區(qū)域的提取精度。
研究小組在研究基于深度學習的高分辨率衛(wèi)星影像甘蔗種植區(qū)域提取方法的基礎(chǔ)上。根據(jù)影像數(shù)據(jù)特點與甘蔗種植范圍提取任務要求,研究并設(shè)計了編碼與解碼模塊,建立了具有編碼—解碼結(jié)構(gòu)的SE-CNN 深度學習模型。實驗證明,將深度學習用于高分辨率衛(wèi)星影像以提取甘蔗種植區(qū)域,能夠有效提高提取的精度與效率,為自動提取甘蔗種植區(qū)域提供了新的解決方法與技術(shù)路線。